avec cet article dédié à l’échantillonnage par grappes, nous concluons notre premier bloc de publications sur l’échantillonnage aléatoire. Avec notre prochain article, nous nous lancerons dans les méthodes d’échantillonnage non aléatoires, qui sont utilisées le plus souvent dans la recherche en ligne.
l’échantillonnage en grappes est une méthode qui rend la plupart des groupes ou des groupes dans la population que représentent correctement la population totale par rapport à la caractéristique que l’on souhaite mesurer., En d’autres termes, toute la variabilité qui existe dans une population est contenue dans la population. Lorsque c’est le cas, nous pouvons sélectionner quelques-uns de ces groupes pour mener notre étude.
examinons cette méthode d’un autre point de vue. Dans la plupart des méthodes que nous avons vues jusqu’à présent, les unités d’échantillonnage ont coïncidé avec les unités à étudier (individus). Avec l’échantillonnage en grappes, cependant, les unités d’échantillonnage sont des groupes d’unités à être étudié, qui peut être très bénéfique quand il s’agit de minimiser le coût du processus d’échantillonnage., Bien sûr, il y a un compromis: cette technique implique généralement moins de précision, car il y a un manque d’hétérogénéité entre les clusters.
le processus D’échantillonnage
la première étape de l’application de cette méthode consiste à définir les grappes. Cela implique d’identifier une caractéristique qui nous permet de diviser la population en groupes discrets (sans chevauchement) et d’inclure chaque individu dans un groupe (aucun ne peut être omis) de telle sorte qu’il n’y ait pas de différence entre les groupes par rapport à ce que nous voulons mesurer., Une fois que nous avons défini ces grappes, nous pouvons en sélectionner au hasard quelques-unes à étudier.
Une caractéristique souvent utilisée pour définir les clusters est la géographie. Par exemple, si nous voulons étudier quel pourcentage de la population Argentine fume, nous pourrions diviser la population entière en provinces et en étudier seulement quelques-unes. Pourvu que nous n’ayons aucune raison de penser que le taux de tabagisme varie d’une province à l’autre, Cette solution nous permet de concentrer nos efforts d’échantillonnage sur un seul endroit géographique., Si nous allons mener l’étude par entretien personnel, cela pourrait représenter des économies importantes sur les frais de voyage.
une Fois que nous avons défini les groupes, l’étape suivante consiste à sélectionner les clusters qui vont être étudiés, soit par échantillonnage aléatoire simple ou systématique d’échantillonnage.
enfin, une fois que nous avons sélectionné les clusters à étudier, nous pouvons rechercher tous les sujets qui composent les clusters, ou même appliquer un nouveau processus d’échantillonnage au sein du cluster—par exemple, nous pourrions obtenir un échantillon via un simple échantillonnage aléatoire ou un échantillonnage systématique., Si nous choisissons de le faire, nous avons affaire à un processus d’échantillonnage en deux étapes: dans la première étape, nous sélectionnons la grappe, et dans la seconde, nous sélectionnons les individus au sein de la grappe. Si, d’autre part, nous étudions tous les individus au sein des grappes, nous appelons cela l’échantillonnage en grappes à une étape.
échantillonnage stratifié et en grappes
l’idée de l’échantillonnage en grappes rappelle l’échantillonnage stratifié. Dans les deux cas, nous divisons la population en groupes. Pourtant, dans un sens, les approches sous-jacentes de ces méthodes sont en opposition.,
l’échantillonnage stratifié est particulièrement approprié lorsque les groupes (strates) ont un haut niveau d’homogénéité interne et sont très différents entre eux. Dans ce cas, il est bon de s’assurer que notre échantillon est représentatif de toutes les couches. Avec l’échantillonnage en grappes, c’est tout le contraire: nous voulons que les groupes dans lesquels nous divisons la population soient très similaires, de sorte qu’il n’y ait pas de différence majeure entre étudier des individus dans un groupe ou un autre.,
ainsi, malgré le fait que les deux méthodes divisent la population (en strates ou en grappes), le processus de sélection individuel est radicalement différent.
avantages et inconvénients de L’échantillonnage en grappes
- Le plus grand avantage de cette méthode est opérationnel: la sélection d’une grappe à étudier est généralement plus facile et plus abordable que la création d’un échantillon aléatoire ou systématique. Par exemple, nous avons vu ci-dessus comment l’utilisation de grappes géographiques peut représenter des économies importantes sur les voyages.,
- curieusement, il est courant que les études menées en ligne continuent de penser en termes de régions, même s’il n’y a pas d’incitation opérationnelle à le faire; bien au contraire, cette approche augmente le risque d’imprécision en raison des différences entre les régions étudiées et le reste de la population. Cette pratique est le legs injustifié de techniques qui étaient bonnes pour les entretiens en direct, mais qui n’ont aucun sens pour d’autres méthodes.
- Le principal inconvénient de l’utilisation de l’échantillonnage en grappes est le risque notable que les grappes ne soient pas vraiment homogènes les unes entre les autres., Dans l’exemple ci-dessus concernant les fumeurs Argentins, l’une des provinces est peut-être plus encline à fumer parce qu’elle est plus urbaine, ou pour des raisons culturelles, ou en raison d’un certain nombre d’autres facteurs possibles.
L’efficacité de L’échantillonnage en grappes
comment cette méthode se compare-t-elle à celles que nous avons vues auparavant? Comme pour l’échantillonnage stratifié, le bon fonctionnement de cette méthode dépend de la” parenté » entre la variance à l’intérieur des grappes et la variance à l’extérieur des grappes.,
Cette relation est exprimée avec un coefficient de corrélation intracluster (δ), Qui est défini comme le coefficient de corrélation linéaire entre toutes les paires de valeurs pour la variable dans l’étude mesurée sur les unités de cluster et étendue à tous les clusters. En fin de compte, ce coefficient est une mesure de l’homogénéité au sein des grappes.
plus le coefficient de corrélation intracluster δ est faible, plus l’efficacité de l’échantillonnage en grappes est grande., Gardez à l’esprit que l’objectif est que les grappes soient aussi hétérogènes que l’ensemble de l’échantillon, de sorte que la sélection d’une grappe donnée donnera les mêmes informations que la sélection aléatoire d’individus de l’ensemble de la population.
Si nous comparons l’échantillonnage aléatoire simple avec l’échantillonnage en grappes, nous pouvons démontrer que si δ=0, les deux méthodes sont équivalentes. Cette condition implique que les clusters sont tout aussi hétérogènes que la population dans son ensemble. Le pire scénario serait si δ=+1, et le meilleur scénario serait δ=-1/(M-1), où M est la taille du cluster., Mais normalement, δ sera toujours supérieur à zéro, car il est normal que les unités d’un cluster aient une certaine ressemblance les unes avec les autres.
une Autre façon de voir l’impact de ce problème est de calculer la taille de l’échantillon nécessaire pour l’échantillonnage en grappes à atteindre le même niveau de précision que l’échantillonnage aléatoire simple. Ceci est exprimé comme
nc = na (1 + (M-1) δ)
où nc est la taille de l’échantillon dans de l’échantillonnage en grappes et nais la taille de l’échantillon que nous aurions besoin pour l’échantillonnage aléatoire simple., Par conséquent, le facteur(1 + (M-1) δ) est la variation de la taille de l’échantillon dont nous aurions besoin pour utiliser des clusters. La variation est généralement une augmentation. Ce fait est connu comme l’effet de conception.
Nous espérons que cet article vous a aidé à mieux comprendre cette méthode d’échantillonnage aléatoire.,ut les liens ci-dessous pour lire les autres articles qui forment cette série:
TABLE DES MATIÈRES: les Séries de l’échantillonnage,
- d’Échantillonnage: Ce qu’il est et pourquoi il fonctionne
- aléatoires et non Aléatoires d’échantillonnage
- l’échantillonnage Aléatoire: L’échantillonnage aléatoire Simple
- au Hasard de l’échantillonnage: l’échantillonnage Stratifié
- au Hasard de l’échantillonnage: l’échantillonnage Systématique,
- au Hasard de l’échantillonnage: l’échantillonnage en grappes
- d’échantillonnage Non aléatoire: la Disponibilité d’échantillonnage
- Non-aléatoire de l’échantillonnage: l’échantillonnage par Quotas,
- Non-aléatoire de l’échantillonnage: échantillonnage en boule de neige