com esta publicação dedicada à amostragem por grupos, concluímos o nosso primeiro bloco de publicações sobre amostragem aleatória. Com o nosso próximo post, vamos lançar em métodos de amostragem não Random, que são usados mais comumente em pesquisa on-line.
Cluster sampling é um método que faz com que a maioria dos grupos ou aglomerados da população que representam corretamente a população total em relação à característica que queremos medir., Em outras palavras, toda a variabilidade que existe em uma população está contida dentro da população. Quando este for o caso, podemos selecionar apenas alguns desses grupos para conduzir o nosso estudo.
vamos olhar para este método de outro ponto de vista. Na maioria dos métodos que vimos até agora, as unidades de amostragem coincidiram com as unidades a serem estudadas (indivíduos). No entanto, com a amostragem por aglomerado, as unidades de amostragem são grupos de unidades a estudar, o que pode ser muito benéfico quando se trata de minimizar o custo do processo de amostragem., É claro que há um trade-off: esta técnica geralmente implica menos precisão, uma vez que há uma falta de heterogeneidade entre os clusters.
o processo de amostragem
a primeira etapa na aplicação deste método é a definição dos aglomerados. Isso envolve a identificação de uma característica que nos permite dividir a população em grupos discretos (sem sobreposição) e para incluir cada indivíduo em um grupo (nenhuma pode ser deixado de fora), de tal forma que não há diferença entre os grupos em relação ao que se pretende medir., Uma vez que tenhamos definido esses aglomerados, podemos aleatoriamente selecionar alguns para estudar.
uma característica frequentemente usada para definir clusters é a geografia. Por exemplo, se quisermos estudar que porcentagem da população Argentina fuma, podemos dividir a população inteira em províncias e estudar apenas alguns deles. Desde que não tenhamos nenhuma razão para pensar que a taxa de tabagismo muda de uma província para outra, esta solução nos permite concentrar nossos esforços de amostragem em uma única localização geográfica., Se vamos conduzir o estudo através de uma entrevista pessoal, isto pode significar grandes poupanças nas despesas de viagem.
Uma vez que tenhamos definido os aglomerados, o próximo passo é selecionar os aglomerados que vão ser estudados através de amostragem aleatória simples ou amostragem sistemática.
Finalmente, uma vez que selecionou os clusters a ser estudado, podemos investigação todos os assuntos que compõem os clusters, ou até mesmo aplicar um novo processo de amostragem dentro do cluster, por exemplo, poderíamos obter uma amostra através de amostragem aleatória simples ou amostragem sistemática., Se optarmos por fazer isso, estamos lidando com um processo de amostragem de duas fases: na primeira fase, selecionamos o aglomerado, e na segunda selecionamos os indivíduos dentro do aglomerado. Se, por outro lado, estudarmos todos os indivíduos dentro dos aglomerados, chamamos-lhe amostragem de aglomerados de estágio único.
amostragem estratificada e por aglomerado
a ideia de amostragem por aglomerado faz lembrar a amostragem estratificada. Em ambos os casos, dividimos a população em grupos. No entanto, num certo sentido, as abordagens subjacentes a estes métodos estão em oposição.,a amostragem estratificada é especialmente adequada quando os grupos (estratos) têm um elevado nível de homogeneidade interna e são muito diferentes entre si. Nesse caso, é bom ter a certeza que a nossa amostra é representativa de todas as camadas. Com a amostragem por cluster, é bem o oposto: queremos que os grupos em que dividimos a população sejam muito semelhantes, de modo que não haja grande diferença entre estudar indivíduos em um grupo ou outro.,
assim, apesar do fato de que ambos os métodos dividem a população (em estratos ou aglomerados), o processo de seleção individual é radicalmente diferente.
vantagens e desvantagens da amostragem por aglomerado
- A maior vantagem deste método é Operacional: selecionar um aglomerado para estudar é tipicamente mais fácil e mais acessível do que criar uma amostra aleatória ou sistemática. Por exemplo, vimos acima como o uso de clusters geográficos pode significar uma economia significativa em viagens.,
- Estranhamente, é comum que os estudos realizados on-line para continuar a pensar em termos de regiões, mesmo que não haja nenhum operacional de incentivo para fazê-lo; muito ao contrário, esta abordagem aumenta o risco de imprecisão devido às diferenças entre as regiões estudadas, e o resto da população. Esta prática é o legado injustificado de técnicas que eram boas para entrevistas ao vivo, mas que não fazem sentido para outros métodos.
- A principal desvantagem de usar amostragem por aglomerado é o risco notável de que os aglomerados não podem ser verdadeiramente homogêneos entre si., No exemplo acima sobre fumantes Argentinos, talvez uma das províncias esteja mais inclinada a fumar porque é mais urbana, ou por razões culturais, ou devido a qualquer número de outros fatores possíveis.
a eficácia da amostragem por aglomerado
como é que este método se ajusta aos que vimos antes? Tal como acontece com a amostragem estratificada, como bem este método funciona depende da “relação” entre a variância dentro dos aglomerados e a variância fora dos aglomerados.,esta relação é expressa com um coeficiente de correlação intracluster (δ), Que é definido como o coeficiente de correlação linear entre todos os pares de valores para a variável no estudo medido sobre as unidades do aglomerado e estendido a todos os aglomerados. Em última análise, este coeficiente é uma medida de homogeneidade dentro dos aglomerados.
Quanto menor for o coeficiente de correlação intracluster δ, maior será a eficácia da amostragem de aglomerados., Tenha em mente que o objetivo é que os clusters de ser tão heterogêneo como o total da amostra, de modo que a seleção de um determinado cluster irá produzir a mesma informação que a seleção aleatória de indivíduos de toda a população.se compararmos amostragem aleatória simples com amostragem por aglomerado, podemos demonstrar que se δ=0, ambos os métodos são equivalentes. Esta condição implica que os clusters são tão heterogêneos quanto a população como um todo. O pior cenário seria Se δ = + 1, e o melhor cenário seria δ=-1/(M-1), onde M é o tamanho do aglomerado., Mas normalmente, δ será sempre maior que zero, uma vez que é normal que as unidades dentro de um aglomerado tenham uma certa semelhança umas com as outras.
outra forma de ver o impacto deste problema é calcular o tamanho da amostra necessário para a amostragem por aglomerado para atingir o mesmo nível de precisão que a amostragem aleatória simples. Isto é expresso como
nc = na (1 + (M-1) δ)
em que nc é a dimensão da amostra na amostragem por aglomerado e nasis a dimensão da amostra de que precisaríamos para uma amostragem aleatória simples., Portanto, o fator(1+(M-1) δ) é a variação do tamanho da amostra que precisaríamos para usar clusters. A variação é geralmente um aumento. Este fato é conhecido como o efeito design.esperamos que este post o tenha ajudado a entender melhor este método de amostragem aleatória.,ut links abaixo para ler os outros artigos que formam esta série:
TABELA DE CONTEÚDO: Série sobre amostragem
- Amostragem: o Que é e por que ele funciona
- Aleatória e amostragem não-aleatória
- amostragem Aleatória: Amostragem aleatória simples
- Aleatório de amostragem: amostragem Estratificada
- Aleatório de amostragem: amostragem Sistemática
- amostragem Aleatória: Cluster de amostragem
- amostragem Não-aleatória: a Disponibilidade de amostragem
- amostragem Não-aleatória: Cota de amostragem
- amostragem Não-aleatória: bola de neve de amostragem