Campionamento casuale: campionamento cluster

Con questo post dedicato al campionamento cluster, concludiamo il nostro primo blocco di post sul campionamento casuale. Con il nostro prossimo post, lanceremo in metodi di campionamento non casuali, che vengono utilizzati più comunemente nella ricerca online.

Il campionamento cluster è un metodo che sfrutta al meglio gruppi o cluster della popolazione che rappresentano correttamente la popolazione totale in relazione alla caratteristica che vogliamo misurare., In altre parole, tutta la variabilità che esiste in una popolazione è contenuta all’interno della popolazione. Quando questo è il caso, possiamo selezionare solo alcuni di questi cluster per condurre il nostro studio.

Diamo un’occhiata a questo metodo da un altro punto di vista. Nella maggior parte dei metodi che abbiamo visto finora, le unità di campionamento hanno coinciso con le unità da studiare (individui). Con il campionamento cluster, tuttavia, le unità di campionamento sono gruppi di unità da studiare, il che può essere molto utile quando si tratta di ridurre al minimo il costo del processo di campionamento., Naturalmente, c’è un compromesso: questa tecnica di solito comporta meno precisione, poiché c’è una mancanza di eterogeneità tra i cluster.

IL PROCESSO DI CAMPIONAMENTO

Il primo passo nell’applicazione di questo metodo è la definizione dei cluster. Ciò comporta l’identificazione di una caratteristica che ci consente di dividere la popolazione in gruppi discreti (senza sovrapposizioni) e di includere ogni individuo in un gruppo (nessuno può essere escluso) in modo tale che non vi sia alcuna differenza tra i gruppi in relazione a ciò che vogliamo misurare., Una volta definiti questi cluster, possiamo selezionarne casualmente alcuni da studiare.

Una caratteristica spesso utilizzata per definire i cluster è la geografia. Ad esempio, se vogliamo studiare quale percentuale della popolazione argentina fuma, potremmo dividere l’intera popolazione in province e studiarne solo alcune. A condizione che non abbiamo motivo di pensare che il tasso di fumo cambi da una provincia all’altra, questa soluzione ci consente di concentrare i nostri sforzi di campionamento su un’unica posizione geografica., Se abbiamo intenzione di condurre lo studio attraverso un colloquio personale, questo potrebbe ammontare a grandi risparmi sulle spese di viaggio.

Una volta definiti i cluster, il passo successivo è selezionare i cluster che verranno studiati attraverso un semplice campionamento casuale o un campionamento sistematico.

Infine, una volta selezionati i cluster da studiare, possiamo ricercare tutti i soggetti che compongono i cluster, o anche applicare un nuovo processo di campionamento all’interno del cluster—ad esempio, potremmo ottenere un campione attraverso un semplice campionamento casuale o un campionamento sistematico., Se decidiamo di farlo, abbiamo a che fare con un processo di campionamento in due fasi: nella prima fase, selezioniamo il cluster e nella seconda selezioniamo gli individui all’interno del cluster. Se, d’altra parte, studiamo tutti gli individui all’interno dei cluster, lo chiamiamo campionamento cluster a singolo stadio.

CAMPIONAMENTO STRATIFICATO E CLUSTER

L’idea del campionamento cluster ricorda il campionamento stratificato. In entrambi i casi, dividiamo la popolazione in gruppi. Tuttavia, in un certo senso, gli approcci alla base di questi metodi sono in opposizione.,

Il campionamento stratificato è particolarmente adatto quando i gruppi (strati) hanno un alto livello di omogeneità interna e sono molto diversi tra loro. In tal caso, è bene assicurarsi che il nostro campione sia rappresentativo di tutti gli strati. Con il campionamento dei cluster, è tutto il contrario: vogliamo che i gruppi in cui dividiamo la popolazione siano molto simili, in modo che non ci sia una grande differenza tra gli individui che studiano in un gruppo o in un altro.,

Quindi, nonostante entrambi i metodi dividano la popolazione (in strati o cluster), il processo di selezione individuale è radicalmente diverso.

VANTAGGI E SVANTAGGI DEL CAMPIONAMENTO CLUSTER

  • Il più grande vantaggio di questo metodo è operativo: selezionare un cluster da studiare è in genere più semplice e conveniente rispetto alla creazione di un campione casuale o sistematico. Ad esempio, abbiamo visto sopra come l’utilizzo di cluster geografici può ammontare a risparmi significativi sui viaggi.,
  • Stranamente, è comune che gli studi condotti online continuino a pensare in termini di regioni, anche se non vi è alcun incentivo operativo a farlo; al contrario, questo approccio aumenta il rischio di imprecisione a causa delle differenze tra le regioni studiate e il resto della popolazione. Questa pratica è il lascito ingiustificato di tecniche che erano buone per le interviste dal vivo, ma che non hanno senso per altri metodi.
  • Lo svantaggio principale dell’utilizzo del campionamento dei cluster è il rischio notevole che i cluster potrebbero non essere veramente omogenei tra loro., Nell’esempio precedente sui fumatori argentini, forse una delle province è più incline a fumare perché è più urbana, o per motivi culturali, o a causa di un numero qualsiasi di altri possibili fattori.

L’EFFICACIA DEL CAMPIONAMENTO CLUSTER

In che modo questo metodo si sovrappone a quelli che abbiamo visto prima? Come nel caso del campionamento stratificato, il funzionamento di questo metodo dipende dalla “relazione” tra varianza all’interno dei cluster e varianza all’esterno dei cluster.,

Questa correlazione è espressa con un coefficiente di correlazione intracluster (δ), che è definito come il coefficiente di correlazione lineare tra tutte le coppie di valori per la variabile nello studio misurato sulle unità di cluster ed esteso a tutti i cluster. In definitiva, questo coefficiente è una misura di omogeneità all’interno dei cluster.

Minore è il coefficiente di correlazione intracluster δ, maggiore è l’efficacia del campionamento del cluster., Tieni presente che l’obiettivo è che i cluster siano eterogenei quanto l’intero campione, in modo che la selezione di un determinato cluster produca le stesse informazioni della selezione casuale di individui dell’intera popolazione.

Se confrontiamo il campionamento casuale semplice con il campionamento del cluster, possiamo dimostrare che se δ=0, entrambi i metodi sono equivalenti. Questa condizione implica che i cluster sono eterogenei quanto la popolazione nel suo complesso. Lo scenario peggiore sarebbe se δ = +1 e lo scenario migliore sarebbe δ=-1/(M-1), dove M è la dimensione del cluster., Ma normalmente, δ sarà sempre maggiore di zero, poiché è normale che le unità all’interno di un cluster abbiano una certa somiglianza l’una con l’altra.

Un altro modo per vedere l’impatto di questo problema è calcolare la dimensione del campione necessaria per il campionamento del cluster per ottenere lo stesso livello di precisione del semplice campionamento casuale. Questo è espresso come

nc = na (1 + (M-1) δ)

dove nc è la dimensione del campione nel campionamento cluster e nais la dimensione del campione di cui avremmo bisogno per un semplice campionamento casuale., Pertanto, il fattore(1 + (M-1) δ) è la variazione della dimensione del campione di cui avremmo bisogno per utilizzare i cluster. La variazione è generalmente un aumento. Questo fatto è noto come l’effetto di design.

Speriamo che questo post ti abbia aiutato a capire meglio questo metodo di campionamento casuale.,ut i link qui sotto per leggere gli altri articoli in questa serie:

INDICE: Serie di campionamento

  1. Campionamento: Cos’è e perché funziona
  2. Casuali e non casuali di campionamento
  3. il campionamento Casuale: Campionamento casuale semplice
  4. Casuale di campionamento: campionamento Stratificato
  5. Casuale di campionamento: campionamento Sistematico
  6. Casuale di campionamento: campionamento a grappolo (Cluster
  7. campione Non casuale: la Disponibilità di campionamento
  8. Non casuale di campionamento: Quota di campionamento
  9. Non casuale di campionamento: Snowball sampling

Author: admin

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *