cu acest post dedicat eșantionării în cluster, încheiem primul nostru bloc de postări privind eșantionarea aleatorie. Cu următorul nostru post, vom lansa în metode de eșantionare nonrandom, care sunt utilizate cel mai frecvent în cercetarea online.
eșantionarea clusterului este o metodă care profită la maximum de grupurile sau clusterele din populație care reprezintă corect populația totală în raport cu caracteristica pe care dorim să o măsurăm., Cu alte cuvinte, toate variabilitatea care există într-o populație este conținută în cadrul populației. Când acesta este cazul, putem selecta doar câteva dintre aceste grupuri pentru a ne conduce studiul.să analizăm această metodă dintr-un alt punct de vedere. În majoritatea metodelor pe care le-am văzut până acum, unitățile de eșantionare au coincis cu unitățile care urmează să fie studiate (indivizi). Cu eșantionarea în cluster, totuși, unitățile de eșantionare sunt grupuri de unități care trebuie studiate, ceea ce poate fi foarte benefic atunci când vine vorba de minimizarea costului procesului de eșantionare., Desigur, există un compromis: această tehnică implică, de obicei, mai puțină precizie, deoarece există o lipsă de eterogenitate în rândul clusterelor.
procesul de eșantionare
primul pas în aplicarea acestei metode este definirea clusterelor. Aceasta implică identificarea unei caracteristici care ne permite Să împărțim populația în grupuri discrete (fără suprapunere) și să includem fiecare individ într-un grup (niciunul nu poate fi lăsat afară) astfel încât să nu existe nicio diferență între grupuri în raport cu ceea ce vrem să măsurăm., Odată ce am definit aceste clustere, putem selecta aleatoriu câteva pentru a studia.o caracteristică folosită adesea pentru a defini clusterele este geografia. De exemplu, dacă vrem să studiem ce procent din populația argentiniană fumează, am putea împărți întreaga populație în provincii și să studiem doar câteva dintre ele. Cu condiția să nu avem niciun motiv să credem că rata fumatului se schimbă de la o provincie la alta, această soluție ne permite să ne concentrăm eforturile de eșantionare pe o singură locație geografică., Dacă vom efectua studiul prin interviu personal, acest lucru s-ar putea ridica la economii majore la cheltuielile de călătorie.după ce am definit clusterele, următorul pas este să selectăm clusterele care vor fi studiate fie prin eșantionare aleatorie simplă, fie prin eșantionare sistematică.în cele din urmă, odată ce am selectat clusterele care urmează să fie studiate, putem cerceta toți subiecții care alcătuiesc clusterele sau chiar să aplicăm un nou proces de eșantionare în cadrul clusterului—de exemplu, am putea obține o probă prin eșantionare aleatorie simplă sau eșantionare sistematică., Dacă optăm să facem acest lucru, avem de-a face cu un proces de eșantionare în două etape: în prima etapă, selectăm clusterul, iar în a doua selectăm indivizii din cadrul clusterului. Dacă, pe de altă parte, studiem toți indivizii din clustere, o numim eșantionare într-o singură etapă.
eșantionare stratificată și CLUSTER
ideea eșantionării cluster amintește de eșantionarea stratificată. În ambele cazuri, împărțim populația în grupuri. Cu toate acestea, într-un sens, abordările care stau la baza acestor metode sunt în opoziție.,eșantionarea stratificată este adecvată în special atunci când grupurile (straturile) au un nivel ridicat de omogenitate internă și sunt foarte diferite între ele. În acest caz, este bine să vă asigurați că eșantionul nostru este reprezentativ pentru toate straturile. Cu eșantionarea în cluster, este exact opusul: vrem ca grupurile în care împărțim populația să fie foarte asemănătoare, astfel încât să nu existe nicio diferență majoră între studierea indivizilor dintr-un grup sau altul.,deci ,în ciuda faptului că ambele metode împart populația (în straturi sau clustere), procesul de selecție individuală este radical diferit.
avantajele și dezavantajele eșantionării în CLUSTER
- cel mai mare avantaj al acestei metode este operațional: selectarea unui cluster pentru studiu este de obicei mai ușoară și mai accesibilă decât crearea unui eșantion aleatoriu sau sistematic. De exemplu, am văzut mai sus cum utilizarea clusterelor geografice poate însemna economii semnificative la călătorii.,
- destul de ciudat, este obișnuit ca studiile efectuate online să continue să gândească în termeni de regiuni, chiar dacă nu există un stimulent operațional în acest sens; dimpotrivă, această abordare sporește riscul impreciziei din cauza diferențelor dintre regiunile studiate și restul populației. Această practică este moștenirea nejustificată a tehnicilor care au fost bune pentru interviurile live, dar care nu au sens pentru alte metode.
- principalul dezavantaj al utilizării eșantionării clusterelor este riscul notabil ca grupurile să nu fie cu adevărat omogene între ele., În exemplul de mai sus despre fumătorii Argentinieni, poate că una dintre provincii este mai înclinată să fumeze, deoarece este mai urbană sau din motive culturale sau datorită oricărui număr de alți factori posibili.
eficacitatea eșantionării clusterului
cum se compară această metodă cu cele pe care le-am văzut înainte? Ca și în cazul eșantionării stratificate, cât de bine funcționează această metodă depinde de „legătura” dintre varianța din cadrul clusterelor și varianța din afara clusterelor.,această corelație este exprimată cu un coeficient de corelație intracluster (δ), Care este definit ca coeficientul de corelație liniară între toate perechile de valori pentru variabila din studiu măsurată pe unitățile de cluster și extinsă la toate clusterele. În cele din urmă, acest coeficient este o măsură a omogenității în cadrul clusterelor.
cu cât coeficientul de corelație intracluster δ este mai mic, cu atât este mai mare eficacitatea eșantionării clusterului., Rețineți că scopul este ca grupurile să fie la fel de eterogene ca întregul eșantion, astfel încât selecția unui anumit grup să producă aceleași informații ca și selecția aleatorie a indivizilor din întreaga populație.dacă comparăm eșantionarea aleatorie simplă cu eșantionarea în cluster, putem demonstra că, dacă δ=0, ambele metode sunt echivalente. Această condiție implică faptul că grupurile sunt la fel de eterogene ca și populația în ansamblu. Scenariul cel mai rău caz ar fi Dacă δ=+1, iar scenariul cel mai bun caz ar fi δ=-1/(M-1), Unde M este dimensiunea clusterului., Dar, în mod normal, δ va fi întotdeauna mai mare decât zero, deoarece este normal ca unitățile dintr-un cluster să aibă o anumită asemănare între ele.un alt mod de a vedea impactul acestei probleme este de a calcula dimensiunea eșantionului necesar pentru eșantionarea clusterului pentru a atinge același nivel de precizie ca eșantionarea aleatorie simplă. Acest lucru este exprimat ca
nc = na (1 +(m-1) δ)
unde nc este dimensiunea eșantionului în eșantionarea clusterului și nais dimensiunea eșantionului de care am avea nevoie pentru eșantionarea simplă aleatorie., Prin urmare, factorul (1+(m-1) δ) este variația dimensiunii eșantionului de care am avea nevoie pentru a utiliza clustere. Variația este, în general, o creștere. Acest fapt este cunoscut sub numele de efect de proiectare.sperăm că această postare v-a ajutat să înțelegeți mai bine această metodă de eșantionare aleatorie.,ut link-urile de mai jos pentru a citi alte articole care formează această serie:
CUPRINS: Seria de pe eșantionare
- de Eșantionare: Ce este și de ce funcționează
- Aleatoare și non-aleatoare de eșantionare
- eșantionare Aleatoare: Eșantionarea aleatorie simplă
- Aleatoare de eșantionare: eșantionare Stratificată
- Aleatoare de eșantionare: eșantionarea Sistematică
- Aleatoare de eșantionare: Cluster de eșantionare
- Non-aleatoare de eșantionare: Disponibilitatea de eșantionare
- Non-aleatoare de eșantionare: eșantionarea pe Cote
- Non-aleatoare de eșantionare: Snowball sampling