Tecniche di campionamento: calcolo della numerosità campionaria 1. Criteri generali Nell’ambito dei metodi di indagine di tipo quantitativo, tradizionalmente la teoria campionaria distingue e raggruppa l’ampia e complessa tematica del campionamento in due parti: • • il campionamento di tipo probabilistico il campionamento di tipo non probabilistico La distinzione si basa fondamentalmente sul concetto di probabilità: mentre nel primo caso la probabilità di estrazione di un caso da una popolazione finita (dove n=caso, P=popolazione e n<P) è nota e compresa tra 0 e 1, nel secondo caso questa probabilità è sconosciuta perché ignota è la numerosità dell’universo dal quale si vogliono estrarre i casi. 2. Tecniche campionarie Sulla base di questa prima distinzione si differenziano le tecniche campionarie di costruzione dei campioni e di determinazione della loro numerosità. Sostanzialmente nel primo caso il criterio fondamentale per l’estrazione dei casi dalla popolazione di riferimento è quello della casualità, mentre nel secondo risponde a quello della fattibilità. • A partire da questa prima ed ampia distinzione, all’interno del primo raggruppamento si distinguono tecniche di estrazione dei casi a livelli differenti di finezza e complessità statistica. A livello generale il criterio fondamentale per l’estrazione di un campione statisticamente rappresentativo è, lo si ripete, il caso. La casualità rappresenta cioè la modalità corretta per poter affermare, con margini differenti di confidenza a seconda della sua numerosità, che il campione rappresenta una quota parte che rispecchia fedelmente le caratteristiche dell’universo dal quale è stato estratto. Il tipo di campionamento più comune e facile da eseguire è quello casuale semplice, nel quale ogni caso viene estratto con la stessa probabilità da un unico universo di riferimento. Campionamento più complesso è quello a strati, dove la popolazione di partenza è suddivisa in sottogruppi il più omogenei possibili rispetto ad una o più variabili di stratificazione (ad esempio per zona altimetrica, dimensioni di comuni, titolo di studio, professione, sesso ed età…) e poi il campione è estratto in modo causale semplice all’interno di ogni strato. • Fanno riferimento invece al secondo gruppo, campionamenti, ad esempio, per quote (dove all’interno di ogni gruppo individuato i soggetti vanno scelti liberamente dall’intervistatore), a scelta ragionata (dove le unità campionarie vengono scelte sulla base di alcune caratteristiche peculiari) o a valanga (dove i soggetti da inserire nel campione sono individuati a partire dai primi soggetti intervistati che vengono utilizzati per fornire altri individui con caratteristiche simili). 3. Numerosità campionaria Essendo nota la popolazione dalla quale si vuole estrarre il campione, la numerosità campionaria per il campionamento causale semplice si calcola seguendo i criteri del campionamento di tipo probabilistico e utilizzando la nota formula di determinazione dell’ampiezza del campione: n=z2*(p*q)/e2 Documento a cura di Alessandro Migliardi Aggiornamento: luglio 2004 http://www.dors.it dove: n è la numerosità campionaria z è il livello di fiducia e è l’errore della stima p è la probabilità favorevole al verificarsi dell’evento q è la probabilità contraria al verificarsi dell’evento Z assume il valore di 1,96 (coefficiente utilizzato quando si utilizza un livello di fiducia del 95% e quando si ipotizza che gli eventi si distribuiscono secondo una curva di tipo normale), e assume il valore di 0,05 (cioè si scelto di stabilire l’errore della stima effettuata al 5%) mentre p e q, possono assumere valori variabili tra 0 e 1 a seconda dell’ipotesi che viene effettuata sull’accadimento dell’evento o sulla conoscenza del problema che si vuole studiare. Più precisa è l’ipotesi che si fa sul verificarsi dell’evento di analisi (ad esempio sulla base di conoscenze pregresse ricavabili da dati di letteratura o attraverso informazioni ottenibili dalla consultazione di esperti di settore), più è possibile dimensionare con precisione il campione. Nel caso in cui non si abbia alcuna conoscenza in merito al tema che si vuole esplorare, è conveniente adottare la scelta conservativa dello 0,5 (50% di probabilità favorevoli e 50% di probabilità contrarie al verificarsi dell’evento). La tabella 1 riporta alcuni valori di numerosità campionaria per il livello di fiducia del 95% . Tabella 1 - Numerosità campionaria per un livello di fiducia del 95% e valori variabili di probabilità P 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,55 0,60 0,65 0,70 0,75 0,80 0,85 0,90 0.95 N 73 138 196 246 288 323 350 369 380 384 380 369 350 323 288 246 196 138 4. Riferimenti bibliografici K. D. Bailey, Metodi della ricerca sociale, Il Mulino, 1985. P. Corbetta, Metodologia e tecniche della ricerca sociale, Il Mulino, 1999. A. Fink, The Survey Kit, Sage Publications Inc., 1995. Documento a cura di Alessandro Migliardi Aggiornamento: luglio 2004 http://www.dors.it 73