L'INDAGINE CAMPIONARIA Metodi, disegni e tecniche di campionamento ezio Bf F~ :_~ () ì E(.' .6.. CJ ?.. ES T Luigi Fabbris L'indagine • • camp1onar1a Metodi, disegni e tecniche di campionamento La Nuova Italia Scientifica Indice pag. 13 Prefazione 17 I. Disegni di campionamento 17 1.1. Il campionamento per r'lndagine statistica 1.1.1. Popolazione e campione 18 1.2. L'indagine statistica 1.2.1. Indagine esaustiva o campionaria? 22 24 1.3. 1.4. Il campionamento casuale Il disegno di campionamento 1.4.1. Struttura del campione - 1.4.2. Probabilità di selezione - 1.4.3. Selezione delle unità campionarie - 1.4.4. Determinazione della numerosità campionaria 26 1.5. Stima 1.5.1. Stimatori - 1.5.2. Errore di campionamento - 1.5.3. Errori di rilevazione - 1.5.4. Intervallo fiduciario delle stime - 1.5.5. Deff: effetto del disegno di campionamento - 1.5.6. Campioni autoponderanti 33 1.6. Criteri di scelta della struttura del campione 1.6.1. Caratteristiche della popolazione e delle variabili - 1.6.2. Indisponibilità o imperfezione delle liste - 1.6.3. Uso efficiente delle risorse disponibili per l'indagine - 1.6.4. Obiettivi di ricerca 41 2. Selezione casuale del campione 41 42 2.1. 2.2. La selezione casuale Selezione con reinserimento 2.2.1. Selezione con probabilità diseguali sione nel campione 43 2.3. 2.2.2. Probabilità di inclu- Selezione senza reinserimento 2.3.1. Selezione con probabilità diseguali sione nel campione 2.3.2. Probabilità di inclu- 44 2.4. Selezione sistematica 2.4.1. Selezione con probabilità diseguali sione nel campione 46 2.5. Tecniche per la selezione casuale semplice 2.5.1. Le tavole dei numeri casuali casuali con il computer 48 2.6. 2.5.2. Generazione di numeri Tecniche per la selezione sistematica 2.6.1. Il caso normale - 2.6.2. Nln non è un numero intero 53 3. Campionamento casuale semplice 53 3.1. 3.2. Il campione casuale semplice Stima 54 2.4.2. Probabilità di inclu- 3.2.1. Totale e media - 3.2.2. Frequenze assolute e relative Differenza e covarianza tra due medie 61 64 3.3. 3.4. 3.2.3. Determinazione della numerosità ottimale del campione Problemi di lista nel campionamento casuale semplice 3.4.1. Elementi mancanti dalla lista - 3.4.2. Unità non pertinenti o "bianche" presenti nella lista - 3.4.3. Registrazione multipla di unità nella lista 68 3.5. Un'applicazione: calcolo della numerosità del campione per un'indagine longitudinale 71 4. Campionamento stratificato 71 73 4.1. 4.2. Il campione stratificato Selezione di un-~campione stratificato 4.2.1. Selezione di un campione stratificato proporzionale - 4.2.2. Stratificazione implicita - 4.2.3. Selezione di un campione stratificato non proporzionale - 4.2.4. Selezione di un campione stratificato ottimale 4.2.5. Controllo sulla selezione oltre la stratificazione 82 4.3. Stima 4.3.1. Stima con un disegno stratificato generico - 4.3.2. Stima con allocazione proporzionale del campione - 4.3.3. Stima con allocazione ottimale del campione - 4.3.4. Stime per sottoclassi - 4.3.5. Un campione di due unità per strato - 4.3.6. Un campione di una unità per strato - 4.3.7. Tecnica delle differenze successive - 4.3.8. Tecnica del collassamento degli strati 92 4.4. Effetto della stratificazione sull'efficienza 4.4.1. Campionamento proporzionale rispetto a campionamento casuale semplice - 4.4.2. Campionamento ottimale rispetto a proporzionale 96 4.5. Altre scelte per formare un campione stratificato 4.5.1. Variabili di stratificazione - 4.5.2. Numero di strati - 4.5.3. Determinazione della numerosità del campione - 4.5.4. Unità autorappresentative - 4.5.5. Allocazione del campione per un'indagine multiscopo 103 4.6. Applicazioni 4.6.1. Spunti per la formazione di un campione stratificato di Comuni toscani - 4.6.2. Un campione stratificato ottimale per un'indagine sulla clientela di un istituto di credito - 4.6.3. Un campione per una indagine sulla tossicodipendenza da droghe pesanti 111 5. Campionamento su più stadi 111 114 5.1. 5.2. Gerarchie di popolazioni e di campioni Disegni con stratificazione delle unità primarie 5.2.1. Formazione degli strati - 116 5.3. 5.2.2. Unità autorappresentative Selezione di un campione su più stadi 5.3.1. Probabilità di selezione costanti ad ogni stadio - 5.3.2. ·Probabilità di selezione proporzionali alla dimensione delle unità (PPS) - 5.3.3. Selezione delle unità finali 122 5.4. Stima 5.4.1. Campioni di numerosità costante nelle unità primarie - 5.4.2. Campioni di numerosità variabile nelle unità primarie - 5.4.3. Il coefficiente di correlazione intraclasse 129 5.5. Stima con disegni stratificati al primo stadio 5.5.1. Sub-campioni di numèrosità costante numerosità variabile 131 5.6. 5.5.2. Sub-campioni di Effetto della selezione stadificata sull'efficienza 5.6.1. Il campionamento su più stadi a confronto del campionamento casuale semplice - 5.6.2. Effetto della stratificazione delle unità primarie - 5.6.3. II campionamento PPS rispetto a quello a_probabilità costanti ad ogni stadio 135 5.7. Determinazione della numerosità campionaria 5.7.1. Numerosità campionaria al primo stadio - 5.7.2. Numerosità dei sub-campioni 139 5.8. Applicazione: il campione per l'indagine dell'ISTAT sulle forze di lavoro 143 6. Campionamento di aree 143 145 6.1. 6.2. Un campione di aree Preparazione della lista di aree 6.2.1. Dimensione dell'area di base 152 6.3. Selezione di un campione areale 6.3 .1. Numerosità ottima di campioni su tre stadi dell'intervallo semi-aperto 157 6.4. Alcuni problemi 6.4.1. Elementi rari - 161 6.5. 6.3.2. La tecnica 6.4.2. Ponderazione delle unità Applicazioni 6.5.1. L'indagine statunitense sulle forze di lavoro Current Population Survey - 6.5.2. Scelte per formare un campione di stabilimenti industriali e commerciali selezionando sezioni di censimento 169 7. 169 7.1. Campionamento ruotato Campioni per indagini ripetute o continue 7.1.1. Campioni ruotati 171 7.2. Schemi di rotazione 7.2.1. Uno schema di rotazione per la rilevazione di dati attuali- 7.2.2. Un campione ruotato per rilevazioni retrospettive - 7.2.3. Uno schema di rotazione generalizzato 175 7.3. Stima con dati attuali 7.3.1. Media - 7.3 .2. Differenza tra le medie di due occasioni - 7.3.3. Media su più occasioni 179 180 7.4. 7.5. Stima della media con dati retrospettivi Effetto della rotazione sull'efficienza 7.5.1. Un livello di rilevazione - 7.5.2. Due livelli di rilevazione 7.5.3 . Campione ruotato a uno o a due livelli di rilevazione?'-- 7.5.4. La frazione di avvicendamento in un campione ruotato 185 7.6. Applicazioni 7.6.1. La rotazione del campione di famiglie nell'indagine dell'ISTAT sulle forze di lavoro - 7.6.2. La rotazione del campione di aree nell'indagine statunitense Current Population Survey 189 8. Campionamento in due fasi 189 190 191 8.1. 8.2. 8.3. Campioni formati in due fasi Selezione di un campione in due fasi Stima della media 8.3.1. Metodo del quoziente - 8.3.2. Metodo della regressione - 8.3.3 . Campionamento doppio con stratificazione 195 8.4. Effetto della doppia selezione sull'efficienza 8.4.1. Il campionamento doppio a confronto del campionamento casuale semplice - 8.4.2. Il campionamento doppio a confronto del campionamento ruotato - 8.4.3. Efficienza e costo delle informazioni ausiliarie 197 198 8.5. 8.6. Numerosità ottima del campione finale Applicazioni della logica del campionamento in più fasi per la soluzione del problema dei mancati rispondenti 8.6.1. Quale frazione di mancati rispondenti sondare in un'indagine diretta? - 8.6.2. Quante volte sollecitare la collaborazione dei mancati rispondenti in un'indagine postale? 207 9. Compenetrazione di sub-campioni 207 210 211 9.1. 9.2. 9.3. Misura degli errori di rilevazione Suddivisione del campione in sub-campioni compenetranti Stima 9.3.1. Media e proporzione - 9.3 .2. Varianza elementare di risposta 9.3.3. Varianza dell'intervistatore 219 9.4. Effetto dell'impiego di rilevatori 221 223 9.5. 9.6. Determinazione del numero ottimo di rilevatori Applicazioni 9.6.1. Compenetrazione delle assegnazioni degli intervistatori in due successive indagini in un'area ristretta - 9.6.2. Compenetrazione delle assegnazioni degli intervistatori in un'indagine sui clienti di un istituto di credito 227 Appendice A. Tavola dei numeri casuali 229 Appendice B. Comuni della Toscana. Dati censuari 235 Appendice C. Alcuni programmi informatici per la misura dell'errore di stima 239 Bibliografia 249 Indice analitico IUAV - SBD VENEZIA l llll lllll llll llll llll llll llllll lllll llll