L'INDAGINE
CAMPIONARIA
Metodi, disegni e tecniche
di campionamento
ezio
Bf F~ :_~ () ì E(.' .6.. CJ ?.. ES T
Luigi Fabbris
L'indagine
•
•
camp1onar1a
Metodi, disegni e tecniche
di campionamento
La Nuova Italia Scientifica
Indice
pag.
13
Prefazione
17
I.
Disegni di campionamento
17
1.1.
Il campionamento per r'lndagine statistica
1.1.1. Popolazione e campione
18
1.2.
L'indagine statistica
1.2.1. Indagine esaustiva o campionaria?
22
24
1.3.
1.4.
Il campionamento casuale
Il disegno di campionamento
1.4.1. Struttura del campione - 1.4.2. Probabilità di selezione - 1.4.3.
Selezione delle unità campionarie - 1.4.4. Determinazione della numerosità campionaria
26
1.5.
Stima
1.5.1. Stimatori - 1.5.2. Errore di campionamento - 1.5.3. Errori di
rilevazione - 1.5.4. Intervallo fiduciario delle stime - 1.5.5. Deff: effetto del disegno di campionamento - 1.5.6. Campioni autoponderanti
33
1.6.
Criteri di scelta della struttura del campione
1.6.1. Caratteristiche della popolazione e delle variabili - 1.6.2. Indisponibilità o imperfezione delle liste - 1.6.3. Uso efficiente delle risorse
disponibili per l'indagine - 1.6.4. Obiettivi di ricerca
41
2.
Selezione casuale del campione
41
42
2.1.
2.2.
La selezione casuale
Selezione con reinserimento
2.2.1. Selezione con probabilità diseguali sione nel campione
43
2.3.
2.2.2. Probabilità di inclu-
Selezione senza reinserimento
2.3.1. Selezione con probabilità diseguali sione nel campione
2.3.2. Probabilità di inclu-
44
2.4.
Selezione sistematica
2.4.1. Selezione con probabilità diseguali sione nel campione
46
2.5.
Tecniche per la selezione casuale semplice
2.5.1. Le tavole dei numeri casuali casuali con il computer
48
2.6.
2.5.2. Generazione di numeri
Tecniche per la selezione sistematica
2.6.1. Il caso normale -
2.6.2. Nln non è un numero intero
53
3.
Campionamento casuale semplice
53
3.1.
3.2.
Il campione casuale semplice
Stima
54
2.4.2. Probabilità di inclu-
3.2.1. Totale e media - 3.2.2. Frequenze assolute e relative Differenza e covarianza tra due medie
61
64
3.3.
3.4.
3.2.3.
Determinazione della numerosità ottimale del campione
Problemi di lista nel campionamento casuale semplice
3.4.1. Elementi mancanti dalla lista - 3.4.2. Unità non pertinenti o
"bianche" presenti nella lista - 3.4.3. Registrazione multipla di unità
nella lista
68
3.5.
Un'applicazione: calcolo della numerosità del campione
per un'indagine longitudinale
71
4.
Campionamento stratificato
71
73
4.1.
4.2.
Il campione stratificato
Selezione di un-~campione stratificato
4.2.1. Selezione di un campione stratificato proporzionale - 4.2.2. Stratificazione implicita - 4.2.3. Selezione di un campione stratificato non
proporzionale - 4.2.4. Selezione di un campione stratificato ottimale 4.2.5. Controllo sulla selezione oltre la stratificazione
82
4.3.
Stima
4.3.1. Stima con un disegno stratificato generico - 4.3.2. Stima con
allocazione proporzionale del campione - 4.3.3. Stima con allocazione
ottimale del campione - 4.3.4. Stime per sottoclassi - 4.3.5. Un campione di due unità per strato - 4.3.6. Un campione di una unità per
strato - 4.3.7. Tecnica delle differenze successive - 4.3.8. Tecnica del
collassamento degli strati
92
4.4.
Effetto della stratificazione sull'efficienza
4.4.1. Campionamento proporzionale rispetto a campionamento casuale
semplice - 4.4.2. Campionamento ottimale rispetto a proporzionale
96
4.5.
Altre scelte per formare un campione stratificato
4.5.1. Variabili di stratificazione - 4.5.2. Numero di strati - 4.5.3.
Determinazione della numerosità del campione - 4.5.4. Unità autorappresentative - 4.5.5. Allocazione del campione per un'indagine multiscopo
103
4.6.
Applicazioni
4.6.1. Spunti per la formazione di un campione stratificato di Comuni
toscani - 4.6.2. Un campione stratificato ottimale per un'indagine sulla
clientela di un istituto di credito - 4.6.3. Un campione per una indagine
sulla tossicodipendenza da droghe pesanti
111
5.
Campionamento su più stadi
111
114
5.1.
5.2.
Gerarchie di popolazioni e di campioni
Disegni con stratificazione delle unità primarie
5.2.1. Formazione degli strati -
116
5.3.
5.2.2. Unità autorappresentative
Selezione di un campione su più stadi
5.3.1. Probabilità di selezione costanti ad ogni stadio - 5.3.2. ·Probabilità di selezione proporzionali alla dimensione delle unità (PPS) - 5.3.3.
Selezione delle unità finali
122
5.4.
Stima
5.4.1. Campioni di numerosità costante nelle unità primarie - 5.4.2.
Campioni di numerosità variabile nelle unità primarie - 5.4.3. Il coefficiente di correlazione intraclasse
129
5.5.
Stima con disegni stratificati al primo stadio
5.5.1. Sub-campioni di numèrosità costante numerosità variabile
131
5.6.
5.5.2. Sub-campioni di
Effetto della selezione stadificata sull'efficienza
5.6.1. Il campionamento su più stadi a confronto del campionamento
casuale semplice - 5.6.2. Effetto della stratificazione delle unità primarie - 5.6.3. II campionamento PPS rispetto a quello a_probabilità costanti ad ogni stadio
135
5.7.
Determinazione della numerosità campionaria
5.7.1. Numerosità campionaria al primo stadio - 5.7.2. Numerosità dei
sub-campioni
139
5.8.
Applicazione: il campione per l'indagine dell'ISTAT sulle
forze di lavoro
143
6.
Campionamento di aree
143
145
6.1.
6.2.
Un campione di aree
Preparazione della lista di aree
6.2.1. Dimensione dell'area di base
152
6.3.
Selezione di un campione areale
6.3 .1. Numerosità ottima di campioni su tre stadi dell'intervallo semi-aperto
157
6.4.
Alcuni problemi
6.4.1. Elementi rari -
161
6.5.
6.3.2. La tecnica
6.4.2. Ponderazione delle unità
Applicazioni
6.5.1. L'indagine statunitense sulle forze di lavoro Current Population
Survey - 6.5.2. Scelte per formare un campione di stabilimenti industriali e commerciali selezionando sezioni di censimento
169
7.
169
7.1.
Campionamento ruotato
Campioni per indagini ripetute o continue
7.1.1. Campioni ruotati
171
7.2.
Schemi di rotazione
7.2.1. Uno schema di rotazione per la rilevazione di dati attuali- 7.2.2.
Un campione ruotato per rilevazioni retrospettive - 7.2.3. Uno schema
di rotazione generalizzato
175
7.3.
Stima con dati attuali
7.3.1. Media - 7.3 .2. Differenza tra le medie di due occasioni - 7.3.3.
Media su più occasioni
179
180
7.4.
7.5.
Stima della media con dati retrospettivi
Effetto della rotazione sull'efficienza
7.5.1. Un livello di rilevazione - 7.5.2. Due livelli di rilevazione 7.5.3 . Campione ruotato a uno o a due livelli di rilevazione?'-- 7.5.4. La
frazione di avvicendamento in un campione ruotato
185
7.6.
Applicazioni
7.6.1. La rotazione del campione di famiglie nell'indagine dell'ISTAT
sulle forze di lavoro - 7.6.2. La rotazione del campione di aree nell'indagine statunitense Current Population Survey
189
8.
Campionamento in due fasi
189
190
191
8.1.
8.2.
8.3.
Campioni formati in due fasi
Selezione di un campione in due fasi
Stima della media
8.3.1. Metodo del quoziente - 8.3.2. Metodo della regressione - 8.3.3 .
Campionamento doppio con stratificazione
195
8.4.
Effetto della doppia selezione sull'efficienza
8.4.1. Il campionamento doppio a confronto del campionamento casuale
semplice - 8.4.2. Il campionamento doppio a confronto del campionamento ruotato - 8.4.3. Efficienza e costo delle informazioni ausiliarie
197
198
8.5.
8.6.
Numerosità ottima del campione finale
Applicazioni della logica del campionamento in più fasi
per la soluzione del problema dei mancati rispondenti
8.6.1. Quale frazione di mancati rispondenti sondare in un'indagine diretta? - 8.6.2. Quante volte sollecitare la collaborazione dei mancati
rispondenti in un'indagine postale?
207
9.
Compenetrazione di sub-campioni
207
210
211
9.1.
9.2.
9.3.
Misura degli errori di rilevazione
Suddivisione del campione in sub-campioni compenetranti
Stima
9.3.1. Media e proporzione - 9.3 .2. Varianza elementare di risposta 9.3.3. Varianza dell'intervistatore
219
9.4.
Effetto dell'impiego di rilevatori
221
223
9.5.
9.6.
Determinazione del numero ottimo di rilevatori
Applicazioni
9.6.1. Compenetrazione delle assegnazioni degli intervistatori in due successive indagini in un'area ristretta - 9.6.2. Compenetrazione delle assegnazioni degli intervistatori in un'indagine sui clienti di un istituto di
credito
227
Appendice A. Tavola dei numeri casuali
229
Appendice B. Comuni della Toscana. Dati censuari
235
Appendice C. Alcuni programmi informatici per la misura
dell'errore di stima
239
Bibliografia
249
Indice analitico
IUAV - SBD VENEZIA
l llll lllll llll llll llll llll llllll lllll llll