L analisi dei dati nell`indagine statistica

Filomena Maggino
L analisi dei dati
nell'indagine statistica
La realizzazione dell'indagine e l'analisi preliminare dei dari
Volume 1
lenezia
vi!'IVn
Firenze Uni versi ty
\
Filomena Maggino
:L analisi dei dati
nell' indagi~e statistica
Volume 1
La realizzazione dell'indagine e l'analisi preliminare dei dati
ISTITUTO UNIVERSITARIO ARCHITETTURA
VENEZIA
AREA SERVIZI BIBLIOGRAFICI EUOCUMENTALI
·~n 1 CIA .•.......... Z.?...~.~S.. ..................
Firenze University Press
2005
I
-"'
Sommario
Presentazione
xi
PARTE
I
l?INDAGINE STATISTICA: APPROCCI, METODI E STRUMENTI
1. Indagine statistica
1.1 Il disegno
1.1.1
Caratteristiche del disegno
1.1.1.1 Disegno e ipotesi
1.1.1.2 Classificazione dei disegni
Affinità tra disegni
~
1.1.2
Il disegno descrittivo
1.1.2.1 Disegni trasversali e longitudinali
1.1.3
Il disegno sperimentale
1.2 Complessità dell'indagine in ambito sociale
1.3 Le fasi
1.1.1.3
2. Strumento di rilevazione
2.1 Definizione, disegno e sviluppo di uno strumento di rilevazione
2.1.1 La standardizzazione di uno strumento
2.2 Il questionario strutturato
2.2.1
Il modello
2.2.2
La costruzione del questionario
2.2.2.1 Definizioni formali
2.2.2.2 Le domande nel questionario strutturato
2.2.2.3 l?organizzazione delle domande e delle risposte
2.2.2.4 Definizione delle categorie di risposta
3. Campionamento: principi e procedure
3.1 Gruppi o campioni non probabilistici
3.2 Campioni probabilistici
3.2.1
Dimensione del campione
3.2.2
Tecniche di estrazione del campione
3.2.3
Particolari problemi di campionamento
3.2.3.1 La stratificazione territoriale
3.2.3.2 Il campionamento per le indagini longitudinali
3
3
3
3
4
6
6
7
8
9
12
19
19
22
23
25
26
28
30
33
35
39
41
43
44
44
47
47
48
f'
Ii
vi
Sommario
4. Raccolta dei dati
4.1 La rilevazione
4.1.1
Principi della rilevazione
4.1.2
Le tecniche e le procedure di rilevazione con questionario
4.1.3
L'organizzazione
4.1.3.1 Studi pilota e pretest
4.1.3.2 I rilevatori
4.1.3.3 I supervisori
4.2 La codifica e la post-codifica
4.2.1
Il modello di codifica
4.2.2
La creazione di schemi di codifica multidimensionali
4.3 L'acquisizione dei dati
4.3.1
La registrazione
4.3.2
La descrizione della struttura dei dati
51
51
51
52
56
57
58
59
60
60
62
63
68
70
5. Trattamento dei dati
5.1 L'elaborazione automatica
5.2 Momenti dell'elaborazione
5.2.1
La lettura
5.2.2
La gestione e la manipolazione
5 .2.2.1 L'ordinamento dei dati
5.2.2.2 Il trattamento degli archivi
5.3 Lo spoglio dei dati: identificazione e trattamento degli errori
73
73
76
76
80
81
84
86
6. Analisi statistica dei dati
6.1 Gli obiettivi dell'analisi
La descrizione
6.1.1
6.1.2
L'esplorazione
La validazione dei risultati
6.1.3
6.2 I metodi e le tecniche di analisi
6.2.1
Accortezze nell'applicazione dei metodi statistici
6.3 Il modello di analisi del questionario
89
92
93
93
95
97
99
1O1
7. Risultati
7.1 La presentazione dei risultati statistici
7 .2 La lettura dei risultati statistici
105
106
107
8. Errori nelle indagini
8.1 L'errore di non-osservazione
8.1.1
L'errore di campionamento
8.1.2
L'errore per mancata risposta
8.2 L'errore di osservazione
8.2.1
L'errore di misurazione
115
117
117
117
119
119
vii
Sommario
Appendici
A. Strumenti per la progettazione e la gestione di un'indagine statistica
A. l La progettazione
A.1.1
Il progetto preliminare
A.1.2
Il progetto di "fattibilità"
A.1.2.1 Alcuni strumenti metodologici
A.1 .3
Il progetto esecutivo
A 1.3.1 Alcuni strumenti operativi della progettazione
A.2 La gestione
A.3 La valutazione
PARTE
125
126
128
129
131
134
134
143
145
II
I...:ANALISI STATISTICA DI BASE: LA DESCRIZIONE DEI DATI
>
1. Descrizione iniziale
1.1 Descrizione della tendenza centrale e della dispersione
1.1.1
La tendenza centrale o modale
1.1.1.1 La scelta tra gli indici
1.1 .2
La dispersione
Confronto tra indici
1.1.3
1.2 Descrizione grafica
1.2. l
Gli strumenti
1.2.2
[analisi della forma della distribuzione
151
152
152
154
155
156
157
158
162
2. Controllo dei dati
2.1 I dati mancanti
2.1.l
Definizione
2.1.2
Origine dei dati mancanti
2.1.3
Il trattamento dei dati mancanti
2.1.3.1 I metodi di imputazione
2.1.3.2 Le tecniche di imputazione
2.2 Outlier
2.2. l
Identificazione degli outlier
167
167
167
168
169
169
170
173
173
3. Modifiche e trasformazioni dei dati
3.1 Modifiche
3.1. l
La suddivisione in classi
3.1.2
La dicotomizzazione
3.1.3
Utilizzo di variabili non-metriche: le variabili dummy
3.2 Trasformazioni
3.2.1
La relativizzazione
3.2.1.1 I centili
177
178
178
181
181
183
183
183
viii
Sommario
3.2.1.2 La standardizzazione
3.2.1.3 I numeri-indice
3.2.2
La normalizzazione di una distribuzione
3.2.2.1 I.:assunto di normalità
3.2.2.2 La trasformazione
3.3 La ponderazione delle osservazioni
184
186
186
186
188
191
4. Defìnizione di punteggi di sintesi
4.1 La preparazione dei dati per la sintesi
· 4.1. l
Verifiche preliminari
4.1.2
Confrontabilità dei livelli di misurazione
4.2 I.:aggregazione
4.2. l
Funzioni di aggregazione
4.2.2
La ponderazione
4.3 I procedimenti più complessi
195
197
197
198
200
200
203
205
5. Relazione tra variabili: l'analisi dell'associazione
5.1 Il tipo di relazione
5.2 La forma della relazione
5.3 La forza e la strettezza
5.3. l
Gli approcci alla misura dell'associazione
Origine del concetto di correlazione
5.3.2
5.3.3
I.: analisi della contingenza
5.3.4
I.: analisi della cograduazione
I.: analisi della correlazione
5.3.5
5.3.5.1 Interpretazione di r ~
5.3.5.2 I.:assunto di linearità
5.3.5.3 Lassunto di omoscedasticità
5.3.6
Associazione tra variabili misurate su scale diverse
5.3.7
Associazione parziale e multipla
5.3.8
Problemi nell'analisi della strettezza
5.4 I.:analisi grafica
209
209
212
215
216
219
222
225
225
226
227
231
232
233
234
235
6. Confronto tra casi: l'analisi della prossimità
6.1 Le misure di distanza
6.1.1
Il modello spaziale
6.1.2
Le misure
6.2 Le misure di somiglianza
6.2.1
Misurare la somiglianza con variabili binarie
6.2.2
Misurare la somiglianza con variabili dicotomiche
Un particolare approccio alla misura di somiglianza:
6.2.3
la misura dell'accordo
6.3 Approcci grafici all'analisi della prossimità
239
240
240
240
245
245
247
249
250
.... .
ix
Sommario
Appendici
A. Criteri per la costruzione di rappresentazioni grafiche
A.1 La percezione visiva
A.2 Elementi da considerare nel disegno dei grafici
255
256
263
B. Una particolare tecnica di rappresentazione grafica: il grafico triangolare
267
Bibliografia
273
CD-Rom allegato
..._
Nel campo della ricerca sociale, uno degli approcci che consentono di ottenere un
particolare tipo di osservazione degli eventi empirici è quello delle indagini. Nello
svolgimento delle indagini, la statistica, nella sua versione applicativa, riveste un
ruolo fondamentale in molte fasi - dalla pianificazione dello studio all'individuazione
e selezione del gruppo da osservare, dalla scelta e costruzione dello strumento di
rilevazione, all'analisi dei dati. Lintento di questo lavoro è di evidenziare tale ruolo
con particolare riferimento all'analisi dei dati, ponendo l'accento sugli obiettivi di tale
analisi, sulla logica e sui procedimenti necessari per raggiungere tali obiettivi e sulla
comprensione e interpretazione dei risultati.
Filomena Maggino, docente di Statistica Sociale presso l'Università di Firenze. La sua
attività di ricerca nel campo della statistica applicata è rivolta anche alla costruzione
e validazione di strumenti di misurazione (in campo epidemiologico, psicologico e
sociale) applicati anche al settore della qualità della vita e di quello più ampio degli
indicatori sociali, alla definizione di modelli di analisi di dati provenienti da rilevazioni
tramite questionari.
Istituto
ISBN 88 8453 2J8 6
111111111111111111111111
9
788884 532084