Filomena Maggino L analisi dei dati nell'indagine statistica La realizzazione dell'indagine e l'analisi preliminare dei dari Volume 1 lenezia vi!'IVn Firenze Uni versi ty \ Filomena Maggino :L analisi dei dati nell' indagi~e statistica Volume 1 La realizzazione dell'indagine e l'analisi preliminare dei dati ISTITUTO UNIVERSITARIO ARCHITETTURA VENEZIA AREA SERVIZI BIBLIOGRAFICI EUOCUMENTALI ·~n 1 CIA .•.......... Z.?...~.~S.. .................. Firenze University Press 2005 I -"' Sommario Presentazione xi PARTE I l?INDAGINE STATISTICA: APPROCCI, METODI E STRUMENTI 1. Indagine statistica 1.1 Il disegno 1.1.1 Caratteristiche del disegno 1.1.1.1 Disegno e ipotesi 1.1.1.2 Classificazione dei disegni Affinità tra disegni ~ 1.1.2 Il disegno descrittivo 1.1.2.1 Disegni trasversali e longitudinali 1.1.3 Il disegno sperimentale 1.2 Complessità dell'indagine in ambito sociale 1.3 Le fasi 1.1.1.3 2. Strumento di rilevazione 2.1 Definizione, disegno e sviluppo di uno strumento di rilevazione 2.1.1 La standardizzazione di uno strumento 2.2 Il questionario strutturato 2.2.1 Il modello 2.2.2 La costruzione del questionario 2.2.2.1 Definizioni formali 2.2.2.2 Le domande nel questionario strutturato 2.2.2.3 l?organizzazione delle domande e delle risposte 2.2.2.4 Definizione delle categorie di risposta 3. Campionamento: principi e procedure 3.1 Gruppi o campioni non probabilistici 3.2 Campioni probabilistici 3.2.1 Dimensione del campione 3.2.2 Tecniche di estrazione del campione 3.2.3 Particolari problemi di campionamento 3.2.3.1 La stratificazione territoriale 3.2.3.2 Il campionamento per le indagini longitudinali 3 3 3 3 4 6 6 7 8 9 12 19 19 22 23 25 26 28 30 33 35 39 41 43 44 44 47 47 48 f' Ii vi Sommario 4. Raccolta dei dati 4.1 La rilevazione 4.1.1 Principi della rilevazione 4.1.2 Le tecniche e le procedure di rilevazione con questionario 4.1.3 L'organizzazione 4.1.3.1 Studi pilota e pretest 4.1.3.2 I rilevatori 4.1.3.3 I supervisori 4.2 La codifica e la post-codifica 4.2.1 Il modello di codifica 4.2.2 La creazione di schemi di codifica multidimensionali 4.3 L'acquisizione dei dati 4.3.1 La registrazione 4.3.2 La descrizione della struttura dei dati 51 51 51 52 56 57 58 59 60 60 62 63 68 70 5. Trattamento dei dati 5.1 L'elaborazione automatica 5.2 Momenti dell'elaborazione 5.2.1 La lettura 5.2.2 La gestione e la manipolazione 5 .2.2.1 L'ordinamento dei dati 5.2.2.2 Il trattamento degli archivi 5.3 Lo spoglio dei dati: identificazione e trattamento degli errori 73 73 76 76 80 81 84 86 6. Analisi statistica dei dati 6.1 Gli obiettivi dell'analisi La descrizione 6.1.1 6.1.2 L'esplorazione La validazione dei risultati 6.1.3 6.2 I metodi e le tecniche di analisi 6.2.1 Accortezze nell'applicazione dei metodi statistici 6.3 Il modello di analisi del questionario 89 92 93 93 95 97 99 1O1 7. Risultati 7.1 La presentazione dei risultati statistici 7 .2 La lettura dei risultati statistici 105 106 107 8. Errori nelle indagini 8.1 L'errore di non-osservazione 8.1.1 L'errore di campionamento 8.1.2 L'errore per mancata risposta 8.2 L'errore di osservazione 8.2.1 L'errore di misurazione 115 117 117 117 119 119 vii Sommario Appendici A. Strumenti per la progettazione e la gestione di un'indagine statistica A. l La progettazione A.1.1 Il progetto preliminare A.1.2 Il progetto di "fattibilità" A.1.2.1 Alcuni strumenti metodologici A.1 .3 Il progetto esecutivo A 1.3.1 Alcuni strumenti operativi della progettazione A.2 La gestione A.3 La valutazione PARTE 125 126 128 129 131 134 134 143 145 II I...:ANALISI STATISTICA DI BASE: LA DESCRIZIONE DEI DATI > 1. Descrizione iniziale 1.1 Descrizione della tendenza centrale e della dispersione 1.1.1 La tendenza centrale o modale 1.1.1.1 La scelta tra gli indici 1.1 .2 La dispersione Confronto tra indici 1.1.3 1.2 Descrizione grafica 1.2. l Gli strumenti 1.2.2 [analisi della forma della distribuzione 151 152 152 154 155 156 157 158 162 2. Controllo dei dati 2.1 I dati mancanti 2.1.l Definizione 2.1.2 Origine dei dati mancanti 2.1.3 Il trattamento dei dati mancanti 2.1.3.1 I metodi di imputazione 2.1.3.2 Le tecniche di imputazione 2.2 Outlier 2.2. l Identificazione degli outlier 167 167 167 168 169 169 170 173 173 3. Modifiche e trasformazioni dei dati 3.1 Modifiche 3.1. l La suddivisione in classi 3.1.2 La dicotomizzazione 3.1.3 Utilizzo di variabili non-metriche: le variabili dummy 3.2 Trasformazioni 3.2.1 La relativizzazione 3.2.1.1 I centili 177 178 178 181 181 183 183 183 viii Sommario 3.2.1.2 La standardizzazione 3.2.1.3 I numeri-indice 3.2.2 La normalizzazione di una distribuzione 3.2.2.1 I.:assunto di normalità 3.2.2.2 La trasformazione 3.3 La ponderazione delle osservazioni 184 186 186 186 188 191 4. Defìnizione di punteggi di sintesi 4.1 La preparazione dei dati per la sintesi · 4.1. l Verifiche preliminari 4.1.2 Confrontabilità dei livelli di misurazione 4.2 I.:aggregazione 4.2. l Funzioni di aggregazione 4.2.2 La ponderazione 4.3 I procedimenti più complessi 195 197 197 198 200 200 203 205 5. Relazione tra variabili: l'analisi dell'associazione 5.1 Il tipo di relazione 5.2 La forma della relazione 5.3 La forza e la strettezza 5.3. l Gli approcci alla misura dell'associazione Origine del concetto di correlazione 5.3.2 5.3.3 I.: analisi della contingenza 5.3.4 I.: analisi della cograduazione I.: analisi della correlazione 5.3.5 5.3.5.1 Interpretazione di r ~ 5.3.5.2 I.:assunto di linearità 5.3.5.3 Lassunto di omoscedasticità 5.3.6 Associazione tra variabili misurate su scale diverse 5.3.7 Associazione parziale e multipla 5.3.8 Problemi nell'analisi della strettezza 5.4 I.:analisi grafica 209 209 212 215 216 219 222 225 225 226 227 231 232 233 234 235 6. Confronto tra casi: l'analisi della prossimità 6.1 Le misure di distanza 6.1.1 Il modello spaziale 6.1.2 Le misure 6.2 Le misure di somiglianza 6.2.1 Misurare la somiglianza con variabili binarie 6.2.2 Misurare la somiglianza con variabili dicotomiche Un particolare approccio alla misura di somiglianza: 6.2.3 la misura dell'accordo 6.3 Approcci grafici all'analisi della prossimità 239 240 240 240 245 245 247 249 250 .... . ix Sommario Appendici A. Criteri per la costruzione di rappresentazioni grafiche A.1 La percezione visiva A.2 Elementi da considerare nel disegno dei grafici 255 256 263 B. Una particolare tecnica di rappresentazione grafica: il grafico triangolare 267 Bibliografia 273 CD-Rom allegato ..._ Nel campo della ricerca sociale, uno degli approcci che consentono di ottenere un particolare tipo di osservazione degli eventi empirici è quello delle indagini. Nello svolgimento delle indagini, la statistica, nella sua versione applicativa, riveste un ruolo fondamentale in molte fasi - dalla pianificazione dello studio all'individuazione e selezione del gruppo da osservare, dalla scelta e costruzione dello strumento di rilevazione, all'analisi dei dati. Lintento di questo lavoro è di evidenziare tale ruolo con particolare riferimento all'analisi dei dati, ponendo l'accento sugli obiettivi di tale analisi, sulla logica e sui procedimenti necessari per raggiungere tali obiettivi e sulla comprensione e interpretazione dei risultati. Filomena Maggino, docente di Statistica Sociale presso l'Università di Firenze. La sua attività di ricerca nel campo della statistica applicata è rivolta anche alla costruzione e validazione di strumenti di misurazione (in campo epidemiologico, psicologico e sociale) applicati anche al settore della qualità della vita e di quello più ampio degli indicatori sociali, alla definizione di modelli di analisi di dati provenienti da rilevazioni tramite questionari. Istituto ISBN 88 8453 2J8 6 111111111111111111111111 9 788884 532084