L’indagine campionaria Tipologie d’indagine Strategie di campionamento La progettazione di un’indagine statistica Dott. Cazzaniga Paolo Dip. di Scienze Umane e Sociali [email protected] Dott. Cazzaniga Paolo La progettazione di un’indagine statistica L’indagine campionaria Tipologie d’indagine Strategie di campionamento Outline 1 L’indagine campionaria 2 Tipologie d’indagine 3 Strategie di campionamento Dott. Cazzaniga Paolo La progettazione di un’indagine statistica L’indagine campionaria Tipologie d’indagine Strategie di campionamento Outline 1 L’indagine campionaria 2 Tipologie d’indagine 3 Strategie di campionamento Dott. Cazzaniga Paolo La progettazione di un’indagine statistica L’indagine campionaria Tipologie d’indagine Strategie di campionamento L’indagine campionaria [1/2] Principalmente influenzata da: tempi costi Censimento: ha tempi molto lunghi sia per la rilevazione che per l’analisi quello della popolazione viene realizzato ogni 10 anni richiede circa 4 anni per la pubblicazione dei risultati dell’indagine Dott. Cazzaniga Paolo La progettazione di un’indagine statistica L’indagine campionaria Tipologie d’indagine Strategie di campionamento L’indagine campionaria [2/2] Rilevazione campionaria: permette di analizzare le caratteristiche di una popolazione attraverso lo studio di una sua porzione la porzione di popolazione presa in esame è detta campione fornisce risultati attendibili con una minima perdita di precisione utilizza dei protocolli: insieme di regole, linee guida e procedure regolate e riconosciute pubblicamente Si compone di 4 fasi fondamentali: 1 Definizione degli obiettivi della ricerca 2 Rilevazione dei dati 3 Elaborazione (statistica) dei dati 4 Interpretazione dei risultati Dott. Cazzaniga Paolo La progettazione di un’indagine statistica L’indagine campionaria Tipologie d’indagine Strategie di campionamento La popolazione di riferimento La definizione degli obiettivi della ricerca prevede l’identificazione della popolazione di riferimento, dove troviamo: popolazione teorica: insieme di tutti i casi che costituiscono la popolazione oggetto di indagine popolazione accessibile: insieme di tutti i casi appartenenti alla popolazione teorica che sono effettivamente raggiungibili La popolazione teorica non è sempre accessibile nell’indagine campionaria per i seguenti problemi: limitate risorse economiche la popolazione non è fisicamente raggiungibile l’intera popolazione non è del tutto nota Per questi motivi si passa al campionamento Dott. Cazzaniga Paolo La progettazione di un’indagine statistica L’indagine campionaria Tipologie d’indagine Strategie di campionamento L’indagine campionaria [1/2] Qualità del campionamento Dott. Cazzaniga Paolo La progettazione di un’indagine statistica L’indagine campionaria Tipologie d’indagine Strategie di campionamento L’indagine campionaria [1/2] Qualità del campionamento Intervistati 50% uomini e 50% donne, però la proporzione del mercato del lavoro italiano è 60% / 40% Quante persone hanno rifiutato l’intervista? Dott. Cazzaniga Paolo La progettazione di un’indagine statistica L’indagine campionaria Tipologie d’indagine Strategie di campionamento L’indagine campionaria [2/2] Per valutare la qualità dell’indagine, devono essere fornite le seguenti informazioni: soggetto che ha realizzato il sondaggio criteri per l’individuazione del campione metodo di raccolta e elaborazione dei dati numero delle persone interpellate e universo (popolazione) di riferimento domande rivolte percentuale di persone che hanno risposo a ciascuna domanda date in cui è stato realizzato il sondaggio Dott. Cazzaniga Paolo La progettazione di un’indagine statistica L’indagine campionaria Tipologie d’indagine Strategie di campionamento Outline 1 L’indagine campionaria 2 Tipologie d’indagine 3 Strategie di campionamento Dott. Cazzaniga Paolo La progettazione di un’indagine statistica L’indagine campionaria Tipologie d’indagine Strategie di campionamento Tipologie d’indagine [1/2] Nella fase di progettazione di un’indagine possono essere identificate le seguenti tipologie: trasversali: raccolta di informazioni in un particolare momento per stimare le caratteristiche della popolazione (ad es. il censimento) longitudinali: misura dell’evoluzione nel tempo delle caratteristiche di interesse descrivono e analizzano adeguatamente i processi di mobilità/inerzia controllano l’eterogeneità non osservata conducono analisi su comportamento individuale i dati longitudinali sono osservazioni ripetute nel tempo sugli stessi soggetti Per le indagini sociali viene individuato il panel, ovvero un campione permanente (fisso o ruotato) Dott. Cazzaniga Paolo La progettazione di un’indagine statistica L’indagine campionaria Tipologie d’indagine Strategie di campionamento Tipologie d’indagine [2/2] Secondo una diversa classificazione delle indagini: Indagini occasionali per ottenere stime riferite a caratteristiche della popolazione in singoli istanti di tempi (o periodi) Indagini ripetute senza sovrapposizioni tra le unità indagate Indagini ripetute con una parziale sovrapposizione del campione (per ridurre la varianza campionaria delle stime) Indagini longitudinali senza rotazione per studiare le trasformazioni nel tempo di una popolazione Indagini longitudinali con rotazione per mantenere un campione rappresentativo nella popolazione (per ottenere stime sia longitudinali che trasversali) Dott. Cazzaniga Paolo La progettazione di un’indagine statistica L’indagine campionaria Tipologie d’indagine Strategie di campionamento Outline 1 L’indagine campionaria 2 Tipologie d’indagine 3 Strategie di campionamento Dott. Cazzaniga Paolo La progettazione di un’indagine statistica L’indagine campionaria Tipologie d’indagine Strategie di campionamento Strategie di campionamento [1/2] Per selezionare un campione di una popolazione è possibile procedere nel seguente modo: campionamento probabilistico o casuale ogni unità della popolazione ha una probabilità maggiore di zero di essere selezionato campionamento non probabilistico non si possono stimare le probabilità di inclusione nel campione delle unità non è possibile assicurare la rappresentatività del campione i risultati non sono generalizzabili alla popolazione Dott. Cazzaniga Paolo La progettazione di un’indagine statistica L’indagine campionaria Tipologie d’indagine Strategie di campionamento Strategie di campionamento [2/2] La rilevazione campionaria consente di analizzare le caratteristiche di una popolazione attraverso lo studio di una porzione della popolazione (il campione) Per assicurare la validità dell’indagine, il campione dovrebbe essere probabilistico o statistico La proporzione di campionamento è il rapporto tra la dimensione del campione n e quella della popolazione N Dott. Cazzaniga Paolo La progettazione di un’indagine statistica L’indagine campionaria Tipologie d’indagine Strategie di campionamento Il campionamento probabilistico [1/5] Estrarre casualmente delle unità è corretto perché fenomeni con un’origine casuale sono distribuiti secondo la legge Normale: «Per “norma” si può intendere ciò che è usuale o tipico, ma anche i nostri più pressanti imperativi etici sono definiti “norme”» [Ian Hacking] Dott. Cazzaniga Paolo La progettazione di un’indagine statistica L’indagine campionaria Tipologie d’indagine Strategie di campionamento Il campionamento probabilistico [2/5] Campionamento casuale semplice è poco utilizzato nelle indagini statistiche ogni unità ha probabilità 1/N (con N dimensione della popolazione) selezione con reimmissione selezione senza reimmissione: alla prima estrazione la probabilità di estrazione è 1/N alla seconda è 1/(N − 1) alla terza è 1/(N − 2) ... Dott. Cazzaniga Paolo La progettazione di un’indagine statistica L’indagine campionaria Tipologie d’indagine Strategie di campionamento Il campionamento probabilistico [3/5] Campionamento stratificato la popolazione viene suddivisa in sotto-popolazioni (strati) la scelta degli strati viene fatta per ottenere una variabilità costante all’interno degli stessi e per massimizzare la variabilità tra strati vengono estratte casualmente le unità all’interno di ogni strato: con frazione di campionamento costante (utile quando c’è bassa variabilità negli strati) con frazione di campionamento variabile (è necessario estrarre più unità dagli strati meno omogenei) Dott. Cazzaniga Paolo La progettazione di un’indagine statistica L’indagine campionaria Tipologie d’indagine Strategie di campionamento Il campionamento probabilistico [3/5] Campionamento stratificato Dott. Cazzaniga Paolo La progettazione di un’indagine statistica L’indagine campionaria Tipologie d’indagine Strategie di campionamento Il campionamento probabilistico [3/5] Campionamento stratificato Dott. Cazzaniga Paolo La progettazione di un’indagine statistica L’indagine campionaria Tipologie d’indagine Strategie di campionamento Il campionamento probabilistico [4/5] Campionamento sistematico la prima unità viene estratta casualmente con probabilità 1/N fissata la cardinalità n del campione, vengono selezionate le unità successive ogni k unità l’intervallo k = N/n viene usato quando le unità della popolazione (finita) possono essere numerate Dott. Cazzaniga Paolo La progettazione di un’indagine statistica L’indagine campionaria Tipologie d’indagine Strategie di campionamento Il campionamento probabilistico [5/5] Campionamento a grappolo e a stadi sfrutta l’esistenza di raggruppamenti “naturali” nella popolazione si estrae un campione casuale di grappoli nella selezione a stadi viene estratto casualmente un campione a partire dai grappoli viene effettuato quanto non è disponibile una lista degli elementi della popolazione (che viene quindi suddivisa in unità areali) viene effettuato per convenienza amministrativa e organizzativa Dott. Cazzaniga Paolo La progettazione di un’indagine statistica L’indagine campionaria Tipologie d’indagine Strategie di campionamento Il campionamento non probabilistico [1/2] Campionamento accidentale utilizza un “campione di convenienza” è il metodo meno attendibile Campionamento per quote molto simile al campionamento casuale stratificato proporzionale l’intervistatore sceglie le persone da intervistare devono essere rispettate le quote prestabilite nella scelta delle unità permette di ridurre tempi e costi c’è il rischio di ottenere un campione distorto Dott. Cazzaniga Paolo La progettazione di un’indagine statistica L’indagine campionaria Tipologie d’indagine Strategie di campionamento Il campionamento non probabilistico [2/2] Campionamento a valanga utilizzato per reperire informazioni su fenomeni rari vengono scelte alcune unità con determinate caratteristiche grazie alle unità scelte vengono identificate nuove unità con le stesse caratteristiche (effetto valanga) Campionamento tramite testimoni privilegiati le unità scelte sono a conoscenza di informazioni e notizie su specifici argomenti metodo Delphi: le unità esprimono il loro parere (accordo/disaccordo) rispetto a delle affermazioni in questo modo gli esperti possono confrontare le loro opinioni con quelle del gruppo attiva meccanismi di autocorrezione se l’indagine viene ripetuta più volte il problema principale riguarda la scelta delle unità da inserire nel campione (spesso soggettiva) Dott. Cazzaniga Paolo La progettazione di un’indagine statistica L’indagine campionaria Tipologie d’indagine Strategie di campionamento Problemi di campionamento Fonti di errore: campionario riguarda solo i metodi di campionamento probabilistici deriva dalla scelta del campione della popolazione può essere stimato non campionario legato alle fasi di progettazione, esecuzione ed elaborazione di un’indagine ha un impatto maggiore rispetto all’errore campionario necessità metodi ad hoc per essere stimato Dott. Cazzaniga Paolo La progettazione di un’indagine statistica L’indagine campionaria Tipologie d’indagine Strategie di campionamento Errore non campionario: categorie Le principali categorie di errore non campionario sono: errore di copertura: un’unità non è presente o non è reperibile mancata risposta (totale o parziale) da parte di un’unità unità non contattabile unità non disponibile a rispondere unità disponibile ma non in grado di rispondere errore di rilevazione: rilevazione di un valore diverso da quello “vero” in un’unità errore di codifica: registrazione di un valore diverso da quello rilevato Dott. Cazzaniga Paolo La progettazione di un’indagine statistica L’indagine campionaria Tipologie d’indagine Strategie di campionamento Errore non campionario: mancate risposte [1/2] Esistono metodi per ridurre le mancate risposte da parte di unità: interventi di pianificazione a livello di indagine interventi a livello di tecniche di raccolta dei dati metodi per la tutela della privacy questionari anonimi computer assisted interviewing (CAI) Dott. Cazzaniga Paolo La progettazione di un’indagine statistica L’indagine campionaria Tipologie d’indagine Strategie di campionamento Errore non campionario: mancate risposte [2/2] E’ possibile intervenire a posteriori per ridurre gli effetti delle mancate risposte: metodi di imputazione metodo della media (aritmetica) metodo della mediana metodo delle classi di imputazione (campione diviso in classi, viene usato il metodo della media all’interno della classe) metodi hot e cold deck (usano valori di altre unità della stessa indagine o di altre indagini) metodi di riponderazione ricostruiscono i dati mancanti usando variabili strutturali Dott. Cazzaniga Paolo La progettazione di un’indagine statistica L’indagine campionaria Tipologie d’indagine Strategie di campionamento Dove studio questi argomenti? Capitolo 3 del libro! Dott. Cazzaniga Paolo La progettazione di un’indagine statistica