La progettazione di un`indagine statistica

L’indagine campionaria
Tipologie d’indagine
Strategie di campionamento
La progettazione di un’indagine statistica
Dott. Cazzaniga Paolo
Dip. di Scienze Umane e Sociali
[email protected]
Dott. Cazzaniga Paolo
La progettazione di un’indagine statistica
L’indagine campionaria
Tipologie d’indagine
Strategie di campionamento
Outline
1
L’indagine campionaria
2
Tipologie d’indagine
3
Strategie di campionamento
Dott. Cazzaniga Paolo
La progettazione di un’indagine statistica
L’indagine campionaria
Tipologie d’indagine
Strategie di campionamento
Outline
1
L’indagine campionaria
2
Tipologie d’indagine
3
Strategie di campionamento
Dott. Cazzaniga Paolo
La progettazione di un’indagine statistica
L’indagine campionaria
Tipologie d’indagine
Strategie di campionamento
L’indagine campionaria [1/2]
Principalmente influenzata da:
tempi
costi
Censimento:
ha tempi molto lunghi sia per la rilevazione che per l’analisi
quello della popolazione viene realizzato ogni 10 anni
richiede circa 4 anni per la pubblicazione dei risultati
dell’indagine
Dott. Cazzaniga Paolo
La progettazione di un’indagine statistica
L’indagine campionaria
Tipologie d’indagine
Strategie di campionamento
L’indagine campionaria [2/2]
Rilevazione campionaria:
permette di analizzare le caratteristiche di una popolazione
attraverso lo studio di una sua porzione
la porzione di popolazione presa in esame è detta campione
fornisce risultati attendibili con una minima perdita di precisione
utilizza dei protocolli:
insieme di regole, linee guida e procedure regolate e riconosciute
pubblicamente
Si compone di 4 fasi fondamentali:
1
Definizione degli obiettivi della ricerca
2
Rilevazione dei dati
3
Elaborazione (statistica) dei dati
4
Interpretazione dei risultati
Dott. Cazzaniga Paolo
La progettazione di un’indagine statistica
L’indagine campionaria
Tipologie d’indagine
Strategie di campionamento
La popolazione di riferimento
La definizione degli obiettivi della ricerca prevede l’identificazione
della popolazione di riferimento, dove troviamo:
popolazione teorica: insieme di tutti i casi che costituiscono la
popolazione oggetto di indagine
popolazione accessibile: insieme di tutti i casi appartenenti alla
popolazione teorica che sono effettivamente raggiungibili
La popolazione teorica non è sempre accessibile nell’indagine
campionaria per i seguenti problemi:
limitate risorse economiche
la popolazione non è fisicamente raggiungibile
l’intera popolazione non è del tutto nota
Per questi motivi si passa al campionamento
Dott. Cazzaniga Paolo
La progettazione di un’indagine statistica
L’indagine campionaria
Tipologie d’indagine
Strategie di campionamento
L’indagine campionaria [1/2]
Qualità del campionamento
Dott. Cazzaniga Paolo
La progettazione di un’indagine statistica
L’indagine campionaria
Tipologie d’indagine
Strategie di campionamento
L’indagine campionaria [1/2]
Qualità del campionamento
Intervistati 50% uomini e 50% donne, però la proporzione del
mercato del lavoro italiano è 60% / 40%
Quante persone hanno rifiutato l’intervista?
Dott. Cazzaniga Paolo
La progettazione di un’indagine statistica
L’indagine campionaria
Tipologie d’indagine
Strategie di campionamento
L’indagine campionaria [2/2]
Per valutare la qualità dell’indagine, devono essere fornite le seguenti
informazioni:
soggetto che ha realizzato il sondaggio
criteri per l’individuazione del campione
metodo di raccolta e elaborazione dei dati
numero delle persone interpellate e universo (popolazione) di
riferimento
domande rivolte
percentuale di persone che hanno risposo a ciascuna domanda
date in cui è stato realizzato il sondaggio
Dott. Cazzaniga Paolo
La progettazione di un’indagine statistica
L’indagine campionaria
Tipologie d’indagine
Strategie di campionamento
Outline
1
L’indagine campionaria
2
Tipologie d’indagine
3
Strategie di campionamento
Dott. Cazzaniga Paolo
La progettazione di un’indagine statistica
L’indagine campionaria
Tipologie d’indagine
Strategie di campionamento
Tipologie d’indagine [1/2]
Nella fase di progettazione di un’indagine possono essere identificate
le seguenti tipologie:
trasversali: raccolta di informazioni in un particolare momento
per stimare le caratteristiche della popolazione (ad es. il
censimento)
longitudinali: misura dell’evoluzione nel tempo delle
caratteristiche di interesse
descrivono e analizzano adeguatamente i processi di
mobilità/inerzia
controllano l’eterogeneità non osservata
conducono analisi su comportamento individuale
i dati longitudinali sono osservazioni ripetute nel tempo sugli stessi
soggetti
Per le indagini sociali viene individuato il panel, ovvero un campione
permanente (fisso o ruotato)
Dott. Cazzaniga Paolo
La progettazione di un’indagine statistica
L’indagine campionaria
Tipologie d’indagine
Strategie di campionamento
Tipologie d’indagine [2/2]
Secondo una diversa classificazione delle indagini:
Indagini occasionali per ottenere stime riferite a caratteristiche
della popolazione in singoli istanti di tempi (o periodi)
Indagini ripetute senza sovrapposizioni tra le unità indagate
Indagini ripetute con una parziale sovrapposizione del campione
(per ridurre la varianza campionaria delle stime)
Indagini longitudinali senza rotazione per studiare le
trasformazioni nel tempo di una popolazione
Indagini longitudinali con rotazione per mantenere un campione
rappresentativo nella popolazione (per ottenere stime sia
longitudinali che trasversali)
Dott. Cazzaniga Paolo
La progettazione di un’indagine statistica
L’indagine campionaria
Tipologie d’indagine
Strategie di campionamento
Outline
1
L’indagine campionaria
2
Tipologie d’indagine
3
Strategie di campionamento
Dott. Cazzaniga Paolo
La progettazione di un’indagine statistica
L’indagine campionaria
Tipologie d’indagine
Strategie di campionamento
Strategie di campionamento [1/2]
Per selezionare un campione di una popolazione è possibile
procedere nel seguente modo:
campionamento probabilistico o casuale
ogni unità della popolazione ha una probabilità maggiore di zero di
essere selezionato
campionamento non probabilistico
non si possono stimare le probabilità di inclusione nel campione
delle unità
non è possibile assicurare la rappresentatività del campione
i risultati non sono generalizzabili alla popolazione
Dott. Cazzaniga Paolo
La progettazione di un’indagine statistica
L’indagine campionaria
Tipologie d’indagine
Strategie di campionamento
Strategie di campionamento [2/2]
La rilevazione campionaria consente di analizzare le
caratteristiche di una popolazione attraverso lo studio di una
porzione della popolazione (il campione)
Per assicurare la validità dell’indagine, il campione dovrebbe
essere probabilistico o statistico
La proporzione di campionamento è il rapporto tra la dimensione
del campione n e quella della popolazione N
Dott. Cazzaniga Paolo
La progettazione di un’indagine statistica
L’indagine campionaria
Tipologie d’indagine
Strategie di campionamento
Il campionamento probabilistico [1/5]
Estrarre casualmente delle unità è corretto perché fenomeni con
un’origine casuale sono distribuiti secondo la legge Normale:
«Per “norma” si può intendere ciò che è usuale o tipico, ma anche i
nostri più pressanti imperativi etici sono definiti “norme”»
[Ian Hacking]
Dott. Cazzaniga Paolo
La progettazione di un’indagine statistica
L’indagine campionaria
Tipologie d’indagine
Strategie di campionamento
Il campionamento probabilistico [2/5]
Campionamento casuale semplice
è poco utilizzato nelle indagini statistiche
ogni unità ha probabilità 1/N (con N dimensione della
popolazione)
selezione con reimmissione
selezione senza reimmissione:
alla prima estrazione la probabilità di estrazione è 1/N
alla seconda è 1/(N − 1)
alla terza è 1/(N − 2)
...
Dott. Cazzaniga Paolo
La progettazione di un’indagine statistica
L’indagine campionaria
Tipologie d’indagine
Strategie di campionamento
Il campionamento probabilistico [3/5]
Campionamento stratificato
la popolazione viene suddivisa in sotto-popolazioni (strati)
la scelta degli strati viene fatta per ottenere una variabilità
costante all’interno degli stessi e per massimizzare la variabilità
tra strati
vengono estratte casualmente le unità all’interno di ogni strato:
con frazione di campionamento costante (utile quando c’è bassa
variabilità negli strati)
con frazione di campionamento variabile (è necessario estrarre più
unità dagli strati meno omogenei)
Dott. Cazzaniga Paolo
La progettazione di un’indagine statistica
L’indagine campionaria
Tipologie d’indagine
Strategie di campionamento
Il campionamento probabilistico [3/5]
Campionamento stratificato
Dott. Cazzaniga Paolo
La progettazione di un’indagine statistica
L’indagine campionaria
Tipologie d’indagine
Strategie di campionamento
Il campionamento probabilistico [3/5]
Campionamento stratificato
Dott. Cazzaniga Paolo
La progettazione di un’indagine statistica
L’indagine campionaria
Tipologie d’indagine
Strategie di campionamento
Il campionamento probabilistico [4/5]
Campionamento sistematico
la prima unità viene estratta casualmente con probabilità 1/N
fissata la cardinalità n del campione, vengono selezionate le
unità successive ogni k unità
l’intervallo k = N/n
viene usato quando le unità della popolazione (finita) possono
essere numerate
Dott. Cazzaniga Paolo
La progettazione di un’indagine statistica
L’indagine campionaria
Tipologie d’indagine
Strategie di campionamento
Il campionamento probabilistico [5/5]
Campionamento a grappolo e a stadi
sfrutta l’esistenza di raggruppamenti “naturali” nella popolazione
si estrae un campione casuale di grappoli
nella selezione a stadi viene estratto casualmente un campione
a partire dai grappoli
viene effettuato quanto non è disponibile una lista degli elementi
della popolazione (che viene quindi suddivisa in unità areali)
viene effettuato per convenienza amministrativa e organizzativa
Dott. Cazzaniga Paolo
La progettazione di un’indagine statistica
L’indagine campionaria
Tipologie d’indagine
Strategie di campionamento
Il campionamento non probabilistico [1/2]
Campionamento accidentale
utilizza un “campione di convenienza”
è il metodo meno attendibile
Campionamento per quote
molto simile al campionamento casuale stratificato proporzionale
l’intervistatore sceglie le persone da intervistare
devono essere rispettate le quote prestabilite nella scelta delle
unità
permette di ridurre tempi e costi
c’è il rischio di ottenere un campione distorto
Dott. Cazzaniga Paolo
La progettazione di un’indagine statistica
L’indagine campionaria
Tipologie d’indagine
Strategie di campionamento
Il campionamento non probabilistico [2/2]
Campionamento a valanga
utilizzato per reperire informazioni su fenomeni rari
vengono scelte alcune unità con determinate caratteristiche
grazie alle unità scelte vengono identificate nuove unità con le
stesse caratteristiche (effetto valanga)
Campionamento tramite testimoni privilegiati
le unità scelte sono a conoscenza di informazioni e notizie su
specifici argomenti
metodo Delphi:
le unità esprimono il loro parere (accordo/disaccordo) rispetto a delle
affermazioni
in questo modo gli esperti possono confrontare le loro opinioni con
quelle del gruppo
attiva meccanismi di autocorrezione se l’indagine viene ripetuta più
volte
il problema principale riguarda la scelta delle unità da inserire nel
campione (spesso soggettiva)
Dott. Cazzaniga Paolo
La progettazione di un’indagine statistica
L’indagine campionaria
Tipologie d’indagine
Strategie di campionamento
Problemi di campionamento
Fonti di errore:
campionario
riguarda solo i metodi di campionamento probabilistici
deriva dalla scelta del campione della popolazione
può essere stimato
non campionario
legato alle fasi di progettazione, esecuzione ed elaborazione di
un’indagine
ha un impatto maggiore rispetto all’errore campionario
necessità metodi ad hoc per essere stimato
Dott. Cazzaniga Paolo
La progettazione di un’indagine statistica
L’indagine campionaria
Tipologie d’indagine
Strategie di campionamento
Errore non campionario: categorie
Le principali categorie di errore non campionario sono:
errore di copertura: un’unità non è presente o non è reperibile
mancata risposta (totale o parziale) da parte di un’unità
unità non contattabile
unità non disponibile a rispondere
unità disponibile ma non in grado di rispondere
errore di rilevazione: rilevazione di un valore diverso da quello
“vero” in un’unità
errore di codifica: registrazione di un valore diverso da quello
rilevato
Dott. Cazzaniga Paolo
La progettazione di un’indagine statistica
L’indagine campionaria
Tipologie d’indagine
Strategie di campionamento
Errore non campionario: mancate risposte [1/2]
Esistono metodi per ridurre le mancate risposte da parte di unità:
interventi di pianificazione a livello di indagine
interventi a livello di tecniche di raccolta dei dati
metodi per la tutela della privacy
questionari anonimi
computer assisted interviewing (CAI)
Dott. Cazzaniga Paolo
La progettazione di un’indagine statistica
L’indagine campionaria
Tipologie d’indagine
Strategie di campionamento
Errore non campionario: mancate risposte [2/2]
E’ possibile intervenire a posteriori per ridurre gli effetti delle mancate
risposte:
metodi di imputazione
metodo della media (aritmetica)
metodo della mediana
metodo delle classi di imputazione (campione diviso in classi, viene
usato il metodo della media all’interno della classe)
metodi hot e cold deck (usano valori di altre unità della stessa
indagine o di altre indagini)
metodi di riponderazione
ricostruiscono i dati mancanti usando variabili strutturali
Dott. Cazzaniga Paolo
La progettazione di un’indagine statistica
L’indagine campionaria
Tipologie d’indagine
Strategie di campionamento
Dove studio questi argomenti?
Capitolo 3 del libro!
Dott. Cazzaniga Paolo
La progettazione di un’indagine statistica