INDAGINE ESAUSTIVA O CAMPIONARIA?

INDAGINE ESAUSTIVA O
CAMPIONARIA?


Si ricorre certamente all’indagine per campione quando la rilevazione
completa è impossibile e quando la determinazione delle modalità possedute
dalle unità in esame ne comporta la distruzione (Es.: lo studio della durata
della durata di un nuovo tipo di contenitore sigillante);
Si può scegliere l’indagine l’indagine campionaria quando:
•
•
•


La popolazione che si studia è numerosa;
E’ insediata su un territorio vasto;
Deve essere osservata ripetutamente nel tempo.
Se si considera l’aspetto economico, la rilevazione parziale conviene rispetto
a quella totale quasi sempre (tranne quando siano disponibili dati su supporto
magnetico)
Le indagini sono da preferirsi quando:
•
•
•
Si voglia andare in profondità nella ricerca della informazione;
Per la rapidità nel raccogliere e trattare i dati;
Per la rapidità nella pubblicazione dei dati .
QUINDI NASCE L’ESIGENZA DI EFFETTUARE L’INDAGINE CAMPIONARIA
POPOLAZIONE E CAMPIONE

POPOLAZIONE, o UNIVERSO è ogni insieme finito o infinito di unità, le quali
non sono necessariamente organismi viventi;

Data una popolazione composta da N unità statistiche, CAMPIONE è
l’insieme delle n unità selezionate tra le N che compongono la popolazione
allo scopo di rappresentarla quanto ai caratteri, o variabili, oggetto dello
studio;

L’aggregato rappresentato dal campione è la POPOLAZIONE DI
RIFERIMENTO;

Le unità che appartengono al campione sono dette UNITA’ CAMPIONARIE;

Il DISEGNO DI CAMPIONAMENTO è l’insieme delle regole seguite per
formare un campionamento
IL CAMPIONAMENTO ED IL “CASO”


La nostra scelta va sulle tecniche di campionamento che hanno in comune la
casualità nella determinazione delle unità che entrano a far parte dell’insieme
da osservare;
La casualità si attribuisce:
•
•



Attribuendo ad ogni unità della popolazione una probabilità positiva di essere
selezionata;
Utilizzando in modo appropriato le tecniche per la selezione casuale del campione;
Al caso è affidato il compito di identificare il codice delle unità che devono
essere inserite nel campione. La casualità della selezione si propone
essenzialmente come metodo finalizzato all’ottenimento di un campione
rappresentativo della popolazione con riguardo ad ogni variabile, nota a priori
dopo la selezione;
I campioni non probabilistici riflettono nel bene e nel male l’orientamento di
colui che li forma;
Da rigettare, in linea di principio, sono i campioni formati “a casaccio”, o con
adesione volontaria dei rispondenti.
IL DISEGNO DI CAMPIONAMENTO
E’ l’insieme delle decisioni prese nel formare il campione. Si tratta di rispondere alle seguenti
domande:
1)
Quale struttura deve avere il campione?
2)
Quali probabilità di selezione?
3)
Quanto numeroso deve essere il campione?
LA STRUTTURA DEL CAMPIONE

Semplice, se la lista della popolazione è unica;

Complessa, se sono necessarie più liste;
PROBABILITA’ DI SELEZIONE

Costanti, se sono uguali per tutte le unità di una lista;

Variabili, quando ad ogni unità si assegna una probabilità di selezione sua propria ed
ammonta ad 1 per il complesso delle unità listate
pi  probabilit à di selezione, per ogni N della lista
0  pi  1, i  1,..., N 
LA DIMENSIONE OTTIMA DEL CAMPIONE

E’ determinabile in funzione del disegno di campionamento.
LA SELEZIONE CASUALE DEL
CAMPIONE
SELEZIONE CON REINSERIMENTO



Per estrarre un campione con probabilità diseguali si assegnano singolarmente alle
unità tanti numeri casuali che, rapportati al totale dei numeri assegnati, eguaglino le
probabilità di selezione. Una unità si considera selezionata se si estrae uno dei numeri
casuali ad essa assegnati.
Una unità compare nel campione con ripetizione se viene estratto più di un numero
casuale ad essa assegnato
N
M
Se
M  numero intero, M  M , p  i
i

i
i
i
M
La probabilità di inclusione nel campione:

Il reinserimento ricrea ad ogni estrazione la situazione di partenza, qualunque sia la
numerosità del campione. Ad ogni estrazione immutata la probabilità di selezione delle
unità.

In n estrazioni, la probabilità di includere l’unità i nel campione è npi;

Se la probabilità iniziale è costante (1/N), la probabilità totale i :
i  n

1 n

N N
Se la probabilità pi è variabile:
 i  npi
IL CAMPIONAMENTO CASUALE
SEMPLICE






Si consideri una popolazione di N unità. SI dice casuale semplice il campione di n unità
estratte dalla popolazione con uguale proprietà (1/N) ad ogni passo dell’estrazione.
La probabilità che un’unità compaia nel campione è la somma delle probabilità che vi
compaia è la somma della probabilità che vi compaia in una qualsiasi delle n prove, e
cioè n/N.
La costanza delle probabilità ad ogni successiva estrazione equivale alla equiprobabilità
di ogni possibile campione con le stesse caratteristiche dimensionali.
Un campione casuale si può ottenere con:
•
Selezione casuale con reinserimento;
•
Selezione casuale senza reinserimento;
•
Selezione sistematica (anche detta “pseudo-casuale”) ma solo se le posizioni della
lista sono mescolate fino all’ottenimento di un ordinamento assolutamente casuale.
Il campionamento casuale semplice si assume nella teoria dell’inferenza statistica
quando non è precisato il disegno adottato.
Al campionamento casuale semplice si applicano stimatori con i quali si confrontano
quelli propri di altri disegni di campionamento.
IL CAMPIONAMENTO CASUALE
SEMPLICE: la stima

Siano Y1,…,Yi,…,YN i valori delle N unità della popolazione e y1,…,yi,…,yN
i valori osservati presso le n unità campionarie.
n


MEDIA CAMPIONARIA:
y 


j
n
y
j

Yˆ
N
La VARIANZA della media campionaria con un campione con reimmissione
è
Sy2
Var ( y ) 
n
2
Sy è la VARIANZA “elementare”, o “della popolazione”, della variabile
osservata:
2
1 N
Yi   
S 

N 1 i
2
y

da stimare con
2
1 N
s 
 y i  y 
n 1 i
2
y
IL CAMPIONAMENTO STRATIFICATO






“Stratificare” una popolazione significa ripartirla in sottopopolazioni, dette “STRATI”.
Perché stratificare:
•
Evidenziare l’insieme delle unità significative per la ricerca;
•
Separare dalle altre le sottopopolazioni fisicamente isolate e con caratteristiche
speciali;
•
Individuare certe unità che si vogliono osservare con tecniche particolari;
•
Introdurre sulla selezione il massimo controllo, pur mantenendola casuale;
•
Individuare sottopopolazioni al massimo omogenee rispetto alla variabile o alle
variabili da rilevare e ricavare così stime più efficienti di quelle ottenibili con un
campione casuale semplice.
Per stratificare, si devono specificare gli attributi in base ai quali va suddivisa la
popolazione e, correlatamente, il numero di strati.
Le caratteristiche per la stratificazione devono essere note prima della selezione per ogni
unita’ statistica.
Ogni unità statistica appartiene ad un solo strato.
STRATIFICATO E’ UN CAMPIONE TRATTO DA UNA POPOLAZIONE STRATIFICATA.
SICCOME OGNI STRATO E’ UNA POPOLAZIONE IN SENSO PROPRIO, IL CAMPIONE
CHE SI SELEZIONA DA UNO STRATO E’ IDONEO A RAPPRESENTARLA. IL
CAMPIONE OTTENUTO PER UNIONE DI QUELLI DEI SINGOLI STRATI MIRA A
RAPPRESENTARE L’INTERA POPOLAZIONE.
IL CAMPIONAMENTO STRATIFICATO:
la stima

nh
La MEDIA CAMPIONARIA
y
yh 

La MEDIA dell’intero campione
hi
i
[h  1,..., H]
nh
H
H
y   Wh y h  
h

h
Nh
yh
N
[h  1,..., H]
La VARIANZA della MEDIA dell’intero campione


S2h
Var ( y h )  
con reimmissione 

nh
H
2
h
Var ( y )   W Var ( y h )
h
… che si stima con
2
1 nh
ŝ 
 y hj  y h 
nh  1 j
2
h
[h  1,..., H]
IL CAMPIONAMENTO SU PIU’ STADI
(cenni)


Un esempio di campionamento su più
stadi è quello condotto dall’ISTAT per
svolgere l’indagine sulle forze del
lavoro in Italia.
Il campione di unità da intervistare per
questa indagine si forma
selezionando alcuni Comuni …
ITALIA
Comune 1
Comune 2
….
Comune N
Comune 2

…poi un insieme di famiglie dalle
anagrafi dei Comuni…
Famiglia 1
Famiglia 2
….
Famiglia M
….
Marco Rossi
Famiglia 1

…infine si seleziona il “grappolo” dei
componenti delle famiglie individuate.
Mario Rossi
Anna Bianchi
In Rossi
L’EFFETTO DEL DISEGNO DI
CAMPIONAMENTO

In un campione casuale complesso (diverso da quello semplice), l’errore di campionamento può
essere espresso in una forma che evidenzia il guadagno o la perdita di precisione delle stime
rispetto all’analoga stima ottenibile con un campione casuale semplice di pari numerosità.

Siccome un campione stratificato è generalmente più efficiente di un campione casuale semplice ,
la numerosità campionaria necessaria per ottenere stime di pari efficienza è inferiore con un
campionamento stratificato.

Il campionamento su più stadi è spesso utilizzato su vasta scala perché la rilevazione dei dati è
concentrata sui punti selezionati al 1° stadio.
Risultano facilitati
l’organizzazione del lavoro in
loco e l’esecuzione della
rilevazione.
Risultano minori i costi
E’ più complessa la stima
Vi è rischio di inefficienza