STATISTICA DESCRITTIVA
INFERENZA STATISTICA
Statistica inferenziale
Probabilità
Campione
Popolazione
Statistica
inferenziale
Popolazione finita e suoi parametri
Una Popolazione finita è un insieme di unità
su cui si può osservare un certo carattere. (es:
tutti i pazienti di un reparto)
I parametri della popolazione sono delle costanti
che
descrivono
aspetti
caratteristici
della
distribuzione del carattere nella popolazione
stessa.
Esempio di parametro:
media della popolazione
1 N
  i 1 xi
N
N
1
2
2




x



i
Varianza della popolazione
N
i i
Popolazione
Campione
rappresentativo
Stima
campionaria
Parametro della
popolazione
Il campione
statistico
è quel sottoinsieme
particolare della
popolazione o
universo,
individuato in essa
in modo da
consentire,
con un rischio
definito di errore, la
generalizzazione
all’intera
popolazione.
Il campione rappresentativo riproduce in miniatura la
popolazione
Procedimento
casuale
Campione
rappresentativo
Il campione casuale è estratto con procedimento tale
che tutte le unità della popolazione hanno la stessa
probabilità di essere estratte
Con
ricollocamento
(estrazioni
indipendenti)
Senza ricollocamento o
in blocco
(estrazioni indipendenti
se n/N<0.05)
Campioni casuali
L’estrazione casuale dei campioni dalla popolazione può
essere
• con ripetizione: una volta estratta un’unità viene rimessa
dentro la popolazione e quindi potrebbe essere
nuovamente estratta;
• senza ripetizione: una volta estratta un’unità questa
viene messa da parte e quindi non può essere estratta
più di una volta.
Due campioni non ordinati di uguale numerosità sono
diversi tra loro se almeno un’unità del primo campione non
è contenuta nel secondo campione.
Nei campioni ordinati conta invece anche l’ordine con cui
si presentano le diverse unità.
Problema: Da una popolazione composta da 5 unità statistiche si
voglia estrarre un campione casuale di numerosità 2.
Schema con ricollocamento o
ripetizione
 Lo spazio campionario,
ovvero l’insieme di tutti i
possibili campioni è:
AA AB AC AD AE
BA BB BC BD BE
CA CB CC CD CE
DA DB DC DD DE
EA EB EC ED EE
 Vi sono in tutto 52=25
campioni, dati dalle
disposizioni con ripetizione di
5 elementi a 2 a 2.
 Due campioni differiscono sia
per l’ordine sia per la natura
degli elementi
Schema senza ricollocamento o
in blocco
 Lo spazio campionario, ovvero
l’insieme di tutti i possibili
campioni è:
BA
CA CB
DA DB DC
EA EB EC ED
 Vi sono in tutto  5  =10
 
campioni,
 2
dati dalle combinazioni senza
ripetizione di 5 elementi a 2 a
2.
Due campioni differiscono solo
per la natura degli elementi
Metodi di campionamento






Campioni probabilistici
Campione casuale semplice
Campione sistematico
Campione stratificato
A due o più stadi
Campione a grappoli




Campioni non
probabilistici
Per quote
Campioni di unità già
disponibili
Campioni di volontari
Campionamento
sistematico
Si deve disporre di un elenco degli
elementi della popolazione da
campionare
 Per individuare le n unità del
campione tra gli N della Popolazione si
sceglie dall’elenco una unità ogni K
(=N/n).
 Il seme iniziale è una qualunque
unità scelta a caso fra le prime K.
Si voglia estrarre un campione di 10 unità da una popolazione
di 1000. Si sceglie un passo di 1000/10=100. Supponiamo che
il numero scelto a caso tra 1 e 100 sia 77. Le unità campionate
sono le seguenti: 77; 177; 277;377;477;577;677;777;877;977
Campionamento
stratificato
La popolazione è divisa in strati
internamente omogenei e quindi si
procede con campionamento
casuale da ciascuno strato.
Supponiamo di avere una popolazione di 7448 unità stratificate
per sesso e classe di età
numerosità
degli strati
Sesso
Maschi
Femmine
classi di età
tra 14 e 34 tra 35 e 64
1879
1046
1756
976
3635
2022
maggiore o
uguale a 65
789
1002
1791
3714
3734
7448
numerosità
degli strati
Sesso
Maschi
Femmine
pesi degli
strati
Maschi
Femmine
classi di età
tra 14 e 34 tra 35 e 64
1879
1046
1756
976
3635
2022
maggiore o
uguale a 65
789
1002
1791
3714
3734
7448
tra 14 e 34 tra 35 e 64
0.25
0.14
0.24
0.13
0.49
0.27
maggiore o
uguale a 65
0.11
0.13
0.24
0.50
0.50
1.00
pesi degli
strati
Maschi
Femmine
tra 14 e 34 tra 35 e 64
0.25
0.14
0.24
0.13
0.49
0.27
maggiore o
uguale a 65
0.11
0.13
0.24
composizione
di un
campione
stratificato di
maggiore o
500 unità
tra 14 e 34 tra 35 e 64 uguale a 65
Maschi
126
70
53
Femmine
118
66
67
244
136
120
126=0.25*500
0.50
0.50
1.00
249
251
500
53=0.11*500
Campionamento casuale a grappoli
e a stadi
Nel campionamento casuale a grappoli la popolazione viene
suddivisa in sottoinsiemi detti grappoli. Si selezionano, con
un’estrazione casuale senza ripetizione, un certo numero di
grappoli e si prendono come unità campionarie tutte le unità
appartenenti ai grappoli estratti.
Nel campionamento casuale a due stadi la popolazione viene
suddivisa in un certo numero di grappoli. Al primo stadio si
estrae senza ripetizione un certo numero di grappoli. Da
ciascuno di questi si estrae con ripetizione (secondo stadio)
un certo numero di unità.
primo stadio
secondo stadio
Unità primarie
Unità secondarie
Piani di campionamento complessi
Le indagini sulle famiglie dell’Istat seguono un piano di
campionamento in cui i comuni (unità primarie) vengono
stratificati e scelti a caso (I° stadio) e da ogni comune
campionato viene scelto un campione di famiglie (2°
stadio)