2. Un carattere misurato in un campione: elementi di statistica

BIOSTATISTICA
2. Un carattere misurato
in un campione: elementi
di statistica descrittiva e
inferenziale
Marta Blangiardo, Imperial College, London
Department of Epidemiology and Public Health
[email protected]
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.1
2. UN CARATTERE MISURATO IN UN CAMPIONE
SPECULARE
PARAMETRI
UNIVERSO
PROGRAMMARE
INFERIRE
CAMPIONE
STIMATORI
DESCRIVERE
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.2
2. UN CARATTERE MISURATO IN UN CAMPIONE
CARATTERE (VARIABILE)
QUALITATIVO
QUANTITATIVO
NOMINALE
DISCRETO
(ES.GENERE)
(ES.NUMERO DI
FIORI DI UNA
PIANTA)
ORDINALE
(ES.GIUDIZIO
ALL’ESAME)
CONTINUO
(ES.STATURA)
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.3
2. UN CARATTERE MISURATO IN UN CAMPIONE
Siamo interessati a stimare
l’incremento del peso delle cavie
nutrite con una certa dieta
UNIVERSO
PARAMETRI
CAMPIONE
STIMATORI
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.4
2. UN CARATTERE MISURATO IN UN CAMPIONE
Siamo interessati a stimare
l’incremento del peso delle cavie
nutrite con una certa dieta
UNIVERSO
PARAMETRI
PROGRAMMARE
CAMPIONE
STIMATORI
Ad un campione casuale di 12
cavie viene somministrata la dieta
in studio dalla nascita fino all’età
di 3 mesi e ne vengono registrati
gli incrementi di peso
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.5
2. UN CARATTERE MISURATO IN UN CAMPIONE
CAMPIONE
STATISTICHE
DESCRIVERE
56 59 63 52 57 68
n = 12
64 61 57 60 63 60
yi: generica i-esima osservazione
(i = 1, 2,…,12)
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.6
2a. UN CARATTERE MISURATO IN UN CAMPIONE:
ELEMENTI DI STATISTICA DESCRITTIVA
CAMPIONE
STATISTICHE
A. Come si distribuiscono i dati
campionari?
B. Come possiamo sintetizzare i
dati campionari?
C. Quanto sono dispersi i dati
campionari?
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.7
2a. UN CARATTERE MISURATO IN UN CAMPIONE:
ELEMENTI DI STATISTICA DESCRITTIVA
A. Come si distribuiscono i dati campionari?
56 59 63 52 57 68
64 61 57 60 63 60
Classi di valori
Frequenze
assolute
Frequenze
relative (%)
50 - 54
54 - 58
58 - 62
62 - 66
66 - 70
1
3
4
3
1
8.3
25.0
33.3
25.0
8.3
totale
12
100.0
DISTRIBUZIONE DI FREQUENZA
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.8
2a. UN CARATTERE MISURATO IN UN CAMPIONE:
ELEMENTI DI STATISTICA DESCRITTIVA
A. Come si distribuiscono i dati campionari?
Classi di valori
Frequenze
assolute
Frequenze
relative
1
3
4
3
1
8.3
25.0
33.3
25.0
8.3
50 - 54
54 - 58
58 - 62
62 - 66
frequenze
66 - 70
ISTOGRAMMA
4
3
2
1
50
54
58
62
66 70
classi di valori
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.9
2a. UN CARATTERE MISURATO IN UN CAMPIONE:
ELEMENTI DI STATISTICA DESCRITTIVA
A. Come si distribuiscono i dati campionari?
Distribuzione simmetrica
Distribuzione con
asimmetria positiva
Distribuzione con
asimmetria negativa
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.10
2a. UN CARATTERE MISURATO IN UN CAMPIONE:
ELEMENTI DI STATISTICA DESCRITTIVA
Possiamo ottenere la distribuzione di
frequenza anche per gli altri tipi di
caratteri:
Carattere nominale
(genere):
MMMMM
FFMMF
Carattere ordinale
(giudizio all’esame):
Buono Buono Suff
Suff Suff Insuff Ottimo
Buono Suff Insuff
4
7
6
5
4
3
2
1
0
3
2
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
Ottimo
F
Buono
M
Suff
0
Insuff
1
2.11
2a. UN CARATTERE MISURATO IN UN CAMPIONE:
ELEMENTI DI STATISTICA DESCRITTIVA
CAMPIONE
STATISTICHE
A. Come si distribuiscono i dati
campionari?
B. Come
sintetizzare
Quale possiamo
valore assumono
in i
dati
campionari?
media
i dati campionari?
C. Quanto sono dispersi i dati
campionari?
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.12
2a. UN CARATTERE MISURATO IN UN CAMPIONE:
ELEMENTI DI STATISTICA DESCRITTIVA
B. Come possiamo sintetizzare i dati campionari?
INDICI DI POSIZIONE
Medie
Medie
non analitiche
analitiche
Media
Moda
aritmetica
Mediana
Media
(e quartili)
geometrica
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.13
2a. UN CARATTERE MISURATO IN UN CAMPIONE:
ELEMENTI DI STATISTICA DESCRITTIVA
B. Come possiamo sintetizzare i dati campionari?
Medie non analitiche
Moda
È il dato campionario che si
manifesta con maggiore
frequenza. Essendo una media non
analitica possiamo calcolarla per
qualsiasi tipo di carattere
(qualitativo o quantitativo)
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.14
2a. UN CARATTERE MISURATO IN UN CAMPIONE:
ELEMENTI DI STATISTICA DESCRITTIVA
B. Come possiamo sintetizzare i dati campionari?
MMMMMFFMMF
7
6
ISTOGRAMMA
frequenze
5
4
Carattere
Nominale
3
2
1
M
F
MODA
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.15
2a. UN CARATTERE MISURATO IN UN CAMPIONE:
ELEMENTI DI STATISTICA DESCRITTIVA
B. Come possiamo sintetizzare i dati campionari?
Buono Buono Suff Suff Suff
Insuff Ottimo Buono Suff
Insuff
ISTOGRAMMA
Carattere
Ordinale
frequenze
4
3
2
1
Insuff
Suff
Buono
Ottimo
MODA
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.16
2a. UN CARATTERE MISURATO IN UN CAMPIONE:
ELEMENTI DI STATISTICA DESCRITTIVA
B. Come possiamo sintetizzare i dati campionari?
52 56 57 57 59 60
60 61 63 63 64 68
frequenze
Qual è il valore modale?
ISTOGRAMMA
Carattere
Quantitativo
4
3
2
1
50
54
58
62
66
70
classe modale = 58 - 62
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.17
2a. UN CARATTERE MISURATO IN UN CAMPIONE:
ELEMENTI DI STATISTICA DESCRITTIVA
B. Come possiamo sintetizzare i dati campionari?
Distribuzione unimodale
Distribuzione bimodale
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.18
2a. UN CARATTERE MISURATO IN UN CAMPIONE:
ELEMENTI DI STATISTICA DESCRITTIVA
B. Come possiamo sintetizzare i dati campionari?
Medie non analitiche
Mediana
È l’osservazione centrale dei
dati campionari disposti in
ordine crescente o decrescente.
Essendo una media non
analitica possiamo calcolarla
anche per caratteri qualitativi
ordinali (NON nominali)
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.19
2a. UN CARATTERE MISURATO IN UN CAMPIONE:
ELEMENTI DI STATISTICA DESCRITTIVA
B. Come possiamo sintetizzare i dati campionari?
Buono Buono Suff Suff Suff Insuff Ottimo
Buono Suff Insuff Insuff
Disposizione in ordine crescente
Insuff Insuff Insuff Suff Suff Suff
Suff Buono Buono Buono Ottimo
n=11
Me =
Insuff Insuff Suff
Suff Suff
11+1
= 6°
2
Me=Suff
Suff Buono Buono
Buono Ottimo
ISTOGRAMMA
frequenze
4
Carattere Ordinale
3
2
1
Insuff
Suff
Buono
Ottimo
MEDIANA
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.20
2a. UN CARATTERE MISURATO IN UN CAMPIONE:
ELEMENTI DI STATISTICA DESCRITTIVA
B. Come possiamo sintetizzare i dati campionari?
Buono Buono Suff Suff Suff Ottimo Insuff
Ottimo Buono Suff Insuff Insuff
Disposizione in ordine crescente
Insuff Insuff Insuff Suff Suff Suff
Suff Buono Buono Buono Ottimo Ottimo
n=12
Me =
12
2
= 6° e
12
Me =
2
+1 = 7°
ISTOGRAMMA
frequenze
4
Carattere
Ordinale
3
2
1
Insuff
Suff
Buono
Ottimo
MEDIANA
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.21
2a. UN CARATTERE MISURATO IN UN CAMPIONE:
ELEMENTI DI STATISTICA DESCRITTIVA
B. Come possiamo sintetizzare i dati campionari?
56 59 63 52 57 68
64 61 57 60 63 60
Disposizione in ordine crescente
52 56 57 57 59 60
60 61 63 63 64 68
n=12
Me =
12
12
= 6°=60
2
Me =
2
+1 = 7°=60
Me = 60
52 56 57 57 59 60
60 61 63 63 64 128
La mediana rimane 60! Non è
sensibile ai valori estremi!
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.22
2a. UN CARATTERE MISURATO IN UN CAMPIONE:
ELEMENTI DI STATISTICA DESCRITTIVA
frequenze
B. Come possiamo sintetizzare i dati campionari?
ISTOGRAMMA
4
3
2
1
50
54
58
62
66
70
Me=60
ISTOGRAMMA
4
3
2
1
50
54
58
62
66
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
70 … 120 130
2.23
2a. UN CARATTERE MISURATO IN UN CAMPIONE:
ELEMENTI DI STATISTICA DESCRITTIVA
B. Come possiamo sintetizzare i dati campionari?
Medie non analitiche
Quartili
Sono le osservazioni che
dividono in 4 parti uguali i dati
campionari disposti in ordine
crescente o decrescente.
Essendo medie non analitiche
possiamo calcolarle anche per
caratteri qualitativi ordinali
(NON nominali)
25%
q25
25%
25%
Me
25%
q75
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.24
2a. UN CARATTERE MISURATO IN UN CAMPIONE:
ELEMENTI DI STATISTICA DESCRITTIVA
B. Come possiamo sintetizzare i dati campionari?
ESEMPIO 1: n/4 non è un numero intero
Buono Buono Suff Suff Suff Insuff Ottimo
Buono Suff Insuff Insuff
Disposizione in ordine crescente
Insuff Insuff Insuff Suff Suff Suff
Suff Buono Buono Buono Ottimo
n=11
1°quartile: a sn abbiamo il 25% della popolazione, a ds il 75%
11
q25 =
4
= 2.75
prendo il primo numero intero
più grande (3°)
Mediana (o 2°quartile):
a sn abbiamo il 50% della popolazione, a ds il 50%
Me =
11+1
= 6°
2
3°quartile: a sn abbiamo il 75% della popolazione, a ds il 25%
q75 =
3
4
* 11 = 8.25
prendo il primo numero intero
più grande (9°)
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.25
2a. UN CARATTERE MISURATO IN UN CAMPIONE:
ELEMENTI DI STATISTICA DESCRITTIVA
B. Come possiamo sintetizzare i dati campionari?
ESEMPIO 1: n/4 non è un numero intero
Insuff Insuff Insuff Suff Suff Suff
Suff Buono Buono Buono Ottimo
Modalità
Insuff
Frequenze
assolute
Frequenze
cumulate
3
3
3°pos:
q25=insuff
6°pos:
Suff
4
7
Buono
3
10
Ottimo
-
1
11
Me=suff
9°pos:
q75=buono
n=11
frequenze
4
3
2
1
Insuff
q25
Suff
Buono
MEDIANA
q75
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
Ottimo
2.26
2a. UN CARATTERE MISURATO IN UN CAMPIONE:
ELEMENTI DI STATISTICA DESCRITTIVA
B. Come possiamo sintetizzare i dati campionari?
ESEMPIO 2: n/4 è un numero intero
Buono Buono Suff Suff Suff Ottimo
Insuff Insuff Buono Suff Insuff Insuff
Disposizione in ordine crescente
Insuff Insuff Insuff InsuffSuff Suff
Suff Suff Buono Buono Buono Ottimo
n=12
1°quartile: a sn abbiamo il 25% della popolazione, a ds il 75%
12
q25 =
4
=3
prendo n/4 (3°) e n/4+1 (4°)
Mediana (o 2°quartile):
a sn abbiamo il 50% della popolazione, a ds il 50%
Me =
12
2
= 6° e
12
Me =
2
+1 = 7°
3°quartile: a sn abbiamo il 75% della popolazione, a ds il 25%
3
q75 =
* 12 = 9
4
prendo 3*n/4 (9°) e 3*n/4+1 (10°)
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.27
2a. UN CARATTERE MISURATO IN UN CAMPIONE:
ELEMENTI DI STATISTICA DESCRITTIVA
B. Come possiamo sintetizzare i dati campionari?
ESEMPIO 2: n/4 è un numero intero
Insuff Insuff Insuff Suff Suff Suff
Suff Buono Buono Buono Ottimo
Modalità
Insuff
Suff
Buono
Frequenze
assolute
Frequenze
cumulate
4
4
4
8
3
11
3°e 4° pos:
q25=insuff
6°e 7° pos:
Me=suff
9°e 10° pos:
q75=buono
Ottimo
-
1
12
n=12
frequenze
4
3
2
1
Insuff
q25
Suff
Buono
MEDIANA
q75
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
Ottimo
2.28
2a. UN CARATTERE MISURATO IN UN CAMPIONE:
ELEMENTI DI STATISTICA DESCRITTIVA
B. Come possiamo sintetizzare i dati campionari?
INDICI DI POSIZIONE
MEDIE ANALITICHE
MEDIA ARITMETICA
Somma dei valori osservati
divisa il numero di osservazioni
(numerosità campionaria)
yi
∑
=
n
y=
i 1
n
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.29
2a. UN CARATTERE MISURATO IN UN CAMPIONE:
ELEMENTI DI STATISTICA DESCRITTIVA
B. Come possiamo sintetizzare i dati campionari?
n
MEDIA
ARITMETICA
∑ y
= i
y = i 1
n
56 59 63 52 57 68
64 61 57 60 63 60
=
56 + 59 +...+ 63 + 60
=
12
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
720
= 60
12
2.30
2a. UN CARATTERE MISURATO IN UN CAMPIONE:
ELEMENTI DI STATISTICA DESCRITTIVA
frequenze
B. Come possiamo sintetizzare i dati campionari?
ISTOGRAMMA
4
3
2
1
50
54
58
62
66
70
MEDIA ARITMETICA
y = 60
Definisce la posizione media dei valori
campionari
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.31
2a. UN CARATTERE MISURATO IN UN CAMPIONE:
ELEMENTI DI STATISTICA DESCRITTIVA
B. Come possiamo sintetizzare i dati campionari?
frequenze
56 59 63 52 57 68
64 61 57 60 63 60
4
3
2
1
50
54
58
62
66
70
y = 60
frequenze
56 59 63 52 57 128
64 61 57 60 63 60
4
3
2
1
50
54
58
62
66
La media aritmetica è
influenzata dai valori estremi
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
70
126
y = 65
2.32
2a. UN CARATTERE MISURATO IN UN CAMPIONE:
ELEMENTI DI STATISTICA DESCRITTIVA
La media aritmetica si può calcolare
SOLO per caratteri
QUANTITATIVI:
Carattere nominale
(genere):
MMMMM
FFMMF
Carattere ordinale
(giudizio all’esame):
Buono Buono Suff
Suff Suff Insuff Ottimo
Buono Suff Insuff
yi
∑
=
n
y=
i 1
n
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.33
2a. UN CARATTERE MISURATO IN UN CAMPIONE:
ELEMENTI DI STATISTICA DESCRITTIVA
Distribuzione simmetrica
Media
Mediana = Moda
aritmetica =
Distribuzione con asimmetria positiva
Moda
Mediana
Media
aritmetica
Distribuzione con asimmetria negativa
Media
Mediana
aritmetica
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
Moda
2.34
2a. UN CARATTERE MISURATO IN UN CAMPIONE:
ELEMENTI DI STATISTICA DESCRITTIVA
B. Come possiamo sintetizzare i dati campionari?
MEDIA GEOMETRICA
Radice n-esima del prodotto dei
valori osservati
n
Mg = n ∏ yi
i=1
che, per le proprietà dei logaritmi diventa:
∑ log(yi )
n
1
log(Mg) = ∑ log( yi ) =
n i=1
n
i =1
n
Il logaritmo della media geometrica è la media
aritmetica dei logaritmi dei valori osservati
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.35
2a. UN CARATTERE MISURATO IN UN CAMPIONE:
ELEMENTI DI STATISTICA DESCRITTIVA
B. Come possiamo sintetizzare i dati campionari?
Grandezze biologiche misurate in
scala di diluizione “a raddoppio”
Titoli
anticorpali
Espressi in
logaritmi
Possono essere
scritti come
1/25
- log(25)
1/50
- [log(2)1 + log(25)] - (1 log 2+log 25)
1/100
- [log(2)2 + log(25)] - (2 log 2+log 25)
1/200
- [log(2)3 + log(25)] - (3 log 2+log 25)
1/400
- [log(2)4 + log(25)] - (4 log 2+log 25)
- (0 log 2+log 25)
0 + 1+ 2 + 3 + 4
⋅ log(2) + log(25)]=
log(Mg)=−[
5
= − [ 2 ⋅ 0.301 + 1.398] = - 2
il cui antilogaritmo è: 10-2 = 1/100
5
e quindi Mg = 1/100 =
1/25*1/50*1/100*1/200*1/400
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.36
2a. UN CARATTERE MISURATO IN UN CAMPIONE:
ELEMENTI DI STATISTICA DESCRITTIVA
CAMPIONE
STATISTICHE
A. Come si distribuiscono i dati
campionari?
B. Come possiamo sintetizzare i
dati campionari?
C. Quanto sono dispersi i dati
campionari?
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.37
2a. UN CARATTERE MISURATO IN UN CAMPIONE:
ELEMENTI DI STATISTICA DESCRITTIVA
C. Quanto sono dispersi i dati campionari?
dispersione
dispersione
posizione
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.38
2a. UN CARATTERE MISURATO IN UN CAMPIONE:
ELEMENTI DI STATISTICA DESCRITTIVA
C. Quanto sono dispersi i dati campionari?
CAMPO DI VARIAZIONE
(o range o escursione)
È l’ampiezza assoluta tra i valori
estremi delle osservazioni
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.39
2a. UN CARATTERE MISURATO IN UN CAMPIONE:
ELEMENTI DI STATISTICA DESCRITTIVA
C. Quanto sono dispersi i dati campionari?
56 59 63 52 57 68
64 61 57 60 63 60
Disposizione in ordine crescente
52 56 57 57 59 60
60 61 63 63 64 68
CAMPO DI VARIAZIONE = (68 - 52) =
= 16
52 56 57 57 59 60
60 61 63 63 64 128
CAMPO DI VARIAZIONE = (128 - 52) =
= 76
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.40
2a. UN CARATTERE MISURATO IN UN CAMPIONE:
ELEMENTI DI STATISTICA DESCRITTIVA
C. Quanto sono dispersi i dati campionari?
Il box plot è un utile strumento per visualizzare la
distribuzione di un carattere visualizzandone indici di
posizione e di dispersione
56 59 63 52 57 68
q25=57
64 61 57 60 63 60
Me=60
q75=63
Distanza interquartilica (IQR) = q75-q25 = 6
Soglia per outliers: >1.5*IQR più grande di q75 o
<1.5*IQR più piccolo di q25
73
71
Outliers
q75+1.5*IQR=63+1.5*6=72
66
63
60
58
IQR
57
53
47
q25-1.5*IQR==57-1.5*6=48
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.41
2a. UN CARATTERE MISURATO IN UN CAMPIONE:
ELEMENTI DI STATISTICA DESCRITTIVA
C. Quanto sono dispersi i dati campionari?
DEVIAZIONE
STANDARD
Radice quadrata della somma
degli scarti quadratici dei valori
osservati dalla media aritmetica
divisa il numero di osservazioni
meno uno
12
s=
Σ(yi - y)
2
i =1
n-1
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.42
2a. UN CARATTERE MISURATO IN UN CAMPIONE:
ELEMENTI DI STATISTICA DESCRITTIVA
C. Quanto sono dispersi i dati campionari?
yi
52
56
57
57
59
60
60
61
63
63
64
68
y = 60
(yi - y)
52 - 60 = - 8
56 - 60 = - 4
57 - 60 = - 3
57 - 60 = - 3
59 - 60 = - 1
60 - 60 = - 0
60 - 60 = - 0
61 - 60 = - 1
63 - 60 = - 3
63 - 60 = - 3
64 - 60 = - 4
68 - 60 = - 8
Σ (yi - y) = 0
12
i =1
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.43
2a. UN CARATTERE MISURATO IN UN CAMPIONE:
ELEMENTI DI STATISTICA DESCRITTIVA
C. Quanto sono dispersi i dati campionari?
(yi - y) 2
yi
52
56
57
57
59
60
60
61
63
63
64
68
y = 60
2
(52 - 60)
(56 - 60)
(57 - 60)
(57 - 60)
(59 - 60)
(60 - 60)
(60 - 60)
(61 - 60)
(63 - 60)
(63 - 60)
(64 - 60)
(68 - 60)
2
2
2
2
2
2
2
2
2
2
2
= 64
= 16
= 9
= 9
= 1
= 0
= 0
= 1
= 9
= 9
= 16
= 64
Σ (yi - y)
12
2
i =1
= 198
Devianza
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.44
2a. UN CARATTERE MISURATO IN UN CAMPIONE:
ELEMENTI DI STATISTICA DESCRITTIVA
C. Quanto sono dispersi i dati campionari?
Σ (yi - y)
12
2
i =1
= 198
Devianza
Aumenta con il numero di osservazioni
12
12
ΣΣ(y
(yii -- y)
y)
22
i i=1
=1
198
198
==16.5
==
18.0
12
11
nn-1
Varianza
Unità di misura elevata al quadrato
rispetto ai dati originali
12
12
ΣΣ(y
(yii -- y)
y)
22
i i=1
=1
nn- 1
Deviazione
== 16.5
18.0 == 4.1
4.2
standard
Perché (n - 1) e non n?
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.45
2a. UN CARATTERE MISURATO IN UN CAMPIONE:
ELEMENTI DI STATISTICA DESCRITTIVA
C. Quanto sono dispersi i dati campionari?
i
yi
1
52
2
56
3
57
4
57
5
59
6
60
7
60
8
61
9
63
10
63
11
64
12
68
(yi - y)
(52 - 60) = -8
(56 - 60) = -4
(57 - 60) = -3
(57 - 60) = 3
(59 - 60) = -1
(60 - 60) = 0
(60 - 60) = 0
(61 - 60) = 1
(63 - 60) = 3
(63 - 60) = 3
(64 - 60) = 4
(68 - 60) = 8
12
y = 60
Da quante
osservazioni
dipende dev?
Nota y
voglio
calcolare
dev
VINCOLO
Σ (yi - y) = 0
i =1
Mi basta calcolare (y1-y), (y2-y),…,(yn-1-y) e l’ultimo
termine (yn-y) è completamente determinato dal
vincolo: mi servono solo n-1 osservazioni (n-1 gdl)
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.46
2b. UN CARATTERE QUANTITATIVO MISURATO IN UN
CAMPIONE
SPECULARE
PARAMETRI
UNIVERSO
PROGRAMMARE
INFERIRE
CAMPIONE
STIMATORI
DESCRIVERE
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.47
2b. UN CARATTERE QUANTITATIVO MISURATO IN UN
CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE
POPOLAZIONE BERSAGLIO
µ
?
10
10
15
15
Campione
12
12
20
20
STATISTICA
16
16
INFERENZIALE
descrizione
y
Forma
Posizione
Distribuzione di frequenza
Media aritmetica
Dispersione
Deviazione standard
STATISTICA DESCRITTIVA
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.48
2b. UN CARATTERE QUANTITATIVO MISURATO IN UN
CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE
POPOLAZIONE BERSAGLIO
Campione
Tutti i possibili
1
campioni
Frequenza
Distribuzione campionaria
y
Medie campionaria
campionarie
Media
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.49
2b. UN CARATTERE QUANTITATIVO MISURATO IN UN
CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE
Proprietà delle distribuzione
campionaria
A. Come si distribuiscono le
medie campionarie?
B. Quale valore assumono in
media le medie campionarie?
C. Quanto sono disperse le
medie campionarie?
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.50
2b. UN CARATTERE QUANTITATIVO MISURATO IN UN
CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE
Frequenza
Proprietà delle distribuzione campionaria
Mediecampionaria
campionarie
Media
TEOREMA DEL LIMITE CENTRALE
A
DISTRIBUZIONE
approssimativamente normale
indipendentemente dalla forma
della distribuzione di frequenza
della variabile nella popolazione
bersaglio (se n sufficientemente
grande)
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.51
2b. UN CARATTERE QUANTITATIVO MISURATO IN UN
CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE
Frequenza
Distribuzione campionaria
Mediecampionaria
campionarie
Media
A. Come si distribuiscono le
medie campionarie?
B. Quale valore assumono in
media le medie campionarie?
C. Quanto sono disperse le
medie campionarie?
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.52
2b. UN CARATTERE QUANTITATIVO MISURATO IN UN
CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE
Frequenza
Proprietà della distribuzione campionaria
µ
Mediecampionaria
campionarie
Media
TEOREMA DEL LIMITE CENTRALE
B
MEDIA CAMPIONARIA:
stimatore corretto
coincide con quella della
media aritmetica del carattere
nella popolazione dalla quale
i campioni sono stati estratti
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.53
2b. UN CARATTERE QUANTITATIVO MISURATO IN UN
CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE
Frequenza
Distribuzione campionaria
Mediecampionaria
campionarie
Media
A. Come si distribuiscono le
medie campionarie?
B. Quale valore assumono in
media le medie campionarie?
C.
C. Quanto
Quantosono
sonodisperse
dispersele
le
medie
mediecampionarie?
campionarie?
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.54
2b. UN CARATTERE QUANTITATIVO MISURATO IN UN
CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE
Frequenza
Proprietà della distribuzione campionaria
σ
es =
n
µ
Mediecampionaria
campionarie
Media
TEOREMA DEL LIMITE CENTRALE
C
ERRORE STANDARD
è la deviazione standard di
una distribuzione
campionaria:
es =
σ
n
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.55
2b. UN CARATTERE QUANTITATIVO MISURATO IN UN
CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE
Proprietà della distribuzione campionaria
Distribuzione normale
es =
σ
n
Medie
Media
campionarie:
campionaria
y
µ
Osservazioni yi non per forza
Gaussiane e caratterizzate da due
parametri: µ e σ2
Medie campionarie y~N(µ
µ,σ
σ2/n)
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.56
2b. UN CARATTERE QUANTITATIVO MISURATO IN UN
CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE
Proprietà della distribuzione campionaria
Le medie campionarie sono tanto più
Frequenza
disperse intorno alla media µ tanto
più:
σ
es =
n
µ
Mediecampionaria
campionarie
Media
il carattere è disperso nella popolazione
il campione è piccolo
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.57
2b. UN CARATTERE QUANTITATIVO MISURATO IN UN
CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE
Proprietà della distribuzione campionaria
Forma normale
σ
es =
n
µ
yi
Distribuzione normale standardizzata
area = 1
yi - µ
1
z=
yi - µ
σ
n
0
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.58
2b. UN CARATTERE QUANTITATIVO MISURATO IN UN
CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE
Distribuzione normale
−
f ( yi ) =
1
σ
⋅ 2⋅π
n
⋅e
( yi − µ ) 2
σ2
2⋅
n
σ
es =
n
µ
Medie campionarie: yi
Distribuzione normale standardizzata
f ( z) =
1
0
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
1
⋅e
2⋅π
n
z2
−
2
n
z
2.59
2b. UN CARATTERE QUANTITATIVO MISURATO IN UN
CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE
Misure di variabilità
Σ (yi - y)
12
2
Devianza
i =1
Σ(yi - y)
12
i =1
n -1
2
= σ2
12
Σ(yi - y)
i =1
n-1
2
=σ
σ
Varianza
Deviazione
standard
Errore
standard
n
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.60
Distribuzione
normale
standardizzata
0
1
2
3
4
5
6
7
8
9
0.0
0.5000
0.5040
0.5080
0.5120
0.5160
0.5199
0.5239
0.5279
0.5319
0.5359
0.1
0.5398
0.5438
0.5478
0.5517
0.5557
0.5596
0.5636
0.5675
0.5714
0.5753
0.2
0.5793
0.5832
0.5871
0.5910
0.5948
0.5987
0.6026
0.6064
0.6103
0.6141
0.3
0.6179
0.6217
0.6255
0.6293
0.6331
0.6368
0.6406
0.6443
0.6480
0.6517
0.4
0.6554
0.6591
0.6628
0.6664
0.6700
0.6736
0.6772
0.6808
0.6844
0.6879
0.5
0.6915
0.6950
0.6985
0.7019
0.7054
0.7088
0.7123
0.7157
0.7190
0.7224
0.6
0.7257
0.7291
0.7324
0.7357
0.7389
0.7422
0.7454
0.7486
0.7517
0.7549
0.7
0.7580
0.7611
0.7642
0.7673
0.7704
0.7734
0.7764
0.7794
0.7823
0.7852
0.8
0.7881
0.7910
0.7939
0.7967
0.7995
0.8023
0.8051
0.8078
0.8106
0.8133
…………
2.2
0.9861
0.9864
0.9868
0.9871
0.9875
0.9878
0.9881
0.9884
0.9887
0.9890
2.3
0.9893
0.9896
0.9898
0.9901
0.9904
0.9906
0.9909
0.9911
0.9913
0.9916
2.4
0.9918
0.9920
0.9922
0.9925
0.9927
0.9929
0.9931
0.9932
0.9934
0.9936
2.5
0.9938
0.9940
0.9941
0.9943
0.9945
0.9946
0.9948
0.9949
0.9951
0.9952
2.6
0.9953
0.9955
0.9956
0.9957
0.9959
0.9960
0.9961
0.9962
0.9963
0.9964
2.7
0.9965
0.9966
0.9967
0.9968
0.9969
0.9970
0.9971
0.9972
0.9973
0.9974
2.8
0.9974
0.9975
0.9976
0.9977
0.9977
0.9978
0.9979
0.9979
0.9980
0.9981
2.9
0.9981
0.9982
0.9982
0.9983
0.9984
0.9984
0.9985
0.9985
0.9986
0.9986
3.0
0.9987
0.9987
0.9987
0.9988
0.9988
0.9989
0.9989
0.9989
0.9990
0.9990
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.61
2b.
3. UN
UNCARATTERE
CARATTEREQUANTITATIVO
QUANTITATIVOMISURATO
MISURATOIN
INUN
UN
CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE
Distribuzione normale standardizzata
Area = 0.6915
Pr { z ≤ +0.5} = 0.6915
Area = 0.1517
Pr { 0.1 ≤ z ≤ 0.5} =
Pr {z ≤ 0.5} - Pr {z ≤ 0.1} = 0.1517
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.62
2b.
3. UN
UNCARATTERE
CARATTEREQUANTITATIVO
QUANTITATIVOMISURATO
MISURATOIN
INUN
UN
CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE
Distribuzione normale standardizzata
Area = 0.4207
Pr { z ≥ 0.2} = 1 - Pr { z ≤ 0.2} =
1 – 0.5793 = 0.4207
Area = 0.2119
Pr { z ≤ - 0.8} = Pr {z ≥ 0.8}
1 - Pr { z ≤ 0.8} = 0.2119
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.63
2b.
3. UN
UNCARATTERE
CARATTEREQUANTITATIVO
QUANTITATIVOMISURATO
MISURATOIN
INUN
UN
CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE
Distribuzione normale standardizzata
Area = 0.950
Area: 0.383
z
- 0.5
0
+ 0.5
Pr { -0.5≤
≤ z ≤ 0.5} = 0.383
y-µ
Pr { -0.5 ≤
z
≤ 0.5} = 0.383
σ/ n
Pr { y -0.5 σ / n ≤ µ ≤ y + 0.5 σ / n } =
0.383
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.64
2b. UN CARATTERE QUANTITATIVO MISURATO IN UN
CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE
Distribuzione normale standardizzata
Area = 0.950
z
- 1.96
0
+ 1.96
Pr { y - 1.96 σ / n ≤ µ ≤ y + 1.96 σ / n } =
0.95
Limiti di confidenza al
95% della media µ della
popolazione
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.65
2b. UN CARATTERE QUANTITATIVO MISURATO IN UN
CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE
POPOLAZIONE BERSAGLIO
µ
?
10
10
15
15
Campione
12
12
20
20
n = 12
16
16
descrizione
y = 60
Media aritmetica
Pr { 60
y - 1.96 σ / 12
n ≤ µ ≤ 60
y + 1.96 σ / n
12 }
= 0.95
?
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.66
2b. UN CARATTERE QUANTITATIVO MISURATO IN UN
CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE
Dalla distribuzione normale standardizzata...
area = 1
1
0
z=
σ
y-µ
n
…alla distribuzione “t”
area = 1
σ è sostituito dal
1
suo stimatore s
0
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
t=
y-µ
s
2.67
n
2b. UN CARATTERE QUANTITATIVO MISURATO IN UN
CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE
Distribuzione t
0.045
0.04
0.035
gdl1
0.03
gdl2
gdl3
0.025
0.02
0.015
0.01
0.005
0
0
20
40
60
0
y- µ
80
t=
100
s
120
n
Non esiste una sola
distribuzione t, ma una famiglia
di distribuzioni corrispondenti
ai diversi gradi di libertà
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.68
2b. UN CARATTERE QUANTITATIVO MISURATO IN UN
CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE
Distribuzione t
gdl
0.4
0.3
0.25
0.2
0.15
0.1
0.05
1
0.3249
0.7265
1.0000
1.3764
1.9626
3.0777
6.3138 12.7062
2
0.2887
0.6172
0.8165
1.0607
1.3862
1.8856
3
0.2767
0.5844
0.7649
0.9785
1.2498
4
0.2707
0.5686
0.7407
0.9410
5
0.2672
0.5594
0.7267
6
0.2648
0.5534
7
0.2632
0.5491
0.025
0.001
0.0005
318.3088
636.6192
2.9200 4.3027
31.5991
1.6377
2.3534
22.3271
….
3.1824
10.2145
12.9240
1.1896
1.5332
2.1318 2.7764
7.1732
8.6103
0.9195
1.1558
1.4759
2.0150 2.5706
5.8934
6.8688
0.7176
0.9057
1.1342
1.4398
1.9432 2.4469
5.2076
5.9588
0.7111
0.8960
1.1192
1.4149
1.8946 2.3646
4.7853
5.4079
….
45
0.2549
0.5281
0.6800
0.8497
1.0485
1.3006
1.6794
2.0141
3.2815
3.5203
50
0.2547
0.5278
0.6794
0.8489
1.0473
1.2987
1.6759
2.0086
3.2614
3.4960
60
0.2545
0.5272
0.6786
0.8477
1.0455
1.2958
1.6706
2.0003
….3.2317
3.4602
70
0.2543
0.5268
0.6780
0.8468
1.0442
1.2938
1.6669
1.9944
3.2108
3.4350
80
0.2542
0.5265
0.6776
0.8461
1.0432
1.2922
1.6641
1.9901
3.1953
3.4163
100
0.2540
0.5261
0.6770
0.8452
1.0418
1.2901
1.6602
1.9840
3.1737
3.3905
120
0.2539
0.5258
0.6765
0.8446
1.0409
1.2886
1.6577
1.9799
3.1595
3.3735
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.69
2b. UN CARATTERE QUANTITATIVO MISURATO IN UN
CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE
n=10
Pr { t≤1} =
n=5
Pr { 0.1 ≤ t ≤ 0.5} =
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.70
2b.
3. UN
UNCARATTERE
CARATTEREQUANTITATIVO
QUANTITATIVOMISURATO
MISURATOIN
INUN
UN
CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE
Distribuzione normale standardizzata
n=15
Pr { t ≥ 0.2} =
n=8
Pr { t ≤ - 0.8} =
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.71
2b. UN CARATTERE QUANTITATIVO MISURATO IN UN
CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE
POPOLAZIONE BERSAGLIO
µ
10
10
15
15
Campione
12
12
20
20
n=8
16
16
Pr=95%:
t0.975=2.36
descrizione
t0.025=-2.36
y = 60 s = 4.2
Media aritmetica
Deviazione standard
Pr { y - 2.36 s / n ≤ µ ≤ y + 2.36 s / n }
= 0.95
60
4.2
8
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.72
2b. UN CARATTERE QUANTITATIVO MISURATO IN UN
CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE
y ± t (s
/ √ n)
ricordando che y = 60 e s = 4.2,
scegliendo un valore di t
corrispondente a una probabilità del
95% che, per (n-1= 7) gdl, è 2.36,
allora µ è compresa nell’intervallo:
60 ± 2.36 (4.2 / √ 8)
56.5, 63.5
con una probabilità del 95%
Intervallo di confidenza al
95% della media µ della
popolazione
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.73
2b. UN CARATTERE QUANTITATIVO MISURATO IN UN
CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE
y ± t (s
/ √ n)
y = 60
n=8
56.5, 63.5
s = 4.2
t(1-0.95)/2;11 = 2.36 Pr = 95 %
56.5 60 63.5
Se volessimo diminuire il grado di
incertezza
n=8
56.3, 63.7
s = 4.2
t(1-0.99)/2;11 = 3.50
Pr = 99 %
56.3
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
60
63.7
2.74
2b. UN CARATTERE QUANTITATIVO MISURATO IN UN
CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE
y ± t (s
/ √ n)
y = 60
n=8
56.5, 63.5
s = 4.2
t(1-0.95)/2;11 = 2.36 Pr = 95 %
56.5 60 63.5
Se disponessimo di un campione
meno numeroso
n=
6
56.2, 63.8
s = 4.2
t(1-0.99)/2;11 = 2.571
Pr = 95 %
56.2
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
60
63.8
2.75
2b. UN CARATTERE QUANTITATIVO MISURATO IN UN
CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE
y ± t (s
/ √ n)
y = 60
n=8
56.5, 63.5
s = 4.2
t(1-0.95)/2;11 = 2.36 Pr = 95 %
56.5 60 63.5
Se il carattere fosse più disperso
nella popolazione
n= 8
54.7, 65.3
s = 6.0
t(1-0.95)/2;11 = 2.36
Pr = 95 %
54.7
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
60
65.3
2.76
2b. UN CARATTERE QUANTITATIVO MISURATO IN UN
CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE
Interpretazione degli intervalli
di confidenza
IC al 95%
X0.025
X
X0.975
Se ripetessimo l’esperimento 100 volte, la
media µ sarebbe compresa nell’intervallo
95 volte
In 95 casi µ è
compresa qui
X0.025
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
X0.975
2.77
2b. UN CARATTERE QUANTITATIVO MISURATO IN UN
CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE
Distribuzione di 10 intervalli di
confidenza
Livello di confidenza 90%
La VERA media non è
contenuta
nell’intervallo di
confidenza
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.78
2b. UN CARATTERE QUANTITATIVO MISURATO IN UN
CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE
Inferenza
Ci sono essenzialmente 4 tipi di inferenza
I1. Calcolo delle probabilità
I2. Stima dei parametri
I3. Intervalli di confidenza
Assumiamo
che i
parametri
siano noti
Assumiamo
che i
parametri
siano ignoti
I4. Test d’ipotesi
•Variabile di interesse continua
•Il fenomeno in studio ha una
distribuzione simmetrica?
yi~N(µ
µ,σ
σ2)
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.79
2b. UN CARATTERE QUANTITATIVO MISURATO IN UN
Continuous
CAMPIONE:
dataELEMENTI DI STATISTICA INFERENZIALE
Il passo successivo è valutare i parametri della
distribuzione per poter fare inferenza sui
parametri della popolazione di interesse.
Tipicamente ci interessano
1. La media della popolazione
2. La varianza della popolazione
1. Media µ e deviazione standard σ della
popolazione sono note
─ Calcolo delle probabilità
2. La media della popolazione µ è ignota
(oggetto dell’inferenza), ma la deviazione
standard σ è nota
3. Sia la media µ che la deviazione standard
σ sono ignote
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.80
2b. UN CARATTERE QUANTITATIVO MISURATO IN UN
CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE
Popolazione normale – entrambi i parametri
sono noti
Caso 1: Media µ e deviazione standard σ
della popolazione sono note
I1. Calcolo delle probabilità
E’ facile calcolare le probabilità di una variabile
casuale Normale standard, tramite opportune
tavole
“Standardizziamo” la nostra variabile casuale
normale e calcoliamo la probabilità dalle tavole
Pr { -0.5≤
≤ y ≤ 0.5}
Pr {
-0.5 -µ
µ
σ/ n
≤
z
≤
-0.5 +µ
µ
σ/ n
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
}
2.81
2b. UN CARATTERE QUANTITATIVO MISURATO IN UN
CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE
Popolazione normale – media ignota
Caso 2: Media µ ignota e deviazione standard
σ nota
I2. Stima dei parametri
L’unico parametro da stimare è la media µ dato
che la deviazione standard è nota
Utilizziamo l’informazione proveniente dal
campione
n
∑ y
= i
y = i 1
n
Associamo una stima della dispersione del
parametro tramite lo standard error
σ
se=
n
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.82
2b. UN CARATTERE QUANTITATIVO MISURATO IN UN
CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE
Popolazione normale – media ignota
Caso 2: Media µ ignota e deviazione standard
σ nota
I3. Intervallo di confidenza
Possiamo identificare un intervallo di
confidenza, ad esempio al 95% per la media
della popolazione µ:
Pr { y – zα/2 σ / n ≤ µ ≤ y + zα/2 σ / n } =
0.95
σ
n
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.83
2b. UN CARATTERE QUANTITATIVO MISURATO IN UN
CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE
Popolazione normale – entrambi i parametri
sono ignoti
Caso 3: Media µ e deviazione standard σ
della popolazione sono ignote
I2. Stima dei parametri
Dobbiamo stimare sia la media che la varianza
campionaria
Utilizziamo l’informazione proveniente dal
campione
n
n
∑ y
= i
∑ (yi - y)2
y = i 1
s
= i= 1
n
n-1
L’errore standard sarà
se =
s
n
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.84
2b. UN CARATTERE QUANTITATIVO MISURATO IN UN
CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE
Popolazione normale – entrambi i parametri
sono ignoti
Caso 3: Media µ e deviazione standard σ
della popolazione sono ignote
I3. Intervallo di confidenza
Possiamo identificare un intervallo di
confidenza, ad esempio al 95% per la media
della popolazione µ:
Pr { y – tg, α/2 s / n ≤ µ ≤ y + tg, α/2 s / n } =
0.95
Dobbiamo utilizzare la stima campionaria della
deviazione standard
σ
n
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.85
2b. UN CARATTERE QUANTITATIVO MISURATO IN UN
CAMPIONE: ELEMENTI DI STATISTICA INFERENZIALE
(Popolazione) Parametri and stimatori (Popolazione normale)
Quantità teoretiche
(funzioni di
parametri ignoti µ,
σ2)
Media e deviazione
standard della
popolazione (oggetto
di inferenza)
µ, σ2
vs
Quantità
osservabili
x̄, s2
x
Media e deviazione
standard campionarie
(usate per stimare µ e
σ2)
Idealmente vorremmo
misurare µ. Dato che non
possiamo, utilizziamo un
suo stimatore
x̄, s2
x
(NB Di solito ci
interessa µ)
Idelamente vorremmo
avere un’idea
dell’incertezza
associata alla stima
se=
σ
n
Errore standard:
rappresenta una stima
dell’incertezza intorno allo
stimatore della media µ
Nella pratica usiamo
l’informazione campionaria
per stimare questa
variabilità
se=
s
n
Errore standard stimato:
dato che non conosciato il
vero valore σ l’unica cosa da
fare è utilizzare l’informazione
campionaria per stimare
questa quantità
ELEMENTI DI STATISTICA DESCRITTIVA ED INFERENZIALE -
2.86