Corso di Statistica
Distribuzione casuale Normale
Prof.ssa T. Laureti
a.a. 2014-2015
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
1
Distribuzione Normale (o Gaussiana)
Forma campanulare, unimodale e simmetrica (tra – e +
infinito)
Media=Mediana=Moda=μ
La deviazione standard è la distanza tra l’asse e il punto di flesso
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Distribuzione Normale (o Gaussiana)
1
f (x)
2
e
1 x
2
2
x
X ~ N(μ;σ2)
E(X)
V(X)
2
3
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Distribuzione Normale (o Gaussiana)
E’ la distribuzione più usata perché
1)descrive bene molti fenomeni (approssima la
distribuzione empirica di moltissimi fenomeni reali,
come il peso e l’altezza di una popolazione)
2) ha proprietà matematiche convenienti
3) il teorema del limite centrale prova che la
normale è la distribuzione approssimata della
media di campioni di grandi dimensioni
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Proprietà della normale:
1.
2.
3.
4.
5.
6.
La curva è simmetrica, con asse di simmetria x
Me Md
Media, moda e mediana coincidono:
E’ crescente nell’intervallo (
, ) e decrescente
nell’intervallo ( , )
e x
Ha due punti di flesso in x
E’ concava nell’intervallo (
,
) e convessa
altrove
Ha come asintoto l’asse delle x xlim f(x) 0; xlim f(x)
f (x)dx
7.
P
f (x)dx
X
0,5
0,5
ovvero
P
X
0,5
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
0
Distribuzione Normale
6
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Distribuzione Normale
7
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Distribuzione Normale
Minore variabilità
Maggiore variabilità
8
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Distribuzione Normale
per diversi valori di μ e σ2
9
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Distribuzione Normale
Standardizzata
Partendo da una X ~ N(μ;σ2) qualunque,
con la trasformazione di standardizzazione
Z
X E(X)
SD(X)
X
si ottiene la distribuzione Normale
Standardizzata Z ~ N(0;1)
f(z)
1
e
2
1 2
z
2
10
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
11
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
F. di ripartizione della Normale
Standardizzata
(z)
P(Z
z)
corrisponde
all’area colorata al
di sotto della f. di
densità compresa
tra -∞ e z
12
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
F. di ripartizione della Normale
Standardizzata
13
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Proprietà di Φ(z)
(0)
P
Z
0
P(z
0)
0,5
0,5
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
14
Tavola di Φ(z)
La tavola della Normale standardizzata (Tavola 1 del libro di testo)
fornisce i valori della funzione di ripartizione (z) della
distribuzione normale standardizzata
Per un dato valore z di Z, la
tavola fornisce F(z) (l’area
sottesa alla curva da meno
infinito al valore z)
(z) P(Z
z)
La tavola 1 fornisce la probabilità
F(z) per qualunque valore z tra 0 e
4,09
(4,09) P(Z
4,09) 0,99998 1
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Tavola di Φ(z)
z
0,00
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0,0
0,5000
0,5040
0,5080
0,5120
0,5160
0,5199
0,5239
0,5279
0,5319
0,5359
0,1
0,5398
0,5438
0,5478
0,5517
0,5557
0,5596
0,5636
0,5675
0,5714
0,5753
0,2
0,5793
0,5832
0,5871
0,5910
0,5948
0,5987
0,6026
0,6064
0,6103
0,6141
0,3
0,6179
0,6217
0,6255
0,6293
0,6331
0,6368
0,6406
0,6443
0,6480
0,6517
0,4
0,6554
0,6591
0,6628
0,6664
0,6700
0,6736
0,6772
0,6808
0,6844
0,6879
0,5
0,6915
0,6950
0,6985
0,7019
0,7054
0,7088
0,7123
0,7157
0,7190
0,7224
0,6
0,7257
0,7291
0,7324
0,7357
0,7389
0,7422
0,7454
0,7486
0,7517
0,7549
0,7
0,7580
0,7611
0,7642
0,7673
0,7704
0,7734
0,7764
0,7794
0,7823
0,7852
0,8
0,7881
0,7910
0,7939
0,7967
0,7995
0,8023
0,8051
0,8078
0,8106
0,8133
0,9
0,8159
0,8186
0,8212
0,8238
0,8264
0,8289
0,8315
0,8340
0,8365
0,8389
1,0
0,8413
0,8438
0,8461
0,8485
0,8508
0,8531
0,8554
0,8577
0,8599
0,8621
1,1
0,8643
0,8665
0,8686
0,8708
0,8729
0,8749
0,8770
0,8790
0,8810
0,8830
1,2
0,8849
0,8869
0,8888
0,8907
0,8925
0,8944
0,8962
0,8980
0,8997
0,9015
1,3
0,9032
0,9049
0,9066
0,9082
0,9099
0,9115
0,9131
0,9147
0,9162
0,9177
1,4
0,9192
0,9207
0,9222
0,9236
0,9251
0,9265
0,9279
0,9292
0,9306
0,9319
1,5
0,9332
0,9345
0,9357
0,9370
0,9382
0,9394
0,9406
0,9418
0,9429
0,9441
(continua)
(0,43)
Valori di z>0
sulla prima
colonna (fino
alla prima cifra
decimale) e
sulla prima riga
(seconda cifra
decimale).
All’incrocio,
all’interno della
tabella si legge
il valore della f.
di ripartizione
0,6664
P(Z<0,43)=0,6664
z=0,43
16
Proprietà di Φ(z)
Per valori negativi di Z usiamo la proprietà di simmetria della
distribuzione simmetrica per trovare la probabilità desiderata
Per la
simmetria di Z
intorno allo 0,
le due aree
colorate sono
equivalenti
( z)
( z)
1
(z)
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
1
(z)
Esempio
P Z
( z)
1,5
1
(z)
?
P Z
1,5
1 0,9332
1
1,5
0,0668
0,9332
0,0668
1,5
0,9332
0,0668
- 1,5
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Proprietà di Φ(z)
P Z
z
?
P Z
z
19
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Proprietà di Φ(z)
P Z
z
?
1
(z)
P(Z
z)
La differenza
1
(z)
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
P(Z
z)
1
Esempio
P Z
0,5
?
1
(z)
P(Z
z)
(0,5)
1 0,6915
0,3085
0,6915
0,3085
0 0,5
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Determinazione di probabilità per una
distribuzione normale qualsiasi
Poiché ogni v.c. Normale può essere trasformata in una v.c.
standardizzata, le tavole della N(0,1) possono essere
utilizzate per qualsiasi distribuzione Normale.
Seguire i seguenti passaggi:
1. Disegnare la curva Normale per il problema dato in termini di
v.c. X
P(x1<X<x2)=?
x1
x2
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Determinazione di probabilità per una
distribuzione normale qualsiasi
2. Standardizzare la v.c. X: tradurre i valori di X in valori di Z
Z
X E(X)
SD(X)
X
P(z1<X<z2)=?
f(z)
Il problema è equivalente
z1
xx
1
1
0
z2
xx
21
z
3. Utilizzare la Tavola della Funzione di ripartizione della N(0,1)
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Calcolo di P(z1<Z<z2)
P(z1
Z
z2 )
24
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Calcolo di P(z1<Z<z2)
P(z1
Z
(z1 )
z2 )
P(Z
z2 ) P(Z
(z2 )
z1)
(z2 )
(z1)
(z1 )
25
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
P(z1<Z<z2) come differenza di aree
26
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Determinazione di probabilità per una
distribuzione normale qualsiasi
Esempio 1
La quantità di liquido X contenuta nelle bottiglie di
una bevanda analcolica si distribuisce normalmente
con media μ=1,5 litri e σ=0,04 litri
X ~ N(1,5;0,042)
Le bottiglie che contengono meno di 1,4 litri oppure
più di 1,6 litri non sono accettabili e non possono
essere immesse sul mercato.
Si sceglie a caso una bottiglia.
Calcolare la probabilità che la bottiglia sia immessa sul
mercato
27
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Esempio 1 X ~ N(1,5;0,042)
Calcolare la probabilità che la bottiglia sia immessa sul
mercato P 1, 4 X 1,6 ?
P 1,4
P
X
1,4 1,5
P
0,04
1,6
2,5
Z
2,5
Z
1,6 1,5
0,04
0,9876
Calcolare la quantità di liquido x per cui P(X>x)=0,99
Vale che P(Z>-2,33)=0,99
x 1,5
0,04
2,33
da cui
x
1,5
2,33 0,04
1,4068
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
28
Determinazione di probabilità per una
distribuzione normale qualsiasi
Esempio 2
Il tasso di rendimento X di un insieme di titoli
segue una distribuzione Normale con μ=4,5%
e σ=2%
X ~ N(4,5;22)
Calcolare P(0,5 X 8,5)
Le probabilità sono tabulate per Z
Che relazione c’è tra X e Z?
P 0,5
P
X
2
8,5
Z
2
P
0,5
2
0,9544
4,5
Z
Z
X
X
8,5
4,5
2
4,5
2
29
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Calcolo di P(x1<X<x2)
X ~ N(4,5;4)
P(0,5
X
Z ~ N(0;1)
8,5)
P( 2
Z
2)
Le due aree
colorate
sotto le due
distribuzioni
sono uguali
0,5
4,5
2
2
8,5
4,5
2
2
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
30
PROBLEMA DIRETTO E INVERSO
Problema diretto: dato un valore di z determinare la
probabilità cumulata
Problema inverso: dato un valore P della probabilità cumulata,
determinare il valore z corrispondente
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Esempio di problema inverso
Tavola di Φ(z)
z
0,00
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0,0
0,5000
0,5040
0,5080
0,5120
0,5160
0,5199
0,5239
0,5279
0,5319
0,5359
0,1
0,5398
0,5438
0,5478
0,5517
0,5557
0,5596
0,5636
0,5675
0,5714
0,5753
0,2
0,5793
0,5832
0,5871
0,5910
0,5948
0,5987
0,6026
0,6064
0,6103
0,6141
0,3
0,6179
0,6217
0,6255
0,6293
0,6331
0,6368
0,6406
0,6443
0,6480
0,6517
0,4
0,6554
0,6591
0,6628
0,6664
0,6700
0,6736
0,6772
0,6808
0,6844
0,6879
0,5
0,6915
0,6950
0,6985
0,7019
0,7054
0,7088
0,7123
0,7157
0,7190
0,7224
0,6
0,7257
0,7291
0,7324
0,7357
0,7389
0,7422
0,7454
0,7486
0,7517
0,7549
0,7
0,7580
0,7611
0,7642
0,7673
0,7704
0,7734
0,7764
0,7794
0,7823
0,7852
0,8
0,7881
0,7910
0,7939
0,7967
0,7995
0,8023
0,8051
0,8078
0,8106
0,8133
0,9
0,8159
0,8186
0,8212
0,8238
0,8264
0,8289
0,8315
0,8340
0,8365
0,8389
1,0
0,8413
0,8438
0,8461
0,8485
0,8508
0,8531
0,8554
0,8577
0,8599
0,8621
1,1
0,8643
0,8665
0,8686
0,8708
0,8729
0,8749
0,8770
0,8790
0,8810
0,8830
1,2
0,8849
0,8869
0,8888
0,8907
0,8925
0,8944
0,8962
0,8980
0,8997
0,9015
1,3
0,9032
0,9049
0,9066
0,9082
0,9099
0,9115
0,9131
0,9147
0,9162
0,9177
1,4
0,9192
0,9207
0,9222
0,9236
0,9251
0,9265
0,9279
0,9292
0,9306
0,9319
1,5
0,9332
0,9345
0,9357
0,9370
0,9382
0,9394
0,9406
0,9418
0,9429
0,9441
Valori della f. di
ripartizione >0,5
all’interno della
tabella.
Sulla prima riga
e sulla prima
colonna si legge
il corrispondente
valore z
(continua)
(z)
Per
0,6103
(z)
0,5
z=?
(z)
z
0,28
0,3446
z=?
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
32
Esempio di problema inverso
La quantità di liquido X contenuta nelle bottiglie di una bevanda
analcolica si distribuisce normalmente con media μ=1,5 litri e
σ=0,04 litri.
Determinare la quantità di liquido nella bottiglia che ha una
probabilità uguale al 25% di essere superato
Si tratta di determinare il valore x* per il quale P(X > x*) = 0,25 o
equivalentemente P(X < x*) = 0,75
Dalla tavola della (z) leggiamo il valore 0,7486 che corrisponde
a z*=0,67
Utilizzando la formula della standardizzazione possiamo ricavare
x*
x*x*-1,5
Da z*
0,67
0,04
superato dal 25%
segue x*
z*
1,5 0,67 0,04 1,53 Valore
ossia terzo quartile
Valori tipici di z e Φ(z)
z
Φ(z)
z
Φ(z)
0
0,50
0
0,50
0,67
0,75
-0,67
0,25
1,28
0,90
-1,28
0,10
1,64
0,95
-1,64
0,05
1,96
0,975
-1,96
0,025
2,33
0,99
-2,33
0,01
2,58
0,995
-2,58
0,005
3,09
0,999
-3,09
0,001
(z)
0,05
z=-1,64
z è un valore della v.c. (un valore sull’asse delle ascisse)
Φ(z) è una probabilità (un’area al di sotto della curva di densità)
0
z
(z)
,
1
praticamente - 3
z
3
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
34
Curtosi
ipernormale
Normale
iponormale
Indice di curtosi di Pearson
Indice di curtosi di Fisher
1
n 4
n
i 1
xi
x
4
3
35
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti