Distribuzione per variabili casuali continue. Variabile casuale Normale

Principi di Statistica
a.a. 2014-2015
Dr. Luca Secondi
03 Distribuzioni di probabilità per
variabili casuali continue:
La v.c. Normale
1
Distribuzione Normale (o Gaussiana)
Forma campanulare, unimodale e simmetrica (tra – e +
infinito)
Media=Mediana=Moda=µ
La deviazione standard è la distanza tra l’asse e il punto di flesso
Distribuzione Normale (o Gaussiana)
3
Distribuzione Normale (o Gaussiana)
Funzione di densità della v.c. Normale
f (x) =
X~
1
σ 2π
2
N(µ;σ )
e
1 x−µ 
− 

2 σ 
2
− ∞ < x < +∞
E(X) = µ
V(X) = σ2
4
σ
µ
5
Distribuzione Normale (o Gaussiana)
E’ la distribuzione più usata perché:
1) descrive bene molti fenomeni (approssima la distribuzione
empirica di moltissimi fenomeni reali, come il peso e
l’altezza di una popolazione)
2) ha proprietà e caratteristiche «convenienti»
3) il Teorema del Limite Centrale (TLC) prova che la
distribuzione normale è la distribuzione approssimata della
media di campioni di grandi dimensioni
La distribuzione normale trova ampia applicazione in biostatistica. I metodi statistici più utilizzati,
infatti, assumono che i dati provengano da una distribuzione Normale o, possano essere ricondotti
a una v.c. Normale.
Proprietà della normale:
1.
2.
3.
4.
5.
6.
La curva è simmetrica, con asse di simmetria x = µ
Media, moda e mediana coincidono: µ = M e = M d
E’ crescente nell’intervallo ( −∞, µ) e decrescente
nell’intervallo (µ, ∞)
Ha due punti di flesso in x = µ − σ e x = µ + σ
Ha la concavità rivolta verso il basso nell’intervallo (µ − σ, µ + σ)
e verso l’altro altrove
Ha come asintoto orizzontale l’asse delle x lim f(x) = 0; lim f(x) = 0
x → −∞
µ
7.
∞
∫ f (x)dx = ∫ f (x)dx = 0,5
−∞
ovvero
µ
P ( −∞ < X < µ ) = 0,5
P ( µ < X < +∞ ) = 0,5
x → +∞
Distribuzione Normale (o Gaussiana)
8
Distribuzione Normale
9
Distribuzione Normale
10
Distribuzione Normale
Minore variabilità
Maggiore variabilità
11
Distribuzione Normale
per diversi valori di µ e σ2
12
13
Distribuzione Normale
Standardizzata
Partendo da una X ~ N(µ;σ2) qualunque,
con la trasformazione di standardizzazione
Z=
X − E(X) X − µ
=
SD(X)
σ
si ottiene la distribuzione Normale
Standardizzata Z ~ N(0;1)
f (z ) =
1
− z
1
e 2
2π
2
14
15
16
F. di ripartizione della Normale
Standardizzata
Φ(z) = P(Z ≤ z)
corrisponde
all’area colorata al
di sotto della f. di
densità compresa
tra -∞ e z
17
F. di ripartizione della Normale
Standardizzata
18
Proprietà di Φ(z)
Φ(0) = P(z ≤ 0) = 0,5
P ( −∞ < Z < 0 ) = 0,5
19
Tavola di Φ(z)
La tavola della distribuzione Normale standardizzata fornisce i
valori della funzione di ripartizione Φ(z) della v.c. Normale
standardizzata
Per un dato valore z di Z, la
tavola fornisce F(z) (l’area
sottesa alla curva da meno
infinito al valore z)
Φ( z) = P(Z ≤ z)
La tavola 1 fornisce la probabilità
F(z) per qualunque valore z tra 0 e
4,09
Φ(4,09) = P (Z ≤ 4,09) = 0,99998 ≃ 1
Tavola di Φ(z)
z
0,00
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0,0
0,5000
0,5040
0,5080
0,5120
0,5160
0,5199
0,5239
0,5279
0,5319
0,5359
0,1
0,5398
0,5438
0,5478
0,5517
0,5557
0,5596
0,5636
0,5675
0,5714
0,5753
0,2
0,5793
0,5832
0,5871
0,5910
0,5948
0,5987
0,6026
0,6064
0,6103
0,6141
0,3
0,6179
0,6217
0,6255
0,6293
0,6331
0,6368
0,6406
0,6443
0,6480
0,6517
0,4
0,6554
0,6591
0,6628
0,6664
0,6700
0,6736
0,6772
0,6808
0,6844
0,6879
0,5
0,6915
0,6950
0,6985
0,7019
0,7054
0,7088
0,7123
0,7157
0,7190
0,7224
0,6
0,7257
0,7291
0,7324
0,7357
0,7389
0,7422
0,7454
0,7486
0,7517
0,7549
0,7
0,7580
0,7611
0,7642
0,7673
0,7704
0,7734
0,7764
0,7794
0,7823
0,7852
0,8
0,7881
0,7910
0,7939
0,7967
0,7995
0,8023
0,8051
0,8078
0,8106
0,8133
0,9
0,8159
0,8186
0,8212
0,8238
0,8264
0,8289
0,8315
0,8340
0,8365
0,8389
1,0
0,8413
0,8438
0,8461
0,8485
0,8508
0,8531
0,8554
0,8577
0,8599
0,8621
1,1
0,8643
0,8665
0,8686
0,8708
0,8729
0,8749
0,8770
0,8790
0,8810
0,8830
1,2
0,8849
0,8869
0,8888
0,8907
0,8925
0,8944
0,8962
0,8980
0,8997
0,9015
1,3
0,9032
0,9049
0,9066
0,9082
0,9099
0,9115
0,9131
0,9147
0,9162
0,9177
1,4
0,9192
0,9207
0,9222
0,9236
0,9251
0,9265
0,9279
0,9292
0,9306
0,9319
1,5
0,9332
0,9345
0,9357
0,9370
0,9382
0,9394
0,9406
0,9418
0,9429
0,9441
(continua)
Valori di z>0
sulla prima
colonna (fino
alla prima cifra
decimale) e
sulla prima riga
(seconda cifra
decimale).
All’incrocio,
all’interno della
tabella si legge
il valore della f.
di ripartizione
Φ(0,43) = 0,6664
P(Z<0,43)=0,6664
z=0,43
21
Proprietà di Φ(z)
Per valori negativi di Z usiamo la proprietà di simmetria della
distribuzione simmetrica per trovare la probabilità desiderata
Per la
simmetria di Z
intorno allo 0,
le due aree
colorate sono
equivalenti
Φ(−z) = 1 − Φ(z)
Φ(−z)
1 − Φ(z)
Esempio
P ( Z < −1,5 ) =
Φ(−z) = 1 − Φ(z)
?
P ( Z < −1,5 ) = 1 − Φ (1,5 ) =
= 1 − 0,9332 = 0,0668
0,9332
0,0668
1,5
0,9332
0,0668
- 1,5
Proprietà di Φ(z)
P (Z > z) = ?
P (Z > z)
24
Proprietà di Φ(z)
P (Z > z) = ?
1 − Φ(z) = P(Z > z)
La differenza
1 − Φ(z) = P(Z > z)
Esempio
P ( Z > 0,5 ) = ?
1 − Φ(z) = P(Z > z)
1 − Φ(0,5) =
= 1 − 0,6915 = 0,3085
Determinazione di probabilità per una
distribuzione normale qualsiasi
Poiché ogni v.c. Normale può essere trasformata in una v.c.
standardizzata, le tavole della N(0,1) possono essere
utilizzate per qualsiasi distribuzione Normale.
Seguire i seguenti passaggi:
1. Disegnare la curva Normale per il problema dato in termini di
v.c. X
P(x1<X<x2)=?
x1
x2
Determinazione di probabilità per una
distribuzione normale qualsiasi
2. Standardizzare la v.c. X: tradurre i valori di X in valori di Z
X − E(X) X − µ
Z=
=
SD(X)
σ
P(z1<X<z2)=?
f(z)
Il problema è equivalente
z1 =
xx
1 −µ
1
σ
0
z2 =
xx
21 − µ
z
σ
3. Utilizzare la Tavola della Funzione di ripartizione della N(0,1)
Calcolo di P(z1<Z<z2)
P(z1 < Z < z2 )
29
Calcolo di P(z1<Z<z2)
P(z1 < Z < z2 ) = P(Z < z2 ) − P(Z < z1 ) = Φ(z2 ) − Φ(z1 )
Φ(z1 )
Φ(z2 )
Φ(z1 )
30
P(z1<Z<z2) come differenza di aree
31
Determinazione di probabilità per una
distribuzione normale qualsiasi
Esempio 1
La quantità di liquido X contenuta nelle bottiglie di
una bevanda analcolica si distribuisce normalmente
con media µ=1,5 litri e σ=0,04 litri
X ~ N(1,5;0,042)
a) Determinare la probabilità che una bottiglia abbia
un contenuto compreso tra 1.4 e 1.6 litri.
32
Esempio 1 X ~ N(1,5;0,042)
P (1, 4 < X < 1,6 ) = ?
1,6 − 1,5 
 1,4 − 1,5
P(1,4 < X < 1,6 ) = P
<Z<
=
0,04 
 0,04
= P(− 2,5 < Z < 2,5) = 0,9876
33
Determinazione di probabilità per una
distribuzione normale qualsiasi
Esempio 2
Il contenuto di fosforo nel sangue in una determinata
popolazione di individui adulti di sesso maschile si
distribuisce normalmente con valore medio pari a 4,5
mg/dl e deviazione standard pari a 2 mg/dl.
X ~ N(4,5;22)
P(0,5 < X < 8,5)
Calcolare
Le probabilità sono tabulate per Z
Z=
X−µ
σ
=
X − 4,5
2
Che relazione c’è tra X e Z?
8,5 − 4,5 
 0,5 − 4,5
P (0,5 < X < 8,5 ) = P 
<Z <
 =
2
2


= P (− 2 < Z < 2 ) = 0,9544
34
Calcolo di P(x1<X<x2)
X ~ N(4,5;4)
Z ~ N(0;1)
P(0,5 < X < 8,5)
P(−2 < Z < 2)
Le due aree
colorate
sotto le due
distribuzioni
sono uguali
0,5 − 4,5
= −2
2
8,5 − 4,5
=2
2
35