Principi di Statistica a.a. 2014-2015 Dr. Luca Secondi 03 Distribuzioni di probabilità per variabili casuali continue: La v.c. Normale 1 Distribuzione Normale (o Gaussiana) Forma campanulare, unimodale e simmetrica (tra – e + infinito) Media=Mediana=Moda=µ La deviazione standard è la distanza tra l’asse e il punto di flesso Distribuzione Normale (o Gaussiana) 3 Distribuzione Normale (o Gaussiana) Funzione di densità della v.c. Normale f (x) = X~ 1 σ 2π 2 N(µ;σ ) e 1 x−µ − 2 σ 2 − ∞ < x < +∞ E(X) = µ V(X) = σ2 4 σ µ 5 Distribuzione Normale (o Gaussiana) E’ la distribuzione più usata perché: 1) descrive bene molti fenomeni (approssima la distribuzione empirica di moltissimi fenomeni reali, come il peso e l’altezza di una popolazione) 2) ha proprietà e caratteristiche «convenienti» 3) il Teorema del Limite Centrale (TLC) prova che la distribuzione normale è la distribuzione approssimata della media di campioni di grandi dimensioni La distribuzione normale trova ampia applicazione in biostatistica. I metodi statistici più utilizzati, infatti, assumono che i dati provengano da una distribuzione Normale o, possano essere ricondotti a una v.c. Normale. Proprietà della normale: 1. 2. 3. 4. 5. 6. La curva è simmetrica, con asse di simmetria x = µ Media, moda e mediana coincidono: µ = M e = M d E’ crescente nell’intervallo ( −∞, µ) e decrescente nell’intervallo (µ, ∞) Ha due punti di flesso in x = µ − σ e x = µ + σ Ha la concavità rivolta verso il basso nell’intervallo (µ − σ, µ + σ) e verso l’altro altrove Ha come asintoto orizzontale l’asse delle x lim f(x) = 0; lim f(x) = 0 x → −∞ µ 7. ∞ ∫ f (x)dx = ∫ f (x)dx = 0,5 −∞ ovvero µ P ( −∞ < X < µ ) = 0,5 P ( µ < X < +∞ ) = 0,5 x → +∞ Distribuzione Normale (o Gaussiana) 8 Distribuzione Normale 9 Distribuzione Normale 10 Distribuzione Normale Minore variabilità Maggiore variabilità 11 Distribuzione Normale per diversi valori di µ e σ2 12 13 Distribuzione Normale Standardizzata Partendo da una X ~ N(µ;σ2) qualunque, con la trasformazione di standardizzazione Z= X − E(X) X − µ = SD(X) σ si ottiene la distribuzione Normale Standardizzata Z ~ N(0;1) f (z ) = 1 − z 1 e 2 2π 2 14 15 16 F. di ripartizione della Normale Standardizzata Φ(z) = P(Z ≤ z) corrisponde all’area colorata al di sotto della f. di densità compresa tra -∞ e z 17 F. di ripartizione della Normale Standardizzata 18 Proprietà di Φ(z) Φ(0) = P(z ≤ 0) = 0,5 P ( −∞ < Z < 0 ) = 0,5 19 Tavola di Φ(z) La tavola della distribuzione Normale standardizzata fornisce i valori della funzione di ripartizione Φ(z) della v.c. Normale standardizzata Per un dato valore z di Z, la tavola fornisce F(z) (l’area sottesa alla curva da meno infinito al valore z) Φ( z) = P(Z ≤ z) La tavola 1 fornisce la probabilità F(z) per qualunque valore z tra 0 e 4,09 Φ(4,09) = P (Z ≤ 4,09) = 0,99998 ≃ 1 Tavola di Φ(z) z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359 0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753 0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141 0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517 0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879 0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224 0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549 0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852 0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133 0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389 1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621 1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830 1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015 1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177 1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319 1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441 (continua) Valori di z>0 sulla prima colonna (fino alla prima cifra decimale) e sulla prima riga (seconda cifra decimale). All’incrocio, all’interno della tabella si legge il valore della f. di ripartizione Φ(0,43) = 0,6664 P(Z<0,43)=0,6664 z=0,43 21 Proprietà di Φ(z) Per valori negativi di Z usiamo la proprietà di simmetria della distribuzione simmetrica per trovare la probabilità desiderata Per la simmetria di Z intorno allo 0, le due aree colorate sono equivalenti Φ(−z) = 1 − Φ(z) Φ(−z) 1 − Φ(z) Esempio P ( Z < −1,5 ) = Φ(−z) = 1 − Φ(z) ? P ( Z < −1,5 ) = 1 − Φ (1,5 ) = = 1 − 0,9332 = 0,0668 0,9332 0,0668 1,5 0,9332 0,0668 - 1,5 Proprietà di Φ(z) P (Z > z) = ? P (Z > z) 24 Proprietà di Φ(z) P (Z > z) = ? 1 − Φ(z) = P(Z > z) La differenza 1 − Φ(z) = P(Z > z) Esempio P ( Z > 0,5 ) = ? 1 − Φ(z) = P(Z > z) 1 − Φ(0,5) = = 1 − 0,6915 = 0,3085 Determinazione di probabilità per una distribuzione normale qualsiasi Poiché ogni v.c. Normale può essere trasformata in una v.c. standardizzata, le tavole della N(0,1) possono essere utilizzate per qualsiasi distribuzione Normale. Seguire i seguenti passaggi: 1. Disegnare la curva Normale per il problema dato in termini di v.c. X P(x1<X<x2)=? x1 x2 Determinazione di probabilità per una distribuzione normale qualsiasi 2. Standardizzare la v.c. X: tradurre i valori di X in valori di Z X − E(X) X − µ Z= = SD(X) σ P(z1<X<z2)=? f(z) Il problema è equivalente z1 = xx 1 −µ 1 σ 0 z2 = xx 21 − µ z σ 3. Utilizzare la Tavola della Funzione di ripartizione della N(0,1) Calcolo di P(z1<Z<z2) P(z1 < Z < z2 ) 29 Calcolo di P(z1<Z<z2) P(z1 < Z < z2 ) = P(Z < z2 ) − P(Z < z1 ) = Φ(z2 ) − Φ(z1 ) Φ(z1 ) Φ(z2 ) Φ(z1 ) 30 P(z1<Z<z2) come differenza di aree 31 Determinazione di probabilità per una distribuzione normale qualsiasi Esempio 1 La quantità di liquido X contenuta nelle bottiglie di una bevanda analcolica si distribuisce normalmente con media µ=1,5 litri e σ=0,04 litri X ~ N(1,5;0,042) a) Determinare la probabilità che una bottiglia abbia un contenuto compreso tra 1.4 e 1.6 litri. 32 Esempio 1 X ~ N(1,5;0,042) P (1, 4 < X < 1,6 ) = ? 1,6 − 1,5 1,4 − 1,5 P(1,4 < X < 1,6 ) = P <Z< = 0,04 0,04 = P(− 2,5 < Z < 2,5) = 0,9876 33 Determinazione di probabilità per una distribuzione normale qualsiasi Esempio 2 Il contenuto di fosforo nel sangue in una determinata popolazione di individui adulti di sesso maschile si distribuisce normalmente con valore medio pari a 4,5 mg/dl e deviazione standard pari a 2 mg/dl. X ~ N(4,5;22) P(0,5 < X < 8,5) Calcolare Le probabilità sono tabulate per Z Z= X−µ σ = X − 4,5 2 Che relazione c’è tra X e Z? 8,5 − 4,5 0,5 − 4,5 P (0,5 < X < 8,5 ) = P <Z < = 2 2 = P (− 2 < Z < 2 ) = 0,9544 34 Calcolo di P(x1<X<x2) X ~ N(4,5;4) Z ~ N(0;1) P(0,5 < X < 8,5) P(−2 < Z < 2) Le due aree colorate sotto le due distribuzioni sono uguali 0,5 − 4,5 = −2 2 8,5 − 4,5 =2 2 35