Corso di Statistica Distribuzione casuale Normale Prof.ssa T. Laureti a.a. 2014-2015 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 1 Distribuzione Normale (o Gaussiana) Forma campanulare, unimodale e simmetrica (tra – e + infinito) Media=Mediana=Moda=μ La deviazione standard è la distanza tra l’asse e il punto di flesso Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Distribuzione Normale (o Gaussiana) 1 f (x) 2 e 1 x 2 2 x X ~ N(μ;σ2) E(X) V(X) 2 3 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Distribuzione Normale (o Gaussiana) E’ la distribuzione più usata perché 1)descrive bene molti fenomeni (approssima la distribuzione empirica di moltissimi fenomeni reali, come il peso e l’altezza di una popolazione) 2) ha proprietà matematiche convenienti 3) il teorema del limite centrale prova che la normale è la distribuzione approssimata della media di campioni di grandi dimensioni Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Proprietà della normale: 1. 2. 3. 4. 5. 6. La curva è simmetrica, con asse di simmetria x Me Md Media, moda e mediana coincidono: E’ crescente nell’intervallo ( , ) e decrescente nell’intervallo ( , ) e x Ha due punti di flesso in x E’ concava nell’intervallo ( , ) e convessa altrove Ha come asintoto l’asse delle x xlim f(x) 0; xlim f(x) f (x)dx 7. P f (x)dx X 0,5 0,5 ovvero P X 0,5 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 0 Distribuzione Normale 6 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Distribuzione Normale 7 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Distribuzione Normale Minore variabilità Maggiore variabilità 8 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Distribuzione Normale per diversi valori di μ e σ2 9 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Distribuzione Normale Standardizzata Partendo da una X ~ N(μ;σ2) qualunque, con la trasformazione di standardizzazione Z X E(X) SD(X) X si ottiene la distribuzione Normale Standardizzata Z ~ N(0;1) f(z) 1 e 2 1 2 z 2 10 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 11 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti F. di ripartizione della Normale Standardizzata (z) P(Z z) corrisponde all’area colorata al di sotto della f. di densità compresa tra -∞ e z 12 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti F. di ripartizione della Normale Standardizzata 13 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Proprietà di Φ(z) (0) P Z 0 P(z 0) 0,5 0,5 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 14 Tavola di Φ(z) La tavola della Normale standardizzata (Tavola 1 del libro di testo) fornisce i valori della funzione di ripartizione (z) della distribuzione normale standardizzata Per un dato valore z di Z, la tavola fornisce F(z) (l’area sottesa alla curva da meno infinito al valore z) (z) P(Z z) La tavola 1 fornisce la probabilità F(z) per qualunque valore z tra 0 e 4,09 (4,09) P(Z 4,09) 0,99998 1 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Tavola di Φ(z) z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359 0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753 0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141 0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517 0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879 0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224 0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549 0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852 0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133 0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389 1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621 1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830 1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015 1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177 1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319 1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441 (continua) (0,43) Valori di z>0 sulla prima colonna (fino alla prima cifra decimale) e sulla prima riga (seconda cifra decimale). All’incrocio, all’interno della tabella si legge il valore della f. di ripartizione 0,6664 P(Z<0,43)=0,6664 z=0,43 16 Proprietà di Φ(z) Per valori negativi di Z usiamo la proprietà di simmetria della distribuzione simmetrica per trovare la probabilità desiderata Per la simmetria di Z intorno allo 0, le due aree colorate sono equivalenti ( z) ( z) 1 (z) Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 1 (z) Esempio P Z ( z) 1,5 1 (z) ? P Z 1,5 1 0,9332 1 1,5 0,0668 0,9332 0,0668 1,5 0,9332 0,0668 - 1,5 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Proprietà di Φ(z) P Z z ? P Z z 19 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Proprietà di Φ(z) P Z z ? 1 (z) P(Z z) La differenza 1 (z) Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti P(Z z) 1 Esempio P Z 0,5 ? 1 (z) P(Z z) (0,5) 1 0,6915 0,3085 0,6915 0,3085 0 0,5 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Determinazione di probabilità per una distribuzione normale qualsiasi Poiché ogni v.c. Normale può essere trasformata in una v.c. standardizzata, le tavole della N(0,1) possono essere utilizzate per qualsiasi distribuzione Normale. Seguire i seguenti passaggi: 1. Disegnare la curva Normale per il problema dato in termini di v.c. X P(x1<X<x2)=? x1 x2 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Determinazione di probabilità per una distribuzione normale qualsiasi 2. Standardizzare la v.c. X: tradurre i valori di X in valori di Z Z X E(X) SD(X) X P(z1<X<z2)=? f(z) Il problema è equivalente z1 xx 1 1 0 z2 xx 21 z 3. Utilizzare la Tavola della Funzione di ripartizione della N(0,1) Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Calcolo di P(z1<Z<z2) P(z1 Z z2 ) 24 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Calcolo di P(z1<Z<z2) P(z1 Z (z1 ) z2 ) P(Z z2 ) P(Z (z2 ) z1) (z2 ) (z1) (z1 ) 25 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti P(z1<Z<z2) come differenza di aree 26 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Determinazione di probabilità per una distribuzione normale qualsiasi Esempio 1 La quantità di liquido X contenuta nelle bottiglie di una bevanda analcolica si distribuisce normalmente con media μ=1,5 litri e σ=0,04 litri X ~ N(1,5;0,042) Le bottiglie che contengono meno di 1,4 litri oppure più di 1,6 litri non sono accettabili e non possono essere immesse sul mercato. Si sceglie a caso una bottiglia. Calcolare la probabilità che la bottiglia sia immessa sul mercato 27 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Esempio 1 X ~ N(1,5;0,042) Calcolare la probabilità che la bottiglia sia immessa sul mercato P 1, 4 X 1,6 ? P 1,4 P X 1,4 1,5 P 0,04 1,6 2,5 Z 2,5 Z 1,6 1,5 0,04 0,9876 Calcolare la quantità di liquido x per cui P(X>x)=0,99 Vale che P(Z>-2,33)=0,99 x 1,5 0,04 2,33 da cui x 1,5 2,33 0,04 1,4068 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 28 Determinazione di probabilità per una distribuzione normale qualsiasi Esempio 2 Il tasso di rendimento X di un insieme di titoli segue una distribuzione Normale con μ=4,5% e σ=2% X ~ N(4,5;22) Calcolare P(0,5 X 8,5) Le probabilità sono tabulate per Z Che relazione c’è tra X e Z? P 0,5 P X 2 8,5 Z 2 P 0,5 2 0,9544 4,5 Z Z X X 8,5 4,5 2 4,5 2 29 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Calcolo di P(x1<X<x2) X ~ N(4,5;4) P(0,5 X Z ~ N(0;1) 8,5) P( 2 Z 2) Le due aree colorate sotto le due distribuzioni sono uguali 0,5 4,5 2 2 8,5 4,5 2 2 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 30 PROBLEMA DIRETTO E INVERSO Problema diretto: dato un valore di z determinare la probabilità cumulata Problema inverso: dato un valore P della probabilità cumulata, determinare il valore z corrispondente Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Esempio di problema inverso Tavola di Φ(z) z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359 0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753 0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141 0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517 0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879 0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224 0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549 0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852 0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133 0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389 1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621 1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830 1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015 1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177 1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319 1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441 Valori della f. di ripartizione >0,5 all’interno della tabella. Sulla prima riga e sulla prima colonna si legge il corrispondente valore z (continua) (z) Per 0,6103 (z) 0,5 z=? (z) z 0,28 0,3446 z=? Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 32 Esempio di problema inverso La quantità di liquido X contenuta nelle bottiglie di una bevanda analcolica si distribuisce normalmente con media μ=1,5 litri e σ=0,04 litri. Determinare la quantità di liquido nella bottiglia che ha una probabilità uguale al 25% di essere superato Si tratta di determinare il valore x* per il quale P(X > x*) = 0,25 o equivalentemente P(X < x*) = 0,75 Dalla tavola della (z) leggiamo il valore 0,7486 che corrisponde a z*=0,67 Utilizzando la formula della standardizzazione possiamo ricavare x* x*x*-1,5 Da z* 0,67 0,04 superato dal 25% segue x* z* 1,5 0,67 0,04 1,53 Valore ossia terzo quartile Valori tipici di z e Φ(z) z Φ(z) z Φ(z) 0 0,50 0 0,50 0,67 0,75 -0,67 0,25 1,28 0,90 -1,28 0,10 1,64 0,95 -1,64 0,05 1,96 0,975 -1,96 0,025 2,33 0,99 -2,33 0,01 2,58 0,995 -2,58 0,005 3,09 0,999 -3,09 0,001 (z) 0,05 z=-1,64 z è un valore della v.c. (un valore sull’asse delle ascisse) Φ(z) è una probabilità (un’area al di sotto della curva di densità) 0 z (z) , 1 praticamente - 3 z 3 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 34 Curtosi ipernormale Normale iponormale Indice di curtosi di Pearson Indice di curtosi di Fisher 1 n 4 n i 1 xi x 4 3 35 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti