Corso di Statistica Teorema del Limite Centrale Variabili casuali continue: T di Student F di Fisher Chi quadrato q Prof.ssa T. Laureti a.a. 2014-2015 1 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Teorema del limite centrale (TLC) Date X1, X2,…,Xn v.c. indipendenti e identicamente distribuite ((iid)) con media μ e varianza σ2 n Xi la v.c. somma Sn = ∑ al crescere di n i =1 tende a distribuirsi come una Normale con media nμ e varianza nσ2 Sn ~ N ( nμ,nnσ 2 ) Si può considerare la v v.c. c somma standardizzata Zn (il cui valore medio è 0 e la varianza è 1) definita n da: Xn n ∑ ∑ X n − nμ i =1 − μ Zn = Sn − E ( Sn ) Var ( Sn ) = i =1 σ n = n σ n Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 2 Se una v.c. risulta dalla somma di un grande numero di v.c. iid, la sua distribuzione può essere approssimata da una curva normale Non solo il TLC ci fornisce un metodo per approssimare la distribuzione di una somma di variabili aleatorie ma ci aiuta anche a spiegare il fatto notevole che le frequenze empiriche di tante popolazioni naturali (distribuzioni degli errori accidentali) esibiscano una curva normale. Esistono numerose versioni del TLC che tendono ad ampliare le sue possibilità di applicazione rimuovendo alcune restrizioni (la versione precedente del teorema è quella ll originaria). i i i ) Il TLC è chiamato “centrale” perché le v.c. di forma qualunque tendono a convergere verso una distribuzione “centrata” sulla media, che è la v.c. 3 Normale) Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Conseguenze del TLC La v.c. X ~ Binomiale(n;π) risulta dalla somma di n v.c. iid di Bernoulli In virtù ù del TLC, per n grande la sua distribuzione può essere approssimata da una N(nπ; nπ(1-π)) Quindi la v.c. X − nπ nπ ⋅ (1 − π) può essere approssimata da una curva normale standard 4 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Approssimazione della Binomiale con la Normale Sapendo S d che h il 10% dei d i pezzii prodotti d tti d da un certo processo è difettoso (π=0,10), avendo d scelto lt casualmente l t 300 pezzii tra t quelli lli prodotti in una giornata (n=300), calcolare l l lla probabilità b bilità che h almeno l 40 pezzii siano difettosi, cioè P(x>40) X ~ N(30;27 ) Sfruttando l’approssimazione alla Normale 40 − 30 ⎞ ⎛ P ( X > 40 ) = P ⎜ Z > ⎟ = P ( Z > 1,92 ) = 1 − Φ (1,92 ) = 27 ⎠ ⎝ 5 = 1 − 0,9726 = 0,0274 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Ancora sul teorema del limite centrale (v.c. media) Date X1, X2,…,X Xn v.c. v c indipendenti e identicamente distribuite (iid) con media μ e varianza σ2 1 n la v.c. media X = n ∑ Xi al crescere di n i =1 tende a distribuirsi come una Normale con 2 2 ⎛ ⎞ σ media μ e varianza σ /n X ~ N⎜ μ, ⎟ Quindi la v.c. X − μ ~ N(0,1) σ n ⎝ n⎠ è approssimativamente Normale standard 6 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Ancora sul teorema del limite centrale (v.c. proporzione) X ~ Binomiale conta il numero di successi in n prove Spesso si è interessati alla proporzione di successi, definita da P = X n Al crescere di n, P tende a distribuirsi come una Normale con media π e varianza π(1-π)/n Quindi P −π ~ N(0,1) π ⋅ (1 − π ) n ⎛ π ⋅ (1 − π) ⎞ P ~ N⎜ π, ⎟ n ⎝ ⎠ Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 7 Distribuzione chi-quadrato χ X~ χ x>0 Asimmetrica, χ24 2 g 2 g Asimmetrica Dipende da g (gradi di libertà) 2 χ10 2 χ15 Se si considerano g v.c. normali standardizzate e indipendenti allora la somma dei loro quadrati si distribuisce come una χ 2g con g gradi di libertà: Z12 + Z22 + .... + Zg2 ∼ χg2 8 Tavola del chi-quadrato (Area sulla coda destra, da χ 2 all'infinito) g\p 0,995 0,99 0,975 0,95 0,9 0,75 0,5 0,25 0,1 0,05 0,025 0,01 0,005 1 0,0000 0,0002 0,0010 0,0039 0,0158 0,1015 0,4549 1,3233 2,7055 3,8415 5,0239 6,6349 7,8794 2 0,0100 0,0201 0,0506 0,1026 0,2107 0,5754 1,3863 2,7726 4,6052 5,9915 7,3778 9,2103 10,5966 3 , 0,0717 0,1148 , 0,2158 , 0,3519 , 0,5844 , 1,2125 , 2,3660 , 4,1083 , 6,2514 , 7,8147 , 9,3484 , 11,3449 , 12,8382 , 4 0,2070 0,2971 0,4844 0,7107 1,0636 1,9226 3,3567 5,3853 7,7794 9,4877 11,1433 13,2767 14,8603 5 0,4117 0,5543 0,8312 1,1455 1,6103 2,6746 4,3515 6,6257 9,2364 11,0705 12,8325 15,0863 16,7496 6 0,6757 0,8721 1,2373 1,6354 2,2041 3,4546 5,3481 7,8408 10,6446 12,5916 14,4494 16,8119 18,5476 7 0 9893 0,9893 1 2390 1,2390 1 6899 1,6899 2 1674 2,1674 2 8331 2,8331 4 2549 4,2549 6 3458 6,3458 9 0372 9,0372 12 0170 12,0170 14 0671 14,0671 16 0128 16,0128 18 4753 18,4753 20 2777 20,2777 8 1,3444 1,6465 2,1797 2,7326 3,4895 5,0706 7,3441 10,2189 13,3616 15,5073 17,5346 20,0902 21,9550 9 1,7349 2,0879 2,7004 3,3251 4,1682 5,8988 8,3428 11,3888 14,6837 16,9190 19,0228 21,6660 23,5894 10 2,1559 2,5582 3,2470 3,9403 4,8652 6,7372 9,3418 12,5489 15,9872 18,3070 20,4832 23,2093 25,1882 Sulla prima colonna il numero dei gradi di libertà (g) Sulla prima riga l’area alla destra del valore chi quadrato cercato (area rossa nel disegno) All’incrocio si legge il valore chi-quadrato della corrispondente distribuzione che lascia alla sua destra tale area Il valore l della d ll distribuzione di t ib i chi hi quadrato d t con g=6 6 che h lascia l i alla ll sua destra un’area pari a 0,025 è 14,4494 P χ 2 > 14,4494 = 0,025 ( ) 6 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 9 Distribuzione t di Student T ~ Student(g) − ∞ < t < +∞ Campanulare Simmetrica intorno a t=0 Dipende da g (gradi di libertà) Al crescere di g tende a Z T(4) T(30) 10 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Distribuzione t di Student La v v.c. c t di Student si ottiene dal rapporto tra una v.c. Z e la radice quadrata di una v.c. Chi quadrato divisa per i propri gradi di Chi-quadrato libertà D t Z ~ N(0,1) Date N(0 1) 2 χ Y~ g Z T = Y g T ~ Student(g) 11 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Tavola della t di Student (Area sulla coda destra, da t all'infinito) g\p 0 250 0,250 0 100 0,100 1 1,0000 3,0777 2 0,8165 3 0 050 0,050 0 025 0,025 0 010 0,010 0 005 0,005 0 0005 0,0005 6,3138 12,7062 31,8205 63,6567 636,6192 1,8856 2,9200 4,3027 6,9646 9,9248 31,5991 0,7649 1,6377 2,3534 3,1825 4,5407 5,8409 12,9240 4 0,7407 1,5332 2,1318 2,7765 3,7470 4,6041 8,6103 5 0,7267 1,4759 2,0150 2,5706 3,3649 4,0321 6,8688 6 0,7176 1,4398 1,9432 2,4469 3,1427 3,7074 5,9588 7 0,7111 1,4149 1,8946 2,3646 2,9980 3,4995 5,4079 8 0,7064 1,3968 1,8595 2,3060 2,8965 3,3554 5,0413 9 0,7027 1,3830 1,8331 2,2622 2,8214 3,2498 4,7809 10 0,6998 1,3722 1,8125 2,2281 2,7638 3,1693 4,5869 ∞ (infinito) 0,6745 1,2816 1,6449 1,9600 2,3264 2,5758 3,2905 Il valore della distribuzione ti di Student con g=4 che lascia alla sua destra un’area pari a 0,010 è 3,7470 P(t 4 > 3,7470 ) = 0,010 Per la convergenza a Z Sulla prima colonna il numero dei gradi di libertà (g) Sulla prima riga l’area alla destra del valore t cercato (area rossa nel disegno) All’incrocio si legge il valore l tdella td ll corrispondente distribuzione che lascia alla sua destra tale area P(t ∞ > 1,96 ) = 0,025 = P(Z > 1,96 ) Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 12 12 Distribuzione F di Fisher X ~ F(v1;v2) x>0 F(20;20) Asimmetrica Dipende da v1 e v2 (gradi di libertà) F(4;10) 13 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Distribuzione F di Fisher La v v.c. c F di Fisher si ottiene dal rapporto tra due v.c. Chi-quadrato ciascuna divisa per i propri gradi di libertà Date Y1 ~ χ Y2 ~ χ2v 2 v1 2 Y1 v1 F= Y2 v 2 F ~ Fisher(v1;v2) 14 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Tavola della F di Fisher F (Area sulla coda destra - da F all'infinito – pari a 0,05) v2\v1 1 2 3 4 5 6 7 8 9 10 1 161,448 199,500 215,707 224,583 230,162 233,986 236,768 238,882 240,543 241,882 2 18,513 19,000 19,164 19,247 19,296 19,330 19,353 19,371 19,385 19,396 3 10,128 9,552 9,277 9,117 9,013 8,941 8,887 8,845 8,812 8,786 4 7,709 6,944 6,591 6,388 6,256 6,163 6,094 6,041 5,999 5,964 5 6,608 5,786 5,409 5,192 5,050 4,950 4,876 4,818 4,772 4,735 6 5,987 5,143 4,757 4,534 4,387 4,284 4,207 4,147 4,099 4,060 7 5,591 4,737 4,347 4,120 3,972 3,866 3,787 3,726 3,677 3,637 8 5,318 4,459 4,066 3,838 3,687 3,581 3,500 3,438 3,388 3,347 9 5,117 4,256 3,863 3,633 3,482 3,374 3,293 3,230 3,179 3,137 10 4,965 4,103 3,708 3,478 3,326 3,217 3,135 3,072 3,020 2,978 11 4,844 3,982 3,587 3,357 3,204 3,095 3,012 2,948 2,896 2,854 12 4,747 3,885 3,490 3,259 3,106 2,996 2,913 2,849 2,796 2,753 Sulla prima riga il numero dei gradi di libertà del numeratore (v1) Sulla prima colonna il numero dei gradi di libertà del denominatore (v2) All’incrocio si legge il valore F della corrispondente distribuzione che lascia alla sua destra un’area pari a 0,05 Il valore della distribuzione F con v1=6 6 e v2=8 8 che lascia alla sua destra un’area pari a 0,05 è 3,581 P (F > 3,581 ) = 0,05 6 ;8 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 15