Corso di Statistica

annuncio pubblicitario
Corso di Statistica
Teorema del Limite Centrale
Variabili casuali continue:
T di Student
F di Fisher
Chi quadrato
Prof.ssa T. Laureti
a.a. 2012-2013
1
Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Teorema del limite centrale (TLC)
Date X1, X2,…,Xn v.c. indipendenti e
identicamente distribuite (iid) con media µ e
varianza σ2
n
Xi
la v.c. somma Sn = ∑
al crescere di n
i =1
tende a distribuirsi come una Normale con
media nµ e varianza nσ2 Sn ~ N ( nµ,nσ 2 )
Si può considerare la v.c. somma standardizzata Zn
(il cui valore medio è 0 e la varianza
è 1) definita
n
da:
Xn
n
∑
∑ X n − nµ i =1 − µ
Zn =
Sn − E ( Sn )
Var ( Sn )
=
i =1
σ n
=
n
σ
n
Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
2
Se una v.c. risulta dalla somma di un grande numero
di v.c. iid, la sua distribuzione può essere approssimata
da una curva normale
Non solo il TLC ci fornisce un metodo per approssimare
la distribuzione di una somma di variabili aleatorie ma
ci aiuta anche a spiegare il fatto notevole che le
frequenze empiriche di tante popolazioni naturali
(distribuzioni degli errori accidentali) esibiscano una
curva normale.
Esistono numerose versioni del TLC che tendono ad
ampliare le sue possibilità di applicazione rimuovendo
alcune restrizioni (la versione precedente del teorema
è quella originaria).
Il TLC è chiamato “centrale” perché le v.c. di forma
qualunque tendono a convergere verso una
distribuzione “centrata” sulla media, che è la v.c.
3
Normale) Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Conseguenze del TLC
La v.c. X ~ Binomiale(n;π) risulta dalla somma
di n v.c. iid di Bernoulli
In virtù del TLC, per n grande la sua
distribuzione può essere approssimata da una
N(nπ; nπ(1-π))
Quindi la v.c.
X − nπ
nπ ⋅ (1 − π)
può essere approssimata da una curva
normale standard
Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
4
Approssimazione della Binomiale
con la Normale
Sapendo che il 10% dei pezzi prodotti da un
certo processo è difettoso (π=0,10),
avendo scelto casualmente 300 pezzi tra quelli
prodotti in una giornata (n=300),
calcolare la probabilità che almeno 40 pezzi
siano difettosi, cioè P(x>40) X ~ N(30;27 )
Sfruttando l’approssimazione alla Normale
40 − 30 ⎞
⎛
P ( X > 40 ) = P ⎜ Z >
⎟ = P ( Z > 1,92 ) = 1 − Φ (1,92 ) =
27 ⎠
⎝
5
= 1 − 0,9726 = 0,0274
Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Ancora sul teorema del limite
centrale (v.c. media)
Date X1, X2,…,Xn v.c. indipendenti e
identicamente distribuite (iid) con media µ e
varianza σ2
1 n
la v.c. media X = n ∑ Xi al crescere di n
i =1
tende a distribuirsi come una Normale con
⎛ σ2 ⎞
media µ e varianza σ2/n
X ~ N⎜ µ, ⎟
Quindi la v.c.
X − µ
~ N(0,1)
σ
n
⎝
n⎠
è approssimativamente Normale standard
6
Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Ancora sul teorema del limite
centrale (v.c. proporzione)
X ~ Binomiale conta il numero di successi in
n prove
Spesso si è interessati alla proporzione di
successi, definita da P = X
n
Al crescere di n, P tende a distribuirsi come
una Normale con media π e varianza π(1-π)/n
Quindi
P −π
~ N(0,1)
π ⋅ (1 − π )
n
⎛ π ⋅ (1 − π) ⎞
P ~ N⎜ π,
⎟
n
⎝
⎠
Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
7
Distribuzione chi-quadrato χ
X~
x>0
Asimmetrica,
χ24
2
g
χ2g
Asimmetrica
Dipende da g
(gradi di libertà)
2
χ10
2
χ15
Se si considerano g v.c. normali standardizzate e indipendenti allora la
somma dei loro quadrati si distribuisce come una χ 2g con g gradi di libertà:
Z12 + Z22 + .... + Zg2 ∼ χg2
8
Tavola del chi-quadrato
(Area sulla coda destra, da χ 2 all'infinito)
g\p
0,995
0,99
0,975
0,95
0,9
0,75
0,5
0,25
0,1
0,05
0,025
0,01
0,005
1
0,0000
0,0002
0,0010
0,0039
0,0158
0,1015
0,4549
1,3233
2,7055
3,8415
5,0239
6,6349
7,8794
2
0,0100
0,0201
0,0506
0,1026
0,2107
0,5754
1,3863
2,7726
4,6052
5,9915
7,3778
9,2103
10,5966
3
0,0717
0,1148
0,2158
0,3519
0,5844
1,2125
2,3660
4,1083
6,2514
7,8147
9,3484
11,3449
12,8382
4
0,2070
0,2971
0,4844
0,7107
1,0636
1,9226
3,3567
5,3853
7,7794
9,4877
11,1433
13,2767
14,8603
5
0,4117
0,5543
0,8312
1,1455
1,6103
2,6746
4,3515
6,6257
9,2364
11,0705
12,8325
15,0863
16,7496
6
0,6757
0,8721
1,2373
1,6354
2,2041
3,4546
5,3481
7,8408
10,6446
12,5916
14,4494
16,8119
18,5476
7
0,9893
1,2390
1,6899
2,1674
2,8331
4,2549
6,3458
9,0372
12,0170
14,0671
16,0128
18,4753
20,2777
8
1,3444
1,6465
2,1797
2,7326
3,4895
5,0706
7,3441
10,2189
13,3616
15,5073
17,5346
20,0902
21,9550
9
1,7349
2,0879
2,7004
3,3251
4,1682
5,8988
8,3428
11,3888
14,6837
16,9190
19,0228
21,6660
23,5894
10
2,1559
2,5582
3,2470
3,9403
4,8652
6,7372
9,3418
12,5489
15,9872
18,3070
20,4832
23,2093
25,1882
Sulla prima colonna il numero dei gradi di libertà (g)
Sulla prima riga l’area alla destra del valore chi quadrato cercato (area
rossa nel disegno)
All’incrocio si legge il valore chi-quadrato della corrispondente
distribuzione che lascia alla sua destra tale area
Il valore della distribuzione chi quadrato con g=6 che lascia alla sua
destra un’area pari a 0,025 è 14,4494 P χ 2 > 14,4494 = 0,025
(
)
6
Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
9
Distribuzione t di Student
T ~ Student(g)
− ∞ < t < +∞
Campanulare
Simmetrica
intorno a t=0
Dipende da g
(gradi di libertà)
Al crescere di g
tende a Z
T(4)
T(30)
10
Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Distribuzione t di Student
La v.c. t di Student si ottiene dal rapporto tra
una v.c. Z e la radice quadrata di una v.c.
Chi-quadrato divisa per i propri gradi di
libertà
Date Z ~ N(0,1)
2
χ
Y~ g
T =
Z
Y
g
T ~ Student(g)
11
Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Tavola della t di Student
(Area sulla coda destra, da t all'infinito)
g\p
0,250
0,100
1
1,0000
3,0777
2
0,8165
3
0,7649
4
5
0,050
0,025
0,010
0,005
0,0005
6,3138
12,7062
31,8205
63,6567
636,6192
1,8856
2,9200
4,3027
6,9646
9,9248
31,5991
1,6377
2,3534
3,1825
4,5407
5,8409
12,9240
0,7407
1,5332
2,1318
2,7765
3,7470
4,6041
8,6103
0,7267
1,4759
2,0150
2,5706
3,3649
4,0321
6,8688
6
0,7176
1,4398
1,9432
2,4469
3,1427
3,7074
5,9588
7
0,7111
1,4149
1,8946
2,3646
2,9980
3,4995
5,4079
8
0,7064
1,3968
1,8595
2,3060
2,8965
3,3554
5,0413
9
0,7027
1,3830
1,8331
2,2622
2,8214
3,2498
4,7809
10
0,6998
1,3722
1,8125
2,2281
2,7638
3,1693
4,5869
∞
(infinito)
0,6745
1,2816
1,6449
1,9600
2,3264
2,5758
3,2905
Il valore della distribuzione ti di Student con g=4
che lascia alla sua destra un’area pari a 0,010 è
3,7470
P(t 4 > 3,7470 ) = 0,010
Per la convergenza a Z
Sulla prima colonna
il numero dei gradi
di libertà (g)
Sulla prima riga
l’area alla destra
del valore t cercato
(area rossa nel
disegno)
All’incrocio si legge
il valore tdella
corrispondente
distribuzione che
lascia alla sua
destra tale area
P(t ∞ > 1,96 ) = 0,025 = P(Z > 1,96 )
Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
12
12
Distribuzione F di Fisher
X ~ F(v1;v2)
x>0
F(20;20)
Asimmetrica
Dipende da v1 e
v2 (gradi di
libertà)
F(4;10)
13
Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Distribuzione F di Fisher
La v.c. F di Fisher si ottiene dal rapporto tra
due v.c. Chi-quadrato ciascuna divisa per i
propri gradi di libertà
2
Date Y1 ~ χ v1
Y2 ~ χ2v
2
F=
Y1 v1
Y2 v 2
F ~ Fisher(v1;v2)
14
Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Tavola della F di Fisher
F
(Area sulla coda destra - da F all'infinito – pari a 0,05)
v2\v1
1
2
3
4
5
6
7
8
9
10
1
161,448
199,500
215,707
224,583
230,162
233,986
236,768
238,882
240,543
241,882
2
18,513
19,000
19,164
19,247
19,296
19,330
19,353
19,371
19,385
19,396
3
10,128
9,552
9,277
9,117
9,013
8,941
8,887
8,845
8,812
8,786
4
7,709
6,944
6,591
6,388
6,256
6,163
6,094
6,041
5,999
5,964
5
6,608
5,786
5,409
5,192
5,050
4,950
4,876
4,818
4,772
4,735
6
5,987
5,143
4,757
4,534
4,387
4,284
4,207
4,147
4,099
4,060
7
5,591
4,737
4,347
4,120
3,972
3,866
3,787
3,726
3,677
3,637
8
5,318
4,459
4,066
3,838
3,687
3,581
3,500
3,438
3,388
3,347
9
5,117
4,256
3,863
3,633
3,482
3,374
3,293
3,230
3,179
3,137
10
4,965
4,103
3,708
3,478
3,326
3,217
3,135
3,072
3,020
2,978
11
4,844
3,982
3,587
3,357
3,204
3,095
3,012
2,948
2,896
2,854
12
4,747
3,885
3,490
3,259
3,106
2,996
2,913
2,849
2,796
2,753
Sulla prima riga il numero dei gradi di libertà del numeratore (v1)
Sulla prima colonna il numero dei gradi di libertà del denominatore (v2)
All’incrocio si legge il valore F della corrispondente distribuzione che lascia
alla sua destra un’area pari a 0,05
Il valore della distribuzione F con v1=6 e v2=8 che lascia alla sua destra
un’area pari a 0,05 è 3,581
P (F
> 3,581 ) = 0,05
6 ;8
Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
15
Scarica