Statistica e biometria - Matematica e Applicazioni

Statistica e
biometria
D. Bertacchi
La media campionaria
Media
campionaria
Teorema del
limite centrale
Densità Exp
Φ(x )
Bernoulli(0.5)
MEDIA CAMPIONARIA
Date n v.a.
X1 , . . . , Xn indipendenti e identicamente
distribuite (in breve i.i.d.), la v.a.
Bernoulli(0.2)
Applicazione
Chebychev
Esempi
n
Xn =
Legge dei
grandi numeri
i=1
Applicazione
Approfondiamo
1X
Xi ,
n
è detta media campionaria.
In altre parole, se le X1 , . . . , Xn sono il risultato di n
misurazioni (indipendenti) di una stessa quantità (aleatoria),
la media campionaria è la media aritmetica di queste
misurazioni.
Statistica e
biometria
D. Bertacchi
La media campionaria
Media
campionaria
Teorema del
limite centrale
Densità Exp
Φ(x )
Bernoulli(0.5)
Bernoulli(0.2)
Applicazione
Chebychev
Esempi
Legge dei
grandi numeri
Applicazione
Approfondiamo
È naturale chiedersi alcune cose su X n :
• posso dire che legge ha?
• c’entra qualcosa con E(X )?
Alla prima domanda rispondiamo che in generale non si è
semplice conoscere la legge di X n , ma se n è grande e ci si
accontenta di un’approssimazione, il Teorema del Limite
Centrale dà una risposta.
Alla seconda domanda risponderà la legge dei grandi
numeri.
Statistica e
biometria
Su E(X1) ←→ X n
D. Bertacchi
Media
campionaria
Teorema del
limite centrale
Densità Exp
Notiamo fin d’ora: se i valori che ognuna delle v.a. può assumere sono,
ad esempio, v1 , v2 , v3 , v4 e fX1 (v1 ) = p1 , fX1 (v2 ) = p2 , fX1 (v3 ) = p3 ,
fX1 (v4 ) = p4 , allora
Φ(x )
Bernoulli(0.5)
Bernoulli(0.2)
Applicazione
Chebychev
Esempi
Legge dei
grandi numeri
Applicazione
Approfondiamo
Xn =
1
(v1 · num. di volte che v1 è presente nei dati
n
+ v2 · num. di volte che v2 è presente nei dati
+ v3 · num. di volte che v3 è presente nei dati
+ v4 · num. di volte che v4 è presente nei dati)
=v1 · freq.rel. di v1
+ v2 · freq.rel. di v2
+ v3 · freq.rel. di v3
+ v4 · freq.rel. di v4 )
≈v1 · p1 + v2 · p2 + v3 · p3 + v4 · p4 = E(X1 ).
Quindi X n ≈ E(X1 ) se pensiamo che le frequenze relative ≈ probabilità.
Statistica e
biometria
Su E(X1) ←→ X n
D. Bertacchi
Media
campionaria
Teorema del
limite centrale
Densità Exp
Φ(x )
Bernoulli(0.5)
Bernoulli(0.2)
Applicazione
Chebychev
Esempi
Legge dei
grandi numeri
Applicazione
Approfondiamo
È dunque piuttosto naturale dire che,
SE frequenze relative ≈ probabilità ALLORA ANCHE
X n ≈ E(X1 ).
L’idea di fondo è che “frequenze relative 6≈ probabilità” sia
un fatto improbabile se n è grande.
L’affermazione precisa è la legge dei grandi numeri che
vedremo a breve.
Statistica e
biometria
D. Bertacchi
Il teorema del limite centrale
Media
campionaria
Teorema del
limite centrale
Densità Exp
Φ(x )
Bernoulli(0.5)
Bernoulli(0.2)
Applicazione
Teorema
Sia {Xi }i≥1 una successione di v.a. i.i.d. tutte con valore
atteso E(Xi ) = µ e varianza finita Var(Xi ) = σ 2 > 0. Sia
Chebychev
Esempi
Legge dei
grandi numeri
Sn∗ =
Applicazione
Approfondiamo
Xn − µ
√ .
σ/ n
Allora per ogni t ∈ R vale
n→+∞
P(Sn∗ ≤ t) −→ Φ(t).
Statistica e
biometria
Significato
D. Bertacchi
Media
campionaria
Teorema del
limite centrale
Densità Exp
Sn∗ =
Xn − µ
√ .
σ/ n
è la standardizzata della media campionaria,
Φ(x )
Bernoulli(0.5)
Bernoulli(0.2)
infatti
Applicazione
Chebychev
Esempi
n
E(X n ) = E
Legge dei
grandi numeri
i=1
Applicazione
Approfondiamo
1X
Xi
n
=
n
1X
n
n
=
1X
E(Xi )
n
i=1
µ = µ.
i=1
n
Var(X n ) = Var
!
1X
Xi
n
i=1
!
=
n
1 X 2 σ2
.
σ =
= 2
n
n
i=1
n
1 X
Var(Xi )
n2
i=1
Statistica e
biometria
Significato
D. Bertacchi
Media
campionaria
Teorema del
limite centrale
Densità Exp
Φ(x )
Bernoulli(0.5)
Bernoulli(0.2)
Applicazione
Chebychev
Esempi
Legge dei
grandi numeri
Applicazione
Approfondiamo
n→+∞
P(Sn∗ ≤ t) −→ Φ(t) = P(N (0, 1) ≤ t).
ci dice la legge di Sn∗ si approssima, per n grande, con
quella di una N (0, 1).
In altre parole, se vogliamo calcolare probabilità relative a
Sn∗ possiamo utilizzare quelle relative a N (0, 1) come
approssimazione.
Statistica e
biometria
Approssimazione normale
D. Bertacchi
Media
campionaria
Teorema del
limite centrale
qui con ≈ indichiamo l’approssimazione delle probabilità di
cui abbiamo appena discusso:
Sn∗ ≈ N (0, 1)
Densità Exp
Φ(x )
Bernoulli(0.5)
X n ≈ N (µ, σ 2 /n)
Bernoulli(0.2)
Applicazione
X1 + · · · + Xn ≈ N (nµ, nσ 2 )
Chebychev
Esempi
Legge dei
grandi numeri
Applicazione
Approfondiamo
Pro
Questa approssimazione vale qualsiasi sia la legge delle
X1 , . . . , Xn .
Contro
È un’approssimazione e vale solo se n è sufficientemente grande, ma quanto grande dipende dalla legge delle
X1 , . . . , Xn .
Statistica e
biometria
D. Bertacchi
Quando vale l’approssimazione
Media
campionaria
Teorema del
limite centrale
Densità Exp
Φ(x )
Bernoulli(0.5)
Bernoulli(0.2)
Applicazione
Chebychev
Esempi
Legge dei
grandi numeri
Applicazione
Approfondiamo
In generale, se la legge delle X1 , . . . , Xn non è troppo
asimmetrica, a livello empirico si considera che n = 30 sia
abbastanza grande.
Se invece la legge di ciascuna Xi è B(p), l’approssimazione
normale si considera valida se sia np che n(1 − p) sono ≥ 5.
Statistica e
biometria
D. Bertacchi
Media
campionaria
Teorema del
limite centrale
Densità Exp
Φ(x )
Bernoulli(0.5)
Grafici di approssimazione
Prendiamo come esempio una successione di v.a. Xi di tipo
esponenziale (non è importante qui sapere come sono
definite) e confrontiamo il grafico della densità della
standardizzata di X n con quello di N (0, 1):
Bernoulli(0.2)
Applicazione
Chebychev
0,4
Esempi
Legge dei
grandi numeri
0,3
Applicazione
Approfondiamo
0,2
0,1
0
-3
-2
-1
0
1
2
x
S_10^*
S_5^*
N(0,1)
3
Statistica e
biometria
D. Bertacchi
Media
campionaria
Teorema del
limite centrale
Densità Exp
Grafici di approssimazione
In realtà il teorema confronta le aree e non le curve, ma
poiché siamo abituati a vedere la campana della densità
N (0, 1) guardiamo questi grafici:
Φ(x )
Bernoulli(0.5)
Bernoulli(0.2)
0,4
Applicazione
Chebychev
Esempi
0,3
Legge dei
grandi numeri
Applicazione
0,2
Approfondiamo
0,1
0
-3
-2
-1
0
1
N(0,1)
S_50^*
S_20^*
2
3
Statistica e
biometria
D. Bertacchi
Media
campionaria
Teorema del
limite centrale
Grafici di approssimazione
Vediamo infine tutte le densità: quella di N (0, 1) e quelle di
∗ , S∗ , S∗ .
S5∗ , S10
50
20
Densità Exp
Φ(x )
Bernoulli(0.5)
0,4
Bernoulli(0.2)
Applicazione
Chebychev
0,3
Esempi
Legge dei
grandi numeri
0,2
Applicazione
Approfondiamo
0,1
0
-3
-2
-1
0
1
2
x
S_5^*
N(0,1)
S_10^*
S_50^*
S_20^*
3
Statistica e
biometria
D. Bertacchi
Media
campionaria
Teorema del
limite centrale
Grafici di approssimazione
Invece della densità, guardiamo ora il grafico della funzione
x 7→ P(N (0, 1) ≤ x) = Φ(x)
Densità Exp
Φ(x )
Bernoulli(0.5)
Bernoulli(0.2)
1
Applicazione
Chebychev
0,8
Esempi
Legge dei
grandi numeri
0,6
Applicazione
Approfondiamo
0,4
0,2
0
-3
-2
-1
0
1
P(N(0,1)<x)
2
3
Statistica e
biometria
D. Bertacchi
Media
campionaria
Teorema del
limite centrale
Grafici di approssimazione
Confrontiamo con gli analoghi grafici per le medie
∗ ):
campionarie standardizzate di prima (S5∗ e S10
Densità Exp
Φ(x )
Bernoulli(0.5)
1
Bernoulli(0.2)
Applicazione
0,8
Chebychev
Esempi
Legge dei
grandi numeri
0,6
Applicazione
0,4
Approfondiamo
0,2
0
-3
-2
-1
0
1
x
P(S_5^*<x)
P(N(0,1)<x)
P(S_10^*<x)
2
3
Statistica e
biometria
Grafici di approssimazione
D. Bertacchi
Media
campionaria
Teorema del
limite centrale
Consideriamo ora X1 , X2 , X3 , X4 , X5 indipendenti e ciascuna
con legge B(0.5). Sia S5 = X1 + X2 + X3 + X4 + X5 e
guardiamo il grafico della funzione
Densità Exp
x 7→ P(S5 ≤ x)
Φ(x )
Bernoulli(0.5)
Bernoulli(0.2)
Applicazione
Chebychev
1
Esempi
Legge dei
grandi numeri
0,8
Applicazione
Approfondiamo
0,6
0,4
0,2
0
1
2
3
4
5
6
Statistica e
biometria
D. Bertacchi
Media
campionaria
Teorema del
limite centrale
Grafici di approssimazione
Standardizziamo S5 e guardiamo il grafico di P(S5∗ ≤ x)
Densità Exp
Φ(x )
1
Bernoulli(0.5)
Bernoulli(0.2)
Applicazione
0,8
Chebychev
Esempi
Legge dei
grandi numeri
0,6
Applicazione
Approfondiamo
0,4
0,2
-2
-1
0
1
2
3
Statistica e
biometria
D. Bertacchi
Media
campionaria
Teorema del
limite centrale
Grafici di approssimazione
Confrontiamo il grafico di P(S5∗ ≤ x) e quello di
P(N (0, 1) ≤ x):
Densità Exp
Φ(x )
Bernoulli(0.5)
1
Bernoulli(0.2)
Applicazione
Chebychev
0,8
Esempi
Legge dei
grandi numeri
0,6
Applicazione
Approfondiamo
0,4
0,2
0
-2
-1
0
1
2
3
Statistica e
biometria
D. Bertacchi
Media
campionaria
Teorema del
limite centrale
Grafici di approssimazione
∗ ≤ x) e quello di
Confrontiamo il grafico di P(S10
P(N (0, 1) ≤ x):
Densità Exp
Φ(x )
Bernoulli(0.5)
1
Bernoulli(0.2)
Applicazione
Chebychev
0,8
Esempi
Legge dei
grandi numeri
0,6
Applicazione
Approfondiamo
0,4
0,2
0
-3
-2
-1
0
1
2
3
Statistica e
biometria
Grafici di approssimazione
D. Bertacchi
Media
campionaria
Teorema del
limite centrale
∗ ≤ x) e quello di
Confrontiamo il grafico di P(S30
P(N (0, 1) ≤ x):
Densità Exp
Φ(x )
Bernoulli(0.5)
1
Bernoulli(0.2)
Applicazione
Chebychev
0,8
Esempi
Legge dei
grandi numeri
0,6
Applicazione
Approfondiamo
0,4
0,2
0
-4
-2
0
2
4
Statistica e
biometria
D. Bertacchi
Media
campionaria
Teorema del
limite centrale
Grafici di approssimazione
Prendiamo ora delle B(0.2): confrontiamo il grafico di
P(S5∗ ≤ x) e quello di P(N (0, 1) ≤ x):
Densità Exp
Φ(x )
Bernoulli(0.5)
1
Bernoulli(0.2)
Applicazione
Chebychev
0,8
Esempi
Legge dei
grandi numeri
0,6
Applicazione
Approfondiamo
0,4
0,2
0
-2
-1
0
1
2
3
Statistica e
biometria
D. Bertacchi
Media
campionaria
Teorema del
limite centrale
Grafici di approssimazione
∗ ≤ x) e quello di
Confrontiamo il grafico di P(S10
P(N (0, 1) ≤ x):
Densità Exp
Φ(x )
Bernoulli(0.5)
1
Bernoulli(0.2)
Applicazione
Chebychev
0,8
Esempi
Legge dei
grandi numeri
0,6
Applicazione
Approfondiamo
0,4
0,2
0
-3
-2
-1
0
1
2
3
Statistica e
biometria
Grafici di approssimazione
D. Bertacchi
Media
campionaria
Teorema del
limite centrale
∗ ≤ x) e quello di
Confrontiamo il grafico di P(S30
P(N (0, 1) ≤ x):
Densità Exp
Φ(x )
Bernoulli(0.5)
1
Bernoulli(0.2)
Applicazione
Chebychev
0,8
Esempi
Legge dei
grandi numeri
0,6
Applicazione
Approfondiamo
0,4
0,2
0
-4
-2
0
2
4
Statistica e
biometria
D. Bertacchi
La binomiale
Media
campionaria
Teorema del
limite centrale
Densità Exp
Φ(x )
Bernoulli(0.5)
Una delle approssimazioni normali viste è
Bernoulli(0.2)
Applicazione
Chebychev
Esempi
Legge dei
grandi numeri
Applicazione
X1 + · · · + Xn ≈ N (nµ, nσ 2 )
poiché una B(n, p) può essere vista come somma di n B(p)
indipendenti ne ricaviamo
Approfondiamo
B(n, p) ≈ N (np, np(1 − p)).
Statistica e
biometria
D. Bertacchi
La moneta
Media
campionaria
Teorema del
limite centrale
Densità Exp
Φ(x )
Bernoulli(0.5)
Bernoulli(0.2)
Applicazione
Chebychev
Se lancio 1000 volte una moneta equilibrata, qual è la
probabilità che escano meno di 490 teste? e più di 530? E
che la differenza con 500 superi 5?
Esempi
Legge dei
grandi numeri
Applicazione
Approfondiamo
P(B(1000, 0.5) < 490) ≈ P(N (500, 250) < 490)
P(B(1000, 0.5) > 530) ≈ P(N (500, 250)) > 530)
P(|B(1000, 0.5) − 500| > 5) ≈ P(|N (500, 250) − 500| > 5)
Statistica e
biometria
D. Bertacchi
Calcoliamo
Media
campionaria
Teorema del
limite centrale
Densità Exp
Φ(x )
Bernoulli(0.5)
Bernoulli(0.2)
Applicazione
Chebychev
P(B(1000, 0.5) < 490) ≈ P(N (500, 250) < 490)
490 − 500
= P(N (0, 1) < √
) = Φ(−0.63)
250
= 1 − 0.73565 = 0.26435.
Esempi
Legge dei
grandi numeri
Applicazione
Approfondiamo
P(B(1000, 0.5) > 530) ≈ P(N (500, 250)) > 530)
530 − 500
) = 1 − Φ(1.90)
= P(N (0, 1) > √
250
= 1 − 0.97128 = 0.02872.
P(|B(1000, 0.5) − 500| > 5) ≈ P(|N (500, 250) − 500| > 5)
5
) = 2(1 − Φ(0.32))
= P(|N (0, 1)| > √
250
= 2 · (1 − 0.62552) = 0.74896.
Statistica e
biometria
10000 lanci
D. Bertacchi
Media
campionaria
Teorema del
limite centrale
Densità Exp
Φ(x )
Bernoulli(0.5)
Bernoulli(0.2)
Applicazione
Se lancio 10000 volte una moneta equilibrata, qual è la
probabilità che escano meno di 4900 teste? e più di 5300?
E che la differenza con 5000 superi 50?
Chebychev
Esempi
Legge dei
grandi numeri
Applicazione
Approfondiamo
P(B(10000, 0.5) < 4900) ≈ P(N (5000, 2500) < 4900)
P(B(10000, 0.5) > 5300) ≈ P(N (5000, 2500)) > 5300)
P(|B(10000, 0.5) − 500| > 50)
≈ P(|N (5000, 2500) − 5000| > 50)
Statistica e
biometria
Calcoliamo
D. Bertacchi
Media
campionaria
Teorema del
limite centrale
Densità Exp
Φ(x )
Bernoulli(0.5)
Bernoulli(0.2)
Applicazione
Chebychev
P(B(10000, 0.5) < 4900) ≈ P(N (5000, 2500) < 4900)
4900 − 5000
√
) = Φ(−2)
= P(N (0, 1) <
2500
= 1 − 0.97725 = 0.02275.
Esempi
Legge dei
grandi numeri
Applicazione
Approfondiamo
P(B(1000, 0.5) > 5300) ≈ P(N (5000, 2500)) > 5300)
5300 − 5000
√
= P(N (0, 1) >
) = 1 − Φ(6) ≈ 0
2500
P(|B(10000, 0.5) − 5000| > 5)
≈ P(|N (5000, 2500) − 5000| > 50)
50
) = 2(1 − Φ(1))
= P(|N (0, 1)| > √
2500
= 2 · (1 − 0.84134) = 0.31732.
Statistica e
biometria
D. Bertacchi
Media
campionaria
Teorema del
limite centrale
Media e varianza cosa dicono?
Ricordiamo: se X è una v.a.
E(X ) è un indice di posizione, Var(X ) un indice di
dispersione.
Densità Exp
Φ(x )
Bernoulli(0.5)
Bernoulli(0.2)
Applicazione
Chebychev
Esempi
Vogliamo ora quantificare il significato di “varianza = misura
della dispersione”: la disuguaglianza di Chebychev è quello
che ci serve.
Legge dei
grandi numeri
Applicazione
Approfondiamo
Pafnuty Lvovich Chebychev (1821-1894)
Statistica e
biometria
D. Bertacchi
Disuguaglianza di Chebychev
Media
campionaria
Teorema del
limite centrale
Densità Exp
Φ(x )
Bernoulli(0.5)
Bernoulli(0.2)
Applicazione
Disuguaglianza di Chebychev
Sia X una v.a. con E(X )=µ e Var(X )=σ 2 . Sia δ un numero
reale positivo prefissato. Vale la seguente disuguaglianza:
Chebychev
Esempi
Legge dei
grandi numeri
Applicazione
Approfondiamo
P(|X − µ| ≥ δσ) ≤
1
δ2
o equivalentemente
P(|X − µ| < δσ) ≥ 1 −
1
.
δ2
Statistica e
biometria
La prima versione
D. Bertacchi
Media
campionaria
Teorema del
limite centrale
Densità Exp
Φ(x )
“Sciogliendo” il modulo in
Bernoulli(0.5)
Bernoulli(0.2)
Applicazione
Chebychev
P(|X − µ| ≥ δσ) ≤
1
δ2
Esempi
Legge dei
grandi numeri
Applicazione
e il fatto che (X ≥ µ + δσ) e (X ≤ µ − δσ) sono eventi
incompatibili otteniamo che
Approfondiamo
P(X ≥ µ + δσ) + P(X ≤ µ − δσ) ≤
1
δ2
Statistica e
biometria
La prima versione
D. Bertacchi
Media
campionaria
Significa che la probabilità che la v.a. X assuma valori
X
Teorema del
limite centrale
Densità Exp
Φ(x )
Bernoulli(0.5)
Bernoulli(0.2)
Applicazione
Chebychev
Esempi
Legge dei
grandi numeri
Applicazione
Approfondiamo
µ−δσ
µ
µ+δσ
µ−δσ
µ
µ+δσ
oppure
X
è minore di
1
.
δ2
Statistica e
biometria
La seconda versione
D. Bertacchi
Media
campionaria
Teorema del
limite centrale
Densità Exp
Φ(x )
Bernoulli(0.5)
“Sciogliendo” il modulo in
Bernoulli(0.2)
Applicazione
P(|X − µ| < δσ) ≥ 1 −
Chebychev
Esempi
Legge dei
grandi numeri
1
δ2
otteniamo che
Applicazione
Approfondiamo
P(µ − δσ < X < µ + δσ) ≥ 1 −
1
δ2
Statistica e
biometria
La seconda versione
D. Bertacchi
Media
campionaria
Teorema del
limite centrale
Densità Exp
Φ(x )
Significa che la probabilità che la v.a. X assuma valori
Bernoulli(0.5)
Bernoulli(0.2)
X
Applicazione
Chebychev
Esempi
Legge dei
grandi numeri
Applicazione
Approfondiamo
µ−δσ
è maggiore o uguale a 1 −
µ
1
.
δ2
µ+δσ
Statistica e
biometria
D. Bertacchi
Chebychev con alcuni δ
Media
campionaria
Teorema del
limite centrale
Densità Exp
Φ(x )
Riscriviamo la seconda versione di Chebychev con
δ = 2, 3, 5, 10:
Bernoulli(0.5)
Bernoulli(0.2)
Applicazione
Chebychev
Esempi
Legge dei
grandi numeri
Applicazione
Approfondiamo
1
= 0.75
4
1
P(µ − 3σ < X < µ + 3σ) ≥ 1 − = 0.88
9
1
= 0.96
P(µ − 5σ < X < µ + 5σ) ≥ 1 −
25
1
P(µ − 10σ < X < µ + 10σ) ≥ 1 −
= 0.99
100
P(µ − 2σ < X < µ + 2σ) ≥ 1 −
Statistica e
biometria
Significato
D. Bertacchi
Media
campionaria
Teorema del
limite centrale
Densità Exp
Φ(x )
Bernoulli(0.5)
Bernoulli(0.2)
Applicazione
Chebychev
Esempi
Legge dei
grandi numeri
Applicazione
Approfondiamo
Ad esempio con δ = 5 abbiamo che con una probabilità
almeno del 96% X assume valori nell’intervallo
[µ − 5σ, µ + 5σ]; con una probabilità al massimo del 4% X
assume valori fuori da quell’intervallo.
Cosa mi dice Chebychev
Non so prevedere esattamente il valore di X (perché è una
v.a.), MA ho un intervallo di valori in cui è molto probabile
che si trovi il valore che X assumerà.
Statistica e
biometria
D. Bertacchi
Varianza=dispersione
Media
campionaria
Teorema del
limite centrale
Densità Exp
Φ(x )
Bernoulli(0.5)
P(µ − δσ < X < µ + δσ) ≥ 1 −
1
δ2
Bernoulli(0.2)
Applicazione
Chebychev
Esempi
Legge dei
grandi numeri
Come influisce la varianza σ 2
La probabilità (almeno 1 − δ12 ) è fissata se scelgo δ, ma
quanto è largo l’intervallo dipende da σ 2 .
Applicazione
Approfondiamo
µ−δσ
µ
µ+δσ
Statistica e
biometria
Esempi con varianze diverse
D. Bertacchi
Media
campionaria
Teorema del
limite centrale
Densità Exp
Φ(x )
Bernoulli(0.5)
Bernoulli(0.2)
Applicazione
Chebychev
Esempi
Sia X v.a. con E(X ) = 2 e Var(X ) = 1 e sia Y v.a. con
E(Y ) = 2 e Var(Y ) = 4.
Cerchiamo un intervallo in cui X assuma valori con
probabilità ≥ 0.96 e idem per Y .
Per X :
Legge dei
grandi numeri
2−5=−3
Applicazione
µ =2
2+5=7
Approfondiamo
Per Y :
2−5*2=−8
µ =2
2+5*2=12
Statistica e
biometria
D. Bertacchi
Differenze
Media
campionaria
Teorema del
limite centrale
Densità Exp
Φ(x )
Bernoulli(0.5)
Bernoulli(0.2)
Applicazione
Chebychev
Esempi
Legge dei
grandi numeri
Applicazione
Approfondiamo
Il centro dell’intervallo è lo stesso, ma fissata la probabilità
l’intervallo è più ampio per la v.a. con varianza maggiore.
Varianza come misura dell’incertezza
Una varianza maggiore mi dà maggiore incertezza sull’esito
dell’esperimento “qual è il valore assunto da X ”. L’idea è resa
quantitativa da Chebychev.
Statistica e
biometria
La legge dei grandi numeri
D. Bertacchi
Media
campionaria
Teorema del
limite centrale
Densità Exp
Φ(x )
Bernoulli(0.5)
Bernoulli(0.2)
Applicazione
Legge dei grandi numeri
Siano X1 , X2 , . . . , Xn v.a. indipendenti e identicamente distribuite. Sia E(Xi ) = µ e Var(Xi ) = σ 2 per ogni i. Allora per
ogni ε > 0 vale
Chebychev
Esempi
P(|X n − µ| > ε) → 0 per n → ∞.
Legge dei
grandi numeri
Applicazione
Approfondiamo
Ricordiamo
Che tutti i valori attesi e tutte le varianze siano uguali è implicito nella
richiesta identicamente distribuite. Quello che specifichiamo nelle ipotesi
è che chiamiamo µ e σ 2 rispettivamente il valore atteso e la varianza.
P
X n è la media campionaria cioè n1 ni=1 Xi .
Statistica e
biometria
Dimostrazione
D. Bertacchi
Applichiamo la disuguaglianza di Chebychev alla v.a. X n :
„
«
q
1
P |X n − E(X n )| ≥ δ Var(X n ) ≤ 2 per ogni δ > 0.
δ
Media
campionaria
Teorema del
limite centrale
Densità Exp
Φ(x )
Bernoulli(0.5)
Bernoulli(0.2)
Applicazione
Chebychev
Esempi
Legge dei
grandi numeri
Applicazione
Ci serve il calcolo di E(X n ) e di Var(X n ), si fa utilizzando le proprietà di
valore atteso e varianza:
!
!
n
n
X
1X
1
Xi = E
Xi
E(X n ) = E
n
n
i=1
i=1
n
n
1X
1X
E(Xi ) =
µ = µ.
=
n
n
i=1
Approfondiamo
Var(X n ) = Var
i=1
n
1X
Xi
n
i=1
!
n
=
X
1
Xi )
Var(
2
n
i=1
n
n
1 X 2
σ2
1 X
Var(Xi ) = 2
σ =
.
= 2
n
n
n
i=1
i=1
Statistica e
biometria
Dimostrazione
D. Bertacchi
Applichiamo la disuguaglianza di Chebychev alla v.a. X n :
„
«
q
1
P |X n − E(X n )| ≥ δ Var(X n ) ≤ 2 per ogni δ > 0.
δ
Media
campionaria
Teorema del
limite centrale
Densità Exp
Φ(x )
Bernoulli(0.5)
Bernoulli(0.2)
Applicazione
Chebychev
Esempi
Legge dei
grandi numeri
Applicazione
Approfondiamo
2
Ora abbiamo E(X n ) = µ e Var(X n ) = σn .
„
«
σ
1
P |X n − µ)| ≥ δ √
≤ 2 per ogni δ > 0.
δ
n
√
Scegliamo δ = ε n/σ (in modo che δ √σn = ε):
“
”
σ2
P |X n − µ| ≥ ε ≤ 2
ε n
Per n → ∞ si ottiene la tesi.
per ogni ε > 0
Statistica e
biometria
Significato
D. Bertacchi
Media
campionaria
Teorema del
limite centrale
Densità Exp
Φ(x )
Bernoulli(0.5)
Bernoulli(0.2)
Applicazione
Chebychev
Esempi
Legge dei
grandi numeri
Applicazione
Approfondiamo
P(|X n − µ| > ε) → 0 per n → ∞.
Scelgo ε. Confronto la media campionaria X n con µ (che è
il valore atteso di ciascuna Xi ).
La probabilità che la distanza fra le due superi ε è
trascurabile (≈ 0) se n è abbastanza grande.
=⇒ La probabilità che X n cada fuori dall’intervallo colorato
in figura è trascurabile (≈ 0) se n è abbastanza grande.
=⇒ La probabilità che X n cada dentro l’intervallo colorato in
figura è ≈ 1 se n è abbastanza grande.
µ−ε
µ
µ+ε
Statistica e
biometria
Applicazione
D. Bertacchi
Media
campionaria
Teorema del
limite centrale
Densità Exp
Φ(x )
Bernoulli(0.5)
Bernoulli(0.2)
Applicazione
Chebychev
Esempi
Legge dei
grandi numeri
Applicazione
Supponiamo di avere un “tipo” di v.a. (ovvero una legge) con
valore atteso µ, e facciamo n osservazioni indipendenti di
quel tipo. Significa che consideriamo n v.a. i.i.d. X1 , . . . , Xn .
La legge dei grandi numeri dice che il valore osservato per
X n con grande probabilità è vicino a µ.
Applicazione
Approfondiamo
Se non conosco µ, posso stimarla con X n .
Se n è grande, la probabilità che i due valori siano “molto
diversi” è quasi zero.
Statistica e
biometria
D. Bertacchi
Media
campionaria
Media teorica ≈ media
osservata
Teorema del
limite centrale
Densità Exp
Φ(x )
Bernoulli(0.5)
Bernoulli(0.2)
Applicazione
Chebychev
Esempi
In pratica confrontiamo µ, media teorica di ciascuna
osservazione, con X n media osservata.
La legge dei grandi numeri rende precisa l’affermazione
Legge dei
grandi numeri
Applicazione
Approfondiamo
µ ≈ X n.
Nella pratica µ non si conosce, ma si stima con la media di
(molti) esperimenti.
Statistica e
biometria
Caso B(p)
D. Bertacchi
Media
campionaria
Teorema del
limite centrale
Densità Exp
Φ(x )
Bernoulli(0.5)
Bernoulli(0.2)
Applicazione
Sia A un evento di cui non conosco la probabilità. Posso
fare n esperimenti e porre Xi = 1 se nell’esperimento
i-esimo si è verificato A (=il caso ha pescato un caso da A),
Xi = 0 altrimenti.
Le v.a. Xi sono B(p) dove p = P(A). La legge dei grandi
numeri dice che (nel senso dell’enunciato rigoroso...)
Chebychev
n
Esempi
Legge dei
grandi numeri
Applicazione
Approfondiamo
Xn =
1 X n→∞
Xi → E(X1 ).
n
i=1
Ma la somma delle Xi è il numero di volte che ho osservato
A nei miei esperimenti, dunque X n è la frequenza relativa di
A, mentre E(X1 ) = p.
In altre parole, ecco che la casalinga di Voghera aveva
ragione:
n→∞
frequenza con cui osservo A in n esperimenti → P(A).
Statistica e
biometria
Quanto grande n?
D. Bertacchi
Media
campionaria
Teorema del
limite centrale
Dalla dimostrazione della legge dei grandi numeri ricaviamo
un’altra informazione:
σ2
P |X n − µ| ≥ ε ≤ 2
ε n
Densità Exp
Φ(x )
Bernoulli(0.5)
Bernoulli(0.2)
Applicazione
Chebychev
Esempi
Legge dei
grandi numeri
per ogni ε > 0
quindi se fisso ε e η e voglio che la probabilità che X n disti
più di ε da µ sia ≤ η basta scegliere n in modo che
σ2
=η
ε2 n
Applicazione
Approfondiamo
ovvero
n=
σ2
.
ε2 η
Notate che n è direttamente proporzionale a σ 2 e
inversamente proporzionale a ε2 e η.