Statistica e biometria D. Bertacchi La media campionaria Media campionaria Teorema del limite centrale Densità Exp Φ(x ) Bernoulli(0.5) MEDIA CAMPIONARIA Date n v.a. X1 , . . . , Xn indipendenti e identicamente distribuite (in breve i.i.d.), la v.a. Bernoulli(0.2) Applicazione Chebychev Esempi n Xn = Legge dei grandi numeri i=1 Applicazione Approfondiamo 1X Xi , n è detta media campionaria. In altre parole, se le X1 , . . . , Xn sono il risultato di n misurazioni (indipendenti) di una stessa quantità (aleatoria), la media campionaria è la media aritmetica di queste misurazioni. Statistica e biometria D. Bertacchi La media campionaria Media campionaria Teorema del limite centrale Densità Exp Φ(x ) Bernoulli(0.5) Bernoulli(0.2) Applicazione Chebychev Esempi Legge dei grandi numeri Applicazione Approfondiamo È naturale chiedersi alcune cose su X n : • posso dire che legge ha? • c’entra qualcosa con E(X )? Alla prima domanda rispondiamo che in generale non si è semplice conoscere la legge di X n , ma se n è grande e ci si accontenta di un’approssimazione, il Teorema del Limite Centrale dà una risposta. Alla seconda domanda risponderà la legge dei grandi numeri. Statistica e biometria Su E(X1) ←→ X n D. Bertacchi Media campionaria Teorema del limite centrale Densità Exp Notiamo fin d’ora: se i valori che ognuna delle v.a. può assumere sono, ad esempio, v1 , v2 , v3 , v4 e fX1 (v1 ) = p1 , fX1 (v2 ) = p2 , fX1 (v3 ) = p3 , fX1 (v4 ) = p4 , allora Φ(x ) Bernoulli(0.5) Bernoulli(0.2) Applicazione Chebychev Esempi Legge dei grandi numeri Applicazione Approfondiamo Xn = 1 (v1 · num. di volte che v1 è presente nei dati n + v2 · num. di volte che v2 è presente nei dati + v3 · num. di volte che v3 è presente nei dati + v4 · num. di volte che v4 è presente nei dati) =v1 · freq.rel. di v1 + v2 · freq.rel. di v2 + v3 · freq.rel. di v3 + v4 · freq.rel. di v4 ) ≈v1 · p1 + v2 · p2 + v3 · p3 + v4 · p4 = E(X1 ). Quindi X n ≈ E(X1 ) se pensiamo che le frequenze relative ≈ probabilità. Statistica e biometria Su E(X1) ←→ X n D. Bertacchi Media campionaria Teorema del limite centrale Densità Exp Φ(x ) Bernoulli(0.5) Bernoulli(0.2) Applicazione Chebychev Esempi Legge dei grandi numeri Applicazione Approfondiamo È dunque piuttosto naturale dire che, SE frequenze relative ≈ probabilità ALLORA ANCHE X n ≈ E(X1 ). L’idea di fondo è che “frequenze relative 6≈ probabilità” sia un fatto improbabile se n è grande. L’affermazione precisa è la legge dei grandi numeri che vedremo a breve. Statistica e biometria D. Bertacchi Il teorema del limite centrale Media campionaria Teorema del limite centrale Densità Exp Φ(x ) Bernoulli(0.5) Bernoulli(0.2) Applicazione Teorema Sia {Xi }i≥1 una successione di v.a. i.i.d. tutte con valore atteso E(Xi ) = µ e varianza finita Var(Xi ) = σ 2 > 0. Sia Chebychev Esempi Legge dei grandi numeri Sn∗ = Applicazione Approfondiamo Xn − µ √ . σ/ n Allora per ogni t ∈ R vale n→+∞ P(Sn∗ ≤ t) −→ Φ(t). Statistica e biometria Significato D. Bertacchi Media campionaria Teorema del limite centrale Densità Exp Sn∗ = Xn − µ √ . σ/ n è la standardizzata della media campionaria, Φ(x ) Bernoulli(0.5) Bernoulli(0.2) infatti Applicazione Chebychev Esempi n E(X n ) = E Legge dei grandi numeri i=1 Applicazione Approfondiamo 1X Xi n = n 1X n n = 1X E(Xi ) n i=1 µ = µ. i=1 n Var(X n ) = Var ! 1X Xi n i=1 ! = n 1 X 2 σ2 . σ = = 2 n n i=1 n 1 X Var(Xi ) n2 i=1 Statistica e biometria Significato D. Bertacchi Media campionaria Teorema del limite centrale Densità Exp Φ(x ) Bernoulli(0.5) Bernoulli(0.2) Applicazione Chebychev Esempi Legge dei grandi numeri Applicazione Approfondiamo n→+∞ P(Sn∗ ≤ t) −→ Φ(t) = P(N (0, 1) ≤ t). ci dice la legge di Sn∗ si approssima, per n grande, con quella di una N (0, 1). In altre parole, se vogliamo calcolare probabilità relative a Sn∗ possiamo utilizzare quelle relative a N (0, 1) come approssimazione. Statistica e biometria Approssimazione normale D. Bertacchi Media campionaria Teorema del limite centrale qui con ≈ indichiamo l’approssimazione delle probabilità di cui abbiamo appena discusso: Sn∗ ≈ N (0, 1) Densità Exp Φ(x ) Bernoulli(0.5) X n ≈ N (µ, σ 2 /n) Bernoulli(0.2) Applicazione X1 + · · · + Xn ≈ N (nµ, nσ 2 ) Chebychev Esempi Legge dei grandi numeri Applicazione Approfondiamo Pro Questa approssimazione vale qualsiasi sia la legge delle X1 , . . . , Xn . Contro È un’approssimazione e vale solo se n è sufficientemente grande, ma quanto grande dipende dalla legge delle X1 , . . . , Xn . Statistica e biometria D. Bertacchi Quando vale l’approssimazione Media campionaria Teorema del limite centrale Densità Exp Φ(x ) Bernoulli(0.5) Bernoulli(0.2) Applicazione Chebychev Esempi Legge dei grandi numeri Applicazione Approfondiamo In generale, se la legge delle X1 , . . . , Xn non è troppo asimmetrica, a livello empirico si considera che n = 30 sia abbastanza grande. Se invece la legge di ciascuna Xi è B(p), l’approssimazione normale si considera valida se sia np che n(1 − p) sono ≥ 5. Statistica e biometria D. Bertacchi Media campionaria Teorema del limite centrale Densità Exp Φ(x ) Bernoulli(0.5) Grafici di approssimazione Prendiamo come esempio una successione di v.a. Xi di tipo esponenziale (non è importante qui sapere come sono definite) e confrontiamo il grafico della densità della standardizzata di X n con quello di N (0, 1): Bernoulli(0.2) Applicazione Chebychev 0,4 Esempi Legge dei grandi numeri 0,3 Applicazione Approfondiamo 0,2 0,1 0 -3 -2 -1 0 1 2 x S_10^* S_5^* N(0,1) 3 Statistica e biometria D. Bertacchi Media campionaria Teorema del limite centrale Densità Exp Grafici di approssimazione In realtà il teorema confronta le aree e non le curve, ma poiché siamo abituati a vedere la campana della densità N (0, 1) guardiamo questi grafici: Φ(x ) Bernoulli(0.5) Bernoulli(0.2) 0,4 Applicazione Chebychev Esempi 0,3 Legge dei grandi numeri Applicazione 0,2 Approfondiamo 0,1 0 -3 -2 -1 0 1 N(0,1) S_50^* S_20^* 2 3 Statistica e biometria D. Bertacchi Media campionaria Teorema del limite centrale Grafici di approssimazione Vediamo infine tutte le densità: quella di N (0, 1) e quelle di ∗ , S∗ , S∗ . S5∗ , S10 50 20 Densità Exp Φ(x ) Bernoulli(0.5) 0,4 Bernoulli(0.2) Applicazione Chebychev 0,3 Esempi Legge dei grandi numeri 0,2 Applicazione Approfondiamo 0,1 0 -3 -2 -1 0 1 2 x S_5^* N(0,1) S_10^* S_50^* S_20^* 3 Statistica e biometria D. Bertacchi Media campionaria Teorema del limite centrale Grafici di approssimazione Invece della densità, guardiamo ora il grafico della funzione x 7→ P(N (0, 1) ≤ x) = Φ(x) Densità Exp Φ(x ) Bernoulli(0.5) Bernoulli(0.2) 1 Applicazione Chebychev 0,8 Esempi Legge dei grandi numeri 0,6 Applicazione Approfondiamo 0,4 0,2 0 -3 -2 -1 0 1 P(N(0,1)<x) 2 3 Statistica e biometria D. Bertacchi Media campionaria Teorema del limite centrale Grafici di approssimazione Confrontiamo con gli analoghi grafici per le medie ∗ ): campionarie standardizzate di prima (S5∗ e S10 Densità Exp Φ(x ) Bernoulli(0.5) 1 Bernoulli(0.2) Applicazione 0,8 Chebychev Esempi Legge dei grandi numeri 0,6 Applicazione 0,4 Approfondiamo 0,2 0 -3 -2 -1 0 1 x P(S_5^*<x) P(N(0,1)<x) P(S_10^*<x) 2 3 Statistica e biometria Grafici di approssimazione D. Bertacchi Media campionaria Teorema del limite centrale Consideriamo ora X1 , X2 , X3 , X4 , X5 indipendenti e ciascuna con legge B(0.5). Sia S5 = X1 + X2 + X3 + X4 + X5 e guardiamo il grafico della funzione Densità Exp x 7→ P(S5 ≤ x) Φ(x ) Bernoulli(0.5) Bernoulli(0.2) Applicazione Chebychev 1 Esempi Legge dei grandi numeri 0,8 Applicazione Approfondiamo 0,6 0,4 0,2 0 1 2 3 4 5 6 Statistica e biometria D. Bertacchi Media campionaria Teorema del limite centrale Grafici di approssimazione Standardizziamo S5 e guardiamo il grafico di P(S5∗ ≤ x) Densità Exp Φ(x ) 1 Bernoulli(0.5) Bernoulli(0.2) Applicazione 0,8 Chebychev Esempi Legge dei grandi numeri 0,6 Applicazione Approfondiamo 0,4 0,2 -2 -1 0 1 2 3 Statistica e biometria D. Bertacchi Media campionaria Teorema del limite centrale Grafici di approssimazione Confrontiamo il grafico di P(S5∗ ≤ x) e quello di P(N (0, 1) ≤ x): Densità Exp Φ(x ) Bernoulli(0.5) 1 Bernoulli(0.2) Applicazione Chebychev 0,8 Esempi Legge dei grandi numeri 0,6 Applicazione Approfondiamo 0,4 0,2 0 -2 -1 0 1 2 3 Statistica e biometria D. Bertacchi Media campionaria Teorema del limite centrale Grafici di approssimazione ∗ ≤ x) e quello di Confrontiamo il grafico di P(S10 P(N (0, 1) ≤ x): Densità Exp Φ(x ) Bernoulli(0.5) 1 Bernoulli(0.2) Applicazione Chebychev 0,8 Esempi Legge dei grandi numeri 0,6 Applicazione Approfondiamo 0,4 0,2 0 -3 -2 -1 0 1 2 3 Statistica e biometria Grafici di approssimazione D. Bertacchi Media campionaria Teorema del limite centrale ∗ ≤ x) e quello di Confrontiamo il grafico di P(S30 P(N (0, 1) ≤ x): Densità Exp Φ(x ) Bernoulli(0.5) 1 Bernoulli(0.2) Applicazione Chebychev 0,8 Esempi Legge dei grandi numeri 0,6 Applicazione Approfondiamo 0,4 0,2 0 -4 -2 0 2 4 Statistica e biometria D. Bertacchi Media campionaria Teorema del limite centrale Grafici di approssimazione Prendiamo ora delle B(0.2): confrontiamo il grafico di P(S5∗ ≤ x) e quello di P(N (0, 1) ≤ x): Densità Exp Φ(x ) Bernoulli(0.5) 1 Bernoulli(0.2) Applicazione Chebychev 0,8 Esempi Legge dei grandi numeri 0,6 Applicazione Approfondiamo 0,4 0,2 0 -2 -1 0 1 2 3 Statistica e biometria D. Bertacchi Media campionaria Teorema del limite centrale Grafici di approssimazione ∗ ≤ x) e quello di Confrontiamo il grafico di P(S10 P(N (0, 1) ≤ x): Densità Exp Φ(x ) Bernoulli(0.5) 1 Bernoulli(0.2) Applicazione Chebychev 0,8 Esempi Legge dei grandi numeri 0,6 Applicazione Approfondiamo 0,4 0,2 0 -3 -2 -1 0 1 2 3 Statistica e biometria Grafici di approssimazione D. Bertacchi Media campionaria Teorema del limite centrale ∗ ≤ x) e quello di Confrontiamo il grafico di P(S30 P(N (0, 1) ≤ x): Densità Exp Φ(x ) Bernoulli(0.5) 1 Bernoulli(0.2) Applicazione Chebychev 0,8 Esempi Legge dei grandi numeri 0,6 Applicazione Approfondiamo 0,4 0,2 0 -4 -2 0 2 4 Statistica e biometria D. Bertacchi La binomiale Media campionaria Teorema del limite centrale Densità Exp Φ(x ) Bernoulli(0.5) Una delle approssimazioni normali viste è Bernoulli(0.2) Applicazione Chebychev Esempi Legge dei grandi numeri Applicazione X1 + · · · + Xn ≈ N (nµ, nσ 2 ) poiché una B(n, p) può essere vista come somma di n B(p) indipendenti ne ricaviamo Approfondiamo B(n, p) ≈ N (np, np(1 − p)). Statistica e biometria D. Bertacchi La moneta Media campionaria Teorema del limite centrale Densità Exp Φ(x ) Bernoulli(0.5) Bernoulli(0.2) Applicazione Chebychev Se lancio 1000 volte una moneta equilibrata, qual è la probabilità che escano meno di 490 teste? e più di 530? E che la differenza con 500 superi 5? Esempi Legge dei grandi numeri Applicazione Approfondiamo P(B(1000, 0.5) < 490) ≈ P(N (500, 250) < 490) P(B(1000, 0.5) > 530) ≈ P(N (500, 250)) > 530) P(|B(1000, 0.5) − 500| > 5) ≈ P(|N (500, 250) − 500| > 5) Statistica e biometria D. Bertacchi Calcoliamo Media campionaria Teorema del limite centrale Densità Exp Φ(x ) Bernoulli(0.5) Bernoulli(0.2) Applicazione Chebychev P(B(1000, 0.5) < 490) ≈ P(N (500, 250) < 490) 490 − 500 = P(N (0, 1) < √ ) = Φ(−0.63) 250 = 1 − 0.73565 = 0.26435. Esempi Legge dei grandi numeri Applicazione Approfondiamo P(B(1000, 0.5) > 530) ≈ P(N (500, 250)) > 530) 530 − 500 ) = 1 − Φ(1.90) = P(N (0, 1) > √ 250 = 1 − 0.97128 = 0.02872. P(|B(1000, 0.5) − 500| > 5) ≈ P(|N (500, 250) − 500| > 5) 5 ) = 2(1 − Φ(0.32)) = P(|N (0, 1)| > √ 250 = 2 · (1 − 0.62552) = 0.74896. Statistica e biometria 10000 lanci D. Bertacchi Media campionaria Teorema del limite centrale Densità Exp Φ(x ) Bernoulli(0.5) Bernoulli(0.2) Applicazione Se lancio 10000 volte una moneta equilibrata, qual è la probabilità che escano meno di 4900 teste? e più di 5300? E che la differenza con 5000 superi 50? Chebychev Esempi Legge dei grandi numeri Applicazione Approfondiamo P(B(10000, 0.5) < 4900) ≈ P(N (5000, 2500) < 4900) P(B(10000, 0.5) > 5300) ≈ P(N (5000, 2500)) > 5300) P(|B(10000, 0.5) − 500| > 50) ≈ P(|N (5000, 2500) − 5000| > 50) Statistica e biometria Calcoliamo D. Bertacchi Media campionaria Teorema del limite centrale Densità Exp Φ(x ) Bernoulli(0.5) Bernoulli(0.2) Applicazione Chebychev P(B(10000, 0.5) < 4900) ≈ P(N (5000, 2500) < 4900) 4900 − 5000 √ ) = Φ(−2) = P(N (0, 1) < 2500 = 1 − 0.97725 = 0.02275. Esempi Legge dei grandi numeri Applicazione Approfondiamo P(B(1000, 0.5) > 5300) ≈ P(N (5000, 2500)) > 5300) 5300 − 5000 √ = P(N (0, 1) > ) = 1 − Φ(6) ≈ 0 2500 P(|B(10000, 0.5) − 5000| > 5) ≈ P(|N (5000, 2500) − 5000| > 50) 50 ) = 2(1 − Φ(1)) = P(|N (0, 1)| > √ 2500 = 2 · (1 − 0.84134) = 0.31732. Statistica e biometria D. Bertacchi Media campionaria Teorema del limite centrale Media e varianza cosa dicono? Ricordiamo: se X è una v.a. E(X ) è un indice di posizione, Var(X ) un indice di dispersione. Densità Exp Φ(x ) Bernoulli(0.5) Bernoulli(0.2) Applicazione Chebychev Esempi Vogliamo ora quantificare il significato di “varianza = misura della dispersione”: la disuguaglianza di Chebychev è quello che ci serve. Legge dei grandi numeri Applicazione Approfondiamo Pafnuty Lvovich Chebychev (1821-1894) Statistica e biometria D. Bertacchi Disuguaglianza di Chebychev Media campionaria Teorema del limite centrale Densità Exp Φ(x ) Bernoulli(0.5) Bernoulli(0.2) Applicazione Disuguaglianza di Chebychev Sia X una v.a. con E(X )=µ e Var(X )=σ 2 . Sia δ un numero reale positivo prefissato. Vale la seguente disuguaglianza: Chebychev Esempi Legge dei grandi numeri Applicazione Approfondiamo P(|X − µ| ≥ δσ) ≤ 1 δ2 o equivalentemente P(|X − µ| < δσ) ≥ 1 − 1 . δ2 Statistica e biometria La prima versione D. Bertacchi Media campionaria Teorema del limite centrale Densità Exp Φ(x ) “Sciogliendo” il modulo in Bernoulli(0.5) Bernoulli(0.2) Applicazione Chebychev P(|X − µ| ≥ δσ) ≤ 1 δ2 Esempi Legge dei grandi numeri Applicazione e il fatto che (X ≥ µ + δσ) e (X ≤ µ − δσ) sono eventi incompatibili otteniamo che Approfondiamo P(X ≥ µ + δσ) + P(X ≤ µ − δσ) ≤ 1 δ2 Statistica e biometria La prima versione D. Bertacchi Media campionaria Significa che la probabilità che la v.a. X assuma valori X Teorema del limite centrale Densità Exp Φ(x ) Bernoulli(0.5) Bernoulli(0.2) Applicazione Chebychev Esempi Legge dei grandi numeri Applicazione Approfondiamo µ−δσ µ µ+δσ µ−δσ µ µ+δσ oppure X è minore di 1 . δ2 Statistica e biometria La seconda versione D. Bertacchi Media campionaria Teorema del limite centrale Densità Exp Φ(x ) Bernoulli(0.5) “Sciogliendo” il modulo in Bernoulli(0.2) Applicazione P(|X − µ| < δσ) ≥ 1 − Chebychev Esempi Legge dei grandi numeri 1 δ2 otteniamo che Applicazione Approfondiamo P(µ − δσ < X < µ + δσ) ≥ 1 − 1 δ2 Statistica e biometria La seconda versione D. Bertacchi Media campionaria Teorema del limite centrale Densità Exp Φ(x ) Significa che la probabilità che la v.a. X assuma valori Bernoulli(0.5) Bernoulli(0.2) X Applicazione Chebychev Esempi Legge dei grandi numeri Applicazione Approfondiamo µ−δσ è maggiore o uguale a 1 − µ 1 . δ2 µ+δσ Statistica e biometria D. Bertacchi Chebychev con alcuni δ Media campionaria Teorema del limite centrale Densità Exp Φ(x ) Riscriviamo la seconda versione di Chebychev con δ = 2, 3, 5, 10: Bernoulli(0.5) Bernoulli(0.2) Applicazione Chebychev Esempi Legge dei grandi numeri Applicazione Approfondiamo 1 = 0.75 4 1 P(µ − 3σ < X < µ + 3σ) ≥ 1 − = 0.88 9 1 = 0.96 P(µ − 5σ < X < µ + 5σ) ≥ 1 − 25 1 P(µ − 10σ < X < µ + 10σ) ≥ 1 − = 0.99 100 P(µ − 2σ < X < µ + 2σ) ≥ 1 − Statistica e biometria Significato D. Bertacchi Media campionaria Teorema del limite centrale Densità Exp Φ(x ) Bernoulli(0.5) Bernoulli(0.2) Applicazione Chebychev Esempi Legge dei grandi numeri Applicazione Approfondiamo Ad esempio con δ = 5 abbiamo che con una probabilità almeno del 96% X assume valori nell’intervallo [µ − 5σ, µ + 5σ]; con una probabilità al massimo del 4% X assume valori fuori da quell’intervallo. Cosa mi dice Chebychev Non so prevedere esattamente il valore di X (perché è una v.a.), MA ho un intervallo di valori in cui è molto probabile che si trovi il valore che X assumerà. Statistica e biometria D. Bertacchi Varianza=dispersione Media campionaria Teorema del limite centrale Densità Exp Φ(x ) Bernoulli(0.5) P(µ − δσ < X < µ + δσ) ≥ 1 − 1 δ2 Bernoulli(0.2) Applicazione Chebychev Esempi Legge dei grandi numeri Come influisce la varianza σ 2 La probabilità (almeno 1 − δ12 ) è fissata se scelgo δ, ma quanto è largo l’intervallo dipende da σ 2 . Applicazione Approfondiamo µ−δσ µ µ+δσ Statistica e biometria Esempi con varianze diverse D. Bertacchi Media campionaria Teorema del limite centrale Densità Exp Φ(x ) Bernoulli(0.5) Bernoulli(0.2) Applicazione Chebychev Esempi Sia X v.a. con E(X ) = 2 e Var(X ) = 1 e sia Y v.a. con E(Y ) = 2 e Var(Y ) = 4. Cerchiamo un intervallo in cui X assuma valori con probabilità ≥ 0.96 e idem per Y . Per X : Legge dei grandi numeri 2−5=−3 Applicazione µ =2 2+5=7 Approfondiamo Per Y : 2−5*2=−8 µ =2 2+5*2=12 Statistica e biometria D. Bertacchi Differenze Media campionaria Teorema del limite centrale Densità Exp Φ(x ) Bernoulli(0.5) Bernoulli(0.2) Applicazione Chebychev Esempi Legge dei grandi numeri Applicazione Approfondiamo Il centro dell’intervallo è lo stesso, ma fissata la probabilità l’intervallo è più ampio per la v.a. con varianza maggiore. Varianza come misura dell’incertezza Una varianza maggiore mi dà maggiore incertezza sull’esito dell’esperimento “qual è il valore assunto da X ”. L’idea è resa quantitativa da Chebychev. Statistica e biometria La legge dei grandi numeri D. Bertacchi Media campionaria Teorema del limite centrale Densità Exp Φ(x ) Bernoulli(0.5) Bernoulli(0.2) Applicazione Legge dei grandi numeri Siano X1 , X2 , . . . , Xn v.a. indipendenti e identicamente distribuite. Sia E(Xi ) = µ e Var(Xi ) = σ 2 per ogni i. Allora per ogni ε > 0 vale Chebychev Esempi P(|X n − µ| > ε) → 0 per n → ∞. Legge dei grandi numeri Applicazione Approfondiamo Ricordiamo Che tutti i valori attesi e tutte le varianze siano uguali è implicito nella richiesta identicamente distribuite. Quello che specifichiamo nelle ipotesi è che chiamiamo µ e σ 2 rispettivamente il valore atteso e la varianza. P X n è la media campionaria cioè n1 ni=1 Xi . Statistica e biometria Dimostrazione D. Bertacchi Applichiamo la disuguaglianza di Chebychev alla v.a. X n : „ « q 1 P |X n − E(X n )| ≥ δ Var(X n ) ≤ 2 per ogni δ > 0. δ Media campionaria Teorema del limite centrale Densità Exp Φ(x ) Bernoulli(0.5) Bernoulli(0.2) Applicazione Chebychev Esempi Legge dei grandi numeri Applicazione Ci serve il calcolo di E(X n ) e di Var(X n ), si fa utilizzando le proprietà di valore atteso e varianza: ! ! n n X 1X 1 Xi = E Xi E(X n ) = E n n i=1 i=1 n n 1X 1X E(Xi ) = µ = µ. = n n i=1 Approfondiamo Var(X n ) = Var i=1 n 1X Xi n i=1 ! n = X 1 Xi ) Var( 2 n i=1 n n 1 X 2 σ2 1 X Var(Xi ) = 2 σ = . = 2 n n n i=1 i=1 Statistica e biometria Dimostrazione D. Bertacchi Applichiamo la disuguaglianza di Chebychev alla v.a. X n : „ « q 1 P |X n − E(X n )| ≥ δ Var(X n ) ≤ 2 per ogni δ > 0. δ Media campionaria Teorema del limite centrale Densità Exp Φ(x ) Bernoulli(0.5) Bernoulli(0.2) Applicazione Chebychev Esempi Legge dei grandi numeri Applicazione Approfondiamo 2 Ora abbiamo E(X n ) = µ e Var(X n ) = σn . „ « σ 1 P |X n − µ)| ≥ δ √ ≤ 2 per ogni δ > 0. δ n √ Scegliamo δ = ε n/σ (in modo che δ √σn = ε): “ ” σ2 P |X n − µ| ≥ ε ≤ 2 ε n Per n → ∞ si ottiene la tesi. per ogni ε > 0 Statistica e biometria Significato D. Bertacchi Media campionaria Teorema del limite centrale Densità Exp Φ(x ) Bernoulli(0.5) Bernoulli(0.2) Applicazione Chebychev Esempi Legge dei grandi numeri Applicazione Approfondiamo P(|X n − µ| > ε) → 0 per n → ∞. Scelgo ε. Confronto la media campionaria X n con µ (che è il valore atteso di ciascuna Xi ). La probabilità che la distanza fra le due superi ε è trascurabile (≈ 0) se n è abbastanza grande. =⇒ La probabilità che X n cada fuori dall’intervallo colorato in figura è trascurabile (≈ 0) se n è abbastanza grande. =⇒ La probabilità che X n cada dentro l’intervallo colorato in figura è ≈ 1 se n è abbastanza grande. µ−ε µ µ+ε Statistica e biometria Applicazione D. Bertacchi Media campionaria Teorema del limite centrale Densità Exp Φ(x ) Bernoulli(0.5) Bernoulli(0.2) Applicazione Chebychev Esempi Legge dei grandi numeri Applicazione Supponiamo di avere un “tipo” di v.a. (ovvero una legge) con valore atteso µ, e facciamo n osservazioni indipendenti di quel tipo. Significa che consideriamo n v.a. i.i.d. X1 , . . . , Xn . La legge dei grandi numeri dice che il valore osservato per X n con grande probabilità è vicino a µ. Applicazione Approfondiamo Se non conosco µ, posso stimarla con X n . Se n è grande, la probabilità che i due valori siano “molto diversi” è quasi zero. Statistica e biometria D. Bertacchi Media campionaria Media teorica ≈ media osservata Teorema del limite centrale Densità Exp Φ(x ) Bernoulli(0.5) Bernoulli(0.2) Applicazione Chebychev Esempi In pratica confrontiamo µ, media teorica di ciascuna osservazione, con X n media osservata. La legge dei grandi numeri rende precisa l’affermazione Legge dei grandi numeri Applicazione Approfondiamo µ ≈ X n. Nella pratica µ non si conosce, ma si stima con la media di (molti) esperimenti. Statistica e biometria Caso B(p) D. Bertacchi Media campionaria Teorema del limite centrale Densità Exp Φ(x ) Bernoulli(0.5) Bernoulli(0.2) Applicazione Sia A un evento di cui non conosco la probabilità. Posso fare n esperimenti e porre Xi = 1 se nell’esperimento i-esimo si è verificato A (=il caso ha pescato un caso da A), Xi = 0 altrimenti. Le v.a. Xi sono B(p) dove p = P(A). La legge dei grandi numeri dice che (nel senso dell’enunciato rigoroso...) Chebychev n Esempi Legge dei grandi numeri Applicazione Approfondiamo Xn = 1 X n→∞ Xi → E(X1 ). n i=1 Ma la somma delle Xi è il numero di volte che ho osservato A nei miei esperimenti, dunque X n è la frequenza relativa di A, mentre E(X1 ) = p. In altre parole, ecco che la casalinga di Voghera aveva ragione: n→∞ frequenza con cui osservo A in n esperimenti → P(A). Statistica e biometria Quanto grande n? D. Bertacchi Media campionaria Teorema del limite centrale Dalla dimostrazione della legge dei grandi numeri ricaviamo un’altra informazione: σ2 P |X n − µ| ≥ ε ≤ 2 ε n Densità Exp Φ(x ) Bernoulli(0.5) Bernoulli(0.2) Applicazione Chebychev Esempi Legge dei grandi numeri per ogni ε > 0 quindi se fisso ε e η e voglio che la probabilità che X n disti più di ε da µ sia ≤ η basta scegliere n in modo che σ2 =η ε2 n Applicazione Approfondiamo ovvero n= σ2 . ε2 η Notate che n è direttamente proporzionale a σ 2 e inversamente proporzionale a ε2 e η.