Antonella Bodini Istituto di Matematica Applicata e Tecnologie Informatiche “E. Magenes” del CNR Materiale ad uso dei ricercatori che hanno seguito il corso di formazione interna in Statistica, edizione 2016. STATISTICA Inferenza Il campione e le v.a. Per fare inferenza su un certo valore di interesse di un’intera popolazione (es., l’altezza o la credenza nell’aldilà) utilizzando un campione è necessario fare delle ipotesi sui valori della popolazione e sul rapporto tra la popolazione ed il campione. Una ipotesi è che esista una distribuzione di probabilità di fondo per i valori di interesse dell’intera popolazione le variabili casuali che descrivono il valore di interesse dei vari membri della popolazione sono v.a. indipendenti “i.i.d” con la stessa distribuzione Ci stiamo mettendo prima della raccolta dei dati. Se ci interessa fare inferenza sull’altezza di una popolazione, possiamo fare l’ipotesi che nella popolazione ci sia gente un po’ più alta e un po’ più bassa, ma simmetricamente rispetto ad un valor medio ( ← ipotesi): indicata con ๐ l’altezza di una persona qualunque nella popolazione, stiamo dicendo (per ipotesi) che ๐~๐(๐, ๐ 2 ). E poi diciamo che scegliamo il nostro campione a caso nella popolazione (e non, tanto per dire, tra i giocatori di basket!): prima di raccogliere i dati, il campione è un generico vettore (๐1 , ๐2 , … , ๐๐ ). Inferenza La distribuzione è qualunque! non parametrica (distribution free) Parametrica: la distribuzione è Gaussiana, o Gamma, o Weibull, o una qualunque distribuzione con forma funzionale nota ma con parametri incogniti Inferenza per la media e la varianza della popolazione ๐1 , … , ๐๐ campione casuale (v.a. indipendenti, tutte con la stessa distribuzione) ๐ธ ๐1 + ๐2 + โฏ + ๐๐ = ๐๐ธ ๐1 ๐๐๐ ๐1 + ๐2 + โฏ + ๐๐ = ๐๐๐๐ ๐1 ๐ธ ๐1 = ๐ธ ๐2 = … = ๐ธ ๐๐ ๐๐๐ ๐1 = ๐๐๐ ๐2 = … = ๐๐๐ ๐๐ ๐ = ๐ธ ๐1 ๐ธ ๐ =๐ ๐2 ๐๐๐ ๐ = ๐ ๐ 2 = ๐๐๐ ๐1 media nella popolazione varianza nella pop. ๐1 + ๐2 + โฏ + ๐๐ ๐= ๐ media campionaria Inferenza… ๐1 , … , ๐๐ campione casuale (v.a. indipendenti, tutte con la stessa distribuzione) ๐ = ๐ธ ๐1 media nella popolazione varianza nella popolazione media ๐1 + ๐2 + โฏ + ๐๐ ๐= campionaria ๐ ๐ธ ๐ =๐ ๐ 2 = ๐๐๐ ๐1 stimatore: qualunque funzione del campione ๐(๐1 , … , ๐๐ ) non distorto: ๐ธ ๐ ๐1 , … , ๐๐ =parametro di interesse la media campionaria è uno stimatore non distorto della media nella popolazione ๐2 ๐๐๐ ๐ = → 0 con ๐ ↑ ๐ ๐ ๐ ≤2 =? Per rispondere serve conoscere (i.e., ipotizzare) la distribuzione campionaria Ti piace vincere facile? Mettiamoci in un mondo gaussiano! ๐๐ ~ ๐ ๐, ๐ 2 ๐๐ ~ ๐ 2 ๐ ๐≤2 = ๐๐ = ๐1 + ๐2 + โฏ + ๐๐ ๐๐, ๐๐ 2 ๐~ ๐ ๐2 ๐, ๐ 2 ๐๐,๐2 ๐ฅ ๐๐ฅ = "pnorm(2, ๐, ๐๐ )" −∞ oppure in uno schema di prove ripetute di Bernoulli: ๐๐ ~ ๐ต๐๐๐ ๐ ๐๐ ~ B๐๐ ๐, ๐ ๐ ๐ ≤ 0.2 = ๐ ๐๐ ≤ 0.2๐ = "pbinom(โช 0.2๐ โซ, ๐, ๐)" ๐ è stimatore non distorto della proporzione di successi, ๐ Il Teorema centrale del limite (o del limite centrale) ๐1 , … , ๐๐ campione casuale (v.a. indipendenti, tutte con la stessa distribuzione). Se ๐ = ๐ธ ๐1 e ๐ 2 = ๐๐๐ ๐1 esistono, finite, allora ๐๐ − ๐๐ ๐๐ 2 ๐−๐ ๐๐ − ๐ธ(๐๐ ) ๐๐๐(๐๐ ) ๐น๐ (๐ฅ) ๐2 ๐ d ๐~๐(0,1) ๐ → +∞ ๐ → +∞ Φ(๐ฅ) per ogni ๐ฅ ๐ฅ Φ ๐ฅ = ๐−๐ ๐ ๐ ๐ ๐< ๐๐ − ๐ธ(๐๐ ) ๐๐๐(๐๐ ) =Φ ๐ −Φ ๐ , −∞ ๐ข2 ๐๐ฅ๐ − ๐๐ข 2 2๐ 1 ≤ ๐ = ๐น๐ b − ๐น๐ (a) ≈ ๐ ๐ < ๐ ≤ ๐ non serve conoscere la distribuzione della popolazione per ๐ suff. grande Il Teorema centale del limite Pierre Simone, marchese di Laplace (1749-1827) Errori di misura: legge della frequenza degli errori Jules Henri Poincaré (1854-1912) Tutti ne sono convinti: gli sperimentali credono che sia un teorema matematico, mentre i matematici credono che sia un fatto empirico Caso particolare ๐1 , … , ๐๐ campione casuale, ๐๐ ~ ๐ต๐๐๐(๐) ๐ธ ๐1 = ๐, ๐๐๐ ๐1 = ๐(1 − ๐) ๐๐ − ๐๐ ๐๐(1 − ๐) v.a. discrete d ๐~๐(0,1) ๐ → +∞ v.a. continua rule of thumb โถ ๐๐ > 5 & ๐ 1 − ๐ > 5 ๐๐ ~ B๐๐ ๐, ๐ … Esempio (Ross, es. 10 p. 295) Una compagnia aerea osserva che il 6% dei passeggeri che prenotano un volo non si presentano al check-in. Quante prenotazioni possono essere accettate perchè con almeno il 95% di probabilità tutti coloro che si presentano al checkin per un volo da 250 posti siano ammessi? ๐๐ = 1 se si presenta al check − in ๐๐ = 0 altrimenti ๐๐ n. di persone che si presentano al checkin su ๐ prenotati. ๐๐ = ๐1 + โฏ + ๐๐ ๐๐ ~๐ต๐๐ ๐, ๐ , ๐ = 1 − 0.06 = 0.94 tutti coloro che si presentano al check-in per un volo da 250 posti sono ammessi se e solo se ๐๐ ≤ 250 0.95 ≤ ๐(๐๐ ≤ 250) = ๐ ๐ incognito! ๐ต๐๐ ๐, ๐ =๐ ๐๐ − ๐๐ ≤ 250 − ๐๐ ๐๐(1 − ๐) ๐๐(1 − ๐) ๐๐ − ๐ × 0.94 250 − 0.94๐ ≤ ๐ × 0.94 × 0.06 0.0564๐ Esempio, cont. 0.95 ≤ ๐(๐๐ ≤ 250) = ๐ ๐๐ − ๐๐ ๐๐(1 − ๐) 250 × 0.94 = 235 250 × 0.06 = 15 ≤ 250 − ๐๐ ๐๐(1 − ๐) pbinom(250,259,0.94) pbinom(250,260,0.94) pbinom(250,261,0.94) =๐ (TCL*) ≈ ๐ ๐ ≤ ๐๐ − ๐ × 0.94 ๐ × 0.94 × 0.06 250 − 0.94๐ 0.0564๐ ≤ =Φ 250 − 0.94๐ 0.0564๐ 250 − 0.94๐ 0.0564๐ 0.4 N(0,1) 0.2 0.3 ๐ง: ๐ ๐ ≤ ๐ง = 0.95? per qque ๐ง > ๐ง: ๐ ๐ ≤ ๐ง ≥ 0.95 ๐ง = qnorm 0.95,0,1 = 1.644854 0.1 250 − 0.94๐ 0.0564๐ ≥ 1.644854 0.0 ๐ ≤ 259(.266) -4 -2 0 2 4 Sunto estremo ๐1 , … , ๐๐ campione casuale (v.a. indipendenti, tutte con la stessa distribuzione) ๐ = ๐ธ ๐1 ๐ 2 = ๐๐๐ ๐1 ๐1 + ๐2 + โฏ + ๐๐ ๐ media campionaria media nella pop. ๐= varianza nella pop. (inizio di) inferenza per la media di una popolazione la media campionaria è uno stimatore non distorto della media nella popolazione ๐−๐ ๐2 ๐ d ๐ → +∞ ๐ è stimatore non distorto della proporzione di successi, ๐ ๐~๐(0,1) Verifica del TCL con R Script5.R Normal Q-Q Plot 4 Histogram of rnorm(1000, 0, 1) -2 0 Sample Quantiles 0.2 0.1 0.0 Density 0.3 2 0.4 per ๐ suff. grande ๐๐ − ๐ธ(๐๐ ) ๐ ๐< ≤๐ ≈Φ ๐ −Φ ๐ , ๐๐๐(๐๐ ) -2 0 2 -4 4 0 Theoretical Quantiles rnorm(1000, 0, 1) 5000 simulazioni di -2 ๐๐ − ๐ธ(๐๐ ) ๐๐๐(๐๐ ) = ๐๐ − 0.5 1 12๐ 2 4 ๐(0,1) da una Unif(0,1) (๐๐ = ๐1 + ๐2 + โฏ + ๐๐ , ๐๐ ~๐(0,1)) Inferenza ๐1 , … , ๐๐ campione casuale (v.a. indipendenti, tutte con la stessa distribuzione) ๐ = ๐ธ ๐1 media nella pop., ๐ stimatore non distorto ๐ 2 = ๐๐๐ ๐1 varianza nella pop. varianza campionaria ๐0 2 1 = ๐ ๐2 = stimatore non distorto: ๐ ๐๐ − ๐ 2 se è nota se non è nota ๐=1 1 ๐−1 ๐ ๐๐ − ๐ 2 ๐=1 la media ๐ฅ e la varianza (non distorta) ๐ 2 dei dati sono la realizzazione campionaria di queste variabili aleatorie incertezza associata al campione/alla stima. Intervalli di confidenza ๐1 , … , ๐๐ campione casuale (v.a. indipendenti, tutte con la stessa distribuzione) ๐ = ๐ธ ๐1 media nella pop., ๐ stimatore non distorto Un intervallo di confidenza per è, in breve, un intervallo aleatorio che, con buona probabilità, contiene il “vero” (e sconosciuto) valore di . Se ๐ è un buon stimatore di è ragionevole supporre che la sua distribuzione sia concentrata vicino al “vero valore di” . ๐ ๐ − ๐ < ๐, ๐ + ๐ > ๐ = 0.95 ๐ ๐ − ๐ < ๐ < ๐ + ๐ = 0.95 ๐ −๐ ๐2 ๐ < ๐−๐ ๐2 ๐ < ๐ ๐2 ๐ nota ๐1 ~๐ ๐, ๐ 2 o ๐ grande: ๐−๐ = 0.95 ๐2 ๐ ~๐(0,1) Intervalli di confidenza ๐1 , … , ๐๐ campione casuale (v.a. indipendenti, tutte con la stessa distribuzione) ๐ = ๐ธ ๐1 media nella pop., ๐ −๐ ๐2 ๐ < ๐ stimatore non distorto ๐−๐ ๐2 ๐ ๐2 ๐ = 0.95 -2 0 2 4 0.4 0.3 0.1 0.0 0.0 0.1 0.2 0.3 0.4 (−2.326248, 1.750686) 0.2 0.3 0.2 0.1 0.0 -4 ๐1 ~๐ ๐, ๐ 2 o ๐ grande: ๐−๐ ~๐(0,1) 2 ๐ ๐ (−1.644854, +∞) 0.4 (−∞, 1.644854) ๐ < nota -4 -2 0 2 4 -4 -2 0 2 4 Intervalli di confidenza ๐1 , … , ๐๐ campione casuale (v.a. indipendenti, tutte con la stessa distribuzione) ๐ = ๐ธ ๐1 media nella pop., ๐ (−1.959964, −๐ ๐2 ๐ < ๐ stimatore non distorto ๐−๐ ๐2 ๐ ๐ < ๐2 ๐ nota ๐1 ~๐ ๐, ๐ 2 o ๐ grande: ๐−๐ ~๐(0,1) 2 ๐ ๐ = 0.95 ๐=๐ 1.959964) ๐ ๐2 ๐ = ๐ง1−๐ผ 2 1−๐ผ ๐ ๐ − ๐ < ๐, qnorm 0.975,0,1 [ 0.95 ] ] livello di confidenza ๐+๐ >๐ = 1−๐ผ Intervalli di confidenza ๐1 , … , ๐๐ campione casuale (v.a. indipendenti, tutte con la stessa distribuzione) ๐ = ๐ธ ๐1 media nella pop., ๐ ๐ 2 = ๐๐๐ ๐1 varianza nella pop. ๐ ๐− ๐2 ×๐ง1−๐ผ 2 ๐ <๐ < ๐+ stimatore non distorto ๐2 ×๐ง1−๐ผ 2 ๐ =1−๐ผ nota ๐1 ~๐ ๐, ๐ 2 o ๐ grande: ๐−๐ ~๐(0,1) 2 ๐ ๐ Un intervallo di confidenza per è, in breve, un intervallo aleatorio che, con buona probabilità, contiene il “vero” (e sconosciuto) valore di . Se ๐ è un buon stimatore di è ragionevole supporre che la sua distribuzione sia concentrata vicino a . Si può agire su ๐ o su ๐ผ errore massimo nella stima (โ) Intervalli di confidenza ๐ ๐− ๐2 ๐ ×๐ง1−๐ผ 2 <๐ < ๐+ ๐2 ๐ ×๐ง1−๐ผ 2 =1−๐ผ ๐ crescente โน riduzione dell′ errore massimo accettabile 1 − ๐ผ crescente (α decrescente) โน ๐๐ฎ๐ฆ๐๐ง๐ญ๐จ dell′ errore massimo accettabile 1 − ๐ผ = 0.95 ⇔ ๐ผ = 0.05 ⇒ ๐ง0.975 = 1.959964 1 − ๐ผ = 0.99 ⇔ ๐ผ = 0.01 ⇒ ๐ง0.995 = 2.575829 ๐ง0.975 = 1.959964 Intervalli di confidenza ๐1 , … , ๐๐ campione casuale (v.a. indipendenti, tutte con la stessa distribuzione) ๐ = ๐ธ ๐1 media nella pop., ๐ ๐ 2 = ๐๐๐ ๐1 varianza nella pop., ๐ 2 ๐ ๐− ๐2 ๐ ×๐ง1−๐ผ 2 <๐ < ๐+ ๐2 ๐ ×๐ง1−๐ผ 2 nota ๐1 ~๐ ๐, ๐ 2 o ๐ grande: ๐−๐ ~๐(0,1) 2 ๐ ๐ =1−๐ผ Per un campione gaussiano si ha che: non nota • ๐ ๐ ๐ 2 ๐ ๐๐๐ ๐ฃ. ๐. ๐๐๐๐๐๐๐๐๐๐๐ก๐ • • (๐−1)๐ 2 2 ~๐ 2 ๐ ๐−๐ ๐2 ๐ pivot ๐1 ~๐ ๐, ๐ 2 ๐ ๐ ๐ ๐ซ๐๐ง๐๐: ๐−1 ~๐ก(๐ − 1) ๐ ๐− ๐2 ๐ ×๐ก(๐ − 1)1−๐ผ 2 <๐ Intervalli di confidenza ๐1 , … , ๐๐ campione casuale (v.a. indipendenti, tutte con la stessa distribuzione) ๐ = ๐ธ ๐1 media nella pop., ๐ ๐ 2 = ๐๐๐ ๐1 varianza nella pop., ๐ 2 Per un campione gaussiano si ha che: • ๐ ๐ ๐ 2 ๐ ๐๐๐ ๐ฃ. ๐. ๐๐๐๐๐๐๐๐๐๐๐ก๐ • • (๐−1)๐ 2 2 ~๐ 2 ๐ ๐−๐ ๐2 ๐−1 (๐ − 1)๐ 2 (๐ − 1)๐ 2 , ๐ 2 ๐−1,๐ผ/2 ๐ 2 ๐−1,1−๐ผ/2 ~๐ก(๐ − 1) ๐ ๐−1,…,๐(๐๐ − ๐ 2 ๐,๐ผ/2 ๐)2 , ๐−1,…,๐(๐๐ − ๐) ๐ 2 ๐,1−๐ผ/2 2 Esempio In prossimità del nuovo anno scolastico il preside di una scuola vuole stimare il numero medio di giorni di assenza degli studenti nell’a.s. precedente. Per questo estrae un campione casuale di 50 studenti dell’anno precedente, ricavandone una media di 8.4 giorni con una deviazione standard di 5.1 giorni. a) Indicare un IC(95%) del numero medio di giorni di assenza di uno studente della scuola; b) Con una confidenza del 95%, qual è il limite superiore del numero medio di giorni di assenza? ๐1 , … , ๐50 c.c. da popolazione con media ๐ e deviazione standard ๐, entrambe incognite. La distribuzione della pop. è discreta. ๐ฅ = 8.4, ๐ = 5.1 a) ๐ผ = 0.05 ๐ก(49)0.975 = 2.009575 ๐− ๐ 2 ×๐ก(๐ ๐ − 1)1−๐ผ 2 <๐ < ๐+ ๐ 2 ×๐ก(๐ ๐ − 1)1−๐ผ 2 (6.9506, 9.8494) (Ross, n. 20 p. 339) Esempio In prossimità del nuovo anno scolastico il preside di una scuola vuole stimare il numero medio di giorni di assenza degli studenti nell’a.s. precedente. Per questo estrae un campione casuale di 50 studenti dell’anno precedente, ricavandone una media di 8.4 giorni con una deviazione standard di 5.1 giorni. a) Indicare un IC(95%) del numero medio di giorni di assenza di uno studente della scuola; b) Con una confidenza del 95%, qual è il limite superiore del numero medio di giorni di assenza? ๐1 , … , ๐50 c.c. da popolazione con media ๐ e deviazione standard ๐, entrambe incognite. La distribuzione della pop. è discreta. ๐ฅ = 8.4, ๐ = 5.1 b) ๐ผ = 0.05 ๐ก(49)๐.๐๐ = 1.676551 ๐− ๐ 2 ×๐ก ๐ ๐−1 2 2 1−๐ผ 2 ๐ ×๐ก(๐ < ๐ ๐<<๐ ๐++ ๐ ๐ ×๐๐ก(๐ −−1)1) ๐−๐ถ 1−๐ผ/2 9.60921 (Ross, n. 20 p. 339) Una parentesi:Olbia 2013 117.6 Una parentesi: Olbia 2013 120.6) Intervalli di confidenza: p ๐1 , … , ๐๐ campione casuale dalla distribuzione Bern(p). ๐ è stimatore non distorto di ๐ ๐๐๐ ๐ = ๐(1 − ๐) ๐ ๐−๐ ๐(1 − ๐)/๐ ≈ ๐ 0,1 ๐ ๐− ๐(1−๐) ๐ ๐๐ > 5 & ๐ 1 − ๐ > 5 × ๐ง1−๐ผ 2 <๐ < ๐+ ๐(1−๐) ๐ × ๐ง1−๐ผ 2 =1−๐ผ Esempio Pochi giorni prima delle elezioni un noto quotidiano commissiona un sondaggio di opinione per prevedere quale fra le due coalizioni (CD, CS) vincerà le elezioni. Il sondaggio, condotto su un campione di 1750 intervistati, assegna il 39% al CS ed il 42% al CD. Calcolare IC(95%) per ciascuna coalizione e dedurne i reali vantaggi. ๐ฅ ๐ถ๐ท = 0.42 e ๐ฅ ๐ถ๐ = 0.39 1 − ๐ผ = 0.95 ๐− ๐๐ > 5 & ๐ 1 − ๐ > 5 in entrambi i casi. ๐(1−๐) ๐ × ๐ง1−๐ผ 2 <๐ < ๐+ ๐(1−๐) ๐ × ๐ง1−๐ผ ๐๐ถ๐ท CD: 0.397, 0.443 CS: 0.367, 0.413 ๐๐ถ๐ Quante persone andrebbero intervistate perchè l’errore massimo accettabile nella stima sia 0.01? (err. max attuale ๏ป 0.02) 2 Esempio Pochi giorni prima delle elezioni un noto quotidiano commissiona un sondaggio di opinione per prevedere quale fra le due coalizioni (CD, CS) vincerà le elezioni. Il sondaggio, condotto su un campione di 1750 intervistati, assegna il 39% al CS ed il 42% al CD. Calcolare IC(95%) per ciascuna coalizione e dedurne i reali vantaggi. x 5.5 ๐ฅ ๐ถ๐ท = 0.42 e ๐ฅ ๐ถ๐ = 0.39 1 − ๐ผ = 0.95 ๐− ๐(1−๐) ๐ × ๐ง1−๐ผ 1 4๐ risultato indipendente da ๐ฅ 2 <๐ < ๐+ × ๐ง1−๐ผ 2 ≤ ε ๐ง1−๐ผ 2 2 ๐≥ 4ε2 ๐(1− ๐(1−๐) ๐) × ๐ง1−๐ผ 2 ๐๐ ๐ข(1 − ๐ข) ≤ 1/4 ๐ ≥ 9603.65 Quante persone andrebbero intervistate perchè l’errore massimo accettabile nella stima sia 0.01? (err. max attuale ๏ป 0.02) I principali IC … ๐๐ ~๐(๐, ๐ 2 ) o ๐ grande (TCL) Per ๐, con ๐ 2 nota: Per ๐, con ๐ 2 non nota: Per ๐ 2 , con ๐ non nota: ๐๐ − ๐ง1−๐ผ 2 ๐2 , ๐๐ ๐ ๐๐ − ๐ก๐−1,1−๐ผ 2 + ๐ง1−๐ผ ๐ 2 ๐ , ๐๐ 2 ๐2 ๐ + ๐ก๐−1,1−๐ผ 2 ๐ 2 ๐ (๐ − 1)๐ 2 (๐ − 1)๐ 2 , ๐ 2 ๐−1,1−๐ผ 2 ๐ 2 ๐−1,๐ผ 2 ๐๐ ~๐ต๐๐๐(๐) asintotico: ๐๐ − ๐ง1−๐ผ 2 ๐๐ (1−๐๐ ) , ๐๐ ๐ + ๐ง1−๐ผ 2 ๐๐ (1−๐๐ ) ๐ I principali IC … con R Script6.R 0.50 IC(95) 0.45 IC(95%) 0.40 0.3671479 ๐ = ๐. ๐๐ ๐ = 1750 ๐ฅ = 0.39 0.30 0.35 0.4128521 ๐๐ ~๐ต๐๐๐(๐) asintotico: 0 50 ๐ = 100๐ n=100k ๐๐ − ๐ง1−๐ผ 2 100 ๐๐ (1−๐๐ ) , ๐๐ ๐ 150 + ๐ง1−๐ผ 2 ๐๐ (1−๐๐ ) ๐ Intervalli di confidenza 0.40 0.45 0.50 0.55 0.60 Interpretazione frequentista: se potessi ripetere l’esperimento tante volte, sempre nelle stesse condizioni, il (1-๐ผ)% degli intervalli campionari ottenuti contiene il «vero valore» del IC(95) parametro. 0.35 Script6.R 0 20 40 60 80 100 Legge (forte) dei grandi numeri ๐1 , … , ๐๐ , … successione di v.a. indipendenti, tutte con la stessa distribuzione che abbia media ๐ finita. ๐1 + ๐2 + โฏ + ๐๐ ๐ ๐→∞ ๐ ๐๐ข๐๐ ๐ ๐๐๐๐ก๐๐๐๐๐ก๐ succ. numerica, una diversa per ogni esito ๐ ๐ ๐โถ ๐1 (๐) + ๐2 (๐) + โฏ + ๐๐ (๐) ๐ ๐→∞ ๐ variabili aleatorie: quantità di interesse legate all’esito dell’esperimento =1 ๐ฟ P Legge (forte) dei grandi numeri Bern(0.5) Bern(0.5) Bern(0.5) 0 200 400 600 800 quattro diversi esiti ๐ 0 200 400 600 800 0 200 400 600 800 0 200 400 600 800 0.6 0.20.0 0.40.2 0.60.4 0.60.4 0.80.6 1.00.8 Bern(0.5) Bern(0.5) 0.0 1.0 Bern(0.5) 0.4 quattro diverse successioni numeriche 0.4 0.20.0 0.40.2 200 400 600 800 0.0 0 0.0 0.20.0 0.40.2 0.60.4 0.6 Bern(0.5) Bern(0.5) 0 200 400 600 800 Legge (forte) dei grandi numeri ๐1 , … , ๐๐ , … successione di v.a. indipendenti, tutte con la stessa distribuzione che abbia media ๐ finita. ๐1 + ๐2 + โฏ + ๐๐ ๐๐ = ๐ ๐→∞ ๐๐ข๐๐ ๐ ๐๐๐๐ก๐๐๐๐๐ก๐ ๐ se ๐๐๐ ๐1 = ๐ 2 esiste finita, allora ๐1 2 ha media finita ๐ 2 + ๐ e quindi ๐1 2 + ๐2 2 + โฏ + ๐๐ 2 (๐ 2 +๐2 ) ๐→∞ ๐ pertanto 1 2 ๐n = ๐−1 ๐ ๐๐ − ๐๐ ๐=1 2 1 = ๐−1 ๐ ๐๐ 2 − ๐๐๐ ๐=1 2 ๐→∞ (๐ 2 +๐2 − ๐2 ) = ๐ 2 ๐. ๐. La legge (forte) dei grandi numeri 1 ๐ 1 , −∞ Cauchy ๐ฅ 2 +1 < ๐ฅ < +∞ 0.25 0.30 ๐ ๐ฅ = × 0.00 0.05 0.10 0.15 0.20 densità di Cauchy -10 -5 0 5 10 La legge (forte) dei grandi numeri