Antonella Bodini Istituto di Matematica Applicata e Tecnologie Informatiche “E. Magenes” del CNR Materiale ad uso dei ricercatori che hanno seguito il corso di formazione interna in Statistica, edizione 2016. STATISTICA Variabili casuali continue Le variabili aleatorie discrete Principali densità discrete E, Var ๐ธ ๐ =๐ฅ ๐๐๐ ๐ = Unif. ๐(๐ = ๐ฅ๐ ) =1/n , ๐ = 1, … , ๐ < ∞ Bern(p) ๐(๐ = 1)=p, ๐(๐ =0)=1-p Bin(n,p) (*) ๐ ๐ ๐(๐ = ๐)= ๐ (1 − ๐)๐−๐ , ๐ ๐ = 0,1, … , ๐ ๐ธ ๐ = ๐๐ V๐๐ ๐ = ๐๐(1 − ๐) Numero di successi in n prove indipendenti e identiche Geom(p) ๐ ๐ = ๐ = ๐(1 − ๐) , ๐ ≥ 0 ๐ธ ๐ = (1 − ๐) ๐ ๐๐๐ ๐ = (1 − ๐)/๐2 Tempo del primo successo in prove ripetute identiche Po( ) ๐ ๐ = ๐ = ๐ −๐ ๐๐! , ๐ ≥ 0 ๐ธ ๐ = ๐, ๐๐๐ ๐ = ๐ O distribuzione degli eventi rari ๐−1 ๐ ๐ (*) n=1 fornisce la Bernoulli(p) ๐ฅ๐ − ๐ฅ 2 ๐ธ ๐ =๐ ๐๐๐ ๐ = ๐(1 − ๐) Ex. il dado equilibrato. Esito di una prova con due soli possibili risultati V.a. assolutamente continua ๐ ๐ ๐ฅ ≥ 0 e integrabile ๐ ๐ <๐ ≤๐ =๐น ๐ −๐น ๐ = ๐ ๐ฅ ๐๐ฅ ๐ +∞ ๐ ๐ฅ ๐๐ฅ = 1 ๐ ๐ = ๐ = 0 qualunque sia ๐ −∞ f. ripartizione N(0,1) 1.0 0.4 N(0,1) 0.0 0.0 0.2 0.1 0.4 0.2 0.6 0.3 0.8 0.8413 -5 -4 -2 0 1 2 4 -4 -2 0 1 2 4 Valore atteso e varianza ๐ธ ๐ = ๐=1,…,๐ ๐ฅ๐ ๐ ๐๐๐ ๐ = ๐๐๐ ๐ = ๐ธ ๐ = ๐ฅ๐ ๐ฅ ๐๐ฅ ๐ = ๐ฅ๐ 2 ๐=1,…,๐(๐ฅ๐ −๐ธ(๐)) ๐ ๐ฅ−๐ธ ๐ 2 ๐ ๐ฅ ๐๐ฅ = ๐ = ๐ฅ๐ = ๐ธ ๐ 2 − ๐ธ 2 (๐) ๐ฅ 2 ๐ ๐ฅ ๐๐ฅ − ๐ธ 2 ๐ = ๐ธ ๐ 2 − ๐ธ 2 ๐ ๐ธ ๐๐ + ๐ = ๐๐ธ ๐ + ๐ ๐๐๐ ๐๐ + ๐ = ๐2 ๐๐๐(X) ๐ธ ๐+๐ =๐ธ ๐ +๐ธ ๐ ๐๐๐ ๐ + ๐ = ๐๐๐ ๐ + ๐๐๐ ๐ + ๐ถ๐๐ฃ(๐, ๐) ๐ถ๐๐ฃ ๐, ๐ = ๐=1,…,๐(๐ฅ๐ −๐ธ(๐))(๐ฆ๐ −๐ธ(๐))๐(๐ ๐ถ๐๐ฃ ๐, ๐ = ๐ฅ−๐ธ ๐ se X e Y sono indipendenti = ๐ฅ๐ , ๐ = ๐ฆ๐ ) = ๐ธ(๐๐) − ๐ธ(๐)๐ธ(๐) ๐ฆ − ๐ธ ๐ ๐ ๐ฅ, ๐ฆ ๐๐ฅ๐๐ฆ = ๐ธ ๐๐ − ๐ธ ๐ ๐ธ(๐) ๐ถ๐๐ฃ ๐, ๐ = 0 e ๐๐๐ ๐ + ๐ = ๐๐๐ ๐ + ๐๐๐ ๐ Densità note Alcune ben note densità continue Uniforme su ๐, ๐ Gaussiana: ๐ต(๐, ๐๐ ) Gamma: ๐ฎ ๐ถ, ๐ท , ๐ถ > ๐, ๐ท > ๐ Esponenziale: ๐ฌ๐๐ ๐ , ๐ > ๐ ๐๐ ๐ t-Student: ๐ ๐ , ๐>๐ ๐ ๐ฅ =1 ๐ − ๐ , ๐ < ๐ฅ < ๐ ๐ ๐ฅ = (๐ฅ−๐)2 − ๐ 2๐2 2๐๐ 2 , ๐ฅ∈๐ E(X) Var(X) ๐+๐ 2 (๐−๐)2 12 ๐ ∈๐ ๐2 ๐ผ๐ฝ ๐ผ๐ฝ 2 1 ๐ ๐ 1 ๐ 2๐ 0, se ๐ > 1 ๐ ๐−2 , se ๐ > 2 ๐ฅ ๐ ๐ฅ = − ๐ฅ ๐ผ−1 ๐ ๐ฝ , 1 ๐ฝ๐ผ Γ ๐ผ ( shape, ๐ฅ>0 scale, 1/ ๐ ๐ฅ = ๐๐ −๐๐ฅ , rate) ๐ฅ>0 Gamma(α = ๐ 2 , con α intero; ๐ฝ = 2) ๐ ๐ฅ = Γ ๐+1 2 ๐๐ Γ ๐ 2 1+ ๐+1 2 − 2 ๐ฅ ๐ , ๐ฅ>0 Densità note Gaussiana(0,1) Gamma(5.5,1/3) -1 0 1 2 3 4 0.0 0.0 0.0 0.1 0.1 0.1 0.2 0.2 0.2 0.3 0.3 0.4 0.3 0.4 0.5 0.5 0.4 Uniforme(0,2) Script4.R 5 -4 -2 0 2 4 0 2 4 Chi.q(3) 8 10 0.5 0.4 0.20 -10 -5 0 5 10 0.0 0.0 0.00 0.1 0.05 0.1 0.2 0.10 0.2 0.3 0.15 0.3 6 Esp(2) 0.25 t-Student(4) 0 5 10 15 20 0 10 20 30 40 V.a. assolutamente continua Gamma(2,2) Gamma(2,2) ๐ ๐ ≤ 4 = 0.594 0.10 0.10 0.05 0.05 0.15 0.15 ๐ 2.5 ≤ ๐ ≤ 6 = 0.445 0.00 0.00 ๐ ๐ > 10 = 0.04 0 4 5 (retini.R) 10 15 20 0 2.5 5 6.0 10 15 20 ๐ฅ โถ ๐ ๐ > ๐ฅ = 0.05 quantile di ordine 0.95 E adesso? ๏ฒ=0.548 E adesso? E adesso? E adesso? Abbiamo descritto e sintetizzato dati di varia forma, provenienti da un qualche esperimento I dati come campione casuale Abbiamo introdotto la probabilità come una misura dell’incertezza sull’esito dell’esperimento. Abbiamo introdotto le variabili aleatorie come quantità di interesse legate all’esito di un esperimento. I dati come campione casuale campione casuale semplice: È un campione scelto per mezzo di un meccanismo che assegna ad ogni unità della popolazione la stessa probabilità di far parte del campione. Questo rende il campione rappresentativo. Il campione casuale Un sottinsieme casuale di k u.s. da una popolazione finita di N elementi può essere ottenuto col metodo delle estrazioni dall’urna senza reimmissione: palline tutte uguali, indistinguibili al tatto, numerate da 1 a N e ogni numero è univocamente associato ad una u.s. Estrazione di k palline. ๐! ๐ =๐! ๐−๐ ! possibili ๐ campioni, tutti ugualmente probabili. Si hanno quindi Ex. 10 ragazzi, campione di 3 ragazzi per indagare sulla loro altezza: 10 9 8 / 3 2 1 = 120 possibili terne. Il campione casuale La virtù del campionamento casuale sta più nella sua promessa (di imparzialità fra le unità estratte e quindi fra i campioni) e meno nel suo risultato occasionale (l'effettivo campione che si produce in una particolare situazione) (A. Cazzola, Univ. Bologna) Ex. 10 ragazzi, campione di 3 ragazzi per indagare sulla loro altezza: 10 9 8 / 3 2 1 = 120 possibili terne. h (in cm): 165, 177, 184, 173, 173, 168, 182, 160, 185, 174 Il campione casuale Se la proporzione di credenti nell’aldilà è la stessa nei due sessi, p: q=prop. di Femmine nella popolazione Credenza nell’aldilà FREQUENZE ATTESE Sesso Femmine Maschi Sì No nqp nq(1-p) n(1-q)p n(1-q)(1-p) np nq n(1-p) n(1-q) n Credenza nell’aldilà Sesso Femmine Maschi Maschi Sì No 435 432,1 375 375 377,9 810=np 147 149,9 134 134 131,1 281 810=np 281 582=nq ๐= 582 =0.533 1091 509 509 n=1091 n=1091 ๐= 810 =0.742 1091