STATISTICA A – K (60 ore) Marco Riani [email protected] http://www.riani.it Esercizio • Data una scheda telefonica da 5 euro di cui non si sa se sia mai stata usata e nel caso sia stata usata non si conosce l’ammontare ancora disponibile, è ragionevole ipotizzare per tale ammontare X la seguente funzione di densità f(x)=1/5 per [0 ≤x≤5] Marco Riani, Univ. di Parma 1 • Verificare che f(x)=1/5 per [0 ≤x≤5] sia una densità e rappresentarla graficamente • Calcolare il credito residuo atteso (E(X)) • Calcolare la varianza del credito residuo (VAR(X)) • Devo fare una telefonata da 2 € calcolare la prob che la scheda sia sufficiente per fare la telefonata • Ho 60 schede tutte con un ammontare che si distribuisce come descritto sopra. Qual è la prob che l’ammontare complessivo sia superiore a 170 € Soluzione • Verificare che f(x)=1/5 per [0 ≤x≤5] sia una densità f(x)=1/5=0,2 Marco Riani, Univ. di Parma 2 Calcolo di E(X) e VAR(X) Soluzione (continua) • Devo fare una telefonata da 2 € calcolare la prob che la scheda sia sufficiente per fare la telefonata • Pr(credito residuo>2) Marco Riani, Univ. di Parma 3 Calcolo di Pr(X>2) • La prob richiesta è l’area di un rettangolo con base 3 e altezza 0,2 Soluzione (continua) • Ho 60 schede tutte con un ammontare che si distribuisce come descritto sopra. Qual è la prob che l’ammontare complessivo sia superiore a 170 € • Pr(credito residuo totale>170) Marco Riani, Univ. di Parma 4 Pr(X1+X2+. . .+X60)>170 • Sia Xi la variabile casuale che descrive la disponibilità residua (in euro) dell’i-esima scheda telefonica, i = 1, . . . , 60 • T = X1+X2+. . .+X60 • la variabile casuale che descrive l’ammontare complessivo delle 60 schede • Obiettivo: calcolare Pr(T>170) • Qual è la distribuzione di T? Pr(T)>170 • Dato che X1+X2+. . .+X60 sono v.c. iid • T= X1+X2+. . .+X60 ≈ N(E(T) VAR(T)) • Calcolo E(T) e VAR(T) E(T)= E(X1)+E(X2)+. . .+E(X60 )=60×2,5=150 VAR(T)= VAR(X1)+VAR(X2)+. . .+VAR(X60 )= =(25/12)×60=125 T ≈ N(150 125) Marco Riani, Univ. di Parma 5 Pr(T)>170 • T ≈ N(150 125) • Pr(T)>170=1-Pr(T)<170 1-F((170-150)/1250,5) =1-F(1,788854)=0,03682 Esercizio • La durata di un macchinario si distribuisce secondo una distribuzione normale di media 2 anni e scarto quadratico medio 0,5 anni. Si determini: 1. prob che il macchinario duri più di 28 mesi. 2. l’intervallo di ampiezza 2 anni al quale corrisponde la massima prob di contenere la durata effettiva del macchinario. Calcolare tale probabilità. 3. Se il costo di acquisto del macchinario è di 1000 euro e il costo del suo funzionamento è stimato in 150 euro all’anno, si calcolino la media e la varianza del costo complessivo del macchinario. Marco Riani, Univ. di Parma 6 Soluzione • T= v.a. che descrive la durata del macchinario T~N(24 mesi 62 mesi) • Pr(T>28)=1-Pr(T<28)=1-F(4/6)=0,25249 Intervallo di ampiezza 2 anni al quale corrisponde la massima prob di contenere la durata effettiva del macchinario. T= v.a. che descrive la durata del macchinario T~N(24 mesi 62 mesi) Dalla forma campanulare e simmetrica attorno a μ della densità di una generica N(μ, σ2), si ottiene che l’intervallo di ampiezza 2 anni che contiene la massima probabilità per una N(24,6) è l’intervallo di ampiezza 2 anni attorno alla media (E(T) = 24), ossia [12 mesi,36 mesi]. Marco Riani, Univ. di Parma 7 Pr(12 mesi ≤T≤36 mesi) • Dato che T~N(24 mesi 62 mesi) • Pr(12 <T<36) • =Pr(µ-2σ<T<µ+2σ)=0,9545 Media e varianza del costo complessivo del macchinario • • • • • • • • C= v.a. che descrive il costo complessivo CA=costo acquisto = 1000 € CM = costo manutenzione annuo =150 € T = v.a. che descrive la durata in mesi C=CA+(CM/12) × T C=1000+(25/2) T con T~N(24m 62m) E(C) =? E(C)= 1000+ (25/2) E(T)=1300 VAR(C)=? VAR(C)= (25/2)2VAR(T)= 5625 Marco Riani, Univ. di Parma 8 Se avessi espresso tutto in anni • • • • • • • • C= v.a. che descrive il costo complessivo CA=costo acquisto = 1000 € CM = costo manutenzione annuo =150 € TA = v.a. che descrive la durata in anni C=CA+CM × TA C=1000+150 TA con TA~N(2 0,52) E(C) = 1000+ 150 E(TA)=1300 VAR(C)= 1502 VAR(TA)= 5625 Esercizio • Sia X1, … Xn un campione casuale estratto da un universo X con la seguente distribuzione di Cauchy (T di student con un solo grado di libertà) Marco Riani, Univ. di Parma 9 Richieste • • • • • • Verificare che f(x; θ, d) è una densità Rappresentare graficamente f(x; θ, d) Calcolare la funzione di ripartizione F(x) Calcolare la mediana di X Calcolare E(X) Illustrare se in presenza di un campione casuale estratto da questa densità è possibile applicare il teorema centrale del limite • Verificare che 6,314 (ossia il numero all’incrocio della prima riga e della prima colonna della tabella di p. 150 del testo di inferenza) è quantile che lascia alla sua sinistra una probabilità pari a 0,95 • Trovare il quantile 0,995 (ossia il valore che lascia alla sua destra una probabilità pari a 0,005). Verificare che tale numero risulta uguale a 63,656 (v. tabella di p. 150 del libro di inferenza) Marco Riani, Univ. di Parma 10 Soluzione • Verifica che è una densità • Per chi desidera ripassare le proprietà dell’arcotangente http://it.wikipedia.org/wiki/Arcotangente Rappresentazione grafica θ=0, d=1 Marco Riani, Univ. di Parma 11 Calcolo della funzione di ripartizione θ=0, d=1 Calcolo della mediana • La mediana (Me) per un v.c. continua con funzione di densità f(x) e ripartizione F(x) è definita come la soluzione della seguente equazione Mediana = quantile che lascia alla sua destra ed alla sua sinistra una probabilità pari a 0,5 Marco Riani, Univ. di Parma 12 Calcolo della mediana Calcolo del valore atteso • Per semplificare i calcoli possiamo considerare la variabile di Cauchy in forma «standardizzata» z= (x-θ)/d Marco Riani, Univ. di Parma 13 • Domanda: illustrare se in presenza di un campione casuale estratto da questa densità è possibile applicare il teorema centrale del limite • Risposta: non è possibile applicare il teorema centrale del limite in quanto E(X)=∞. Di conseguenza lo scostamento standardizzato della media campionaria non si distribuisce come una v.c. normale standardizzata Verificare che 6,314 (ossia il numero all’incrocio della prima riga e della prima colonna della tabella di p. 150 del testo di inferenza) è quantile che lascia alla sua sinistra una probabilità pari a 0,95 Occorre verificare che Marco Riani, Univ. di Parma 14 Trovare il quantile 0,995 (ossia il valore che lascia alla sua destra una probabilità pari a 0,005). Verificare che tale numero risulta uguale a 63,656 (v. tabella di p. 150 del libro di inferenza) Occorre trovare x0,995 tale per cui F(x0,995)=0,995 Osservazione: in Excel =INV.T(0,01;1) =63,65674 Esercizio • Si consideri una popolazione distribuita secondo il seguente modello X Pi 2 0.3 5 0.6 7 0.1 • Si elenchino tutti i campioni di ampiezza 3 che si possono estrarre con ripetizione da tale popolazione assegnando a ciascun campione la relativa probabilità • Si determini la distribuzione campionaria della media e la si rappresenti graficamente • Si calcoli il valore atteso e la varianza della media campionaria • Si determini la distribuzione campionaria della mediana ed il suo valore atteso Marco Riani, Univ. di Parma 15 Soluzione: spazio dei campioni (27=33) e relative probabilità X Pi 2 0.3 5 0.6 7 0.1 Universo X Distribuzione della media campionaria Marco Riani, Univ. di Parma 16 X Pi 2 0.3 5 0.6 7 0.1 Universo X Distribuzione della media campionaria Rappresentazione grafica della distribuzione della media campionaria • Quando n è elevato la distribuzione della media campionaria è normale. Quando n è piccolo la distribuzione dipende da quella dell’universo Marco Riani, Univ. di Parma 17 X 2 5 7 Pi 0.3 0.6 0.1 Universo X E(X)=4.3 Distribuzione della mediana campionaria E(Me)=4.408. In questo caso lo stimatore mediana campionaria è distorto Bias=0.108 Marco Riani, Univ. di Parma 18