STATISTICA A – K
(60 ore)
Marco Riani
[email protected]
http://www.riani.it
Esercizio
• Data una scheda telefonica da 5 euro di
cui non si sa se sia mai stata usata e nel
caso sia stata usata non si conosce
l’ammontare ancora disponibile, è
ragionevole ipotizzare per tale ammontare
X la seguente funzione di densità f(x)=1/5
per [0 ≤x≤5]
Marco Riani, Univ. di Parma
1
• Verificare che f(x)=1/5 per [0 ≤x≤5] sia
una densità e rappresentarla graficamente
• Calcolare il credito residuo atteso (E(X))
• Calcolare la varianza del credito residuo
(VAR(X))
• Devo fare una telefonata da 2 € calcolare
la prob che la scheda sia sufficiente per
fare la telefonata
• Ho 60 schede tutte con un ammontare che
si distribuisce come descritto sopra. Qual
è la prob che l’ammontare complessivo sia
superiore a 170 €
Soluzione
• Verificare che f(x)=1/5 per [0 ≤x≤5] sia
una densità
f(x)=1/5=0,2
Marco Riani, Univ. di Parma
2
Calcolo di E(X) e VAR(X)
Soluzione (continua)
• Devo fare una telefonata da 2 € calcolare
la prob che la scheda sia sufficiente per
fare la telefonata
• Pr(credito residuo>2)
Marco Riani, Univ. di Parma
3
Calcolo di Pr(X>2)
• La prob richiesta è l’area di un rettangolo
con base 3 e altezza 0,2
Soluzione (continua)
• Ho 60 schede tutte con un ammontare che
si distribuisce come descritto sopra. Qual
è la prob che l’ammontare complessivo sia
superiore a 170 €
• Pr(credito residuo totale>170)
Marco Riani, Univ. di Parma
4
Pr(X1+X2+. . .+X60)>170
• Sia Xi la variabile casuale che descrive la
disponibilità residua (in euro) dell’i-esima
scheda telefonica, i = 1, . . . , 60
• T = X1+X2+. . .+X60
• la variabile casuale che descrive
l’ammontare complessivo delle 60 schede
• Obiettivo: calcolare Pr(T>170)
• Qual è la distribuzione di T?
Pr(T)>170
• Dato che X1+X2+. . .+X60 sono v.c. iid
• T= X1+X2+. . .+X60 ≈ N(E(T) VAR(T))
• Calcolo E(T) e VAR(T)
E(T)= E(X1)+E(X2)+. . .+E(X60 )=60×2,5=150
VAR(T)= VAR(X1)+VAR(X2)+. . .+VAR(X60 )=
=(25/12)×60=125
T ≈ N(150 125)
Marco Riani, Univ. di Parma
5
Pr(T)>170
• T ≈ N(150 125)
• Pr(T)>170=1-Pr(T)<170
1-F((170-150)/1250,5)
=1-F(1,788854)=0,03682
Esercizio
• La durata di un macchinario si distribuisce secondo
una distribuzione normale di media 2 anni e scarto
quadratico medio 0,5 anni. Si determini:
1. prob che il macchinario duri più di 28 mesi.
2. l’intervallo di ampiezza 2 anni al quale corrisponde la
massima prob di contenere la durata effettiva del
macchinario. Calcolare tale probabilità.
3. Se il costo di acquisto del macchinario è di 1000
euro e il costo del suo funzionamento è stimato in
150 euro all’anno, si calcolino la media e la varianza
del costo complessivo del macchinario.
Marco Riani, Univ. di Parma
6
Soluzione
• T= v.a. che descrive la durata del
macchinario T~N(24 mesi 62 mesi)
•
Pr(T>28)=1-Pr(T<28)=1-F(4/6)=0,25249
Intervallo di ampiezza 2 anni al quale corrisponde
la massima prob di contenere la durata
effettiva del macchinario.
T= v.a. che descrive la
durata del macchinario
T~N(24 mesi 62 mesi)
Dalla forma campanulare e simmetrica attorno a μ
della densità di una generica N(μ, σ2), si ottiene che
l’intervallo di ampiezza 2 anni che contiene la
massima probabilità per una N(24,6) è l’intervallo di
ampiezza 2 anni attorno alla media (E(T) = 24), ossia
[12 mesi,36 mesi].
Marco Riani, Univ. di Parma
7
Pr(12 mesi ≤T≤36 mesi)
• Dato che T~N(24 mesi 62 mesi)
• Pr(12 <T<36)
• =Pr(µ-2σ<T<µ+2σ)=0,9545
Media e varianza del costo
complessivo del macchinario
•
•
•
•
•
•
•
•
C= v.a. che descrive il costo complessivo
CA=costo acquisto = 1000 €
CM = costo manutenzione annuo =150 €
T = v.a. che descrive la durata in mesi
C=CA+(CM/12) × T
C=1000+(25/2) T
con T~N(24m 62m)
E(C) =?
E(C)= 1000+ (25/2) E(T)=1300
VAR(C)=? VAR(C)= (25/2)2VAR(T)= 5625
Marco Riani, Univ. di Parma
8
Se avessi espresso tutto in anni
•
•
•
•
•
•
•
•
C= v.a. che descrive il costo complessivo
CA=costo acquisto = 1000 €
CM = costo manutenzione annuo =150 €
TA = v.a. che descrive la durata in anni
C=CA+CM × TA
C=1000+150 TA
con TA~N(2 0,52)
E(C) = 1000+ 150 E(TA)=1300
VAR(C)= 1502 VAR(TA)= 5625
Esercizio
• Sia X1, … Xn un campione casuale
estratto da un universo X con la seguente
distribuzione di Cauchy (T di student con
un solo grado di libertà)
Marco Riani, Univ. di Parma
9
Richieste
•
•
•
•
•
•
Verificare che f(x; θ, d) è una densità
Rappresentare graficamente f(x; θ, d)
Calcolare la funzione di ripartizione F(x)
Calcolare la mediana di X
Calcolare E(X)
Illustrare se in presenza di un campione
casuale estratto da questa densità è
possibile applicare il teorema centrale del
limite
• Verificare che 6,314 (ossia il numero
all’incrocio della prima riga e della prima
colonna della tabella di p. 150 del testo di
inferenza) è quantile che lascia alla sua
sinistra una probabilità pari a 0,95
• Trovare il quantile 0,995 (ossia il valore
che lascia alla sua destra una probabilità
pari a 0,005). Verificare che tale numero
risulta uguale a 63,656 (v. tabella di p. 150
del libro di inferenza)
Marco Riani, Univ. di Parma
10
Soluzione
• Verifica che è una densità
• Per chi desidera ripassare le proprietà
dell’arcotangente
http://it.wikipedia.org/wiki/Arcotangente
Rappresentazione grafica θ=0, d=1
Marco Riani, Univ. di Parma
11
Calcolo della funzione di ripartizione
θ=0, d=1
Calcolo della mediana
• La mediana (Me) per un v.c. continua con
funzione di densità f(x) e ripartizione F(x) è
definita come la soluzione della seguente
equazione
Mediana = quantile che lascia alla sua
destra ed alla sua sinistra una probabilità
pari a 0,5
Marco Riani, Univ. di Parma
12
Calcolo della mediana
Calcolo del valore atteso
• Per semplificare i calcoli possiamo
considerare la variabile di Cauchy in forma
«standardizzata» z= (x-θ)/d
Marco Riani, Univ. di Parma
13
• Domanda: illustrare se in presenza di un
campione casuale estratto da questa
densità è possibile applicare il teorema
centrale del limite
• Risposta: non è possibile applicare il
teorema centrale del limite in quanto
E(X)=∞. Di conseguenza lo scostamento
standardizzato della media campionaria
non si distribuisce come una v.c. normale
standardizzata
Verificare che 6,314 (ossia il numero all’incrocio della prima riga e
della prima colonna della tabella di p. 150 del testo di inferenza) è
quantile che lascia alla sua sinistra una probabilità pari a 0,95
Occorre verificare che
Marco Riani, Univ. di Parma
14
Trovare il quantile 0,995 (ossia il valore che lascia alla sua
destra una probabilità pari a 0,005). Verificare che tale numero
risulta uguale a 63,656 (v. tabella di p. 150 del libro di inferenza)
Occorre trovare x0,995 tale per cui
F(x0,995)=0,995
Osservazione: in Excel
=INV.T(0,01;1) =63,65674
Esercizio
• Si consideri una popolazione distribuita
secondo il seguente modello
X
Pi
2
0.3
5
0.6
7
0.1
• Si elenchino tutti i campioni di ampiezza 3 che si possono
estrarre con ripetizione da tale popolazione assegnando a
ciascun campione la relativa probabilità
• Si determini la distribuzione campionaria della media e la
si rappresenti graficamente
• Si calcoli il valore atteso e la varianza della media
campionaria
• Si determini la distribuzione campionaria della mediana ed
il suo valore atteso
Marco Riani, Univ. di Parma
15
Soluzione: spazio dei campioni
(27=33) e relative probabilità
X
Pi
2
0.3
5
0.6
7
0.1
Universo X
Distribuzione della media
campionaria
Marco Riani, Univ. di Parma
16
X
Pi
2
0.3
5
0.6
7
0.1
Universo X
Distribuzione della
media campionaria
Rappresentazione grafica della
distribuzione della media campionaria
• Quando n è elevato la distribuzione della media
campionaria è normale. Quando n è piccolo la
distribuzione dipende da quella dell’universo
Marco Riani, Univ. di Parma
17
X
2
5
7
Pi
0.3
0.6
0.1
Universo X
E(X)=4.3
Distribuzione
della mediana
campionaria
E(Me)=4.408. In questo caso lo stimatore
mediana campionaria è distorto Bias=0.108
Marco Riani, Univ. di Parma
18