APPLICAZIONI
DI
INFERENZA STATISTICA
2
Applicazioni di Probabilità e Statistica
Applicazioni di Inferenza Statistica
3
ESERCIZIO 1
Le ore di costante funzionamento giornaliero di cinque lampadine speciali
(li, i = 1, …, 5) campionate indipendentemente l’una dalle altre (c.c.s.) da una distribuzione di tipo Gamma (2; ) sono state:
1)
2)
3)
4)
l1
l2
l3
l4
l5
7.76
19.38
14.99
2.56
10.64
Si determini e rappresenti graficamente la funzione di log-verosimiglianza;
si individui la stima di massima verosimiglianza per ;
si individuino gli stimatori di   X  e di  2  X  ;
si dimostri che lo stimatore di   X  è corretto.
Si determinino, inoltre:
5) la distribuzione esatta e approssimata dello stimatore media campionaria e i relativi intervalli di confidenza.
Soluzione 1)
Si ricorda che la funzione di densità di una v.a. Gamma di parametri r  2 e 
è (Probabilità e statistica metodologica, formula IV.3.28):
2  x
 e x
f (X )  
0
x0
.
x0
La funzione di verosimiglianza (Probabilità e statistica metodologica, formula
IX.2.1) risulta essere:
n
n
 r e  xi x r 1
i 1
i 1
( r )
L  r ;     f  xi   

5
L  2;      2e   xi xi  10e 55,33 61404, 29
i 1
da cui la funzione di log-verosimiglianza (Probabilità e statistica metodologica,
formula IX.2.3):
4
Applicazioni di Probabilità e Statistica

 5

l  2;    ln    2e   xi xi  
 i 1


 ln 61404, 29  10e 55,33  ln 61404, 29  ln 10  55,33 
 10ln   55,33  11,025 .
La rappresentazione grafica è la seguente:
0
λ
‐5
l [λ]
‐10
‐15
‐20
‐25
‐30
‐35
‐40
‐45
‐50
Soluzione 2)
La stima di massima verosimiglianza viene ricavata eguagliando a zero la derivata prima della funzione di log-verosimiglianza (Probabilità e statistica metodologica, formula IX.2.12):
l     0

10

 55,33  0 .
La soluzione dell’equazione porta a:
ˆ 
10
 0,18 .
55,33
Applicazioni di Inferenza Statistica
5
Soluzione 3)
Individuata la stima di  e ricordando le formulazioni della media e della varianza
della v.a. Gamma (Probabilità e statistica metodologica, formule IV.3.37-38), si possono ricavare le stime di queste ultime come segue:
r
2

 11,11
ˆ 0,18
2
r
ˆ X2  2 
 61,73 .
ˆ
0,182

ˆ X 
Soluzione 4)
Dalle soluzioni 2) e 3) si deduce che la stima di  è:
ˆ 
2n
n
 xi
i 1
n
ˆ X 
 xi
2
2

 i 1
ˆ
2
n
n

n
 xi
i 1
2
n 
  xi 
ˆ
2
2
2
  i 1 2   X .
ˆX  2 
2
2
2n
ˆ


 2 
 n 
  xi 
 i 1 
Ne segue che affinché gli stimatori per la media e la varianza siano corretti deve risultare:
2
M  ˆ X  

 
M ˆ X2 
2
2
.
Essendo ˆ X la stima della media aritmetica nel campionamento casuale semplice, è sicuramente corretta.
6
Applicazioni di Probabilità e Statistica
Il valore atteso della stima della varianza è:
 
M ˆ X2
2
  n 2 
 n 
x
x
  i  
 i
1 
 2 
 M  2   M   i 1 2    M  i 1  .
 2n  2  n 
 ˆ 








2
n 
Si noti che la quantità   xi  è pari a:
 i 1 
x
2
1

 x22  ...  2 x1 x2  ...  2 x1 xn  ...  2 xn 1 xn .
Conseguentemente, nel momento in cui si deve calcolare il valore atteso della
suddetta somma è necessario ricavare quello dei suoi singoli addendi. Ciò implica
2
n 
che il calcolo di M   xi  richiede la determinazione di nuove variabili aleatorie.
 i 1 
Si può ovviare a tale problema tramite simulazione computazionale; tuttavia, la
numerosità campionaria non è sufficientemente alta da ottenere risultati soddisfacenti al fine di dare un giudizio sulla correttezza dello stimatore della varianza.
Soluzione 5)
La distribuzione esatta della media campionaria:
n
ˆ X 
 xi
i 1
n
si ottiene come somma di n v.a. Gamma  ( r  s,  ) divise per n. Dal momento che
se X ~  (r ,  ) e Y ~  ( s,  )  Z   X  Y  ~  (r  s,  ) , la somma di cinque variabili Gamma  (r ,  ) identicamente distribuite è una  (5r ,  ) . Pertanto, definita
  X 1  X 2  X 3  X 4  X 5 si ha che  ~  10,   . La v.a. Media Campionaria è
dunque:

X 
5
con distribuzione  (5r ,5 ) :
5r
5  e5 x x 5r 1

f (X ) 
.
(5r )
7
Applicazioni di Inferenza Statistica
Pertanto l’intervallo di confidenza esatto a un livello 1   % si ottiene nel seguente modo:
Infesatto
f x d x   2

f  x  d x  1 2
0
Supesatto
.
Ipotizzando un valore di  pari al 5%, dalle tavole della v.a. Gamma di parametri 5r  10 e 5  5  0,18  0,9 si ottiene rispettivamente per l’estremo inferiore
3,345 e per l’estremo superiore 17,998.
Ai fini di individuare l’intervallo di confidenza approssimato si ipotizza per la
media campionaria la distribuzione t di Student con 4 gradi di libertà. L’intervallo,
ipotizzando   0,05 , è dunque:
x  t g ; 2  s    x  t g ; 2  s

11,11  2,77  7,856    11,11  2,77  7,856

10,65    32,87 .
Si osservi che l’intervallo di confidenza approssimato è molto differente da
quello esatto. In particolare, poichè x > 0 non ha senso che l’intervallo di confidenza
comprenda valori negativi. Inoltre, l’intervallo esatto ha un’ampiezza molto minore di quello approssimato.
L’inesattezza dell’intervallo di confidenza approssimato è legata alla bassa numerosità campionaria (n = 5) in conseguenza della quale non ci si può appellare al
Teorema del Limite Centrale.
ESERCIZIO 2
Le lunghezze li (i = 1, ..., 6) in cm di 6 tavole estratte casualmente dalla
produzione di un macchinario che segue una legge Normale N 120,   sono:
l1
l2
l3
l4
l5
l6
130.44
137.20
113.92
130.21
110.81
120.86
8
Applicazioni di Probabilità e Statistica
1) si determini e rappresenti graficamente la funzione di log-verosimiglianza l();
2) si individui la stima di massima verosimiglianza per ;
3) si valuti la correttezza dello stimatore per  ;
4) si determini, inoltre l’intervallo di confidenza per la varianza.
Soluzione 1)
La funzione di verosimiglianza (Probabilità e statistica metodologica, formula
IX.2.1) risulta:
6
L    
i 1
1
2 2
e
1  x 120 
  i

2  

2
1
8 3
6
3
2
1 6  xi 120 

 
 1   1   2 i1

  2 e
 2    

e
6

631,24
2 2
.
Ne segue la funzione di log-verosimiglianza (Probabilità e statistica metodologica, formula IX.2.3):
631,24



1 1
1
315,62
2 2 

 ln 3  3ln  2 
.
l    ln
e
 8 3  6

2
8


Graficamente:
σ
l(σ)
Applicazioni di Inferenza Statistica
9
Soluzione 2)
Per individuare la stima di massima verosimiglianza per  si pone uguale a zero
la derivata prima della funzione di log-verosimiglianza (Probabilità e statistica
metodologica, formula IX.2.12):
6 631, 24
0
l '     

3



ˆ 6ˆ 2  631, 24  0

ˆ  105, 21
2

ˆ  10, 26
.
Soluzione 3)
Dalla soluzione 2) si osserva che:
n
ˆ 2 
 ( xi  x )2
i 1
n
.
Tale formulazione, come si evince dalle nozioni di inferenza statistica, non porta a una stima corretta della varianza.
Soluzione 4)
L’intervallo di confidenza risulta:
ˆ 2
 n21;
2 
2
ˆ 2
 n21;1
.
2
Ipotizzando   0,05 si ottiene:
631, 24
631, 24
2 
12,8325
0,8312

49,19   2  759, 43 .