APPLICAZIONI DI INFERENZA STATISTICA 2 Applicazioni di Probabilità e Statistica Applicazioni di Inferenza Statistica 3 ESERCIZIO 1 Le ore di costante funzionamento giornaliero di cinque lampadine speciali (li, i = 1, …, 5) campionate indipendentemente l’una dalle altre (c.c.s.) da una distribuzione di tipo Gamma (2; ) sono state: 1) 2) 3) 4) l1 l2 l3 l4 l5 7.76 19.38 14.99 2.56 10.64 Si determini e rappresenti graficamente la funzione di log-verosimiglianza; si individui la stima di massima verosimiglianza per ; si individuino gli stimatori di X e di 2 X ; si dimostri che lo stimatore di X è corretto. Si determinino, inoltre: 5) la distribuzione esatta e approssimata dello stimatore media campionaria e i relativi intervalli di confidenza. Soluzione 1) Si ricorda che la funzione di densità di una v.a. Gamma di parametri r 2 e è (Probabilità e statistica metodologica, formula IV.3.28): 2 x e x f (X ) 0 x0 . x0 La funzione di verosimiglianza (Probabilità e statistica metodologica, formula IX.2.1) risulta essere: n n r e xi x r 1 i 1 i 1 ( r ) L r ; f xi 5 L 2; 2e xi xi 10e 55,33 61404, 29 i 1 da cui la funzione di log-verosimiglianza (Probabilità e statistica metodologica, formula IX.2.3): 4 Applicazioni di Probabilità e Statistica 5 l 2; ln 2e xi xi i 1 ln 61404, 29 10e 55,33 ln 61404, 29 ln 10 55,33 10ln 55,33 11,025 . La rappresentazione grafica è la seguente: 0 λ ‐5 l [λ] ‐10 ‐15 ‐20 ‐25 ‐30 ‐35 ‐40 ‐45 ‐50 Soluzione 2) La stima di massima verosimiglianza viene ricavata eguagliando a zero la derivata prima della funzione di log-verosimiglianza (Probabilità e statistica metodologica, formula IX.2.12): l 0 10 55,33 0 . La soluzione dell’equazione porta a: ˆ 10 0,18 . 55,33 Applicazioni di Inferenza Statistica 5 Soluzione 3) Individuata la stima di e ricordando le formulazioni della media e della varianza della v.a. Gamma (Probabilità e statistica metodologica, formule IV.3.37-38), si possono ricavare le stime di queste ultime come segue: r 2 11,11 ˆ 0,18 2 r ˆ X2 2 61,73 . ˆ 0,182 ˆ X Soluzione 4) Dalle soluzioni 2) e 3) si deduce che la stima di è: ˆ 2n n xi i 1 n ˆ X xi 2 2 i 1 ˆ 2 n n n xi i 1 2 n xi ˆ 2 2 2 i 1 2 X . ˆX 2 2 2 2n ˆ 2 n xi i 1 Ne segue che affinché gli stimatori per la media e la varianza siano corretti deve risultare: 2 M ˆ X M ˆ X2 2 2 . Essendo ˆ X la stima della media aritmetica nel campionamento casuale semplice, è sicuramente corretta. 6 Applicazioni di Probabilità e Statistica Il valore atteso della stima della varianza è: M ˆ X2 2 n 2 n x x i i 1 2 M 2 M i 1 2 M i 1 . 2n 2 n ˆ 2 n Si noti che la quantità xi è pari a: i 1 x 2 1 x22 ... 2 x1 x2 ... 2 x1 xn ... 2 xn 1 xn . Conseguentemente, nel momento in cui si deve calcolare il valore atteso della suddetta somma è necessario ricavare quello dei suoi singoli addendi. Ciò implica 2 n che il calcolo di M xi richiede la determinazione di nuove variabili aleatorie. i 1 Si può ovviare a tale problema tramite simulazione computazionale; tuttavia, la numerosità campionaria non è sufficientemente alta da ottenere risultati soddisfacenti al fine di dare un giudizio sulla correttezza dello stimatore della varianza. Soluzione 5) La distribuzione esatta della media campionaria: n ˆ X xi i 1 n si ottiene come somma di n v.a. Gamma ( r s, ) divise per n. Dal momento che se X ~ (r , ) e Y ~ ( s, ) Z X Y ~ (r s, ) , la somma di cinque variabili Gamma (r , ) identicamente distribuite è una (5r , ) . Pertanto, definita X 1 X 2 X 3 X 4 X 5 si ha che ~ 10, . La v.a. Media Campionaria è dunque: X 5 con distribuzione (5r ,5 ) : 5r 5 e5 x x 5r 1 f (X ) . (5r ) 7 Applicazioni di Inferenza Statistica Pertanto l’intervallo di confidenza esatto a un livello 1 % si ottiene nel seguente modo: Infesatto f x d x 2 f x d x 1 2 0 Supesatto . Ipotizzando un valore di pari al 5%, dalle tavole della v.a. Gamma di parametri 5r 10 e 5 5 0,18 0,9 si ottiene rispettivamente per l’estremo inferiore 3,345 e per l’estremo superiore 17,998. Ai fini di individuare l’intervallo di confidenza approssimato si ipotizza per la media campionaria la distribuzione t di Student con 4 gradi di libertà. L’intervallo, ipotizzando 0,05 , è dunque: x t g ; 2 s x t g ; 2 s 11,11 2,77 7,856 11,11 2,77 7,856 10,65 32,87 . Si osservi che l’intervallo di confidenza approssimato è molto differente da quello esatto. In particolare, poichè x > 0 non ha senso che l’intervallo di confidenza comprenda valori negativi. Inoltre, l’intervallo esatto ha un’ampiezza molto minore di quello approssimato. L’inesattezza dell’intervallo di confidenza approssimato è legata alla bassa numerosità campionaria (n = 5) in conseguenza della quale non ci si può appellare al Teorema del Limite Centrale. ESERCIZIO 2 Le lunghezze li (i = 1, ..., 6) in cm di 6 tavole estratte casualmente dalla produzione di un macchinario che segue una legge Normale N 120, sono: l1 l2 l3 l4 l5 l6 130.44 137.20 113.92 130.21 110.81 120.86 8 Applicazioni di Probabilità e Statistica 1) si determini e rappresenti graficamente la funzione di log-verosimiglianza l(); 2) si individui la stima di massima verosimiglianza per ; 3) si valuti la correttezza dello stimatore per ; 4) si determini, inoltre l’intervallo di confidenza per la varianza. Soluzione 1) La funzione di verosimiglianza (Probabilità e statistica metodologica, formula IX.2.1) risulta: 6 L i 1 1 2 2 e 1 x 120 i 2 2 1 8 3 6 3 2 1 6 xi 120 1 1 2 i1 2 e 2 e 6 631,24 2 2 . Ne segue la funzione di log-verosimiglianza (Probabilità e statistica metodologica, formula IX.2.3): 631,24 1 1 1 315,62 2 2 ln 3 3ln 2 . l ln e 8 3 6 2 8 Graficamente: σ l(σ) Applicazioni di Inferenza Statistica 9 Soluzione 2) Per individuare la stima di massima verosimiglianza per si pone uguale a zero la derivata prima della funzione di log-verosimiglianza (Probabilità e statistica metodologica, formula IX.2.12): 6 631, 24 0 l ' 3 ˆ 6ˆ 2 631, 24 0 ˆ 105, 21 2 ˆ 10, 26 . Soluzione 3) Dalla soluzione 2) si osserva che: n ˆ 2 ( xi x )2 i 1 n . Tale formulazione, come si evince dalle nozioni di inferenza statistica, non porta a una stima corretta della varianza. Soluzione 4) L’intervallo di confidenza risulta: ˆ 2 n21; 2 2 ˆ 2 n21;1 . 2 Ipotizzando 0,05 si ottiene: 631, 24 631, 24 2 12,8325 0,8312 49,19 2 759, 43 .