7) GLI STIMATORI Def : una statistica è una qualunque funzione T = f ( X1,…,Xn ) della v.c. ( X1,…,Xn ) descritta dalla n-upla campionaria ( x1,…,xn ) Def : uno stimatore è una statistica Tn le cui determinazioni servono a fornire delle stime del parametro ignoto della v.c. X in cui sono state effettuate le n prove. Es.: Sia E un evento di probabilità sconosciuta . Per stimare questa prob. vengono effettuate n=2 prove bernoulliane che forniscono i valori x1 e x2. Allora la v.c. (X1 + X2) è una statistica, mentre la v.c. : 1 X 2 ( X1 X 2 ) 2 è uno stimatore in quanto si pensa che le sue determinazioni diano stime di 7.1) Stimatore per la media In generale, se X è una v.c. con legge ignota, viene assunto come stimatore per la media =E(X) della X, la v.c.: 1 n Xn Xi , n i 1 dove (X1,…,Xn) è la v.c. descritta dalla n-upla (x1,…,xn). 7.2) Stimatore per la varianza Si assume in generale come stimatore per la varianza 2 = VAR(X) la v.c.: n 1 S n2 ( X i X n )2 , n i 1 7.3) Proprietà Vediamo ora quali sono le proprietà che un generico stimatore Tn = f ( X1,…,Xn ) per un parametro incognito della v.c. X deve possedere perché le sue stime siano affidabili. 1) CORRETTEZZA Si dice che lo stimatore Tn = f ( X1,…,Xn ) è “corretto” o “non distorto” per il parametro se la media di Tn coincide con qualunque sia il suo valore compreso nello spazio parametrico . Cioè: E( Tn ) = . La stima fornita da uno stimatore corretto può dirsi “corretta in media”. Se non vale la relazione vista sopra allora lo stimatore è detto “distorto”, e la sua distorsione rispetto a viene misurata dalla quantità: n [ E( Tn ) ]. Se però al crescere di n il valore di n tende a 0, allora Tn viene detto stimatore “asintoticamente corretto” Dimostriamo che lo stimatore proposto per la media è “corretto”: 1 n Xn Xi , n i 1 1 n 1 n E( X n ) E X i E( X i ) n i 1 n i 1 Poiché le marginali X1,…,Xn di ( X1,…,Xn ) sono identiche alla v.c. X, risulta: 1 n 1 n E( X n ) E( X i ) n i 1 n i 1 Per cui lo stimatore media Xn è corretto per la Si può dimostrare invece che lo stimatore proposto per la varianza non è “corretto”. Lo stimatore corretto è il seguente: n 1 2 S n2 ( X X ) , i n n 1 i 1 Siccome si può sempre scrivere: n n 1 n 2 2 2 Sn ( Xi Xn ) S , n 1 n i 1 n 1 segue che: E 2 Sn n 2 E Sn n 1 2 quindi lo stimatore Sn2 è asintoticamente corretto per 2 in quanto: per n E Sn2 2 2) CONSISTENZA Questa proprietà indica la capacità di Tn di fornire stime migliori per al crescere della numerosità campionaria. Uno stimatore si dice “consistente” per se: lim PTn 1 n Se lo stimatore è corretto o asintoticamente corretto, un modo per verificarne la consistenza è quello di osservare il valore 2n: n2 E Tn 2 Se per n si verifica che 2n 0 allora lo stimatore Tn è detto “consistente” 3) EFFICIENZA Questa proprietà viene introdotta per poter scegliere tra più stimatori corretti e consistenti Esistono diversi criteri per effettuare la scelta; il più usato è quelle che si basa sul criterio della varianza: fra più stimatori corretti e consistenti per viene preferito quello con la varianza minore (cioè il “più efficiente”). Se la v.c. è normale (cioè una v.c. simmetrica) (=> media mediana x0.5) si hanno a disposizione due stimatori idonei: lo stimatore Media campionaria e lo stimatore Mediana campionaria X0.5. Per tali stimatori si ha: Var( X n ) 2 Var( X 0.5 ) n 2 2 n 1.57 2 n Ora: qual è il “minimo” valore che può assumere la varianza di uno stimatore? Posto che la v.c. di partenza soddisfi ad opportune condizioni, il minimo soddisfa alla disuguaglianza di Fréchet-Rao-Cramér: 1 Var( Tn ) nI ( ) dove I() è chiamata “informazione di Fisher” ed ha la seguente struttura: d I ( ) E log ( X ; d ) 2 cioè è la media del quadrato della derivata rispetto a del logaritmo della legge che governa la v.c. di cui è il parametro ignoto. È immediato osservare che tale minimo dipende esclusivamente dalla legge della v.c. in cui sono state effettuate le prove e dalla numerosità campionaria n ma non dalla natura dello stimatore.