Proprietà degli stimatori

Lo stimatore del parametro θ è la statistica
T=t(X1,X2,…,Xn), ovvero la funzione delle
osservazioni campionarie, utilizzata per
assegnare un valore al parametro incognito
Stima puntuale e stimatore
La stima t
può essere considerata

t
(
x
,

,
x
)
1
n
come una realizzazione della variabile casuale
chiamata stimatore di 
T

t
(
X
,

,
X
)
1
n
Esempio: campione osservato (2,5,3,6,4,4,1,2,2,5)
 media della popolazione.
Parametro:
110
Stimatore: media campionaria X 
X
i
10
i
1
,
4
Stima: x3
 
3
Stima puntuale e stimatore
Lo stimatore, dipendendo dal campione, è una
variabile casuale e quindi possiede una
distribuzione campionaria la cui conoscenza
permette di capire se lo stimatore scelto produrra
con elevata probabilità stime “vicine al valore vero
del parametro.
4
Proprietà degli stimatori
Per valutare la “bontà” di uno stimatoreT si può
guardare alle sue proprietà:
Proprietà per n finito:
- Correttezza
- Efficienza
Proprietà per n
(asintotiche):


- Consistenza
- Correttezza asintotica
5
Proprietà degli stimatori
Correttezza
Lo stimatore T è uno stimatore corretto di se
E
(
T
)

Per tutti i possibili valori di 
La distorsione di uno stimatore è uguale a:

B
(
T
)
)
E
(
T

6
Proprietà degli stimatori
Per valutare la prossimità diT a  possiamo usare l’errore
quadratico medio (mean square error) dato dalla quantità:


2
MSE
(
T
)

E
[(
T

)]
Proprietà:
2
2
MSE
(
T
)

E
[(
T

)]

Va
(
T
)

B
(
T
)
2
(
T
)

E
[
T

E
(
T
)]
dove Var
Diremo che T1 è più efficiente di T2 se
MSE
(
T
)

MSE
(
T
)
1
2
Per tutti i possibili valori di  .
Precisione e accuratezza di uno stimatore

Accuratezza: capacità di uno stimatore di essere corretto in
media. Uno stimatore non accurato è distorto. Il BIAS è
l’errore sistematico, non casuale, in cui i valori tendono ad
essere non accurati in una precisa direzione

Precisione (riproducibilità o attendibilità): capacità di un
certo stimatore di fornire lo stesso risultato o uno molto
simile con stime ripetute dello stesso parametro. L’errore
casuale da solo, se grande, può determinare mancanza di
precisione.
L’errore quadratico medio include in sé sia la misura
dell’accuratezza (Bias) sia la misura della precisione
(Varianza)
Accuratezza e precisione
Distorsione, precisione
Accuratezza, non precisione
Distorsione, non precisione
Proprietà degli stimatori
Nella figura sono riportate le distribuzioni campionarie di due
stimatori corretti. lo stimatore T1 (linea rossa) possiede un
errore quadratico medio (ossia una varianza) più piccolo di T2
(linea nera).
10
Sufficienza:

Uno stimatore sufficiente è tale se
raccoglie ed esaurisce tutte le informazioni
riguardanti θ contenute nel campione
casuale (x1,x2,…,xn)
n

Sono stimatori sufficienti:
x, f ,

xi
i1
Proprietà per grandi campioni
Consistenza:

Uno stimatore Tn è consistente in probabilità
per θ se:






0

lim
Pr
ob
T



1
n
n


Correttezza asintotica:
limETn
n

Stima puntuale della media della popolazione
Si consideri una popolazione X con media  e varianza
2
La media campionaria X è uno stimatore corretto per la
(
X
)
media della popolazione, ossia E

2

(
X
)
n
La varianza della media campionaria è Var
pertanto è uno stimatore consistente, poiché
2

lim
MSE
(
X
)

lim

0
n
n


n
n


 2

,

Se la popolazione è distribuita come una Normale, N
allora anche la media campionaria si distribuisce come una
Normale
2



X
N
, 
 n


13
Stima puntuale della proporzione della popolazione
Si consideri una popolazione X distribuita come una Bernoulli
con parametro .
La media campionaria X è uno stimatore corretto della
proporzione  della popolazione, ossia E
(
X
)





(
X
)

1

n
La varianza della media campionaria è Var
pertanto è uno stimatore consistente, poiché



1

lim
MSE
(
X
)

lim

0
n
n
n


n


14
Stima puntuale della varianza della popolazione
Si consideri una popolazione X con media  e varianza 
entrambe ignote.
2
Si definisce varianza campionaria corretta lo stimatore:
1n
2


S
 
X

X
i
n

1
i

1
2
S 2 è uno stimatore corretto della varianza della popolazione
2
2
, ossia E
(
S
)

Sn2 è uno stimatore consistente per  2 , ossia
2
lim
MSE
(
S
)

0
n
n


15
Stima per intervallo
Sia X una v.c. che rappresenta un carattere osservato su
una popolazione. Supponiamo che la v.c. sia definita da una
funzione di probabilità fx
;
dipendente dal parametro 
incognito.
,

,
x
,

,
X
Sia X
un campione di dimensione n e x
1
n
1
n
il corrispondente campione osservato.
Obiettivo:
Determinare due statistiche campionarie:
L

L
(
X
,

,
X
)
L

L
(
X
,

,
X
)
1
1
1
n
2
2
1
n
tali che L
1 L
2 per ogni possibile campione e che
l’intervallo L
1,L
2contenga il parametro  con probabilità 1
16
Stima per intervallo





L’intervallo casuale 
si
L
X
,

,
X
,
L
X
,

,
X
1
1
n
2
1
n
 
definisce intervallo di confidenza di livello 1 per il
parametro  se contiene con probabilità 1 il parametro
ignoto  della popolazione, ossia:






Pr
L
X
,

,
X


L
X
,

,
X

1

1
1
n
2
1
n
In genere si fissano valori di 1 pari a 0,99; 0,95; 0,90 e
viene detto livello di confidenza. Una volta estratto il campione
si ottiene l’intervallo di confidenza stimato.
17
Nota:
Non è possibile sapere se l’intervallo stimato contenga o meno il valore
vero del parametro; d’altra parte se si estraesse dalla popolazione un
numero sufficientemente elevato di campioni e calcolassimo i
corrispondenti intervalli di confidenza, circa il
di questi conterrebbe il parametro ignoto.
100
(
1

)
%

Stima per intervallo - esempio
Esempio (continua)
Nella seguente figura si mostrano, in corrispondenza di 6
campioni osservati, gl’intervalli di confidenza stimati per la
media della popolazione a un livello di confidenza 0,95.
Osserviamo che dal campione 5 si ottiene un intervallo
stimato che non contiene il vero parametro della popolazione.
18