Stime e stimatori

Capitolo 17
Suggerimenti agli esercizi a cura di Elena Siletti
Esercizio 17.1: Suggerimento
Si ricordi che X1 , X2 , X3 sono v.c. indipendenti quando le estrazioni sono con
riposizione.
Uno stimatore Tn si dice non distorto se il suo valore atteso coincide con il parametro
oggetto di stima:
E(Tn ) = θ
Uno stimatore non distorto 1 Tn è più efficiente di un secondo stimatore non distorto
se la sua varianza è più piccola:
2 Tn
Var(1 Tn ) < Var(2 Tn )
Esercizio 17.2: Suggerimento
Uno stimatore Tn si dice non distorto se il suo valore atteso coincide con il
parametro oggetto di stima:
E(Tn ) = θ
Uno stimatore non distorto 1 Tn è più efficiente di un secondo stimatore non distorto
se la sua varianza è più piccola:
2 Tn
Var(1 Tn ) < Var(2 Tn )
Lo stimatore T2 è la media campionaria. È noto che:
- è stimatore non distorto della media della popolazione E(T2 ) = µ;
- è stimatore consistente ed è il più efficiente fra gli stimatori non distorti di µ , con
M SE(Ȳ ) = V (Ȳ ) =
σ2
n
Esercizio 17.3: Suggerimento
c 2010
F. Mecatti,
dibase.
base Come,
The perché,
McGraw-Hill
Companies,
srl
Fulvia
Mecatti,Statistica
Statistica di
quando,
2e. © 2015,
ISBN 9788838668852
1
2
Capitolo 17 - Suggerimenti agli esercizi
Stimatore non distorto della media µ della popolazione è lo Stimatore Media
Campionaria:
n
1X
X̄ =
Xi
n i=1
La stima dell’errore medio di stima, calcolata sugli stessi dati campionari, è detta
Standard Error dello stimatore, per la Media Campionaria è:
r
s2
SE (x̄) =
n
tale numero quantifica probabilisticamente la precisione dello stimatore.
Stimatore non distorto della varianza σ 2 della popolazione è lo Stimatore Varianza
Campionaria Corretta:
n
2
1 X
S2 =
Xi − X̄
n − 1 i=1
Esercizio 17.4: Suggerimento
Stimatore non distorto della media µ della popolazione è lo Stimatore Media
Campionaria:
n
1X
Xi
X̄ =
n i=1
La varianza dello Stimatore Media Campionaria è:
σ2
V ar X̄ =
n
La deviazione standard dello stimatore equivale all’Errore quadratico medio,
ovvero in questo caso con
2
M SE X̄ = E X̄ − µ = V X̄
Esercizio 17.5: Suggerimento
La stima più naturale per l’ignota frequenza relativa p di soggetti classificati
nella categoria d’interesse, è la corrispondente frequenza relativa nel campione cioè
la Frequenza Relativa Campionaria p̂.
La stima dell’errore medio di stima, calcolata sugli stessi dati campionari, è detta
Standard Error dello stimatore, che nel caso della percentuale è:
r
p̂ (1 − p̂)
SE (p̂) =
n
Fulvia Mecatti,
base. Come,
2e. ©McGraw-Hill
2015, ISBN 9788838668852
c perché,
F.Statistica
Mecatti,diStatistica
di quando,
base 2010 The
Companies, srl
Capitolo 17 - Suggerimenti agli esercizi
3
Esercizio 17.6: Suggerimento
Uno stimatore Tn si dice non distorto se il suo valore atteso coincide con il
parametro oggetto di stima:
E(Tn ) = θ
Uno stimatore non distorto 1 Tn è più efficiente di un secondo stimatore non distorto
se la sua varianza è più piccola:
2 Tn
Var(1 Tn ) < Var(2 Tn )
La stima dell’errore medio di stima, calcolata sugli stessi dati campionari, è detta
Standard Error dello stimatore:
√
SE = stima per M SE
Esercizio 17.7: Suggerimento
La stima più naturale per l’ignota frequenza relativa p di soggetti classificati
nella categoria d’interesse, è la corrispondente frequenza relativa nel campione cioè
la Frequenza Relativa Campionaria p̂.
La stima dell’errore medio di stima, calcolata sugli stessi dati campionari, è detta
Standard Error dello stimatore, che nel caso della percentuale è:
r
p̂ (1 − p̂)
SE (p̂) =
n
Esercizio 17.8: Suggerimento
Fare inferenza sul modello lineare significa stimare i parametri a e b dai dati campionari. Le stime da utilizzare per gli ignoti parametri sono quelli che minimizzano i
minimi quadrati :
a = ȳ − b · x̄
sXY
b= 2
sX
dove
sXY =
1 XX
(xi − x̄) (yj − ȳ) fij
n−1 i j
s2X =
1 X
(xi − x̄) fi.
n−1 i
cperché,
Mecatti,
Statistica
base 20102e.
The
McGraw-Hill
Companies, srl
Fulvia Mecatti,F.
Statistica
di base.
Come,diquando,
© 2015,
ISBN 9788838668852
4
Capitolo 17 - Suggerimenti agli esercizi
La stima della varianza degli errori si ottiene come:
s2ε =
1 XX
2
(yi − ŷj ) fij
n−2 i j
da cui è possibile ottenere i rispettivi standard error associabili alle stime dei parametri:
s x̄2
1
2
+
SE (â) = sε
n (n − 1) s2X
s
s2ε
SE b̂ =
(n − 1) s2X
Esercizio 17.9: Suggerimento
Il diagramma a dispersione o scatter plot è uno strumento grafico utile per visualizzare il tipo di relazione esistente tra due variabili. È un diagramma cartesiano
con gli assi intestati alle modalità dei due fenomeni, ad esempio X sulle ascisse ed Y
sulle ordinate. Le coppie di valori osservati sono viste come coordinate di punti sul
diagramma. La tabella osservata è rappresentata sullo scatter plot come una nuvola
di punti.
Fare inferenza sul modello lineare significa stimare i parametri a e b dai dati campionari. Le stime da utilizzare per gli ignoti parametri sono quelli che minimizzano i
minimi quadrati :
a = ȳ − b · x̄
sXY
b= 2
sX
dove
sXY =
1 XX
(xi − x̄) (yj − ȳ) fij
n−1 i j
s2X =
1 X
(xi − x̄) fi.
n−1 i
La bontà di adattamento del modello si valuta mediante il seguente indice:
s2
r2 = p XY
s2X s2Y
Accanto alla misura analitica r2 dell’adattamento del modello è utile un’analisi grafica degli n residui disegnadoli su un grafico. Tale grafico ha l’aspetto di una nuvola
cperché,
Mecatti,
base 2010 2e.
The
McGraw-Hill
Companies, srl
Fulvia Mecatti,F.Statistica
di Statistica
base. Come,diquando,
© 2015,
ISBN 9788838668852
Capitolo 17 - Suggerimenti agli esercizi
5
di punti più o meno sparpagliati intorno allo 0. Residui ben sparpagliati, che si dispongono a caso intorno allo 0, senza mostrare alcuna struttura o sistematicità, sono
residui con un buon comportamento, ovvero che il modello lineare è un buon modello
per interpretare la variabile Y in funzione di X ed in genrale corrispondono ad un r2
vicino allo 0.
Esercizio 17.10: Suggerimento
Il diagramma a dispersione o scatter plot è uno strumento grafico utile per visualizzare il tipo di relazione esistente tra due variabili. È un diagramma cartesiano
con gli assi intestati alle modalità dei due fenomeni, ad esempio X sulle ascisse ed Y
sulle ordinate. Le coppie di valori osservati sono viste come coordinate di punti sul
diagramma. La tabella osservata è rappresentata sullo scatter plot come una nuvola
di punti.
Fare inferenza sul modello lineare significa stimare i parametri a e b dai dati campionari. Le stime da utilizzare per gli ignoti parametri sono quelli che minimizzano i
minimi quadrati :
a = ȳ − b · x̄
sXY
b= 2
sX
dove
1 XX
sXY =
(xi − x̄) (yj − ȳ) fij
n−1 i j
s2X =
1 X
(xi − x̄) fi.
n−1 i
Il parametro a è l’intercetta, mentre b è la pendenza della retta.
La stima della varianza degli errori si ottiene come:
1 XX
2
s2ε =
(yi − ŷj ) fij
n−2 i j
da cui è possibile ottenere i rispettivi standard error associabili alle stime dei parametri:
s x̄2
1
2
+
SE (â) = sε
n (n − 1) s2X
s
s2ε
SE b̂ =
(n − 1) s2X
La bontà di adattamento del modello si valuta mediante il seguente indice:
s2
r2 = p XY
s2X s2Y
Fulvia Mecatti,
base. Come,
2015, ISBN 9788838668852
c perché,
F.Statistica
Mecatti,diStatistica
diquando,
base 2010 2e.
The© McGraw-Hill
Companies, srl
6
Capitolo 17 - Suggerimenti agli esercizi
Il modello può essere utilizzato per prevedere e simulare valori non osservati di Y ,
utilizzando X come predittore.
Fulvia Mecatti,F.
Statistica
di base.
Come,di
quando,
© 2015,
ISBN 9788838668852
cperché,
Mecatti,
Statistica
base 20102e.
The
McGraw-Hill
Companies, srl