Stime e stimatori

annuncio pubblicitario
Capitolo 17
Suggerimenti agli esercizi a cura di Elena Siletti
Esercizio 17.1: Suggerimento
Si ricordi che X1 , X2 , X3 sono v.c. indipendenti quando le estrazioni sono con
riposizione.
Uno stimatore Tn si dice non distorto se il suo valore atteso coincide con il parametro
oggetto di stima:
E(Tn ) = θ
Uno stimatore non distorto 1 Tn è più efficiente di un secondo stimatore non distorto
se la sua varianza è più piccola:
2 Tn
Var(1 Tn ) < Var(2 Tn )
Esercizio 17.2: Suggerimento
Uno stimatore Tn si dice non distorto se il suo valore atteso coincide con il
parametro oggetto di stima:
E(Tn ) = θ
Uno stimatore non distorto 1 Tn è più efficiente di un secondo stimatore non distorto
se la sua varianza è più piccola:
2 Tn
Var(1 Tn ) < Var(2 Tn )
Lo stimatore T2 è la media campionaria. È noto che:
- è stimatore non distorto della media della popolazione E(T2 ) = µ;
- è stimatore consistente ed è il più efficiente fra gli stimatori non distorti di µ , con
M SE(Ȳ ) = V (Ȳ ) =
σ2
n
Esercizio 17.3: Suggerimento
c 2010
F. Mecatti,
dibase.
base Come,
The perché,
McGraw-Hill
Companies,
srl
Fulvia
Mecatti,Statistica
Statistica di
quando,
2e. © 2015,
ISBN 9788838668852
1
2
Capitolo 17 - Suggerimenti agli esercizi
Stimatore non distorto della media µ della popolazione è lo Stimatore Media
Campionaria:
n
1X
X̄ =
Xi
n i=1
La stima dell’errore medio di stima, calcolata sugli stessi dati campionari, è detta
Standard Error dello stimatore, per la Media Campionaria è:
r
s2
SE (x̄) =
n
tale numero quantifica probabilisticamente la precisione dello stimatore.
Stimatore non distorto della varianza σ 2 della popolazione è lo Stimatore Varianza
Campionaria Corretta:
n
2
1 X
S2 =
Xi − X̄
n − 1 i=1
Esercizio 17.4: Suggerimento
Stimatore non distorto della media µ della popolazione è lo Stimatore Media
Campionaria:
n
1X
Xi
X̄ =
n i=1
La varianza dello Stimatore Media Campionaria è:
σ2
V ar X̄ =
n
La deviazione standard dello stimatore equivale all’Errore quadratico medio,
ovvero in questo caso con
2
M SE X̄ = E X̄ − µ = V X̄
Esercizio 17.5: Suggerimento
La stima più naturale per l’ignota frequenza relativa p di soggetti classificati
nella categoria d’interesse, è la corrispondente frequenza relativa nel campione cioè
la Frequenza Relativa Campionaria p̂.
La stima dell’errore medio di stima, calcolata sugli stessi dati campionari, è detta
Standard Error dello stimatore, che nel caso della percentuale è:
r
p̂ (1 − p̂)
SE (p̂) =
n
Fulvia Mecatti,
base. Come,
2e. ©McGraw-Hill
2015, ISBN 9788838668852
c perché,
F.Statistica
Mecatti,diStatistica
di quando,
base 2010 The
Companies, srl
Capitolo 17 - Suggerimenti agli esercizi
3
Esercizio 17.6: Suggerimento
Uno stimatore Tn si dice non distorto se il suo valore atteso coincide con il
parametro oggetto di stima:
E(Tn ) = θ
Uno stimatore non distorto 1 Tn è più efficiente di un secondo stimatore non distorto
se la sua varianza è più piccola:
2 Tn
Var(1 Tn ) < Var(2 Tn )
La stima dell’errore medio di stima, calcolata sugli stessi dati campionari, è detta
Standard Error dello stimatore:
√
SE = stima per M SE
Esercizio 17.7: Suggerimento
La stima più naturale per l’ignota frequenza relativa p di soggetti classificati
nella categoria d’interesse, è la corrispondente frequenza relativa nel campione cioè
la Frequenza Relativa Campionaria p̂.
La stima dell’errore medio di stima, calcolata sugli stessi dati campionari, è detta
Standard Error dello stimatore, che nel caso della percentuale è:
r
p̂ (1 − p̂)
SE (p̂) =
n
Esercizio 17.8: Suggerimento
Fare inferenza sul modello lineare significa stimare i parametri a e b dai dati campionari. Le stime da utilizzare per gli ignoti parametri sono quelli che minimizzano i
minimi quadrati :
a = ȳ − b · x̄
sXY
b= 2
sX
dove
sXY =
1 XX
(xi − x̄) (yj − ȳ) fij
n−1 i j
s2X =
1 X
(xi − x̄) fi.
n−1 i
cperché,
Mecatti,
Statistica
base 20102e.
The
McGraw-Hill
Companies, srl
Fulvia Mecatti,F.
Statistica
di base.
Come,diquando,
© 2015,
ISBN 9788838668852
4
Capitolo 17 - Suggerimenti agli esercizi
La stima della varianza degli errori si ottiene come:
s2ε =
1 XX
2
(yi − ŷj ) fij
n−2 i j
da cui è possibile ottenere i rispettivi standard error associabili alle stime dei parametri:
s x̄2
1
2
+
SE (â) = sε
n (n − 1) s2X
s
s2ε
SE b̂ =
(n − 1) s2X
Esercizio 17.9: Suggerimento
Il diagramma a dispersione o scatter plot è uno strumento grafico utile per visualizzare il tipo di relazione esistente tra due variabili. È un diagramma cartesiano
con gli assi intestati alle modalità dei due fenomeni, ad esempio X sulle ascisse ed Y
sulle ordinate. Le coppie di valori osservati sono viste come coordinate di punti sul
diagramma. La tabella osservata è rappresentata sullo scatter plot come una nuvola
di punti.
Fare inferenza sul modello lineare significa stimare i parametri a e b dai dati campionari. Le stime da utilizzare per gli ignoti parametri sono quelli che minimizzano i
minimi quadrati :
a = ȳ − b · x̄
sXY
b= 2
sX
dove
sXY =
1 XX
(xi − x̄) (yj − ȳ) fij
n−1 i j
s2X =
1 X
(xi − x̄) fi.
n−1 i
La bontà di adattamento del modello si valuta mediante il seguente indice:
s2
r2 = p XY
s2X s2Y
Accanto alla misura analitica r2 dell’adattamento del modello è utile un’analisi grafica degli n residui disegnadoli su un grafico. Tale grafico ha l’aspetto di una nuvola
cperché,
Mecatti,
base 2010 2e.
The
McGraw-Hill
Companies, srl
Fulvia Mecatti,F.Statistica
di Statistica
base. Come,diquando,
© 2015,
ISBN 9788838668852
Capitolo 17 - Suggerimenti agli esercizi
5
di punti più o meno sparpagliati intorno allo 0. Residui ben sparpagliati, che si dispongono a caso intorno allo 0, senza mostrare alcuna struttura o sistematicità, sono
residui con un buon comportamento, ovvero che il modello lineare è un buon modello
per interpretare la variabile Y in funzione di X ed in genrale corrispondono ad un r2
vicino allo 0.
Esercizio 17.10: Suggerimento
Il diagramma a dispersione o scatter plot è uno strumento grafico utile per visualizzare il tipo di relazione esistente tra due variabili. È un diagramma cartesiano
con gli assi intestati alle modalità dei due fenomeni, ad esempio X sulle ascisse ed Y
sulle ordinate. Le coppie di valori osservati sono viste come coordinate di punti sul
diagramma. La tabella osservata è rappresentata sullo scatter plot come una nuvola
di punti.
Fare inferenza sul modello lineare significa stimare i parametri a e b dai dati campionari. Le stime da utilizzare per gli ignoti parametri sono quelli che minimizzano i
minimi quadrati :
a = ȳ − b · x̄
sXY
b= 2
sX
dove
1 XX
sXY =
(xi − x̄) (yj − ȳ) fij
n−1 i j
s2X =
1 X
(xi − x̄) fi.
n−1 i
Il parametro a è l’intercetta, mentre b è la pendenza della retta.
La stima della varianza degli errori si ottiene come:
1 XX
2
s2ε =
(yi − ŷj ) fij
n−2 i j
da cui è possibile ottenere i rispettivi standard error associabili alle stime dei parametri:
s x̄2
1
2
+
SE (â) = sε
n (n − 1) s2X
s
s2ε
SE b̂ =
(n − 1) s2X
La bontà di adattamento del modello si valuta mediante il seguente indice:
s2
r2 = p XY
s2X s2Y
Fulvia Mecatti,
base. Come,
2015, ISBN 9788838668852
c perché,
F.Statistica
Mecatti,diStatistica
diquando,
base 2010 2e.
The© McGraw-Hill
Companies, srl
6
Capitolo 17 - Suggerimenti agli esercizi
Il modello può essere utilizzato per prevedere e simulare valori non osservati di Y ,
utilizzando X come predittore.
Fulvia Mecatti,F.
Statistica
di base.
Come,di
quando,
© 2015,
ISBN 9788838668852
cperché,
Mecatti,
Statistica
base 20102e.
The
McGraw-Hill
Companies, srl
Scarica