Capitolo 17 Suggerimenti agli esercizi a cura di Elena Siletti Esercizio 17.1: Suggerimento Si ricordi che X1 , X2 , X3 sono v.c. indipendenti quando le estrazioni sono con riposizione. Uno stimatore Tn si dice non distorto se il suo valore atteso coincide con il parametro oggetto di stima: E(Tn ) = θ Uno stimatore non distorto 1 Tn è più efficiente di un secondo stimatore non distorto se la sua varianza è più piccola: 2 Tn Var(1 Tn ) < Var(2 Tn ) Esercizio 17.2: Suggerimento Uno stimatore Tn si dice non distorto se il suo valore atteso coincide con il parametro oggetto di stima: E(Tn ) = θ Uno stimatore non distorto 1 Tn è più efficiente di un secondo stimatore non distorto se la sua varianza è più piccola: 2 Tn Var(1 Tn ) < Var(2 Tn ) Lo stimatore T2 è la media campionaria. È noto che: - è stimatore non distorto della media della popolazione E(T2 ) = µ; - è stimatore consistente ed è il più efficiente fra gli stimatori non distorti di µ , con M SE(Ȳ ) = V (Ȳ ) = σ2 n Esercizio 17.3: Suggerimento c 2010 F. Mecatti, dibase. base Come, The perché, McGraw-Hill Companies, srl Fulvia Mecatti,Statistica Statistica di quando, 2e. © 2015, ISBN 9788838668852 1 2 Capitolo 17 - Suggerimenti agli esercizi Stimatore non distorto della media µ della popolazione è lo Stimatore Media Campionaria: n 1X X̄ = Xi n i=1 La stima dell’errore medio di stima, calcolata sugli stessi dati campionari, è detta Standard Error dello stimatore, per la Media Campionaria è: r s2 SE (x̄) = n tale numero quantifica probabilisticamente la precisione dello stimatore. Stimatore non distorto della varianza σ 2 della popolazione è lo Stimatore Varianza Campionaria Corretta: n 2 1 X S2 = Xi − X̄ n − 1 i=1 Esercizio 17.4: Suggerimento Stimatore non distorto della media µ della popolazione è lo Stimatore Media Campionaria: n 1X Xi X̄ = n i=1 La varianza dello Stimatore Media Campionaria è: σ2 V ar X̄ = n La deviazione standard dello stimatore equivale all’Errore quadratico medio, ovvero in questo caso con 2 M SE X̄ = E X̄ − µ = V X̄ Esercizio 17.5: Suggerimento La stima più naturale per l’ignota frequenza relativa p di soggetti classificati nella categoria d’interesse, è la corrispondente frequenza relativa nel campione cioè la Frequenza Relativa Campionaria p̂. La stima dell’errore medio di stima, calcolata sugli stessi dati campionari, è detta Standard Error dello stimatore, che nel caso della percentuale è: r p̂ (1 − p̂) SE (p̂) = n Fulvia Mecatti, base. Come, 2e. ©McGraw-Hill 2015, ISBN 9788838668852 c perché, F.Statistica Mecatti,diStatistica di quando, base 2010 The Companies, srl Capitolo 17 - Suggerimenti agli esercizi 3 Esercizio 17.6: Suggerimento Uno stimatore Tn si dice non distorto se il suo valore atteso coincide con il parametro oggetto di stima: E(Tn ) = θ Uno stimatore non distorto 1 Tn è più efficiente di un secondo stimatore non distorto se la sua varianza è più piccola: 2 Tn Var(1 Tn ) < Var(2 Tn ) La stima dell’errore medio di stima, calcolata sugli stessi dati campionari, è detta Standard Error dello stimatore: √ SE = stima per M SE Esercizio 17.7: Suggerimento La stima più naturale per l’ignota frequenza relativa p di soggetti classificati nella categoria d’interesse, è la corrispondente frequenza relativa nel campione cioè la Frequenza Relativa Campionaria p̂. La stima dell’errore medio di stima, calcolata sugli stessi dati campionari, è detta Standard Error dello stimatore, che nel caso della percentuale è: r p̂ (1 − p̂) SE (p̂) = n Esercizio 17.8: Suggerimento Fare inferenza sul modello lineare significa stimare i parametri a e b dai dati campionari. Le stime da utilizzare per gli ignoti parametri sono quelli che minimizzano i minimi quadrati : a = ȳ − b · x̄ sXY b= 2 sX dove sXY = 1 XX (xi − x̄) (yj − ȳ) fij n−1 i j s2X = 1 X (xi − x̄) fi. n−1 i cperché, Mecatti, Statistica base 20102e. The McGraw-Hill Companies, srl Fulvia Mecatti,F. Statistica di base. Come,diquando, © 2015, ISBN 9788838668852 4 Capitolo 17 - Suggerimenti agli esercizi La stima della varianza degli errori si ottiene come: s2ε = 1 XX 2 (yi − ŷj ) fij n−2 i j da cui è possibile ottenere i rispettivi standard error associabili alle stime dei parametri: s x̄2 1 2 + SE (â) = sε n (n − 1) s2X s s2ε SE b̂ = (n − 1) s2X Esercizio 17.9: Suggerimento Il diagramma a dispersione o scatter plot è uno strumento grafico utile per visualizzare il tipo di relazione esistente tra due variabili. È un diagramma cartesiano con gli assi intestati alle modalità dei due fenomeni, ad esempio X sulle ascisse ed Y sulle ordinate. Le coppie di valori osservati sono viste come coordinate di punti sul diagramma. La tabella osservata è rappresentata sullo scatter plot come una nuvola di punti. Fare inferenza sul modello lineare significa stimare i parametri a e b dai dati campionari. Le stime da utilizzare per gli ignoti parametri sono quelli che minimizzano i minimi quadrati : a = ȳ − b · x̄ sXY b= 2 sX dove sXY = 1 XX (xi − x̄) (yj − ȳ) fij n−1 i j s2X = 1 X (xi − x̄) fi. n−1 i La bontà di adattamento del modello si valuta mediante il seguente indice: s2 r2 = p XY s2X s2Y Accanto alla misura analitica r2 dell’adattamento del modello è utile un’analisi grafica degli n residui disegnadoli su un grafico. Tale grafico ha l’aspetto di una nuvola cperché, Mecatti, base 2010 2e. The McGraw-Hill Companies, srl Fulvia Mecatti,F.Statistica di Statistica base. Come,diquando, © 2015, ISBN 9788838668852 Capitolo 17 - Suggerimenti agli esercizi 5 di punti più o meno sparpagliati intorno allo 0. Residui ben sparpagliati, che si dispongono a caso intorno allo 0, senza mostrare alcuna struttura o sistematicità, sono residui con un buon comportamento, ovvero che il modello lineare è un buon modello per interpretare la variabile Y in funzione di X ed in genrale corrispondono ad un r2 vicino allo 0. Esercizio 17.10: Suggerimento Il diagramma a dispersione o scatter plot è uno strumento grafico utile per visualizzare il tipo di relazione esistente tra due variabili. È un diagramma cartesiano con gli assi intestati alle modalità dei due fenomeni, ad esempio X sulle ascisse ed Y sulle ordinate. Le coppie di valori osservati sono viste come coordinate di punti sul diagramma. La tabella osservata è rappresentata sullo scatter plot come una nuvola di punti. Fare inferenza sul modello lineare significa stimare i parametri a e b dai dati campionari. Le stime da utilizzare per gli ignoti parametri sono quelli che minimizzano i minimi quadrati : a = ȳ − b · x̄ sXY b= 2 sX dove 1 XX sXY = (xi − x̄) (yj − ȳ) fij n−1 i j s2X = 1 X (xi − x̄) fi. n−1 i Il parametro a è l’intercetta, mentre b è la pendenza della retta. La stima della varianza degli errori si ottiene come: 1 XX 2 s2ε = (yi − ŷj ) fij n−2 i j da cui è possibile ottenere i rispettivi standard error associabili alle stime dei parametri: s x̄2 1 2 + SE (â) = sε n (n − 1) s2X s s2ε SE b̂ = (n − 1) s2X La bontà di adattamento del modello si valuta mediante il seguente indice: s2 r2 = p XY s2X s2Y Fulvia Mecatti, base. Come, 2015, ISBN 9788838668852 c perché, F.Statistica Mecatti,diStatistica diquando, base 2010 2e. The© McGraw-Hill Companies, srl 6 Capitolo 17 - Suggerimenti agli esercizi Il modello può essere utilizzato per prevedere e simulare valori non osservati di Y , utilizzando X come predittore. Fulvia Mecatti,F. Statistica di base. Come,di quando, © 2015, ISBN 9788838668852 cperché, Mecatti, Statistica base 20102e. The McGraw-Hill Companies, srl