Capitolo 13 Suggerimenti agli esercizi a cura di Elena Siletti Esercizio 13.1: Suggerimento Il diagramma a dispersione o scatter plot è uno strumento grafico utile per visualizzare il tipo di relazione esistente tra due variabili. È un diagramma cartesiano con gli assi intestati alle modalità dei due fenomeni, ad esempio X sulle ascisse ed Y sulle ordinate. Le coppie di valori osservati sono viste come coordinate di punti sul diagramma. La tabella osservata è rappresentata sullo scatter plot come una nuvola di punti. Per misurare la correlazione lineare si utilizza il coefficiente di correlazione lineare rho: σXY ρXY = p 2 2 σX σY In generale rho assume valori tra -1 ed +1 e dà indicazioni circa il verso e l’intensità della correlazione tra X ed Y . Quando è uguale a -1 i fenomeni sono perfettamente e negativamente correlati, i punti sono perfettamente allineati lungo una retta con pendenza negativa; quando è uguale a +1 sono perfettamente e positivamente correlati, i punti sono perfettamente allineati lungo una retta con pendenza positiva; quando è nullo sono incorrelati. I valori intermedi sono interpretabili come percentuale di correlazione. Per calcolare la retta di regressione è necessario ricavare i coefficienti a e b: b= σXY 2 = σX a = ȳ − b · x̄ PP 1 (xi − x̄) (yi − ȳ) N i j 1 N P 2 (xi − x̄) i L’indice che misura l’adattamento del modello di regressione lineare è il rho quadro: P 2 (ŷj − ȳ) DS j 2 ρ2XY = (ρXY ) = =P 2 DT (yj − ȳ) j c 2010 F. Mecatti, di base. base Come, The perché, McGraw-Hill Companies, srl Fulvia Mecatti,Statistica Statistica di quando, 2e. © 2015, ISBN 9788838668852 1 2 Capitolo 13 - Suggerimenti agli esercizi Esercizio 13.2: Suggerimento Il diagramma a dispersione o scatter plot è uno strumento grafico utile per visualizzare il tipo di relazione esistente tra due variabili. È un diagramma cartesiano con gli assi intestati alle modalità dei due fenomeni, ad esempio X sulle ascisse ed Y sulle ordinate. Le coppie di valori osservati sono viste come coordinate di punti sul diagramma. La tabella osservata è rappresentata sullo scatter plot come una nuvola di punti. Per calcolare la retta di regressione è necessario ricavare i coefficienti a e b: b= σXY 2 = σX a = ȳ − b · x̄ PP 1 (xi − x̄) (yi − ȳ) N i j 1 N P 2 (xi − x̄) i Una volta sostituiti i parametri a e b con le soluzioni dei m.q. la distanza totale fra i valori osservati e la retta ci dà il Residuo totale della retta. Il residuo, anche detto, Devianza residua, è nullo quando la retta si adatta perfettamente ai dati osservati, questo avviene quando le variabili sono perfettamente correlate e i punti sul diagramma a dispersione si presentano allineati lungo una retta. In tutti gli altri casi la regressione lascia un residuo (DR > 0). L’indice che misura l’adattamento del modello di regressione lineare è il rho quadro: P 2 (ŷj − ȳ) DS j 2 ρ2XY = (ρXY ) = =P 2 DT (yj − ȳ) j Esercizio 13.3: Suggerimento Il diagramma a dispersione o scatter plot è uno strumento grafico utile per visualizzare il tipo di relazione esistente tra due variabili. È un diagramma cartesiano con gli assi intestati alle modalità dei due fenomeni, ad esempio X sulle ascisse ed Y sulle ordinate. Le coppie di valori osservati sono viste come coordinate di punti sul diagramma. La tabella osservata è rappresentata sullo scatter plot come una nuvola di punti. La spezzata di regressione si ottiene unendo con dei segmenti i punti sul diagramma a dispersione. Per calcolare la retta di regressione è necessario ricavare i coefficienti a e b: a = ȳ − b · x̄ Fulvia Mecatti,F. Statistica di base. Come,diquando, © 2015, ISBN 9788838668852 cperché, Mecatti, Statistica base 20102e. The McGraw-Hill Companies, srl Capitolo 13 - Suggerimenti agli esercizi σXY b= 2 = σX 1 N 3 PP i (xi − x̄) (yi − ȳ) j 1 N P 2 (xi − x̄) i L’indice che misura l’adattamento del modello di regressione lineare è il rho quadro: P 2 (ŷj − ȳ) DS j 2 ρ2XY = (ρXY ) = =P 2 DT (yj − ȳ) j La retta di regressione può essere utilizzata per prevedere e simulare valori non osservati di Y . Si ricorda che per utilizzare con obiettivi previsivi valori teorici non osservati nella realtà, ma estrapolati dal modello di regressione, servono cautela e buon senso: - l’estrapolazione avviene assumendo che il modello valga anche per i valori non osservati, cioè a parità di trend. - l’affidabilità dei valori estrapolati dipende dalla bontà del modello. Esercizio 13.4: Suggerimento Il diagramma a dispersione o scatter plot è uno strumento grafico utile per visualizzare il tipo di relazione esistente tra due variabili. È un diagramma cartesiano con gli assi intestati alle modalità dei due fenomeni, ad esempio X sulle ascisse ed Y sulle ordinate. Le coppie di valori osservati sono viste come coordinate di punti sul diagramma. La tabella osservata è rappresentata sullo scatter plot come una nuvola di punti. La spezzata di regressione si ottiene unendo con dei segmenti i punti sul diagramma a dispersione. Per calcolare la retta di regressione è necessario ricavare i coefficienti a e b: b= σXY 2 = σX a = ȳ − b · x̄ PP 1 (xi − x̄) (yi − ȳ) N i j 1 N P 2 (xi − x̄) i L’indice che misura l’adattamento del modello di regressione lineare è il rho quadro: P 2 (ŷj − ȳ) DS j 2 ρ2XY = (ρXY ) = =P 2 DT (yj − ȳ) j La retta di regressione può essere utilizzata per prevedere e simulare valori non osservati di Y . Si ricorda che per utilizzare con obiettivi previsivi valori teorici non c perché, F.Statistica Mecatti,diStatistica diquando, base 2010 2e. The© McGraw-Hill Companies, srl Fulvia Mecatti, base. Come, 2015, ISBN 9788838668852 4 Capitolo 13 - Suggerimenti agli esercizi osservati nella realtà, ma estrapolati dal modello di regressione, servono cautela e buon senso: - l’estrapolazione avviene assumendo che il modello valga anche per i valori non osservati, cioè a parità di trend. - l’affidabilità dei valori estrapolati dipende dalla bontà del modello. Esercizio 13.5: Suggerimento Il diagramma a dispersione o scatter plot è uno strumento grafico utile per visualizzare il tipo di relazione esistente tra due variabili. È un diagramma cartesiano con gli assi intestati alle modalità dei due fenomeni, ad esempio X sulle ascisse ed Y sulle ordinate. Le coppie di valori osservati sono viste come coordinate di punti sul diagramma. La tabella osservata è rappresentata sullo scatter plot come una nuvola di punti. La spezzata di regressione si ottiene unendo con dei segmenti i punti sul diagramma a dispersione. Per calcolare la retta di regressione è necessario ricavare i coefficienti a e b: a = ȳ − b · x̄ b= σXY 2 = σX 1 N PP i (xi − x̄) (yi − ȳ) j 1 N P 2 (xi − x̄) i Una volta sostituiti i parametri a e b con le soluzioni dei m.q. la distanza totale fra i valori osservati e la retta ci dà il Residuo totale della retta. Il residuo, anche detto, Devianza residua, è nullo quando la retta si adatta perfettamente ai dati osservati, questo avviene quando le variabili sono perfettamente correlate e i punti sul diagramma a dispersione si presentano allineati lungo una retta. In tutti gli altri casi la regressione lascia un residuo (DR > 0). L’indice che misura l’adattamento del modello di regressione lineare è il rho quadro: P 2 ρ2XY = (ρXY ) = 2 (ŷj − ȳ) DS j =P 2 DT (yj − ȳ) j La retta di regressione può essere utilizzata per prevedere e simulare valori non osservati di Y . Si ricorda che per utilizzare con obiettivi previsivi valori teorici non osservati nella realtà, ma estrapolati dal modello di regressione, servono cautela e buon senso: - l’estrapolazione avviene assumendo che il modello valga anche per i valori non osservati, cioè a parità di trend. cperché, Mecatti, Statistica base 2010 2e. The McGraw-Hill Companies, srl Fulvia Mecatti,F.Statistica di base. Come,diquando, © 2015, ISBN 9788838668852 Capitolo 13 - Suggerimenti agli esercizi 5 - l’affidabilità dei valori estrapolati dipende dalla bontà del modello. Esercizio 13.6: Suggerimento Il diagramma a dispersione o scatter plot è uno strumento grafico utile per visualizzare il tipo di relazione esistente tra due variabili. È un diagramma cartesiano con gli assi intestati alle modalità dei due fenomeni, ad esempio X sulle ascisse ed Y sulle ordinate. Le coppie di valori osservati sono viste come coordinate di punti sul diagramma. La tabella osservata è rappresentata sullo scatter plot come una nuvola di punti. Per calcolare la retta di regressione è necessario ricavare i coefficienti a e b: b= σXY 2 = σX a = ȳ − b · x̄ PP 1 (xi − x̄) (yi − ȳ) N i j 1 N P 2 (xi − x̄) i L’ndice che misura l’adattamento del modello di regressione lineare è il rho quadro: P 2 (ŷj − ȳ) DS j 2 ρ2XY = (ρXY ) = =P 2 DT (yj − ȳ) j Dire che due fenomeni sono statisticamente indipendenti significa che non esiste una relazione generica (connessione) tra loro. Se due variabili sono statisticamente indipendenti le distribuzioni condizionate sono tutte uguali ed uguali alla rispettiva distribuzione marginale. È utile ricordare che l’indipendenza statistica implica l’indipendenza in media,ma non è vero il contrario. Si dice che Y dipende in media da X se le medie condizionate ȳ|xi risultano diverse tra loro al variare della modalità di X, mentre si dice che X dipende in media da Y se le medie condizionate x̄|yj risultano diverse tra loro al variare della modalità di Y . Esercizio 13.7: Suggerimento Il diagramma a dispersione o scatter plot è uno strumento grafico utile per visualizzare il tipo di relazione esistente tra due variabili. È un diagramma cartesiano con gli assi intestati alle modalità dei due fenomeni, ad esempio X sulle ascisse ed Y sulle ordinate. Le coppie di valori osservati sono viste come coordinate di punti sul diagramma. La tabella osservata è rappresentata sullo scatter plot come una nuvola di punti. Per calcolare la retta di regressione è necessario ricavare i coefficienti a e b: a = ȳ − b · x̄ Fulvia Mecatti,F.Statistica di base. Come,diquando, © 2015, ISBN 9788838668852 cperché, Mecatti, Statistica base 2010 2e. The McGraw-Hill Companies, srl 6 Capitolo 13 - Suggerimenti agli esercizi σXY b= 2 = σX 1 N PP i (xi − x̄) (yi − ȳ) j 1 N P 2 (xi − x̄) i L’indice che misura l’adattamento del modello di regressione lineare è il rho quadro: P 2 ρ2XY = (ρXY ) = 2 (ŷj − ȳ) DS j =P 2 DT (yj − ȳ) j Si dice che Y dipende in media da X se le medie condizionate ȳ|xi risultano diverse tra loro al variare della modalità di X, mentre si dice che X dipende in media da Y se le medie condizionate x̄|yj risultano diverse tra loro al variare della modalità di Y . Esercizio 13.8: Suggerimento Il diagramma a dispersione o scatter plot è uno strumento grafico utile per visualizzare il tipo di relazione esistente tra due variabili. È un diagramma cartesiano con gli assi intestati alle modalità dei due fenomeni, ad esempio X sulle ascisse ed Y sulle ordinate. Le coppie di valori osservati sono viste come coordinate di punti sul diagramma. La tabella osservata è rappresentata sullo scatter plot come una nuvola di punti. Per calcolare la retta di regressione è necessario ricavare i coefficienti a e b: a = ȳ − b · x̄ σXY b= 2 = σX 1 N PP i (xi − x̄) (yi − ȳ) j 1 N P 2 (xi − x̄) i L’indice che misura l’adattamento del modello di regressione lineare è il rho quadro: P ρ2XY 2 (ŷj − ȳ) DS j 2 =P = (ρXY ) = 2 DT (yj − ȳ) j Esercizio 13.9: Suggerimento La regressione logistica, il modello logit, serve per modellare una variabile risposta binaria Y in funzione lineare di una variabile esplicativa X qualunque. Una volta c perché, F.Statistica Mecatti,di Statistica diquando, base 2010 2e. The© McGraw-Hill Companies, srl Fulvia Mecatti, base. Come, 2015, ISBN 9788838668852 Capitolo 13 - Suggerimenti agli esercizi 7 ottenuti i valori per i parametri a e b, possiamo usarli per simulare o prevedere la tendenza al successo al variare della variabile esplicativa. p̂ = ea+bX 1 + ea+bX Si ricorda che il punto di equilibrio nel modello logit è il punto di coordinate (−a/b,0). Esercizio 13.10: Suggerimento La regressione logistica, il modello logit, serve per modellare una variabile risposta binaria Y in funzione lineare di una variabile esplicativa X qualunque. na volta ottenuti i valori per i parametri a e b, possiamo usarli per simulare o prevedere la tendenza al successo al variare della variabile esplicativa. p̂ = ea+bX . 1 + ea+bX Fulvia Mecatti, StatisticaStatistica di base. Come, quando, perché, 2e.McGraw-Hill © 2015, ISBN 9788838668852 c 2010 F. Mecatti, di base The Companies, srl