Capitolo 13
Suggerimenti agli esercizi a cura di Elena Siletti
Esercizio 13.1: Suggerimento
Il diagramma a dispersione o scatter plot è uno strumento grafico utile per visualizzare il tipo di relazione esistente tra due variabili. È un diagramma cartesiano
con gli assi intestati alle modalità dei due fenomeni, ad esempio X sulle ascisse ed Y
sulle ordinate. Le coppie di valori osservati sono viste come coordinate di punti sul
diagramma. La tabella osservata è rappresentata sullo scatter plot come una nuvola
di punti.
Per misurare la correlazione lineare si utilizza il coefficiente di correlazione lineare
rho:
σXY
ρXY = p 2 2
σX σY
In generale rho assume valori tra -1 ed +1 e dà indicazioni circa il verso e l’intensità
della correlazione tra X ed Y . Quando è uguale a -1 i fenomeni sono perfettamente e
negativamente correlati, i punti sono perfettamente allineati lungo una retta con pendenza negativa; quando è uguale a +1 sono perfettamente e positivamente correlati,
i punti sono perfettamente allineati lungo una retta con pendenza positiva; quando
è nullo sono incorrelati. I valori intermedi sono interpretabili come percentuale di
correlazione.
Per calcolare la retta di regressione è necessario ricavare i coefficienti a e b:
b=
σXY
2 =
σX
a = ȳ − b · x̄
PP
1
(xi − x̄) (yi − ȳ)
N
i
j
1
N
P
2
(xi − x̄)
i
L’indice che misura l’adattamento del modello di regressione lineare è il rho quadro:
P
2
(ŷj − ȳ)
DS
j
2
ρ2XY = (ρXY ) =
=P
2
DT
(yj − ȳ)
j
c 2010
F. Mecatti,
di base.
base Come,
The perché,
McGraw-Hill
Companies,
srl
Fulvia
Mecatti,Statistica
Statistica di
quando,
2e. © 2015,
ISBN 9788838668852
1
2
Capitolo 13 - Suggerimenti agli esercizi
Esercizio 13.2: Suggerimento
Il diagramma a dispersione o scatter plot è uno strumento grafico utile per visualizzare il tipo di relazione esistente tra due variabili. È un diagramma cartesiano
con gli assi intestati alle modalità dei due fenomeni, ad esempio X sulle ascisse ed Y
sulle ordinate. Le coppie di valori osservati sono viste come coordinate di punti sul
diagramma. La tabella osservata è rappresentata sullo scatter plot come una nuvola
di punti.
Per calcolare la retta di regressione è necessario ricavare i coefficienti a e b:
b=
σXY
2 =
σX
a = ȳ − b · x̄
PP
1
(xi − x̄) (yi − ȳ)
N
i
j
1
N
P
2
(xi − x̄)
i
Una volta sostituiti i parametri a e b con le soluzioni dei m.q. la distanza totale
fra i valori osservati e la retta ci dà il Residuo totale della retta. Il residuo, anche
detto, Devianza residua, è nullo quando la retta si adatta perfettamente ai dati
osservati, questo avviene quando le variabili sono perfettamente correlate e i punti
sul diagramma a dispersione si presentano allineati lungo una retta. In tutti gli altri
casi la regressione lascia un residuo (DR > 0).
L’indice che misura l’adattamento del modello di regressione lineare è il rho quadro:
P
2
(ŷj − ȳ)
DS
j
2
ρ2XY = (ρXY ) =
=P
2
DT
(yj − ȳ)
j
Esercizio 13.3: Suggerimento
Il diagramma a dispersione o scatter plot è uno strumento grafico utile per visualizzare il tipo di relazione esistente tra due variabili. È un diagramma cartesiano
con gli assi intestati alle modalità dei due fenomeni, ad esempio X sulle ascisse ed Y
sulle ordinate. Le coppie di valori osservati sono viste come coordinate di punti sul
diagramma. La tabella osservata è rappresentata sullo scatter plot come una nuvola
di punti.
La spezzata di regressione si ottiene unendo con dei segmenti i punti sul diagramma
a dispersione.
Per calcolare la retta di regressione è necessario ricavare i coefficienti a e b:
a = ȳ − b · x̄
Fulvia Mecatti,F.
Statistica
di base.
Come,diquando,
© 2015,
ISBN 9788838668852
cperché,
Mecatti,
Statistica
base 20102e.
The
McGraw-Hill
Companies, srl
Capitolo 13 - Suggerimenti agli esercizi
σXY
b= 2 =
σX
1
N
3
PP
i
(xi − x̄) (yi − ȳ)
j
1
N
P
2
(xi − x̄)
i
L’indice che misura l’adattamento del modello di regressione lineare è il rho quadro:
P
2
(ŷj − ȳ)
DS
j
2
ρ2XY = (ρXY ) =
=P
2
DT
(yj − ȳ)
j
La retta di regressione può essere utilizzata per prevedere e simulare valori non osservati di Y . Si ricorda che per utilizzare con obiettivi previsivi valori teorici non
osservati nella realtà, ma estrapolati dal modello di regressione, servono cautela e
buon senso:
- l’estrapolazione avviene assumendo che il modello valga anche per i valori non osservati, cioè a parità di trend.
- l’affidabilità dei valori estrapolati dipende dalla bontà del modello.
Esercizio 13.4: Suggerimento
Il diagramma a dispersione o scatter plot è uno strumento grafico utile per visualizzare il tipo di relazione esistente tra due variabili. È un diagramma cartesiano
con gli assi intestati alle modalità dei due fenomeni, ad esempio X sulle ascisse ed Y
sulle ordinate. Le coppie di valori osservati sono viste come coordinate di punti sul
diagramma. La tabella osservata è rappresentata sullo scatter plot come una nuvola
di punti.
La spezzata di regressione si ottiene unendo con dei segmenti i punti sul diagramma
a dispersione.
Per calcolare la retta di regressione è necessario ricavare i coefficienti a e b:
b=
σXY
2 =
σX
a = ȳ − b · x̄
PP
1
(xi − x̄) (yi − ȳ)
N
i
j
1
N
P
2
(xi − x̄)
i
L’indice che misura l’adattamento del modello di regressione lineare è il rho quadro:
P
2
(ŷj − ȳ)
DS
j
2
ρ2XY = (ρXY ) =
=P
2
DT
(yj − ȳ)
j
La retta di regressione può essere utilizzata per prevedere e simulare valori non osservati di Y . Si ricorda che per utilizzare con obiettivi previsivi valori teorici non
c perché,
F.Statistica
Mecatti,diStatistica
diquando,
base 2010 2e.
The© McGraw-Hill
Companies, srl
Fulvia Mecatti,
base. Come,
2015, ISBN 9788838668852
4
Capitolo 13 - Suggerimenti agli esercizi
osservati nella realtà, ma estrapolati dal modello di regressione, servono cautela e
buon senso:
- l’estrapolazione avviene assumendo che il modello valga anche per i valori non osservati, cioè a parità di trend.
- l’affidabilità dei valori estrapolati dipende dalla bontà del modello.
Esercizio 13.5: Suggerimento
Il diagramma a dispersione o scatter plot è uno strumento grafico utile per visualizzare il tipo di relazione esistente tra due variabili. È un diagramma cartesiano
con gli assi intestati alle modalità dei due fenomeni, ad esempio X sulle ascisse ed Y
sulle ordinate. Le coppie di valori osservati sono viste come coordinate di punti sul
diagramma. La tabella osservata è rappresentata sullo scatter plot come una nuvola
di punti.
La spezzata di regressione si ottiene unendo con dei segmenti i punti sul diagramma
a dispersione.
Per calcolare la retta di regressione è necessario ricavare i coefficienti a e b:
a = ȳ − b · x̄
b=
σXY
2 =
σX
1
N
PP
i
(xi − x̄) (yi − ȳ)
j
1
N
P
2
(xi − x̄)
i
Una volta sostituiti i parametri a e b con le soluzioni dei m.q. la distanza totale
fra i valori osservati e la retta ci dà il Residuo totale della retta. Il residuo, anche
detto, Devianza residua, è nullo quando la retta si adatta perfettamente ai dati
osservati, questo avviene quando le variabili sono perfettamente correlate e i punti
sul diagramma a dispersione si presentano allineati lungo una retta. In tutti gli altri
casi la regressione lascia un residuo (DR > 0).
L’indice che misura l’adattamento del modello di regressione lineare è il rho quadro:
P
2
ρ2XY = (ρXY ) =
2
(ŷj − ȳ)
DS
j
=P
2
DT
(yj − ȳ)
j
La retta di regressione può essere utilizzata per prevedere e simulare valori non osservati di Y . Si ricorda che per utilizzare con obiettivi previsivi valori teorici non
osservati nella realtà, ma estrapolati dal modello di regressione, servono cautela e
buon senso:
- l’estrapolazione avviene assumendo che il modello valga anche per i valori non osservati, cioè a parità di trend.
cperché,
Mecatti,
Statistica
base 2010 2e.
The
McGraw-Hill
Companies, srl
Fulvia Mecatti,F.Statistica
di base.
Come,diquando,
© 2015,
ISBN 9788838668852
Capitolo 13 - Suggerimenti agli esercizi
5
- l’affidabilità dei valori estrapolati dipende dalla bontà del modello.
Esercizio 13.6: Suggerimento
Il diagramma a dispersione o scatter plot è uno strumento grafico utile per visualizzare il tipo di relazione esistente tra due variabili. È un diagramma cartesiano
con gli assi intestati alle modalità dei due fenomeni, ad esempio X sulle ascisse ed Y
sulle ordinate. Le coppie di valori osservati sono viste come coordinate di punti sul
diagramma. La tabella osservata è rappresentata sullo scatter plot come una nuvola
di punti.
Per calcolare la retta di regressione è necessario ricavare i coefficienti a e b:
b=
σXY
2 =
σX
a = ȳ − b · x̄
PP
1
(xi − x̄) (yi − ȳ)
N
i
j
1
N
P
2
(xi − x̄)
i
L’ndice che misura l’adattamento del modello di regressione lineare è il rho quadro:
P
2
(ŷj − ȳ)
DS
j
2
ρ2XY = (ρXY ) =
=P
2
DT
(yj − ȳ)
j
Dire che due fenomeni sono statisticamente indipendenti significa che non esiste una
relazione generica (connessione) tra loro. Se due variabili sono statisticamente indipendenti le distribuzioni condizionate sono tutte uguali ed uguali alla rispettiva
distribuzione marginale. È utile ricordare che l’indipendenza statistica implica l’indipendenza in media,ma non è vero il contrario.
Si dice che Y dipende in media da X se le medie condizionate ȳ|xi risultano diverse
tra loro al variare della modalità di X, mentre si dice che X dipende in media da Y
se le medie condizionate x̄|yj risultano diverse tra loro al variare della modalità di Y .
Esercizio 13.7: Suggerimento
Il diagramma a dispersione o scatter plot è uno strumento grafico utile per visualizzare il tipo di relazione esistente tra due variabili. È un diagramma cartesiano
con gli assi intestati alle modalità dei due fenomeni, ad esempio X sulle ascisse ed Y
sulle ordinate. Le coppie di valori osservati sono viste come coordinate di punti sul
diagramma. La tabella osservata è rappresentata sullo scatter plot come una nuvola
di punti.
Per calcolare la retta di regressione è necessario ricavare i coefficienti a e b:
a = ȳ − b · x̄
Fulvia Mecatti,F.Statistica
di base.
Come,diquando,
© 2015,
ISBN 9788838668852
cperché,
Mecatti,
Statistica
base 2010 2e.
The
McGraw-Hill
Companies, srl
6
Capitolo 13 - Suggerimenti agli esercizi
σXY
b= 2 =
σX
1
N
PP
i
(xi − x̄) (yi − ȳ)
j
1
N
P
2
(xi − x̄)
i
L’indice che misura l’adattamento del modello di regressione lineare è il rho quadro:
P
2
ρ2XY = (ρXY ) =
2
(ŷj − ȳ)
DS
j
=P
2
DT
(yj − ȳ)
j
Si dice che Y dipende in media da X se le medie condizionate ȳ|xi risultano diverse
tra loro al variare della modalità di X, mentre si dice che X dipende in media da Y
se le medie condizionate x̄|yj risultano diverse tra loro al variare della modalità di Y .
Esercizio 13.8: Suggerimento
Il diagramma a dispersione o scatter plot è uno strumento grafico utile per visualizzare il tipo di relazione esistente tra due variabili. È un diagramma cartesiano
con gli assi intestati alle modalità dei due fenomeni, ad esempio X sulle ascisse ed Y
sulle ordinate. Le coppie di valori osservati sono viste come coordinate di punti sul
diagramma. La tabella osservata è rappresentata sullo scatter plot come una nuvola
di punti.
Per calcolare la retta di regressione è necessario ricavare i coefficienti a e b:
a = ȳ − b · x̄
σXY
b= 2 =
σX
1
N
PP
i
(xi − x̄) (yi − ȳ)
j
1
N
P
2
(xi − x̄)
i
L’indice che misura l’adattamento del modello di regressione lineare è il rho quadro:
P
ρ2XY
2
(ŷj − ȳ)
DS
j
2
=P
= (ρXY ) =
2
DT
(yj − ȳ)
j
Esercizio 13.9: Suggerimento
La regressione logistica, il modello logit, serve per modellare una variabile risposta
binaria Y in funzione lineare di una variabile esplicativa X qualunque. Una volta
c perché,
F.Statistica
Mecatti,di Statistica
diquando,
base 2010 2e.
The© McGraw-Hill
Companies, srl
Fulvia Mecatti,
base. Come,
2015, ISBN 9788838668852
Capitolo 13 - Suggerimenti agli esercizi
7
ottenuti i valori per i parametri a e b, possiamo usarli per simulare o prevedere la
tendenza al successo al variare della variabile esplicativa.
p̂ =
ea+bX
1 + ea+bX
Si ricorda che il punto di equilibrio nel modello logit è il punto di coordinate (−a/b,0).
Esercizio 13.10: Suggerimento
La regressione logistica, il modello logit, serve per modellare una variabile risposta
binaria Y in funzione lineare di una variabile esplicativa X qualunque. na volta
ottenuti i valori per i parametri a e b, possiamo usarli per simulare o prevedere la
tendenza al successo al variare della variabile esplicativa.
p̂ =
ea+bX
.
1 + ea+bX
Fulvia Mecatti,
StatisticaStatistica
di base. Come,
quando,
perché,
2e.McGraw-Hill
© 2015, ISBN 9788838668852
c 2010
F. Mecatti,
di base
The
Companies, srl