MODÈLE LINÉAIRE

MODÈLE LINÉAIRE - TD 1
Nom
Esercizio 1)
num.
1
2
3
4
5
6
7
8
9
10
11
Su una popolazione di 12 unità, vengono effettuate
due rilevazioni quantitative, indicate con X e Y, i
cui risultati sono riportati a fianco.
1.1 Costruire un grafico della
congiunta delle variabili X e Y.
distribuzione
INDICARE CHIARAMENTE LA SCALA
12
1
X
45.85
42.90
42.85
42.24
40.16
49.03
40.94
42.25
41.61
41.92
45.47
49.83
Y
158.26
155.97
153.31
153.99
155.99
162.80
154.09
154.82
158.93
156.61
164.55
163.62
Per le rilevazioni precedenti si ha:
Σ xi = 525.05
1.2
Σ xi2 = 23080.1
y = 157.75
var(y) = 15.57
Σ xi yi = 82930.9
Calcolare la media di X.
1.3
Calcolare la varianza di X.
1.4.
Calcolare la covarianza fra X e Y.
1.5
Scrivere l'equazione della retta di regressione di Y rispetto a X.
1.6
X.
Disegnare, sullo stesso sistema di assi usato in precedenza, la retta di regressione di Y rispetto a
1.7
Calcolare il valore del residuo per la quinta unità sperimentale e indicarlo sul grafico.
1.8
Calcolare l’indice R-sq per la regressione di Y rispetto a X (ricordando che nella regressione con
una sola variabile esplicativa esso è il quadrato del coefficiente di correlazione fra X e Y).
2
Esercizio 2)
1. Dimostrare che, in un modello di regressione
y   0   1 x   con i coefficienti determinati con
il metodo dei minimi quadrati, la somma dei residui è nulla:
  yi  yˆ i   0
n
i 1
2.
Calcolare il coefficiente b che minimizza la somma dei quadrati dei residui in un modello con
sola costante: y    
3
MODÈLE LINÉAIRE - TD 1 (a casa)
Nom
Esercizio 3)
Su una popolazione di 10 unità, vengono effettuate due
rilevazioni quantitative, indicate con X e Y, i cui risultati sono
riportati a fianco.
Costruire un grafico della distribuzione congiunta delle variabili
X e Y.
INDICARE CHIARAMENTE LA SCALA
num.
1
2
3
4
5
6
7
8
9
10
4
X
-1.8
-1.8
-1.2
2.0
-1.7
0.2
0.5
3.5
1.4
Y
-2.2
-20.0
-4.5
10.9
-6.1
11.2
8.0
23.0
10.3
1.2
8.6
Per le rilevazioni precedenti si ha:
x = 0.23
var(x) = 3.358
Σ yi =39.20
Σ yi2 = 1479.6
Σ xi yi = 189.01
2.1 Calcolare la media di Y.
2.3.
Calcolare la varianza di Y.
2.4
Calcolare la covarianza fra X e Y.
2.5
Scrivere l'equazione della retta di regressione di Y rispetto a X.
2.6
X.
Disegnare, sullo stesso sistema di assi usato in precedenza, la retta di regressione di Y rispetto a
2.7
Calcolare il valore del residuo per la seconda unità sperimentale e indicarlo sul grafico.
2.8
Calcolare l’indice R-sq per la regressione di Y rispetto a X (ricordando che nella regressione con
una sola variabile esplicativa esso è il quadrato del coefficiente di correlazione fra X e Y).
5
MODÈLE LINÉAIRE - TD 2
Nom
num.
1
2
3
4
5
6
7
8
9
10
11
12
ESERCIZIO 1
Considerare i dati dell’esercizio 1 della
lezione precedente (TD1), che riportiamo a
fianco:
Qui a fianco sono forniti i valori di Y
approssimati linearmente tramite X con la
tecnica dei minimi quadrati per i primi 10
dati.
1.1
Calcolare ŷ11 e ŷ12 .
1.2
Calcolare tutti i residui.
1.3
Costruire il grafico dei residui rispetto
ai valori approssimati.
ŷ1
ŷ 2
ŷ 3
ŷ 4
ŷ 5
ŷ 6
ŷ 7
ŷ 8
ŷ 9
ŷ10
ŷ11
ŷ12
=
=
=
=
=
=
=
=
=
=
=
=
6
X
45.85
42.90
42.85
42.24
40.16
49.03
40.94
42.25
41.61
41.92
45.47
49.83
159,84
156,89
156,84
156,23
154,15
163,01
154,93
156,25
155,60
155,91
......
......
Y
158.26
155.97
153.31
153.99
155.99
162.80
154.09
154.82
158.93
156.61
164.55
163.62
e1
e2
e3
e4
e5
e6
e7
e8
e9
e10
e11
e12
=
=
=
=
=
=
=
=
=
=
=
=
......
......
......
......
......
......
......
......
......
......
......
......
ESERCIZIO 2
I seguenti grafici rappresentano i residui rispetto ai valori stimati di 4 modelli di regressione lineare.
Per ciascuno di essi dire se il modello è adeguato o se sono necessarie eventuali trasformazioni dei dati ed
indicare quali si ritengono opportune.
MODELLO 1
MODELLO 2
COMMENTO
COMMENTO
MODELLO 3
MODELLO 4
COMMENTO
COMMENTO
ESERCIZIO 3
Si consideri un modello di regressione lineare privo di intercetta in cui la variabile risposta Y dipenda da
un’unica variabile esplicativa X. Il modello avrà quindi equazione:
yi = ß xi + i
 i=1, …, n
Si calcoli la stima ai minimi quadrati di ß.
7
MODÈLE LINÉAIRE - TD 2 (a casa)
Nom
ESERCIZIO 4
Considerare i dati dell’esercizio 2 della lezione
precedente (TD1), che riportiamo qui a fianco:
num.
1
2
3
4
5
6
7
8
9
10
Qui a fianco sono forniti i valori di Y approssimati
linearmente tramite X con la tecnica dei minimi quadrati
per i primi 8 dati.
4.1
Calcolare ŷ 9 e ŷ10 .
ŷ1
ŷ 2
ŷ 3
ŷ 4
4.2
=
=
=
=
X
-1.8
-1.8
-1.2
2.0
-1.7
0.2
0.5
3.5
1.4
1.2
-8.17
-8.17
-4.60
14.46
ŷ 5 = -7.57
Calcolare tutti i residui.
4.3
Costruire il grafico dei residui rispetto ai valori
approssimati.
8
Y
-2.2
-20.0
-4.5
10.9
-6.1
11.2
8.0
23.0
10.3
8.6
e1
e2
e3
e4
=
=
=
=
......
......
......
......
3.74
5.53
e5 = ......
e6 = ......
e7 = ......
ŷ 8 = 23.40
ŷ 9 = .....
ŷ10 = .....
e8 = ......
e9 = ......
e10 = ......
ŷ 6 =
ŷ 7 =
MODÈLE LINÉAIRE - TD 3
Nom
ESERCIZIO 1
Considerare i dati riportiati qui a fianco:
num.
Si ottiene la seguente retta di regressione:
Y = 135 + 0.476 x
x
Y
e
1 45.85 158.26
.
2 42.90 155.97
.
3 42.85 153.31
.
4 42.24 153.99
.
5 40.16 155.90
.
a) Calcolare i residui e la stima della varianza delle variabili aleatorie Y1 , K ,Y n
b) Calcolare la stima s B2 0 della varianza di B0 e la stima s B2 0 della varianza di B1.
c) Calcolare un intervallo di confidenza per ciascuno del coefficienti del modello  0 e  1 .
9
d) Effettuare un test a livello di significatività del 95% per verificare se il coefficiente  0 è nullo
e) Calcolare:
a. le stime y¶1 ,K , y¶5 dei valori attesi delle variabili risposta Y1 ,K ,Y5
b. le stime delle varianze degli stimatori Yµ,K ,Yµ
1
5
c. un intevallo di confidenza per ciascuno dei valori attesi delle variabili risposta Y1 ,K ,Y5
j
y¶j
x
j
x

2
hj
1
2
3
4
5
10
 
intervallo di confidenza per IE Y j
ESERCIZIO 2 - LETTURA DI UN OUTPUT SAS
Si considerino i dati ....................
Dependent Variable: PERCORRE
Analysis of Variance
Source
DF
Sum of
Squares
Mean
Square
Model
Error
C Total
5
32
37
224.69314
62.22384
286.91697
44.93863
1.94449
Root MSE
Dep Mean
C.V.
1.39445
10.53111
13.24126
R-square
Adj R-sq
F Value
Prob>F
23.111
0.0001
0.7831
0.7492
Parameter Estimates
Variable
DF
Parameter
Estimate
Standard
Error
T for H0:
Parameter=0
Prob > |T|
INTERCEP
DRIVE_R
CILINDRA
NUM_C
RIPRESA
PES_POT
1
1
1
1
1
1
27.390415
-2.407964
-0.001776
-0.462520
-0.406254
332.025153
3.95086954
0.79443447
0.00057888
0.44158181
0.18537862
209.18758707
6.933
-3.031
-3.068
-1.047
-2.191
1.587
0.0001
0.0048
0.0044
0.3028
0.0358
0.1223
Nella tabella Parameter Estimates sono riportate:
Parameter Estimate:
stime puntuali dei coefficienti 0 e 1 ., cioè i valori di b0 e b1 :
Standard Error:
stime puntuali delle standard deviation degi stimatori B 0 e B1 , cioè i
valori di s B 0 e s B 1 :
valore della statistica test per il test di nullità di ciascun coefficiente
b
b
0 e 1 : t 0  0 e t 1  1
sB 0
sB 1
p-value delle realizzaizoni campionarie t 0 e t 1 :
T for H0: Parameter=0
Prob > |T|:
a) Calcolare un intervallo di confidenza per ciascuno del coefficienti del modello  0 e  1 .
b) Effettuare un test per verificare la nullità del coefficiente  0 contro l’alternadiva che sia diverso da zero.
11
MODÈLE LINÉAIRE - TD 4
Nom
Alcune osservazioni sulla distribuzione degli stimatori dei coefficienti
Consideriamo un modello di regressione lineare con p  1 variabili esplicative:
y   0   1 x1     p 1 x p 1  
Supponiamo che i dati osservati siano riferiti a un campione di una popolazione.
Si può dimostrare che, se i residui hanno distribuzione normale e sono non correlati tra loro --cioè
 i ~ N (0,  ) -- allora la variabile casuale Bk , stimatore del coefficiente  k , ha una distribuzione tale che
Bk   k
ha distribuzione t di Student a n  p gradi di libertà, dove con S k si è
Sk
indicato lo stimatore della varianza di Bk .
---------------------------------------------------------------------Si considerino i dati relativi a 38 auto riguardanti:
 nazione di fabbricazione
 tipo di auto
 percorrenza (chilometri percorsi con un litro di carburante)
 peso (in kg)
 rapporto di trasmissione al ponte (drive ratio)
 potenza (in HP)
 cilindrata (in cm3)
 numero cilindri
 ripresa (secondi impiegati per percorrere da fermo un quarto di miglio cioè 402 m)
la variabile casuale
I dati sono tratti dall'articolo: H.V. Henderson & P.F. Velleman, Building Multiple Regression
Models Interactively, Biometrics, 1981, p. 400.
Di seguito è riportato un output SAS relativo alla regressione della variabile percorrenza rispetto
alle variabili esplicative: drive ratio, cilindrata, numero cilindri, ripresa, peso/potenza.
Dependent Variable: PERCORRE
Analysis of Variance
Source
Model
Error
C Total
DF
5
32
37
Root MSE
Dep Mean
C.V.
Variable
INTERCEP
DRIVE_R
CILINDRA
NUM_C
RIPRESA
PES_POT
DF
1
1
1
1
1
1
Sum of
Squares
224.69314
62.22384
286.91697
1.39445
10.53111
13.24126
Mean
Square
44.93863
1.94449
R-square
Adj R-sq
F Value
23.111
Prob>F
0.0001
0.7831
0.7492
Parameter Estimates
Parameter
Standard
T for H0:
Estimate
Error
Parameter=0
27.390415
3.95086954
6.933
-2.407964
0.79443447
-3.031
-0.001776
0.00057888
-3.068
-0.462520
0.44158181
-1.047
-0.406254
0.18537862
-2.191
332.025153 209.18758707
1.587
Prob > |T|
0.0001
0.0048
0.0044
0.3028
0.0358
0.1223
Nella tabella Parameter Estimates sono riportate le stime puntuali:
 dei singoli coefficienti, cioè i valori di b0 , b1 ,, b5 , nella colonna Parameter Estimate

delle standard deviation dei singoli coefficienti, cioè i valori di s0 , s1 ,, s5 nella colonna Standard Error
12
ESERCIZIO 1
Calcolare un intervallo di confidenza a livello del 95% per ciascun coefficiente  0 , 1 ,,  5 .
 Coefficiente  0 :

Coefficiente  1 :

Coefficiente  2 :

Coefficiente  3 :

Coefficiente  4 :

Coefficiente  5 :
ESERCIZIO 2
Effettuare un test a livello di significatività del 5% per verificare la nullità di ciascun coefficiente
 0 ,  1 , ,  5 .
H 0 :  k  0 contro H1 :  k  0
 Coefficiente  0 :

Coefficiente  1 :

Coefficiente  2 :

Coefficiente  3 :

Coefficiente  4 :

Coefficiente  5 :
ESERCIZIO 2
Effettuare un test a livello di significatività del 5% per verificare l’ugualianza dei coefficienti  3 e  4 :
H 0 :  3   4 contro H 1 :  3   4 .
B3  B4    3   4 
Come statistica test si utilizzi la variable casuale B3  B 4 standardizzata, cioè
,
stˆd B3  B4 
supponendo che abbia distribuzione normale. Per il calcolo della stima della varianza di B3  B 4 si
consideri che l’elemento corrispondente a B3  B 4 della matrice  X ' X 1 è – 0.0022.
13
MODÈLE LINÉAIRE - TD 5
Nom
ESERCIZIO 1
Si consideri nuovamente il modello lineare che esprime il consumo di ossigeno da parte di atleti
che praticano sport di fondo in dipendenza da variabili esplicative facilmente rilevabili anche sul campo.
Inizialmente si costruisce un modello con variabili esplicative: ETA, PESO, TEMPO,
PULS_FER, PULS_MED, PULS_MAX . I risultati della regressione sono i seguenti.
Model: MODEL1
Dependent Variable: OSS
Analysis of Variance
Sum of
Mean
Source
DF
Squares
Square
Model
Error
C Total
6
24
30
Root MSE
Dep Mean
C.V.
Variable
DF
INTERCEP
ETA
PESO
TEMPO
PUL_FER
PUL_MED
PUL_MAX
1
1
1
1
1
1
1
722.54361
128.83794
851.38154
2.31695
47.37581
4.89057
120.42393
5.36825
R-square
Adj R-sq
F Value
Prob>F
22.433
0.0001
0.8487
0.8108
Parameter Estimates
Parameter
Standard
T for H0:
Estimate
Error
Parameter=0
102.934479
-0.226974
-0.074177
-2.628653
-0.021534
-0.369628
0.303217
12.40325810
0.09983747
0.05459316
0.38456220
0.06605428
0.11985294
0.13649519
8.299
-2.273
-1.359
-6.835
-0.326
-3.084
2.221
Prob > |T|
0.0001
0.0322
0.1869
0.0001
0.7473
0.0051
0.0360
Dai test di nullità dei singoli coefficienti risulta che singolarmente possono essere considerate
ininfluenti, a livello del 5% le variabili variabili PESO e PUL_FER e a livello dell’1% anche le variabili
ETA e PUL_MAX.
Si ipotizza quindi che i coefficienti relativi a queste 4 variabili siano contemporaneamente nulli e
si effettua una regressione senza le 4 variabili.
I risultati della regressione lineare eseguita sul modello ridotto sono i seguenti.
14
Model: MODEL1
Dependent Variable: OSSIGENO
Analysis of Variance
Source
DF
Sum of
Squares
Mean
Square
Model
Error
C Total
2
28
30
648.26218
203.11936
851.38154
324.13109
7.25426
Root MSE
Dep Mean
C.V.
2.69337
47.37581
5.68513
R-square
Adj R-sq
F Value
Prob>F
44.681
0.0001
0.7614
0.7444
Parameter Estimates
Variable
DF
Parameter
Estimate
Standard
Error
T for H0:
Parameter=0
Prob > |T|
INTERCEP
TEMPO
PULS_MED
1
1
1
93.088766
-3.140188
-0.073509
8.24882295
0.37326470
0.05051438
11.285
-8.413
-1.455
0.0001
0.0001
0.1567
Si commenti l’output.
1.1
Si effettui un test di Fisher sulla nullità dei parametri relativi alle variabili ETA, PESO,
PUL_FER e PUL_MAX. A tal fine, si determinino i gradi di libertà del denominatore utilizzando la
tabella ANOVA.
Quale è il valore campionario assunto dalla statistica test? Osservando le tavole della Fisher, si
accetta o si rifiuta l’ipotesi principale? Il modello ridotto è quindi accettabile, cioè non fa perdere
informazioni significative rispetto al modello completo?
1.2
Si calcoli il valore predetto per l’ossigeno nel modello ridotto per la quarta unità sperimentale e il
residuo corrispondente.
OBS
4
SESSO
f
ETA
42
PESO
68.15
OSS
59.571
TEMPO
8.17
PUL_FER
40
15
PUL_MED
166
PUL_MAX
172
MODÈLE LINÉAIRE – TD 5
Nom
ESERCIZIO 2
Si vuole studiare se una variabile casuale Y possa avere una dipendenza lineare da 4 variabili esplicative,
indicate con X1, X2, X3 e X4.
MODELLO 1. Si effettua una regressione lineare considerando un modello con costante e con variabili
esplicative X1, X2, X3 e X4. I risultati sono i seguenti:
Analysis of Variance
Source
Model
Error
C Total
DF
4
105
109
Sum of
Squares
887.27763
3.10297
890.38060
Root MSE
Dep Mean
C.V.
Mean
Square
221.81941
0.02955
0.17191
40.20930
0.4275
F Value
7506.041
R-square
Adj R-sq
Prob>F
0.0001
0.9965
0.9964
Parameter Estimates
Variable
INTERCEP
X1
X2
X3
X4
DF
1
1
1
1
1
Parameter
Estimate
20.779155
0.012495
-0.143898
0.012429
0.006459
Standard
Error
0.13504999
0.00010338
0.38621580
0.00010066
0.00765082
T for H0:
Parameter=0
153.863
120.873
-0.373
123.473
0.844
Prob > |T|
0.0001
0.0001
0.7102
0.0001
0.4005
Nella tabella Analysis of Variance:
- nella colonna DF si trovano i gradi di libertà dei vettori Xb  y (in corrispondenza di Model), y  Xb (in corrispondenza di Error) e
-
y  y (in corrispondenza di C Total)
nella colonna Sum of Squares, in corrispondenza della riga Error, si trova la somma dei quadrati dei residui
nella colonna F Value si trova la quantità SS R SSC n p ,avendo indicato rispettivamente con SSC e SS R la somma dei quadrati dei
SSC
p1
residui nel modello completo e quella nel modello costituito dalla sola costante, avendo indicato con n il n. delle osservazioni e con p il
n. dei coefficienti da stimare.
Nella tabella Parameter Estimates:
- Nella colonna Variable si trovano i nomi delle variabili esplicative (compresa la costante).
Per ogni riga (cioè in corrispondenza di ogni variabile indicata nella colonna Variable):
- nella colonna Parameter Estimate si trova la stima del coefficienti b k ;
-
nella colonna Standard Error si trova la stima sk delle deviazione standard degli stimatori Bk ;
nella colonna T for H0 si trova il valore t k  bk / s k ;
nella colonna Prob > |T| si trova la probabilità che una variabile casuale T con distribuzione t di Student, con gradi di libertà n  p ,
assuma valori inferiori a - t k o superiori a t k , cioè IP ( T  t k ) , avendo indicato con n il numero delle osservazioni e con p il numero
dei coefficienti da stimare.
16
Qui sotto è riportato il grafico dei residui studentizzati rispetto ai valori della regressione.
Y2 = 20.779 +0.0125
X1 -0.1439
X2 +0.0124
X3 +0.0065
X4
3
N
110
Rsq
0.9965
2
AdjRsq
0.9964
Rt MSE
0.1719
1
0
-1
-2
-3
-4
32
34
36
38
40
42
44
46
48
Predicted Value of Y
2.1.
In base ai dati precedenti stabilire se il modello è buono. Indicare eventuali possibili
trasformazioni delle variabili. Spiegare nei dettagli quali dati si sono considerati
MODELLO 2.
E’ stata effettua una opportuna trasformazione di una o più variabili, ottenendo i seguenti risultati.
Sono ora indicate con Y, X1, X2, X3 e X4 le variabili precedenti o loro trasformazioni.
Analysis of Variance
Source
Model
Error
C Total
DF
4
105
109
Sum of
Squares
5705173.0499
9899.72372
5715072.7736
Root MSE
Dep Mean
C.V.
Mean
Square
1426293.2625
94.28308
9.70995
1624.88231
0.59758
F Value
15127.775
R-square
Adj R-sq
0.9983
0.9982
Parameter Estimates
Parameter
Standard
T for H0:
17
Prob>F
0.0001
Variable
INTERCEP
X1
X2
X3
X4
DF
1
1
1
1
1
Estimate
73.699471
1.001831
-9.342434
0.996904
1.241956
Error
7.62811335
0.00583908
21.81487039
0.00568556
0.43214615
Parameter=0
9.662
171.573
-0.428
175.340
2.874
Prob > |T|
0.0001
0.0001
0.6693
0.0001
0.0049
Y = 73. 699 +1. 0018 X1 - 9. 3424X2 +0. 9969 X3 +1. 242 X4
3
N
110
R
sq
0. 9983
2
Adj R
sq
0. 9982
R
t M
SE
9. 7099
1
0
-1
-2
-3
1000
1200
1400
1600
1800
Pr edi ct ed Val ue of
2000
2200
2400
Y
2.2.
In base ai dati precedenti stabilire se il modello 2 è buono. Spiegare nei dettagli quali dati si sono
considerati
18
MODELLO 3.
Si effettua quindi una regressione considerando un modello con variabili esplicative X1 e X3.
I risultati di questa regressione lineare sono i seguenti:
Analysis of Variance
Source
Model
Error
C Total
DF
2
107
109
Sum of
Squares
5704393.8801
10678.89351
5715072.7736
Root MSE
Dep Mean
C.V.
Mean
Square
2852196.9401
99.80274
9.99013
1624.88231
0.61482
F Value
28578.342
R-square
Adj R-sq
Prob>F
0.0001
0.9981
0.9981
Parameter Estimates
Variable
INTERCEP
X1
X3
DF
1
1
1
Parameter
Estimate
62.110609
1.003832
0.994821
Standard
Error
6.65562361
0.00592485
0.00579988
T for H0:
Parameter=0
9.332
169.427
171.524
Prob > |T|
0.0001
0.0001
0.0001
2.3. Utilizzando questi dati e i precedenti effettuare il test di Fisher, a livello del 5%, per verificare se
il modello ridotto senza le variabili X2 e X4 è buono (esplicitare il procedimento)
2.4.
Si consideri il modello ridotto. Una osservazione ha i seguenti valori:
Y=1417.25
X1=520.31 X3=839.75
a)
Calcolare il valore di Y della regressione (arrotondare i dati alla prima cifra decimale)
b)
Calcolare il valore del residuo (arrotondare i dati alla prima cifra decimale)
c)
Sapendo che lo standard error di tale residuo è 9.90, calcolare il residuo studentizzato.
2.5. Calcolare un intervallo di confidenza a livello del 5% per il parametro della variabile X1 del
modello ridotto.
19
MODÈLE LINÉAIRE - TD 6
Nom
ESERCIZIO 1
Si consideri il modello lineare che esprime il tempo di vita (in ore) di un batterio in funzione
dell’ossigeno disciolto nell’acqua di coltura (in milligrammi). L’output SAS della proc reg è il seguente.
E’ indicata anche la matrice di varianza-covarianza dei coefficienti.
The REG Procedure
Dependent Variable: ore_vita
Analysis of Variance
Source
DF
Sum of
Squares
Mean
Square
Model
Error
Corrected Total
1
16
17
30.60514
7.73891
38.34404
30.60514
0.48368
Root MSE
Dependent Mean
Coeff Var
0.69547
9.93444
7.00062
R-Square
Adj R-Sq
F Value
Pr > F
63.28
<.0001
0.7982
0.7856
Parameter Estimates
Variable
DF
Parameter
Estimate
Standard
Error
t Value
Pr > |t|
Intercept
mg_ossig
1
1
-12.81867
1.52404
2.86507
0.19159
-4.47
7.95
0.0004
<.0001
Covariance of Estimates
Variable
Intercept
mg_ossig
1.
Intercept
mg_ossig
8.208636928
-0.548028813
-0.548028813
0.0367079174
Commentare i risultati e dire se la dipendenza lineare è significativa.
Si vuole prevedere il tempo di vita per due nuove osservazioni delle quali si hanno solo i valori di
ossigeno disciolto. Tali valori sono x19  14.38 e x 20  16.92 .
2.
Calcolare le stime di y19 e y 20 .
3.
Calcolare l’intervallo di confidenza a livello 90% per la media di y19 e per la media di y 20 .
4.
Calcolare l’intervallo di confidenza a livello 90% per il valore predetto di y19 e per il valore
predetto di y 20 .
20
MODÈLE LINÉAIRE - TD 8
Nom
Si consideri una variabile quantativa Y e un fattore A a 3 livelli (indicati con 1, 2 e 3 )
La variabile Y in un campione assume i valori
riportati a finco, suddivisi a seconda dei livelli del
1
2
fattore A.
7
2
5
Si consideri un modello di analisi della varianza a
9
una via:
3
3
yik     i   ik con i  1, ,3
k  1,2
4
1.1 Si scriva in modo esteso il modello in forma matriciale per i dati campionari (scrivere la matrice del
disegno di rango pieno):
y  X*  *  
1.2 Si stimino i parametri ricordando che la stima di  è la media generale della variabile risposta e la
stima di  i è la differenza fra la media del livello i e la media generale.
1.3 Si calcolino i valori stimati per la variabile risposta e i corrispondenti residui.
1.4
Si effettui il test di non influenza del fattore sulla variabile risposta a livello di significatività del 5%.
Ricordare che il numeratore della statistica test - esclusi i gradi di libertà - è:
3
2
2
   yi.  y.. 
i 1 k 1
Per casa: esercizi 1 e 2 delle dispense.
21
MODÈLE LINÉAIRE - TD 9
Nom
Si consideri una variabile quantativa Y e due fattori: A a 3 livelli e B a due livelli
La variabile Y in un campione assume i valori
riportati a finco, suddivisi a seconda dei livelli del
fattore A.
a
1
1
1
1
1
1
2
2
2
2
2
2
Si consideri un modello di analisi della
varianza a due vie con interazione.:
yijk     i   j   ij   ijk con
i  1, ,3
j  1,2 k  1,2
Qui sotto è riportato l’output SAS
dell’analisi della varianza
b
1
1
2
2
3
3
1
1
2
2
3
3
y
3
6
3
4
7
8
1
2
2
3
5
6
Output SAS:
Analysis of Variance Procedure
Class Level Information
Class
Levels
A
2
B
3
Number of observations in
Values
1 2
1 2 3
data set = 12
Dependent Variable: Y
Source
DF
Sum of Squares
Mean Square
F Value
Pr > F
Model
Error
Corrected Total
5
6
11
46.66666667
7.00000000
53.66666667
9.33333333
1.16666667
8.00
0.0125
R-Square
0.869565
C.V.
25.92296
Root MSE
1.08012345
DF
Anova SS
Mean Square
F Value
Pr > F
1
2
2
12.00000000
32.66666667
2.00000000
12.00000000
16.33333333
1.00000000
10.29
14.00
0.86
0.0184
0.0055
0.4705
Source
A
B
A*B
Y Mean
4.16666667
2.1
Commentare i risultati.
2.2
Scrivere la tabella dell’analisi della varianza per il modello con il solo fattore B:
y jk     j   jk con j  1,2 k  1,3
22