La riparametrizzazione dei Modelli Lineari e le procedure

introduzione
MLG & GLM
altre procedure
oranges
conclusioni
La riparametrizzazione dei Modelli Lineari e le
procedure GLM e MIXED di SAS
E.D’Arcangelo, C.Vitiello
DIPARTIMENTO DI STATISTICA
Sapienza Universita’ di Roma
11 dicembre 2012
E.D’Arcangelo, C.Vitiello (Dip. Statistica) La riparametrizzazione dei Modelli Lineari e le procedure
11GLM
dicembre
e MIXED
2012
di SAS1 / 23
introduzione
MLG & GLM
altre procedure
oranges
conclusioni
Anova
Regressione
M ODELLO
L INEARE
G ENERALE
MANCOVA
R ISPOSTA
M ULTIVARIATA
Ancova
MANOVA
M ODELLI
PER M ISURE
R IPETUTE
M ODELLI
A EFFETTI
CASUALI
M ODELLI A
EFFETTI MISTI
E.D’Arcangelo, C.Vitiello (Dip. Statistica) La riparametrizzazione dei Modelli Lineari e le procedure
11GLM
dicembre
e MIXED
2012
di SAS2 / 23
introduzione
MLG & GLM
altre procedure
oranges
conclusioni
Anova
Regressione
M ODELLO
L INEARE
G ENERALE
MANCOVA
R ISPOSTA
M ULTIVARIATA
Ancova
MANOVA
M ODELLI
PER M ISURE
R IPETUTE
M ODELLI
A EFFETTI
CASUALI
M ODELLI A
EFFETTI MISTI
E.D’Arcangelo, C.Vitiello (Dip. Statistica) La riparametrizzazione dei Modelli Lineari e le procedure
11GLM
dicembre
e MIXED
2012
di SAS2 / 23
introduzione
MLG & GLM
altre procedure
oranges
conclusioni
Anova
Regressione
M ODELLO
L INEARE
G ENERALE
MANCOVA
R ISPOSTA
M ULTIVARIATA
Ancova
MANOVA
M ODELLI
PER M ISURE
R IPETUTE
M ODELLI
A EFFETTI
CASUALI
M ODELLI A
EFFETTI MISTI
E.D’Arcangelo, C.Vitiello (Dip. Statistica) La riparametrizzazione dei Modelli Lineari e le procedure
11GLM
dicembre
e MIXED
2012
di SAS2 / 23
introduzione
MLG & GLM
altre procedure
oranges
conclusioni
Anova
Regressione
M ODELLO
L INEARE
G ENERALE
MANCOVA
R ISPOSTA
M ULTIVARIATA
Ancova
MANOVA
M ODELLI
PER M ISURE
R IPETUTE
M ODELLI
A EFFETTI
CASUALI
M ODELLI A
EFFETTI MISTI
E.D’Arcangelo, C.Vitiello (Dip. Statistica) La riparametrizzazione dei Modelli Lineari e le procedure
11GLM
dicembre
e MIXED
2012
di SAS2 / 23
introduzione
MLG & GLM
altre procedure
oranges
conclusioni
Anova
Regressione
M ODELLO
L INEARE
G ENERALE
MANCOVA
R ISPOSTA
M ULTIVARIATA
Ancova
MANOVA
M ODELLI
PER M ISURE
R IPETUTE
M ODELLI
A EFFETTI
CASUALI
M ODELLI A
EFFETTI MISTI
E.D’Arcangelo, C.Vitiello (Dip. Statistica) La riparametrizzazione dei Modelli Lineari e le procedure
11GLM
dicembre
e MIXED
2012
di SAS2 / 23
introduzione
MLG & GLM
altre procedure
MODELLO LINEARE GENERALE
oranges
conclusioni
Y = Aθ + U
con:
dove:
Yn×1
vettore di v.c. osservabili
A
θp×1
matrice di costanti note
vettore di parametri incogniti
Un×1
vettore di v.c. non osservabili
E(U) = 0
Cov (Ui Uj ) = 0,
Cov (Ui Ui ) = σ 2 ;
Ui ∼ N(0, σ 2 ),
σ ignoto;
E.D’Arcangelo, C.Vitiello (Dip. Statistica) La riparametrizzazione dei Modelli Lineari e le procedure
11GLM
dicembre
e MIXED
2012
di SAS3 / 23
introduzione
MLG & GLM
altre procedure
oranges
conclusioni
modelli regressivi
REGRESSIONE SEMPLICE
Yi = β0 + β1 Xi + εi
Y = k + X + acc
proc glm data=campus;
model Y = X;
run;
i = 1...n
εi ∼ N(0, σ 2 )
i.i.d
E(Yi ) = µi = β0 + β1 Xi
REGRESSIONE MULTIPLA
Y = k + X1 . . . X(P−1) + acc
Yi = β0 + β1 Xi + . . . + βp Xi(p−1) + εi
εi ∼ N(0, σ 2 )
i.i.d
REGRESSIONE POLINOMIALE
Yi = β0 + β1 X1i + β2 X1i2 + β3 X1i3 + εi
εi ∼ N(0, σ 2 )
i.i.d
proc glm data=campus;
model Y = X1 X2 ..X(P-1);
run;
Y = k + X1 + X21 + X31 + acc
proc glm data=campus;
model Y = X1 X1**2 X1**3;
run;
E.D’Arcangelo, C.Vitiello (Dip. Statistica) La riparametrizzazione dei Modelli Lineari e le procedure
11GLM
dicembre
e MIXED
2012
di SAS4 / 23
introduzione
MLG & GLM
altre procedure
oranges
conclusioni
modelli per l’analisi della varianza (not full rank)
DISEGNO COMPLETAMENTE RANDOMIZZATO
Yij = µ + αi + εij
2
εi ∼ N(0, σ )
P
i.i.d
αi = 0 E(yij ) = µij = µ + αi
DISEGNO A BLOCCHI RANDOMIZZATI
Yij = µ + αi + βj + εij
εij ∼ N(0, σ 2 ),
P
αi = 0,
P
βj = 0
E(yij ) = µij = µ + αi + βj
proc glm data=campus;
class=A; model Y = A;
run;
Y = k + A + B + acc
proc glm data=campus;
class=A B; model Y = A B;
run;
DISEGNO FATTORIALE con effetto interattivo
Yij = µ + αi + βj + (αβ)ij + εij
P
P
εij ∼ N(0, σ 2 ),
αi = 0,
βj = 0
P
P
i (αβ)ij = 0 ∀j
j (αβ)ij = 0 ∀i
Y = k + A + acc
Y = k + A + B + A*B + acc
proc glm data=campus;
class=A B; model Y = A B A*B;
run;
E.D’Arcangelo, C.Vitiello (Dip. Statistica) La riparametrizzazione dei Modelli Lineari e le procedure
11GLM
dicembre
e MIXED
2012
di SAS5 / 23
introduzione
MLG & GLM
altre procedure
oranges
conclusioni
modelli ancova
ANCOVA A=fatt.sper. X=var.quant.
Y = k + A + X + acc
Yij = µ + αi + β(Xij − X̄ ) + εij
2
εij ∼ N(0, σ )
i.i.d
E(Yij ) = µij = µ + αi + β(Xij − X̄ )
ANCOVA con interazione
Y = k + A + X + A*X + acc
Yij = µ + αi + βi (Xij − X̄ ) + εij
εij ∼ N(0, σ 2 )
i.i.d
REGRESS. MULTIPLA (A var.di classif.)
Yij = β0 + β1 X 1ij . . . + βk Xhij + αi + εij
2
εij ∼ N(0, σ )
i.i.d
proc glm data=campus;
class=A; model Y= A X;
run;
proc glm data=campus;
class=A; model Y = A X A*X;
run;
Y = k + X1 . . . Xh + A + acc
proc glm data=campus;
class=A; model Y= X1 X2 ... Xh A;
run;
E.D’Arcangelo, C.Vitiello (Dip. Statistica) La riparametrizzazione dei Modelli Lineari e le procedure
11GLM
dicembre
e MIXED
2012
di SAS6 / 23
introduzione
MLG & GLM
altre procedure
oranges
conclusioni
modelli a effetti casuali e misti PROC GLM e PROC MIXED
ANOVA: DIS.FATTORIALE (A cas.)
Yijr = µ + αi + βj + (αβ)ij + εijr
2
εijr ∼ N(0, σ )
2
2
αi ∼ N(0, σα
) (αβ)ij ∼ N(0, σ(αβ)
)
E(Yijr ) = µijr = µ + αi
oss: l’interazione (αβ) e’ casuale
Y= k + A +B + AB +acc
proc glm data=campus;
class=A B;
model Y = A B A*B/options;
random A A*B/test;
run;
E.D’Arcangelo, C.Vitiello (Dip. Statistica) La riparametrizzazione dei Modelli Lineari e le procedure
11GLM
dicembre
e MIXED
2012
di SAS7 / 23
introduzione
MLG & GLM
altre procedure
oranges
conclusioni
modelli a effetti casuali e misti PROC GLM e PROC MIXED
ANOVA: DIS.FATTORIALE (A cas.)
Yijr = µ + αi + βj + (αβ)ij + εijr
2
εijr ∼ N(0, σ )
2
2
αi ∼ N(0, σα
) (αβ)ij ∼ N(0, σ(αβ)
)
E(Yijr ) = µijr = µ + αi
oss: l’interazione (αβ) e’ casuale
ANOVA: DIS.FATTORIALE (A cas.)
Yijr = µ + αi + βj + (αβ)ij + εijr
εijr ∼ N(0, σ 2 )
2
2
αi ∼ N(0, σα
) (αβ)ij ∼ N(0, σ(αβ)
)
E(yijr ) = µijr = µ + αi
oss: l’interazione (αβ) e’ casuale
Y= k + A +B + AB +acc
proc glm data=campus;
class=A B;
model Y = A B A*B/options;
random A A*B/test;
run;
Y= k + A +B + AB +acc
proc mixed data=campus;
class=A B;
model Y = B /options;
random A A*B/test;
run;
E.D’Arcangelo, C.Vitiello (Dip. Statistica) La riparametrizzazione dei Modelli Lineari e le procedure
11GLM
dicembre
e MIXED
2012
di SAS7 / 23
introduzione
MLG & GLM
altre procedure
oranges
conclusioni
modelli per risposta multivariata
MANCOVA (Y mult.) A B=fatt.sper.
Y1 -Yh = µ+αi +βj +(αβ)ij +βX +ε
P
Y1 ..Yh ∼ MNh (µ, )
Y1 ..Yh =k + A + B + A*B + X + acc
proc glm data=campus;
class=A B ;
model Y1-Yh = A B A*B X/options;
manova h= all ;
run;
E.D’Arcangelo, C.Vitiello (Dip. Statistica) La riparametrizzazione dei Modelli Lineari e le procedure
11GLM
dicembre
e MIXED
2012
di SAS8 / 23
introduzione
MLG & GLM
altre procedure
oranges
conclusioni
modelli per risposta multivariata
MANCOVA (Y mult.) A B=fatt.sper.
Y1 -Yh = µ+αi +βj +(αβ)ij +βX +ε
P
Y1 ..Yh ∼ MNh (µ, )
ANCOVA (mis.ripet.) A,B=fatt.sper.
Y1 -Y3 = µ+αi +βj +(αβ)ij +βX +ε
P
Y1 ..Y3 ∼ MN3 (µ, )
Y1 ..Yh =k + A + B + A*B + X + acc
proc glm data=campus;
class=A B ;
model Y1-Yh = A B A*B X/options;
manova h= all ;
run;
Y1 Y2 Y3 = k + A + B + A*B + X + acc
proc glm data=campus;
class=A B;
model Y1-Y3 = A B A*B X/options;
repeated Time 3 (1 2 3) polynomial;
run;
E.D’Arcangelo, C.Vitiello (Dip. Statistica) La riparametrizzazione dei Modelli Lineari e le procedure
11GLM
dicembre
e MIXED
2012
di SAS8 / 23
introduzione
MLG & GLM
altre procedure
oranges
conclusioni
procedure ”specifiche”
MODELLI ANOVA PER DISEGNI
SPERIMENTALI BILANCIATI
PROC ANOVA
MODELLI DI REGRESSIONE
PROC REG
MODELLI ANOVA E REG. QUANDO E’ RICHIESTO UN
METODO DI ORTOGONALIZZAZIONE DEI DATI
PROC ORTHOREG
MODELLI DI REGRESSIONE ROBUSTA PER LIMITARE
GLI EFFETTI DELLA PRESENZA DI OUTLIERS
PROC ROBUSTREG
MODELLI DI REGRESSIONE PER SUPERFICI DI
RISPOSTA QUADRATICHE
PROC RSREG
MODELLI LINEARI CHE RICHIEDONO
TRASFORMAZIONI NON LINEARI O SPLINE
PROC TRANSREG
E.D’Arcangelo, C.Vitiello (Dip. Statistica) La riparametrizzazione dei Modelli Lineari e le procedure
11GLM
dicembre
e MIXED
2012
di SAS9 / 23
introduzione
MLG & GLM
altre procedure
oranges
conclusioni
bond data
ESEMPIO”BOND DATA”
fonte: ”SAS System for Mixed Models”
R.Littel, G.Milliken,W.Stroup,R.Wolfinger
DISEGNO:
RISPOSTA:
FATTORE SPERIMENTALE:
FATTORE BLOCCO:
BLOCCHI RANDOMIZZATI
PRESSIONE (v.c.)
METAL (Copper,Iron,Nikel)((eff.fiss.)
INGOT (Eff.Casuale)
R= k + METAL +IN GOT + acc
proc glm data=ingot;
class=METAL INGOT;
model PRES = INGOT METAL;
random INGOT;
lsmeans METAL/pdiff;
estimate ’Nikel Mean’
Intercept 1 Metal 0 0 1;
contrast’Copper vs Iron’
Metal 1 -1 ;
run;
proc mixed data=ingot;
class=METAL INGOT;
model PRES = METAL;
random INGOT;
lsmeans METAL/pdiff;
estimate ’Nikel Mean’
Intercept 1 Metal 0 0 1;
contrast’Copper vs Iron’
Metal 1 -1 0;
run;
E.D’Arcangelo, C.Vitiello (Dip. Statistica) La riparametrizzazione dei Modelli Lineari e le procedure
11 dicembre
GLM e MIXED
2012di SAS
10 / 23
introduzione
MLG & GLM
altre procedure
oranges
conclusioni
ORANGES: il disegno sperimentale
ESEMPIO ”ORANGES DATA”
fonte: ”SAS System for Linear Models”
R.Littel, W.Stroup,and R.Freund - Fourth Edition
DISEGNO: Blocchi Randomizzati con una replicazione per casella;
OSSERVAZIONI: n=6x6 =36;
FATTORE SUBSPERIMENTALE: STORE con h=6 modalita’;
VAR.RISPOSTA: Q1, Q2= Quantita’ di Arance vendute di due qualita’;
VAR.CONCOMITANTI: P1, P2= Prezzo delle due qualita’ di Arance.
Day
Store
Day 1
STO 1
Q111 Q211
P111 P211
Day 2
Day 3
Day 4
Day 6
medie
Q116 Q216
P116 P216
Q125 Q225
P125 P225
STO 2
Q133 Q233
P133 P233
STO 3
Q142 Q242
P142 P242
STO 4
Q154 Q254
P154 P254
STO 5
STO 6
Day 5
Q161 Q261
P161 P261
Q166 Q266
P166 P266
medie
E.D’Arcangelo, C.Vitiello (Dip. Statistica) La riparametrizzazione dei Modelli Lineari e le procedure
11 dicembre
GLM e MIXED
2012di SAS
11 / 23
introduzione
MLG & GLM
altre procedure
oranges
conclusioni
ORANGES: analisi descrittiva
Analysis Variable : Q1
Store N Obs Mean Std Dev Min
1
6
12.66
3.76
8.65
2
6
8.4
7.19
0
3
6
6.64
4.8
0
4
6
8.33
5.16
1.44
5
6
9.89
6.51
3.61
6
6
15.37 10.31
0
Max
18.89
21.79
13.23
14.99
20.76
28.18
Analysis Variable : Q1
Day N Obs Mean Std Dev Min
1
6
7.87
2.93
4.26
2
6
7.1
6.42
0
3
6
13.76
5.92
8.05
4
6
8.04
5.64
0
5
6
12.92
6.44
6.14
6
6
11.6
10.89 1.44
Max
11.35
14.99
22.61
14.67
20.76
28.18
Simple Statistics
Variable
P1
P2
Q1
Q2
N
36
36
36
36
Mean Std Dev
51.22 6.0809
48.56 7.9873
10.22 6.8320
11.06 8.8644
Sum Minimum Maximum
1844 37.0000
61.0000
1748 33.0000
65.0000
368
0.0017
28.1828
398
0.0037
40.5720
E.D’Arcangelo, C.Vitiello (Dip. Statistica) La riparametrizzazione dei Modelli Lineari e le procedure
11 dicembre
GLM e MIXED
2012di SAS
12 / 23
introduzione
MLG & GLM
altre procedure
oranges
conclusioni
ORANGES: analisi descrittiva
Pearson Correlation Coefficients, N=36
Prob > |r| under H0: Rho=0
P1
P1
1.000
P2
-0.017
Q1
-0.562
0.9228
0.0004
P2
-0 017
-0.017
Q1
0.0162
1 000
1.000
0 205
0.205
-0 567
-0.567
0.2296
0.0003
-0.562
0.205
1.000
-0.045
0.0004
0.2296
Q2
0.398
-0.567
-0.045
0.0162
0.0003
0.7930
0.9228
Q2
0.398
0.7930
1.000
E.D’Arcangelo, C.Vitiello (Dip. Statistica) La riparametrizzazione dei Modelli Lineari e le procedure
11 dicembre
GLM e MIXED
2012di SAS
13 / 23
introduzione
MLG & GLM
altre procedure
oranges
conclusioni
ORANGES: analisi descrittiva
E.D’Arcangelo, C.Vitiello (Dip. Statistica) La riparametrizzazione dei Modelli Lineari e le procedure
11 dicembre
GLM e MIXED
2012di SAS
14 / 23
introduzione
MLG & GLM
altre procedure
oranges
conclusioni
ORANGES: analisi descrittiva
E.D’Arcangelo, C.Vitiello (Dip. Statistica) La riparametrizzazione dei Modelli Lineari e le procedure
11 dicembre
GLM e MIXED
2012di SAS
15 / 23
introduzione
MLG & GLM
altre procedure
oranges
conclusioni
ORANGES: formalizzazione
MODELLI AD EFFETTI FISSI
Q1=k+STORE+DAY +STORE*DAY+ACC
DISEGNO FATT.: MODELLO ANOVA
(r=1: gdl insufficienti)
Q1=k+STORE+DAY+ACC
DIS.BL.RAND.: MODELLO ANOVA
MODELLI AD EFFETTI FISSI CON VARIABILI CONCOMITANTI
Q1=k+STORE+DAY+P1+ACC
DBR con Var.Con.: MODELLO ANCOVA
HP parallelismo
Q1=k+STORE+DAY+P1*DAY+ACC
DBR con Var.Con.: MODELLO ANCOVA
Q1=k+STORE+DAY+P1+P2+ACC
DBR con Var.Con.: MODELLO ANCOVA
test dell’HP parallelismo
HP parallelismo
MODELLI AD EFFETTI FISSI var. risp.=Q2
Q2=k+STORE+DAY+STORE*DAY+ACC
DISEGNO FATT.: MODELLO ANOVA
(r=1: gdl insufficienti)
.............
E.D’Arcangelo, C.Vitiello (Dip. Statistica) La riparametrizzazione dei Modelli Lineari e le procedure
11 dicembre
GLM e MIXED
2012di SAS
16 / 23
introduzione
MLG & GLM
altre procedure
oranges
conclusioni
ORANGES: formalizzazione
MODELLI AD EFFETTI MISTI
(ad.es.: i sei store sono un campione da una popolazione di 30 supermercati)
Q1=k+ST ORE+DAY+P1+ACC
DBR con Var.Con.: MODELLO ANCOVA
MODELLI AD EFFETTI FISSI PER RISPOSTA MULTIVARIATA
Q1 Q2=k+STORE+DAY+ACC
DBR: MODELLO MANOVA
risp.bivariata
Q1 Q2=k+STORE+DAY+P1+P2+ACC
DBR: MODELLO MANCOVA
risp. bivariata, due var conc.
E.D’Arcangelo, C.Vitiello (Dip. Statistica) La riparametrizzazione dei Modelli Lineari e le procedure
11 dicembre
GLM e MIXED
2012di SAS
17 / 23
introduzione
MLG & GLM
altre procedure
oranges
conclusioni
ORANGES: modello anova (decomposizione della devianza)
1) Q1=k+STORE+DAY+STORE*DAY+acc
Source
Source
Model
Model
Error
Error
Corrected Total
Corrected Total
Store
Store
Day
Day
Store*Day
Store*Day
Source
Source
Model
Model
Error
Error
Corrected Total
Corrected Total
Store
Store
Day
Day
DF
35
0
35
5
5
25
2) Q1=k+STORE+DAY+acc
Dependent Variable: Q1
Dependent Variable: Q1
Sum of Squares Mean Square F Value
Pr>F
DF
Sum of Squares Mean Square F Value
Pr>F
1633.68
46.68
.
.
35
1633.68
46.68
.
.
0.00
.
0
0.00
.
1633.68
35
1633.68
313.42
62.68
.
.
5
313.42
62.68
.
.
250.40
50.08
.
.
5
250.40
50.08
.
.
1069.86
42.79
.
.
25
1069.86
42.79
.
.
Dependent Variable: Q1
Dependent Variable: Q1
DF
Sum of Squares Mean Square F Value
Pr>F
Sum
of Squares 56.38
Mean Square1.32F Value
10 DF
563.82
0.2746Pr>F
10
563.82
56.38
1.32
0.2746
25
1069.86
42.79
25
1069.86
42.79
35
1633.68
35
1633.68
5
313.42
62.68
1.46
0.2366
5
313.42
62.68
1.46
0.2366
5
250.40
50.08
1.17
0.3514
5
250.40
50.08
1.17
0.3514
R-Square
Coeff Var
R-Square 64.03
Coeff Var
0.35
0.35
64.03
Root MSE
Q1 Mean
Root MSE 10.22
Q1 Mean
6.54
6.54
10.22
E.D’Arcangelo, C.Vitiello (Dip. Statistica) La riparametrizzazione dei Modelli Lineari e le procedure
11 dicembre
GLM e MIXED
2012di SAS
18 / 23
introduzione
MLG & GLM
altre procedure
oranges
conclusioni
ORANGES: modello ancova (decomposizione della devianza)
Q1= k + STORE + DAY + P1 + acc
Dependent Variable: Q1
Source
DF
Source
Dependent
Variable:
Q1
Sum of
Squares
DF
Mean Square F Value
Sum of Squares Mean Square F Value
Model
11
1185.83
107.80
ErrorError
24
24
447.85
447.85
18.66
35
35
1633.68
1633.68
Model
11
Corrected
Total
Corrected
Total
Source
DF
Source
Store
DF
5
StoreDay
P1
Day
P1
55
1
5
1
1185.83
107.80
5.78
Pr>F
5.78
0.0002
18.66
Sum of Squares Mean Square F Value
Pr>F
Sum
of Squares
Mean Square
F Value
313.42
62.68
3.36 0.0193
250.40
313.42
622 01
622.01
250.40
622 01
622.01
Pr>F
0.0002
50.08
622 01
622.01
2.68
62.68
33 33
33.33
50.08
622 01
622.01
R-Square
Coeff Var
Root MSE
Q1 Mean
0.73
42.28
4.32
10.22
0.04603.36
< 0001
<.0001
2.68
33.33
33
33
R-Square
Coeff Var
Root MSE
Q1 Mean
0.73
42.28
4.32
10.22
Pr>F
0.0193
0.0460
< 0001
<.0001
E.D’Arcangelo, C.Vitiello (Dip. Statistica) La riparametrizzazione dei Modelli Lineari e le procedure
11 dicembre
GLM e MIXED
2012di SAS
19 / 23
introduzione
MLG & GLM
altre procedure
oranges
conclusioni
ORANGES: modello ancova (stima dei parametri)
Parameter
Estimate
Standard Error
Intercept
60.601
B
Store 1
Store 2
Store 3
Store 4
Store 5
Store 6
-8.538
-5.215
-6.976
-4.117
-4.892
0.000
B
B
B
B
B
B
Day 1
Day 2
Day 3
Day 4
Day 5
Day 6
-4.898
-4.503
3.322
-2.395
4.821
0.000
B
B
B
B
B
B
P1
-0.875
t Value
Pr > |t|
7.96
7.61
<.0001
2.69
2.51
2.51
2.54
2.50
.
-3.17
-2.08
-2.78
-1.62
-1.96
.
0.0041
0.0488
0.0105
0.1188
0.0617
.
2.50
2.49
2.50
2.50
2.57
.
-1.96
-1.81
1.33
-0.96
1.88
.
0.0620
0.0836
0.1968
0.3481
0.0725
.
0.15
-5.77
<.0001
Note: The X’X matrix has been found to be singular, and a generalized inverse was
used to solve the normal equations. Terms whose estimates are followed by the
letter ’B’ are not uniquely estimable.
E.D’Arcangelo, C.Vitiello (Dip. Statistica) La riparametrizzazione dei Modelli Lineari e le procedure
11 dicembre
GLM e MIXED
2012di SAS
20 / 23
introduzione
MLG & GLM
altre procedure
oranges
conclusioni
ORANGES: modello ancova con effetto interattivo P1*DAY (decomposizione della devianza)
Q1= k + STORE + DAY + P1 + P1*DAY + acc
test dell’ ipotesi di parallelismo
Dependent Variable: Q1
Source
DF
Sum of Squares
Model
16
Dependent
Variable: Q1
1264.81
ErrorSource
DF
19
Corrected Total
Error
3519
Model
16
Corrected Total
Source
Source
Store Store
Day Day
P1 P1
P1*Day
P1*Day
35
DF
DF
55
55
11
5
5
Sum of Squares
368.86
313.42
78.99
R-Square
Coeff Var
0.77
R-Square
43.12
Coeff
0.77
4.07
Mean Square
Mean Square
62.68
50.08
622.01
15.80
Root MSE
Var
43.12
F Value
Pr>F
4.07
0.0022
Pr>F
0.0022
19.41
Sum of Squares
313.42
250.40
250.40
622.01
622.01
78.99
F Value
19.41
79.05
1633.68
368.86
Sum of Squares
79.05
Mean Square
1264.81
1633.68
Mean Square
4.41
F Value
62.68
3.23
50.08
2.58
32.04
622.01
0.81
15.80
F Value
Pr>F
3.23
0.0282
2.58
0.0607
<.0001
32.04
0.5545
0.81
Pr>F
0.0282
0.0607
<.0001
0.5545
Q1 Mean
10.22
Root MSE
Q1 Mean
4.41
10.22
E.D’Arcangelo, C.Vitiello (Dip. Statistica) La riparametrizzazione dei Modelli Lineari e le procedure
11 dicembre
GLM e MIXED
2012di SAS
21 / 23
introduzione
MLG & GLM
altre procedure
oranges
conclusioni
ORANGES: modello ancova con effetto interattivo P1*DAY (stima dei parametri)
Parameter
Estimate
Standard Error t Value
Pr > |t|
Intercept
68.791
B
13.45
5.11
<.0001
Store 1
…
Store 5
Store 6
-8.016
…
-4.338
0.000
B
…
B
B
3.63
…
2.85
.
-2.21
…
-1.52
.
0.0397
…
0.1447
.
Day 1
…
Day 5
Day 6
-35.354
…
-8.218
0.000
B
…
B
B
20.83
…
31.56
.
-1.7
…
-0.26
.
0.1059
…
0.7974
.
P1
-1.041
B
0.28
-3.77
0.0013
P1*Day 1
…
P1*Day 5
P1*Day 6
0.617
…
0.252
0.000
B
…
B
B
0.42
…
0.59
.
1.48
…
0.43
.
0.1552
…
0.6724
.
Note: The X’X matrix has been found to be singular, and a generalized inverse was
used to solve the normal equations. Terms whose estimates are followed by the
letter ’B’ are not uniquely estimable.
E.D’Arcangelo, C.Vitiello (Dip. Statistica) La riparametrizzazione dei Modelli Lineari e le procedure
11 dicembre
GLM e MIXED
2012di SAS
22 / 23
introduzione
MLG & GLM
altre procedure
oranges
conclusioni
LINGUAGGIO
STATISTICO
SINTASSI
SEMPLICE
GRANDE
VERSATILITA’
PROC GLM
INVERSA
GENERALIZZATA
CORNER POINT
RIPARAMETRIZZAZIONE
DECOMPOSIZIONE
della
DEVIANZA
E.D’Arcangelo, C.Vitiello (Dip. Statistica) La riparametrizzazione dei Modelli Lineari e le procedure
11 dicembre
GLM e MIXED
2012di SAS
23 / 23
introduzione
MLG & GLM
altre procedure
oranges
conclusioni
LINGUAGGIO
STATISTICO
SINTASSI
SEMPLICE
GRANDE
VERSATILITA’
PROC GLM
INVERSA
GENERALIZZATA
CORNER POINT
RIPARAMETRIZZAZIONE
DECOMPOSIZIONE
della
DEVIANZA
E.D’Arcangelo, C.Vitiello (Dip. Statistica) La riparametrizzazione dei Modelli Lineari e le procedure
11 dicembre
GLM e MIXED
2012di SAS
23 / 23
introduzione
MLG & GLM
altre procedure
oranges
conclusioni
LINGUAGGIO
STATISTICO
SINTASSI
SEMPLICE
GRANDE
VERSATILITA’
PROC GLM
INVERSA
GENERALIZZATA
CORNER POINT
RIPARAMETRIZZAZIONE
DECOMPOSIZIONE
della
DEVIANZA
E.D’Arcangelo, C.Vitiello (Dip. Statistica) La riparametrizzazione dei Modelli Lineari e le procedure
11 dicembre
GLM e MIXED
2012di SAS
23 / 23
introduzione
MLG & GLM
altre procedure
oranges
conclusioni
La famiglia MODELLI LINEARI permette di
rappresentare un ampia gamma di situazioni
sperimentali ed osservazionali
Le procedure GLM e MIXED del SAS consentono
un analisi esauriente ed accurata dei modelli
lineari ad effetti fissi, casuali e misti
E.D’Arcangelo, C.Vitiello (Dip. Statistica) La riparametrizzazione dei Modelli Lineari e le procedure
11 dicembre
GLM e MIXED
2012di SAS
24 / 23
introduzione
MLG & GLM
altre procedure
oranges
conclusioni
Lo sviluppo esponenziale dell’hardware e del
software permette di affrontare con strumenti sempre
piu’ efficaci:
gli ultimi sviluppi degli aspetti teorici, metodologici,
applicativi dei MODELLI STATISTICI
le sfide proposte dalla sempre piu’ ampia
disponibilita’ dei ”BIG DATA” che partendo dalla
rete invadono la quotidianita’ ed i processi
decisionali
E.D’Arcangelo, C.Vitiello (Dip. Statistica) La riparametrizzazione dei Modelli Lineari e le procedure
11 dicembre
GLM e MIXED
2012di SAS
25 / 23