MODÈLE LINÉAIRE - TD 1 Nom Esercizio 1) num. 1 2 3 4 5 6 7 8 9 10 11 Su una popolazione di 12 unità, vengono effettuate due rilevazioni quantitative, indicate con X e Y, i cui risultati sono riportati a fianco. 1.1 Costruire un grafico della congiunta delle variabili X e Y. distribuzione INDICARE CHIARAMENTE LA SCALA 12 1 X 45.85 42.90 42.85 42.24 40.16 49.03 40.94 42.25 41.61 41.92 45.47 49.83 Y 158.26 155.97 153.31 153.99 155.99 162.80 154.09 154.82 158.93 156.61 164.55 163.62 Per le rilevazioni precedenti si ha: Σ xi = 525.05 1.2 Σ xi2 = 23080.1 y = 157.75 var(y) = 15.57 Σ xi yi = 82930.9 Calcolare la media di X. 1.3 Calcolare la varianza di X. 1.4. Calcolare la covarianza fra X e Y. 1.5 Scrivere l'equazione della retta di regressione di Y rispetto a X. 1.6 X. Disegnare, sullo stesso sistema di assi usato in precedenza, la retta di regressione di Y rispetto a 1.7 Calcolare il valore del residuo per la quinta unità sperimentale e indicarlo sul grafico. 1.8 Calcolare l’indice R-sq per la regressione di Y rispetto a X (ricordando che nella regressione con una sola variabile esplicativa esso è il quadrato del coefficiente di correlazione fra X e Y). 2 Esercizio 2) 1. Dimostrare che, in un modello di regressione y 0 1 x con i coefficienti determinati con il metodo dei minimi quadrati, la somma dei residui è nulla: yi yˆ i 0 n i 1 2. Calcolare il coefficiente b che minimizza la somma dei quadrati dei residui in un modello con sola costante: y 3 MODÈLE LINÉAIRE - TD 1 (a casa) Nom Esercizio 3) Su una popolazione di 10 unità, vengono effettuate due rilevazioni quantitative, indicate con X e Y, i cui risultati sono riportati a fianco. Costruire un grafico della distribuzione congiunta delle variabili X e Y. INDICARE CHIARAMENTE LA SCALA num. 1 2 3 4 5 6 7 8 9 10 4 X -1.8 -1.8 -1.2 2.0 -1.7 0.2 0.5 3.5 1.4 Y -2.2 -20.0 -4.5 10.9 -6.1 11.2 8.0 23.0 10.3 1.2 8.6 Per le rilevazioni precedenti si ha: x = 0.23 var(x) = 3.358 Σ yi =39.20 Σ yi2 = 1479.6 Σ xi yi = 189.01 2.1 Calcolare la media di Y. 2.3. Calcolare la varianza di Y. 2.4 Calcolare la covarianza fra X e Y. 2.5 Scrivere l'equazione della retta di regressione di Y rispetto a X. 2.6 X. Disegnare, sullo stesso sistema di assi usato in precedenza, la retta di regressione di Y rispetto a 2.7 Calcolare il valore del residuo per la seconda unità sperimentale e indicarlo sul grafico. 2.8 Calcolare l’indice R-sq per la regressione di Y rispetto a X (ricordando che nella regressione con una sola variabile esplicativa esso è il quadrato del coefficiente di correlazione fra X e Y). 5 MODÈLE LINÉAIRE - TD 2 Nom num. 1 2 3 4 5 6 7 8 9 10 11 12 ESERCIZIO 1 Considerare i dati dell’esercizio 1 della lezione precedente (TD1), che riportiamo a fianco: Qui a fianco sono forniti i valori di Y approssimati linearmente tramite X con la tecnica dei minimi quadrati per i primi 10 dati. 1.1 Calcolare ŷ11 e ŷ12 . 1.2 Calcolare tutti i residui. 1.3 Costruire il grafico dei residui rispetto ai valori approssimati. ŷ1 ŷ 2 ŷ 3 ŷ 4 ŷ 5 ŷ 6 ŷ 7 ŷ 8 ŷ 9 ŷ10 ŷ11 ŷ12 = = = = = = = = = = = = 6 X 45.85 42.90 42.85 42.24 40.16 49.03 40.94 42.25 41.61 41.92 45.47 49.83 159,84 156,89 156,84 156,23 154,15 163,01 154,93 156,25 155,60 155,91 ...... ...... Y 158.26 155.97 153.31 153.99 155.99 162.80 154.09 154.82 158.93 156.61 164.55 163.62 e1 e2 e3 e4 e5 e6 e7 e8 e9 e10 e11 e12 = = = = = = = = = = = = ...... ...... ...... ...... ...... ...... ...... ...... ...... ...... ...... ...... ESERCIZIO 2 I seguenti grafici rappresentano i residui rispetto ai valori stimati di 4 modelli di regressione lineare. Per ciascuno di essi dire se il modello è adeguato o se sono necessarie eventuali trasformazioni dei dati ed indicare quali si ritengono opportune. MODELLO 1 MODELLO 2 COMMENTO COMMENTO MODELLO 3 MODELLO 4 COMMENTO COMMENTO ESERCIZIO 3 Si consideri un modello di regressione lineare privo di intercetta in cui la variabile risposta Y dipenda da un’unica variabile esplicativa X. Il modello avrà quindi equazione: yi = ß xi + i i=1, …, n Si calcoli la stima ai minimi quadrati di ß. 7 MODÈLE LINÉAIRE - TD 2 (a casa) Nom ESERCIZIO 4 Considerare i dati dell’esercizio 2 della lezione precedente (TD1), che riportiamo qui a fianco: num. 1 2 3 4 5 6 7 8 9 10 Qui a fianco sono forniti i valori di Y approssimati linearmente tramite X con la tecnica dei minimi quadrati per i primi 8 dati. 4.1 Calcolare ŷ 9 e ŷ10 . ŷ1 ŷ 2 ŷ 3 ŷ 4 4.2 = = = = X -1.8 -1.8 -1.2 2.0 -1.7 0.2 0.5 3.5 1.4 1.2 -8.17 -8.17 -4.60 14.46 ŷ 5 = -7.57 Calcolare tutti i residui. 4.3 Costruire il grafico dei residui rispetto ai valori approssimati. 8 Y -2.2 -20.0 -4.5 10.9 -6.1 11.2 8.0 23.0 10.3 8.6 e1 e2 e3 e4 = = = = ...... ...... ...... ...... 3.74 5.53 e5 = ...... e6 = ...... e7 = ...... ŷ 8 = 23.40 ŷ 9 = ..... ŷ10 = ..... e8 = ...... e9 = ...... e10 = ...... ŷ 6 = ŷ 7 = MODÈLE LINÉAIRE - TD 3 Nom ESERCIZIO 1 Considerare i dati riportiati qui a fianco: num. Si ottiene la seguente retta di regressione: Y = 135 + 0.476 x x Y e 1 45.85 158.26 . 2 42.90 155.97 . 3 42.85 153.31 . 4 42.24 153.99 . 5 40.16 155.90 . a) Calcolare i residui e la stima della varianza delle variabili aleatorie Y1 , K ,Y n b) Calcolare la stima s B2 0 della varianza di B0 e la stima s B2 0 della varianza di B1. c) Calcolare un intervallo di confidenza per ciascuno del coefficienti del modello 0 e 1 . 9 d) Effettuare un test a livello di significatività del 95% per verificare se il coefficiente 0 è nullo e) Calcolare: a. le stime y¶1 ,K , y¶5 dei valori attesi delle variabili risposta Y1 ,K ,Y5 b. le stime delle varianze degli stimatori Yµ,K ,Yµ 1 5 c. un intevallo di confidenza per ciascuno dei valori attesi delle variabili risposta Y1 ,K ,Y5 j y¶j x j x 2 hj 1 2 3 4 5 10 intervallo di confidenza per IE Y j ESERCIZIO 2 - LETTURA DI UN OUTPUT SAS Si considerino i dati .................... Dependent Variable: PERCORRE Analysis of Variance Source DF Sum of Squares Mean Square Model Error C Total 5 32 37 224.69314 62.22384 286.91697 44.93863 1.94449 Root MSE Dep Mean C.V. 1.39445 10.53111 13.24126 R-square Adj R-sq F Value Prob>F 23.111 0.0001 0.7831 0.7492 Parameter Estimates Variable DF Parameter Estimate Standard Error T for H0: Parameter=0 Prob > |T| INTERCEP DRIVE_R CILINDRA NUM_C RIPRESA PES_POT 1 1 1 1 1 1 27.390415 -2.407964 -0.001776 -0.462520 -0.406254 332.025153 3.95086954 0.79443447 0.00057888 0.44158181 0.18537862 209.18758707 6.933 -3.031 -3.068 -1.047 -2.191 1.587 0.0001 0.0048 0.0044 0.3028 0.0358 0.1223 Nella tabella Parameter Estimates sono riportate: Parameter Estimate: stime puntuali dei coefficienti 0 e 1 ., cioè i valori di b0 e b1 : Standard Error: stime puntuali delle standard deviation degi stimatori B 0 e B1 , cioè i valori di s B 0 e s B 1 : valore della statistica test per il test di nullità di ciascun coefficiente b b 0 e 1 : t 0 0 e t 1 1 sB 0 sB 1 p-value delle realizzaizoni campionarie t 0 e t 1 : T for H0: Parameter=0 Prob > |T|: a) Calcolare un intervallo di confidenza per ciascuno del coefficienti del modello 0 e 1 . b) Effettuare un test per verificare la nullità del coefficiente 0 contro l’alternadiva che sia diverso da zero. 11 MODÈLE LINÉAIRE - TD 4 Nom Alcune osservazioni sulla distribuzione degli stimatori dei coefficienti Consideriamo un modello di regressione lineare con p 1 variabili esplicative: y 0 1 x1 p 1 x p 1 Supponiamo che i dati osservati siano riferiti a un campione di una popolazione. Si può dimostrare che, se i residui hanno distribuzione normale e sono non correlati tra loro --cioè i ~ N (0, ) -- allora la variabile casuale Bk , stimatore del coefficiente k , ha una distribuzione tale che Bk k ha distribuzione t di Student a n p gradi di libertà, dove con S k si è Sk indicato lo stimatore della varianza di Bk . ---------------------------------------------------------------------Si considerino i dati relativi a 38 auto riguardanti: nazione di fabbricazione tipo di auto percorrenza (chilometri percorsi con un litro di carburante) peso (in kg) rapporto di trasmissione al ponte (drive ratio) potenza (in HP) cilindrata (in cm3) numero cilindri ripresa (secondi impiegati per percorrere da fermo un quarto di miglio cioè 402 m) la variabile casuale I dati sono tratti dall'articolo: H.V. Henderson & P.F. Velleman, Building Multiple Regression Models Interactively, Biometrics, 1981, p. 400. Di seguito è riportato un output SAS relativo alla regressione della variabile percorrenza rispetto alle variabili esplicative: drive ratio, cilindrata, numero cilindri, ripresa, peso/potenza. Dependent Variable: PERCORRE Analysis of Variance Source Model Error C Total DF 5 32 37 Root MSE Dep Mean C.V. Variable INTERCEP DRIVE_R CILINDRA NUM_C RIPRESA PES_POT DF 1 1 1 1 1 1 Sum of Squares 224.69314 62.22384 286.91697 1.39445 10.53111 13.24126 Mean Square 44.93863 1.94449 R-square Adj R-sq F Value 23.111 Prob>F 0.0001 0.7831 0.7492 Parameter Estimates Parameter Standard T for H0: Estimate Error Parameter=0 27.390415 3.95086954 6.933 -2.407964 0.79443447 -3.031 -0.001776 0.00057888 -3.068 -0.462520 0.44158181 -1.047 -0.406254 0.18537862 -2.191 332.025153 209.18758707 1.587 Prob > |T| 0.0001 0.0048 0.0044 0.3028 0.0358 0.1223 Nella tabella Parameter Estimates sono riportate le stime puntuali: dei singoli coefficienti, cioè i valori di b0 , b1 ,, b5 , nella colonna Parameter Estimate delle standard deviation dei singoli coefficienti, cioè i valori di s0 , s1 ,, s5 nella colonna Standard Error 12 ESERCIZIO 1 Calcolare un intervallo di confidenza a livello del 95% per ciascun coefficiente 0 , 1 ,, 5 . Coefficiente 0 : Coefficiente 1 : Coefficiente 2 : Coefficiente 3 : Coefficiente 4 : Coefficiente 5 : ESERCIZIO 2 Effettuare un test a livello di significatività del 5% per verificare la nullità di ciascun coefficiente 0 , 1 , , 5 . H 0 : k 0 contro H1 : k 0 Coefficiente 0 : Coefficiente 1 : Coefficiente 2 : Coefficiente 3 : Coefficiente 4 : Coefficiente 5 : ESERCIZIO 2 Effettuare un test a livello di significatività del 5% per verificare l’ugualianza dei coefficienti 3 e 4 : H 0 : 3 4 contro H 1 : 3 4 . B3 B4 3 4 Come statistica test si utilizzi la variable casuale B3 B 4 standardizzata, cioè , stˆd B3 B4 supponendo che abbia distribuzione normale. Per il calcolo della stima della varianza di B3 B 4 si consideri che l’elemento corrispondente a B3 B 4 della matrice X ' X 1 è – 0.0022. 13 MODÈLE LINÉAIRE - TD 5 Nom ESERCIZIO 1 Si consideri nuovamente il modello lineare che esprime il consumo di ossigeno da parte di atleti che praticano sport di fondo in dipendenza da variabili esplicative facilmente rilevabili anche sul campo. Inizialmente si costruisce un modello con variabili esplicative: ETA, PESO, TEMPO, PULS_FER, PULS_MED, PULS_MAX . I risultati della regressione sono i seguenti. Model: MODEL1 Dependent Variable: OSS Analysis of Variance Sum of Mean Source DF Squares Square Model Error C Total 6 24 30 Root MSE Dep Mean C.V. Variable DF INTERCEP ETA PESO TEMPO PUL_FER PUL_MED PUL_MAX 1 1 1 1 1 1 1 722.54361 128.83794 851.38154 2.31695 47.37581 4.89057 120.42393 5.36825 R-square Adj R-sq F Value Prob>F 22.433 0.0001 0.8487 0.8108 Parameter Estimates Parameter Standard T for H0: Estimate Error Parameter=0 102.934479 -0.226974 -0.074177 -2.628653 -0.021534 -0.369628 0.303217 12.40325810 0.09983747 0.05459316 0.38456220 0.06605428 0.11985294 0.13649519 8.299 -2.273 -1.359 -6.835 -0.326 -3.084 2.221 Prob > |T| 0.0001 0.0322 0.1869 0.0001 0.7473 0.0051 0.0360 Dai test di nullità dei singoli coefficienti risulta che singolarmente possono essere considerate ininfluenti, a livello del 5% le variabili variabili PESO e PUL_FER e a livello dell’1% anche le variabili ETA e PUL_MAX. Si ipotizza quindi che i coefficienti relativi a queste 4 variabili siano contemporaneamente nulli e si effettua una regressione senza le 4 variabili. I risultati della regressione lineare eseguita sul modello ridotto sono i seguenti. 14 Model: MODEL1 Dependent Variable: OSSIGENO Analysis of Variance Source DF Sum of Squares Mean Square Model Error C Total 2 28 30 648.26218 203.11936 851.38154 324.13109 7.25426 Root MSE Dep Mean C.V. 2.69337 47.37581 5.68513 R-square Adj R-sq F Value Prob>F 44.681 0.0001 0.7614 0.7444 Parameter Estimates Variable DF Parameter Estimate Standard Error T for H0: Parameter=0 Prob > |T| INTERCEP TEMPO PULS_MED 1 1 1 93.088766 -3.140188 -0.073509 8.24882295 0.37326470 0.05051438 11.285 -8.413 -1.455 0.0001 0.0001 0.1567 Si commenti l’output. 1.1 Si effettui un test di Fisher sulla nullità dei parametri relativi alle variabili ETA, PESO, PUL_FER e PUL_MAX. A tal fine, si determinino i gradi di libertà del denominatore utilizzando la tabella ANOVA. Quale è il valore campionario assunto dalla statistica test? Osservando le tavole della Fisher, si accetta o si rifiuta l’ipotesi principale? Il modello ridotto è quindi accettabile, cioè non fa perdere informazioni significative rispetto al modello completo? 1.2 Si calcoli il valore predetto per l’ossigeno nel modello ridotto per la quarta unità sperimentale e il residuo corrispondente. OBS 4 SESSO f ETA 42 PESO 68.15 OSS 59.571 TEMPO 8.17 PUL_FER 40 15 PUL_MED 166 PUL_MAX 172 MODÈLE LINÉAIRE – TD 5 Nom ESERCIZIO 2 Si vuole studiare se una variabile casuale Y possa avere una dipendenza lineare da 4 variabili esplicative, indicate con X1, X2, X3 e X4. MODELLO 1. Si effettua una regressione lineare considerando un modello con costante e con variabili esplicative X1, X2, X3 e X4. I risultati sono i seguenti: Analysis of Variance Source Model Error C Total DF 4 105 109 Sum of Squares 887.27763 3.10297 890.38060 Root MSE Dep Mean C.V. Mean Square 221.81941 0.02955 0.17191 40.20930 0.4275 F Value 7506.041 R-square Adj R-sq Prob>F 0.0001 0.9965 0.9964 Parameter Estimates Variable INTERCEP X1 X2 X3 X4 DF 1 1 1 1 1 Parameter Estimate 20.779155 0.012495 -0.143898 0.012429 0.006459 Standard Error 0.13504999 0.00010338 0.38621580 0.00010066 0.00765082 T for H0: Parameter=0 153.863 120.873 -0.373 123.473 0.844 Prob > |T| 0.0001 0.0001 0.7102 0.0001 0.4005 Nella tabella Analysis of Variance: - nella colonna DF si trovano i gradi di libertà dei vettori Xb y (in corrispondenza di Model), y Xb (in corrispondenza di Error) e - y y (in corrispondenza di C Total) nella colonna Sum of Squares, in corrispondenza della riga Error, si trova la somma dei quadrati dei residui nella colonna F Value si trova la quantità SS R SSC n p ,avendo indicato rispettivamente con SSC e SS R la somma dei quadrati dei SSC p1 residui nel modello completo e quella nel modello costituito dalla sola costante, avendo indicato con n il n. delle osservazioni e con p il n. dei coefficienti da stimare. Nella tabella Parameter Estimates: - Nella colonna Variable si trovano i nomi delle variabili esplicative (compresa la costante). Per ogni riga (cioè in corrispondenza di ogni variabile indicata nella colonna Variable): - nella colonna Parameter Estimate si trova la stima del coefficienti b k ; - nella colonna Standard Error si trova la stima sk delle deviazione standard degli stimatori Bk ; nella colonna T for H0 si trova il valore t k bk / s k ; nella colonna Prob > |T| si trova la probabilità che una variabile casuale T con distribuzione t di Student, con gradi di libertà n p , assuma valori inferiori a - t k o superiori a t k , cioè IP ( T t k ) , avendo indicato con n il numero delle osservazioni e con p il numero dei coefficienti da stimare. 16 Qui sotto è riportato il grafico dei residui studentizzati rispetto ai valori della regressione. Y2 = 20.779 +0.0125 X1 -0.1439 X2 +0.0124 X3 +0.0065 X4 3 N 110 Rsq 0.9965 2 AdjRsq 0.9964 Rt MSE 0.1719 1 0 -1 -2 -3 -4 32 34 36 38 40 42 44 46 48 Predicted Value of Y 2.1. In base ai dati precedenti stabilire se il modello è buono. Indicare eventuali possibili trasformazioni delle variabili. Spiegare nei dettagli quali dati si sono considerati MODELLO 2. E’ stata effettua una opportuna trasformazione di una o più variabili, ottenendo i seguenti risultati. Sono ora indicate con Y, X1, X2, X3 e X4 le variabili precedenti o loro trasformazioni. Analysis of Variance Source Model Error C Total DF 4 105 109 Sum of Squares 5705173.0499 9899.72372 5715072.7736 Root MSE Dep Mean C.V. Mean Square 1426293.2625 94.28308 9.70995 1624.88231 0.59758 F Value 15127.775 R-square Adj R-sq 0.9983 0.9982 Parameter Estimates Parameter Standard T for H0: 17 Prob>F 0.0001 Variable INTERCEP X1 X2 X3 X4 DF 1 1 1 1 1 Estimate 73.699471 1.001831 -9.342434 0.996904 1.241956 Error 7.62811335 0.00583908 21.81487039 0.00568556 0.43214615 Parameter=0 9.662 171.573 -0.428 175.340 2.874 Prob > |T| 0.0001 0.0001 0.6693 0.0001 0.0049 Y = 73. 699 +1. 0018 X1 - 9. 3424X2 +0. 9969 X3 +1. 242 X4 3 N 110 R sq 0. 9983 2 Adj R sq 0. 9982 R t M SE 9. 7099 1 0 -1 -2 -3 1000 1200 1400 1600 1800 Pr edi ct ed Val ue of 2000 2200 2400 Y 2.2. In base ai dati precedenti stabilire se il modello 2 è buono. Spiegare nei dettagli quali dati si sono considerati 18 MODELLO 3. Si effettua quindi una regressione considerando un modello con variabili esplicative X1 e X3. I risultati di questa regressione lineare sono i seguenti: Analysis of Variance Source Model Error C Total DF 2 107 109 Sum of Squares 5704393.8801 10678.89351 5715072.7736 Root MSE Dep Mean C.V. Mean Square 2852196.9401 99.80274 9.99013 1624.88231 0.61482 F Value 28578.342 R-square Adj R-sq Prob>F 0.0001 0.9981 0.9981 Parameter Estimates Variable INTERCEP X1 X3 DF 1 1 1 Parameter Estimate 62.110609 1.003832 0.994821 Standard Error 6.65562361 0.00592485 0.00579988 T for H0: Parameter=0 9.332 169.427 171.524 Prob > |T| 0.0001 0.0001 0.0001 2.3. Utilizzando questi dati e i precedenti effettuare il test di Fisher, a livello del 5%, per verificare se il modello ridotto senza le variabili X2 e X4 è buono (esplicitare il procedimento) 2.4. Si consideri il modello ridotto. Una osservazione ha i seguenti valori: Y=1417.25 X1=520.31 X3=839.75 a) Calcolare il valore di Y della regressione (arrotondare i dati alla prima cifra decimale) b) Calcolare il valore del residuo (arrotondare i dati alla prima cifra decimale) c) Sapendo che lo standard error di tale residuo è 9.90, calcolare il residuo studentizzato. 2.5. Calcolare un intervallo di confidenza a livello del 5% per il parametro della variabile X1 del modello ridotto. 19 MODÈLE LINÉAIRE - TD 6 Nom ESERCIZIO 1 Si consideri il modello lineare che esprime il tempo di vita (in ore) di un batterio in funzione dell’ossigeno disciolto nell’acqua di coltura (in milligrammi). L’output SAS della proc reg è il seguente. E’ indicata anche la matrice di varianza-covarianza dei coefficienti. The REG Procedure Dependent Variable: ore_vita Analysis of Variance Source DF Sum of Squares Mean Square Model Error Corrected Total 1 16 17 30.60514 7.73891 38.34404 30.60514 0.48368 Root MSE Dependent Mean Coeff Var 0.69547 9.93444 7.00062 R-Square Adj R-Sq F Value Pr > F 63.28 <.0001 0.7982 0.7856 Parameter Estimates Variable DF Parameter Estimate Standard Error t Value Pr > |t| Intercept mg_ossig 1 1 -12.81867 1.52404 2.86507 0.19159 -4.47 7.95 0.0004 <.0001 Covariance of Estimates Variable Intercept mg_ossig 1. Intercept mg_ossig 8.208636928 -0.548028813 -0.548028813 0.0367079174 Commentare i risultati e dire se la dipendenza lineare è significativa. Si vuole prevedere il tempo di vita per due nuove osservazioni delle quali si hanno solo i valori di ossigeno disciolto. Tali valori sono x19 14.38 e x 20 16.92 . 2. Calcolare le stime di y19 e y 20 . 3. Calcolare l’intervallo di confidenza a livello 90% per la media di y19 e per la media di y 20 . 4. Calcolare l’intervallo di confidenza a livello 90% per il valore predetto di y19 e per il valore predetto di y 20 . 20 MODÈLE LINÉAIRE - TD 8 Nom Si consideri una variabile quantativa Y e un fattore A a 3 livelli (indicati con 1, 2 e 3 ) La variabile Y in un campione assume i valori riportati a finco, suddivisi a seconda dei livelli del 1 2 fattore A. 7 2 5 Si consideri un modello di analisi della varianza a 9 una via: 3 3 yik i ik con i 1, ,3 k 1,2 4 1.1 Si scriva in modo esteso il modello in forma matriciale per i dati campionari (scrivere la matrice del disegno di rango pieno): y X* * 1.2 Si stimino i parametri ricordando che la stima di è la media generale della variabile risposta e la stima di i è la differenza fra la media del livello i e la media generale. 1.3 Si calcolino i valori stimati per la variabile risposta e i corrispondenti residui. 1.4 Si effettui il test di non influenza del fattore sulla variabile risposta a livello di significatività del 5%. Ricordare che il numeratore della statistica test - esclusi i gradi di libertà - è: 3 2 2 yi. y.. i 1 k 1 Per casa: esercizi 1 e 2 delle dispense. 21 MODÈLE LINÉAIRE - TD 9 Nom Si consideri una variabile quantativa Y e due fattori: A a 3 livelli e B a due livelli La variabile Y in un campione assume i valori riportati a finco, suddivisi a seconda dei livelli del fattore A. a 1 1 1 1 1 1 2 2 2 2 2 2 Si consideri un modello di analisi della varianza a due vie con interazione.: yijk i j ij ijk con i 1, ,3 j 1,2 k 1,2 Qui sotto è riportato l’output SAS dell’analisi della varianza b 1 1 2 2 3 3 1 1 2 2 3 3 y 3 6 3 4 7 8 1 2 2 3 5 6 Output SAS: Analysis of Variance Procedure Class Level Information Class Levels A 2 B 3 Number of observations in Values 1 2 1 2 3 data set = 12 Dependent Variable: Y Source DF Sum of Squares Mean Square F Value Pr > F Model Error Corrected Total 5 6 11 46.66666667 7.00000000 53.66666667 9.33333333 1.16666667 8.00 0.0125 R-Square 0.869565 C.V. 25.92296 Root MSE 1.08012345 DF Anova SS Mean Square F Value Pr > F 1 2 2 12.00000000 32.66666667 2.00000000 12.00000000 16.33333333 1.00000000 10.29 14.00 0.86 0.0184 0.0055 0.4705 Source A B A*B Y Mean 4.16666667 2.1 Commentare i risultati. 2.2 Scrivere la tabella dell’analisi della varianza per il modello con il solo fattore B: y jk j jk con j 1,2 k 1,3 22