Indice pag. Premessa 9 1 Introduzione 11 2 Modello di regressione lineare semplice 1 Stima dei minimi quadrati . . . . . . . . . . . . . . . . . . . 1.1 Media e varianza degli stimatori dei minimi quadrati 1.2 Stimatore di σ 2 . . . . . . . . . . . . . . . . . . . . . 2 Coefficiente di determinazione R2 . . . . . . . . . . . . . . . 3 Normalità e funzione di verosimiglianza . . . . . . . . . . . 3.1 Stimatore di massima verosimiglianza . . . . . . . . 3.2 Distribuzione di (β̂1 , β̂2 ) . . . . . . . . . . . . . . . . 4 Inferenza sui parametri β1 e β2 . . . . . . . . . . . . . . . . 4.1 Verifica di ipotesi . . . . . . . . . . . . . . . . . . . . 4.2 Intervalli di confidenza . . . . . . . . . . . . . . . . . 4.3 Test del log-rapporto di verosimiglianza . . . . . . . 5 Legame tra t2 e R2 . . . . . . . . . . . . . . . . . . . . . . . 6 Previsione con il modello di regressione semplice . . . . . . 7 Esempio: altezze di madri e figlie . . . . . . . . . . . . . . . 8 Esempio con R: Analisi dei dati olimpiadi100m . . . . . . . 8.1 La regressione semplice passo per passo . . . . . . . 8.2 La regressione con la funzione lm . . . . . . . . . . . 9 Richiami sulla verosimiglianza . . . . . . . . . . . . . . . . . 10 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Analisi dei residui 1 Proprietà dei residui . . . . . . . . . . . . . . . . . . . . 2 Analisi grafiche . . . . . . . . . . . . . . . . . . . . . . . 3 Verifica dell’ipotesi di omoschedasticità . . . . . . . . . . 4 Verifica della normalità . . . . . . . . . . . . . . . . . . 4.1 Confronto tra densità e istogramma . . . . . . . 4.2 Confronto tra funzione di ripartizione teorica e empirica . . . . . . . . . . . . . . . . . . . . . . . 4.3 Confronto tra quantili teorici ed empirici . . . . 5 Esempio con R: Analisi dei dati olimpiadi100m . . . . . 6 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . funzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . di . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ripartizione . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 27 30 33 36 38 39 40 41 41 43 44 46 48 49 54 54 60 65 67 69 70 73 75 76 77 79 80 83 87 6 Indice pag. 4 Modello di regressione lineare multipla 1 Il modello . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Rappresentazione matriciale . . . . . . . . . . . . . . . . . . . . . . . 3 Stima dei parametri . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1 Stima di β . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Stima di σ 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Alcuni risultati sul modello stimato . . . . . . . . . . . . . . . . . . . 5 Interpretazione geometrica . . . . . . . . . . . . . . . . . . . . . . . . 6 Teorema di Gauss-Markov . . . . . . . . . . . . . . . . . . . . . . . . 7 Distribuzione degli stimatori . . . . . . . . . . . . . . . . . . . . . . . 7.1 Distribuzione di β̂ . . . . . . . . . . . . . . . . . . . . . . . . 7.2 Distribuzione di σ̂ 2 . . . . . . . . . . . . . . . . . . . . . . . . 7.3 Distribuzione congiunta di (β̂, σ̂ 2 ) . . . . . . . . . . . . . . . 8 Inferenza sul modello . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.1 Inferenza su un singolo coefficiente . . . . . . . . . . . . . . . 8.2 Verifica d’ipotesi sulla nullità di un gruppo di coefficienti . . 8.3 Caso particolare: nullità di un singolo coefficiente . . . . . . . 8.4 Caso particolare: verifica del modello nel complesso . . . . . 8.5 Altri sistemi di ipotesi . . . . . . . . . . . . . . . . . . . . . . 8.6 Caso generale: verifica di ipotesi su un gruppo di coefficienti 8.7 Interpretazione geometrica del confronto tra modelli . . . . . 8.8 Costruzione di regioni di confidenza . . . . . . . . . . . . . . 8.9 Confronto di modelli non annidati . . . . . . . . . . . . . . . 8.10 Previsione con il modello di regressione lineare multipla . . . 9 Esempio: i dati sui ciliegi . . . . . . . . . . . . . . . . . . . . . . . . 10 Esempio: calcoli matriciali . . . . . . . . . . . . . . . . . . . . . . . . 11 Esempio con R: Analisi dei dati hills . . . . . . . . . . . . . . . . . 12 Esempio con R: Analisi dei dati uscrime . . . . . . . . . . . . . . . . 13 Richiami sulla normale multidimensionale . . . . . . . . . . . . . . . 14 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 Alcuni esempi notevoli: Test t a due campioni, ANOVA, 1 Confronto tra medie in due popolazioni normali . . . . . . . 1.1 Test t di Student a due campioni . . . . . . . . . . . 1.2 Il test t e il modello di regressione lineare semplice . 1.3 Verifica degli assunti . . . . . . . . . . . . . . . . . . 1.4 Scomposizione della somma dei quadrati . . . . . . . 1.5 Esempio con R: Analisi dei dati memoria1 . . . . . . 1.6 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . 2 Effetto di un trattamento: ANOVA . . . . . . . . . . . . . . 2.1 ANOVA a un fattore . . . . . . . . . . . . . . . . . . 2.2 L’ANOVA e il modello di regressione lineare . . . . . 2.3 Esempio con R: Analisi dei dati memoria . . . . . . . 2.4 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . 3 Effetto di due trattamenti: ANOVA a due fattori . . . . . . 3.1 ANOVA a due fattori senza interazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 91 93 95 95 96 97 99 101 103 104 104 105 105 105 106 109 110 111 111 114 115 115 117 118 120 124 130 141 143 ANCOVA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 149 150 151 156 158 159 165 166 166 169 177 181 183 189 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Indice 7 pag. . . . . . . . . . . mf . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195 198 201 202 207 211 215 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219 220 222 224 225 228 232 233 239 246 7 Limiti del modello lineare e cenni alle principali estensioni 1 Non linearità . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1 Interpretazione con un modello trasformato . . . . . . 1.2 Modelli polinomiali ed estensioni . . . . . . . . . . . . 2 Non normalità . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1 Trasformazioni di Box-Cox . . . . . . . . . . . . . . . 2.2 Modelli lineari generalizzati . . . . . . . . . . . . . . . 3 Eteroschedasticità . . . . . . . . . . . . . . . . . . . . . . . . 3.1 Trasformazioni per stabilizzare la varianza . . . . . . . 3.2 Minimi quadrati generalizzati . . . . . . . . . . . . . . 4 Dipendenza . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1 Autocorrelazione . . . . . . . . . . . . . . . . . . . . . 4.2 Test di autocorrelazione . . . . . . . . . . . . . . . . . 4.3 Rimedi all’autocorrelazione . . . . . . . . . . . . . . . 5 Multicollinearità . . . . . . . . . . . . . . . . . . . . . . . . . 6 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 249 250 251 253 254 255 258 259 260 262 264 264 266 267 269 271 8 Modelli per variabili risposta discrete 1 Introduzione . . . . . . . . . . . . . . . . . . 2 Famiglia esponenziale e verosimiglianza . . 2.1 Esempio: regressione logistica . . . . 2.2 Esempio: regressione di Poisson . . . 3 Inferenza . . . . . . . . . . . . . . . . . . . 3.1 Confronto tra modelli annidati . . . 4 Bontà del modello e residui . . . . . . . . . 5 Esempio con R: Analisi dei dati stress . . . 6 Esempio con R: Analisi dei dati challenger . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 273 273 274 278 279 279 280 283 284 289 4 3.2 ANOVA a due fattori con interazione . . . . . 3.3 Esempio con R: Analisi dei dati nails . . . . . 3.4 Esercizi . . . . . . . . . . . . . . . . . . . . . . Il modello ANCOVA . . . . . . . . . . . . . . . . . . . 4.1 Il modello ANCOVA . . . . . . . . . . . . . . . 4.2 Esempio con R: Analisi dei dati olimpiadi100m 4.3 Esercizi . . . . . . . . . . . . . . . . . . . . . . 6 Punti leva, anomali, influenti 1 Diagnostiche . . . . . . . . . . . . . . . . . 1.1 Punti leva . . . . . . . . . . . . . . . 1.2 Punti anomali . . . . . . . . . . . . . 1.3 Valori influenti . . . . . . . . . . . . 1.4 Derivazione di alcune formule . . . . 2 Cause e rimedi . . . . . . . . . . . . . . . . 3 Esempio con R: Analisi dei dati alctobacco 4 Esempio con R: Analisi dei dati lunatics . 5 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 Indice pag. 7 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 292 Bibliografia 297 Alfabeto greco 301 Indice analitico 303