PROVA DI LABORATORIO Algebra e Modelli Lineari 18 gennaio 2005 NOME: COGNOME: Esercizio: Il dataset gala, contenuto nella libreria faraway, contiene un esempio su alcune specie di tartaruga presenti nelle isole Galapagos. In 30 isole diverse si sono rilevate le seguenti variabili: Species – numero di specie di tartaruga trovate nell’isola; Endemics – numero di specie endemiche, Area – area dell’isola in km2, Elevation – il punto più alto dell’isola in metri; Nearest – distanza dall’isola più vicina (in km); Scruz – distanza in km dall’isola di SantaCruz, Adjacent – area dell’isola più vicina (in km2). 1) Si consideri un modello di regressione multipla in cui la variabile Species è assunta quale variabile dipendente e le restanti variabili, con l’esclusione della variabile Endemics, rappresentano i regressori. 2) Quanto varia in media il numero di specie di tartaruga per ogni metro in più di altezza del punto più elevato? _______________________________________________________________________________________ 3) Si controlli l’ipotesi nulla di significatività del coefficiente di regressione della variabile Elevation nel modello di regressione multipla scegliendo un livello alfa pari a 0.05: _______________________________________________________________________________________ 4) Si calcoli il VIF della variabile Area: ____________________________________________________ _______________________________________________________________________________________ 5) Quale dei regressori è più importante nello spiegare la variabilità della variabile dipendente? _______________________________________________________________________________________ 6) In termini di capacità esplicativa della variabile risposta è preferibile il modello costruito al punto 1) o quello che contiene soltanto i regressori Endemics e Nearest? Si risponda utilizzando un appropriato indicatore e indicando l’indicatore utilizzato: _______________________________________________________________________________________