PROVA DI LABORATORIO
Algebra e Modelli Lineari
18 gennaio 2005
NOME:
COGNOME:
Esercizio:
Il dataset gala, contenuto nella libreria faraway, contiene un esempio su alcune specie di tartaruga
presenti nelle isole Galapagos. In 30 isole diverse si sono rilevate le seguenti variabili: Species – numero
di specie di tartaruga trovate nell’isola; Endemics – numero di specie endemiche, Area – area dell’isola
in km2, Elevation – il punto più alto dell’isola in metri; Nearest – distanza dall’isola più vicina (in
km); Scruz – distanza in km dall’isola di SantaCruz, Adjacent – area dell’isola più vicina (in km2).
1) Si consideri un modello di regressione multipla in cui la variabile Species è assunta quale variabile
dipendente e le restanti variabili, con l’esclusione della variabile Endemics, rappresentano i regressori.
2) Quanto varia in media il numero di specie di tartaruga per ogni metro in più di altezza del punto più
elevato?
_______________________________________________________________________________________
3) Si controlli l’ipotesi nulla di significatività del coefficiente di regressione della variabile Elevation
nel modello di regressione multipla scegliendo un livello alfa pari a 0.05:
_______________________________________________________________________________________
4) Si calcoli il VIF della variabile Area: ____________________________________________________
_______________________________________________________________________________________
5) Quale dei regressori è più importante nello spiegare la variabilità della variabile dipendente?
_______________________________________________________________________________________
6) In termini di capacità esplicativa della variabile risposta è preferibile il modello costruito al punto 1) o
quello che contiene soltanto i regressori Endemics e Nearest? Si risponda utilizzando un
appropriato indicatore e indicando l’indicatore utilizzato:
_______________________________________________________________________________________