Metodi statistici
(G. Galimberti, A. Capitanio, R. Miglio)
Analisi esplorativa dei dati: rappresentazioni grafiche, indicatori di posizione, variabilità e forma di
una distribuzione statistica.
Il modello di regressione lineare semplice e multipla: significato dei parametri, stima dei
coefficienti di col metodo dei minimi quadrati, valutazione della bontà di adattamento del modello,
aspetti inferenziali.
Il modello di regressione logistica semplice e multipla: odds ratio, trasformata logistica, significato
dei parametri, stima dei coefficienti col metodo della massima verosimiglianza, valutazione della
bontà di adattamento del modello, aspetti inferenziali. Uso del modello di regressione logistica per
la costruzione di una regola di classificazione.
Cenni ai modelli lineari generalizzati.
La scelta del modello di regressione (lineare o logistica): tecniche di selezione automatica dei
regressori, criteri parametrici e non parametrici per il confronto tra modelli.
Tecniche non parametriche per la regressione e la classificazione: i metodi di partizione ricorsiva.
Gli algoritmi CART e CHAID.
Cenni all’analisi discriminante e all’analisi dei gruppi.
Riferimenti Bibliografici:
Azzalini, A., Scarpa, B. (2004): Analisi dei dati e data mining. Springer-Verlag, Milano
Giudici, P. (2005): Data mining. Metodi statistici per le applicazioni aziendali. II edizione.
McGraw-Hill, Milano
Hosmer, D. W., Lemeshow, S. (2000): Applied logistic regression. II edition. Wiley, New York
Montgomery, D. C., Peck, E. A., Vining, G. G. (2001): Introduction to linear regression analysis.
III edition. Wiley, New York