Data Mining
Rosaria Lombardo
Programma
Questo corso si propone di descrivere alcuni metodi statistici di particolare rilevanza nelle indagini
di valutazione delle aziende di produzione e/o servizi quando si ha disponibile una grande mole di
dati. Più specificamente si propone lo studio della rilevazione dell’informazione, l’analisi
esplorativa multivariata dei dati e lo studio della dipendenza tra variabili. Nella parte finale del
corso si introducono strumenti di misura di fenomeni strettamente connessi all’attività di marketing
di una azienda, quali i consumi, l’audience della pubblicità e la soddisfazione del consumatore.
Il Data Mining e la valutazione statistica dei dati di performance aziendale
• Organizzazione dei dati
• Analisi esplorativa dei dati:
o Analisi delle Componenti Principali
• Modelli statistici per il Data Mining
o Modello di Regressione lineare multiplo
• Ipotesi per la costruzione del modello
• Inferenza sui parametri del modello
• Analisi dei residui del modello
o Introduzione ai Modelli a scelta discreta: la regressione logistica
o La Classificazione automatica gerarchica e non gerarchica
Metodologie didattiche
Le lezioni, oltre che ex cathedra, prevedono anche l’esame di case studies e lo svolgimento di
esercitazioni nel laboratorio informatico. Esercitazioni in laboratorio informatico con diversi
pacchetti di software statistico.
Modalità di svolgimento degli esami
I candidati devono preparare un elaborato in cui si applicano le diverse tecniche multivariate e
devono sostenere una prova orale.
Libri di testo
Giudici P. Data Mining, metodi informatici, statistici ed applicazioni. McGraw-Hill- cap. I,II, III,
IV, V.
e/o
Gherghi M., Lauro N.C. Analisi Multidimensionale dei Dati. Ed. EDISU; Introduzione, cap. I, VI
Durante il corso saranno rilasciate alcune dispense integrative