Data Mining Rosaria Lombardo

annuncio pubblicitario
Data Mining
Rosaria Lombardo
Programma
Questo corso si propone di descrivere alcuni metodi statistici di particolare rilevanza nelle indagini
di valutazione delle aziende di produzione e/o servizi quando si ha disponibile una grande mole di
dati. Più specificamente si propone lo studio della rilevazione dell’informazione, l’analisi
esplorativa multivariata dei dati e lo studio della dipendenza tra variabili. Nella parte finale del
corso si introducono strumenti di misura di fenomeni strettamente connessi all’attività di marketing
di una azienda, quali i consumi, l’audience della pubblicità e la soddisfazione del consumatore.
Il Data Mining e la valutazione statistica dei dati di performance aziendale
• Organizzazione dei dati
• Analisi esplorativa dei dati:
o Analisi delle Componenti Principali
• Modelli statistici per il Data Mining
o Modello di Regressione lineare multiplo
• Ipotesi per la costruzione del modello
• Inferenza sui parametri del modello
• Analisi dei residui del modello
o Introduzione ai Modelli a scelta discreta: la regressione logistica
o La Classificazione automatica gerarchica e non gerarchica
Metodologie didattiche
Le lezioni, oltre che ex cathedra, prevedono anche l’esame di case studies e lo svolgimento di
esercitazioni nel laboratorio informatico. Esercitazioni in laboratorio informatico con diversi
pacchetti di software statistico.
Modalità di svolgimento degli esami
I candidati devono preparare un elaborato in cui si applicano le diverse tecniche multivariate e
devono sostenere una prova orale.
Libri di testo
Giudici P. Data Mining, metodi informatici, statistici ed applicazioni. McGraw-Hill- cap. I,II, III,
IV, V.
e/o
Gherghi M., Lauro N.C. Analisi Multidimensionale dei Dati. Ed. EDISU; Introduzione, cap. I, VI
Durante il corso saranno rilasciate alcune dispense integrative
Scarica