Data Mining Rosaria Lombardo Programma Questo corso si propone di descrivere alcuni metodi statistici di particolare rilevanza nelle indagini di valutazione delle aziende di produzione e/o servizi quando si ha disponibile una grande mole di dati. Più specificamente si propone lo studio della rilevazione dell’informazione, l’analisi esplorativa multivariata dei dati e lo studio della dipendenza tra variabili. Nella parte finale del corso si introducono strumenti di misura di fenomeni strettamente connessi all’attività di marketing di una azienda, quali i consumi, l’audience della pubblicità e la soddisfazione del consumatore. Il Data Mining e la valutazione statistica dei dati di performance aziendale • Organizzazione dei dati • Analisi esplorativa dei dati: o Analisi delle Componenti Principali • Modelli statistici per il Data Mining o Modello di Regressione lineare multiplo • Ipotesi per la costruzione del modello • Inferenza sui parametri del modello • Analisi dei residui del modello o Introduzione ai Modelli a scelta discreta: la regressione logistica o La Classificazione automatica gerarchica e non gerarchica Metodologie didattiche Le lezioni, oltre che ex cathedra, prevedono anche l’esame di case studies e lo svolgimento di esercitazioni nel laboratorio informatico. Esercitazioni in laboratorio informatico con diversi pacchetti di software statistico. Modalità di svolgimento degli esami I candidati devono preparare un elaborato in cui si applicano le diverse tecniche multivariate e devono sostenere una prova orale. Libri di testo Giudici P. Data Mining, metodi informatici, statistici ed applicazioni. McGraw-Hill- cap. I,II, III, IV, V. e/o Gherghi M., Lauro N.C. Analisi Multidimensionale dei Dati. Ed. EDISU; Introduzione, cap. I, VI Durante il corso saranno rilasciate alcune dispense integrative