Statistica (Statistical learning) PROF. GUIDO CONSONNI OBIETTIVO DEL CORSO La società moderna è caratterizzata da una massa crescente di informazioni e dati (big data). Il corso si propone di fornire strumenti moderni di Statistica e Data Science per modellizzare e comprendere dati di natura complessa sempre più presenti non solo in campo scientifico ma anche in ambito economico-aziendale. Particolare enfasi sarà rivolta agli aspetti computazionali - mediante l’uso del linguaggio gratuito ed open-source R - al fine di sviluppare concrete capacità di analisi empirica su casi concreti. Prerequisiti Gli studenti devono possedere nozioni di analisi dei dati, probabilità e inferenza al livello dei corsi di Statistica impartiti in una facoltà di Economia. Maggiori informazioni si trovano nelle AVVERTENZE. PROGRAMMA DEL CORSO 0. 1. 2. 3. 4. 5. 6. 7. Introduzione al linguaggio di programmazione R Introduzione a Statistical learning Regressione lineare Classificazione Metodi di ricampionamento Modello lineare: metodi di penalizzazione e scelta del modello Modelli non lineari Metodi statistici basati su alberi decisionali BIBLIOGRAFIA J. GARETH-D. WITTEN-T. HASTIE-R. TIBSHIRANI, An Introduction to Statistical Learning, Springer, 2013. Materiale del corso sulla piattaforma Blackboard. Software statistico R http://www.r-project.org/ DIDATTICA DEL CORSO Lezioni (60 ore) che prevedono la presentazione di metodi, l’esame di programmi in R e l’analsi di dati; esercitazioni pratiche in aula informatica (20 ore). METODO DI VALUTAZIONE Prova scritta: domande su metodi, interpretazione di programmi in R, interpretazione di risultati. È prevista una prova intermedia sugli argomenti 2,3,4. AVVERTENZE Gli studenti devono possedere nozioni di analisi dei dati, probabilità e inferenza al livello dei corsi di Statistica impartiti in una facoltà di Economia; ad esempio gli argomenti dei corsi di Statistica I e Statistica Applicata, oppure di Statistics e Applied Statistics impartiti presso questo Ateneo.