Statistica (Statistical learning)
PROF. GUIDO CONSONNI
OBIETTIVO DEL CORSO
La società moderna è caratterizzata da una massa crescente di informazioni e dati
(big data). Il corso si propone di fornire strumenti moderni di Statistica e Data
Science per modellizzare e comprendere dati di natura complessa sempre più
presenti non solo in campo scientifico ma anche in ambito economico-aziendale.
Particolare enfasi sarà rivolta agli aspetti computazionali - mediante l’uso del
linguaggio gratuito ed open-source R - al fine di sviluppare concrete capacità di
analisi empirica su casi concreti.
Prerequisiti
Gli studenti devono possedere nozioni di analisi dei dati, probabilità e inferenza al
livello dei corsi di Statistica impartiti in una facoltà di Economia. Maggiori
informazioni si trovano nelle AVVERTENZE.
PROGRAMMA DEL CORSO
0.
1.
2.
3.
4.
5.
6.
7.
Introduzione al linguaggio di programmazione R
Introduzione a Statistical learning
Regressione lineare
Classificazione
Metodi di ricampionamento
Modello lineare: metodi di penalizzazione e scelta del modello
Modelli non lineari
Metodi statistici basati su alberi decisionali
BIBLIOGRAFIA
J. GARETH-D. WITTEN-T. HASTIE-R. TIBSHIRANI, An Introduction to Statistical Learning, Springer,
2013.
Materiale del corso sulla piattaforma Blackboard.
Software statistico R http://www.r-project.org/
DIDATTICA DEL CORSO
Lezioni (60 ore) che prevedono la presentazione di metodi, l’esame di programmi in R e
l’analsi di dati; esercitazioni pratiche in aula informatica (20 ore).
METODO DI VALUTAZIONE
Prova scritta: domande su metodi, interpretazione di programmi in R, interpretazione di
risultati. È prevista una prova intermedia sugli argomenti 2,3,4.
AVVERTENZE
Gli studenti devono possedere nozioni di analisi dei dati, probabilità e inferenza al
livello dei corsi di Statistica impartiti in una facoltà di Economia; ad esempio gli argomenti
dei corsi di Statistica I e Statistica Applicata, oppure di Statistics e Applied Statistics
impartiti presso questo Ateneo.