Statistica II
PROF. GUIDO CONSONNI
[Il programma è mutuato dalla Laurea magistrale in Scienze statistiche, attuariali ed
economiche con la denominazione “Statistica bayesiana”]
OBIETTIVO DEL CORSO
La società moderna è caratterizzata da una massa sempre più crescente di
informazioni e dati (big data). Il corso si propone di fornire strumenti per
comprendere i dati usando sia un’impostazione frequentista che bayesiana.
Particolare enfasi sarà rivolta ai modelli statistici ed agli aspetti computazionali mediante l’uso del linguaggio R - al fine di sviluppare concrete capacità di analisi
empirica. Il corso presuppone la conoscenza delle nozioni di base di statistica
(analisi dei dati, probabilità e inferenza), impartite negli insegnamenti di Statistica
I e Statistica Applicata della laurea triennale.
PROGRAMMA DEL CORSO
MODULO A: Strumenti per comprendere i dati
–
–
–
–
–
–
–
Statistical learning
Introduzione al linguaggio di programmazione R
Regressione lineare
Classificazione
Metodi di ricampionamento
Selezione del modello
Analisi di alcuni dataset: salari e variabili demografiche; prezzi dei titoli in
borsa.
MODULO B: Statistica bayesiana
– Il teorema di Bayes per eventi e variabili aleatorie: distribuzione iniziale e
finale. Distribuzione marginale e predittiva per variabili osservabili.
– Inferenza con distribuzioni iniziali coniugate: modello binomiale, di Poisson,
normale
– Inferenza approssimata: metodo di Monte Carlo e Markov Chain Monte Carlo
(Gibbs sampling).
– Modelli gerarchici
– Applicazioni reali: indicatori di salute nel mondo (stima del trend).
BIBLIOGRAFIA
Modulo A
J. GARETH-D. WITTEN-T. HASTIE-R. TIBSHIRANI, An Introduction to Statistical Learning, Springer,
2013.
Modulo B
P.D. HOFF, A First Course in Bayesian Statistical Methods, Springer, 2009.
Software statistico R http://www.r-project.org/
DIDATTICA DEL CORSO
Lezioni frontali ed esercitazioni pratiche ed in aula informatica.
METODO DI VALUTAZIONE
Prova scritta.