Statistica II PROF. GUIDO CONSONNI [Il programma è mutuato dalla Laurea magistrale in Scienze statistiche, attuariali ed economiche con la denominazione “Statistica bayesiana”] OBIETTIVO DEL CORSO La società moderna è caratterizzata da una massa sempre più crescente di informazioni e dati (big data). Il corso si propone di fornire strumenti per comprendere i dati usando sia un’impostazione frequentista che bayesiana. Particolare enfasi sarà rivolta ai modelli statistici ed agli aspetti computazionali mediante l’uso del linguaggio R - al fine di sviluppare concrete capacità di analisi empirica. Il corso presuppone la conoscenza delle nozioni di base di statistica (analisi dei dati, probabilità e inferenza), impartite negli insegnamenti di Statistica I e Statistica Applicata della laurea triennale. PROGRAMMA DEL CORSO MODULO A: Strumenti per comprendere i dati – – – – – – – Statistical learning Introduzione al linguaggio di programmazione R Regressione lineare Classificazione Metodi di ricampionamento Selezione del modello Analisi di alcuni dataset: salari e variabili demografiche; prezzi dei titoli in borsa. MODULO B: Statistica bayesiana – Il teorema di Bayes per eventi e variabili aleatorie: distribuzione iniziale e finale. Distribuzione marginale e predittiva per variabili osservabili. – Inferenza con distribuzioni iniziali coniugate: modello binomiale, di Poisson, normale – Inferenza approssimata: metodo di Monte Carlo e Markov Chain Monte Carlo (Gibbs sampling). – Modelli gerarchici – Applicazioni reali: indicatori di salute nel mondo (stima del trend). BIBLIOGRAFIA Modulo A J. GARETH-D. WITTEN-T. HASTIE-R. TIBSHIRANI, An Introduction to Statistical Learning, Springer, 2013. Modulo B P.D. HOFF, A First Course in Bayesian Statistical Methods, Springer, 2009. Software statistico R http://www.r-project.org/ DIDATTICA DEL CORSO Lezioni frontali ed esercitazioni pratiche ed in aula informatica. METODO DI VALUTAZIONE Prova scritta.