.- Statistica assicurativa PROF. DIEGO ZAPPA OBIETTIVO DEL CORSO Nell’ambito delle discipline legate alle aziende di assicurazione, la statistica svolge un ruolo di un certo interesse specie all’interno del c.d. ramo danni. In tale contesto infatti la decisione sull’entità del premio assicurativo spesso viene basata sull’analisi di dati campionari che si ritiene possano contenere informazioni preziose e rappresentative del rischio di assicurazione. Ne è un esempio l’ormai sempre più diffuso impiego di modelli di personalizzazione del premio per gli autoveicoli (la cd RCAuto) in base alle caratteristiche dell’assicurato. È sulla base di questi presupposti che con questo corso ci si propone di presentare i principali modelli per stimare i coefficienti di rischio di sinistro e quindi per realizzare modelli di calcolo personalizzato del premio. Dopo il necessario richiamo, commento e spiegazione del perché i ben noti modelli lineari classici gaussiani sono non di rilevante interesse per l’ambito assicurativo, verranno presentati i modelli intrinsecamente non-lineari (nei parametri). Si procederà quindi con l’introduzione dei modelli lineari generalizzati (GLM). Si darà diffusa spiegazione sulla loro origine, impiego, stima. Le lezioni, svolte sempre in aula informatica, si snoderanno senza soluzione di continuità alternando lezioni metodologiche ad applicazioni degli argomenti con semplici dataset, facendo uso dei sw Excel(c), R, SPSS. Di quest’ultimo verrà data ampia spiegazione del modulo GLM recentemente inserito a partire dalla rel.15. PROGRAMMA DEL CORSO Obiettivi formativi che lo studente dovrebbe aver raggiunto prima di accedere al corso Prima di accedere al corso la studentessa/lo studente dovrebbe conoscere almeno gli elementi di matematica e statistica impartiti nei corsi della laurea triennale, aver appreso come effettuare la stima dei parametri di un modello di regressione e conoscere i principali modelli probabilistici (in particolare il modello gaussiano). Nozioni di base di algebra lineare (nozione di vettore, matrice, prodotto, determinante, inversa di matrici) e, stante il rilevante impiego di strumenti informatici, una almeno sufficiente dimestichezza col personal computer, con un browser internet e col foglio elettronico Excel costituiranno elementi utili per una più agevole interpretazione dei risultati. Obiettivi formativi che lo studente potrebbe acquisire nel corso Il corso inizierà dedicando diverse ore di lezione alla genesi, alla stima e all’interpretazione dei modelli lineari classici gaussiani. In particolare si metteranno in luce i principali limiti di tali modelli tra cui: la verifica dell’assunto di gaussianità della componente aleatoria, gli effetti prodotti dalla presenza di valori influenti o di eteroschedasticità. Seguiranno alcune utili estensioni di impiego di variabili dummy, utilizzando differenti matrici di contrasto, e la presentazione delle trasformazioni di Box-Cox. Dopo il completamento della trattazione dei precedenti argomenti si mostreranno le connessioni metodologiche con i modelli (intrinsecamente) non lineari di cui verrà data spiegazione dell’impiego dell’utile algoritmo di Gauss-Newton per la stima dei parametri. I precedenti argomenti saranno necessari per introdurre i modelli lineari generalizzati (GLM). In particolare si mostrerà come, facendo riferimento all’assunto molto generale di avere come oggetto lo studio una variabile aleatoria avente distribuzione appartenente alla famiglia esponenziale e di disporre di p variabili esplicative, sia possibile superare molti dei limiti presenti nel contesto della modellistica classica. In particolare si parlerà di: – scelta della funzione legame e predittore lineare; – l’algoritmo dei minimi quadrati ponderati iterati; – inferenza sui modelli GLM. Dopo il completamento della trattazione dei precedenti argomenti si commenteranno i modelli per: – variabili risposta non continue: Modelli di Poisson, Logistico, Log-lineari; – variabili risposta continue: Modello Gamma, Lognormale, Normale-Gamma. Dopo il completamento della trattazione dei precedenti argomenti la studentessa/lo studente sarà in grado di comprendere come costruire modelli per: – la stima del rischio di sinistro; – la stima del numero di sinistri; – la stima del valore monetario di un sinistro; necessari per effettuare il calcolo del premio (personalizzato in base alle variabili utilizzate nei modelli). Applicazione a dataset tratti da casi reali e interpretazione dei risultati in particolare del modello logistico e poissoniano e del modello miscuglio PoissonGamma completeranno la presentazione degli argomenti. È prevista, compatibilmente con la disponibilità di tempo, la presentazione di una parte monografica riguardante la selezione di variabili, i sistemi Bonus Malus e l’applicazione dei GLM per la stima della riserva sinistri. BIBLIOGRAFIA Testo: D. ZAPPA, Appunti di Statistica Assicurativa - Introduzione ai modelli lineari generalizzati, EDUCatt, Milano, 2006. Letture complementari: P. DE JONG-G.Z. HELLER, Generalized Linear Models for Insurance Data, Cambridge University Press, 2008. A. DOBSON, An Introduction to Generalized Linear Models, Chapman and Hall, 1990. I.B. HOSSACK-J.H. POLLARD-B. ZEHNWIRTH, Introductory statistics with applications in general insurance, Cambridge University Press, 1999. 2nd ed. J. LEMAIRE, Bonus-Malus Systems in Automobile Insurance, Kluwer, 1995. DIDATTICA DEL CORSO Lezioni in aula informatica; impiego dei sw EXCEL, SPSS. METODO DI VALUTAZIONE L’esame consisterà in una prova orale su un argomento scelto dallo studente tra quelli indicati nel programma del corso. AVVERTENZE È previsto un piano di studio specifico per gli studenti provenienti da corsi diversi da quelli in discipline statistiche. In tal caso si prega di prendere contatti col docente prima dell’inserimento della materia nel piano di studi. Orario e luogo di ricevimento Il Prof. Diego Zappa riceve gli studenti come da avviso affisso all’albo presso il Dipartimento di Scienze statistiche (via Necchi 9, I piano) nonché pubblicato sulla pagina virtuale del docente.