.-
Statistica assicurativa
PROF. DIEGO ZAPPA
OBIETTIVO DEL CORSO
Nell’ambito delle discipline legate alle aziende di assicurazione, la statistica svolge
un ruolo di un certo interesse specie all’interno del c.d. ramo danni. In tale contesto
infatti la decisione sull’entità del premio assicurativo spesso viene basata
sull’analisi di dati campionari che si ritiene possano contenere informazioni
preziose e rappresentative del rischio di assicurazione. Ne è un esempio l’ormai
sempre più diffuso impiego di modelli di personalizzazione del premio per gli
autoveicoli (la cd RCAuto) in base alle caratteristiche dell’assicurato.
È sulla base di questi presupposti che con questo corso ci si propone di presentare i
principali modelli per stimare i coefficienti di rischio di sinistro e quindi per
realizzare modelli di calcolo personalizzato del premio. Dopo il necessario
richiamo, commento e spiegazione del perché i ben noti modelli lineari classici
gaussiani sono non di rilevante interesse per l’ambito assicurativo, verranno
presentati i modelli intrinsecamente non-lineari (nei parametri). Si procederà
quindi con l’introduzione dei modelli lineari generalizzati (GLM). Si darà diffusa
spiegazione sulla loro origine, impiego, stima.
Le lezioni, svolte sempre in aula informatica, si snoderanno senza soluzione di
continuità alternando lezioni metodologiche ad applicazioni degli argomenti con
semplici dataset, facendo uso dei sw Excel(c), R, SPSS. Di quest’ultimo verrà data
ampia spiegazione del modulo GLM recentemente inserito a partire dalla rel.15.
PROGRAMMA DEL CORSO
Obiettivi formativi che lo studente dovrebbe aver raggiunto prima di accedere al
corso
Prima di accedere al corso la studentessa/lo studente dovrebbe conoscere almeno
gli elementi di matematica e statistica impartiti nei corsi della laurea triennale, aver
appreso come effettuare la stima dei parametri di un modello di regressione e
conoscere i principali modelli probabilistici (in particolare il modello gaussiano).
Nozioni di base di algebra lineare (nozione di vettore, matrice, prodotto,
determinante, inversa di matrici) e, stante il rilevante impiego di strumenti
informatici, una almeno sufficiente dimestichezza col personal computer, con un
browser internet e col foglio elettronico Excel costituiranno elementi utili per una
più agevole interpretazione dei risultati.
Obiettivi formativi che lo studente potrebbe acquisire nel corso
Il corso inizierà dedicando diverse ore di lezione alla genesi, alla stima e
all’interpretazione dei modelli lineari classici gaussiani. In particolare si
metteranno in luce i principali limiti di tali modelli tra cui: la verifica dell’assunto
di gaussianità della componente aleatoria, gli effetti prodotti dalla presenza di
valori influenti o di eteroschedasticità. Seguiranno alcune utili estensioni di
impiego di variabili dummy, utilizzando differenti matrici di contrasto, e la
presentazione delle trasformazioni di Box-Cox.
Dopo il completamento della trattazione dei precedenti argomenti si mostreranno le
connessioni metodologiche con i modelli (intrinsecamente) non lineari di cui verrà
data spiegazione dell’impiego dell’utile algoritmo di Gauss-Newton per la stima
dei parametri.
I precedenti argomenti saranno necessari per introdurre i modelli lineari
generalizzati (GLM). In particolare si mostrerà come, facendo riferimento
all’assunto molto generale di avere come oggetto lo studio una variabile aleatoria
avente distribuzione appartenente alla famiglia esponenziale e di disporre di p
variabili esplicative, sia possibile superare molti dei limiti presenti nel contesto
della modellistica classica. In particolare si parlerà di:
– scelta della funzione legame e predittore lineare;
– l’algoritmo dei minimi quadrati ponderati iterati;
– inferenza sui modelli GLM.
Dopo il completamento della trattazione dei precedenti argomenti si
commenteranno i modelli per:
– variabili risposta non continue: Modelli di Poisson, Logistico, Log-lineari;
– variabili risposta continue: Modello Gamma, Lognormale, Normale-Gamma.
Dopo il completamento della trattazione dei precedenti argomenti la studentessa/lo
studente sarà in grado di comprendere come costruire modelli per:
– la stima del rischio di sinistro;
– la stima del numero di sinistri;
– la stima del valore monetario di un sinistro;
necessari per effettuare il calcolo del premio (personalizzato in base alle variabili
utilizzate nei modelli).
Applicazione a dataset tratti da casi reali e interpretazione dei risultati in
particolare del modello logistico e poissoniano e del modello miscuglio PoissonGamma completeranno la presentazione degli argomenti.
È prevista, compatibilmente con la disponibilità di tempo, la presentazione di una
parte monografica riguardante la selezione di variabili, i sistemi Bonus Malus e
l’applicazione dei GLM per la stima della riserva sinistri.
BIBLIOGRAFIA
Testo:
D. ZAPPA, Appunti di Statistica Assicurativa - Introduzione ai modelli lineari generalizzati,
EDUCatt, Milano, 2006.
Letture complementari:
P. DE JONG-G.Z. HELLER, Generalized Linear Models for Insurance Data, Cambridge University
Press, 2008.
A. DOBSON, An Introduction to Generalized Linear Models, Chapman and Hall, 1990.
I.B. HOSSACK-J.H. POLLARD-B. ZEHNWIRTH, Introductory statistics with applications in general
insurance, Cambridge University Press, 1999. 2nd ed.
J. LEMAIRE, Bonus-Malus Systems in Automobile Insurance, Kluwer, 1995.
DIDATTICA DEL CORSO
Lezioni in aula informatica; impiego dei sw EXCEL, SPSS.
METODO DI VALUTAZIONE
L’esame consisterà in una prova orale su un argomento scelto dallo studente tra quelli
indicati nel programma del corso.
AVVERTENZE
È previsto un piano di studio specifico per gli studenti provenienti da corsi diversi da
quelli in discipline statistiche. In tal caso si prega di prendere contatti col docente prima
dell’inserimento della materia nel piano di studi.
Orario e luogo di ricevimento
Il Prof. Diego Zappa riceve gli studenti come da avviso affisso all’albo presso il
Dipartimento di Scienze statistiche (via Necchi 9, I piano) nonché pubblicato sulla pagina
virtuale del docente.