Programma del Corso di Modellistica e Identificazione Laurea Magistrale in Ingegneria Gestionale (9 cr) Obiettivi. Lo studente acquisisce strumenti statistici per la raccolta e l'analisi di dati sperimentali riguardanti processi di varia natura nell'ambito dell'Ingegneria dell'Informazione. Sviluppa capacità volte alla deduzione di inferenze attendibili ed alla formulazione di decisioni. • Statistica descrittiva. Esempio di statistica descrittiva. Istogramma, distribuzione campionaria. o Caratteristiche del I e del II ordine: valor medio, modo, mediana, varianza deviazione standard. Caratteristiche del III e IV ordine: skewness, Curtosi. Regole per tracciare un istogramma. o Richiami sul calcolo delle probabilità: media e varianza di trasformazione affine di una variabile aleatoria; caso vettoriale. o Percentili di una distribuzione. Box Plot. o Distribuzione gaussiana. Distribuzione chi2. Distribuzione t-Student. Distribuzione di Fisher. Teorema del limite centrale. o Test statistici: errore di tipo 1 e 2; test più potente di livello ε e test uniformemente più potente. Lemma di Neyman-Pearson. Q-Q Plot. Test di Pearson. Test di Kolmogorov-Smirnov. Test di Anderson-Darling. • Statistica induttiva. Stima di punto, stima di intervallo, confronti tra statistiche. o Campione casuale semplice e non indipendente. Stima campionaria del valor medio e della varianza di popolazione, varianza delle stime nei due casi. Caso gaussiano, casi di asimmetria, distribuzione con code grasse. o Intervallo di confidenza. Controllo statistico della qualità, fault detection. o Test di confronto tra due gruppi: tra proporzioni, tra medie, tra varianze. o Test di confronto tra più gruppi: test di Bartlett, test di Levene. o Analisi della varianza (ANOVA). Test di Pearson ad 1 via, a due vie. Test di Kruskal-Wallis. Welch Anova. o Cenni ai test non parametrici. o Piano degli esperimenti. Campionamento stratificato. • Modello di regressione lineare. Modelli di descrizione, modelli di predizione. Significato del modello di regressione lineare. o Parametri del modello: offset, sensibilità, correlazione parziale. o Stima dei parametri: sistema normale di equazioni. Test R-quadro: varianza spiegata, varianza residua. o Preelaborazione dei dati: standardizzazione, equalizzazione. Cenni PCA. o Complessità del modello: criterio di Akaike. • Stima parametrica. Introduzione, nozioni generali. o Proprietà delle stime: distorsione, efficienza. Limite inferiore di Cramer-Rao. Consistenza della stima. o Stima dei minimi quadrati (LSE): modello lineare con errore additivo. Condizioni necessarie e sufficienti di ottimo. Proprietà della stima e validazione del modello (R2). Stima dei minimi quadrati pesata. o Stima di massima verosimiglianza (MLE): modello lineare con errore additivo gaussiano. Condizioni necessarie e sufficienti di ottimo. Proprietà della stima e validazione del modello (R2, test di gaussianità del fit error). o Stima Bayesiana. Condizioni necessarie e sufficienti di ottimo. Proprietà della stima e validazione del modello(R2, test di gaussianità del fit error). o Confronto tra i tre metodi di stima. • Stima di Parametri variabili nel tempo. Minimi quadrati con pesi esponenziali, algoritmo ricorsivo. • Modelli di serie storiche. Analisi additiva, analisi moltiplicativa: Decomposizione in trend, stagionalità, residuo. o Trend: modelli globali, parametrici e non parametrici (modello polinomiale con parametri costanti, filtro di Prescott-Hodrick); modelli locali, parametrici e non parametrici (modello polinomiale con parametri variabili nel tempo, media mobile semplice, SMA, media mobile esponenziale,EMA). o Stagionalità: la uso della funzione di covarianza, metodo di stima della componente stagionale. o Componente residua: modelli AR, MA, ARMA, predittore ottimo. Modelli ARCH, GARCH. Identificazione dei modelli: stima parametrica e validazione (test di bianchezza). • Casi di Studio con Excel (a cura del Prof. L. Benvenuti) Implementazione in Excel dei test per o il confronto tra medie, misure non appaiate, varianza incognita (T-test); o il confronto tra varianze (F-test); o il confronto tra varianze di più gruppi (Test di Bartlett); o l'analisi della varianza (per popolazioni omoschedastiche con distribuzione gaussiana); o il confronto tra una distribuzione cumulativa ipotizzata e quella dei dati (Test di Anderson-Darling); mediante o o o o il calcolo tabellare; l'uso di funzioni statistiche; l'implementazione di funzioni personalizzate; gli strumenti di "Analisi dei dati". Analisi di serie storiche mediante Excel o calcolo della tendenza e della componente ciclica mediante regressione lineare e l'uso di tabelle di Pivot o calcolo della componente stagionale e di quella residuale; o calcolo della componente strutturata mediante modelli autoregressivi o test di bianchezza sulla componente i.i.d. (Test sui cambi di segno e test Portmanteau). Testi • Dispense a cura del docente e temi d'esame • Introduzione alla statistica matematica Basilio Giardina , Franco Angeli Ed. • http://www.itl.nist.gov/div898/handbook/