.- Analisi statistica multivariata PROF. BENITO VITTORIO FROSINI OBIETTIVO DEL CORSO Questo corso introduce alle principali tecniche dell’analisi statistica multivariata, presentate secondo un approccio principalmente descrittivo. Per una piena comprensione degli argomenti svolti, la prima parte del corso richiama alcuni argomenti di algebra matriciale e di geometria, che vengono subito applicati – per una loro immediata comprensione di tipo statistico – alla matrice dei dati. L’esposizione teorica è supportata da esercitazioni, nelle quali si utilizzano softwares statistici espressamente dedicati a questo tipo di analisi. PROGRAMMA DEL CORSO 1. Richiami e complementi di algebra matriciale e geometria multidimensionale. Spazi lineari, rette, distanze e proiezioni in uno spazio multidimensionale. Il metodo dei minimi quadrati applicato alle distanze; rette di migliore adattamento. 2. Matrici dei dati, di covarianza e di correlazione. Dipendenze lineari e rango di una matrice. Media e varianza di una combinazione lineare di variabili casuali. Vettore di medie e matrice di covarianza di una trasformazione lineare. Distribuzioni multivariate; la distribuzione normale bivariata e multivariata. 3. Analisi delle componenti principali. Derivazione delle componenti principali col metodo di Hotelling e col metodo di Pearson. Coefficienti delle componenti e correlazioni fra variabili e componenti. Aspetti geometrici delle componenti principali. Applicazioni delle componenti principali. 4. Analisi dei fattori. Il modello canonico di analisi dei fattori. Significato dei parametri del modello. Struttura della matrice di covarianza sotto il modello. Il problema delle rotazioni. Identificazione del modello. Metodi di stima nonparametrica dei parametri del modello, in particolare il metodo di Howe. Il metodo di stima parametrico della massima verosimiglianza. Procedimenti di stima dei punteggi fattoriali. 5. Analisi discriminante. La distanza di Mahalanobis. La funzione discriminante di Fisher nel caso di due popolazioni: approccio parametrico e non-parametrico. Probabilità di classificazione errata e sua minimizzazione. Approccio non- parametrico nel caso di k popolazioni, comprensivo della applicazione di funzioni di perdita. 6. Analisi dei gruppi. Indici di distanza e indici di dissimilarità. In particolare: la distanza di Mahalanobis e sue principali proprietà. Caso dicotomico e caso politomico. Scopi perseguiti con l’analisi dei gruppi e principali tecniche di clustering. Criteri gerarchici e non gerarchici. 7. Lo scaling multidimensionale (MDS). Scopi perseguiti con lo scaling multidimensionale. Lo scaling classico e lo scaling ordinale. Relazione fra lo scaling classico e le componenti principali. 8. Reti neurali. Principali tipi di reti neurali artificiali. Reti Multi-Layer Perceptron e reti Radial Basis Function. Regole di apprendimento, addestramento della rete, controllo dell’errore. Problema dell’overfitting. BIBLIOGRAFIA C. CHATFIELD-A.J. COLLINS, Introduction to Multivariate Analysis, Chapman & Hall, London. B.V. FROSINI, Connessione, regressione, correlazione, Celuc, Milano, 3a ed. B.V. FROSINI, Analisi di regressione (con Appendice di Calcolo matriciale), in preparazione. S. MIGNANI-A. MONTANARI, Appunti di Analisi statistica multivariata, Esculapio, Bologna. D.F. MORRISON, Multivariate statistical methods, McGraw-Hill, New York. S. ZANI-A. CERIOLI, Analisi dei dati e data mining per le decisioni aziendali, Giuffré, Milano. DIDATTICA DEL CORSO Lezioni in aula ed esercitazioni in aula computer. METODO DI VALUTAZIONE Esami scritti. AVVERTENZE Orario e luogo di ricevimento Il Prof. Benito Vittorio Frosini riceve gli studenti come da avviso affisso all’albo presso il Dipartimento di Scienze statistiche.