.-
Analisi statistica multivariata
PROF. BENITO VITTORIO FROSINI
OBIETTIVO DEL CORSO
Questo corso introduce alle principali tecniche dell’analisi statistica multivariata,
presentate secondo un approccio principalmente descrittivo. Per una piena
comprensione degli argomenti svolti, la prima parte del corso richiama alcuni
argomenti di algebra matriciale e di geometria, che vengono subito applicati – per
una loro immediata comprensione di tipo statistico – alla matrice dei dati.
L’esposizione teorica è supportata da esercitazioni, nelle quali si utilizzano
softwares statistici espressamente dedicati a questo tipo di analisi.
PROGRAMMA DEL CORSO
1. Richiami e complementi di algebra matriciale e geometria multidimensionale.
Spazi lineari, rette, distanze e proiezioni in uno spazio multidimensionale. Il
metodo dei minimi quadrati applicato alle distanze; rette di migliore
adattamento.
2. Matrici dei dati, di covarianza e di correlazione. Dipendenze lineari e rango di
una matrice. Media e varianza di una combinazione lineare di variabili casuali.
Vettore di medie e matrice di covarianza di una trasformazione lineare.
Distribuzioni multivariate; la distribuzione normale bivariata e multivariata.
3. Analisi delle componenti principali. Derivazione delle componenti principali
col metodo di Hotelling e col metodo di Pearson. Coefficienti delle componenti
e correlazioni fra variabili e componenti. Aspetti geometrici delle componenti
principali. Applicazioni delle componenti principali.
4. Analisi dei fattori. Il modello canonico di analisi dei fattori. Significato dei
parametri del modello. Struttura della matrice di covarianza sotto il modello. Il
problema delle rotazioni. Identificazione del modello. Metodi di stima nonparametrica dei parametri del modello, in particolare il metodo di Howe. Il
metodo di stima parametrico della massima verosimiglianza. Procedimenti di
stima dei punteggi fattoriali.
5. Analisi discriminante. La distanza di Mahalanobis. La funzione discriminante
di Fisher nel caso di due popolazioni: approccio parametrico e non-parametrico.
Probabilità di classificazione errata e sua minimizzazione. Approccio non-
parametrico nel caso di k popolazioni, comprensivo della applicazione di
funzioni di perdita.
6. Analisi dei gruppi. Indici di distanza e indici di dissimilarità. In particolare: la
distanza di Mahalanobis e sue principali proprietà. Caso dicotomico e caso
politomico. Scopi perseguiti con l’analisi dei gruppi e principali tecniche di
clustering. Criteri gerarchici e non gerarchici.
7. Lo scaling multidimensionale (MDS). Scopi perseguiti con lo scaling
multidimensionale. Lo scaling classico e lo scaling ordinale. Relazione fra lo
scaling classico e le componenti principali.
8. Reti neurali. Principali tipi di reti neurali artificiali. Reti Multi-Layer
Perceptron e reti Radial Basis Function. Regole di apprendimento,
addestramento della rete, controllo dell’errore. Problema dell’overfitting.
BIBLIOGRAFIA
C. CHATFIELD-A.J. COLLINS, Introduction to Multivariate Analysis, Chapman & Hall, London.
B.V. FROSINI, Connessione, regressione, correlazione, Celuc, Milano, 3a ed.
B.V. FROSINI, Analisi di regressione (con Appendice di Calcolo matriciale), in preparazione.
S. MIGNANI-A. MONTANARI, Appunti di Analisi statistica multivariata, Esculapio, Bologna.
D.F. MORRISON, Multivariate statistical methods, McGraw-Hill, New York.
S. ZANI-A. CERIOLI, Analisi dei dati e data mining per le decisioni aziendali, Giuffré, Milano.
DIDATTICA DEL CORSO
Lezioni in aula ed esercitazioni in aula computer.
METODO DI VALUTAZIONE
Esami scritti.
AVVERTENZE
Orario e luogo di ricevimento
Il Prof. Benito Vittorio Frosini riceve gli studenti come da avviso affisso all’albo presso
il Dipartimento di Scienze statistiche.