Statistica multivariata 27/09/2016 D.Rodi, 2016 Metodi Statistici Statistica Descrittiva Studio di uno o più fenomeni osservati sull’INTERA popolazione di interesse (rilevazione esaustiva) Descrizione delle caratteristiche di tale popolazione Statistica Inferenziale Studio dei fenomeni osservati su una PARTE della popolazione di interesse (rilevazione parziale) Porta a risultati «probabili» Teoria dei campioni: per scegliere la parte di popolazione da osservare Calcolo delle probabilità: assegnazione di un grado di fiducia ai risultati ottenuti Statistica Univariata: studio di un fenomeno Statistica Bivariata o Multivariata: studio di due o più fenomeni in modo congiunto D.Rodi, 2016 Analisi Univariata Studio degli effetti di una o più variabili indipendenti (variabili esplicative o predittori) su una variabile dipendente (variabile di interesse) Variabile dipendente: fenomeno che deve essere spiegato Variabile indipendente: fenomeno che permette di spiegare D.Rodi, 2016 Analisi Multivariata Insieme di metodi statistici usati per analizzare simultaneamente piu’ variabili dipendenti e capire le relazioni che hanno una con l’altra Le applicazioni possono essere molto diverse. Applicazioni in medicina, psicologia, biologia, ecologia, sociologia, ingegneria D.Rodi, 2016 Analisi dei dati CMDA: Confirmatory Multivariate Data Analysis • • • • • • • Analisi confermative-Predittive Studio delle relazioni di un insieme limitato di p variabili Assunzioni sulla distribuzione delle variabili Approccio analitico Si specificano modelli per la verifica delle ipotesi Modelli di Regressione (GLM, Stepwise, modelli log-lineari, logistica etc.) Analisi Causale (Path Analysis etc.) EMDA: Exploratory Multidimensional Data Analysis • • • • • • Analisi esplorative-descrittive Attenzione sulle n unità statistiche Obiettivo: trovare la struttura latente dei dati Approccio geometrico Per dati con strutture complesse, applicazioni in campo sociale e psicologico Studio di Correlazione, Covariazione, Connessione D.Rodi, 2016 Analisi Multivariata: applicazioni Analisi Univariata Analisi Multivariata D.Rodi, 2016 Relazioni e modelli • Le tecniche statistiche permettono di definire un modello statistico che studia le relazioni fra le variabili di interesse Il modello serve a comprendere il fenomeno attraverso: • La descrizione sintetica e efficiente dei dati • La predizione del futuro • L’inferenza sulla popolazione D.Rodi, 2016 Relazioni e modelli • La media: un indice di sintesi Indice di sintesi….quindi non rappresenta tutti i dati correttamente D.Rodi, 2016 Relazioni e modelli • La Varianza: un indice di dispersione Rappresenta la quantificazione dell’errore della media D.Rodi, 2016 Relazioni e modelli Informazioni necessarie alla costruzione del modello: • scopo dell'analisi • tipo di variabili • relazioni oggetto di studio • unità di misura dei dati • struttura dei dati D.Rodi, 2016 Dataset multivariato • Righe: osservazioni • Colonne: variabili (qualitative o quantitative) D.Rodi, 2016 Relazioni e modelli Il modello statistico è associato ad una serie di test inferenziali che permettono di trarre conclusioni sulla popolazione di riferimento t= Il modello statistico sarà una buona rappresentazione dei dati se: • • • I parametri sono modellati correttamente Gli errori sono modellati correttamente La struttura dei dati è rispettata D.Rodi, 2016 Obiettivi dell’Analisi Multivariata Dati n individui su cui si siano rilevate p variabili, le tecniche di analisi multivariata sono una famiglia di metodi descrittivoesplorativi per: 1) Descrivere l'insieme di n individui nello spazio p-dimensionale generato dalle variabili individuate. 2) Ridurre la dimensionalità dello spazio da p a q dimensionale (q<p) attraverso l'uso di particolari funzioni obiettivo atte a descrivere l'insieme di n individui nello spazio p dimensionale. D.Rodi, 2016 Obiettivi dell’Analisi Multivariata 3) Ricavare in termini esplorativi informazioni sui legami esistenti tra coppie di variabili di diversi sottoinsiemi di esse. In particolare possono spiegare il comportamento di più variabili dipendenti in funzione di altre variabili esplicative o indipendenti, evidenziarne il nesso causale, ricercare l'interazione fra variabili. 4) Discriminare: identificare le caratteristiche che differenziano due o più insiemi di unità. 5) Classificare: assegnare unità a classi definite a priori (analisi confermativa) o no (esplicative). D.Rodi, 2016 Obiettivi dell’Analisi Multivariata 6) Raggruppare in classi le unità più somiglianti individuando eventualmente strutture gerarchiche. 7) Evidenziare le strutture latenti sottostanti gli indicatori osservati. 8) Quantificare simultaneamente variabili qualitative ricavandone eventualmente trasformate lineari; 9) Costruire modelli multivariati anche di tipo inferenziale (partendo dalle informazioni di tipo descrittivo esplorativo ricavate nell'analisi dei dati) D.Rodi, 2016 Statistica multivariata Analisi Fattoriale • Permette di rappresentare un numero elevato di variabili con un minore numero di variabili latenti (Fattori) Regressione multipla • Permette di formulare modelli descrittivi/interpretativi D.Rodi, 2016 Tecniche multivariate Ordinamento • • Rappresentazione del campione e delle relazioni tra variabil in modo fedele e in uno spazio dimensionale ridotto Clustering • Suddivisione dei dati in gruppi (clusters): gli oggetti dello stesso gruppo si somigliano, quelli di gruppi diversi sono diversi Scopo: rappresentazione grafica dei dati, ordinamento degli oggetti, matrice con minor numero di variabili e minima perdita di informazioni D.Rodi, 2016 Tecniche multivariate Classificazione • • • • • Classificano un oggetto in una tra le n classi previste dal problema Quando ci sono almeno due categorie Rispondono a: a quale delle categorie è probabile che appartenga l’oggetto da classificare? Modellamento Quando vi è una sola categoria Rispondono a: l’oggetto ha caratteristiche compatibili con quelle tipiche della categoria modellata? Predizione • • Derivano da quelle di regressione Per predire un evento partendo da un modello con variabili quantitative definite D.Rodi, 2016 Tecniche multivariate D.Rodi, 2016 Dott. Donata Rodi Contatti: [email protected] Cell. 347 9657256 D.Rodi, 2016