Lezione 1

annuncio pubblicitario
Statistica multivariata
27/09/2016
D.Rodi, 2016
Metodi Statistici
Statistica Descrittiva


Studio di uno o più fenomeni osservati sull’INTERA
popolazione di interesse (rilevazione esaustiva)
Descrizione delle caratteristiche di tale popolazione
Statistica Inferenziale






Studio dei fenomeni osservati su una PARTE della
popolazione di interesse (rilevazione parziale)
Porta a risultati «probabili»
Teoria dei campioni: per scegliere la parte di
popolazione da osservare
Calcolo delle probabilità: assegnazione di un grado
di fiducia ai risultati ottenuti
Statistica Univariata: studio di un fenomeno
Statistica Bivariata o Multivariata: studio di
due o più fenomeni in modo congiunto
D.Rodi, 2016
Analisi Univariata
Studio degli effetti di una o più variabili indipendenti (variabili esplicative o
predittori) su una variabile dipendente (variabile di interesse)
Variabile dipendente: fenomeno che deve essere spiegato
Variabile indipendente: fenomeno che permette di spiegare
D.Rodi, 2016
Analisi Multivariata
 Insieme di metodi statistici usati per analizzare simultaneamente piu’ variabili
dipendenti e capire le relazioni che hanno una con l’altra
 Le applicazioni possono essere molto diverse.
 Applicazioni in medicina, psicologia, biologia, ecologia, sociologia, ingegneria
D.Rodi, 2016
Analisi dei dati
CMDA: Confirmatory
Multivariate Data Analysis
•
•
•
•
•
•
•
Analisi confermative-Predittive
Studio delle relazioni di un insieme limitato di
p variabili
Assunzioni sulla distribuzione delle variabili
Approccio analitico
Si specificano modelli per la verifica delle
ipotesi
Modelli di Regressione (GLM, Stepwise,
modelli log-lineari, logistica etc.)
Analisi Causale (Path Analysis etc.)
EMDA: Exploratory
Multidimensional Data Analysis
•
•
•
•
•
•
Analisi esplorative-descrittive
Attenzione sulle n unità statistiche
Obiettivo: trovare la struttura latente dei dati
Approccio geometrico
Per dati con strutture complesse, applicazioni
in campo sociale e psicologico
Studio di Correlazione, Covariazione,
Connessione
D.Rodi, 2016
Analisi Multivariata: applicazioni
Analisi
Univariata
Analisi
Multivariata
D.Rodi, 2016
Relazioni e modelli
• Le tecniche statistiche permettono di definire un modello statistico che
studia le relazioni fra le variabili di interesse
Il modello serve a comprendere il fenomeno attraverso:
• La descrizione sintetica e efficiente dei dati
• La predizione del futuro
• L’inferenza sulla popolazione
D.Rodi, 2016
Relazioni e modelli
• La media: un indice di sintesi
Indice di sintesi….quindi non rappresenta tutti i dati correttamente
D.Rodi, 2016
Relazioni e modelli
• La Varianza: un indice di dispersione
Rappresenta la quantificazione dell’errore della media
D.Rodi, 2016
Relazioni e modelli
Informazioni necessarie alla costruzione del modello:
• scopo dell'analisi
• tipo di variabili
• relazioni oggetto di studio
• unità di misura dei dati
• struttura dei dati
D.Rodi, 2016
Dataset multivariato
• Righe: osservazioni
• Colonne: variabili (qualitative o quantitative)
D.Rodi, 2016
Relazioni e modelli
Il modello statistico è associato ad una serie di test inferenziali che permettono di
trarre conclusioni sulla popolazione di riferimento
t=
Il modello statistico sarà una buona rappresentazione dei dati se:
•
•
•
I parametri sono modellati correttamente
Gli errori sono modellati correttamente
La struttura dei dati è rispettata
D.Rodi, 2016
Obiettivi dell’Analisi Multivariata
Dati n individui su cui si siano rilevate p variabili, le tecniche di
analisi multivariata sono una famiglia di metodi descrittivoesplorativi per:
1) Descrivere l'insieme di n individui nello spazio p-dimensionale
generato dalle variabili individuate.
2) Ridurre la dimensionalità dello spazio da p a q dimensionale
(q<p) attraverso l'uso di particolari funzioni obiettivo atte a
descrivere l'insieme di n individui nello spazio p dimensionale.
D.Rodi, 2016
Obiettivi dell’Analisi Multivariata
3) Ricavare in termini esplorativi informazioni sui legami
esistenti tra coppie di variabili di diversi sottoinsiemi di esse.
In particolare possono spiegare il comportamento di più
variabili dipendenti in funzione di altre variabili esplicative o
indipendenti, evidenziarne il nesso causale, ricercare
l'interazione fra variabili.
4) Discriminare: identificare le caratteristiche che differenziano
due o più insiemi di unità.
5) Classificare: assegnare unità a classi definite a priori (analisi
confermativa) o no (esplicative).
D.Rodi, 2016
Obiettivi dell’Analisi Multivariata
6) Raggruppare in classi le unità più somiglianti individuando
eventualmente strutture gerarchiche.
7) Evidenziare le strutture latenti sottostanti gli indicatori
osservati.
8) Quantificare
simultaneamente
variabili
qualitative
ricavandone eventualmente trasformate lineari;
9) Costruire modelli multivariati anche di tipo inferenziale
(partendo dalle informazioni di tipo descrittivo esplorativo
ricavate nell'analisi dei dati)
D.Rodi, 2016
Statistica multivariata
Analisi Fattoriale
• Permette di rappresentare un
numero elevato di variabili con un
minore numero di variabili latenti
(Fattori)
Regressione multipla
• Permette di formulare modelli
descrittivi/interpretativi
D.Rodi, 2016
Tecniche multivariate
Ordinamento
•
•
Rappresentazione del campione e delle
relazioni tra variabil in modo fedele e in uno
spazio dimensionale ridotto
Clustering
•
Suddivisione dei dati in gruppi (clusters): gli
oggetti dello stesso gruppo si somigliano,
quelli di gruppi diversi sono diversi
Scopo: rappresentazione grafica dei dati,
ordinamento degli oggetti, matrice con minor
numero di variabili e minima perdita di
informazioni
D.Rodi, 2016
Tecniche multivariate
Classificazione
•
•
•
•
•
Classificano un oggetto in una tra le n classi
previste dal problema
Quando ci sono almeno due categorie
Rispondono a: a quale delle categorie è
probabile che appartenga l’oggetto da
classificare?
Modellamento
Quando vi è una sola categoria
Rispondono a: l’oggetto ha caratteristiche
compatibili con quelle tipiche della categoria
modellata?
Predizione
•
•
Derivano da quelle di regressione
Per predire un evento partendo da un modello
con variabili quantitative definite
D.Rodi, 2016
Tecniche multivariate
D.Rodi, 2016
Dott. Donata Rodi
Contatti:
[email protected]
Cell. 347 9657256
D.Rodi, 2016
Scarica