Statistica multivariata
Donata Rodi
11/10/2016
Statistica Bivariata
Distribuzione di Frequenza Congiunta
Rodi, 2016
Relazioni tra due fenomeni
Indipendenza Statistica
• Al variare della modalità di un
fenomeno, la distribuzione
dell’altro non varia
• Non esiste alcun legame tra i due
Connessione
• se non c’è indipendenza statistica
• Contingenza: differenza tra
frequenze osservate e teoriche
fenomeni
• Proprietà di simmetria
Rodi, 2016
Chi-Quadro di Pearson
• Se le cij sono nulle: indipendenza statistica
• Indice di connessione: valori maggiori se le contingenze si allontanano da 0
Rodi, 2016
Esempio
Frequenze osservate
Frequenze teoriche
Rodi, 2016
Esempio
Contingenze
Rodi, 2016
Chi-Quadro di Pearson
• Non è normalizzato: 0 indipendenza, cresce se c’è connessione
• Varia tra 0 e 1: es. 0,08 (8% di massima connessione possibile)
Rodi, 2016
Covarianza
• Misura della variabilità congiunta di due fenomeni (X e Y)
Rodi, 2016
Covarianza
• Interpreta il legame esistente tra due fenomeni
• Diagramma di dispersione (scatter plot)
Segno discorde:
contributo negativo
alla covarianza
Segno concorde:
contributo positivo
alla covarianza
Segno concorde:
contributo positivo
alla covarianza
Segno discorde:
contributo negativo
alla covarianza
Rodi, 2016
Covarianza
Legame lineare crescente
Legame lineare decrescente
Rodi, 2016
Covarianza
Assenza di legame
Legame non lineare
Rodi, 2016
Covarianza: interpretazione
• Misura: intensità e verso del legame lineare tra due fenomeni quantitativi
• L’indipendenza di X e Y implica Cov=0
• Cov=0 NON implica indipendenza
• Cov≠0 indica una dipendenza (ma non di che tipo)
• Interpreta il grado di relazione lineare
• Nessuna delle due variabili è causa del variare dell’altra
Rodi, 2016
Coefficiente di Correlazione lineare
• Non normalizzata: pseudo-normalizzazione
• Interpreta la forza della dipendenza
• -1: perfetto legame lineare negativo
• +1: perfetto legame lineare positivo
• 0: indipendenza statistica o legame non lineare
• Nessuna delle due variabili è causa del variare dell’altra
Rodi, 2016
Esempio
N=200
Rodi, 2016
Test di ipotesi
• R=0.623
• La relazione positiva è dovuta al caso?
• H0: ρ = 0
= 11,2
Correlazione positiva e significativa: NON IMPLICA un rapporto CAUSA-EFFETTO
Rodi, 2016
Regressione
• Relazione di dipendenza tra le variabili (var.dipendente e indipendente)
• Ricerca di un modello matematico che tende a spiegare l’andamento di un
fenomeno in funzione dell’altro
• La retta: per legami di tipo lineare
• Al variare di x stabilisce il valore teorico che y dovrebbe avere sull’unità iesima
Rodi, 2016
Regressione
• Yi: valore osservato
• La retta deve essere il modello più
prossimo ai valori osservati
• Metodo dei Minimi Quadrati
Rodi, 2016
Regressione
Coefficiente angolare
Pendenza
della retta
Stessa a
Diverso b
Intercetta
Intercetta
sull’asse x
Stessa b
Diverso a
Rodi, 2016
Esempio
Rodi, 2016
Adattamento della retta
• Il modello scelto è affidabile?
Rodi, 2016