Statistica multivariata Donata Rodi 11/10/2016 Statistica Bivariata Distribuzione di Frequenza Congiunta Rodi, 2016 Relazioni tra due fenomeni Indipendenza Statistica • Al variare della modalità di un fenomeno, la distribuzione dell’altro non varia • Non esiste alcun legame tra i due Connessione • se non c’è indipendenza statistica • Contingenza: differenza tra frequenze osservate e teoriche fenomeni • Proprietà di simmetria Rodi, 2016 Chi-Quadro di Pearson • Se le cij sono nulle: indipendenza statistica • Indice di connessione: valori maggiori se le contingenze si allontanano da 0 Rodi, 2016 Esempio Frequenze osservate Frequenze teoriche Rodi, 2016 Esempio Contingenze Rodi, 2016 Chi-Quadro di Pearson • Non è normalizzato: 0 indipendenza, cresce se c’è connessione • Varia tra 0 e 1: es. 0,08 (8% di massima connessione possibile) Rodi, 2016 Covarianza • Misura della variabilità congiunta di due fenomeni (X e Y) Rodi, 2016 Covarianza • Interpreta il legame esistente tra due fenomeni • Diagramma di dispersione (scatter plot) Segno discorde: contributo negativo alla covarianza Segno concorde: contributo positivo alla covarianza Segno concorde: contributo positivo alla covarianza Segno discorde: contributo negativo alla covarianza Rodi, 2016 Covarianza Legame lineare crescente Legame lineare decrescente Rodi, 2016 Covarianza Assenza di legame Legame non lineare Rodi, 2016 Covarianza: interpretazione • Misura: intensità e verso del legame lineare tra due fenomeni quantitativi • L’indipendenza di X e Y implica Cov=0 • Cov=0 NON implica indipendenza • Cov≠0 indica una dipendenza (ma non di che tipo) • Interpreta il grado di relazione lineare • Nessuna delle due variabili è causa del variare dell’altra Rodi, 2016 Coefficiente di Correlazione lineare • Non normalizzata: pseudo-normalizzazione • Interpreta la forza della dipendenza • -1: perfetto legame lineare negativo • +1: perfetto legame lineare positivo • 0: indipendenza statistica o legame non lineare • Nessuna delle due variabili è causa del variare dell’altra Rodi, 2016 Esempio N=200 Rodi, 2016 Test di ipotesi • R=0.623 • La relazione positiva è dovuta al caso? • H0: ρ = 0 = 11,2 Correlazione positiva e significativa: NON IMPLICA un rapporto CAUSA-EFFETTO Rodi, 2016 Regressione • Relazione di dipendenza tra le variabili (var.dipendente e indipendente) • Ricerca di un modello matematico che tende a spiegare l’andamento di un fenomeno in funzione dell’altro • La retta: per legami di tipo lineare • Al variare di x stabilisce il valore teorico che y dovrebbe avere sull’unità iesima Rodi, 2016 Regressione • Yi: valore osservato • La retta deve essere il modello più prossimo ai valori osservati • Metodo dei Minimi Quadrati Rodi, 2016 Regressione Coefficiente angolare Pendenza della retta Stessa a Diverso b Intercetta Intercetta sull’asse x Stessa b Diverso a Rodi, 2016 Esempio Rodi, 2016 Adattamento della retta • Il modello scelto è affidabile? Rodi, 2016