Relazioni tra variabili Strumenti di indagine per la valutazione psicologica Metodi simmetrici vs asimmetrici ● 1.5 – Correlazione e causazione ● Davide Massidda Nei metodi di studio simmetrici non viene ipotizzata una relazione causale tra le variabili. Non esiste quindi la suddivisione tra variabile dipendente e variabile indipendente, ma le due variabili vengono considerate sullo stesso piano (come nell’analisi di correlazione). [email protected] Università di Cagliari, a.a. 2013/2014 Relazioni tra variabili Metodi simmetrici vs asimmetrici ● La correlazione ● I metodi asimmetrici vengono utilizzati per studiare relazioni di tipo “causa ed effetto” tra le variabili. ● ● Il ricercatore ipotizza a priori una relazione causale tra le due variabili: una viene considerata dipendente e l’altra indipendente (come nell’analisi di regressione). È la misura di una relazione tra due variabili tale per cui a ciascun valore della prima variabile corrisponde con una certa regolarità un valore della seconda. Non si tratta di un rapporto di causa ed effetto ma semplicemente della tendenza di una variabile a variare assieme a un'altra: le due variabili sono sullo stesso piano causale. La correlazione ● Correlazione ≠ Causazione Grossolanamente, possiamo dire che due variabili sono legate quando: (a) all’aumentare di una aumenta anche l’altra (e, viceversa, al diminuire di una diminuisce anche l’altra); (b) all’aumentare di una, l’altra diminuisce (e, viceversa, al diminuire di una l’altra aumenta). ● ● La correlazione è espressa attraverso degli indici che variano tra -1 e +1: tendono a +1 nel caso (a) e tendono a -1 nel caso (b). L'indice più noto è quello di Bravais-Pearson per variabili continue, ma non è l'unico. en.wikipedia.org/wiki/Correlation_does_not_imply_causation Correlazione ≠ Causazione Relazione causale diretta Due variabili sono legate da una relazione causale diretta quando un mutamento nella variabile “causa” produce un mutamento nella variabile “effetto”. Y www.nejm.org/doi/full/10.1056/NEJMon1211064 X Relazione causale reciproca Relazione causale spuria Due variabili sono legate da una relazione causale reciproca quando un mutamento nella variabile “causa” produce un mutamento nella variabile “effetto” e viceversa, anche in tempi differenti. Presenza di covariazione in assenza di causazione. La covariazione fra due variabili è provocata da una terza variabile che agisce causalmente sulle prime. Y X Y X Z Relazione causale indiretta Relazione causale condizionata Si ha relazione causale indiretta tra due variabili X e Y quando il loro legame causale è mediato da una terza variabile Z, detta interveniente. Si ha relazione causale condizionata, o interazione, quando la relazione tra due variabili cambia a seconda del valore assunto da una terza. Y X Z Y X Z Studiare le relazioni I modelli lineari y =β0 +β1 x y =f ( x) ● ● I fenomeni x e y non sono indipendenti, ma fra loro c'è una relazione: dai valori di x dipendono, almeno in parte, quelli di y. ● Questa relazione è descritta dalla funzione f, che può assumere forme diverse. Un caso molto comune è quello dei modelli lineari: si ipotizza che, applicando una trasformazione lineare sulla variabile x, si possa ottenere y. y =β0 +β1 x +ϵ ● Nella pratica, però, è difficile che questa relazione venga osservata “pulita”: ci sarà sempre una componente d'errore dovuta all'influenza di altri fenomeni sconosciuti. I modelli lineari Verifica del modello y y =β0 +β1 x ● ● Attraverso l'analisi statistica si cerca di individuare il valore dei parametri del modello che, se inseriti nella formula, permettono di riottenere y. Inoltre, si calcolano degli indici come R2 per capire quanto il modello si avvicina alla realtà. ● ● vs ̂y Se la y stimata attraverso il modello si avvicina molto alla y osservata, allora potremo dire che il nostro modello è un buon prototipo della realtà. Proviamo a vederlo in pratica? Esempio ● ● ● I dati Vivibilità Criminalità Il Ministero della Salute sta svolgendo una ricerca sulla vivibilità delle città italiane. Scopo della ricerca è mettere in relazione la vivibilità delle città, così come percepita dai cittadini, con altre possibili variabili che la possono influenzare. 32 33 32 35 62 90 34 61 37 40 47 56 Una delle ipotesi è che la vivibilità percepita possa dipendere dalla percezione di diffusione della microcriminalità. 40 37 39 88 39 39 40 44 70 61 47 66 40 35 45 29 ... ... Attraverso appositi questionari, le due variabili sono state misurate su un campione di 20 abitanti di una città italiana. Scatter plot Il modello Vivibilità=β0 +β1 Criminalità + ϵ r = -0.61 ● ● β0: intercetta. Valore che assume y quando x vale zero; definisce il punto di partenza della retta. β1: coefficiente angolare (slope). Incremento che si osserva in y per ogni incremento unitario in x; definisce l'inclinazione della retta. Il modello La retta di regressione y =β0 +β1 x +ϵ ̂y =52.15−0.21 x Metodo OLS ̂y =52.15−0.21 x Tassonomia dei modelli lineari Assumendo una Y continua che dipende da più di una X: X Continua Continua Y Binaria, binomiale, frequenze, ordinale Regressione Modelli lineari generalizzati Tassonomia dei modelli lineari X1 Categoriale Test t, Analisi della varianza Modelli lineari generalizzati Continua Continua X2 Categoriale Regressione multipla Analisi di covarianza (ANCOVA) Categoriale Analisi di covarianza (ANCOVA) Analisi della varianza (ANOVA) a due vie