AIP - Sezione Psicologia dello sviluppo e dell’educazione Scuola estiva di metodologia “Modelli Multilivello per dati longitudinali per variabili nominali e ordinali” (coordinatore:Fabio Presaghi) PRESENTAZIONE I modelli multilivello (MRLM) applicati a dati longitudinali stimano le curve di sviluppo (growth model) di una variabile di interesse allo scopo di studiarne l’andamento nel tempo. Tale stima utilizza le tecniche della regressione multipla applicate a variabili dipendenti che sono continue e si distribuiscono approssimativamente in modo normale (e.g., punteggio alle Matrici Progressive di Raven). Quando la variabile dipendente è categoriale (i.e., dicotomica, ordinale, nominale o semplicemente la frequenza di un certo evento), l’assunzione di normalità della distribuzione viene meno e quindi i MRLM non si possono applicare. In questi casi si può ricorrere ai Modelli Multilivello Generalizzati Non-lineari (MMGnL) descritti da Wong e Mason (1985), Goldstein (1991, 1995) e Hedeker e Gibbons (2006). Questi modelli possono essere utilizzati per dati longitudinali non bilanciati dove ogni individuo può essere misurato in differenti occasioni e il numero di osservazioni può variare da individuo ad individuo. OBIETTIVI DEL CORSO Scopo del corso è introdurre la prospettiva multilivello nell’analisi di dati con struttura gerarchica, organizzati cioè in una struttura ad albero che si suppone rifletta una gerarchia tra le entità presenti nel data base (es. Tot studenti frequentanti una data classe appartenente a una data scuola collocata in una data città) . In particolare verrà introdotta la terminologia e logica sottostante l’approccio multilivello e i principali modelli di riferimento per l’analisi di dati longitudinali. Nella parte pratica, verrà presentato un software in grado di gestire i principali modelli multilevel presentati nella parte teorica. Particolare enfasi verrà data all’interpretazione e alla presentazione dei risultati di una ricerca con prospettiva multilevel. PRE-REQUISITI: conoscenza della regressione multipla con particolare riferimento alla sua applicazione, all’interpretazione dei parametri di regressione in termini di effetti diretti ed effetti di interazione alle assunzioni del modello di regressione. APPLICAZIONI: la disponibilità di software in grado di gestire questi modelli ha favorito la diffusione di questo tipo di analisi anche se le implementazioni di tali modelli sono difficili da individuare in letteratura a causa dei diversi nomi con cui gli autori si riferiscono a questi modelli. Di seguito è riportato un breve elenco di articoli in cui i MMGnL sono stati applicati: Gibbons, Hedeker, & Du Toit (2010). “Advances in Longitudinal Data”. Annual Review of Clinical Psychology, 6, 79-107. Gjerstad, Boeve, Wentzel-Larsen, et al (2008). Occurrence and clinical correlates of REM sleep behaviour disorder in patients with Parkinson's disease over time. J Neurol Neurosurg Psychiatry, 79, 387-391 Schonfeld and Rindskopf (2007) Hierarchical Linear Modeling in Organizational Research : Longitudinal Data Outside the Context of Growth Modeling. Organizational Research Methods, 10: 417 Johansson, Ytterberg, Hillert, et al (2008) A longitudinal study of variations in and predictors of fatigue in multiple sclerosis, J Neurol Neurosurg Psychiatry, 79, 454-457. 1 Chen, and Escarce, (2008). Family Structure and the Treatment of Childhood Asthma, Medical Care, 46: 174– 184. Wake, Hardy, Canterford, Sawyer and Carlin (2007) Overweight, obesity and girth of Australian preschoolers: prevalence and socio-economic correlates. International Journal of Obesity, 31, 1044–1051. KUCHIBHATLA, & FILLENBAUM, (2005) Modeling association in longitudinal binary outcomes: A brief review, Aging & Mental Health, 9(3): 196–200. Brunsma (2005). Interracial Families and the Racial Identification ofMixed-Race Children: Evidence from the Early Childhood Longitudinal Study, Social Forces, 84, 2. Adams, Moore, (2007) High-Risk Health and Credit BehaviorAmong 18- to 25-Year-Old College Students, Journal of American College Health, 56(2) Pattena, Don Schopflocher (2009). Longitudinal epidemiology of major depression as assessed by the Brief Patient Health Questionnaire (PHQ-9), Comprehensive Psychiatry, 50, 26-33. Hedeker & Mermelstein (2000) Analysis of longitudinal substance use outcomes using ordinal random-effects regression models, Addiction 95(Supplement 3), S381–S394 Donald Hedeker, Robin J. Mermelstein, Michael L. Berbaum & Richard T. Campbell (2009). Modeling mood variation associated with smoking: an application of a heterogeneous mixed-effects model for analysis of ecological momentary assessment (EMA) data, Addiction, 104, 297–307. Borrelli, Hayes, Dunsiger & Fava (2009) Risk perception and smoking behavior in medically ill smokers: a prospective study, Addiction, 105, 1100–1108 Gavett , Poon, Ozonoff , Jefferson , Nair , Green, and Stern, (2009). Diagnostic utility of the NAB List Learning test in Alzheimer’s disease and amnestic mild cognitive impairment, Journal of the International Neuropsychological Society, 15 , 121 – 129 . Kloek, van Lenthe, van Nierop et al. (2006) Stages of change for moderate-intensity physical activity in deprived neighborhoods, Preventive Medicine 43, 325–331 SOFTWARE: Diversi software permettono di implementare questi modelli. Di seguito ne vengono elencati alcuni che possono essere utilizzati per il corso. MIXED-UP (Hedeker & Gibbons, 1996), SUPERMIX (Hedeker, Gibbons, Du Toit, & Cheng, 2003), MLwiN (Rasbash, Browne, Healy, Cameron, e Charlton, 2010), HLM (Raudenbush, Bryk, Cheong, Congdon, 2000), SAS (Littell, Freund e Spector, 1991), WINBUGS (Spiegelhalter, Thomas, Best, e Lunn, 2004). PROGRAMMA DEL CORSO: Parte teorica Caratteristiche dei modelli multilivello: o Scopi e obiettivi o Strutture di dati multilivello o Differenze tra modello di regressione con effetti “fissi” e modello di regressione con effetti “random” o Esempi dalla letteratura scientifica (articoli di ricerca) o Omoschedasticità/eteroschedasticità o Correlazione intra-classe Modelli Longitudinali Multilivello per dati DICOTOMICI e CATEGORIALI ORDINALI: o Effetti Fissi: andamento nel tempo ed effetti di covariate o Effetti Random: effetti del tempo ed effetti di covariate fisse e variabili nel tempo o Funzioni Complesse di Varianza Modelli Longitudinali Multilivello per dati NOMINALI: o Effetti Fissi: andamento nel tempo ed effetti di covariate o Effetti Random: effetti del tempo ed effetti di covariate fisse e variabili nel tempo o Funzioni Complesse di Varianza Modelli Longitudinali Multilivello per COUNT DATA (Poisson): o Effetti Fissi: andamento nel tempo ed effetti di covariate o Effetti Random: effetti del tempo ed effetti di covariate fisse e variabili nel tempo o Funzioni Complesse di Varianza Statistiche di fit e significatività dei parametri di regressione Dimensione ottimale del campione per uno studio longitudinale (due livelli) 2 Scelta del Modello migliore (Fit) Preparazione di un report per la pubblicazione Parte pratica : Organizzazione del file dati con struttura multilivello Presentazione del software: o l’interfaccia grafica o Importazione/esportazione dei dati Operazioni preliminari all’analisi multilevel o Impostazione di un modello di regressione con effetti fissi o Confrontare due o più gruppi di un modello con effetti fissi o Confrontare molti gruppi: modelli ad effetti random o Modelli ad intercetta random e modelli a coefficiente angolare random o Procedure grafiche per l’esplorazione del modello o Effetti contestuali (covariate fisse e variabili nel tempo) o La varianza come funzione dei predittori LIBRI CONSIGLIATI Libri consigliati per il ripasso della Regressione multipla: Hedeker & Gibbons (2006) Longitudinal Data Analysis. John Wiley & Sons, Inc., Hoboken, New Jersey RISORSE INTERNET: La descrizione introduttiva al software si trova al sito: http://www.ssicentral.com/ E’ possibile anche iscriversi ad un gruppo di discussione http://www.jiscmail.ac.uk/lists/MULTILEVEL.html in cui è possibile molto materiale per risolvere problemi di varia natura: dai problemi di lettura dati, alle trasformazioni del dataset per l’analisi multilivello, all’implementazione dei vari modelli ecc. Giorno 1 2 3 Programma del corso Mattino 9.00-13.00 Pomeriggio 14.00-18.00 Aspetti teorici Esercitazioni -Introduzione al corso -Introduzione all’uso del software -Strutture di dati multilivello (gerarchiche vs -Organizzazione del file dati non-gerarchiche) multilivello - Ripasso (veloce) sulla Regressone Logistica -Trattamento preliminare dei dati per - I Modelli di Regressione Logistica Multilivello l'analisi multilivello Modelli Longitudinali Multilivello per dati Applicazione con il software DICOTOMICI e CATEGORIALI ORDINALI: Effetti Fissi, Effetti Random Modelli Longitudinali Multilivello per dati Applicazione con il software NOMINALI: Effetti Fissi, Effetti Random, Modelli Longitudinali Multilivello per dati COUNT DATA (Poisson): Effetti Fissi, Effetti Random 3