AIP - Sezione Psicologia dello sviluppo e dell`educazione

AIP - Sezione Psicologia dello sviluppo e dell’educazione
Scuola estiva di metodologia
“Modelli Multilivello per dati longitudinali per variabili nominali e ordinali”
(coordinatore:Fabio Presaghi)
PRESENTAZIONE
I modelli multilivello (MRLM) applicati a dati longitudinali stimano le curve di sviluppo (growth model) di
una variabile di interesse allo scopo di studiarne l’andamento nel tempo. Tale stima utilizza le tecniche della
regressione multipla applicate a variabili dipendenti che sono continue e si distribuiscono
approssimativamente in modo normale (e.g., punteggio alle Matrici Progressive di Raven). Quando la
variabile dipendente è categoriale (i.e., dicotomica, ordinale, nominale o semplicemente la frequenza di un
certo evento), l’assunzione di normalità della distribuzione viene meno e quindi i MRLM non si possono
applicare. In questi casi si può ricorrere ai Modelli Multilivello Generalizzati Non-lineari (MMGnL) descritti
da Wong e Mason (1985), Goldstein (1991, 1995) e Hedeker e Gibbons (2006). Questi modelli possono
essere utilizzati per dati longitudinali non bilanciati dove ogni individuo può essere misurato in differenti
occasioni e il numero di osservazioni può variare da individuo ad individuo.
OBIETTIVI DEL CORSO
Scopo del corso è introdurre la prospettiva multilivello nell’analisi di dati con struttura gerarchica,
organizzati cioè in una struttura ad albero che si suppone rifletta una gerarchia tra le entità presenti nel data
base (es. Tot studenti frequentanti una data classe appartenente a una data scuola collocata in una data città) .
In particolare verrà introdotta la terminologia e logica sottostante l’approccio multilivello e i principali
modelli di riferimento per l’analisi di dati longitudinali. Nella parte pratica, verrà presentato un software in
grado di gestire i principali modelli multilevel presentati nella parte teorica. Particolare enfasi verrà data
all’interpretazione e alla presentazione dei risultati di una ricerca con prospettiva multilevel.
PRE-REQUISITI: conoscenza della regressione multipla con particolare riferimento alla sua applicazione,
all’interpretazione dei parametri di regressione in termini di effetti diretti ed effetti di interazione alle
assunzioni del modello di regressione.
APPLICAZIONI: la disponibilità di software in grado di gestire questi modelli ha favorito la diffusione di
questo tipo di analisi anche se le implementazioni di tali modelli sono difficili da individuare in letteratura a
causa dei diversi nomi con cui gli autori si riferiscono a questi modelli. Di seguito è riportato un breve elenco
di articoli in cui i MMGnL sono stati applicati:




Gibbons, Hedeker, & Du Toit (2010). “Advances in Longitudinal Data”. Annual Review of Clinical
Psychology, 6, 79-107.
Gjerstad, Boeve, Wentzel-Larsen, et al (2008). Occurrence and clinical correlates of REM sleep behaviour
disorder in patients with Parkinson's disease over time. J Neurol Neurosurg Psychiatry, 79, 387-391
Schonfeld and Rindskopf (2007) Hierarchical Linear Modeling in Organizational Research : Longitudinal Data
Outside the Context of Growth Modeling. Organizational Research Methods, 10: 417
Johansson, Ytterberg, Hillert, et al (2008) A longitudinal study of variations in and predictors of fatigue in
multiple sclerosis, J Neurol Neurosurg Psychiatry, 79, 454-457.
1











Chen, and Escarce, (2008). Family Structure and the Treatment of Childhood Asthma, Medical Care, 46: 174–
184.
Wake, Hardy, Canterford, Sawyer and Carlin (2007) Overweight, obesity and girth of Australian preschoolers:
prevalence and socio-economic correlates. International Journal of Obesity, 31, 1044–1051.
KUCHIBHATLA, & FILLENBAUM, (2005) Modeling association in longitudinal binary outcomes: A brief
review, Aging & Mental Health, 9(3): 196–200.
Brunsma (2005). Interracial Families and the Racial Identification ofMixed-Race Children: Evidence from the
Early Childhood Longitudinal Study, Social Forces, 84, 2.
Adams, Moore, (2007) High-Risk Health and Credit BehaviorAmong 18- to 25-Year-Old College Students,
Journal of American College Health, 56(2)
Pattena, Don Schopflocher (2009). Longitudinal epidemiology of major depression as assessed by the Brief
Patient Health Questionnaire (PHQ-9), Comprehensive Psychiatry, 50, 26-33.
Hedeker & Mermelstein (2000) Analysis of longitudinal substance use outcomes using ordinal random-effects
regression models, Addiction 95(Supplement 3), S381–S394
Donald Hedeker, Robin J. Mermelstein, Michael L. Berbaum & Richard T. Campbell (2009). Modeling mood
variation associated with smoking: an application of a heterogeneous mixed-effects model for analysis of
ecological momentary assessment (EMA) data, Addiction, 104, 297–307.
Borrelli, Hayes, Dunsiger & Fava (2009) Risk perception and smoking behavior in medically ill smokers: a
prospective study, Addiction, 105, 1100–1108
Gavett , Poon, Ozonoff , Jefferson , Nair , Green, and Stern, (2009). Diagnostic utility of the NAB List
Learning test in Alzheimer’s disease and amnestic mild cognitive impairment, Journal of the International
Neuropsychological Society, 15 , 121 – 129 .
Kloek, van Lenthe, van Nierop et al. (2006) Stages of change for moderate-intensity physical activity in
deprived neighborhoods, Preventive Medicine 43, 325–331
SOFTWARE: Diversi software permettono di implementare questi modelli. Di seguito ne vengono elencati
alcuni che possono essere utilizzati per il corso. MIXED-UP (Hedeker & Gibbons, 1996), SUPERMIX
(Hedeker, Gibbons, Du Toit, & Cheng, 2003), MLwiN (Rasbash, Browne, Healy, Cameron, e Charlton,
2010), HLM (Raudenbush, Bryk, Cheong, Congdon, 2000), SAS (Littell, Freund e Spector, 1991),
WINBUGS (Spiegelhalter, Thomas, Best, e Lunn, 2004).
PROGRAMMA DEL CORSO:
Parte teorica
 Caratteristiche dei modelli multilivello:
o Scopi e obiettivi
o Strutture di dati multilivello
o Differenze tra modello di regressione con effetti “fissi” e modello di regressione con effetti
“random”
o Esempi dalla letteratura scientifica (articoli di ricerca)
o Omoschedasticità/eteroschedasticità
o Correlazione intra-classe
 Modelli Longitudinali Multilivello per dati DICOTOMICI e CATEGORIALI ORDINALI:
o Effetti Fissi: andamento nel tempo ed effetti di covariate
o Effetti Random: effetti del tempo ed effetti di covariate fisse e variabili nel tempo
o Funzioni Complesse di Varianza
 Modelli Longitudinali Multilivello per dati NOMINALI:
o Effetti Fissi: andamento nel tempo ed effetti di covariate
o Effetti Random: effetti del tempo ed effetti di covariate fisse e variabili nel tempo
o Funzioni Complesse di Varianza
 Modelli Longitudinali Multilivello per COUNT DATA (Poisson):
o Effetti Fissi: andamento nel tempo ed effetti di covariate
o Effetti Random: effetti del tempo ed effetti di covariate fisse e variabili nel tempo
o Funzioni Complesse di Varianza
 Statistiche di fit e significatività dei parametri di regressione
 Dimensione ottimale del campione per uno studio longitudinale (due livelli)
2
 Scelta del Modello migliore (Fit)
 Preparazione di un report per la pubblicazione
Parte pratica :
 Organizzazione del file dati con struttura multilivello
 Presentazione del software:
o l’interfaccia grafica
o Importazione/esportazione dei dati Operazioni preliminari all’analisi multilevel
o Impostazione di un modello di regressione con effetti fissi
o Confrontare due o più gruppi di un modello con effetti fissi
o Confrontare molti gruppi: modelli ad effetti random
o Modelli ad intercetta random e modelli a coefficiente angolare random
o Procedure grafiche per l’esplorazione del modello
o Effetti contestuali (covariate fisse e variabili nel tempo)
o La varianza come funzione dei predittori
LIBRI CONSIGLIATI
Libri consigliati per il ripasso della Regressione multipla:
 Hedeker & Gibbons (2006) Longitudinal Data Analysis. John Wiley & Sons, Inc., Hoboken, New
Jersey
RISORSE INTERNET:
La descrizione introduttiva al software si trova al sito: http://www.ssicentral.com/
E’ possibile anche iscriversi ad un gruppo di discussione
http://www.jiscmail.ac.uk/lists/MULTILEVEL.html in cui è possibile molto materiale per risolvere
problemi di varia natura: dai problemi di lettura dati, alle trasformazioni del dataset per l’analisi multilivello,
all’implementazione dei vari modelli ecc.
Giorno
1
2
3
Programma del corso
Mattino 9.00-13.00
Pomeriggio 14.00-18.00
Aspetti teorici
Esercitazioni
-Introduzione al corso
-Introduzione all’uso del software
-Strutture di dati multilivello (gerarchiche vs -Organizzazione
del
file
dati
non-gerarchiche)
multilivello
- Ripasso (veloce) sulla Regressone Logistica
-Trattamento preliminare dei dati per
- I Modelli di Regressione Logistica Multilivello l'analisi multilivello
Modelli Longitudinali Multilivello per dati
Applicazione con il software
DICOTOMICI e CATEGORIALI ORDINALI:
Effetti Fissi, Effetti Random
Modelli Longitudinali Multilivello per dati
Applicazione con il software
NOMINALI: Effetti Fissi, Effetti Random,
Modelli Longitudinali Multilivello per dati
COUNT DATA (Poisson): Effetti Fissi, Effetti
Random
3