INTRODUZIONE AI MODELLI DI SOPRAVVIVENZA CON IL SAS

I n t e l l i g e n c e o n B us i n e s s I n f o r ma t i o n
Corso:
INTRODUZIONE AI
MODELLI DI SOPRAVVIVENZA CON IL SAS
Durata: 1 giorno
Orario: 4 moduli giornalieri di circa 1ore e 30 minuti ciascuno
Impostazione del corso:
Nei modelli di sopravvivenza la variabile di interesse è rappresentata dalla durata della
permanenza in uno status. Si tratta dunque di analizzare dati che esprimono il tempo intercorso
tra un evento origine ed un evento terminale che segna l’uscita di un individuo da un
determinato stato. Essi si prestano ad essere interpretati ed elaborati secondo una particolare
metodologia statistica nota come l’analisi dei dati di durata o analisi della sopravvivenza [Cox e
Oakes, 1984]. Una delle caratteristiche fondamentali di tale analisi consiste nella valutazione
del contributo alla stima della sopravvivenza di quegli individui che nel periodo di osservazione
non vivono mai l’evento terminale (osservazioni censurate).
Il corso, chiarite le nozioni di misurazione dei dati di durata con osservazioni censurate,
prevede lo svolgimento di alcune precisazioni circa l'approccio "di sopravvivenza" col quale
vengono correttamente trattate queste informazioni. In letteratura sono ormai numerose le
applicazioni di tale impostazione alle scienze sociali ed economiche anche se il principale
dominio resta quello legato alle ricerche bio-mediche e cliniche [Lancaster, 1990].
La prima e più immediata statistica che su un vettore di dati di durata è possibile calcolare è
indubbiamente la media aritmetica. Ma ad esempio, nel caso di analisi della durata dello stato
di disoccupazione dopo aver sostenuto un corso di formazione professionale (il trattamento), è
evidente che la durata media della disoccupazione post-corso intuitivamente potrebbe essere
considerata come stima della probabilità di trovare lavoro. Tuttavia se la media volesse essere
una stima di un tale concetto occorrerebbe, semplificando, che tutti i soggetti sui quali è stata
condotta l'indagine avessero avuto a disposizione lo stesso tempo dalla fine del corso per
condurre le debite azioni di ricerca del lavoro. Il che non è vero proprio nel caso della
valutazione di un piano formativo regionale, il quale dovrà riguardare inevitabilmente corsi il cui
inizio e la cui fine sono assolutamente diversi fra loro.
SIMBOLOGICA S.R.L. – CAP. SOC. 65.000 EURO INT. VER.
SEDE OPERATIVA: VIA NAPO TORRIANI, 29 - MILANO, I - 20124 - TEL: (+39) 02 36581250 FAX: (+39) 02 36581255
SEDE LEGALE: VIA TORQUATO TARAMELLI, 26 - MILANO, I - 20124 - TEL: (+39) 02 6084 1
REG. IMP. DI MILANO N. 11106720151 - R.E.A. MILANO N. 1435146 - COD. FISC. E P.IVA: 11106720151
Società soggetta all’attività di direzione e coordinamento da parte di KEDRIOS S.P.A. - GRUPPO SIA
1/3
Sui dati di durata la procedura maggiormente rigorosa e allo stesso tempo ricca di chiavi
interpretative è la stima di una funzione di sopravvivenza, la quale descrive al variare del
tempo, la probabilità che un individuo si trovi in quel determinato stato "almeno" fino all'istante
t, a partire dal tempo t0 che rappresenta per l'individuo stesso il momento in cui ha avuto
origine il fenomeno. La variabile T, che rappresenta il tempo, viene quindi trattata come una
variabile casuale e i modelli di durata permettono di valutare la “velocità” dell’uscita dallo stato
che si sta studiando.
In particolare, nel nostro caso i modelli valutano il rischio di uscire dallo stato di non
occupazione e tale rischio è stato posto in funzione di gruppi diversi (ad esempio col metodo di
Kaplan-Meier) o in relazione ad alcune variabili esogene (classe dei modelli a rischi
proporzionali).
Nel corso verranno discussi e sviluppati con SAS alcuni modelli stimati per l’analisi della
sopravvivenza nello stato di “non occupato” a partire dall'analisi della durata intercorsa tra la
fine di un corso di formazione e la prima occupazione o rioccupazione. In tal modo
l’esemplificazione della modellistica presentata assumerà il tono di strumentazione per valutare
l’efficacia di un trattamento che determina la censura ai dati stessi.
L’approccio filosofico di presentazione dei modelli di sopravvivenza sarà di stampo
decisionale, in quanto, mediante alcune specificazioni particolari, si mostrerà la possibilità di
esplorare comportamenti differenziali rispetto alle diverse caratteristiche delle unità statistiche
in gioco.
2/3
Indice strutturato del corso:
•
Definizioni statistiche di base in analisi di sopravvivenza:
9 la funzione di sopravvivenza,
9 processi temporali,
9 il censoring (right, left, a intervalli),
9 l’hazard function.
•
Modelli di sopravvivenza:
9 ipotesi fondamentali dei modelli,
9 la curva di sopravvivenza,
9 il metodo di Kaplan e Mayer,
9 il test Log-Rank,
9 interpretazione dei parametri.
•
Metodi di stima e analisi
9 la stima empirica della funzione di sopravvivenza e dell’hazard function,
9 la stima di massima verosimiglianza,
9 la massima verosimiglianza in presenza di censoring,
9 bilanciamento delle curve di sopravvivenza,
9 test d’ipotesi sulle stime dei parametri.
•
Implementazione con SAS:
9 la Proc LIFETEST,
9 la Proc PHREG,
9 la Proc LIFEREG.
•
Esercizi
9 Case studies in Biostatistica
•
Bibliografia e sitografia.
3/3