I n t e l l i g e n c e o n B us i n e s s I n f o r ma t i o n Corso: INTRODUZIONE AI MODELLI DI SOPRAVVIVENZA CON IL SAS Durata: 1 giorno Orario: 4 moduli giornalieri di circa 1ore e 30 minuti ciascuno Impostazione del corso: Nei modelli di sopravvivenza la variabile di interesse è rappresentata dalla durata della permanenza in uno status. Si tratta dunque di analizzare dati che esprimono il tempo intercorso tra un evento origine ed un evento terminale che segna l’uscita di un individuo da un determinato stato. Essi si prestano ad essere interpretati ed elaborati secondo una particolare metodologia statistica nota come l’analisi dei dati di durata o analisi della sopravvivenza [Cox e Oakes, 1984]. Una delle caratteristiche fondamentali di tale analisi consiste nella valutazione del contributo alla stima della sopravvivenza di quegli individui che nel periodo di osservazione non vivono mai l’evento terminale (osservazioni censurate). Il corso, chiarite le nozioni di misurazione dei dati di durata con osservazioni censurate, prevede lo svolgimento di alcune precisazioni circa l'approccio "di sopravvivenza" col quale vengono correttamente trattate queste informazioni. In letteratura sono ormai numerose le applicazioni di tale impostazione alle scienze sociali ed economiche anche se il principale dominio resta quello legato alle ricerche bio-mediche e cliniche [Lancaster, 1990]. La prima e più immediata statistica che su un vettore di dati di durata è possibile calcolare è indubbiamente la media aritmetica. Ma ad esempio, nel caso di analisi della durata dello stato di disoccupazione dopo aver sostenuto un corso di formazione professionale (il trattamento), è evidente che la durata media della disoccupazione post-corso intuitivamente potrebbe essere considerata come stima della probabilità di trovare lavoro. Tuttavia se la media volesse essere una stima di un tale concetto occorrerebbe, semplificando, che tutti i soggetti sui quali è stata condotta l'indagine avessero avuto a disposizione lo stesso tempo dalla fine del corso per condurre le debite azioni di ricerca del lavoro. Il che non è vero proprio nel caso della valutazione di un piano formativo regionale, il quale dovrà riguardare inevitabilmente corsi il cui inizio e la cui fine sono assolutamente diversi fra loro. SIMBOLOGICA S.R.L. – CAP. SOC. 65.000 EURO INT. VER. SEDE OPERATIVA: VIA NAPO TORRIANI, 29 - MILANO, I - 20124 - TEL: (+39) 02 36581250 FAX: (+39) 02 36581255 SEDE LEGALE: VIA TORQUATO TARAMELLI, 26 - MILANO, I - 20124 - TEL: (+39) 02 6084 1 REG. IMP. DI MILANO N. 11106720151 - R.E.A. MILANO N. 1435146 - COD. FISC. E P.IVA: 11106720151 Società soggetta all’attività di direzione e coordinamento da parte di KEDRIOS S.P.A. - GRUPPO SIA 1/3 Sui dati di durata la procedura maggiormente rigorosa e allo stesso tempo ricca di chiavi interpretative è la stima di una funzione di sopravvivenza, la quale descrive al variare del tempo, la probabilità che un individuo si trovi in quel determinato stato "almeno" fino all'istante t, a partire dal tempo t0 che rappresenta per l'individuo stesso il momento in cui ha avuto origine il fenomeno. La variabile T, che rappresenta il tempo, viene quindi trattata come una variabile casuale e i modelli di durata permettono di valutare la “velocità” dell’uscita dallo stato che si sta studiando. In particolare, nel nostro caso i modelli valutano il rischio di uscire dallo stato di non occupazione e tale rischio è stato posto in funzione di gruppi diversi (ad esempio col metodo di Kaplan-Meier) o in relazione ad alcune variabili esogene (classe dei modelli a rischi proporzionali). Nel corso verranno discussi e sviluppati con SAS alcuni modelli stimati per l’analisi della sopravvivenza nello stato di “non occupato” a partire dall'analisi della durata intercorsa tra la fine di un corso di formazione e la prima occupazione o rioccupazione. In tal modo l’esemplificazione della modellistica presentata assumerà il tono di strumentazione per valutare l’efficacia di un trattamento che determina la censura ai dati stessi. L’approccio filosofico di presentazione dei modelli di sopravvivenza sarà di stampo decisionale, in quanto, mediante alcune specificazioni particolari, si mostrerà la possibilità di esplorare comportamenti differenziali rispetto alle diverse caratteristiche delle unità statistiche in gioco. 2/3 Indice strutturato del corso: • Definizioni statistiche di base in analisi di sopravvivenza: 9 la funzione di sopravvivenza, 9 processi temporali, 9 il censoring (right, left, a intervalli), 9 l’hazard function. • Modelli di sopravvivenza: 9 ipotesi fondamentali dei modelli, 9 la curva di sopravvivenza, 9 il metodo di Kaplan e Mayer, 9 il test Log-Rank, 9 interpretazione dei parametri. • Metodi di stima e analisi 9 la stima empirica della funzione di sopravvivenza e dell’hazard function, 9 la stima di massima verosimiglianza, 9 la massima verosimiglianza in presenza di censoring, 9 bilanciamento delle curve di sopravvivenza, 9 test d’ipotesi sulle stime dei parametri. • Implementazione con SAS: 9 la Proc LIFETEST, 9 la Proc PHREG, 9 la Proc LIFEREG. • Esercizi 9 Case studies in Biostatistica • Bibliografia e sitografia. 3/3