Cd LM LM-67 - Scienze e Tecniche delle attività motorie preventive e adattate C.I. Epidemiologia e valutazione degli stili di vita sulla salute Modulo: Metodologia Epidemiologica Prof. Giovanni Capelli (Cattedra di Igiene Università di Cassino [email protected]) C.I. Epidemiologia e valutazione degli stili di vita sulla salute (8 CFU) Docenti: Prof. Giovanni CAPELLI, Prof. Nicola PORRO „Stile di vita‟ e „Stili di vita‟: cultura del corpo e della salute, rappresentazioni sociali ed età della vita. Dalla misura della quantità di vita alla misura della qualità di vita: principi, strumenti e applicazioni; approcci standardizzati e non standardizzati. Modelli e metodi per lo studio e la valutazione di relazioni causa-effetto e del ruolo delle variabili fisiche, biologiche, psicologiche e sociali. Studi epidemiologici, indagini socio- demografiche e indagini demoscopiche: metodi, strumenti e applicazioni. Lettura e comprensione di articoli scientifici, interpretazione di indici epidemiologici e sociodemografici. Cd LM LM-67 - Scienze e Tecniche delle attività motorie preventive e adattate Cause ed effetti Nesso di Causalità E‟ ciò che mette in relazione le cause con gli effetti che esse producono La gran parte dell‟epidemiologia consiste nello studio dei nessi di causalità o E‟ importante ricordare che le “prove” epidemiologiche non sono sufficienti a stabilire un nesso di casualità, ma costituiscono solo elementi circostanziali Esistono diverse tipologie di cause Last JM, A Dictionary of Epidemiology, 3rd Ed, Oxford Univ Press, 1995 (Causality) Definizione di Causa • Possiamo definire la causa di uno specifico evento di malattia come: un evento, condizione o caratteristica che ha preceduto l‟evento di malattia, e senza il quale la malattia non si sarebbe per nulla verificata o si sarebbe verificata in un tempo successivo • In effetti, nessun evento, condizione o caratteristica specifiche sono sufficienti di per sé a produrre l‟effetto questa definizione non si riferisce al complesso del meccanismo causale, ma soltanto ad un suo componente Rothman K, Greenland S, Causation and Causal Inference, In: Rothman K, Greenland S “Modern Epidemiology”, Lippincott-Raven, 1998 Filosofia della valutazione di causalità Teorie probabilistiche della causalità Una causa è un fattore statisticamente rilevante X causa Y se e solo se: o o o X precede temporalmente Y X è correlato, positivamente o negativamente, con Y non esiste un fattore Z precedente a X tale da eliminare la relazione tra X e Y la correlazione tra X e Y non è “spuria” Filosofia della valutazione di causalità Teorie probabilistiche della causalità Il problema principale di queste teorie è il soddisfacimento della terza condizione (che l‟associazione non sia “spuria”) o che implica identificazione ed eliminazione dei fattori “disturbanti” (confounding factors) Che X sia causa di Y secondo la definizione probabilistica può dipendere, dunque o o da quali fattori sono presi in considerazione e quindi X resta una causa a meno di altri fattori, a noi sconosciuti, potenzialmente rilevanti Il potenziale agente causale (o fattore di rischio) viene a contatto con l’ospite Risultato della interazione tra agente causale (o fattore di rischio) e ospite Il potenziale agente causale (o fattore di rischio) viene a contatto con l’ospite Risultato della interazione tra agente causale (o fattore di rischio) e ospite Il ruolo delle variabili indagate Un momento chiave nella analisi dei dati è la formulazione di una IPOTESI ESPLICATIVA un modello concettuale dei possibili legami tra le entità o i fenomeni misurati Questo richiede la definizione di: Una (o più) variabili di risultato o Effetto (outcome), variabili dipendenti Le possibili variabili “causali” o Esposizioni, variabili indipendenti (esplicative) Le possibili variabili “di confondimento” In cosa consiste l‟approccio agli esiti? R.L. Kane, Approaching the outcomes question, in R.L. Kane, Understanding Health Outcome Research, Aspen Publ, 1997 Il modello di base per analizzare gli esiti degli interventi sanitari può essere sintetizzato come segue: = f(stato di base, caratteristiche cliniche, caratteristiche demografiche e psicosociali, trattamento, ambito di assistenza) ESITO Questa formula indica che gli esiti clinici sono il risultato di svariati fattori, classificabili come: fattori di rischio (stato di base, stato clinico, caratteristiche demografiche e psicosociali) caratteristiche del trattamento (trattamento e ambito di assistenza) L‟obiettivo dell‟analisi è isolare la relazione tra l‟esito di interesse e il trattamento prestato “controllando” l‟effetto di altre variabili rilevanti (correzione del rischio) Il modello concettuale (1) R.L. Kane, Approaching the outcomes question, in R.L. Kane, Understanding Health Outcome Research, Aspen Publ, 1997 Momento chiave nella realizzazione di uno studio sugli esiti è la definizione di un modello concettuale in sostanza, il modello concettuale mostra ciò che riteniamo causi gli effetti identifica quali variabili, scelte per rappresentare i vari componenti della funzione matematica sopra espressa, siano pertinenti allo studio in oggetto e specifica tali variabili e la loro relazione con l‟effetto che ci interessa e tra di loro un modo di dire familiare nella “outcomes research” è “quello che non misuri non esiste” • è perciò necessario essere capaci di ridurre situazioni complesse a rappresentazioni MISURABILI, per poterle studiare • MA: la misura comporta inevitabilmente distorsione, è per sua natura processo di astrazione, e qualcosa va comunque perso nel processo ovviamente, però, non tutto ciò che può essere misurato è parimenti utile... Il modello concettuale (2) R.L. Kane, Approaching the outcomes question, in R.L. Kane, Understanding Health Outcome Research, Aspen Publ, 1997 Modello concettuale non è sempre sinonimo di modello teorico in epidemiologia valutativa, non è strettamente necessario che vi sia il supporto di una solida teoria “fisiopatologica” Piuttosto, serve ad indicare chiaramente quale processo il ricercatore ritiene sia alla base del fenomeno o almeno quali elementi vanno controllati nella analisi simili modelli possono essere basati sulla esperienza “clinica” o sulla revisione bibliografica delle esperienze precedenti E il lavoro “a tavolino” sul modello permette di ragionare sull‟importanza relativa dei fattori presi in considerazione Il modello concettuale (3) R.L. Kane, Approaching the outcomes question, in R.L. Kane, Understanding Health Outcome Research, Aspen Publ, 1997 Fattori clinici Gittata cardiaca Gravità Durata Eziologia Comorbosità Stato precedente • Fattori del paziente – Età – Sesso – Professione • Trattamento – Terapie specifiche – Dieta – Esercizio – Gestione del caso • Effetti – Gittata cardiaca – Sintomi – Funzione – Complicazioni – Qualità di Vita – Rientro/perdita del lavoro Trattamento ed esiti nello scompenso cardiaco congestizio Attenzione, dunque: Una solida ipotesi di partenza è sempre necessaria I dati vanno letti criticamente, per non “estorcere” risultati conformi solo ai propri preconcetti I metodi epidemiologicostatistici non producono risultati “assoluti”, ma verità RELATIVE che quantificano l‟incertezza legata alle affermazioni fatte Esiti (Endpoints) HARD Sopravvivenza / Recidiva / Tossicità o Tempo (survival time, disease free time) o Frequenza SOFT Tasso di incidenza (Rate) Rischio Relativo Misure dello stato di salute positiva o “Oggettive” Karnowsky, ECOG o “Soggettive” Percezione individuale di dimensioni della Qualità di Vita • Questionari SF-36, EORTC Variabili “hard” e “soft” Le variabili che è facile rilevare in modo riproducibile sono dette “dure” o “robuste” (inglese hard) Tipiche variabili dure sono l‟età e lo stato in vita (con i valori deceduto o vivo) Le variabili difficili da rilevare in modo riproducibile sono dette “molli” o“fragili” (inglese soft) tipiche variabili molli, che sono poco riproducibili o richiedono il ricorso a particolari accorgimenti per essere rilevate in modo riproducibile, sono il giudizio di modificazione complessiva o di gravità complessiva dello stato clinico, ad esempio il primo con i valori “molto migliorato; migliorato; stazionario; peggiorato; molto peggiorato” o il secondo con i valori “molto grave; grave; medio; discreto; lieve”. Poco riproducibili sono anche molte diagnosi e, nonostante quello che comunemente si crede, la presenza/assenza di molti sintomi e segni clinici, tra cui ad esempio il segno di Babinski (Tomasello et al., 1982) Esiti (Endpoints) HARD Sopravvivenza / Recidiva / Tossicità o Tempo (survival time, disease free time) o Frequenza SOFT Tasso di incidenza (Rate) Rischio Relativo Misure dello stato di salute positiva o “Oggettive” Karnowsky, ECOG o “Soggettive” Percezione individuale di dimensioni della Qualità di Vita • Questionari SF-36, EORTC Endpoints: primari e secondari In ogni ricerca clinica vanno definiti obiettivi chiari espliciti e misurabili Con il termine di end-point si fa riferimento, appunto, alle misure utilizzate per la valutazione del conseguimento degli obiettivi End-point primario L‟esito principale oggetto di studio o es. ridurre la mortalità -> Tasso di mortalità End-point secondari Altri esiti di interesse clinico o o Frequenza e qualità effetti collaterali Qualità di vita (QoL, HRQoL) Gli endpoint “surrogati” Razionale Alcune delle patologie oggetto di indagine potrebbero avere antecedenti misurabili decesso per cancro o recidiva o metastasi morte per aritmia ventricolare post-infarto o episodi di aritmia ventricolare non fatali morte neonatale o prematurità Il numero di ESITI effettivamente osservati condiziona la potenza di uno studio gli antecedenti sono + frequenti dell‟end-point finale o studiare gli antecedenti migliora la potenza statistica -> scelta di ENDPOINT SURROGATI Gli endpoint “surrogati” Problemi Questo aumento di potenza statistica è molto gradito purché l‟analisi della frequenza dell‟end-point surrogato corrisponda effettivamente a quella che sarebbe stata la frequenza dell‟end-point vero in uno studio più ampio in grado di misurarlo o è necessario dunque fare molta attenzione nella scelta di end-point surrogati in parecchi casi, ci si è resi conto che condizioni antecedenti che sembravano avere un legame biologicamente plausibile in teoria non si rivelavano buoni predittori nella pratica • Addirittura, alcuni farmaci capaci di ridurre la frequenza di una forma di aritmia cardiaca , la depolarizzazione ventricolare prematura, si sono rivelati aumentare la mortalità per aritmia cardiaca Le misure del rischio in epidemiologia Cosa è il Rischio ? E‟ la probabilità che si verifichi un evento negativo per la salute Come ogni evento a cui vengono applicate le leggi di probabilità, l‟effetto è un evento binario, che si verifica oppure no Affermare che esiste un rischio del 5%, significa affermare che ci attende che 5 esposizioni su 100 portino all‟ effetto e 95 no Situazione a rischio Probabilità Danno Ambiente Ospite Fattore di rischio Fattore di rischio Non danno La misura del rischio è strettamente legata al concetto di probabilità perchè il rischio riguarda avvenimenti futuri che possono verificarsi o meno che possono svolgersi con diversa intensità Condizioni che anticipano l‟insorgenza di una malattia o ne rendono più grave il decorso Esiste una correlazione causale fra queste condizioni e la malattia? SI Sono potenzialmente controllabili? Agenti fisici, chimici, biologici FATTORI DI RISCHIO NO Età, sesso, etnia MARKERS DI RISCHIO Come aiutare a percepire le misure di probabilità e rischio ? Calman e Royston (BMJ, 1997), hanno portato un contributo interessante al problema della comunicazione e comprensibilità delle misure di rischio spesso è difficile proporre, stime di probabilità o di aumento relativo di probabilità non solo ai pazienti, ma anche agli operatori sanitari ed hanno proposto di fare riferimento a scale logaritmiche (come quella Richter per i terremoti) a riferimenti in termini di distanza chilometrica a riferimenti qualitativi verbali a riferimenti delle dimensioni di comunità crescenti Community cluster classification da Calman KC, Royston G, Personal paper: Risk language and dialects, BMJ, 1997, 315: 939,-942 Grouping Approximate size Individual Family Street Village Small town Large town City Province or country Large country Continent World 1 10 100 1000 10000 100000 1000000 10000000 100000000 1000000000 10000000000 Logarithm of size 0 1 2 3 4 5 6 7 8 9 10 La percezione del rischio La percezione del rischio da parte del pubblico si presenta spesso diversa dalle misure obiettive proposte dagli esperti e si basa prevalentemente su caratteristiche qualitative più che quantitative familiarità, controllo, potenziale catastrofico, pericolo per le generazioni future Situazioni potenzialmente pericolose ritenute “volontarie” sono anche comunemente considerate “controllabili” Situazioni i cui effetti negativi sono ritardati tendono ad essere identificate come situazioni a rischio poco conosciuto Slovic P, Perception of Risk, Science, 236: 280-285, 1987 Stima di probabilità Rischio assoluto, Proporzione di incidenza, Tasso di attacco, Tasso di incidenza, Proporzione di prevalenza Rischio Relativo (RR), Odds Ratio (OR) stima dell‟ incremento relativo di rischio di una popolazione rispetto ad una popolazione di riferimento Aumento assoluto di probabilità Rischio differenziale (RD) stima del rischio riferita ad un singolo gruppo di soggetti (popolazione) Aumento relativo di probabilità Misura del rischio stima della differenza assoluta di rischio tra una popolazione ed una popolazione di riferimento Aumento di probabilità imputabile all‟ esposizione Rischio attribuibile (AR) stima della proporzione di casi che non si sarebbero verificati in assenza di effetto della esposizione, nel gruppo degli esposti o nella popolazione Misure di Frequenza PREVALENZA “Casi presenti” -->> stati Proporzione di prevalenza puntuale Proporzione di prevalenza periodale INCIDENZA “Nuovi Casi” -->> cambiamenti di stato Tempo di incidenza Tasso di incidenza (Incidence rate- Densità di incidenza) tempo-persona • va distinto dal tempo “di calendario” perché è la somma di tempi contemporanei di persone diverse, mentre il tempo di calendario è consecutivo Proporzione di incidenza suscettibili nel periodo Proporzione di prevalenza t0 A B C D E F G H I L PREVALENZA PUNTUALE (stati presenti)= n° casi in t 0 tutta la popolazione (C,E) 2 = = (A,B,C,D,E,F,G,H,I,L) 10 Proporzione di Prevalenza t0 A B C D E F G H I L PREVALENZA PUNTUALE (stati presenti)= n° casi in t0 tutta la popolazione (C,E) 2 = = (A,B,C,D,E,F,G,H,I,L) 10 Proporzione di prevalenza t0 (“Tasso di prevalenza”) t1 A B C D E F G H I L PREVALENZA PERIODALE (stati presenti)= n° casi tra t 0 e t 1 tutta la popolazione (C,E,F,G,H,I) 6 = = (A,B,C,D,E,F,G,H,I,L) 10 RAPPORTI, PROPORZIONI, TASSI PROPORZIONE esprime il numero di soggetti che presentano una particolare caratteristica come percentuale di tutti i soggetti che compongono la popolazione gli eventi al numeratore fanno parte di quelli al denominatore, e dunque sono compresi in esso (rapporto di derivazione) Mortalità = N° morti / N° abitanti RAPPORTI, PROPORZIONI, TASSI TASSO è una derivazione della proporzione che tiene conto delle variazioni nel tempo è utilizzato nella letteratura medica per misurare la frequenza di accadimento di morte o malattia durante uno specificato intervallo di tempo INCIDENZA: nuovi casi di malattia PREVALENZA DI PERIODO: casi presenti di malattia in uno specifico punto del tempo PREVALENZA PUNTUALE: casi presenti di malattia (in realtà è una proporzione, idealmente) il denominatore rappresenta la popolazione media a rischio durante l‟ intervallo considerato quando l‟ evento può essere osservato solo una volta durante lo studio, si può dire che il tasso approssima la PROBABILITA‟ di accadimento dell‟ evento (il rischio) Proporzione di incidenza t0 t1 A B C D E F G H I L INCIDENZA (cambiamenti di stato)= n° nuovi casi tra t 0 e t1 = tutti i suscettibili (F,G,H,I) 4 = (A,B,D,F,G,H,I,L) 8 t0 Tempo di incidenza A B C D E F G H INCIDENZA = cambiamenti di stato t0 -> inizio osservazione (nascita, insorgenza, inizio studio) Tasso di incidenza (incidence rate) t0 A B C D E F G H n° cambiamenti di stato Densità di incidenza = A B G C D E A F C F H D Somma di tutti i tempi di osservazione (tempo/persona) Tasso di incidenza (incidence rate) t0 A B C D E F G H n° cambiamenti di stato Densità di incidenza = A B G C D E A F C F H D Somma di tutti i tempi di osservazione (tempo/persona) Incidence Rate o Densità di incidenza: interpretazione 100 casi/anno-persona = 10‟000 casi/secolo-persona = 8.33 casi/mese-persona = 1.92 casi/settimana-persona = 0.27 casi/giorno-persona Incidenza, Prevalenza, Sopravvivenza Morbosità incidente Morbosità prevalente Mortalità Prevalenza = Incidenza - Mortalità Evoluzione della mortalità Percentuale di sopravviventi 1 0.9 0.8 0.7 Edmund Halley, 1693 0.6 Roman Empire 0.5 Breslau 1687-91 0.4 Michigan 1998 0.3 0.2 Bruce Frier's Landlords and Tenants in Imperial Rome, 1980 0.1 0 0 20 40 60 Età 80 100 Sopravvivenza relativa per alcuni tumori ginecologici (Registri tumori italiani 1990-94) >74 anni 100 100 90 90 80 80 70 Mammella (ICD-IX 174-175) 60 Corpo utero (ICD-IX 182) 50 Vagina & Vulva (ICD-IX 184) 40 Cervice uterina (ICD-IX 180) 30 Ovaio (ICD-IX 183) 70 % sopravvivenza % sopravvivenza 65-74 anni 60 50 40 30 20 20 10 10 0 0 0 1 2 3 Anni 4 5 0 1 2 3 4 Anni Dati tratti da: Epidemiologia e Prevenzione, 2001: 25(3) suppl. 5 Tassi grezzi e tassi specifici TASSO GREZZO un singolo numero calcolato come misura sintetica per una intera popolazione non considera le differenze dovute all‟ età, al sesso, alla etnia, e ad altre caratteristiche E P TASSI SPECIFICI Tassi calcolati per gruppi di popolazione relativamente piccoli, ben definiti E1 E E1 P P1 = Tasso grezzo E3 P3 P1 E2 P2 E3 E2 P3 P2 = Tassi specifici Confronti tra i tassi Comparisons of Rates Crude Rates Advantage Disadvantage Actual summary rates Since populations vary in composition (most notably, age) differences in crude rates are Readily calculable for comparison Specific Rates difficult to interpret Homogeneous groups Difficult to compare many subgroups of two Detailed rates are useful for epidemiological and or more populations public health purposes Adjusted Rates Summary statements Fictional rates Differences in the composition of groups is Absolute magnitude depends on standard "removed" allowing unbiased comparison population chosen Opposing trends in subgroups are masked Ma cosa sono i Tassi Standardizzati? from http://www.bioanth.org/ANTH147/EPI.HTM La tabella di contingenza 2x2 Binomiale: 2 modalità Se rappresentiamo esposizione e malattia come caratteri binomiali in una tabella a doppia entrata, otteniamo una tabella di contingenza detta “Tabella 2x2”: Malati Non malati Binomiale: 2 modalità Esposti Non esposti La tabella 2 x 2 Se consideriamo un campione di 100 soggetti : Malati Esposti Non esposti 16 4 20 Non esposti malati / non esposti = Rischio assoluto per i non esposti Non malati 34 50 46 80 50 100 Esposti malati / Esposti = Rischio assoluto per gli esposti 16/50 = 0.32 4/50 = 0.08 Proporzioni campo esistenza: 0-1 Il Rischio relativo (RR) Rischio Assoluto per gli esposti 0-1 Rischio Assoluto per i non esposti =0- 0 0 0-1 Rischio Relativo 0.32/0.08 = 4 Rapporto campo esistenza: 0- Fattore protettivo 0 0 1 0 Fattore di rischio Incidence Proportion Exposed _____________________ Incidence Proportion Unexposed Incidence Rate Exposed _____________________ Incidence Rate Unexposed Risk Ratio Rate Ratio (RR) Relative Risk Prevalence Ratio Prevalence Proportion Exposed _____________________ Prevalence Proportion Unexposed Definizioni tratte da Norell SE, Workbook of Epidemiology, Oxford Univ. Press, 1995 La tabella 2 x 2 Ma possiamo anche considerare gli ODDs, rapporti tra eventi tra loro esclusivi: Malati Esposti Non esposti 16 4 20 Malati esposti / Malati non esposti = Odds per i malati Non malati 34 50 46 80 50 100 Non malati esposti / Non malati non esposti = Odds per i non malati 34/46 = 0.74 16/4 = 4 Rapporti campo esistenza: 0- L‟ Odds Ratio (OR) Odds Ratio 0- 0- Odds per i non malati =04/0.74 = 5.4 0 0 Odds per i malati Rapporto campo esistenza: 0- Fattore protettivo 0 0 1 0 Fattore di rischio Qualcos‟altro su OR Gli OR tendono ad essere asimmetrici Gli esposti hanno 5.4 volte (4/0.74) il rischio dei non esposti I non esposti hanno 0.18 volte (0.74/4) il rischio degli esposti Qulache volta, conviene utilizzare il log odds ratio invece dell‟odds ratio. 0 5 10 Odds Ratio 15 20 -4 -2 0 Log Odds Ratio 2 4 Il log OR che confronta esposti e non esposti è log(1.44) = 1.68 Il log OR che confronta non esposti ed esposti è log(0.69) = -1.68 log OR > 0: Rischio aumentato (fattore di rischio) log OR = 0: Nessuna differenza di rischio log OR < 0: Rischio ridotto (fattore protettivo) Intervallo di confidenza Definizione frequentista Un intervallo tale da essere sicuro (confidente) al 95% (o al 90%, o al 99%) che esso includa il valore del parametro. Ovvero: Sulla base delle osservazioni campionarie definisco un intervallo (CLInf, CLSup) tale che, se: il valore del parametro fosse minore di CLInf io estraessi dalla popolazione un grande numero di campioni della stessa numerosità • non più del 2.5% delle stime campionarie sarebbe uguale o maggiore del valore effettivamente osservato” Analogamente, se il valore del parametro fosse maggiore di CLSup, non più del 2.5% delle stime campionarie sarebbe uguale o minore del valore effettivamente osservato Intervallo di confidenza al 95% (o al 90%, o al 99%) Gli intervalli di confidenza Stima “intervallare” Un intervallo di valori entro i quali si ritiene sia compreso il parametro in esame () con un certo grado di “confidenza” L‟ intervallo di confidenza al 95% NON esprime una probabilità del 95% che sia compresa nel range perché ha un suo valore, che già esiste piuttosto possiamo affermare che, ripetendo gli esperimenti, degli n intervalli calcolati, il 95% comprenderà effettivamente Come interpretare gli Intervalli di Confidenza N=20 N=5 N=100 Il Rischio differenziale (RD) Risk Difference Rischio Assoluto per gli esposti (0 ÷ 1) - (0 ÷ 1) (excess risk) = -1 ÷ +1 Rischio Assoluto per i non esposti -1 Fattore protettivo 0 Numero puro campo esistenza: -1 ÷ +1 Fattore di rischio +1 Il Rischio attribuibile (AR) Rischio Assoluto per gli esposti Rischio Assoluto per i non esposti (0 ÷ 1) - (0 ÷ 1) Rischio attribuibile per gli esposti = - ÷ + 1 (0 ÷ 1) Rapporto Rischio Assoluto per gli esposti - Fattore protettivo 0 campo esistenza: -÷+1 Fattore di rischio +1 Hazard Ratios (HR) L‟Hazard Ratio (HR) è una quantità interpretabile come una forma di Rischio Relativo (RR) Assunto di base: “Proportional hazards” Hazard è la probabilità (rischio) che si verifichi l‟evento in un soggetto che è in osservazione al momento in cui inizia uno specifico intervallo di osservazione Proporzionale Il rischio non dipende dal tempo vale a dire “la variazione nel rischio è costante nel tempo” • ma che vuol dire? Hazard Ratios (HR) Un esempio ipotetico: Assumiamo che l‟Hazard Ratio (HR) sia 2. I soggetti esposti al trattamento standard (STD) hanno un rischio di decesso doppio rispetto ai soggetti esposti al nuovo trattamento (NEW), in ogni momento dello studio. Hazard function= P(morire al tempo t | essendo vivi prima del tempo t) La Tavola di sopravvivenza 00-01 01-05 05-10 10-15 15-20 20-25 25-30 30-35 35-40 40-45 45-50 50-55 55-60 60-65 65-70 70-75 75-80 80-85 85+ Probabilità di morire nqx 0.00858 0.00189 0.00116 0.00159 0.00473 0.00682 0.00660 0.00738 0.01005 0.01520 0.02254 0.03171 0.04880 0.07920 0.12452 0.18625 0.26855 0.39752 1.00000 Hazard function 1 Probabilità di Morire (Hazard) Classe di Età 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 20 40 60 Età 80 100 La Tavola di sopravvivenza Life Table, Michigan 1998, Males Probabilità di sopravvivere oltre l'età t 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 20 40 60 Age 80 100 Curva di sopravvivenza S(x) 1.0000 0.9914 0.9895 0.9884 0.9868 0.9822 0.9755 0.9690 0.9619 0.9522 0.9378 0.9166 0.8876 0.8442 0.7774 0.6806 0.5538 0.4051 0.2441 La curva di Kaplan-Meier Evento Sopravv. (mesi) 0 0 1 2 2 3 3 6 4 7 5 10 6 15 7 16 Kaplan-Meier survival estimate 1.00 0.75 lt q 1-q S(t+n) 12 11 10 8 7 6 4 3 0.0000 0.0833 0.0909 0.2000 0.1250 0.1429 0.3333 0.2500 1.0000 0.9167 0.9091 0.8000 0.8750 0.8571 0.6667 0.7500 1.0000 0.9167 0.8333 0.6667 0.5833 0.5000 0.3333 0.2500 0.50 0.25 0.00 0 10 analysis time 20 30 Il modello del Proportional Hazard di Cox L‟Hazard al tempo t, qt, è la probabilità che si verifichi l‟evento al tempo t, condizionato al fatto che il soggetto è sopravvissuto fino a t Il Proportional Hazard al tempo t è la probabilità che si verifichi l‟evento al tempo t, condizionato al fatto che il soggetto è sopravvissuto fino a t e per uno specifico valore di una variabile esplicativa, x h(t|x) = c(t) * f(x) Hazard Ratios Hazard Ratio = assume che questo rapporto sia costante nel tempo. 0.8 E cioè? 0.4 0.6 Std Therapy New Drug 0.2 hazard function di STD hazard function di NEW 0.0 Si Hazard Function 0 10 20 30 Time 40 Hazard Ratios Hazard Ratio = hazard function di STD hazard function di NEW Si assume che questo rapporto sia costante nel tempo. 0.8 Vale a dire che... 0.4 0.6 Std Therapy New Drug 0.2 HR = 2 0.0 Hazard Function 0 10 20 30 Time 40 Hazard Ratios Hazard Ratio = hazard function di STD hazard function di NEW assume che questo rapporto sia costante nel tempo 0.8 Si Std Therapy New Drug 0.6 HR = 2 0.4 0.2 HR = 2 0.0 Hazard Function 0 10 20 30 Time 40 Interpretation Again 0.8 Quindi: per ogni specifico punto nel tempo, i soggetti esposti alla terapia standard hanno un rischio doppio rispetto agli esposti al farmaco nuovo. Std Therapy New Drug 0.6 HR = 2 0.4 0.2 HR = 2 0.0 Hazard Function 0 10 20 30 Time 40 Ma non sempre le hazard functions sono costanti... E se l‟assunto di base è violato, l‟applicazione dei modelli di regressione di Cox non è opportuna