Cd LM LM-67 - Scienze e Tecniche delle attività
motorie preventive e adattate
C.I. Epidemiologia e valutazione degli stili
di vita sulla salute
Modulo: Metodologia Epidemiologica
Prof. Giovanni Capelli
(Cattedra di Igiene Università di Cassino [email protected])
C.I. Epidemiologia e valutazione degli
stili di vita sulla salute (8 CFU)
Docenti: Prof. Giovanni CAPELLI, Prof. Nicola PORRO





„Stile di vita‟ e „Stili di vita‟: cultura del corpo e della
salute, rappresentazioni sociali ed età della vita.
Dalla misura della quantità di vita alla misura della qualità
di vita: principi, strumenti e applicazioni; approcci
standardizzati e non standardizzati.
Modelli e metodi per lo studio e la valutazione di relazioni
causa-effetto e del ruolo delle variabili fisiche, biologiche,
psicologiche e sociali.
Studi epidemiologici, indagini socio- demografiche e
indagini demoscopiche: metodi, strumenti e applicazioni.
Lettura
e
comprensione
di
articoli
scientifici,
interpretazione di indici epidemiologici e sociodemografici.
Cd LM LM-67 - Scienze e Tecniche delle attività motorie
preventive e adattate
Cause ed effetti
Nesso di Causalità

E‟ ciò che mette in relazione le cause con gli
effetti che esse producono

La gran parte dell‟epidemiologia consiste nello
studio dei nessi di causalità
o

E‟ importante ricordare che le “prove”
epidemiologiche non sono sufficienti a
stabilire un nesso di casualità, ma
costituiscono solo elementi circostanziali
Esistono diverse tipologie di cause
Last JM, A Dictionary of Epidemiology, 3rd Ed, Oxford Univ Press,
1995 (Causality)
Definizione di Causa
•
Possiamo definire la causa di uno specifico evento di
malattia come:
 un evento, condizione o caratteristica che ha
preceduto l‟evento di malattia,
 e senza il quale la malattia non si sarebbe per nulla
verificata o si sarebbe verificata in un tempo
successivo
•
In effetti, nessun evento, condizione o caratteristica
specifiche sono sufficienti di per sé a produrre
l‟effetto
 questa definizione non si riferisce al complesso del
meccanismo causale, ma soltanto ad un suo componente
Rothman K, Greenland S, Causation and Causal Inference,
In: Rothman K, Greenland S “Modern Epidemiology”, Lippincott-Raven, 1998
Filosofia della valutazione di causalità

Teorie probabilistiche della causalità

Una causa è un fattore statisticamente rilevante

X causa Y se e solo se:
o
o
o
X precede temporalmente Y
X è correlato, positivamente o negativamente,
con Y
non esiste un fattore Z precedente a X tale da
eliminare la relazione tra X e Y
 la correlazione tra X e Y non è “spuria”
Filosofia della valutazione di causalità

Teorie probabilistiche della causalità

Il problema principale di queste teorie è il
soddisfacimento della terza condizione (che
l‟associazione non sia “spuria”)
o

che implica identificazione ed eliminazione
dei fattori “disturbanti” (confounding
factors)
Che X sia causa di Y secondo la definizione
probabilistica può dipendere, dunque
o
o
da quali fattori sono presi in considerazione
e quindi X resta una causa a meno di altri
fattori, a noi sconosciuti, potenzialmente
rilevanti
Il potenziale agente
causale (o fattore di
rischio) viene a
contatto con l’ospite
Risultato della
interazione tra agente
causale (o fattore di
rischio) e ospite
Il potenziale agente
causale (o fattore
di rischio) viene a
contatto con
l’ospite
Risultato della
interazione tra
agente causale (o
fattore di rischio) e
ospite
Il ruolo delle variabili indagate

Un momento chiave nella analisi dei dati è la
formulazione di una IPOTESI ESPLICATIVA


un modello concettuale dei possibili legami tra
le entità o i fenomeni misurati
Questo richiede la definizione di:
Una (o più) variabili di risultato
o Effetto (outcome), variabili dipendenti
 Le possibili variabili “causali”
o Esposizioni, variabili indipendenti (esplicative)
 Le possibili variabili “di confondimento”

In cosa consiste l‟approccio agli esiti?
R.L. Kane, Approaching the outcomes question,
in R.L. Kane, Understanding Health Outcome Research, Aspen Publ, 1997

Il modello di base per analizzare gli esiti degli interventi
sanitari può essere sintetizzato come segue:
= f(stato di base, caratteristiche cliniche,
caratteristiche demografiche e psicosociali, trattamento,
ambito di assistenza)
 ESITO
 Questa
formula indica che gli esiti clinici sono il risultato
di svariati fattori, classificabili come:


fattori di rischio (stato di base, stato clinico, caratteristiche
demografiche e psicosociali)
caratteristiche del trattamento (trattamento e ambito di
assistenza)
 L‟obiettivo
dell‟analisi è isolare la relazione tra l‟esito di
interesse e il trattamento prestato “controllando”
l‟effetto di altre variabili rilevanti (correzione del rischio)
Il modello concettuale (1)
R.L. Kane, Approaching the outcomes question,
in R.L. Kane, Understanding Health Outcome Research, Aspen Publ, 1997

Momento chiave nella realizzazione di uno studio sugli esiti è la
definizione di un modello concettuale
 in sostanza, il modello concettuale mostra ciò che riteniamo causi
gli effetti


identifica quali variabili, scelte per rappresentare i vari componenti
della funzione matematica sopra espressa, siano pertinenti allo
studio in oggetto
e specifica tali variabili e la loro relazione con l‟effetto che ci
interessa e tra di loro
 un modo di dire familiare nella “outcomes research” è “quello che
non misuri non esiste”
• è perciò necessario essere capaci di ridurre situazioni
complesse a rappresentazioni MISURABILI, per poterle
studiare
• MA: la misura comporta inevitabilmente distorsione, è per
sua natura processo di astrazione, e qualcosa va comunque
perso nel processo
 ovviamente, però, non tutto ciò che può essere misurato è
parimenti utile...
Il modello concettuale (2)
R.L. Kane, Approaching the outcomes question,
in R.L. Kane, Understanding Health Outcome Research, Aspen Publ, 1997

Modello concettuale non è sempre sinonimo di
modello teorico
 in
epidemiologia valutativa, non è strettamente necessario
che vi sia il supporto di una solida teoria “fisiopatologica”

Piuttosto, serve ad indicare chiaramente quale
processo il ricercatore ritiene sia alla base del
fenomeno
o
almeno quali elementi vanno controllati nella analisi


simili modelli possono essere basati sulla esperienza “clinica” o
sulla revisione bibliografica delle esperienze precedenti
E il lavoro “a tavolino” sul modello permette di
ragionare sull‟importanza relativa dei fattori presi in
considerazione
Il modello concettuale (3)
R.L. Kane, Approaching the outcomes question,
in R.L. Kane, Understanding Health Outcome Research, Aspen Publ, 1997

Fattori clinici






Gittata cardiaca
Gravità
Durata
Eziologia
Comorbosità
Stato precedente
• Fattori del paziente
– Età
– Sesso
– Professione
• Trattamento
– Terapie specifiche
– Dieta
– Esercizio
– Gestione del caso
• Effetti
– Gittata cardiaca
– Sintomi
– Funzione
– Complicazioni
– Qualità di Vita
– Rientro/perdita del lavoro
Trattamento ed esiti nello scompenso cardiaco congestizio
Attenzione, dunque:



Una solida ipotesi di
partenza è sempre
necessaria
I dati vanno letti
criticamente, per non
“estorcere” risultati
conformi solo ai propri
preconcetti
I metodi epidemiologicostatistici non producono
risultati “assoluti”, ma
verità RELATIVE
 che
quantificano
l‟incertezza legata alle
affermazioni fatte
Esiti (Endpoints)

HARD


Sopravvivenza / Recidiva / Tossicità
o Tempo (survival time, disease free time)
o Frequenza
SOFT

 Tasso di incidenza (Rate)
 Rischio Relativo
Misure dello stato di salute positiva
o “Oggettive”
 Karnowsky, ECOG
o
“Soggettive”
 Percezione individuale di dimensioni della Qualità di Vita
• Questionari SF-36, EORTC
Variabili “hard” e “soft”


Le variabili che è facile rilevare in modo riproducibile sono dette
“dure” o “robuste” (inglese hard)
 Tipiche variabili dure sono l‟età e lo stato in vita (con i valori
deceduto o vivo)
Le variabili difficili da rilevare in modo riproducibile sono dette
“molli” o“fragili” (inglese soft)
 tipiche variabili molli, che sono poco riproducibili o
richiedono il ricorso a particolari accorgimenti per essere
rilevate in modo riproducibile, sono il giudizio di
modificazione complessiva o di gravità complessiva dello
stato clinico,


ad esempio il primo con i valori “molto migliorato; migliorato;
stazionario; peggiorato; molto peggiorato” o il secondo con i
valori “molto grave; grave; medio; discreto; lieve”.
Poco riproducibili sono anche molte diagnosi e, nonostante
quello che comunemente si crede, la presenza/assenza di
molti sintomi e segni clinici, tra cui ad esempio il segno di
Babinski

(Tomasello et al., 1982)
Esiti (Endpoints)

HARD


Sopravvivenza / Recidiva / Tossicità
o Tempo (survival time, disease free time)
o Frequenza
SOFT

 Tasso di incidenza (Rate)
 Rischio Relativo
Misure dello stato di salute positiva
o “Oggettive”
 Karnowsky, ECOG
o
“Soggettive”
 Percezione individuale di dimensioni della Qualità di Vita
• Questionari SF-36, EORTC
Endpoints: primari e secondari


In ogni ricerca clinica vanno definiti obiettivi chiari
espliciti e misurabili
 Con il termine di end-point si fa riferimento, appunto, alle
misure utilizzate per la valutazione del conseguimento
degli obiettivi
End-point primario
 L‟esito principale oggetto di studio
o

es. ridurre la mortalità -> Tasso di mortalità
End-point secondari
 Altri esiti di interesse clinico
o
o
Frequenza e qualità effetti collaterali
Qualità di vita (QoL, HRQoL)
Gli endpoint “surrogati”
Razionale


Alcune delle patologie oggetto di indagine potrebbero avere
antecedenti misurabili
 decesso per cancro
o recidiva o metastasi
 morte per aritmia ventricolare post-infarto
o episodi di aritmia ventricolare non fatali
 morte neonatale
o prematurità
Il numero di ESITI effettivamente osservati condiziona la
potenza di uno studio
 gli antecedenti sono + frequenti dell‟end-point finale
o studiare gli antecedenti migliora la potenza statistica
 -> scelta di ENDPOINT SURROGATI
Gli endpoint “surrogati”
Problemi

Questo aumento di potenza statistica è molto gradito
 purché l‟analisi della frequenza dell‟end-point surrogato
corrisponda effettivamente a quella che sarebbe stata la
frequenza dell‟end-point vero in uno studio più ampio in
grado di misurarlo
o è necessario dunque fare molta attenzione nella scelta
di end-point surrogati
 in parecchi casi, ci si è resi conto che condizioni antecedenti
che sembravano avere un legame biologicamente plausibile in
teoria non si rivelavano buoni predittori nella pratica
•
Addirittura, alcuni farmaci capaci di ridurre la
frequenza di una forma di aritmia cardiaca , la
depolarizzazione ventricolare prematura, si sono rivelati
aumentare la mortalità per aritmia cardiaca
Le misure del rischio
in epidemiologia
Cosa è il Rischio ?



E‟ la probabilità che si verifichi un
evento negativo per la salute
Come ogni evento a cui vengono
applicate le leggi di probabilità,
l‟effetto è un evento binario, che si
verifica oppure no
Affermare che esiste un rischio del 5%,
significa affermare che ci attende che
5 esposizioni su 100 portino all‟ effetto
e 95 no
Situazione a rischio Probabilità
Danno
Ambiente
Ospite
Fattore
di rischio
Fattore
di rischio

Non danno
La misura del rischio è strettamente
legata al concetto di probabilità
 perchè


il rischio riguarda avvenimenti futuri
che possono verificarsi o meno
che possono svolgersi con diversa intensità
Condizioni che anticipano l‟insorgenza di una
malattia o ne rendono più grave il decorso
Esiste una correlazione causale fra queste
condizioni e la malattia?
SI
Sono
potenzialmente
controllabili?
Agenti fisici,
chimici, biologici
FATTORI
DI RISCHIO
NO
Età,
sesso, etnia
MARKERS
DI RISCHIO
Come aiutare a percepire le
misure di probabilità e rischio ?

Calman e Royston (BMJ, 1997), hanno
portato un contributo interessante al
problema
della
comunicazione
e
comprensibilità delle misure di rischio
 spesso
è difficile proporre, stime di probabilità
o di aumento relativo di probabilità non solo ai
pazienti, ma anche agli operatori sanitari

ed hanno proposto di fare riferimento
 a scale logaritmiche (come quella Richter per i
terremoti)
 a riferimenti in termini di distanza chilometrica
 a riferimenti qualitativi verbali
 a riferimenti delle dimensioni di comunità crescenti
Community cluster classification
da Calman KC, Royston G, Personal paper: Risk
language and dialects, BMJ, 1997, 315: 939,-942
Grouping
Approximate size
Individual
Family
Street
Village
Small town
Large town
City
Province or country
Large country
Continent
World
1
10
100
1000
10000
100000
1000000
10000000
100000000
1000000000
10000000000
Logarithm of size
0
1
2
3
4
5
6
7
8
9
10
La percezione del rischio

La percezione del rischio da parte del pubblico si
presenta spesso diversa dalle misure obiettive
proposte dagli esperti e si basa prevalentemente su
caratteristiche qualitative più che quantitative
 familiarità,
controllo, potenziale catastrofico, pericolo per
le generazioni future


Situazioni
potenzialmente
pericolose
ritenute
“volontarie” sono anche comunemente considerate
“controllabili”
Situazioni i cui effetti negativi sono ritardati tendono
ad essere identificate come situazioni a rischio poco
conosciuto
 Slovic P, Perception of Risk, Science, 236: 280-285, 1987

Stima di probabilità

Rischio assoluto, Proporzione di incidenza, Tasso di attacco, Tasso
di incidenza, Proporzione di prevalenza


Rischio Relativo (RR), Odds Ratio (OR)

stima dell‟ incremento relativo di rischio di una popolazione
rispetto ad una popolazione di riferimento
Aumento assoluto di probabilità

Rischio differenziale (RD)


stima del rischio riferita ad un singolo gruppo di soggetti
(popolazione)
Aumento relativo di probabilità


Misura del rischio
stima della differenza assoluta di rischio tra una popolazione
ed una popolazione di riferimento
Aumento di probabilità imputabile all‟ esposizione

Rischio attribuibile (AR)

stima della proporzione di casi che non si sarebbero verificati
in assenza di effetto della esposizione, nel gruppo degli
esposti o nella popolazione
Misure di Frequenza

PREVALENZA
 “Casi



presenti” -->> stati
Proporzione di prevalenza puntuale
Proporzione di prevalenza periodale
INCIDENZA
 “Nuovi


Casi” -->> cambiamenti di stato
Tempo di incidenza
Tasso di incidenza (Incidence rate-
Densità di incidenza)
 tempo-persona
• va distinto dal tempo “di calendario” perché è la somma di
tempi contemporanei di persone diverse, mentre il tempo di
calendario è consecutivo

Proporzione di incidenza
 suscettibili nel periodo
Proporzione di prevalenza
t0
A
B
C
D
E
F
G
H
I
L
PREVALENZA PUNTUALE (stati presenti)=
n° casi in t 0
tutta la popolazione
(C,E)
2
=
=
(A,B,C,D,E,F,G,H,I,L) 10
Proporzione di Prevalenza
t0
A
B
C
D
E
F
G
H
I
L
PREVALENZA PUNTUALE (stati presenti)=
n° casi in t0
tutta la popolazione
(C,E)
2
=
=
(A,B,C,D,E,F,G,H,I,L) 10
Proporzione di prevalenza
t0
(“Tasso di prevalenza”)
t1
A
B
C
D
E
F
G
H
I
L
PREVALENZA PERIODALE (stati presenti)=
n° casi tra t 0 e t 1
tutta la popolazione
(C,E,F,G,H,I)
6
=
=
(A,B,C,D,E,F,G,H,I,L) 10
RAPPORTI, PROPORZIONI, TASSI

PROPORZIONE
 esprime
il numero di soggetti che presentano una
particolare caratteristica come percentuale di tutti i
soggetti che compongono la popolazione
 gli eventi al numeratore fanno parte di quelli al
denominatore, e dunque sono compresi in esso (rapporto
di derivazione)

Mortalità = N° morti / N° abitanti
RAPPORTI, PROPORZIONI, TASSI

TASSO
è
una derivazione della proporzione che tiene conto
delle variazioni nel tempo
 è utilizzato nella letteratura medica per misurare la
frequenza di accadimento di morte o malattia

durante uno specificato intervallo di tempo
 INCIDENZA: nuovi casi di malattia
 PREVALENZA DI PERIODO: casi presenti di malattia

in uno specifico punto del tempo
 PREVALENZA PUNTUALE: casi presenti di malattia (in realtà è una
proporzione, idealmente)
 il
denominatore rappresenta la popolazione media a
rischio durante l‟ intervallo considerato
 quando l‟ evento può essere osservato solo una volta
durante lo studio, si può dire che il tasso approssima la
PROBABILITA‟ di accadimento dell‟ evento (il rischio)
Proporzione di incidenza
t0
t1
A
B
C
D
E
F
G
H
I
L
INCIDENZA (cambiamenti di stato)=
n° nuovi casi tra t 0 e t1
=
tutti i suscettibili
(F,G,H,I)
4
=
(A,B,D,F,G,H,I,L)
8
t0
Tempo di incidenza
A
B
C
D
E
F
G
H
INCIDENZA = cambiamenti di stato
t0 -> inizio osservazione (nascita,
insorgenza, inizio studio)
Tasso di incidenza (incidence rate)
t0
A
B
C
D
E
F
G
H
n° cambiamenti di stato
Densità di
incidenza =
A
B
G
C
D
E
A
F
C
F
H
D
Somma di tutti i tempi di
osservazione (tempo/persona)
Tasso di incidenza (incidence rate)
t0
A
B
C
D
E
F
G
H
n° cambiamenti di stato
Densità di
incidenza =
A
B
G
C
D
E
A
F
C
F
H
D
Somma di tutti i tempi di
osservazione (tempo/persona)
Incidence Rate o Densità di
incidenza: interpretazione
100 casi/anno-persona
=
10‟000 casi/secolo-persona
=
8.33 casi/mese-persona
=
1.92 casi/settimana-persona
=
0.27 casi/giorno-persona
Incidenza, Prevalenza, Sopravvivenza
Morbosità
incidente
Morbosità
prevalente
Mortalità
Prevalenza = Incidenza - Mortalità
Evoluzione della mortalità
Percentuale di sopravviventi
1
0.9
0.8
0.7
Edmund Halley, 1693
0.6
Roman Empire
0.5
Breslau 1687-91
0.4
Michigan 1998
0.3
0.2
Bruce Frier's Landlords and Tenants
in Imperial Rome, 1980
0.1
0
0
20
40
60
Età
80
100
Sopravvivenza relativa per alcuni tumori ginecologici
(Registri tumori italiani 1990-94)
>74 anni
100
100
90
90
80
80
70
Mammella (ICD-IX 174-175)
60
Corpo utero (ICD-IX 182)
50
Vagina & Vulva (ICD-IX 184)
40
Cervice uterina (ICD-IX 180)
30
Ovaio (ICD-IX 183)
70
% sopravvivenza
% sopravvivenza
65-74 anni
60
50
40
30
20
20
10
10
0
0
0
1
2
3
Anni
4
5
0
1
2
3
4
Anni
Dati tratti da: Epidemiologia e Prevenzione, 2001: 25(3) suppl.
5
Tassi grezzi e tassi specifici
TASSO GREZZO
un singolo numero calcolato
come misura sintetica per una
intera popolazione
 non considera le differenze
dovute all‟ età, al sesso, alla
etnia, e ad altre caratteristiche

E
P
TASSI SPECIFICI
Tassi
calcolati per gruppi di
popolazione
relativamente
piccoli, ben definiti
E1
E
E1
P
P1
= Tasso grezzo
E3
P3
P1
E2
P2
E3
E2
P3
P2
= Tassi specifici
Confronti tra i tassi
Comparisons of
Rates
Crude Rates
Advantage
Disadvantage
Actual summary rates
Since populations vary in composition (most
notably, age) differences in crude rates are
Readily calculable for comparison
Specific Rates
difficult to interpret
Homogeneous groups
Difficult to compare many subgroups of two
Detailed rates are useful for epidemiological and
or more populations
public health purposes
Adjusted Rates
Summary statements
Fictional rates
Differences in the composition of groups is
Absolute magnitude depends on standard
"removed" allowing unbiased comparison
population chosen
Opposing trends in subgroups are masked
Ma cosa sono i Tassi
Standardizzati?
from http://www.bioanth.org/ANTH147/EPI.HTM
La tabella di contingenza 2x2
Binomiale: 2 modalità
Se rappresentiamo esposizione e
malattia come caratteri binomiali
in una tabella a doppia entrata,
otteniamo
una
tabella
di
contingenza detta “Tabella 2x2”:
Malati
Non
malati
Binomiale: 2 modalità
Esposti
Non
esposti
La tabella 2 x 2

Se consideriamo un campione di 100 soggetti :
Malati
Esposti
Non
esposti
16
4
20
Non esposti malati / non esposti =
Rischio assoluto per i non esposti
Non
malati
34
50
46
80
50
100
Esposti malati / Esposti =
Rischio assoluto per gli esposti
16/50 = 0.32
4/50 = 0.08
Proporzioni
campo esistenza: 0-1
Il Rischio relativo (RR)
Rischio Assoluto
per gli esposti
0-1
Rischio Assoluto
per i non esposti
=0-
0
0
0-1
Rischio
Relativo
0.32/0.08
=
4
Rapporto
campo esistenza: 0-
Fattore protettivo
0
0
1
0
Fattore di rischio
Incidence Proportion Exposed
_____________________
Incidence Proportion Unexposed
Incidence Rate Exposed
_____________________
Incidence Rate Unexposed
Risk Ratio
Rate Ratio
(RR)
Relative Risk
Prevalence
Ratio
Prevalence Proportion Exposed
_____________________
Prevalence Proportion Unexposed
Definizioni tratte da
Norell SE,
Workbook of Epidemiology,
Oxford Univ. Press, 1995
La tabella 2 x 2

Ma possiamo anche considerare gli ODDs, rapporti
tra eventi tra loro esclusivi:
Malati
Esposti
Non
esposti
16
4
20
Malati esposti / Malati non esposti =
Odds per i malati
Non
malati
34
50
46
80
50
100
Non malati esposti / Non malati non esposti =
Odds per i non malati
34/46 = 0.74
16/4 = 4
Rapporti
campo esistenza: 0-
L‟ Odds Ratio (OR)
Odds
Ratio
0-
0-
Odds per i non malati
=04/0.74
=
5.4
0
0
Odds per i malati
Rapporto
campo esistenza: 0-
Fattore protettivo
0
0
1
0
Fattore di rischio
Qualcos‟altro su OR

Gli OR tendono ad essere asimmetrici
Gli esposti hanno 5.4 volte (4/0.74) il rischio dei non esposti
 I non esposti hanno 0.18 volte (0.74/4) il rischio degli esposti


Qulache volta, conviene utilizzare il log odds ratio invece dell‟odds
ratio.
0


5
10
Odds Ratio
15
20
-4
-2
0
Log Odds Ratio
2
4
Il log OR che confronta esposti e non esposti è log(1.44) = 1.68
Il log OR che confronta non esposti ed esposti è log(0.69) = -1.68
log OR > 0: Rischio aumentato (fattore di rischio)
log OR = 0: Nessuna differenza di rischio
log OR < 0: Rischio ridotto (fattore protettivo)
Intervallo di confidenza

Definizione frequentista
 Un
intervallo tale da essere sicuro (confidente) al 95% (o
al 90%, o al 99%) che esso includa il valore del parametro.

Ovvero:
 Sulla
base delle osservazioni campionarie definisco un
intervallo (CLInf, CLSup) tale che, se:

il valore del parametro fosse minore di CLInf
 io estraessi dalla popolazione un grande numero di campioni della
stessa numerosità
• non più del 2.5% delle stime campionarie sarebbe uguale o
maggiore del valore effettivamente osservato”
 Analogamente,
se il valore del parametro fosse maggiore di
CLSup, non più del 2.5% delle stime campionarie sarebbe
uguale o minore del valore effettivamente osservato

Intervallo di confidenza al 95% (o al 90%, o al 99%)
Gli intervalli di confidenza

Stima “intervallare”
Un
intervallo di valori entro i quali si
ritiene sia compreso il parametro in esame
() con un certo grado di “confidenza”

L‟ intervallo di confidenza al 95% NON
esprime una probabilità del 95% che 
sia compresa nel range
 perché  ha un suo valore, che già esiste

piuttosto possiamo affermare che,
ripetendo gli esperimenti, degli n
intervalli calcolati, il 95% comprenderà
effettivamente 
Come interpretare gli
Intervalli di Confidenza
N=20
N=5
N=100
Il Rischio differenziale (RD)
Risk Difference
Rischio Assoluto
per gli esposti
(0 ÷ 1) - (0 ÷ 1)
(excess risk)
= -1 ÷ +1
Rischio Assoluto
per i non esposti
-1
Fattore protettivo
0
Numero puro
campo esistenza:
-1 ÷ +1
Fattore di rischio
+1
Il Rischio attribuibile (AR)
Rischio Assoluto
per gli esposti
Rischio Assoluto
per i non esposti
(0 ÷ 1) - (0 ÷ 1)
Rischio
attribuibile per
gli esposti
= - ÷ + 1
(0 ÷ 1)
Rapporto
Rischio Assoluto
per gli esposti
-  Fattore protettivo 0
campo esistenza:
-÷+1
Fattore di rischio
+1
Hazard Ratios (HR)


L‟Hazard Ratio (HR) è una quantità
interpretabile come una forma di Rischio
Relativo (RR)
Assunto di base: “Proportional hazards”
 Hazard
è la probabilità (rischio) che si verifichi l‟evento in un
soggetto che è in osservazione al momento in cui inizia
uno specifico intervallo di osservazione
 Proporzionale


Il rischio non dipende dal tempo
 vale a dire “la variazione nel rischio è costante nel tempo”
• ma che vuol dire?
Hazard Ratios (HR)

Un esempio ipotetico: Assumiamo che
l‟Hazard Ratio (HR) sia 2.
I
soggetti esposti al trattamento standard
(STD) hanno un rischio di decesso doppio
rispetto ai soggetti esposti al nuovo
trattamento (NEW), in ogni momento dello
studio.

Hazard function= P(morire al tempo t | essendo vivi
prima del tempo t)
La Tavola di sopravvivenza
00-01
01-05
05-10
10-15
15-20
20-25
25-30
30-35
35-40
40-45
45-50
50-55
55-60
60-65
65-70
70-75
75-80
80-85
85+
Probabilità di
morire
nqx
0.00858
0.00189
0.00116
0.00159
0.00473
0.00682
0.00660
0.00738
0.01005
0.01520
0.02254
0.03171
0.04880
0.07920
0.12452
0.18625
0.26855
0.39752
1.00000
Hazard function
1
Probabilità di Morire (Hazard)
Classe di Età
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
20
40
60
Età
80
100
La Tavola di sopravvivenza
Life Table, Michigan 1998, Males
Probabilità di sopravvivere oltre l'età t
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
20
40
60
Age
80
100
Curva di
sopravvivenza
S(x)
1.0000
0.9914
0.9895
0.9884
0.9868
0.9822
0.9755
0.9690
0.9619
0.9522
0.9378
0.9166
0.8876
0.8442
0.7774
0.6806
0.5538
0.4051
0.2441
La curva di Kaplan-Meier
Evento Sopravv.
(mesi)
0
0
1
2
2
3
3
6
4
7
5
10
6
15
7
16
Kaplan-Meier survival estimate
1.00
0.75
lt
q
1-q
S(t+n)
12
11
10
8
7
6
4
3
0.0000
0.0833
0.0909
0.2000
0.1250
0.1429
0.3333
0.2500
1.0000
0.9167
0.9091
0.8000
0.8750
0.8571
0.6667
0.7500
1.0000
0.9167
0.8333
0.6667
0.5833
0.5000
0.3333
0.2500
0.50
0.25
0.00
0
10
analysis time
20
30
Il modello del Proportional Hazard di Cox


L‟Hazard al tempo t, qt, è la
probabilità che si verifichi l‟evento al
tempo t, condizionato al fatto che il
soggetto è sopravvissuto fino a t
Il Proportional Hazard al tempo t è la
probabilità che si verifichi l‟evento al
tempo t, condizionato al fatto che il
soggetto è sopravvissuto fino a t e per
uno specifico valore di una variabile
esplicativa, x
 h(t|x)
= c(t) * f(x)
Hazard Ratios
Hazard Ratio =
assume che questo rapporto sia costante nel tempo.
0.8
E cioè?
0.4
0.6
Std Therapy
New Drug
0.2

hazard function di STD
hazard function di NEW
0.0
 Si
Hazard Function

0
10
20
30
Time
40
Hazard Ratios
Hazard Ratio =
hazard function di STD
hazard function di NEW
 Si
assume che questo rapporto sia costante nel
tempo.
0.8
Vale a dire che...
0.4
0.6
Std Therapy
New Drug
0.2
HR = 2
0.0

Hazard Function

0
10
20
30
Time
40
Hazard Ratios
Hazard Ratio =
hazard function di STD
hazard function di NEW
assume che questo rapporto sia costante nel
tempo
0.8
 Si
Std Therapy
New Drug
0.6
HR = 2
0.4

0.2
HR = 2
0.0
Hazard Function

0
10
20
30
Time
40
Interpretation Again
0.8
Quindi: per ogni specifico punto nel tempo,
i soggetti esposti alla terapia standard
hanno un rischio doppio rispetto agli
esposti al farmaco nuovo.
Std Therapy
New Drug
0.6
HR = 2
0.4

0.2
HR = 2
0.0
Hazard Function

0
10
20
30
Time
40
Ma non sempre le hazard
functions sono costanti...

E se l‟assunto di base è violato,
l‟applicazione dei modelli di regressione
di Cox non è opportuna