Appendice 1
Approfondimento dei metodi statistici
APPROFONDIMENTO DEI METODI STATISTICI
TASSO STANDARDIZZATO PER
OSPEDALIZZAZIONE (TSDH).
ETÀ
DI
MORTALITÀ
(TSDM)
E
DI
Il Tasso Standardizzato (TSD) è calcolato come media pesata dei tassi specifici per
classi di età, ognuna delle quali assume un peso dato dalla struttura per età di una
popolazione di riferimento considerata come standard. Questo metodo permette di
confrontare tassi di popolazioni che hanno strutture per età diverse tra di loro. La
popolazione di riferimento è quella europea fittizia, costante nel tempo e definita
uguale per ciascun genere.
Il TSD si ottiene come:
TSD =
∑ tiNi
∑ Ni
* 10000
dove:
ti è il tasso di mortalità o di ricovero per la i-esima classe di età nella popolazione in
studio;
Ni la numerosità della popolazione standard nella i-esima classe di età.
RAPPORTO DI MORTALITÀ E DI OSPEDALIZZAZIONE STANDARDIZZATI PER
ETÀ (RISPETTIVAMENTE SMR E SHR)
L’SMR e l’SHR si calcolano come rapporto tra casi osservati e casi attesi:
SMR, SHR =
∑ di
∑ Ti *ni
* 100
dove
•
di sono i decessi o i ricoveri osservati per la classe i-esima di età della popolazione in
studio;
•
Ti rappresentano i tassi di mortalità o di ricovero della popolazione di riferimento per
classe di età;
•
∑ Ti * ni sono i decessi o i ricoveri attesi per la classe i-esima di età della popolazione in
studio.
3
I casi attesi sono il numero di casi che ci si attenderebbe se la popolazione in studio
sperimentasse il tasso di mortalità della popolazione di riferimento al netto dell’effetto
attribuibile all’età.
Un valore di SMR vicino a 100 indica che il numero di osservati è simile all’atteso,
mentre un SMR pari a 200 indica un rischio di morte doppio nell’area in studio rispetto
all’area di riferimento.
L’intervallo di confidenza dell’SMR è dato dal metodo approssimato di Byar.
ANALISI E TEST DEGLI ANDAMENTI TEMPORALI (TREND)
Se gli eventi si presentano nel tempo, è utile modellare il tasso usando variabili
esplicative. Questo implica un processo di Poisson non omogeneo.
Di seguito è riportato il procedimento per gli SMR che vale anche per gli SHR.
L’SMR è per definizione pari a
d
e
dove d sono i casi osservati ed e sono i casi attesi.
Essendo l’SMR un indicatore non negativo, allora deve necessariamente essere
modellato usando modelli lineari nel logaritmo, cioè:
d
log i = α + βx ⇒ logd = loge + α + βx
i
i
e
i
•
β è il coefficiente angolare della retta di regressione;
•
x assume valori interi compresi tra 1 (1° periodo) e 3 (3° periodo);
•
log ei è chiamato offset e non è un parametro.
Di seguito è riportato il significato di β:
βx
logSMR(x) = α + βx ⇒ SMR(x) = eα e
e
βx β
log(SMR(x + 1)) = α + βx ⇒ SMR(x + 1) = eα e e
Quindi:
β
log(SMR(x + 1)) = e log(SMR(x))
4
ϑ=
SMR
x +1 = exp(α + β + βx) = exp(β )
SMR x
exp(α + βx)
Un incremento di x di un’unità provoca un incremento del rischio di e
β
con un effetto
che è chiamato in tal caso moltiplicativo. Quindi l’esponenziale di b rappresenta la
statistica test sul trend degli SMR nei tre periodi considerati. L’ipotesi di non presenza
di trend (β = 0) è stata verificata con il test Z.
INDICATORI STATISTICI BAYESIANI
Il BMR è calcolato mediante la somma di due effetti casuali:
α +U + V
BMR = e
i
−
i
i
V[i] ~ N(0, prec.v), componente a priori normale del rischio che tiene conto della
sovradispersione non spaziale nei dati;
−
U[i] ~ car.N (adj[i],.prec.u), componente normale del rischio che tiene conto della
variabilità strutturata spazialmente, la distribuzione a priori car.normal (Conditional
Auto Regression) permette di stimare il rischio in un comune in funzione delle
stime calcolate nei comuni adiacenti: più è alta la correlazione spaziale nella
distribuzione della causa di morte, maggiore sarà il peso dei comuni adiacenti nella
stima del rischio relativo; più i rischi stimati sono basati su pochi casi, più essi si
avvicinano ad una media locale dei rischi fortemente influenzata dalle stime dei
comuni adiacenti.
Il calcolo dei BMR e la ricerca delle informazioni a priori utilizzate (Mollié, 2000),
prevedono complicati calcoli computazionali. Gli intervalli di “credibilità” al 95% (IC
95%) vengono stimati mediante procedure iterative di simulazione di Monte Carlo
(Catene di Markov) e di campionamento di Gibbs (Gelfand et al., 1990) e sono serviti
per valutare l’ampiezza dell’incertezza della stima e la significatività statistica
dell’eccesso o del difetto di rischio.
Il controllo della convergenza del metodo è stato effettuato attraverso una serie di
test statistici (Gelman et al., 1992).
Il
modello
è
stato
implementato
e
compilato
(Spiegelhalter et al., 1999).
5
tramite
il
software
WinBUGS
ANALISI DI TENDENZA ALL’ADDENSAMENTO DEGLI EVENTI (CLUSTERING)
L’analisi è stata effettuata mediante la tecnica Spatial Scan Statistic di Kulldorff
(Kulldorff & Nagarwalla, 1995).
Il metodo utilizzato ipotizza che il numero di casi sia distribuito mediante un modello
poissoniano ed è basato sullo spostamento di una finestra ellittica con assi variabili su
tutto il territorio in studio; la finestra è centrata su ognuna delle possibili coordinate
(xi,yi) rappresentanti il comune. Il metodo identifica gli aggregati comunali con SMR
più elevato e seleziona quelli statisticamente significativi in base alla massimizzazione
del rapporto di verosimiglianza. In dettaglio, per ogni finestra identificata viene
testata l’ipotesi nulla (H0: nessuna differenza tra il numero di casi osservati nel cluster
e quelli attesi) mediante il test del rapporto di verosimiglianza (LRT). Il cluster è
considerato statisticamente significativo quando p<0,05.
ANALISI DI REGRESSIONE DI POISSON PER LO STUDIO DI CORRELAZIONE
TRA INQUINANTI ED EVENTI SANITARI
METODOLOGIA PER IL CALCOLO DEL RAPPORTO TRA SMR
I rapporti tra SMR vengono stimati utilizzando l’analisi di regressione lineare di
Poisson.
L’ipotesi di partenza è che il numero di eventi siano distribuiti secondo una
distribuzione di Poisson.
Partendo dal modello di regressione:
,
dove:
•
i assume valori da 1 a 3 (prima, seconda e terza classe di concentrazione
media dell’indicatore ambientale considerato)
•
Οι è il valore osservato dei morti/ricoverati del gruppo di comuni nell’iesima classe di esposizione,
•
Ai rappresenta il numero morti/ricoverati attesi rispetto al tasso di
riferimento regionale del gruppo di comuni nell’i-esima classe di
esposizione,
•
X2 è una variabile dicotomica che prende valore 1 quando X=2 e 0
quando X≠2,
6
•
X3 è una variabile dicotomica che prende valore 1 quando X=3 e 0
quando X≠3,
si ottiene che il rischio stimato nei diversi profili di esposizione dipende dalla classe di
appartenenza (X=1a classe, 2a classe, 3a classe); il rischio SMRi per il gruppo di
comuni con X pari ad i è dato dalla seguente formula:
.
Per stimare l’SMR nella prima classe (X=1):
.
Per stimare l’SMR nella seconda classe (X=2):
.
Per stimare l’SMR nella terza classe (X=3):
.
, per i=2, 3.
Il modello fornisce il rapporto tra SMR,
METODOLOGIA PER IL CALCOLO DEL TREND
L’andamento del rischio di mortalità/ricoverati al variare dell’indicatore ambientale
(trend) viene stimato utilizzando l’analisi di regressione lineare di Poisson.
L’ipotesi di partenza è che il numero di eventi sia distribuito secondo una distribuzione
di Poisson.
,
Partendo dal modello di regressione
dove:
•
i assume valori da 1 a 3 (prima, seconda e terza classe di concentrazione
media dell’indicatore ambientale considerato)
•
Oi è il valore osservato dei morti/ricoverati del gruppo di comuni nell’iesima classe di esposizione
•
Ai rappresenta il numero morti/ricoverati attesi rispetto al tasso di
riferimento regionale del gruppo di comuni nell’i-esima classe di
esposizione
•
X è una variabile categorica che prende valore 1, 2, 3 a seconda della
classe di appartenenza del comune
si ottiene che l’aumento stimato di rischio all’aumentare unitario della X (1Æ2, 2Æ3) è
dato dalla seguente formula:
7
.
Per stimare l’SMR nella prima classe (X=1):
.
Per stimare l’SMR nella seconda classe (X=2):
.
Per stimare l’SMR nella terza classe (X=3):
La stima del trend è quindi data da
.
.
8