ESERCIZIO 1

annuncio pubblicitario
5. LE TAVOLE DI ELIMINAZIONE
1. La stima del rischio di un evento
Si è visto come, nel caso della mortalità, il rapporto
m = M/P (x1000) esprima il numero medio di eventi ogni 1000
persone/anno, ovvero ogni mille anni di vita vissuti nell’anno di
riferimento. Questo indicatore è tuttavia molto generico, tanto
che a volte occorre depurarlo almeno dell’effetto dovuto alla
struttura per età, calcolando tassi specifici o ricorrendo agli
opportuni metodi di eliminazione, così da svolgere confronti
corretti tra popolazioni. La questione che ne deriva riguarda
allora la scelta della misura più opportuna per descrivere il
fenomeno demografico in esame, la più vicina possibile al rischio
di subire quel determinato evento. Tale misura non può che
essere la probabilità, e quindi il problema si traduce nella sua
stima che generalmente, in demografia, avviene attraverso le
tavole attuariali di sopravvivenza. Le stesse che usano le
società di assicurazione per calcolare il premio, cioè la cifra
mensile o annuale da richiedere all’assicurato, confidando, in
primo luogo, che questi sopravviva un tempo più che sufficiente
per garantire un guadagno alla compagnia e, secondariamente,
che la legge dei grandi numeri renda regolare il succedersi dei
decessi, prevedibili in termini collettivi, ma assolutamente aleatori
per quanto attiene ogni singolo individuo.
Occorre premettere che la tavola di sopravvivenza o di
eliminazione, nella sua accezione più usuale, si riferisce ad un
evento unico, tale da comportare l’esclusione dall’osservazione
del soggetto che lo subisce. La specificazione è comunque
teorica poiché tutti gli eventi, anche quelli ripetibili, come ad
esempio la ricerca di un n-esimo lavoro, possono diventare eventi
unici se opportunamente specificati. Così potrebbero esistere
tavole di eliminazione dallo stato di disoccupazione dopo aver
2
svolto n-1 lavori, ed anche tavole di fecondità per donne che
hanno già avuto n-1 figli, tavole di mortalità differenziale in
cardiochirurgia per pazienti che hanno subito n-1 infarti ecc...
Si distinguono due modalità di raccolta delle informazioni
longitudinali, con cui solitamente vengono prodotte tavole di
eliminazione. La prima consiste nell’isolare un determinato
contingente (indicato come generazione o anche coorte), in cui
tutti i componenti sono accomunati da uno stesso evento origine
(tutti i nati nell’anno 1970, ad esempio), e seguirlo nel tempo
sino all’uscita dall’osservazione di tutti i soggetti, come accade
nelle tavole di mortalità, oppure sino ad un limite convenzionale
di fine osservazione, ad esempio sino al 50-esimo compleanno
nel caso si voglia stimare la probabilità di matrimonio per una
generazione di celibi. Inoltre talvolta è possibile ricostruire, a
partire da un dato istante, la storia passata di una generazione
raccogliendo gli stessi dati che si sarebbero rilevati osservandola
a partire dalla
sua costituzione.
In genere, l’indagine
retrospettiva comporta tuttavia maggiori problemi riguardo
l’affidabilità e la distorsione dei dati che ne risultano. Quando si
raccolgono informazioni attraverso interviste si fa implicitamente
affidamento alla buona memoria degli intervistati e, ovviamente,
si considerano i soli sopravvissuti, i quali rappresentano spesso
un campione selezionato rispetto anche alla base della variabile
d’interesse. Una tavola di nuzialità calcolata sulla base di
interviste ad una generazione di sopravviventi al 50 compleanno
porterà, inevitabilmente, a sovrastimare la probabilità di
matrimonio della generazione iniziale se tra i deceduti, che non
sono inclusi, la probabilità di contrarre matrimonio è inferiore
rispetto ai sopravviventi.
Nella seconda alternativa, la più comune ed anche
teoricamente la più controversa, si ricorre all’esperienza
contemporanea di un insieme di soggetti che non hanno subito
uno stesso evento origine
in passato, ma che sono
contemporaneamente osservati in uno stesso intervallo
temporale. Poiché la teoria delle tavole di sopravvivenza si basa
3
sulla prima situazione, si formulano ipotesi tali da consentire,
quantomeno teoricamente, il passaggio dallo schema per
contemporanei a quello per generazioni.
2. Dati per contemporanei e per generazioni
Attraverso l’osservazione per contemporanei si definiscono
tassi specifici annuali del tipo m( x)  M ( x) / P( x) , dove P(x)
rappresenta la popolazione media, considerata a metà anno
nell’ipotesi di variazione lineare e quindi con riferimento
convenzionale della mezzanotte del 30 giugno. È evidente che
m(x) non indica esattamente una probabilità, perché la stima della
popolazione a rischio non considera coloro che sono deceduti nel
periodo 1 gennaio - 30 giugno. Una migliore stima della
popolazione a rischio potrebbe allora essere definita come:
P (x) = M(x)/2 + P(x) dove, supponendo una distribuzione
uniforme dei decessi annuali, il termine M(x)/2 sottintende i
deceduti nel periodo 1 gennaio - 30 giugno e, sommato a P(x),
consente di ricostruire, in via approssimata, il contingente
iniziale dei soggetti esposti al rischio di morte nella classe di età
x-esima.
q( x )  M ( x ) / P' ( x )
p( x )  1  q( x )  1  M ( x ) / P' ( x )
In queste condizioni le due quantità q(x) e p(x) assumono il
significato di stime, per contemporanei, delle probabilità di morte
e di sopravvivenza relative all’età x nell’anno in esame1. Più
esattamente, q(x) indica la probabilità che un individuo giunto in
vita al compleanno x-esimo muoia prima del compleanno
1
Questo procedimento fu proposto per la prima volta da J. Milne, nel 1815.
4
x+1-esimo, e p(x) è ovviamente la probabilità complementare, di
sopravvivere dal compleanno x sino all’x+1-esimo.
Quando si ammette che tali probabilità, calcolate durante un
certo intervallo temporale, solitamente un anno o un
quinquennio, possano caratterizzare una generazione teorica
seguita dalla nascita sino all’estinzione, si costruisce una tavola di
eliminazione che rispecchia la mortalità congiunturale o del
momento. Questa tavola non si riferisce all’evoluzione di una
generazione reale sottoposta al rischio di morte, ma considera
una generazione teorica in cui sono comprese le esperienze di
generazioni diverse osservate in uno stesso periodo. A priori,
non esistono motivi per considerare non corretta una tavola di
mortalità calcolata con riferimento ad un dato anno di calendario
o comunque per contemporanei, purché ovviamente sia definita e
usata concettualmente come tale. Inoltre, non si può escludere
che la generazione teorica associata alla tavola di mortalità per
contemporanei esista o possa esistere in futuro. Se la mortalità
raggiungesse un limite oltre il quale gli ulteriori guadagni, alle
varie età, fossero praticamente irrilevanti, da quel momento in
poi tutte le generazioni sarebbero caratterizzate dalla stessa
mortalità specifica e circa un secolo dopo si estinguerebbe la
prima generazione contraddistinta dalle probabilità di morte
calcolate per contemporanei nell’anno limite2. Dal punto di vista
formale, infine, non esistono differenze tra tavole per generazioni
2
Si tratta della cosiddetta popolazione stazionaria associata ad ogni tavola
di mortalità. In pratica, se una tavola di mortalità inizialmente composta da
l(0)=100.000 individui riproducesse, ad ogni anno, lo sviluppo di una
popolazione chiusa rispetto ai movimenti migratori ed effettivamente
composta da 100.000 individui alla nascita, da l(1) individui al primo
compleanno, l(2) al secondo... e così via, questa non potrebbe che rimanere
stazionaria, cioè ad incremento nullo. Infatti ogni anno verrebbero alla luce
l(0) nuovi individui e ne morirebbero altrettanti, poiché d(x)=l(0). In altri
termini, si avrebbe: r= n-m= N/P-D/P= l(0)/T(0) - d(x)/T(0) = 0, con
T(0) = L(x) che rappresenta la popolazione media complessiva.
5
e tavole per contemporanei3, cosicché tutte le grandezze tipiche
della prima situazione vengono assimilate alla seconda nei termini
che seguono:
P (x)  l(x) = sopravviventi all’x-esimo compleanno;
P(x)  L(x) = popolazione media o anni mediamente vissuti tra il
compleanno x e il compleanno x+1;
M(x) d(x) = deceduti in età x.
CONTEMPORANEI
GENERAZIONI
GENERAZIONE
TEORICA
età
d(x)/2
P'(x)
P(x)
L(x)
d(x)/2
M(x)/2 M(x)/2
x
l(x)
...
0
t-1
t
ANNO DI
CALENDARIO
t+1
anno
Figura 5.1 Passaggio dallo schema per contemporanei a quello per
generazioni
3
Si può obbiettare che nella tavola per generazioni tutte le grandezze che la
caratterizzano, il numero dei sopravviventi, dei decessi..., sono reali e
possono assumersi così come sono, mentre nella tavola per contemporanei
solo la probabilità di morte è effettiva e le altre grandezze sono costruite in
modo teorico a partire da una popolazione di 10 n individui. Tuttavia anche
per le generazioni le tavole vengono solitamente riproporzionate sulla base
di un contingente iniziale espresso come potenza di dieci e quindi questa
differenza, pur essendo concettualmente valida, dal punto di vista
dell’utilizzo pratico e formale non comporta nessuna conseguenza.
6
In definitiva, quando occorre costruire tavole di mortalità per
contemporanei, si assume che il numero dei decessi M(x),
all’età x, sia uniformemente distribuito nel corso dell’anno
(o della classe pluriennale considerata) e quindi, sommando
M(x)/2 decessi alla popolazione a metà anno P(x), si ricostruisce
la popolazione P (x) inizialmente esposta al rischio di morte.
Queste tre grandezze, M(x), P(x) e P (x), dallo schema per
contemporanei vengono trasportate nello schema per generazioni
(figura 5.1), in cui diventano d(x), L(x), l(x) e dove inoltre - salvo
diversamente specificato - all’interno di ogni segmento di
generazione teorica così ricostruito, vale l’ipotesi di uniforme
distribuzione dei decessi tra un compleanno e il successivo.
La generazione teorica è pertanto quella che si costituisce a
partire dall’anno di riferimento e che, ad ogni età, subisce le
probabilità di morte calcolate per contemporanei nel medesimo
anno. Oltre alle probabilità, anche i tassi specifici m(x) subiscono
un’analoga traslazione e, da m(x) = M(x)/P(x) nello schema per
contemporanei, diventano m(x) = d(x)/L(x) nello schema per
generazioni, pur rimanendo esattamente le stesse quantità.
In queste condizioni, l’uguaglianza:
q( x ) 
2m( x )
2  m( x )
che, come si vedrà, è verificata all’interno della schema per
generazioni, viene estesa anche al tasso specifico calcolato per
contemporanei. Il passaggio contemporanei / generazione può
perciò avvenire in modi formalmente diversi ma del tutto
equivalenti:
a) assumendo che le probabilità di morte calcolate per
contemporanei possano implicitamente caratterizzare la
mortalità di una generazione teorica: q(x)=M(x)/ P (x);
7
b) trasportando le grandezze M(x) e P (x) nello schema per
generazioni, dove diventano d(x) e l(x), e dove ovviamente si
ottiene: q(x) = d(x)/l(x) = M(x)/P (x);
c) inserendo nella formula q(x)=2m(x) / (2+m(x)) i tassi calcolati
per contemporanei, vale a dire m(x)=M(x)/P(x), e ricavando
indirettamente i valori di q(x).
Una volta costruita la serie delle probabilità q(x), riferita a
contemporanei o generazioni, si possono calcolare tutte le altre
grandezze dalla tavola di mortalità con la sola ulteriore
definizione della popolazione iniziale l(0), espressa come 10n.
3. Grandezze caratteristiche
Quando si utilizzano classi di età annuali, le formule più
ricorrenti, nell’ambito delle grandezze considerate dalla tavola di
mortalità, sono:
q( x) 
d ( x)
l ( x)

d(0) = l(0)q(0)
l(1) = l(0)-d(0)
d(1) = l(1)q(1)
l(2) = l(1)-d(1)
...
d(w-1) = l(w-1)q(w-1)
l(w) = 0
q(x) è la probabilità di morte
nell’età x per un individuo ancora
in vita all’x-esimo compleanno.
Data la serie q(x) e il termine
iniziale l(0), le due serie l(x) e d(x)
si ottengono facilmente in modo
ricorsivo;
8
p ( x)  1  q ( x)
d ( x)
l ( x)
l ( x)  l ( x  1)
1
l ( x)
l ( x  1)

l ( x)
1
S ( x)  p(0) p(1)... p( x  1)
x 1
  p(i )
i 0
 l ( x) / l (0)
S ( x  y )  p ( x) p ( x  1)...
... p( y  1)
y 1
  p(i )
i x
 l ( y ) / l ( x)
l ( x)  l ( x  1)
L( x) 
2
4
p(x) è la probabilità di
sopravvivere all’età x, cioè di
arrivare al compleanno x+1 per un
individuo ancora in vita all’x-esimo
compleanno;
S(x) è la probabilità di essere in vita
all’età esatta x per un componente
il contingente iniziale l(0).
In
pratica, non è altro che il rapporto
l(x)/l(0) e può essere intesa come
probabilità, per un solo individuo
(l(0)=100), di sopravvivere dalla
nascita sino all’età x4. Più in
generale, S(x-y) è la probabilità di
rimanere in vita tra il compleanno x
e quello y;
L(x) indica la popolazione media
o gli anni mediamente vissuti
all’età x. Nella definizione data è
implicita l’ipotesi di uniforme
distribuzione dei decessi d(x) tra i
due compleanni successivi, che
equivale
ad
assumere
una
distribuzione
lineare
dei
Se la probabilità di superare in vita l’età x-1 è: 1- q(x-1) = p(x)= l(x)/l(x-1),
nell’ipotesi di indipendenza dei rischi di morte la probabilità di sopravvivere
dalla nascita sino all’età esatta x è:
l (1) l ( 2)
l( x )
l( x )
...

S(x)= p(0)p(1)...p(x-1)=
l ( 0) l (1) l ( x  1) l ( 0)
9
l ( x)  (l ( x)  d ( x))
2
1
 l ( x)  d ( x)
2

sopravviventi
intervallo;
l(x)
nello
stesso
T(x) è la somma degli anni di vita
T ( x)  L( x)  L( x  1)  ... mediamente
vissuti
dai
all’età
x.
In
 L( w  2)  L( w  1) sopravviventi
particolare,
T(0)
indica
w1
l’ammontare
di
vita
media
  L(i )
i x
complessivamente vissuta da tutti
gli l(0) individui inclusi nella
generazione;
T ( x)
e( x ) 
l( x)
(x)
e(x) è il numero di anni che,
mediamente, spettano ancora da
vivere ai sopravviventi5 all’età x .
Di conseguenza, e(0) = T(0)/l(0)
è la vita media alla nascita, cioè la
vita mediamente vissuta da ciascun
componente la generazione. Vale
anche la pena di notare che
1/e(0)= l(0)/T(0) è il tasso di
natalità e di mortalità della
popolazione teorica stazionaria
associata alla tavola di mortalità6;
(x) corrisponde all’intervallo di
tempo che deve ancora trascorrere
affinché i sopravviventi l(x) si
riducano a l(x)/2. È l’età mediana
per x=0 e dell’intervallo mediano
per ogni altra età x,
5
Nonostante il riferimento ai sopravviventi l(x), all’età esatta x, questa
grandezza viene calcolata considerando la popolazione media L(x).
6
Vedi nota 2.
10
Tavola 5.1 Tavola di mortalità della popolazione italiana nel
1970-72 (Maschi)
x
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
l(x)
d(x)
q(x)
p(x)
L(x)
m(x)
T(x)
e(x)
100000
96920
96770
96676
96610
96552
96496
96445
96398
96353
96311
96270
96227
96180
96124
96058
95979
95888
95786
95677
95564
95451
95339
95228
95118
95010
94902
94793
94683
94571
94458
94342
94221
94094
93959
93815
93659
93489
93302
93096
92870
92621
92347
92043
91705
91332
90921
90471
89982
89448
3080
150
94
66
58
56
51
47
45
42
41
43
47
56
66
79
91
102
109
113
113
112
111
110
108
108
109
110
112
113
116
121
127
135
144
156
170
187
206
226
249
274
304
338
373
411
450
489
534
581
0,0308
0,0015
0,0010
0,0007
0,0006
0,0006
0,0005
0,0005
0,0005
0,0004
0,0004
0,0004
0,0005
0,0006
0,0007
0,0008
0,0009
0,0011
0,0011
0,0012
0,0012
0,0012
0,0012
0,0012
0,0011
0,0011
0,0011
0,0012
0,0012
0,0012
0,0012
0,0013
0,0013
0,0014
0,0015
0,0017
0,0018
0,0020
0,0022
0,0024
0,0027
0,0030
0,0033
0,0037
0,0041
0,0045
0,0049
0,0054
0,0059
0,0065
0,9692
0,9985
0,9990
0,9993
0,9994
0,9994
0,9995
0,9995
0,9995
0,9996
0,9996
0,9996
0,9995
0,9994
0,9993
0,9992
0,9991
0,9989
0,9989
0,9988
0,9988
0,9988
0,9988
0,9988
0,9989
0,9989
0,9989
0,9988
0,9988
0,9988
0,9988
0,9987
0,9987
0,9986
0,9985
0,9983
0,9982
0,9980
0,9978
0,9976
0,9973
0,9970
0,9967
0,9963
0,9959
0,9955
0,9951
0,9946
0,9941
0,9935
97536,0
96845,0
96723,0
96643,0
96581,0
96524,0
96470,5
96421,5
96375,5
96332,0
96290,5
96248,5
96203,5
96152,0
96091,0
96018,5
95933,5
95837,0
95731,5
95620,5
95507,5
95395,0
95283,5
95173,0
95064,0
94956,0
94847,5
94738,0
94627,0
94514,5
94400,0
94281,5
94157,5
94026,5
93887,0
93737,0
93574,0
93395,5
93199,0
92983,0
92745,5
92484,0
92195,0
91874,0
91518,5
91126,5
90696,0
90226,5
89715,0
89157,5
0,0316
0,0015
0,0010
0,0007
0,0006
0,0006
0,0005
0,0005
0,0005
0,0004
0,0004
0,0004
0,0005
0,0006
0,0007
0,0008
0,0009
0,0011
0,0011
0,0012
0,0012
0,0012
0,0012
0,0012
0,0011
0,0011
0,0011
0,0012
0,0012
0,0012
0,0012
0,0013
0,0013
0,0014
0,0015
0,0017
0,0018
0,0020
0,0022
0,0024
0,0027
0,0030
0,0033
0,0037
0,0041
0,0045
0,0050
0,0054
0,0060
0,0065
6895723,0
6798187,0
6701342,0
6604619,0
6507976,0
6411395,0
6314871,0
6218400,5
6121979,0
6025603,5
5929271,5
5832981,0
5736732,5
5640529,0
5544377,0
5448286,0
5352267,5
5256334,0
5160497,0
5064765,5
4969145,0
4873637,5
4778242,5
4682959,0
4587786,0
4492722,0
4397766,0
4302918,5
4208180,5
4113553,5
4019039,0
3924639,0
3830357,5
3736200,0
3642173,5
3548286,5
3454549,5
3360975,5
3267580,0
3174381,0
3081398,0
2988652,5
2896168,5
2803973,5
2712099,5
2620581,0
2529454,5
2438758,5
2348532,0
2258817,0
68,96
70,14
69,25
68,32
67,36
66,40
65,44
64,48
63,51
62,54
61,56
60,59
59,62
58,65
57,68
56,72
55,76
54,82
53,88
52,94
52,00
51,06
50,12
49,18
48,23
47,29
46,34
45,39
44,44
43,50
42,55
41,60
40,65
39,71
38,76
37,82
36,88
35,95
35,02
34,10
33,18
32,27
31,36
30,46
29,57
28,69
27,82
26,96
26,10
25,25
11
Segue Tav 5.1
x
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
l(x)
d(x)
q(x)
p(x)
L(x)
m(x)
T(x)
e(x)
88867
88233
87539
86781
85956
85059
84091
83046
81917
80699
79380
77954
76411
74744
72954
71038
69000
66845
64577
62197
59690
57046
54247
51294
48218
45050
41828
38584
35347
32144
28998
25931
22960
20089
17335
14725
12291
10065
8073
6333
4852
3626
2640
1871
1289
863
561
354
216
128
73
41
22
11
6
3
1
634
694
758
825
897
968
1045
1129
1218
1319
1426
1543
1667
1790
1916
2038
2155
2268
2380
2507
2644
2799
2953
3076
3168
3222
3244
3237
3203
3146
3067
2971
2871
2754
2610
2434
2226
1992
1740
1481
1226
986
769
582
426
302
207
138
88
55
32
19
11
5
3
2
1
0,0071
0,0079
0,0087
0,0095
0,0104
0,0114
0,0124
0,0136
0,0149
0,0163
0,0180
0,0198
0,0218
0,0239
0,0263
0,0287
0,0312
0,0339
0,0369
0,0403
0,0443
0,0491
0,0544
0,0600
0,0657
0,0715
0,0776
0,0839
0,0906
0,0979
0,1058
0,1146
0,1250
0,1371
0,1506
0,1653
0,1811
0,1979
0,2155
0,2339
0,2527
0,2719
0,2913
0,3111
0,3305
0,3499
0,3690
0,3898
0,4074
0,4297
0,4384
0,4634
0,5000
0,4545
0,5000
0,6667
1,0000
0,9929
0,9921
0,9913
0,9905
0,9896
0,9886
0,9876
0,9864
0,9851
0,9837
0,9820
0,9802
0,9782
0,9761
0,9737
0,9713
0,9688
0,9661
0,9631
0,9597
0,9557
0,9509
0,9456
0,9400
0,9343
0,9285
0,9224
0,9161
0,9094
0,9021
0,8942
0,8854
0,8750
0,8629
0,8494
0,8347
0,8189
0,8021
0,7845
0,7661
0,7473
0,7281
0,7087
0,6889
0,6695
0,6501
0,6310
0,6102
0,5926
0,5703
0,5616
0,5366
0,5000
0,5455
0,5000
0,3333
0,0000
88550,0
87886,0
87160,0
86368,5
85507,5
84575,0
83568,5
82481,5
81308,0
80039,5
78667,0
77182,5
75577,5
73849,0
71996,0
70019,0
67922,5
65711,0
63387,0
60943,5
58368,0
55646,5
52770,5
49756,0
46634,0
43439,0
40206,0
36965,5
33745,5
30571,0
27464,5
24445,5
21524,5
18712,0
16030,0
13508,0
11178,0
9069,0
7203,0
5592,5
4239,0
3133,0
2255,5
1580,0
1076,0
712,0
457,5
285,0
172,0
100,5
57,0
31,5
16,5
8,5
4,5
2,0
0,5
0,0072
0,0079
0,0087
0,0096
0,0105
0,0114
0,0125
0,0137
0,0150
0,0165
0,0181
0,0200
0,0221
0,0242
0,0266
0,0291
0,0317
0,0345
0,0375
0,0411
0,0453
0,0503
0,0560
0,0618
0,0679
0,0742
0,0807
0,0876
0,0949
0,1029
0,1117
0,1215
0,1334
0,1472
0,1628
0,1802
0,1991
0,2196
0,2416
0,2648
0,2892
0,3147
0,3409
0,3684
0,3959
0,4242
0,4525
0,4842
0,5116
0,5473
0,5614
0,6032
0,6667
0,5882
0,6667
1,0000
---
2169659,5
2081109,5
1993223,5
1906063,5
1819695,0
1734187,5
1649612,5
1566044,0
1483562,5
1402254,5
1322215,0
1243548,0
1166365,5
1090788,0
1016939,0
944943,0
874924,0
807001,5
741290,5
677903,5
616960,0
558592,0
502945,5
450175,0
400419,0
353785,0
310346,0
270140,0
233174,5
199429,0
199429,0
141393,5
116948,0
95423,5
76711,5
60681,5
47173,5
35995,5
26926,5
19723,5
14131,0
9892,0
6759,0
4503,5
2923,5
1847,5
1135,5
678,0
393,0
221,0
120,5
63,5
32,0
15,5
7,0
2,5
0,5
24,41
23,59
22,77
21,96
21,17
20,39
19,62
18,86
18,11
17,38
16,66
15,95
15,26
14,59
13,94
13,30
12,68
12,07
11,48
10,90
10,34
9,79
9,27
8,78
8,30
7,85
7,42
7,00
6,60
6,20
5,82
5,45
5,09
4,75
4,43
4,12
3,84
3,58
3,34
3,11
2,91
2,73
2,56
2,41
2,27
2,14
2,02
1,92
1,82
1,73
1,65
1,55
1,45
1,41
1,17
0,83
0,50
Nota: tutte le variabili sono calcolate come stabilito nelle formule precedenti, nessuna interpolazione è
applicata alle età finali; tassi e probabilità, qui e nel testo, non sono moltiplicati x1000
12
In questa e nella pagina precedente è riassunta la tavola di
mortalità italiana calcolata sulla base dei dati 1970-72 e riferita
alla sola popolazione maschile. Talvolta, come appunto in
questo triennio, si assume un riferimento pluriennale e si utilizza
la media dei decessi per attenuare le possibili perturbazioni
congiunturali che facilmente potrebbero influenzare eventi
rilevati in un solo anno. Il numero medio dei decessi annuali per
ogni classe di età viene poi riferito alla popolazione
corrispondente registrata nell’istante intermedio dell’anno
centrale, per il quale si dispone delle informazioni necessarie,
come appunto avviene utilizzando i risultati censuari del 19717.
d(x)
l(x)
sopravviventi l(x)
100000
decessi d(x)
3500
90000
3000
80000
2500
70000
60000
2000
50000
1500
40000
30000
1000
20000
500
10000
0
0
5
0
10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 età
Figura 5.2 Distribuzione dei sopravviventi e dei decessi nella tavola di
mortalità italiana del 1970-72 (Maschi)
La curva dei sopravviventi è, come ovvio, monotòna
decrescente, poiché il numero dei soggetti esposti a rischio
potrebbe aumentare, nell’analisi per contemporanei, solo a causa
7
Istat, Tavole di mortalità della popolazione italiana per regione,
Supplemento al Bollettino mensile di Statistica, n. 6, 1976.
13
di flussi migratori che qui non sono considerati. È interessante
osservare che i sopravviventi diminuiscono più velocemente nel
primo anno di vita e soprattutto oltre i 40 anni, quando i decessi
aumentano in modo progressivo. Alla massima riduzione dei
sopravviventi, a 76 anni, corrisponde il massimo incremento dei
decessi. In seguito, i sopravviventi decrescono tanto da far
diminuire il numero assoluto dei decessi, mentre il rischio di
morte continua progressivamente ad aumentare.
0,60
0,60
0,50
0,50
m(x)=d(x)/L(x)
0,40
0,40
0,30
0,30
0,20
0,20
q(x)=d(x)/l(x)
0,10
0,10
0,00
0,00
0
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95 100 età
Figura 5.3 Tasso e probabilità di morte nella tavola di mortalità italiana
del 1970-72 (Maschi)
Va sottolineato che nella tavola di mortalità le età estreme
rappresentano situazioni particolari, in cui il rischio di morte è
decisamente più elevato che altrove. Le età iniziali rientrano nel
discorso della mortalità infantile, brevemente accennato in
seguito, mentre per quanto riguarda le età senili vale la pena di
ricordare due fonti di errore per il calcolo delle probabilità di
morte. In primo luogo, la difficoltà di ottenere informazioni
corrette in riferimento alle persone molto anziane, per le quali
14
non è sempre possibile conoscere, direttamente o indirettamente,
informazioni esatte. La capacità di ricordare senza errori la data
di nascita non è scontata per chi è molto anziano ed anche i
documenti, quando si riferiscono a circostanze molto remote,
possono risultare particolarmente imprecisi o irrecuperabili.
I problemi maggiori sono comunque rappresentati dall’esiguità
crescente dei collettivi alle età più elevate, e dalle conseguenti
forti oscillazioni di natura aleatoria che subiscono le stime della
probabilità di morte. Per ovviare a questo aumento di varianza
degli stimatori, a partire da un’età limite, 90 anni ad esempio, si
preferisce interpolare il tratto di curva rimanente con una
funzione esponenziale del tipo q' ( x )  A  Be x , così da garantire
una maggiore stabilità all’andamento degli ultimi valori di q(x).
Accade allora che nelle tavole di mortalità ufficiali si riscontrino
apparenti paradossi. Ad esempio, con un solo sopravvivente e
un deceduto all’età x =106, la probabilità di morte riportata nelle
tavole Istat non è unitaria, bensì 0,544.
q(x)
1,00
0,90
0,80
0,70
0,60
0,50
0,40
0,30
0,20
q(x) empirica
q(x) teorica (valori Istat)
0,10
0,00
90
92
94
96
98
100
102
104
106 età
Figura 5.4 Probabilità di morte teorica ed empirica alle età finali nella
tavola di mortalità italiana del 1970-72 (Maschi)
15
4. Tassi e probabilità
Conviene soffermarci ancora brevemente sulla definizione
dei tassi di mortalità e sul collegamento tra questi e le probabilità
di morte all’interno della tavola di eliminazione, dove il tasso
m(x) è calcolato con riferimento alla popolazione media L(x) tra
due compleanni successivi e rappresenta il rischio medio
nell’intervallo ovvero il rischio di morte nel punto centrale
dell’intervallo8. In questo ambito, valgono le uguaglianze
seguenti:
d ( x)
l ( x)
d ( x)

1
L( x)  d ( x)
2
d ( x) / L( x)

1
1  d ( x) / L( x)
2
m( x )
2m( x )


1
1  m( x ) 2  m( x )
2
q( x) 
8
m( x ) 
d ( x)
L( x )

d ( x)
1
l( x)  d ( x)
2

d ( x) / l( x)
1
1  d ( x) / l( x)
2

q( x)
2q ( x )

1
1  q( x) 2  q( x)
2
L’andamento è quindi lineare entro ogni intervallo.
16
Gli intervalli unitari precedenti sono indicati attraverso il solo
indice x oppure con x |- x+1 oppure [x - x+1). Quando
l’intervallo è costante di ampiezza a, gli eventi accaduti tra il
primo estremo compreso ed il secondo escluso diventano:
a
d(x)= d[x - x+a)
Va precisato che il riferimento [x - x+a) esprime un intervallo i
cui estremi sono valori puntuali su scala continua, anche se
usualmente nei testi di demografia tale classe sottintende una tra
le possibili modalità assunte da una variabile aleatoria
numerabile, così come in precedenza [x - x+1) veniva indicata
attraverso la variabile aleatoria intera x. Con la notazione
intervallare demografica avremo allora:
a
d ( x)  l ( x)  l ( x  a )
a
q ( x) 
a
m( x ) 
a
L( x )  a
l ( x) 
a
d ( x) l ( x)  l ( x  a)

l ( x)
l ( x)
a
d ( x)
a L( x )
a
l ( x)  l ( x  a )
2
L( x )
a

a
d ( x)
2
d(x) e aL(x) rappresentano, rispettivamente, i decessi e la
popolazione media su tutto l’intervallo di ampiezza generica a,
a partire dall’età esatta x. Inoltre, la relazione tra tassi e
probabilità diventa:
a
17
a
q( x) 
2a a m( x )
2  a a m( x )
che, per classi quinquennali (a= 5) è:
5
q ( x) 

d ( x)
l ( x)
5
d ( x)
d ( x)
5 L( x)
 5
5
2
5
d ( x)
5 L( x)

1 1 5 d ( x)

5 2 5 L( x)
5

10 5 m( x)
2 5 5 m( x )
Quando il riferimento è annuale, la probabilità q(x) è sempre
inferiore al tasso m(x), poiché il denominatore è superiore,
(l(x) > L(x)). Tuttavia, con a>1, considerando classi
quinquennali ad esempio, la probabilità di morte dipende dalla
lunghezza di a e copre tutti i cinque anni del quinquennio, mentre
il tasso indica un numero medio di eventi per persona in ogni
singolo anno del quinquennio. Quindi il primo indicatore è circa
cinque volte il secondo e la relazione d’ordine s’inverte:
5q(x) >> 5m(x).
18
Questo aspetto è interessante perché depone a favore del
tasso come indicatore di rischio, in quanto indipendente
dall’intervallo di misura, che invece condiziona la probabilità.
Sempre considerando intervalli costanti d’ampiezza a
generica, con d[x - x+a) = ad(x) eventi, l(x) sopravviventi
all’istante puntuale x, avremo:
a
f ( x) 
a
w 1

x 0
d ( x)
d ( x)
a
l ( x)  l ( x  a)
l (0)
 S ( x)  S ( x  a)

f(x) esprime la probabilità non condizionata che accada l’evento
in esame tra l’x-esimo e l’x+a-esimo istante (o compleanno)
escluso, rispetto a tutti gli intervalli possibili.
In pratica, af(x) rappresenta la probabilità che spetta all’intervallo
[x - x+a) e dipende anche dall’ampiezza a.
a
a
f(x) = Pr[X [x - x +a)]
dove la variabile aleatoria X (età in anni compiuti) indica il
tempo dell’evento d’interesse, che può accadere nell’intervallo in
esame come in tutti i possibili intervalli concorrenti. Di
conseguenza avremo:
w1

x 0
a
a
f ( x) 
f ( x)  0
d (0) a d (1a) a d (2a)
d [( w  a)  w) d [0  w)


... 

1
l (0)
l (0)
l (0)
l (0)
l (0)
a
a
f ( w)  0
a
19
Ritornando, per semplicità, all’intervallo unitario (a=1), è facile
verificare il collegamento tra probabilità condizionata q(x) e
incondizionata f(x):
q( x) 



d ( x)
l ( x)
d ( x)
l (0)   j  0 d ( j )
x 1
d ( x) / l (0)
1   j  0 d ( j ) / l (0)
x 1
f ( x)
1   j 0 f ( j)
x 1

f ( x )  q ( x ) 1   j 0 f ( j )
x 1

f(0)= q(0)
f(1) = q(1)(1- f(0))
= q(1)(1- q(0))= q(1)p(0)
f(2) = q(2) [1- (f(0)+ f(1))]
= q(2) [1- q(0) - q(1) + q(1)q(0)]
= q(2) [1- q(0)][ 1- q(1)]
= q(2) p(0) p(1)
f(x) = q(x) [1- q(0)] [1- q(1)] … [1- q(x-1)]
= q(x) p(0) p(1)…
… p(x-1)
Questa espressione indica che per morire nel compleanno x è non
si può fare a meno di sopravvivere sino al compleanno x-1,
20
quindi essere esposti a rischio nel compleanno x e subire l’evento
prima del compleanno x+1. Inoltre, poiché:
S(x) = p(0) p(1) … p(x-1)
l’espressione finale di f(x) si può semplificare nella probabilità
composta:
f(x) = q(x) S(x) → Pr{A e B}= Pr{B|A}Pr{A}
La probabilità condizionata è allora: q(x)= f(x) /S(x)
Tenendo poi conto che:
x 1
l ( x) l (0)   j  0 d ( j )
S ( x) 

 1   j 0 f ( j)
l (0)
l (0)
x 1


è facile notare come, per il tempo limite w della sommatoria,
quando la generazione è estinta, la differenza entro parentesi sia
nulla e dunque S(w)=0, poiché non esiste alcun soggetto in vita
(quindi esposto a rischio) al tempo limite w.
21
5. Variabili aleatorie continue
Riprendendo quanto accennato al paragrafo precedente, avremo
a
f ( x) 
a
w 1

x 0
d ( x)
a
d ( x)
l ( x)  l ( x  a)
l (0)
 S ( x)  S ( x  a)

Allora, se definiamo gli intervalli in forma estesa, il rischio
condizionato aq(x) diventa:
a
q(x) = Pr{X  [x - x+a) | X  x }
= Pr{X [x - x+a) ] / Pr[X  x }
= [S(x)- S(x+a)] / S(x)
 S ( x)  S ( x  a ) 

 = af(x)/ S(x)
S ( x)


Ovviamente, ponendo a=1, si ottiene l’usuale definizione della
probabilità q(x). Ma è da notare che questa definizione dipende
sia dall’età x sia dall’ampiezza dell’intervallo a e quindi una
misura di rischio indipendente dall’intervallo in esame è
intuitivamente:
22
 S ( x)  S ( x  a) 
h( x )  
 = af(x)/ aS(x)
aS ( x)


che ovviamente non risente dell’intervallo su cui è calcolato.
Restringendo l’intervallo a ad un infinitesimo e passando ad una
notazione in cui il tempo di esposizione al rischio è continuo
all’interno di un dominio definito, ovvero passando dalla variabile
aleatoria X usata nelle tavole attuariali alla variabile aleatoria
continua T, parleremo di densità istantanea f(t):
 S (t )  S (t  a) 
f (t )  lim 

a 0
a

 S (t  a)  S (t ) 
  lim 
   S ' (t )
a 0
a

f(t) indica la probabilità incondizionata di accadimento
dell’evento che spetta ad un intervallo infinitesimo, che è zero in
tempo continuo e con f(t) continua. Tale funzione si può
esprimere attraverso la derivata prima di -S(t). Infatti:
F(t) = 1 - S(t)
F(t)′ = - S(t)′= f(t)
Senza rapportare questa quantità all’ampiezza a dell’intervallo
infinitesimo, con a0 il limite risulterebbe nullo, infatti: il limite
di f(t) per a →0 sarebbe: S(t)- S(t)= 0.
Attribuendo alla variabile aleatoria T la potenza del continuo,
accade che entro qualsiasi intervallo finito cadano un'infinità di
valori della variabile stessa: di conseguenza non si può pensare di
attribuire a ciascuno di essi un valore finito di probabilità f(t).
In pratica, la massa di probabilità f(t), che spetta a ciascuno degli
infiniti valori puntuali della variabile aleatoria all’interno di un
23
qualsiasi intervallo, non può che essere nulla. Diversamente da
quanto accade con variabili aleatorie discrete e numerabili.
Quando T è la variabile aleatoria che esprime l’accadimento
dell’evento in esame in un tempo continuo, il riferimento ai tassi
di transizione o alle probabilità istantanee di cambiamento di
stato diventa formalmente diverso:
S(t) = Pr {t  T } = 1- F(t)
quindi: f(t)= - S(t)′
f(t)=limt0 Pr { t  T< t + t } /t
h(t)=limt0 Pr { t  T< t + t| t  T } /t
h(t ) 
f (t )
S (t )'
 ln S (t )


S (t )
S (t )
t
t
  h( x)dx  ln S ( x) 0t
con S (0)  1 avremo
0
t
  h( x)dx  ln S (t )  ln(1)
0
 t

S (t )  exp    h( x)dx 
 0

 H (t )
S (t )  e
 ln S (t )  H (t )
t
H (t )   h( x)dx
0
h(t ) 
H (t )
t
24
Si ricordi che la funzione di distribuzione cumulata per una
variabile aleatoria continua X è definita come la probabilità che la
variabile X assuma un qualsiasi valore minore di x:
F(x) = Pr[X ≤ x]
La funzione F(x) è non decrescente, limitata tra 0-1, ed esiste per
tutte le variabili aleatorie. Vanno ricordati i seguenti punti:
1) Se f:[a, b] →R è una funzione continua, allora
la funzione integrale F(x) è derivabile in [a, b] e F′(x) = f(x)
per ogni x [a, b], con:
x
F ( x)   f (u )du
a
2) Se f:[a, b] →R è una funzione continua e F(x) :[a, b] →R
una primitiva di f, ovvero F′(x) = f(x) allora
b
F (b)  F (a)   f (u )du
a
3) Nel continuo per un qualsiasi punto x che esprima Pr{X=x}
avremo f(x)= 0:
1-F(x)
= 1- Pr[X ≤ x]
= Pr[X ≥ x] = S(x)
e quindi
b
F(b) - F(a) = [1-F(a)]-[1- F(b)]= S (a)  S (b)   f (u )du
a
Scarica