5. LE TAVOLE DI ELIMINAZIONE 1. La stima del rischio di un evento Si è visto come, nel caso della mortalità, il rapporto m = M/P (x1000) esprima il numero medio di eventi ogni 1000 persone/anno, ovvero ogni mille anni di vita vissuti nell’anno di riferimento. Questo indicatore è tuttavia molto generico, tanto che a volte occorre depurarlo almeno dell’effetto dovuto alla struttura per età, calcolando tassi specifici o ricorrendo agli opportuni metodi di eliminazione, così da svolgere confronti corretti tra popolazioni. La questione che ne deriva riguarda allora la scelta della misura più opportuna per descrivere il fenomeno demografico in esame, la più vicina possibile al rischio di subire quel determinato evento. Tale misura non può che essere la probabilità, e quindi il problema si traduce nella sua stima che generalmente, in demografia, avviene attraverso le tavole attuariali di sopravvivenza. Le stesse che usano le società di assicurazione per calcolare il premio, cioè la cifra mensile o annuale da richiedere all’assicurato, confidando, in primo luogo, che questi sopravviva un tempo più che sufficiente per garantire un guadagno alla compagnia e, secondariamente, che la legge dei grandi numeri renda regolare il succedersi dei decessi, prevedibili in termini collettivi, ma assolutamente aleatori per quanto attiene ogni singolo individuo. Occorre premettere che la tavola di sopravvivenza o di eliminazione, nella sua accezione più usuale, si riferisce ad un evento unico, tale da comportare l’esclusione dall’osservazione del soggetto che lo subisce. La specificazione è comunque teorica poiché tutti gli eventi, anche quelli ripetibili, come ad esempio la ricerca di un n-esimo lavoro, possono diventare eventi unici se opportunamente specificati. Così potrebbero esistere tavole di eliminazione dallo stato di disoccupazione dopo aver 2 svolto n-1 lavori, ed anche tavole di fecondità per donne che hanno già avuto n-1 figli, tavole di mortalità differenziale in cardiochirurgia per pazienti che hanno subito n-1 infarti ecc... Si distinguono due modalità di raccolta delle informazioni longitudinali, con cui solitamente vengono prodotte tavole di eliminazione. La prima consiste nell’isolare un determinato contingente (indicato come generazione o anche coorte), in cui tutti i componenti sono accomunati da uno stesso evento origine (tutti i nati nell’anno 1970, ad esempio), e seguirlo nel tempo sino all’uscita dall’osservazione di tutti i soggetti, come accade nelle tavole di mortalità, oppure sino ad un limite convenzionale di fine osservazione, ad esempio sino al 50-esimo compleanno nel caso si voglia stimare la probabilità di matrimonio per una generazione di celibi. Inoltre talvolta è possibile ricostruire, a partire da un dato istante, la storia passata di una generazione raccogliendo gli stessi dati che si sarebbero rilevati osservandola a partire dalla sua costituzione. In genere, l’indagine retrospettiva comporta tuttavia maggiori problemi riguardo l’affidabilità e la distorsione dei dati che ne risultano. Quando si raccolgono informazioni attraverso interviste si fa implicitamente affidamento alla buona memoria degli intervistati e, ovviamente, si considerano i soli sopravvissuti, i quali rappresentano spesso un campione selezionato rispetto anche alla base della variabile d’interesse. Una tavola di nuzialità calcolata sulla base di interviste ad una generazione di sopravviventi al 50 compleanno porterà, inevitabilmente, a sovrastimare la probabilità di matrimonio della generazione iniziale se tra i deceduti, che non sono inclusi, la probabilità di contrarre matrimonio è inferiore rispetto ai sopravviventi. Nella seconda alternativa, la più comune ed anche teoricamente la più controversa, si ricorre all’esperienza contemporanea di un insieme di soggetti che non hanno subito uno stesso evento origine in passato, ma che sono contemporaneamente osservati in uno stesso intervallo temporale. Poiché la teoria delle tavole di sopravvivenza si basa 3 sulla prima situazione, si formulano ipotesi tali da consentire, quantomeno teoricamente, il passaggio dallo schema per contemporanei a quello per generazioni. 2. Dati per contemporanei e per generazioni Attraverso l’osservazione per contemporanei si definiscono tassi specifici annuali del tipo m( x) M ( x) / P( x) , dove P(x) rappresenta la popolazione media, considerata a metà anno nell’ipotesi di variazione lineare e quindi con riferimento convenzionale della mezzanotte del 30 giugno. È evidente che m(x) non indica esattamente una probabilità, perché la stima della popolazione a rischio non considera coloro che sono deceduti nel periodo 1 gennaio - 30 giugno. Una migliore stima della popolazione a rischio potrebbe allora essere definita come: P (x) = M(x)/2 + P(x) dove, supponendo una distribuzione uniforme dei decessi annuali, il termine M(x)/2 sottintende i deceduti nel periodo 1 gennaio - 30 giugno e, sommato a P(x), consente di ricostruire, in via approssimata, il contingente iniziale dei soggetti esposti al rischio di morte nella classe di età x-esima. q( x ) M ( x ) / P' ( x ) p( x ) 1 q( x ) 1 M ( x ) / P' ( x ) In queste condizioni le due quantità q(x) e p(x) assumono il significato di stime, per contemporanei, delle probabilità di morte e di sopravvivenza relative all’età x nell’anno in esame1. Più esattamente, q(x) indica la probabilità che un individuo giunto in vita al compleanno x-esimo muoia prima del compleanno 1 Questo procedimento fu proposto per la prima volta da J. Milne, nel 1815. 4 x+1-esimo, e p(x) è ovviamente la probabilità complementare, di sopravvivere dal compleanno x sino all’x+1-esimo. Quando si ammette che tali probabilità, calcolate durante un certo intervallo temporale, solitamente un anno o un quinquennio, possano caratterizzare una generazione teorica seguita dalla nascita sino all’estinzione, si costruisce una tavola di eliminazione che rispecchia la mortalità congiunturale o del momento. Questa tavola non si riferisce all’evoluzione di una generazione reale sottoposta al rischio di morte, ma considera una generazione teorica in cui sono comprese le esperienze di generazioni diverse osservate in uno stesso periodo. A priori, non esistono motivi per considerare non corretta una tavola di mortalità calcolata con riferimento ad un dato anno di calendario o comunque per contemporanei, purché ovviamente sia definita e usata concettualmente come tale. Inoltre, non si può escludere che la generazione teorica associata alla tavola di mortalità per contemporanei esista o possa esistere in futuro. Se la mortalità raggiungesse un limite oltre il quale gli ulteriori guadagni, alle varie età, fossero praticamente irrilevanti, da quel momento in poi tutte le generazioni sarebbero caratterizzate dalla stessa mortalità specifica e circa un secolo dopo si estinguerebbe la prima generazione contraddistinta dalle probabilità di morte calcolate per contemporanei nell’anno limite2. Dal punto di vista formale, infine, non esistono differenze tra tavole per generazioni 2 Si tratta della cosiddetta popolazione stazionaria associata ad ogni tavola di mortalità. In pratica, se una tavola di mortalità inizialmente composta da l(0)=100.000 individui riproducesse, ad ogni anno, lo sviluppo di una popolazione chiusa rispetto ai movimenti migratori ed effettivamente composta da 100.000 individui alla nascita, da l(1) individui al primo compleanno, l(2) al secondo... e così via, questa non potrebbe che rimanere stazionaria, cioè ad incremento nullo. Infatti ogni anno verrebbero alla luce l(0) nuovi individui e ne morirebbero altrettanti, poiché d(x)=l(0). In altri termini, si avrebbe: r= n-m= N/P-D/P= l(0)/T(0) - d(x)/T(0) = 0, con T(0) = L(x) che rappresenta la popolazione media complessiva. 5 e tavole per contemporanei3, cosicché tutte le grandezze tipiche della prima situazione vengono assimilate alla seconda nei termini che seguono: P (x) l(x) = sopravviventi all’x-esimo compleanno; P(x) L(x) = popolazione media o anni mediamente vissuti tra il compleanno x e il compleanno x+1; M(x) d(x) = deceduti in età x. CONTEMPORANEI GENERAZIONI GENERAZIONE TEORICA età d(x)/2 P'(x) P(x) L(x) d(x)/2 M(x)/2 M(x)/2 x l(x) ... 0 t-1 t ANNO DI CALENDARIO t+1 anno Figura 5.1 Passaggio dallo schema per contemporanei a quello per generazioni 3 Si può obbiettare che nella tavola per generazioni tutte le grandezze che la caratterizzano, il numero dei sopravviventi, dei decessi..., sono reali e possono assumersi così come sono, mentre nella tavola per contemporanei solo la probabilità di morte è effettiva e le altre grandezze sono costruite in modo teorico a partire da una popolazione di 10 n individui. Tuttavia anche per le generazioni le tavole vengono solitamente riproporzionate sulla base di un contingente iniziale espresso come potenza di dieci e quindi questa differenza, pur essendo concettualmente valida, dal punto di vista dell’utilizzo pratico e formale non comporta nessuna conseguenza. 6 In definitiva, quando occorre costruire tavole di mortalità per contemporanei, si assume che il numero dei decessi M(x), all’età x, sia uniformemente distribuito nel corso dell’anno (o della classe pluriennale considerata) e quindi, sommando M(x)/2 decessi alla popolazione a metà anno P(x), si ricostruisce la popolazione P (x) inizialmente esposta al rischio di morte. Queste tre grandezze, M(x), P(x) e P (x), dallo schema per contemporanei vengono trasportate nello schema per generazioni (figura 5.1), in cui diventano d(x), L(x), l(x) e dove inoltre - salvo diversamente specificato - all’interno di ogni segmento di generazione teorica così ricostruito, vale l’ipotesi di uniforme distribuzione dei decessi tra un compleanno e il successivo. La generazione teorica è pertanto quella che si costituisce a partire dall’anno di riferimento e che, ad ogni età, subisce le probabilità di morte calcolate per contemporanei nel medesimo anno. Oltre alle probabilità, anche i tassi specifici m(x) subiscono un’analoga traslazione e, da m(x) = M(x)/P(x) nello schema per contemporanei, diventano m(x) = d(x)/L(x) nello schema per generazioni, pur rimanendo esattamente le stesse quantità. In queste condizioni, l’uguaglianza: q( x ) 2m( x ) 2 m( x ) che, come si vedrà, è verificata all’interno della schema per generazioni, viene estesa anche al tasso specifico calcolato per contemporanei. Il passaggio contemporanei / generazione può perciò avvenire in modi formalmente diversi ma del tutto equivalenti: a) assumendo che le probabilità di morte calcolate per contemporanei possano implicitamente caratterizzare la mortalità di una generazione teorica: q(x)=M(x)/ P (x); 7 b) trasportando le grandezze M(x) e P (x) nello schema per generazioni, dove diventano d(x) e l(x), e dove ovviamente si ottiene: q(x) = d(x)/l(x) = M(x)/P (x); c) inserendo nella formula q(x)=2m(x) / (2+m(x)) i tassi calcolati per contemporanei, vale a dire m(x)=M(x)/P(x), e ricavando indirettamente i valori di q(x). Una volta costruita la serie delle probabilità q(x), riferita a contemporanei o generazioni, si possono calcolare tutte le altre grandezze dalla tavola di mortalità con la sola ulteriore definizione della popolazione iniziale l(0), espressa come 10n. 3. Grandezze caratteristiche Quando si utilizzano classi di età annuali, le formule più ricorrenti, nell’ambito delle grandezze considerate dalla tavola di mortalità, sono: q( x) d ( x) l ( x) d(0) = l(0)q(0) l(1) = l(0)-d(0) d(1) = l(1)q(1) l(2) = l(1)-d(1) ... d(w-1) = l(w-1)q(w-1) l(w) = 0 q(x) è la probabilità di morte nell’età x per un individuo ancora in vita all’x-esimo compleanno. Data la serie q(x) e il termine iniziale l(0), le due serie l(x) e d(x) si ottengono facilmente in modo ricorsivo; 8 p ( x) 1 q ( x) d ( x) l ( x) l ( x) l ( x 1) 1 l ( x) l ( x 1) l ( x) 1 S ( x) p(0) p(1)... p( x 1) x 1 p(i ) i 0 l ( x) / l (0) S ( x y ) p ( x) p ( x 1)... ... p( y 1) y 1 p(i ) i x l ( y ) / l ( x) l ( x) l ( x 1) L( x) 2 4 p(x) è la probabilità di sopravvivere all’età x, cioè di arrivare al compleanno x+1 per un individuo ancora in vita all’x-esimo compleanno; S(x) è la probabilità di essere in vita all’età esatta x per un componente il contingente iniziale l(0). In pratica, non è altro che il rapporto l(x)/l(0) e può essere intesa come probabilità, per un solo individuo (l(0)=100), di sopravvivere dalla nascita sino all’età x4. Più in generale, S(x-y) è la probabilità di rimanere in vita tra il compleanno x e quello y; L(x) indica la popolazione media o gli anni mediamente vissuti all’età x. Nella definizione data è implicita l’ipotesi di uniforme distribuzione dei decessi d(x) tra i due compleanni successivi, che equivale ad assumere una distribuzione lineare dei Se la probabilità di superare in vita l’età x-1 è: 1- q(x-1) = p(x)= l(x)/l(x-1), nell’ipotesi di indipendenza dei rischi di morte la probabilità di sopravvivere dalla nascita sino all’età esatta x è: l (1) l ( 2) l( x ) l( x ) ... S(x)= p(0)p(1)...p(x-1)= l ( 0) l (1) l ( x 1) l ( 0) 9 l ( x) (l ( x) d ( x)) 2 1 l ( x) d ( x) 2 sopravviventi intervallo; l(x) nello stesso T(x) è la somma degli anni di vita T ( x) L( x) L( x 1) ... mediamente vissuti dai all’età x. In L( w 2) L( w 1) sopravviventi particolare, T(0) indica w1 l’ammontare di vita media L(i ) i x complessivamente vissuta da tutti gli l(0) individui inclusi nella generazione; T ( x) e( x ) l( x) (x) e(x) è il numero di anni che, mediamente, spettano ancora da vivere ai sopravviventi5 all’età x . Di conseguenza, e(0) = T(0)/l(0) è la vita media alla nascita, cioè la vita mediamente vissuta da ciascun componente la generazione. Vale anche la pena di notare che 1/e(0)= l(0)/T(0) è il tasso di natalità e di mortalità della popolazione teorica stazionaria associata alla tavola di mortalità6; (x) corrisponde all’intervallo di tempo che deve ancora trascorrere affinché i sopravviventi l(x) si riducano a l(x)/2. È l’età mediana per x=0 e dell’intervallo mediano per ogni altra età x, 5 Nonostante il riferimento ai sopravviventi l(x), all’età esatta x, questa grandezza viene calcolata considerando la popolazione media L(x). 6 Vedi nota 2. 10 Tavola 5.1 Tavola di mortalità della popolazione italiana nel 1970-72 (Maschi) x 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 l(x) d(x) q(x) p(x) L(x) m(x) T(x) e(x) 100000 96920 96770 96676 96610 96552 96496 96445 96398 96353 96311 96270 96227 96180 96124 96058 95979 95888 95786 95677 95564 95451 95339 95228 95118 95010 94902 94793 94683 94571 94458 94342 94221 94094 93959 93815 93659 93489 93302 93096 92870 92621 92347 92043 91705 91332 90921 90471 89982 89448 3080 150 94 66 58 56 51 47 45 42 41 43 47 56 66 79 91 102 109 113 113 112 111 110 108 108 109 110 112 113 116 121 127 135 144 156 170 187 206 226 249 274 304 338 373 411 450 489 534 581 0,0308 0,0015 0,0010 0,0007 0,0006 0,0006 0,0005 0,0005 0,0005 0,0004 0,0004 0,0004 0,0005 0,0006 0,0007 0,0008 0,0009 0,0011 0,0011 0,0012 0,0012 0,0012 0,0012 0,0012 0,0011 0,0011 0,0011 0,0012 0,0012 0,0012 0,0012 0,0013 0,0013 0,0014 0,0015 0,0017 0,0018 0,0020 0,0022 0,0024 0,0027 0,0030 0,0033 0,0037 0,0041 0,0045 0,0049 0,0054 0,0059 0,0065 0,9692 0,9985 0,9990 0,9993 0,9994 0,9994 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9995 0,9994 0,9993 0,9992 0,9991 0,9989 0,9989 0,9988 0,9988 0,9988 0,9988 0,9988 0,9989 0,9989 0,9989 0,9988 0,9988 0,9988 0,9988 0,9987 0,9987 0,9986 0,9985 0,9983 0,9982 0,9980 0,9978 0,9976 0,9973 0,9970 0,9967 0,9963 0,9959 0,9955 0,9951 0,9946 0,9941 0,9935 97536,0 96845,0 96723,0 96643,0 96581,0 96524,0 96470,5 96421,5 96375,5 96332,0 96290,5 96248,5 96203,5 96152,0 96091,0 96018,5 95933,5 95837,0 95731,5 95620,5 95507,5 95395,0 95283,5 95173,0 95064,0 94956,0 94847,5 94738,0 94627,0 94514,5 94400,0 94281,5 94157,5 94026,5 93887,0 93737,0 93574,0 93395,5 93199,0 92983,0 92745,5 92484,0 92195,0 91874,0 91518,5 91126,5 90696,0 90226,5 89715,0 89157,5 0,0316 0,0015 0,0010 0,0007 0,0006 0,0006 0,0005 0,0005 0,0005 0,0004 0,0004 0,0004 0,0005 0,0006 0,0007 0,0008 0,0009 0,0011 0,0011 0,0012 0,0012 0,0012 0,0012 0,0012 0,0011 0,0011 0,0011 0,0012 0,0012 0,0012 0,0012 0,0013 0,0013 0,0014 0,0015 0,0017 0,0018 0,0020 0,0022 0,0024 0,0027 0,0030 0,0033 0,0037 0,0041 0,0045 0,0050 0,0054 0,0060 0,0065 6895723,0 6798187,0 6701342,0 6604619,0 6507976,0 6411395,0 6314871,0 6218400,5 6121979,0 6025603,5 5929271,5 5832981,0 5736732,5 5640529,0 5544377,0 5448286,0 5352267,5 5256334,0 5160497,0 5064765,5 4969145,0 4873637,5 4778242,5 4682959,0 4587786,0 4492722,0 4397766,0 4302918,5 4208180,5 4113553,5 4019039,0 3924639,0 3830357,5 3736200,0 3642173,5 3548286,5 3454549,5 3360975,5 3267580,0 3174381,0 3081398,0 2988652,5 2896168,5 2803973,5 2712099,5 2620581,0 2529454,5 2438758,5 2348532,0 2258817,0 68,96 70,14 69,25 68,32 67,36 66,40 65,44 64,48 63,51 62,54 61,56 60,59 59,62 58,65 57,68 56,72 55,76 54,82 53,88 52,94 52,00 51,06 50,12 49,18 48,23 47,29 46,34 45,39 44,44 43,50 42,55 41,60 40,65 39,71 38,76 37,82 36,88 35,95 35,02 34,10 33,18 32,27 31,36 30,46 29,57 28,69 27,82 26,96 26,10 25,25 11 Segue Tav 5.1 x 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 l(x) d(x) q(x) p(x) L(x) m(x) T(x) e(x) 88867 88233 87539 86781 85956 85059 84091 83046 81917 80699 79380 77954 76411 74744 72954 71038 69000 66845 64577 62197 59690 57046 54247 51294 48218 45050 41828 38584 35347 32144 28998 25931 22960 20089 17335 14725 12291 10065 8073 6333 4852 3626 2640 1871 1289 863 561 354 216 128 73 41 22 11 6 3 1 634 694 758 825 897 968 1045 1129 1218 1319 1426 1543 1667 1790 1916 2038 2155 2268 2380 2507 2644 2799 2953 3076 3168 3222 3244 3237 3203 3146 3067 2971 2871 2754 2610 2434 2226 1992 1740 1481 1226 986 769 582 426 302 207 138 88 55 32 19 11 5 3 2 1 0,0071 0,0079 0,0087 0,0095 0,0104 0,0114 0,0124 0,0136 0,0149 0,0163 0,0180 0,0198 0,0218 0,0239 0,0263 0,0287 0,0312 0,0339 0,0369 0,0403 0,0443 0,0491 0,0544 0,0600 0,0657 0,0715 0,0776 0,0839 0,0906 0,0979 0,1058 0,1146 0,1250 0,1371 0,1506 0,1653 0,1811 0,1979 0,2155 0,2339 0,2527 0,2719 0,2913 0,3111 0,3305 0,3499 0,3690 0,3898 0,4074 0,4297 0,4384 0,4634 0,5000 0,4545 0,5000 0,6667 1,0000 0,9929 0,9921 0,9913 0,9905 0,9896 0,9886 0,9876 0,9864 0,9851 0,9837 0,9820 0,9802 0,9782 0,9761 0,9737 0,9713 0,9688 0,9661 0,9631 0,9597 0,9557 0,9509 0,9456 0,9400 0,9343 0,9285 0,9224 0,9161 0,9094 0,9021 0,8942 0,8854 0,8750 0,8629 0,8494 0,8347 0,8189 0,8021 0,7845 0,7661 0,7473 0,7281 0,7087 0,6889 0,6695 0,6501 0,6310 0,6102 0,5926 0,5703 0,5616 0,5366 0,5000 0,5455 0,5000 0,3333 0,0000 88550,0 87886,0 87160,0 86368,5 85507,5 84575,0 83568,5 82481,5 81308,0 80039,5 78667,0 77182,5 75577,5 73849,0 71996,0 70019,0 67922,5 65711,0 63387,0 60943,5 58368,0 55646,5 52770,5 49756,0 46634,0 43439,0 40206,0 36965,5 33745,5 30571,0 27464,5 24445,5 21524,5 18712,0 16030,0 13508,0 11178,0 9069,0 7203,0 5592,5 4239,0 3133,0 2255,5 1580,0 1076,0 712,0 457,5 285,0 172,0 100,5 57,0 31,5 16,5 8,5 4,5 2,0 0,5 0,0072 0,0079 0,0087 0,0096 0,0105 0,0114 0,0125 0,0137 0,0150 0,0165 0,0181 0,0200 0,0221 0,0242 0,0266 0,0291 0,0317 0,0345 0,0375 0,0411 0,0453 0,0503 0,0560 0,0618 0,0679 0,0742 0,0807 0,0876 0,0949 0,1029 0,1117 0,1215 0,1334 0,1472 0,1628 0,1802 0,1991 0,2196 0,2416 0,2648 0,2892 0,3147 0,3409 0,3684 0,3959 0,4242 0,4525 0,4842 0,5116 0,5473 0,5614 0,6032 0,6667 0,5882 0,6667 1,0000 --- 2169659,5 2081109,5 1993223,5 1906063,5 1819695,0 1734187,5 1649612,5 1566044,0 1483562,5 1402254,5 1322215,0 1243548,0 1166365,5 1090788,0 1016939,0 944943,0 874924,0 807001,5 741290,5 677903,5 616960,0 558592,0 502945,5 450175,0 400419,0 353785,0 310346,0 270140,0 233174,5 199429,0 199429,0 141393,5 116948,0 95423,5 76711,5 60681,5 47173,5 35995,5 26926,5 19723,5 14131,0 9892,0 6759,0 4503,5 2923,5 1847,5 1135,5 678,0 393,0 221,0 120,5 63,5 32,0 15,5 7,0 2,5 0,5 24,41 23,59 22,77 21,96 21,17 20,39 19,62 18,86 18,11 17,38 16,66 15,95 15,26 14,59 13,94 13,30 12,68 12,07 11,48 10,90 10,34 9,79 9,27 8,78 8,30 7,85 7,42 7,00 6,60 6,20 5,82 5,45 5,09 4,75 4,43 4,12 3,84 3,58 3,34 3,11 2,91 2,73 2,56 2,41 2,27 2,14 2,02 1,92 1,82 1,73 1,65 1,55 1,45 1,41 1,17 0,83 0,50 Nota: tutte le variabili sono calcolate come stabilito nelle formule precedenti, nessuna interpolazione è applicata alle età finali; tassi e probabilità, qui e nel testo, non sono moltiplicati x1000 12 In questa e nella pagina precedente è riassunta la tavola di mortalità italiana calcolata sulla base dei dati 1970-72 e riferita alla sola popolazione maschile. Talvolta, come appunto in questo triennio, si assume un riferimento pluriennale e si utilizza la media dei decessi per attenuare le possibili perturbazioni congiunturali che facilmente potrebbero influenzare eventi rilevati in un solo anno. Il numero medio dei decessi annuali per ogni classe di età viene poi riferito alla popolazione corrispondente registrata nell’istante intermedio dell’anno centrale, per il quale si dispone delle informazioni necessarie, come appunto avviene utilizzando i risultati censuari del 19717. d(x) l(x) sopravviventi l(x) 100000 decessi d(x) 3500 90000 3000 80000 2500 70000 60000 2000 50000 1500 40000 30000 1000 20000 500 10000 0 0 5 0 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 età Figura 5.2 Distribuzione dei sopravviventi e dei decessi nella tavola di mortalità italiana del 1970-72 (Maschi) La curva dei sopravviventi è, come ovvio, monotòna decrescente, poiché il numero dei soggetti esposti a rischio potrebbe aumentare, nell’analisi per contemporanei, solo a causa 7 Istat, Tavole di mortalità della popolazione italiana per regione, Supplemento al Bollettino mensile di Statistica, n. 6, 1976. 13 di flussi migratori che qui non sono considerati. È interessante osservare che i sopravviventi diminuiscono più velocemente nel primo anno di vita e soprattutto oltre i 40 anni, quando i decessi aumentano in modo progressivo. Alla massima riduzione dei sopravviventi, a 76 anni, corrisponde il massimo incremento dei decessi. In seguito, i sopravviventi decrescono tanto da far diminuire il numero assoluto dei decessi, mentre il rischio di morte continua progressivamente ad aumentare. 0,60 0,60 0,50 0,50 m(x)=d(x)/L(x) 0,40 0,40 0,30 0,30 0,20 0,20 q(x)=d(x)/l(x) 0,10 0,10 0,00 0,00 0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 età Figura 5.3 Tasso e probabilità di morte nella tavola di mortalità italiana del 1970-72 (Maschi) Va sottolineato che nella tavola di mortalità le età estreme rappresentano situazioni particolari, in cui il rischio di morte è decisamente più elevato che altrove. Le età iniziali rientrano nel discorso della mortalità infantile, brevemente accennato in seguito, mentre per quanto riguarda le età senili vale la pena di ricordare due fonti di errore per il calcolo delle probabilità di morte. In primo luogo, la difficoltà di ottenere informazioni corrette in riferimento alle persone molto anziane, per le quali 14 non è sempre possibile conoscere, direttamente o indirettamente, informazioni esatte. La capacità di ricordare senza errori la data di nascita non è scontata per chi è molto anziano ed anche i documenti, quando si riferiscono a circostanze molto remote, possono risultare particolarmente imprecisi o irrecuperabili. I problemi maggiori sono comunque rappresentati dall’esiguità crescente dei collettivi alle età più elevate, e dalle conseguenti forti oscillazioni di natura aleatoria che subiscono le stime della probabilità di morte. Per ovviare a questo aumento di varianza degli stimatori, a partire da un’età limite, 90 anni ad esempio, si preferisce interpolare il tratto di curva rimanente con una funzione esponenziale del tipo q' ( x ) A Be x , così da garantire una maggiore stabilità all’andamento degli ultimi valori di q(x). Accade allora che nelle tavole di mortalità ufficiali si riscontrino apparenti paradossi. Ad esempio, con un solo sopravvivente e un deceduto all’età x =106, la probabilità di morte riportata nelle tavole Istat non è unitaria, bensì 0,544. q(x) 1,00 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,20 q(x) empirica q(x) teorica (valori Istat) 0,10 0,00 90 92 94 96 98 100 102 104 106 età Figura 5.4 Probabilità di morte teorica ed empirica alle età finali nella tavola di mortalità italiana del 1970-72 (Maschi) 15 4. Tassi e probabilità Conviene soffermarci ancora brevemente sulla definizione dei tassi di mortalità e sul collegamento tra questi e le probabilità di morte all’interno della tavola di eliminazione, dove il tasso m(x) è calcolato con riferimento alla popolazione media L(x) tra due compleanni successivi e rappresenta il rischio medio nell’intervallo ovvero il rischio di morte nel punto centrale dell’intervallo8. In questo ambito, valgono le uguaglianze seguenti: d ( x) l ( x) d ( x) 1 L( x) d ( x) 2 d ( x) / L( x) 1 1 d ( x) / L( x) 2 m( x ) 2m( x ) 1 1 m( x ) 2 m( x ) 2 q( x) 8 m( x ) d ( x) L( x ) d ( x) 1 l( x) d ( x) 2 d ( x) / l( x) 1 1 d ( x) / l( x) 2 q( x) 2q ( x ) 1 1 q( x) 2 q( x) 2 L’andamento è quindi lineare entro ogni intervallo. 16 Gli intervalli unitari precedenti sono indicati attraverso il solo indice x oppure con x |- x+1 oppure [x - x+1). Quando l’intervallo è costante di ampiezza a, gli eventi accaduti tra il primo estremo compreso ed il secondo escluso diventano: a d(x)= d[x - x+a) Va precisato che il riferimento [x - x+a) esprime un intervallo i cui estremi sono valori puntuali su scala continua, anche se usualmente nei testi di demografia tale classe sottintende una tra le possibili modalità assunte da una variabile aleatoria numerabile, così come in precedenza [x - x+1) veniva indicata attraverso la variabile aleatoria intera x. Con la notazione intervallare demografica avremo allora: a d ( x) l ( x) l ( x a ) a q ( x) a m( x ) a L( x ) a l ( x) a d ( x) l ( x) l ( x a) l ( x) l ( x) a d ( x) a L( x ) a l ( x) l ( x a ) 2 L( x ) a a d ( x) 2 d(x) e aL(x) rappresentano, rispettivamente, i decessi e la popolazione media su tutto l’intervallo di ampiezza generica a, a partire dall’età esatta x. Inoltre, la relazione tra tassi e probabilità diventa: a 17 a q( x) 2a a m( x ) 2 a a m( x ) che, per classi quinquennali (a= 5) è: 5 q ( x) d ( x) l ( x) 5 d ( x) d ( x) 5 L( x) 5 5 2 5 d ( x) 5 L( x) 1 1 5 d ( x) 5 2 5 L( x) 5 10 5 m( x) 2 5 5 m( x ) Quando il riferimento è annuale, la probabilità q(x) è sempre inferiore al tasso m(x), poiché il denominatore è superiore, (l(x) > L(x)). Tuttavia, con a>1, considerando classi quinquennali ad esempio, la probabilità di morte dipende dalla lunghezza di a e copre tutti i cinque anni del quinquennio, mentre il tasso indica un numero medio di eventi per persona in ogni singolo anno del quinquennio. Quindi il primo indicatore è circa cinque volte il secondo e la relazione d’ordine s’inverte: 5q(x) >> 5m(x). 18 Questo aspetto è interessante perché depone a favore del tasso come indicatore di rischio, in quanto indipendente dall’intervallo di misura, che invece condiziona la probabilità. Sempre considerando intervalli costanti d’ampiezza a generica, con d[x - x+a) = ad(x) eventi, l(x) sopravviventi all’istante puntuale x, avremo: a f ( x) a w 1 x 0 d ( x) d ( x) a l ( x) l ( x a) l (0) S ( x) S ( x a) f(x) esprime la probabilità non condizionata che accada l’evento in esame tra l’x-esimo e l’x+a-esimo istante (o compleanno) escluso, rispetto a tutti gli intervalli possibili. In pratica, af(x) rappresenta la probabilità che spetta all’intervallo [x - x+a) e dipende anche dall’ampiezza a. a a f(x) = Pr[X [x - x +a)] dove la variabile aleatoria X (età in anni compiuti) indica il tempo dell’evento d’interesse, che può accadere nell’intervallo in esame come in tutti i possibili intervalli concorrenti. Di conseguenza avremo: w1 x 0 a a f ( x) f ( x) 0 d (0) a d (1a) a d (2a) d [( w a) w) d [0 w) ... 1 l (0) l (0) l (0) l (0) l (0) a a f ( w) 0 a 19 Ritornando, per semplicità, all’intervallo unitario (a=1), è facile verificare il collegamento tra probabilità condizionata q(x) e incondizionata f(x): q( x) d ( x) l ( x) d ( x) l (0) j 0 d ( j ) x 1 d ( x) / l (0) 1 j 0 d ( j ) / l (0) x 1 f ( x) 1 j 0 f ( j) x 1 f ( x ) q ( x ) 1 j 0 f ( j ) x 1 f(0)= q(0) f(1) = q(1)(1- f(0)) = q(1)(1- q(0))= q(1)p(0) f(2) = q(2) [1- (f(0)+ f(1))] = q(2) [1- q(0) - q(1) + q(1)q(0)] = q(2) [1- q(0)][ 1- q(1)] = q(2) p(0) p(1) f(x) = q(x) [1- q(0)] [1- q(1)] … [1- q(x-1)] = q(x) p(0) p(1)… … p(x-1) Questa espressione indica che per morire nel compleanno x è non si può fare a meno di sopravvivere sino al compleanno x-1, 20 quindi essere esposti a rischio nel compleanno x e subire l’evento prima del compleanno x+1. Inoltre, poiché: S(x) = p(0) p(1) … p(x-1) l’espressione finale di f(x) si può semplificare nella probabilità composta: f(x) = q(x) S(x) → Pr{A e B}= Pr{B|A}Pr{A} La probabilità condizionata è allora: q(x)= f(x) /S(x) Tenendo poi conto che: x 1 l ( x) l (0) j 0 d ( j ) S ( x) 1 j 0 f ( j) l (0) l (0) x 1 è facile notare come, per il tempo limite w della sommatoria, quando la generazione è estinta, la differenza entro parentesi sia nulla e dunque S(w)=0, poiché non esiste alcun soggetto in vita (quindi esposto a rischio) al tempo limite w. 21 5. Variabili aleatorie continue Riprendendo quanto accennato al paragrafo precedente, avremo a f ( x) a w 1 x 0 d ( x) a d ( x) l ( x) l ( x a) l (0) S ( x) S ( x a) Allora, se definiamo gli intervalli in forma estesa, il rischio condizionato aq(x) diventa: a q(x) = Pr{X [x - x+a) | X x } = Pr{X [x - x+a) ] / Pr[X x } = [S(x)- S(x+a)] / S(x) S ( x) S ( x a ) = af(x)/ S(x) S ( x) Ovviamente, ponendo a=1, si ottiene l’usuale definizione della probabilità q(x). Ma è da notare che questa definizione dipende sia dall’età x sia dall’ampiezza dell’intervallo a e quindi una misura di rischio indipendente dall’intervallo in esame è intuitivamente: 22 S ( x) S ( x a) h( x ) = af(x)/ aS(x) aS ( x) che ovviamente non risente dell’intervallo su cui è calcolato. Restringendo l’intervallo a ad un infinitesimo e passando ad una notazione in cui il tempo di esposizione al rischio è continuo all’interno di un dominio definito, ovvero passando dalla variabile aleatoria X usata nelle tavole attuariali alla variabile aleatoria continua T, parleremo di densità istantanea f(t): S (t ) S (t a) f (t ) lim a 0 a S (t a) S (t ) lim S ' (t ) a 0 a f(t) indica la probabilità incondizionata di accadimento dell’evento che spetta ad un intervallo infinitesimo, che è zero in tempo continuo e con f(t) continua. Tale funzione si può esprimere attraverso la derivata prima di -S(t). Infatti: F(t) = 1 - S(t) F(t)′ = - S(t)′= f(t) Senza rapportare questa quantità all’ampiezza a dell’intervallo infinitesimo, con a0 il limite risulterebbe nullo, infatti: il limite di f(t) per a →0 sarebbe: S(t)- S(t)= 0. Attribuendo alla variabile aleatoria T la potenza del continuo, accade che entro qualsiasi intervallo finito cadano un'infinità di valori della variabile stessa: di conseguenza non si può pensare di attribuire a ciascuno di essi un valore finito di probabilità f(t). In pratica, la massa di probabilità f(t), che spetta a ciascuno degli infiniti valori puntuali della variabile aleatoria all’interno di un 23 qualsiasi intervallo, non può che essere nulla. Diversamente da quanto accade con variabili aleatorie discrete e numerabili. Quando T è la variabile aleatoria che esprime l’accadimento dell’evento in esame in un tempo continuo, il riferimento ai tassi di transizione o alle probabilità istantanee di cambiamento di stato diventa formalmente diverso: S(t) = Pr {t T } = 1- F(t) quindi: f(t)= - S(t)′ f(t)=limt0 Pr { t T< t + t } /t h(t)=limt0 Pr { t T< t + t| t T } /t h(t ) f (t ) S (t )' ln S (t ) S (t ) S (t ) t t h( x)dx ln S ( x) 0t con S (0) 1 avremo 0 t h( x)dx ln S (t ) ln(1) 0 t S (t ) exp h( x)dx 0 H (t ) S (t ) e ln S (t ) H (t ) t H (t ) h( x)dx 0 h(t ) H (t ) t 24 Si ricordi che la funzione di distribuzione cumulata per una variabile aleatoria continua X è definita come la probabilità che la variabile X assuma un qualsiasi valore minore di x: F(x) = Pr[X ≤ x] La funzione F(x) è non decrescente, limitata tra 0-1, ed esiste per tutte le variabili aleatorie. Vanno ricordati i seguenti punti: 1) Se f:[a, b] →R è una funzione continua, allora la funzione integrale F(x) è derivabile in [a, b] e F′(x) = f(x) per ogni x [a, b], con: x F ( x) f (u )du a 2) Se f:[a, b] →R è una funzione continua e F(x) :[a, b] →R una primitiva di f, ovvero F′(x) = f(x) allora b F (b) F (a) f (u )du a 3) Nel continuo per un qualsiasi punto x che esprima Pr{X=x} avremo f(x)= 0: 1-F(x) = 1- Pr[X ≤ x] = Pr[X ≥ x] = S(x) e quindi b F(b) - F(a) = [1-F(a)]-[1- F(b)]= S (a) S (b) f (u )du a