Fondamenti di Probabilità Lucio Barabesi Capitolo 1 Eventi e classi di eventi 1.1. Nozioni preliminari Si consideri un esperimento (o un fenomeno) nei confronti del quale ci si trova in condizioni di incertezza. L'incertezza è determinata dal fatto che l'esperimento (o il fenomeno) in questione sia suscettibile di verificarsi secondo una pluralità di risultati, tali che uno (e uno solo) di essi si deve necessariamente realizzare. In questo caso, l'esperimento (o il fenomeno) è detto aleatorio. L'insieme H i cui elementi rappresentano i possibili risultati dell'esperimento aleatorio, è detto spazio fondamentale (o insieme delle eventualità) e il generico elemento = di H è anche detto eventualità. Ogni parte I di H identifica un evento e il risultato = realizza I se = − I . Inoltre, un evento Ö=× composto da un solo risultato è detto evento elementare. Infine, l'evento H viene anche detto evento certo, in quanto si realizza sempre, mentre l'insieme vuoto g è detto evento impossibile. Per quanto riguarda la cardinalità di H, vi sono tre principali situazioni di interesse. Nel primo caso, H è finito con cardÐHÑ œ 8, ovvero contiene un numero finito 8 di risultati e dunque H œ Ö=" ß á ß =8 ×. Nel secondo caso, H è numerabile, ovvero contiene una infinità numerabile di risultati e dunque H œ Ö=" ß =# ß á ×. Infine, nel terzo caso, H è non numerabile, ovvero contiene un'infinità non numerabile di risultati. Esempio 1.1.1. Si consideri una moneta con le facce contrassegnate dai simboli “testa” e “croce”, che viene comunemente adottata nel più semplice gioco d'azzardo, detto appunto testa e croce. Questa terminologia deriva dalle sagome che erano coniate su molte monete italiane dei secoli passati, in quanto una faccia usualmente raffigurava il volto del re, mentre l'altra riportava il simbolo cristiano della croce. Simili terminologie sono comuni a molte culture, con un nome generalmente derivante dalle raffigurazioni sulle facce dei conii. Ad esempio, nell'antica Roma i due simboli venivano denominati “navis” e “caput”, dal momento che su alcune monete romane era rappresentata una nave su una 2 Eventi e classi di eventi faccia e la testa dell'imperatore sull'altra. Analogamente, l'uso nel mondo anglosassone dei termini “head” e “tail” per i simboli sulle due facce deriva probabilmente dalla moneta da dieci centesimi di sterlina, su cui erano rappresentate la faccia del monarca regnante, ed un leone araldico con una coda in evidenza. Figura 1.1.1. Una lira del 1863 raffigurante i simboli “testa” e croce”. Com'è noto, il gioco consiste semplicemente nello scommettere su una delle due facce e nel lanciare in aria la moneta. La faccia vincente è quella mostrata dalla moneta dopo la caduta. Dunque, il gioco è in effetti un esperimento aleatorio. Se si indicano rispettivamente con =" e =# i risultati relativi al verificarsi delle facce contrassegnate dalla testa e dalla croce, lo spazio fondamentale è dato da H œ Ö=" ß =# × e quindi H è finito con cardÐHÑ œ #. Si noti che esiste una certa arbitrarietà nella scelta della codifica dei risultati. Ad esempio, molti autori preferiscono indicare in modo più esplicito i due risultati solamente con i simboli > e - . In questo caso, lo spazio fondamentale viene scritto semplicemente come H œ Ö>ß - ×. Esempio 1.1.2. I dadi sono stati adottati a scopo di gioco d'azzardo fino dall'antichità. La loro origine sembra risalire a circa 5000 anni fa nella regione dell'attuale India. Riferimenti al gioco dei dadi sono contenuti nella Bibbia, e il gioco d'azzardo con tre dadi era molto popolare nell'antica Grecia e soprattutto nell'antica Roma. Nel Medioevo il gioco con i dadi era uno dei passatempi preferiti dei cavalieri. Molti problemi classici di calcolo delle probabilità si sono originati dal gioco dei dadi (si veda Gordon, 1997, Hald, 1990). Addirittura, in quello che può essere considerato il primo trattamento della Teoria della Probabilità, ovvero nel Liber de Ludo Aleae dell'italiano Gerolamo Cardano (1501-1576), il gioco dei dadi è centrale nell'esposizione. Cardano ebbe una vita avventurosa e molto travagliata, e fu anche un giocatore d'azzardo oltre che matematico, tanto che nel Liber de Ludo Aleae (scritto verso il 1560, ma pubblicato postumo solo nel 1663) esiste addirittura una sezione dedicata ai 3 Capitolo 1 metodi per barare efficacemente (per una biografia di Cardano si veda Ore, 1953). Figura 1.1.2. Gerolamo Cardano (1501-1576). I dadi comunemente adottati nel gioco d'azzardo sono cubi con le facce marcate da 3 punti, dove 3 œ "ß á ß ', e le somme dei punti su due facce contrapposte sono pari a sette (si veda la Figura 1.1.3). Si suppone che dadi di questo tipo siano stati adoperati anche dagli antichi etruschi, non solo per gioco, ma anche per divinazione. Figura 1.1.3. Comuni dadi da gioco e “sviluppo” di un singolo dado. Se si considera un singolo dado, il gioco consiste nel far rotolare il dado su una superficie piana e convenzionalmente viene preso come esito del lancio il valore che si viene a trovare sulla faccia rivolta verso l'alto quando il dado termina il proprio movimento. Anche in questo caso il gioco è dunque un esperimento aleatorio. Se si indica con =3 il risultato relativo al verificarsi della faccia contrassegnata da 3 punti, si ha H œ Ö=" ß =# ß =$ ß =% ß =& ß =' × e quindi H è finito con cardÐHÑ œ '. Tenendo presente la discussione nell'Esempio 1.1.1, la codifica 4 Eventi e classi di eventi dello spazio fondamentale può essere data da H œ Ö"ß #ß $ß %ß &ß '×, interpretando tuttavia le cifre come simboli piuttosto che come numeri naturali. In questo caso, l'evento che si verifichi un numero pari di punti è dato da I œ Ö#ß %ß '×, ovvero I è la parte di H costituita da tutti i risultati relativi al verificarsi di una faccia contrassegnata da un numero pari di punti. Inoltre, l'evento che si verifichi un numero di punti maggiore o uguale a ' è dato da I œ Ö'×, che è effettivamente un evento elementare e che non deve essere ingenuamente confuso con il risultato '. Infine, l'evento che si verifichi un numero di punti maggiore di ) è dato da I œ g, ovvero I è un evento impossibile. Esempio 1.1.3. Si consideri l'esperimento aleatorio che consiste nell'inserire in modo casuale 7 palline in Q celle. In questo caso, gli elementi di H sono in corrispondenza biunivoca con tutte le possibili configurazioni di palline nelle celle. Se le palline sono distinguibili, allora H è finito con cardÐHÑ œ Q 7 , . Al fine di mentre se le palline sono indistinguibili, allora cardÐHÑ œ Q 7" 7 rappresentare le varie configurazioni, almeno per valori modesti di 7 e Q , si adottano di solito Q spazi fra ÐQ "Ñ barre per indicare le celle, mentre le palline vengono indicate come simboli differenti all'interno delle barre se sono distinguibili e con un asterisco se sono indistinguibili. Ad esempio, supponendo che Q œ $ e 7 œ #, nel caso di palline distinguibili (che vengono indicate di seguito con i simboli + e , ), si ha cardÐHÑ œ $# œ *. Dunque, in modo leggermente informale anche se efficace, i possibili risultati dell'esperimento aleatorio possono essere rappresentati come =" œ ± +, ± ± ± ß =# œ ± ± +, ± ± ß =$ œ ± ± ± +, ± ß =% œ ± + ± , ± ± ß =& œ ± + ± ± , ± ß =' œ ± ± + ± , ± ß =( œ ± , ± + ± ± ß =) œ ± , ± ± + ± ß =* œ ± ± , ± + ± . Nel caso di palline indistinguibili si ha cardÐHÑ œ %# œ ', e in questo caso si ottiene =" œ ± ‡‡ ± ± ± ß =# œ ± ± ‡‡ ± ± ß =$ œ ± ± ± ‡‡ ± ß =% œ ± ‡ ± ‡ ± ± ß =& œ ± ‡ ± ± ‡ ± ß =' œ ± ± ‡ ± ‡ ± . Supponendo invece che sia possibile inserire al più una pallina per cella e quindi risulta 7 Ÿ Q , se le palline sono distinguibili si ha cardÐHÑ œ Q xÎÐQ 7Ñx, mentre se le palline sono indistinguibili allora si ha cardÐHÑ œ Q 7 . Considerando di nuovo Q œ $ e 7 œ #, nel caso di palline distinguibili si ha cardÐHÑ œ $xÎ"x œ ', e i possibili risultati dell'esperimento aleatorio possono essere rappresentati come 5 Capitolo 1 =" œ ± + ± , ± ± ß =# œ ± + ± ± , ± ß =$ œ ± ± + ± , ± ß =% œ ± , ± + ± ± ß =& œ ± , ± ± + ± ß =' œ ± ± , ± + ± . Al contrario, nel caso di palline indistinguibili si ha cardÐHÑ œ $# œ $, e si ottiene =" œ ± ‡ ± ‡ ± ± ß =# œ ± ‡ ± ± ‡ ± ß =$ œ ± ± ‡ ± ‡ ± . Per i dettagli relativi al calcolo combinatorio relativo alle configurazioni di palline nelle celle del presente Esempio e per le corrispondenti applicazioni alla meccanica quantistica, si veda Feller (1968, p.9). Esempio 1.1.4. Si consideri una moneta con le facce contrassegnate dai simboli “testa” e “croce” e l'esperimento aleatorio che consiste nel lanciare ripetutamente la moneta fino a quando non si presenta il simbolo “testa”. Se si indica con =8 il risultato relativo al verificarsi del primo simbolo “testa” all'8-esimo lancio, lo spazio fondamentale è dato da H œ Ö=" ß =# ß á × e quindi H è numerabile. Tenendo presente la discussione fatta nell'Esempio 1.1.1, una codifica più immediata dello spazio fondamentale è data da H œ Ö"ß #ß á ×. Considerando una situazione specifica, l'evento I tale che si verifichi il primo simbolo testa ad un numero pari di lanci è dato da I œ Ö#ß %ß á ×. Dunque, anche l'evento I è numerabile. Esempio 1.1.5. Si consideri il tempo di attesa per un evento sismico in una determinata zona. Ogni risultato relativo a questo fenomeno aleatorio è del tipo “il tempo di attesa è pari a > unità temporali”, dove > !. Dunque, una formalizzazione dello spazio fondamentale è data da H œ Ò!ß ∞Ò, per cui H non è numerabile. Considerando una situazione specifica, l'evento tale che il tempo di attesa sia compreso tra 1 e $ unità temporali è dato da I œ Ò"ß $Ó e quindi anche l'evento I non è numerabile. 1.2. Classi di eventi e operazioni sugli eventi Un insieme X costituito da eventi di H è detto classe di eventi. La classe costituita da tutti gli eventi di H, e dagli eventi g e H, è detto insieme delle parti di H ed è indicato con la notazione c ÐHÑ. Una classe di eventi verrà talvolta indicata con ÐI3 Ñ3−M , dove M è un opportuno insieme di indici, eventualmente non numerabile. Se M œ Ö"ß á ß 8×, per indicare la classe si adotta la notazione 6 Eventi e classi di eventi ÐI3 Ñ83œ" . Se M œ Ö"ß #ß á ×, la classe è detta successione di eventi e viene indicata con la notazione ÐI8 Ñ8 " . Inoltre, se si ha M œ Ö!ß "ß á ×, per indicare la successione di eventi si adotta anche la notazione ÐI8 Ñ8 ! . Dal momento che in effetti gli eventi sono insiemi, le usuali operazioni insiemistiche possono essere immediatamente considerate sugli eventi di H. Tuttavia, è opportuno dare a queste operazioni una lettura nel presente ambito con adeguate terminologie e definizioni. Dati due eventi I" e I# , si dice che I" implica I# e si adotta la notazione I" § I# , quando il verificarsi di I" comporta necessariamente il verificarsi di I# , ovvero se e solo se un risultato che realizza I" è anche un risultato che realizza I# . Inoltre, due eventi I" e I# sono detti uguali e si adotta la notazione I" œ I# , quando il verificarsi dell'uno implica il verificarsi dell'altro e viceversa, ovvero se si ha contemporaneamente I" § I# e I# § I" . Infine, l'evento opposto (o evento contrario) di I è dato da I - œ Ö= − H À =  I× , ovvero l'evento I - si verifica quando non si verifica I . In particolare, si ha H- œ g. Data una classe di eventi ÐI3 Ñ3−M di H, l'evento unione è dato da I3 œ Ö= − H À b3 − Mß = − I3 × , 3−M ovvero l'evento 3−M I3 si verifica quando si verifica almeno uno degli eventi della classe. Nel caso in cui la classe è costituita da 8 eventi ÐI3 Ñ83œ" di H, l'evento unione viene usualmente scritto come 83œ" I3 , e se 8 œ # l'evento unione viene indicato semplicemente con la notazione I" ∪ I# . Infine, quando si considera una successione di eventi ÐI8 Ñ8 " , l'evento unione viene indicato con ∞ 8œ" I8 . Data una classe di eventi ÐI3 Ñ3−M di H, l'evento intersezione è dato da I3 œ Ö= − H À a3 − Mß = − I3 × , 3−M ovvero l'evento 3−M I3 si verifica quando si verificano tutti gli eventi della classe. In modo simile a quanto fatto per l'evento unione, nel caso in cui la classe sia costituita da 8 eventi, l'evento intersezione viene scritto come 83œ" I3 , e se 8 œ # si adotta la notazione I" ∩ I# . Infine, nel caso di una successione di eventi, l'evento intersezione viene indicato con ∞ 8œ" I8 . Esistono due utili relazioni, che prendono nome dal matematico inglese Augustus De Morgan (1806-1871), autore fra l'altro del testo An Essay on 7 Capitolo 1 Probabilities (1838), e che permettono di esprimere un evento intersezione come un evento unione (e viceversa), ovvero I3 œ I3 - 3−M 3−M e I3 œ I3 . - 3−M 3−M Dati due eventi I" e I# , l'evento differenza (o evento complementare di I# rispetto ad I" ) è dato da I" Ï I# œ Ö= − H À = − I" , =  I# × , ovvero l'evento I" Ï I# si verifica quando si verifica I" e non si verifica I# . In particolare, si ha I - œ H Ï I , mentre risulta evidente la relazione I" Ï I# œ I" ∩ I#- . Si noti che se I" § I# , allora si ha I" Ï I# œ g, in quanto non è possibile che si verifichi I" e non si verifichi I# quando il verificarsi di I" implica il verificarsi di I# . Inoltre, è ovvio che I Ï I œ g, in quanto è impossibile l'evento che si verifica quando contemporaneamente si verifica e non si verifica I . Infine, se I# § I" , allora l'evento I" Ï I# è detto differenza propria. Esempio 1.2.1. Si consideri l'esperimento aleatorio che consiste nel lancio di un dado. Dati gli eventi I" œ Ö"ß #× e I# œ Ö"ß #ß $ß %×, si ha I" § I# . Inoltre, risulta I"- œ Ö$ß %ß &ß '× e I#- œ Ö&ß '×, mentre si ha I" ∪ I# œ Ö"ß #ß $ß %× , e I" ∩ I# œ Ö"ß #× . Dato l'ulteriore evento I$ œ Ö"ß &×, risulta I3 œ Ö"ß #ß $ß %ß &× , $ 3œ" 8 Eventi e classi di eventi e I3 œ Ö"× . $ 3œ" Infine, si ha I" Ï I# œ g, mentre I# Ï I" œ Ö$ß %× . Gli eventi della classe ÐI3 Ñ83œ" sono detti incompatibili quando il verificarsi di uno di essi esclude il verificarsi di tutti gli altri, ovvero quando I3 ∩ I4 œ g per ogni 3 Á 4 œ "ß á ß 8. Ovviamente, due eventi I" e I# sono incompatibili se I" ∩ I# œ g. In particolare, I e I - sono eventi incompatibili, così come ciascun evento elementare è incompatibile con tutti gli altri eventi elementari di H. Inoltre, l'evento impossibile è incompatibile con tutti gli altri eventi. Infine, se I" e I# sono incompatibili, allora I" Ï I# œ I" . Gli eventi della classe ÐI3 Ñ83œ" sono detti esaustivi quando uno di essi si deve necessariamente verificare, ovvero quando I3 œ H . 8 3œ" Si dice che gli eventi della classe ÐI3 Ñ83œ" costituiscono una partizione finita di H quando sono incompatibili e esaustivi. In modo analogo, gli eventi della successione ÐI8 Ñ8 " , sono detti incompatibili quando I8 ∩ I7 œ g per ogni 8 Á 7 œ "ß #ß á , mentre sono detti esaustivi quando ∞ 8œ" I8 œ H. Gli eventi della successione ÐI8 Ñ8 " costituiscono una partizione numerabile di H quando sono incompatibili e esaustivi. Esempio 1.2.2. Si consideri il lancio di un dado. Gli eventi I" œ Ö"ß $×, I# œ Ö#ß %ß &× e I$ œ Ö'× costituiscono una partizione finita di H. Gli eventi I" œ Ö"ß $ß %×, I# œ Ö#ß %ß &× e I$ œ Ö%ß '× sono esaustivi, anche se non costituiscono una partizione finita di H. Data una successione ÐI8 Ñ8 " , si dice limite inferiore della successione l'evento 9 Capitolo 1 lim inf I8 œ I5 , ∞ 8 ∞ 8œ" 5œ8 ovvero l'evento lim inf8 I8 appartiene a tutti gli eventi della successione stessa ad esclusione al più di un numero finito di questi. Inoltre, si dice limite superiore della successione l'evento lim sup I8 œ I5 , ∞ 8 ∞ 8œ" 5œ8 ovvero l'evento lim sup8 I8 appartiene ad una infinità numerabile di eventi della successione stessa. Se i due eventi lim inf8 I8 e lim sup8 I8 coincidono, allora si dice limite della successione l'evento lim I8 œ lim inf I8 œ lim sup I8 . 8 8 8 Inoltre, se I8 § I8" per ogni 8 œ "ß #ß á , la successione è detta crescente, mentre se I8" § I8 per ogni 8 œ "ß #ß á , la successione è detta decrescente. Successioni crescenti o decrescenti sono dette monotone. Dalle precedenti definizioni risulta facile verificare che una successione crescente ammette sempre limite, dato da lim I8 œ I8 , ∞ 8 8œ" così come una successione decrescente ammette sempre limite, dato da lim I8 œ I8 . ∞ 8 8œ" Esempio 1.2.3. Si supponga di considerare un esperimento aleatorio che consiste nello scegliere casualmente un punto su un segmento unitario. In questo caso, lo spazio fondamentale associato all'esperimento aleatorio è dato da H œ Ò!ß "Ó. Si consideri la successione ÐI8 Ñ8 " il cui generico evento I8 risulta I8 œ Ò!ß Ð" Ð "Ñ8 ÑÎ%Ó . Dunque, si ha I8 œ Ò!ß "Î#Ó se 8 è dispari, mentre I8 œ Ö!× se 8 è pari, da cui 10 Eventi e classi di eventi lim inf I8 œ I5 œ Ö!× œ Ö!× ∞ 8 ∞ ∞ 8œ" 5œ8 8œ" e lim sup I8 œ I5 œ Ò!ß "Î#Ó œ Ò!ß "Î#Ó . ∞ 8 ∞ ∞ 8œ" 5œ8 8œ" Non esiste dunque il limite della successione in quanto lim inf8 I8 e lim sup8 I8 non coincidono. Se si considera invece la successione decrescente ÐI8 Ñ8 " il cui generico evento risulta I8 œ Ò!ß 8" Ó , il suo limite è dato da lim I8 œ I8 œ Ö!× , ∞ 8 8œ" in quanto, verificandosi l'evento elementare Ö!×, si verifica ciascun evento I8 della successione. Se si considera invece la successione crescente ÐI8 Ñ8 " il cui generico evento è dato da I8 œ Ò!ß Ð" 8" ÑÎ#Ó , il suo limite risulta lim I8 œ I8 œ Ò!ß "Î#Ó , ∞ 8 8œ" in quanto, se si verifica l'evento Ò!ß "Î#Ó, si verifica almeno un evento I8 della successione. Si noti che le operazioni definite per gli eventi possono essere estese in modo generale alle classi di eventi, dal momento che in effetti classi di eventi costituiscono insiemi di insiemi. In particolare, date due classi di eventi X" e X# , si dice che X" è contenuta in X# e si adotta la notazione X" § X# , se e solo se per ogni evento I − X" si ha I − X# . Due classi di eventi X" e X# sono dette uguali e si adotta la notazione X" œ X# , quando si ha contemporaneamente X" § X# e 11 Capitolo 1 X# § X" . Se ÐX3 Ñ3−M rappresenta una classe di classi di eventi, dove M è un insieme eventualmente non numerabile, la rispettiva unione è definita come X3 œ ÖI − c ÐHÑ À b3 − Mß I − X3 × , 3−M mentre la rispettiva intersezione è definita come X3 œ ÖI − c ÐHÑ À a3 − Mß I − X3 × . 3−M Se M œ Ö"ß #ß á ×, in modo simile a quanto fatto per le successioni di eventi, si adotta la notazione ÐX8 Ñ8 " , mentre l'unione e l'intersezione vengono indicate ∞ 8œ" rispettivamente con ∞ X8 . 8œ" X8 e 1.3. 5 -algebre Dato un esperimento aleatorio, anche se ogni parte di H può essere interpretata come un evento, certe parti potrebbero non essere interessanti ai fini di un determinato problema, oppure potrebbero essere troppo complicate per essere analizzate. In ogni caso specifico, è conveniente dunque scegliere una classe di eventi non vuota, in modo che possieda caratteristiche di stabilità rispetto alle principali operazioni insiemistiche. Una importante classe di eventi che gode di questa proprietà è la cosiddetta 5 -algebra. Definizione 1.3.1. Si dice 5-algebra di eventi una classe Y non vuota di eventi di H tale che: i) se I − Y , allora I - − Y ; ii) se ÐI8 Ñ8 " è una successione di eventi di Y , allora ∞ 8œ" I8 − Y . In pratica la 5 -algebra è una classe di eventi “chiusa” rispetto alle operazioni di complementazione e unione numerabile. Dunque, esempi immediati di 5 algebre sono la classe c ÐHÑ, oppure la classe Ögß H×. Esempio 1.3.1. Si consideri lo spazio fondamentale H œ Ö=" ß =# ß =$ ×. Le possibili 5 -algebre che si possono costruire da H sono date da Y" œ Ögß H× , 12 Eventi e classi di eventi Y# œ Ögß Ö=" ×ß Ö=# ß =$ ×ß H× , Y$ œ Ögß Ö=# ×ß Ö=" ß =$ ×ß H× , Y% œ Ögß Ö=$ ×ß Ö=" ß =# ×ß H× , Y& œ Ögß Ö=" ×ß Ö=# ×ß Ö=$ ×ß Ö=" ß =# ×ß Ö=" ß =$ ×ß Ö=# ß =$ ×ß H× œ c ÐHÑ . Si noti che Y" è contenuta in tutte le altre 5 -algebre, mentre Y& contiene tutte le altre. Teorema 1.3.2. Ogni 5 -algebra Y contiene la 5 -algebra Ögß H×. Dimostrazione. Dal momento che ogni 5 -algebra è non vuota, esiste almeno un evento I − Y . Allora, dalla Definizione 1.3.1, si ha anche I - − Y e I ∪ I - œ H − Y . Di conseguenza, H- œ g − Y . Tenendo presente il precedente Teorema, la 5-algebra Ögß H× è detta la più piccola 5 -algebra su H. Al contrario, dal momento che per ogni 5 -algebra Y su H si ha Y § c ÐHÑ, allora c ÐHÑ è detta la più grande 5 -algebra su H. ∞ 8œ" I8 Teorema 1.3.3. Se ÐI8 Ñ8 " è una successione di eventi di Y , allora − Y. Dimostrazione. Dal momento che ÐI8- Ñ8 " è una successione di eventi di Y , ∞ - si ha ∞ 8œ" I8 − Y e di conseguenza Ð 8œ" I8 Ñ − Y . Dalla relazione di De ∞ - Morgan si ha ∞ 8œ" I8 œ Ð 8œ" I8 Ñ , da cui segue la tesi. Teorema 1.3.4. Se I" ß I# − Y , allora I" Ï I# − Y . Dimostrazione. Dal momento che I" ß I#- − Y , anche I" ∩ I#- − Y . La tesi segue dalla relazione I" Ï I# œ I" ∩ I#- . Attraverso i precedenti Teoremi si deduce che la 5 -algebra è una classe di eventi “chiusa” rispetto alle principali operazioni insiemistiche considerate nella Sezione 1.2, ovvero rispetto alla complementazione, all'unione e all'intersezione numerabile, e alla differenza. Inoltre, se ÐI8 Ñ8 " è una successione di eventi di Y anche gli eventi lim inf8 I8 , lim sup8 I8 e lim8 I8 appartengono alla 5 algebra, in quanto sono definiti tramite unioni e intersezioni numerabili di eventi. 13 Capitolo 1 Teorema 1.3.5. Se ÐY3 Ñ3−M è una classe di 5-algebre, allora l'intersezione Y œ 3−M Y3 è una 5-algebra. Dimostrazione. L'intersezione è non vuota, dal momento che contiene almeno la 5 -algebra Ögß H×. Se I − Y , allora I − Y3 per ogni 3 − M . Dunque, I - − Y3 per ogni 3 − M e quindi I - − Y . In modo simile, se ÐI8 Ñ8 " − Y , allora I8 − Y3 per ogni 8 " e 3 − M . Dunque, ∞ 8œ" I8 − Y3 per ogni 3 − M e quindi ∞ 8œ" I8 − Y . Anche se il precedente Teorema assicura che l'intersezione di 5-algebre è ancora una 5-algebra, si noti che l'unione 3−M Y3 non è in generale una 5 algebra. Nella Teoria della Probabilità risulta fondamentale considerare inizialmente una classe di eventi con una struttura semplice con proprietà minimali e successivamente considerare una 5-algebra che la contiene. Più esattamente, data una classe di eventi X su H, si dice 5-algebra generata da X , e si indica con 5 ÐX Ñ, la più piccola 5 -algebra che contiene X . Dunque, se ÐY3 Ñ3−M è la classe di 5 -algebre tali che X § Y3 , allora 5 ÐX Ñ œ Y 3 . 3−M Evidentemente 5 ÐX Ñ contiene, oltre a tutti gli eventi di X , anche tutti gli eventi che si possono ottenere al più da un insieme numerabile di operazioni effettuate sugli eventi di X . Esempio 1.3.2. Si consideri di nuovo l'Esempio 1.3.1. Data la classe di eventi X œ Ögß Ö=# ß =$ ×× , allora X § Y# e X § Y& . Quindi si ha 5 ÐX Ñ œ Y3 œ Y# . 3−Ö#ß&× Si noti inoltre che Y3 œ Ögß Ö=" ×ß Ö=# ×ß Ö=" ß =$ ×ß Ö=# ß =$ ×ß H× 3−Ö#ß$× non è una 5-algebra. Ad esempio, la precedente classe non contiene l'evento I œ Ö=" ß =$ × ∩ Ö=# ß =$ × œ Ö=$ × . 14 Eventi e classi di eventi 1.4. Spazi probabilizzabili Se Y è una 5 -algebra su H, la coppia ÐHß Y Ñ è detta spazio probabilizzabile. Uno spazio probabilizzabile può essere costruito a partire da una classe iniziale X di eventi di H, in modo tale da considerare la 5 -algebra Y generata da X , ovvero Y œ 5 ÐX Ñ. Se la classe X è scelta in maniera appropriata, 5 ÐX Ñ soddisfa qualsiasi esigenza di carattere pratico, nel senso che contiene tutti gli eventi sui quali normalmente si opera. In ogni caso, sussiste una certa arbitrarietà nella scelta della classe iniziale, in quanto dipende dal criterio con il quale si considerano alcuni eventi interessanti e altri eventi non interessanti. Se H œ Ö=" ß á ß =8 × è finito, si può scegliere la classe degli eventi elementari X œ ÐÖ=3 ×Ñ83œ" come classe iniziale. In questo caso, Y œ 5 ÐX Ñ œ c ÐHÑ. Risulta facile verificare che Y contiene #8 eventi, ovvero cardÐY Ñ œ #8 . In modo analogo, se X œ ÐI3 Ñ83œ" è una partizione finita di H, allora Y œ 5 ÐX Ñ e si ha di nuovo cardÐY Ñ œ #8 . Esempio 1.4.1. Se si considera il lancio di un dado, allora si può scegliere X œ ÐÖ3×Ñ'3œ" , in modo tale che si ha Y œ c ÐHÑ con cardÐY Ñ œ #' œ '%. Tuttavia, se l'interesse dell'esperimento aleatorio è focalizzato solamente sul verificarsi di una faccia pari o dispari, si potrebbero considerare solamente gli eventi I" œ Ö"ß $ß &× e I# œ Ö#ß %ß '×, in modo tale che X œ ÖI" ß I# × costituisce una partizione finita di H. In questo caso, si ha Y œ 5 ÐX Ñ œ Ögß I" ß I# ß H× , con cardÐY Ñ œ ## œ %. Esempio 1.4.2. Un esperimento aleatorio consiste nello spezzare casualmente un segmento di lunghezza unitaria in due parti. Anche se in questo caso lo spazio fondamentale H œ Ò!ß "Ó contiene una infinità non numerabile di eventi elementari, si può considerare gli eventi I" œ Ò!ß "Î$Ò, I# œ Ò"Î$ß #Î$Ò e I$ œ Ò#Î$ß "Ó, che rappresentano rispettivamente l'evento che il segmento sia stato spezzato nella parte inferiore, centrale o superiore. Evidentemente, X œ ÖI" ß I# ß I$ × costituisce una partizione finita di H, per cui Y œ 5 ÐX Ñ œ Ögß I" ß I# ß I$ ß I" ∪ I# ß I" ∪ I$ ß I# ∪ I$ ß H× . Tuttavia, la ricchezza di eventi contenuta in H non viene effettivamente considerata a causa della estrema semplicità della classe iniziale. 15 Capitolo 1 Se H è numerabile, ovvero H œ Ö=" ß =# ß á ×, si può scegliere di nuovo la classe degli eventi elementari X œ ÐÖ=8 ×Ñ8 " come classe iniziale. Dunque, si ha ancora Y œ 5 ÐX Ñ œ c ÐHÑ. Se H è non numerabile, allora non è opportuno considerare l'insieme delle parti c ÐHÑ, in quanto questa classe risulta troppo ampia da probabilizzare (si veda il Capitolo 3). Quindi, ci si deve limitare a scegliere una opportuna classe iniziale, in modo tale che 5 ÐX Ñ contenga gli eventi di interesse per l'analisi dell'esperimento aleatorio. Esempio 1.4.3. Si consideri lo spazio fondamentale H œ ‘. In questo caso, la classe iniziale X può essere scelta come la classe degli eventi del tipo Ó+ß ,Ó. Se si considera dunque la 5 -algebra Y generata da X , ovvero Y œ 5 ÐX Ñ, è opportuno analizzare alcune categorie di eventi che appartengono a Y . La successione di eventi ÐI8 Ñ8 " , dove I8 œ Ó+ 8" ß ,Ó appartiene a Y , ed essendo questa successione decrescente, il suo limite è dato da lim I8 œ Ó+ 8" ß ,Ó œ Ò+ß ,Ó . ∞ 8 8œ" Quindi, Y contiene eventi del tipo Ò+ß ,Ó. Dunque, dal momento che Ò+ß +Ó œ Ö+× appartiene ad Y , Y contiene anche tutti gli eventi elementari. Inoltre, la successione di eventi ÐI8 Ñ8 " , dove I8 œ Ó+ 8ß ,Ó appartiene a Y , ed essendo questa successione crescente, il suo limite è dato da lim I8 œ Ó+ 8ß ,Ó œ Ó ∞ß ,Ó . ∞ 8 8œ" Quindi, Y contiene eventi del tipo Ó ∞ß ,Ó. In generale, si può verificare che la 5 -algebra Y generata da X contiene tutti gli eventi del tipo Ó+ß ,Ò, Ó+ß ,Ó, Ò+ß ,Ò e Ò+ß ,Ó, gli eventi del tipo Ó ∞ß ,Ó, Ó ∞ß ,Ò, Ò+ß ∞Ò e Ó+ß ∞Ò, oltre a tutti gli eventi elementari. Inoltre, Y contiene tutti gli eventi ottenibili da un insieme numerabile di operazioni insiemistiche su questi eventi. Dunque, è molto laborioso costruire un evento che non appartenga a Y (si veda Dudley, 2004, p.493) e in effetti la classe Y soddisfa pienamente tutte le esigenze di carattere pratico. Nel linguaggio della Teoria della Misura, la 5 -algebra discussa nell'Esempio 1.4.3 è detta 5-algebra di Borel, che prende nome dal grande matematico francese Émile Borel (1871-1956), uno dei pionieri della Teoria della Misura e 16 Eventi e classi di eventi delle sue applicazioni alla Teoria della Probabilità. Generalmente, la 5 -algebra di Borel è indicata con U Ð‘Ñ e i suoi elementi sono detti Boreliani. Inoltre, la coppia Ð‘ß U БÑÑ è uno spazio misurabile. Si può dimostrare che la costruzione della 5-algebra di Borel può anche essere fatta a partire dalla classe degli insiemi aperti di ‘ (si veda Dudley, 2004, p.98). Questa costruzione è equivalente a quelle fatte partendo da una qualsiasi classe di insiemi del tipo Ó+ß ,Ò, Ó+ß ,Ó, Ò+ß ,Ò e Ò+ß ,Ó, o da una qualsiasi classe di insiemi del tipo Ó ∞ß ,Ó, Ó ∞ß ,Ò, Ò+ß ∞Ò e Ó+ß ∞Ò. Se “ § ‘, si adotta anche la notazione U Ð“Ñ per indicare la 5 -algebra i cui elementi sono del tipo F ∩ “ con F − U БÑ. Figura 1.4.1. Émile Borel (1871-1956). 1.5. Prodotto cartesiano di spazi fondamentali Si considerino 5 esperimenti aleatori, a ciascuno dei quali risulta associato lo spazio fondamentale H3 , dove 3 œ "ß á ß 5 , e si combinino in modo da ottenere un unico esperimento aleatorio. In questo caso, lo spazio fondamentale prodotto risulta essere il prodotto cartesiano H œ H" ‚ â ‚ H5 , ovvero gli elementi di H sono tutte le possibili 5 -ple Ð=" ß á ß =5 Ñ tali che =" − H" ß á ß =5 − H5 . In questo caso, se I" § H" ß á ß I5 § H5 , si dice evento rettangolare un evento I dello spazio fondamentale prodotto H i cui elementi risultano essere tutte le possibili 5 -ple Ð=" ß á ß =5 Ñ con =" − I" ß á ß =5 − I5 , ovvero I œ I" ‚ â ‚ I5 . 17 Capitolo 1 Inoltre, l'evento I3 § H3 è detto evento proiezione dell'evento rettangolare I su H3 . Infine, se N è una scelta di indici di M , un evento I § H è detto evento cilindrico se si verificano gli eventi I3 § H3 con 3 − N , ovvero I œ J" ‚ â ‚ J5 , dove J3 œ I3 se 3 − N , mentre J3 œ H3 se 3 − M Ï N . Se ÐH" ß Y" Ñß á ß ÐH5 ß Y5 Ñ sono 5 spazi probabilizzabili corrispondenti ai 5 esperimenti aleatori, la 5-algebra prodotto Y relativa allo spazio fondamentale prodotto H è la 5 -algebra generata dalla classe dagli eventi rettangolari di H e si scrive Y œ Y" Œ â Œ Y 5 . La coppia ÐHß Y Ñ è detta spazio probabilizzabile prodotto. Inoltre, per quanto riguarda la costruzione dello spazio probabilizzabile ÐHß Y Ñ, se H è finito o numerabile, allora si può scegliere Y œ c ÐHÑ. Se invece almeno uno degli spazi fondamentali H3 è non numerabile, allora anche H è non numerabile. In questo caso, Y può essere scelta come la 5 -algebra generata dagli eventi rettangolari di H. Nella Teoria della Misura si considera usualmente lo spazio prodotto 5 ‘ œ ‘ ‚ â ‚ ‘. In questo caso, la 5-algebra di Borel su ‘5 è data da U Б5 Ñ œ U Ð‘Ñ Œ â Œ U Ð‘Ñ e può essere costruita a partire dagli insiemi rettangolari di ‘5 del tipo Ó+" ß ," Ó ‚ â ‚ Ó+5 ß ,5 Ó (o in modo simile a quanto visto nella Sezione 1.4, dal prodotto cartesiano di ogni tipo di intervallo o semiretta). Nel linguaggio della Teoria della Misura, la coppia Б5 ß U Б5 ÑÑ è uno spazio misurabile prodotto. Infine, se “ § ‘5 , si adotta la notazione U Ð“Ñ per indicare la 5 -algebra i cui elementi sono del tipo F ∩ “ con F − U Б5 Ñ. In generale, se si considera una classe di spazi fondamentali ÐH3 Ñ3−M , dove M è un insieme eventualmente non numerabile, allora lo spazio fondamentale prodotto è dato da H œ H3 , 3−M ovvero in questo caso gli elementi di H risultano essere tutte le famiglie del tipo Ð=3 Ñ3−M tali che =3 − H3 per ogni 3 − M . Inoltre, si dice evento rettangolare un evento I dello spazio fondamentale prodotto H i cui elementi risultano essere tutte le possibili famiglie Ð=3 Ñ3−M tali che =3 − I3 per ogni 3 − M , ovvero 18 Eventi e classi di eventi I œ I3 . 3−M Infine, se N è una scelta di un numero finito di indici di M , un evento I § H è detto evento cilindrico se si verificano gli eventi I3 § H3 con 3 − N , ovvero I œ J3 , 3−M dove J3 œ I3 se 3 − N , mentre J3 œ H3 se 3 − M Ï N . Se ÐÐH3 ß Y3 ÑÑ3−M è la classe di spazi probabilizzabili corrispondente alla classe di esperimenti aleatori, la 5-algebra prodotto Y sullo spazio fondamentale prodotto H è la 5 -algebra generata dalla classe degli eventi cilindrici di H e viene scritta come Y œ Y3 . 3−M Anche in questo caso, la coppia ÐHß Y Ñ è detta spazio probabilizzabile prodotto. Esempio 1.5.1. Si considerino due lanci di una moneta. Poichè ogni lancio è un esperimento aleatorio che ha come spazio fondamentale H3 œ Ö>ß - ×, con 3 œ "ß # (dove al solito > e - rappresentano gli esiti relativi al verificarsi delle due facce della moneta), lo spazio fondamentale prodotto relativo all'esperimento aleatorio combinato risulta H œ H" ‚ H# œ ÖÐ>ß >Ñß Ð>ß - Ñß Ð- ß >Ñß Ð- ß - Ñ× . La 5 -algebra prodotto è data da Y œ Y" Œ Y# œ c ÐHÑ, dove Y" œ c ÐH" Ñ e Y# œ c ÐH# Ñ, con cardÐY Ñ œ #% œ "'. Dunque, risulta Y œ Ögß ÖÐ>ß >Ñ×ß ÖÐ>ß - Ñ×ß ÖÐ- ß >Ñ×ß ÖÐ- ß - Ñ×ß ÖÐ>ß >Ñß Ð>ß - Ñ×ß ÖÐ>ß >Ñß Ð- ß >Ñ×ß ÖÐ>ß >Ñß Ð- ß - Ñ×ß ÖÐ>ß - Ñß Ð- ß >Ñ×ß ÖÐ>ß - Ñß Ð- ß - Ñ×ß ÖÐ- ß >Ñß Ð- ß - Ñ×ß ÖÐ>ß >Ñß Ð>ß - Ñß Ð- ß >Ñ×ß ÖÐ>ß >Ñß Ð>ß - Ñß Ð- ß - Ñ×ß ÖÐ>ß - Ñß Ð- ß >Ñß Ð- ß - Ñ×ß H× . L'evento I œ ÖÐ>ß >Ñß Ð- ß >Ñ× è rettangolare, dal momento che può essere espresso come I œ I" ‚ I# , dove I" œ Ö>ß - × è un evento di H" , mentre I# œ Ö>× è un evento di H# . L'evento I è 19 Capitolo 1 anche cilindrico, dal momento che I" œ H" , e può essere rappresentato dunque come I œ H" ‚ I# . Al contrario, l'evento I œ ÖÐ>ß >Ñß Ð>ß - Ñß Ð- ß >Ñ× non è rettangolare, in quanto non può essere espresso come prodotto cartesiano di eventi di H" e H# . Esempio 1.5.2. Si analizza ora la generalizzazione dell'Esempio 1.5.1. Si consideri un esperimento aleatorio con esito dicotomico, ovvero suscettibile di assumere due soli risultati =" e =# del tipo “successo” e “insuccesso”. Uno schema che sta alla base di molti modelli probabilistici è appunto la ripetizione di questo esperimento aleatorio per 5 volte. Lo spazio fondamentale prodotto H œ H" ‚ â ‚ H5 relativo alla combinazione dei 5 esperimenti aleatori risulta allora composto da #5 elementi del tipo Ð=4" ß á ß =45 Ñ, dove 43 œ "ß # e 3 œ "ß á ß 5 . In effetti, Ð=4" ß á ß =45 Ñ è il risultato dell'esperimento combinato tale che “=4" si è verificato nel primo esperimento, á , =45 si è verificato nel 5 esimo esperimento”. In pratica H è costituito da tutte le #5 possibili 5 -ple composte dai risultati =" e =# . Quindi, la 5 -algebra prodotto è data da 5 Y œ Y" Œ â Œ Y5 œ c ÐHÑ ed è pertanto costituita da ## eventi. Lo schema appena considerato può essere ulteriormente generalizzato considerando un'infinità numerabile di ripetizioni dell'esperimento aleatorio. In questo caso, lo spazio fondamentale prodotto H œ 8 " H8 relativo alla combinazione degli esperimenti aleatori risulta allora composto dalle successioni del tipo Ð=48 Ñ8 " , dove 48 œ "ß #. Inoltre, la 5-algebra prodotto Y œ 8 " Y8 può essere costruita a partire dalla classe degli eventi cilindrici. Risulta interessante notare che se H8 œ Ö!ß "×, allora ogni elemento di H è in effetti una successione di simboli ! e ". Tenendo presente la rappresentazione binaria dei numeri in Ò!ß "Ó, ogni evento elementare di H può essere quindi messo in corrispondenza con un numero in Ò!ß "Ó. Lo schema considerato è quindi equivalente all'esperimento aleatorio che consiste nello scegliere in modo casuale un punto su un segmento di lunghezza unitaria (per un approfondimento di questi argomenti si consideri Billingsley, 1995, p.1). Si deve infine sottolineare che lo schema delle prove ripetute ora descritto è anche detto schema di Bernoulli, dal momento che fu introdotto dal grande matematico svizzero Jakob Bernoulli (1654-1705), un membro della famosa famiglia di matematici e fisici che include fra l'altro il fratello Johann Bernoulli (1667-1748) e il nipote Daniel Bernoulli (1700-1782). Jakob Bernoulli è l'autore di Ars Conjectandi (pubblicato postumo nel 1713), l'opera che ha posto 20 Eventi e classi di eventi le basi del calcolo combinatorio e introdotto alcuni risultati fondamentali della Teoria della Probabilità. Figura 1.5.1. Jakob Bernoulli (1654-1705) e frontespizio di Ars Conjectandi (1713). Esempio 1.5.3. Si consideri il tempo di attesa per un evento sismico in due determinate zone. Ogni risultato di questo fenomeno aleatorio è del tipo “i tempi di attesa sono rispettivamente pari a >" e ># unità temporali”, dove >" ß ># !. Quindi, dal momento che lo spazio fondamentale relativo a ciascun fenomeno aleatorio è del tipo H3 œ Ò!ß ∞Ò, lo spazio fondamentale prodotto risulta H œ H" ‚ H# œ Ò!ß ∞Ò ‚ Ò!ß ∞Ò . L'evento I œ ÖÐ>" ß ># Ñ − H À >" − Ò"ß $Óß ># − Ò%ß ∞Ò× è rettangolare dal momento che I œ I" ‚ I# , dove I" § H" e I# § H# sono dati da I" œ Ò"ß $Ó e I# œ Ò%ß ∞Ò. Al contrario l'evento I œ ÖÐ>" ß ># Ñ − H À >" ># − Ò!ß $Ó× , ovvero “la somma dei tempi di attesa non supera le $ unità temporali”, non è dato dal prodotto cartesiano di eventi di H" e H# . Infine l'evento I œ ÖÐ>" ß ># Ñ − H À >" − Ò!ß $Ó× , ovvero “il tempo di attesa nella prima zona non supera le $ unità temporali”, risulta esprimibile come prodotto cartesiano I œ I" ‚ H# , dove I" § H" è dato da I" œ Ò!ß $Ó. Quindi, I rappresenta l'evento cilindrico che si verifichi I" nel primo esperimento aleatorio. Per quanto riguarda infine la 5 -algebra prodotto, Y Capitolo 1 21 è in questo caso la 5 -algebra generata dagli eventi rettangolari del tipo I" ‚ I# , dove I" − Y" e I# − Y# , mentre Y" e Y# sono 5-algebre di eventi rispettivamente costruite come nella Sezione 1.4 nel caso di un solo esperimento aleatorio con spazio fondamentale di cardinalità non numerabile. Se si considera infine il tempo di attesa per un evento sismico per zone situate lungo un intero meridiano, allora lo spazio fondamentale prodotto risulta H œ 3−M H3 , dove M rappresenta l'insieme di posizioni sul meridiano. In questo caso, M è un insieme che contiene un'infinita non numerabile di indici e Y può essere scelta come la 5 -algebra generata dalla classe degli eventi cilindrici di H. 1.6. Riferimenti bibliografici Per quanto riguarda la storia della Teoria della Probabilità, si suggerisce di consultare i testi di Hald (1998, 2003). L'approccio alla probabilità basato sulla Teoria della Misura è estesamente considerato nei testi avanzati di Ash e Doléans-Dade (2000), Billingsley (1995), Borovkov (2013), Gut (2005) e Resnick (2014), e nei testi introduttivi di Jacod e Protter (2004), Letta (1993) e Venkatesh (2012). Basandosi sul medesimo approccio, i testi di Dudley (2004) e Kallenberg (2002) forniscono risultati e dimostrazioni in modo dettagliato e sono opportuni per un lettore esigente. Per un approccio classico alla probabilità, si dovrebbe consultare il fondamentale testo di Feller (1968). Capitolo 2 Misure di probabilità 2.1. Definizione assiomatica di probabilità Il trattamento rigoroso della Teoria della Probabilità è stato introdotto intorno al 1930 dal matematico russo Andrej Nikolaevic Kolmogorov (1903-1987). Kolmogorov sviluppò il concetto di probabilità assumendo la Teoria della Misura come metalinguaggio per la Teoria della Probabilità, in modo da superare il dibattito fra quanti consideravano la probabilità come limite di frequenze relative, ovvero la cosiddetta impostazione frequentista, e quanti cercavano un fondamento logico della stessa (per un'analisi approfondita dei vari concetti di probabilità, si veda von Plato, 1994). Al contrario, l'approccio proposto da Kolmogorov semplicemente definisce la probabilità in modo assiomatico, postulando in effetti che la probabilità sia una misura normalizzata (Kolmogorov, 1933). Risulta quindi opportuno definire inizialmente il concetto di misura prima di introdurre quello di probabilità. Figura 2.1.1. Andrej Nikolaevic Kolmogorov (1903-1987). 2 Misure di probabilità Definizione 2.1.1. Una applicazione . À Y È Ò!ß ∞Ò è una misura su Y se per ogni successione di eventi incompatibili ÐI8 Ñ8 " − Y si ha . I8 œ .ÐI8 Ñ . ∞ 8œ" ∞ 8œ" La precedente definizione stabilisce che una misura è una funzione non negativa su Y con la cosiddetta proprietà della 5-additività (o additività numerabile). Una misura è detta invece additiva se dati 8 eventi incompatibili 8 ÐI3 Ñ83œ" − Y , allora .Ð83œ" I3 Ñ œ 3œ" .ÐI3 Ñ. Inoltre, se .ÐHÑ œ " la misura è detta normalizzata. Nel linguaggio della Teoria della Misura, la terna ÐHß Y ß .Ñ è detta spazio misurato. Data l'importanza del concetto di probabilità, in modo leggermente ridondante, viene data di seguito anche la classica definizione assiomatica di probabilità attraverso tre assiomi (che evidentemente definiscono di nuovo la probabilità come misura normalizzata). Definizione 2.1.2. Una applicazione T À Y È Ò!ß ∞Ò è una misura di probabilità (o semplicemente probabilità) se: i) T ÐIÑ ! per ogni I − Y ; ii) T ÐHÑ œ "; iii) per ogni successione di eventi incompatibili ÐI8 Ñ8 " − Y si ha T I8 œ T ÐI8 Ñ . ∞ 8œ" ∞ 8œ" In effetti, gli assiomi i) e iii) della Definizione 2.1.2 stabiliscono che la probabilità è una misura 5-additiva, mentre l'assioma ii) stabilisce che questa misura è normalizzata a ". La terna ÐHß Y ß T Ñ è detta spazio probabilizzato. Si noti che l'approccio assiomatico non fornisce il modo con cui selezionare la misura di probabilità T . In pratica, l'individuo che analizza l'esperimento o il fenomeno aleatorio esprime un “grado di fiducia” nei confronti degli eventi di Y , che lo portano a definire una data misura di probabilità. Ovviamente, un differente individuo potrebbe essere incline a specificare un diverso “grado di fiducia” nei confronti degli stessi eventi di Y , in modo tale da definire una differente misura di probabilità rispetto al primo individuo. Quindi, la scelta di 3 Capitolo 2 T , ovvero la costruzione di uno spazio probabilizzato, ha per sua natura un carattere arbitrario e sarà discussa in dettaglio nella Sezione 2.3. 2.2. Alcune proprietà della probabilità Come conseguenza della definizione assiomatica di probabilità derivano numerose proprietà. Alcune di queste proprietà sono enunciate di seguito sotto forma di altrettanti Teoremi. Teorema 2.2.1. Se ÐHß Y ß T Ñ è uno spazio probabilizzato, si ha T ÐgÑ œ !. Dimostrazione. Dal momento che H œ H ∪ g, essendo H e g incompatibili, per l'assioma iiiÑ della Definizione 2.1.2 si ha T ÐHÑ œ T ÐHÑ T ÐgÑ e quindi risulta T ÐgÑ œ !. Teorema 2.2.2. Sia ÐHß Y ß T Ñ uno spazio probabilizzato. Se I − Y , allora T ÐI - Ñ œ " T ÐI Ñ . Dimostrazione. Dal momento che H œ I ∪ I - , essendo I e I incompatibili, per l'assioma iiiÑ della Definizione 2.1.2 si ha T ÐHÑ œ T ÐI Ñ T ÐI - Ñ, da cui si ha la tesi tenendo presente l'assioma ii) della Definizione 2.1.2. Esempio 2.2.1. In modo simile all'Esempio 1.1.3, si considerino 7 palline distinguibili inserite in modo casuale in Q celle. Si supponga che ogni configurazione di palline nelle celle sia ugualmente probabile, ovvero che per ogni evento elementare di H si abbia T ÐÖ=3 ×Ñ œ Q 7 . Si vuole determinare la probabilità di avere una configurazione con almeno due palline in una cella. In questo caso, se I rappresenta l'evento di ottenere una configurazione con al più una pallina per cella, dal momento che esistono Q xÎÐQ 7Ñx di tali configurazioni se 7 Ÿ Q , si ha T ÐI Ñ œ Qx Q 7 , ÐQ 7Ñx mentre T ÐIÑ œ ! se 7 Q . Dunque, la probabilità richiesta è data da 4 Misure di probabilità T ÐI - Ñ œ " Qx Q 7 ÐQ 7Ñx se 7 Ÿ Q , mentre T ÐI - Ñ œ " se 7 Q . Risulta inoltre immediato verificare che T ÐI - Ñ è una funzione crescente di 7 per un dato Q . Questi risultati possono essere utilizzati nella soluzione del cosiddetto problema dei compleanni. Supponendo che 7 persone siano riunite in una stanza, questo problema consiste nell'ottenere la probabilità di avere almeno due persone con il compleanno nello stesso giorno dell'anno. Se si assume che tutte le configurazioni di compleanni siano ugualmente probabili e di avere un anno pari a Q œ $'& giorni, la probabilità richiesta si ottiene immediatamente dalla precedente espressione. In modo piuttosto controintuitivo, è sufficiente che 7 œ #$ persone siano presenti nella stanza per ottenere che questa probabilità sia maggiore di "Î#. In effetti in questo caso si ha T ÐI - Ñ ¶ !Þ&!(. Si noti che T ÐI - Ñ cresce rapidamente al crescere di 7. In effetti se 7 œ &! persone sono presenti nella stanza, si ha T ÐI - Ñ ¶ !Þ*(!. Per curiosità relative al problema dei compleanni si veda Olofsson (2015, p.61). Teorema 2.2.3. Sia ÐHß Y ß T Ñ uno spazio probabilizzato. Se I" ß I# − Y e I" § I# , allora T ÐI# Ï I" Ñ œ T ÐI# Ñ T ÐI" Ñ . Inoltre, si ha T ÐI" Ñ Ÿ T ÐI# Ñ. Dimostrazione. Dal momento che I" § I# , I# può essere scritto come I# œ I" ∪ ÐI# Ï I" Ñ , dove I" e ÐI# Ï I" Ñ sono tra loro incompatibili. Dunque, per l'assioma iiiÑ della Definizione 2.1.2 si ha T ÐI# Ñ œ T ÐI" Ñ T ÐI# Ï I" Ñ , da cui segue immediatamente la prima parte. Essendo T ÐI# Ï I" Ñ ! per l'assioma iÑ della Definizione 2.1.2, si ha la seconda parte. Come conseguenza del Teorema 2.2.3, dal momento che per ogni I − Y si ha I § H, allora T ÐI Ñ Ÿ T ÐHÑ œ ". Tenendo presente l'assioma i) della Definizione 2.1.2, si può quindi concludere che ! Ÿ T ÐI Ñ Ÿ " per ogni I − Y . 5 Capitolo 2 Teorema 2.2.4. Sia ÐHß Y ß T Ñ uno spazio probabilizzato. Se I" ß I# − Y , allora T ÐI" ∪ I# Ñ œ T ÐI" Ñ T ÐI# Ñ T ÐI" ∩ I# Ñ . Dimostrazione. Tenendo presente le relazioni I" ∪ I# œ I" ∪ ÐI# Ï I" Ñ e I# œ ÐI" ∩ I# Ñ ∪ ÐI# Ï I" Ñ , dal momento che i secondi membri delle due uguaglianze sono dati dall'unione di eventi incompatibili, per l'assioma iiiÑ della Definizione 2.1.2 risulta T ÐI" ∪ I# Ñ œ T ÐI" Ñ T ÐI# Ï I" Ñ e T ÐI# Ñ œ T ÐI" ∩ I# Ñ T ÐI# Ï I" Ñ . Sottraendo membro a membro queste relazioni si ottiene immediatamente la tesi. Esempio 2.2.2. Il gioco del bridge è stato frequentemente analizzato in termini teorici dai matematici. Émile Borel è stato addirittura l'autore, insieme al giocatore di scacchi e di bridge André Chéron (1895-1980), di un manuale specifico, ovvero Théorie Mathématique du Bridge à la Portée de Tous (1940). Nel gioco del bridge viene assegnata ad ogni giocatore una mano composta da "$ carte scelte casualmente da un mazzo di &# carte. Quindi, se si considera la mano di carte assegnata ad un singolo giocatore, i possibili risultati sono dati da tutte le scelte di "$ carte dal mazzo, ovvero cardÐHÑ œ &# "$ . Se si assume che nessun baro sia presente al tavolo di gioco, si può supporre che ogni mano di carte sia ugualmente probabile, ovvero che per ogni evento elementare si abbia " T ÐÖ=3 ×Ñ œ &# . Si consideri dunque la probabilità di ottenere una mano che "$ contiene l'asso, il re, la regina, il fante e il dieci di almeno un seme di cuori o di quadri. Se si indica con I" e I# gli eventi tali che le cinque carte descritte siano presenti nella mano rispettivamente per il seme di cuori e di quadri, allora si ha %( &# T ÐI" Ñ œ T ÐI# Ñ œ ) "$ " . 6 Misure di probabilità mani equiprobabili che contengono le cinque carte In effetti vi sono %( ) d'interesse per il seme di cuori e altrettante mani per il seme di quadri. Inoltre si ha %# &# T ÐI" ∩ I# Ñ œ $ "$ " , mani equiprobabili che contengono dal momento che vi sono %# $ contemporaneamente le cinque carte d'interesse del seme di cuori e del seme di quadri. Dunque la probabilità richiesta è data da %( &# T ÐI" ∪ I# Ñ œ # ) "$ " %# &# $ "$ " ¶ !Þ!!" . Questo esempio richiede la conoscenza elementare dei metodi di enumerazione (per una introduzione all'argomento si veda Graham et al., 1994). Ulteriori problemi relativi al gioco del bridge sono considerati da Ash (2008) e da Feller (1968). Figura 2.2.1. Frontespizio dell'edizione originale e dell'edizione inglese di Théorie Mathématique du Bridge à la Portée de Tous (1940). Il Teorema 2.2.4 può essere utilizzato in maniera ricorsiva per la determinazione della probabilità dell'unione di 8 eventi. Ad esempio, dati tre eventi I" ß I# ß I$ , tenendo presente le proprietà associativa e distributiva dell'unione di eventi e applicando tre volte il Teorema 2.2.4, si ottiene 7 Capitolo 2 T ÐI" ∪ I# ∪ I$ Ñ œ T ÐÐI" ∪ I# Ñ ∪ I$ Ñ œ T ÐI" ∪ I# Ñ T ÐI$ Ñ T ÐÐI" ∪ I# Ñ ∩ I$ Ñ œ T ÐI" Ñ T ÐI# Ñ T ÐI" ∩ I# Ñ T ÐI$ Ñ T ÐÐI" ∩ I$ Ñ ∪ ÐI# ∩ I$ ÑÑ œ T ÐI" Ñ T ÐI# Ñ T ÐI$ Ñ T ÐI" ∩ I# Ñ T ÐI" ∩ I$ Ñ T ÐI# ∩ I$ Ñ T ÐI" ∩ I# ∩ I$ Ñ . In generale, si può ottenere la probabilità dell'unione di 8 eventi mediante la Formula di Inclusione ed Esclusione considerata nel seguente Teorema. La formula è stata introdotta da Abraham de Moivre (1667-1754), uno dei padri della Teoria della Probabilità, anche se è comunemente legata al nome del matematico francese Jules Henri Poincaré (1854-1912). Abraham de Moivre nacque in Francia anche se passò la maggior parte della sua vita in esilio in Inghilterra, dove scrisse quello che può essere considerato il primo manuale di Teoria della Probabilità, ovvero The Doctrine of Chances pubblicato nel 1718. Figura 2.2.2. Abraham de Moivre (1667-1754) e frontespizio di The Doctrine of Chances (1718). Teorema 2.2.5. (Formula di Inclusione ed Esclusione) Sia ÐHß Y ß T Ñ uno spazio probabilizzato. Dati 8 eventi ÐI3 Ñ83œ" − Y , allora 8 Misure di probabilità T I3 œ T ÐI3 Ñ T ÐI3 ∩ I4 Ñ 8 8 3œ" 3œ" "Ÿ34Ÿ8 T ÐI3 ∩ I4 ∩ I5 Ñ á "Ÿ345Ÿ8 8" Ð "Ñ T ÐI" ∩ I# ∩ á ∩ I8 Ñ . Dimostrazione. La relazione è ovviamente verificata per 8 œ " ed è valida per 8 œ # sulla base del Teorema 2.2.4. Ancora per il Teorema 2.2.4, considerando l'ulteriore evento I8" − Y , si ha T I3 œ T I8" ∪ I3 8" 8 3œ" 3œ" œ T ÐI8" Ñ T I3 T I8" ∩ I3 8 8 3œ" 3œ" œ T ÐI8" Ñ T I3 T ÐI8" ∩ I3 Ñ . 8 8 3œ" 3œ" Applicando la formula di Inclusione ed Esclusione al secondo e terzo addendo della precedente espressione, con un calcolo laborioso anche se ovvio, si ottiene la formula con Ð8 "Ñ al posto di 8. Il Teorema è quindi dimostrato per induzione. Esempio 2.2.3. Si considerino 8 celle numerate in cui vengono inserite in modo casuale 8 palline a loro volta numerate, in modo tale che una cella contenga una sola pallina. I possibili risultati sono dati da tutte le configurazioni di palline nelle celle e quindi risulta cardÐHÑ œ 8x, ovvero gli elementi di H sono in corrispondenza biunivoca con le possibili permutazioni dei primi 8 interi. Supponendo che ogni configurazione sia ugualmente probabile, ovvero che per ogni evento elementare si abbia T ÐÖ=3 ×Ñ œ "Î8x, si vuole determinare la probabilità che almeno una pallina sia in una cella con un numero identico. Se I3 è l'evento per cui la configurazione è tale che la pallina numerata con 3 è nella cella numerata con 3, allora la probabilità in questione risulta T 83œ" I3 . Dal momento che esistono Ð8 "Ñx configurazioni per cui la pallina numerata con 3 è nella cella numerata con 3, allora si ha 9 Capitolo 2 T ÐI3 Ñ œ Ð8 "Ñx 8 " œ . 8x " Inoltre esistono Ð8 #Ñx configurazioni per cui la pallina numerata con 3 è nella cella numerata con 3, mentre la pallina numerata con 4 è nella cella numerata con 4. Dunque si ha T ÐI3 ∩ I4 Ñ œ Ð8 #Ñx " 8 " œ . 8x #x # Iterando, risulta Ð8 $Ñx " 8 " T ÐI3 ∩ I4 ∩ I5 Ñ œ œ , 8x $x $ e così via. In base alla Formula di inclusione ed esclusione, la probabilità richiesta è quindi data da 8 " 8 " 8 " " 8 " T I3 œ 8 á Ð "Ñ8" " # #x # 8x 8 3œ" 8 œ" " " " á Ð "Ñ8" . #x $x 8x Figura 2.2.3. Frontespizio di Essay d'analyse sur les jeux de hazard (1708). Per 8 abbastanza elevato la precedente probabilità può essere approssimata da " expÐ "Ñ ¶ !Þ'$# e quindi, in modo piuttosto controintuitivo, la probabilità che almeno una pallina sia inserita in una cella con lo stesso numero risulta 10 Misure di probabilità piuttosto alta. Per ulteriori problemi relativi a giochi di rencontre si veda Feller (1968). La prima analisi del presente problema è dovuta al matematico francese Pierre Raymond de Montmort (1678-1719), autore di Essay d'analyse sur les jeux de hazard (1708), una delle prime trattazioni del gioco d'azzardo con metodi probabilistici. Teorema 2.2.6. Sia ÐHß Y ß T Ñ uno spazio probabilizzato. Dati 8 eventi ÐI3 Ñ83œ" − Y , allora T I3 maxÐT ÐI3 ÑÑ . 8 3œ" 3 Dimostrazione. Dal momento che I3 § 83œ" I3 per ogni 3, allora T ÐI3 Ñ Ÿ T Ð83œ" I3 Ñ per il Teorema 2.2.3. Se la disuguaglianza è valida per ogni T ÐI3 Ñ, allora risulta valida anche per il relativo massimo. Teorema 2.2.7. Sia ÐHß Y ß T Ñ uno spazio probabilizzato. Dati 8 eventi ÐI3 Ñ83œ" − Y , allora T I3 Ÿ minÐT ÐI3 ÑÑ . 8 3œ" 3 Dimostrazione. Dal momento che 83œ" I3 § I3 per ogni 3, allora T Ð83œ" I3 Ñ Ÿ T ÐI3 Ñ per il Teorema 2.2.3. Se la disuguaglianza è valida per ogni T ÐI3 Ñ, allora risulta valida anche per il relativo minimo. Il prossimo Teorema fornisce due utili disuguaglianze sulla probabilità dell'unione di 8 eventi. Queste disuguaglianze hanno importanti applicazioni nella statistica matematica e furono introdotte dal matematico italiano Carlo Emilio Bonferroni (1892-1960). Teorema 2.2.8. (Disuguaglianze di Bonferroni) Sia ÐHß Y ß T Ñ uno spazio probabilizzato. Dati 8 eventi ÐI3 Ñ83œ" − Y , allora T I3 Ÿ T ÐI3 Ñ e 8 8 3œ" 3œ" 11 Capitolo 2 T I3 T ÐI3 Ñ T ÐI3 ∩ I4 Ñ . 8 8 3œ" 3œ" "Ÿ34Ÿ8 Dimostrazione. La prima disuguaglianza è ovviamente verificata per 8 œ " ed è valida per 8 œ # per il Teorema 2.2.4. Inoltre, dal Teorema 2.2.4 si ha T I3 œ T I" ∪ I3 Ÿ T ÐI" Ñ T I3 . 8 8 8 3œ" 3œ# 3œ# Applicando di nuovo il Teorema 2.2.4 si ha T I3 Ÿ T ÐI" Ñ T I# ∪ I3 8 8 3œ" 3œ$ Ÿ T ÐI" Ñ T ÐI# Ñ T I3 . 8 3œ$ Iterando il procedimento si ottiene la prima disuguaglianza di Bonferroni per induzione. Di nuovo, la seconda disuguaglianza è ovviamente verificata per 8 œ " ed è valida per 8 œ # per il Teorema 2.2.4. Ancora per il Teorema 2.2.4 e tenendo presente la dimostrazione del Teorema 2.2.5, considerando l'ulteriore evento I8" − Y , sulla base della prima disuguaglianza di Bonferroni si ha T I3 œ T ÐI8" Ñ T I3 T ÐI8" ∩ I3 Ñ 8" 8 8 3œ" 3œ" 3œ" T ÐI8" Ñ T I3 T ÐI8" ∩ I3 Ñ . 8 8 3œ" 3œ" Applicando la seconda disuguaglianza di Bonferroni al secondo membro della precedente disuguaglianza, si ottiene facilmente la seconda parte per induzione. Teorema 2.2.9. Sia ÐHß Y ß T Ñ uno spazio probabilizzato. Dati 8 eventi ÐI3 Ñ83œ" − Y , allora T I3 T ÐI3 Ñ Ð8 "Ñ. 8 8 3œ" 3œ" 12 Misure di probabilità Dimostrazione. Dalla relazione di De Morgan, si ha T I3 œ " T I3- . 8 8 3œ" 3œ" Dalla precedente relazione e dal Teorema 2.2.8, si ottiene inoltre T I3 " 8 3œ" T ÐI3- Ñ 3œ" 8 œ " Ð" T ÐI3 ÑÑ 8 œ T ÐI3 Ñ Ð8 "Ñ , 3œ" 8 3œ" che è quanto si voleva dimostrare. Nel caso che vengano considerate successioni di eventi, si possono ottenere un insieme di ulteriori interessanti proprietà per la probabilità. I seguenti due teoremi provano la “continuità” della misura di probabilità. Teorema 2.2.10. Se ÐHß Y ß T Ñ è uno spazio probabilizzato e se ÐI8 Ñ8 " è una successione crescente o decrescente di eventi di Y , allora lim T ÐI8 Ñ œ T lim I8 . 8 8 Dimostrazione. Si consideri una successione crescente. Si ha I8 § I8" e quindi T ÐI8 Ñ Ÿ T ÐI8" Ñ, ovvero la successione numerica ÐT ÐI8 ÑÑ8 " ammette limite essendo crescente e superiormente limitata da ". Si esprima I8 come unione di eventi incompatibili, ovvero I8 œ I" ∪ ÐI# Ï I" Ñ ∪ á ∪ ÐI8 Ï I8" Ñ œ I" ∪ ÐI3 Ï I3" Ñ , 8 3œ# da cui lim I8 œ I8 œ I" ∪ ÐI3 Ï I3" Ñ , 8 ∞ ∞ 8œ" 3œ# essendo lim8 I8 œ ∞ 8œ" I8 dal momento che la successione è crescente. Inoltre, si ha 13 Capitolo 2 T ÐI8 Ñ œ T ÐI" Ñ T ÐI3 Ï I3" Ñ , 8 3œ# e quindi, data la 5-additività di T , lim T ÐI8 Ñ œ T ÐI" Ñ T ÐI3 Ï I3" Ñ ∞ 8 3œ# ∞ œ T I" ∪ ÐI3 Ï I3" Ñ œ T lim I8 . 8 3œ# Si consideri una successione decrescente. Risulta dunque I8" § I8 e quindi T ÐI8" Ñ Ÿ T ÐI8 Ñ, ovvero la successione numerica ÐT ÐI8 ÑÑ8 " ammette limite essendo decrescente e inferiormente limitata da !. Se ÐI8 Ñ8 " è decrescente la successione ÐI8- Ñ8 " è crescente, per cui si ha lim T ÐI8- Ñ œ T lim I8- 8 8 e quindi dalla relazione di De Morgan lim T ÐI8 Ñ œ lim Ð" T ÐI8- ÑÑ œ " T lim I8- 8 8 œ " T ∞ 8œ" 8 I8- œ T I8 œ T lim I8 , ∞ 8œ" 8 essendo lim8 I8 œ ∞ 8œ" I8 dal momento che la successione è decrescente. Teorema 2.2.11. Se ÐHß Y ß T Ñ è uno spazio probabilizzato e se ÐI8 Ñ8 " è una successione di eventi di Y , allora T lim inf I8 Ÿ lim inf T ÐI8 Ñ Ÿ lim sup T ÐI8 Ñ Ÿ T lim sup I8 . 8 8 8 8 Se la successione ammette limite, allora lim T ÐI8 Ñ œ T lim I8 . 8 8 14 Misure di probabilità Dimostrazione. Si ha G8 § I8 § H8 , dove G8 œ ∞ 5œ8 I5 e quindi ÐG8 Ñ8 " ∞ è una successione crescente di eventi, mentre H8 œ 5œ8 I5 e quindi ÐH8 Ñ8 " è una successione decrescente di eventi. Inoltre, si ha lim G8 œ G8 œ lim inf I8 ∞ 8 8œ" 8 e lim H8 œ H8 œ lim sup I8 , ∞ 8 8œ" 8 mentre dal Teorema 2.2.10 si ha lim T ÐG8 Ñ œ T lim G8 œ T lim inf I8 8 8 8 e lim T ÐH8 Ñ œ T lim H8 œ T lim sup I8 . 8 8 8 Dal momento che T ÐG8 Ñ Ÿ T ÐI8 Ñ Ÿ T ÐH8 Ñ per ogni 8, allora si ha la prima parte del Teorema. La seconda parte del Teorema segue immediatamente dalla prima, in quanto se la successione di eventi ammette limite, allora T lim inf I8 œ T lim sup I8 . 8 8 Teorema 2.2.12. Se ÐHß Y ß T Ñ è uno spazio probabilizzato e se ÐI8 Ñ8 " è una successione di eventi di Y tale che T ÐI8 Ñ œ ! per ogni 8, allora T I8 œ ! . ∞ 8œ" Inoltre, se ÐI8 Ñ8 " è una successione di eventi di Y tale che T ÐI8 Ñ œ " per ogni 8, allora T I8 œ " . ∞ 8œ" 15 Capitolo 2 Dimostrazione. Dalla prima disuguaglianza di Bonferroni (Teorema 2.2.8) per ogni 8 si ha T I3 Ÿ T ÐI3 Ñ œ ! , 8 8 3œ" 3œ" e quindi dal Teorema 2.2.10 e dall'assioma i) della Definizione 2.1.2 segue la prima parte del Teorema. Dal momento che se T ÐI8 Ñ œ " allora T ÐI8- Ñ œ !, dalla relazione di De Morgan e dalla prima parte del Teorema si ha T I8 œ " T I8- œ " . ∞ ∞ 8œ" 8œ" 2.3. Costruzione di spazi probabilizzati Dato uno spazio probabilizzabile ÐHß Y Ñ, al fine di ottenere il relativo spazio probabilizzato ÐHß Y ß T Ñ, occorre assegnare a ogni evento I − Y un numero reale T ÐI Ñ mediante una applicazione T in modo coerente con i tre assiomi della Definizione 2.1.2. A questo fine, è conveniente operare in modo che, assegnate le probabilità a certi particolari eventi di Y , risultino conseguentemente determinate le probabilità di tutti gli altri eventi di Y . Se cardÐHÑ œ 8, allora H œ Ö=" ß á ß =8 × ed è sufficiente assegnare le probabilità a ciascuno degli eventi elementari, ovvero T ÐÖ=3 ×Ñ œ :3 , 3 œ "ß á ß 8 , affinchè risultino determinate le probabilità di tutti i #8 eventi di Y . Ovviamente, le probabilità di ogni evento elementare devono essere assegnate in modo da soddisfare i tre assiomi. In altri termini, occorre che :3 ! per ogni 3 œ "ß á ß 8 e che 83œ" :3 œ ". In questo caso, infatti, poichè ogni evento I − Y è costituito dall'unione di una scelta di eventi elementari ed essendo gli eventi elementari tra loro incompatibili, si ottiene che T ÐI Ñ œ "I Ð=3 Ñ:3 , 8 3œ" 16 Misure di probabilità dove "E ÐBÑ rappresenta la funzione indicatrice dell'insieme E, ovvero "E ÐBÑ œ " se B − E e "E ÐBÑ œ ! altrimenti. Nel caso in cui gli eventi elementari siano considerati equiprobabili, ovvero se si assegna :3 œ : per ogni 3 œ "ß á ß 8, allora occorre che risulti : œ "Î8 affinchè 8: œ ". Quindi, risulta evidente che " 8 cardÐIÑ T ÐI Ñ œ "I Ð=3 Ñ œ . 8 3œ" 8 Questo tipo di assegnazione di probabilità è detta di Laplace, in quanto fu teorizzata in particolar modo dal grande matematico Pierre-Simon, marchese de Laplace (1749-1827), autore di alcune delle prime opere sistematiche di Teoria della Probabilità, ovvero Théorie analytique des probabilités (1812) e Essai philosophique sur les probabilités (1814). Figura 2.3.1. Pierre-Simon, marchese de Laplace (1749-1827) e frontespizio di Théorie analytique des probabilités (1812). Esempio 2.3.1. Si consideri il lancio di un dado. Se il dado non è truccato risulta naturale assegnare a ciascuno dei sei eventi elementari Ðcorrispondenti a ciascuna faccia del dadoÑ la stessa probabilità : œ "Î'. In questo caso, l'evento I œ Ö"ß $ß &× ha probabilità T ÐIÑ œ "Î#, essendo composto dall'unione di $ eventi elementari. Se invece il dado è stato truccato e si assegnano le probabilità T ÐÖ=3 ×Ñ œ :3 tali che :" œ :& œ "Î$ e :# œ :$ œ :% œ :' œ "Î"#, si ottiene T ÐI Ñ œ :" :$ :& œ $ . % 17 Capitolo 2 In modo analogo si procede nel caso in cui H è numerabile, ovvero se H œ Ö=" ß =# ß á ×. Di nuovo, se si assegnano le probabilità a ciascuno degli eventi elementari, ovvero T ÐÖ=8 ×Ñ œ :8 , 8 œ "ß #ß á , rispettando i vincoli :8 ! per ogni 8 œ "ß #ß á e ∞ 8œ" :8 œ ", risultano probabilizzati tutti gli eventi I − Y , in quanto ciascuno di essi è costituito dall'unione di una scelta di un numero finito o di una infinità numerabile di eventi elementari. In altri termini, si ha T ÐI Ñ œ "I Ð=8 Ñ:8 . ∞ 8œ" Si noti che, in caso di spazi fondamentali che contengono un'infinità numerabile di risultati, non è possibile assegnare a ciascun evento elementare la stessa probabilità : !. In questo modo, infatti, non converge la serie ∞ 8œ" :. Viceversa, assegnando : œ ! ad ogni evento elementare, la serie in questione converge ma risulta T ÐHÑ œ !. In effetti, in questo caso l'equiprobabilità degli eventi elementari risulta possibile solo quando la misura di probabilità non è 5 additiva, ma semplicemente additiva. Esempio 2.3.2. Si consideri uno spazio fondamentale che contiene una infinità numerabile di risultati, ovvero H œ Ö=" ß =# ß á × e si supponga di considerare per ogni I − Y , l'applicazione . À Y È Ò!ß ∞Ò tale che .ÐI Ñ œ lim 5 cardÐI ∩ E5 Ñ , 5 dove E5 œ Ö=" ß á ß =5 ×. L'applicazione . rispetta l'assioma iÑ della Definizione 2.1.2 in quanto, trattandosi del limite di un rapporto tra quantità non negative, risulta .ÐI Ñ ! per ogni I − Y . Inoltre, l'applicazione . rispetta anche l'assioma iiÑ della Definizione 2.1.2, in quanto cardÐH ∩ E5 Ñ œ 5 e quindi .ÐHÑ œ lim 5 cardÐH ∩ E5 Ñ œ". 5 Tuttavia, l'applicazione . non rispetta l'assioma iiiÑ della Definizione 2.1.2. Infatti, per un evento elementare Ö=8 × si ha cardÐÖ=8 × ∩ E5 Ñ œ ! se 8 œ 5 "ß 5 #ß á , e cardÐÖ=8 × ∩ E5 Ñ œ " se 8 œ "ß á ß 5 , per cui 18 Misure di probabilità .ÐÖ=8 ×Ñ œ lim 5 cardÐÖ=8 × ∩ E5 Ñ œ!, 5 ovvero . assegna la stessa probabilità : œ ! ad ogni evento elementare e dal momento che .ÐÖ=8 ×Ñ œ ! .ÐHÑ œ " , ∞ 8œ" l'applicazione . non è 5-additiva. L'applicazione . risulta invece finitamente additiva, ovvero dati 8 eventi incompatibili ÐI3 Ñ83œ" − Y , si ha cardÐ83œ" ÐI3 ∩ E5 ÑÑ . I3 œ lim 5 5 3œ" 8 8 cardÐI3 ∩ E5 Ñ œ lim œ .ÐI3 Ñ , 5 5 3œ" 3œ" 8 dal momento che card ÐI3 ∩ E5 Ñ œ cardÐI3 ∩ E5 Ñ . 8 8 3œ" 3œ" Si noti che se I œ Ö=# ß =% ß á ×, allora si ha .ÐI Ñ œ "Î#, mentre se I œ Ö=$ ß =' ß á ×, allora risulta .ÐI Ñ œ "Î$. Infine, se H è non numerabile, in genere si sceglie un'opportuna classe iniziale di eventi X e si assegna la probabilità T ÐI Ñ a ciascun evento I − X in modo da soddisfare i tre assiomi della Definizione 2.1.2. In questo caso, se la classe iniziale è scelta appropriatamente, si può infatti dimostrare che esiste una sola estensione di T da X alla 5 -algebra 5 ÐXÑ. In altri termini, esiste un solo modo di assegnare le probabilità agli eventi di 5 ÐX Ñ in modo da rispettare gli assiomi e senza modificare le probabilità assegnate agli eventi di X . Questo implica in pratica che, una volta probabilizzati gli eventi di X , risultano probabilizzati univocamente anche tutti gli eventi di Y œ 5 ÐXÑ (si veda Dudley, 2004, p.91). Si noti che esistono eventi a cui non è possibile assegnare una probabilità, anche se la costruzione di tali eventi è molto laboriosa e richiede addirittura l'Assioma della Scelta (si veda Dudley, 2004, p.105). 19 Capitolo 2 Esempio 2.3.3. Si consideri lo spazio fondamentale H œ Ó!ß "Ó. In modo simile all'Esempio 1.4.3, la 5 -algebra Y può essere costruita a partire dalla classe X degli eventi del tipo Ó+ß ,Ó, dove ! Ÿ + Ÿ , Ÿ ". In questo caso, si può verificare che T ÐÓ+ß ,ÓÑ œ , + è una misura di probabilità su X che ha un'unica estensione a Y œ 5 ÐX Ñ (si veda Dudley, 2004, p.94). Dunque, tenendo presente l'Esempio 1.4.3, in base al Teorema 2.2.10 si ha T ÐÒ+ß ,ÓÑ œ T lim Ó+ 8" ß ,Ó œ lim T ÐÓ+ 8" ß ,ÓÑ 8 8 " œ lim Ð, + 8 Ñ œ T ÐÓ+ß ,ÓÑ . 8 In modo analogo, si ha T ÐÓ+ß ,ÓÑ œ T ÐÒ+ß ,ÓÑ œ T ÐÒ+ß ,ÒÑ œ T ÐÓ+ß ,ÒÑ . Inoltre, si ha T ÐÖ+×Ñ œ T ÐÒ+ß +ÓÑ œ !, ovvero tutti gli eventi elementari hanno probabilità nulla. Di conseguenza, anche un'unione numerabile di eventi elementari ha probabilità nulla. In generale, mediante le proprietà viste nella Sezione 2.2, si possono ottenere le probabilità di tutti gli eventi ottenibili da un insieme numerabile di operazioni insiemistiche sugli eventi del tipo Ó+ß ,Ò, Ó+ß ,Ó, Ò+ß ,Ò e Ò+ß ,Ó, ovvero si possono ottenere le probabilità di tutti gli eventi di Y . Figura 2.3.2. Henri Léon Lebesgue (1875-1941). Nella Sezione 1.4 è stato visto che la 5 -algebra di Borel su ‘ può essere costruita a partire dalle classi di intervalli del tipo Ó+ß ,Ó. Nella Teoria della 20 Misure di probabilità Misura, la misura - che assegna la lunghezza ad ogni intervallo Ó+ß ,Ó di ‘, ovvero -ÐÓ+ß ,ÓÑ œ , +, è detta misura di Lebesgue. Le basi della Teoria della Misura, che hanno permesso l'approccio assiomatico alla Teoria della Probabilità da parte di Kolmogorov, sono state appunto introdotte dal matematico francese Henri Léon Lebesgue (1875-1941) nella sua tesi di laurea Intégrale, Longueur, Aire (1902) sviluppata sotto la supervisione di Émile Borel. Infine, una volta costruito lo spazio probabilizzato ÐHß Y ß T Ñ si dice che un evento I si verifica quasi certamente (;Þ-Þ) rispetto a T se T ÐIÑ œ ". Analogamente, nel linguaggio della Teoria della Misura, si dice che una proprietà è valida quasi ovunque (;Þ9Þ) rispetto alla misura di Lebesgue se la proprietà è verificata eccetto che su insieme di misura di Lebesgue nulla. Esempio 2.3.4. Dato lo spazio fondamentale H œ Ó!ß "Ó e la misura di probabilità T dell'Esempio 2.3.3, si consideri l'evento I œ H ∩ , dove rappresenta l'insieme dei numeri razionali. Dunque, I è l'insieme dei numeri razionali in Ó!ß "Ó. Dal momento che cardÐIÑ œ cardÐÑ, allora l'evento I è una unione numerabile di eventi elementari. Di conseguenza, si ha T ÐIÑ œ ! anche se l'insieme I è denso in Ó!ß "Ó. Quindi, l'evento I - si verifica ;Þ-Þ Figura 2.3.3. Georg Cantor (1845-1918) e le prime cinque iterazioni per la costruzione dell'insieme di Cantor. Esempio 2.3.5. Dato lo spazio fondamentale H œ Ó!ß "Ó e la misura di probabilità T dell'Esempio 2.3.3, si consideri l'evento I di H costruito in modo iterativo come segue. Si rimuove l'intervallo centrale Ó"Î$ß #Î$Ò da H, ottenendo l'evento I" œ Ó!ß "Î$Ó ∪ Ò#Î$ß "Ó , 21 Capitolo 2 per cui risulta T ÐI" Ñ œ #Î$. Successivamente, si rimuove l'intervallo centrale da Ó!ß "Î$Ó e Ò#Î$ß "Ó, ottenendo l'evento I# œ Ó!ß "Î*Ó ∪ Ò#Î*ß "Î$Ó ∪ Ò#Î$ß (Î*Ó ∪ Ò)Î*ß "Ó , per cui risulta T ÐI# Ñ œ %Î*. Continuando il procedimento, alla 8-esima iterazione l'evento I8 è composto dall'unione di #8 intervalli disgiunti, per cui si ha T ÐI8 Ñ œ #8 Î$8 . Si consideri dunque l'evento I œ ∞ 8œ" I8 , che nel linguaggio di Teoria della Misura è detto insieme di Cantor. In effetti, questo insieme è stato introdotto dal matematico tedesco Georg Cantor (1845-1918), uno dei padri fondatori della Teoria degli Insiemi. Si noti che I8" § I8 e quindi la successione di eventi è decrescente, per cui, tenendo presente il Teorema 2.2.10, si ha #8 T ÐIÑ œ T I8 œ lim T ÐI8 Ñ œ lim 8 œ ! . 8 8 $ 8œ" ∞ Dal momento che si può dimostrare che I è non numerabile (si veda Dudley, 2004, p.105), allora I è un evento di probabilità nulla che contiene un'infinità non numerabile di risultati. In altre parole, l'evento I - si verifica ;Þ-Þ 2.4. Probabilità condizionata Dato lo spazio probabilizzato ÐHß Y ß T Ñ, supponiamo che si sia verificato l'evento I! − Y . Alla luce di questa nuova conoscenza, è ovvio che lo spazio fondamentale si riduce. I risultati possibili, infatti, non sono più tutte le eventualità che compongono H, ma solo le eventualità che compongono I! . Risultano dunque impossibili, e dovranno quindi avere probabilità nulla, tutti gli eventi di Y che sono incompatibili con I! , mentre risulta certo, e dovrà quindi avere probabilità unitaria, l'evento I! . In pratica, le probabilità dovranno essere riassegnate su Y in modo da rispettare questi vincoli. Definizione 2.4.1. Sia ÐHß Y ß T Ñ uno spazio probabilizzato. Se Iß I! − Y e T ÐI! Ñ !, la probabilità condizionata di I dato I! è data da T ÐI ± I! Ñ œ T ÐI ∩ I! Ñ . T ÐI! Ñ 22 Misure di probabilità Si noti che se T ÐI! Ñ œ !, la probabilità condizionata non è definita. Al variare di I in Y , la probabilità condizionata T ÐI ± I! Ñ descrive una misura di probabilità T Ð † ± I! Ñ che è coerente con i tre assiomi della probabilità, come risulta del seguente Teorema. Teorema 2.4.2. Sia ÐHß Y ß T Ñ uno spazio probabilizzato. Se I! − Y e T ÐI! Ñ !, allora T Ð † ± I! Ñ è una misura di probabilità su Y . Dimostrazione. Occorre dimostrare che T Ð † ± I! Ñ soddisfa i tre assiomi della Definizione 2.1.2. Per ogni I − Y T ÐI ± I! Ñ œ T ÐI ∩ I! Ñ !, T ÐI! Ñ in quanto T ÐI ∩ I! Ñ !, mentre T ÐI! Ñ ! per ipotesi. Inoltre, T ÐH ± I! Ñ œ T ÐH ∩ I! Ñ T ÐI! Ñ œ œ". T ÐI! Ñ T ÐI! Ñ Infine, data successione di eventi incompatibili ÐI8 Ñ8 " − Y , si ha ∞ T Ð∞ I ∩ I Ñ T Ð 8 ! 8œ" 8œ" ÐI8 ∩ I! ÑÑ T I8 ± I! œ œ T ÐI! Ñ T ÐI! Ñ 8œ" ∞ œ ∞ 8œ" T ÐI8 ∩ I! Ñ T ÐI! Ñ œ T ÐI8 ± I! Ñ , ∞ 8œ" in quanto ÐI8 ∩ I! Ñ8 " è una successione di eventi incompatibili. Dalla definizione di probabilità condizionata segue il cosiddetto Principio delle Probabilità Composte, il quale permette di esprimere la probabilità dell'intersezione di due eventi I" ß I# − Y nel seguente modo T ÐI" ∩ I# Ñ œ T ÐI# ± I" ÑT ÐI" Ñ o, alternativamente, come T ÐI" ∩ I# Ñ œ T ÐI" ± I# ÑT ÐI# Ñ . Il Principio delle Probabilità Composte può essere applicato in modo ricorsivo per determinare la probabilità dell'intersezione di più di due eventi. Per esempio, la probabilità dell'intersezione di tre eventi I" ß I# ß I$ − Y risulta 23 Capitolo 2 T ÐI" ∩ I# ∩ I$ Ñ œ T ÐÐI" ∩ I# Ñ ∩ I$ Ñ œ T ÐI$ ± I" ∩ I# ÑT ÐI" ∩ I# Ñ œ T ÐI$ ± I" ∩ I# ÑT ÐI# ± I" ÑT ÐI" Ñ . In generale, dati 8 eventi ÐI3 Ñ83œ" − Y , si verifica per induzione che la probabilità della loro intersezione risulta T I8 œ T ÐI8 ± I" ∩ I# ∩ á ∩ I8" Ñá T ÐI# ± I" ÑT ÐI" Ñ . ∞ 8œ" Teorema 2.4.3. (Legge delle Probabilità Totali) Sia ÐHß Y ß T Ñ uno spazio probabilizzato. Se ÐI3 Ñ83œ" − Y è una partizione finita di H con T ÐI3 Ñ ! per ogni 3 œ "ß á ß 8, allora per ogni I − Y si ha T ÐI Ñ œ T ÐI ± I3 ÑT ÐI3 Ñ . 8 3œ" Dimostrazione. Dal momento che I § H, si ha I œ I ∩ H œ I ∩ I3 œ ÐI ∩ I3 Ñ . 8 8 3œ" 3œ" Inoltre, gli eventi ÐI3 Ñ83œ" sono tra loro incompatibili e quindi anche le loro intersezioni con l'evento I risultano incompatibili, per cui T ÐI Ñ œ T ÐI ∩ I3 Ñ œ T ÐI ± I3 ÑT ÐI3 Ñ . 8 3œ" 8 3œ" Dalla definizione di probabilità condizionata si può esprimere la probabilità di un evento, condizionata al verificarsi di un ulteriore evento, in termini della probabilità di quest'ultimo condizionata al verificarsi del primo, ovvero se I" ß I# − Y e T ÐI" Ñß T ÐI# Ñ !, allora T ÐI# ± I" Ñ œ T ÐI" ± I# ÑT ÐI# Ñ . T ÐI" Ñ Questa riscrittura della probabilità condizionata dà luogo alla celebrata Formula di Bayes, che prende nome dal reverendo Thomas Bayes (1702-1761), matematico inglese autore di un saggio che ha posto le basi di moderne correnti 24 Misure di probabilità di pensiero nella Teoria della Probabilità e nella Statistica, ovvero Essay Towards Solving a Problem in the Doctrine of Chances (pubblicato postumo nel 1763). Figura 2.4.1. Probabile ritratto di Thomas Bayes (1702-1761) e frontespizio di Essay Towards Solving a Problem in the Doctrine of Chances 1763). Teorema 2.4.4. (Formula di Bayes) Sia ÐHß Y ß T Ñ uno spazio probabilizzato. Se ÐI3 Ñ83œ" − Y è una partizione finita di H tale che T ÐI3 Ñ ! per ogni 3 œ "ß á ß 8, allora dato I − Y con T ÐI Ñ ! si ha T ÐI3 ± I Ñ œ T ÐI ± I3 ÑT ÐI3 Ñ T ÐI ± I3 ÑT ÐI3 Ñ œ 8 . T ÐI Ñ T ÐI ± I Ñ T ÐI Ñ 3 3 3œ" Dimostrazione. Dalla definizione di probabilità condizionata, dal Principio delle Probabilità Composte e dalla Legge delle Probabilità Totali si ottiene immediatamente la tesi. Da un punto di vista formale, la Formula di Bayes sembra essere una mera riformulazione della probabilità condizionata, ottenuta sulla base del Principio delle Probabilità Composte e della Legge delle Probabilità Totali. Tuttavia, a causa di alcune sue interpretazioni logiche, esso ha assunto una rilevante importanza applicativa, soprattutto nell'ambito della statistica inferenziale. Esempio 2.4.1. Si considerino "!!! palline che sono inserite in $ urne che contengono rispettivamente #!!, (!! e "!! palline. Se si suppone di considerare un'estrazione di una pallina da un'urna scelta in modo casuale, allora lo spazio fondamentale risulta H œ Ö=" ß á ß ="!!! ×, dove =3 rappresenta il risultato relativo all'estrazione della pallina 3-esima. Se si indica con I" , I# e I$ 25 Capitolo 2 rispettivamente l'evento che la pallina sia estratta dalla prima, seconda e terza urna, allora si ha T ÐI" Ñ œ "Î&, T ÐI# Ñ œ (Î"! e T ÐI$ Ñ œ "Î"!. Inoltre, si supponga che la prima urna contenga #! palline rosse, che la seconda urna contenga $& palline rosse e che l'ultima urna non contenga nessuna pallina rossa. Se si indica con I l'evento che una pallina rossa è stata estratta, allora si ha T ÐI ± I" Ñ œ "Î"!, T ÐI ± I# Ñ œ "Î#! e T ÐI ± I$ Ñ œ !. Dal momento che gli eventi I" , I# e I$ costituiscono una partizione dello spazio fondamentale, applicando la Legge delle Probabilità Totali si ottiene T ÐI Ñ œ T ÐI ± I3 ÑT ÐI3 Ñ œ $ 3œ" "" . #!! Applicando inoltre la Formula di Bayes, si è in grado di ottenere la probabilità T ÐI3 ± IÑ, ovvero la probabilità dell'evento che la pallina sia stata estratta dall'3esima urna, condizionata all'evento che sia stata estratta una pallina rossa. Si ottengono dunque le seguenti probabilità T ÐI" ± I Ñ œ T ÐI ± I" ÑT ÐI" Ñ % œ , T ÐI Ñ "" T ÐI# ± I Ñ œ T ÐI ± I# ÑT ÐI# Ñ ( œ , T ÐI Ñ "" e T ÐI$ ± I Ñ œ T ÐI ± I$ ÑT ÐI$ Ñ œ!. T ÐI Ñ In pratica, se è stata estratta una pallina rossa, allora la pallina è stata estratta dalla seconda urna con la maggiore probabilità e dalla terza urna con la minore probabilità. Esempio 2.4.2. Si considerino tre scatole in modo tale che la prima scatola contenga due monete d'oro, la seconda scatola contenga due monete d'argento e la terza scatola una moneta d'oro e una d'argento. L'esperimento aleatorio consiste nel considerare l'estrazione di una moneta da una scatola in modo equiprobabile. In questo caso, se la moneta estratta è d'oro si vuole conoscere la probabilità che anche la restante moneta sia d'oro. Ingenuamente, il neofita è portato a pensare che questa probabilità sia pari a "Î#, non tenendo presente il presente contesto di probabilità condizionata. Formalmente, se si indicano con 26 Misure di probabilità I" , I# e I$ rispettivamente gli eventi che la moneta sia estratta dalla prima, seconda e terza scatola, allora si ha T ÐI" Ñ œ T ÐI# Ñ œ T ÐI$ Ñ œ "Î$. Inoltre, se I rappresenta l'evento che la moneta estratta sia d'oro, allora T ÐI ± I" Ñ œ ", T ÐI ± I# Ñ œ ! e T ÐI ± I$ Ñ œ "Î#. Dunque, applicando la Legge delle Probabilità Totali si ottiene T ÐI Ñ œ "Î#, da cui la probabilità richiesta risulta T ÐI" ± I Ñ œ T ÐI ± I" ÑT ÐI" Ñ # œ , T ÐI Ñ $ ovvero un risultato controintuitivo. Questo è il motivo per cui il problema è detto paradosso delle scatole di Bertrand, dal momento che fu introdotto dal probabilista Joseph Bertrand (1822-1900) nel suo testo Calcul des probabilités, pubblicato nel 1889. 2.5. Indipendenza stocastica Si considerino due eventi I" ß I# tali che T ÐI" Ñß T ÐI# Ñ !. Dal momento che, sulla base della definizione di probabilità condizionata, il verificarsi dell'evento I" modifica generalmente la valutazione probabilistica relativa all'evento I# , si può allora concludere che T ÐI# ± I" Ñ œ T ÐI# ∩ I" Ñ Á T ÐI# Ñ . T ÐI" Ñ Se questo non avviene, si deve verificare necessariamente che T ÐI# ± I" Ñ œ T ÐI# ∩ I" Ñ œ T ÐI# Ñ . T ÐI" Ñ In base a queste considerazioni è naturale introdurre la seguente definizione di indipendenza stocastica. Definizione 2.5.1. Sia ÐHß Y ß T Ñ uno spazio probabilizzato. Se I" ß I# − Y , gli eventi I" e I# sono detti stocasticamente indipendenti (o semplicemente indipendenti) se T ÐI" ∩ I# Ñ œ T ÐI" ÑT ÐI# Ñ . 27 Capitolo 2 Si noti che la definizione di indipendenza dipende dalla misura di probabilità che viene adottata. In altri termini, due eventi che risultano indipendenti con una assegnazione di probabilità, potrebbero non esserlo con una differente assegnazione di probabilità. Esempio 2.5.1. Si consideri il lancio di un dado e gli eventi I" œ Ö"ß #ß $ß %×, I# œ Ö$ß %ß &ß '× e I$ œ Ö#ß %ß '×. Se gli eventi elementari sono equiprobabili, ovvero se T ÐÖ3×Ñ œ "Î' per ogni 3 œ "ß á ß ', allora T ÐI" Ñ œ T ÐI# Ñ œ #Î$ e T ÐI$ Ñ œ "Î#. Gli eventi I" e I# non sono indipendenti in quanto, risultando I" ∩ I# œ Ö$ß %×, si ha T ÐI" ∩ I# Ñ œ " # # % Á T ÐI" ÑT ÐI# Ñ œ ‚ œ . $ $ $ * Al contrario, gli eventi I" e I$ sono indipendenti in quanto, risultando I" ∩ I$ œ Ö#ß %×, si ha T ÐI" ∩ I$ Ñ œ " # " œ ‚ œ T ÐI" ÑT ÐI$ Ñ . $ $ # Se invece si considera una ulteriore assegnazione di probabilità T ÐÖ3×Ñ œ :3 , dove :" œ "Î# e :# œ :$ œ :% œ :& œ :' œ "Î"!, allora si ha T ÐI" Ñ œ %Î& e T ÐI$ Ñ œ $Î"!. In questo caso, al contrario di quanto avviene con la precedente assegnazione di probabilità, gli eventi I" e I$ non sono indipendenti in quanto si ha T ÐI" ∩ I$ Ñ œ " % $ ' Á T ÐI" ÑT ÐI# Ñ œ ‚ œ . & & "! #& Teorema 2.5.2. Sia ÐHß Y ß T Ñ uno spazio probabilizzato. Se I" ß I# − Y sono eventi indipendenti, allora anche le coppie di eventi I"- e I# , I" e I#- , I"- e I#sono indipendenti. Dimostrazione. Si considerino gli eventi I"- e I# . Dal momento che I# œ ÐI" ∩ I# Ñ ∪ ÐI"- ∩ I# Ñ , dove ÐI" ∩ I# Ñ e ÐI"- ∩ I# Ñ sono eventi incompatibili, allora risulta T ÐI# Ñ œ T ÐI" ∩ I# Ñ T ÐI"- ∩ I# Ñ œ T ÐI" ÑT ÐI# Ñ T ÐI"- ∩ I# Ñ , da cui 28 Misure di probabilità T ÐI"- ∩ I# Ñ œ T ÐI# Ñ T ÐI" ÑT ÐI# Ñ œ T ÐI# ÑÐ" T ÐI" ÑÑ œ T ÐI# ÑT ÐI"- Ñ , che prova l'indipendenza di I"- e I# . In modo del tutto analogo, dal momento che I" œ ÐI" ∩ I# Ñ ∪ ÐI" ∩ I#- Ñ , si dimostra l'indipendenza di I" I"- ∩ I#- œ ÐI" ∪ I# Ñ- , si ottiene e I#- . Infine, dal momento che T ÐI"- ∩ I#- Ñ œ " T ÐI" ∪ I# Ñ œ " ÐT ÐI" Ñ T ÐI# Ñ T ÐI" ∩ I# ÑÑ œ " T ÐI" Ñ T ÐI# Ñ T ÐI" ÑT ÐI# Ñ œ Ð" T ÐI" ÑÑÐ" T ÐI# ÑÑ , ovvero l'indipendenza di I"- e I#- . Teorema 2.5.3. Se ÐHß Y ß T Ñ è uno spazio probabilizzato, gli eventi g e H sono indipendenti da ogni altro evento I − Y . Dimostrazione. Si ha T ÐI ∩ gÑ œ T ÐgÑ œ T ÐI ÑT ÐgÑ , mentre T ÐI ∩ HÑ œ T ÐI Ñ œ T ÐI ÑT ÐHÑ , dal momento che T ÐgÑ œ ! e T ÐHÑ œ ". Teorema 2.5.4. Se ÐHß Y ß T Ñ è uno spazio probabilizzato, un evento I − Y è indipendente da se stesso se e solo se T ÐI Ñ œ ! o T ÐI Ñ œ ". Dimostrazione. Se I è indipendente da se stesso si ha T ÐI Ñ œ T ÐI ∩ I Ñ œ T ÐI Ñ# , da cui segue che necessariamente che T ÐI Ñ œ ! o T ÐI Ñ œ ". L'affermazione inversa è immediata. Definizione 2.5.5. Sia ÐHß Y ß T Ñ uno spazio probabilizzato. Gli eventi ÐI3 Ñ83œ" − Y sono detti reciprocamente indipendenti se T ÐI3 ∩ I4 Ñ œ T ÐI3 ÑT ÐI4 Ñ 29 Capitolo 2 per ogni 3 Á 4 œ "ß á ß 8, mentre sono detti completamente indipendenti se per ogni possibile scelta di 5 eventi con 5 œ #ß á ß 8, si ha T I34 œ T ÐI34 Ñ . 5 4œ" 5 4œ" Evidentemente l'indipendenza completa è una condizione molto più restrittiva dell'indipendenza reciproca. In effetti, al fine di verificare che 8 eventi sono reciprocamente indipendenti devono essere soddisfatte 8# condizioni, mentre se gli eventi sono completamente indipendenti devono essere soddisfatte Ð#8 8 "Ñ condizioni. Esempio 2.5.2. Si consideri un'urna contenente ) palline contrassegnate dai primi ) numeri interi. Lo spazio fondamentale relativo all'estrazione aleatoria di una pallina dall'urna è dato da H œ Ö"ß á ß )×, dove ogni risultato rappresenta l'estrazione della pallina contraddistinta dal corrispondente numero. Se ciascuna pallina ha la stessa probabilità di essere estratta, ovvero se T ÐÖ3×Ñ œ "Î) per ogni 3 œ "ß á ß ), gli eventi I" œ Ö"ß #ß $ß %×, I# œ Ö#ß %ß 'ß )× e I$ œ Ö$ß '× hanno probabilità T ÐI" Ñ œ T ÐI# Ñ œ "Î# e T ÐI$ Ñ œ "Î%. Essendo I" ∩ I# œ Ö#ß %×, si ha inoltre T ÐI" ∩ I# Ñ œ T ÐI" ÑT ÐI# Ñ œ " , % mentre, essendo I" ∩ I$ œ Ö$×, allora T ÐI" ∩ I$ Ñ œ T ÐI" ÑT ÐI$ Ñ œ " . ) Infine, essendo I# ∩ I$ œ Ö'×, si ha T ÐI# ∩ I$ Ñ œ T ÐI# ÑT ÐI$ Ñ œ " . ) Sulla base di questi risultati si può concludere che i tre eventi sono reciprocamente indipendenti. Tuttavia, gli stessi eventi non sono completamente indipendenti in quanto essendo I" ∩ I# ∩ I$ œ g, risulta T ÐI" ∩ I# ∩ I$ Ñ œ ! Á T ÐI" ÑT ÐI# ÑT ÐI$ Ñ œ " . "' 30 Misure di probabilità Con la medesima assegnazione di probabilità, si considerino inoltre gli eventi I" œ Ö"ß #ß $ß %×, I# œ Ö"ß &ß 'ß (× e I$ œ Ö"ß &ß 'ß )×, per cui risulta ovviamente T ÐI" Ñ œ T ÐI# Ñ œ T ÐI$ Ñ œ "Î#. In questo caso si ha T ÐI" ∩ I# ∩ I$ Ñ œ T ÐÖ"×Ñ œ " œ T ÐI" ÑT ÐI# ÑT ÐI$ Ñ . ) Tuttavia gli eventi non sono completamente indipendenti in quanto T ÐI" ∩ I# Ñ œ T ÐÖ"×Ñ œ " " Á T ÐI" ÑT ÐI# Ñ œ . ) % 2.6. Costruzione di spazi probabilizzati prodotto Si considerino 5 esperimenti aleatori che danno luogo ad altrettanti spazi probabilizzati ÐH3 ß Y3 ß T3 Ñ, dove 3 œ "ß á ß 5 . Sia dunque H œ H" ‚ â ‚ H5 il relativo spazio fondamentale prodotto. Come evidenziato nella Sezione 1.5, se H ha cardinalità finita o numerabile, la 5 -algebra prodotto Y può essere scelta come l'insieme delle parti cÐHÑ. In questo caso, per definire una misura di probabilità T sugli eventi di Y , è allora sufficiente probabilizzare gli eventi elementari di H. Se H è non numerabile, allora il problema risulta notevolmente più complesso. In effetti, se la 5 -algebra prodotto Y è scelta come la 5 -algebra generata dalla classe X degli eventi rettangolari, allora si può dimostrare che è sufficiente probabilizzare gli eventi di X per ottenere in modo univoco una misura di probabilità T anche sugli eventi di Y (si veda Dudley, 2004, p.255). Una situazione di particolare interesse è quella in cui ciascun esperimento aleatorio non ha influenza sui rimanenti esperimenti aleatori, ovvero quando si richiede che T ÐI" ‚ â ‚ I5 Ñ œ T3 ÐI3 Ñ , 5 3œ" per ogni I" − Y" ß á ß I5 − Y5 . La misura T è detta probabilità prodotto ed è indicata con T œ T" Œ á Œ T5 . Si può dimostrare l'esistenza e l'unicità della misura di probabilità prodotto (si veda Dudley, 2004, p.255). La precedente relazione definisce in effetti il concetto di indipendenza per la classe di 5 -algebre ÐY3 Ñ83œ" . 31 Capitolo 2 Nella Teoria della Misura, dato lo spazio misurabile prodotto Б5 ß U Б5 ÑÑ, la misura di Lebesgue -5 in ‘5 assegna un “ipervolume” ad ogni insieme rettangolare Ó+" ß ," Ó ‚ â ‚ Ó+5 ß ,5 Ó di ‘5 , ovvero - ÐÓ+" ß ," Ó ‚ â ‚ Ó+5 ß ,5 ÓÑ œ -ÐÓ+3 ß ,3 ÓÑ . 5 5 3œ" La terna Б5 ß U Б5 Ñß -5 Ñ è uno spazio misurato prodotto. Se in generale ÐÐH3 ß Y3 ß T3 ÑÑ3−M , dove M è un insieme eventualmente non numerabile, è una classe di spazi probabilizzati, si può dimostrare che sulla 5 algebra prodotto Y esiste un'unica misura di probabilità T tale che T I3 œ T3 ÐI3 Ñ , 3−N 3−N dove ÐI3 Ñ3−N è una qualsiasi classe di eventi cilindrici di H (si veda Dudley, 2004, p.255). In questo caso, T è detta probabilità prodotto e viene indicata con T œ 3−M T3 . Inoltre, la relazione definisce il concetto di indipendenza per la classe di 5 -algebre ÐY3 Ñ3−N . Si noti infine che la terna ÐHß Y ß T Ñ è detta spazio probabilizzato prodotto. Esempio 2.6.1. Si lanci in modo indipendente un dado e una moneta e si consideri come unico esperimento aleatorio la combinazione dei due esperimenti aleatori. Si supponga che sia il dado che la moneta non siano truccati e quindi che le probabilità nei singoli spazi fondamentali H" e H# siano state assegnate ad ogni evento elementare come T" ÐÖ3×Ñ œ "Î', dove 3 œ "ß á ß ', e T# ÐÖ4×Ñ œ "Î#, 4 œ >ß - . dove Per ogni evento elementare ÖÐ3ß 4Ñ× − H œ H" ‚ H# , la probabilità prodotto T œ T" Œ T# risulta dunque T ÐÖÐ3ß 4Ñ×Ñ œ T" ÐÖ3×ÑT# ÐÖ4×Ñ œ " . "# Una volta assegnate le probabilità agli eventi elementari, risultano determinate anche le probabilità dei #"# eventi che compongono la 5 -algebra Y œ c ÐHÑ relativa all'esperimento aleatorio combinato. In particolare, l'evento I œ ÖÐ"ß - Ñß Ð#ß - Ñ× ha probabilità T ÐI Ñ œ "Î', mentre l'evento I œ ÖÐ$ß >Ñß Ð%ß >Ñß Ð$ß - Ñ× ha probabilità T ÐI Ñ œ "Î%. Si noti come l'assegnazione sia coerente con le probabilità relative ai singoli esperimenti aleatori. Per esempio, l'evento cilindrico I œ ÖÐ#ß >Ñß Ð#ß - Ñ× ha probabilità 32 Misure di probabilità T ÐI Ñ œ "Î', che equivale appunto alla probabilità che nel lancio del dado si sia verificata la faccia contrassegnata dal simbolo #. Esempio 2.6.2. Antoine Gombaud (1607-1684), detto Cavalier de Méré, fu uno scrittore francese e accanito giocatore d'azzardo che pose uno dei primi problemi di calcolo delle probabilità al grande matematico francese Blaise Pascal (16231662). Figura 2.6.1. Blaise Pascal (1623-1662). Il Cavalier de Méré ripeteva % volte il lancio di un dado scommettendo che la faccia contrassegnata da ' si sarebbe verificata almeno una volta. In questo caso, lo spazio fondamentale è dato da H œ H" ‚ â ‚ H% , dove H3 rappresenta lo spazio fondamentale relativo all'3-esimo lancio. Supponendo che i lanci siano effettuati in modo indipendente, sia I3 l'evento che non si sia verificata la faccia ' all'3-esimo lancio. Quindi, se I è l'evento che non si sia verificata la faccia ' a nessun lancio, e considerando un'assegnazione equiprobabile per ogni lancio, si ha & T ÐIÑ œ T ÐI" ‚ â ‚ I% Ñ œ T3 ÐI3 Ñ œ . ' 3œ" % % Dunque, la probabilità che la faccia contrassegnata da ' si sia verificata almeno in un lancio è data da & T ÐI Ñ œ " ¶ !Þ&") . ' % - 33 Capitolo 2 Il gioco era quindi leggermente favorevole per il Cavalier de Méré, che aveva intuito questo risultato semplicemente dalla sua esperienza di giocatore d'azzardo senza ovviamente conoscere l'esatta probabilità. Ingenuamente, il Cavalier de Méré suppose che, dal momento che i possibili risultati nel lancio di due dadi sono $' (ovvero ' volte i risultati nel lancio del singolo dado), allora ripetendo % ‚ ' œ #% volte il lancio di # dadi, sarebbe stato ugualmente favorevole scommettere che “il doppio '” si sarebbe presentato almeno una volta. Tuttavia, con grande sorpresa, il Cavalier de Méré si accorse empiricamente che la giocata non era favorevole e fu spinto a porre il problema a Pascal, che successivamente ebbe uno scambio epistolare con l'altro grande matematico francese Pierre de Fermat (1601 o 1607/8-1665), in cui viene ottenuta la corretta soluzione. Figura 2.6.2. Pierre de Fermat (1601 o 1607/8-1665). Formalmente, lo spazio fondamentale è dato da H œ H" ‚ â ‚ H#% , dove in questo caso H3 rappresenta lo spazio fondamentale relativo all'3-esimo lancio congiunto dei due dadi e che quindi potrebbe essere considerato a sua volta uno spazio prodotto di due spazi fondamentali. Se I rappresenta l'evento che non si sia verificato “il doppio '” su nessun lancio congiunto dei due dadi, considerando un'assegnazione equiprobabile per ogni lancio, allora si ha $& T ÐIÑ œ T ÐI" ‚ â ‚ I#% Ñ œ T3 ÐI3 Ñ œ $' 3œ" #% #% . Dunque, la probabilità che si sia verificato almeno in un lancio congiunto “il doppio '” è data da 34 Misure di probabilità $& T ÐI Ñ œ " $' #% - ¶ !Þ%*" . Come aveva intuito il Cavalier de Méré, il gioco era quindi leggermente sfavorevole. Resta comunque sorprendente come il Cavalier de Méré fosse giunto a queste conclusioni solo sulla base dell'esperienza fatta al tavolo di gioco. Il problema posto dal Cavalier de Méré viene considerato comunemente come il vero inizio della Teoria della Probabilità. Fra l'altro si deve notare che Pascal incoraggiò il grande matematico, astronomo e fisico Christiaan Huygens (1629-1695) a scrivere il trattato De ratiociniis in ludo aleae (1657), largamente basato sullo studio probabilistico del gioco dei dadi. Figura 2.6.3. Christiaan Huygens (1629-1695) e frontespizio di De ratiociniis in ludo aleae (1657). Esempio 2.6.3. La roulette è un gioco d'azzardo la cui introduzione è stata attribuita, almeno nella sua forma primitiva, a Blaise Pascal. Nella versione europea della roulette, detta di tipo Monte Carlo, il gioco è basato su un disco diviso in $( settori di uguale ampiezza e che sono numerati con i primi $' interi e con lo zero. Alternativamente, nella versione americana della roulette, detta di tipo Las Vegas, il disco è diviso in $) settori di uguale ampiezza e che sono numerati con i primi $' interi, con lo zero e con il cosiddetto doppio zero. I settori sono colorati alternativamente in rosso e nero, mentre lo zero, così come il doppio zero quando è presente, sono normalmente colorati di verde. Il gioco consiste nel far ruotare il disco dal gestore del banco (il cosiddetto croupier), che successivamente vi lancia una pallina. La pallina viene fatta ruotare in senso 35 Capitolo 2 opposto a quello della roulette e il numero vincente è quello relativo al settore in cui cade la pallina. Le puntate vengono effettuate su un tavolo verde, su cui sono riportati i numeri della roulette, oltre a varie possibilità di differenti scommesse. Figura 2.6.4. Disposizione dei numeri sulla roulette e sul tavole verde per una roulette di tipo Monte Carlo. Ad esempio, si può scommettere su Pair ou Impair, ovvero che il numero uscito sia pari o dispari, su Manque ou Passe, ovvero che sia uscito un numero da " a ") o un numero da "* a $', o su Rouge ou Noir, ovvero sul colore del numero uscito. Esistono ulteriori possibilità di scommessa, che sono usualmente definite con termini specifici nel linguaggio caratteristico del giocatore d'azzardo. Ovviamente, la procedura viene ripetuta numerose volte durante una serata di gioco. Anche se apparentemente è possibile considerare alla roulette una pluralità di differenti scommesse, in generale il gioco può essere riportato allo schema delle prove ripetute introdotto nell'Esempio 1.5.2. Ad esempio, se si decide di puntare sul rosso durante la serata di gioco, allora si ha in effetti uno schema di Bernoulli basato su 5 ripetizioni di un esperimento aleatorio con esito dicotomico (si veda l'Esempio 1.5.2), ognuna delle quali con spazio fondamentale H3 œ Ö=" ß =# ×, dove =" è il risultato che rappresenta l'uscita di un numero colorato in rosso, mentre =# è il risultato che rappresenta l'uscita di un numero colorato in nero o dello zero. Supponendo che il croupier sia onesto e la roulette sia bilanciata, si può considerare l'assegnazione di probabilità T3 ÐÖ=" ×Ñ œ ")Î$( e T3 ÐÖ=# ×Ñ œ "*Î$( sullo spazio fondamentale H3 . Dal momento che lo spazio fondamentale prodotto H ha cardinalità finita, la misura di probabilità prodotto T si ottiene probabilizzando i #5 eventi elementari ÖÐ=4" ß á ß =45 Ñ× di H, ovvero 36 Misure di probabilità T ÐÖÐ=4" ß á ß =45 Ñ×Ñ œ T3 ÐÖ=43 ×Ñ , 5 3œ" dove 43 œ "ß # e 3 œ "ß á ß 5 . Per un approfondimento delle strategie di gioco ottimali alla roulette (nel senso di strategie che permettono di limitare le perdite) si consideri la trattazione di Billingsley (1995, p.92). Si noti che nelle case da gioco europee la precedente assegnazione di probabilità può risultare modificata dalla possibilità di recuperare almeno in parte la giocata quando si presenta lo zero (mediante le regole basate su la partage o en prison) e che nel presente esempio non è stata adottata per semplicità di esposizione. 2.7. Lemma di Borel-Cantelli e Legge zero-uno di Kolmogorov In questa Sezione vengono considerati alcuni risultati molto celebrati che riguardano successioni di eventi. Il seguente Lemma, che è fondamentale per ottenere risultati teorici di convergenza, è dovuto al probabilista italiano Francesco Paolo Cantelli (1875-1966) e al già citato Émile Borel. Teorema 2.7.1. (Lemma di Borel-Cantelli) Dato lo spazio probabilizzato ÐHß Y ß T Ñ, se ÐI8 Ñ8 " è una successione di eventi di Y tale che ∞ 8œ" T ÐI8 Ñ ∞, allora T lim sup I8 œ ! . 8 Inoltre, se ÐI8 Ñ8 " è una successione di eventi indipendenti di Y tale che ∞ 8œ" T ÐI8 Ñ œ ∞, allora T lim sup I8 œ " . 8 Dimostrazione. Tenendo presente i Teoremi 2.2.7 e 2.2.8, si ha T lim sup I8 Ÿ T I5 Ÿ T ÐI5 Ñ 8 ∞ ∞ 5œ8 5œ8 37 Capitolo 2 per ogni 8. Dal momento che ∞ 8œ" T ÐI8 Ñ ∞, allora deve risultare lim T ÐI5 Ñ œ ! , ∞ 8 5œ8 da cui segue la prima parte del Teorema. Inoltre, tenendo presente la relazione di De Morgan, si ha lim sup I8 œ I5- œ I5- œ lim inf I8- , 8 8 - ∞ ∞ 8œ" 5œ8 ∞ - ∞ - 8œ" 5œ8 da cui T lim sup I8 œ " T lim inf I8- . 8 8 ∞ 5œ8 Si noti che lim inf8 I8- œ ∞ I5- , mentre ÐG8 Ñ8 " è una 8œ" G8 , dove G8 œ successione crescente di eventi. Dunque, dal Teorema 2.2.10 e dall'indipendenza degli eventi della successione risulta T lim sup I8 œ " T lim G8 8 8 œ " lim T ÐG8 Ñ œ " lim Ð" T ÐI5 ÑÑ . ∞ 8 8 5œ8 Tenendo presente la disuguaglianza " B Ÿ expÐ BÑ, per ogni 8 si ha Ð" T ÐI5 ÑÑ Ÿ expÐ T ÐI5 ÑÑ œ exp T ÐI5 Ñ . ∞ ∞ ∞ 5œ8 5œ8 5œ8 Quindi dal momento che ∞ 8œ" T ÐI8 Ñ œ ∞ e che T ÐI8 Ñ Ÿ " per ogni 8, allora deve risultare lim T ÐI5 Ñ œ ∞ , ∞ 8 e dunque 5œ8 38 Misure di probabilità lim Ð" T ÐI5 ÑÑ œ ! , ∞ 8 5œ8 da cui segue la seconda parte del Teorema. Esempio 2.7.1. Si consideri lo schema di Bernoulli relativo ad un'infinità numerabile di ripetizioni del lancio di una moneta bilanciata e il relativo spazio probabilizzato prodotto ÐHß Y ß T Ñ. Se I8 rappresenta l'evento di ottenere una sequenza di almeno 8 volte il simbolo “testa”, si ha T ÐI8 Ñ œ " #5 œ #8 . 8 5œ" Se si considera la successione di eventi ÐI8 Ñ8 " , allora risulta ∞ 8œ" T ÐI8 Ñ œ " e quindi la prima parte del Lemma di Borel-Cantelli implica che T Ðlim sup8 I8 Ñ œ !. In altre parole, una sequenza di simboli “testa” di lunghezza arbitraria si presenta infinitamente spesso con probabilità nulla. Se inoltre I8 è l'evento di ottenere il simbolo “testa” al Ð#8 "Ñ-esimo e al Ð#8Ñ-esimo lancio, si ha T ÐI8 Ñ œ " . % Gli eventi della successione ÐI8 Ñ8 " sono indipendenti e risulta ∞ 8œ" T ÐI8 Ñ œ ∞. Quindi, dalla seconda parte del Lemma di Borel-Cantelli si ha T Ðlim sup8 I8 Ñ œ ". In altre parole, una sequenza di due simboli “testa” si presenta infinitamente spesso con probabilità unitaria. Analogamente, si può verificare che una qualsiasi prefissata sequenza di lunghezza finita di simboli “testa” e “croce” si verifica infinitamente spesso. Se i simboli “testa” e “croce” vengono messi in corrispondenza biunivoca con i simboli “punto” e “linea” di un alfabeto Morse, allora il risultato appena ottenuto è stato frequentemente interpretato in maniera pittoresca. Infatti, qualsiasi opera letteraria può essere rappresentata come una sequenza di simboli nell'alfabeto Morse. Quindi, adottando uno schema di Bernoulli di lanci ripetuti della moneta, questa opera “verrà scritta” dal lancio della moneta con probabilità unitaria, purché il lanciatore sia abbastanza paziente. 39 Capitolo 2 Teorema 2.7.2. (Legge zero-uno di Kolmogorov) Dato lo spazio probabilizzato ÐHß Y ß T Ñ, se ÐI8 Ñ8 " è una successione di eventi indipendenti di Y , si consideri la successione di 5 -algebre ÐY8 Ñ8 " , dove Y8 œ 5 ÐX8 Ñ e X8 œ ÖI8 ß I8" ß á ×. Se I − ∞ 8œ" Y8 , allora si ha T ÐIÑ œ ! o T ÐIÑ œ ". Dimostrazione. Si veda Gut (2005, p.20). Esempio 2.7.2. Si consideri una successione di eventi indipendenti ÐI8 Ñ8 " e sia dato l'ulteriore evento " 8 IB œ = − H À lim "I3 Ð=Ñ Ÿ B . 8 8 3œ" dove B − ‘. In pratica, l'evento IB si verifica se il limite della frequenza relativa degli eventi della successione che si verificano è minore o uguale a B. Si noti che " 8 " IB œ = − H À "I3 Ð=Ñ Ÿ B 8 3œ4 7 7œ" 5œ4 8œ5 ∞ ∞ ∞ Inoltre, tenendo presente la notazione del Teorema 2.7.2, si ha " 8 " " = − H À Ð = Ñ Ÿ B − Y8 . I 8 3œ4 3 7 Dal momento che IB può essere espresso come unione e intersezione numerabile di questi eventi, allora dal Teorema 2.7.2 si ha T ÐIB Ñ œ ! o T ÐIB Ñ œ " per ogni B. 2.8. Riferimenti bibliografici L'approccio assiomatico è quello seguito nella maggioranza dei testi di Teoria della Probabilità, come ad esempio quelli segnalati nella Sezione 1.6. Si deve comunque evidenziare che l'approccio soggettivo alla probabilità, per quanto minoritario nei testi, ha notevole importanza in ambito statistico. Per una trattazione di questo approccio si dovrebbero consultare i classici testi di de Finetti (1970) e Dubins e Savage (1965). Per una revisione degli approcci 40 Misure di probabilità moderni alla probabilità si veda il testo di von Plato (1994). I problemi tecnici connessi alla costruzione della misura di probabilità sono estesamente considerati in Dudley (2004). Per quanto riguarda l'esemplificazione del calcolo delle probabilità con spazi finiti o numerabili si dovrebbero consultare i testi di Blom (1994), Gorroochurn (2012), Isaac (1995), Mosteller (1987) e Petkovic (2009), che contengono numerosi problemi classici. Erickson (2010), Graham et al. (1994) e Lovász (2003) sono testi introduttivi al calcolo combinatorio con parti dedicate al calcolo delle probabilità con spazi finiti. Infine, per una trattazione di paradossi e controesempi in probabilità, si veda i testi di Székely (1986) e Wise e Hall (1993). Capitolo 3 Variabili e vettori aleatori 3.1. Variabili aleatorie Quando si analizzano esperimenti o fenomeni aleatori, le quantità di interesse sono comunemente applicazioni dallo spazio fondamentale all'insieme dei numeri reali, che nella Teoria della Probabilità sono dette variabili aleatorie. Formalmente, si ha la seguente definizione. Definizione 3.1.1. Se ÐHß Y ß T Ñ è uno spazio probabilizzato, un'applicazione \ À H È ‘ è detta variabile aleatoria (v.a.) se l'evento \ " ÐFÑ œ Ö= − H À \Ð=Ñ − F× è tale che \ " ÐFÑ − Y per ogni F − U БÑ. Quindi, un'applicazione da H a ‘ è una v.a. se l'immagine inversa di ogni F − U Ð‘Ñ appartiene alla 5 -algebra Y . Nel linguaggio della Teoria della Misura una v.a. è detta funzione misurabile. Inoltre, si noti che la definizione di v.a. non coinvolge la scelta della misura di probabilità effettuata su Y . In altre parole, una v.a. continua a rimanere tale anche se viene considerata una differente scelta della misura di probabilità su Y . Se si considera lo spazio probabilizzato ÐHß Y ß T Ñ, la misura di probabilità indotta dalla v.a. \ è data da T\ ÐFÑ œ T Ð\ " ÐFÑÑ Þ La misura di probabilità T\ è detta legge (o distribuzione) della v.a. \ . Per quanto riguarda la notazione si noti che le v.a. sono generalmente indicate con lettere maiuscole (ad esempio \ , ] e ^ ) e le rispettive leggi sono indicizzate di conseguenza. Inoltre, per semplicità di notazione, l'evento \ " ÐFÑ viene semplicemente indicato con Ö\ − F× e la probabilità T ÐÖ\ − F×Ñ è 2 Variabili e vettori aleatori comunemente indicata con T Ð\ − FÑ. Questi leggeri abusi in notazione sono universalmente adottati nei testi di Teoria della Probabilità. Teorema 3.1.2. Ð‘ß U БÑß T\ Ñ è uno spazio probabilizzato. Dimostrazione. Occorre dimostrare che T\ soddisfa i tre assiomi della Definizione 2.1.2. Per ogni F − U Ð‘Ñ si ha ovviamente T\ ÐFÑ œ T Ð\ − FÑ ! . Inoltre, risulta T\ Ð‘Ñ œ T Ð\ − ‘Ñ œ " . Infine, data una successione di insiemi disgiunti ÐF8 Ñ8 " − U БÑ, dal momento che ÐÖ\ − F8 ×Ñ8 " è una successione di eventi incompatibili, si ha T\ F8 œ T \ − F8 œ T Ö\ − F8 × ∞ 8œ" ∞ ∞ 8œ" 8œ" œ T Ð\ − F8 Ñ œ T\ ÐF8 Ñ , ∞ ∞ 8œ" 8œ" da cui segue la tesi. Se l'interesse è dunque focalizzato sulla v.a. \ , lo spazio probabilizzato Б ß U БÑß T\ Ñ diventa centrale e, da un punto di vista pratico, lo spazio probabilizzato ÐHß Y ß T Ñ può essere tralasciato. Tuttavia, si dovrebbe notare che, mentre una v.a. determina univocamente la rispettiva legge, l'affermazione contraria è falsa. In altre parole, v.a. differenti potrebbero avere la medesima legge, perfino se sono definite su spazi probabilizzati differenti. In particolare, se \ e ] sono v.a. con leggi date da T\ e T] e se T\ ÐFÑ œ T] ÐFÑ per ogni F − U БÑ, allora si dice che le due v.a. sono uguali in legge e si scrive _ \œ] . Si noti inoltre che, se si ha un'applicazione \ À H È W , dove W § ‘ è un insieme numerabile, affinchè \ sia una v.a. è sufficiente che l'evento Ö\ œ B× œ Ö= − H À \Ð=Ñ œ B× appartenga a Y per ogni B − W . In questo caso, la v.a. è detta discreta. Per definire la legge di una v.a. discreta è sufficiente dunque considerare le 3 Capitolo 3 probabilità T Ð\ œ BÑ per B − W , che definiscono la cosiddetta legge essenziale della v.a. \ . Inoltre, se cardÐWÑ œ ", la v.a. discreta è detta degenere. Una precisa classificazione delle v.a. sarà considerata nella Sezione 3.2, così come le v.a. discrete saranno considerate in dettaglio nella Sezione 3.3. Si noti inoltre che nel linguaggio della Teoria della Misura una v.a. discreta che assume un numero finito di valori, ovvero quando si ha cardÐWÑ œ 8, è detta funzione misurabile semplice. Esempio 3.1.1. Si consideri lo spazio fondamentale H œ Ö=" ß =# × e l'assegnazione di probabilità T ÐÖ=3 ×Ñ œ "Î# per 3 œ "ß #. Si consideri inoltre la v.a. discreta \ tale che \Ð=" Ñ œ ! e \Ð=# Ñ œ ". Essendo W œ Ö!ß "×, la legge essenziale di \ risulta T Ð\ œ BÑ œ "Î# per B œ !ß ". Sia data l'ulteriore v.a. discreta ] tale che ] Ð=" Ñ œ " e ] Ð=# Ñ œ !. Risulta evidente che le leggi _ essenziali di \ e ] sono identiche e quindi \ œ ] , anche se le v.a. \ e ] differiscono per ogni evento elementare di H. Si consideri l'ulteriore spazio fondamentale dato da H œ Ö=" ß =# ß =$ ß =% × e l'assegnazione di probabilità T ÐÖ=3 ×Ñ œ "Î% per ogni 3. Se ^ è la v.a. discreta tale che ^Ð=" Ñ œ ^Ð=# Ñ œ ! e ^Ð=$ Ñ œ ^Ð=% Ñ œ ", allora la legge essenziale della v.a. ^ è identica a quella _ della v.a. \ e quindi \ œ ^ , anche se la v.a. ^ è definita su un differente spazio fondamentale. La precedente legge è una delle più semplici che si possono considerare e si ottiene per una specifica parametrizzazione della legge di Bernoulli, che è stata ovviamente introdotta da Jakob Bernoulli. La legge di Bernoulli è un caso particolare della legge Binomiale analizzata nella Sezione 6.1. Dal momento che la costruzione della 5-algebra di Borel U Ð‘Ñ può essere fatta a partire dalla classe di insiemi del tipo Ó ∞ß BÓ, allora \ è una v.a. se l'evento Ö\ Ÿ B× œ Ö\ − Ó ∞ß BÓ× appartiene ad Y per ogni B − ‘. In questo caso, a T\ è associata in modo unico la cosiddetta funzione di ripartizione (f.r.), che viene indicata con J\ ed è data da J\ ÐBÑ œ T\ ÐÓ ∞ß BÓÑ œ T Ð\ Ÿ BÑ Þ Dunque, l'uguaglianza in legge equivale all'uguaglianza delle f.r., ovvero se \ e _ ] sono v.a. con f.r. date rispettivamente da J\ e J] , allora \ œ ] se J\ ÐBÑ œ J] ÐBÑ per ogni B − ‘. Esempio 3.1.2. Si consideri di nuovo la v.a. discreta \ introdotta nell'Esempio 3.1.1. La f.r. di \ è data da 4 Variabili e vettori aleatori ! J\ ÐBÑ œ "# " B! !ŸB" B " o, in forma più concisa, da J\ ÐBÑ œ " "Ò!ß"Ò ÐBÑ "Ò"ß∞Ò ÐBÑ Þ # Il grafico di J\ è riportato nella Figura 3.1.1. 1.0 0.8 0.6 0.4 0.2 0.0 0.0 0.5 1.0 Figura 3.1.1. Funzione di ripartizione relativa alla legge di Bernoulli. 3.2. Proprietà della funzione di ripartizione Per quanto detto nella Sezione 3.1, risulta evidente che la descrizione probabilistica della v.a. \ è incentrata sulle caratteristiche della corrispondente f.r. Sulla base della definizione, è quindi conveniente ricavare alcune proprietà relative alla f.r. Teorema 3.2.1. Se J\ è la f.r. relativa alla v.a. \ definita sullo spazio probabilizzato ÐHß Y ß T Ñ, si ha ! Ÿ J\ ÐBÑ Ÿ " per ogni B − ‘. Dimostrazione. Per definizione, risulta J\ ÐBÑ œ T Ð\ Ÿ BÑ, dove Ö\ Ÿ B× − Y e quindi ! Ÿ T Ð\ Ÿ BÑ Ÿ ". Teorema 3.2.2. Se J\ è la f.r. relativa alla v.a. \ definita sullo spazio probabilizzato ÐHß Y ß T Ñ, J\ è non decrescente. 5 Capitolo 3 Dimostrazione. Occorre dimostrare che se B C, allora J\ ÐBÑ Ÿ J\ ÐCÑ. Per definizione si ha J\ ÐBÑ œ T Ð\ Ÿ BÑ e J\ ÐCÑ œ T Ð\ Ÿ CÑ. Inoltre, se = − Ö\ Ÿ B× deve risultare = − Ö\ Ÿ C×. Dunque, si ha Ö\ Ÿ B× § Ö\ Ÿ C×, e dal Teorema 2.2.3 si ottiene infine che T Ð\ Ÿ BÑ Ÿ T Ð\ Ÿ CÑ. Teorema 3.2.3. Se J\ è la f.r. relativa alla v.a. \ definita sullo spazio probabilizzato ÐHß Y ß T Ñ, allora limBÄ∞ J\ ÐBÑ œ ! e limBÄ∞ J\ ÐBÑ œ ". Dimostrazione. Si ha lim J\ ÐBÑ œ lim T Ð\ Ÿ BÑ œ lim T ÐI8 Ñ , BÄ∞ BÄ∞ 8 dove ÐI8 Ñ8 " è una successione decrescente di eventi il cui generico elemento è dato da I8 œ Ö\ Ÿ 8×. Dunque, tenendo presente il Teorema 2.2.10 e la definizione di limite di successione decrescente di eventi, risulta lim T ÐI8 Ñ œ T lim I8 œ T I8 œ T ÐgÑ œ ! . ∞ 8 8 8œ" In modo analogo, si ha lim J\ ÐBÑ œ lim T Ð\ Ÿ BÑ œ lim T ÐI8 Ñ , BÄ∞ BÄ∞ 8 dove ÐI8 Ñ8 " è una successione crescente di eventi il cui generico elemento è dato da I8 œ Ö\ Ÿ 8×. Dunque, risulta lim J\ ÐBÑ œ T I8 œ T ÐHÑ œ " . ∞ BÄ∞ 8œ" Teorema 3.2.4. Se J\ è la f.r. di una v.a. \ definita sullo spazio probabilizzato ÐHß Y ß T Ñ, allora J\ è continua a destra. Dimostrazione. Per ogni B − ‘, si deve dimostrare che per & ! si ha lim J\ ÐB &Ñ œ J\ ÐBÑ , &Ä! ovvero che lim T Ð\ Ÿ B &Ñ œ T Ð\ Ÿ BÑ . &Ä! Per un dato B − ‘, si consideri che 6 Variabili e vettori aleatori lim T Ð\ Ÿ B &Ñ œ lim T ÐI8 Ñ , 8 &Ä! dove ÐI8 Ñ8 " è una successione decrescente di eventi il cui generico elemento è dato da I8 œ Ö\ Ÿ B 8" ×. Tenendo presente il Teorema 2.2.10 e la definizione di limite di successione decrescente di eventi, si ha lim T ÐI8 Ñ œ T I8 œ T Ð\ Ÿ BÑ , ∞ 8 8œ" da cui segue la tesi. Teorema 3.2.5. Sia J\ la f.r. di una v.a. \ definita sullo spazio probabilizzato ÐHß Y ß T Ñ e per & ! sia ˜J\ ÐBÑ œ lim J\ ÐB &Ñ lim J\ ÐB &Ñ œ J\ ÐBÑ lim J\ ÐB &Ñ , &Ä! &Ä! &Ä! ovvero ˜J\ ÐBÑ rappresenta l'ampiezza del salto di J\ ÐBÑ nel punto B. Si ha ˜J\ ÐBÑ œ T Ð\ œ BÑ . Dimostrazione. Risulta lim J\ ÐB &Ñ œ lim T Ð\ Ÿ B &Ñ œ lim T ÐI8 Ñ , &Ä! 8 &Ä! dove ÐI8 Ñ8 " è una successione crescente di eventi il cui generico elemento è dato da I8 œ Ö\ B 8" ×. Inoltre, dal Teorema 2.2.10 e dalla definizione di limite di successione crescente di eventi, risulta lim T ÐI8 Ñ œ T I8 œ T Ð\ BÑ , ∞ 8 8œ" da cui ˜J\ ÐBÑ œ T Ð\ Ÿ BÑ T Ð\ BÑ œ T Ð\ œ BÑ . Teorema 3.2.6. Sia J\ la f.r. di una v.a. \ definita sullo spazio probabilizzato ÐHß Y ß T Ñ. L'insieme di punti di discontinuità di J\ è numerabile. Dimostrazione. Per ogni punto di salto B si consideri l'intervallo aperto 7 Capitolo 3 MB œ Ólim J\ ÐB &Ñß J\ ÐBÑÒ , &Ä! dove & !. Se C è un ulteriore punto di salto tale che B C, allora dal Teorema 3.2.2 si ha J\ ÐBÑ Ÿ lim J\ ÐC &Ñ , &Ä! per cui gli intervalli MB e MC sono disgiunti. Quindi, l'insieme dei punti di salto può essere messo in corrispondenza biunivoca con un insieme di intervalli disgiunti, che per il Teorema 3.2.1 sono sottoinsiemi dell'intervallo Ò!ß "Ó. Quest'ultimo insieme è necessariamente numerabile, dal momento che ogni intervallo dell'insieme contiene almeno un numero razionale. Dunque, l'insieme dei punti di salto è in corrispondenza biunivoca con un sottoinsieme dei numeri razionali e quindi è numerabile. Si può quindi concludere che la f.r. J\ di una v.a. \ non è continua a sinistra e che risulta continua a B se e solo se T Ð\ œ BÑ œ !, mentre l'insieme dei punti di discontinuità, ovvero l'insieme dei punti di probabilità non nulla, deve essere finito o al più numerabile. Risulta possibile verificare che in generale ogni f.r. J\ può essere espressa in modo unico come la combinazione convessa di tre tipi fondamentali di f.r., ovvero J\ œ α. J. α+- J+- α= J= , dove α. ß α+- ß α= ! e α. α+- α= œ " (si veda Chung, 2001, p.1). In questo caso, J. è una f.r. costante a tratti con un insieme numerabile di punti di salto ed è detta f.r. discreta. Formalmente, J. è una f.r. discreta se esiste un insieme numerabile W , tale che T Ð\ œ BÑ ! solo se B − W , per cui si ha J. ÐBÑ œ "Ó∞ßBÓ Ð?ÑT Ð\ œ ?Ñ . ?−W Inoltre, J+- è una f.r. assolutamente continua, ovvero esiste una classe di funzioni non negative, il cui generico elemento è indicato con 0\ , che coincidono ;Þ9Þ rispetto alla misura di Lebesgue, integrabili su ‘ rispetto alla misura di Lebesgue, e per cui si ha J+- ÐBÑ œ B ∞ 0\ Ð?Ñ .? . 8 Variabili e vettori aleatori Infine, J= è una f.r. singolare, se non è identicamente nulla e se la derivata J=w esiste ed è nulla ;Þ9Þ Una f.r. singolare è continua, ma non è assolutamente continua e non ammette la precedente rappresentazione integrale. Risulta immediato verificare che una v.a. discreta, come definita nella Sezione 3.1, possiede una f.r. del primo tipo. Inoltre, una v.a. è detta assolutamente continua se possiede una f.r. del secondo tipo. Infine, una v.a. è detta singolare se possiede una f.r. del terzo tipo. Una v.a. è detta mista se possiede una f.r. che è data da una combinazione convessa di almeno due tipi di f.r. Proprietà ed esempi specifici di v.a. discrete e assolutamente continue saranno discusse a lungo nel presente capitolo e nei prossimi capitoli. Al contrario, v.a. singolari sono poco impiegate nella pratica e non saranno ulteriormente considerate. Tuttavia, si noti che questo tipo di v.a. riveste un'importanza notevole nelle strategie di gioco ottimali in giochi d'azzardo quale la roulette. Questi argomenti sono considerati in grande dettaglio da Billingsley (1995, p.101). Esempio 3.2.1. Si consideri la v.a. \ con f.r. data da ! J\ ÐBÑ œ B " B! !ŸB" B " o, in forma più concisa, da J\ ÐBÑ œ B"Ò!ß"Ò ÐBÑ "Ò"ß∞Ò ÐBÑ Þ Dal momento che J\ ÐBÑ œ B "Ó!ß"Ò Ð?Ñ .? , ∞ allora \ è una v.a. assolutamente continua. Evidentemente, in questo caso si è scelto 0\ ÐBÑ œ "Ó!ß"Ò ÐBÑ, anche se sarebbe stata ugualmente corretta una scelta del tipo 0\ ÐBÑ œ "Ó!ß"ÒÏ ÐBÑÞ In effetti, le due scelte coincidono ;Þ9Þ, dal momento che l'insieme dei numeri razionali in Ó!ß "Ò è numerabile e la sua misura di Lebesgue risulta nulla. La legge associata a questa v.a. si ottiene per una particolare parametrizzazione della cosiddetta legge Uniforme, che a sua volta è un caso particolare della legge Beta, che sarà considerata in dettaglio nella Sezione 6.9. Il grafico della f.r. considerata è riportato nella Figura 3.2.1. 9 Capitolo 3 1.0 0.8 0.6 0.4 0.2 0.0 0.0 0.5 1.0 Figura 3.2.1. Funzione di ripartizione relativa alla legge Uniforme. Esempio 3.2.2. Si consideri la v.a. \ con f.r. data da ! J\ ÐBÑ œ #B" % " B! !ŸB" B " o, in forma più concisa, da J\ ÐBÑ œ #B " "Ò!ß"Ò ÐBÑ "Ò"ß∞Ò ÐBÑ Þ % 1.0 0.8 0.6 0.4 0.2 0.0 0.0 0.5 1.0 Figura 3.2.2. Funzione di ripartizione relativa alla legge mista. 10 Variabili e vettori aleatori Si noti che J\ ÐBÑ œ " " J. ÐBÑ J+- ÐBÑ , # # dove J. è la f.r. discreta considerata nell'Esempio 3.1.2, mentre J+- è la f.r. assolutamente continua considerata nell'Esempio 3.2.1. Dunque, \ è una v.a. mista. Il grafico della f.r. considerata è riportato nella Figura 3.2.2. Esempio 3.2.3. Si consideri l'insieme di Cantor analizzato nell'Esempio 2.3.5. Ogni elemento B che appartiene all'insieme di Cantor ha l'espansione ternaria data da Bœ ∞ 8œ" -8 , $8 dove -8 œ !ß #, ovvero B ha un'espansione ternaria che non contiene la cifra ". Si consideri la f.r. data da J\ ÐBÑ œ ∞ 8œ" -8 "Ò"ß∞Ò ÐBÑ , #8" con B definito in precedenza. Questa f.r. è in effetti la funzione di Cantor, che in modo piuttosto pittoresco viene detta anche “scala del diavolo”. Si può dimostrare che J\w è nulla ;Þ9Þ e quindi J\ è singolare (si veda Chung, 2001, p.13). Il grafico (ovviamente approssimato) della f.r. è riportato nella sottostante Figura 3.2.3. 1.0 0.8 0.6 0.4 0.2 0.0 0.0 0.2 0.4 0.6 0.8 1.0 Figura 3.2.3. Funzione di ripartizione di Cantor. 11 Capitolo 3 3.3. Variabili aleatorie discrete Come evidenziato nella Sezione 3.1, la v.a. \ è detta discreta se è a valori su insieme numerabile W . Se si definisce la funzione di probabilità (f.p.) della v.a. \ come :\ ÐBÑ œ T Ð\ œ BÑ , in base a quanto visto nella Sezione 3.2, la f.r. di \ può essere scritta come J\ ÐBÑ œ "Ó∞ßBÓ Ð?Ñ:\ Ð?Ñ . ?−W La f.p. :\ è non nulla solo se B − W . L'insieme delle probabilità Ð:\ ÐBÑÑB−W costituisce la legge essenziale di \ definita nella Sezione 3.1. Inoltre, la f.r. J\ è costante a tratti, con punti di salto sugli elementi B − W per cui si ha :\ ÐBÑ œ ˜J\ ÐBÑ. Per ovvie ragioni di semplicità è in pratica conveniente lavorare con la f.p. piuttosto che con la f.r., dal momento che la f.p. definisce comunque la legge essenziale della v.a. \ . Si noti che, tenendo presente il Teorema di Radon-Nikodym (Teorema A.9), la legge della v.a. \ può essere anche scritta sotto forma di integrale, ovvero per ogni F − U Ð‘Ñ si ha T\ ÐFÑ œ :\ ./ , F dove / ÐFÑ œ cardÐF ∩ WÑ, ovvero / è la misura che enumera gli elementi di un sottoinsieme di W . Equivalentemente, risulta dunque T Ð\ − FÑ œ "F ÐBÑ:\ ÐBÑ . B−W Dal momento che H œ B−W Ö\ œ B×, è immediato verificare che :\ ÐBÑ œ " . B−W Esempio 3.3.1. Si consideri la v.a. \ con f.p. data da :\ ÐBÑ œ #B" " ÐBÑ . 12 Variabili e vettori aleatori In questo caso si ha W œ , mentre la legge essenziale è data dall'insieme delle probabilità Ð#B" ÑB−W . Inoltre, considerando la serie geometrica, per + − Ó!ß "Ò è ben noto che +B œ ∞ Bœ! " "+ e quindi adoperando la precedente relazione per + œ "Î# si ha " ∞ B :\ ÐBÑ œ # œ " . # Bœ! Bœ! ∞ Tenendo presente che per + − Ó!ß "Ò si ha inoltre +? œ 5 ?œ! " +5" , "+ e adoperando questa relazione con + œ "Î#, la f.r. di \ risulta J\ ÐBÑ œ "Ó∞ßBÓ Ð?Ñ#?" ?−W œ "Ò!ß∞Ò ÐBÑ #?" œ Ð" #ÚBÛ" Ñ"Ò!ß∞Ò ÐBÑ , ÚBÛ ?œ! dove ÚBÛ denota il più grande numero intero minore o uguale a B. Infine, la probabilità che la v.a. \ assuma un valore intero dispari è data da :\ Ð#B "Ñ œ # ∞ Bœ! ∞ Bœ! #B# " ∞ B " œ % œ . % Bœ! $ La legge associata a questa v.a. si ottiene per una particolare parametrizzazione della legge Geometrica, che a sua volta è un caso particolare della legge Binomiale Negativa considerata nella Sezione 6.3. Esempio 3.3.2. Sia W œ ÐB8 Ñ8 " una enumerazione dei numeri razionali e si consideri la v.a. \ con legge essenziale data dall'insieme delle probabilità Ð#8 Ñ8 " , mentre la relativa f.r. risulta 13 Capitolo 3 J\ ÐBÑ œ "Ó∞ßBÓ ÐB8 Ñ#8 . ∞ 8œ" Si noti che le probabilità relative alla legge essenziale sono in effetti identiche a quelle dell'Esempio 3.3.1, anche se definite su un differente insieme W . Tuttavia, la v.a. \ del presente esempio è in qualche modo patologica, in quanto prende valori su una enumerazione dei numeri razionali che non è unica e neppure “cronologica”. Inoltre, W è un insieme denso su ‘. 3.4. Variabili aleatorie assolutamente continue Come detto nella Sezione 3.2., una v.a. \ è assolutamente continua se possiede una f.r. assolutamente continua rispetto alla misura di Lebesgue. In questo caso, la f.r. della v.a. \ può essere espressa come J\ ÐBÑ œ B 0\ Ð?Ñ .? , ∞ dove la funzione misurabile non negativa 0\ À ‘ È Ò!ß ∞Ò è detta densità di probabilità (d.p.) o semplicemente densità. Come evidenziato nella Sezione 3.2., la d.p. non è unica e quindi si dovrebbe parlare più propriamente di una versione della densità. Tenendo presente la mancanza di univocità, per l'utilizzo pratico è comunque conveniente considerare la d.p. in quanto possiede generalmente un'espressione molto più semplice della relativa f.r. In questo caso, si dice che \ ammette una d.p. 0\ . Inoltre, dal momento che una f.r. è differenziabile ;Þ9Þ su ‘ (si veda Chung, 2001, p.11), allora risulta 0\ ÐBÑ œ . J\ ÐBÑ . .B Tenendo presente il Teorema di Radon-Nikodym (Teorema A.9), la legge della v.a. \ può essere scritta sotto forma di integrale, ovvero per ogni F − U Ð‘Ñ si ha T\ ÐFÑ œ T Ð\ − FÑ œ 0\ ÐBÑ .B . F In particolare, se F œ Ó+ß ,Ó allora risulta 14 Variabili e vettori aleatori T Ð\ − Ó+ß ,ÓÑ œ J\ Ð,Ñ J\ Ð+Ñ œ 0\ ÐBÑ .B . , + Dal momento che T Ð\ œ BÑ œ ! per ogni B − ‘, essendo la v.a. \ assolutamente continua, allora si ha anche T Ð\ − Ò+ß ,ÓÑ œ T Ð\ − Ó+ß ,ÒÑ œ T Ð\ − Ò+ß ,ÒÑ œ 0\ ÐBÑ .B . , + Risulta infine T Ð\ − ‘Ñ œ ∞ 0\ ÐBÑ .B œ " . ∞ Esempio 3.4.1. Si consideri la v.a. \ con f.r. data da ! J\ ÐBÑ œ B$ " B! !ŸB" B " o, in forma più concisa, da J\ ÐBÑ œ B$ "Ò!ß"Ò ÐBÑ "Ò"ß∞Ò ÐBÑ Þ La v.a. \ è assolutamente continua e si ha J\ ÐBÑ œ B $?# "Ó!ß"Ò Ð?Ñ .? . ∞ Inoltre, J\ è derivabile ;Þ9Þ, dal momento che non è derivabile solo se B œ ", per cui si ha T Ð\ œ "Ñ œ !. Dunque, una versione della d.p. è data da 0\ ÐBÑ œ . J\ ÐBÑ œ $B# "Ó!ß"Ò ÐBÑ . .B Inoltre, si ha T Ð\ − Ó!ß "Î#ÒÑ œ T Ð\ − Ò!ß "Î#ÓÑ œ J\ Ð"Î#Ñ J\ Ð!Ñ œ mentre " , ) 15 Capitolo 3 T Ð\ − Ó "ß #ÓÑ œ J\ Ð#Ñ J\ Ð "Ñ œ " . La legge associata alla v.a. considerata si ottiene per una particolare parametrizzazione della legge Beta (si veda Sezione 6.9). 3.5. Vettori aleatori Quando si considera un'applicazione dallo spazio fondamentale a ‘5 , il concetto di v.a. può essere esteso immediatamente a quello di vettore aleatorio. Formalmente, si ha la seguente definizione. Definizione 3.5.1. Se ÐHß Y ß T Ñ è uno spazio probabilizzato, un'applicazione \ À H È ‘5 è detta vettore di variabili aleatorie (v.v.a.) (o semplicemente vettore aleatorio) se l'evento \ " ÐFÑ œ Ö= − H À \Ð=Ñ − F× è tale che \ " ÐFÑ − Y per ogni F − U Б5 Ñ. Un v.v.a. è quindi dato da un vettore del tipo \ œ Ð\" ß á ß \5 ÑT , dove \" ß á ß \5 sono v.a. La v.a. \3 è detta componente marginale del v.v.a. \ , mentre la misura di probabilità T\ indotta dal v.v.a. è detta legge congiunta. Se F œ F" ‚ â ‚ F5 con F3 − U БÑ, si definisca inoltre l'evento Ö\ − F× œ Ö\" − F" ß á ß \5 − F5 × œ Ö\3 − F3 × . 5 3œ" In particolare, si definisce Ö\ Ÿ B× œ Ö\" Ÿ B" ß á ß \5 Ÿ B5 × œ Ö\3 Ÿ B3 × , 5 3œ" dove B œ ÐB" ß á ß B5 ÑT , e tenendo presente che la 5algebra di Borel su ‘5 può essere costruita a partire dagli insiemi rettangolari del tipo Ó ∞ß B" Ó ‚ â ‚ Ó ∞ß B5 Ó, alla legge congiunta T\ è associata in modo unico la cosiddetta funzione di ripartizione congiunta (f.r.c.), data da J\ ÐBÑ œ J\ ÐB" ß á ß B5 Ñ œ T Ð\ Ÿ BÑ œ T Ð\" Ÿ B" ß á ß \5 Ÿ B5 Ñ Þ 16 Variabili e vettori aleatori Inoltre, la funzione di ripartizione marginale (f.r.m.) della 3-esima componente marginale \3 è data da J\3 ÐB3 Ñ œ T Ð\3 Ÿ B3 Ñ œ T Ð\" − ‘ß á ß \3 Ÿ B3 ß á ß \5 − ‘Ñ , per 3 œ "ß á ß 5 . Si può verificare facilmente che la f.r.c. di un v.v.a. ha proprietà analoghe a quelle della f.r. di una v.a. In effetti, si ha che ! Ÿ J\ ÐBÑ Ÿ " per ogni B − ‘5 , mentre J\ ÐBÑ Ÿ J\ ÐCÑ se B œ ÐB" ß á ß B5 ÑT e C œ ÐC" ß á ß C5 ÑT sono tali che B3 Ÿ C3 per ogni 3 œ "ß á ß 5 . Inoltre, risulta lim J\ ÐB" ß á ß B5 Ñ œ ! B3 Ä∞ per ogni 3 œ "ß á ß 5 , mentre lim B" Ä∞ßáßB5 Ä∞ J\ ÐB" ß á ß B5 Ñ œ " . Infine, per & ! si ha lim J\ ÐB" ß á ß B3 &ß á ß B5 Ñ œ J\ ÐBÑ , &Ä! da cui si può dimostrare che J\ è continua nel punto B se e solo se T Ð\ œ BÑ œ !. In modo simile a quanto fatto per le v.a., si può ottenere una classificazione dei v.v.a. a secondo delle varie tipologie delle f.r.c. Tuttavia, per brevità saranno considerate nel seguito solo le due più importanti classi di v.v.a. Per quanto riguarda la prima classe, un v.v.a. è detto discreto se è a valori su insieme W − ‘5 finito o numerabile. La funzione di probabilità congiunta (f.p.c.) del v.v.a. \ è definita come :\ ÐBÑ œ :\ ÐB" ß á ß B5 Ñ œ T Ð\ œ BÑ œ T Ð\" œ B" ß á ß \5 œ B5 Ñ . La f.p.c. :\ ÐBÑ è non nulla solo se B − W e l'insieme delle probabilità Ð:\ ÐBÑÑB−W costituisce la legge essenziale di \ . Per semplicità di notazione e di calcolo, risulta generalmente conveniente lavorare con la legge essenziale di un v.v.a. discreto piuttosto che con la relativa f.r.c. In ogni caso, in modo simile a quanto visto nella Sezione 3.3, si può ottenere la legge del v.v.a. \ , ovvero per ogni F − U Б5 Ñ si ha T Ð\ − FÑ œ :\ ./ œ F ÐB" ßáßB5 Ñ−W "F ÐB" ß á ß B5 Ñ:\ ÐB" ß á ß B5 Ñ , 17 Capitolo 3 dove /ÐFÑ œ cardÐF ∩ WÑ e quindi l'espressione della f.r.c. è data da J\ ÐBÑ œ "Ó∞ßB" Ó‚á‚Ó∞ßB5 Ó Ð?" ß á ß ?5 Ñ:\ Ð?" ß á ß ?5 Ñ. Ð?" ßáß?5 Ñ−W Se il v.v.a. è discreto, tale è anche ogni componente marginale \3 . In questo caso, la funzione di probabilità marginale (f.p.m.) della 3-esima componente marginale \3 è data da :\3 ÐB3 Ñ œ T Ð\" − ‘ß á ß \3 œ B3 ß á ß \5 − ‘Ñ œ :\ ÐB" ß á ß B5 Ñ , 5 4Á3œ"B4 −W4 dove W3 rappresenta la proiezione di W sull'3-esimo asse cartesiano. L'insieme delle probabilità Ð:\3 ÐB3 ÑÑB3 −W3 costituisce la legge essenziale della v.a. \3 . Un v.v.a. \ è assolutamente continuo se possiede una f.r.c. assolutamente continua rispetto alla misura di Lebesgue in ‘5 . In questo caso, per il Teorema di Radon-Nikodym (Teorema A.9), la legge della v.a. \ può essere scritta sotto forma di integrale, ovvero per ogni F − U Б5 Ñ si ha T\ ÐFÑ œ 0\ ÐB" ß á ß B5 Ñ .B" á .B5 F e quindi la f.r.c. del v.v.a. \ può essere espressa come J\ ÐBÑ œ B" ∞ á B5 0\ Ð?" ß á ß ?5 Ñ .?" á .?5 , ∞ dove la funzione misurabile non negativa 0\ À ‘5 È Ò!ß ∞Ò è detta densità di probabilità congiunta (d.p.c.) o semplicemente densità congiunta del v.v.a. \ . In modo simile a quanto visto nella Sezione 3.3., la d.p.c. non è unica e quindi si dovrebbe parlare più propriamente di una versione della densità congiunta. Inoltre, dal momento che la f.r.c. è differenziabile ;Þ9Þ su ‘5 , allora risulta `5 0\ ÐBÑ œ 0\ ÐB" ß á ß B5 Ñ œ J\ ÐB" ß á ß B5 Ñ . `B" á `B5 Di nuovo, si deve notare che è conveniente lavorare con la d.p.c. di un v.v.a. discreto piuttosto che con la relativa f.r.c. Se il v.v.a. è assolutamente continuo, tale è anche ogni componente marginale \3 . In questo caso, la 3-esima 18 Variabili e vettori aleatori componente marginale \3 ammette densità di probabilità marginale (d.p.m.) data da 0\3 ÐB3 Ñ œ ‘5" 0\ ÐB" ß á ß B5 Ñ .B" á .B3" .B3" á .B5 . Esempio 3.5.1. Si consideri il v.v.a. \ œ Ð\" ß \# ÑT con f.p.c. " " " # " :\ ÐB" ß B# Ñ œ % # % B B "B" B# "Ö!ß"× ÐB" Ñ"Ö!ß"× ÐB# Ñ"Ö!ß"× ÐB" B# Ñ . Evidentemente, risulta W œ ÖÐ!ß !Ñß Ð"ß !Ñß Ð!ß "Ñ×, mentre W" œ W# œ Ö!ß "×. Dunque, la f.p.m. relativa alla prima componente marginale \" è data da " " $ :\" ÐB" Ñ œ :\ ÐB" ß B# Ñ œ % % B −W B # "B" "Ö!ß"× ÐB" Ñ , # mentre la f.p.m. relativa alla seconda componente marginale \# risulta :\# ÐB# Ñ œ :\ ÐB" ß B# Ñ œ B" −W" " "Ö!ß"× ÐB# Ñ . # La legge associata al v.v.a. \ è legata alla legge Multinomiale, mentre le leggi associate alle v.a. \" e \# si hanno per particolari parametrizzazioni della legge Binomiale (si veda Sezione 6.5). Esempio 3.5.2. Si consideri il v.v.a. assolutamente continuo \ œ Ð\" ß \# ÑT che ammette la seguente d.p.c. 0\ ÐB" ß B# Ñ œ #%B" Ð" B" B# Ñ"Ó!ß"Ò ÐB" Ñ"Ó!ß"Ò ÐB# Ñ"Ó!ß"Ò ÐB" B# Ñ . Le d.p.m. della prima e della seconda componente marginale sono rispettivamente date da 0\" ÐB" Ñ œ ! e "B" #%B" Ð" B" B# Ñ"Ó!ß"Ò ÐB" Ñ .B# œ "#B" Ð" B" Ñ# "Ó!ß"Ò ÐB" Ñ 19 Capitolo 3 0\# ÐB# Ñ œ "B# #%B" Ð" B" B# Ñ"Ó!ß"Ò ÐB# Ñ .B" œ %Ð" B# Ñ$ "Ó!ß"Ò ÐB# Ñ . ! La legge associata al v.v.a. \ è legata alla legge di Dirichlet, mentre le leggi associate alle v.a. \" e \# si hanno per particolari parametrizzazioni della legge Beta (si veda Sezione 6.12). Esempio 3.5.3. Si consideri il v.v.a. \ œ Ð\" ß \# ÑT che possiede f.r.c. J\ ÐB" ß B# Ñ œ minÐB" ß B# Ñ"Ò!ß"Ó ÐminÐB" ß B# ÑÑ "Ó"ß∞Ò ÐminÐB" ß B# ÑÑ . Il v.v.a. \ non è ovviamente discreto e non è neppure assolutamente continuo in quanto la f.r.c. non è assolutamente continua rispetto alla misura di Lebesgue in ‘# . In effetti, il gradiente di J\ è nullo ;Þ9Þ Inoltre, si ha J\" ÐB" Ñ œ T Ð\" Ÿ B" ß \# − ‘Ñ œ B" "Ò!ß"Ó ÐB" Ñ "Ó"ß∞Ò ÐB" Ñ , da cui 0\" ÐB" Ñ œ "Ò!ß"Ó ÐB" Ñ , ovvero la prima componente marginale è una v.a. assolutamente continua. In modo simile si verifica che anche la seconda componente marginale è _ assolutamente continua e che \" œ \# . Dunque, il fatto che le componenti marginali siano assolutamente continue non implica che il v.v.a sia assolutamente continuo. 3.6. Indipendenza di variabili aleatorie Risulta ovviamente fondamentale estendere il concetto di indipendenza definito per eventi ad un insieme finito di v.a. definite sullo stesso spazio fondamentale. Si ha la seguente definizione formale che in effetti è una conseguenza della Definizione 2.5.5. Definizione 3.6.1. Le v.a. \" ß á ß \8 definite sullo spazio probabilizzato ÐHß Y ß T Ñ sono dette stocasticamente indipendenti (o semplicemente indipendenti) se si ha 20 Variabili e vettori aleatori T Ö\3 − F3 × œ T Ð\3 − F3 Ñ , 8 8 3œ" 3œ" per ogni F3 − U Ð‘Ñ con 3 œ "ß á ß 8. Si noti che la precedente Definizione implica che ogni possibile scelta di 5 v.a. \3" ß á ß \35 con 5 œ #ß á ß 8 risulta indipendente. Inoltre, posto \ œ Ð\" ß á ß \8 ÑT , dal momento che la costruzione della 5 -algebra di Borel U Ð‘Ñ può essere fatta a partire dalla classe di insiemi del tipo Ó ∞ß BÓ, allora la condizione data nella Definizione 3.6.1 è equivalente alla condizione J\ ÐB" ß á ß B8 Ñ œ T Ö\3 Ÿ B3 × œ T Ð\3 Ÿ B3 Ñ œ J\3 ÐB3 Ñ . 8 8 8 3œ" 3œ" 3œ" Teorema 3.6.2. Le v.a. discrete \" ß á ß \8 definite sullo spazio probabilizzato ÐHß Y ß T Ñ sono indipendenti se e solo se la f.p.c. :\ del v.v.a. \ œ Ð\" ß á ß \8 ÑT è data da :\ ÐB" ß á ß B8 Ñ œ :\3 ÐB3 Ñ , 8 3œ" dove :\3 è la f.p.m. della 3-esima componente. Dimostrazione. Se \" ß á ß \8 sono indipendenti, dalla Definizione 3.6.1 si ha come caso particolare :\ ÐB" ß á ß B8 Ñ œ T Ö\3 œ B3 × œ T Ð\3 œ B3 Ñ œ :\3 ÐB3 Ñ . 8 8 8 3œ" 3œ" 3œ" Inversamente, se è vera la fattorizzazione, se il v.v.a. \ prende valori su W − ‘5 e W3 rappresenta la proiezione di W sull'3-esimo asse cartesiano, sommando opportunamente si ha 21 Capitolo 3 T Ö\3 − F3 × œ á "F" ÐB" Ñá "F8 ÐB8 Ñ:\ ÐB" ß á ß B8 Ñ 8 3œ" B" −W" B8 −W8 œ á "F3 ÐB3 Ñ :\3 ÐB3 Ñ 8 8 B8 −W8 3œ" B" −W" 8 3œ" œ "F3 ÐB3 Ñ:\3 ÐB3 Ñ œ T Ð\3 − F3 Ñ . 8 3œ" B3 −W3 3œ" La precedente relazione è equivalente alla condizione della Definizione 3.6.1 e quindi implica la tesi. Teorema 3.6.3. Le v.a. assolutamente continue \" ß á ß \8 definite sullo spazio probabilizzato ÐHß Y ß T Ñ sono indipendenti se e solo se la d.p.c. 0\ del v.v.a. \ œ Ð\" ß á ß \8 ÑT è data da 0\ ÐB" ß á ß B8 Ñ œ 0\3 ÐB3 Ñ , 8 3œ" dove 0\3 è la d.p.m. della 3-esima componente. Dimostrazione. Dal momento che la Definizione 3.6.1 è equivalente a J\ ÐB" ß á ß B8 Ñ œ 83œ" J\3 ÐB3 Ñ, allora è sufficiente verificare che `8 0\ ÐB" ß á ß B8 Ñ œ J\ ÐB" ß á ß B5 Ñ `B" á `B8 8 `8 J\ ÐB3 Ñ œ `B" á `B8 3œ" 3 8 . J\3 ÐB3 Ñ œ 0\3 ÐB3 Ñ , œ .B 3 3œ" 3œ" 8 che è quanto si voleva dimostrare. Esempio 3.6.1. Si consideri il v.v.a. \ œ Ð\" ß \# ÑT che ammette f.p.c. " " # $ :\ ÐB" ß B# Ñ œ # % % B "B# "Ö!ß"× ÐB" Ñ"Ö!ß"× ÐB# Ñ . 22 Variabili e vettori aleatori Evidentemente, risulta W œ ÖÐ!ß !Ñß Ð"ß !Ñß Ð!ß "Ñß Ð"ß "Ñ× e W" œ W# œ Ö!ß "×. La v.a. \" ammette f.p.m. data da :\" ÐB" Ñ œ :\ ÐB" ß B# Ñ œ B# −W# " "Ö!ß"× ÐB# Ñ , # mentre la v.a. \# ammette f.p.m. data da " # $ :\# ÐB# Ñ œ :\ ÐB" ß B# Ñ œ % % B −W B " "B# "Ö!ß"× ÐB# Ñ . " Incidentalmente, si noti che il v.v.a. \ possiede componenti marginali che hanno le stesse f.p.m. del v.v.a. dell'Esempio 3.5.1, anche se la f.p.c. risulta differente. Essendo :\ ÐB" ß B# Ñ œ :\" ÐB" Ñ:\# ÐB# Ñ , le v.a. \" e \# sono indipendenti. Al contrario, è immediato verificare che le v.a. \" e \# dell'Esempio 3.5.1 non sono indipendenti. Esempio 3.6.2. Si consideri il v.v.a. \ œ Ð\" ß \# ÑT che ammette d.p.c. 0\ ÐB" ß B# Ñ œ %B" B# "Ó!ß"Ò ÐB" Ñ"Ó!ß"Ò ÐB# Ñ . La v.a. \" ammette d.p.m. data da 0\" ÐB" Ñ œ " %B" B# "Ó!ß"Ò ÐB" Ñ .B# œ #B" "Ó!ß"Ò ÐB" Ñ ! e quindi per simmetria la v.a. \# ammette d.p.m. 0\# ÐB# Ñ œ #B# "Ó!ß"Ò ÐB# Ñ . Essendo 0\ ÐB" ß B# Ñ œ 0\" ÐB" Ñ0\# ÐB# Ñ , le v.a. \" e \# sono indipendenti. Le leggi associate alle v.a. \" e \# si hanno per particolari parametrizzazioni della legge Beta (si veda Sezione 6.9). Esempio 3.6.3. Si consideri il v.v.a. assolutamente continuo \ œ Ð\" ß \# ÑT che ammette d.p.c. 23 Capitolo 3 0\ ÐB" ß B# Ñ œ " "Ò!ß"Ò ÐB#" B## Ñ . 1 La legge associata al v.v.a. è detta Uniforme sul cerchio unitario. La v.a. \" ammette d.p.m. data da 0\" ÐB" Ñ œ Ð"B#" Ñ"Î# Ð"B#" Ñ"Î# " # "Ó"ß"Ò ÐB" Ñ .B# œ Ð"B#" Ñ"Î# "Ó"ß"Ò ÐB" Ñ 1 1 e quindi per simmetria la v.a. \# ammette d.p.m. 0\# ÐB# Ñ œ # Ð"B## Ñ"Î# "Ó"ß"Ò ÐB# Ñ . 1 Le v.a. \" e \# non sono indipendenti in quanto 0\ ÐB" ß B# Ñ Á 0\" ÐB" Ñ0\# ÐB# Ñ . 3.7. Trasformate di variabili aleatorie In molti casi è necessario considerare una funzione di una certa v.a. (o di un certo v.v.a.), piuttosto che la v.a. (o il v.v.a.) originale. Formalmente, dato lo spazio probabilizzato ÐHß Y ß T Ñ e la v.a. \ À H È ‘, se 1 À ‘ È ‘ è una funzione misurabile, allora ] œ 1Ð\Ñ è detta trasformata della v.a. \ . Dal momento che 1 è una funzione misurabile e che per ogni F − U Ð‘Ñ si ha ] " ÐFÑ œ \ " Ð1" ÐFÑÑ , allora segue immediatamente che ] è una v.a. in base alla Definizione 3.1.1. Inoltre, la legge indotta dalla v.a. ] è data da T] ÐFÑ œ T\ Ð1" ÐFÑÑ œ T Ð1Ð\Ñ − FÑ œ T Ð\ − 1" ÐFÑÑ Þ Dalla precedente relazione si può ottenere la f.r. della v.a. ] qualora si ponga F œ Ó ∞ß CÓ. Inoltre, identici risultati possono adeguate a trasformate di v.v.a., assumendo in questo caso che 1 À ‘5 È ‘2 sia una funzione misurabile. Anche se il problema di determinare la legge e la f.r. di una trasformata è concettualmente semplice, la gestione di ogni caso specifico può richiedere tuttavia una certa abilità di calcolo. 24 Variabili e vettori aleatori Esempio 3.7.1. Data la v.a. \ , si consideri la trasformata ] œ l\l. In questo caso, per ogni C ! si ha T Ð] Ÿ CÑ œ T Ð\ − Ò Cß CÓÑ e dunque J] ÐCÑ œ T Ð] Ÿ CÑ œ ÐJ\ ÐCÑ J\ Ð CÑ T Ð\ œ CÑÑ"Ò!ß∞Ò ÐCÑ Þ Quando la v.a. \ è assolutamente continua, allora risulta J] ÐCÑ œ ÐJ\ ÐCÑ J\ Ð CÑÑ"Ò!ß∞Ò ÐCÑ e quindi anche la v.a. ] è assolutamente continua e ammette d.p. data da 0] ÐCÑ œ . J] ÐCÑ œ Ð0\ ÐCÑ 0\ Ð CÑÑ"Ò!ß∞Ò ÐCÑ . .C Infine, se la d.p. 0\ è simmetrica rispetto all'origine, allora 0] ÐCÑ œ #0\ ÐCÑ"Ò!ß∞Ò ÐCÑ . Nel caso particolare in cui 0\ ÐBÑ œ " "Ó"ß"Ò ÐBÑ , # si ha dunque 0] ÐCÑ œ "Ó!ß"Ò ÐCÑ . Esempio 3.7.2. Dato il v.v.a. \ œ Ð\" ß \# ÑT , si consideri la trasformata ] œ \" \# . Si ha J] ÐCÑ œ T Ð] Ÿ CÑ œ T Ð\" \# Ÿ CÑ Þ Quando il v.v.a. \ è assolutamente continuo, dalla precedente espressione risulta J] ÐCÑ œ 0\ ÐB" ß B# Ñ"Ó∞ßCÒ ÐB" ∞ ∞ ∞ CB" œ ∞ ∞ B# Ñ .B" .B# 0\ ÐB" ß B# Ñ .B" .B# ∞ ∞ e quindi anche la v.a. ] è assolutamente continua con d.p. data da 25 Capitolo 3 ∞ . 0] ÐCÑ œ J] ÐCÑ œ 0\ ÐB" ß C B" Ñ .B" . .C ∞ Nel caso particolare in cui 0\ ÐB" ß B# Ñ œ "Ó!ß"Ò ÐB" Ñ"Ó!ß"Ò ÐB# Ñ , si ha 0] ÐCÑ œ " "Ó!ß"Ò ÐC B" Ñ .B" œ minÐCß # CÑ"Ó!ß#Ò ÐCÑ . ! In questo caso, la legge associata alla v.a. ] si ottiene per una particolare parametrizzazione della cosiddetta legge Triangolare. Si noti inoltre che un metodo più elegante per ottenere la legge di una somma di v.a. sarà considerato nel Capitolo 7. Di seguito vengono considerati alcuni risultati utili per determinare la f.r. e la d.p. di una trasformata di una v.a. assolutamente continua. Successivamente, vengono analizzate estensioni di questi metodi a trasformate di v.v.a. assolutamente continui. Teorema 3.7.1. Sia data la trasformata ] œ 1Ð\Ñ della v.a. \ assolutamente continua definita sullo spazio probabilizzato ÐHß Y ß T Ñ, con 1 funzione misurabile biunivoca. Se 1 è una funzione crescente, allora si ha J] ÐCÑ œ J\ Ð1" ÐCÑÑ , mentre se 1 è una funzione decrescente, allora si ha J] ÐCÑ œ " J\ Ð1" ÐCÑÑ . Inoltre, la d.p. della v.a. ] è data da 0] ÐCÑ œ 0\ Ð1" ÐCÑÑ . " 1 ÐCÑ . .C Dimostrazione. Se 1 è crescente si ha J] ÐCÑ œ T Ð1Ð\Ñ Ÿ CÑ œ T Ð\ Ÿ 1" ÐCÑÑ œ J\ Ð1" ÐCÑÑ , mentre se 1 è decrescente si ha 26 Variabili e vettori aleatori J] ÐCÑ œ T Ð1Ð\Ñ Ÿ CÑ œ T Ð\ 1" ÐCÑÑ œ " J\ Ð1" ÐCÑÑ , in quanto l'immagine inversa dell'insieme Ó ∞ß +Ó risulta Ò+ß ∞Ò. La seconda parte del Teorema si ottiene immediatamente derivando le precedenti espressioni della f.r. J] . Il precedente Teorema può essere esteso al caso in cui 1 non sia una funzione biunivoca, ma risulti biunivoca su ogni elemento di una partizione finita E" ß á ß E8 di ‘, ovvero 83œ" E3 œ ‘. Sotto questa ipotesi si ha 1ÐBÑ œ 13 ÐBÑ , 8 3œ" dove 13 ÐBÑ œ 1ÐBÑ"E3 ÐBÑ e dunque, applicando opportunamente il Teorema 3.7.1, si verifica che la d.p. di ] è data da 0] ÐCÑ œ 0\ Ð13" ÐCÑÑ 8 3œ" . " 1 ÐCÑ . .C 3 Esempio 3.7.3. Data la v.a. \ assolutamente continua, si consideri la trasformata ] œ \ # . Dal momento che la funzione C œ B# è decrescente in E" œ Ó ∞ß !Ó e crescente in E# œ Ó!ß ∞Ò, allora 0] ÐCÑ œ Ð0\ ÐCÑ 0\ Ð CÑÑ " "Ò!ß∞Ò ÐCÑ . # C Nel caso particolare in cui 0\ ÐBÑ œ " "Ó"ß"Ò ÐBÑ , # tenendo presente la simmetria di 0\ rispetto all'origine, si ha 0] ÐCÑ œ " "Ó!ß"Ò ÐCÑ . # C Teorema 3.7.2. Sia dato il v.v.a. \ assolutamente continuo definito sullo spazio probabilizzato ÐHß Y ß T Ñ e sia 1 À ‘5 È ‘5 un diffeomorfismo. La d.p.c. della trasformata data dal v.v.a. ] œ 1Ð\Ñ risulta 27 Capitolo 3 0] ÐCÑ œ 0\ Ð1" ÐCÑÑlN Ð1" ÐCÑÑl , dove N Ð1" ÐCÑÑ è lo Jacobiano relativo alla funzione 1" nel punto C. Dimostrazione. Per ogni F − U Б5 Ñ si ha T] ÐFÑ œ T\ Ð1" ÐFÑÑ œ 1" ÐFÑ 0\ ÐB" ß á ß B5 Ñ .B" á .B5 . Tenendo presente il commento successivo al Teorema A.8, allora risulta T] ÐFÑ œ 0\ Ð1" ÐC" ß á ß C5 ÑÑlN Ð1" ÐC" ß á ß C5 ÑÑl .C" á .C5 , F da cui segue la tesi. In modo simile a quanto visto per una singola v.a., il Teorema 3.7.2 può essere esteso al caso in cui 1 sia un diffeomorfismo su ogni elemento di una partizione E" ß á ß E8 di ‘5 , ovvero in questo caso la d.p.c. del v.v.a. ] è data da 0] ÐCÑ œ 0\ Ð13" ÐCÑÑlN Ð13" ÐCÑÑl , 8 3œ" dove 13 ÐBÑ œ 1ÐBÑ"E3 ÐBÑ. Esempio 3.7.4. Dato il v.v.a. \ œ Ð\" ß \# ÑT assolutamente continuo, si vuole determinare la d.p. della v.a. somma \" \# . A questo fine è conveniente considerare la trasformata ] œ Ð]" ß ]# ÑT œ 1Ð\Ñ, dove 1ÐBÑ œ ÐB" ß B" B# ÑT . Dal momento che 1" ÐCÑ œ ÐC" ß C# C" ÑT , allora lN Ð1" ÐCÑÑl œ ", e quindi 0] ÐCÑ œ 0] ÐC" ß C# Ñ œ 0\ ÐC" ß C# C" Ñ . La d.p.m. della componente ]# œ \" \# è dunque data da 0]# ÐC# Ñ œ ∞ 0\ ÐC" ß C# C" Ñ .C" . ∞ Ovviamente questo risultato coincide con quello ottenuto nell'Esempio 3.7.2. Si noti che nel caso in cui le v.a. \" e \# siano indipendenti, allora si ha 0]# ÐC# Ñ œ ∞ ∞ 0\" ÐC" Ñ0\# ÐC# C" Ñ .C" . 28 Variabili e vettori aleatori Se si vuole determinare la d.p. della v.a. differenza \" \# , in modo simile si considera la trasformata ] œ Ð]" ß ]# ÑT œ 1Ð\Ñ, dove 1ÐBÑ œ ÐB" ß B" B# ÑT . In questo caso, la d.p.m. della componente ]# œ \" \# è data da 0]# ÐC# Ñ œ ∞ 0\ ÐC" ß C" C# Ñ .C" , ∞ mentre se le v.a. \" e \# sono indipendenti risulta 0]# ÐC# Ñ œ ∞ ∞ 0\" ÐC" Ñ0\# ÐC" C# Ñ .C" . Esempio 3.7.5. Dato il v.v.a. assolutamente continuo \ œ Ð\" ß \# ÑT , si vuole determinare la d.p. della v.a. prodotto \" \# . A questo fine è conveniente considerare la trasformata ] œ Ð]" ß ]# ÑT œ 1Ð\Ñ, dove 1ÐBÑ œ ÐB" ß B" B# ÑT . Dal momento che 1" ÐCÑ œ ÐC" ß C# ÎC" ÑT , allora lN Ð1" ÐCÑÑl œ lC" l" , e quindi 0] ÐCÑ œ 0\ C" ß C# " . C" lC" l La d.p.m. della componente ]# œ \" \# è dunque data da 0]# ÐC# Ñ œ ∞ ∞ 0\ C" ß C# " .C" , C" lC" l che nel caso in cui le v.a. \" e \# siano indipendenti, si riduce a 0]# ÐC# Ñ œ ∞ ∞ 0\" ÐC" Ñ0\# C# " .C" . C" lC" l In modo simile, la d.p. della v.a. rapporto ]# œ \# Î\" è data da 0]# ÐC# Ñ œ ∞ ∞ 0\ C" ß C" C# lC" l .C" , mentre se le v.a. \" e \# sono indipendenti risulta 0]# ÐC# Ñ œ ∞ ∞ 0\" ÐC" Ñ0\# ÐC" C# ÑlC" l .C" . Nel caso particolare in cui si considera la d.p.c. dell'Esempio 3.7.2, allora la d.p.m. della trasformata ]# œ \" \# risulta 29 Capitolo 3 0]# ÐC# Ñ œ ! " "Ó!ß"Ò C# " .C" œ logÐC# Ñ"Ó!ß"Ò ÐC# Ñ , C" C" mentre la d.p.m. della trasformata ]# œ \# Î\" risulta 0]# ÐC# Ñ œ " "Ò!ß"Ó ÐC" C# ÑC" .C" œ ! " " "Ó!ß"Ó ÐC# Ñ # "Ó"ß∞Ò ÐC# Ñ . # #C# Esempio 3.7.6. Sia data la legge Uniforme sul cerchio unitario introdotta nell'Esempio 3.6.3, e si consideri la trasformata in coordinate polari ] œ Ð]" ß ]# ÑT œ 1Ð\Ñ, dove 1" ÐCÑ œ ÐC" cosC# ß C" sinC# ÑT . Dal momento che lN Ð1" ÐCÑÑl œ C" , si ha 0] ÐCÑ œ " C" "Ó!ß"Ò ÐC" Ñ"Ó!ß#1Ò ÐC# Ñ . 1 Dunque, è immediato verificare che le v.a. ]" e ]# sono indipendenti e che la d.p.m. di ]" è data da 0]" ÐC" Ñ œ #C" "Ó!ß"Ò ÐC" Ñ , mentre la d.p.m. di ]# è data da 0]# ÐC# Ñ œ " "Ó!ß#1Ò ÐC# Ñ . #1 La legge associata alla v.a. ]" si ottiene per una particolare parametrizzazione della legge Beta (si veda Sezione 6.9), mentre la legge associata alla v.a. ]# si ottiene per una particolare parametrizzazione della legge Uniforme. Questi risultati possono essere applicati per illustrare il cosiddetto paradosso delle corde considerato da Joseph Bertrand nel suo testo Calcul des probabilités. Il problema consiste nello scegliere “casualmente” una corda nel cerchio unitario e nel determinare la probabilità che la corda sia più lunga del lato del triangolo equilatero inscritto nel cerchio (ovvero di $). Il paradosso deriva dal fatto che nella formulazione del problema non è ben definita la v.a. d'interesse, ovvero si hanno differenti risultati a secondo di come viene selezionata la corda. Ad esempio, se la corda viene scelta generando uniformemente un punto nel cerchio e in modo tale che il punto corrisponda al punto medio della corda, allora la probabilità richiesta è data da 30 Variabili e vettori aleatori T Ð#Ð" Ð\"# \## ÑÑ"Î# "Î# " " $Ñ œ T ]" Ÿ œ # C" .C" œ . # % ! Se invece si genera un punto casuale sul diametro perpendicolare al lato del triangolo equilatero e si sceglie la corda perpendicolare a questo punto, allora se la v.a. ^ possiede legge uniforme su Ò "ß "Ó, ovvero ammette densità data da 0^ ÐDÑ œ #" "Ò"ß"Ó ÐDÑ, la probabilità richiesta è data da # "Î# T Ð#Ð" ^ Ñ " " "Î# " $Ñ œ T |^ | Ÿ œ .C" œ . # # "Î# # Se infine la corda viene scelta in modo che uno dei suoi estremi coincida con un estremo del lato del triangolo e l'altro estremo abbia una distribuzione uniforme sulla circonferenza unitaria, allora la probabilità richiesta è data da "Î# T ÐÐ# # cos]# Ñ &1Î' 1 &1 " " $Ñ œ T Ÿ ]# Ÿ .C# œ . œ ' ' #1 1Î' $ Teorema 3.7.3. Sia dato il v.v.a. \ œ Ð\" ß á ß \5 ÑT con componenti indipendenti definito sullo spazio probabilizzato ÐHß Y ß T Ñ. Se T ] œ Ð]" ß á ß ]5 Ñ œ 1Ð\Ñ è una trasformata misurabile tale che ]3 œ 13 Ð\3 Ñ, le componenenti del v.v.a. ] sono indipendenti. Dimostrazione. Dal momento che risulta T Ö13 Ð\3 Ñ − F3 × œ T Ö\3 − 13" ÐF3 Ñ× 8 3œ" 8 3œ" œ T Ð\3 − 13" ÐF3 ÑÑ 8 3œ" 8 œ T Ð13 Ð\3 Ñ − F3 Ñ 3œ" per ogni F3 − U Ð‘Ñ con 3 œ "ß á ß 8, la tesi segue immediatamente dalla Definizione 3.6.1. Capitolo 3 31 3.8. Riferimenti bibliografici Una trattazione esauriente ed elegante delle proprietà della funzione di ripartizione è contenuta nel classico testo di Chung (2001). Numerosi esempi di equivalenze in legge e su trasformate di variabili aleatorie (o vettori aleatori) sono contenuti nei testi con esercizi svolti di Chaumont e Yor (2005), Grimmett e Stirzaker (2001) e Hamming (1991). Infine, Devroye (1986) è un testo dedicato alla generazione di variabili pseudo aleatorie con numerosi esempi di equivalenze in legge. Capitolo 4 Valori attesi 4.1. Valore atteso di una variabile aleatoria Il concetto di valore atteso è fondamentale nella Teoria della Probabilità. Formalmente, si ha la seguente definizione. Definizione 4.1.1. Data la v.a. \ definita sullo spazio probabilizzato ÐHß Y ß T Ñ, si dice valore atteso l'integrale EÒ\Ó œ \ .T se esiste finito. La simbologia adottata nella precedente definizione è basata sul termine inglese expectation o sul termine francese espérance. Il valore atteso è anche detto valor medio o speranza matematica. Inoltre, il valore atteso della v.a. \ è spesso indicato con il simbolo .\ , o semplicemente con . quando il contesto non si presta a fraintendimenti. Si noti che se \ œ "I dove I − Y , allora risulta EÒ"I Ó œ .T œ T ÐIÑ , I ovvero la probabilità di un evento può essere interpretata come un valore atteso. Tenendo presente il Teorema A.8, il valore atteso può anche essere espresso come EÒ\Ó œ B .T\ ÐBÑ . ‘ Dalla precedente espressione e dal Teorema A.10, se la v.a. \ è discreta a valori su insieme numerabile W con f.p. :\ , il valore atteso si riduce a 2 Valori attesi EÒ\Ó œ B:\ ÐBÑ ./ ÐBÑ œ B:\ ÐBÑ , ‘ B−W dove / è la misura definita nella Sezione 3.3. Analogamente, se la v.a. \ è assolutamente continua con d.p. 0\ , il valore atteso si riduce a EÒ\Ó œ ∞ B0\ ÐBÑ .B . ∞ _ Infine, se \ e ] sono v.a. tali che \ œ ] , allora si ottiene immediatamente che EÒ\Ó œ EÒ] Ó. Esempio 4.1.1. Si consideri la v.a. discreta \ analizzata nell'Esempio 3.3.1. In questo caso, il valore atteso della v.a. \ è dato da EÒ\Ó œ B:\ ÐBÑ œ B#B" . ∞ ∞ Bœ! Bœ! Tenendo presente che derivando ambo i membri della serie geometrica (si veda l'Esempio 3.3.1) rispetto ad + si ottiene B+ œ B+B œ ∞ ∞ B Bœ" Bœ! + , Ð" +Ñ# allora, ponendo + œ "Î# nella precedente relazione, il valore atteso risulta " ∞ EÒ\Ó œ B#B œ " . # Bœ! Esempio 4.1.2. Si consideri la v.a. assolutamente continua \ analizzata nell'Esempio 3.4.1. In questo caso il valore atteso della v.a. \ è dato da EÒ\Ó œ ! " B0\ ÐBÑ .B œ $ ! " B$ .B œ $ . % Denotando con \ œ maxÐ\ß !Ñ e \ œ minÐ\ß !Ñ, il valore atteso può essere scritto come 3 Capitolo 4 EÒ\Ó œ EÒ\ Ó EÒ\ Ó . Dunque, il valore atteso esiste finito se si ha EÒ\ Ó ∞ e EÒ\ Ó ∞. Nel caso in cui uno dei valori attesi EÒ\ Ó o EÒ\ Ó non sia finito, allora il valore atteso EÒ\Ó non è finito. Infine, se entrambi i valori attesi EÒ\ Ó e EÒ\ Ó non sono finiti, allora il valore atteso EÒ\Ó non è definito, in quanto si ha la forma del tipo ∞ ∞. 0.5 0.4 0.3 0.2 0.1 0.0 0 1 2 3 4 Figura 4.1.1. Densità di probabilità relativa alla legge ridotta di Lévy. Figura 4.1.2. Paul Pierre Lévy (1886-1971). Esempio 4.1.3. Si consideri la v.a. assolutamente continua \ che ammette d.p. data da 4 Valori attesi 0\ ÐBÑ œ " " B$Î# exp "Ó!ß∞Ò ÐBÑ . #1 #B La legge associata a questa v.a. prende nome dal probabilista Paul Pierre Lévy (1886-1971) (la legge è considerata nella versione ridotta, si veda la Sezione 6.6). La legge ha interessanti applicazioni nell'ambito finanziario e in fisica (per la genesi, si veda la Sezione 9.4). Risulta immediato verificare che EÒ\ Ó œ !, mentre ∞ " " "Î# EÒ\ Ó œ exp B .B #1 ! #B ∞ " " "Î# exp B .B #1 " #B expÐ "Î#Ñ ∞ "Î# .B œ ∞ B #1 " e quindi EÒ\Ó non è finito. 0.3 0.2 0.1 0.0 4 2 0 2 4 Figura 4.1.3. Densità di probabilità relativa alla legge ridotta di Cauchy. Esempio 4.1.4. Si consideri la v.a. assolutamente continua \ che ammette d.p. data da 0\ ÐBÑ œ " . 1Ð" B# Ñ 5 Capitolo 4 La legge associata a questa v.a. è legata al nome del grande matematico Augustin-Louis Cauchy (1789-1857) (anche in questo caso la legge è considerata nella versione ridotta, si veda la Sezione 6.6). La legge ha importanti applicazioni in fisica e si ottiene per una particolare parametrizzazione della legge > di Student (vedi Sezione 6.10). Data la simmetria di 0\ risulta EÒ\ Ó œ EÒ\ Ó œ ! ∞ B .B œ ∞ 1Ð" B# Ñ e quindi EÒ\Ó non è definito. Figura 4.1.4. Augustin-Louis Cauchy (1789-1857). 4.2. Proprietà del valore atteso I seguenti Teoremi forniscono un insieme di proprietà, che riguardano alcune disuguaglianze e le condizioni di esistenza sul valore atteso. Teorema 4.2.1. Si consideri la v.a. \ definita sullo spazio probabilizzato ÐHß Y ß T Ñ. Si ha lEÒ\Ól Ÿ EÒl\lÓ e quindi se EÒl\lÓ esiste finito, allora anche EÒ\Ó esiste finito. Dimostrazione. Dal momento che Ö\ Ÿ l\ l× ;Þ-Þ, allora dal Teorema A.6 si ha EÒ\Ó Ÿ lEÒ\ Ól œ \ .T Ÿ l\ l .T œ EÒl\ lÓ , 6 Valori attesi da cui segue immediatamente anche la seconda parte. Teorema 4.2.2. Si consideri la v.a. \ definita sullo spazio probabilizzato ÐHß Y ß T Ñ. Se T Ð\ − Ò+ß ,ÓÑ œ " dove + e , sono costanti, allora si ha + Ÿ EÒ\Ó Ÿ ,. Quindi, se +ß , ∞, allora EÒ\Ó esiste finito. Dimostrazione. Dal momento che Ö\ +× ;Þ-Þ, dal Teorema A.6 si ha EÒ\ Ó œ \ .T + .T œ + , mentre, dal momento che Ö\ Ÿ ,× ;Þ-Þ, allora EÒ\ Ó œ \ .T Ÿ , .T œ , , da cui segue anche la seconda parte. Se 1 À ‘5 È ‘ è una funzione misurabile, risulta banale generalizzare i Teoremi 4.2.1 e 4.2.2 alla trasformata ] œ 1Ð\Ñ del v.v.a. \ œ Ð\" ß á ß \5 ÑT . Più esattamente, si ha che lEÒ1Ð\ÑÓl Ÿ EÒl1Ð\ÑlÓ e quindi se EÒl1Ð\ÑlÓ esiste finito, allora anche EÒ1Ð\ÑÓ esiste finito. Inoltre, se T Ð1Ð\Ñ − Ò+ß ,ÓÑ œ ", si ha + Ÿ EÒ1Ð\ÑÓ Ÿ ,. Infine, il seguente Teorema è fondamentale in quanto permette di ottenere il valore atteso della trasformata ] œ 1Ð\Ñ senza dover prima determinare la distribuzione della v.a. trasformata, come in effetti sembrerebbe necessario dalla definizione. Teorema 4.2.3. Data la funzione misurabile 1 À ‘5 È ‘, si consideri la trasformata ] œ 1Ð\Ñ del v.v.a. \ œ Ð\" ß á ß \5 ÑT definito sullo spazio probabilizzato ÐHß Y ß T Ñ. Si ha EÒ] Ó œ EÒ1Ð\ÑÓ œ ‘5 1ÐB" ß á ß B5 Ñ . T\ ÐB" ß á ß B5 Ñ se l'integrale esiste finito. Dimostrazione. Dal Teorema A.8 si ha EÒ] Ó œ 1Ð\Ñ .T œ ‘5 1ÐB" ß á ß B5 Ñ . T\ ÐB" ß á ß B5 Ñ 7 Capitolo 4 che è quanto si voleva dimostrare. In particolare, se \ è un v.v.a. discreto a valori su un insieme W e con f.p.c. :\ , dal Teorema 4.2.3 e dal Teorema A.10 si ottiene che EÒ] Ó œ EÒ1Ð\ÑÓ œ 1ÐB" ß á ß B5 Ñ:\ ÐB" ß á ß B5 Ñ , ÐB" ßáßB5 Ñ−W mentre se \ è un v.v.a. assolutamente continuo che ammette d.p.c. 0\ allora si ha EÒ] Ó œ EÒ1Ð\ÑÓ œ ‘5 1ÐB" ß á ß B5 Ñ0\ ÐB" ß á ß B5 Ñ .B" á .B5 . Esempio 4.2.1. Si consideri la v.a. assolutamente continua \ con legge Uniforme che ammette d.p. 0\ ÐBÑ œ "Ó!ß"Ò ÐBÑ e si consideri la trasformata ] œ \ # . Dal momento che la funzione C œ B# è crescente in Ó!ß "Ò, allora dal Teorema 3.7.1 risulta 0] ÐCÑ œ " "Ó!ß"Ò ÐCÑ # C e quindi EÒ] Ó œ ! " " " " C0] ÐCÑ .C œ C .C œ . # ! $ Il medesimo risultato può essere ottenuto in modo più immediato applicando direttamente il Teorema 4.2.3, in quanto si ha EÒ] Ó œ EÒ\ Ó œ # ! " B 0\ ÐBÑ .B œ # ! " B# .B œ " . $ Esempio 4.2.2. Si consideri il v.v.a. assolutamente continuo \ œ Ð\" ß \# ÑT che ammette la d.p.c. introdotta nell'Esempio 3.7.5. Nel medesimo Esempio è stato 8 Valori attesi verificato che la d.p. della trasformata ] œ \" \# risulta 0] ÐCÑ œ logÐCÑ"Ó!ß"Ò ÐCÑ e quindi EÒ] Ó œ " C logÐCÑ .C œ ! " . % Tuttavia, applicando il Teorema 4.2.3, si ha immediatamente EÒ] Ó œ EÒ\" \# Ó œ " ! " B" B# .B" .B# œ ! " . % Il seguente Teorema fornisce un importante risultato sul valore atteso di una combinazione lineare di v.a., nel senso che il valore atteso di una combinazione lineare di v.a. è dato dalla combinazione lineare dei valori attesi. Teorema 4.2.4. Se \ œ Ð\" ß á ß \5 ÑT è un v.v.a. definito sullo spazio probabilizzato ÐHß Y ß T Ñ, si consideri la trasformata ] œ + 53œ" ,3 \3 dove + − ‘ e Ð," ß á ß ,5 Ñ − ‘5 sono costanti. Se EÒ\3 Ó esiste finito per ogni 3 œ "ß á ß 5, si ha EÒ] Ó œ + ,3 EÒ\3 Ó . 5 3œ" Dimostrazione. Tenendo presente il Teorema A.6 si ha EÒ] Ó œ + ,3 \3 .T 5 3œ" œ + .T ,3 \3 .T œ + ,3 EÒ\3 Ó , 5 5 3œ" 3œ" da cui segue la tesi. In particolare, quando si considera la trasformata ] œ + ,\ , dove +ß , − ‘, dal Teorema 4.2.4 risulta EÒ] Ó œ + ,EÒ\Ó . 9 Capitolo 4 Inoltre, se si ha la trasformata ] œ \ ., con . œ EÒ\Ó, allora segue che EÒ] Ó œ EÒ\Ó . œ ! . Infine, se si considera la trasformata ] œ 53œ" \3 , nelle ipotesi del Teorema 4.2.4 risulta EÒ] Ó œ EÒ\3 Ó . 5 3œ" Esempio 4.2.3. Si consideri il v.v.a. assolutamente continuo \ œ Ð\" ß \# ÑT introdotto nell'Esempio 3.5.2. Si ha EÒ\" Ó œ #% " ! "B" ! B#" Ð" B" B# Ñ .B" .B# œ # & e EÒ\# Ó œ #% " ! "B" B" B# Ð" B" B# Ñ .B" .B# œ ! " . & Dunque, si la media della v.a. ] œ \" \# è data da EÒ] Ó œ EÒ\" \# Ó œ EÒ\" Ó EÒ\# Ó œ $ . & Il seguente Teorema permette di ottenere il valore atteso di un prodotto di v.a. indipendenti, nel senso che il valore atteso del prodotto di v.a. indipendenti è dato dal prodotto dei valori attesi. Teorema 4.2.5. Se \ œ Ð\" ß á ß \5 ÑT è un v.v.a. definito sullo spazio probabilizzato ÐHß Y ß T Ñ a componenti indipendenti, si consideri la trasformata ] œ 53œ" \3 . Se EÒ\3 Ó esiste finito per ogni 3 œ "ß á ß 5 , si ha EÒ] Ó œ EÒ\3 Ó . 5 3œ" Dimostrazione. Tenendo presente il Teorema 4.2.3 e il Teorema di Fubini (Teorema A.11) si ha 10 Valori attesi EÒ] Ó œ \3 .T œ 5 3œ" B3 .T\" Œ á Œ T\5 5 ‘5 3œ" œ B3 . T\3 œ EÒ\3 Ó , 5 5 3œ" ‘ 3œ" che è quanto si voleva dimostrare. Si noti che non vale ovviamente l'inverso del Teorema 4.2.5, ovvero, se si verifica che il valore atteso di un prodotto di v.a. equivale al prodotto dei singoli valori attesi, questo non ci permette di concludere che le v.a. sono indipendenti. Esempio 4.2.4. Si consideri il v.v.a. assolutamente continuo \ œ Ð\" ß \# ÑT dell'Esempio 3.7.2. Inoltre, nell'Esempio 4.2.2 è stato ottenuto il valore atteso della trasformata ] œ \" \# . Il calcolo di questa quantità può essere ulteriormente semplificato. In effetti, dal momento che 0\ ÐB" ß B# Ñ œ 0\" ÐB" Ñ0\# ÐB# Ñ , dove 0\" ÐB" Ñ œ "Ó!ß"Ò ÐB" Ñ e 0\# ÐB# Ñ œ "Ó!ß"Ò ÐB# Ñ, allora le componenti marginali del v.v.a. sono indipendenti. Inoltre, si ha EÒ\" Ó œ EÒ\# Ó œ "Î# e quindi la media della v.a. ] œ \" \# è data da EÒ] Ó œ EÒ\" \# Ó œ EÒ\" ÓEÒ\# Ó œ " . % Esempio 4.2.5. Si consideri il v.v.a. assolutamente continuo \ œ Ð\" ß \# ÑT dell'Esempio 3.6.3. Risulta " " Ð"B" Ñ EÒ\" \# Ó œ B" B# .B" .B# œ ! , 1 " Ð"B#" Ñ"Î# # "Î# mentre, data la simmetria rispetto all'origine della d.p. 0\" ÐB" Ñ, si ha # " EÒ\" Ó œ B" Ð"B#" Ñ"Î# .B" œ ! . 1 " Inoltre, dal momento che \" e \# posseggono la medesima legge, allora si ha anche EÒ\# Ó œ !. Risulta quindi EÒ\" \# Ó œ EÒ\" ÓEÒ\# Ó anche se le v.a. \" e \# non sono indipendenti. 11 Capitolo 4 Il seguente Teorema introduce una importante disuguaglianza per il valore atteso di una trasformata ] œ 1Ð\Ñ di un v.v.a. \ quando la funzione 1 risulta convessa, ovvero se 1 è definita su un insieme aperto G e 1Ðα? Ð" αÑ@Ñ Ÿ α1Ð?Ñ Ð" αÑ1Ð@Ñ per ogni ?ß @ − G e dove α − Ò!ß 1Ó. La disuguaglianza prende nome dal matematico danese Johan Jensen (1859-1925). Teorema 4.2.6. (Disuguaglianza di Jensen) Data la funzione convessa 1 À ‘5 È ‘, si consideri la trasformata ] œ 1Ð\Ñ del v.v.a. \ œ Ð\" ß á ß \5 ÑT definito sullo spazio probabilizzato ÐHß Y ß T Ñ. Si ha 1ÐEÒ\ÓÑ Ÿ EÒ1Ð\ÑÓ . Dimostrazione. Se 1 è una funzione convessa, per ogni @ esiste un - œ -Ð@Ñ tale che 1Ð?Ñ 1Ð@Ñ -Ð? @Ñ (si veda Billingsley, 1995, p.545). Tenendo presente questa disuguaglianza con @ œ EÒ\Ó e le proprietà del valore atteso, si ha EÒ1Ð\ÑÓ EÒ1ÐEÒ\ÓÑ -Ð\ EÒ\ÓÑÓ œ 1ÐEÒ\ÓÑ - EÒ\ EÒ\ÓÓ œ 1ÐEÒ\ÓÑ , che è quanto si voleva dimostrare. Esempio 4.2.6. Si consideri la v.a. \ e la trasformata 1Ð\Ñ œ l\l. Dal momento che 1 è una funzione convessa, allora risulta lEÒ\Ól Ÿ EÒl\lÓ, ovvero si ha una ulteriore dimostrazione del Teorema 4.2.1, in questo caso basata sulla Disuguaglianza di Jensen. 4.3. Momenti di variabili aleatorie I momenti sono medie di particolari trasformate della v.a. in oggetto di studio, ovvero medie di potenze, e che servono a caratterizzare la distribuzione della v.a. Più esattamente si ha la seguente definizione. 12 Valori attesi Definizione 4.3.1. Data la v.a. \ definita sullo spazio probabilizzato ÐHß Y ß T Ñ, si dice momento di ordine <, dove < œ !ß "ß á , l'integrale EÒ\ < Ó œ \ < .T se esiste finito. Si dice inoltre momento assoluto di ordine < l'integrale EÒl\l< Ó œ l\l< .T se esiste finito. Infine, si dicono rispettivamente momento centrale di ordine < l'integrale EÒÐ\ .Ñ< Ó œ Ð\ .Ñ< .T e momento centrale assoluto di ordine < l'integrale EÒl\ .l< Ó œ l\ .l< .T se esistono finiti. Il momento di ordine < della v.a. \ è spesso indicato con il simbolo .\ß< , o semplicemente con .< quando il contesto è chiaro. Dalla Definizione 4.3.1 risulta evidente che .! œ ", mentre si ha ." œ . œ EÒ\Ó. Ovviamente, i momenti e i momenti assoluti (così come i momenti centrali e i momenti centrali assoluti) coincidono quando < è pari. Risulta inoltre immediato verificare che il primo momento centrale è nullo (vedi Sezione 4.2). Il secondo momento centrale è detto varianza e viene indicato con la notazione VarÒ\Ó œ EÒÐ\ .Ñ# Ó , # o anche con la notazione 5\ , che al solito viene ulteriormente semplificata con # 5 quando non vi è possibilità di fraintendimento. Infine, la radice quadrata della varianza è detta scarto quadratico medio. Tenendo presente il Teorema 4.2.4, è immediato verificare che fra i momenti centrali e i momenti esiste la seguente relazione < < < <3 3 <3 EÒÐ\ .Ñ Ó œ E Ð "Ñ \ . œ Ð "Ñ<3 .3 .<3 . 3 3 3œ! 3œ! < < 13 Capitolo 4 In particolare, si ha VarÒ\Ó œ EÒ\ # Ó EÒ\Ó# œ .# .# . Nel linguaggio della Teoria della Misura, i momenti sono evidentemente funzioni di norme, ovvero EÒl\l< Ó œ m\m<< e EÒl\ .l< Ó œ m\ .m<< . Esempio 4.3.1. Si consideri la v.a. assolutamente continua \ analizzata nell'Esempio 4.2.1. In questo caso il momento di ordine < della v.a. \ è dato da EÒ\ Ó œ < " B< .B œ ! " . <" Si ha dunque . œ "Î#, mentre il momento di ordine < coincide con il momento assoluto di ordine <. Per quanto riguarda il momento centrale di ordine < della v.a., risulta EÒÐ\ .Ñ Ó œ " < ! " #Ð<"Ñ Ð" Ð "Ñ< Ñ B .B œ # <" < e quindi EÒÐ\ .Ñ< Ó œ ! se < è dispari, mentre #< EÒÐ\ .Ñ Ó œ <" < se < è pari. Dunque, si ha VarÒ\Ó œ "Î"#. Infine, risulta EÒl\ .l Ó œ < ! " #< lB "Î#l .B œ . <" < Esempio 4.3.2. Si noti che v.a. con leggi differenti possono avere tutti i momenti coincidenti. Come caso specifico si consideri la v.a. assolutamente continua \ che ammette densità 0\ ÐBÑ œ " expÐ B"Î$ Ñ"Ò!ß∞Ò ÐBÑ ' e la v.a. assolutamente continua ] che ammette densità 0] ÐCÑ œ " expÐ C"Î$ ÑÐ" sinÐ$C"Î$ ÑÑ"Ò!ß∞Ò ÐCÑ . ' 14 Valori attesi Incidentalmente, si noti che la legge associata alla v.a. ^ œ \ "Î$ si ottiene per una particolare parametrizzazione della legge Gamma (si veda la Sezione 6.8). Dal momento che risulta ! ∞ B< expÐ C"Î$ ÑsinÐ$C"Î$ Ñ .B œ ! , allora segue immediatamente che EÒ\ < Ó œ EÒ] < Ó per ogni < œ !ß "ß á . Il seguente Teorema fornisce una importante disuguaglianza, che nel successivo Teorema permette di ottenere le condizioni di esistenza per i momenti. La disuguaglianza è comunemente attribuita al matematico e probabilista russo Aleksandr Mikhailovich Lyapunov (1857-1918). Figura 4.3.1. Aleksandr Mikhailovich Lyapunov (1857-1918). Teorema 4.3.2. (Disuguaglianza di Lyapunov) Si consideri la v.a. \ definita sullo spazio probabilizzato ÐHß Y ß T Ñ. Se ! = Ÿ <, allora si ha EÒl\l= Ó"Î= Ÿ EÒl\l< Ó"Î< . Dimostrazione. Se Ö] !× ;Þ-Þ, dalla disuguaglianza di Jensen (Teorema 4.2.6) con 1ÐCÑ œ C+ e + ", si ha EÒ] Ó+ Ÿ EÒ] + Ó . Dal momento che <Î= ", ponendo + œ <Î= e ] œ l\l= nella precedente disuguaglianza si ottiene 15 Capitolo 4 EÒl\l= Ó<Î= Ÿ EÒl\l< Ó , da cui si ha immediatamente la tesi. Nel linguaggio della Teoria della Misura, la disuguaglianza di Lyapunov stabilisce in effetti che m\m= Ÿ m\m< se ! = Ÿ <. Teorema 4.3.3. Si consideri la v.a. \ definita sullo spazio probabilizzato ÐHß Y ß T Ñ. Se si ha EÒl\l< Ó ∞, allora EÒ\ 3 Ó esiste finito per ogni 3 œ "ß á ß <. Dimostrazione. Dal momento che 3 Ÿ < per ogni 3 œ "ß á ß <, dalla disuguaglianza di Lyapunov (Teorema 4.3.2) si ha EÒl\l3 Ó"Î3 Ÿ EÒl\l< Ó"Î< . Dunque, se EÒl\l< Ó ∞, allora EÒl\ 3 lÓ ∞. Tuttavia, dal Teorema 4.2.1 risulta che se EÒl\ 3 lÓ ∞ allora si ha EÒ\ 3 Ó ∞. Tenendo presente la dimostrazione del precedente Teorema, è inoltre facile verificare che se il momento di ordine < non esiste finito, allora non esistono finiti neppure i momenti di ordine superiore. Inoltre, dal momento che VarÒ\Ó Ÿ EÒ\ # Ó, la varianza esiste finita se esiste finito il secondo momento. In generale, è immediato verificare che il momento centrale di ordine < esiste finito se esiste finito il momento di ordine <. Si considerano di seguito alcuni Teoremi sulle proprietà della varianza. Teorema 4.3.4. Si consideri la v.a. \ definita sullo spazio probabilizzato ÐHß Y ß T Ñ. Se EÒ\ # Ó esiste finito, si ha VarÒ\Ó Ÿ min EÒÐ\ +Ñ# Ó . +−‘ Dimostrazione. Tenendo presente le proprietà del valore atteso, si ha EÒÐ\ +Ñ# Ó œ EÒÐ\ . . +Ñ# Ó œ EÒÐ\ .Ñ# #Ð\ .ÑÐ. +Ñ Ð. +Ñ# Ó œ VarÒ\Ó Ð. +Ñ# e, dal momento che VarÒ\Ó ! non dipende da +, il minimo della precedente quantità si ottiene per + œ .. 16 Valori attesi Teorema 4.3.5. Si consideri la v.a. \ definita sullo spazio probabilizzato ÐHß Y ß T Ñ. Se EÒ\ # Ó esiste finito, la varianza della trasformata ] œ + ,\ , dove +ß , − ‘, è data da VarÒ] Ó œ VarÒ+ ,\Ó œ ,# VarÒ\Ó . Dimostrazione. Tenendo presente il Teorema 4.2.4 si ha EÒ] Ó œ + ,., e quindi VarÒ] Ó œ EÒÐ+ ,\ + ,.Ñ# Ó œ ,# EÒÐ\ .Ñ# Ó œ ,# VarÒ\Ó , che è quanto si voleva dimostrare. In particolare, se ] œ + \ , dal Teorema 4.3.5 si ha VarÒ] Ó œ VarÒ+ \Ó œ VarÒ\Ó . Inoltre, se si considera la trasformazione ^œ \. , 5 allora risulta EÒ^Ó œ " EÒ\ .Ó œ ! , 5 mentre VarÒ^Ó œ " " Var Ò\ . Ó œ VarÒ\Ó œ " . 5# 5# Per questi motivi, la precedente è detta trasformazione di standardizzazione. Il seguente Teorema fornisce una importante e utile disuguaglianza, che prende nome dal matematico e probabilista russo Andrey Andreyevich Markov (1856-1922). Teorema 4.3.6. (Disuguaglianza di Markov) Si consideri la v.a. \ definita sullo spazio probabilizzato ÐHß Y ß T Ñ. Se - !, allora si ha T Ðl\l -Ñ Ÿ Dimostrazione. Si ha " EÒl\lÓ . - 17 Capitolo 4 EÒl\lÓ œ l\ l .T - "Öl\ l -× .T œ -T Ðl\l -Ñ , da cui segue immediatamente la tesi. Figura 4.3.2. Andrey Andreyevich Markov (1856-1922). Il seguente Teorema fornisce una famosa e celebrata disuguaglianza introdotta dal matematico russo Pafnuty Lvovich Chebyshev (1821-1894), padre fondatore della scuola matematica russa e in particolare maestro di Lyapunov e Markov. Teorema 4.3.7. (Disuguaglianza di Chebyshev) Si consideri la v.a. \ definita sullo spazio probabilizzato ÐHß Y ß T Ñ. Se - !, allora si ha 5# T Ðl\ .l -Ñ Ÿ # . Equivalentemente, se 5 # ∞ si ha T \. " - Ÿ # . 5 - Dimostrazione. Applicando opportunamente la disuguaglianza di Markov (Teorema 4.3.6) alla v.a. trasformata Ð\ .Ñ# , si ha T Ðl\ .l -Ñ œ T ÐÐ\ .Ñ# - # Ñ Ÿ " EÒÐ\ .Ñ# Ó , # - da cui segue la prima parte del Teorema. La seconda parte si ottiene in modo simile considerando la v.a. trasformata Ð\ .Ñ# Î5 # . 18 Valori attesi Figura 4.3.3. Pafnuty Lvovich Chebyshev (1821-1894). La precedente disuguaglianza è anche detta di Bienaymé-Chebyshev dal momento che in effetti fu congiuntamente formulata da Chebyshev insieme allo statistico francese Irénée-Jules Bienaymé (1796-1878). Si noti inoltre che la disuguaglianza può essere facilmente generalizzata con i momenti centrali assoluti, ovvero risulta T Ðl\ .l -Ñ Ÿ " EÒl\ .l< Ó . < - Teorema 4.3.8. Se \ è una v.a. definita sullo spazio probabilizzato ÐHß Y ß T Ñ e se EÒ\ # Ó esiste finito, si ha VarÒ\Ó œ ! se e solo se \ è degenere. Dimostrazione. Se \ è degenere, allora risulta Ö\ œ +× ;Þ-Þ per una data costante + − ‘. In questo caso, si ha EÒ\Ó œ +T Ð\ œ +Ñ œ + , mentre VarÒ\Ó œ Ð+ EÒ\ÓÑ# T Ð\ œ +Ñ œ ! . Inversamente, se VarÒ\Ó œ !, applicando la disuguaglianza di Chebyshev, per ogni - si ha 5# T Ðl\ +l -Ñ Ÿ # œ ! , ovvero Ö\ œ +× ;Þ-Þ 19 Capitolo 4 4.4. Covarianza e matrice di varianza-covarianza Il concetto di momento può essere esteso in modo generale a v.v.a. In effetti, si ha la seguente definizione formale. Definizione 4.4.1. Dato il v.v.a. \ œ Ð\" ß á ß \5 ÑT definito sullo spazio probabilizzato ÐHß Y ß T Ñ, si dice momento misto di ordine Ð<" ß á ß <5 Ñ, dove <3 œ !ß "ß á , 3 œ "ß á ß 5ß l'integrale EÒ\"<" á \5<5 Ó œ \"<" á \5<5 .T se esiste finito. Inoltre, si dice momento centrale misto di ordine Ð<" ß á ß <5 Ñ l'integrale EÒÐ\" .\" Ñ<" á Ð\5 .\5 Ñ<5 Ó œ Ð\" .\" Ñ<" á Ð\5 .\5 Ñ<5 .T se esiste finito. Si noti che, scegliendo opportunamente gli indici Ð<" ß á ß <5 Ñ, si possono ottenere i momenti di qualsiasi ordine di tutte le possibili scelte delle componenti marginali. Ad esempio, ponendo <3 œ " e <6 œ ! per ogni 6 Á 3 œ "ß á ß 5 , si ottiene EÒ\3 Ó. In particolare, risulta fondamentale considerare i momenti per vettori bivariati di v.a. Più esattamente, dato il v.v.a. \ œ Ð\" ß \# ÑT , il momento misto è dato dall'integrale EÒ\" \# Ó œ \" \# .T se esiste finito. Analogamente, il momento misto centrale, detto usualmente covarianza, è dato dall'integrale CovÒ\" ß \# Ó œ EÒÐ\" .\" ÑÐ\# .\# ÑÓ œ Ð\" .\" ÑÐ\# .\# Ñ .T se esiste finito. La covarianza viene anche usualmente denotata con il simbolo 5\" ß\# . Tenendo presente il Teorema A.6, risulta immediato verificare che CovÒ\" ß \# Ó œ EÒ\" \# Ó EÒ\" ÓEÒ\# Ó , 20 Valori attesi mentre ovviamente CovÒ\" ß \" Ó œ VarÒ\" Ó. In Teoria della Misura, il momento misto e la covarianza sono prodotti interni, ovvero EÒ\" \# Ó œ Ø\" ß \# Ù e CovÒ\" \# Ó œ Ø\" .\" ß \# .\# Ù. Il seguente Teorema introduce una famosa disuguaglianza che permette fra l'altro di ottenere le condizioni di esistenza della covarianza e che prende nome dal matematico tedesco Otto Ludwig Hölder (1859-1937). Tuttavia, la disuguaglianza dovrebbe più correttamente essere denominata di Rogers-Hölder, dal momento che è stata introdotta indipendentemente e contemporaneamente anche dal matematico inglese Leonard James Rogers (1862-1933). Teorema 4.4.2. (Disuguaglianza di Hölder) Sia dato un v.v.a. \ œ Ð\" ß \# ÑT definito sullo spazio probabilizzato ÐHß Y ß T Ñ. Se <ß = − Ó"ß ∞Ò sono costanti tali che "Î< "Î= œ " e se EÒl\" l< Ó ∞ e EÒl\# l= Ó ∞, allora lEÒ\" \# Ól Ÿ EÒl\" \# lÓ Ÿ EÒl\" l< Ó"Î< EÒl\# l= Ó"Î= . Inoltre, l'uguaglianza si ottiene se e solo se Ö," \" œ ,# \# × ;Þ-Þ Dimostrazione. La prima disuguaglianza segue dal Teorema 4.2.1. Al fine di dimostrare la seconda disuguaglianza, si noti che la funzione logaritmica è concava, ovvero la funzione B È logÐBÑ è convessa. Dunque, se α − Ò!ß 1Ó dalla definizione di funzione convessa si ha logÐα? Ð" αÑ@Ñ αlogÐ?Ñ Ð" αÑlogÐ@Ñ œ logÐ?α @"α Ñ per ogni ?ß @ − Ó!ß ∞Ò. Inoltre, essendo la funzione logaritmica monotona crescente, dalla precedente disuguaglianza si ottiene ?α @"α Ÿ α? Ð" αÑ@ . Infine, dal momento che la funzione logaritmica è strettamente concava, l'uguaglianza si ha se e solo se ? œ @. Adoperando dunque la precedente disuguaglianza con α œ "Î< e " α œ "Î=, posto ]" œ l\" l< ÎEÒl\" l< Ó e ]# œ l\# l= ÎEÒl\# l= Ó e tenendo presente che EÒ]" Ó œ EÒ]# Ó œ ", allora si ha " " " " "Î< "Î= EÒ]" ]# Ó Ÿ E ]" ]# œ œ " . < = < = Sostituendo opportunamente, dalle proprietà del valore atteso si ottiene immediatamente la prima parte del Teorema. Inoltre, l'uguaglianza si ottiene se e solo se Ö]" œ ]# × ;Þ-Þ, ovvero, tenendo presente che 21 Capitolo 4 l\" l< l," \" l< œ EÒl\" l< Ó EÒl," \" l< Ó e l\# l= l,# \# l= œ , EÒl\# l= Ó EÒl,# \# l= Ó quando si ha Ö," \" œ ,# \# × ;Þ-Þ Nel caso particolare in cui < œ = œ #, la disuguaglianza si riduce a EÒ\" \# Ó# Ÿ EÒ\"# ÓEÒ\## Ó , e viene detta disuguaglianza di Schwarz in onore del matematico tedesco Karl Hermann Amandus Schwarz (1843-1921). Anche in questo caso si dovrebbe parlare di disuguaglianza di Cauchy-Bunyakovsky-Schwarz, in quanto la versione elementare della disuguaglianza è stata introdotta dal grande matematico Cauchy e successivamente estesa dal matematico russo Viktor Yakovlevich Bunyakovsky (1804-1889). La disuguaglianza di Schwarz implica inoltre che CovÒ\" ß \# Ó esiste finita se esistono finiti i momenti EÒ\"# Ó e EÒ\## Ó. Infine, si noti che in Teoria della Misura la disuguaglianza di Hölder stabilisce che lØ\" ß \# Ùl Ÿ m\" m= m\# m< se "Î< "Î= œ ". Il seguente Teorema introduce un'altra celebrata disuguaglianza che discende dalla disuguaglianza di Hölder e che prende nome dal matematico tedesco Hermann Minkowski (1864-1909). Teorema 4.4.3. (Disuguaglianza di Minkowski) Sia dato un v.v.a. \ œ Ð\" ß \# ÑT definito sullo spazio probabilizzato ÐHß Y ß T Ñ. Se < " e se EÒl\" l< Ó ∞ e EÒl\# l< Ó ∞, allora EÒl\" \# l< Ó"Î< Ÿ EÒl\" l< Ó"Î< EÒl\# l< Ó"Î< . Dimostrazione. Se EÒl\" \# l< Ó œ ! la disuguaglianza è immediatamente verificata. Si consideri quindi il caso in cui EÒl\" \# l< Ó !. Tenendo presente che per ogni ?ß @ − ‘ vale la disuguaglianza l? @l Ÿ l?l l@l, si ha 22 Valori attesi EÒl\" \# l< Ó œ EÒl\" \# l † l\" \# l<" Ó Ÿ EÒÐl\" l l\# lÑ † l\" \# l<" Ó œ EÒl\" l † l\" \# l<" Ó EÒl\# l † l\" \# l<" Ó . Inoltre, dalla disuguaglianza di Hölder applicata alle v.a. l\" l e l\" \# l<" risulta EÒl\" l † l\" \# l<" Ó Ÿ EÒl\" l< Ó"Î< EÒl\" \# lÐ<"Ñ= Ó"Î= œ EÒl\" l< Ó"Î< EÒl\" \# l< Ó""Î< , dal momento che, essendo "Î< "Î= œ ", si ha anche Ð< "Ñ= œ < e "Î= œ " "Î<. In modo simile risulta EÒl\# l † l\" \# l<" Ó Ÿ EÒl\# l< Ó"Î< EÒl\" \# l< Ó""Î< . Dunque, si ha EÒl\" \# l< Ó Ÿ ÐEÒl\" l< Ó"Î< EÒl\# l< Ó"Î< ÑEÒl\" \# l< Ó""Î< , da cui discende immediatamente la tesi. In Teoria della Misura, la disuguaglianza di Minkowski stabilisce in effetti la cosiddetta disuguaglianza triangolare, ovvero m\" \# m< Ÿ m\" m< m\# m< . Si considerano di seguito alcuni Teoremi sulle proprietà della covarianza. Teorema 4.4.4. Dato un v.v.a. \ œ Ð\" ß \# ÑT definito sullo spazio probabilizzato ÐHß Y ß T Ñ, se \" e \# sono indipendenti e se EÒ\" Ó e EÒ\# Ó esistono finiti, allora si ha CovÒ\" ß \# Ó œ !Þ Dimostrazione. Tenendo presente il Teorema 4.2.5 si ha EÒ\" \# Ó œ EÒ\" ÓEÒ\# Ó , da cui segue immediatamente la tesi. Si deve notare che non è in generale valido l'inverso del Teorema 4.4.4, ovvero se si verifica CovÒ\" ß \# Ó œ ! non si può concludere che le due componenti del v.v.a. \ œ Ð\" ß \# ÑT sono indipendenti. In effetti, come sarà visto in seguito, la covarianza dipende dal'intensità del legame lineare tra le due componenti del v.v.a. \ . Se tali componenti sono indipendenti, non esistendo tra loro nessun tipo di legame, non esiste nemmeno un legame di tipo lineare e quindi la 23 Capitolo 4 covarianza risulta nulla. Al contrario, se le due componenti hanno covarianza nulla, si può solamente affermare che non esiste tra loro nessun legame di tipo lineare, ma questo non esclude che esista un legame di tipo differente. Esempio 4.4.1. Si consideri il v.v.a. assolutamente continuo \ œ Ð\" ß \# ÑT . Si supponga che la componente marginale \" ammetta d.p. data da 0\" ÐB" Ñ œ " "Ó"ß"Ò ÐB" Ñ # e che \# œ \"# . Dal momento che EÒ\"< Ó " " < " œ B .B œ Ð" Ð "Ñ< Ñ # " #Ð< "Ñ e quindi EÒ\"< Ó œ ! se < è dispari, mentre EÒ\"< Ó œ " <" se < è pari. Dunque, si ha CovÒ\" ß \# Ó œ EÒ\"$ Ó EÒ\" ÓEÒ\1# Ó œ ! anche se \# è una trasformata di \" e dunque \" e \# non risultano ovviamente indipendenti. Teorema 4.4.5. Dato un v.v.a. \ œ Ð\" ß \# ÑT definito sullo spazio probabilizzato ÐHß Y ß T Ñ, se ]" œ +" ," \" e ]# œ +# ,# \# , dove +" ß +# ß ," ß ,# − ‘ sono costanti, e se CovÒ\" ß \# Ó esiste finita, allora CovÒ]" ß ]# Ó œ CovÒ+" ," \" ß +# ,# \# Ó œ ," ,# CovÒ\" ß \# Ó . Dimostrazione. Tenendo presente il Teorema 4.2.4 si ha CovÒ]" ß ]# Ó œ EÒÐ+" ," \" EÒ+" ," \" ÓÑÐ+# ,# \# EÒ+# ,# \# ÓÑÓ œ ," ,# EÒÐ\" EÒ\" ÓÑÐ\# EÒ\# ÓÑÓ œ ," ,# CovÒ\" ß \# Ó , che è quanto si voleva dimostrare. In particolare, per ]" œ +" \" e ]# œ +# \# , dal Teorema 4.4.5 si ha CovÒ]" ß ]# Ó œ CovÒ+" \" ß +# \# Ó œ CovÒ\" ß \# Ó . 24 Valori attesi Viene introdotto di seguito un importante indice che risulta fondamentale nel valutare il grado di dipendenza lineare tra due v.a. Più esattamente, dato il v.v.a. \ œ Ð\" ß \# ÑT definito sullo spazio probabilizzato ÐHß Y ß T Ñ, se \" e \# sono v.a. non degeneri tali che EÒ\"# Ó e EÒ\## Ó esistono finiti, si dice coefficiente di correlazione tra \" e \# la quantità 5\" ß\# 3\" ß\# œ . 5 \ " 5 \# Tenendo presente il Teorema 4.4.5 e il Teorema 4.3.5, se si considera le v.a. standardizzate ^" œ Ð\" .\" ÑÎ5\" e ^# œ Ð\# .\# ÑÎ5\# , è immediato verificare che EÒ^" ^# Ó œ 5^" ß^# œ 3^" ß^# œ 3\" ß\# , ovvero il coefficiente di correlazione rappresenta in pratica la covarianza tra le v.a. standardizzate. Inoltre, quando 3\" ß\# œ ! le v.a. sono dette non correlate. Ovviamente, questo si verifica se e solo se 5\" ß\# œ !. Dai seguenti Teoremi risultano le principali proprietà del coefficiente di correlazione. Teorema 4.4.6. Dato un v.v.a. \ œ Ð\" ß \# ÑT definito sullo spazio probabilizzato ÐHß Y ß T Ñ, se ]" œ +" ," \" e ]# œ +# ,# \# , dove +" ß +# ß ," ß ,# − ‘, e se \" e \# sono v.a. non degeneri tali che EÒ\"# Ó e EÒ\## Ó esistono finiti, allora 3]" ß]# œ sgnÐ," ,# Ñ3\" ß\# . Dimostrazione. Tenendo presente il Teorema 4.4.5 e il Teorema 4.3.5 si ha 3]" ß]# œ ," ,# 5\" ß\# œ sgnÐ," ,# Ñ3\" ß\# . l," l5\" l,# l5\" Teorema 4.4.7. Dato un v.v.a. \ œ Ð\" ß \# ÑT definito sullo spazio probabilizzato ÐHß Y ß T Ñ, se \" e \# sono v.a. non degeneri tali che EÒ\"# Ó e EÒ\## Ó esistono finiti, si ha l3\" ß\# l Ÿ ". Inoltre, l3\" ß\# l œ " se e solo se Ö\# œ + ,\" × ;Þ-Þ o Ö\# œ + ,\" × ;Þ-Þ dove + œ .\# .\" Ð5\# Î5\" Ñ e , œ 5 \ # Î 5 \" . Dimostrazione. Se si considera le v.a. ]" œ Ð\" .\" ÑÎ5\" e ]# œ Ð\# .\# ÑÎ5\# , dal momento che EÒ]"# Ó œ 5]#" œ " e EÒ]## Ó œ 5]## œ ", dalla disuguaglianza di Schwarz si ha 25 Capitolo 4 EÒ]" ]# Ó# Ÿ " . La prima parte del Teorema segue tenendo presente che EÒ]" ]# Ó œ 3\" ß\# . Tenendo presente la dimostrazione del Teorema 4.4.2, l'uguaglianza si ha se e solo se Ö]" œ ]# × ;Þ-Þ o Ö]" œ ]# × ;Þ- , da cui segue la seconda parte del Teorema. Esempio 4.4.2. Si consideri il v.v.a. assolutamente continuo \ œ Ð\" ß \# ÑT dell'Esempio 3.5.2. Si ha EÒ\" \# Ó œ #% " ! "B" ! B#" B# Ð" B" B# Ñ .B" .B# œ " . "& Inoltre, è stato visto nell'Esempio 4.2.3 che EÒ\" Ó œ #Î& e EÒ\# Ó œ "Î&, mentre risulta EÒ\"# Ó œ #% " ! "B" ! B"$ Ð" B" B# Ñ .B" .B# œ " , & e EÒ\## Ó œ #% " ! ! "B" B" B## Ð" B" B# Ñ .B" .B# œ " , "& # # Dunque, si ottiene 5\" ß\# œ "Î(&, 5\ œ "Î#& e 5\ œ #Î(&, per cui " # 3\" ß\# œ 'Î'. In generale, considerato il v.v.a. \ œ Ð\" ß á ß \5 ÑT definito sullo spazio probabilizzato ÐHß Y ß T Ñ, se EÒ\3 Ó esiste finito per ogni 3 œ "ß á ß 5 , il vettore delle medie è definito come .\ œ Ð.\" ß á ß .\5 ÑT , mentre se CovÒ\3 ß \4 Ó esiste finito per ogni 3 œ 4 œ "ß á ß 5 , la matrice di varianza-covarianza è definita come # 5 \" 5\ ß\ # " O\ œ ã 5\5 ß\" 5\" ß\# # 5\ # ã 5\5 ß\# á á ä á 5\" ß\5 5\# ß\5 . ã # 5\ 5 Il determinante detÐO\ Ñ è detto varianza generalizzata del v.v.a. \ . 26 Valori attesi Esempio 4.4.3. Si consideri il v.v.a. assolutamente continuo \ œ Ð\" ß \# ß \$ ÑT che ammette la seguente d.p.c. 0\ ÐB" ß B# ß B$ Ñ œ Ð" Ð" #B" ÑÐ" #B# ÑÑ"Ó!ß"Ò ÐB" Ñ"Ó!ß"Ò ÐB# Ñ"Ó!ß"Ò ÐB$ Ñ . Si ha EÒ\" \# Ó œ " " ! ! " B" B# Ð" Ð" #B" ÑÐ" #B# ÑÑ .B" .B# .B$ œ ! & , ") mentre EÒ\" Ó œ " ! " ! " B" Ð" Ð" #B" ÑÐ" #B# ÑÑ .B" .B# .B$ œ " # B"# Ð" Ð" #B" ÑÐ" #B# ÑÑ .B" .B# .B$ œ " . $ ! e EÒ\"# Ó œ " ! " ! " ! Inoltre, per simmetria si ha EÒ\# Ó œ EÒ\" Ó e EÒ\## Ó œ EÒ\"# Ó. Si noti che 0\ ÐB" ß B# ß B$ Ñ œ 0\" ß\# ÐB" ß B# Ñ0\$ ÐB$ Ñ , dove 0\" ß\# ÐB" ß B# Ñ œ Ð" Ð" #B" ÑÐ" #B# ÑÑ"Ó!ß"Ò ÐB" Ñ"Ó!ß"Ò ÐB# Ñ e 0\$ ÐB$ Ñ œ "Ó!ß"Ò ÐB$ Ñ . Quindi, il v.v.a. Ð\" ß \# Ñ e la v.a. \$ sono indipendenti. Inoltre, si ha EÒ\$ Ó œ "Î# e EÒ\$# Ó œ "Î$. Dunque, si ha infine che .\ œ Ð"Î#ß "Î#ß "Î#ÑT , mentre # 5 \" O\ œ 5\# ß\" 5\$ ß\" 5\" ß\# # 5\ # 5\$ ß\# " 5\" ß\$ "# " 5\# ß\$ œ $' # ! 5\ $ " $' " "# ! ! ! . " "# Il seguente Teorema fornisce un importante risultato sulla varianza di una combinazione lineare di v.a. 27 Capitolo 4 Teorema 4.4.8. Se \ œ Ð\" ß á ß \5 ÑT è un v.v.a. definito sullo spazio probabilizzato ÐHß Y ß T Ñ con matrice di varianza-covarianza data da O\ , si consideri la trasformata ] œ + 53œ" ,3 \3 dove + − ‘ e Ð," ß á ß ,5 Ñ − ‘5 sono costanti. Se , œ Ð," ß á ß ,5 ÑT e se CovÒ\3 ß \4 Ó esiste finita per ogni 3 œ "ß á ß 5, si ha VarÒ] Ó œ ,T O\ , . Dimostrazione. Tenendo presente il Teorema A.6 e il Teorema 4.2.4, si ha 5 5 VarÒ] Ó œ E + ,3 \3 + ,3 EÒ\3 Ó 3œ" 3œ" # 5 œ E ,3 Ð\3 EÒ\3 ÓÑ 3œ" # 5 5 5 # œE ,3 Ð\3 EÒ\3 ÓÑ ,3 ,4 Ð\3 EÒ\3 ÓÑÐ\4 EÒ\4 ÓÑ 3œ" 3œ" 4Á3œ" ,3# VarÒ\3 Ó 3œ" 5 œ ,3 ,4 CovÒ\3 ß \4 Ó œ ,T O\ , , 5 5 3œ" 4Á3œ" che è quanto si voleva dimostrare. Dal Teorema 4.4.8 si deduce che la matrice di varianza-covarianza è semidefinita positiva. In effetti, dal momento che ,T O\ , è una varianza di una v.a., per ogni , diverso dal vettore a componenti nulle si ha ,T O\ , !, ovvero la condizione che definisce una matrice semidefinita positiva. Inoltre, dal Teorema 4.5.1 si ha che la varianza di una somma di v.a., ovvero ] œ 53œ" \3 , risulta # 5\ 3 3œ" 5 VarÒ] Ó œ 5\3 ß\4 e quindi, se le v.a. sono non correlate, si ha 5 5 3œ" 4Á3œ" 28 Valori attesi # VarÒ] Ó œ 5\ . 3 5 3œ" In particolare, per 5 œ # si ottiene VarÒ\" \# Ó œ VarÒ\" Ó VarÒ\# Ó # CovÒ\" ß \# Ó , mentre VarÒ\" \# Ó œ VarÒ\" Ó VarÒ\# Ó # CovÒ\" ß \# Ó . Esempio 4.4.4. Si consideri di nuovo il v.v.a. analizzato nell'Esempio 4.2.3 e nell'Esempio 4.4.2. I precedenti risultati consento di determinare la varianza della v.a. trasformata ] œ \" \# senza doverne determinare la relativa distribuzione. In effetti, tenendo presente i risultati dell'Esempio 4.4.2, si ottiene immediatamente che VarÒ\" \# Ó œ "Î#&. Inoltre, risulta anche VarÒ\" \# Ó œ (Î(&. Un v.v.a. \ œ Ð\" ß á ß \5 ÑT definito sullo spazio probabilizzato ÐHß Y ß T Ñ, è detto linearmente degenere se la trasformata ] œ + 53œ" ,3 \3 è degenere. In pratica, se un v.v.a. è linearmente degenere, esiste una componente del v.v.a. che è una combinazione lineare delle rimanenti Ð5 "Ñ componenti. Da un punto di vista geometrico questo implica che la distribuzione di probabilità sia concentrata su un iperpiano a Ð5 "Ñ dimensioni. Se \ è un v.v.a. linearmente degenere, allora dal Teorema 4.3.8 si ha VarÒ] Ó œ ,T O\ , œ ! , ovvero O\ non è definita positiva. Di conseguenza, si ha che il rango di O\ è inferiore a 5 e quindi detÐO\ Ñ œ !. Quanto detto appare evidente nel caso di due variabili. In effetti, quando 5 œ #, si ha # # # # detÐO\ Ñ œ 5\ 5 # 5\ œ 5\ 5 # Ð" 3\ Ñ. " \# " ß\# " \# " ß\# Dunque, se \ è un v.v.a. linearmente degenere, dal Teorema 4.4.6 si ha l3\" ß\# l œ " e quindi detÐO\ Ñ œ !. Al contrario, se \ non è un v.v.a. linearmente degenere, dal Teorema 4.4.7 si ha l3\" ß\# l " e quindi detÐO\ Ñ !, ovvero O\ risulta definita positiva. Capitolo 4 29 4.5. Riferimenti bibliografici Un approccio non usuale alla Teoria della Probabilità basato su una assiomatizzazione del valore atteso è contenuto in Whittle (2000). I testi avanzati, quali Ash e Doléans-Dade (2000), Athreya e Lahiri (2006), Gut (2005), Khoshnevisan (2007) e Resnick (2014), considerano estesamente il concetto di valore atteso. Per quanto riguarda una trattazione approfondita delle disuguaglianze in probabilità, si dovrebbero consultare i testi di Boucheron et al. (2013) e Lin e Bai (2010). Capitolo 5 Valori attesi condizionati 5.1. Valore atteso condizionato Prima di introdurre formalmente in modo generale il concetto di valore atteso condizionato è opportuno definire il valore atteso condizionato di una v.a. rispetto ad un evento. Tenendo presente il Teorema 2.4.2, si ha dunque la seguente definizione. Definizione 5.1.1. Data la v.a. \ definita sullo spazio probabilizzato ÐHß Y ß T Ñ e l'evento I! − Y tale che T ÐI! Ñ !, si dice valore atteso condizionato all'evento I! l'integrale EÒ\ ± I! Ó œ \ .T Ð † ± I! Ñ œ " \ .T T ÐI! Ñ I! se esiste finito. Si noti che dalla Definizione 5.1.1 si ha in effetti EÒ\ ± I! Ó œ EÒ\ "I! Ó . T ÐI! Ñ Se \ œ "I dove I − Y , allora risulta EÒ"I ± I! Ó œ EÒ"I∩I! Ó T ÐI ∩ I! Ñ œ œ T ÐI ± I! Ñ , T ÐI! Ñ T ÐI! Ñ ovvero la probabilità condizionata di I dato I! può essere interpretata come un valore atteso condizionato. Inoltre, è immediato verificare che il valore atteso condizionato all'evento I! esiste finito se il valore atteso EÒ\Ó esiste finito. Esempio 5.1.1. Si consideri la v.a. assolutamente continua \ analizzata nell'Esempio 3.2.1 e si consideri l'evento I! œ \ " ÐÓ!ß "Î$ÒÑ. Dal momento che 2 Valori attesi condizionati T ÐI! Ñ œ "Î$ .B œ ! " , $ si ha EÒ\ ± I! Ó œ $ ! "Î$ B .B œ " . ' La successiva definizione introduce la definizione di valore atteso condizionato ad una 5-algebra, nel caso in cui la 5 -algebra sia generata da una classe di eventi che costituiscono una partizione di H. Definizione 5.1.2. Sia data la v.a. \ definita sullo spazio probabilizzato ÐHß Y ß T Ñ. Sia inoltre ÐI8 Ñ8 " una partizione di H tale che T ÐI8 Ñ ! per ogni 8 œ "ß #ß á e sia Y! la 5 -algebra generata dalla partizione. Se EÒ\Ó esiste finito, si dice valore atteso condizionato alla 5 -algebra Y! la v.a. EÒ\ ± Y! Ó œ EÒ\ ± I8 Ó"I8 . ∞ 8œ" Dalla precedente definizione, è immediato verificare che EÒ\ ± Y! Ó è una v.a. che assume valore EÒ\ ± I8 Ó per ogni = − I8 , dove 8 œ "ß #ß á . Dunque, EÒ\ ± Y! Ó è una v.a. discreta che assume valori su W œ ÐEÒ\ ± I8 ÓÑ8 " con legge essenziale data dall'insieme delle probabilità ÐT ÐI8 ÑÑ8 " . Esempio 5.1.2. Si consideri la v.a. assolutamente continua \ analizzata nell'Esempio 5.1.1 e si consideri la partizione di H data da ÖI" ß I# ×, dove I" œ \ " ÐÓ ∞ß "Î$ÒÑ e I# œ \ " ÐÒ"Î$ß ∞ÒÑ. Si ha Y! œ Ögß I" ß I# ß H×. Inoltre, risulta T ÐI" Ñ œ "Î$ e T ÐI# Ñ œ #Î$, mentre EÒ\ ± I" Ó œ "Î' e EÒ\ ± I# Ó œ #Î$. In questo caso, il valore atteso condizionato EÒ\ ± Y! Ó è una v.a. discreta che assume valori su W œ Ö"Î'ß #Î$× con legge essenziale data dall'insieme delle probabilità Ö"Î$ß #Î$×. Dalle Definizioni 5.1.1 e 5.1.2, tenendo presente che per un insieme opportuno di indici M § ogni I! − Y! può essere rappresentato come 3 Capitolo 5 I! œ I8 , 8−M si ha I! EÒ\ ± Y! Ó .T œ EÒ\ ± I8 ÓT ÐI8 ∩ I! Ñ œ EÒ\ ± I8 ÓT ÐI8 Ñ ∞ 8œ" œ 8−M I8 \ .T œ 8−M \ .T , I! ovvero EÒEÒ\ ± Y! ÓÓ œ EÒ\ "I! Ó . Nel caso in cui I! œ H, la precedente relazione stabilisce che il valore atteso della v.a. EÒ\ ± Y! Ó è pari al valore atteso della v.a. \ , mentre se \ œ "I si ottiene la generalizzazione della Legge delle Probabilità Totali (Teorema 2.4.3), ovvero T ÐI Ñ œ "I .T œ EÒ"I ± I8 ÓT ÐI8 Ñ œ T ÐI ± I8 ÑT ÐI8 Ñ . H ∞ ∞ 8œ" 8œ" Inoltre, la relazione permette di introdurre la definizione generale di valore atteso condizionato. Definizione 5.1.3. Sia data la v.a. \ definita sullo spazio probabilizzato ÐHß Y ß T Ñ e sia Y! § Y una 5 -algebra. Se EÒ\Ó esiste finito, si dice valore atteso condizionato alla 5 -algebra Y! un membro della classe di v.a. che coincidono ;Þ-Þ rispetto a T e tali che per ogni I! − Y! soddisfano la relazione I! EÒ\ ± Y! Ó .T œ \ .T . I! L'esistenza del valore atteso condizionato alla 5 -algebra Y! è assicurata dal Teorema di Radon-Nikodym (Teorema A.9). Inoltre, se si ha la trasformata ] œ 1Ð\Ñ del v.v.a. \ œ Ð\" ß á ß \5 ÑT definito sullo spazio probabilizzato ÐHß Y ß T Ñ, il valore atteso condizionato alla 5 -algebra Y! viene ovviamente definito mediante la relazione 4 Valori attesi condizionati EÒ1Ð\Ñ ± Y! Ó .T œ I! 1Ð\Ñ .T I! per ogni I! − Y! . Infine, nel caso in cui I! œ H e \ œ "I si ottiene un'ulteriore generalizzazione della Legge delle Probabilità Totali (Teorema 2.4.3), ovvero T ÐIÑ œ EÒ"I ± Y! Ó .T œ EÒEÒ"I ± Y! ÓÓ . 5.2. Proprietà del valore atteso condizionato I seguenti Teoremi forniscono un insieme di proprietà che riguardano il valore atteso condizionato alla 5 -algebra. Teorema 5.2.1. Si consideri la v.a. \ definita sullo spazio probabilizzato ÐHß Y ß T Ñ e sia Y! § Y una 5-algebra. Se la v.a. \ è tale che \ " ÐFÑ − Y! per ogni F − U БÑ, allora si ha ÖEÒ\ ± Y! Ó œ \× ;Þ-Þ Dimostrazione. Risulta immediata dalla relazione della Definizione 5.1.3Þ Teorema 5.2.2. Se \ œ Ð\" ß á ß \5 ÑT è un v.v.a. definito sullo spazio probabilizzato ÐHß Y ß T Ñ, si consideri la trasformata ] œ + 53œ" ,3 \3 dove + − ‘ e Ð," ß á ß ,5 Ñ − ‘5 sono costanti. Se Y! § Y è una 5 -algebra e se EÒ] Ó esiste finito, allora ÖEÒ] ± Y! Ó œ + 53œ" ,3 EÒ\3 ± Y! Ó× ;Þ-Þ Dimostrazione. Tenendo presente la Definizione 5.1.3 si ha I! EÒ] ± Y! Ó .T œ + ,3 \3 .T œ + 5 I! œ + 3œ" I! da cui segue la tesi. 3œ" \3 .T I! 5 I! œ .T ,3 I! .T ,3 5 3œ" EÒ\3 ± Y! Ó .T I! Ð+ ,3 EÒ\3 ± Y! ÓÑ .T , 5 3œ" 5 Capitolo 5 Il seguente Teorema fornisce le versioni condizionate delle principali disuguaglianze ottenute in precedenza per il valore atteso. Teorema 5.2.3. Si ha: i) (Disuguaglianza di Jensen condizionata) Data la funzione convessa 1 À ‘5 È ‘, si consideri la trasformata ] œ 1Ð\Ñ del v.v.a. \ œ Ð\" ß á ß \5 ÑT definito sullo spazio probabilizzato ÐHß Y ß T Ñ e sia Y! § Y una 5 -algebra. Risulta Ö1ÐEÒ\ ± Y! ÓÑ Ÿ EÒ1Ð\Ñ ± Y! Ó× ;Þ- . ii) (Disuguaglianza di Lyapunov condizionata) Si consideri la v.a. \ definita sullo spazio probabilizzato ÐHß Y ß T Ñ e sia Y! § Y una 5 -algebra. Se ! = Ÿ <, allora risulta ÖEÒl\l= ± Y! Ó"Î= Ÿ EÒl\l< ± Y! Ó"Î< × ;Þ-Þ iii) (Disuguaglianza di Hölder condizionata) Si consideri il v.v.a. \ œ Ð\" ß \# ÑT definito sullo spazio probabilizzato ÐHß Y ß T Ñ e sia Y! § Y una 5-algebra. Se <ß = − Ó"ß ∞Ò sono costanti tali che "Î< "Î= œ ", allora risulta ÖlEÒ\" \# ± Y! Ól Ÿ EÒl\" l< ± Y! Ó"Î< EÒl\# l= ± Y! Ó"Î= × ;Þ-Þ Dimostrazione. Le dimostrazioni sono analoghe a quelle dei Teoremi 4.2.6, 4.3.2 e 4.4.2, dal momento che le dimostrazioni sono basate su disuguaglianze fra numeri reali. Nel caso in cui si consideri la v.a. \ e la trasformata 1Ð\Ñ œ l\l, dal momento che 1 è una funzione convessa, allora dalla parte i) del Teorema 5.2.3 risulta ÖlEÒ\ ± Y! Ól Ÿ EÒl\l ± Y! Ó× ;Þ-Þ, ovvero si ottiene la disuguaglianza condizionata corrispondente a quella del Teorema 4.2.1. Il seguente Teorema fornisce una classica scomposizione della varianza di una v.a. Teorema 5.2.4. Si consideri la v.a. \ definita sullo spazio probabilizzato ÐHß Y ß T Ñ e sia Y! § Y una 5-algebra. Se EÒ\Ó esiste finito, si ha EÒ\Ó œ EÒEÒ\ ± Y! ÓÓ , mentre se EÒ\ # Ó esiste finito, si ha VarÒ\Ó œ EÒVarÒ\ ± Y! ÓÓ VarÒEÒ\ ± Y! ÓÓ , dove VarÒ\ ± Y! Ó œ EÒ\ # ± Y! Ó EÒ\ ± Y! Ó# . Dimostrazione. La prima parte risulta immediata ponendo I! œ H nella relazione data nella Definizione 5.1.3Þ Per quanto riguarda la seconda parte, posto ] œ \ EÒ\ ± Y! Ó e ^ œ EÒ\ ± Y! Ó EÒ\Ó, si osservi che 6 Valori attesi condizionati VarÒ\Ó œ EÒÐ] ^Ñ# Ó œ EÒ] # Ó EÒ^ # Ó #EÒ] ^Ó . Si può facilmente verificare che ÖEÒ] ^ ± Y! Ó œ ^ EÒ] ± Y! Ó× ;Þ-Þ se ^ è una v.a. tale che ^ " ÐFÑ − Y! per ogni F − U БÑ. Tenendo presente i Teoremi 5.2.1 e 5.2.2 risulta dunque ÖEÒ] ± Y! Ó œ !× ;Þ-Þ e di conseguenza si ha ÖEÒ] ^ ± Y! Ó œ !× ;Þ-Þ, ovvero dalla prima parte del Teorema si ottiene EÒ] ^Ó œ EÒEÒ] ^ ± Y! ÓÓ œ ! . Inoltre, essendo ÖEÒ] ± Y! Ó œ !× ;Þ-Þ, risulta EÒ] # Ó œ EÒEÒ] # ± Y! ÓÓ œ EÒVarÒ] ± Y! ÓÓ œ EÒVarÒ\ ± Y! ÓÓ , dal momento che VarÒ\ ± Y! Ó œ EÒ\ # ± Y! Ó EÒ\ ± Y! Ó# œ EÒÐ\ EÒ\ ± Y! ÓÑ# ± Y! Ó . Infine, dalla prima parte del Teorema si ha EÒ^ # Ó œ EÒÐEÒ\ ± Y! Ó EÒ\ÓÑ# Ó œ EÒÐEÒ\ ± Y! Ó EÒ\ÓÑ# ± Y! Ó œ VarÒEÒ\ ± Y! ÓÓ , da cui segue la tesi. Si noti che dal Teorema 5.2.4 si ha \ œ ] EÒ\ ± Y! Ó , con ] œ \ EÒ\ ± Y! Ó e dove EÒ] EÒ\ ± Y! ÓÓ œ !. In altri termini, la v.a. EÒ\ ± Y! Ó può essere considerata come la “proiezione” della v.a. \ su Y! con il relativo “complemento ortogonale” dato dalla v.a. ] . Teorema 5.2.5. Sia dato un v.v.a. \ œ Ð\" ß \# ÑT definito sullo spazio probabilizzato ÐHß Y ß T Ñ e sia Y! § Y una 5 -algebra. Se EÒ\"# Ó e EÒ\## Ó esistono finiti, e se la v.a. \" è tale che \"" ÐFÑ − Y! per ogni F − U БÑ, si ha EÒÐ\# \" Ñ# Ó œ EÒVarÒ\# ± Y! ÓÓ EÒÐEÒ\# ± Y! Ó \" Ñ# Ó . Inoltre, si ha EÒÐ\# \" Ñ# Ó EÒVarÒ\# ± Y! ÓÓ , dove l'uguaglianza si ottiene se Ö\" œ EÒ\# ± Y! Ó× ;Þ-Þ 7 Capitolo 5 Dimostrazione. Posto ] œ \# EÒ\# ± Y! Ó e ^ œ EÒ\# ± Y! Ó \" , la prima parte si dimostra in modo simile al Teorema 5.2.5. La seconda parte è immediata, dal momento che EÒÐEÒ\# ± Y! Ó \" Ñ# Ó ! e l'uguaglianza è ottenuta quando ÖEÒ\# ± Y! Ó \" œ !× ;Þ-Þ Si noti che il Teorema 5.2.5 fornisce in effetti una versione generale del Teorema di Rao-Blackwell comunemente adottato nell'inferenza statistica. Per maggiori informazioni sul Teorema di Rao-Blackwell, si veda Lehmann e Casella, 1998). Teorema 5.2.6. Si consideri la v.a. \ definita sullo spazio probabilizzato ÐHß Y ß T Ñ e si consideri le 5 -algebre Y! e Y" tali che Y! § Y" § Y . Se EÒ\Ó esiste finito, si ha ÖEÒEÒ\ ± Y" Ó ± Y! Ó œ EÒ\ ± Y! Ó× ;Þ-Þ Dimostrazione. Posto ] œ EÒ\ ± Y" Ó, tenendo presente la disuguaglianza di Jensen condizionata (Teorema 5.2.3, i), si ha EÒ] Ó Ÿ EÒl] lÓ œ EÒlEÒ\ ± Y" ÓlÓ Ÿ EÒEÒl\l ± Y" ÓÓ œ EÒl\lÓ ∞ . Dunque, per ogni I! − Y! dalla Definizione 5.1.3 si ha I! EÒ] ± Y! Ó .T œ ] .T . I! Inoltre, di nuovo dalla Definizione 5.1.3 e tenendo presente che I! − Y! § Y" , si ha I! EÒ\ ± Y" Ó .T œ \ .T . I! Dalle precedenti espressioni si ha I! da cui segue la tesi. EÒ] ± Y! Ó .T œ \ .T , I! Il precedente Teorema è anche detto della “proprietà della torre” e generalizza in effetti la prima parte del Teorema 5.2.4. 8 Valori attesi condizionati 5.3. Valore atteso condizionato ad una variabile aleatoria Si noti che la v.a. \" definita sullo spazio probabilizzato ÐHß Y ß T Ñ induce in effetti una 5 -algebra Y\" § Y data da Y\" œ ÖI − Y À I œ \"" ÐFÑß F − U БÑ× . Di conseguenza, considerato il v.v.a. \ œ Ð\" ß \# ÑT definito sullo spazio probabilizzato ÐHß Y ß T Ñ, si può introdurre il valore atteso condizionato della v.a. \# (alla v.a. \" ) come EÒ\# ± \" Ó œ EÒ\# ± Y\" Ó . Dunque, tenendo presente la Definizione 5.1.3, se EÒ\# Ó esiste finito, EÒ\# ± \" Ó è un membro della classe di v.a. che coincidono ;Þ-Þ rispetto a T e tali che per ogni F − U Ð‘Ñ soddisfano la relazione \"" ÐFÑ EÒ\# ± \" Ó .T œ \"" ÐFÑ \# .T . Inoltre, dalla precedente relazione, si può verificare che esiste una funzione 2ÐB" Ñ œ EÒ\# ± \" œ B" Ó, detta valore atteso condizionato della v.a. \# all'evento Ö\" œ B" ×, tale che se T Ð\"" ÐFÑÑ ! risulta \"" ÐFÑ \# .T œ \"" ÐFÑ EÒ\# ± \" œ B" Ó .T œ 2ÐB" Ñ .T\" ÐB" Ñ . F Si assuma ora che il v.v.a. \ sia discreto a valori su insieme numerabile W − ‘# , con f.p.c. data da :\ ÐB" ß B# Ñ e f.p.m. date da :\" ÐB" Ñ e :\# ÐB# Ñ. Siano inoltre W" e W# le proiezioni di W sugli assi cartesiani. Per F œ ÖB" ×, dove ovviamente B" − W" , si ha \"" ÐFÑ \# .T œ B# :\ ÐB" ß B# Ñ , B# −W# mentre 2ÐB" Ñ .T\" ÐB" Ñ œ EÒ\# ± \" œ B" Ó:\" ÐB" Ñ . F 9 Capitolo 5 Dunque, il valore atteso condizionato della v.a. \# all'evento Ö\" œ B" × con B" − W" , è in questo caso dato da EÒ\# ± \" œ B" Ó œ B# B# −W# :\ ÐB" ß B# Ñ . :\" ÐB" Ñ Esempio 5.3.1. Si consideri il v.v.a. discreto \ œ Ð\" ß \# ÑT dell'Esempio 3.5.1. Si noti che W œ ÖÐ!ß !Ñß Ð"ß !Ñß Ð!ß "Ñ×, mentre W" œ W# œ Ö!ß "×. Dunque, dal momento che EÒ\# Ó œ "Î# ∞, si ha EÒ\# ± \" œ !Ó œ B# :\ Ð!ß B# Ñ # œ :\" Ð!Ñ $ EÒ\# ± \" œ "Ó œ B# :\ Ð"ß B# Ñ œ!. :\" Ð"Ñ B# −W# e B# −W# Si assuma invece che il v.v.a. \ sia assolutamente continuo con d.p.c. data da 0\ ÐB" ß B# Ñ e d.p.m. date da 0\" ÐB" Ñ e 0\# ÐB# Ñ. Inoltre, si consideri l'insieme H œ ÖÐB" ß B# Ñ − ‘# À 0\" ÐB" Ñ œ !× . Risulta T Ð\ − HÑ œ ! e quindi per ogni F − U БÑ, grazie al Teorema di Fubini (Teorema A.11), si ha \"" ÐFÑ \# .T œ B# 0\ ÐB" ß B# Ñ .B" .B# ‘‚F œ B# 0\ ÐB" ß B# Ñ .B# 0\" ÐB" Ñ .B" 0\" ÐB" Ñ ‘ FÏH 0\ ÐB" ß B# Ñ œ B# .B# 0\" ÐB" Ñ .B" 0 ÐB Ñ \ " ‘ F " œ 2ÐB" Ñ .T\" ÐB" Ñ F e dunque 10 Valori attesi condizionati EÒ\# ± \" œ B" Ó œ B# ‘ 0\ ÐB" ß B# Ñ .B# . 0\" ÐB" Ñ Esempio 5.3.2. Si consideri il v.v.a. assolutamente continuo \ œ Ð\" ß \# ÑT dell'Esempio 3.5.2. Dall'Esempio 4.2.3 risulta EÒ\# Ó œ "Î& ∞ e dunque, se B" − Ó!ß "Ò, si ha EÒ\# ± \" œ B" Ó œ "B" ! #B# B# " B" , " .B# œ " B" " B" $ ovvero in questo caso il valore atteso condizionato della v.a. \# all'evento Ö\" œ B" × è una funzione lineare di B" . In modo simile, dal momento che dall'Esempio 4.2.3 risulta EÒ\" Ó œ #Î& ∞, se B# − Ó!ß "Ò, si ottiene EÒ\" ± \# œ B# Ó œ ! "B# 'B#" B" " B# " .B œ , " Ð" B# Ñ# " B# # ovvero il valore atteso condizionato della v.a. \" all'evento Ö\# œ B# × è a sua volta una funzione lineare di B# . Nel caso in cui F œ ‘, dal Teorema 5.2.4 si ottiene EÒ\# Ó œ EÒEÒ\# ± \" ÓÓ se EÒ\# Ó esiste finito. Inoltre, posto VarÒ\# ± \" Ó œ EÒ\## ± \" Ó EÒ\# ± \" Ó# , di nuovo dal Teorema 5.2.4 si ha VarÒ\# Ó œ EÒVarÒ\# ± \" ÓÓ VarÒEÒ\# ± \" ÓÓ , se EÒ\## Ó esiste finito. Infine, dal Teorema 5.2.5 si ha EÒÐ\# \" Ñ# Ó œ EÒVarÒ\# ± \" ÓÓ EÒÐEÒ\# ± \" Ó \" Ñ# Ó e EÒÐ\# \" Ñ# Ó EÒVarÒ\# ± \" ÓÓ , dove l'uguaglianza si ottiene se Ö\" œ EÒ\# ± \" Ó× ;Þ-Þ Esempio 5.3.3. Si consideri il v.v.a. assolutamente continuo \ œ Ð\" ß \# ÑT dell'Esempio 3.5.2. Tenendo presente l'Esempio 5.3.2. e l'Esempio 4.2.3, si ha 11 Capitolo 5 EÒ\# Ó œ EÒEÒ\# ± \" ÓÓ œ " " Ð" EÒ\" ÓÑ œ , $ & coerentemente con quanto visto nell'Esempio 4.2.3. In modo simile, si ottiene EÒ\" Ó œ EÒEÒ\" ± \# ÓÓ œ " # Ð" EÒ\# ÓÑ œ , # & in accordo con quanto visto nell'Esempio 4.2.3. Inoltre, si ha EÒ\## ± \" œ B" Ó œ "B" ! #B## B# Ð" B" Ñ# , " .B# œ " B" " B" #! da cui Ð" B" Ñ# Ð" B" Ñ# Ð" B" Ñ# VarÒ\# ± \" Ó œ œ . ' * ") Inoltre, tenendo presente l'Esempio 4.4.2, si ha EÒVarÒ\# ± \" ÓÓ œ " " Ð" #EÒ\" Ó EÒ\"# ÓÑ œ ") %& e VarÒEÒ\# ± \" ÓÓ œ " " VarÒ\" Ó œ , * ##& da cui risulta VarÒ\# Ó œ EÒVarÒ\# ± \" ÓÓ VarÒEÒ\# ± \" ÓÓ œ # , (& in accordo con i risultati ottenuti nell'Esempio 4.4.2. Esempio 5.3.4. Si consideri il v.v.a. assolutamente continuo \ œ Ð\" ß \# ÑT che ammette la seguente d.p.c. " ÐB# B" Ñ# ÐB" "Ñ# exp 0\ ÐB" ß B# Ñ œ "‘ÏÖ!× ÐB" Ñ . #1lB" l # #B#" Sulla base dei risultati ottenuti, si può ottenere il valore atteso EÒ\# Ó senza calcolare esplicitamente la d.p.m. della v.a. \# (che in questo caso è 12 Valori attesi condizionati un'operazione abbastanza complessa). Tenendo presente le proprietà introdotte nella Sezione 6.7 per la legge Normale, la d.p.m. della v.a. \" risulta 0\" ÐB" Ñ œ ∞ 0\ ÐB" ß B# Ñ .B# ∞ ∞ " ÐB# "Ñ# " ÐB# B" Ñ# œ exp exp .B# # #1 # #B #1lB" l ∞ " " ÐB" "Ñ# œ exp , #1 # ovvero la legge associata alla v.a. \" è Normale di parametri . œ " e 5 œ ". Si ha EÒ\# ± \" œ B" Ó œ ∞ ∞ ∞ œ ∞ 0\ ÐB" ß B# Ñ .B# 0\" ÐB" Ñ B# ÐB# B" Ñ# exp .B# œ B" , #1lB" l #B#" B# ovvero EÒ\# Ó œ EÒEÒ\# ± \" ÓÓ œ EÒ\" Ó ∞ " ÐB" "Ñ# œ B exp .B" œ " , #1 ∞ " # e dunque il valore atteso della v.a. \# è stato ottenuto senza conoscere la legge corrispondente. Evidentemente, si può calcolare anche la varianza della v.a. \# senza determinarne la legge. 5.4. Leggi condizionate Si consideri il v.v.a. \ œ Ð\" ß \# ÑT definito sullo spazio probabilizzato ÐHß Y ß T Ñ. Si supponga inizialmente che il v.v.a. \ sia discreto a valori su insieme numerabile W − ‘# , con f.p.c. data da :\ ÐB" ß B# Ñ e f.p.m. date da :\" ÐB" Ñ e :\# ÐB# Ñ. Siano inoltre W" e W# le proiezioni di W sugli assi cartesiani. Dato l'evento Ö\" œ B" × con B" − W" , T Ð † ± Ö\" œ B" ×Ñ è in effetti una misura di probabilità (vedi Sezione 2.4) e per F − U Ð‘Ñ 13 Capitolo 5 T\# ±\" œB" ÐFÑ œ T Ð\#" ÐFÑ T Ð\#" ÐFÑ ∩ Ö\" œ B" ×Ñ ± Ö\" œ B" ×Ñ œ T Ð\" œ B" Ñ è detta legge condizionata della v.a. \# all'evento Ö\" œ B" ×. Dunque, si può definire la f.p. condizionata della v.a. \# all'evento Ö\" œ B" ×, con B" − W" , come :\# ±\" œB" ÐB# Ñ œ T ÐÖ\# œ B# × ± Ö\" œ B" ×Ñ œ :\ ÐB" ß B# Ñ . :\" ÐB" Ñ Risulta facile verificare che :\# ±\" œB" ÐB# Ñ è in effetti una f.p. e che la sua definizione è coerente con con quella di valore atteso condizionato della v.a. \# all'evento Ö\" œ B" ×, dal momento che, per quanto visto nella Sezione 5.4, risulta EÒ\# ± \" œ B" Ó œ B# :\# ±\" œB" ÐB# Ñ . B# −W# Esempio 5.4.1. Si consideri il v.v.a. discreto \ œ Ð\" ß \# ÑT dell'Esempio 3.5.1. La f.p. condizionata della v.a. \# all'evento Ö\" œ !× è data dunque da :\ Ð!ß B# Ñ # # " :\# ±\" œ! ÐB# Ñ œ œ :\" Ð!Ñ $ $ B "B# "Ö!ß"× ÐB# Ñ , mentre la f.p. condizionata della v.a. \# all'evento Ö\" œ "× risulta :\# ±\" œ" ÐB" Ñ œ :\ Ð"ß B# Ñ œ "Ö!× ÐB# Ñ , :\" Ð"Ñ ovvero le leggi associate alle v.a. condizionate si ottengono per particolari parametrizzazioni della legge Binomiale (si veda Sezione 6.5). Il modo con cui è stata costruita la legge condizionata nel caso di un v.v.a. \ discreto perde di senso quando l'evento Ö\" œ B" × è di probabilità nulla. In generale, non sempre esiste una legge condizionata della v.a. \# all'evento Ö\" œ B" ×, anche se gli esempi di non esistenza sono artificiosi e non fondamentali nell'uso della teoria (per maggiori dettagli, si veda Wise e Hall, 1993, p.159). Nel caso in cui il v.v.a. \ sia assolutamente continuo con d.p.c. data da 0\ ÐB" ß B# Ñ e d.p.m. date da 0\" ÐB" Ñ e 0\# ÐB# Ñ, si può definire la d.p. condizionata della v.a. \# all'evento Ö\" œ B" × come 14 Valori attesi condizionati 0\# ±\" œB" ÐB# Ñ œ 0\ ÐB" ß B# Ñ " # ÐB" ß B# Ñ , 0\" ÐB" Ñ ‘ ÏH (vedi Sezione 5.3 per la definizione dell'insieme H). Il Teorema di RadonNikodym (Teorema A.9) assicura in questo caso l'esistenza della legge condizionata della v.a. \# all'evento Ö\" œ B" ×, ovvero per ogni F − U Ð‘Ñ si ha T\# ±\" œB" ÐFÑ œ 0\# ±\" œB" ÐB# Ñ .B# . F Si dovrebbe evidenziare che la d.p. condizionata non è unica e quindi al solito si dovrebbe parlare di una versione della densità. Inoltre, la sua definizione è coerente con con quella di valore atteso condizionato della v.a. \# all'evento Ö\" œ B" ×, dal momento che per quanto visto nella Sezione 5.4 risulta EÒ\# ± \" œ B" Ó œ B# 0\# ±\" œB" ÐB# Ñ .B# . ‘ Esempio 5.4.2. Si consideri il v.v.a. assolutamente continuo \ œ Ð\" ß \# ÑT dell'Esempio 3.5.2. La d.p. condizionata della v.a. \# all'evento Ö\" œ B" × è data dunque da 0\ ÐB" ß B# Ñ 0\" ÐB" Ñ # B# œ " "Ó!ß"Ò ÐB" Ñ"Ó!ß"B" Ò ÐB# Ñ , " B" " B" 0\# ±\" œB" ÐB# Ñ œ mentre la d.p. condizionata della v.a. \" all'evento Ö\# œ B# × risulta 0\ ÐB" ß B# Ñ 0\# ÐB# Ñ 'B" B" œ " "Ó!ß"Ò ÐB# Ñ"Ó!ß"B# Ò ÐB" Ñ , Ð" B# Ñ# " B# 0\" ±\# œB# ÐB" Ñ œ ovvero le leggi associate alle v.a. condizionate si ottengono per particolari parametrizzazioni della legge Beta (si veda Sezione 6.12). 15 Capitolo 5 Esempio 5.4.3. Sia data la legge Uniforme sul cerchio unitario introdotta nell'Esempio 3.6.3. La d.p. condizionata della v.a. \" all'evento Ö\# œ B# × è data dunque da 0\# ±\" œB" ÐB# Ñ œ 0\ ÐB" ß B# Ñ " # "Î# # "Î# ÐB# Ñ , œ " 0\" ÐB" Ñ #Ð"B#" Ñ"Î# ÓÐ"B" Ñ ßÐ"B" Ñ Ò mentre per simmetria la d.p. condizionata della v.a. \" all'evento Ö\# œ B# × risulta 0\" ±\# œB# ÐB" Ñ œ " # "Î# # "Î# ÐB" Ñ , " #Ð"B## Ñ"Î# ÓÐ"B# Ñ ßÐ"B# Ñ Ò ovvero le leggi associate alle v.a. condizionate sono Uniformi (si veda Sezione 6.12). 5.5. Riferimenti bibliografici Una trattazione approfondita del concetto di valore atteso condizionato è contenuto in Williams (1992). Altri testi dove è possibile trovare un'esauriente analisi dei problemi tecnici legati al valore atteso condizionato sono Cohen e Elliott (2015), Dudley (2004), Kallenberg (2002) e Stroock (2013). Per controesempi nell'ambito del valore atteso condizionato si veda Wise e Hall (1993). Capitolo 6 Principali leggi 6.1. Legge Binomiale Si consideri un esperimento aleatorio con esito dicotomico, ovvero, utilizzando la terminologia dei giochi d'azzardo, suscettibile di assumere due soli risultati =" e =# del tipo “successo” e “insuccesso” di un ipotetico giocatore. Se si ripete 8 volte l'esperimento aleatorio, il corrispondente spazio fondamentale prodotto è dato da H œ H" ‚ â ‚ H8 , dove H3 œ Ö=" ß =# ×. Quindi, H è costituito da #8 eventi elementari che coincidono con tutte le possibili sequenze di lunghezza 8 (distinte anche per l'ordine) di =" e =# . Si supponga inoltre che gli esperimenti aleatori siano condotti in modo indipendente e che l'assegnazione di probabilità su H3 sia data da T3 ÐÖ=" ×Ñ œ : e T3 ÐÖ=# ×Ñ œ " : œ ; , dove : − Ó!ß "Ò. In altre parole, l'assegnazione di probabilità è la stessa per ogni esperimento aleatorio. Dunque, la misura di probabilità prodotto T si ottiene probabilizzando i #8 eventi elementari ÖÐ=4" ß á ß =48 Ñ× di H come T ÐÖÐ=4" ß á ß =48 Ñ×Ñ œ T3 ÐÖ=43 ×Ñ , 8 3œ" dove 43 œ "ß # e 3 œ "ß á ß 8. Si consideri la v.a. \ À H È W , che ad ogni realizzazione dell'esperimento combinato associa il corrisponente numero di “successi”, ovvero il numero di risultati del tipo =" contenuti in ogni Ð=4" ß á ß =48 Ñ − H. La v.a. \ è evidentemente di tipo discreto e si ha W œ Ö!ß "ß á ß 8×. Si noti inoltre che la probabilità di ciascun evento elementare di H in cui compaiono B “successi” e Ð8 BÑ “insuccessi” è pari a :B ; 8B , dove B œ !ß "ß á ß 8. Inoltre, vi sono 8B eventi elementari di questo tipo, che sono distinti solo per l'ordine in cui i “successi” e gli “insuccessi” si alternano. Dunque, la f.p. della v.a. \ è data da 2 Principali leggi 8 :\ ÐBÑ œ :B ; 8B "Ö!ß"ßáß8× ÐBÑ . B La legge relativa alla v.a. \ è detta legge Binomiale di parametri 8 e : e si denota usualmente con UÐ8ß :Ñ. Inoltre, nel caso particolare in cui 8 œ ", la legge viene detta legge di Bernoulli di parametro :, anche se entrambe le leggi sono state introdotte da Jakob Bernoulli. Si noti che :\ è in effetti una f.p., in quanto dall'espressione del binomio di Newton si verifica immediatamente che 8 :\ ÐBÑ œ :B ; 8B œ Ð: ;Ñ8 œ " . B Bœ! Bœ! 8 8 0.15 0.10 0.05 0.00 0 10 20 30 40 50 Figura 6.1.1. Funzione di probabilità per la legge Binomiale e Ð8ß :Ñ œ Ð&!ß "Î&Ñß Ð&!ß "Î#Ñß Ð&!ß %Î&Ñ (rispettivamente in rosso, verde e blu). La v.a. \ può essere interpretata anche come una somma di 8 v.a. indipendenti \3 , ognuna delle quali è caratterizzata dalla legge di Bernoulli di parametro :, ovvero si ha \ œ 83œ" \3 . Questa affermazione sarà dimostrata con un metodo semplice ed elegante nell'Esempio 7.4.3. Dunque, dal momento che è immediato verificare che EÒ\3 Ó œ : e VarÒ\3 Ó œ :; e, tenendo presente le proprietà relative alla media e varianza di somme di v.a. indipendenti, si ottiene EÒ\Ó œ EÒ\3 Ó œ 8: 8 3œ" 3 Capitolo 6 e VarÒ\Ó œ VarÒ\3 Ó œ 8:; . 8 3œ" Questi risultati saranno anche verificati con un differente metodo nell'Esempio 7.2.4. 6.2. Legge di Poisson Si consideri una successione Ð:8 Ñ8 " di elementi di Ó!ß "Ò, in modo tale che la successione Ð8:8 Ñ8 " converga verso una costante - − Ó!ß ∞Ò e si ponga inoltre ;8 œ " :8 . Dunque, la successione Ð:8 Ñ8 " deve necessariamente convergere verso !. Per ogni 8 si consideri inoltre la successione Ð18 ÐBÑÑB ! , dove 8B :8B ;88B 18 ÐBÑ œ ! B − Ö!ß "ß á ß 8× B − Ï Ö!ß "ß á ß 8× In altre parole, Ð18 ÐBÑÑB ! è il prolungamento su della legge Binomiale UÐ8ß :8 Ñ. Se B − Ö!ß "ß á ß 8× si ha B" 8 B 8B " 3 B 8B 18 ÐBÑ œ :8 ;8 œ Ð8:8 Ñ Ð" :8 Ñ " . B Bx 8 3œ! Tenendo presente che se Ð+8 Ñ8 " è una successione di numeri reali tale che lim8 +8 œ + si ha lim " 8 allora risulta +8 8 œ expÐ+Ñ , 8 8:8 8 lim Ð" :8 Ñ œ lim " œ expÐ -Ñ . 8 8 8 8 Inoltre, si ha lim Ð" :8 ÑB œ " 8 e 4 Principali leggi lim " B" 8 3œ! 3 œ", 8 da cui si ottiene infine -B lim 18 ÐBÑ œ expÐ -Ñ . 8 Bx Dunque, si può considerare la v.a. \ con f.p. limite data da -B :\ ÐBÑ œ expÐ -Ñ " ÐBÑ . Bx La v.a. \ è discreta e prende valori su W œ . La legge relativa alla v.a. \ è detta legge di Poisson di parametro - e si denota usualmente con c Ð-Ñ. La legge prende nome dal matematico francese Siméon Denis Poisson (1781-1840), che ne ha considerato le prime applicazioni, anche se la legge era già nota a Abraham de Moivre. La legge di Poisson sarà ottenuta in modo più elegante nell'Esempio 8.1.7. Si noti che :\ è in effetti una f.p., in quanto dall'espressione della serie esponenziale si ha -B :\ ÐBÑ œ expÐ -Ñ œ expÐ -ÑexpÐ-Ñ œ " . Bx Bœ! Bœ! ∞ ∞ La media della v.a. \ è data da ∞ -B -B EÒ\Ó œ expÐ -Ñ B œ -expÐ -Ñ œ-. Bx Bx Bœ! Bœ! ∞ Inoltre, essendo ∞ -B -B EÒ\Ð\ "ÑÓ œ expÐ -Ñ BÐB "Ñ œ expÐ -Ñ Bx ÐB #Ñx Bœ! Bœ# ∞ -B œ - expÐ -Ñ œ -# , Bx Bœ! ∞ # si ha EÒ\ # Ó œ -# - e dunque VarÒ\Ó œ -. Questi risultati saranno anche verificati con un differente metodo nell'Esempio 7.2.5. 5 Capitolo 6 0.30 0.25 0.20 0.15 0.10 0.05 0.00 0 5 10 15 20 25 30 Figura 6.2.1. Funzione di probabilità per la legge di Poisson e - œ #ß &ß "! (rispettivamente in rosso, verde e blu). 6.3. Legge Binomiale Negativa Si consideri di nuovo un esperimento aleatorio con esito dicotomico, suscettibile di assumere due soli risultati =" e =# , che al solito rappresentano “successo” e “insuccesso” di un ipotetico giocatore, e si ripeta l'esperimento aleatorio in modo indipendente sino a quando non si siano verificati 5 “successi”. Anche se l'esperimento aleatorio combinato ha termine in pratica dopo che si sono ottenuti 5 “successi”, da un punto di vista formale è conveniente considerare un'infinità numerabile di esperimenti aleatori. In altre parole, si considera lo spazio prodotto H œ ∞ 3œ" H3 , dove ogni singolo spazio fondamentale è dato da H3 œ Ö=" ß =# ×. Dunque, gli elementi dello spazio fondamentale prodotto H sono tutte le successioni del tipo Ð=48 Ñ8 " , dove 48 œ "ß #. Tenendo presente la discussione effettuata nella Sezione 2.6, se si effettua l'assegnazione di probabilità su H3 in modo tale che T3 ÐÖ=" ×Ñ œ : e T3 ÐÖ=# ×Ñ œ " : œ ; , dove : − Ó!ß "Ò, la probabilità prodotto T œ ∞ 3œ" T3 esiste ed è unica. Si consideri la v.a. \ À H È W , che ad ogni elemento di H associa il numero di esperimenti aleatori che si devono effettuare oltre il 5 -esimo esperimento per ottenere 5 “successi” (in effetti, affinchè si verifichino 5 “successi”, si devono effettuare almeno 5 esperimenti). Si assuma inoltre che 5 œ "ß #ß á . La v.a. \ è evidentemente di tipo discreto e risulta W œ . La probabilità di ciascun evento elementare di H a cui corrispondono Ð5 "Ñ “successi” nei primi Ð5 B "Ñ 6 Principali leggi esperimenti aleatori e per cui si ha di nuovo “successo” al Ð5 BÑ-esimo eventi esperimento aleatorio risulta pari a :5 ; B . Inoltre, vi sono 5B" 5" elementari di questo tipo e che sono distinti solo per l'ordine in cui i “successi” e gli “insuccessi” si succedono. Dunque, la f.p. della v.a. \ è data da :\ ÐBÑ œ 5B" 5 B : ; " ÐBÑ . 5" La legge relativa alla v.a. \ è detta legge Binomiale Negativa di parametri 5 e : e si denota usualmente con Ua Ð5ß :Ñ. Inoltre, nel caso particolare in cui 5 œ ", la legge viene comunemente detta legge Geometrica di parametro :, anche se qualche autore definisce come legge Geometrica quella relativa alla v.a. Ð\ "Ñ. Si noti che :\ è in effetti una f.p., in quanto dall'espressione della serie binomiale negativa si ha :\ ÐBÑ œ : ∞ Bœ! 5B" B ; 5" Bœ! 5B" B 5 5 ; œ : Ð" ;Ñ œ " . B ∞ 5 Bœ! ∞ œ :5 La v.a. \ può essere interpretata come una somma di 5 v.a. indipendenti \3 , ognuna delle quali è caratterizzata dalla legge Geometrica di parametro :, ovvero risulta \ œ 53œ" \3 . Questa affermazione sarà dimostrata molto semplicemente nell'Esempio 7.4.4. Dunque, dal momento che (si tenga presente l'Esempio 4.1.1) EÒ\3 Ó œ : B; B œ ∞ Bœ! ; , : mentre ;# EÒ\3 Ð\3 "ÑÓ œ : BÐB "Ñ; œ # # , : Bœ! ∞ B da cui VarÒ\3 Ó œ ; , :# per le proprietà relative alla media e varianza di somme di v.a. indipendenti si ha 7 Capitolo 6 EÒ\Ó œ EÒ\3 Ó œ 5 3œ" 5; : e VarÒ\Ó œ VarÒ\3 Ó œ 5 3œ" 5; . :# Questi risultati saranno anche verificati con un differente metodo nell'Esempio 7.2.6. Risulta inoltre interessante ottenere la f.p. limite per 5 Ä ∞, qualora Ð:5 Ñ5 " sia una successione di elementi di Ó!ß "Ò, tale che l'ulteriore successione Ð5;5 Î:5 Ñ5 " converge verso una costante - − Ó!ß ∞Ò e dove ;5 œ " :5 . Si noti che Ð:5 Ñ5 " deve necessariamente convergere verso ". Per B − si ponga 5B" 5 B " 5;5 ;5 15 ÐBÑ œ :5 ;5 œ " 5" Bx :5 :5 B " B5 B" 3œ! 3 5 e per ogni 5 si consideri la successione Ð15 ÐBÑÑB ! . Dal momento che ;5 lim " 5 :5 5 5;5 Î:5 œ lim " 5 5 5 œ expÐ -Ñ , mentre risulta lim " B" 5 3œ! 3 œ", 5 si ha -B lim 15 ÐBÑ œ expÐ -Ñ , 5 Bx ovvero la f.p. limite è quella relativa ad una legge di Poisson c Ð-Ñ. Questo risultato sarà ottenuto in modo più elegante nell'Esempio 8.1.8. Si noti infine che il parametro 5 può in generale assumere un qualsiasi valore positivo non necessariamente intero, anche se in questo caso la genesi della v.a. non si ottiene dallo schema degli esperimenti ripetuti. In effetti, la serie binomiale negativa può essere definita per ogni 5 positivo e le proprietà ottenute in precedenza possono essere generalizzate. 8 Principali leggi 0.30 0.25 0.20 0.15 0.10 0.05 0.00 0 5 10 15 20 25 Figura 6.3.1. Funzione di probabilità per la legge Binomiale Negativa e Ð5ß :Ñ œ Ð&ß $Î"!Ñß Ð&ß "Î#Ñß Ð&ß (Î"!Ñ (rispettivamente in rosso, verde e blu). 6.4. Legge Ipergeometrica Si consideri un'urna composta da R palline di cui H sono rosse e ÐR HÑ sono nere. Si suppone ovviamente che H sia un intero positivo tale che H Ÿ R . Si consideri inoltre l'esperimento aleatorio che consiste nell'estrarre in blocco 8 palline, dove 8 è un intero positivo tale che 8 Ÿ R . Lo spazio fondamentale H relativo all'esperimento risulta costituito da R8 risultati che corrispondono a tutte le possibili scelte di R palline a gruppi di 8. Se si suppone che l'estrazione sia regolare, allora si può considerare un'assegnazione equiprobabile, ovvero la " probabilità di ciascun evento elementare di H risulta pari a R8 . Si consideri la v.a. \ À H È W , che ad ogni risultato associa il numero di numero di palline rosse estratte. La v.a. \ è evidentemente di tipo discreto e si ha inoltre W œ ÖmaxÐ!ß 8 R HÑß á ß minÐ8ß HÑ×. Gli estremi dell'insieme W derivano dal fatto che, se 8 R H almeno Ð8 R HÑ palline estratte devono essere rosse, mentre se 8 H si possono estrarre al più H palline rosse. Inoltre il numero di eventi elementari per cui si hanno B palline rosse estratte H risulta HB R8B , che corrisponde al numero di scelte di H palline rosse a gruppi di B combinate con le scelte di ÐR HÑ palline nere a gruppi di Ð8 BÑ. Dunque, la f.p. della v.a. \ è data da 9 Capitolo 6 :\ ÐBÑ œ H HB R8B R8 "W ÐBÑ . La legge relativa alla v.a. \ è detta legge Ipergeometrica di parametri 8, H e R , e si denota usualmente con \ Ð8ß Hß R Ñ. Si noti che :\ è in effetti una f.p., in quanto per le proprietà dei coefficienti binomiali si ha R :\ ÐBÑ œ 8 BœmaxÐ!ß8R HÑ minÐ8ßHÑ minÐ8ßHÑ " BœmaxÐ!ß8R HÑ H R H B 8B R R œ œ" 8 8 " Tenendo presente l'espressione della f.p. relativa alla legge Ipergeometrica \ Ð8 "ß H "ß R "Ñ, la media della v.a. \ è data da minÐ8ßHÑ EÒ\Ó œ B H HB R8B BœmaxÐ!ß8R HÑ R8 8H œ R BœmaxÐ!ß8R H"Ñ minÐ8"ßH"Ñ H" R H B 8"B R " 8" Inoltre, tenendo presente l'espressione della Ipergeometrica \ Ð8 #ß H #ß R #Ñ si ha minÐ8ßHÑ EÒ\Ð\ "ÑÓ œ B ÐB "Ñ BœmaxÐ!ß8R HÑ f.p. œ relativa R8 minÐ8#ßH#Ñ da cui 8HÐ8 "ÑÐH "Ñ R ÐR "Ñ alla H HB R8B 8HÐ8 "ÑÐH "Ñ œ R ÐR "Ñ BœmaxÐ!ß8R H#Ñ œ 8H . R H# R H B 8#B R # 8# legge 10 Principali leggi VarÒ\Ó œ 8H R H R 8 . R R R " La legge Ipergeometrica può essere ottenuta anche come legge condizionata. Più esattamente, date R v.a. indipendenti \3 ognuna delle quali è caratterizzata dalla legge di Bernoulli di parametro :, si consideri le v.a. \ œ H 3œ" \3 e R ] œ 3œ" \3 . La f.p. condizionata della v.a. \ all'evento Ö] œ 8× è data da :\±] œ8 ÐBÑ œ œ H 8B R H8B HB :B ; HB R8B : ; R8 :8 ; R 8 H HB R8B R8 "W ÐBÑ "W ÐBÑ . Risulta interessante ottenere la f.p. limite per R Ä ∞, qualora ÐHR ÑR " sia una successione con HR Ÿ R per ogni R e tale che la successione ÐHR ÎR ÑR " converge verso una costante : − Ó!ß "Ò. Per ogni R , si consideri l'insieme Ð1R ÐBÑÑ8Bœ! , dove 1R ÐBÑ è il prolungamento su Ö!ß "ß á ß 8× della legge Ipergeometrica \ Ð8ß HR ß R Ñ. Se B − ÖmaxÐ!ß 8 R HÑß á ß minÐ8ß HÑ×, si ottiene 1R ÐBÑ œ HR HBR R8B R8 8B" ÐR HR 3Ñ 8 B" 3œ! ÐHR 3Ñ 3œ! œ 8" B 3œ! ÐR 3Ñ 8B" Ð" HR ÎR 3ÎR Ñ 8 B" 3œ! ÐHR ÎR 3ÎR Ñ 3œ! œ 8" B 3œ! Ð" 3ÎR Ñ Dal momento che si ha lim B" R 3œ! HR 3 œ :B R R e lim " R 8B" 3œ! dove ; œ " : , mentre HR 3 œ ; 8B , R R 11 Capitolo 6 lim " 8" R si ottiene 3œ! 3 œ ", R 8 lim 1R ÐBÑ œ :B ; 8B , R B ovvero la f.p. limite è quella relativa ad una legge Binomiale UÐ8ß :Ñ. Si noti infine che se le palline sono estratte dall'urna reimmettendo dopo ogni singola estrazione la pallina nell'urna, ovvero in caso di estrazioni indipendenti, allora la v.a. \ che rappresenta il numero di palline rosse estratte possiede una legge Binomiale UÐ8ß HÎR Ñ. 0.20 0.15 0.10 0.05 0.00 0 10 20 30 40 Figura 6.4.1. Funzione di probabilità per la legge Ipergeometrica e Ð8ß Hß R Ñ œ Ð%!ß &!ß #!!Ñß Ð%!ß "!!ß #!!Ñß Ð%!ß "&!ß #!!Ñ (rispettivamente in rosso, verde e blu). 6.5. Legge Multinomiale Nella presente Sezione viene introdotta la generalizzazione dell'esperimento aleatorio analizzato per la legge Binomiale. Più esattamente, si considera un esperimento aleatorio suscettibile di 5 possibili risultati e si ripete 8 volte l'esperimento aleatorio, in modo tale che lo spazio fondamentale prodotto associato è dato da H œ H" ‚ â ‚ H8 con H3 œ Ö=" ß á ß =5 ×. Quindi, H è 12 Principali leggi costituito da 5 8 eventi elementari che coincidono con tutte le possibili sequenze di lunghezza 8 (distinte anche per l'ordine) di =" ß á ß =5 . Si supponga inoltre che gli esperimenti aleatori siano condotti indipendentemente e che l'assegnazione di probabilità su H3 sia la stessa per ogni esperimento aleatorio, ovvero risulti T3 ÐÖ=4 ×Ñ œ :4 − Ó!ß "Ò per ogni 4 œ "ß á ß 5 . Ovviamente, si deve avere 54œ" :4 œ ". In modo simile a quanto visto nella Sezione 6.1, la misura di probabilità prodotto T si ottiene probabilizzando i 5 8 eventi elementari ÖÐ=4" ß á ß =48 Ñ× di H come T ÐÖÐ=4" ß á ß =48 Ñ×Ñ œ 83œ" T3 ÐÖ=43 ×Ñ, dove 43 œ "ß á ß 5 e 3 œ "ß á ß 8. Si consideri il v.v.a. \ À H È W , che ad ogni risultato associa il vettore B œ ÐB" ß á ß B5 ÑT , dove B4 rappresenta il numero di elementi del tipo =4 in ogni Ð=4" ß á ß =48 Ñ − H. Il v.v.a. \ œ Ð\" ß á ß \5 ÑT è evidentemente di tipo discreto e W § ‘5 è tale che W œ ÐB" ß á ß B5 Ñ À B4 − Ö!ß "ß á ß 8×ß B4 œ 8 . 5 4œ" Inoltre, la probabilità di ciascun evento elementare di H in cui si compare B" volte il risultato =" , á , B5 volte il risultato =5 (dove 54œ" B4 œ 8), risulta pari a :"B" á :5B5 . Dal momento che vi sono 8 8x œ 5 B" á B5 4œ" B4 x di tali eventi elementari e che sono distinti per l'ordine in cui gli eventi =" ß á ß =5 si succedono, la f.p.c. del v.v.a. \ è data da 5 8 B4 :\ ÐBÑ œ :\ ÐB" ß á ß B5 Ñ œ :4 "W ÐB" ß á ß B5 Ñ . B" á B5 4œ" Si noti che l'insieme W è contenuto su un iperpiano di ‘5 e che in effetti risulta Ö54œ" \4 œ 8× ;Þ-Þ, ovvero il v.v.a. \ è linearmente degenere. La legge relativa al v.v.a. \ è detta legge Multinomiale di parametri 8 e : œ Ð:" ß á ß :5 ÑT , e si denota usualmente con `Ð8ß :Ñ. Si noti che :\ è in effetti una f.p.c., in quanto per il teorema multinomiale si ha 13 Capitolo 6 5 8 B4 :\ ÐB" ß á ß B5 Ñ œ :4 B" á B5 4œ" ÐB ßáßB Ñ−W ÐB ßáßB Ñ−W " 5 " 5 œ :4 œ " . 5 8 4œ" Si può dimostrare facilmente che la componente marginale \4 ha legge Binomiale UÐ8ß :4 Ñ (si veda l'Esempio 7.4.1). Inoltre, in modo analogo alla legge Binomiale, il v.v.a. \ può essere espresso come somma di 8 v.v.a. indipendenti, ognuno dei quali possiede legge Multinomiale `Ð"ß :Ñ (si veda l'Esempio 7.4.5). Sulla base di questa osservazione, in modo simile a quanto fatto per la legge Binomiale, si può provare che il vettore delle medie del v.v.a. \ è dato da .\ œ 8:, mentre la matrice di varianza-covarianza è data da O\ œ 8ÐdiagÐ:Ñ ::T Ñ , con varianza generalizzata che deve necessariamente risultare detÐO\ Ñ œ !. In modo alternativo, questo risultato può essere ottenuto tenendo presente l'Esempio 7.4.2. Si noti infine che per 5 œ # e : œ Ð:" ß :# ÑT la legge `Ð8ß :Ñ è in effetti “equivalente” alla legge UÐ8ß :" Ñ, dal momento che si ha Ö\# œ 8 \" × ;Þ-Þ, mentre risulta B"8B# œ B8" e :# œ " :" . 6.6. Leggi con parametri di posizione e di scala Si noti innanzitutto che due v.a. \ e ^ , con rispettive f.r. J\ e J^ , sono dette dello stesso tipo se esistono due costanti +ß , − ‘ per cui _ \ œ + ,^ , ovvero quando J^ ÐBÑ œ J\ Ð+ ,BÑ per ogni B − ‘. Si consideri dunque una v.a. \ con f.r. data da B+ J\ ÐBÑ œ K , , dove K è una f.r., mentre + − ‘ e , − Ó!ß ∞Ò. In pratica, per una data f.r. K, la precedente relazione descrive una famiglia di leggi al variare di + e ,. Inoltre, + è 14 Principali leggi detto parametro di posizione e , è detto parametro di scala. Se si consideri la trasformazione ^ œ Ð\ +ÑÎ,, risulta J^ ÐDÑ œ T Ð^ Ÿ DÑ œ T Ð\ Ÿ + ,DÑ œ J\ Ð+ ,DÑ œ KÐDÑ per ogni D − ‘. In altre parole, le due v.a. \ e ^ sono dello stesso tipo. Inoltre, è evidente che la precedente trasformazione consente di ottenere la v.a. ^ con f.r. che non dipende dai parametri + e ,. Per questo motivo si dice che la v.a. ^ possiede la legge ridotta (o legge standardizzata) all'interno della famiglia di leggi. Analogamente, la v.a. ^ viene comunemente detta standardizzata, anche se in modo leggermente improprio. In effetti, questa definizione dovrebbe essere solamente adottata per la trasformazione di standardizzazione, ovvero quando si ha + œ .\ e , œ 5\ . In pratica, risulta quindi conveniente lavorare con la legge ridotta e successivamente considerare la famiglia di leggi che si ottiene al variare dei parametri di posizione e di scala (questo è il motivo per cui negli Esempi 4.1.3 e 4.1.4 sono state considerate le leggi ridotte). Infine, se la legge è caratterizzata da altri parametri oltre a quello di posizione e di scala, questi vengono detti parametri di forma. Se \ è una v.a. assolutamente continua, allora la f.d. di \ è esprimibile attraverso la f.d. della v.a. standardizzata, ovvero 0\ ÐBÑ œ " B+ 0^ , , , mentre per quanto riguarda la f.r. risulta ovviamente B+ J\ ÐBÑ œ J^ . , Si noti infine che il momento di ordine < della v.a. \ è esprimibile attraverso i momenti della v.a. standardizzata ^ , ovvero .\ß< œ EÒ\ < Ó œ EÒÐ+ ,^Ñ< Ó < < 3 < <3 œ E + Ð,^Ñ œ +3 ,<3 .^ß<3 , 3 3 3œ" 3œ" < da cui .\ œ + ,.^ . Analogamente, il momento centrale di ordine < della v.a. \ risulta EÒÐ\ .\ Ñ< Ó œ EÒÐ+ ,^ + ,.^ Ñ< Ó œ ,< EÒÐ^ .^ Ñ< Ó , # da cui 5\ œ ,# 5^# . In particolare, se + œ .\ e , œ 5\ , allora .^ œ ! e 5^ œ ". 15 Capitolo 6 Esempio 6.6.1. La legge introdotta dal matematico tedesco Emil Julius Gumbel (1891-1966) è associata alla f.r. B+ J\ ÐBÑ œ exp exp , , dove + − ‘ e , − Ó!ß ∞Ò. Evidentemente, una v.a. \ che possiede la precedente f.r. è assolutamente continua e ammette d.p. data da 0\ ÐBÑ œ " B+ B+ exp exp . , , , Se si considera la trasformazione ^ œ Ð\ +ÑÎ,, si ha J^ ÐDÑ œ expÐ expÐ DÑÑ , ovvero la f.r. della v.a. standardizzata ^ non dipende dai parametri + e ,. Inoltre, la v.a. ^ ammette d.p. data da 0^ ÐDÑ œ expÐ D expÐ DÑÑ . Si può verificare infine che .^ œ # e 5^# œ 1# Î', dove # œ ∞ lnB expÐ BÑ .B ¶ !Þ&(( ! rappresenta la cosiddetta costante di Eulero-Mascheroni. Si ha dunque # .\ œ + ,# , mentre 5\ œ ,# 1# Î'. 0.4 0.3 0.2 0.1 0.0 4 2 0 2 4 6 Figura 6.6.1. Densità di probabilità per la legge di Gumbel e Ð+ß ,Ñ œ Ð!ß "Ñß Ð#ß "Ñß Ð!ß #Ñ (rispettivamente in rosso, verde e blu). 16 Principali leggi Esempio 6.6.2. L'ingegnere e statistico svedese Ernst Hjalmar Waloddi Weibull (1887-1979) ha introdotto la legge a cui è associata la f.r. B+ 5 J\ ÐBÑ œ " exp "Ó+ß∞Ò ÐBÑ , , dove + − ‘, , − Ó!ß ∞Ò e 5 − Ó!ß ∞Ò. Evidentemente, una v.a. \ che possiede la precedente f.r. è assolutamente continua e ammette d.p. data da 5 B + 5" B+ 5 0\ ÐBÑ œ exp "Ó+ß∞Ò ÐBÑ . , , , Se si considera la trasformazione ^ œ Ð\ +ÑÎ,, si ha J^ ÐDÑ œ Ò" expÐ D 5 ÑÓ"Ó!ß∞Ò ÐDÑ , ovvero la f.r. della v.a. ^ non dipende dai parametri + e ,. Tuttavia, la f.r. continua a dipendere dal parametro 5 , che quindi risulta essere un parametro di forma. Inoltre, la v.a. ^ ammette d.p. data da 0^ ÐDÑ œ 5D 5" expÐ D 5 Ñ"Ó!ß∞Ò ÐDÑ . Si può verificare che .^ œ >Ð" "Î5Ñ e 5^# œ >Ð" #Î5Ñ >Ð" "Î5Ñ# , dove >Ð † Ñ rappresenta la funzione gamma di Eulero (si veda la Sezione 6.8 per una precisa definizione di questa funzione). Si ha .\ œ + ,>Ð" "Î5Ñ, # mentre 5\ œ ,# Ð>Ð" #Î5Ñ >Ð" "Î5Ñ# Ñ. 2.0 1.5 1.0 0.5 0.0 0.0 0.5 1.0 1.5 2.0 Figura 6.6.2. Densità di probabilità per la legge di Weibull e Ð+ß ,ß 5Ñ œ Ð!ß "ß "Î#Ñß Ð!ß "ß #Ñß Ð!ß "ß &Ñ (rispettivamente in rosso, verde e blu). 17 Capitolo 6 6.7. Legge Normale Si consideri la v.a. assolutamente continua \ che ammette d.p. data da ÐB .Ñ# exp 0\ ÐBÑ œ , #15 #5 # " dove . − ‘ e 5 − Ó!ß ∞Ò. La legge associata alla v.a. \ è detta legge Normale di parametri . e 5 , e viene indicata comunemente con a Ð.ß 5 # Ñ. La legge è anche detta Gaussiana in onore del grande matematico tedesco Johann Carl Friedrich Gauss (1777-1855) che ne studiò le applicazioni, anche se in effetti la legge fu introdotta da Abraham de Moivre. Figura 6.7.1. Johann Carl Friedrich Gauss (1777-1855). Se si considera la trasformazione di standardizzazione ^ œ Ð\ .ÑÎ5 , si ha " D# 9ÐDÑ œ 0^ ÐDÑ œ exp , #1 # ovvero la d.p. della v.a. ^ non dipende dai parametri . e 5 , che in effetti sono rispettivamente i parametri di posizione e di scala. Si noti che 9 (e di conseguenza 0\ ) è in effetti una d.p. essendo ∞ ∞ D# D # C# exp .D œ exp .D.C # # ∞ ∞ ∞ ∞ #1 <# œ < exp .<. ) œ #1 , # ! ! ∞ # 18 Principali leggi sulla base della trasformazione in coordinate polari. La legge associata alla v.a. ^ è detta legge Normale ridotta. Si noti che la notazione 9 per la d.p. 0^ è universalmente adottata, così come la notazione D " ?# FÐDÑ œ J^ ÐDÑ œ exp .? #1 ∞ # per la f.r. J^ . Di conseguenza, la f.r. di \ è data da B. J\ ÐBÑ œ F . 5 Dal momento che 9 è simmetrica rispetto all'origine si ha EÒ^Ó œ !, mentre D# VarÒ^Ó œ EÒ^ Ó œ D exp .D œ " . # ∞ ∞ # # Si ha dunque EÒ\Ó œ . e VarÒ\Ó œ 5 # , che rende più chiaro il motivo per cui si adotta la notazione a Ð.ß 5 # Ñ per indicare la legge Normale. 0.8 0.6 0.4 0.2 0.0 4 2 0 2 4 Figura 6.7.2. Densità di probabilità per la legge Normale e Ð.ß 5 Ñ œ Ð "ß "Î#Ñß Ð!ß "Ñß Ð"ß #Ñ (rispettivamente in rosso, verde e blu). 6.8. Legge Gamma Si consideri la v.a. assolutamente continua \ che ammette d.p. data da 19 Capitolo 6 0\ ÐBÑ œ " B + 5" B+ exp "Ó+ß∞Ò ÐBÑ , ,>Ð5Ñ , , dove + − ‘ e , − Ó!ß ∞Ò, mentre 5 − Ó!ß ∞Ò. La legge associata alla v.a. \ è detta legge Gamma di parametri +, , e 5 , e viene indicata comunemente con ZÐ+ß ,ß 5Ñ. Se si considera la trasformazione di standardizzazione ^ œ Ð\ +ÑÎ,, si ha 0^ ÐDÑ œ " D 5" expÐ DÑ"Ó!ß∞Ò ÐDÑ , >Ð5Ñ ovvero la d.p. della v.a. ^ non dipende dai parametri + e , , che rappresentano rispettivamente i parametri di posizione e di scala, mentre 5 è dunque un parametro di forma. La legge associata alla v.a. ^ è detta legge Gamma ridotta. Si noti che 0^ (e di conseguenza 0\ ) è in effetti una d.p., essendo >Ð5Ñ œ ∞ ?5" expÐ ?Ñ .? ! la nota funzione Gamma di Eulero (da cui ovviamente prende il nome anche la legge). La funzione Gamma è stata introdotta dal grande matematico svizzero Leonhard Euler (1707-1783), che viene comunemente italianizzato in Eulero. La f.r. relativa alla v.a. ^ è data da J^ ÐDÑ œ " # Ð5ß DÑ"Ó!ß∞Ò ÐDÑ , >Ð5Ñ dove #Ð5ß DÑ œ D ?5" expÐ ?Ñ .? ! rappresenta la cosiddetta funzione Gamma incompleta. Di conseguenza, la f.r. di \ è data da J\ ÐBÑ œ " B+ #5ß "Ó+ß∞Ò ÐBÑ . >Ð5Ñ , Dal momento che risulta >Ð5 "Ñ œ 5 >Ð5Ñ, si ha 20 Principali leggi ∞ " >Ð5 "Ñ 5 EÒ^Ó œ œ5, D expÐ DÑ .D œ >Ð5Ñ ! >Ð5Ñ e ∞ " >Ð5 #Ñ 5" EÒ^ Ó œ expÐ DÑ .D œ œ 5Ð5 "Ñ , D >Ð5Ñ ! >Ð5Ñ # da cui si ha anche VarÒ\Ó œ 5 . Di conseguenza, si ha anche EÒ\Ó œ + ,5 e VarÒ\Ó œ ,# 5 . 1.0 0.8 0.6 0.4 0.2 0.0 0 1 2 3 4 Figura 6.8.1. Densità di probabilità per la legge Gamma e Ð+ß ,ß 5Ñ œ Ð!ß "ß "Ñß Ð!ß "ß #Ñß Ð!ß "ß $Ñ (rispettivamente in rosso, verde e blu). Si noti che la legge Gamma contiene numerosi casi particolari di rilevante importanza sia pratica che teorica. Ad esempio, per 5 œ " si ottiene la cosiddetta legge Esponenziale, e in questo caso la v.a. \ ammette d.p. data da 0\ ÐBÑ œ con relativa f.d. data da " B+ exp "Ó+ß∞Ò ÐBÑ , , , J\ ÐBÑ œ " exp B+ "Ó+ß∞Ò ÐBÑ . , Inoltre, per + œ ! e , œ # e se 5 œ 8Î# dove 8 œ "ß #ß á , si ottiene la legge Chi-quadrato con 8 gradi di libertà, che viene indicata di solito con ;#8 . In questo caso la v.a. \ ammette d.p. data da 21 Capitolo 6 0\ ÐBÑ œ " B 8Î#" B exp "Ó!ß∞Ò ÐBÑ . #>Ð8Î#Ñ # # Si ha inoltre EÒ\Ó œ 8 e VarÒ\Ó œ #8. Tenendo presente l'Esempio 3.7.3 e dal momento che >Ð"Î#Ñ œ 1, è immediato dimostrare che il quadrato una v.a. \ con legge Normale ridotta a Ð!ß "Ñ possiede legge Chi-quadrato ;#" . Inoltre, la v.a. \ con legge Chi-quadrato con 8 gradi di libertà si può esprimere come una somma dei quadrati di 8 v.a. indipendenti \3 caratterizzate dalla legge Normale ridotta a Ð!ß "Ñ (si veda l'Esempio 7.3.4). 6.9. Legge Beta Si consideri la v.a. assolutamente continua \ che ammette d.p. data da 0\ ÐBÑ œ >Ðα " Ñ B + α" B + " " " "Ó+ß+,Ò ÐBÑ , ,>ÐαÑ>Ð" Ñ , , dove + − ‘ e , − Ó!ß ∞Ò, mentre αß " − Ó!ß ∞Ò. La legge associata alla v.a. \ è detta legge Beta di parametri +, , , α e " , e viene indicata comunemente con UX Ð+ß ,ß αß " Ñ. Se si considera la trasformazione di standardizzazione ^ œ Ð\ +ÑÎ,, si ha 0^ ÐDÑ œ >Ðα " Ñ α" D Ð" DÑ" " "Ó!ß"Ò ÐDÑ , >ÐαÑ>Ð" Ñ ovvero la d.p. della v.a. ^ non dipende dai parametri + e , , che rappresentano rispettivamente i parametri di posizione e di scala, mentre α e " sono dunque parametri di forma. La legge associata alla v.a. ^ è detta legge Beta ridotta. Si noti che 0^ (e di conseguenza 0\ ) è in effetti una d.p., essendo " >ÐαÑ>Ð" Ñ FÐαß " Ñ œ œ ?α" Ð" ?Ñ" " .? >Ð α " Ñ ! la funzione Beta di Eulero (da cui ovviamente prende il nome anche la legge). La d.p. 0^ (e di conseguenza la d.p. 0\ ) può assumere svariate forme al variare di α e " . In particolare, per α œ " , 0^ è simmetrica, per αß " − Ó"ß ∞Ò, 0^ è campanulare, per αß " − Ó!ß "Ò, 0^ è a forma di U, mentre 0^ è crescente o decrescente se α − Ó!ß "Ò o " − Ó!ß "Ò. La f.r. relativa alla v.a. ^ è data da 22 Principali leggi J^ ÐDÑ œ MD Ðαß " Ñ"Ó!ß"Ò ÐDÑ , dove >Ðα " Ñ D α" " " MD Ðαß " Ñ œ .? ? Ð" ?Ñ >ÐαÑ>Ð" Ñ ! rappresenta la cosiddetta funzione Beta incompleta regolarizzata. Dunque, la f.r. di \ è data da J\ ÐBÑ œ MÐB+ÑÎ, Ðαß " Ñ"Ó+ß+,Ò ÐBÑ . Si noti che nel caso particolare in cui α œ " œ ", la legge associata alla v.a. \ è detta legge Uniforme su Ó+ß + ,Ò, e quindi la v.a. \ ammette d.p. data da 0\ ÐBÑ œ " "Ó+ß+,Ò ÐBÑ , , con corrispondente f.r. data da J\ ÐBÑ œ B "Ó+ß+,Ò ÐBÑ "Ò+,ß∞Ò ÐBÑ . , Dal momento che >Ð5 "Ñ œ 5 >Ð5Ñ, si ha >Ðα " Ñ " α α " " EÒ^Ó œ .D œ , D Ð" DÑ > Ð α Ñ> Ð" Ñ ! α" e >Ðα " Ñ " α" αÐα "Ñ " " EÒ^ Ó œ .D œ , D Ð" DÑ > Ð α Ñ> Ð" Ñ ! Ðα " ÑÐα " "Ñ # da cui si ha anche VarÒ^Ó œ α" . Ðα " Ñ# Ðα " "Ñ La media e la varianza della v.a. \ sono quindi date da α EÒ\Ó œ + , , α" mentre 23 Capitolo 6 VarÒ\Ó œ ,# α" . Ðα " Ñ# Ðα " "Ñ 2.5 2.0 1.5 1.0 0.5 0.0 0.0 0.2 0.4 0.6 0.8 1.0 Figura 6.9.1. Densità di probabilità per la legge Beta e Ð+ß ,ß αß " Ñ œ Ð!ß "ß %ß #Ñß Ð!ß "ß #ß #Ñß Ð!ß "ß #ß %Ñ (rispettivamente in rosso, verde e blu). 3.0 2.5 2.0 1.5 1.0 0.5 0.0 0.0 0.2 0.4 0.6 0.8 1.0 Figura 6.9.2. Densità di probabilità per la legge Beta e Ð+ß ,ß αß " Ñ œ Ð!ß "ß "Î#ß #Ñß Ð!ß "ß "Î#ß "Î#Ñß Ð!ß "ß #ß "Î#Ñ (rispettivamente in rosso, verde e blu). La legge Beta nella forma ridotta può essere ottenuta considerando la v.a. data dal rapporto ^" ÎÐ^" ^# Ñ, dove ^" e ^# sono due v.a. indipendenti con legge Gamma ridotta, rispettivamente di parametri α e " . Si consideri dunque la 24 Principali leggi trasformata Ð]" ß ]# ÑT œ 1Ð^" ß ^# Ñ, dove 1ÐD" ß D# Ñ œ ÐD" ÎÐD" D# Ñß D# ÑT . Poichè 1" ÐC" ß C# Ñ œ ÐC" C# ÎÐ" C" Ñß C# ÑT , allora lN Ð1" ÐC" ß C# ÑÑl œ lC# lÎÐ" C" Ñ# , e quindi 0Ð]" ß]# Ñ ÐCÑ œ 0Ð^" ß^# Ñ C" C# lC# l ß C# . " C" Ð" C" Ñ# La d.p.m. della componente ]" œ ^" ÎÐ^" ^# Ñ è dunque data da 0]" ÐC" Ñ œ C" C# lC# l ß C# .C# # " C Ð" C Ñ " " ∞ ∞ C" C# lC# l œ 0 ^" 0 ÐC Ñ .C# , ^# # # " C Ð" C Ñ " " ∞ ∞ 0Ð^" ß^# Ñ ovvero sostituendo opportunamente " C"α" Ð" C" Ñα" "Ó!ß"Ò ÐC" Ñ ‚ > Ð α Ñ> Ð" Ñ ∞ C# ‚ C#α" " exp .C# " C " ! >Ðα " Ñ α" œ C" Ð" C" Ñ" " "Ó!ß"Ò ÐC" Ñ , > Ð α Ñ> Ð" Ñ 0]" ÐC" Ñ œ che risulta essere appunto la f.d. relativa ad una legge Beta ridotta di parametri α e ". 6.10. Legge > di Student e J di Snedecor Le cosiddette leggi > di Student e J di Snedecor sono frequentemente utilizzate nell'ambito della statistica inferenziale classica. Si consideri le v.a. indipendenti \" e \# rispettivamente con legge ;#8" e ;8# # e la v.a. \œ \" Î8" 8# \" œ . \# Î8# 8" \# Risulta evidente che la v.a. \ è assolutamente continua. Al fine di ottenere la legge della v.a. \ , si considera innanzitutto la v.a. ] œ \" Î\# . Tenendo presente l'Esempio 3.7.5, la v.a. ] ammette d.p. data da 25 Capitolo 6 0] ÐCÑ œ ∞ ∞ 0\" ÐBÑ0\# ÐBCÑlBl .B " C8" Î#" "Ó!ß∞Ò ÐCÑ ‚ Ð8 8 ÑÎ# # " # >Ð8" Î#Ñ>Ð8# Î#Ñ ∞ Ð" CÑB ‚ BÐ8" 8# ÑÎ#" exp .B # ! >ÐÐ8" 8# ÑÎ#Ñ 8" Î#" œ C Ð" CÑÐ8" 8# ÑÎ# "Ó!ß∞Ò ÐCÑ . >Ð8" Î#Ñ>Ð8# Î#Ñ œ Dunque, la v.a. \ œ Ð8# Î8" Ñ] ammette d.p. data da >ÐÐ8" 8# ÑÎ#Ñ 8" 0\ ÐBÑ œ >Ð8" Î#Ñ>Ð8# Î#Ñ 8# 8" Î# 8" " B 8# Ð8" 8# ÑÎ# B 8" Î#" "Ó!ß∞Ò ÐCÑ . La legge associata alla v.a. \ è detta legge J di Snedecor con 8" e 8# gradi di libertà, e viene indicata comunemente con J8" ß8# . La legge dovrebbe essere più correttamente denominata di Fisher-Snedecor, dal momento che fu inizialmente introdotta dal grande statistico e genetista inglese Ronald Aylmer Fisher (18901962) e poi applicata dal matematico statunitense George Waddel Snedecor (1881-1974). Figura 6.9.1. Ronald Aylmer Fisher (1890-1962). Si tenga presente che, se 8# œ $ß %ß á , si ha 26 Principali leggi EÒ\#" Ó ∞ " B 8# Î## B œ exp .B %>Ð8# Î#Ñ ! # # >Ð8# Î# "Ñ " œ œ , #>Ð8# Î#Ñ 8# # mentre, se 8# œ %ß &ß á , si ha EÒ\## Ó ∞ " B 8# Î#$ B œ exp .B )>Ð8# Î#Ñ ! # # >Ð8# Î# #Ñ " œ œ . #>Ð8# Î#Ñ Ð8# #ÑÐ8# %Ñ Sulla base della definizione della v.a. \ , dal momento che \" e \# sono indipendenti, la media della v.a. \ è data da 8# 8# EÒ\Ó œ EÒ\" ÓEÒ\#" Ó œ , 8" 8# # se 8# œ $ß %ß á , e 8## #8## Ð8" 8# #Ñ # # # VarÒ\Ó œ # EÒ\" ÓEÒ\# Ó EÒ\Ó œ , 8" Ð8# #Ñ# Ð8# %Ñ 8" se 8# œ %ß &ß á . Dunque, se 8# œ "ß # la media non è finita, mentre se 8# œ "ß #ß $ß % la varianza non è finita. 0.8 0.6 0.4 0.2 0.0 0.0 0.5 1.0 1.5 2.0 2.5 3.0 Figura 6.10.1. Densità di probabilità per la legge J di Snedecor e Ð8" ß 8# Ñ œ Ð&ß &Ñß Ð(ß "!Ñß Ð"&ß "!Ñ (rispettivamente in rosso, verde e blu). 27 Capitolo 6 In secondo luogo, si consideri le v.a. indipendenti \" e \# rispettivamente con legge a Ð!ß "Ñ e legge ;#8 e la v.a. \œ \" . \# Î8 È evidente che la v.a. \ è assolutamente continua. Al fine di ottenere la legge della v.a. \ , si noti che la v.a. ] œ \"# ÎÐ\# Î8Ñ possiede una legge J"ß8 , dal momento che la v.a. \"# possiede una legge ;"# . Dunque, si ha 0] ÐCÑ œ >ÐÐ8 "ÑÎ#Ñ "Î# C Ð8"ÑÎ# C "Ó!ß∞Ò ÐCÑ , " 81>Ð8Î#Ñ 8 _ poichè >Ð"Î#Ñ œ 1. Inoltre, tenendo presente che \" œ \" e la discussione successiva al Teorema 3.7.1, si ha >ÐÐ8 "ÑÎ#Ñ B# 0] ÐBÑ œ " 81>Ð8Î#Ñ 8 Ð8"ÑÎ# . La legge associata alla v.a. \ è detta legge > di Student con 8 gradi di libertà, e viene indicata comunemente con >8 . La distribuzione venne introdotta dallo statistico inglese William Sealy Gosset (1876-1937), che pubblicò il risultato sotto lo pseudonimo di “Student” dal momento che la birreria presso la quale era impiegato vietava ai propri dipendenti di pubblicare articoli, affinché questi non divulgassero segreti di produzione. Si noti inoltre che per 8 œ " si ottiene la legge di Cauchy (si veda Esempio 4.1.4). Tenendo presente la definizione della v.a. \ , dal momento che \" e \# sono "Î# indipendenti e che EÒ\" Ó œ ! che EÒ\# Ó è finito se 8 œ #ß $ß á , la media della v.a. \ è data da EÒ\Ó œ 8EÒ\" ÓEÒ\# "Î# Óœ!, se 8 œ #ß $ß á . Inoltre, dal momento che si ha EÒ\"# Ó œ " e per quanto visto in precedenza in questa Sezione si ha EÒ\#" Ó œ "ÎÐ8 #Ñ se 8 œ $ß %ß á , allora VarÒ\Ó œ EÒ\ # Ó œ 8EÒ\"# ÓEÒ\#" Ó œ 8 , 8# se 8 œ $ß %ß á . Dunque, se 8 œ " la media non è definita, mentre se 8 œ "ß # la varianza non è definita. 28 Principali leggi 0.4 0.3 0.2 0.1 0.0 3 2 1 0 1 2 3 Figura 6.10.2. Densità di probabilità per la legge > di Student e 8 œ #ß &ß #! (rispettivamente in rosso, verde e blu). 6.11. Legge Normale Multivariata Si consideri il v.v.a. assolutamente continuo \ œ Ð\" ß á ß \5 ÑT che ammette d.p.c. data da 0\ ÐBÑ œ detÐ#1O\ Ñ"Î# exp " ÐB .\ ÑT O\" ÐB .\ Ñ , # dove B œ ÐB" ß á ß B5 ÑT , mentre .\ − ‘5 rappresenta il vettore delle medie e O\ è la matrice di varianza-covarianza, che si assume definita positiva. La legge associata al v.v.a. \ è detta legge Normale Multivariata di parametri .\ e O\ , e viene indicata comunemente con a5 Ð.\ ß O\ Ñ. Si noti che 0\ è in effetti una d.p.c., in quanto si ha "Î# 0\ ÐBÑ .B œ detÐO\ Ñ exp ‘5 ‘5 5 " T C C .C # œ detÐO\ Ñ"Î# exp 4œ" ‘5 " # C .C # 4 œ Ð#1Ñ5Î# detÐO\ Ñ"Î# œ detÐ#1O\ Ñ"Î# , "Î# considerando il cambio di variabile C œ O\ ÐB .\ Ñ, dove C œ ÐC" ß á ß C5 ÑT , con Jacobiano è dato da detÐO\ Ñ"Î# . Inoltre, la d.p.c. risulta costante per tutti i 29 Capitolo 6 vettori B che appartengono al luogo geometrico ÐB .\ ÑT O\" ÐB .\ Ñ œ - , con - − Ó!ß ∞Ò, ovvero è costante su un iper-ellissoide. Questo iper-ellissoide è centrato nel punto .\ , con assi le cui direzioni sono determinate dalle direzioni degli autovettori di O\ e le cui lunghezze sono pari a #-4 - , dove -4 rappresenta il 4-esimo autovalore di O\ , con 4 œ "ß á ß 5 . Se \ è un v.v.a. con legge Normale Multivariata, ogni scelta Ð4" ß á ß 42 Ñ di 2 v.a. Ð\4" ß á ß \42 ÑT con 2 œ "ß á ß 5 ", possiede ancora una legge Normale Multivariata con vettore delle medie e matrice di varianza-covarianza costituiti rispettivamente dalle medie e dalle varianze e covarianze delle v.a. marginali che lo compongono (si veda l'Esempio 7.3.1). Da questo segue ovviamente che ogni # componente marginale \4 possiede legge Normale a Ð.\4 ß 5\ Ñ. Risulta inoltre 4 valido per una legge Normale Multivariata il seguente teorema. Teorema 6.11.1. Il v.v.a. \ œ Ð\" ß á ß \5 ÑT con legge a5 Ð.\ ß O\ Ñ possiede componenti reciprocamente indipendenti se e solo se O\ è una matrice diagonale. Dimostrazione. Se \ possiede componenti marginali indipendenti la dimostrazione è immediata in quanto l'indipendenza implica assenza di correlazione e quindi 5\3 \4 œ ! per ogni 3 Á 4 œ "ß á ß 5 . Inversamente, se # 5\3 \4 œ ! per ogni 3 Á 4 œ "ß á ß 5 , allora risulta detÐ#1O\ Ñ œ 54œ" #15\ e 4 # # O\" œ diagÐ5\ ß á ß 5\ Ñ , da cui " 5 ÐB .\ Ñ T ÐB4 .\4 Ñ# .\ Ñ œ . # 5 \4 4œ" 5 O\" ÐB Sostituendo queste espressioni nella d.p.c. del v.v.a. \ si ottiene infine 0\ ÐBÑ œ 54œ" œ 5 4œ" 5 ÐB4 .\4 Ñ# " exp # #15\ # 5\ 4œ" 4 4 #15\ " 4 5 ÐB4 .\4 Ñ# exp œ 0\4 ÐB4 Ñ , # # 5 \4 4œ" che è quanto si voleva dimostrare. In pratica il Teorema 6.11.1 afferma che nel caso di v.v.a. con legge Normale Multivariata, l'assenza di correlazione fra le v.a. marginali è condizione sufficiente per l'indipendenza delle stesse. 30 Principali leggi 6.12. Legge di Dirichlet In questa Sezione viene introdotta l'estensione multivariata della legge Beta ridotta. Si consideri il v.v.a. assolutamente continuo ^ œ Ð^" ß á ß ^5 ÑT che ammette d.p.c. data da 0^ ÐDÑ œ 0^ ÐD" ß á ß D5 Ñ œ >Ðα ! Ñ 54œ" >Ðα4 Ñ D4α4 " "W ÐD" ß á ß D5 Ñ , 5 4œ" dove D œ ÐD" ß á ß D5 ÑT , α œ Ðα" ß á ß α5 ÑT è un vettore di parametri per cui α4 − Ó!ß ∞Ò, 4 œ "ß á ß 5 , e α! œ 54œ" α4 , mentre W œ ÐD" ß á ß D5 Ñ À D4 − Ó!ß "Òß D4 œ " . 5 4œ" Si noti che l'insieme W è contenuto su un iperpiano di ‘5 e che in effetti risulta Ö54œ" ^4 œ "× ;Þ-Þ, ovvero il v.v.a. ^ è linearmente degenere. La legge associata al v.v.a. ^ è detta legge di Dirichlet di parametro α, e viene indicata comunemente con WÐαÑ. La legge prende nome dal matematico tedesco Johann Peter Dirichlet (1805-1859). Inoltre, 0^ è in effetti una d.p.c., essendo 54œ" >Ðα4 Ñ >Ðα ! Ñ α " œ D4 4 .D" á .D5 5 W 4œ" la funzione Beta multinomiale. Al fine di determinare le proprietà del v.v.a. \ è conveniente estendere un risultato visto in precedenza per la legge Beta ridotta. Sia \ œ Ð\" ß á ß \5 ÑT un v.v.a. con componenti marginali indipendenti in modo tale che \4 possiede legge Z Ð!ß "ß α4 Ñ e si consideri la trasformata ] œ Ð]" ß á ß ]5 ÑT œ 1Ð\Ñ, dove 1ÐBÑ œ B" 54œ" B4 B5" ß B4 , 5 4œ" B4 4œ" 5 ßáß T e quindi 1" ÐCÑ œ ÐC5 C" ß á ß C5 C5" ß C5 ÑT , da cui lN Ð1" ÐCÑÑl œ C55" . Dal momento che 31 Capitolo 6 0\ ÐB" ß á ß B5 Ñ œ 5 4œ" " α " B4 4 expÐ B4 Ñ"Ó!ß∞Ò ÐB4 Ñ , > Ðα 4 Ñ allora si ha 0] ÐC" ß á ß C5 Ñ œ C4α4 " " C4 5 4œ" >Ðα4 Ñ 4œ" 4œ" ‚ C5α! " expÐ C5 Ñ"Ó!ß∞Ò ÐC5 Ñ , 5" " 5" α5 " "X ÐC" ß á ß C5" Ñ dove X œ ÐC" ß á ß C5" Ñ À C4 − Ó!ß "Òß C4 Ÿ " . 5" 4œ" Tenendo presente che la somma di 5 v.c. indipendenti con legge Gamma Z Ð!ß "ß α4 Ñ si distribuisce con legge Gamma del tipo Z Ð!ß "ß α! Ñ (si veda l'Esempio 7.3.3), allora se ] ‡ œ Ð]" ß á ß ]5" ÑT si ha 0 ] ‡ ÐC" ß á ß C5" Ñ œ " 54œ" >Ðα4 Ñ ‚ ! œ ∞ C4α4 " " C4 5" 4œ" 5" α5 " "X ÐC" ß á ß C5" Ñ 4œ" C5α! " expÐ C5 Ñ .C5 > Ðα ! Ñ C4α4 " " C4 5" 54œ" >Ðα4 Ñ 4œ" 5 " 4œ" α5 " "X ÐC" ß á ß C5" Ñ . T Il v.v.a linearmente degenere Ð^" ß á ß ^5 ÑT œ Ð]" ß á ß ]5" ß " 5" 4œ" ]4 Ñ possiede dunque una legge di Dirichlet WÐαÑ. Dal precedente risultato e tenendo presente quanto detto nella Sezione 6.9, allora la componente marginale ^4 del v.v.a. ^ possiede una legge del tipo UX Ðα4 ß α! α4 Ñ. Inoltre, ogni scelta Ð4" ß á ß 42 Ñ di 2 v.a. Ð^4" ß á ß ^42 ÑT con 2 œ #ß á ß 5 ", possiede ancora una legge di Dirichlet. Da queste considerazioni si può provare che il vettore delle medie del v.v.a. \ è dato da .\ œ Ð"Îα! Ñα, mentre la matrice di varianza-covarianza è data da 32 Principali leggi O\ œ " Ðα! diagÐαÑ ααT Ñ , # α! Ðα! "Ñ con varianza generalizzata che deve necessariamente risultare detÐO\ Ñ œ !. Si noti infine che per 5 œ # e α œ Ðα" ß α# ÑT la legge WÐαÑ è in effetti “equivalente” alla legge UX Ðα" ß α# Ñ, dal momento che si ha Ö\# œ " \" × ;Þ-Þ 6.13. Riferimenti bibliografici Una trattazione enciclopedica delle leggi di probabilità e delle loro applicazioni nelle varie discipline è contenuta nella serie di volumi di Johnson et al. (2005), Johnson et al. (1994, 1995, 1997) e Kotz et al. (2000). Inoltre, una esposizione più sintetica di questi argomenti è data in Forbes et al. (2011). Per quanto riguarda le leggi relative a variabili aleatorie discrete, si dovrebbero consultare anche i testi di Charalambides (2005) e Johnson e Kotz (1977). Capitolo 7 Funzioni caratteristiche e generatrici 7.1. Funzioni caratteristiche La funzione caratteristica di una v.a. è una particolare funzione complessa, le cui proprietà analitiche sono molto utili per ottenere leggi di probabilità o momenti di v.a. trasformate. Nel prossimo Capitolo, la funzione caratteristica sarà anche centrale nello studio del comportamento asintotico di successioni di v.a. Prima di introdurre la definizione di funzione caratteristica è conveniente estendere il concetto di v.a. all'insieme dei numeri complessi. Per quanto riguarda la notazione adottata in questo Capitolo, i œ 1 rappresenta come al solito l'unità immaginaria. Inoltre, dato il numero complesso - œ + i,, allora la parte reale e immaginaria di - sono rispettivamente denotate con dÐ-Ñ œ + e eÐ-Ñ œ ,, mentre il modulo di - è dato da l-l œ +# ,# . Definizione 7.1.1. Se ÐHß Y ß T Ñ è uno spazio probabilizzato, un'applicazione \ À H È ‚ è detta variabile aleatoria complessa se dÐ\Ñ e eÐ\Ñ sono variabili aleatorie. Se \ è una v.a. complessa, allora il relativo valore atteso è definito come EÒ\Ó œ EÒdÐ\ÑÓ i EÒeÐ\ÑÓ . Affinchè il valore atteso di una v.a. complessa esista finito è sufficiente che il valore atteso EÒ|\ |Ó œ EÒdÐ\Ñ# eÐ\Ñ# Ó esista finito. In questo caso, è facile verificare che lEÒ\Ól Ÿ EÒl\lÓ. Inoltre, si può verificare che le proprietà del valore atteso di una v.a. complessa sono simili a quelle di una v.a. reale e in particolare risulta EÒ-\Ó œ - EÒ\Ó per - − ‚. La definizione formale di funzione caratteristica è quindi la seguente. 2 Funzioni caratteristiche e generatrici Definizione 7.1.2. Data la v.a. \ definita sullo spazio probabilizzato ÐHß Y ß T Ñ, si dice funzione caratteristica (f.c.) della v.a. \ la funzione :\ À ‘ È ‚ :\ Ð>Ñ œ EÒcosÐ>\ÑÓ i EÒsinÐ>\ÑÓ œ EÒexpÐi>\ÑÓ , dove > − ‘. Nel linguaggio della Teoria della Misura, la f.c. è in effetti la trasformata di Fourier (a meno di una costante moltiplicativa). Tenendo presente quanto detto nella Sezione 4.1, se la v.a. \ è discreta a valori su insieme numerabile W con f.p. :\ , la funzione caratteristica si riduce a :\ Ð>Ñ œ cosÐ>BÑ:\ ÐBÑ i sinÐ>BÑ:\ ÐBÑ œ expÐi>\Ñ:\ ÐBÑ , B−W B−W B−W mentre, se la v.a. assolutamente continua \ ammette d.p. 0\ , la funzione caratteristica si riduce a :\ Ð>Ñ œ ∞ ∞ ∞ œ cosÐ>BÑ0\ ÐBÑ .B i ∞ sinÐ>BÑ0\ ÐBÑ .B ∞ expÐi>BÑ0\ ÐBÑ .B . ∞ Esempio 7.1.1. Si consideri la v.a. \ con legge di Bernoulli U Ð"ß :Ñ. In questo caso, la funzione caratteristica della v.a. \ è data da :\ Ð>Ñ œ cosÐ>BÑ: ; " B "B Bœ! i sinÐ>BÑ:B ; "B " Bœ! œ ; : cosÐ>Ñ i: sinÐ>Ñ œ ; : expÐi>BÑ . Se si considera più in generale la v.a. \ con legge Binomiale U Ð8ß :Ñ, tenendo presente l'espressione del binomio di Newton in ‚, si ha 8 :\ Ð>Ñ œ expÐi>BÑ :B ; 8B B Bœ! 8 8 œ Ð: expÐi>ÑÑB ; 8B œ Ð; : expÐi>ÑÑ8 . B Bœ! 8 3 Capitolo 7 Esempio 7.1.2. Si consideri la v.a. \ con legge di Poisson c Ð-Ñ. Tenendo presente l'espressione della serie esponenziale in ‚, si ha -B :\ Ð>Ñ œ expÐ -Ñ expÐi>BÑ Bx Bœ! ∞ Ð- expÐi>ÑÑB œ expÐ -Ñ œ expÐ-ÐexpÐi>Ñ "ÑÑ . Bx Bœ! ∞ Esempio 7.1.3. Si consideri la v.a. \ con legge Binomiale Negativa Ua Ð5ß :Ñ. Tenendo presente l'espressione della serie binomiale negativa in ‚, si ha :\ Ð>Ñ œ : expÐi>BÑ ∞ 5 Bœ! ∞ 5B" B ; 5" 5B" : B œ : Ð; expÐi>ÑÑ œ . 5 " " ; exp Ð i >Ñ Bœ! 5 5 Esempio 7.1.4. Si consideri la v.a. ^ con legge Normale ridotta a Ð!ß "Ñ. Tenendo presente che ^ ammette una d.p. simmetrica rispetto all'origine, si ha ∞ " D# EÒsinÐ>^ÑÓ œ sinÐ>DÑ exp .D œ ! , #1 ∞ # e quindi ∞ " D# ># :^ Ð>Ñ œ EÒcosÐ>^ÑÓ œ cosÐ>DÑ exp .D œ exp . #1 ∞ # # In questo caso, :^ Ð>Ñ è una funzione puramente reale. In generale, risulta immediato verificare che la f.c. è una funzione puramente reale se una v.a. assolutamente continua \ ammette d.p. simmetrica rispetto all'origine. La stessa affermazione è vera se una v.a. discreta \ possiede f.p. simmetrica rispetto all'origine. Esempio 7.1.5. Si consideri la v.a. ^ con legge Esponenziale ridotta Z Ð!ß "ß "Ñ. Dal momento che 4 Funzioni caratteristiche e generatrici EÒcosÐ>^ÑÓ œ ∞ cosÐ>DÑ expÐ DÑ .D œ ! " " ># e EÒsinÐ>^ÑÓ œ ∞ sinÐ>DÑ expÐ DÑ .D œ ! > , " ># allora si ha :^ Ð>Ñ œ " > i œ Ð" i>Ñ" . # # "> "> Più in generale, se la v.a. ^ possiede legge Gamma ridotta Z Ð!ß "ß 5Ñ, tenendo presente le espressioni delle serie esponenziale e binomiale negativa in ‚, si ha ∞ " 5" expÐ DÑ .D :^ Ð>Ñ œ expÐi>DÑ D >Ð5Ñ ! ∞ ∞ " Ði>DÑ8 5" expÐ DÑ .D œ D >Ð5Ñ ! 8œ! 8x " ∞ Ði>Ñ8 ∞ 85" expÐ DÑ .D œ D >Ð5Ñ 8œ! 8x ! ∞ >Ð8 5Ñ 85" 8 8 5 œ Ði>Ñ œ Ði>Ñ œ Ð" i>Ñ . 8x>Ð5Ñ 8 8œ! 8œ! ∞ Ovviamente, l'espressione coincide con quella ottenuta per la legge Esponenziale ridotta se 5 œ ". Di seguito vengono considerate una serie di proprietà della f.c., che riguardano l'esistenza, la continuità uniforme della f.c. e l'espressione della f.c. di particolari v.a. trasformate. Teorema 7.1.2. Se \ è una v.a. definita sullo spazio probabilizzato ÐHß Y ß T Ñ con f.c. :\ , allora l:\ Ð>Ñl Ÿ " per ogni > − ‘ e in particolare :\ Ð!Ñ œ ". Dimostrazione. Tenendo presente che per ogni B − ‘ si ha lexpÐi>BÑl œ |cosÐ>BÑ i sinÐ>BÑl œ ÐcosÐ>BÑ# sinÐ>BÑ# Ñ"Î# œ " , allora 5 Capitolo 7 l:\ Ð>Ñl œ |EÒexpÐi>\ÑÓ| Ÿ EÒlexpÐi>\ÑlÓ œ " . Inoltre, si ha l:\ Ð!Ñl œ .T œ " . Teorema 7.1.3. Se \ è una v.a. definita sullo spazio probabilizzato ÐHß Y ß T Ñ con f.c. :\ , allora :\ è uniformemente continua su ‘. Dimostrazione. Per 2 − ‘ si ha l:\ Ð> 2Ñ :\ Ð>Ñl œ lEÒexpÐi>\ÑÐexpÐi2\Ñ "ÑÓl Ÿ EÒlexpÐi>\ÑÐexpÐi2\Ñ "ÑlÓ œ EÒlexpÐi>\Ñl † lÐexpÐi2\Ñ "ÑlÓ œ EÒlÐexpÐi2\Ñ "ÑlÓ , essendo lexpÐi>\Ñl œ ". Dal momento che si hanno le disuguaglianze lexpÐi2BÑ "l Ÿ # e lexpÐi2BÑ "l Ÿ l2Bl per ogni B − ‘, per + − Ó!ß ∞Ò risulta EÒlÐexpÐi2\Ñ "ÑlÓ œ EÒlÐexpÐi2\Ñ "Ñl"Ò!ß+Ó Ðl\lÑÓ EÒlÐexpÐi2\Ñ "Ñl"Ó+ß∞Ò Ðl\lÑÓ Ÿ EÒl2\l"Ò!ß+Ó Ðl\lÑÓ #EÒ"Ó+ß∞Ò Ðl\lÑÓ Ÿ l2lEÒl\l"Ò!ß+Ó Ðl\ lÑÓ #T Ðl\l +Ñ Ÿ +l2l #T Ðl\l +Ñ . Dunque, fissato & !, se 2 e + sono scelti in modo tale che +l2l &Î# e T Ðl\l +Ñ &Î%, si ha l:\ Ð> 2Ñ :\ Ð>Ñl Ÿ +l2l #T Ðl\l +Ñ & , da cui segue la continuità uniforme, dal momento che & non dipende da >. Teorema 7.1.4. Se \ è una v.a. definita sullo spazio probabilizzato ÐHß Y ß T Ñ con f.c. :\ , allora la f.c. della v.a. trasformata ] œ + ,\ , dove +ß , − ‘, è data da :] Ð>Ñ œ expÐi+>Ñ:\ Ð,>Ñ . Dimostrazione. Si ha 6 Funzioni caratteristiche e generatrici :] Ð>Ñ œ EÒexpÐi>Ð+ ,\ÑÑÓ œ expÐi+>ÑEÒexpÐi,>\ÑÓ œ expÐi+>Ñ:\ Ð,>Ñ , che è quanto si voleva dimostrare. Esempio 7.1.6. Si consideri la v.a. \ con legge Normale a Ð.ß 5 # Ñ. Tenendo presente l'Esempio 7.1.4, dal momento che \ œ . 5 ^ , si ha 5 # ># :\ Ð>Ñ œ expÐi.>Ñ:^ Ð5 >Ñ œ expi.> . # Esempio 7.1.7. Si consideri la v.a. \ con legge Gamma Z Ð+ß ,ß 5Ñ. Tenendo presente l'Esempio 7.1.5, dal momento che \ œ + ,^ , si ha :\ Ð>Ñ œ expÐi+>Ñ:^ Ð,>Ñ œ expÐi+>ÑÐ" i,>Ñ5 . In particolare, se la v.a. \ possiede una legge Chi-quadrato ;#8 , dalla precedente espressione con + œ !, , œ # e 5 œ 8Î# risulta :\ Ð>Ñ œ Ð" #i>Ñ8Î# . I seguenti due Teoremi forniscono rispettivamente un'importante relazione fra la f.c. e i momenti di una v.a., e lo sviluppo in serie in un intorno di zero della f.c. basato sui momenti. Teorema 7.1.5. Se la v.a. \ definita sullo spazio probabilizzato ÐHß Y ß T Ñ possiede momento di ordine < finito, allora la relativa f.c. :\ è derivabile < volte e Ð=Ñ :\ Ð!Ñ œ i= EÒ\ = Ó per = œ "ß á ß <. Dimostrazione. Dalla definizione di derivata di funzione complessa si ha . . . expÐi>BÑ œ cosÐ>BÑ i sinÐ>BÑ œ iB expÐi>BÑ . .> .> .> Dunque, per ogni > − ‘, dal Teorema A.7 risulta che Ð"Ñ :\ Ð>Ñ œ . . EÒexpÐi>\ÑÓ œ EÒ expÐi>\ÑÓ œ EÒi\ expÐi>\ÑÓ . .> .> 7 Capitolo 7 Ð"Ñ La funzione :\ è definita, dal momento che, tenendo presente le ipotesi fatte, si ha lEÒi\ expÐi>\ÑÓ| Ÿ EÒli\ expÐi>\ÑlÓ œ EÒlil † l\l † l expÐi>\ÑlÓ œ EÒl\lÓ ∞ . In particolare, risulta Ð"Ñ :\ Ð!Ñ œ i EÒ\Ó . In maniera analoga, si ha Ð#Ñ :\ Ð>Ñ œ . EÒi\ expÐi>\ÑÓ œ EÒi# \ # expÐi>\ÑÓ , .> che è definita, essendo per le ipotesi fatte lEÒi# \ # expÐi>\ÑÓ| Ÿ EÒ\ # Ó ∞ . Dunque, si ha Ð#Ñ :\ Ð!Ñ œ i# EÒ\ # Ó . Iterando il procedimento < volte si ottiene la tesi. Esempio 7.1.8. Si consideri la v.a. ^ con legge Normale ridotta a Ð!ß "Ñ. La v.a. ^ possiede momenti di ogni ordine, essendo EÒ^ < Ó œ ! se < è dispari, mentre risulta ∞ " D# <x < EÒ^ Ó œ D exp .D œ <Î# #1 ∞ # # Ð<Î#Ñx < se < è pari. In base al Teorema 7.1.5, la f.c. ammette dunque derivata di ogni ordine. In particolare, tenendo presente l'Esempio 7.1.4, si ha Ð"Ñ :^ Ð>Ñ Ð"Ñ da cui :^ Ð!Ñ œ !, mentre . ># œ exp œ >:^ Ð>Ñ , .> # 8 Funzioni caratteristiche e generatrici Ð#Ñ :^ Ð>Ñ .# ># œ # exp œ Ð># "Ñ:^ Ð>Ñ , .> # Ð#Ñ da cui da cui :^ Ð!Ñ œ ". Confermando risultati già noti, si ha dunque Ð"Ñ Ð#Ñ EÒ^Ó œ :^ Ð!Ñ œ !, mentre VarÒ^Ó œ EÒ^ # Ó œ :^ Ð!ÑÎi# œ ". Esempio 7.1.9. Si consideri la v.a. ^ con legge di Cauchy ridotta analizzata nell'Esempio 4.1.4. Dal medesimo Esempio e tenendo presente il Teorema 4.3.3, si ha che la v.a. ^ non possiede momento di ogni ordine. In effetti, dal momento che la v.a. ^ ammette una d.p. simmetrica rispetto all'origine, la f.c. è data da " ∞ " :^ Ð>Ñ œ EÒcosÐ>^ÑÓ œ cosÐ>DÑ .D œ expÐ l>lÑ , 1 ∞ " B# che appunto non risulta derivabile in > œ !. Teorema 7.1.6. Se la v.a. \ definita sullo spazio probabilizzato ÐHß Y ß T Ñ con f.c. :\ possiede momento di ordine < finito, allora per > Ä ! si ha Ði>Ñ= :\ Ð>Ñ œ EÒ\ = Ó 9Ðl>l< Ñ . =x =œ! < Dimostrazione. Si veda Billingsley (1995, p.341). Esempio 7.1.10. Si consideri la v.a. ^ con legge Normale ridotta a Ð!ß "Ñ. Per > Ä ! si ha dunque Ði>Ñ# ># # # :^ Ð>Ñ œ " i> EÒ^Ó EÒ^ Ó 9Ð> Ñ œ " 9Ð># Ñ . # # In alcune applicazioni della Teoria della Probabilità (ad esempio in molti problemi della statistica matematica) risulta piuttosto semplice ottenere la f.c. di alcune v.a. Il problema che sorge di conseguenza consiste nel risalire alla f.r. di queste v.a., se è nota la corrispondente f.c. I prossimi Teoremi consentono appunto di ottenere la f.r. di una v.a. (eventualmente la f.p. e la d.p. nel caso di v.a. discrete e di v.a. assolutamente continue) a partire dalla f.c. 9 Capitolo 7 Teorema 7.1.7. (Teorema di inversione di Lévy) Si consideri la v.a. \ definita sullo spazio probabilizzato ÐHß Y ß T Ñ con f.r. J\ e f.c. :\ Þ Se Bß C − ‘ sono punti di continuità di J\ tali che B C, allora si ha X " expÐi>BÑ expÐi>CÑ J\ ÐCÑ J\ ÐBÑ œ lim :\ Ð>Ñ .> . X Ä∞ #1 X i> Dimostrazione. Si veda Billingsley (1995, p.346). Teorema 7.1.8. Si consideri la v.a. \ definita sullo spazio probabilizzato ÐHß Y ß T Ñ con f.c. :\ Þ Se T Ð\ œ BÑ !, allora si ha X " T Ð\ œ BÑ œ lim expÐ i>BÑ :\ Ð>Ñ .> . X Ä∞ #X X Dimostrazione. Si veda Billingsley (1995, p.354). Teorema 7.1.9. Si consideri la v.a. \ definita sullo spazio probabilizzato ∞ ÐHß Y ß T Ñ con f.c. :\ Þ Se ∞ l:\ Ð>Ñl. > ∞, la v.a. \ è assolutamente continua con d.p. ∞ " 0\ ÐBÑ œ expÐ i>BÑ :\ Ð>Ñ .> . #1 ∞ Dimostrazione. Si veda Billingsley (1995, p.347). Si noti che dal Teorema 7.1.7 segue anche la proprietà di unicità della f.c., _ ovvero, date le v.a. \ e ] , allora \ œ ] se e solo se :\ œ :] . La f.c. deve appunto la sua denominazione al fatto che “caratterizza” in modo univoco la corrispondente legge. Esempio 7.1.11. Si consideri la v.a. ^ con legge di Cauchy ridotta (si veda l'Esempio 4.1.4). Tenendo presente l'Esempio 7.1.9, si ha ∞ ∞ l:\ Ð>Ñl . > œ ∞ expÐ l>lÑ . > œ # ∞ ∞ e dal momento che la f.c. :\ è simmetrica rispetto all'origine, si ottiene 10 Funzioni caratteristiche e generatrici ∞ " 0\ ÐBÑ œ expÐ i>BÑ expÐ l>lÑ .> #1 ∞ ∞ " " œ , cosÐ>BÑ expÐ l>lÑ .> œ #1 ∞ 1Ð" B# Ñ come ovviamente doveva risultare. 7.2. Funzioni generatrici Nel caso in cui si consideri una v.a. discreta \ a valori su (o su un suo sottoinsieme), è conveniente considerare la cosiddetta funzione generatrice di probabilità piuttosto che la funzione caratteristica. Formalmente, si ha la seguente definizione. Definizione 7.2.1. Data la v.a. discreta \ definita sullo spazio probabilizzato ÐHß Y ß T Ñ a valori su W © e con f.p. :\ , si dice funzione generatrice di probabilità (f.g.) (o semplicemente funzione generatrice) della v.a. \ la funzione K\ À Ò!ß "Ó È ‘ tale che K\ Ð>Ñ œ EÒ> Ó œ >B :\ ÐBÑ , ∞ \ Bœ! con la convenzione che !! œ ". Nel linguaggio della Teoria della Misura la f.g. corrisponde alla funzione generatrice di Laplace. Risulta immediato verificare che per ciascun punto di Ò!ß "Ó la f.g. K\ coincide per definizione con la somma della serie di potenze avente Ð:\ ÐBÑÑB ! come successione dei coefficienti. Inoltre, la serie di potenze ha raggio di convergenza almeno pari ad " dal momento che converge nel punto > œ ", essendo K\ Ð"Ñ œ ". Dunque, essendo inoltre K\ Ð!Ñ œ :\ Ð!Ñ, la f.g. è definita per ogni valore dell'intervallo Ò!ß "Ó ed è crescente in questo intervallo essendo EÒ>\ Ó Ÿ EÒ=\ Ó per ogni > =. Esempio 7.2.1. Se si considera la v.a. \ con legge Binomiale U Ð8ß :Ñ, tenendo presente l'espressione del binomio di Newton, si ha 11 Capitolo 7 8 8 B 8B 8 K\ Ð>Ñ œ > : ; œ Ð:>ÑB ; 8B œ Ð; :>Ñ8 . B B Bœ! Bœ! 8 B Evidentemente, si ha K\ Ð!Ñ œ :\ Ð!Ñ œ ; 8 e K\ Ð"Ñ œ Ð; :Ñ8 œ ", mentre K\ è una funzione crescente. Esempio 7.2.2. Si consideri la v.a. \ con legge di Poisson c Ð-Ñ. Tenendo presente l'espressione della serie esponenziale, si ha ∞ -B Ð->ÑB K\ Ð>Ñ œ expÐ -Ñ > œ expÐ -Ñ œ expÐ-Ð> "ÑÑ . Bx Bx Bœ! Bœ! ∞ B Esempio 7.2.3. Si consideri la v.a. \ con legge Binomiale Negativa Ua Ð5ß :Ñ. Tenendo presente l'espressione della serie binomiale negativa, si ha K\ Ð>Ñ œ : >B ∞ 5 Bœ! ∞ 5B" B ; 5" 5B" : B œ : Ð;>Ñ œ . 5 " " ;> Bœ! 5 5 Il seguente teorema mette in relazione la f.p. con la f.g. e giustifica in effetti la denominazione di K\ . Teorema 7.2.2. Data la v.a. discreta \ definita sullo spazio probabilizzato ÐHß Y ß T Ñ a valori su W © con f.p. :\ e f.g. K\ , si ha ÐBÑ K Ð!Ñ :\ ÐBÑ œ \ Bx per B − . Dimostrazione. Dal momento che una serie di potenze può essere derivata termine a termine per ogni valore nel raggio di convergenza, per > − Ò!ß "Ò si ha Ð"Ñ K\ Ð>Ñ œ 8>8" :\ Ð8Ñ , ∞ 8œ" 12 Funzioni caratteristiche e generatrici Ð#Ñ K\ Ð>Ñ œ 8Ð8 "Ñ>8# :\ Ð8Ñ , ∞ 8œ# e in generale ÐBÑ K\ Ð>Ñ œ 8Ð8 "Ñá Ð8 B "Ñ>8B :\ Ð8Ñ . ∞ 8œB Dunque, si ottiene Ð"Ñ K\ Ð!Ñ œ :\ Ð"Ñ , Ð#Ñ K\ Ð!Ñ œ #:\ Ð#Ñ , e in generale ÐBÑ K\ Ð!Ñ œ Bx:\ ÐBÑ . Ð!Ñ Tenendo presente che K\ Ð!Ñ œ :\ Ð!Ñ si ha dunque la tesi. Dal precedente Teorema segue anche la proprietà di unicità della f.g., ovvero, _ date le v.a. \ e ] , allora si ha \ œ ] se e solo se K\ œ K] . Il seguente Teorema fornisce la relazione fra la f.g. e i momenti di una v.a. Teorema 7.2.3. Data la v.a. discreta \ definita sullo spazio probabilizzato ÐHß Y ß T Ñ a valori su W © con f.p. :\ e f.g. K\ , se la v.a. \ possiede momento di ordine < finito, si ha Ð=Ñ K\ Ð"Ñ œ EÒ\Ð\ "Ñá Ð\ = "ÑÓ per = œ "ß á ß <. Ð=Ñ Dimostrazione. Tenendo presente il Teorema 7.2.2, K\ è positiva e crescente in Ò!ß "Ò e quindi ammette un limite sinistro per > Ä " (che può non essere finito). Si ha Ð"Ñ lim K\ Ð>Ñ >Ä" œ B:\ ÐBÑ œ EÒ\Ó , ∞ Bœ! 13 Capitolo 7 Ð#Ñ lim K\ Ð>Ñ >Ä" œ BÐB "Ñ:\ ÐBÑ œ EÒ\Ð\ "ÑÓ , ∞ Bœ! e in generale Ð=Ñ lim K\ Ð>Ñ >Ä" œ BÐB "Ñá ÐB = "Ñ:\ ÐBÑ ∞ Bœ! œ EÒ\Ð\ "Ñá Ð\ = "ÑÓ . Dal momento che EÒ\Ð\ "Ñá Ð\ = "ÑÓ Ÿ EÒ\ = Ó ∞, in quanto EÒ\ = Ó è finito per = œ "ß á ß <, si ha quindi la tesi. In particolare dal precedente Teorema si ha che Ð"Ñ EÒ\Ó œ K\ Ð"Ñ se EÒ\Ó è finito, mentre VarÒ\Ó œ EÒ\Ð\ "ÑÓ EÒ\Ó EÒ\Ó# Ð#Ñ Ð"Ñ Ð"Ñ œ K\ Ð"Ñ K\ Ð"Ñ K\ Ð"Ñ# , se EÒ\ # Ó è finito. Esempio 7.2.4. Se si considera la v.a. \ con legge Binomiale U Ð8ß :Ñ, si ha Ð"Ñ K\ Ð>Ñ œ . Ð; :>Ñ8 œ 8:Ð; :>Ñ8" .> e Ð#Ñ K\ Ð>Ñ .# œ # Ð; :>Ñ8 œ 8Ð8 "Ñ:# Ð; :>Ñ8# . .> Dunque, si ha EÒ\Ó œ 8: e EÒ\Ð\ "ÑÓ œ 8Ð8 "Ñ:# , da cui è immediato verificare che VarÒ\Ó œ 8:; , un risultato noto dalla Sezione 6.1. Esempio 7.2.5. Se si considera la v.a. \ con legge di Poisson c Ð-Ñ, si ha Ð"Ñ K\ Ð>Ñ œ . expÐ-Ð> "ÑÑ œ - expÐ-Ð> "ÑÑ .> 14 Funzioni caratteristiche e generatrici e Ð#Ñ K\ Ð>Ñ .# œ # expÐ-Ð> "ÑÑ œ -# expÐ-Ð> "ÑÑ . .> Dunque, si ha EÒ\Ó œ - e EÒ\Ð\ "ÑÓ œ -# , da cui VarÒ\Ó œ -, un risultato verificato nella Sezione 6.2. Esempio 7.2.6. Se si considera la v.a. \ con legge Binomiale Negativa Ua Ð5ß :Ñ, si ha Ð"Ñ K\ Ð>Ñ . : 5; : œ œ .> " ;> : " ;> 5 5" e Ð#Ñ K\ Ð>Ñ .# : 5Ð5 "Ñ; # : œ # œ .> " ;> :# " ;> 5 5# . Dunque, risulta EÒ\Ó œ 5;Î: e EÒ\Ð\ "ÑÓ œ 5Ð5 "Ñ; # Î:# , da cui è immediato verificare che VarÒ\Ó œ 5;Î:# , un risultato ottenuto in precedenza nella Sezione 6.3. Esempio 7.2.7. Si consideri la v.a. discreta \ con f.p. data da :\ ÐBÑ œ " = B "Ö"ß#ßá× ÐBÑ , ' Ð=Ñ = dove = − Ó"ß ∞Ò, mentre ' Ð=Ñ œ ∞ rappresenta la funzione Zeta di Bœ" B Riemann. La legge associata a questa v.a. è detta di Zipf in onore del linguista e filologo statunitense George Kingsley Zipf (1902-1950), che si occupò delle applicazioni probabilistiche alle analisi dei testi. Ovviamente, la funzione Zeta prende nome dal grande matematico tedesco Georg Friedrich Bernhard Riemann (1826-1866). Dal momento che si ha ' Ð#Ñ œ 1# Î', per = œ # la f.p. della v.a. \ risulta :\ ÐBÑ œ ' # B "Ö"ß#ßá× ÐBÑ . 1# Per questo valore di =, la v.a. \ non possiede momenti finiti di alcun ordine, essendo 15 Capitolo 7 ' ∞ " EÒ\Ó œ # B œ ∞ . 1 Bœ" In effetti, la f.g. risulta ' ∞ B # K\ Ð>Ñ œ # > B , 1 Bœ" da cui, tenendo presente l'espressione della serie logaritmica, si ha Ð"Ñ K\ Ð>Ñ ' ∞ >B ' logÐ" >Ñ œ # œ # , 1 > Bœ" B 1 > e quindi Ð"Ñ lim K\ Ð>Ñ œ ∞ Þ >Ä" 7.3. Funzioni caratteristiche multivariate Viene considerata di seguito l'estensione della f.c. quando si dispone di un v.v.a. Formalmente si ha la seguente definizione. Definizione 7.3.1. Dato il v.v.a. \ œ Ð\" ß á ß \5 ÑT definito sullo spazio probabilizzato ÐHß Y ß T Ñ, si dice funzione caratteristica multivariata (f.c.m.) del v.v.a. \ la funzione :\ À ‘5 È ‚ :\ Ð>Ñ œ EÒcosÐ>T \ÑÓ i EÒsinÐ>T \ÑÓ œ EÒexpÐi>T \ÑÓ , dove > œ Ð>" ß á ß >5 ÑT − ‘5 . Dalla Definizione 7.3.1 è ovvio che la f.c.m. possiede la seguente espressione alternativa :\ Ð>Ñ œ :\ Ð>" ß á ß >5 Ñ œ Eexp i>3 \3 œ E expÐi>3 \3 Ñ . 5 5 3œ" 3œ" 16 Funzioni caratteristiche e generatrici Risulta importante notare che, se nella f.c.m. relativa al v.v.a. \ si pone >6 œ ! per ogni 6 Á 3 œ "ß á ß 5 , si ottiene :\ Ð!ß á ß >3 ß á ß !Ñ œ EÒexpÐi>3 \3 ÑÓ œ :\3 Ð>3 Ñ , ovvero si ottiene la f.c. della componente marginale \3 . In modo analogo, ponendo >6 œ ! per ogni 6 Á 3ß 4 œ "ß á ß 5 , si ha :\ Ð!ß á ß >3 ß á ß >4 ß á ß !Ñ œ EÒexpÐi>3 \3 i>4 \4 ÑÓ œ :Ð\3 ß\4 Ñ Ð>3 ß >4 Ñ , che costituisce la f.c.m. del v.v.a. Ð\3 ß \4 ÑT . In generale, azzerando opportunamente alcune componenti del vettore >, si ottengono le f.c.m. di tutte le possibili scelte di componenti marginali del v.v.a. \ . Esempio 7.3.1. Si consideri il v.v.a. \ con legge Normale Multivariata a5 Ð.\ ß O\ Ñ. Tenendo presente quanto visto nella Sezione 6.11, in base al "Î# "Î# cambio di variabile C œ O\ ÐB .\ Ñ con B œ .\ O\ C, la f.c.m. relativa al v.v.a. \ è data da :\ Ð>Ñ œ detÐ#1O\ Ñ"Î# expÐi>T BÑ exp " ÐB .\ ÑT O\" ÐB .\ Ñ .B # ‘5 " "Î# œ Ð#1Ñ5Î# expi>T .\ i>T O\ C CT C .C # ‘5 " T œ Ð#1Ñ5Î# expi.\ > >T O\ > ‚ # " "Î# "Î# ‚ exp ÐC i O\ >ÑT ÐC i O\ >Ñ .C . # ‘5 "Î# Effettuando inoltre il cambio di variabile D œ C i O\ >, con Jacobiano pari a ", si ottiene :\ Ð>Ñ œ Ð#1Ñ5Î# expi.T\ > œ Si ha inoltre expi.T\ > " T " > O\ > exp D T D .D # # ‘5 >T O\ > . # 17 Capitolo 7 # # 5\ > 3 3 :\3 Ð>3 Ñ œ :\ Ð!ß á ß >3 ß á ß !Ñ œ expi.\3 > , # # ovvero ogni componente marginale \3 possiede legge Normale a Ð.\3 ß 5\ Ñ. In 3 modo simile, si dimostra che ogni scelta di componenti marginali del v.v.a. \ possiede ancora una legge Normale Multivariata. La f.c.m. di un v.v.a. possiede proprietà analoghe rispetto alla f.c. di una v.a. Più esattamente, si hanno i seguenti Teoremi. Teorema 7.3.2. Se \ œ Ð\" ß á ß \5 ÑT è un v.v.a. definito sullo spazio probabilizzato ÐHß Y ß T Ñ con f.c.m. :\ , allora si ha l:\ Ð>Ñl Ÿ " per ogni > − ‘5 e in particolare :\ Ð!Ñ œ ", dove ! œ Ð!ß á ß !ÑT rappresenta l'origine di ‘5 , mentre :\ Ð>Ñ è uniformemente continua su ‘5 . Dimostrazione. Risulta simile a quella dei Teoremi 7.1.2. e 7.1.3. Teorema 7.3.3. Se \ œ Ð\" ß á ß \5 ÑT è un v.v.a definito sullo spazio probabilizzato ÐHß Y ß T Ñ con f.c.m. :\ Ð>" ß á ß >5 Ñ, la f.c. della v.a. trasformata ] œ + 53œ" ,3 \3 , dove + − ‘ e , œ Ð," ß á ß ,5 ÑT − ‘5 , risulta :] Ð>Ñ œ expÐi+>Ñ:\ Ð>," ß á ß >,5 Ñ œ expÐi+>Ñ:\ Ð>,Ñ , dove > − ‘. Dimostrazione. Si ha :] Ð>Ñ œ EÒexpÐi>] ÑÓ œ Eexpi+> i,3 >\3 5 3œ" œ expÐi+>ÑEexp i,3 >\3 5 3œ" œ expÐi+>Ñ:\ Ð," >ß á ß ,5 >Ñ œ expÐi+>Ñ:\ Ð>,Ñ , che è quanto si voleva dimostrare. Come conseguenza del precedente Teorema si ottiene che la f.c. della v.a. ] œ 53œ" \3 è data da :] Ð>Ñ œ :\ Ð>ß á ß >Ñ , 18 Funzioni caratteristiche e generatrici un risultato che riveste notevole importanza pratica nel determinare la legge della v.a. ] . Esempio 7.3.2. Si consideri il v.v.a. \ con legge Normale Multivariata a5 Ð.\ ß O\ Ñ. Tenendo presente l'Esempio 7.3.1, per il Teorema 7.3.3 la f.c. della v.a. trasformata ] œ + 53œ" ,3 \3 è data da Ð>,ÑT O\ Ð>,Ñ :] Ð>Ñ œ expÐi+>ÑexpiÐ>,Ñ .\ # Ð,T O\ ,Ñ># T œ expiÐ+ , .\ Ñ> , # T che risulta essere la f.c. di una v.a. con legge a Ð+ ,T .\ ß ,T O\ ,Ñ. Dunque, ogni combinazione lineare (e quindi anche la somma) delle componenti di un v.v.a. con legge Normale Multivariata possiede legge Normale. Teorema 7.3.4. Dato il v.v.a. \ œ Ð\" ß á ß \5 ÑT definito sullo spazio probabilizzato ÐHß Y ß T Ñ con f.c.m. :\ Ð>" ß á ß >5 Ñ, se EÒ\"<" á \5<5 Ó esiste finito, :\ è derivabile <" volte rispetto a >" , á , <5 volte rispetto a >5 e ` = :\ Ð>" ß á ß >5 Ñ œ i= EÒ\"=" á \5=5 Ó , =5 =" ` >" á ` >5 >" ßáß>5 œ! dove =3 œ "ß á ß <3 , 3 œ "ß á ß 5 , mentre = œ 53œ" =3 . Dimostrazione. Risulta analoga a quella del Teorema 7.1.5. Teorema 7.3.5. Dato il v.v.a. \ œ Ð\" ß á ß \5 ÑT definito sullo spazio probabilizzato ÐH ß Y ß T Ñ con f.r. J\ e f.c.m. :\ , se F œ ÓB" ß C" Ó ‚ â ‚ ÓB5 ß C5 Ó, con B3 C3 , 3 œ "ß á ß 5 , è un insieme la cui frontiera è un insieme di continuità di J\ , allora 5 " expÐi>3 B3 Ñ expÐi>3 C3 Ñ T Ð\ − FÑ œ lim :\ Ð>Ñ .> . X Ä∞ Ð#1 Ñ5 ÒX ßX Ó5 i > 3œ" Dimostrazione. Si veda Billingsley (1995, p.382). I seguenti Teoremi forniscono alcuni risultati di particolare rilevanza nel caso in cui le componenti del v.v.a. \ risultano indipendenti. 19 Capitolo 7 Teorema 7.3.6. Dato il v.v.a. \ œ Ð\" ß á ß \5 ÑT definito sullo spazio probabilizzato ÐHß Y ß T Ñ con f.c.m. :\ Ð>" ß á ß >5 Ñ, allora si ha :\ Ð>" ß á ß >5 Ñ œ :\3 Ð>3 Ñ , 5 3œ" se e solo se \" ß á ß \5 sono indipendenti. Dimostrazione. Se \" ß á ß \5 sono v.a. indipendenti, allora dal Teorema 4.2.5 si ottiene :\ Ð>Ñ œ E expÐi>3 \3 Ñ œ EÒexpÐi>3 \3 ÑÓ œ :\3 Ð>3 Ñ Þ 5 5 5 3œ" 3œ" 3œ" Inversamente, se :\ Ð>Ñ œ 53œ" :\3 Ð>3 Ñ, allora per il Teorema 7.3.5, denotando con F œ ÓB" ß C" Ó ‚ â ‚ ÓB5 ß C5 Ó, si ottiene 5 " expÐi>B3 Ñ expÐi>C3 Ñ T Ð\ − FÑ œ lim :\3 Ð>3 Ñ .>" á .>5 X Ä∞ Ð#1 Ñ5 ÒX ßX Ó5 i > 3œ" e, tenendo presente il Teorema A.11, si ha T Ð\ − FÑ œ lim " expÐi>B3 Ñ expÐi>C3 Ñ :\3 Ð>3 Ñ .>3 X Ä∞ #1 ÒX ßX Ó i > 3œ" 5 œ T Ð\3 − ÓB3 ß C3 ÓÑ , 5 3œ" che dalla Definizione 3.6. implica l'indipendenza delle v.a. \" ß á ß \5 . Il Teorema 7.3.6 implica la proprietà di unicità della f.c.m., ovvero, dati i _ v.v.a. \ e ] , allora si ha \ œ ] se e solo se :\ œ :] . Inoltre, tenendo presente il Teorema 7.3.3, se \" ß á ß \5 sono v.a. indipendenti, la f.c. della v.a. trasformata ] œ + 53œ" ,3 \3 , dove + − ‘ e , œ Ð," ß á ß ,5 ÑT − ‘5 , risulta :] Ð>Ñ œ expÐi+>Ñ:\ Ð," >ß á ß ,5 >Ñ œ expÐi+>Ñ :\3 Ð,3 >Ñ . 5 3œ" In particolare, se ] œ 53œ" \3 è la somma di 5 v.a. indipendenti, la relativa f.c. risulta 20 Funzioni caratteristiche e generatrici :] Ð>Ñ œ :\3 Ð>Ñ . 5 3œ" Dunque, quando le \3 possiedono la stessa legge che coincide con quella di una data v.a. \ , ovvero quando :\3 Ð>Ñ œ :\ Ð>Ñ per ogni 3 œ "ß á ß 5 , si ottiene :] Ð>Ñ œ Ð:\ Ð>ÑÑ5 . In generale, si può dimostrare in modo semplice ma laborioso che se \" ß á ß \8 sono v.v.a. indipendenti con 5 componenti marginali, la f.c.m. del v.v.a. trasformato ] œ 83œ" \3 risulta :] Ð>" ß á ß >5 Ñ œ :\3 Ð>" ß á ß >5 Ñ . 8 3œ" Esempio 7.3.3. Si consideri la v.a. ^ con legge Esponenziale ridotta Z Ð!ß "ß "Ñ. Dunque, dall'Esempio 7.1.5 la f.c. della v.a. ^ è data da :^ Ð>Ñ œ Ð" i>Ñ" . Di conseguenza, se ^" ß á ß ^5 sono v.a. indipendenti con la stessa legge della v.a. ^ , la v.a. ] œ 53œ" \3 possiede f.c. data da :] Ð>Ñ œ ÐÐ" i>Ñ" Ñ5 œ Ð" i>Ñ5 . Dunque, tenendo ancora presente l'Esempio 7.1.5, la v.a. ] possiede legge Gamma ridotta ZÐ!ß "ß 5Ñ. Esempio 7.3.4. Si consideri la v.a. \ con legge Chi-quadrato ;#" . Dunque, dall'Esempio 7.1.7 la f.c. di \ è data da :\ Ð>Ñ œ Ð" #i>Ñ"Î# . Di conseguenza, se \" ß á ß \8 sono v.a. indipendenti con la stessa legge di \ , la v.a. ] œ 83œ" \3 possiede f.c. data da :] Ð>Ñ œ ÐÐ" #i>Ñ"Î# Ñ8 œ Ð" #i>Ñ8Î# . Dunque, tenendo ancora presente l'Esempio 7.1.7, la v.a. ] possiede legge Chiquadrato ;#8 . 21 Capitolo 7 Esempio 7.3.5. Si consideri le v.a. indipendenti \" ß á ß \8 , rispettivamente con # legge Normale a Ð.\3 ß 5\ Ñ. Tenendo presente l'Esempio 7.1.6, la v.a. 3 ] œ 53œ" \3 possiede f.c. data da # # 5\ > 5]# ># 3 :] Ð>Ñ œ expi.\3 > œ expi.] > # , # 3œ" 5 # dove .] œ 83œ" .\3 e 5]# œ 83œ" 5\ . Dunque, la v.a. ] possiede legge 3 Normale a Ð.] ß 5]# Ñ, un risultato che conferma un caso particolare di quanto ottenuto nell'Esempio 7.3.2. Esempio 7.3.6. Si consideri il v.v.a. \ con legge Normale Multivariata a5 Ð.\ ß O\ Ñ. Se \" ß á ß \8 sono v.v.a. indipendenti con la stessa legge del v.v.a. \ , sulla base dei risultati ottenuti nell'Esempio 7.3.1, il v.v.a. ] œ 83œ" \3 possiede f.c.m. data da :] Ð>Ñ œ T expi.\ > >T O\ > >T Ð8O\ Ñ> T œ expiÐ8.\ Ñ > . # # 8 Dunque, tenendo ancora presente l'Esempio 7.3.1, il v.v.a. ] possiede legge Normale Multivariata a5 Ð8.\ ß 8O\ Ñ. 7.4. Funzioni generatrici multivariate Quando si dispone di un v.v.a. discreto con 5 componenti marginali e a valori su 5 (o su un suo sottoinsieme) si può estendere il concetto di funzione generatrice. Più esattamente, si ha la seguente definizione. Definizione 7.4.1. Dato il v.v.a. discreto \ œ Ð\" ß á ß \5 ÑT definito sullo spazio probabilizzato ÐHß Y ß T Ñ a valori su W © 5 e con f.p.c. :\ , si dice funzione generatrice multivariata di probabilità (f.g.m.) (o semplicemente funzione generatrice multivariata) del v.v.a. \ la funzione K\ À Ò!ß "Ó5 È ‘ tale che 3 E >\ 3 3œ" 5 K\ Ð>" ß á ß >5 Ñ œ œ >3B3 :\ ÐB" ß á ß B5 Ñ , 5 ÐB" ßáßB5 Ñ−W 3œ" 22 Funzioni caratteristiche e generatrici con la convenzione che !! œ ". Se nella f.g.m. relativa al v.v.a. \ si pone >6 œ " per ogni 6 Á 3 œ "ß á ß 5 , si ottiene 3 K\ Ð"ß á ß >3 ß á ß "Ñ œ EÒ>\ 3 Ó œ K\3 Ð>3 Ñ , ovvero la f.g. della componente marginale \3 . In modo analogo, ponendo >6 œ " per ogni 6 Á 3ß 4 œ "ß á ß 5 , si ottiene \ 4 3 K\ Ð"ß á ß >3 ß á ß >4 ß á ß "Ñ œ EÒ>\ 3 >4 Ó œ KÐ\3 ß\4 Ñ Ð>3 ß >4 Ñ , che costituisce la f.g.m. del v.v.a. Ð\3 ß \4 Ñ. In generale, ponendo pari all'unità in modo opportuno alcune componenti del vettore Ð>" ß á ß >5 Ñ, si ottengono le f.g.m. di tutte le possibili scelte di componenti marginali del v.v.a. \ . Esempio 7.4.1. Si consideri il v.v.a. \ con legge Multinomiale `Ð8ß :Ñ. Dunque, si ha >B3 3 B" 3œ" ÐB" ßáßB5 Ñ−W 5 K\ Ð>" ß á ß >5 Ñ œ œ ÐB" ßáßB5 Ñ−W 5 8 B3 :3 á B5 3œ" 5 5 8 B 3 Ð:3 >3 Ñ œ :3 >3 , B" á B5 3œ" 3œ" 8 dove W § 5 è definito nella Sezione 6.5. Inoltre, risulta K\3 Ð>3 Ñ œ K\ Ð"ß á ß >3 ß á ß "Ñ œ Ð;3 :3 >3 Ñ8 , dove ;3 œ " :3 œ 56Á3œ" :6 , ovvero ogni componente marginale \3 possiede legge Binomiale UÐ8ß :3 Ñ. In modo analogo, si dimostra che ogni scelta di componenti marginali del v.v.a. \ possiede ancora legge Multinomiale. La f.g.m. di un v.v.a. possiede proprietà analoghe alla f.g. di una v.a. In particolare, la f.g.m. è definita per ogni > − Ò!ß "Ó5 e risulta K\ Ð"ß á ß "Ñ œ ", mentre K\ Ð!ß á ß !Ñ œ :\ Ð!ß á ß !Ñ. Si ha inoltre il seguente Teorema. Teorema 7.4.2. Dato il v.v.a. discreto \ œ Ð\" ß á ß \5 ÑT definito sullo spazio probabilizzato ÐHß Y ß T Ñ a valori su W © 5 con f.p.c. :\ e f.g.m. K\ , si ha 23 Capitolo 7 " ` B" áB5 K\ Ð>" ß á ß >5 Ñ :\ ÐB" ß á ß B5 Ñ œ B" xá B5 x ` >B" " á ` >B5 5 >" ßáß>5 œ! per ÐB" ß á ß B5 Ñ − 5 . Dimostrazione. Risulta simile a quella del Teorema 7.2.2. Dal precedente Teorema segue anche la proprietà di unicità della f.g.m., _ ovvero, dati i v.v.a. \ e ] , allora si ha \ œ ] se e solo se K\ œ K] . Teorema 7.4.3. Dato il v.v.a. discreto \ œ Ð\" ß á ß \5 ÑT definito sullo spazio probabilizzato ÐHß Y ß T Ñ a valori su W © 5 con f.g.m. K\ , se EÒ\"<" á \5<5 Ó esiste finito, K\ è derivabile <" volte rispetto a >" , á , <5 volte rispetto a >5 e 5 ` = K\ Ð>" ß á ß >5 Ñ œ E \3 Ð\3 "Ñá Ð\3 =3 "Ñ , =5 =" ` >" á ` >5 >" ßáß>5 œ" 3œ" dove =3 œ "ß á ß <3 , 3 œ "ß á ß 5 , mentre = œ 53œ" =3 . Dimostrazione. Risulta simile a quella del Teorema 7.2.3. Esempio 7.4.2. Si consideri il v.v.a. \ con legge Multinomiale `Ð8ß :Ñ. Dunque, dal Teorema 7.4.3 si ha ` :6 >6 ` >3 6œ" 8 5 EÒ\3 Ó œ œ 8:3 , >" ßáß>5 œ" per cui il vettore delle medie del v.v.a. \ è dato da .\ œ 8:. Inoltre, si ha 5 `# EÒ\3 Ð\3 "ÑÓ œ # :6 >6 ` >3 6œ" 8 œ 8Ð8 "Ñ:3# >" ßáß>5 œ" e 5 `# :6 >6 EÒ\3 \4 Ó œ ` >3 ` >4 6œ" 8 œ 8Ð8 "Ñ:3 :4 . >" ßáß>5 œ" 24 Funzioni caratteristiche e generatrici Dunque, risulta VarÒ\3 Ó œ 8:3 Ð" :3 Ñ e CovÒ\3 ß \4 Ó œ 8:3 :4 , e dunque la matrice di varianza-covarianza è data da O\ œ 8ÐdiagÐ:Ñ ::T Ñ. Teorema 7.4.4. Dato il v.v.a. discreto \ œ Ð\" ß á ß \5 ÑT definito sullo spazio probabilizzato ÐHß Y ß T Ñ a valori su W © 5 con f.g.m. K\ , la f.g.m. della v.a. trasformata ] œ 53œ" \3 risulta K] Ð>Ñ œ K\ Ð>ß á ß >Ñ , dove > − ‘. Dimostrazione. Si ha K] Ð>Ñ œ E> 53œ" \3 œ E >\3 œ K\ Ð>ß á ß >Ñ , 5 3œ" che è quanto si voleva dimostrare. Il seguente Teorema fornisce l'espressione della f.g.m. nel caso in cui le componenti del v.v.a. \ risultano indipendenti. Teorema 7.4.5. Dato il v.v.a. discreto \ œ Ð\" ß á ß \5 ÑT definito sullo spazio probabilizzato ÐHß Y ß T Ñ a valori su W © 5 con f.g.m. K\ , allora si ha K\ Ð>" ß á ß >5 Ñ œ K\3 Ð>3 Ñ , 5 3œ" se e solo se \" ß á ß \5 sono indipendenti. Dimostrazione. Se \" ß á ß \5 sono v.a. indipendenti, allora dal Teorema 4.2.5 si ottiene 3 E >\ 3 3œ" 5 K\ Ð>" ß á ß >5 Ñ œ EÒ>3\3 Ó 3œ" 5 œ œ K\3 Ð>3 Ñ Þ 5 3œ" Inversamente, se K\ Ð>" ß á ß >5 Ñ œ 53œ" K\3 Ð>3 Ñ, dal Teorema 7.4.2 si ha 25 Capitolo 7 ` B" áB5 53œ" K\3 Ð>3 Ñ " :\ ÐB" ß á ß B5 Ñ œ ` >B" " á ` >B5 5 B" xá B5 x >" ßáß>5 œ! 8 " ` B3 K\3 Ð>3 Ñ œ œ :\3 ÐB3 Ñ , B3 ` B x > 3 >" ßáß>5 œ! 3œ" 3 3œ" 5 che dal Teorema 3.6.1 implica l'indipendenza delle v.a. \" ß á ß \5 . Tenendo presente il Teorema 7.4.4, se \" ß á ß \5 sono v.a. indipendenti, la f.g. della v.a. trasformata ] œ 53œ" \3 risulta K] Ð>Ñ œ K\3 Ð>Ñ . 5 3œ" Dunque, quando le v.a. \3 possiedono la stessa legge che coincide con quella di una data v.a. \ , ovvero quando K\3 Ð>Ñ œ K\ Ð>Ñ per ogni 3 œ "ß á ß 5, si ottiene K] Ð>Ñ œ ÐK\ Ð>ÑÑ5 . In generale, si può dimostrare in modo semplice ma laborioso che se \" ß á ß \8 sono v.v.a. indipendenti con 5 componenti marginali, la f.g.m. del v.v.a. trasformato ] œ 83œ" \3 risulta K] Ð>" ß á ß >5 Ñ œ K\3 Ð>" ß á ß >5 Ñ . 8 3œ" Esempio 7.4.3. Si consideri la v.a. \ con legge di Bernoulli U Ð"ß :Ñ. Dunque, dall'Esempio 7.2.1 la f.g. di \ è data da K\ Ð>Ñ œ ; :> . Di conseguenza, se \" ß á ß \8 sono v.a. indipendenti con la stessa legge della v.a. \ , la v.a. ] œ 83œ" \3 possiede f.g. data da K] Ð>Ñ œ Ð; :>Ñ8 . Dunque, tenendo ancora presente l'Esempio 7.2.1, la v.a. ] possiede legge Binomiale UÐ8ß :Ñ. 26 Funzioni caratteristiche e generatrici Esempio 7.4.4. Si consideri la v.a. \ con legge Binomiale Negativa Ua Ð"ß :Ñ, ovvero con legge Geometrica. Dunque, dall'Esempio 7.2.3 la f.g. della v.a. \ è data da : K\ Ð>Ñ œ . " ;> Di conseguenza, se \" ß á ß \5 sono v.a. indipendenti con la stessa legge della v.a. \ , la v.a. ] œ 53œ" \3 possiede f.g. data da : K] Ð>Ñ œ . " ;> 5 Dunque, tenendo ancora presente l'Esempio 7.2.3, la v.a. ] possiede legge Binomiale Negativa Ua Ð5ß :Ñ. Esempio 7.4.5. Si consideri il v.v.a. \ con legge Multinomiale `Ð"ß :Ñ. Dunque, dall'Esempio 7.4.1 la f.g.m. del v.v.a. \ è data da K\ Ð>" ß á ß >5 Ñ œ :3 >3 . 5 3œ" Di conseguenza, se \" ß á ß \8 sono v.v.a. indipendenti con la stessa legge del v.v.a. \ , il v.v.a. ] œ 53œ" \3 possiede f.g.m. data da K] Ð>" ß á ß >5 Ñ œ :3 >3 . 5 8 3œ" Dunque, tenendo ancora presente l'Esempio 7.4.1, il v.v.a. ] possiede legge Multinomiale `Ð8ß :Ñ. 7.5. Leggi additive e infinitamente divisibili In questa sezione vengono considerate due importanti famiglie di leggi che sono caratterizzate da particolari comportamenti rispetto alla somma di v.a. indipendenti. In particolare, si ha la seguente definizione. Definizione 7.5.1. Sia data la v.a. \ definita sullo spazio probabilizzato ÐHß Y ß T Ñ con f.r. J\ß) che dipende da un vettore di parametri ) − K © ‘7 . La 27 Capitolo 7 v.a. \ e la relativa legge si dicono additive rispetto a ) se, date le v.a. indipendenti \" e \# con rispettive f.r. J\" ß)" e J\" ß)" , la f.r. della v.a. Ð\" \# Ñ risulta essere J\" \# ß)" )# per ogni )" ß )# − K. Tenendo presente la proprietà di unicità della f.c., la Definizione 7.5.1 può essere anche data in termini della f.c. :\ß) della v.a. \ . Evidentemente, se la v.a. \ e la rispettiva legge risultano additive rispetto a ), si verifica che :\" ß)" Ð>Ñ:\# ß)# Ð>Ñ œ :\" \# ß)" )# Ð>Ñ , per ogni )" ß )# − K. Ovviamente, nel caso di una v.a. discreta \ a valori su W © , una analoga definizione può essere data in termini della corrispondente f.g. K\ß) , ovvero si ha K\" ß)" Ð>ÑK\# ß)# Ð>Ñ œ K\" \# ß)" )# Ð>Ñ , per ogni )" ß )# − K. Si noti che il vettore di parametri ) può non comprendere l'intero insieme di parametri che caratterizzano la legge in questione, ma soltanto il sottoinsieme di parametri rispetto ai quali si vuole verificare l'additività. In questo caso, i rimanenti parametri devono invece essere costanti. Esempio 7.5.1. Si consideri la v.a. \ con legge Normale a Ð.ß 5 # Ñ. In questo caso, si pone ) œ Ð.ß 5 # ÑT con K œ ‘ ‚ Ó!ß ∞Ò. La legge risulta additiva rispetto al vettore di parametri ), in quanto dall'Esempio 7.3.5 si ha # # # # 5\ 5\ > > " # . i exp :\" ß)" Ð>Ñ:\# ß)# Ð>Ñ œ expi.\" > > \ # # # œ expiÐ.\" # # Ð5 \ 5\ Ñ># " # .\# Ñ> # œ :\" \# ß)" )# Ð>Ñ , ovvero, in altri termini, la somma di due v.a. indipendenti, rispettivamente con # # legge Normale a Ð.\" ß 5\ Ñ e a Ð.\# ß 5\ Ñ, possiede legge Normale " # # a Ð.\" \# ß 5\ Ñ. " \# Esempio 7.5.2. Si consideri la v.a. \ con legge Gamma Z Ð!ß ,ß 5Ñ. In questo caso, si pone ) œ 5 con K œ Ó!ß ∞Ò, ovvero si vuole verificare l'additività rispetto al parametro 5 e non al parametro ,. La legge è additiva rispetto a ), in quanto tenendo presente l'Esempio 7.1.7 si ha 28 Funzioni caratteristiche e generatrici :\" ß)" Ð>Ñ:\# ß)# Ð>Ñ œ Ð" i,>Ñ5" Ð" i,>Ñ5# œ Ð" i,>ÑÐ5" 5# Ñ œ :\" \# ß)" )# Ð>Ñ . Dunque, la somma di due v.a. indipendenti, rispettivamente con legge Gamma Z Ð!ß ,ß 5" Ñ e Z Ð!ß ,ß 5# Ñ, possiede legge Gamma Z Ð!ß ,ß 5" 5# Ñ. In particolare, se la v.a. \ possiede legge Chi-quadrato ;#8 , dalla precedente espressione con , œ # e 5 œ 8Î#, la legge risulta additiva rispetto al parametro 8. Dunque, la somma di due v.a. indipendenti, rispettivamente con legge Chi-quadrato ;#8" e ;#8# , possiede legge Chi-quadrato ;8# " 8# . Si noti infine che l'additività non vale per il parametro di scala ,. In effetti, se si considera il vettore di parametri ) œ Ð,ß 5ÑT con K œ Ó!ß ∞Ò ‚ Ó!ß ∞Ò, si ha :\" ß)" Ð>Ñ:\# ß)# Ð>Ñ œ Ð" i," >Ñ5" Ð" i,# >Ñ5# Á :\" \# ß)" )# Ð>Ñ œ Ð" iÐ," ,# Ñ>ÑÐ5" 5# Ñ . In altre parole, la somma di due v.a. indipendenti, con legge Gamma ZÐ!ß ," ß 5" Ñ e Z Ð!ß ,# ß 5# Ñ, non possiede legge Gamma Z Ð!ß ," ,# ß 5" 5# Ñ. Esempio 7.5.3. Si consideri la v.a. \ con legge Binomiale U Ð8ß :Ñ. In questo caso, si pone ) œ 8 con K œ Ö"ß #ß á ×, ovvero si vuole verificare l'additività rispetto al parametro 8 e non al parametro :. La legge risulta additiva rispetto a 8, in quanto tenendo presente l'Esempio 7.2.1 si ha K\" ß)" Ð>ÑK\# ß)# Ð>Ñ œ Ð; :>Ñ8" Ð; :>Ñ8# œ Ð; :>Ñ8" 8# œ K\" \# ß)" )# Ð>Ñ . Quindi, la somma di due v.a. indipendenti, rispettivamente con legge Binomiale U Ð8" ß :Ñ e U Ð8# ß :Ñ, possiede legge Binomiale Z Ð8" 8# ß :Ñ. Risulta immediato verificare che l'additività non vale per il parametro :. Dunque, se si considera il vettore di parametri ) œ Ð8ß :ÑT con K œ Ö"ß #ß á × ‚ Ó!ß "Ò, la legge non risulta additiva rispetto a ). Esempio 7.5.4. Si consideri la v.a. \ con legge di Poisson c Ð-Ñ. Si pone ) œ con K œ Ó!ß ∞Ò. La legge risulta additiva rispetto al parametro -, in quanto tenendo presente l'Esempio 7.2.2 si ha K\" ß)" Ð>ÑK\# ß)# Ð>Ñ œ expÐ-" Ð> "ÑÑexpÐ-# Ð> "ÑÑ œ expÐÐ-" -# ÑÐ> "ÑÑ œ K\" \# ß)" )# Ð>Ñ . 29 Capitolo 7 Dunque, la somma di due v.a. indipendenti, rispettivamente con legge di Poisson c Ð-" Ñ e c Ð-# Ñ, possiede legge di Poisson c Ð-" -# Ñ. Esempio 7.5.5. Si consideri la v.a. \ con legge Binomiale Negativa Ua Ð5ß :Ñ. Si pone ) œ 5 con K œ Ö"ß #ß á ×, ovvero si vuole verificare l'additività rispetto al parametro 5 e non al parametro :. La legge risulta additiva rispetto a ), in quanto tenendo presente l'Esempio 7.2.3 si ha " : : K\" ß)" Ð>ÑK\# ß)# Ð>Ñ œ " ;> " ;> 5 : œ " ;> 5# 5" 5# œ K\" \# ß)" )# Ð>Ñ , ovvero si ha che la somma di due v.a. indipendenti, rispettivamente con legge Binomiale Negativa Ua Ð5" ß :Ñ e Ua Ð5# ß :Ñ, possiede legge Binomiale Negativa Ua Ð5" 5# ß :Ñ. In modo analogo alla legge Binomiale, risulta inoltre immediato verificare che l'additività non vale per il parametro :. Dunque, se si considera il vettore di parametri ) œ Ð5ß :ÑT con K œ Ö"ß #ß á × ‚ Ó!ß "Ò, la legge non è additiva rispetto a ). Definizione 7.5.2. Si consideri la v.a. \ definita sullo spazio probabilizzato ÐHß Y ß T Ñ. La v.a. \ e la rispettiva legge sono dette infinitamente divisibili se _ per ogni 8 œ "ß #ß á si ha \ œ 83œ" \3 , dove Ð\" ß á ß \8 ÑT è un v.v.a. indipendenti e ugualmente distribuite. Tenendo presente la proprietà di unicità della f.c., la Definizione 7.5.2 può essere data in modo alternativo utilizzando la f.c. In questo caso, se la v.a. \ ha f.c. :\ , mentre :\8 è la f.c. comune alle componenti marginali del v.v.a. Ð\" ß á ß \8 ÑT , allora la v.a. \ è infinitamente divisibile se per ogni 8 œ "ß #ß á si ha :\ Ð>Ñ œ Ð:\8 Ð>ÑÑ8 . Nel caso in cui la v.a. \ è discreta a valori su W © , una analoga definizione può essere data in termini della f.g., nel senso che la precedente condizione si riduce a K\ Ð>Ñ œ ÐK\8 Ð>ÑÑ8 . Per una v.a. infinitamente divisibile vale inoltre il seguente teorema. 30 Funzioni caratteristiche e generatrici Teorema 7.5.3. Data la v.a. \ definita sullo spazio probabilizzato ÐHß Y ß T Ñ, se la v.a. \ è infinitamente divisibile lo è anche la trasformata ] œ + ,\ , dove +ß , − ‘. Dimostrazione. Tenendo presente il Teorema 7.3.4, si ha :] Ð>Ñ œ expÐi+>Ñ:\ Ð,>Ñ œ expÐi+>ÑÐ:\8 Ð,>ÑÑ8 œ ÐexpÐi+>Î8Ñ:\8 Ð,>ÑÑ8 , da cui segue che ] œ 83œ" Ð+Î8 ,\3 Ñ, ovvero la v.a. ] è infinitamente divisibile. _ In generale, dal precedente Teorema, è immediato verificare che, se una legge ridotta è infinitamente divisibile, lo è anche la relativa legge con parametro di posizione e di scala. Dunque, è sufficiente verificare che legge ridotta sia infinitamente divisibile per concludere che la legge con parametro di posizione e di scala è a sua volta infinitamente divisibile. Esempio 7.5.6. Si consideri la v.a. \ con legge Normale a Ð!ß "Ñ. Dal momento che per ogni 8 œ "ß #ß á si ha ># ># 8 :\ Ð>Ñ œ exp œ exp œ Ð:\ 8 Ð>ÑÑ , # #8 8 la legge è infinitamente divisibile. In altri termini, una v.a. \ con legge Normale a Ð!ß "Ñ è equivalente in legge alla somma di 8 v.a. indipendenti con legge Normale a Ð!ß "Î8Ñ per ogni 8 œ "ß #ß á . In base al Teorema 7.5.3 è inoltre sufficiente verificare che legge Normale ridotta a Ð!ß "Ñ è infinitamente divisibile per concludere che la legge Normale a Ð.ß 5 # Ñ è a sua volta infinitamente divisibile. Esempio 7.5.7. Si consideri la v.a. \ con legge Gamma ridotta Z Ð!ß "ß 5Ñ. Dal momento che per ogni 8 œ "ß #ß á si ha :\ Ð>Ñ œ Ð" i>Ñ5 œ ÐÐ" i>Ñ5Î8 Ñ8 œ Ð:\ 8 Ð>ÑÑ8 , la legge è infinitamente divisibile. In altri termini, una v.a. \ con legge Gamma ridotta ZÐ!ß "ß 5Ñ è equivalente in legge alla somma di 8 v.a. indipendenti con legge Gamma ZÐ!ß "ß 5Î8Ñ per ogni 8 œ "ß #ß á . Esempio 7.5.8. Si consideri una v.a. \ con f.c. 31 Capitolo 7 :\ Ð>Ñ œ expÐ l>lα Ñ , dove α − Ó!ß #Ó. La legge associata alla v.a. \ è detta legge Stabile simmetrica di parametro α e, ovviamente, contiene come casi particolari la legge a Ð!ß #Ñ per α œ # (si veda l'Esempio 7.1.6) e la legge di Cauchy ridotta per α œ " (si veda l'esempio 7.1.9). Dal momento che per α − Ó!ß #Ó si ha ∞ ∞ l:\ Ð>Ñl .> œ ∞ ∞ expÐ l>lα Ñ .> œ >" " ∞, α sulla base del Teorema 7.1.9 la v.a. \ è assolutamente continua. La d.p. relativa non può essere ottenuta in forma chiusa, eccetto che per i due casi particolari precedentemente citati. Inoltre, tenendo presente il Teorema 7.1.5, EÒ\Ó non è definito se α − Ó!ß "Ó, mentre esiste finito EÒ\Ó ma non EÒ\ # Ó se α − Ó"ß #Ò. Ovviamente, i momenti di ogni ordine esistono finiti se α œ #. Dal momento che per ogni legge della famiglia si ha :\ Ð>Ñ œ expÐ l>lα Ñ œ ÐexpÐ l8"Îα >lα Ñ8 œ Ð:\ 8 Ð>ÑÑ8 , la legge Stabile simmetrica è infinitamente divisibile. In altri termini, una v.a. \ con legge Stabile simmetrica di parametro α è equivalente in legge alla somma di 8 v.a. indipendenti del tipo 8"Îα \3 , 3 œ "ß á ß 8, dove ogni v.a. \3 possiede ancora legge Stabile simmetrica di parametro α. Esempio 7.5.9. Si consideri la v.a. \ con legge Binomiale U Ð7ß :Ñ. Dal momento che si ha K\ Ð>Ñ œ Ð; :>Ñ7 œ ÐÐ; :>Ñ7Î8 Ñ8 , la legge è infinitamente divisibile solamente se 7 è multiplo di 8. Dunque, la legge Binomiale non è infinitamente divisibile. Esempio 7.5.10. Si consideri la v.a. \ con legge di Poisson c Ð-Ñ. Dal momento che si ha K\ Ð>Ñ œ expÐ-Ð> "ÑÑ œ ÐexpÐÐ-Î8ÑÐ> "ÑÑÑ8 œ ÐK\ 8 Ð>ÑÑ8 , la legge è infinitamente divisibile. In altri termini, una v.a. \ con legge di Poisson c Ð-Ñ è equivalente in legge alla somma di 8 v.a. indipendenti con legge di Poisson c Ð-Î8Ñ per ogni 8 œ "ß #ß á . 32 Funzioni caratteristiche e generatrici 7.6. Riferimenti bibliografici Lukacs (1970) è una monografia sulle funzioni caratteristiche. I classici testi di Feller (1968, 1971) trattano estesamente le funzioni generatrici e caratteristiche. Un testo più recente sulle funzioni caratteristiche è Sasvári (2013). Wilf (2006) è un testo espressamente dedicato alle funzioni generatrici. Infine, una trattazione esauriente delle leggi infinitamente divisibili viene data in Steutel et al. (2004). Capitolo 8 Convergenze 8.1. Convergenza in legge Un insieme numerabile di v.a. Ð\" ß \# ß á Ñ è detta successione di v.a. e viene indicata con Ð\8 Ñ8 " . Se la successione viene indicizzata come Ð\! ß \" ß á Ñ, si adotta eventualmente la notazione Ð\8 Ñ8 ! . Dal momento che alla successione Ð\8 Ñ8 " è associata la corrispondente successione di f.r. ÐJ\8 Ñ8 " , risulta interessante definire il concetto di convergenza per una successione di f.r. Formalmente, la cosiddetta convergenza in legge è data nella seguente definizione. Definizione 8.1.1. Se Ð\8 Ñ8 " è una successione di v.a., a cui corrisponde la successione di f.r. ÐJ\8 Ñ8 " , si dice che la successione di v.a. converge in legge (o in distribuzione) alla v.a. \ con f.r. J\ se per ogni B tale che ˜J\ ÐBÑ œ ! si ha lim J\8 ÐBÑ œ J\ ÐBÑ 8 _ e si scrive \8 Ä \ per 8 Ä ∞. In pratica, la definizione di convergenza in legge implica che la f.r. della v.a. \8 converga puntualmente a quella della v.a. \ per ogni B per cui J\ è continua. Si noti inoltre che la convergenza in legge non richiede che le v.a. della successione e la v.a. \ siano definite su uno stesso spazio probabilizzato. In effetti, la condizione della Definizione 8.1.1 riguarda solamente le f.r. e introduce la cosiddetta convergenza debole della successione di f.r. ÐJ\8 Ñ8 " alla f.r. J\ . Data la biunivocità esistente fra legge e f.r. di una v.a., se ÐT\8 Ñ8 " denota la successione di leggi corrispondente alla successione di f.r. ÐJ\8 Ñ8 " e se T\ è la legge relativa alla f.r. J\ , la convergenza debole può essere anche definita mediante la condizione 2 Convergenze lim T\8 ÐFÑ œ T\ ÐFÑ 8 per ogni F − U Ð‘Ñ la cui frontiera (ovvero l'insieme di punti di discontinuità di "F ) ha probabilità nulla secondo T\ . Nel caso in cui la v.a. \ sia degenere e tale che T Ð\ œ -Ñ œ ", allora si ha J\ ÐBÑ œ "Ò-ß∞Ò ÐBÑ e J\ è continua per B Á - . Dunque, la condizione della Definizione 8.1.1 si riduce a lim J\8 ÐBÑ œ "Ò-ß∞Ò ÐBÑ 8 per ogni B Á - . In questo caso, con un leggero abuso in notazione generalmente adottato nei testi di Teoria della Probabilità, la convergenza in legge viene _ denotata come \8 Ä - per 8 Ä ∞. Esempio 8.1.1. Si consideri la successione di v.a. Ð\8 Ñ8 " tale che la v.a. \8 possiede legge Beta ridotta UXÐ!ß "ß " "Î8ß "Ñ. Tenendo presente quanto detto nella Sezione 6.9, si ha J\8 ÐBÑ œ B""Î8 "Ó!ß"Ò ÐBÑ "Ó"ß∞Ò ÐBÑ , da cui lim J\8 ÐBÑ œ B"Ó!ß"Ò ÐBÑ "Ó"ß∞Ò ÐBÑ . 8 Dal momento che la precedente espressione fornisce la f.r. di una v.a. \ con _ legge Uniforme su Ó!ß "Ò, allora si ha \8 Ä \ per 8 Ä ∞. Esempio 8.1.2. Si consideri la successione di v.a. Ð\8 Ñ8 " tale che la v.a. \8 possiede legge Uniforme su Ò "Î8ß "Î8Ó. Tenendo presente quanto detto nella Sezione 6.9, si ha J\8 ÐBÑ œ 8B " "Ò"Î8ß"Î8Ó ÐBÑ "Ó"Î8ß∞Ò ÐBÑ , # da cui lim J\8 ÐBÑ œ 8 " "Ö!× ÐBÑ "Ó!ß∞Ò ÐBÑ . # 3 Capitolo 8 Risulta immediato verificare che la precedente espressione non costituisce una f.r. Tuttavia, si consideri la v.a. degenere \ concentrata sullo ! e che possiede f.r. data da J\ ÐBÑ œ "Ò!ß∞Ò ÐBÑ. Dal momento che lim8 J\8 ÐBÑ e J\ ÐBÑ _ coincidono per ogni B Á !, allora si ha \8 Ä ! per 8 Ä ∞. Esempio 8.1.3. Sia Ð^8 Ñ8 " una successione di v.a. indipendenti definite sullo stesso spazio probabilizzato ÐHß Y ß T Ñ e tale che la v.a. ^8 possiede legge Esponenziale ridotta ZÐ!ß "ß "Ñ per ogni 8. Inoltre, si consideri la successione di v.a. Ð]8 Ñ8 " , dove ]8 œ max"Ÿ3Ÿ8 ^3 . Tenendo presente i risultati della Sezione 6.8, dall'assunzione di indipendenza si ha J]8 ÐBÑ œ T Ð^" Ÿ Bß á ß ^8 Ÿ BÑ œ T Ð^3 Ÿ BÑ œ J^3 ÐBÑ 8 8 3œ" 3œ" œ Ð" expÐ BÑÑ"Ó!ß∞Ò ÐBÑ œ Ð" expÐ BÑÑ8 "Ó!ß∞Ò ÐBÑ . 8 3œ" Si consideri infine l'ulteriore successione di v.a. Ð\8 Ñ8 " , con \8 œ ]8 log8. In questo caso, si ha J\8 ÐBÑ œ T Ð\8 Ÿ BÑ œ T Ð]8 log8 Ÿ BÑ œ T Ð]8 Ÿ B log8Ñ œ J]8 ÐB log8Ñ œ Ð" expÐ B log8ÑÑ8 "Ólog8ß∞Ò ÐBÑ 8 expÐ BÑ œ " "Ólog8ß∞Ò ÐBÑ , 8 da cui expÐ BÑ lim J\8 ÐBÑ œ lim " "Ólog8ß∞Ò ÐBÑ œ expÐ expÐ BÑÑ . 8 8 8 8 La precedente espressione fornisce la f.r. di una v.a. \ con legge di Gumbel _ ridotta (si veda l'Esempio 6.6.1) e quindi si ha che \8 Ä \ per 8 Ä ∞. In altre parole, la successione delle f.r. relative ai massimi (“centrati” con un opportuno parametro di posizione) di 8 v.a. indipendenti con legge Esponenziale ridotta converge alla f.r. relativa ad una legge di Gumbel ridotta. I prossimi Teoremi risultano fondamentali per ottenere la convergenza in legge mediante la convergenza delle f.c. o delle f.g. In effetti, dal momento che la f.c. o la f.g. determinano in maniera univoca la f.r. di una v.a., è naturale aspettarsi che 4 Convergenze la convergenza in legge si possa stabilire tramite la successione delle f.c. o delle f.g. Teorema 8.1.2. (Teorema di Lévy) Se Ð\8 Ñ8 " è una successione di v.a. a cui corrisponde la successione di f.c. Ð:\8 Ñ8 " e se \ è una v.a. con f.c. :\ , _ allora \8 Ä \ per 8 Ä ∞ se e solo se lim :\8 Ð>Ñ œ :\ Ð>Ñ 8 per ogni > − ‘. Dimostrazione. Si veda Billingsley (1995, p.349). Nel caso in cui la v.a. \ sia degenere e concentrata su - , allora si ha :\ Ð>Ñ œ expÐi->Ñ, e la condizione del Teorema di Lévy si riduce alla condizione lim :\8 Ð>Ñ œ expÐi->Ñ 8 per ogni > − ‘. Esempio 8.1.4. Sia Ð^8 Ñ8 " una successione di v.a., tale che la v.a. ^8 possiede legge Chi-quadrato ;#8 . Tenendo presente che dalla Sezione 6.8 si ha EÒ^8 Ó œ 8 e VarÒ^8 Ó œ #8, si consideri la successione di v.a. standardizzate Ð\8 Ñ8 " , dove \8 œ Ð^8 8ÑÎ#8. Dunque, dall'Esempio 7.1.7 e dal Teorema 7.1.4 si ha i> :\8 Ð>Ñ œ expÐ i>8Î#Ñ" 8Î# 8Î# . Inoltre, dalle proprietà dell'espansione in serie della funzione logaritmica in campo complesso, per ogni - − ‚ tale che l-l " risulta logÐ" -Ñ œ - " # - 9Ð- # Ñ , # da cui i> i> ># log" œ 9Ð8" Ñ . 8Î# 8Î# 8 Dunque, si ha 5 Capitolo 8 ># :\8 Ð>Ñ œ exp 89Ð8" Ñ , # da cui ># lim :\8 Ð>Ñ œ exp . 8 # Risulta immediato riconoscere che la precedente espressione è la f.c. relativa a una v.a. \ con legge Normale ridotta a Ð!ß "Ñ e perciò si ottiene infine che _ \8 Ä \ per 8 Ä ∞. Esempio 8.1.5. Analogamente all'Esempio 8.1.4, si consideri la successione di v.a. Ð^8 Ñ8 " , tale che la v.a. ^8 possiede legge Chi-quadrato ;#8 . Si consideri inoltre la successione di v.a. Ð\8 Ñ8 " , dove \8 œ ^8 Î8. Tenendo presente l'Esempio 7.1.7, si ottiene #i> :\8 Ð>Ñ œ " 8 8Î# . Dunque, si ha lim :\8 Ð>Ñ œ expÐi>Ñ . 8 Risulta immediato riconoscere che la precedente espressione è la f.c. di una v.a. _ degenere \ concentrata su " e dunque \8 Ä " per 8 Ä ∞. Esempio 8.1.6. Si consideri la successione di v.a. Ð^8 Ñ8 " dove la v.a. ^8 possiede legge di Poisson c Ð-8 Ñ e dove Ð-8 Ñ8 " è una successione tale che -8 Ä ∞ per 8 Ä ∞. Tenendo presente che dalla Sezione 6.2 si ha EÒ^8 Ó œ -8 e VarÒ^8 Ó œ -8 , si consideri la successione di v.a. standardizzate Ð\8 Ñ8 " , dove \8 œ Ð^8 -8 ÑÎ-8 . Dunque, dall'Esempio 7.1.2 e dal Teorema 7.1.4 si ha :\8 Ð>Ñ œ exp-8 exp i> -8 i>-8 . -8 Inoltre, dalle proprietà dell'espansione in serie della funzione esponenziale in campo complesso, per ogni - − ‚ risulta 6 Convergenze expÐ-Ñ œ " - " # - 9Ð- # Ñ , # da cui i> i> ># œ" 9Ð-8" Ñ . exp -8 -8 # -8 Dunque, si ha ># :\8 Ð>Ñ œ exp -8 9Ð-8" Ñ , # da cui ># lim :\8 Ð>Ñ œ exp . 8 # Risulta immediato riconoscere che la precedente espressione è la f.c. relativa a una v.a. \ con legge Normale ridotta a Ð!ß "Ñ e perciò si ottiene infine che _ \8 Ä \ per 8 Ä ∞. Teorema 8.1.3. Se Ð\8 Ñ8 " è una successione di v.a. discrete a valori su W8 © a cui corrisponde la successione di f.g. ÐK\8 Ñ8 " e se \ è un'ulteriore _ v.a. discreta a valori su W © con f.g. K\ , allora \8 Ä \ per 8 Ä ∞ se e solo se lim K\8 Ð>Ñ œ K\ Ð>Ñ 8 per ogni > − Ò!ß "Ó. Dimostrazione. Si veda Gut (2005, p.240). Esempio 8.1.7. Si consideri la successione di v.a. Ð\8 Ñ8 " dove la v.a. \8 possiede legge Binomiale UÐ8ß :8 Ñ e dove Ð:8 Ñ8 " è una successione tale che l'ulteriore successione Ð8:8 Ñ8 " converge verso la costante - − Ó!ß ∞Ò. Tenendo presente l'Esempio 7.2.1, si ha 8:8 Ð> "Ñ K\8 Ð>Ñ œ Ð" :8 :8 >Ñ œ " . 8 8 8 7 Capitolo 8 Dunque, si ha 8:8 Ð> "Ñ lim K\8 Ð>Ñ œ lim " œ expÐ-Ð> "ÑÑ . 8 8 8 8 Risulta immediato riconoscere che la precedente espressione è la f.g. di una v.a. _ \ con legge di Poisson c Ð-Ñ e dunque \8 Ä \ per 8 Ä ∞. Questo risultato è in effetti già noto dalla Sezione 6.2. Esempio 8.1.8. Si consideri la successione di v.a. Ð\8 Ñ8 " dove la v.a. \8 possiede legge Binomiale Negativa Ua Ð8ß :8 Ñ e dove Ð:8 Ñ8 " è una successione tale che l'ulteriore successione Ð8Ð" :8 ÑÎ:8 Ñ8 " converge verso la costante - − Ó!ß ∞Ò. Tenendo presente l'Esempio 7.2.3, si ha :8 8Ð" :8 ÑÐ" >ÑÎ:8 K\8 Ð>Ñ œ œ " " Ð" :8 Ñ> 8 8 8 . Dunque, si ha 8Ð" :8 ÑÐ" >ÑÎ:8 lim K\8 Ð>Ñ œ lim " 8 8 8 8 œ expÐ-Ð> "ÑÑ . Risulta immediato riconoscere che la precedente espressione è la f.g. di una v.a. _ \ con legge di Poisson c Ð-Ñ e dunque \8 Ä \ per 8 Ä ∞. Questo risultato è in effetti già noto dalla Sezione 6.3. Teorema 8.1.4. Sia Ð\8 Ñ8 " una successione di v.a. e \ una v.a. tale che _ \8 Ä \ per 8 Ä ∞. Se 1 À ‘ È ‘ è una funzione continua, allora si ha _ 1Ð\8 Ñ Ä 1Ð\Ñ per 8 Ä ∞. Dimostrazione. Posto ]8 œ 1Ð\8 Ñ e ] œ 1Ð\Ñ, tenendo presente il Lemma di Fatou (Teorema A.7), si ha lim :]8 Ð>Ñ œ lim EÒexpÐi>]8 ÑÓ œ EÒlim expÐi>]8 ÑÓ œ EÒexpÐi>] ÑÓ œ :] Ð>Ñ 8 8 e la tesi segue dal Teorema 8.1.2. 8 Esempio 8.1.9. Analogamente all'Esempio 8.1.4, si consideri la successione di v.a. standardizzate Ð\8 Ñ8 " dove \8 œ Ð^8 8ÑÎ#8, mentre la v.a. ^8 possiede legge Chi-quadrato ;#8 . Nel medesimo Esempio è stato verificato che 8 Convergenze _ \8 Ä \ per 8 Ä ∞, dove la v.a. \ possiede legge Normale ridotta a Ð!ß "Ñ. Tenendo presente quanto detto nella Sezione 6.8, se si considera la funzione _ continua 1 À B È B# , allora si ha \8# Ä ] per 8 Ä ∞, dove la v.a. trasformata ] œ \ # possiede legge Chi-quadrato ;"# . 8.2. Convergenza in probabilità Un secondo concetto di convergenza, detto convergenza in probabilità, è dato nella seguente definizione. Definizione 8.2.1. Se Ð\8 Ñ8 " è una successione di v.a. definite sullo spazio probabilizzato ÐHß Y ß T Ñ, allora si dice che la successione converge in probabilità alla v.a. \ , definita sul medesimo spazio probabilizzato, se per ogni & ! si ha lim T Ðl\8 \l &Ñ œ ! 8 T e si scrive \8 Ä \ per 8 Ä ∞. In pratica, la definizione di convergenza in probabilità richiede che la probabilità dell'evento che si realizza quando le v.a. \8 e \ differiscono tenda a !. Nel caso in cui la v.a. \ sia degenere e tale che T Ð\ œ -Ñ œ ", allora la condizione della Definizione 8.2.1 si riduce a lim T Ðl\8 -l &Ñ œ ! 8 e con un abuso in notazione quasi universalmente adottato nei testi di Teoria T della Probabilità, la convergenza in probabilità viene denotata con \8 Ä - per 8 Ä ∞. Esempio 8.2.1. Data la v.a. \ che possiede legge Normale ridotta a Ð!ß "Ñ, si consideri la successione di v.a. Ð\8 Ñ8 " tale che \8 œ Ð" "Î8Ñ\ . Si vuole verificare che la successione di v.a. converge in probabilità alla v.a. \ . Dal momento che 9 Capitolo 8 T Ðl\8 \l &Ñ œ " T Ðl\8 \l Ÿ &Ñ œ " T Ðl\l Ÿ 8&Ñ 8& " ?# œ" exp .? œ # #FÐ8&Ñ , # 8& #1 allora si ha lim T Ðl\8 \l &Ñ œ # # lim FÐ8&Ñ œ ! 8 8 T e quindi \8 Ä \ per 8 Ä ∞. Esempio 8.2.2. Data la v.a. ^ che possiede legge ridotta di Cauchy (si veda l'Esempio 4.1.4), si consideri la successione di v.a. Ð\8 Ñ8 " tale che \8 œ ^Î8. Si vuole verificare che la successione di v.a. converge in probabilità ad una v.a. degenere concentrata sullo !. In effetti, si ha T Ðl\8 l &Ñ œ " T Ðl\8 l Ÿ &Ñ œ " T Ðl^l Ÿ 8&Ñ 8& " # œ" .? œ " arctanÐ8&Ñ , # 1 8& 1 Ð" ? Ñ da cui lim T Ðl\8 l &Ñ œ " 8 # lim arctanÐ8&Ñ œ ! 1 8 T e quindi \8 Ä ! per 8 Ä ∞. Il seguente teorema fornisce la condizione sufficiente per la convergenza in probabilità ad una v.a. degenere. Teorema 8.2.2. Sia Ð\8 Ñ8 " una successione di v.a. definite sullo spazio probabilizzato ÐHß Y ß T Ñ. Se esiste un $ ! per cui si ha lim EÒl\8 -l$ Ó œ ! , 8 T allora \8 Ä - per 8 Ä ∞. Dimostrazione. Dalla disuguaglianza di Markov (Teorema 4.3.6) si ha EÒl\8 -l$ Ó T Ðl\8 -l &Ñ œ T Ðl\8 -l & Ñ Ÿ &$ $ $ 10 Convergenze e quindi dall'ipotesi fatta risulta lim8 T Ðl\8 -l &Ñ œ !. Dal momento che EÒÐ\8 -Ñ# Ó œ VarÒ\8 Ó ÐEÒ\8 Ó -Ñ# , si nota che per $ œ # la condizione data nel Teorema 8.2.2 è equivalente alle condizioni lim8 EÒ\8 Ó œ - e lim8 VarÒ\8 Ó œ !. Esempio 8.2.3. Si consideri la successione di v.a. indipendenti Ð\8 Ñ8 " tale che la v.a. \8 possiede legge Binomiale U Ð"ß :Ñ per ogni 8. Inoltre, si consideri l'ulteriore successione di v.a. Ð^8 Ñ8 " , dove ^8 œ W8 Î8 e W8 œ 83œ" \3 . Essendo EÒ^8 Ó œ EÒ\8 Ó œ : , allora EÒÐ^8 :Ñ# Ó œ VarÒ^8 Ó œ " :; VarÒ\8 Ó œ , 8 8 T da cui lim8 EÒÐ^8 :Ñ# Ó œ !. Dunque, si può concludere che ^8 œ W8 Î8 Ä : per 8 Ä ∞. Dal momento che W8 Î8 rappresenta la percentuale di successi in 8 esperimenti indipendenti dicotomici con probabilità di successo pari a : (ovvero quando si considera lo schema delle prove ripetute), allora il precedente risultato stabilisce che la percentuale di successi converge alla probabilità di successo nel singolo esperimento. Questa particolare convergenza in probabilità costituisce in effetti la Legge Debole dei Grandi Numeri di Jakob Bernoulli e sarà analizzata nella sua forma generale in questa Sezione. La condizione del Teorema 8.2.2 non è necessaria per la convergenza in probabilità verso una v.a. degenere. In effetti, tale convergenza si può verificare senza che EÒÐ\8 -Ñ# Ó converga verso zero. Ad esempio, questo può accadere con successioni di v.a. che non possiedono primo o secondo momento finito. Esempio 8.2.4. Si consideri la successione di v.a. discrete Ð\8 Ñ8 " , tale che la v.a. \8 prende valori sull'insieme W œ Ö!ß 8× con legge essenziale T Ð\8 œ !Ñ œ " "Î8 e T Ð\8 œ 8Ñ œ "Î8. La successione di v.a. converge in probabilità ad una v.a. degenere concentrata sullo !. In effetti, per & 8 risulta T Ðl\8 l &Ñ œ !, mentre per & 8 si ha T Ðl\8 l &Ñ œ " T Ð\8 œ !Ñ œ " . 8 11 Capitolo 8 T Dunque, si ottiene lim8 T Ðl\8 l &Ñ œ !, da cui \8 Ä ! per 8 Ä ∞. Tuttavia, è immediato verificare che EÒ\8# Ó œ 8 e quindi lim8 EÒ\8# Ó œ ∞. Inoltre, si ha EÒ\8 Ó œ ", da cui lim EÒ\8 Ó œ " , 8 ovvero la successione delle medie ÐEÒ\8 ÓÑ8 " non converge verso !. Esempio 8.2.5. Si consideri la v.a. assolutamente continua ^ che ammette d.p. data da 0^ ÐBÑ œ αD α" "Ò"ß∞Ò ÐDÑ . La legge associata a questa v.a. è detta Legge di Potenza di parametro α, dove α − Ó!ß ∞Ò. Si consideri inoltre la successione di v.a. Ð\8 Ñ8 " , dove \8 œ ^Î8. Si vuole verificare che per ogni α la successione di v.a. converge in probabilità ad una v.a. degenere concentrata sullo !. In effetti, si ha T Ðl\8 l &Ñ œ " T Ðl\8 l Ÿ &Ñ œ " T Ðl^l Ÿ 8&Ñ œ" 8& αD α" .D œ Ð8&Ñα , " da cui lim T Ðl\8 l &Ñ œ lim Ð8&Ñα œ ! 8 8 T e quindi \8 Ä ! per 8 Ä ∞. Tuttavia, è immediato verificare che per α − Ó!ß #Ó si ha EÒ^ # Ó œ ∞ e dunque risulta lim8 EÒ\8# Ó œ ∞. I prossimi Teoremi riguardano il legame esistente tra la convergenza in probabilità e la convergenza in distribuzione. Più esattamente, si dimostra che la convergenza in probabilità implica la convergenza in distribuzione, mentre la proposizione inversa è vera quando si ha la convergenza in distribuzione verso una v.a. degenere. Teorema 8.2.3. Date una v.a. \ e una successione di v.a. Ð\8 Ñ8 " definite T sullo stesso spazio probabilizzato ÐHß Y ß T Ñ, se \8 Ä \ per 8 Ä ∞ allora si _ ha \8 Ä \ per 8 Ä ∞. Dimostrazione. Se & !, allora risulta 12 Convergenze J\8 ÐBÑ œ T Ð\8 Ÿ BÑ œ T ÐÖ\8 Ÿ B× ∩ Öl\8 \l Ÿ &×Ñ T ÐÖ\8 Ÿ B× ∩ Öl\8 \l &×Ñ Ÿ T ÐÖ\ Ÿ B &× ∩ Öl\8 \l Ÿ &×Ñ T Ðl\8 \l &Ñ Ÿ T Ð\ Ÿ B &Ñ T Ðl\8 \l &Ñ . Dalla definizione di convergenza in probabilità si ha lim8 T Ðl\8 \l &Ñ œ ! e dunque lim sup J\8 ÐBÑ Ÿ J\ ÐB &Ñ . 8 In modo analogo si ottiene lim inf J\8 ÐBÑ J\ ÐB &Ñ . 8 Dal momento che & è arbitrario, per ogni B per cui J\ è continua si ha J\ ÐBÑ œ lim J\ ÐB &Ñ Ÿ lim inf J\8 ÐBÑ 8 &Ä! Ÿ lim sup J\8 ÐBÑ Ÿ lim J\ ÐB &Ñ œ J\ ÐBÑ , &Ä! 8 _ da cui segue lim8 J\8 ÐBÑ œ J\ ÐBÑ, ovvero \8 Ä \ per 8 Ä ∞. Teorema 8.2.4. Data una successione di v.a. Ð\8 Ñ8 " definite sullo spazio T _ probabilizzato ÐHß Y ß T Ñ, allora \8 Ä - per 8 Ä ∞ se e solo se \8 Ä - per 8 Ä ∞. Dimostrazione. Sulla base del Teorema 8.2.3 si deve dimostrare solo l'implicazione inversa. Se & !, si ha T Ðl\8 -l &Ñ œ " T Ðl\8 -l Ÿ &Ñ œ " J\8 Ð- &Ñ J\8 Ð- &Ñ T Ð\8 œ - &Ñ Ÿ " J\8 Ð- &Ñ J\8 Ð- &Ñ . _ Dal momento che \8 Ä - per 8 Ä ∞, ovvero lim8 J\8 ÐBÑ œ "Ò-ß∞Ò ÐBÑ per ogni B Á - , allora si ha lim8 J\8 Ð- &Ñ œ " e lim8 J\8 Ð- &Ñ œ !. Dunque, si ha lim Ð" J\8 Ð- &Ñ J\8 Ð- &ÑÑ œ ! , 8 T da cui segue che \8 Ä - per 8 Ä ∞. 13 Capitolo 8 Esempio 8.2.6. Analogamente all'Esempio 8.1.5, si consideri la successione di v.a. Ð^8 Ñ8 " , tale che la v.a. ^8 possiede legge Chi-quadrato ;#8 , e la successione di v.a. Ð\8 Ñ8 " , dove \8 œ ^8 Î8. Nel medesimo esempio è stato verificato che _ T \8 Ä " per 8 Ä ∞ e dunque dal Teorema 8.2.4 si ha anche che \8 Ä " per 8 Ä ∞. Si introducono di seguito alcuni risultati sulla convergenza per successioni di trasformate di v.a. In particolare, viene dato il cosiddetto Teorema di CramérSlutsky, che prende nome dallo statistico matematico svedese Harald Cramér (1893-1985) e dal probabilista ed economista russo Evgeny Evgenievich Slutsky (1880-1948). Teorema 8.2.5. Date una v.a. \ e una successione di v.a. Ð\8 Ñ8 " definite T sullo stesso spazio probabilizzato ÐHß Y ß T Ñ, se \8 Ä \ per 8 Ä ∞ e T 1 À ‘ È ‘ è una funzione continua, allora si ha 1Ð\8 Ñ Ä 1Ð\Ñ per 8 Ä ∞. Dimostrazione. Sia - una costante per cui si ha T Ðl\l -Ñ $ Î# con $ !. Inoltre, dal momento che 1 è continua, allora per 8 abbastanza elevato esiste un $ œ $ Ð&Ñ tale che T Ðl1Ð\8 Ñ 1Ð\Ñl &Ñ œ T ÐÖl1Ð\8 Ñ 1Ð\Ñl &× ∩ Öl\l Ÿ -×Ñ T ÐÖl1Ð\8 Ñ 1Ð\Ñl &× ∩ Öl\l -×Ñ Ÿ T ÐÖl\8 \l $ ×Ñ T ÐÖl\l -×Ñ $ $ Ÿ œ$, # # T da cui segue che 1Ð\8 Ñ Ä 1Ð\Ñ per 8 Ä ∞. Teorema 8.2.6. (Teorema di Cramér-Slutsky) Si considerino due successioni di v.a. Ð\8 Ñ8 " e Ð]8 Ñ8 " definite sullo stesso spazio probabilizzato _ ÐHß Y ß T Ñ e la v.a. \ definita sul medesimo spazio probabilizzato. Se \8 Ä \ e T ]8 Ä - per 8 Ä ∞, allora si ha _ \8 ]8 Ä \ - , _ \8 ]8 Ä \ - , 14 Convergenze _ \8 ]8 Ä -\ , \8 _ \ Ä ,-Á!, ]8 per 8 Ä ∞. Dimostrazione. Si dimostra la prima relazione. Si ha J\8 ]8 ÐBÑ œ T Ð\8 ]8 Ÿ BÑ œ T ÐÖ\8 ]8 Ÿ B× ∩ Öl]8 -l Ÿ &×Ñ T ÐÖ\8 ]8 Ÿ B× ∩ Öl\8 -l &×Ñ Ÿ T ÐÖ\8 Ÿ B - &× ∩ Öl]8 -l Ÿ &×Ñ T Ðl]8 -l &Ñ Ÿ T Ð\8 Ÿ B - &Ñ T Ðl]8 -l &Ñ . Dalla definizione di convergenza in probabilità si ha lim8 T Ðl]8 -l &Ñ œ ! e _ dal momento che \8 Ä \ , se ÐB - &Ñ è un punto di continuità per J\ , si ha lim sup J\8 ]8 ÐBÑ Ÿ J\ ÐB - &Ñ . 8 In modo analogo, se ÐB - &Ñ è un punto di continuità per J\ , si ottiene lim inf J\8 ]8 ÐBÑ J\ ÐB - &Ñ . 8 Dal momento che & può essere scelto piccolo in modo arbitrario e dal momento che l'insieme dei punti di discontinuità di J\ è al più numerabile (Teorema 3.2.6), per ogni ÐB -Ñ per cui J\ è continua si ha lim J\8 ]8 ÐBÑ œ J\ ÐB -Ñ , 8 _ ovvero \8 ]8 Ä \ - per 8 Ä ∞. Le altre relazioni si verificano in modo analogo. Esempio 8.2.7. Si consideri la successione di v.a. Ð^8 Ñ, dove la v.a. ^8 possiede legge > di Student con 8 gradi di libertà. Tenendo presente la Sezione 6.10, la v.a. ^8 può essere rappresentata come ^8 œ \8 Î]8 Î8, dove la v.a. \8 ammette legge Normale ridotta a Ð!ß "Ñ, mentre la v.a. ]8 ammette legge ChiT quadrato ;#8 . Dall'Esempio 8.2.6 si ha che ]8 Î8 Ä " per 8 Ä ∞. Inoltre, dal momento che la funzione 1 À B È B è continua, allora dal Teorema 8.2.5 si ha T che ]8 Î8 Ä " per 8 Ä ∞. Infine, tenendo presente che banalmente si ha 15 Capitolo 8 _ \8 Ä ^ , dove la v.a. ^ ammette legge Normale ridotta a Ð!ß "Ñ, dal Teorema _ 8.2.6 si ha dunque che ^8 Ä ^ per 8 Ä ∞. Il seguente Teorema fornisce un celebre risultato, ovvero la cosiddetta Legge Debole dei Grandi Numeri, nella sua forma più comune. Teorema 8.2.7. (Legge Debole dei Grandi Numeri) Sia Ð\8 Ñ8 " una successione di v.a. non correlate definite sullo spazio probabilizzato ÐHß Y ß T Ñ, tali che per ogni 8 si ha EÒ\8 Ó œ . e VarÒ\8 Ó - ∞. Data l'ulteriore T successione di v.a. ÐW8 Î8Ñ8 " , dove W8 œ 83œ" \3 , allora si ha W8 Î8 Ä . per 8 Ä ∞. Dimostrazione. Se ^8 œ W8 Î8, dal momento che EÒ^8 Ó œ EÒ\3 Ó œ . 8 3œ" e " 8 VarÒ^8 Ó œ # VarÒ\3 Ó , 8 3œ" 8 dalla disuguaglianza di Chebyshev (Teorema 4.3.7) si ha T Ðl^8 .l &Ñ Ÿ VarÒ^8 Ó . &# 8&# Dunque, risulta lim T Ðl^8 .l &Ñ œ ! , 8 T ovvero W8 Î8 Ä . per 8 Ä ∞. Un'ulteriore versione fondamentale della Legge Debole dei Grandi Numeri è stata ottenuta in un approccio generale dal probabilista russo Aleksandr Yakovlevich Khinchin (1894-1959) e viene data di seguito. Teorema 8.2.8. (Legge Debole dei Grandi Numeri di Khinchin) Sia Ð\8 Ñ8 " una successione di v.a. indipendenti con la medesima legge definite sullo spazio probabilizzato ÐHß Y ß T Ñ, tali che per ogni 8 si ha EÒ\8 Ó œ .. Data 16 Convergenze l'ulteriore successione di v.a. ÐW8 Î8Ñ8 " , dove W8 œ 83œ" \3 , allora si ha T W8 Î8 Ä . per 8 Ä ∞. Dimostrazione. Dal Teorema 7.1.6 si ha :\8 Ð>Ñ œ " i.> 9Ð>Ñ . Inoltre, dal Teorema 7.3.6 e dal Teorema 7.1.4 si ha i.> :W8 Î8 Ð>Ñ œ " 9Ð8" Ñ , 8 8 da cui lim :\8 Ð>Ñ œ expÐi.>Ñ . 8 _ Dunque, tenendo presente il Teorema 8.1.2 si ha W8 Î8 Ä . per 8 Ä ∞, ovvero T dal Teorema 8.2.4 si ottiene infine che W8 Î8 Ä . per 8 Ä ∞. 8.3. Convergenza quasi certa Un terzo concetto di convergenza, detto convergenza quasi certa, è dato nella seguente definizione. Definizione 8.3.1. Se Ð\8 Ñ8 " è una successione di v.a. definite sullo spazio probabilizzato ÐHß Y ß T Ñ, allora si dice che la successione converge quasi certamente alla v.a. \ , definita sul medesimo spazio probabilizzato, se l'evento Ö= − H À lim \8 Ð=Ñ œ \Ð=Ñ× œ Ölim \8 œ \× 8 si verifica ;Þ-Þ, ovvero se 8 T lim \8 œ \ œ " , 8 ;Þ-Þ e si scrive \8 Ä \ per 8 Ä ∞. Nel caso in cui la v.a. \ sia degenere e tale che T Ð\ œ -Ñ œ ", allora la condizione della Definizione 8.3.1 si riduce a 17 Capitolo 8 T lim \8 œ - œ " , 8 e con il solito abuso in notazione, la convergenza quasi certa viene denotata con ;Þ-Þ \8 Ä - per 8 Ä ∞. Risulta inoltre interessante notare che, dalla definizione di limite, l'evento Ölim8 \8 œ \× si verifica se per ogni intero 7 esiste un intero 8 tale che per ogni 5 8 si verifica l'evento Öl\5 \l Ÿ 7" ×. Dunque, anche tenendo presente la definizione di limite superiore di una successione di eventi, si ha Ölim \8 œ \× œ Öl\5 \l Ÿ 7" × ∞ 8 ∞ ∞ 7œ"8œ"5œ8 œ lim lim sup Öl\8 \l Ÿ 7" × , 7 8 ovvero, dal momento che Ðlim sup8 Öl\8 \l Ÿ 7" ×Ñ7 " è una successione decrescente di eventi e in base al Teorema 2.2.10, la condizione della Definizione 8.3.1 è equivalente a T lim \8 œ \ œ T Öl\5 \l Ÿ 7" × ∞ 8 ∞ ∞ 7œ"8œ"5œ8 œ lim T lim sup Öl\8 \l Ÿ 7" × œ " . 7 8 Il seguente Teorema stabilisce una condizione necessaria e sufficiente affinchè si verifichi la convergenza quasi certa. Teorema 8.3.2. Date una v.a. \ e una successione di v.a. Ð\8 Ñ8 " definite ;Þ-Þ sullo stesso spazio probabilizzato ÐHß Y ß T Ñ, allora \8 Ä \ per 8 Ä ∞ se e solo se per ogni & ! si ha lim T Öl\5 \l Ÿ &× œ " , ∞ 8 5œ8 o equivalentemente che lim T Öl\5 \l &× œ ! . ∞ 8 5œ8 18 Convergenze Dimostrazione. Posto G8ß7 œ Öl\5 \l Ÿ 7" × , ∞ 5œ8 si noti che la successione di eventi ÐG8ß7 Ñ8 " è crescente per ogni dato 7. Inoltre, la condizione della Definizione 8.3.1 è verificata se e solo se per ogni intero 7 si ha T G8ß7 œ " . ∞ 8œ" Tenendo presente la definizione di limite di successione crescente di eventi, dal Teorema 2.2.10 si ottiene inoltre T G8ß7 œ T lim G8ß7 œ lim T ÐG8ß7 Ñ , ∞ 8 8œ" 8 da cui segue la prima parte del Teorema. Inoltre, dalla relazione di De Morgan si ha G8ß7 œ Öl\5 \l 7" × , - ∞ 5œ8 da cui segue la seconda parte del Teorema. Esempio 8.3.1. Si consideri la successione di v.a. Ð\8 Ñ8 " dell'Esempio 8.2.1. Dal momento che si ha T Öl\5 \l &× œ T Öl\l 5 &× ∞ ∞ 5œ8 5œ8 œ T Ðl\l 8&Ñ œ # #FÐ8&Ñ allora risulta lim T Öl\5 \l &× œ # # lim FÐ8&Ñ œ ! ∞ 8 ;Þ-Þ 5œ8 e quindi \8 Ä \ per 8 Ä ∞. 8 19 Capitolo 8 Esempio 8.3.2. Si consideri la successione di v.a. Ð\8 Ñ8 " dell'Esempio 8.2.2. Dal momento che si ha T Öl\5 l &× œ T Öl^l 5 &× ∞ ∞ 5œ8 5œ8 œ T Ðl^l 8&Ñ œ " # arctanÐ8&Ñ , 1 allora risulta lim T Öl\5 l &× œ " ∞ 8 5œ8 # lim arctanÐ8&Ñ œ ! 1 8 ;Þ-Þ e quindi \8 Ä ! per 8 Ä ∞. Dal Teorema 8.3.2 si intuisce come la convergenza quasi certa implichi una condizione molto più forte di quella richiesta nella convergenza in probabilità. In effetti vale il seguente Teorema. Teorema 8.3.3. Date una v.a. \ e una successione di v.a. Ð\8 Ñ8 " definite ;Þ-Þ sullo stesso spazio probabilizzato ÐHß Y ß T Ñ, se \8 Ä \ per 8 Ä ∞ allora si T ha \8 Ä \ per 8 Ä ∞. Dimostrazione. Dato & !, per ogni 8 si ha T Ðl\8 \l &Ñ Ÿ T Öl\5 \l &× . ∞ 5œ8 ;Þ-Þ Dunque, se \8 Ä \ per 8 Ä ∞, dal Teorema 8.3.2 e dalla precedente relazione T si ha lim8 T Ðl\8 \l &Ñ œ !, ovvero \8 Ä \ per 8 Ä ∞. Esempio 8.3.3. Si consideri la successione di v.a. discrete Ð\8 Ñ8 " dell'Esempio 8.2.4, assumendo l'indipendenza delle v.a. Evidentemente, anche in questo caso T si ha \8 Ä ! per 8 Ä ∞. Dunque, in base al Teorema 8.3.3, se vi è convergenza quasi certa la successione deve necessariamente convergere verso una v.a. degenere concentrata sullo !. Tuttavia, per ogni % ! si ha T Ðl\8 l &Ñ œ "Î8, e quindi ∞ 8œ" T Ðl\8 l &Ñ œ ∞. Dunque, dal Lemma di 20 Convergenze Borel-Cantelli (Teorema 2.7.1) si ha che T Ðlim sup8 l\8 l &Ñ œ ", ovvero la successione non può converge quasi certamente a !. Il seguente Teorema fornisce condizioni sufficienti per la convergenza quasi certa verso una v.a. degenere. Teorema 8.3.4. Data una successione di v.a. Ð\8 Ñ8 " definite sullo stesso ;Þ-Þ spazio probabilizzato ÐHß Y ß T Ñ, allora \8 Ä - per 8 Ä ∞ se per ogni & si ha T Ðl\8 -l &Ñ ∞ . ∞ 8œ" ;Þ-Þ Alternativamente, \8 Ä - per 8 Ä ∞ se esiste un $ ! per cui si ha EÒl\8 -l$ Ó ∞ . ∞ 8œ" Dimostrazione. Si ha T Öl\5 \l &× Ÿ T Ðl\5 -l &Ñ . ∞ ∞ 5œ8 5œ8 Dal momento che l'ipotesi di convergenza della serie ∞ 8œ" T Ðl\8 -l &Ñ implica lim T Ðl\5 -l &Ñ œ ! , ∞ 8 5œ8 segue la prima parte del Teorema. Tenendo presente la disuguaglianza di Markov, si ha inoltre " ∞ T Ðl\5 -l &Ñ œ T Ðl\5 -l & Ñ Ÿ $ EÒl\5 -l$ Ó . & 5œ8 5œ8 5œ8 ∞ ∞ $ $ $ Dal momento che l'ipotesi di convergenza della serie ∞ 8œ" EÒl\8 -l Ó implica lim EÒl\5 -l$ Ó œ ! , ∞ 8 5œ8 allora si ha la seconda parte del Teorema. 21 Capitolo 8 Esempio 8.3.4. In modo simile all'Esempio 8.2.3, si consideri la successione di v.a. indipendenti Ð\8 Ñ8 " tale che la v.a. \8 possiede legge Binomiale U Ð"ß :Ñ per ogni 8. Inoltre, si consideri l'ulteriore successione di v.a. Ð^8 Ñ8 " , dove ^8 œ W8 Î8 e W8 œ 83œ" \3 . Tenendo presente la seconda condizione del Teorema 8.3.4, posto $ œ %, dal momento che W8 possiede legge Binomiale UÐ8ß :Ñ si ha " $:# ; # :;Ð" ':;Ñ % EÒÐ^8 :Ñ Ó œ % EÒÐW8 8:Ñ Ó œ , 8 8# 8$ % dove l'ultima relazione è stata ottenuta attraverso l'applicazione laboriosa, ma ovvia, del Teorema 7.1.5. Dunque, dalla definizione della funzione Zeta di Riemann (si veda Esempio 7.2.7), risulta EÒÐ^8 :Ñ% Ó œ $:# ; # ' Ð#Ñ :;Ð" ':;Ñ' Ð$Ñ ∞ , ∞ 8œ" dove ' Ð#Ñ œ 1# Î' e ' Ð$Ñ ' Ð%Ñ œ 1% Î*!. Dunque, si può concludere che ;Þ-Þ ^8 œ W8 Î8 Ä : per 8 Ä ∞. Questa particolare convergenza quasi certa costituisce un caso particolare della Legge Forte dei Grandi Numeri. Il seguente Teorema fornisce la cosiddetta Legge Forte dei Grandi Numeri, nella sua forma introdotta da Andrej Kolmogorov. Teorema 8.3.5. (Legge Forte dei Grandi Numeri di Kolmogorov) Sia Ð\8 Ñ8 " una successione di v.a. indipendenti con la medesima legge definite sullo spazio probabilizzato ÐHß Y ß T Ñ, tali che per ogni 8 si ha EÒ\8 Ó œ .. Data l'ulteriore successione di v.a. ÐW8 Î8Ñ8 " , dove W8 œ 83œ" \3 , allora si ha ;Þ-Þ W8 Î8 Ä . per 8 Ä ∞. Dimostrazione. Si veda Billingsley (1995 p.85). 8.4. Convergenza in media Un ulteriore concetto di convergenza, che è usualmente detto convergenza in media di ordine : (o semplicemente in media quadratica quando : œ #), viene definito di seguito. La convergenza in media sarà centrale nello sviluppo della teoria dell'integrazione stocastica presentata nel Capitolo 10. 22 Convergenze Definizione 8.4.1. Se Ð\8 Ñ8 " è una successione di v.a. definite sullo spazio probabilizzato ÐHß Y ß T Ñ e se : − Ó!ß ∞Ò, allora si dice che la successione converge in media di ordine : alla v.a. \ , definita sul medesimo spazio probabilizzato, se si ha lim EÒl\8 \l: Ó œ ! 8 P: e si scrive \8 Ä \ per 8 Ä ∞. La convergenza in media di ordine : risulta effettivamente equivalente alla convergenza in norma di ordine : in Teoria della Misura. Questo è il motivo per cui questo tipo di convergenza viene indicata con il simbolo P: (si veda l'Appendice A). Nel caso in cui la v.a. \ sia degenere e tale che T Ð\ œ -Ñ œ ", allora la condizione della Definizione 8.4.1 si riduce a lim EÒl\8 -l: Ó œ ! 8 P: e si scrive \8 Ä - per 8 Ä ∞ con il solito abuso in notazione. Esempio 8.4.1. Si consideri una successione Ð\8 Ñ8 " di v.a. indipendenti con la medesima legge e tali che per ogni 8 si ha EÒ\8 Ó œ . e VarÒ\8 Ó œ 5 # ∞. Si consideri inoltre l'ulteriore successione di v.a. ÐW8 Î8Ñ8 " con W8 œ 83œ" \3 . Dal momento che EÒW8 Ó œ 8. e VarÒW8 Ó œ 85 # , allora si ha EÒÐW8 8.Ñ# Ó VarÒW8 Ó 5# lim EÒÐW8 Î8 .Ñ Ó œ lim œ lim œ lim œ!. 8 8 8 8 8 8# 8# # P# Dunque, risulta W8 Î8 Ä . per 8 Ä ∞. Inoltre, dal momento che si ha "Î# EÒlW8 Î8 .lÓ Ÿ EÒÐW8 Î8 .Ñ# Ó P" per la disuguaglianza di Lyapunov (Teorema 4.3.2), allora risulta W8 Î8 Ä . per 8 Ä ∞. La convergenza in media di ordine : implica la convergenza in probabilità. Questo risultato era già stato in effetti evidenziato nel Teorema 8.2.2 nel caso di convergenza ad una variabile degenere e viene generalizzato nel seguente Teorema. 23 Capitolo 8 Teorema 8.4.2. Date una v.a. \ e una successione di v.a. Ð\8 Ñ8 " definite sullo stesso spazio probabilizzato ÐHß Y ß T Ñ, se esiste un : − Ó!ß ∞Ò per cui si ha P: T \8 Ä \ per 8 Ä ∞ allora risulta \8 Ä \ per 8 Ä ∞. Dimostrazione. Dalla disuguaglianza di Markov (Teorema 4.3.6) si ha EÒl\8 \l: Ó T Ðl\8 \l &Ñ œ T Ðl\8 \l & Ñ Ÿ &: : : e dal momento che dalle ipotesi fatte si ha lim8 EÒl\8 \l: Ó œ !, allora risulta T anche lim8 T Ðl\8 \l &Ñ œ !, ovvero \8 Ä \ per 8 Ä ∞. Per quanto riguarda la relazione fra convergenza quasi certa e convergenza in media di ordine :, in generale non si possono fare affermazioni. In effetti, ci sono casi in cui vi è convergenza quasi certa, ma non quella in media di ordine : e viceversa. I seguenti esempi evidenziano queste situazioni. Esempio 8.4.2. Si consideri una v.a. ^ con legge Uniforme su Ó!ß "Ò e la successione Ð\8 Ñ8 " dove \8 œ #8 "Ò!ß"Î8Ò Ð^Ñ. Evidentemente la v.a. \8 è discreta ed è definita su Ö!ß #8 × con probabilità T Ð\8 œ !Ñ œ " "Î8 e T Ð\8 œ #8 Ñ œ "Î8. Tenendo presente il Teorema 8.3.2, si ha lim T Öl\5 l &× œ lim T Ð\8 &Ñ œ lim ∞ 8 8 5œ8 8 " œ!, 8 ;Þ-Þ ovvero \8 Ä !. Tuttavia, dal momento che #8: lim EÒl\8 l Ó œ lim œ∞, 8 8 8 : non vi è convergenza in media per nessun valore di :. Esempio 8.4.3. Si consideri una v.a. ^ con legge Uniforme su Ó!ß "Ò e sia data inoltre la successione Ð\8 Ñ8 " dove \8 œ "Ò4#7 ßÐ4"Ñ#7 Ò Ð^Ñ con 8 œ #7 4, 4 œ Ö!ß "ß á ß #7 "× e 7 − . Dunque, \" œ "Ò!ß"Ò Ð^Ñ, \# œ "Ò!ß"Î#Ò Ð^Ñ, \$ œ "Ò"Î#ß"Ò Ð^Ñ, \% œ "Ò!ß"Î%Ò Ð^Ñ, \& œ "Ò"Î%ß"Î#Ò Ð^Ñ, \' œ "Ò"Î#ß$Î%Ò Ð^Ñ, \( œ "Ò$Î%ß"Ò Ð^Ñ e così via. In questo caso, \" è una v.a. degenere tale che T Ð\" œ "Ñ œ ", mentre \8 è una v.a. di Bernoulli di parametro T Ð\8 œ "Ñ œ #7 per 8 œ #7 4 ". Dal momento che 24 Convergenze lim EÒl\8 l: Ó œ lim #7: œ ! , 8 7 P: allora \8 Ä ! per ogni valore di :. Tuttavia, dal Teorema 8.3.2, si ha lim T Öl\5 l &× œ lim T Ð\" œ "Ñ œ " , ∞ 8 5œ8 8 ovvero la successione non può converge quasi certamente a !. Il prossimo teorema fornisce una condizione per la quale la convergenza quasi certa implica la convergenza in media di ordine :. Teorema 8.4.3. Date una v.a. \ e una successione di v.a. Ð\8 Ñ8 " definite ;Þ-Þ sullo stesso spazio probabilizzato ÐHß Y ß T Ñ, se \8 Ä \ per 8 Ä ∞ e P: Öl\8 l Ÿ ] × ;Þ-Þ per una v.a. ] tale che EÒ] : Ó ∞, allora si ha \8 Ä \ per 8 Ä ∞. Dimostrazione. Si noti che dalle assunzioni si ha EÒl\8 l: Ó Ÿ EÒ] : Ó ∞. ;Þ-Þ Inoltre, dal momento che \8 Ä \ , allora risulta anche EÒl\l: Ó Ÿ EÒ] : Ó ∞ e Öl\l Ÿ ] × ;Þ-Þ Dunque, si ha Öl\8 \l Ÿ #] × ;Þ-Þ, da cui EÒl\8 \l: Ó œ EÒl\8 \l: "Ò!ß&Ò Ðl\8 \lÑ EÒl\8 \l: "Ò&ß∞Ò Ðl\8 \lÑÓ Ÿ &: #: EÒ] : "Ò&ß∞Ò Ðl\8 \lÑÓ ;Þ-Þ Dal momento che \8 Ä \ , allora lim8 EÒ] : "Ò&ß∞Ò Ðl\8 \lÑÓ œ ! si ha anche T che \8 Ä \ . Dunque dal momento che & è arbitrario, dalla precedente relazione segue che lim8 EÒl\8 \l: Ó œ !, ovvero si ha la tesi. 8.5. Teoremi limite Si considerano di seguito alcuni teoremi di convergenza che hanno importanti aspetti applicativi in ambiti come la statistica inferenziale. Questi classici risultati sono comunemente denominati come Teoremi Centrali del Limite (dove centrale va inteso nel senso di fondamentale) sulla base di una traduzione 25 Capitolo 8 leggermente impropria dalla terminologia inglese, ma di uso comune nella letteratura italiana. Teorema 8.5.1. (Teorema Centrale del Limite di Lindeberg-Lévy) Sia Ð\8 Ñ8 " una successione di v.a. indipendenti con la medesima legge e definite sullo spazio probabilizzato ÐHß Y ß T Ñ, tali che per ogni 8 si ha EÒ\8 Ó œ . e VarÒ\8 Ó œ 5 # ∞. Si consideri inoltre la successione di v.a. Ð^8 Ñ8 " con ^8 œ W8 EÒW8 Ó W8 8. œ VarÒW8 Ó 5 8 _ e W8 œ 83œ" \3 . Se la v.a. ^ possiede legge a Ð!ß "Ñ, allora ^8 Ä ^ per 8 Ä ∞. Dimostrazione. Se ]3 œ Ð\3 .ÑÎ5, si ha EÒ]3 Ó œ ! e VarÒ]3 Ó œ ". Sulla base del Teorema 7.1.6, per > Ä ! la f.c. della v.a. ]3 può essere espressa come Ði>Ñ# ># # # :]3 Ð>Ñ œ " i>EÒ]3 Ó EÒ]3 Ó 9Ð> Ñ œ " 9Ð># Ñ . # # Dal momento che " 8 ] , ^8 œ 8 3œ" 3 allora si ottiene 8 > ># :^8 Ð>Ñ œ :]3 œ " 9Ð8# Ñ . 8 #8 8 Dunque, si ha ># lim :^8 Ð>Ñ œ exp , 8 # ovvero dal Teorema di Lévy (Teorema 8.1.2) si ottiene la tesi. Questa versione di Teorema Centrale del Limite è stata appunto introdotta da Paul Lévy e dal probabilista finnico Jarl Waldemar Lindeberg (1876-1932). Il Teorema 8.5.1 contiene come caso particolare la versione primitiva del Teorema Centrale del Limite data da Abraham de Moivre, nella quale si assume che Ð\8 Ñ8 " sia una successione di v.a. indipendenti con la medesima legge e tale 26 Convergenze che ogni v.a. \8 ammette legge di Bernoulli U Ð"ß :Ñ. Dal momento che W8 œ 83œ" \3 ammette legge Binomiale U Ð8ß :Ñ (si veda l'Esempio 7.4.3), il Teorema Centrale del Limite dato da De Moivre fornisce la convergenza in legge della successione di v.a. standardizzate Ð^8 Ñ8 " , dove ^8 œ ÐW8 8:ÑÎ8:; , ad una v.a. con legge a Ð!ß "Ñ per 8 Ä ∞. La seguente versione di Teorema Centrale del Limite può essere applicata a successioni di v.a. indipendenti con differenti medie e varianze. Il Teorema, oltre che da Paul Lévy e da Jarl Lindeberg, prende nome dal grande probabilista croato Vilibald (William) Srecko Feller (1906-1970). Figure 8.5.1. Vilibald (William) Srecko Feller (1906-1970). Teorema 8.5.2. (Teorema Centrale del Limite di Lindeberg-Lévy-Feller) Sia Ð\8 Ñ8 " una successione di v.a. indipendenti definite sullo spazio probabilizzato ÐHß Y ß T Ñ, tali che EÒ\8 Ó œ .8 e VarÒ\8 Ó œ 58# ∞ per ogni 8. Posto @8# œ 83œ" 53# , si consideri inoltre la successione di v.a. Ð^8 Ñ8 " con " 8 Ð\3 .3 Ñ . ^8 œ @8 3œ" Se per ogni & ! si ha " 8 lim # EÒÐ\3 .3 Ñ# "Ó&@8 ß∞Ò Ðl\3 .3 lÑÓ œ ! , 8 @8 3œ" _ allora ^8 Ä ^ per 8 Ä ∞, dove la v.a. ^ possiede legge a Ð!ß "Ñ. Dimostrazione. Si veda Billingsley (1995, p.359). 27 Capitolo 8 La prossima versione di Teorema Centrale del Limite è dovuta a Lyapunov. Nelle medesime ipotesi del Teorema Centrale del Limite dato da LindebergLévy-Feller, questa versione richiede su una condizione più forte, ma spesso più facile da verificare. Teorema 8.5.3. (Teorema Centrale del Limite di Lyapunov) Sia Ð\8 Ñ8 " una successione di v.a. indipendenti definite sullo spazio probabilizzato ÐHß Y ß T Ñ, tali che EÒ\8 Ó œ .8 e VarÒ\8 Ó œ 58# ∞ per ogni 8. Posto @8# œ 83œ" 53# , si consideri inoltre la successione di v.a. Ð^8 Ñ8 " con " 8 Ð\3 .3 Ñ . ^8 œ @8 3œ" Se esiste un $ # tale che EÒl\8 l$ Ó ∞ per ogni 8 e che lim 8 " $ Î# @8 EÒl\3 .3 l$ Ó œ ! , 8 3œ" _ allora ^8 Ä ^ per 8 Ä ∞, dove la v.a. ^ possiede legge a Ð!ß "Ñ. Dimostrazione. Si veda Billingsley (1995, p.362). Esempio 8.5.1. Si consideri la successione di v.a. indipendenti Ð\8 Ñ8 " tale che la v.a. \8 possiede legge Binomiale U Ð"ß :8 Ñ. Risulta dunque @8# œ 83œ" :3 ;3 . Inoltre, dal momento che Öl\3 :3 l Ÿ "× ;Þ-Þ, segue che EÒl\3 :3 l$ Ó œ EÒÐ\3 :3 Ñ# l\3 :3 lÓ Ÿ EÒÐ\3 :3 Ñ# Ó œ :3 ;3 . Dunque, considerando il Teorema 8.5.3 con $ œ $, si ha $ $Î# @8 EÒl\3 .3 l Ó Ÿ 8 " 3œ" " $Î# @8 :3 ;3 œ 8 3œ" " @8 e la relativa condizione è dunque soddisfatta se lim8 @8 œ ∞. In questo caso, se si considera la successione di v.a. Ð^8 Ñ8 " , con W8 83œ" :3 " 8 Ð\3 :3 Ñ œ ^8 œ 83œ" :3 ;3 @8 3œ" _ e W8 œ 83œ" \3 , si ha ^8 Ä ^ per 8 Ä ∞ dove la v.a. ^ possiede legge a Ð!ß "Ñ. Questo risultato costituisce in effetti una estensione del Teorema 28 Convergenze Centrale del Limite dato da De Moivre. In particolare, se esiste - − Ó!ß "Ò tale che :3 − Ó-ß " -Ò, allora si ha anche ;3 − Ó-ß " -Ò e da cui segue @8 8- # , ovvero la condizione di Lyapunov è soddisfatta. La condizione di Lyapunov può essere soddisfatta perfino se lim8 :8 œ !. Ad esempio, se :8 œ 8" , allora si ha @8 œ 3 8 3# 8 " 3œ" 3œ" " e quindi la condizione è verificata dal momento che la serie ∞ non 3œ" 3 ∞ converge, mentre risulta 3œ" 3# œ 1# Î'. Si considera infine un teorema di convergenza, comunemente detto metodo Delta, che è spesso di notevole utilità pratica per lo studio di successioni di v.a. Teorema 8.5.4. (Metodo Delta) Sia Ð\8 Ñ8 " una successione di v.a. indipendenti con la medesima legge e definite sullo spazio probabilizzato ÐHß Y ß T Ñ. Sia inoltre Ð^8 Ñ8 " la successione di v.a. con ^8 œ 8 \8 ) , < _ dove ) e < sono opportune costanti, tale che ^8 Ä ^ per 8 Ä ∞ e dove la v.a. ^ possiede legge a Ð!ß "Ñ. Se 1 À ‘ È ‘ è una funzione continua e differenziabile tale che 1w Ð)Ñ Á !, data la successione di v.a. Ð]8 Ñ8 " con ]8 œ 8 1Ð\8 Ñ 1Ð)Ñ , l1w Ð)Ñl< _ si ha ]8 Ä ^ per 8 Ä ∞. Dimostrazione. Si veda Billingsley (1995). Esempio 8.5.2. Sia ÐW8 Î8Ñ8 " una successione di v.a. indipendenti e con la medesima legge tale che ogni v.a. W8 ammette legge di Binomiale U Ð8ß :Ñ. Dal Teorema Centrale del Limite dato da De Moivre la successione di v.a. Ð^8 Ñ8 " con ^8 œ 8 W8 Î8 : :Ð" :Ñ 29 Capitolo 8 _ è tale che ^8 Ä ^ per 8 Ä ∞, dove la v.a. ^ possiede legge a Ð!ß "Ñ. Dunque, se 1 À ‘ È ‘ è una funzione continua e differenziabile tale che 1w Ð:Ñ Á !, per la successione di v.a. Ð]8 Ñ8 " con ]8 œ 8 1ÐW8 Î8Ñ 1Ð:Ñ , l1w Ð:Ñl:Ð" :Ñ _ si ha ]8 Ä ^ per 8 Ä ∞. In particolare, se si richiede l1w Ð:Ñl:Ð" :Ñ œ ", allora deve risultare 1Ð:Ñ œ #arcsin:, ovvero si ottiene che ]8 œ #8 ÐarcsinW8 Î8 arcsin:Ñ . Questa particolare scelta della funzione 1 è detta in generale trasformazione stabilizzatrice, in quanto permette di ottenere una costante al denominatore della precedente definizione della v.a. ]8 . Questo risultato è spesso utile nella statistica inferenziale. 8.6. Convergenza di vettori aleatori I concetti di convergenza possono essere estesi al caso di v.v.a. Per quanto riguarda la notazione adottata in questo capitolo, m † m denota come al solito la distanza euclidea in ‘5 . Inoltre, se J\ rappresenta la f.r.c. di un v.v.a. \ con 5 componenti marginali, B œ ÐB" ß á ß B5 ÑT è un punto di continuità di J\ se la frontiera dell'insieme Ó ∞ß B" Ó ‚ â ‚ Ó ∞ß B5 Ó ha probabilità nulla. Definizione 8.6.1. Se Ð\8 Ñ8 " è una successione di v.v.a. (ognuno dei quali possiede 5 componenti marginali) a cui corrisponde la successione di f.r.c. ÐJ\8 Ñ8 " , si dice che la successione di v.v.a. converge in legge al v.v.a. \ con f.r.c. J\ se per ogni punto di continuità B − ‘5 di J\ si ha lim J\8 ÐBÑ œ J\ ÐBÑ 8 _ e si scrive \8 Ä \ per 8 Ä ∞. Se Ð\8 Ñ8 " è una successione di v.v.a. definiti sullo spazio probabilizzato ÐHß Y ß T Ñ, si dice che la successione di v.v.a. converge in probabilità al v.v.a. \ , definito sul medesimo spazio probabilizzato, se per ogni & ! si ha 30 Convergenze lim T Ðm\8 \m &Ñ œ ! 8 T e si scrive \8 Ä \ per 8 Ä ∞. Se Ð\8 Ñ8 " è una successione di v.v.a. definiti sullo spazio probabilizzato ÐHß Y ß T Ñ, si dice che la successione di v.v.a. converge quasi certamente al v.v.a. \ , definito sul medesimo spazio probabilizzato, se l'evento Ö= − H À lim8 \8 Ð=Ñ œ \Ð=Ñ× œ Ölim8 \8 œ \× ;Þ-Þ si verifica ;Þ-Þ e si scrive \8 Ä \ per 8 Ä ∞. Se Ð\8 Ñ8 " è una successione di v.v.a. definiti sullo spazio probabilizzato ÐHß Y ß T Ñ, si dice che la successione di v.v.a. converge in media di ordine : al v.v.a. \ , definito sul medesimo spazio probabilizzato, se lim EÐm\8 \m: Ñ œ ! 8 P: per : − Ó!ß ∞Ò e si scrive \8 Ä \ per 8 Ä ∞. La gran parte dei risultati ottenuti per successioni di v.a. possono essere opportunamente estesi al caso di v.v.a. Di conseguenza, vengono considerati nel seguito solo alcuni Teoremi che hanno interesse specifico per v.v.a. Il prossimo Teorema consente di determinare la convergenza in legge di una successione di v.v.a. attraverso la convergenza in legge di combinazioni lineari degli elementi della successione ed è dovuto a Harald Cramér e allo statistico matematico norvegese Herman Ole Andreas Wold (1908-1992). Teorema 8.6.2. (Teorema di Cramér-Wold) Data una successione di v.v.a. _ Ð\8 Ñ8 " (ognuno dei quali possiede 5 componenti marginali), allora \8 Ä \ _ per 8 Ä ∞ se e solo se - T \8 Ä - T \ per ogni - − ‘5 . Dimostrazione. Si veda Billingsley (1995, p.383). Esempio 8.6.1. Si consideri la successione di v.v.a. Ð^8 Ñ8 " tale che ogni v.v.a. ^8 possiede legge Normale Multivariata a5 Ð.\ ß O\ Ñ e l'ulteriore successione di v.v.a. Ð\8 Ñ8 " dove \8 œ 8" ^8 . Dall'Esempio 7.3.2 è noto che la v.a. - T ^8 possiede legge Normale a Ð- T .\ ß - T O\ -Ñ. Dunque, la v.a. - T \8 è tale che EÒ- T \8 Ó œ " T - .\ 8 31 Capitolo 8 e VarÒ- T \8 Ó œ " T - O\ - . 8# T Di conseguenza, dal Teorema 8.2.2 segue che - T \8 Ä ! per 8 Ä ∞ e quindi _ dal Teorema 8.2.4 si ottiene che - T \8 Ä ! per 8 Ä ∞. Dunque, dal Teorema _ 8.6.2 risulta infine che \8 Ä ! per 8 Ä ∞, ovvero la successione di v.v.a. converge in legge ad un v.v.a. degenere concentrato sul vettore a componenti nulle. Teorema 8.6.3. Data una successione di v.v.a. Ð\8 Ñ8 " (ognuno dei quali T possiede 5 componenti marginali), allora \8 Ä \ per 8 Ä ∞ se e solo se ogni componente marginale del v.v.a. \8 converge in probabilità alla rispettiva ;Þ-Þ componente marginale del v.v.a. \ . Analogamente, \8 Ä \ per 8 Ä ∞ se e solo se ogni componente marginale del v.v.a. \8 converge quasi certamente alla rispettiva componente marginale del v.v.a. \ . Dimostrazione. Si veda Billingsley (1995, p.378). Esempio 8.6.2. Si consideri la successione di v.v.a. Ð^8 Ñ8 " tale che il v.v.a. ^8 possiede legge Multinomiale `Ð8ß :Ñ con : œ Ð:" ß á ß :5 ÑT e l'ulteriore successione di v.v.a. Ð\8 Ñ8 " dove \8 œ 8" ^8 . Dall'Esempio 7.4.1 è noto che la 4-esima componente marginale del v.v.a. ^8 ha legge Binomiale U Ð8ß :4 Ñ e dunque dall'Esempio 8.3.4 si ottiene che la 4-esima componente marginale del v.v.a. \8 converge quasi certamente ad una v.a. degenere concentrata su :4 . ;Þ-Þ Quindi, dal Teorema 8.6.3 si ha infine che \8 Ä : per 8 Ä ∞, ovvero la successione di v.v.a. converge quasi certamente al v.v.a. degenere concentrato sul vettore :. Teorema 8.6.4. (Teorema Centrale Multivariato del Limite) Sia Ð\8 Ñ8 " una successione di v.v.a. indipendenti con la medesima legge (ognuno dei quali possiede 5 componenti marginali) e definiti sullo spazio probabilizzato ÐHß Y ß T Ñ, tali che per ogni 8 si ha EÒ\8 Ó œ .\ e VarÒ\8 Ó œ O\ dove detÐO\ Ñ ∞. Si consideri inoltre la successione di v.a. Ð^8 Ñ8 " con ^8 œ " ÐW 8.Ñ 8 8 32 Convergenze e W8 œ 83œ" \3 . Se la v.a. ^ possiede legge Normale Multivariata a5 Ð!ß O\ Ñ, _ allora ^8 Ä ^ per 8 Ä ∞. Dimostrazione. Si veda Billingsley (1995, p.385). Esempio 8.6.3. Si consideri la successione di v.v.a. Ð\8 Ñ8 " tale che ogni v.v.a. ^8 possiede legge Multinomiale `Ð"ß :Ñ. Inoltre, dall'Esempio 7.4.5 risulta che il v.v.a. W8 possiede legge Multinomiale `Ð8ß :Ñ. Dunque, il Teorema Centrale Multivariato del Limite fornisce la convergenza in legge della successione di v.v.a. Ð^8 Ñ8 " , dove ^8 œ 8"Î# ÐW8 8:Ñ, ad un v.v.a. che possiede legge a5 Ð!ß diagÐ:Ñ ::T Ñ per 8 Ä ∞. Teorema 8.6.5. (Metodo Delta Multivariato) Sia Ð\8 Ñ8 " una successione di v.v.a. indipendenti con la medesima legge (ognuno dei quali possiede 5 componenti marginali) e definiti sullo spazio probabilizzato ÐHß Y ß T Ñ. Sia inoltre Ð^8 Ñ8 " la successione di v.v.a. con ^8 œ 8Ð\8 )Ñ, tale che _ ^8 Ä ^ per 8 Ä ∞, dove il v.v.a. ^ possiede legge Normale Multivariata a5 Ð!ß R Ñ, mentre ) − ‘5 e R è una matrice simmetrica definita positiva. Se ` 1 À ‘5 È ‘2 è una funzione continua e differenziabile tale che E œ `B 1ÐBÑBœ) è una matrice non nulla, data la successione di v.v.a. Ð]8 Ñ8 " con _ ]8 œ 8Ð1Ð\8 Ñ 1Ð)ÑÑ, si ha ]8 Ä ] per 8 Ä ∞, dove il v.v.a. ^ possiede legge Normale Multivariata a2 Ð!ß ET R EÑ. Dimostrazione. Si veda Billingsley (1995, p.385). 8.7. Riferimenti bibliografici I testi di Ferguson (1996), Serfling (1980) e van der Vaart (1998) considerano estesamente gli argomenti relativi alle convergenze probabilistiche, con speciale attenzione alle applicazioni statistiche. Il testo di Petrov (1995) è espressamente dedicato ai teoremi limite. I testi con approccio alla probabilità basato sulla Teoria della Misura hanno ampie parti dedicati alle convergenze e ai teoremi limite, come ad esempio Ash e Doléans-Dade (2000), Billingsley (1995), Gut (2005) e Resnick (2014). Capitolo 9 Processi aleatori 9.1. Concetti preliminari Molti esperimenti o fenomeni aleatori danno luogo ad un insieme di realizzazioni all'evolversi di un “parametro”, come ad esempio il tempo. In questo caso, l'interesse si concentra sull'analisi di collezioni di v.a. indicizzate su un determinato insieme, che nella Teoria della Probabilità sono dette processi aleatori. Formalmente, si ha la seguente definizione. Definizione 9.1.1. Se “ © Ò!ß ∞Ò è un insieme di indici, una collezione di v.a. \ œ Ð\> Ñ>−“ definita sullo spazio probabilizzato ÐHß Y ß T Ñ è detta processo aleatorio (p.a.) se l'applicazione \ À “ ‚ H È ‘, dove \Ð>ß =Ñ œ \> Ð=Ñ, è misurabile rispetto alla 5 -algebra U Ð“Ñ Œ Y . Per un dato > − “, la v.a. \> è detta stato del p.a. a tempo >Þ Al contrario, per un dato = − H, l'applicazione > È \> Ð=Ñ è detta traiettoria del p.a. associata con =. Anche se in generale si possono considerare spazi complessi per “, si noti che nella precedente Definizione l'insieme “ è stato assimilato in effetti ad un insieme di tempi. Nel seguito si assumerà principalmente che “ œ o che “ œ Ò!ß ∞Ò (o eventualmente un loro sottoinsieme). Più esattamente, il p.a. sarà detto a tempo discreto se cardÐ“Ñ è finita o numerabile o a tempo continuo se cardÐ“Ñ non è numerabile. Inoltre, quando “ œ , il p.a. si riduce ad una successione di v.a. e si enfatizzerà questo fatto adottando l'indice 8 piuttosto che l'indice >. Esempio 9.1.1. Si consideri una successione di v.a. Ð^8 Ñ8 " a componenti indipendenti con legge di Bernoulli di parametro : e si definisca il p.a. a tempo discreto \ œ Ð\8 Ñ8 ! dove \8 œ 83œ" ^3 e \! œ ! ;Þ-Þ In questo caso, si ha ovviamente “ œ . Inoltre, per quanto visto nella Sezione 6.1, per un determinato 8 " lo stato \8 è una v.a. con legge Binomiale U Ð8ß :Ñ, mentre una traiettoria è una successione non decrescente a valori su tale che gli 2 Processi aleatori incrementi fra due termini successivi sono nulli o pari all'unità. In un ambito di gioco d'azzardo, piuttosto che la successione originale Ð^8 Ñ8 " , si considera invece la successione Ð]8 Ñ8 " , dove ]8 œ #^8 ", ovvero si ottiene il p.a. a 8 tempo discreto \ œ Ð\8 Ñ8 ! dove \8 œ 83œ" ]3 œ #3œ" ^3 8. In questo caso, il p.a. \ viene assimilato ad una successione di giocate in cui si vince un'unità con probabilità : e si perde un'unità con probabilità Ð" :Ñ ad ogni giocata. Lo stato \8 risulta dunque la v.a. che rappresenta la somma vinta (o perduta) a tempo 8, mentre una traiettoria è la successione delle somme vinte (o perdute). Con un termine pittoresco, questo p.a. è detto passeggiata aleatoria e sarà analizzato in dettaglio nella Sezione 9.3. Esempio 9.1.2. Sia “ œ Ò!ß X Ó e sia ! œ >! >" á >8 œ X una partizione di Ò!ß X Ó. Inoltre, si consideri il v.v.a. ^ œ Ð^! ß á ß ^8" ÑT e si definisca il p.a. a tempo continuo \ œ Ð\> Ñ>−Ò!ßX Ó dove \> œ ^3 "Ò>3 ß>3" Ò Ð>Ñ . 8" 3œ! Per un determinato > − Ò>3 ß >3" Ò, lo stato \> è una v.a. caratterizzata dalla stessa legge della v.a. ^3 , mentre una traiettoria è una funzione semplice. Di conseguenza, questo p.a. è detto semplice. Questo tipo di p.a. sarà fondamentale nel calcolo stocastico introdotto nel Capitolo 10. Definizione 9.1.2. Si consideri uno spazio probabilizzabile ÐHß Y Ñ. Se “ © Ò!ß ∞Ò, una filtrazione è una collezione di 5-algebre ÐY> Ñ>−“ per cui si ha Y= § Y> § Y per ogni =ß > − “ tali che = Ÿ >. Inoltre, dato il p.a. \ œ Ð\> Ñ>−“ definito sullo spazio probabilizzato ÐHß Y ß T Ñ, sia Y> œ 5 ÐÖ\= À = Ÿ >×Ñ la più piccola 5 -algebra che contiene gli eventi del tipo Ö\= − F× con F − U Ð‘Ñ e = Ÿ >. In questo caso, la corrispondente filtrazione viene detta filtrazione naturale per il p.a. \ . Per comodità, si assume usualmente che infÐÖ> À > − “×Ñ œ ! e Y! œ Ögß H×. Inoltre, uno spazio di probabilità ÐHß Y ß T Ñ a cui è associata la filtrazione ÐY> Ñ>−“ è detto spazio di probabilità con filtrazione. Una filtrazione può essere interpretata come l'incremento di informazione nel p.a. che si ottiene al passare del tempo. In effetti, Y> può essere vista come l'informazione disponibile ad un osservatore del p.a. fino a tempo >. 3 Capitolo 9 Esempio 9.1.3. Si consideri di nuovo il p.a. \ dell'Esempio 9.1.1. Si noti che ogni traiettoria del p.a. può essere posta in corrispondenza biunivoca con un punto dell'intervallo Ò!ß "Ó, dal momento che ogni determinazione della successione Ð^8 Ñ8 " può essere vista come l'insieme delle cifre nella rappresentazione binaria di un punto in Ò!ß "Ó. In questo caso, si può considerare la filtrazione ÐY8 Ñ8 ! con Y! œ Ögß H× e dove Y8 è la 5 -algebra generata dagli intervalli del tipo Ò#8 Ð3 "Ñß #8 3Ò con 3 œ "ß á ß #8 . Evidentemente, la partizione binaria di Ò!ß "Ó che genera Y8 diventa sempre più “fine” all'aumentare di 8 e la relativa 5 -algebra diventa contemporaneamente più “ricca”. Definizione 9.1.3. Sia \ œ Ð\> Ñ>−“ un p.a. definito sullo spazio di probabilità ÐHß Y ß T Ñ con filtrazione ÐY> Ñ>−“ . Il p.a. \ è detto adattato se \> è misurabile rispetto a Y> per ogni > − “. Inoltre il p.a. \ è detto progressivamente misurabile se l'applicazione Ð=ß =Ñ È \= Ð=Ñ è misurabile rispetto alla 5 -algebra U ÐÒ!ß >ÓÑ Œ Y> per ogni > − “. Dalla Definizione 9.1.3 è evidente che un p.a. \ è adattato se la filtrazione è naturale. Definizione 9.1.4. Sia \ œ Ð\> Ñ>−“ un p.a. definito sullo spazio di probabilità ÐHß Y ß T Ñ. Il p.a. \ è detto continuo se le corrispondenti traiettorie sono continue ;Þ-Þ Inoltre, il p.a. è detto continuo a destra se le corrispondenti traiettorie sono continue a destra ;Þ-Þ Esempio 9.1.4. Si consideri di nuovo il p.a. semplice \ introdotto nell'Esempio 9.1.2. È immediato verificare che le traiettorie del p.a. \ non sono continue ;Þ-Þ In effetti, risulta Ö\>3 œ ^3 × ;Þ-Þ, mentre per & ! si ha Ölim&Ä! \>3 & œ ^3" × ;Þ-Þ, dove 3 œ "ß á ß 8. Dunque, il p.a. \ non è continuo ;Þ-Þ Tuttavia, il p.a. \ è continuo a destra ;Þ-Þ, dal momento che Ölim&Ä! \>3 & œ ^3 × ;Þ-Þ Definizione 9.1.5. Si consideri i p.a. \ œ Ð\> Ñ>−“ e ] œ Ð]> Ñ>−“ definiti sullo spazio di probabilità ÐHß Y ß T Ñ. Si dice che il p.a. ] è una modificazione del p.a. \ se per ogni > − “ si ha T ÐÖ= − H À \> Ð=Ñ œ ]> Ð=Ñ×Ñ œ " . Inoltre, si dice che i p.a. \ e ] sono indistinguibili se si ha T ÐÖ= − H À \> Ð=Ñ œ ]> Ð=Ñß a> − “×Ñ œ " . 4 Processi aleatori Risulta evidente dalla precedente Definizione che se i p.a. \ e ] sono indistinguibili, allora il p.a. \ è anche una modificazione del p.a. ] , mentre non è vero il contrario. Sulla base di queste classi di equivalenza fra p.a., si può selezionare il p.a. più opportuno ai fini teorici all'interno di una classe, come ad esempio un p.a. continuo. Esempio 9.1.5. Si consideri i p.a. \ œ Ð\> Ñ>−Ò!ß∞Ò e ] œ Ð]> Ñ>−Ò!ß∞Ò definiti sullo spazio di probabilità ÐHß Y ß T Ñ, dove H œ Ò!ß ∞Ò e Y œ U ÐÒ!ß ∞ÒÑ. Inoltre, i p.a. \ e ] sono tali che \> œ !, mentre ]> œ "Ö=× Ð>Ñ. Dunque, i p.a. \ e ] non sono indistinguibili, in quanto \> Ð=Ñ Á ]> Ð=Ñ per > œ =. Tuttavia, il p.a. ] è una modificazione del p.a. \ , in quanto T ÐÖ= − H À \> Ð=Ñ Á ]> Ð=Ñ×Ñ œ ! . e dunque T ÐÖ= − H À \> Ð=Ñ œ ]> Ð=Ñ×Ñ œ " T ÐÖ= − H À \> Ð=Ñ Á ]> Ð=Ñ×Ñ œ " . 9.2. Martingale Le cosiddette “martingale” costituiscono una vasta classe di p.a. con proprietà notevoli. Il termine “martingala” ha origine nel gioco d'azzardo, anche se la sua etimologia non è del tutto chiara. La prima apparizione del termine in ambito probabilistico è dovuta al matematico Jean Ville (1910-1989) e lo studio di questi p.a. è stato profondamente influenzato dal probabilista Joseph Leo Doob (1910-2004), che ne ha costruito le basi teoriche. Definizione 9.2.1. Se “ © Ò!ß ∞Ò, sia Q œ ÐQ> Ñ>−“ un p.a. adattato definito sullo spazio di probabilità ÐHß Y ß T Ñ con filtrazione ÐY> Ñ>−“ e tale che EÒlQ> lÓ ∞ per ogni > − “ . Si dice che Q è una martingala se per ogni ! Ÿ = > si ha ÖEÒQ> ± Y= Ó œ Q= × ;Þ-Þ , mentre si dice che Q è una super-martingala se ÖEÒQ> ± Y= Ó Ÿ Q= × ;Þ-Þ , e infine si dice che Q è una sub-martingala se 5 Capitolo 9 ÖEÒQ> ± Y= Ó Q= × ;Þ-Þ . Figura 9.2.1. Joseph Leo Doob (1910-2004). È evidente che la proprietà di martingala dipende dalla filtrazione e dalla misura di probabilità T che sono state considerate. Inoltre, dalla Definizione 9.2.1, per ogni > si ha ÖEÒQ> ± Y! Ó œ Q! × ;Þ-Þ , ovvero, una martingala può essere considerato in effetti un p.a. che rimane “costante in media”. Analogamente, una super-martingala è un p.a. che “decresce in media” e una sub-martingala è un p.a. che “cresce in media”. Risulta importante sottolineare che ogni martingala ammette sempre una modificazione continua a destra che è unica, a meno di p.a. indistinguibili (si veda Pascucci, 2011, p.115). Dal momento che questa condizione non è restrittiva, nel seguito verrà considerata tacitamente la versione continua a destra di ogni martingala. Esempio 9.2.1. Si consideri una successione di v.a. Ð\8 Ñ8 " a componenti indipendenti tale che EÒ\8 Ó œ - ∞ per ogni 8. Si definisca inoltre il p.a. a tempo discreto Q œ ÐQ8 Ñ8 ! tale che Q8 œ \3 8 3œ" 6 Processi aleatori con ÖQ! œ !× ;Þ-Þ e sia ÐY8 Ñ8 ! la filtrazione naturale, ovvero si assuma che Y8 œ 5 ÐÖ\" ß á ß \8 ×Ñ. Tenendo presente le assunzioni fatte sul p.a. Q , per ogni 8 si ha EÒlQ8 lÓ œ EÒl \3 lÓ Ÿ EÒ l\3 lÓ œ EÒl\3 lÓ ∞ . 8 8 8 3œ! 3œ! 3œ! Inoltre, dal momento che ÖEÒQ8 ± Y8 Ó œ Q8 × ;Þ-Þ sulla base del Teorema 5.2.1 e che la 5 -algebra generata da \8 è indipendente dalla 5 -algebra Y8" , si ha ;Þ-Þ EÒQ8 ± Y8" Ó œ EÒQ8" \8 ± Y8" Ó œ EÒQ8" ± Y8" Ó EÒ\8 ± Y8" Ó œ Q8" EÒ\8 Ó œ Q8" - . Procedendo in modo iterativo, per 7 − con 7 8, dalla precedente espressione si ha ;Þ-Þ EÒQ8 ± Y7 Ó œ Q7 Ð8 7Ñ- . Quindi, il p.a. Q è una martingala se - œ !, una super-martingala se - ! e una sub-martingala se - !Þ Esempio 9.2.2. Si consideri una successione Ð]8 Ñ8 " di v.a. indipendenti con la medesima legge, tali che T Ð]8 œ "Ñ œ : e T Ð]8 œ "Ñ œ ; , dove ; œ " :, e una successione ÐY8 Ñ8 " di v.a. tale che Y8 œ 18 Ð]" ß á ß ]8" Ñ con T ÐY8 !Ñ œ " e EÒY8 Ó ∞ per ogni 8 − . Si definisca il p.a. a tempo discreto Q œ ÐQ8 Ñ8 ! tale che Q8 œ Y3 ]3 8 3œ" con ÖQ! œ !× ;Þ-Þ e sia ÐY8 Ñ8 ! la filtrazione naturale, ovvero si assume che Y8 œ 5 ÐÖ]" ß á ß ]8 ×Ñ. Dalle assunzioni fatte si noti che la v.a. Y8 è misurabile rispetto a Y8" . Questo p.a. può essere assimilato ad un insieme di giocate ad un gioco d'azzardo con esito dicotomico, in cui si vince con probabilità : e si perde con probabilità ; , e dove si scommette una quantità di denaro pari a Y8 all'8esima giocata. In questo caso, Q8 rappresenta la somma vinta (o perduta) dal giocatore all'8-esima giocata. Nella terminologia del gioco d'azzardo, la successione di v.a. ÐY8 Ñ8 " è detta strategia di gioco. Risulta evidente il motivo per cui la v.a. Y8 dipende solo dal v.v.a. Ð]" ß á ß ]8" ÑT . In effetti, il giocatore può prendere la decisione sulla somma da scommettere all'8-esima giocata solo 7 Capitolo 9 basandosi sugli esiti delle Ð8 "Ñ giocate precedenti. Tenendo presente che le v.a. Y8 e ]8 sono indipendenti e che EÒl]8 lÓ œ ", per ogni 8 si ha EÒlQ8 lÓ œ EÒl Y3 ]3 lÓ Ÿ EÒ lY3 ]3 lÓ 8 8 3œ! 3œ! œ EÒlY3 lÓEÒl]3 lÓ œ EÒlY3 lÓ ∞ . 8 8 3œ! 3œ! Inoltre, sulla base del Teorema 5.2.1, dal momento che la 5 -algebra generata da ]8 è indipendente dalla 5 -algebra Y8" e che Y8 è misurabile rispetto a Y8" , si ha ;Þ-Þ EÒQ8 ± Y8" Ó œ EÒQ8" Y8 ]8 ± Y8" Ó œ EÒQ8" ± Y8" Ó EÒY8 ]8 ± Y8" Ó œ Q8" Y8 EÒ]8 ± Y8" Ó œ Q8" Y8 EÒ]8 Ó œ Q8" Y8 Ð#: "Ñ . Quindi, a prescindere dalla strategia di gioco adottata dal giocatore, il p.a. Q è una martingala se : œ "Î#, una super-martingala se : "Î# e una submartingala se : "Î#. Di conseguenza, per qualsiasi strategia di gioco considerata, un gioco equo rimane equo, un gioco sfavorevole rimane sfavorevole e un gioco favorevole rimane favorevole. Questo esempio mostra che è impossibile determinare una strategia di gioco per cui un gioco d'azzardo sfavorevole può essere trasformato in un gioco favorevole. Di seguito vengono dati due esempi di importanti martingale. Ulteriori esempi di martingale, super-martingale e sub-martingale verranno considerati nell'analisi delle passeggiate aleatorie nella Sezione 9.3 e del moto Browniano nella Sezione 9.4. Esempio 9.2.3. Si consideri una v.a. \ con EÒl\lÓ ∞ e si consideri il p.a. Q œ ÐQ> Ñ>−“ tale che Q> œ EÒ\ ± Y> Ó , dove ÐY> Ñ>−“ è una filtrazione. Tenendo presente la disuguaglianza di Jensen condizionata (Teorema 5.2.3), per ogni = > si ha EÒlQ> lÓ œ EÒlEÒ\ ± Y= ÓlÓ Ÿ EÒEÒl\l ± Y= ÓÓ œ EÒl\lÓ ∞ . 8 Processi aleatori Inoltre, sulla base del Teorema 5.2.6 si ha ÖEÒEÒ\ ± Y> Ó ± Y= Ó œ EÒ\ ± Y= Ó× ;Þ-Þ se Y= § Y> , da cui si ha ;Þ-Þ EÒQ> ± Y= Ó œ EÒEÒ\ ± Y> Ó ± Y= Ó œ EÒ\ ± Y= Ó œ Q> . Quindi, il p.a. Q è una martingala, anche detta martingala di Doob. Questo esempio evidenzia una procedura pratica per costruire una martingala. Esempio 9.2.4. Sia data un'urna che contiene < palline rosse e , palline blu. Si consideri inoltre un esperimento aleatorio nel quale si estrae una pallina dall'urna e, dopo averne verificato il colore, si reimmette la pallina nell'urna con un'ulteriore pallina dello stesso colore. La procedura viene successivamente ripetuta con le stesse modalità. Questo esperimento aleatorio è detto schema dell'urna di Pólya dal momento che è stato proposto dal matematico George Pólya (1887-1985). Se \8 è la v.a. che rappresenta il numero di palline rosse nell'urna alla 8-esima ripetizione dell'esperimento, si consideri la successione di v.a. Ð\8 Ñ8 " . Si noti che si può scrivere \8 œ < 83œ" ^3 , dove ogni v.a. ^3 è tale che ^3 œ " se la pallina estratta all'i-esima estrazione è rossa e ^3 œ ! altrimenti. Dalla costruzione dell'esperimento aleatorio risulta immediato verificare che B EÒ^3 ± \3" œ BÓ œ , 3"<, dove B œ <ß < "ß á ß < 3 ". Si consideri dunque il p.a. Q œ ÐQ8 Ñ8 ! tale che Q8 œ \8 ÎÐ8 < ,Ñ e Q! œ <ÎÐ< ,Ñ con ÐY8 Ñ8 ! filtrazione naturale. Per ogni 8 si ha EÒlQ8 lÓ œ EÒQ8 Ó œ EÒ\8 Ó 8< Ÿ ". 8<, 8<, Inoltre, tenendo presente il Teorema 5.2.1 e che EÒ^8 ± Y8" Ó œ EÒ^8 ± \8" Ó, si ha ;Þ-Þ " ÐEÒ\8" ± Y8" Ó EÒ^8 ± Y8" ÓÑ 8<, " \8" œ Ð\8" Ñ 8<, 8"<, " œ \8" œ Q8" . 8"<, EÒQ8 ± Y8" Ó œ Procedendo in modo iterativo, per 7 − con 7 8, si ha dunque ;Þ-Þ 9 Capitolo 9 EÒ\8 ± Y7 Ó œ " \7 œ Q7 , 7<, ovvero dalla Definizione 9.2.1 il p.a. Q è una martingala. Di seguito viene introdotta la definizione di tempo di arresto. Anche se il tempo di arresto può essere considerato in generale per un qualsiasi p.a., questo concetto risulta particolarmente importante nell'ambito delle martingale. Definizione 9.2.2. Si consideri lo spazio di probabilità ÐHß Y ß T Ñ. Se ÐY8 Ñ8 ! è una filtrazione, un tempo di arresto discreto è un'applicazione 7 À H È ∪ Ö∞×, tale che l'evento Ö7 Ÿ 8× − Y8 per ogni 8 − . Inoltre, se ÐY> Ñ>−Ò!ß∞Ò è una filtrazione, un tempo di arresto continuo è un'applicazione 7 À H È Ò!ß ∞Ò ∪ Ö∞×, tale che l'evento Ö7 Ÿ >× − Y> per ogni > − Ò!ß ∞Ò. Intuitivamente, si può pensare ad un tempo d’arresto come al momento in cui si prende una decisione relativa ad un fenomeno aleatorio nel tempo (per esempio, la decisione di raddoppiare la scommessa ad un certo istante in una serie di giocate ad un gioco d'azzardo). I vincoli sugli eventi, ovvero Ö7 Ÿ 8× − Y8 e Ö7 Ÿ >× − Y> , si basano sul fatto che tale decisione deve dipendere solo dalle informazioni disponibili fino a quel momento. Si noti infine che un tempo di arresto non è in effetti una v.a. in senso proprio in quanto potrebbe sussistere che T Ð7 ∞Ñ ", ovvero il tempo di arresto potrebbe non essere finito. Esempio 9.2.5. Si consideri di nuovo il p.a. Q œ ÐQ8 Ñ8 ! introdotto nell'Esempio 9.2.2 e sia dato il tempo di arresto 7 œ minÐÖ8 − À ]8 œ "×Ñ . Nell'interpretazione in termini di gioco d'azzardo, il tempo di arresto 7 può essere visto come l'istante in cui il giocatore ottiene la prima vincita. Si noti che 7 è in effetti un tempo di arresto, dal momento che Y8 è la 5 -algebra generata dal v.v.a. Ð]" ß á ß ]8 ÑT e Ö7 œ 8× œ Ö]" œ "ß á ß ]8" œ "ß ]8 œ "× − Y8 , per cui 10 Processi aleatori Ö7 Ÿ 8× œ Ö7 œ 3× − Y8 . 8 3œ" Per quanto visto nella Sezione 6.3, la v.a. Ð7 "Ñ è caratterizzata dalla legge Geometrica di parametro :, ovvero la relativa f.p. è data da :7 ÐBÑ œ :; B" "Ö"ß#ßá× ÐBÑ . Dunque, in questo caso si ha T Ð7 ∞Ñ œ ". Definizione 9.2.3. Si consideri lo spazio di probabilità ÐHß Y ß T Ñ e sia ÐY> Ñ>−“ una filtrazione. In questo caso Y7 œ ÖI − Y À J ∩ Ö7 >×ß > − “× è detta 5 -algebra associata al tempo di arresto 7 . Inoltre, se Q œ ÐQ> Ñ>−“ è una martingala e 7 è un tempo di arresto, allora posto Q7 œ Q Ð7 Ð=Ñß =Ñ, il p.a. Q 7 œ ÐQ7 •> Ñ>−“ è detta martingala arrestata al tempo di arresto 7 . Il prossimo Teorema riveste un'importanza notevole, dal momento che evidenzia che una martingala arrestata conserva ancora le caratteristiche di martingala. Teorema 9.2.4. (Teorema del campionamento opzionale di Doob) Sia Q œ ÐQ> Ñ>−“ una martingala e 7" e 7# tempi di arresto tali che Ö7" Ÿ 7# X × ;Þ-Þ dove X !. Si ha ;Þ-Þ EÒQ7# ± Y7" Ó œ Q7" . In particolare, il p.a. Q 7 œ ÐQ7 •> Ñ>−“ è una martingala. Inoltre, se Q è una super-martingala, si ha ;Þ-Þ EÒQ7# ± Y7" Ó Ÿ Q7" e il p.a. Q 7 è una super-martingala, mentre se Q è una sub-martingala, si ha ;Þ-Þ EÒQ7# ± Y7" Ó Q7" e il p.a. Q 7 è una sub-martingala. Dimostrazione. Si veda Revuz e Yor (2005, p.123). 11 Capitolo 9 Esempio 9.2.6. Si consideri il p.a. Q œ ÐQ8 Ñ8 ! introdotto nell'Esempio 9.2.2 e si assuma inoltre una successione di v.a. ÐY8 Ñ8 " tale che "Ö"× Ð]3 Ñ . 8" Y8 œ # 8" 3œ" Si consideri inoltre il tempo d'arresto 7 introdotto nell'Esempio 9.2.5 e la martingala arrestata Q 7 œ ÐQ7 •8 Ñ8 ! . Dal Teorema 9.2.4, si ha dunque che il p.a. Q 7 è una martingala se : œ "Î#, una super-martingala se : "Î# o una sub-martingala se : "Î#. Nell'interpretazione in un ambito di gioco d'azzardo, la strategia di gioco basata sulla successione di v.a. ÐY8 Ñ8 " è comunemente detta martingala (con una terminologia ovviamente fuorviante). In pratica, seguendo questa strategia, il giocatore scommette un'unità alla prima giocata. Nel caso in cui perda, il giocatore raddoppia la scommessa e continua in questo modo fino a quando non ottiene la prima vincita e conclude il gioco. Si noti che Q7 •8 œ "Ö"ßáß8× Ð7 Ñ Y3 "Ö8"ß8#ßá× Ð7 Ñ 8 3œ" 8 œ "Ö"ßáß8× Ð7 Ñ #3" "Ö8"ß8#ßá× Ð7 Ñ 3œ" 8 œ "Ö"ßáß8× Ð7 Ñ Ð# "Ñ"Ö8"ß8#ßá× Ð7 Ñ . In pratica, Q7 •8 œ Q7 œ " se 7 œ 8 (ovvero il giocatore guadagna un'unità alla prima vincita concludendo il gioco), mentre Q7 •8 œ Q8 œ Ð#8 "Ñ se 7 8 (ovvero il giocatore perde #8 " unità all'8-esima giocata precedente la prima vincita). Dunque, poichè T Ð7 ∞Ñ œ ", si ha anche T ÐQ7 œ "Ñ œ ". Dal momento che questo risultato vale per ogni :, la martingala sembra apparentemente una strategia di gioco vincente (il giocatore termina il gioco con un'unità vinta). Tuttavia, si deve tenere presente che questa strategia presuppone una disponibilità illimitata di denaro e di tempo da parte del giocatore (ovviamente un'assunzione irrealistica). Inoltre, tenendo presente l'Esempio 9.2.5, si ha EÒQ7 " Ó œ Q8" T Ð7 œ 8Ñ œ Ð#8" "Ñ:; 8" ∞ ∞ 8œ" œ : Ð#;Ñ8 " . ∞ 8œ! 8œ" 12 Processi aleatori Dunque, risulta EÒQ7 " Ó œ ∞ per : Ÿ "Î#, ovvero la perdita attesa nella giocata prima della vincita finale è infinita. Sorprendentemente, questo risultato si ha anche per un gioco equo, ovvero anche nel caso in cui : œ "Î#. Teorema 9.2.5. (Disuguaglianze di Doob) Sia Q œ ÐQ8 Ñ>−“ martingalaÞ Per ogni X ! e - ! vale la disuguaglianza T sup lQ> l - Ÿ >−Ò!ßX Ó una " " EÒQX ” !Ó Ÿ EÒlQX lÓ . - Inoltre, per : " e ; œ :ÎÐ: "Ñ vale la disuguaglianza E sup lQ> l: ; : EÒlQX l: Ó . >−Ò!ßX Ó Dimostrazione. Si veda Pascucci (2011, p.113). 9.3. Passeggiate aleatorie La passeggiata aleatoria è uno dei p.a. più semplici (anche se fondamentali) nella teoria della probabilità. Più esattamente, la passeggiata aleatoria è un processo a tempo discreto che viene formalmente definito come segue. Definizione 9.3.1. Sia ÐHß Y ß T Ñ con ÐY8 Ñ8 ! uno spazio di probabilità con filtrazione. Sia inoltre Ð]8 Ñ8 " una successione di v.a. indipendenti con la medesima legge, tali che T Ð]8 œ "Ñ œ : e T Ð]8 œ "Ñ œ ; dove ; œ " :. Si dice passeggiata aleatoria il p.a. \ œ Ð\8 Ñ8 ! dove \8 œ 83œ" ]3 e Ö\! œ !× ;Þ-Þ Evidentemente, vista l'indipendenza degli elementi della successione Ð]8 Ñ8 " , si può scegliere la filtrazione naturale ÐY8 Ñ8 ! tale che Y8 œ 5 ÐÖ]" ß á ß ]8 ×Ñ. I tempi 8 − sono anche detti passi della passeggiata aleatoria. Inoltre, nel caso particolare in cui : œ "Î#, la passeggiata aleatoria è detta simmetrica. Il seguente Teorema fornisce la legge del generico stato della passeggiata aleatoria. Teorema 9.3.2. Sia \ œ Ð\8 Ñ8 ! una passeggiata aleatoria. Per ogni 8 − la f.p. dello stato \8 è data da 13 Capitolo 9 :\8 ÐBÑ œ 8 Ð8BÑÎ# Ð8BÑÎ# ; "Ö8ß#8ßáß8#ß8× ÐBÑ . : Ð8 BÑÎ# Inoltre, EÒ\8 Ó œ 8Ð: ;Ñ e VarÒ\8 Ó œ %8:; . Dimostrazione. Si noti che sussiste \8 œ #Z8 8, dove Z8 œ 83œ" ^3 e Ð^8 Ñ8 " è una successione di v.a. indipendenti con legge di Bernoulli di parametro :. Per quanto visto nella Sezione 6.1, la v.a. Z8 possiede legge Binomiale UÐ8ß :Ñ. Dunque, dal momento che la v.a. \8 è una trasformata lineare della v.a. Z8 è immediato ottenerne la relativa f.p. Inoltre, per le proprietà del valore atteso si ha EÒ\8 Ó œ #EÒZ8 Ó 8 œ #8: 8 œ 8Ð: ;Ñ e VarÒ\8 Ó œ %VarÒZ8 Ó œ %8:; . 10 5 0 5 10 0 20 40 60 80 100 Figura 9.3.1. Una traiettoria della passeggiata aleatoria con : œ ")Î$( e 8 œ "!! passi. Esempio 9.3.1. Si consideri il gioco d'azzardo della roulette introdotto nell'Esempio 2.6.3. Si supponga inoltre un giocatore ostinato (con disponibilità illimitate) che scommette un'unità sul rosso ad ogni giocata. La successione delle somme vinte (o perdute) dal giocatore è una passeggiata aleatoria con : œ ")Î$( se la roulette è di tipo Monte Carlo (evitando di considerare per semplicità le regole basate su la partage o en prison quando si presenta lo zero). Sulla base del Teorema 9.3.2, la probabilità di essere in attivo dopo 8 œ #! giocate è data 14 Processi aleatori da "! 5œ" :\#! Ð#5Ñ œ !Þ$'&, quella di essere in pareggio è data da :\#! Ð!Ñ œ !Þ"(& e quella di essere in perdita è data da " 5œ"! :\#! Ð#5Ñ œ !Þ%'!. Inoltre, le medesime quantità dopo 8 œ "!! giocate sono rispettivamente date da &! " 5œ" :\"!! Ð#5Ñ œ !Þ$&&, :\"!! Ð!Ñ œ !Þ!(( e 5œ&! :\"!! Ð#5Ñ œ !Þ&'). Il seguente Teorema evidenzia che la passeggiata aleatoria è una martingala, una sub-martingala o una super-martingala a secondo dei valori assunti da :. Teorema 9.3.3. La passeggiata aleatoria \ œ Ð\8 Ñ8 ! è una martingala se : œ "Î#, una super-martingala se : "Î# e una sub-martingala se : "Î#Þ Dimostrazione. Sulla base della Definizione 9.3.1, dal momento che EÒl]3 lÓ œ " si ha EÒl\8 lÓ œ EÒl ]3 lÓ Ÿ EÒl]3 lÓ œ 8 ∞ . 8 8 3œ" 3œ" Inoltre, tenendo presente che ÖEÒ\8 ± Y8 Ó œ \8 × ;Þ-Þ sulla base del Teorema 5.2.1 e che la 5 -algebra generata da ]8 è indipendente dalla 5 -algebra Y8" , si ha ;Þ-Þ EÒ\8 ± Y8" Ó œ EÒ\8" ± Y8" Ó EÒ]8 ± Y8" Ó œ \8" EÒ]8 Ó œ \8" #: " . In modo analogo alla precedente relazione, si ha ;Þ-Þ EÒ\8 ± Y8# Ó œ EÒ\8# ± Y8# Ó EÒ]8" ± Y8# Ó EÒ]8 ± Y8# Ó œ \8# EÒ]8" Ó EÒ]8 Ó œ \8# #Ð#: "Ñ . Procedendo in modo iterativo, per 7 − con 7 8, si ha dunque ;Þ-Þ EÒ\8 ± Y7 Ó œ \7 Ð8 7ÑÐ#: "Ñ . Dalla precedente espressione e dalla Definizione 9.2.1 segue il risultato. Esempio 9.3.2. Si consideri il gioco d'azzardo della testa e croce introdotto nell'Esempio 1.1.1 e si supponga di nuovo un giocatore ostinato (con disponibilità illimitate) che scommette un'unità sulla croce ad ogni giocata. Se la moneta è bilanciata, ovvero : œ "Î#, allora la successione delle somme vinte (o perdute) dal giocatore è una passeggiata aleatoria che è anche una martingala. La testa e croce è dunque un gioco equo. Nel caso della roulette considerato nell'Esempio 9.3.1, la passeggiata aleatoria è invece una super-martingala, dal 15 Capitolo 9 momento che : œ ")Î$( "Î#Þ La roulette non è dunque un gioco d'azzardo vantaggioso. Risulta interessante ottenere alcune proprietà della traiettoria di una passeggiata aleatoria. In questo ambito, è conveniente introdurre le seguente definizione. Definizione 9.3.4. Sia \ œ Ð\8 Ñ8 ! una passeggiata aleatoria. Posto 8 œ #5 con 5 − , la quantità ?8 œ T Ð\8 œ !Ñ con ?#5 œ T Ð\#5 œ !Ñ œ #5 5 Ð:;Ñ 5 e ?#5" œ T Ð\#5" œ !Ñ œ ! è detta probabilità di ritorno all'origine in 8 passi. Dunque, ?8 non è nulla solo se 8 è pari. Il seguente Teorema fornisce alcune caratteristiche della successione delle probabilità di ritorno all'origine. Teorema 9.3.5. La successione ? œ Ð?8 Ñ8 ! ammette funzione generatrice data da K? Ð>Ñ œ >8 ?8 =Ð" %:;># Ñ"Î# . ∞ 8œ! Inoltre, posto 8 œ #5 con 5 − , per 5 Ä ∞ si ha ?#5 µ " Ð%:;Ñ5 . 15 Dimostrazione. Dal momento che sussiste la serie ∞ 5œ! #5 5 "Î# , B œ Ð" %BÑ 5 la funzione generatrice della successione ? è data da 16 Processi aleatori K? Ð>Ñ œ > ?8 œ >#5 ?#5 ∞ ∞ 8 8œ! ∞ œ 5œ! 5œ! #5 # 5 # "Î# . Ð:;> Ñ œ Ð" %:;> Ñ 5 Inoltre, per 5 Ä ∞ l'approssimazione di Stirling applicata al coefficiente binomiale nell'espressione di ?#5 fornisce #5 %5 , µ 5 15 da cui si ottiene la seconda parte. Dal Teorema 9.3.5, per : œ "Î# si ottiene in particolare che ?#5 µ " . 15 Dunque, la probabilità di ritorno all'origine per una passeggiata aleatoria simmetrica tende ad annullarsi all'aumentare dei passi. La seguente definizione introduce un particolare tempo di arresto nell'ambito delle passeggiate aleatorie. Definizione 9.3.6. Sia \ œ Ð\8 Ñ8 ! una passeggiata aleatoria. Il tempo di arresto 75 œ minÐÖ8 ! À \8 œ 5×Ñ , dove 5 − ™, è detto tempo del primo passaggio per 5 . In particolare, 7! œ minÐÖ8 ! À \8 œ !×Ñ è detto tempo del primo ritorno all'origine. Evidentemente, il tempo del primo ritorno all'origine 7! può prendere valori solo sui numeri pari. Il seguente Teorema fornisce la distribuzione di 7! e le relative caratteristiche. Teorema 9.3.7. Sia \ œ Ð\8 Ñ8 ! una passeggiata aleatoria. La funzione generatrice della successione @ œ Ð@8 Ñ8 " con @8 œ T Ð7! œ 8Ñ è data da 17 Capitolo 9 K@ Ð>Ñ œ >8 @8 œ " Ð" %:;># Ñ"Î# . ∞ 8œ" Posto 8 œ #5 con 5 − Ö"ß #ß á ×, si ha @#5 œ T Ð7! œ #5Ñ œ Ð "Ñ5" "Î# 5 Ð%:;Ñ 5 e @#5" œ T Ð7! œ #5 "Ñ œ ! . Inoltre, risulta @#5 œ ?#5 #5 " e per 5 Ä ∞ si ha @#5 µ %1 5 $ " Ð%:;Ñ5 . Infine, risulta @8 œ T Ð7! ∞Ñ œ " l: ;l . ∞ 8œ" Dimostrazione. Gli eventi Ö7! œ 3×, 3 œ "ß #ß á ß 8, sono incompatibili e dunque risulta T Ð\8 œ !Ñ œ T Ð\8 œ ! ± 7! œ 3ÑT Ð7! œ 3Ñ . 8 3œ" Inoltre, si ha T Ð\8 œ ! ± 7! œ 3Ñ œ T Ð\83 œ !Ñ dal momento che, se si verifica Ö7! œ 3×, allora 84œ3 ]4 può essere considerato come il passo di ordine Ð8 3Ñ di una nuova passeggiata aleatoria. Dunque, dalla precedente espressione risulta ?8 œ ?83 @3 . 8 3œ" Moltiplicando e sommando opportunamente la precedente espressione si ha 18 Processi aleatori > ?8 œ >8 ?83 @3 . ∞ ∞ 8 8 8œ! 8œ! 3œ" Tenendo presente la definizione di convoluzione di funzioni generatrici e poichè ?! œ ", si ottiene K? Ð>Ñ œ " K? Ð>ÑK@ Ð>Ñ , ovvero K@ Ð>Ñ œ " K? Ð>Ñ" e la prima parte segue dal Teorema 9.3.5. Inoltre, considerando l'espressione della serie binomiale, la funzione generatrice della successione @ può essere scritta come ∞ "Î# # 5 5" "Î# 5 #5 K@ Ð>Ñ œ " Ð %:;> Ñ œ Ð "Ñ Ð%:;Ñ > , 5 5 5œ! 5œ" ∞ da cui segue la seconda parte. La terza parte segue dall'identità combinatoria 5" Ð "Ñ "Î# #5 ##5 œ 5 5 #5 " applicata all'espressione di @#5 e dal Teorema 9.3.5. Infine, si ha @8 œ K@ Ð"Ñ œ " l: ;l . ∞ 8œ" Esempio 9.3.3. Si consideri di nuovo il gioco d'azzardo della roulette. In questo caso, sulla base del Teorema 9.3.7, la probabilità del tempo di ritorno all'origine dopo 8 œ #! giocate è data da @#! œ !Þ!!*. Inoltre, la probabilità che il tempo di ritorno all'origine sia finito risulta T Ð7! ∞Ñ œ $'Î$(. Dunque, in modo sorprendente per il giocatore ingenuo (anche se con disponibilità illimitate), la probabilità che il tempo di ritorno all'origine non sia finito è dato da " T Ð7! ∞Ñ œ "Î$(. Si deve evidenziare che K@ non è in generale una funzione generatrice delle probabilità. In effetti, la successione @ non costituisce in generale una legge essenziale, dal momento che dal Teorema 9.3.7 si ha T Ð7! ∞Ñ Ÿ "Þ Da questo 19 Capitolo 9 Teorema è evidente che T Ð7! ∞Ñ œ " esclusivamente per una passeggiata aleatoria simmetrica. Dunque, 7! è una v.a. propria solamente per : œ "Î#. In questo caso, si ha il seguente risultato. Teorema 9.3.8. Sia \ œ Ð\8 Ñ8 ! una passeggiata aleatoria simmetrica. La f.p. della v.a. 7! è data da :7! ÐBÑ œ Ð "ÑBÎ#" "Î# "Ö#ß%ßá× ÐBÑ . BÎ# Inoltre, si ha EÒ7! Ó œ ∞. Infine, posto 8 œ #5 con 5 − e data la successione D œ ÐD8 Ñ8 ! dove D#5 œ T Ð7! #5Ñ e D#5" œ ! , si ha D œ ?. Dimostrazione. Per : œ "Î# la v.a. 7! ha f.g. data da K7! Ð>Ñ œ " Ð" ># Ñ"Î# e la prima parte segue immediatamente dal Teorema 9.3.7. Inoltre, si ha K7Ð"Ñ Ð>Ñ œ >Ð" ># Ñ"Î# , ! e dunque EÒ7! Ó œ lim K7Ð"Ñ Ð>Ñ œ ∞ Þ ! >Ä" Per quanto riguarda l'ultima parte, poichè D#5 œ EÒ"Ö"ß#ßá× Ð7! #5ÑÓ, la funzione generatrice della successione D è data da 20 Processi aleatori KD Ð>Ñ œ > D8 œ >#5 EÒ"Ö"ß#ßá× Ð7! #5ÑÓ ∞ ∞ 8 8œ! 5œ! 7! Î#" #5 œ E > "Ö"ß#ßá× Ð7! #5Ñ œ E > 5œ! 5œ! ∞ #5 " >7! " K7! Ð>Ñ œ œ E . " ># " ># Tenendo presente l'espressione di K7! Ð>Ñ e dal Teorema 9.3.5, si ha KD Ð>Ñ œ Ð" ># Ñ"Î# œ K? Ð>Ñ , da cui segue la tesi. Dal Teorema 9.3.8 segue quindi che, pur essendo T Ð7! ∞Ñ œ " per : œ "Î#, si ha comunque EÒ7! Ó œ ∞. Inoltre, dal medesimo Teorema segue anche una relazione notevole fra le successioni ? e D per una passeggiata aleatoria simmetrica. In effetti, da questa relazione si ha che la probabilità di non ritornare all'origine in #5 passi è pari alla probabilità di ritornare all'origine in #5 passi quando : œ "Î#ß ovvero T Ð7! #5Ñ œ T Ð\#5 œ !Ñ. Esempio 9.3.4. Si consideri il gioco d'azzardo della testa e croce analizzato nell'Esempio 9.3.2. In questo caso, la probabilità del tempo di ritorno all'origine dopo 8 œ #! giocate è data da T Ð\#0 œ !Ñ œ !Þ"(', per cui risulta anche T Ð70 #!Ñ œ !Þ"('. Il prossimo Teorema fornisce un risultato classico per la passeggiata aleatoria simmetrica, ovvero la cosiddetta legge dell'arcoseno. Se si considera i primi #8 passi di una passeggiata aleatoria, questa legge fornisce la distribuzione dell'ultimo tempo di ritorno all'origine. Teorema 9.3.9. (Legge dell'arcoseno) Sia \ œ Ð\8 Ñ8 ! una passeggiata aleatoria simmetrica. Si consideri la v.a. 48 œ maxÐÖ6 − Ö"ß á ß 8× À \6 œ !×Ñ, detta ultimo tempo di ritorno all'origine in 8 passi. Posto 8 œ #5 con 5 − , se α#6ß#5 œ T Ð4#5 œ #6Ñ, si ha α#6ß#5 œ ?#6 ?#5#6 œ #6 #5 #6 #5 , # 6 56 21 Capitolo 9 per 6 œ !ß á ß 5 , ovvero la f.p. della v.a. 48 è data da p48 ÐBÑ œ B 8B 8 # "Ö!ß#ßáß8× ÐBÑ . BÎ# Ð8 BÑÎ# Inoltre, risulta lim T Ð48 Î8 Ÿ BÑ œ 8 # arcsinB"Ò!ß"Ó ÐBÑ "Ó"ß∞Ò ÐBÑ , 1 _ ovvero 48 Î8 Ä ^ per 8 Ä ∞, dove ^ è una v.a. con legge Beta di tipo UXÐ!ß "ß "Î#ß "Î#Ñ che ammette d.p. data da 0^ ÐBÑ œ " "Ò!ß"Ó ÐBÑ . 1BÐ" BÑ Dimostrazione. Per quanto riguarda la prima parte, tenendo presente che se si verifica Ö\#6 œ !×, allora i successivi passi possono essere considerati come una nuova passeggiata aleatoria, dal Teorema 9.3.8 si ha α#6ß#5 œ T Ð\#6 œ T Ð\#6 œ T Ð\#6 œ T Ð\#6 œ !ß \#6# Á !ß á ß \#5 Á !Ñ œ !ÑT Ð\#6# Á !ß á ß \#5 Á ! ± \#6 œ !Ñ œ !ÑT Ð\#6# Á !ß á ß \#5 Á !Ñ œ !ÑT Ð7! #5 #6Ñ œ ?#6 ?#5#6 . Per quanto riguarda la seconda parte, dal Teorema 9.3.5 si ha α#6ß#5 µ " . 16Ð5 6Ñ Dunque, posto B œ 6Î5 per 6 œ !ß á ß 5 , si ha T Ð48 Î8 Ÿ BÑ µ 5B 3œ! " , 13Ð5 3Ñ da cui, tenendo presente la definizione di integrale di Riemann, si ottiene B " " lim T Ð48 Î8 Ÿ BÑ œ lim œ .? . 8 5 ! 1 ?Ð" ?Ñ 3œ! 1 3Ð5 3Ñ 5B La seconda parte segue dunque dalla definizione di convergenza in legge e dai risultati della Sezione 6.9. 22 Processi aleatori Si noti che α#6ß#5 œ α#5#6ß#5 . Inoltre, si deve sottolineare che 48 non è un tempo di arresto. La legge dell'arcoseno fornisce un risultato sulla legge della v.a. 48 che può risultare controintuitiva. In effetti, la f.p. della v.a. 48 mostra la cosiddetta “forma ad U” (si veda la Figura 9.3.2), così come la d.p. della v.a. limite della successione di v.a. Ð48 Î8Ñ8 " mostra la medesima forma. In effetti, anche se EÒ48 Ó œ 8Î#, la probabilità del tempo di ritorno all'origine in 8 passi è molto più elevata per valori prossimi a ! e a 8 che a 8Î#. Dal momento che la v.a. limite può essere interpretata come la proporzione di tempo dall'ultimo ritorno all'origine, la legge dell'arcoseno è ancora più sorprendente per 8 Ä ∞. 0.12 0.10 0.08 0.06 0.04 0.02 0.00 0 10 20 30 40 50 Figura 9.3.2. Funzione di probabilità per la legge dell'arcoseno con 8 œ &!. Per concludere, viene considerato un risultato classico nella Teoria della Probabilità, ovvero la cosiddetta rovina del giocatore d'azzardo. In questo problema, un giocatore ostinato con capitale iniziale pari ad + unità fronteggia in giocate ripetute un secondo giocatore con capitale iniziale pari a , unità. Il gioco continua fino a quando il primo giocatore esaurisce il proprio capitale o riesce a vincere il capitale del secondo giocatore. In questo caso, l'obiettivo è quello di determinare la probabilità di rovina, che viene ottenuta nel seguente risultato. Teorema 9.3.10. (La rovina del giocatore d'azzardo) Sia \ œ Ð\8 Ñ8 ! una passeggiata aleatoria. Se +ß , − , si consideri il tempo di arresto 7 œ minÐ7+ ß 7, Ñ. Si ha T Ð7 ∞Ñ œ ". Inoltre, per : Á "Î# " Ð;Î:Ñ, T Ð\7 œ +Ñ œ " T Ð\7 œ ,Ñ œ , Ð;Î:Ñ+ Ð;Î:Ñ, 23 Capitolo 9 mentre se : œ "Î# T Ð\7 œ +Ñ œ " T Ð\7 œ ,Ñ œ , . +, Dimostrazione. Per quanto riguarda la prima parte, si ponga - œ + , e si definisca il tempo di arresto ) œ minÐÖ8 − Ö"ß #ß á × À ]Ð8"Ñ-" œ "ß á ß ]Ð8"Ñ-- œ "×Ñ . Dal momento che per 8 fissato si ha T Ð]Ð8"Ñ-" œ "ß á ß ]Ð8"Ñ-- œ "Ñ œ :- , la v.a. ) è caratterizzata da una legge Geometrica di parametro :- e dunque EÒ)Ó ∞. Inoltre, Ö7 - )× ;Þ-Þ dal momento che 7 si deve necessariamente realizzare almeno nell'intervallo ÖÐ8 "Ñ- "ß á ß Ð8 "Ñ- -× se ) œ 8. Dunque, risulta EÒ7 Ó - EÒ)Ó ∞, da cui si ha anche T Ð7 ∞Ñ œ ". Per quanto riguarda la seconda parte per : Á "Î#, si noti che Q œ ÐQ8 Ñ8 ! con Q8 œ Ð;Î:Ñ\8 è una martingala. In effetti, dal momento che EÒÐ;Î:Ñ]3 Ó œ " per 3 œ "ß á ß 8, si ha EÒlQ8 lÓ œ EÒ Ð;Î:Ñ Ó œ EÒÐ;Î:Ñ]3 Ó œ " ∞ , 8 8 ]3 3œ" 3œ" mentre risulta ;Þ-Þ EÒQ8 ± Y8" Ó œ EÒÐ;Î:Ñ]8 Q8" ± Y8" Ó œ EÒÐ;Î:Ñ]8 ÓEÒQ8" ± Y8" Ó œ Q8" e dunque, in modo iterativo, per 7 − con 7 8, si ha ;Þ-Þ EÒ\8 ± Y7 Ó œ \7 . Dunque, dal Teorema 9.2.4 si ha che EÒQ7 Ó œ EÒQ! Ó œ " ∞ . Dal momento che i due eventi E œ Ö\7 œ +× œ ÖQ7 œ Ð;Î:Ñ+ × œ Ö7+ 7, × e 24 Processi aleatori F œ Ö\7 œ ,× œ ÖQ7 œ Ð;Î:Ñ, × œ Ö7+ 7, × , sono incompatibili ed esaustivi, si ha EÒQ7 Ó œ EÒQ7 ± EÓT ÐEÑ EÒQ7 ± F ÓT ÐFÑ œ Ð;Î:Ñ+ T Ð\7 œ +Ñ Ð;Î:Ñ, T Ð\7 œ ,Ñ œ " e la tesi segue tenendo presente che T Ð\7 œ +Ñ T Ð\7 œ ,Ñ œ ". Nel caso che : œ "Î#, dal Teorema 9.3.3 si ha che \ è una martingala. Dunque, dal Teorema 9.2.4 si ha che EÒ\7 Ó œ EÒ\! Ó œ ! ∞ . In modo simile a quanto visto in precedenza, si ha EÒ\7 Ó œ EÒ\7 ± EÓT ÐEÑ EÒ\7 ± F ÓT ÐFÑ œ Ð +ÑT Ð\7 œ +Ñ ,T Ð\7 œ ,Ñ œ ! , da cui segue la seconda parte. Dal precedente Teorema, si evidenzia che il gioco termina ;Þ-Þ dal momento che T Ð7 ∞Ñ œ " a prescindere dai valori di + e , e di :. Inoltre, nel caso che il secondo giocatore sia infinitamente ricco, ovvero se , Ä ∞, allora si ha T Ð\7 œ +Ñ œ " , se ;Î: ", mentre ; T Ð\7 œ +Ñ œ , : + se ;Î: ". Dunque, sorprendentemente, la rovina del primo giocatore contro un giocatore infinitamente ricco avviene ;Þ-Þ anche se il gioco è equo. Esempio 9.3.5. Si consideri di nuovo il gioco d'azzardo della roulette. Come è stato visto nell'Esempio 9.3.2, la roulette non è un gioco equo essendo : œ ")Î$( e inoltre la casa da gioco dispone solitamente di capitali molto più elevati dei giocatori, ovvero , è molto più grande di +. Quindi, T Ð\7 œ +Ñ è prossimo ad uno nei casi usuali. Tuttavia, supponendo che , œ +, ovvero che la casa da gioco disponga dello stesso capitale del giocatore ostinato, per + œ &! si ha T Ð\7 œ &!Ñ œ !Þ*$( e per + œ "!! si ha T Ð\7 œ "!!Ñ œ !Þ**'. Inoltre, supponendo che , œ +Î#, ovvero che la casa da gioco disponga della 25 Capitolo 9 metà del capitale rispetto al giocatore ostinato, per + œ &! si ha T Ð\7 œ &!Ñ œ !Þ(&% e per + œ "!! si ha T Ð\7 œ "!!Ñ œ !Þ*$$. Dunque, anche se il gioco della roulette è solo leggermente sfavorevole, questo fatto conferisce comunque un vantaggio determinante alla casa da gioco. 9.4. Moto Browniano Il moto Browniano è uno dei p.a. fondamentali nella Teoria della Probabilità. Questo p.a. prende nome dal botanico Robert Brown (1773-1858), che per primo aveva notato il moto erratico delle particelle nei fluidi. Il probabilista Norbert Wiener (1894-1964) ha determinato numerose proprietà del relativo modello matematico e per questo motivo il p.a. è anche detto processo di Wiener. Figura 9.4.1. Norbert Wiener (1894-1964). Definizione 9.4.1. Sia ÐHß Y ß T Ñ con ÐY> Ñ>−Ò!ß∞Ò uno spazio di probabilità con filtrazione. Il moto Browniano o processo di Wiener è un p.a. F œ ÐF> Ñ>−Ò!ß∞Ò tale che i) T ÐF! œ !Ñ œ "; ii) per ogni ! Ÿ = >, la v.a. F> F= è caratterizzata dalla legge Normale a Ð!ß > =Ñ e le 5 -algebre YF> F= e YF= sono indipendenti; iii) il p.a. F ha incrementi indipendenti, ovvero per ogni ! Ÿ >" á >8 le v.a. F>" ß F># F>" ß á ß F>8 F>8" sono indipendenti; iv) il p.a. F ha traiettorie continue ;Þ-Þ 26 Processi aleatori 1.0 0.5 0.0 0.5 1.0 0.0 0.2 0.4 0.6 0.8 1.0 Figura 9.4.2. Una traiettoria del moto Browniano. Per quanto riguarda la costruzione del moto Browniano, si può consultare Kuo (2006, p.23), dove a tale fine sono analizzati tre principali metodi. Il moto Browniano può essere anche ottenuto come limite in legge di una versione generale di passeggiata aleatoria “scalata” i cui passi tendono a zero. Più esattamente, si ha il seguente Teorema che prende il nome dal matematico Monroe David Donsker (1924-1991). Teorema 9.4.2. (Teorema di Donsker) Sia ÐHß Y ß T Ñ con ÐY> Ñ>−Ò!ß∞Ò uno spazio di probabilità con filtrazione. Sia inoltre Ð]8 Ñ8 " una successione di v.a. indipendenti con la medesima legge, tali che EÒ]8 Ó œ ! e VarÒ]8 Ó œ " e sia \8 œ 83œ" ]3 e \! œ ! ;Þ-Þ Se ^8 œ Ð^8ß> Ñ>−Ò!ß"Ó è una passeggiata aleatoria scalata tale che ^8ß> œ " Ð\Ú8>Û Ð8> Ú8>ÛÑ]Ú8>Û" Ñ , 8 _ dove ÚBÛ rappresenta il più grande intero minore o uguale a B, allora ^8 Ä F per 8 Ä ∞, dove F œ ÐF> Ñ>−Ò!ß"Ó . Dimostrazione. Si veda Capasso (2015, p.430). In particolare, il Teorema di Donsker vale per la passeggiata aleatoria simmetrica, per cui si ha T Ð]8 œ "Ñ œ T Ð]8 œ "Ñ œ "Î#. Il Teorema di Donsker può essere considerato come la versione funzionale del Teorema Centrale del Limite (Teorema 8.4.1). Molte proprietà del moto Browniano 27 Capitolo 9 possono essere quindi ottenute nel “limite” da quelle della passeggiata aleatoria simmetrica (si veda Bhattacharya e Waymire, 2009). Di seguito vengono considerati una serie di Teoremi che forniscono alcune delle principali proprietà del moto Browniano. Teorema 9.4.3. Sia dato il moto Browniano F œ ÐF> Ñ>−Ò!ß∞Ò . Per ogni > !, la v.a. F> è caratterizzata dalla legge Normale a Ð!ß >Ñ. Inoltre, per ogni =ß > ! si ha CovÒF= ß F> Ó œ minÐ=ß >Ñ. Dimostrazione. Dall'assunzione i) della Definizione 9.4.1 si ottiene che _ F> œ F> F! e dunque la prima parte segue dalle assunzioni i) e ii) della Definizione 9.4.1. Per quanto riguarda la seconda parte, banalmente si ha che _ F> œ ÐF> F= Ñ F= per = >. Tenendo presente l'assunzione iii) della Definizione 9.4.1 si ha che EÒÐF> F= ÑF= Ó œ ! e dunque CovÒF= ß F> Ó œ EÒF= F> Ó œ EÒÐF> F= ÑF= F=# Ó œ EÒF=# Ó œ = . La seconda parte segue immediatamente scambiando gli indici = e >. Il seguente Teorema mostra che il moto Browniano è un p.a. Gaussiano, ovvero un p.a. per cui ogni scelta finita di stati possiede legge Normale Multivariata. Teorema 9.4.4. Sia dato il moto Browniano F œ ÐF> Ñ>−Ò!ß∞Ò . Se >" á >5 , allora il v.v.a. ÐF>" ß á ß F>5 Ñ possiede legge Normale Multivariata a5 Ð!ß O Ñ dove O œ ÐminÐ>3 ß >4 ÑÑ. Dimostrazione. Innanzitutto, si noti che @" F>" á @5 F>5 œ Ð@" á @5 ÑF>" Ð@# á @5 ÑÐF># F>" Ñ á @5 ÐF>5 F>5" Ñ e che le v.a. F>" ß ÐF># F>" Ñß á ß ÐF>5 F>5" Ñ sono indipendenti sulla base della assunzione iii) della Definizione 9.4.1. Dunque, posto @ œ Ð@" ß á ß @5 ÑT ß la f.c.m. del v.v.a. ÐF>" ß á ß F>5 Ñ è data da :Ð@Ñ œ E expÐi@3 F>3 Ñ œ EÒexpÐiÐ@" á @5 ÑF>" ÑÓ ‚ 5 3œ" ‚ EÒexpÐiÐ@# á @5 ÑÐF># F>" ÑÑÓ ‚ â ‚ EÒexpÐi@5 ÐF>5 F>5" ÑÑÓ . 28 Processi aleatori Inoltre, dal Teorema 9.4.3 si ha che la v.a. F>" possiede legge Normale a Ð!ß >" Ñ, mentre dalla assunzione ii) della Definizione 9.4.1 si ha che la v.a. F>3 F>3" possiede legge Normale a Ð!ß >3 >3" Ñ (3 œ #ß á ß 5 ). Dunque, tenendo presente l'Esempio 7.1.6, risulta >" Ð@" á @5 Ñ# Ð># >" ÑÐ@# á @5 Ñ# :Ð@Ñ œ exp ‚ exp ‚ # # Ð>5 >5" Ñ@5# ‚ â ‚ exp # 5 5 " 5 @T O @ # œ exp >3 ?3 # >3 ?3 ?4 œ exp # 3œ" # 3=" 4=3" e quindi, sulla base dell'Esempio 7.3.1, segue la tesi. Il seguente Teorema mostra che il moto Browniano è in effetti una martingala. Teorema 9.4.5. Sia dato il moto Browniano F œ ÐF> Ñ>−Ò!ß∞Ò . Il p.a. F è una martingala. Dimostrazione. Sulla base del Teorema 9.4.3 e dalla disuguaglianza di Lyapunov (Teorema 4.3.2), per ogni > si ha EÒlF> lÓ Ÿ EÒF># Ó"Î# œ >"Î# ∞ . Inoltre, tenendo presente la dimostrazione del Teorema 9.4.3 e le assunzioni ii) e iii) della Definizione 9.4.1, risulta EÒF> ± Y= Ó œ EÒF> F= ± Y= Ó EÒF= ± Y= Ó œ EÒF> F= Ó EÒF= Ó œ F= , da cui segue la tesi. I seguenti Teoremi mostrano che se il moto Browniano viene riflesso, o traslato, o scalato, o invertito rispetto al tempo, si ottiene di nuovo un moto Browniano. Teorema 9.4.6. Sia dato il moto Browniano F œ ÐF> Ñ>−Ò!ß∞Ò . Posto \> œ F> il p.a. \ œ Ð\> Ñ>−Ò!ß∞Ò è un moto Browniano. Dimostrazione. Innanzitutto, si ha T Ð\! œ !Ñ œ T Ð F! œ !Ñ œ ". Inoltre, _ per ogni ! Ÿ = >, sussiste \> \= œ ÐF> F= Ñ œ F> F= per la 29 Capitolo 9 simmetria della legge Normale rispetto all'origine. Dunque, dall'assunzione ii) della Definizione 9.4.1, la v.a. \> \= possiede legge Normale a Ð!ß > =Ñ. Dal momento che trasformate di v.a. indipendenti sono indipendenti (vedi Teorema 3.7.3), allora le v.a. \> \= œ ÐF> F= Ñ e \= œ F= risultano indipendenti sulla base dell'assunzione ii) della Definizione 9.4.1. Quindi, anche le 5 -algebre Y\> \= e Y\= sono indipendenti. In modo analogo, per ogni ! Ÿ >" á >8 le v.a. \>" ß \># \>" ß á ß \>8 \>8" sono indipendenti. Infine, è evidente che il p.a. \ ha traiettorie continue ;Þ-Þ Dunque, dalla Definizione 9.4.1 il p.a. \ è un moto Browniano. Teorema 9.4.7. Sia dato il moto Browniano F œ ÐF> Ñ>−Ò!ß∞Ò . Se ? ! e posto \> œ F>? F? il p.a. \ œ Ð\> Ñ>−Ò!ß∞Ò è un moto Browniano. Dimostrazione. Risulta evidente che T Ð\! œ !Ñ œ ". Inoltre, per ogni ! Ÿ = >, la v.a. \> \= œ F>? F=? è caratterizzata dalla legge Normale a Ð!ß > =Ñ sulla base dell'assunzione ii) della Definizione 9.4.1. Tenendo presente la medesima assunzione, è immediato verificare che le 5 -algebre Y\> \= e Y\= sono indipendenti e che le v.a. \>" ß \># \>" ß á ß \>8 \>8" sono indipendenti. Infine, è evidente che il p.a. \ ha traiettorie continue ;Þ-Þ Dunque, dalla Definizione 9.4.1 il p.a. \ è un moto Browniano. Teorema 9.4.8. Sia dato il moto Browniano F œ ÐF> Ñ>−Ò!ß∞Ò . Se - Á ! e posto \> œ -F>Î-# il p.a. \ œ Ð\> Ñ>−Ò!ß∞Ò è un moto Browniano. Dimostrazione. Si ha T Ð\! œ !Ñ œ T Ð-F! œ !Ñ œ ". Inoltre, per ogni ! Ÿ = >, si ha \> \= œ -ÐF>Î-# F=Î- # Ñ. Dunque, dall'assunzione ii) della Definizione 9.4.1 e dal Teorema 9.4.3, risulta EÒ\> \= Ó œ -ÐEÒF>Î-# Ó EÒF=Î- # ÓÑ œ ! e VarÒ\> \= Ó œ - # ÐVarÒF>Î-# Ó VarÒF=Î- # Ó #CovÒF>Î- # ß F=Î- # ÓÑ œ > = . Tenendo presente l'Esempio 7.3.2, allora la v.a. \> \= è caratterizzata dalla legge Normale a Ð!ß > =Ñ. Dal momento che trasformate di v.a. indipendenti sono indipendenti (vedi Teorema 3.7.3), le v.a. \> \= œ -ÐF>Î-# F=Î- # Ñ e \= œ -F=Î- # risultano indipendenti sulla base dell'assunzione ii) della Definizione 9.4.1 e anche le 5 -algebre Y\> \= e Y\= sono indipendenti. In modo analogo, per ogni ! Ÿ >" á >8 le v.a. \>" ß \># \>" ß á ß \>8 \>8" 30 Processi aleatori risultano indipendenti. Infine, è evidente che il p.a. \ ha traiettorie continue ;Þ-Þ Dunque, dalla Definizione 9.4.1, il p.a. \ è un moto Browniano. Teorema 9.4.9. Sia dato il moto Browniano F œ ÐF> Ñ>−Ò!ß∞Ò . Posto \> œ >F"Î> se > ! e \! œ ! ;Þ-Þ il p.a. \ œ Ð\> Ñ>−Ò!ß∞Ò è un moto Browniano. Dimostrazione. Evidentemente si ha T Ð\! œ !Ñ œ " dalle assunzioni fatte. Dal Teorema 9.4.3, la v.a. F"Î> possiede legge Normale a Ð!ß "Î>Ñ e dunque la v.a. \> possiede legge Normale a Ð!ß >Ñ, mentre per ogni ! Ÿ = > si ha EÒ\> \= Ó œ >EÒF"Î> Ó =EÒF"Î= Ó œ ! e VarÒ\> \= Ó œ ># VarÒF"Î> Ó =# VarÒF"Î= Ó #>=CovÒF"Î> ß F"Î= ÓÑ œ > = . Dal momento il v.v.a. ÐF"Î> ß F"Î= Ñ possiede legge Normale Multivariata sulla base del Teorema 9.4.4 e poichè \> \= œ >F"Î> =F"Î= è una combinazione lineare di questo v.v.a., si ha dunque che la v.a. \> \= possiede legge Normale a Ð!ß > =Ñ. Inoltre, risulta # CovÒÐ\> \= Ñ\= Ó œ EÒ\> \= Ó EÒ\=# Ó œ =>EÒF"Î> F"Î= Ó =# EÒF"Î= Óœ!. Il v.v.a. Ð\= ß Ð\> \= ÑÑ possiede legge Normale Multivariata essendo una trasformata affine del v.v.a. ÐF"Î> ß F"Î= Ñ ed inoltre le sue componenti sono indipendenti tenendo presente la precedente relazione. Dunque, anche le 5 algebre Y\> \= e Y\= sono indipendenti. In modo analogo, per ogni ! Ÿ >" á >8 le v.a. \>" ß \># \>" ß á ß \>8 \>8" risultano indipendenti. Dal momento che il moto Browniano è continuo ;Þ-Þ, risulta T Ðlim>Ä! \> œ !Ñ œ T Ðlim>Ä! >F"Î> œ !Ñ œ " e quindi il p.a. \ ha traiettorie continue ;Þ-Þ Dunque, dalla Definizione 9.4.1, il p.a. \ è un moto Browniano. I prossimi Teoremi evidenziano che le traiettorie del moto Browniano sono molto “irregolari”. In effetti, anche se le traiettorie di questo p.a. sono continue ;Þ-Þ per definizione, queste sono non differenziabili ;Þ9Þ Inoltre, la variazione di un moto Browniano è infinita ;Þ-Þ, mentre la rispettiva variazione quadratica è finita (per una discussione approfondita di queste quantità si veda Klebaner, 2005) 31 Capitolo 9 Teorema 9.4.10. Sia dato il moto Browniano F œ ÐF> Ñ>−Ò!ß∞Ò . Allora, ;Þ-Þ le traiettorie del moto Browniano non sono differenziabili ;Þ9Þ Dimostrazione. Si veda Capasso (2015, p.138). Teorema 9.4.11. Sia dato un moto Browniano F œ ÐF> Ñ>−Ò!ßX Ó . Si consideri inoltre la partizione ! œ >!ß8 >"ß8 á >8ß8 œ X e le successioni di v.a. ÐZ8 Ñ8 " / ÐZ8ß# Ñ8 " , dove Z8 œ lF>3"ß8 F>3ß8 l 8" 3œ! e Z8ß# œ ÐF>3"ß8 F>3ß8 Ñ# . 8" 3œ! Allora, se lim8 maxÐ>3"ß8 >3ß8 Ñ œ !, si ha T Ðlim Z8 œ ∞Ñ œ " 8 e lim EÒÐZ8ß# X Ñ# Ó œ ! . 8 Dimostrazione. Si veda Klebaner (2005, p.63). La seguente definizione introduce il cosiddetto tempo di primo passaggio del moto Browniano. Definizione 9.4.12. Sia F œ ÐF> Ñ>−Ò!ß∞Ò il moto Browniano. Il tempo di arresto 7+ œ infÖ> − Ó0,∞Ò À F> œ +× , dove + − ‘, è detto tempo del primo passaggio per +. Teorema 9.4.13. Sia F œ ÐF> Ñ>−Ò!ß∞Ò il moto Browniano. La v.a. 7+ ammette d.p. data da 32 Processi aleatori l+l $Î# +# 07+ ÐBÑ œ B exp "Ó!ß∞Ò ÐBÑ . #1 #B Inoltre, si ha EÒ7+ Ó œ ∞. Dimostrazione. Si veda Klebaner (2005, p.75). Dal precedente Teorema è immediato verificare che il tempo del primo passaggio del moto Browniano possiede in effetti la legge di Lévy introdotta nella sua versione ridotta nell'Esempio 4.1.3. Il prossimo Teorema fornisce un risultato classico la legge dell'arcoseno per il moto Browniano che fornisce la distribuzione dell'ultimo tempo di ritorno all'origine. Teorema 9.4.14. (Legge dell'arcoseno per il moto Browniano) Sia F œ ÐF> Ñ>−Ò!ß"Ó il moto Browniano su Ò!ß "Ó e si consideri la v.a. 7 œ supÖ> − Ò!ß "Ó À B> œ !×. La v.a. 7 ammette d.p. data da 07 ÐBÑ œ " "Ò!ß"Ó ÐBÑ . 1BÐ" BÑ ovvero 7 è una v.a. con legge Beta di tipo UXÐ!ß "ß "Î#ß "Î#Ñ. Dimostrazione. Si veda Klebaner (2005, p.75). 9.5. Riferimenti bibliografici I testi di Bass (2011), Bhattacharya e Waymire (2009), Koralov e Sinai (2007) e Knill (2009) sono espressamente focalizzati sulla teoria dei processi stocastici. Ampie parti dei testi avanzati di Ash e Doléans-Dade (2000), Billingsley (1995), Çinlar (2010), Dudley (2004), Kallenberg (2002) e Stroock (2013) sono dedicati ai processi stocastici. Per un approccio introduttivo a questo argomento si ´ possono consultare i testi di Brzezniak e Zastawniak (2002), Durrett (2012), Resnick (2005) e Tijms (2003). I testi di Capasso e Bakstein (2015) e Revuz e Yor (2005) considerano in modo esaustivo i processi stocastici a tempo continuo. I processi a tempo discreto, con particolare enfasi sulle martingale, sono ´ considerati in Brzezniak e Zastawniak (2002), Pascucci (2011) e Williams (1992). In particolar modo le applicazioni delle martingale al gioco d'azzardo sono analizzate in Ethier (2010). Per una introduzione alle passeggiate aleatorie si può consultare il testo di Klafter e Sokolov (2011), mentre è fondamentale il capitolo dedicato a questo argomento in Feller (1968). Il moto Browniano è Capitolo 9 33 considerato in dettaglio nei testi di Mörters e Peres (2010) e Schilling e Partzsch (2012). Capitolo 10 Calcolo stocastico 10.1. Introduzione all'integrazione stocastica Il problema dell'integrazione stocastica può esser fatto risalire a Louis Bachelier (1870-1946). Se \> rappresenta il prezzo di un bene al variare del tempo, nella sua tesi di laurea Théorie de la spéculation (1900), Louis Bachelier propose di modellare gli incrementi infinitesimi del prezzo in modo proporzionale agli incrementi infinitesimi del moto Browniano, ovvero (con una simbologia moderna) introdusse la relazione euristica .\> œ 5 .F> dove 5 − Ó!ß ∞Ò. In questo caso, la precedente relazione porta intuitivamente a concludere che \> œ \! 5 F> . Tuttavia, anche se questo modello può essere discretamente valido per descrivere la dinamica del prezzo nel breve periodo, in generale non è realistico. In effetti, tenendo presenti le proprietà del moto Browniano, il prezzo \> può assumere valori negativi con probabilità crescente all'aumentare del tempo. Figura 9.2.1. Kiyosi Itô (1915-2008). 2 Calcolo stocastico L'inconveniente del modello potrebbe essere aggirato supponendo che l'incremento infinitesimo del prezzo, rapportato al prezzo stesso, sia proporzionale agli incrementi infinitesimi del moto Browniano considerando la relazione euristica .\> Î\> œ 5 .F> , ovvero .\> œ 5 \> .F> . Anche se questa ultima espressione potrebbe ricordare una equazione differenziale ordinaria, evidentemente presenta una difficoltà teorica dal momento che il moto Browniano non è differenziabile q.o. e quindi non ha significato matematico. Il problema è stato risolto da Kiyosi Itô (1915-2008), che ha dato un'interpretazione rigorosa alla precedente relazione con una formulazione in > termini di integrale del tipo \> œ \! 5 ! \= .F= . Nel secondo termine di quest'espressione compare appunto il cosiddetto integrale stocastico di Itô. Di seguito vengono introdotte le basi per la costruzione dell'integrale stocastico di Itô partendo da una classe elementare di processi, al fine di ottenere la definizione generale nella prossima sezione. Definizione 10.1.1. Si consideri uno spazio di probabilità ÐHß Y ß T Ñ con filtrazione ÐY> Ñ>−Ò!ßX Ó dove X !. Sia inoltre ! œ >! >" á >8 œ X una partizione di Ò!ß X Ó e sia dato un v.v.a. ^ œ Ð^! ß á ß ^8" ÑT tale che ogni v.a. ^3 è misurabile rispetto a Y>3 con EÒ^3# Ó ∞ per 3 œ !ß á ß 8 ". Il p.a. \ œ Ð\> Ñ>−Ò!ßX Ó è detto semplice se \> œ ^3 "Ò>3 ß>3" Ò Ð>Ñ . 8" 3œ! La classe dei p.a. semplici è denotata con fX# . Si noti che la misurabilità delle v.a. ^3 rispetto alle 5 -algebre Y>3 implica che il p.a. semplice \ sia adattato alla filtrazione ÐY> Ñ>−Ò!ß∞Ò . Inoltre, l'assunzione EÒ^3# Ó ∞ implica che EÒ\># Ó ∞ per ogni > − Ò!ß X Ó. Infine, fX# è uno spazio vettoriale, dal momento che è immediato verificare che +\ ,] − fX# per ogni \ß ] − fX# e +ß , − ‘. Definizione 10.1.2. Si consideri uno spazio di probabilità ÐHß Y ß T Ñ con filtrazione ÐY> Ñ>−Ò!ß∞Ò e il moto Browniano F œ ÐF> Ñ>−Ò!ß∞Ò adattato alla filtrazione. Dato il p.a. \ − fX# , l'integrale stocastico di Itô di \ è definito come 3 Capitolo 10 MÐ\Ñ œ ^3 ÐF>3" F>3 Ñ 8" 3œ! e si scrive MÐ\Ñ œ \> .F> . X ! Per semplicità di notazione si pone anche \> .F> œ "Ò+ß,Ò Ð>Ñ\> .F> , , X + ! dove +ß , − Ò!ß X Ó e + ,. Il seguente Teorema evidenzia che l'integrale stocastico di Itô è una v.a. con media nulla e secondo momento finito quando il p.a. è semplice. Teorema 10.1.3. Se \ − fX# , l'integrale stocastico di Itô è una v.a. tale che EÒMÐ\ÑÓ œ ! e VarÒMÐ\ÑÓ œ EÒMÐ\Ñ Ó œ # ! X EÒ\># Ó .> œ E \># .> ∞ . X ! Dimostrazione. È immediato verificare che MÐ\Ñ è una v.a. Per semplicità di notazione si assuma che J3 œ F>3" F>3 Þ Dal momento che la v.a. ^3 è misurabile rispetto a Y>3 e che l'incremento J3 è indipendente dalla 5 -algebra Y>3 per l'assunzione ii) della Definizione 9.4.1, tenendo presente i Teoremi 5.2.1 e 5.2.4 si ha EÒ^3 J3 Ó œ EÒEÒ^3 J3 ± Y>3 ÓÓ œ EÒ^3 EÒJ3 ± Y>3 ÓÓ œ EÒ^3 EÒJ3 ÓÓ œ ! , in quanto sussiste EÒJ3 Ó œ ! sulla base dell'assunzione ii) della Definizione 9.4.1. Quindi, risulta EÒMÐ\ÑÓ œ EÒ^3 J3 Ó œ ! . 8" 3œ! Inoltre, si ha 4 Calcolo stocastico MÐ\Ñ œ ^3 ^4 J3 J4 . 8" 8" # 3œ! 4œ! Tenendo presente i precedenti commenti, per 3 Á 4 e assumendo 3 4, si ha EÒ^3 ^4 J3 J4 Ó œ EÒEÒ^3 ^4 J3 J4 ± Y>4 ÓÓ œ EÒ^3 ^4 J3 EÒJ4 ± Y>4 ÓÓ œ EÒ^3 ^4 J3 EÒJ4 ÓÓ œ ! , mentre per 3 œ 4, si ha EÒ^3# J3# Ó œ EÒEÒ^3# J3# ± Y>3 ÓÓ œ EÒ^3# EÒJ3# ± Y>3 ÓÓ œ EÒ^3# EÒJ3# ÓÓ œ EÒ^3# ÓÐ>3" >3 Ñ , dal momento che EÒJ3# Ó œ Ð>3" >3 Ñ dall'assunzione ii) della Definizione 9.4.1. Dunque, risulta EÒMÐ\Ñ Ó œ EÒ^3# ÓÐ>3" >3 Ñ . 8" # 3œ! Inoltre, tenendo presente che "Ò>3 ß>3" Ò Ð>Ñ"Ò>4 ß>4" Ò Ð>Ñ œ ! per 3 Á 4, si ha X ! \># .> œ ^3 ^4 "Ò>3 ß>3" Ò Ð>Ñ"Ò>4 ß>4" Ò Ð>Ñ .> X 8" 8" ! 3œ! 4œ! # ^3 "Ò>3 ß>3" Ò Ð>Ñ .> ! 3œ! X 8" œ œ ^3# Ð>3" >3 Ñ , 8" 3œ! da cui E ! X \># .> œ ! X œ EÒ^3# ÓÐ>3" >3 Ñ . 8" EÒ\># Ó .> 3œ! Il teorema segue dalle precedenti relazioni. Esempio 10.1.1. Si assuma il p.a. semplice \ œ Ð\> Ñ>−Ò!ß&Ó , dove \> œ ^! "Ò!ß"Ò Ð>Ñ ^" "Ò"ß#Ò Ð>Ñ ^# "Ò#ß&Ó Ð>Ñ , e ^ œ Ð^! ß ^" ß ^# ÑT è un v.v.a. degenere con T Ð^! œ "ß ^" œ #ß ^# œ "Ñ œ ". In questo caso, l'integrale stocastico di Itô è dato da 5 Capitolo 10 MÐ\Ñ œ ^! ÐF" F! Ñ ^" ÐF# F" Ñ ^# ÐF& F# Ñ _ œ F" #ÐF# F" Ñ ÐF& F# Ñ . Dunque, dall'assunzione iii) della Definizione 9.4.1, si ha che MÐ\Ñ è una v.a. caratterizzata dalla legge Normale a Ð!ß (Ñ. In effetti dal Teorema 10.1.3 risulta EÒMÐ\ÑÓ œ ! e VarÒMÐ\ÑÓ œ EÒ^!# Ó EÒ^"# Ó $EÒ^## Ó œ ( . Esempio 10.1.2. Si assuma il p.a. semplice \ œ Ð\> Ñ>−Ò!ß"Ó , dove \> œ ^! "Ò!ß"Ó Ð>Ñ , mentre ^! è una v.a. caratterizzata dalla legge di Bernoulli di parametro "Î#. In questo caso, l'integrale stocastico di Itô è dato da _ MÐ\Ñ œ ^! ÐF" F! Ñ œ ^! F" . Dunque, la f.r. della v.a. MÐ\Ñ è data da " T ÐÖMÐ\Ñ Ÿ B× ± Ö^! œ !×Ñ # " " œ T Ð^0 Ÿ BÑ T ÐF" Ÿ BÑ œ # # JMÐ\Ñ ÐBÑ œ " T ÐÖMÐ\Ñ Ÿ B× ± Ö^! œ "×Ñ # " " "Ò!ß∞Ò ÐBÑ FÐBÑ . # # Dunque, MÐ\Ñ è una v.a. mista, dal momento che la corrispondente f.r. è una combinazione convessa di una f.r. di una v.a. degenere nello zero e una v.a. con legge Normale ridotta. Inoltre, risulta EÒMÐ\ÑÓ œ ! e VarÒMÐ\ÑÓ œ EÒ^!# Ó œ " . # I seguenti Teoremi forniscono rispettivamente la proprietà di linearità l'integrale stocastico di Itô e la covarianza fra due integrali stocastici di Itô nel caso di p.a. semplici. Teorema 10.1.4. Dati i p.a. \ß ] − fX# , per ogni +ß , − ‘ si ha MÐ+\ ,] Ñ œ +MÐ\Ñ ,MÐ] Ñ . 6 Calcolo stocastico Dimostrazione. Si consideri la partizione ! œ >! >" á >8 œ X di Ò!ß X Ó, in modo tale che \> œ ^3 "Ò>3 ß>3" Ò Ð>Ñ 8" 3œ! e ]> œ Y3 "Ò>3 ß>3" Ò Ð>Ñ . 8" 3œ! dove le v.a. ^3 e Y3 sono misurabili rispetto a Y>3 con EÒ^3# Ó ∞ e EÒY3# Ó ∞ per 3 œ !ß á ß 8 ". Se le due partizioni per i p.a. \ e ] sono differenti, è sempre possibile considerare una partizione comune considerando un raffinamento delle due partizioni originali. Dunque, si ha +\> ,]> œ Ð+^3 ,Y3 Ñ"Ò>3 ß>3" Ò Ð>Ñ . 8" 3œ! Assumendo le notazioni nella dimostrazione del Teorema 10.1.3, risulta MÐ+\ ,] Ñ œ Ð+^3 ,Y3 ÑJ3 8" 3œ! 8" 8" 3œ! 3œ! œ + ^3 J3 , Y3 J3 œ +MÐ\Ñ ,MÐ] Ñ , da cui segue il risultato. Teorema 10.1.5. Dati i p.a. \ß ] − fX# , si ha CovÒMÐ\Ñß MÐ] ÑÓ œ EÒMÐ\ÑMÐ] ÑÓ œ EÒ\> ]> Ó .> œ E \> ]> .> . X ! Dimostrazione. Tenendo presente l'identità +, œ " " " Ð+ ,Ñ# +# ,# , # # # dove +ß , − ‘, e il Teorema 10.1.3, si ha X ! 7 Capitolo 10 " " " EÒÐMÐ\Ñ MÐ] ÑÑ# Ó EÒMÐ\Ñ# Ó EÒMÐ] Ñ# Ó # # # X X X " " " # # œ E Ð\> ]> Ñ .> E \> .> E ]># .> # # # ! ! ! EÒMÐ\ÑMÐ] ÑÓ œ œ E \> ]> .> , X ! da cui segue il risultato. 10.2. Integrale di Itô La seguente classe di p.a. è centrale nella definizione generale dell'integrale stocastico di Itô. In effetti, gli elementi di questa classe saranno le “funzioni integrande” opportune per cui l'integrale stocastico è definito. Definizione 10.2.1. Si consideri uno spazio di probabilità ÐHß Y ß T Ñ con filtrazione ÐY> Ñ>−Ò!ß∞Ò . La classe `#X è costituita dai p.a. \ œ Ð\> Ñ>−Ò!ßX Ó adattati X alla filtrazione e tali che EÒ! \># .>Ó ∞. Esempio 10.2.1. Si consideri il p.a. \ œ ÐF> Ñ>−Ò!ßX Ó . Tenendo presente la Definizione 9.4.1 si ha E X ! F># .> œ X ! EÒF># Ó .> X# œ > .> œ , # ! X ovvero \ − `#X . Si consideri inoltre il p.a. \ œ ÐF># Ñ>−Ò!ßX Ó . Tenendo presente che in base al Teorema 9.4.3 si ha EÒF>% Ó œ $># (si veda anche l'Esempio 7.1.8), allora risulta E ! X F>% .> œ ovvero si ha anche \ − `#X . ! X EÒF>% Ó .> œ $># .> œ X $ , X ! 8 Calcolo stocastico È immediato verificare che fX# § `X# . Inoltre, il seguente Teorema fornisce una semplice condizione per verificare se un p.a. appartiene alla classe `#X , mentre il Teorema successivo evidenzia che la classe fX# è densa nella classe `#X . Teorema 10.2.2. Se il p.a. \ œ Ð\> Ñ>−Ò!ßX Ó è adattato alla filtrazione e limitato, ovvero se esiste O ! tale che l\> Ð=Ñl O per ogni Ð>ß =Ñ − Ò!ß X Ó ‚ H, allora \ − `#X . Dimostrazione. Dalle assunzioni si ha E X ! \># .> Ÿ E O # .> œ X O # , X ! e sulla base della Definizione 10.2.1 segue il teorema. Teorema 10.2.3. Per ogni p.a. \ œ Ð\> Ñ>−Ò!ßX Ó tale che \ − `#X esiste una successione di p.a. Ð\8 Ñ8 " , dove \8 œ Ð\>ß8 Ñ>−Ò!ßX Ó con \8 − fX# , che approssima il p.a. \ , ovvero lim E Ð\> \>ß8 Ñ# .> œ ! . X 8 ! Dimostrazione. Si veda Da Prato (2014). Sulla base dei precedenti risultati, si può introdurre la versione generale dell'integrale stocastico di Itô di un p.a. definito su `#X come limite in media quadratica di una successione di integrali stocastici relativi ad una successione di p.a. semplici. Definizione 10.2.4. Si consideri uno spazio di probabilità ÐHß Y ß T Ñ con filtrazione ÐY> Ñ>−Ò!ß∞Ò e un moto Browniano F œ ÐF> Ñ>−Ò!ß∞Ò adattato alla filtrazione. Dato il p.a. \ − `#X , si dice che MÐ\Ñ è l'integrale stocastico di Itô del p.a. \ se lim EÒÐMÐ\Ñ MÐ\8 ÑÑ# Ó œ ! 8 per ogni successione Ð\8 Ñ8 " di p.a. tali che \8 − fX# e si scrive 9 Capitolo 10 MÐ\Ñ œ \> .F> . X ! Evidentemente, la precedente Definizione implica che l'integrale stocastico di Itô può essere definito in termini di convergenza in media quadratica, ovvero risulta P# MÐ\8 Ñ Ä MÐ\Ñ per 8 Ä ∞. Inoltre, in modo equivalente a quanto fatto per i p.a. semplici, per semplicità di notazione si pone anche \> .F> œ "Ò+ß,Ò Ð>Ñ\> .F> . , X + ! Dal seguente Teorema si evince che l'integrale stocastico è ben definito, nel senso che non dipende dalla scelta della successione di p.a. semplici. Teorema 10.2.5. Per ogni p.a. \ − `#X , l'integrale stocastico di Itô MÐ\Ñ non dipende dalla successione di p.a. semplici Ð\8 Ñ8 " che approssimano il p.a. \. Dimostrazione. Si consideri due successioni Ð\8 Ñ8 " e Ð]8 Ñ8 " che X approssimano \ in `#X , ovvero tali che lim8 EÒ! Ð\> \>ß8 Ñ# .>Ó œ ! e X lim8 EÒ! Ð\> ]>ß8 Ñ# .>Ó œ !. Tenendo presente la disuguaglianza Ð+ ,Ñ# Ÿ #+# #,# , dove +ß , − ‘, si ha E Ð\>ß8 ]>ß8 Ñ .> Ÿ #E Ð\> \>ß8 Ñ .> #E Ð\> ]>ß8 Ñ# .> X X # ! ! e dunque lim E Ð\>ß8 ]>ß8 Ñ# .> œ ! . X 8 ! Inoltre, dai Teoremi 10.1.3 e 10.1.4 si ha X # ! 10 Calcolo stocastico EÒÐMÐ\8 Ñ MÐ]8 ÑÑ Ó œ EÒMÐ\8 ]8 Ñ Ó œ E Ð\>ß8 ]>ß8 Ñ# .> , # X # ! da cui, sulla base del precedente risultato, si ha lim EÒÐMÐ\8 Ñ MÐ]8 ÑÑ# Ó œ ! , 8 da cui segue il Teorema sulla base delle assunzioni e della Definizione 10.2.4. In modo parallelo per quanto visto per i p.a. semplici si hanno i seguenti Teoremi. Teorema 10.2.6. Se \ − `#X , l'integrale stocastico di Itô è una v.a. tale che EÒMÐ\ÑÓ œ ! e VarÒMÐ\ÑÓ œ EÒMÐ\Ñ Ó œ X # ! EÒ\># Ó .> œ E \># .> ∞ . X ! Dimostrazione. Si consideri una successione di p.a. Ð\8 Ñ8 " che approssima il p.a. \ in `#X . Per quanto riguarda la prima parte, tenendo presente che EÒMÐ\8 ÑÓ œ ! dal Teorema 10.1.3 e sulla base della disuguaglianza di Jensen (Teorema 4.2.6) si ha EÒMÐ\ÑÓ# œ EÒMÐ\ \8 ÑÓ# Ÿ EÒMÐ\ \8 Ñ# Ó œ EÒÐMÐ\Ñ MÐ\8 ÑÑ# Ó e quindi per 8 Ä ∞ segue che EÒMÐ\ÑÓ œ ! dalla Definizione 10.2.4. Per quanto riguarda la seconda parte, dalla disuguaglianza di Schwarz (Teorema 4.4.2) e per le proprietà dell'integrale di Lebesgue, si ha "Î# "Î# "Î# X X X # E Ð\> \>ß8 Ñ# .> E \># .> E \>ß8 .> . ! ! ! X Dal momento che lim8 EÒ! Ð\> \>ß8 Ñ# .>Ó œ ! sulla base del Teorema 10.2.3, la precedente relazione implica che lim E 8 ! X # \>ß8 .> œ E \># .> . X ! 11 Capitolo 10 In modo simile, la Definizione 10.2.4 implica che X X lim E \>ß8 .F> œ E \> .F> , 8 ! ! # # ovvero lim EÒMÐ\8 Ñ# Ó œ EÒMÐ\Ñ# Ó . 8 Inoltre, dal momento che \8 − fX# , dal Teorema 10.1.3 si ha X X # E \>ß8 .F> œ E \>ß8 .> ! ! # e quindi i due limiti precedenti coincidono. Teorema 10.2.7. Dati i p.a. \ß ] − `#X , per ogni +ß , − ‘ si ha MÐ+\ ,] Ñ œ +MÐ\Ñ ,MÐ] Ñ . Dimostrazione. Si consideri due successioni di p.a. semplici Ð\8 Ñ8 " e Ð]8 Ñ8 " che approssimano rispettivamente i p.a. \ e ] in `#X , ovvero tali che X X lim8 EÒ! Ð\> \>ß8 Ñ# .>Ó œ ! e lim8 EÒ! Ð]> ]>ß8 Ñ# .>Ó œ !. Tenendo presente la disuguaglianza nella dimostrazione del Teorema 10.2.5, dal momento che E Ð+\> ,]> +\>ß8 ,]>ß8 Ñ# .> Ÿ X ! Ÿ #+ E Ð\> \>ß8 Ñ .> #, E Ð]> ]>ß8 Ñ# .> , X # # ! X # ! allora dalle precedenti relazioni risulta lim EÒ Ð+\> ,]> +\>ß8 ,]>ß8 Ñ# .>Ó œ ! , X 8 ! ovvero la successione di p.a. semplici Ð+\8 ,]8 Ñ8 " approssima il p.a. +\ ,] in `#X . Dunque, dalla Definizione 10.2.4 si ha 12 Calcolo stocastico lim EÒÐMÐ+\ ,] Ñ MÐ+\8 ,]8 ÑÑ# Ó œ ! , 8 ovvero, tenendo presente il Teorema 10.1.4, risulta anche lim EÒÐMÐ+\ ,] Ñ +MÐ\8 Ñ ,MÐ]8 ÑÑ# Ó œ ! . 8 Inoltre, si ha EÒÐ+MÐ\Ñ ,MÐ] Ñ +MÐ\8 Ñ ,MÐ]8 ÑÑ# Ó Ÿ Ÿ #+# EÒÐMÐ\Ñ MÐ\8 ÑÑ# Ó #,# EÒÐMÐ\Ñ MÐ\8 ÑÑ# Ó , e poichè risulta lim8 EÒÐMÐ\Ñ MÐ\8 ÑÑ# Ó œ ! e lim8 EÒÐMÐ] Ñ MÐ]8 ÑÑ# Ó œ ! dalla Definizione 10.2.4, si ha che lim EÒÐ+MÐ\Ñ ,MÐ] Ñ +MÐ\8 Ñ ,MÐ]8 ÑÑ# Ó œ ! . 8 Confrontando i precedenti limiti si ottiene il teorema. Teorema 10.2.8. Dati i p.a. \ß ] − `#X , si ha CovÒMÐ\Ñß MÐ] ÑÓ œ EÒMÐ\ÑMÐ] ÑÓ œ EÒ\> ]> Ó .> œ E \> ]> .> . X ! Dimostrazione. È analoga a quella del Teorema 10.1.5. X ! Esempio 10.2.2. Se \ œ Ð\> ÑÒ!ßX Ó è un p.a. per cui risulta che \> œ "Ò!ßX Ó Ð>Ñ, si vuole verificare che MÐ\Ñ œ .F> œ FX . X ! Evidentemente, \ è un p.a. semplice e dunque \ − `#X . Inoltre, si può banalmente scegliere la successione Ð\8 Ñ8 " con \8 œ \ e quindi sussiste MÐ\8 Ñ œ ÐF>3"ß8 F>3ß8 Ñ œ FX . 8" 3œ! Ovviamente, si ha 13 Capitolo 10 P# MÐ\8 Ñ Ä FX e dalla Definizione 10.2.4 risulta MÐ\Ñ œ FX . Dunque, in questo caso l'integrale stocastico di Itô è una v.a. caratterizzata da legge Normale a Ð!ß X Ñ. Ovviamente, dal Teorema 10.2.6 risulta che EÒMÐ\ÑÓ œ ! e VarÒMÐ\ÑÓ œ X . Esempio 10.2.3. Se \ œ ÐF> ÑÒ!ßX Ó , si vuole verificare che MÐ\Ñ œ F> .F> œ X ! " # ÐF X Ñ . # X Precedentemente, nell'Esempio 10.2.1 è stato verificato che \ − `#X . Dunque, posto ! œ >!ß8 >"ß8 á >8ß8 œ X , si consideri la successione di p.a. semplici Ð\8 Ñ8 " , dove \8 œ Ð\>ß8 Ñ>−Ò!ßX Ó e \>ß8 œ F>3ß8 "Ò>3ß8 ß>3"ß8 Ò Ð>Ñ . 8" 3œ! Inoltre, dal momento che l'integrale stocastico non dipende dalla scelta della successione, si ponga >3ß8 œ 3X Î8. Inoltre, tenendo presente l'identità +Ð, +Ñ œ " # " Ð, +# Ñ Ð, +Ñ# , # # dove +ß , − ‘, si ha MÐ\8 Ñ œ F>3ß8 ÐF>3"ß8 F>3ß8 Ñ 8" 3œ! 8" " " 8" # # œ ÐF>3"ß8 F>3ß8 Ñ ÐF>3"ß8 F>3ß8 Ñ# # 3œ! # 3œ! " # " 8" œ FX ÐF>3"ß8 F>3ß8 Ñ# . # # 3œ! Dunque, tenendo presente il Teorema 9.4.11 si ha 14 Calcolo stocastico " # " 8" P# " FX ÐF>3"ß8 F>3ß8 Ñ# Ä ÐFX# X Ñ # # 3œ! # per 8 Ä ∞ e dalla Definizione 10.2.4 risulta MÐ\Ñ œ " # ÐF X Ñ . # X In questo caso, l'integrale di Itô è una trasformata lineare del quadrato di una v.a. caratterizzata dalla legge Normale a Ð!ß X Ñ. Inoltre, dal Teorema 10.2.6 si ha che EÒMÐ\ÑÓ œ ! e VarÒMÐ\ÑÓ œ X # Î#. Si noti infine che il risultato ottenuto nell'integrazione stocastica è simile a quello che si ha in un ambito di integrazione con funzioni deterministiche, eccetto la presenza di un secondo termine. Questo termine è dovuto al fatto che la variazione di un moto Browniano non è nulla (vedi Teorema 9.4.11). Seguendo un percorso analogo a quello che si conduce nella teoria dell'integrazione ordinaria, di seguito viene dato il concetto di processo integrale. Definizione 10.2.9. Si consideri uno spazio di probabilità ÐHß Y ß T Ñ con filtrazione ÐY> Ñ>−Ò!ß∞Ò e un moto Browniano F œ ÐF> Ñ>−Ò!ß∞Ò adattato alla filtrazione. Dato il p.a. \ − `#X , si dice processo integrale il p.a. Q œ ÐQ> Ñ>−Ò!ßX Ó tale che Q> œ \= .F= . > ! Il seguente Teorema considera le principali caratteristiche del processo integrale. Teorema 10.2.10. Se Q œ ÐQ> Ñ>−Ò!ßX Ó è un processo integrale, allora Q è unico ;Þ-Þ e Q − `#X . Inoltre, Q è una martingala rispetto alla filtrazione ÐY> Ñ>−Ò!ß∞Ò con traiettorie continue ;Þ-Þ Dimostrazione. Si veda Da Prato (2014). Esempio 10.2.4. Dall'Esempio 10.2.3, si consideri il processo integrale Q œ ÐQ> Ñ>−Ò!ßX Ó tale che 15 Capitolo 10 Q> œ F= .F= œ > ! " # ÐF >Ñ . # > Tenendo presente l'Esempio 10.2.1, si ha E ! X Q># X " .> Ÿ E ÐF>% ># Ñ .> % ! X " " X # X$ % œ E F> .> > .> œ ∞, % % ! $ ! e dunque risulta Q − `#X a conferma del Teorema 10.2.10. Inoltre, si ha EÒlQ> lÓ Ÿ " > EÒF># Ó œ > ∞ . # # Tenendo presente che il moto Browniano è una martingala (Teorema 9.4.5), per ogni = > risulta EÒF># ± Y= Ó œ EÒÐF> F= Ñ# ± Y= Ó #EÒF> F= ± Y= Ó EÒF=# ± Y= Ó œ EÒÐF> F= Ñ# Ó #F=# F=# œ > = F=# , ovvero EÒF># > ± Y= Ó œ F=# = , da cui infine risulta EÒQ> ± Y= Ó œ Q= . Dunque, di nuovo a conferma del Teorema 10.2.10, dalla Definizione 9.2.1 si ha che il p.a. Q è una martingala. 10.3. Formula di Itô Di seguito viene considerata un'ampia classe di processi aleatori, detti processi di Itô, che generalizza la famiglia dei processi integrali presentata nella precedente sezione. Inoltre, viene introdotta la cosiddetta formula di Itô, che permette di determinare la struttura di una trasformata di un processo di Itô e che risulta fondamentale per il calcolo differenziale stocastico. 16 Calcolo stocastico Definizione 10.3.1. Si consideri uno spazio di probabilità ÐHß Y ß T Ñ con filtrazione ÐY> Ñ>−Ò!ß∞Ò . Un p.a. \ œ Ð\> Ñ>−Ò!ßX Ó è detto processo di Itô se si ha \> œ \! α= .= "= .F= , > > ! ! dove α œ Ðα> Ñ>−Ò!ßX Ó e " œ Ð"> Ñ>−Ò!ßX Ó sono p.a. tali che αß " − `#X . Quando si considera il processo di Itô, è uso comune adottare la seguente notazione alternativa .\> œ α> .> "> .F> , e denominare .\> come differenziale stocastico. La precedente espressione viene detta anche notazione differenziale di Itô. Tuttavia, si deve evidenziare che il differenziale stocastico non ha un significato matematico ben definito e dovrebbe sempre essere inteso nel senso rigoroso della Definizione 10.3.1. La notazione differenziale di Itô va dunque vista solamente come un modo efficiente di scrivere il processo di Itô. Esempio 10.3.1. Considerato il p.a. \ œ ÐF> ÑÒ!ßX Ó e tenendo presente l'Esempio 10.2.2, si ha F> œ .F= . > ! Dunque, il moto Browniano è un processo di Itô, dal momento che è immediato verificare che αß " − `#X , essendo α> œ ! e "> œ ". Esempio 10.3.2. Considerato il p.a. \ œ ÐF># ÑÒ!ßX Ó e tenendo presente l'Esempio 10.2.3 si ha F># œ .= # F= .F= > ! > ! Dunque, il moto Browniano è un processo di Itô, dal momento che αß " − `#X , essendo α> œ " e "> œ F> (vedi anche Esempio 10.2.1). Inoltre, in notazione differenziale si può scrivere .F># œ .> #F> .F> . 17 Capitolo 10 Il seguente Teorema fornisce le caratteristiche principali del processo di Itô. Teorema 10.3.2. Se il p.a. \ œ Ð\> Ñ>−Ò!ßX Ó è un processo di Itô, allora \ ha traiettorie continue ;Þ-Þ Inoltre, \ è una martingala se il p.a. α œ Ðα> Ñ>−Ò!ßX Ó è tale che α> œ !. Dimostrazione. Segue immediatamente dalle assunzioni e dal Teorema 10.2.10. Il seguente Teorema considera la celebrata formula di Itô, che fornisce il effetti la rappresentazione integrale di una trasformata del processo di Itô. Teorema 10.3.3. (Formula di Itô per trasformate univariate) Se il p.a. \ è un processo di Itô e 1 À ‘ È ‘ è una funzione con derivata seconda continua, allora " > ww 1Ð\> Ñ œ 1Ð\! Ñ 1 Ð\= Ñα= .= 1 Ð\= Ñ"= .F= 1 Ð\= Ñ"=# .= , # ! ! ! > > w w ovvero in notazione differenziale di Itô si ha .1Ð\> Ñ œ 1w Ð\> Ñα> .> 1w Ð\> Ñ"> .F> œ 1w Ð\> Ñ .\> " ww 1 Ð\> Ñ"># .> . # " ww 1 Ð\> Ñ"># .> # Dimostrazione. Si veda Da Prato (2014). È importante notare che nel precedente Teorema la funzione 1 non può dipendere da >. Di seguito vengono date alcune esemplificazioni di questa importante formula. Esempio 10.3.3. Si consideri il moto Browniano \ œ ÐF> ÑÒ!ßX Ó e la funzione 1ÐBÑ œ B7 con 7 − Ö"ß #ß á ×. Dal momento che è stato verificato che \ è un processo di Itô nell'Esempio 10.3.1, dal Teorema 10.3.3 si ha F>7 œ 7 ! > F=7" 7Ð7 "Ñ > 7# .F= F= .= , # ! ovvero in notazione differenziale si ha 18 Calcolo stocastico .F>7 œ 7F>7" .F> 7Ð7 "Ñ 7# F> .> . # In effetti, questa relazione generalizza quella ottenuta nell'Esempio 10.3.2 nel caso particolare 7 œ #. Esempio 10.3.4. Si consideri il p.a. \ œ Ð\> ÑÒ!ßX Ó tale che .\> œ " \> .> \> .F> . # Se si suppone che \ − `#X , il p.a. \ è un processo di Itô con α œ Ð\> Î#Ñ>−Ò!ßX Ó e " œ Ð\> Ñ>−Ò!ßX Ó . In questo caso, considerata la funzione 1ÐBÑ œ logÐBÑ, dal Teorema 10.3.3 si ottiene " > " > " > logÐ\> Ñ œ logÐ\! Ñ .= .F= .= œ logÐ\! Ñ F> , # ! # ! # ! ovvero in notazione differenziale si ha . logÐ\> Ñ œ .F> . Si deve concludere dunque che \> œ \! expÐF> Ñ, ovvero si è determinata la struttura del p.a. \ che soddisfa alla relazione differenziale stocastica .\> œ Ð"Î#Ñ\> .> \> .F> . Inoltre, risulta in effetti \ − `#X , dal momento che tenendo presente il Teorema 9.4.3 si ha EÒexpÐF> ÑÓ œ expÐ>Î#Ñ, e quindi E expÐF> Ñ .> œ EÒexpÐF> ÑÓ .> œ expÐ>Î#Ñ .> œ #expÐX Î#Ñ # . X ! X X ! ! Si consideri inoltre un generalizzazione del p.a. \ , ovvero .\> œ .\> .> 5 \> .F> , dove . − ‘ e 5 − Ó!ß ∞Ò. Dunque, si ha α œ Ð.\> Ñ>−Ò!ßX Ó e " œ Ð5 \> Ñ>−Ò!ßX Ó . Dal Teorema 10.3.3, considerata ancora la funzione 1ÐBÑ œ logÐBÑ, si ottiene quindi " > # logÐ\> Ñ œ logÐ\! Ñ . .= 5 .F= 5 .= # ! ! ! œ logÐ\! Ñ Ð. 5 # Î#Ñ> 5 F> , > ovvero in notazione differenziale si ha > 19 Capitolo 10 . logÐ\> Ñ œ Ð. 5 # Î#Ñ .> 5 .F> . Si deve concludere dunque che \> œ \! expÐÐ. 5 # Î#Ñ> 5 F> Ñ . Il p.a. \ è detto moto Browniano geometrico e riveste grande importanza nelle applicazioni finanziarie. Si noti infine che per . œ ! il p.a. \ si riduce a > .\> œ 5 \> .F> , ovvero \> œ \! 5 ! \= .F= in termini di integrale di Itô. Quindi, si è ottenuta la risposta formale al problema introdotto all'inizio della Sezione 10.1 e che ha condotto a considerare l'integrale di Itô. 7 6 5 4 3 2 1 0 0.0 0.5 1.0 1.5 2.0 Figura 10.3.1. Una traiettoria del moto Browniano geometrico con . œ " e 5 œ ". Il seguente Teorema estende la formula di Itô nella situazione in cui si considera due processi di Itô e una loro trasformata. Ovviamente, la formula può essere ancora generalizzata al caso di più processi di Itô (per maggiori dettagli, si veda Da Prato, 2014, p.121). Teorema 10.3.4. (Formula di Itô per trasformate bivariate) Se i p.a. \ e ] sono processi di Itô tali che .\> œ α\ß> .> "\ß> .F> e 20 Calcolo stocastico .]> œ α] ß> .> "] ß> .F> , mentre 1 À ‘# È ‘ è una funzione con derivate parziali seconde continue, allora 1Ð\> ß ]> Ñ œ 1Ð\! ß ]! Ñ > > `1ÐBß CÑ `1ÐBß CÑ α\ß= .= α] ß= .= `B `C ! ! Ð\= ß]= Ñ Ð\= ß]= Ñ > > ! > `1ÐBß CÑ `1ÐBß CÑ "\ß= .F= "] ß= .F= `B `C ! Ð\= ß]= Ñ Ð\= ß]= Ñ " > ` # 1ÐBß CÑ " > `1ÐBß CÑ # "\ß= .= "]# ß= .= # # ! `B # ! `C Ð\= ß]= Ñ Ð\= ß]= Ñ ! ` # 1ÐBß CÑ "\ß= "] ß= .= . `B`C Ð\= ß]= Ñ Equivalentemente, in notazione differenziale stocastica si ha .1Ð\> ß ]> Ñ œ `1ÐBß CÑ `1ÐBß CÑ α .> α] ß> .> \ß> `B `C Ð\> ß]> Ñ Ð\> ß]> Ñ `1ÐBß CÑ `1ÐBß CÑ "\ß> .F> "] ß> .F> `B `C Ð\> ß]> Ñ Ð\> ß]> Ñ " ` # 1ÐBß CÑ " ` # 1ÐBß CÑ # "\ß> .> "]# ß> .> # # # `B # `C Ð\> ß]> Ñ Ð\> ß]> Ñ ` # 1ÐBß CÑ "\ß> "] ß> .> , `B`C Ð\> ß]> Ñ ovvero .1Ð\> ß ]> Ñ œ `1ÐBß CÑ `1ÐBß CÑ .\ .]> > `B `C Ð\> ß]> Ñ Ð\> ß]> Ñ " ` # 1ÐBß CÑ " ` # 1ÐBß CÑ # "\ß> .> "]# ß> .> # # # `B # `C Ð\> ß]> Ñ Ð\> ß]> Ñ ` # 1ÐBß CÑ "\ß> "] ß> .> . `B`C Ð\> ß]> Ñ Dimostrazione. Si veda Da Prato (2014, p.121). 21 Capitolo 10 Esempio 10.3.5. Si consideri i p.a. di Itô \ e ] , dove .]> œ .>. Evidentemente, ] è in effetti un processo deterministico. In questo caso, essendo α] ß> œ " e "] ß> œ !, la formula di Itô del Teorema 10.3.4 si riduce a .1Ð\> ß >Ñ œ `1ÐBß CÑ `1ÐBß CÑ .\> .> `B `C Ð\> ß>Ñ Ð\> ß>Ñ " ` # 1ÐBß CÑ # "\ß> .> , # # `B Ð\> ß>Ñ che è anche detta formula ridotta di Itô. Al fine di esemplificare questa formula, supponiamo che \ sia il moto Browniano, ovvero .\> œ .F> , e si consideri inoltre la funzione 1ÐBß CÑ œ expÐB CÎ#Ñ. Dunque, calcolando le derivate parziali, dalla precedente espressione si ottiene . expÐF> >Î#Ñ œ expÐF> >Î#Ñ .F> . Se si pone ^ œ Ð^> ÑÒ!ßX Ó con ^> œ expÐF> >Î#Ñ, si è determinato dunque il p.a. che soddisfa alla relazione differenziale stocastica .^> œ ^> .F> . Tenendo presente l'Esempio 10.3.4, il p.a. ^ è quindi un moto Browniano geometrico con . œ ! e 5 œ ". Più generalmente, se si considera inoltre la funzione 1ÐBß CÑ œ expÐ5 B Ð. 5 # Î#ÑCÑ con . − ‘ e 5 − Ó!ß ∞Ò, si ha . expÐ5 F> Ð. 5 # Î#Ñ>Ñ œ 5 expÐ5 F> Ð. 5 # Î#Ñ>Ñ .F> , ovvero, se si pone ^ œ Ð^> ÑÒ!ßX Ó con ^> œ expÐ5 F> Ð. 5 # Î#Ñ>Ñ, si è ottenuta una formulazione alternativa del moto Browniano geometrico. Esempio 10.3.6. Si consideri i processi di Itô \ e ] e la funzione 1ÐBß CÑ œ BC. Calcolando le derivate parziali e sostituendo opportunamente, dal Teorema 10.3.4 si ha dunque .Ð\> ]> Ñ œ ]> α\ß> .> \> α] ß> .> ]> "\ß> .F> \> "] ß> .F> "\ß> "] ß> .> œ ]> .\> \> .]> "\ß> "] ß> .> . Questa espressione è detta anche formula di integrazione stocastica per parti. Si noti infine che il risultato ottenuto nell'integrazione stocastica è simile a quello che si ha in un ambito di integrazione con funzioni deterministiche, eccetto la presenza di un terzo termine. Questo termine è dovuto al fatto in generale i processi di Itô \ e ] non sono indipendenti, in quanto sono trasformate dello stesso moto Browniano. 22 Calcolo stocastico 10.4. Equazioni differenziali stocastiche Il calcolo differenziale classico è stato sviluppato principalmente al fine di porre in termini di equazioni differenziali i principi fondamentali che governano i fenomeni fisici nel tempo. Il calcolo differenziale stocastico è stato introdotto con simili scopi nel caso di sistemi che si evolvono con una componente aleatoria. Ovviamente, questo tipo di modelli fornisce una descrizione più efficiente dei fenomeni reali. La seguente definizione introduce una classe di equazioni differenziali che ha importanza fondamentale nelle applicazioni. Definizione 10.4.1. Si consideri uno spazio di probabilità ÐHß Y ß T Ñ con filtrazione ÐY> Ñ>−Ò!ß∞Ò . Siano inoltre + e , due funzioni tali che + À ‘# È ‘ e , À ‘# È ‘. Un processo di Itô \ œ Ð\> Ñ>−Ò!ßX Ó è detto soluzione dell'equazione differenziale stocastica .\> œ +Ð\> ß >Ñ .> ,Ð\> ß >Ñ .F> con condizione iniziale \! œ G , se G è una v.a. misurabile rispetto alla 5 algebra Y! , i p.a. + œ Ð+Ð\> ß >ÑÑ>−Ò!ßX Ó e , œ ,Ð\> ß >Ñ>−Ò!ßX Ó sono tali che +ß , − `#X e risulta \> œ G +Ð\= ß >Ñ .= ,Ð\= ß >Ñ .F= , > ! > ! per ogni >. Il seguente Teorema fornisce le condizioni per l'esistenza e l'unicità di una soluzione di un'equazione differenziale stocastica. Teorema 10.4.2. Si consideri uno spazio di probabilità ÐHß Y ß T Ñ con filtrazione ÐY> Ñ>−Ò!ß∞Ò . Siano inoltre + e , due funzioni + À ‘# È ‘ e , À ‘# È ‘ tali che esiste P ! per cui l+ÐBß >Ñ +ÐCß >Ñl l,ÐBß >Ñ ,ÐCß >Ñl Ÿ PlB Cl , per ogni Bß C − ‘ e > − Ò!ß X Ó, e esiste O ! per cui l+ÐBß >Ñl l,ÐBß >Ñl Ÿ OÐ" lBlÑ , 23 Capitolo 10 per ogni B − ‘ e > − Ò!ß X Ó. Inoltre, sia G una v.a. misurabile rispetto alla 5 algebra Y! , tale che EÒG # Ó ∞. In questo caso, l'equazione differenziale stocastica .\> œ +Ð\> ß >Ñ .> ,Ð\> ß >Ñ .F> , con condizione iniziale \! œ G , possiede un'unica soluzione \ con traiettorie X continue e tale che EÒ! \># .>Ó ∞. Dimostrazione. Si veda Da Prato (2014, p.134). Esempio 10.4.1. Si consideri l'equazione differenziale stocastica .\> œ .> \> .> 5> \> .F> , con condizione iniziale \! œ G , dove . À ‘ È ‘ e 5 À ‘ È ‘ sono funzioni continue in Ò!ß X Ó. Dunque, in questo caso si ha +ÐBß >Ñ œ .> B e ,ÐBß >Ñ œ 5> B. La prima condizione del Teorema 10.4.2 risulta soddisfatta, in quanto l+ÐBß >Ñ +ÐCß >Ñl l,ÐBß >Ñ ,ÐCß >Ñl œ Ðl.> l l5> lÑlB Cl Ÿ PlB Cl , dal momento che esiste P ! per cui l.> l l5> l Ÿ P essendo . e 5 funzioni continue in Ò!ß X Ó. Anche la seconda condizione del Teorema 10.4.2 risulta soddisfatta in modo simile, in quanto l+ÐBß >Ñl l,ÐBß >Ñl œ Ðl.> l l5> lÑlBl Ÿ OÐ" lBlÑ . Si consideri inoltre i processi di Itô Y e Z , tali che .Y> œ 5> .F> e .Z> œ .> e la trasformata 1Ð?ß @Ñ œ - exp? Ð.= 5=# Î#Ñ .= , @ ! dove - è una determinazione della v.a. G . Si tenga presente che in questo caso la si può applicare la formula ridotta di Itô dell'Esercizio 10.3.5, data la struttura dei p.a. Y e Z . Dunque, posto 1Ð5> F> ß >Ñ œ G exp5> F> Ð.= 5=# Î#Ñ .= > ! e sostituendo opportunamente nella formula ridotta di Itô, si ottiene .1Ð5> F> ß >Ñ œ .> 1Ð5> F> ß >Ñ .> 5> 1Ð5> F> ß >Ñ .F> . 24 Calcolo stocastico Dunque, data l'equivalenza di questa espressione con l'equazione differenziale stocastica iniziale, la soluzione \ œ Ð\> Ñ>−Ò!ßX Ó è tale che \> œ 1Ð5> F> ß >Ñ œ G exp5> F> Ð.= 5=# Î#Ñ .= . > ! Questo p.a. è detto modello di Black e Scholes, dal momento che è stato introdotto dal matematico Fischer Sheffey Black (1938-1995) e dall'economista Myron Samuel Scholes (1941-). Il modello è in effetti una generalizzazione del moto Browniano geometrico introdotto nell'Esempio 10.3.4 che si ottiene per .> œ . e 5> œ 5 funzioni costanti. Il modello di Black and Scholes riveste un'importanza fondamentale nella matematica finanziaria. 10 8 6 4 2 0 0.0 0.5 1.0 1.5 2.0 Figura 10.4.1. Una traiettoria del modello di Black e Scholes con .> œ > e 5> œ ". Esempio 10.4.2. Si consideri l'equazione differenziale stocastica .\> œ .\> .> 5 .F> , con condizione iniziale \! œ G , dove .ß 5 − Ó!ß ∞Ò. Dunque, in questo caso si ha +ÐBß >Ñ œ .B e ,ÐBß >Ñ œ 5. La prima condizione del Teorema 10.4.2 risulta ovviamente soddisfatta, in quanto l+ÐBß >Ñ +ÐCß >Ñl l,ÐBß >Ñ ,ÐCß >Ñl œ l.llB Cl . Anche la seconda condizione del Teorema 10.4.2 risulta ovviamente soddisfatta, in quanto 25 Capitolo 10 l+ÐBß >Ñl l,ÐBß >Ñl œ l.llBl l5 l . Tenendo presente la formula di integrazione per parti dell'Esercizio 10.3.6, con il p.a. ] tale che ]> œ expÐ.>Ñ, si ha .Ð\> expÐ.>ÑÑ œ expÐ.>Ñ .\> .expÐ.>Ñ\> .> œ 5 expÐ.>Ñ .F> . Dalla precedente relazione risulta dunque expÐ.>Ñ\> œ G 5 expÐ.=Ñ .F= , > ! ovvero, la soluzione \ œ Ð\> Ñ>−Ò!ßX Ó dell'equazione differenziale stocastica è tale che \> œ expÐ .>ÑG 5 expÐ .>Ñ expÐ.=Ñ .F= . > ! Questo p.a. è detto processo di Ornstein e Uhlenbeck, dal momento che è stato introdotto dai fisici Leonard Salomon Ornstein (1880-1941) e George Eugene Uhlenbeck (1900-1988). Anche questo modello ha grande rilevanza nella matematica finanziaria. 1.5 1.0 0.5 0.0 0.5 0.0 0.5 1.0 1.5 2.0 Figura 10.4.2. Una traiettoria del processo di Ornstein e Uhlenbeck con . œ " e 5 œ ". 26 Calcolo stocastico 10.5. Riferimenti bibliografici I testi di Chung e Williams (1990), Karatzas e Shreve (1991), Klebaner (2005), Kuo (2006), Medvegyev (2007), Pascucci (2011), Protter (2003) e Shreve (2004) sono dedicati al calcolo stocastico. Testi avanzati su questo argomento sono Capasso e Bakstein (2015), Cohen e Elliott (2015), Da Prato (2014) e Revuz e Yor (2005). Per un approccio introduttivo al calcolo stocastico si possono ´ consultare i testi di Brzezniak e Zastawniak (2002), Calin (2015), Choe (2016) e Wiersema (2008). Appendice A Elementi di integrazione Sia ÐHß Y Ñ uno spazio misurabile. Un'applicazione 1 À H È ‘ è misurabile se 1" ÐFÑ œ Ö= − H À 1Ð=Ñ − F× − Y per ogni F − U БÑ. In questo caso, 1 è anche detta funzione Boreliana su ÐHß Y Ñ. Per le funzioni misurabili valgono i seguenti risultati. Teorema A.1. Se ÐHß Y Ñ è uno spazio misurabile, allora: i) 1 è una funzione misurabile se e solo se 1" ÐÓ ∞ß BÓÑ − Y per ogni B − ‘; ii) se 1 e 2 sono funzioni misurabili, la funzione prodotto 12 è misurabile (assumendo che sia ben definita in base alla convenzione ! † ∞ œ ! e ∞ † ! œ !); iii) se 1 e 2 sono funzioni misurabili e se +ß , − ‘, la combinazione lineare +1 ,2 è una funzione misurabile (assumendo che sia ben definita); iv) se Ð18 Ñ8 " è una successione di funzioni misurabili, allora sup8 18 , inf8 18 , lim sup8 18 e lim inf8 18 sono funzioni misurabili. Dimostrazione. Vedi Billingsley (1995). Risulta immediato dimostrare che la funzione indicatrice "E dell'insieme E è una funzione misurabile se E − Y . Una funzione semplice è una combinazione lineare di funzioni indicatrici, ovvero : œ +3 "E3 , 8 3œ" dove E" ß á ß E8 − Y , mentre +" ß á ß +8 − ‘. Dal Teorema A.1 si ha dunque che una funzione semplice è misurabile. Teorema A.2. Se ÐHß Y Ñ è uno spazio misurabile e 1 è una funzione misurabile, allora esiste una successione di funzioni semplici Ð:8 Ñ8 " tali che ! Ÿ :" Ÿ :# Ÿ á Ÿ 1 e lim8 :8 œ 1. 2 Elementi di integrazione Dimostrazione. Vedi Billingsley (1995). Una successione di funzioni semplici come quella considerata nel precedente Teorema può essere sempre costruita scegliendo :8 come segue :8 œ 8#8 3œ" 3" "ÒÐ3"Ñ#8 ß3#8 Ò Ð1Ñ 8"Ò8ß∞Ò Ð1Ñ . #8 La definizione di integrale di una funzione misurabile rispetto ad una misura procede per vari passi, partendo dalla definizione di integrale di una funzione semplice non negativa. Definizione A.3. Se ÐHß Y ß .Ñ è uno spazio misurato e : è una funzione semplice non negativa, ovvero +" ß á ß +8 !, l'integrale di : è dato da : . . œ +3 .ÐE3 Ñ , 8 3œ" con la convenzione che ! † ∞ œ !. Si noti che l'integrale è sempre ben definito, anche se può risultare :. . œ ∞. Inoltre, anche se : non ha una rappresentazione univoca, nel senso che differenti scelte di E" ß á ß E8 e +" ß á ß +8 possono dare luogo ad una stessa funzione semplice :, tuttavia è possibile dimostrare che tutte le differenti rappresentazioni producono lo stesso valore per :. . (si veda Billingsley, 1995). Tenendo presente il Teorema A.2, è quindi immediato dare la definizione di integrale per una funzione misurabile non negativa. Definizione A.4. Sia ÐHß Y ß .Ñ uno spazio misurato e 1 una funzione misurabile non negativa. Se Ð:8 Ñ8 " è una successione di funzioni semplici non negative tali che ! Ÿ :" Ÿ :# Ÿ á Ÿ 1, l'integrale di 1 è dato da 1 . . œ sup :8 .. . 8 Si noti che l'integrale non dipende dalla scelta di una particolare successione di funzioni elementari. Si definisca inoltre come parte positiva di 1 la funzione 1 œ maxÐ1ß !Ñ e come parte negativa di 1 la funzione 1 œ minÐ1ß !Ñ. Le funzioni 1 e 1 sono misurabili e non negative, mentre risulta 1 œ 1 1 e 3 Appendice A l1l œ 1 1 . In questo caso, si ha la seguente definizione generale di integrale per una funzione misurabile. Definizione A.5. Sia ÐHß Y ß .Ñ uno spazio misurato e 1 una funzione misurabile. L'integrale 1.. esiste se e solo se almeno uno degli integrali 1 . . o 1 .. è finito e in questo caso si pone 1 .. œ 1 .. 1 .. . Se entrambi gli integrali 1 . . e 1 .. sono finiti, la funzione 1 è detta integrabile. Se entrambi gli integrali non sono finiti (ovvero, si ha la forma del tipo ∞ ∞), allora l'integrale non è definito. L'insieme di tutte le funzioni integrabili rispetto a . viene indicato con P" Ð.Ñ. In generale, l'insieme delle funzioni per cui l1l: .. ∞, dove : !, viene indicato con P: Ð.Ñ. Inoltre, l'integrale m1m: œ l1l: .. è detta norma di ordine : di 1, mentre l'integrale Ø1ß 2Ù œ 12 .. è detto prodotto interno. Inoltre, se E − Y allora l'integrale di 1 − P" Ð.Ñ su E è definito come 1 . . œ "E 1 . . . E Per enfatizzare l'argomento di 1, per il precedente integrale si adotta talvolta anche la notazione 1 . . œ 1Ð=Ñ ..Ð=Ñ . E E Nel caso particolare in cui H œ ‘ e Y œ U БÑ, mentre . œ - è la misura di Lebesgue, allora l'integrale di 1 su E (detto integrale di Lebesgue su E) viene scritto semplicemente come 4 Elementi di integrazione 1 . . œ 1ÐBÑ .B . E E Qualora E œ Ò+ß ,Ó (dove gli estremi dell'intervallo sono eventualmente non finiti), allora l'integrale di Lebesgue si scrive 1 . . œ 1ÐBÑ .B . , E + La precedente scrittura può apparire ambigua, dal momento che non distingue l'intervallo Ò+ß ,Ó dall'intervallo Ó+ß ,Ò. Tuttavia, poichè -ÐÖ+×Ñ œ -ÐÖ,×Ñ œ !, allora gli integrali estesi ad uno qualsiasi degli intervalli Ó+ß ,Ò, Ó+ß ,Ó, Ò+ß ,Ò e Ò+ß ,Ó , coincidono. Infine, si può dimostrare che l'integrale + 1ÐBÑ.B coincide con quello Riemann, quando questo è definito (vedi Billingsley, 1995). Tuttavia, vi sono funzioni per cui l'integrale di Lebesgue è definito, mentre l'integrale di Riemann non è definito. In modo simile, quando H œ ‘5 e Y œ U Б5 Ñ, mentre . œ -5 è la misura di Lebesgue in ‘5 , allora l'integrale di Lebesgue di 1 su E (detto integrale di Lebesgue su E) viene scritto come 1 . . œ 1ÐB" ß á ß B5 Ñ .B" á .B5 . E E Qualora E œ Ò+" ß ," Ó ‚ â ‚ Ò+5 ß ,5 Ó, allora l'integrale di Lebesgue si scrive 1 .. œ E ," +" á ,5 1ÐB" ß á ß B5 Ñ .B" á .B5 . +5 Di nuovo, si può dimostrare che questo integrale coincide con quello Riemann, quando questo è definito. Di seguito vengono considerate alcune proprietà dell'integrale. Teorema A.6. Sia ÐHß Y ß .Ñ uno spazio misurato e 1ß 2 − P" Ð.Ñ: i) se +ß , − ‘, allora Ð+1 ,2Ñ . . œ + 1 . . , 2 . . ; ii) se 1 Ÿ 2 ;Þ9Þ, allora 5 Appendice A 1 .. Ÿ 2 .. ; iii) se 1 ! ;Þ9Þ e 1.. œ !, allora 1 œ ! ;Þ9Þ Dimostrazione. Vedi Billingsley (1995). Dal Teorema A.6 segue che due funzioni 1ß 2 − P" Ð.Ñ equivalenti ;Þ9Þ rispetto a ., ovvero 1 Á 2 solo per un insieme di misura nulla, hanno lo stesso integrale. Inoltre, dal Teorema A.6 è immediato ottenere la disuguaglianza 1. . Ÿ l1l .. , per cui si ha che una funzione misurabile 1 è integrabile se e solo se l1l è integrabile. Inoltre, una funzione 1 − P" Ð.Ñ è finita ;Þ9Þ Il prossimo Teorema fornisce le condizioni per cui le operazioni di limite e di integrazione possono essere scambiate. La prima parte del Teorema è legata al nome del matematico francese Pierre Joseph Louis Fatou (1878-1929), mentre la seconda parte del Teorema è legata al nome del matematico italiano Beppo Levi (1875-1961). Teorema A.7. Sia ÐHß Y ß .Ñ uno spazio misurato e Ð18 Ñ8 " una successione di funzioni di P" Ð.Ñ: i) (Lemma di Fatou) se 18 ! per ogni 8, allora lim8inf 18 . . œ lim8inf 18 . . ; ii) (Teorema della convergenza dominata di Beppo Levi) Se lim8 18 œ 1 ;Þ9Þ ed esiste una funzione 2 − P" Ð.Ñ tale che l18 l Ÿ 2 ;Þ9Þ, allora 1 − P" Ð.Ñ e 18 . . œ lim 18 . . ; 1 . . œ lim 8 8 Dimostrazione. Vedi Billingsley (1995). Sia ÐHß Y ß .Ñ uno spazio misurato e 1 una funzione misurabile da ÐHß Y Ñ allo spazio misurabile ÐAß Z Ñ. In questo caso, la misura immagine ( di . mediante 1 è definita come ( œ .Ð1" ÐEÑÑ 6 Elementi di integrazione per ogni E − Z . La misura immagine ( è anche detta misura indotta da 1. Il seguente Teorema fornisce un espressione per l'integrale rispetto alla misura immagine. Teorema A.8. Sia ÐHß Y ß .Ñ uno spazio misurato e sia ( la misura immagine di . mediante 1. Se 2 è una funzione Boreliana e la funzione 2 ‰ 1 œ 2Ð1Ñ è integrabile, allora 2 . ( œ Ð2 ‰ 1Ñ . . . Dimostrazione. Vedi Billingsley (1995). Se H œ ‘5 e . œ -5 è la misura di Lebesgue in ‘5 , si supponga che 1 À ‘5 È ‘5 . Sia inoltre 1 un diffeomorfismo, ovvero un'applicazione biunivoca di un insieme aperto ‘5 su un insieme aperto di ‘5 differenziabile con continuità e tale che la sua inversa sia differenziabile con continuità. In questo caso, il Teorema A.8 si riduce a 2ÐC" ß á ß C5 Ñ .C" á .C5 œ F œ 1" ÐFÑ 2Ð1ÐB" ß á ß B5 ÑÑlN Ð1ÐB" ß á ß B5 ÑÑl .B" á .B5 , dove N Ð1ÐB" ß á ß B5 ÑÑ è lo jacobiano relativo a 1. Sia ÐHß Y ß / Ñ uno spazio misurato e 0 una funzione Boreliana non negativa su ÐHß Y Ñ. In questo caso, l'applicazione ( À Y È ‘, data da (ÐEÑ œ 0 ./ E per ogni E − Y , è una misura. In questo contesto, la funzione Boreliana 0 viene detta densità, mentre ( è detta misura definita dalla densità 0 . Teorema A.9. (Teorema di Radon-Nikodym) Siano ( e / due misure definite sullo spazio misurabile ÐHß Y Ñ. Se ( è assolutamente continua rispetto a / , ovvero / ÐEÑ œ ! implica che (ÐEÑ œ !, allora esiste una funzione Boreliana non negativa 0 tale che ( è la misura definita dalla densità 0 . Inoltre, 0 è unica ;Þ9Þ rispetto a / , ovvero se 2 è una funzione Boreliana non negativa tale che (ÐEÑ œ E 2. / per ogni E − Y , allora 0 œ 2 ;Þ9Þ Dimostrazione. Vedi Billingsley (1995). 7 Appendice A In pratica, il Teorema A.9, che prende nome dal matematico austriaco Johann Karl August Radon (1887-1956) e dal matematico polacco Otto Marcin Nikodym (1887-1974), fornisce l'esistenza di una classe di funzioni non negative 0 che coincidono ;Þ9Þ rispetto a / e per questo motivo 0 viene definita come una versione della densità. Si noti che il Teorema di Radon-Nikodym fornisce sia un modo di costruire una misura, ma anche un metodo per calcolare la misura di ogni E − Y . In effetti, se / è una misura di cui sono ben note le proprietà (quale la misura di Lebesgue) allora, una volta determinata la densità 0 , il valore della misura può essere ottenuto per integrazione. In generale, ogni integrazione rispetto a ( può essere ricondotta ad un'integrazione rispetto a / , come si ottiene dal seguente Teorema. Teorema A.10. Sia ÐHß Y ß / Ñ uno spazio misurato e sia ( la misura definita dalla densità 0 . Se 2 è una funzione Boreliana e la funzione 20 è integrabile, allora 2 . ( œ 20 . / . Dimostrazione. Vedi Billingsley (1995). Il seguente Teorema evidenzia come un calcolare un integrale rispetto ad una misura prodotto per mezzo di una integrazione iterata. Teorema A.11. (Teorema di Fubini) Siano ÐH" ß Y" ß ." Ñ e ÐH# ß Y# ß .# Ñ due spazi misurati e sia 1 una funzione misurabile su ÐH" ‚ H5 ß Y" Œ Y# Ñ. Se 1 ! allora la funzione 2Ð=# Ñ œ 1Ð=" ß =# Ñ . ." Ð=" Ñ esiste ;Þ9Þ rispetto a .# ed è misurabile su H# , mentre 1 .Ð." Œ .# Ñ œ 1Ð=" ß =# Ñ .." Ð=" Ñ ..# Ð=# Ñ . Dimostrazione. Vedi Billingsley (1995). Il Teorema può essere esteso a 5 spazi misurati ed è legato al nome del matematico italiano Guido Fubini (1879-1943), anche se più correttamente 8 Elementi di integrazione dovrebbe essere denominato Teorema di Fubini-Tonelli, dal momento che è stato esteso e perfezionato dal matematico italiano Leonida Tonelli (1885-1946). Riferimenti bibliografici Il classico testo di riferimento per la Teoria della Misura è Halmos (1974). Ulteriori testi sulla Teoria della Misura e integrazione sono Ambrosio et al. (2011), Cohn (2013), Schilling (2005), Taylor (2006), Wheeden e Zygmund (2015). Un testo esaustivo sull'argomento è Bogachev (2007, volume I e II), ´ mentre testi introduttivi sono Capinski e Kopp (2007), Kubrusly (2015) e Ovchinnikov (2013). Appendice B Notazioni e abbreviazioni Capitolo 1 H g Ö=× I cardÐIÑ X c ÐH Ñ ÐI3 Ñ3−M ÐI3 Ñ83œ" ÐI8 Ñ8 " ÐI8 Ñ8 ! I3−M I3 I" ∪ I# 83œ" I3 ∞ 8œ" I8 ∞ 8œ! I8 3−M I3 I" ∩ I# 83œ" I3 ∞ 8œ" I8 ∞ 8œ! I8 I" Ï I# lim inf8 I8 lim sup8 I8 lim8 I8 ÐX3 Ñ3−M ÐX8 Ñ8 " spazio fondamentale evento impossibile evento elementare evento cardinalità di un evento classe di eventi insieme delle parti classe di eventi M insieme di indici classe di eventi M œ Ö"ß á ß 8× successione di eventi M œ Ö"ß #ß á × successione di eventi M œ Ö!ß "ß á × evento opposto evento unione evento unione M œ Ö"ß #× evento unione M œ Ö"ß á ß 8× evento unione M œ Ö"ß #ß á × evento unione M œ Ö!ß "ß á × evento intersezione evento intersezione M œ Ö"ß #× evento intersezione M œ Ö"ß á ß 8× evento intersezione M œ Ö"ß #ß á × evento intersezione M œ Ö!ß "ß á × evento differenza limite inferiore di successione di eventi limite superiore di successione di eventi limite di successione di eventi classe di classi di eventi successione di classi di eventi M œ Ö"ß #ß á × 2 ÐX8 Ñ8 ! 3−M X3 ∞ 8œ" X8 ∞ 8œ! X8 3−M X3 ∞ 8œ" X8 ∞ 8œ! X8 Y 5 ÐX Ñ ÐH ß Y Ñ œ Ö!ß "ß #ß á × ™ œ Ö!ß „ "ß „ #ß á × œ Ö7Î8 À 7ß 8 − ™ß 8 Á !× ‘ ‚ Ò+ß ,Ó œ ÖB − ‘ À + Ÿ B Ÿ ,× Ó+ß ,Ò œ ÖB − ‘ À + B ,× Ó+ß ,Ó œ ÖB − ‘ À + B Ÿ ,× Ò+ß ,Ò œ ÖB − ‘ À + Ÿ B ,× U Б Ñ Ð ‘ ß U Б Ñ Ñ H" ‚ â ‚ H5 I" ‚ â ‚ I5 Y" Œ â Œ Y 5 ‘5 U Б 5 Ñ 3−M H3 3−M I3 3−M Y3 Notazioni e abbreviazioni successione di classi di eventi M œ Ö!ß "ß á × unione di classi di eventi unione di classi di eventi M œ Ö"ß #ß á × unione di classi di eventi M œ Ö!ß "ß á × intersezione di classi di eventi intersezione di classi di eventi M œ Ö"ß #ß á × intersezione di classi di eventi M œ Ö!ß "ß á × 5 -algebra 5 -algebra generata dalla classe X spazio probabilizzabile insieme degli interi non negativi insieme dei numeri interi insieme dei numeri razionali insieme dei numeri reali insieme dei numeri complessi intervallo chiuso intervallo aperto intervallo aperto a sinistra e chiuso a destra intervallo chiuso a sinistra e aperto a destra 5 -algebra di Borel spazio misurabile spazio fondamentale prodotto di 5 spazi evento rettangolare di 5 eventi 5-algebra prodotto di 5 spazi spazio Euclideo 5 -algebra di Borel su ‘5 spazio fondamentale prodotto M insieme indici evento rettangolare 5-algebra prodotto Capitolo 2 .Ð † Ñ ÐH ß Y ß . Ñ TÐ † Ñ ÐH ß Y ß T Ñ "E Ð † Ñ misura spazio misurato misura di probabilità spazio probabilizzato funzione indicatrice dell'insieme E 3 Appendice B -Ð † Ñ Ð‘ß U БÑß -Ñ T Ð † ± I! Ñ T" Œ á Œ T5 -5 Ð † Ñ Ð ‘ 5 ß U Б 5 Ñ ß - 5 Ñ 3−M T3 misura di Lebesgue su ‘ spazio misurato probabilità condizionata probabilità prodotto misura di Lebesgue su ‘5 spazio misurato prodotto probabilità prodotto Capitolo 3 \ T\ Ð † Ñ Ð‘ß U БÑß T\ Ñ _ œ J\ Ð † Ñ :\ Ð † Ñ Ú†Û 0\ Ð † Ñ Ð\" ß á ß \5 ÑT \3 J\ Ð † Ñ J\3 Ð † Ñ :\ Ð † Ñ :\3 Ð † Ñ 0\ Ð † Ñ 0 \3 Ð † Ñ variabile aleatoria (v.a.) legge (o distribuzione) della v.a. \ spazio probabilizzato uguaglianza in legge funzione di ripartizione della v.a. \ (f.r.) funzione di probabilità della v.a. \ (f.p.) funzione parte intera densità di probabilità della v.a. \ (d.p.) vettore di variabili aleatorie (v.v.a.) 3-esima componente marginale del v.v.a. funzione di ripartizione del v.v.a. \ (f.r.c.) funzione di ripartizione della v.a. \3 (f.r.m.) funzione di probabilità del v.v.a. \ (f.p.c.) funzione di probabilità della v.a. \3 (f.p.m.) densità di probabilità del v.v.a. \ (d.p.c.) densità di probabilità della v.a. \3 (d.p.m.) Capitolo 4 EÒ\Ó .\ \ \ .\ß< VarÒ\Ó valore atteso della v.a. \ valore atteso della v.a. \ maxÐ\ß !Ñ parte positiva della v.a. \ minÐ\ß !Ñ parte negativa della v.a. \ momento di ordine < della v.a. \ varianza della v.a. \ 4 # 5\ CovÒ\" ß \# Ó 5\" ß\# 3\" ß\# sgnÐ † Ñ O\ detÐO\ Ñ Notazioni e abbreviazioni varianza della v.a. \ covarianza tra le v.a. \" e \# covarianza tra le v.a. \" e \# coefficiente di correlazione tra le v.a. \" e \# "Ó!ß∞Ò Ð † Ñ "Ó∞ß!Ò Ð † Ñ funzione segno matrice di varianza-covarianza varianza generalizzata Capitolo 5 EÒ\ ± I! Ó EÒ\ ± Y! Ó Y\ EÒ\# ± \" Ó T\# ±\" œB" Ð † Ñ :\# ±\" œB" 0\# ±\" œB" valore atteso condizionato all'evento I! valore atteso condizionato alla 5 -algebra Y! 5 -algebra indotta dalla v.a. \ valore atteso condizionato di \# a \" legge condizionata di \# all'evento Ö\" œ B" × f.p. condizionata di \# all'evento Ö\" œ B" × d.p. condizionata di \# all'evento Ö\" œ B" × Capitolo 6 UÐ8ß :Ñ c Ð- Ñ Ua Ð5ß :Ñ \ Ð8ß Hß R Ñ `Ð8ß :Ñ a Ð. ß 5 # Ñ 9Ð † Ñ FÐ † Ñ ZÐ+ß ,ß 5Ñ >Ð5Ñ #Ð5ß DÑ ;#8 UX Ð+ß ,ß αß " Ñ FÐαß " Ñ MD Ðαß " Ñ legge Binomiale di parametri 8 e : legge di Poisson di parametro legge Binomiale Negativa di parametri 5 e : legge Ipergeometrica di parametri 8, H e R legge Multinomiale di parametri 8 e : legge Normale di parametri . e 5 d.p. della v.a. ^ con legge Normale ridotta f.r. della v.a. ^ con legge Normale ridotta legge Gamma di parametri +, , e 5 funzione Gamma di Eulero funzione Gamma incompleta legge Chi-quadrato con 8 gradi di libertà legge Beta di parametri +, ,, α e " funzione Beta di Eulero funzione Beta incompleta regolarizzata 5 Appendice B J8" ß8# >8 a5 Ð.\ ß O\ Ñ WÐαÑ Capitolo 7 i dÐ † Ñ eÐ † Ñ l†l :\ Ð † Ñ K\ Ð † Ñ 'Ð=Ñ :\ Ð † Ñ K\ Ð † Ñ legge di Snedecor con 8" e 8# gradi di libertà legge > di Student con 8 gradi di libertà legge Normale Multivariata legge di Dirichlet di parametro α 1 unità immaginaria parte reale parte immaginaria modulo funzione caratterisitica della v.a. \ (f.c.) funzione generatrice della v.a. \ (f.g.) funzione zeta di Riemann funzione caratterisitica multivariata (f.c.m.) funzione generatrice multivariata (f.g.m.) Capitolo 8 Ð\8 Ñ8 " Ð\8 Ñ8 ! successione di v.a. successione di v.a. _ convergenza in legge T convergenza in probabilità convergenza quasi certa Ä Ä Ä ;Þ-Þ P: Ä convergenza in media di ordine : Capitolo 9 Ð\8 Ñ>−“ ÐY> Ñ>−“ ÐQ> Ñ>−“ 7 Y7 processo aleatorio (p.a.) filtrazione martingala tempo di arresto 5 -algebra associata al tempo di arresto 7 6 ÐQ7 •> Ñ>−“ +”, +•, ÐF> Ñ>−Ò!ß∞Ò 7+ Notazioni e abbreviazioni martingala arrestata al tempo di arresto 7 maxÐ+ß ,Ñ minÐ+ß ,Ñ moto Browniano tempo di primo passaggio per + Capitolo 10 MÐ\Ñ fX# `#X .\> integrale stocastico di Itô del p.a. \ classe dei p.a. semplici classe dei p.a. integrabili differenziale stocastico del p.a. \ Bibliografia Ambrosio, L., Da Prato, G. e Mennucci, A. (2011) Introduction to Measure Theory and Integration, Edizioni della Normale, Scuola Normale Superiore, Pisa. Ash, R.B. (2008) Basic Probability Theory, Dover, New York. Ash, R.B. e Doléans-Dade, C.A. (2000) Probability and Measure Theory, Academic Press, New York. Athreya, K.B. e Lahiri, S.N. (2006) Measure Theory and Probability Theory, Springer, New York. Bass, R.F. (2011) Stochastic Processes, Cambridge University Press, Cambridge. Bhattacharya, R.N. e Waymire, E.C. (2009) Stochastic Processes with Applications, Society for Industrial and Applied Mathematics, Philadelphia. Billingsley, P. (1995) Probability and Measure, terza edizione, Wiley, New York. Blom, G., Holst, L. e Sandell, D. (1994) Problems and Snapshots from the World of Probability, Springer, New York. Bogachev, V.I. (2007) Measure Theory, volume I, Springer, Berlin. Bogachev, V.I. (2007) Measure Theory, volume II, Springer, Berlin. Borovkov, A.A. (2013) Probability Theory, quinta edizione, Springer, London. Boucheron, S., Lugosi, G. e Massart, P. (2013) Concentration Inequalities, Oxford University Press, Oxford. ´ Brzezniak, Z. e Zastawniak, T. (2002) Basic Stochastic Processes, Springer, London. Calin, O. (2015) An Informal Introduction to Stochastic Calculus with Applications, World Scientific Publishing, Singapore. Capasso, V. e Bakstein, D. (2015) An Introduction to Continuous-Time Stochastic Processes, terza edizione, Birkhäuser, New York. ´ Capinski, M. e Kopp, P. (2007) Measure, Integral and Probability, seconda edizione, Springer, NewYork. Charalambides, C.A. (2005) Combinatorial Methods in Discrete Distribution, Wiley, New York. 2 Bibliografia Chaumont, L. e Yor, M. (2005) Exercises in Probability, Cambridge University Press, Cambridge. Choe, G.H. (2016) Stochastic Analysis for Finance with Simulations, Springer, New York. Chung, K.L. (2001) A Course in Probability Theory, terza edizione, Academic Press, San Diego. Chung, K. e Williams, R. (1990) Introduction to Stochastic Integration, seconda edizione, Birkhäuser, Boston. Çinlar, E. (2010) Probability and Stochastics, Springer, New York. Cohen, S.N. e Elliott, R.J. (2015) Stochastic Calculus and Applications, seconda edizione, Birkhäuser, New York. Cohn, D.L. (2013) Measure Theory, seconda edizione, Birkhäuser, New York. Da Prato, G. (2014) Introduction to Stochastic Analysis and Malliavin Calculus, terza edizione, Edizioni della Normale, Scuola Normale Superiore, Pisa. Devroye, L. (1986) Non-uniform Random Variate Generation, Springer, New York. Dubins, L.E. e Savage, L.J. (1965) How to Gamble If You Must, McGraw-Hill, New York. Dudley, R.M. (2004) Real Analysis and Probabiliy, Cambridge University Press, Cambridge. Durrett, R. (2012) Essentials of Stochastic Processes, seconda edizione, Springer, New York. Erickson, M. (2010) Pearls of Discrete Mathematics, CRC Press, Boca Raton. Ethier, S.N. (2010) The Doctrine of Chances, Springer, Berlin. Feller, W. (1968) An Introduction to Probability Theory and its Applications, volume I, terza edizione, Wiley, New York. Feller, W. (1971) An Introduction to Probability Theory and its Applications, volume II, seconda edizione, Wiley, New York. Ferguson, T.S. (1996) A Course in Large-sample Theory, Chapman & Hall, New York. de Finetti, B. (1990) Theory of Probability, volume 1, Wiley, New York. de Finetti, B. (1990) Theory of Probability, volume 2, Wiley, New York. Forbes, C., Evans, M., Hastings, N. e Peacock, B. (2011) Statistical Distributions, quarta edizione, Wiley, New York. Gordon, H. (1997) Discrete Probability, Springer, New York. Gorroochurn, P. (2012) Classic Problems of Probability,Wiley, New York. Graham, R.L., Knuth, D.E. e Patashnik, O. (1994) Concrete Mathematics, seconda edizione, Addison-Wesley, Reading. Bibliografia 3 Grimmett, G.R. e Stirzaker, D.R. (2001) One Thousand Exercises in Probability, Oxford University Press, Oxford. Gut, A. (2005) Probability: a Graduate Course, seconda edizione, Springer, New York. Hald, A. (1998) A History of Mathematical Statistics from 1750 to 1930, Wiley New York. Hald, A. (2003) History of Probability and Statistics and Their Applications before 1750, Wiley, New York. Halmos, P.R. (1974) Measure Theory, Springer, New York. Hamming, R.W. (1991) The Art of Probability, Addison-Wesley, Reading. Isaac, R. (1995) The Pleasures of Probability, Springer, New York. Jacod, J. e Protter, P. (2004) Probability Essentials, seconda edizione, Springer, New York. Johnson, N., Kemp, A. e Kotz, S. (2005) Univariate discrete distributions, terza edizione, New York, Wiley. Johnson, N. e Kotz, S. (1977) Urn Models and Their Applications, New York, Wiley. Johnson, N., Kotz, S. e Balakrishnan, N. (1994) Continuous univariate distributions, volume 1, seconda edizione, New York, Wiley. Johnson, N., Kotz, S. e Balakrishnan, N. (1995) Continuous univariate distributions, volume 2, seconda edizione, New York, Wiley. Johnson, N., Kotz, S. e Balakrishnan, N. (1997) Discrete Multivariate Distributions, New York, Wiley. Kallenberg, O. (2002) Foundations of Modern Probability, seconda edizione, Springer, New York. Karatzas, I. e Shreve, S.E. (1991) Brownian Motion and Stochastic Calculus, seconda edizione, Springer, New York. Khoshnevisan, D. (2007) Probability, American Mathematical Society, Providence. Klafter, J. e Sokolov, I.M. (2011) First Steps in Random Walks, Oxford University Press, Oxford. Klebaner, F. (2005) Introduction to Stochastic Calculus with Applications, seconda edizione, World Scientific Publishing, Singapore. Knill, O. (2009) Probability and Stochastic Processes with Applications, Overseas Press, New Dehli. Kolmogorov, A.N. (1933) Grundbegriffe der Wahrscheinlichkeitsrechnung, Springer, Berlin. Traduzione inglese: Kolmogorov, A.N. (1956) Foundations of the Theory of Probability, Chelsea, New York. 4 Bibliografia Koralov, L.B. e Sinai, Y.G. (2007) Theory of Probability and Random Processes, seconda edizione, Springer, New York. Kotz, S., Balakrishnan, N. e Johnson, N.L. (2000) Continuous Multivariate Distributions, volume 1, seconda edizione, New York, Wiley. Kubrusly, C.S. (2015) Essentials of Measure Theory, Springer, New York. Kuo, H. (2006) Introduction to Stochastic Integration, Springer, New York. Leadbetter, R., Cambanis, S. e Pipiras, V. (2014) A Basic Course in Measure and Probability Theory for Applications, Cambridge University Press, Cambridge. Lehmann, E.L. e Casella, G. (1998) The Theory of Point Estimation, seconda edizione, Springer, New York. Letta, G. (1993) Probabilità Elementare, Zanichelli, Bologna. Lin, Z. e Bai, Z. (2010) Probability Inequalities, Springer, New York. Lovász, L., Pelikán, J. e Vesztergombi, K. (2003) Discrete Mathematics: Elementary and Beyond, Springer, New York. Lukacs, E. (1970) Characteristic Functions, seconda edizione, Griffin, London. Medvegyev, P. (2007) Stochastic Integration Theory, Oxford University Press, Oxford. Mörters, P. e Peres, Y. (2010) Brownian Motion, Cambridge University Press, Cambridge. Mosteller, F. (1987) Fifty Challenging Problems in Probability with Solutions, seconda edizione, Dover Publications, New York. Olofsson, P. (2015) Probabilities - The Little Numbers that Rule Our Lives, seconda edizione, Wiley, New York. Ore, Ø. (1953) Cardano: The Gambling Scholar, Princeton University Press, Princeton. Ovchinnikov, S. (2013) Measure, Integral, Derivative, Springer, New York. Pascucci, A. (2011) PDE and Martingale Methods in Option Pricing, Bocconi & Springer Series, Springer Italia, Milan. Petkovic, M.S. (2009) Famous Puzzles of Great Mathematicians, American Mathematical Society, Providence. Petrov, V.V. (1995) Limit Theorems of Probability Theory, Clarendon Press, Oxford. von Plato, J. (1994) Creating Modern Probability, Cambridge University Press, Cambridge. Protter, P. (2003) Stochastic Integration and Differential Equations, seconda edizione, Springer, New York. Resnick, S.I. (2005) Adventures in Stochastic Processes, Birkhäuser, Boston. Resnick, S.I. (2014) A Probability Path, Birkhäuser, Boston. Bibliografia 5 Revuz, D. e Yor, M. (2005) Continuous Martingales and Brownian Motion, terza edizione, Springer, New York. Sasvári, Z. (2013) Multivariate Characteristic and Correlation Functions, De Gruyter, Berlin. Schilling, R. (2005) Measures, Integrals and Martingales, Cambridge University Press, Cambridge. Schilling, R.L. e Partzsch, L. (2012) Brownian Motion, De Gruyter, Berlin. Serfling R.J. (1980) Approximation Theorems of Statistics, Wiley, New York. Shreve, S. (2004) Stochastic Calculus for Finance II: Continuous-Time Models, Springer, New York. Steutel, F.W. e van Harn, K. (2004) Infinite Divisibility of Probability Distributions on the Real Line, Dekker, New York. Stroock, D.W. (2013) Mathematics of Probability, American Mathematical Society, Providence, Rhode Island. Székely, G.J. (1986) Paradoxes in Probability Theory and Mathematical Statistics, Kluwer, Dordrecht. Taylor, M.E. (2006) Measure Theory and Integration, American Mathematical Society, Providence. Tijms, H.C. (2003) A First Course in Stochastic Models, Wiley, Chichester. Tijms, H.C. (2012) Understanding Probability, terza edizione, Cambridge University Press, Cambridge. van der Vaart, A.W. (1998) Asymptotic Statistics, Cambridge University Press, Cambridge. Venkatesh, S.S. (2012) The Theory of Probability: Explorations and Applications, Cambridge University Press, Cambridge. Wheeden, R.L. e Zygmund, A. (2015) Measure and Integral, seconda edizione, CRC Press, Boca Raton. Whittle, P. (2000) Probability via Expectation, quarta edizione, Springer, New York. Wiersema, U. (2008) Brownian Motion Calculus, Wiley, Hoboken. Wilf, H.S. (2006) Generatingfunctionology, Peters, Wellesley. Williams, D. (1992) Probability with Martingales, Cambridge University Press, Cambridge. Wise, G.L. e Hall, E.B. (1993) Counterexamples in Probability and Real Analysis, Oxford University Press, Oxford.