Compendio di teoria della misura (con un occhio alla probabilità) D.Bertacchi, M.U.Dini 11 settembre 2006 2 Indice 0 Prefazione 0.1 Notazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 Spazi di misura 1.1 Algebre e σ–algebre . . . . . . . . . . . 1.2 Misure . . . . . . . . . . . . . . . . . . 1.3 Probabilità . . . . . . . . . . . . . . . 1.4 Approfondimenti . . . . . . . . . . . . 1.4.1 σ–algebre come “informazione” 1.4.2 Rappresentazione degli elementi 1.4.3 Cardinalità delle σ–algebre . . . 1.4.4 Misure reali e misure complesse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . delle σ–algebre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Estensione di misure 2.1 Costruzione dell’estensione . . . . . . . . . . . . . . . . . . 2.2 Unicità dell’estensione . . . . . . . . . . . . . . . . . . . . 2.3 Completezza . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4 Costruzione della misura di Lebesgue su Rn . . . . . . . . 2.4.1 Probabilità generali e probabilità uniforme su [0, 1] 2.5 Approfondimenti . . . . . . . . . . . . . . . . . . . . . . . 2.5.1 Il teorema della classe monotona . . . . . . . . . . 3 Integrale astratto di Lebesgue 3.1 Funzioni misurabili . . . . . . . . . . . . . . 3.2 Integrazione di funzioni semplici positive . . 3.3 Integrazione di funzioni positive . . . . . . . 3.4 Integrazione di funzioni integrabili . . . . . . 3.5 Teoremi di convergenza . . . . . . . . . . . . 3.6 Confronto Riemann-Lebesgue . . . . . . . . 3.7 Integrali rispetto ad altre misure, serie . . . 3.8 Approfondimenti . . . . . . . . . . . . . . . 3.8.1 Approssimazione di funzioni positive semplici . . . . . . . . . . . . . . . . 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . con successioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . monotone . . . . . . . . . . . . . . . . . . . . . 5 5 . . . . . . . . 7 7 11 14 15 15 16 17 17 . . . . . . . 19 19 24 27 27 30 31 31 . . . . . . . . . . . . . . . . di . . 33 34 35 37 38 39 40 41 43 43 4 INDICE 4 Probabilità su R 4.1 Probabilità discrete e assolutamente continue . . . . 4.2 Funzione di ripartizione di una probabilità su R . . 4.3 Probabilità singolari e teorema di rappresentazione 4.4 Integrale di Lebesgue-Stieltjes . . . . . . . . . . . . 4.5 Approfondimenti . . . . . . . . . . . . . . . . . . . 4.5.1 Teorema di rappresentazione di Riesz . . . . 4.5.2 Teorema di Radon-Nikodym . . . . . . . . . 4.5.3 Funzioni assolutamente continue . . . . . . . 4.5.4 Integrali di Stieltjes . . . . . . . . . . . . . . 5 Misura e integrazione in spazi prodotto 5.1 Prodotto cartesiano e rettangoli . . . . . 5.2 Sezioni . . . . . . . . . . . . . . . . . . . 5.3 Misura prodotto . . . . . . . . . . . . . . 5.4 Integrale prodotto e integrali iterati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 45 47 49 50 51 51 51 51 51 . . . . 53 53 54 56 56 Capitolo 0 Prefazione 0.1 Notazione Nel corso di queste dispense le stesse lettere verrano utilizzate per indicare oggetti diversi e lettere diverse verranno utilizzare per indicare stessi oggetti. Ad esempio L potrà, a seconda del contesto, essere una semplice famiglia di insiemi, una sigma-algebra, la sigma-algebra di Lebesgue su (0, 1] o sempre la sigma-algebra di Lebesgue ma sull’intera retta R. Il contesto NON sarà sufficiente a garantire chiarezza per raggingere la quale il lettore tenterà inutilmente di rivolgersi a testi più attendibili quali il Billingsley o l’Halmos. Infatti sfogliando i suddetti testi il gentil lettore avrà l’amarezza di scoprire che il primo le sigma-algebre di Lebesgue non le nomina nemmeno (ma chiama Ri le sigma-algebre di Borel) mentre l’altro le chiama S̄ in quanto completamento della sigma-algebra di Borel chiamata S. Lo stesso (Halmos) chiama la misura di Lebesgue µ̄ in quanto completamento della misura µ sulla sigma-algebra di Borel. Per far sparire ogni dubbio sulla possibilità di un testo chiaro, l’autore si affretta a specificare che per praticità al posto di µ̄ verrà usato il più semplice µ. È opportuno avvisare il lettore che sempre il medesimo autore usa in tutto il testo sempre e solo µ per indicare ogni sorta di misura che gli venga in mente di citare. Le cose non vanno meglio con Billingsley. Cito testualmente: Se Ω0 ∈ F , allora F ∩ Ω0 = [A : A ⊂ Ω0 , A ∈ F ]. Se Ω = R1 , Ω0 = (0, 1], e F = R1 , e se A è la classe degli intervalli finiti sulla retta, allora A ∩ Ω0 è la classe dei subintervalli di (0, 1], e B = σ(A ∩ Ω0 ) è dato da: B = [A : A ⊂ (0, 1], A ∈ R1 5 6 CAPITOLO 0. PREFAZIONE Un sottoinsieme di (0, 1] è quindi un insieme di Borel (giace in B) se e solo se è un insieme di Borel sulla retta (giace in R1 ) e pertanto la distinzione nella notazione può essere omessa. A parte che nelle prime due righe compaiono 8 (otto) simboli diversi definiti in altrettante diverse pagine del testo, anche in questo caso stessa notazione per oggetti diversi. Resta un dubbio: quale tra gli otto simboli esposti nelle righe precedenti non verrà più utilizzato nel seguito? Billingsley non lo dice... Capitolo 1 Spazi di misura In questo capitolo definiremo gli spazi di misura, cioè le terne (Ω, F , µ) dove Ω è un insieme, F è una σ–algebra su Ω e µ è una misura su F . Gli spazi di probabilità sono un caso particolare e lo metteremo in luce scrivendo P al posto di µ. 1.1 Algebre e σ–algebre Definizione 1. Una classe F di sottoinsiemi di Ω è un’algebra se soddisfa le tre condizioni: (i) Ω ∈ F ; (ii) A ∈ F implica Ac ∈ F (cioè F è chiusa rispetto alla formazione di complementari); S (iii) A1 , . . . , An ∈ F implica ni=1 Ai ∈ F (cioè F è chiusa rispetto alla formazione di unioni finite). Nella definizione di algebra compaiono solo due operazioni insiemistiche: il complementare e l’unione. In realtà le altre operazioni (intersezione, differenza, differenza simmetrica) possono essere scritte usando solo le due operazioni di cui sopra, perciò se una famiglia di sottoinsiemi F è un’algebra, essa risulta chiusa anche rispetto alla formazione di intersezioni finite, differenze e differenze simmetriche. Esercizio 1. Dati A, B, A1 , . . . , An insiemi, scrivere gli insiemi differenza A \ B, differenza simmetrica A∆B e intersezione A1 ∩ · · · ∩ An , utilizzando solo il simbolo di unione e di complementare (ricordiamo che A∆B = (A \ B) ∪ (B \ A)). Definizione 2. Una classe F di sottoinsiemi di Ω è una σ–algebra se soddisfa le tre condizioni: (i) Ω ∈ F ; (ii) A ∈ F implica Ac ∈ F (cioè F è chiusa rispetto alla formazione di complementari); 7 8 (iii) {An }n≥1 ⊂ F implica unioni numerabili). CAPITOLO 1. SPAZI DI MISURA S∞ n=1 An ∈ F (cioè F è chiusa rispetto alla formazione di La differenza fra la definizione di algebra e quella di σ–algebra sta nella terza richiesta, dove appare chiaro che la numerabile additività è una richiesta più forte della finita additività. Come le algebre, anche le σ–algebre risultano chiuse rispetto alla formazione di differenze, differenze simmetriche e intersezioni finite, nonché, in virtù della richiesta (iii), anche rispetto alla formazione di intersezioni numerabili. Esercizio 2. Una σ–algebra è anche un’algebra. Esempio 1. La più piccola σ–algebra in Ω è {∅, Ω}. La più grande è l’insieme delle parti P(Ω). Osserviamo che in generale un’algebra non è detto sia una σ–algebra, come mostra il seguente esercizio. Esercizio 3. Sia Ω un insieme infinito, sia F la famiglia di sottoinsiemi di Ω che o sono finiti o cofiniti (il loro complementare è finito) e sia G la famiglia di sottoinsiemi di Ω che o sono numerabili o conumerabili (il loro complementare è numerabile). a. Dimostrare che F è un’algebra ma non è una σ–algebra. b. Dimostrare che G è una σ–algebra. c. G è chiusa rispetto alle unioni arbitrarie? Quando G = P(Ω)? Definizione 3. Dato un insieme Ω e una σ–algebra F su di esso, la coppia (Ω, F ) è detta spazio misurabile, e gli elementi di F sono anche detti F –misurabili o semplicemente misurabili. Gli elementi F –misurabili sono gli insiemi su cui poi andremo a definire la misura (o, nel caso della teoria delle probabilità, ne definiremo la probabilità). Nella teoria delle probabilità inoltre gli insiemi misurabili sono anche detti eventi. Un paio di esempi ci chiariranno perché è naturale chiedere che la classe degli insiemi misurabili sia una σ–algebra piuttosto che un’algebra. Esempio 2. Si lanci una moneta infinite volte: sappiamo che la probabilità dell’insieme Ai = “esce testa all’i-esimo lancio” è 1/2, e in particolare tale insieme è un evento. (a) Sarebbe interessante determinare la probabilità dell’insieme A = “esce testa prima o poi”, S dunque come minimo questo insieme deve essere un evento. È facile vedere che A = ∞ i=1 Ai , e se la classe degli eventi è una σ–algebra il fatto che A sia un evento è conseguenza del fatto che gli Ai sono eventi. (b) Marco e Paolo giocano a testa e croce, Marco vince 1 euro ogni volta che esce testa (e Paolo lo perde), e viceversa se esce croce. Marco ha inizialmente a euro e Paolo b euro, e giocano finché uno dei due non può proseguire perché non ha più denaro. Ci si può chiedere qual è la probabilità che a perdere tutto sia Marco. Vedremo che l’insieme “Marco perde tutto” è un’unione numerabile di intersezioni finite di eventi Ai , dunque è sicuramente evento se la classe degli eventi è una σ–algebra (mentre non lo sarebbe necessariamente se tale classe fosse solo un’algebra). 1.1. ALGEBRE E σ–ALGEBRE 9 Spesso ci si focalizza su una famiglia ristretta di insiemi “semplici” (chiamiamola A), che si vuole siano misurabili, dopo di che si cerca una σ–algebra che contenga questi insiemi semplici. Ovviamente P(Ω) è fra le σ–algebre candidate, ma noi siamo interessati a quella minimale, cioè alla più piccola σ–algebra che contiene A. Definizione 4. Data una famiglia A di sottoinsiemi di Ω, \ Fα σ(A) := Fα ⊇A Fα σ−algebra è la σ–algebra generata da A. Proposizione 1. Sia A una collezione di sottoinsiemi di Ω. Allora σ(A) è una σ–algebra ed è la più piccola che contenga A. Dim. Cominciamo con l’osservare che gli elementi di σ(A) sono quei sottoinsiemi di Ω che sono elementi di ognuna delle σ–algebre Fα che contengono la famiglia A. La tesi è conseguenza dei tre punti seguenti: 1. L’intersezione di σ–algebre è una σ–algebra: infatti poiché Ω ∈ Fα per ogni α (le Fα sono σ–algebre) allora Ω ∈ σ(A). Se A ∈ σ(A) significa che A ∈ Fα per ogni α, ma allora vale anche Ac ∈ Fα per ogni α e dunque Ac ∈ σ(A) (e dunque σ(A) è chiusa rispetto alla formazione di complementari). Infine se {An }n≥1 ⊂ S σ(A) significa che S∞ {An }n≥1 ⊂ Fα per ogni α e allora n=1 An ∈ Fα per ogni α, da cui ∞ n=1 An ∈ σ(A). 2. L’intersezione che definisce σ(A) è non vuota, cioè esiste almeno una Fα , infatti P(Ω) è una σ–algebra che contiene A (qualunque sia A). 3. Se G è σ–algebra che contiene A, allora σ(A) ⊆ G. Infatti G è una delle σ–algebre la cui intersezione definisce σ(A). Esercizio 4. (1) Sia F una σ–algebra. Dimostrare che σ(F ) = F . (2) Sia A la famiglia dei singoletti. Determinare σ(A). (3) Sia A = {∅}. Determinare σ(A). (4) Sia A = {Ω}. Determinare σ(A). (5) Sia A la classe vuota. Determinare σ(A). (6) Dimostrare che se A ⊆ A′ allora σ(A) ⊆ σ(A′ ). (7) Dimostrare che se A ⊆ A′ ⊆ σ(A) allora σ(A) = σ(A′ ). 10 CAPITOLO 1. SPAZI DI MISURA (8) Determinare σ(A) nei seguenti tre casi: A = {A}, A = {A, B}, A = {A1 , . . . , An } con Ai partizione disgiunta di Ω. Concludiamo con la definizione di una σ–algebra molto importante: quella dei boreliani. La definizione è ambientata in un qualsiasi spazio topologico a partire dagli aperti, noi naturalmente la useremo per lo più in Rn . Definizione 5. Sia τ la classe degli insiemi aperti di Rn . Denotiamo con B(Rn ) ≡ Bn := σ(τ ) la σ–algebra di Borel di Rn , e chiamiamo boreliani i suoi elementi. Analogamente in un qualsiasi spazio topologico (Ω, τ ) la σ–algebra di Borel è quella generata da τ . Su R (e analogamente su Rn ) per ottenere B1 non è necessario “utilizzare” tutti gli aperti, infatti vale la seguente proposizione. Proposizione 2. La σ–algebra B1 è generata da una qualsiasi delle seguenti classi di sottoinsiemi di R: 1. da I1 , classe degli intervalli (a, b] (oppure [a, b), o (a, b), o [a, b]); 2. da I2 , classe degli intervalli (−∞, b] (oppure (−∞, b)); 3. da I3 , classe degli intervalli [a, +∞) (oppure (a, +∞)). Dim. Basta mostrare che ogni elemento di τ può essere scritto tramite operazioni insiemistiche a partire dagli elementi di Ij , j = 1, 2, 3, e viceversa. In particolare accenniamo alla dimostrazione nel caso j = 1: (a, b] = (a, +∞) \ (b, +∞) (differenza di due aperti) dunque I1 ⊂ B1 e dunque σ(I1 ) ⊂ B1 . Viceversa dalle nozioni di topologia su R è noto che gli aperti di R sono unione al più S (x, y− numerabile di intervalli aperti (x, y) e ognuno di essi può essere scritto come ∞ n=1 1/n]. Analogamente si procede per [a, b) e [a, b] ((a, b) è un aperto perciò non c’è nulla da dimostrare). Si potrebbe pensare che data una classe di insiemi M, si riesca a dare una “rappresentazione” degli elementi di σ(M) in funzione degli elementi di M (in effetti una cosa del genere si riesce a fare con le topologie, si vedano gli approfondimenti). In realtà questo, non appena |M| = +∞, diviene in generale impossibile e, scelto A ⊂ Ω, non neppure semplice decidere se A ∈ σ(M) oppure no. Tuttavia fortunatamente spesso non occorre “conoscere” tutti gli insiemi di una certa σ– algebra F , ma solo sapere che a F appartengono determinati insiemi (come gli intervalli o gli aperti nel caso dei boreliani), oppure che certe proprietà valgono per tutti gli elementi di F . Esercizio 5. Sia Ω un insieme e siano x e y due suoi elementi. Sia A la famiglia di sottoinsiemi di Ω tali che se A ∈ A e x ∈ A allora è anche y ∈ A (ovvero tutti gli elementi di A che contengono x contengono anche y). Allora questa proprietà rimane vera per tutti gli elementi di σ(A). 11 1.2. MISURE 1.2 Misure Definizione 6. Data un’algebra F una funzione µ : F −→ [0, +∞] si dice finitamente additiva se si ha che per ogni A1 , . . . , An di elementi di F e a due a due disgiunti vale ! n n [ X µ Ai = µ(Ai ), i=1 i=1 Ha senso chiedere che la misura soddisfi la proprietà di finita additività perché è il modo più naturale e ovvio per definire la misura sull’unione finita di insiemi disgiunti dell’algebra. Ciò, però, non sarà sufficiente in quanto, abbiamo visto, risulta necessario lavorare con una σ-algebra e non solo con un’algebra. Pertanto dovremo introdurre una condizione più restrittiva che fornisca le medesime garanzie ma su una famiglia per la quale vale l’unione numerabile. Definizione 7. Data una σ–algebra F una funzione µ : F −→ [0, +∞] è una misura se è numerabilmente additiva ovvero se soddisfa la seguente richiesta (detta di numerabile additività o σ-additività): per ogni successione {An }n≥1 di insiemi F –misurabili e a due a due disgiunti vale ! ∞ ∞ X [ µ(An ). µ An = n=1 n=1 Si dice che µ è una misura finita se µ(Ω) < +∞ (si dice anche che µ ha massa totale finita). Un caso particolare è quello in cui µ(Ω) = 1: in quel caso µ è per definizione una misura di probabilità. La misura è invece σ–finita se Ω è unione numerabile (non necessariamente disgiunta) di insiemi misurabili di misura finita. Definizione 8. Dato uno spazio misurabile (Ω, F ) e una misura µ su F , la terna (Ω, F , µ) è detta spazio di misura (e se µ è una probabilità è detta spazio di probabilità). Alcune correnti di pensiero, in particolare per studiare le probabilità (si veda De Finetti [3]) preferiscono utilizzare una definizione di misura che richieda solo la finita additività, ritenendo che la numerabile additività non sia un assioma giustificato. Tuttavia la numerabile additività permette di ottenere molti risultati con relativa facilità: perciò seguiremo la linea di quella che ormai è la teoria della misura e della probabilità largamente utilizzata in tutto il mondo. 12 CAPITOLO 1. SPAZI DI MISURA S Osservazione 1. Riguardo alla numerabile additività, notiamo che l’unione ∞ n=1 An è invariante rispetto a riordinamenti successione An , dunque potrebbe sorgere il dubbio Pdella ∞ che vada richiesto che la serie n=1 µ(An ) converga (e allo stesso numero) qualsiasi sia l’ordine dei suoi termini. Ma è noto che una serie a termini positivi se converge, converge assolutamente, dunque incondizionatamente (e se non converge diverge a +∞ qualunque sia l’ordine dei termini). Nel prossimo capitolo vedremo come costruire misure “interessanti”, nel frattempo vediamo due facili esempi di misure. Esempio 3. (a) La misura del conteggio νc è definita su P(Ω): ( |A| se A è finito νc (A) = +∞ se A è infinito dove |A| indica il numero di elementi di A. νc è finita se Ω è finito, mentre è σ–finita (ma non finita) se Ω è numerabile. (b) Fissato ω0 ∈ Ω, la massa concentrata in ω0 , o delta di Dirac in ω0 , è la misura di probabilità δω0 definita su P(Ω): ( 1 se A ∋ ω0 δω0 (A) = 0 se A 6∋ ω0 Passiamo ora alle proprietà delle misure che discendono dalla definizione. Proposizione 3. Sia µ una misura su una σ–algebra F . Allora 1. µ(∅) = 0. 2. µ è finitamente additiva. 3. µ è monotona, cioè A ⊂ B implica µ(A) ≤ µ(B). 4. µ è numerabilmente subadditiva, cioè ! ∞ ∞ [ X µ An ≤ µ(An ), n=1 n=1 ∀{An }n≥1 ⊂ F . 5. µ è continua dal basso, cioè µ(An ) → µ(A) se An ↑ A, ovvero A = A1 ⊂ A2 ⊂ A3 ⊂ · · · S∞ n=1 An e 6. µ è condizionatamente T continua dall’alto, cioè µ(An ) → µ(A) se µ(A1 ) < +∞ e An ↓ A, ovvero A = ∞ n=1 An e A1 ⊃ A2 ⊃ A3 ⊃ · · · 13 1.2. MISURE Dim. 1. Dalla numerabile additività: µ(∅) = µ ∞ [ n=1 ∅ ! = ∞ X µ(∅), n=1 da cui segue che non può essere µ(∅) > 0 e dunque µ(∅) = 0. S 2. Data un’unione finita ni=1 Ai , basta scriverla come unione numerabile aggiungendo infinite volte il vuoto: A1 ∪ A2 ∪ · · · ∪ An = A1 ∪ A2 ∪ · · · ∪ An ∪ ∅ ∪ ∅ ∪ . . . e per la numerabile additività di µ si ha che ! n n X [ µ Ai = µ (A1 ∪ · · · ∪ An ∪ ∅ ∪ ∅ ∪ . . .) = µ(Ai) + µ(∅) + µ(∅) + · · · , i=1 i=1 che grazie a 1. porta alla tesi. 3. Se A ⊂ B allora B = A ∪ (B \ A) e questa unione è disgiunta, perciò per la finita additività µ(B) = µ(A) + µ(B \ A) ≥ µ(A). 4. Definiamo S∞ di eventi disgiunti B1 = A1 e Bn := An \ An−1 per n ≥ 2. S∞ la sequenza Allora n=1 An = n=1 Bn e allora dalla numerabile additività ricaviamo µ ∞ [ An n=1 ! = ∞ X µ(Bn ) n=1 e per la monotonia µ(Bn ) ≤ µ(An ) (infatti Bn ⊂ An ) e quindi la tesi segue da ∞ X n=1 µ(Bn ) ≤ ∞ X µ(An ). n=1 5. Utilizziamo ancora la sequenza disgiunta {Bn }n definita al punto precedente, e osPn µ(B serviamo che µ(A ) = i ). Inoltre per la numerabile additività è µ(A) = n i=1 P∞ i=1 µ(Bi ). Ma allora (dalla definizione di serie) µ(A) = lim n→∞ n X i=1 µ(Bi ) = lim µ(An ). n→∞ 14 CAPITOLO 1. SPAZI DI MISURA 6. Definiamo A′n := A1 \ An (A′n è ilS“complementare T∞dentro A1 ” di An ). Allora la ∞ ′ ′ ′ sequenza {An }n è crescente e A := n=1 An = A1 \ n=1 An . Per il punto precedente µ(A′ ) = lim µ(A′n ). n→∞ D’altra parte µ(A′ ) = µ(A1 ) − µ e ∞ \ An n=1 ! (1.1) = µ(A1 ) − µ(A). µ(A′n ) = µ(A1 ) − µ(An ). Da queste due equazioni e da 1.1 segue la tesi. Ovviamente una misura finita (ad esempio una probabilità) è sempre continua anche dall’alto. Vediamo un esempio in cui la continuità dall’alto non vale. Esempio 4. Sia νc la misura del conteggio su N e sia An = {n, n + 1, n + 2, . . .}. Allora An ↓ ∅ ma νc (An ) = +∞ per ogni n. 1.3 Probabilità Come abbiamo già detto nel paragrafo precedente, una probabilità P è una misura per cui P(Ω) = 1. Questa caratteristica consente di ottenere ulteriori proprietà per le probabilità (che si possono generalizzare per le misure finite). Proposizione 4. Sia (Ω, F , P) uno spazio di probabilità. Valgono le seguenti proprietà. (a) Se A ∈ F allora P(Ac ) = 1 − P(A). (b) Se A, B ∈ F allora P(A ∪ B) = P(A) + P(B) − P(A ∩ B). (c) Principio di inclusione-esclusione: dati A1 , . . . , An ∈ F si ha ! n [ X X P Ai = P(Ai ) − P(Ai ∩ Aj ) + · · · (−1)n−1 P(A1 ∩ · · · ∩ An ). i=1 i i<j La dimostrazione è lasciata al lettore per esercizio. Nel prossimo capitolo vedremo che sarà utile poter dimostrare che una funzione definita su un’algebra a valori in [0, +∞] è σ–additiva. Per questo sono utili i criteri forniti dal seguente teorema. Teorema 1. Sia F una σ–algebra in Ω e P : F → [0, 1] sia finitamente additiva. Allora i seguenti fatti sono equivalenti. 15 1.4. APPROFONDIMENTI (a) P è numerabilmente additiva; (b) P è numerabilmente subadditiva; (c) P è continua dal basso: se An ∈ F , An ↑ A e A ∈ F , allora P(An ) ↑ P(A); (d) P è continua dall’alto: se An ∈ F , An ↓ A e A ∈ F , allora P(An ) ↓ P(A); (e) P è continua al vuoto: se An ∈ F , An ↓ ∅, allora P(An ) ↓ 0; Dim. (a) ⇒ (b) ⇒ (c) ⇒ (d) si dimostra come nella Proposizione 3, mentre è ovvio (d) ⇒ (e). Occorre mostrare che, in presenza della finita additività, (e) ⇒ (a). Infatti se {An }n≥1 è una successione di eventi disgiunti, per la finita additività vale ! ! ! ∞ k ∞ [ [ [ An P An = P An + P n=1 n=1 = k X P(An ) + P n=1 n=k+1 ∞ [ n=k+1 ! An . Il secondo termine va a zero per l’ipotesi di continuità al vuoto, dato che per k che tende a infinito. Come commento notiamo che l’enunciato resta valido nei seguenti casi: S∞ n=k+1 An ↓ ∅, 1. per misure finite (non necessariamente limitate da 1); 2. per P definita su un’algebra F anziché una σ–algebra. In tal caso per enunciare correttamente le proprietà bisogna chiedere che esse valgano ogni qual volta An ∈ F e S∞ T∞ A ∈ F (o A i=n n i=n n ∈ F se si parla del limite da sopra). Infatti il fatto che l’unione e l’intersezione numerabile stiano in F non è garantito a priori se F è un’algebra; 3. per misure non finite resta vera l’equivalenza di (a), (b) e (c). 1.4 1.4.1 Approfondimenti σ–algebre come “informazione” Una domanda potrebbe apparire a questo punto naturale. Qual è l’importanza della σ– algebra quando poi degli insiemi misurabili si valuta la misura? Equivalentemente, nell’ambito della teoria delle probabilità, qual è il ruolo della σ–algebra degli eventi, dato che poi quello che interessa è la probabilità degli eventi stessi? Il ruolo risulta più chiaro (e diventa cruciale nell’ambito dello studio dei processi stocastici) se si interpreta la σ–algebra F degli insiemi misurabili come informazione da noi posseduta riguardo allo spazio Ω. Gli elementi di F sono quelli che conosciamo, cioè quelli di cui possiamo valutare la misura. È chiaro che l’optimum si ha con F = P(Ω) (informazione 16 CAPITOLO 1. SPAZI DI MISURA = tutti i sottoinsiemi di Ω), ma ad esempio se F = σ(A1 , A2 , A3 , A4 ) con gli Ai come in figura, allora l’informazione è limitata ai quattro insiemi A1 e alle loro unioni (si veda l’esercizio 4). Ω Α2 Α1 Α4 Α3 In particolare, se (Ω, F , P) è uno spazio di probabilità, sappiamo che Ω è l’insieme dei possibili esiti ω di un esperimento aleatorio e la “scelta” di ω ∈ Ω (cioè di quale esito particolare si realizza) è fatta dal “caso” secondo la probabilità P. Nella figura qui sotto se il “caso” sceglie ω noi, tramite l’informazione della famiglia F non sappiamo quale elemento preciso sia ω, ma sappiamo che ω ∈ A2 . Ω Α2 Α1 ω Α4 Α3 In generale la σ–algebra F rappresenta l’“informazione” nel senso che quando il “caso” sceglie l’esito particolare ω, noi sappiamo dire, per ogni A ∈ F , se ω ∈ A oppure no. Per approfondire questo concetto, si veda [1] a pagina 57. 1.4.2 Rappresentazione degli elementi delle σ–algebre Abbiamo già accennato al problema della “non rappresentabilità” degli elementi di una σ–algebra. Infatti confrontandoci con quanto avviene per le topologie potremmo essere indotti a credere che sia facile, data una famiglia di insiemi A, capire come sono fatti gli elementi di σ(A). Nel caso della topologia, per costruire a partire da A la più piccola famiglia di insiemi τ che contenga A e sia stabile rispetto ad intersezioni finite e unioni qualunque (definizione 17 1.4. APPROFONDIMENTI di topologia generata da A), basta considerare tutte le intersezioni finite di elementi di A, ottenendo cosı̀ la famiglia C, e poi le unioni qualunque degli elementi di C (si veda ad esempio il Capitolo 3 di [2]). Dunque con due passaggi “leciti” si hanno tutti gli elementi della topologia. Per le σ–algebre sono leciti i complementari e le unioni finite o numerabili. Tuttavia si può dimostrare (si veda [1] pagina 30) che ripetendo un numero finito di volte queste operazioni sugli elementi di A = “intervalli di (0, 1]”, non si ottengono tutti i boreliani. Non solo, neppure ripetendole un insieme numerabile di volte (già definire cosa questo significhi genera problemi!), a meno di farlo in maniera ordinata. Siamo qui volutamente vaghi: per essere più precisi occorrerebbe la teoria dei numeri ordinali infiniti. 1.4.3 Cardinalità delle σ–algebre È piuttosto semplice vedere che una σ–algebra generata da una partizione finita di Ω (cioè F = σ(A) dove A = {A1 , . . . , An } con Ai ∩ Aj = ∅ per i 6= j e Ω = ∪ni=1 Ai ) ha cardinalità 2n . Inoltre conosciamo σ–algebre aventi la cardinalità del continuo: ad esempio P(N) ha cardinalità c = 2ℵ0 (c è il simbolo con cui si indica la cardinalità del continuo, mentre ℵ0 – che si legge “aleph zero” – indica la cardinalità del numerabile). Inoltre si potrebbe dimostrare che i B((0, 1]), B1 e B(Rn ) hanno la cardinalità del continuo. È naturale chiedersi se esistono σ–algebre infinite con cardinalità inferiore al continuo, ovvero, assumendo valida l’ipotesi del continuo (che dice che non esistono cardinalità intermedie fra ℵ0 e c), se esistono σ–algebre numerabili (attenzione: stiamo contando gli elementi della σ–algebra, non di Ω!). La risposta è negativa, come mostra il seguente esercizio. Esercizio 6. Mostrare che non esiste una σ–algebra F tale che |F | = ℵ0 . 1.4.4 Misure reali e misure complesse Le misure definite in questo capitolo sono a valori in [0, +∞], ma si possono anche definire misure a valori in R (misure reali o con segno) o C (misure complesse). In tal caso l’unica richiesta diviene la numerabile additività, ovvero che, se {An }∞ n=1 è una successione disgiunta, ! ∞ ∞ X [ µ(An ) µ An = n=1 n=1 (e la convergenza assoluta della serie è parte della richiesta). Tali misure compaiono quando si voglia definire una misura ν a partire da un’altra misura µ e da una funzione f (reale o complessa): Z ν(A) = f dµ. A 18 CAPITOLO 1. SPAZI DI MISURA Capitolo 2 Estensione di misure Supponiamo di aver costruito un’algebra A di sottoinsiemi di Ω e di aver definito una misura su tale algebra. Nel capitolo precedente abbiamo appurato che, data una famiglia di sottoinsiemi di Ω, esiste sempre ed è unica la σ-algebra generata da tale famiglia: dunque sappiamo “estendere” la famiglia a una σ-algebra che la contenga. In questo capitolo vedremo che, sotto certe condizioni, esiste ed è unica anche l’estensione a σ(A) della misura definita su A. Come caso particolare vedremo la costruzione della misura di Lebesgue. 2.1 Costruzione dell’estensione Sia µ una misura definita su un’algebra F0 di sottoinsiemi di Ω (ovvero che soddisfi i requisiti della Definizione 6 del Capitolo 1). Ci proponiamo di estendere µ a σ(F0 ). Definizione 9. Dato un evento A ⊆ Ω chiamiamo misura esterna la quantità: X µ∗ (A) = inf µ(An ) A n dove l’operazione inf è estesa a tutte i ricoprimenti A ≡ {A1 , A2 , . . .} finite o numerabili +∞ S di A ovvero a tutte le famiglie A di insiemi di F0 tali che A ⊆ An . n=1 Osservazione 2. Rammentiamo che un ricoprimento non è necessariamente una partizione dunque gli elementi An del ricoprimento non sono per forza disgiunti ma è chiaro che meno essi si sovrappongono e più la somma delle misure si avvicina a µ∗ (A). Osservazione 3. Se A ∈ F0 allora µ∗ (A) = µ(A) (il ricoprimento minimale è quello costituito dal solo A). Affinché la misura esterna sia una misura occorre che sia per lo meno finitamente additiva. Questo non è in generale vero se la consideriamo definita su P(Ω), ma mostreremo invece che vale se la consideriamo ristretta agli insiemi misurabili secondo la seguente definizione. 19 20 CAPITOLO 2. ESTENSIONE DI MISURE Definizione 10. Un sottoinsieme A di Ω si dice µ∗ -misurabile se soddisfa il seguente criterio (di Carathéodory): µ∗ (A ∩ E) + µ∗ (Ac ∩ E) = µ∗ (E) ∀E ⊆ Ω, e la classe degli insiemi µ∗ -misurabili è indicata con M. In altre parole un insieme A è µ∗ -misurabile se “taglia bene in due” ogni insieme E ⊂ Ω: in figura A ∩ E e Ac ∩ E hanno misure esterne che si sommano a dare µ∗ (E). Ω E c A A Ora dovremo verificare che la famiglia M appena costruita costituisce una σ–algebra, che essa contiene la σ–algebra generata da F0 e che µ∗ ristretta a σ(F0 ) è proprio la misura che estende µ. A tale scopo serviranno alcune proprietà. Proposizione 5. La misura esterna µ∗ gode delle seguenti proprietà: (i) µ∗ (A) ≥ 0, per ogni A ⊂ Ω; (ii) µ∗ (∅) = 0; (iii) per ogni A, B ∈ P(Ω) con A ⊂ B si ha che µ∗ (A) ≤ µ∗ (B) (monotonia); ∞ ∞ S P ∞ ∗ An ≤ µ∗ (An ) (numera(iv) per ogni successione {An }n=1 ⊂ P(Ω) si ha che µ n=1 n=1 bile subadditività). Dim. (i) Per definizione µ∗ (A) ≥ 0 (inf di quantità positive!). (ii) Per la proprietà precedente µ∗ (∅) ≥ 0. L’insieme vuoto appartiene a F0 ed è ricoperto da se stesso, dunque µ∗ (∅) = 0. (iii) Ogni ricoprimento di B ricoprirà anche A, dunque per definizione l’inf che definisce µ∗ (A) sarà minore o uguale di quello che definisce µ∗ (B). 21 2.1. COSTRUZIONE DELL’ESTENSIONE (iv) Sia ε > 0. Possiamo scegliere {Bn,k }∞ k=1 successione di insiemi in F0 in modo che An ⊂ e ∞ X ∞ [ Bn,k n=1 µ(Bn,k ) < µ∗ (An ) + k=1 Allora [ n e quindi µ ∗ ∞ [ n=1 An ! ≤ An ⊆ X [ ε . 2n Bn,k n,k µ(Bn,k ) < n,k Dall’arbitrarietà di ε discende la tesi. ∞ X µ∗ (An ) + ε. n=1 Lemma 1. M è un’algebra. Dim. Verifichiamo le tre proprietà caratterizzanti: (i) Ω ∈ M, infatti ∀E ⊆ Ω si ha che µ∗ (Ω ∩ E) + µ∗ (∅ ∩ E) = µ∗ (E) (ricordiamo che µ∗ (∅) = 0). (ii) A ∈ M =⇒ Ac ∈ M, infatti ∀E ⊆ Ω si ha che µ∗ (A ∩ E) + µ∗ (Ac ∩ E) = µ∗ (E). (iii) A, B ∈ M =⇒ A ∪ B ∈ M, infatti ∀E ⊆ Ω si ha che µ∗ (E) = µ∗ (B ∩ E) + µ∗ (B c ∩ E) = µ∗ (B ∩ A ∩ E) + µ∗ (B ∩ Ac ∩ E) + µ∗ (B c ∩ A ∩ E) + µ∗ (B c ∩ Ac ∩ E) ≥ µ∗ (B ∩ A ∩ E) + µ∗ ((A ∩ B)c ∩ E) (per la prima uguaglianza abbiamo “spezzato” B ∩ E e B c ∩ E con A, mentre la disuguaglianza segue dalla subadditività). D’altro canto, sempre per la subadditività, µ∗ (A ∩ B ∩ E) + µ∗ ((A ∩ B)c ∩ E) ≥ µ∗ (E), e dunque µ∗ (A ∩ B ∩ E) + µ∗ ((A ∩ B)c ∩ E) = µ∗ (E). Quindi A∩B ∈ M cioè M è chiusa rispetto alle intersezioni finite e ai complementari, perciò grazie alle formule di De Morgan, è chiusa anche rispetto alle unioni finite. 22 CAPITOLO 2. ESTENSIONE DI MISURE Lemma 2. Sia {Ak }∞ k=1 una successione finita o numerabile di insiemi disgiunti di M allora per ogni E ⊂ Ω ! ∞ ∞ [ X Ak = µ∗ (E ∩ Ak ) . µ∗ E ∩ k=1 k=1 Dim. Dividiamo la dimostrazione in più parti: • Il caso finito {Ak }nk=1 si dimostra per induzione: • se n = 1 non c’è nulla da dimostrare. • se n = 2 • se A1 ∪ A2 = Ω la relazione da dimostrare non è altro che il criterio di Carathéodory definente µ∗ infatti, posto A1 = A e A2 = Ac abbiamo che: 2 2 S P Ak = µ∗ (E) = µ∗ (E ∩ A) + µ∗ (E ∩ Ac ) = µ∗ (E ∩ Ak ) µ∗ E ∩ k=1 k=1 • se A1 ∪ A2 ( Ωallora trattiamo E ∩ (A1 ∪ A2 ) come un qualsiasi E ′ ⊂ Ω: 2 2 P S µ∗ (E ∩ Ak ) Ak = µ∗ (E ′ ) = µ∗ (E ′ ∩ A1 ) + µ∗ (E ′ ∩ Ac1 ) = µ∗ E ∩ k=1 k=1 n S • se n > 2 chiamiamo Bn = Ak e osserviamo che Bn = Bn−1 ∪ An . Allora: k=1 n S Ak = µ∗ (E ∩ (Bn−1 ∪ An )) = µ∗ (E ∩ Bn−1 ) + µ∗ (E ∩ An ) perché µ∗ E ∩ k=1 il lemma vale per n = 2 e, infine, µ∗ (E ∩ Bn−1 ) + µ∗ (E ∩ An ) = per l’ipotesi induttiva. n P k=1 µ∗ (E ∩ Ak ) • Il caso numerabile si dimostra sfruttando la monotonia e la numerabile subadditività n ∞ S S ∗ di µ . Infatti, poiché ∀n E ∩ Ak ⊆ E ∩ Ak , per la monotonia: k=1 k=1 n n ∞ ∞ S P S n→∞ P ∗ ∗ ∗ Ak = µ∗ (E ∩ Ak ) −−−→ µ (E ∩ Ak ) Ak ≥ µ E ∩ µ E∩ k=1 k=1 k=1 D’altro per subadditività, ricaviamo: ∞ la numerabile canto, ∞ ∞ P S S µ∗ (E ∩ Ak ) (E ∩ Ak ) ≤ Ak = µ∗ µ∗ E ∩ k=1 da cui l’asserto. k=1 k=1 k=1 Lemma 3. µ∗|M è numerabilmente additiva. Dim. La numerabile additività di µ∗|M si ricava dal lemma precedente ponendo E = Ω. Lemma 4. M è una σ–algebra. 23 2.1. COSTRUZIONE DELL’ESTENSIONE Dim. Poiché abbiamo già visto che M è un’algebra non ci resta da dimostrare che M è chiusa rispetto all’unione numerabile. E per questo ci basterà mostrare che M è chiusa rispetto all’unione numerabile disgiunta (in quanto ogni unione numerabile può essere scritta come unione numerabile disgiunta). A tale scopo sia A1 , A2 , . . . una successione numerabile di insiemi disgiunti di M e sia n S S A = Ak la sua unione. Sia inoltre Bk = Ak l’unione finita arrestata al termine n. k k=1 Ovviamente ogni Bn ∈ M in quanto M è un’algebra. Dobbiamo mostrare che anche A ∈ M ovvero che µ∗ (E) = µ∗ (E ∩ A) + µ∗ (E ∩ Ac ). Grazie alla numerabile subadditività basterà mostrare che µ∗ (E) ≥ µ∗ (E ∩A)+µ∗ (E ∩Ac ). Osserviamo che: • µ∗ (E) = µ∗ (E ∩ Bn ) + µ∗ (E ∩ Bnc ) perché Bn ∈ M; • µ∗ (E ∩ Bn ) = n P k=1 µ∗ (E ∩ Ak ) per il lemma precedente; • µ∗ (E ∩ Bnc ) ≥ µ∗ (E ∩ Ac ) per la monotonia di µ∗ , essendo Ac ⊂ Bnc ; • µ∗ (E ∩ A) = Dunque: ∞ P k=1 µ∗ (E ∩ Ak ) ancora per il lemma precedente. µ∗ (E) = µ∗ (E ∩ Bn ) + µ∗ (E ∩ Bnc ) ≥ n P k=1 µ∗ (E ∩ Ac ) = µ∗ (E ∩ A) + µ∗ (E ∩ Ac ). n→∞ µ∗ (E ∩ Ak ) + µ∗ (E ∩ Ac ) −−−→ ∞ P k=1 µ∗ (E ∩ Ak ) + Lemma 5. F0 ⊂ M. Dim. Dobbiamo mostrare che se A ∈ F0 allora A ∈ M. Infatti se A ∈ F0 allora ∀E ⊆ Ω e ∞ ∞ S P ∀ε > 0 esiste una successione A1 , A2 , . . . in F0 tale che E ⊂ An e µ(An ) ≤ µ∗ (E)+ε. n=1 n=1 Siano Bn = An ∩ A e Cn = An ∩ Ac . Allora Bn e Cn appartengono a F0 perché F0 è ∞ ∞ S S un’algebra. Inoltre E ∩ A ⊂ Bn e E ∩ Ac ⊂ Cn . Quindi: n=1 ∗ ∗ c µ (E ∩ A) + µ (E ∩ A ) ≤ A ∈ M. ∞ P n=1 µ(Bn ) + ∞ P n=1 n=1 µ(Cn ) = ∞ P n=1 µ(An ) ≤ µ∗ (E) + ε e, pertanto, A questo punto conosciamo già molti insiemi µ∗ –misurabili: ad esempio tutti quelli di F0 , i loro complementari, le loro intersezioni o unioni numerabili. Molti altri insiemi sono µ∗ –misurabili, ad esempio quelli di misura esterna nulla. Lemma 6. Sia A ⊂ Ω tale che µ∗ (A) = 0. Allora A ∈ M. 24 CAPITOLO 2. ESTENSIONE DI MISURE Dim. Sia E ⊂ Ω. Per la subadditività si ha che µ∗ (A ∩ E) + µ∗ (Ac ∩ E) ≥ µ∗ (E). Inoltre per la monotonia µ∗ (A ∩ E) = 0 e µ∗ (Ac ∩ E) ≤ µ∗ (E), dunque µ∗ (A ∩ E) + µ∗ (Ac ∩ E) ≤ µ∗ (E), da cui A ∈ M. Ne segue che tutti i sottoinsiemi di insiemi di misura esterna nulla sono misurabili. Corollario 1. Sia B ⊂ A ⊂ Ω e µ∗ (A) = 0. Allora B ∈ M. Dim. La tesi deriva dal lemma precedente e dal fatto che per la monotonia µ∗ (B) = 0. Lemma 7. µ∗|F0 ≡ µ. Dim. Se A ∈ F0 allora µ∗ (A) ≤ µ(A) per definizione di µ∗ . Inoltre, se A ⊂ An ∈ F0 allora, per la monotonia e la subadditività di µ∗ su F0 , µ(A) ≤ ∞ P µ(An ) da cui l’asserto. ∞ P n=1 ∞ S An e n=1 µ(A ∩ An ) ≤ n=1 Siamo ora pronti per dimostrare il seguente teorema. Teorema 2 (di estensione). Sia µ una misura definita su un’algebra F0 e sia F = σ(F0 ) la σ–algebra generata da F0 . Allora esiste l’estensione µ∗ di µ a F . Dim. Per i lemmi introdotti F0 ⊂ F ⊂ M ⊂ P(Ω). Inoltre µ∗ (Ω) = 1 e µ∗|M è una misura su M che su F0 coincide proprio con µ. Allora µ∗|F è l’estensione cercata. Osservazione 4. Per semplicità solitamente (e anche noi adotteremo nel seguito tale convenzione) si scrive µ anziché µ∗ . 2.2 Unicità dell’estensione Definizione 11. Una famiglia A di sottoinsiemi di Ω è detta π-sistema se è chiusa rispetto all’intersezione finita cioé se: (π) A, B ∈ A =⇒ A ∩ B ∈ A Definizione 12. Una famiglia A di sottoinsiemi di Ω è detta λ-sistema se contiene Ω ed è chiusa rispetto alla formazione di complementari e di unioni numerabili di insiemi disgiunti della famiglia ovvero se valgono le seguenti proprietà: 25 2.2. UNICITÀ DELL’ESTENSIONE (λ1 ) Ω ∈ A; (λ2 ) A ∈ A =⇒ Ac ∈ A; (λ3 ) {An }∞ n=1 successione in A di insiemi disgiunti =⇒ ∞ S n=1 An ∈ A. Osservazione 5. Se valgono le proprietà (λ1 ) e (λ3 ) allora (λ2 ) è equivalente a: (λ′2 ) A, B ∈ A, A ⊂ B =⇒ B \ A ∈ A. Infatti se L soddisfa (λ2 ) e (λ3 ) e A, B ∈ L, A ⊂ B, allora L contiene B c , A ∪ B c (unione disgiunta) e B \ A = (A ∪ B c )c . Per cui vale (λ′2 ). Viceversa, se L soddisfa (λ1 ) e (λ′2 ), allora A ∈ L implica che Ac = Ω \ A ∈ L e dunque vale (λ2 ). Osservazione 6. Un’algebra è certamente un π-sistema e una σ-algebra è certamente un λ-sistema ma non è sempre vero il viceversa. Esempio 5. Sia Ω = {a, b, c, d}. Consideriamo A = {∅, Ω, {a, b}, {a, c}, {a, d}, {b, c}, {b, d}, {c, d}} allora A è un λ-sistema ma non è un’algebra. Lemma 8. Se una famiglia L è sia un π-sistema che un λ-sistema allora è anche una σ-algebra. Dim. • Ω ∈ L in virtù della proprietà (λ1 ). • L è chiusa rispetto alla formazione di complementari in virtù della proprietà (λ2 ). • L è chiusa rispetto alle unioni numerabili perchè lo è rispetto alle unioni numerabili disgiunte (λ3 ). Teorema 3 (π-λ di Dynkin). Se A è un π-sistema e L è un λ-sistema tali che A ⊂ L, allora σ(A) ⊂ L. Dim. Sia L0 il λ–sistema generato da A (ovvero l’intersezione di tutti i λ–sistemi contenenti A). È facile mostrare che A ⊂ L0 ⊂ L. Se mostriamo che L0 è anche un π–sistema, la tesi segue dal Lemma 8. Per ogni A ⊂ Ω, sia LA la famiglia di insiemi B tali che A ∩ B ∈ L0 . Mostriamo che se A ∈ A oppure A ∈ L0 allora LA è un λ–sistema. Infatti poiché A ∩ Ω = A, LA soddisfa (λ1 ). Se B1 , B2 ∈ LA e B1 ⊂ B2 , allora L0 contiene A ∩ B1 e A ∩ B2 (è λ–sistema) e dunque contiene la differenza propria (A ∩ B1 ) \ (A ∩ B2 ) = A ∩ (B2 \ B1 ) e dunque LA contiene 26 CAPITOLO 2. ESTENSIONE DI MISURE B2 \ B1 e LA soddisfa (λ′2 ). Infine se Bn ∈ LA sono insiemi disgiunti, S∞ allora L0 contiene A ∩ Bn (che sono disgiunti) e dunque anche la loro unione A ∩ ( n=1 Bn ) e LA soddisfa (λ3 ). Se A, B ∈ A allora A ∩ B ∈ A ⊂ L0 e dunque B ∈ LA . Quindi A ∈ A =⇒ A ⊂ LA , e poiché LA è un λ–sistema, deve essere L0 ⊂ LA . Perciò A ∈ A e B ∈ L0 implicano che B ∈ LA e A ∈ LB . Ne segue che se B ∈ L0 allora A ⊂ LB e quindi L0 ⊂ LB . Infine, B ∈ L0 e C ∈ L0 implicano che C ∈ LB o, che è lo stesso, B ∩ C ∈ L0 e L0 è un π–sistema. Osservazione 7. Il seguente teorema di unicità è l’unico del capitolo che richiede una condizione più restrittiva. I teoremi di estensione, infatti, valgono per misure generiche mentre l’unicità dell’estensione cade se non si postula che le misure in gioco siano σ-finite. Teorema 4 (di unicità). Sia A un π-sistema e siano µ1 e µ2 misure entrambe definite ∞ su S∞σ(A) e σ-finite rispetto ad A, ovvero esista una successione {Bn }n=1 ⊂ A tali che n=1 Bn = Ω e sia µi (Bn ) < ∞ per ogni n e per ogni i = 1, 2. Inoltre sia µ1|A ≡ µ2|A allora µ1 e µ2 coincidono anche su σ(A). Dim. Si supponga che B ∈ A e µ1 (B) = µ2 (B) < ∞ e sia LB la famiglia degli insiemi A ∈ σ(A) tali che µ1 (B ∩ A) = µ2 (B ∩ A). Allora LB è un λ–sistema, infatti: • Ω ∈ LB ; • se A ∈ LB =⇒ Ac ∈ LB infatti, essendo B di misura finita: µ1 (B ∩ Ac ) = µ1 (B) − µ1 (B ∩ A) = µ2 (B) − µ2 (B ∩ A) = µ2 (B ∩ Ac ); S∞ S • se A1 , A2 , . . . ∈ LB disgiunti allora, essendo B ∩ ∞ n=1 B ∩ An , ricaviamo: n=1 An = ! ! ∞ ∞ ∞ ∞ [ X X [ An , µ2 (B ∩ An ) = µ2 B ∩ µ1 (B ∩ An ) = An = µ1 B ∩ n=1 n=1 e dunque S∞ n=1 n=1 n=1 An ∈ LB . Inoltre A ⊂ LB da cui, per il teorema di Dynkin, σ(A) ⊂ LB , per ogni B ∈ A. S Ecco che entra in gioco la condizione di σ-finitezza: siano Bn gli insiemi tali che ∞ n=1 Bn = Ω con µ1 (Bn ) = µ2 (Bn ) < ∞, che esistono per ipotesi. Senza perdita di generalità possiamo pensare che i Bn siano disgiunti. T Ma allora se A ∈ A allora A ∈ ∞ n=1 LBn e per la numerabile additività abbiamo: ! ∞ ∞ [ X µ1 (A) = µ1 (Bn ∩ A) = µ1 (Bn ∩ A) n=1 = ∞ X n=1 µ2 (Bn ∩ A) = µ2 n=1 ∞ [ (Bn ∩ A) n=1 ! = µ2 (A). 2.3. COMPLETEZZA 2.3 27 Completezza Gli insiemi di misura nulla hanno una certa importanza nella teoria della misura (e della probabilità), infatti in generale non è solo l’insieme vuoto ad avere misura nulla. Per questo diamo la seguente definizione. Definizione 13. Un insieme misurabile A con µ(A) = 0 si dice trascurabile. Nel caso in cui si abbia una misura di probabilità si attribuisce un nome anche ai complementari degli insiemi trascurabili. Definizione 14. Un insieme misurabile A con P(A) = 1 si dice quasi certo. Sembrerebbe naturale che tutti i sottoinsiemi di un dato insieme che è trascurabile abbiano misura nulla. Il problema è che tali sottoinsiemi se sono misurabili, allora hanno misura zero (per la proprietà di monotonia), ma non è detto che siano misurabili. Definizione 15. Le misure per cui, per qualsiasi A trascurabili, tutti i sottoinsiemi di A sono misurabili si dicono complete. Per il Corollario 1 l’estensione della misura µ alla σ–algebra M dei misurabili è completa. Inoltre data una misura su una σ–algebra F è sempre possibile completarla ovvero considerarla sulla σ–algebra Fc generata da F più tutti i sottoinsiemi degli elementi di F aventi misura nulla. Si può dimostrare che se E ∈ Fc allora E = A ∪ B dove A ∈ F e B ⊂ C, C ∈ F e µ(C) = 0. 2.4 Costruzione della misura di Lebesgue su Rn Nel caso particolare in cui Ω = Rn la costruzione appena vista (ovvero definizione della misura esterna e sua restrizione alla σ–algebra dei misurabili) si può applicare alla nozione di “lunghezza” in modo da ottenere la misura di Lebesgue. Cominciamo col definire gli insiemi di cui la lunghezza è “ovvia”: gli intervalli e le loro unioni finite. Q Definizione 16. Un intervallo di Rn è ni=1 Ii dove Ii è un intervallo di R (che può essere aperto, chiuso, aperto a destra e chiuso a sinistra, eccetera). Chiamiamo B0n l’algebra dei pluriintervalli, ovvero delle unioni finite e disgiunte di intervalli di Rn . Notiamo che la σ–algebra dei boreliani Bn è generata da B0n , ovvero σ(B0n ) = Bn . Allora definendo “bene” (cioè in modo che sia numerabilmente additiva) una misura su B0n , potremo poi estenderla a Bn (e oltre). Definizione 17. Sia Ii un intervallo di estremi ai e Q bi con ai ≤ bi . Indichiamo con |Ii | la lunghezza in R di Ii , ovvero |Ii| = bi − ai . Se A = ni=1 Ii è un intervallo di Rn la sua Q ∪m lunghezza in Rn è λn (A) = ni=1 |Ii |. Se B = P j=1 Aj è un pluriintervallo (gli Aj sono n n dunque intervalli), la lunghezza di B è λ (B) = m j=1 λ (Aj ). 28 CAPITOLO 2. ESTENSIONE DI MISURE Teorema 5. λn è una misura su B0n ovvero è numerabilmente additiva. Dim. Facciamo solo il caso n = 1 (il caso generale è solo più complesso dal punto di vista della notazione). Sn S n n Sia A =S ∞ i=1 Ii k=1 Ak dove A ∈ B0 e gli Ak sono disgiunti anch’essi in B0 . Allora A = mk k k e Ak = j=1 Jj dove gli Ii sono intervalli disgiunti, e cosı̀ pure i Jj . Dunque λ(A) = Ii = n X i=1 mk ∞ [[ k=1 j=1 |Ii |, e λ(Ak ) = Ii ∩ Jjk , mk X j=1 |Jjk |, inoltre l’unione che fornisce Ii è disgiunta. Se dimostriamo che data una unione numerabile disgiunta di intervalli la sua misura secondo λ è la somma delle misure dei singoli intervalli, allora concludiamo, perché in tal caso: n X i=1 mk n X ∞ X X Ii ∩ Jjk |Ii | = (∗) i=1 k=1 j=1 ∞ ∞ mk (∗∗) X X k (∗∗∗) X J = λ(Ak ). = j k=1 k=1 j=1 In queste uguaglianze (∗) è appunto la proprietà (∗∗) segue dalla a dimostrare; S∞cheSandremo mk Sn k stessa e dal fatto che possiamo scrivere A = k=1 j=1 i=1 Ii ∩ Jj (unione disgiunta) e (∗ ∗ ∗) segue dalla definizione di λ(Ak ). S DimostriamoPdunque che se I è un intervallo e I = ∞ k=1 Ik e gli Ik sono intervalli disgiunti, |I |. Ciò è conseguenza del seguente Lemma. allora |I| = ∞ k=1 k S P Lemma 9. a. Se k Ik ⊂ I e gli Ik sono disgiunti, allora k |Ik | ≤ |I|. S P b. Se I ⊂ k Ik , allora |I| ≤ k |Ik |. Dim. del Lemma a. Se gli Ik sono n l’asserto è dimostrato perP induzione. Se invece gli Ik sono un’infinità n numerabile, per ogni sottofamiglia si ha i=1 |Iki | ≤ |I| e per l’arbitrarietà di n si conclude. b. Come per il punto precedente ora S∞ il caso finito si dimostra per induzione. Supponiamo −k che I = (a, b] e (a, b] ⊂ k=1 (ak , bk ]. Se 0 < ε < b − a, gli aperti (ak , bk + ε2 ) sono una copertura di [a + ε, b]. Poiché [a + ε, b] è un compatto di R (teorema di Heine– Borel) esiste un sottoricoprimento finito (definizione di compatto in spazi topologici), Sn −ki cioè [a + ε, b] allora la proprietà vera nel caso finito P⊂ i=1 (aki , bki + ε2 ). Usando P b − a − ε ≤ ni=1 (bki + ε2−ki − aki ) ≤ ε + ∞ (b k=1 k − ak ). La tesi segue dall’arbitrarietà di ε. 2.4. COSTRUZIONE DELLA MISURA DI LEBESGUE SU RN 29 Teorema 6 (di esistenza e unicità della misura di Lebesgue). Esiste una ed una sola estensione di λn a Bn e questa estensione è una misura completa definita su una σ-algebra Ln che contiene Bn . Tale misura è anch’essa indicata con λn (o semplicemente λ se non ci sono ambiguità sulla dimensione) ed è detta misura di Lebesgue su Rn , mentre Ln è la σ-algebra di Lebesgue di Rn . Dim. Basta applicare il Teorema di estensione e quello di unicità. Poiché i singoletti hanno lunghezza zero, dalla numerabile additività segue che ogni insieme numerabile ha misura di Lebesgue zero, non è però vero il viceversa, come mostra il seguente fondamentale esempio. Esempio 6 (Insieme di Cantor). È noto che l’insieme di Cantor C è un frattale dell’intervallo [0, 1] (volendo si può considerarne anche la versione multidimensionale), avente cardinalità pari a quella del continuo. Mostriamo che ciononostante λ(C) := λ1 (C) = 0. Basterà mostrare che λ(C c ∩ [0, 1]) = 1. La costruzione di C si fa per induzione togliendo via via intervalli che vanno a finire in C c ∩ [0, 1]: al passo 1 si toglie un intervallo di lunghezza 1/3, al passo 2 si tolgono 2 intervalli di lunghezza 1/9 (lunghezza totale 2/9), e cosı̀ via: al passo n si toglie un pluriintervallo di lunghezza 13 · (2/3)n−1 . Quindi ∞ 1X λ(C ∩ [0, 1]) = 3 n=0 c n 2 = 1. 3 Osservazione 8. B0n ( Bn ( Ln ( P(Ω). La catena di inclusioni è a questo punto ovvia, meno ovvio è che le inclusioni sono strette. a. B0n ( Bn infatti le unioni numerabili di intervalli disgiunti non sono in generale elementi di B0n ma lo sono di Bn . b. L’insieme di Cantor C è tale che λ(C) = 0 dunque per la completezza di λ su L tutti i suoi sottoinsiemi sono elementi di L. La cardinalità dell’insieme dei sottoinsiemi di C è 2|C| = 2c > c dove con c indichiamo la cardinalità del continuo. Poiché |B| = c (lo diamo per scontato) allora |L| > |B| e devono esistere elementi di L che non sono in B (ad esempio qualcuno dei sottoinsiemi di C. Il ragionamento si può ripetere in dimensione n. c. Esiste un insieme non misurabile. Per costruirlo osserviamo che la misura di Leesgue è invariante per traslazioni, e in particolare lo è per la somma modulo 1 (che indichiamo con +̂) in [0, 1) (ovvero x+̂y = x + y se x + y < 1, altrimenti x+̂y = x + y − 1). Questo risultato è il Lemma 16 del Capitolo 3 del Royden [6]. Dividiamo [0, 1) in classi di equivalenza: x ∼ y se x − y ∈ Q. Sia P un insieme che contiene uno e un solo rappresentante di ogni classe (P esiste per l’assioma della scelta). Numeriamo i razionali in [0, 1): {ri }∞ i=1 e definiamo Pi = P +̂ri . Osserviamo che i Pi sono a due a due disgiunti, infatti se x ∈ Pi ∩ Pj allora x = pi +̂ri = pj +̂rj con pi e pj 30 CAPITOLO 2. ESTENSIONE DI MISURE in P . Ma pi − pj ∈ Q e allora pi ∼ pj . Siccome P contiene un unico rappresentante per classe deve essere i = j. D’altra parte ogni x ∈ [0, 1) è equivalente ad un elemento di P , dunque differisce da un S∞ elemento di P per un razionale ri e quindi è in Pi . Detto in altro modo [0, 1) = i=1 Pi , dunque ∞ ∞ X X 1 = λ([0, 1)) = λ(Pi ) = λ(P ), i=1 i=1 dove l’ultima uguaglianza segue dall’invarianza di λ rispetto alla somma modulo 1. Il che è assurdo perché l’ultima serie può valere solo 0 oppure ∞ a seconda che λ(P ) = 0 oppure λ(P ) > 0. Di conseguenza P non può essere misurabile. Osservazione 9. Come visto nel caso generale Ln è il completamento di Bn rispetto alla misura λn . Dunque λn ristretta a Bn non è completa, mentre lo è su Ln . Inoltre ogni elemento di Ln è unione di un boreliano e di un sottoinsieme di un boreliano avente misura nulla. Osservazione 10. Si potrebbe pensare che il fatto che non si riesca ad estendere la nozione di lunghezza alla totalità dei sottoinsiemi di Rn sia dovuta alla nostra richiesta di fissare il valore della lunghezza per tutti gli intervalli. Se cosı̀ fosse indebolendo opportunamente le richieste su µ forse si potrebbe trovare una “lunghezza” su P(Rn ). Questa speranza risulta frustrata: infatti sembrerebbe ragionevole chiedere che µ sia invariante per traslazioni, ma anche in quel caso si dimostra che non esiste un’estensione a P(Rn ). Lo stesso accade se si richiede solamente che µ({x}) = 0 per ogni x ∈ Rn . 2.4.1 Probabilità generali e probabilità uniforme su [0, 1] Nel caso in cui la misura definita su F0 da estendere a σ(F0 ) sia una probabilità, ovvero µ(Ω) = 1, oltre alla misura esterna di ogni insieme si può definire facilmente anche la misura interna (in realtà lo si può fare anche in spazi di misura generici, ma qui non lo faremo). Definizione 18. Dato un evento A ⊂ Ω chiamiamo misura interna la quantità: µ∗ (A) = 1 − µ∗ (Ac ) Osservazione 11. In analogia con la definizione di misura esterna si potrebbe pensare di definire la misura interna come X µ∗ (A) = sup µ(An ) A n in cui ora le A sono famiglie di insiemi disgiunti di F0 e contenuti in A. Tale scelta produce però risultati indesiderati: in alcuni casi, insiemi A per i quali ci si aspetta µ∗ (A) = 1 forniscono, secondo questa definizione, µ∗ (A) = 0 (rimandiamo agli approfondimenti). 31 2.5. APPROFONDIMENTI Osservazione 12. Dopo aver definito misura esterna e misura interna si potrebbe essere indotti a definire un criterio più semplice per la µ∗ -misurabilità limitandoci al solo caso E = Ω. Sarebbe infatti molto naturale affermare che un insieme A è µ∗ -misurabile quando le sue misure esterna e interna coincidono: µ∗ (A) = 1 − µ∗ (Ac ) o, equivalentemente, quando: µ∗ (A ∩ Ω) + µ∗ (Ac ∩ Ω) = µ∗ (Ω) Perché, allora, usare il più restrittivo criterio di Carathéodory? Perché, a priori, una misura esterna non è necessariamente additiva (né finitamente né, tantomeno, numerabilmente) e pertanto, al fine di garantire l’additività, Carathéodory introduce questo criterio che, tra tutti gli insiemi (A) le cui misure interne ed esterne coincidono, seleziona quelli che suddividono ogni altro insieme (E) mantenendone l’additività. Per quanto riguarda il caso particolare Ω = [0, 1], restringendo la misura di Lebesgue λ all’intervallo [0, 1] si ottiene una misura di probabilità P: quella uniforme su [0, 1]. Essa risulta definita sugli insiemi A ∈ L ∩ [0, 1], ovvero agli A ⊂ [0, 1] tali che esiste L ∈ L e A = L ∩ [0, 1]. La σ–algebra L ∩ [0, 1] contiene i boreliani di [0, 1] e ne è il completamento rispetto alla misura P. Alternativamente P può essere costruita direttamente considerando Ω = [0, 1], B0 (0, 1) l’algebra delle unioni finite e disgiunte di intervalli di Ω e la nozione di lunghezza usuale su B0 (0, 1). Per il teorema di esistenza ed unicità esiste ed è unica l’estensione di questa lunghezza ad una σ–algebra che completa quella dei boreliani. 2.5 2.5.1 Approfondimenti Il teorema della classe monotona Abbiamo visto che l’unicità dell’estensione della misura è una conseguenza del teorema di Dynkin. Un teorema analogo che poteva essere usato in alternativa al teorema di Dynkin per dimostrare la stessa cosa è il seguente. Una classe monotona è una famiglia di insiemi chiusa rispetto alla formazione di unioni e intersezioni numerabili e monotone. Teorema 7 (teorema della classe monotona). Siano F0 un’algebra e M una famiglia monotona tali che F0 ⊂ M. Allora σ(F0 ) ⊆ M. Il teorema di Dynkin e quello della classe monotona sono spesso usati per dimostrare che una proprietà P è goduta da tutti gli elementi di una certa σ–algebra F : la procedura è la seguente. 1. Prendere una famiglia A (che sia un’algebra o un π-sistema) di insiemi “semplici” che generi F ; 32 CAPITOLO 2. ESTENSIONE DI MISURE 2. dimostrare che gli elementi di A godono di P ; 3. dimostrare la famiglia degli insiemi che godono di P è un λ-sistema (se vogliamo usare Dynkin) o una classe monotona (se vogliamo usare il teorema della classe monotona). Capitolo 3 Integrale astratto di Lebesgue Il concetto di integrale è legato al concetto di misura. Scopo di questo capitolo è definire, dati (Ω, F , µ) spazio di misura e f misurabile (il concetto di misurabilità sarà definito fra poco), l’integrale Z f dµ. Ω Nel caso Ω = R, la costruzione coinciderà con l’integrale di Riemann in molti casi, ma servirà anche a definire integrali non definiti nel senso di Riemann e integrali astratti (cioè su spazi di misura qualsiasi). Esempio 7. Se consideriamo f : R → R tale che f (x) = 1 se x ∈ Q e f (x) = 0 se x ∈ R \ Q, si può verificare che non esiste l’integrale di Riemann Z f (x)dx. R Eppure intuitivamente si potrebbe pensare che i punti razionali siano “troppo pochi” (in effetti la loro misura di Lebesgue è zero) e dunque una definizione sensata dovrebbe dare Z f (x)dx = 0. R Il problema nell’utilizzo della costruzione di Riemann per questa funzione è che anche se “pochi” i razionali sono troppo “sparsi”. La costruzione dell’integrale di Riemann suddivide il dominio in intervallini e il limite, quando questi intervalli divengono sempre più piccoli, della somma delle aree dei rettangoli “da sotto” è l’integrale inferiore di Riemann, analogamente il limite della somma delle aree “da sopra” è l’integrale superiore di Riemann. Se questi due limiti coincidono la funzione ha integrale di Riemann che è questo unico valore limite. 33 34 CAPITOLO 3. INTEGRALE ASTRATTO DI LEBESGUE 00001111 1111 0000 0000 1111 0000 00001111 1111 0000 1111 0000 1111 1111 0000 0000 1111 00001111 00001111 1111 00000000 1111 00001111 1111 0000 1111 0000 0000 1111 0000 00001111 00001111 1111 0000 1111 00001111 1111 00001111 1111 0000 0000 0000 1111 0000000001111 11111 0000 00001111 000001111 11111 0000 1111 00001111 1111 00001111 1111 00000 11111 0000 0000 0000 1111 0000000001111 11111 00001111 00001111 000001111 11111 00000000 1111 0000 1111 00001111 1111 00001111 1111 00000 11111 0000 0000 1111 0000 0000 1111 000001111 11111 0000 1111 0000 0000 1111 0000 1111 0000 00000 11111 00001111 1111 0000 1111 0000 1111 00001111 1111 00001111 1111 000001111 11111 00001111 00001111 0000 1111 0000 0000 000001111 11111 0000 0000 1111 0000 0000 1111 0000 1111 0000 00000 11111 0000 00001111 1111 00001111 1111 0000 1111 00001111 1111 00001111 1111 00001111 1111 00000 11111 0000 1111 0000 0000 0000 0000 0000 1111 00001111 1111 000001111 11111 0000 00001111 1111 00001111 0000 0000 1111 0000 0000 1111 00000 11111 0000 1111 00001111 1111 00001111 1111 0000 1111 00001111 1111 00001111 1111 00001111 1111 00000 11111 0000 0000 0000 1111 0000 0000 00001111 1111 00001111 1111 000001111 11111 0000 1111 00001111 1111 0000 0000 0000 0000 0000 1111 00000 11111 0000 1111 00001111 1111 00001111 0000 1111 0000 1111 0000 1111 0000 1111 00000 11111 0000 0000 1111 0000 1111 0000 1111 000000001111 1111 00001111 1111 00000000 1111 000000000 11111 0000 00001111 00001111 00001111 1111 000001111 11111 0000 1111 y=f(x) Area approssimante l’integrale di Riemann inferiore Il criterio con cui i punti del dominio vengono suddivisi è semplicemente di “contiguità”: punti vicini cadranno nello stesso intervallino. Inoltre questo metodo funziona solo quando il dominio è R, infatti in spazi astratti (dunque non necessariamente metrici o topologici) non c’è la nozione di intervallo né di “vicinanza”. L’idea di Lebesgue è invece di suddividere il codominio (che tra l’altro è sempre R) in intervalli e di conseguenza suddividere anche il dominio: punti del dominio con la stessa immagine (o immagini vicine – le immagini sono in R quindi si sa cosa significa “vicine”!) finiranno nello stesso insieme della partizione di Ω. 1 0 111111111111111111111111111111 000000000000000000000000000000 1 0 y=f(x) 111111111111111111111111111111 000000000000000000000000000000 1 0 111111111111111111111111111111 000000000000000000000000000000 1 0 a b c z s t In questa figura la partizione del dominio [a, t] è: A1 = [a, b) ∪ [s, t], A2 = [b, c) ∪ [z, s] e A3 = [c, z). 3.1 Funzioni misurabili Definizione 19. Dato uno spazio misurabile (Ω, F ), una funzione f : Ω → R è detta misurabile (rispetto a F ) se f −1 (B) := {ω ∈ Ω : f (ω) ∈ B} è un elemento di F per ogni B ∈ B1 . In pratica la definizione mette a confronto la “struttura” (σ–algebra) F sullo spazio di partenza Ω e l’analoga “struttura” B1 sullo spazio d’arrivo R. La richiesta è che l’operazione di “controimmagine” conservi la struttura. La definizione può essere estesa a funzioni tra spazi misurabili: dati due spazi misurabili (Ω1 , F1) e (Ω2 , F2 ), f : Ω1 → Ω2 è F1 /F2 – misurabile se f −1 (A) ∈ F1 per ogni A ∈ F2 (dunque la Definizione 19. è il caso particolare in cui Ω2 = R e F2 = B1 : in tal caso non si fa menzione esplicita di F2 ). 3.2. INTEGRAZIONE DI FUNZIONI SEMPLICI POSITIVE 35 Notiamo anche che similmente altre nozioni che si incontrano in matematica richiedono che l’operazione di controimmagine “conservi una struttura”. Ad esempio dati due spazi topologici (X, τX ) e (Y, τY ), f : X → Y è per definizione continua se f −1 (A) è un aperto in X, per ogni A aperto in Y (ovvero f −1 (A) ∈ τX per ogni A ∈ τY ). Ritornando alla definizione di misurabilità, va osservato che tale nozione dipende da F : una funzione può essere misurabile rispetto a F e non rispetto a G. Esercizio 7. Siano F e G due σ–algebre su Ω e f : Ω → R. 1. Se f (ω) = c, ∀ω ∈ Ω (funzione costante), allora f è misurabile rispetto a qualsiasi σ–algebra. 2. Se F ⊂ G e f è misurabile rispetto a F , allora lo è anche rispetto a G. La definizione di misurabilità può essere data utilizzando anziché tutti i boreliani una famiglia di generatori. Esercizio 8. f misurabile ⇐⇒ f −1 ((a, b]) ∈ F ∀a < b ⇐⇒ f −1 ((−∞, b]) ∈ F ∀b (Suggerimento: è un’applicazione del teorema di Dynkin). La famiglia delle funzioni misurabili è stabile rispetto a molte operazioni. Proposizione 6. La somma di funzioni misurabili, il massimo, il minimo, la parte positiva, la parte negativa, il sup, l’inf, il limite di funzioni misurabili sono misurabili. Esercizio 9. Dimostrare la proposizione. Osservazione 13. Non tutte le funzioni sono misurabili, come vedremo nel prossimo paragrafo, d’altra parte l’integrale di Lebesgue è definito solo per le funzioni misurabili (e a dire il vero neppure per tutte le misurabili) dunque dovremmo d’ora in avanti aggiungere la parola “misurabile” ogni volta che introduciamo delle funzioni. In realtà talvolta ce lo dimenticheremo, forti del fatto che le funzioni che ci sono più familiari sono misurabili (cosı̀ come i sottoinsiemi di R più familiari sono misurabili secondo Lebesgue). Esercizio 10. Sia Ω = R e F = B1 . Dimostrare che ogni funzione continua è misurabile. Esibire un esempio di funzione misurabile non continua. 3.2 Integrazione di funzioni semplici positive Prima di poter dare le definizioni rigorose di integrale, dobbiamo fissare una convenzione sull’aritmetica di ∞: ( +∞ 0 < a ≤ +∞ a · +∞ = +∞ · a = 0 a=0 a + ∞ = +∞ + a = +∞. La “base” da cui partire per costruire le funzioni semplici è costituita dalle funzioni indicatrici. 36 CAPITOLO 3. INTEGRALE ASTRATTO DI LEBESGUE Definizione 20. Sia Ω un insieme e A ⊂ Ω. Allora la funzione indicatrice di A, 1lA : Ω → R è cosı̀ definita: ( 1 se ω ∈ A 1lA (ω) = 0 se ω 6∈ A Questa notazione è in uso presso i probabilisti. Nei testi di analisi la stessa funzione è indicata con χA ed è chiamata funzione caratteristica di A. In probabilità il nome “funzione caratteristica” è riservato ad un altro importante strumento (che nei testi di analisi matematica è la trasformata di Fourier ...questo sembra avallare la tesi che per capire la matematica metà della fatica sia apprendere la terminologia...). Esercizio 11. 1lA è misurabile se e solo se A ∈ F . Come conseguenza di questo esercizio possiamo dare un facile esempio di funzione non misurabile: se N è un insieme non misurabile (cioè N 6∈ F ), allora f (x) := 1lN (x) è non misurabile. Definizione 21. Sia s : Ω → [0, +∞] tale che s(ω) = n X αi 1lAi (ω) i=1 dove αi sono numeri reali non negativi e Ai sono sottoinsiemi di Ω a due a due disgiunti. Allora s è detta funzione semplice positiva. Esercizio 12. Trovare una condizione necessaria e sufficiente sugli Ai affinché s appena definita sia misurabile. DefinizioneP 22. Dato uno spazio di misura (Ω, F , µ) e una funzione misurabile semplice positiva s = ni=1 αi 1lAi l’integrale di s su Ω o su E ∈ F si definisce nel modo seguente: Z n X αi µ(Ai ) s(ω)dµ(ω) = Ω Z E i=1 s(ω)dµ(ω) = n X i=1 αi µ(Ai ∩ E). Osservazione 14. a. Le convenzioni sull’aritmetica di ∞ servono nel caso in cui s valga +∞ su qualche insieme di misura non Rnulla, oppure se s > 0 su qualche insieme di misura infinita. In entrambi questi casi Ω sdµ = +∞. b. Potrebbe sembrare che la definizione di integrale dipenda dalla Pmrappresentazione di s: Pn α 1 l può anche essere scritta come s = infatti s = j=1 βj 1lBj , dove però se i=1 i Ai Ai ∩ Bj 6= ∅ deve essere che αi = βj . Tuttavia per vedere che l’integrale non dipende dalla rappresentazione di s basta associare a s una “rappresentazione massimale” s = P l dove γk sono i valori αi e βj , scelti distinti e Ck = s−1 (γk ). Non è difficile k=1 γk 1lCkP P vedere che ni=1 αi µ(Ai ) = lk=1 γk µ(Ck ). 3.3. INTEGRAZIONE DI FUNZIONI POSITIVE 37 Vediamo subito un paio di proprietà utili dell’integrale. Proposizione 7. L’integrale è lineare e monotono, ovvero se s e f sono due funzioni semplici positive misurabili e a, b sono due numeri reali non negativi, allora R R R a. as + bf è semplice misurabile positiva e Ω (as + bf )dµ = a Ω sdµ + b Ω f dµ. R R b. se s ≤ f allora Ω sdµ ≤ Ω f dµ. Esercizio 13. Dimostrare la proposizione. Osservazione 15. Linearità e monotonia valgono più in generale, come vedremo più avanti con la Proposizione 9. Qui abbiamo dovuto usare delle condizioni restrittive (s e f funzioni positive e a, b > 0) solo perché al momento sappiamo integrare solo funzioni semplici positive. 3.3 Integrazione di funzioni positive Per definire l’integrale di funzioni positive (e più generali, come vedremo in seguito), ci serviamo dell’integrale di funzioni semplici positive appena definito. Definizione 23. Data f : Ω → [0, +∞] misurabile, l’integrale di f su E ∈ F è definito Z Z f (ω)dµ(ω) := sup s(ω)dµ(ω). E s semplice E 0≤s≤f Osservazione 16. Potrebbe sembrare che ci siano due definizioni per le funzioni semplici. In realtà data una funzione semplice f il sup della definizione è raggiunto prendendo s = f , quindi le due definizioni di integrale coincidono per le semplici. Alcune proprietà sono utili anche per il calcolo. Proposizione 8. Siano f e g funzioni positive misurabili, e A, B e E insiemi misurabili. R R (1) Se 0 ≤ f ≤ g allora E f dµ ≤ E gdµ. R R R (2) Se A ∩ B = ∅, allora A∪B f dµ = A f dµ + B f dµ. R R (3) Se A ⊂ B allora A f dµ ≤ B f dµ. R R (4) Se c ≥ 0 allora E cf dµ = c E f dµ. R (5) Se f|E ≡ 0 allora E cf dµ = 0 (anche se µ(E) = +∞). R (6) Se µ(E) = 0 allora E cf dµ = 0 (anche se f = +∞). R R (7) E f dµ = Ω f 1lE dµ. 38 CAPITOLO 3. INTEGRALE ASTRATTO DI LEBESGUE Esercizio 14. Dimostrare la proposizione. Osservazione 17. In realtà la definizione di integrale tramite l’approssimazione con funzioni semplici non è quasi mai “operativa”: vedremo che spesso o ci si riconduce su R (dove in molti casi l’integrale di Lebesgue coincide con quello di Riemann) o si usano altri artifici. Osservazione 18. A patto di accettare come valore possibile di un integrale anche +∞, l’integrale di Lebesgue di funzioni positive esiste sempre. Esempio 8. Sappiamo già che la funzione 1lQ non è integrabile secondo Riemann. Vediamo che invece lo è secondo Lebesgue: Z Z Z 1lQ (x)dλ(x) = 1lQ (x)dλ(x) + 1lQ (x)dλ(x) R Q R\Q dove con λ abbiamo indicato la misura di Lebesgue su R e il primo termine del secondo membro vale zero per (6) della proposizione precedente, mentre il secondo termine è nullo per (5). 3.4 Integrazione di funzioni integrabili A questo punto sappiamo integrare tutte le funzioni misurabili positive. Per passare all’integrazione di qualsiasi funzione l’idea è di integrare separatamente la parte positiva e quella negativa. Ma si possono presentare problemi del tipo +∞ − ∞. Dunque non riusciremo ad integrare tutte le funzioni ma solo quelle della classe (comunque ampia) L1 (µ) che ora definiamo. Definizione 24. Lo spazio delle funzioni integrabili rispetto a µ è Z 1 L (µ) = f : Ω → R : f misurabile e |f (ω)|dµ(ω) < +∞ . Ω Definizione 25. Sia f ∈ L1 (µ). Siano f + = max{f, 0} e f − = min{f, 0} la parte positiva e quella negativa di f , l’integrale di f è Z Z Z + f dµ := f dµ − f − dµ. Ω Ω Ω La linearità e la monotonia sono ancora valide. Proposizione 9. Siano f, g ∈ L1 (µ) e a, b ∈ R. R R R a. af + bg ∈ L1 (µ) e Ω (af + bg)dµ = a Ω f dµ + b Ω gdµ. R R b. Se f ≤ g (µ–q.o.), allora Ω f dµ ≤ Ω gdµ. R R c. Ω f dµ ≤ Ω |f |dµ. 39 3.5. TEOREMI DI CONVERGENZA Esercizio 15. Dimostrare la proposizione (suggerimento per il terzo punto: |f | = f + + f − ). Vale la pena di capire come è fatto lo spazio L1 (µ). Data la proprietà di linearità dell’integrale è naturale farne uno spazio vettoriale e poi uno spazio normato, con la norma Z kf k := |f |dµ. Ω Il problema è che questa risulta essere una pseudonorma, cioè non è solo la funzione identicamente nulla (lo 0 dello spazio vettoriale) ad avere norma nulla, ma anche tutte le funzioni che sono diverse da zero su un insieme di misura nulla. Infatti alterare i valori di una funzione su un insieme di misura nulla non cambia il valore del suo integrale. Bisogna quindi introdurre una relazione di equivalenza, cioè f ∼ g se f = g quasi ovunque rispetto a µ, dove essere uguali quasi ovunque significa differire su un insieme di misura nulla. Definizione 26. Dato uno spazio di misura (Ω, F , µ) lo spazio vettoriale normato delle funzioni integrabili rispetto a µ è lo spazio quoziente L1 (µ) := L1 (µ)/∼ . 3.5 Teoremi di convergenza L’integrale di Lebesgue è particolarmente utile perché esistono per esso dei teoremi piuttosto generali di passaggio al limite sotto integrale (per le dimostrazioni rimandiamo il lettore al libro di Rudin, [7]). Teorema 8 (Convergenza monotona). Sia {fn }n una successione di funzioni misurabili positive tali che a. 0 ≤ f1 (ω) ≤ f2 (ω) ≤ · · · ≤ +∞ per ogni ω ∈ Ω; n→∞ b. fn (ω) −→ f (ω), per ogni ω ∈ Ω. Allora f è misurabile e Z Ω n→∞ fn dµ −→ Z f dµ. Ω Teorema 9 (Lemma di Fatou). Sia {fn }n una successione di funzioni misurabili positive. Allora Z Z lim inf fn dµ ≤ lim inf fn dµ. Ω n n Ω 40 CAPITOLO 3. INTEGRALE ASTRATTO DI LEBESGUE Per ricordare il verso della disuguaglianza di Fatou basta ricordare un esempio dove vale Rla disuguaglianza stretta: fn = 1l[n,+∞). Infatti limn fn (ω) vale zero per ogni ω ∈ R, ma f dµ = +∞ per ogni n, dunque R n Z Z lim inf fn dµ = 0 < lim inf fn dµ = +∞. R n n R Da ultimo, last but not least come direbbero gli inglesi, ecco quello che è forse il più potente teorema di passaggio al limite sotto segno di integrale, dovuto anch’esso a Lebesgue. Teorema 10 (Convergenza dominata di Lebesgue). Sia {fn }n una successione di funzioni misurabili convergente puntualmente, cioè fn (ω) −→ f (ω), ∀ω ∈ Ω. Se esiste g ∈ L1 (µ) tale che |fn (ω)| ≤ g(ω), allora f ∈ L1 (µ), e lim n→∞ lim n→∞ 3.6 Z ZΩ Ω ∀n, ∀ω ∈ Ω, |fn − f |dµ = 0 Z fn dµ = f dµ. Ω Confronto Riemann-Lebesgue Quando Ω = R abbiamo definito due tipi di integrale per le funzioni definite su Ω, a valori reali: quello di Riemann e quello di Lebesgue (integrando rispetto alla misura di Lebesgue su R). È naturale chiedersi che rapporto vi sia fra le due definizioni. Tra l’altro abbiamo già osservato che la definizione di integrale di Lebesgue non è in genere operativa e quindi sarebbe comodo scoprire che esso coincide con l’integrale di Riemann in molti casi. E cosı̀ è, come ci dice il seguente teorema, per la cui dimostrazione rimandiamo al libro di Kolmogorov e Fomin [4]. Teorema 11. a. Se esiste I= Z b f (x)dx, a secondo Riemann, allora f è integrabile secondo Lebesgue su [a, b] e l’integrale di Lebesgue Z Ie = f (x)dx [a,b] e coincide con I, ovvero I ≡ I. 3.7. INTEGRALI RISPETTO AD ALTRE MISURE, SERIE b. Se f ≥ 0 e per ogni ε > 0 Iε = Z 41 b f (x)dx a+ε esiste secondo Riemann e inoltre esiste il limite (integrale generalizzato di Riemann su [a, b]) I := lim Iε , ε→0 allora f è integrabile secondo Lebesgue su [a, b] e Ie ≡ I. c. Se f ≥ 0 e per ogni b > a Ib = Z b f (x)dx a esiste secondo Riemann e inoltre esiste il limite (integrale generalizzato di Riemann su [a, +∞)) I := lim Ib , b→∞ allora f è integrabile secondo Lebesgue su [a, +∞) e Z e I= f (x)dx ≡ I. [a,+∞) Se nel caso dell’integrale improprio si rinuncia all’ipotesi di positività di f , può accadere che esista l’integrale improprio di Riemann ma f non sia integrabile secondo Lebesgue (ricordiamo che ciò equivale all’integrabilità di |f |), perché ad esempio Z b |f (x)|dx = +∞. lim+ ε→0 a+ε Tuttavia se l’integrale improprio di Riemann è assolutamente convergente, cioè esiste ed è finito il limite di cui sopra (o il suo analogo nel caso di b → ∞), allora f è integrabile secondo Lebesgue e i due integrali coincidono. Esempio 9. La funzione f (x) = x1 sin x1 ha integrale improprio di Riemann su [0, 1] e su R ma non è integrabile secondo Lebesgue né su R né su [0, 1]. Dimostratelo per esercizio (o vedete il Kolmogorov e Fomin [4]). 3.7 Integrali rispetto ad altre misure, serie Vediamo un paio di esempi notevoli di integrale rispetto a misure discrete. Esempio 10. Ogni funzione è integrabile rispetto alla delta di Dirac concentrata in ω0 , cioè alla misura δω0 definita da δω0 (A) := 1lA (ω0 ). Infatti si ha che Z f dδω0 = f (ω0 ). Ω 42 CAPITOLO 3. INTEGRALE ASTRATTO DI LEBESGUE Esempio 11. Un altro esempio notevole è dato dalla seguente misura concentrata su un sottoinsieme numerabile di Ω. Sia {ωn }n≥0 una successione in Ω e sia µ su Ω cosı̀ definita: X µ(A) = 1lA (ωn ), n≥0 cioè µ conta quanti elementi della successione cadono inP A. Allora si può verificare che una funzione misurabile f è integrabile se e solo se la serie n≥0 |f (ωn )| è convergente e in tal caso Z X f dµ = f (ωn ). Ω n≥0 In particolare quest’ultimo esempio ci dice che le serie numeriche possono essere P viste come integrali di Lebesgue: se {an }n≥1 è una successione numerica tale che n≥1 an è assolutamente convergente, allora possiamo scrivere Z X an = a(x)dµ(x), n≥1 R dove a(n) = an , a(x) = 0 se x 6∈ N (an visto come la funzione a valutata in n) e µ misura che conta gli interi non negativi, o anche Z X an = a(n)de µ(n), n≥1 N dove µ e(n) = µ|N . Utilizzando questa rappresentazione delle serie e i teoremi di convergenza visti per l’integrale di Lebesgue si ottengono risultati sullo scambio fra l’operazione di serie e di limite (nel Capitolo 5 invece vedremo come scambiare serie e integrali). Ad esempio dal teorema della convergenza dominata otteniamo il seguente teorema. Teorema 12. Sia {fn }n≥1 una successione di funzioni aventi dominio e codominio reali. Fissato x0 ∈ R̄ ≡ R ∪ {±∞}, se esiste un intorno U di x0 e esiste {gn }n≥1 tali che • |fn (x)| ≤ gn per ogni x ∈ U; P∞ • n=1 gn < ∞, allora vale lo scambio: lim x→x0 ∞ X n=1 fn (x) = ∞ X n=1 lim fn (x). x→x0 (3.1) Dim. Cominciamo con l’osservare che il teorema della convergenza dominata è enunciato per limiti di successioni ma si può facilmente dimostrare anche per limiti generali. Dunque l’enunciato più generale è: data una famiglia di funzioni {fx }x∈U definite su Ω e dipendenti dal parametro x, se 43 3.8. APPROFONDIMENTI x→x • fx (ω) −→0 f (ω) dove f è una funzione definita su Ω; • esiste g ∈ L1 (µ) tale che |fx (ω)| ≤ g(ω) per ogni x ∈ U e per ogni ω, allora lim x→x0 Z fx (ω)dµ(ω) = Ω Z f (ω)dµ(ω). Ω Si tratta di riscrivere il nostro enunciato e scrivere fn (x) come fx (n) cioè pensando che n sia l’argomento e x il parametro; inoltre sia µ la misura del conteggio su N. L’equazione 3.1 diviene Z Z fx (n)dµ(n) = f (n)dµ(n), lim x→x0 N N dove f (n) = limx→x0 fx (n) ed è conseguenza delle ipotesi e del teorema della convergenza dominata. 3.8 3.8.1 Approfondimenti Approssimazione di funzioni positive con successioni monotone di semplici approssimazione di funzioni positive con successioni monotone di funzioni semplici e conseguente definizione alternativa dell’integrale di Lebesgue. 44 CAPITOLO 3. INTEGRALE ASTRATTO DI LEBESGUE Capitolo 4 Probabilità su R In questo capitolo diamo particolare attenzione alla probabilità. Molto di quanto diremo si può estendere al caso di misure finite o anche solo σ–finite. Tuttavia lo scopo su cui ci concentriamo è costruire misure di probabilità su R e capire come è fatto l’integrale rispetto a queste misure (ovviamente per la misura di Lebesgue su R questo è stato fatto nel Capitolo 2). 4.1 Probabilità discrete e assolutamente continue Dato un insieme Ω per definire una probabilità su di esso dobbiamo, in un certo senso, distribuire una massa totale pari a 1 sugli elementi di Ω. Naturalmente qui siamo volutamente imprecisi: una probabilità è definita su una σ–algebra di sottoinsiemi di Ω, ma in realtà spesso la σ–algebra è scelta in dipendenza dal genere di misura che si vuole costruire (ad esempio P(Ω) per la misura del conteggio oppure la σ–algebra di Lebesgue L per la misura di Lebesgue). Per distribuire questa massa totale il modo più semplice è quello di ripartirla su un insieme al più numerabile. Definizione 27. Sia (Ω, F ) uno spazio misurabile, e sia P una probabilità definita su di esso. Se esiste C ⊂ Ω, C al più numerabile tale che P(C) = 1, allora P è detta probabilità discreta. Diremo anche che P è concentrata su C. Notiamo che è appropriato usare l’espressione “concentrata su C”, poiché se A ⊂ Ω e A ∩ C = ∅, allora P(A) = 0. Osservazione 19. Per assegnare una probabilità discreta su Ω è necessario e sufficiente scegliere • un insieme C = {xn }∞ n=1 , con xn ∈ Ω; • una successione {pn }∞ n=1 tale che pn ≥ 0 e 45 P∞ n=1 pn = 1. 46 CAPITOLO 4. PROBABILITÀ SU R In tal caso risulta definita P su P(Ω) nel seguente modo: X P(A) = pn . n:xn ∈A Ovviamente qualsiasi probabilità definita su un insieme Ω che sia al più numerabile è una probabilità discreta, ma affinché P sia discreta non è necessario che Ω sia al più numerabile né che C sia discreto in Ω in senso topologico, come mostrano gli esempi seguenti. Esempio 12. a. Sia Ω = R, F = P(Ω), C = {0}: la probabilità P = δ0 è discreta e concentrata su C. b. Sia Ω = R, F = P(Ω), C = Q e {xn }∞ n=1 una numerazione di Q: la probabilità P tale −n che P(xn ) = 2 è discreta e concentrata su C. Un altro modo di costruire misure (e dunque in particolare misure di probabilità) è quello di farlo a partire da una misura già nota utilizzando l’integrale di una funzione positiva. Infatti vale il seguente teorema (per la cui dimostrazione si veda Rudin [7]). Teorema 13. Sia (Ω, F , P) uno spazio di misura e sia f : Ω → [0, +∞] una funzione misurabile. Allora la funzione Z ν(E) := f dµ E è una misura su F e per ogni g misurabile, g ∈ L1 (ν), vale Z Z gdν = gf dµ. Ω Ω Si dice che f è la densità di ν rispetto a µ. In particolare se f è tale che la misura ν è di probabilità. R Ω f dµ = 1 allora Osserviamo che se ν è costruita a partire da f e µ come nel Teorema 13, allora se un insieme è trascurabile per µ lo è anche per ν, cioè µ(E) = 0 =⇒ ν(E) = 0. Questa osservazione ci motiva a dare la seguente definizione. Definizione 28. Date due misure ν e µ definite sulla stessa σ–algebra F , si dice che ν è assolutamente continua (brevemente a.c.) rispetto a µ e si indica con ν ≪ µ, se ν(E) = 0 ∀E ∈ F : µ(E) = 0. Dunque abbiamo che se ν è costruita a partire da µ integrando una funzione positiva f , allora necessariamente ν è assolutamente continua rispetto a µ. Ci si potrebbe chiedere se valga anche viceversa, cioè se una misura ν assolutamente continua rispetto a µ si possa 4.2. FUNZIONE DI RIPARTIZIONE DI UNA PROBABILITÀ SU R 47 rappresentare come integrale rispetto a µ di una qualche funzione. La risposta è affermativa ed è data dal teorema di Radon–Nikodym (si vedano gli approfondimenti). Su R abbiamo costruito nel Capitolo 2 una misura molto importante: la misura di Lebesgue λ (il cui integrale è stato definito nel Capitolo 3). Dunque abbiamo un potente strumento per costruire un’infinità di misure di probabilità R su R, semplicemente integrando le funzioni f che siano positive e in L1 (λ) (e dividere per R f dλ per avere misura di Ω pari a 1). Queste misure di probabilità su R sono dette assolutamente continue. Definizione 29. Una probabilità P su (R, L) (dove L è la σ–algebra di Lebesgue) è detta assolutamente continua (rispetto alla misura di Lebesgue) se esiste fP funzione Lebesgue– misurabile non negativa tale che Z P(A) = fP (t)dt, ∀A ∈ L. A La funzione fP è detta densità di P (rispetto a λ). Osservazione 20. Appare chiaro che è impreciso parlare di “la densità di P”, in quanto q.o. qualsiasi g tale che g = fP è densità di P. È più preciso pensare che fra le funzioni misurabili vi sia la relazione di equivalenza “essere uguali q.o.” e che se fP è una densità, essa rappresenta la sua intera classe di equivalenza. Esempio 13. Esempi di densità di misure di probabilità assolutamente continue: a. f (x) = 1 1l (x) b−a [a,b] densità uniforme su [a, b]. b. f (x) = λe−λt 1l[0,+∞)(x) densità esponenziale. c. f (x) = 4.2 − (x−µ) √ 1 2σ 2 e 2 2πσ 2 densità normale. Funzione di ripartizione di una probabilità su R Finora abbiamo visto su R probabilità discrete e assolutamente continue. È naturale chiedersi se vi siano solo probabilità di questo tipo. La risposta, come vedremo, è negativa. Per mostrarlo ci serviremo delle proprietà di alcune funzioni monotone, più precisamente delle funzioni di distribuzione. Definizione 30. Data P probabilità su (R, L), la sua funzione di distribuzione cumulativa (o funzione di ripartizione) è la funzione FP (t) = P((−∞, t]). La funzione di ripartizione identifica P, infatti vale la seguente proposizione. Proposizione 10. Date due probabilità P e P′ , FP ≡ FP′ se e solo se P ≡ P′ . 48 CAPITOLO 4. PROBABILITÀ SU R Esercizio 16. Dimostrare la proposizione (suggerimento: usare il teorema di Dynkin). Il nostro obiettivo è usare le funzioni di ripartizione per definire le probabilità su R. Per fare questo cerchiamo anzitutto di chiarire che proprietà ha una funzione di ripartizione. Proposizione 11. Sia P una probabilità su R e sia F la sua funzione di ripartizione. a. F è monotona non decrescente, dunque esistono i limiti destro e sinistro F (t− ) e F (t+ ) in ogni t ∈ R e vale F (t− ) ≤ F (t) ≤ F (t+ ). b. F è continua a destra in ogni punto t, cioè F (t) = F (t+ ). c. limt→−∞ F (t) = 0, limt→∞ F (t) = 1. Esercizio 17. Dimostrare la proposizione (suggerimento: usare le proprietà delle misure di probabilità). Il fatto importante è che data una qualsiasi funzione con queste proprietà, ad essa è associata in modo univoco una misura di probabilità su R. Teorema 14. Sia F : R → R monotona non decrescente, continua a destra e avente limiti all’infinito, limt→−∞ F (t) = 0, limt→∞ F (t) = 1 (le funzioni siffatte sono dette in generale funzioni di distribuzione). Allora esiste ed è unica la misura di probabilità P su (R, L) tale che FP = F . Dim. L’unicità segue dalla Proposizione 10. Dobbiamo dunque solo costruire P. Basta definire P((−∞, t]) = F (t) dunque P((a, b]) = F (b) − F (a) e per il teorema di estensione esiste ed è unica l’estensione di P alla σ–algebra di Lebesgue di R. Esempio 14. Se P = δs , allora FP (t) = 1l[s,+∞)(t). Se P = U(a, b), allora FP (t) = (t − a)/(b − a)1l(a,b) (t) + 1l[b,+∞)(t). La forma di F serve per indicarci il tipo di probabilità che abbiamo di fronte. Proposizione 12. Sia P una probabilità su (R, L). I seguenti fatti sono equivalenti. a. P è discreta. b. Esistono due successioni reali {ti }i∈N e {pi }i∈N tali che pi ≥ 0 per ogni i, X P(A) = pi . P∞ i=1 pi = 1 e i:ti ∈A c. Esistono due successioni reali {ti }i∈N e {pi }i∈N tali che pi ≥ 0 per ogni i, X pi . FP (t) = i:ti ≤t P∞ i=1 pi = 1 e 4.3. PROBABILITÀ SINGOLARI E TEOREMA DI RAPPRESENTAZIONE 49 Proposizione 13. Sia P una probabilità su (R, L). I seguenti fatti sono equivalenti. a. P è assolutamente continua. R b. esiste f ≥ 0 con R f (x)dx = 1 tale che FP (t) = Z t f (x)dx. −∞ Osservazione 21. Una probabilità assolutamente continua può avere densità non continua (si veda ad esempio la uniforme su un intervallo), ma per la proposizione precedente ha sempre funzione di distribuzione assolutamente continua (per maggiori dettagli si vedano gli approfondimenti). Non esistono solo probabilità discrete e probabilità assolutamente continue, come mostra il seguente esercizio. Esercizio 18. Mostrare che la seguente F dà luogo ad una probabilità che non è né discreta né continua ma è combinazione lineare di una probabilità discreta e di una continua: t<0 0 −λt F (t) = 1 − e 0≤t<s 1 t≥s 4.3 Probabilità singolari e teorema di rappresentazione Oltre alle probabilità discrete, assolutamente continue e alle loro combinazioni esiste un’altra classificazione per le probabilità su R: la distinzione fra probabilità singolari e non. Per definirle ci serviamo della funzione di distribuzione, nel senso che la definizione fa una precisa richiesta su FP . Definizione 31. Una probabilità su R si dice singolare se esiste A ∈ L tale che λ(A) = 0 e per ogni t 6∈ A esiste la derivata FP′ (t) ed è uguale a zero. Esempio 15. Le probabilità discrete sono singolari (infatti la loro funzione di distribuzione è “a gradini” con al più un’infinità numerabile di salti). Esistono anche probabilità singolari la cui funzione di distribuzione è continua (ma non può essere assolutamente continua, per le motivazioni si vedano gli approfondimenti). Esempio 16. La distribuzione di Cantor (o scala di Vitali–Cantor ) è definita passo passo (esattamente come l’insieme di Cantor). Sull’intervallo [1/3, 2/3], che è il primo che viene tolto nella costruzione di Cantor, F vale 1/2. Al secondo passo vengono tolti 3 intervalli: [1/9, 2/9], [1/3, 2/3] e [7/9, 8/9]. F vale 1/4 e 3/4 rispettivamente sui due “nuovi” intervalli. Per dare una definizione rigorosa osserviamo che al passo n vengono tolti (nella costruzione 50 CAPITOLO 4. PROBABILITÀ SU R di Cantor) 2n − 1 intervalli (ogni volta si ricontano gli intervalli già tolti in precedenza) e ne restano 2n di ampiezza 3−n . Numeriamo i 2n − 1 intervalli rimossi e chiamiamoli In,k , k = 1, . . . , 2n − 1 rispettivamente. Definiamo sul complementare dell’insieme di Cantor C Fe : C c → [0, 1], Fe(t) = k/2n se t ∈ In,k . Si dimostra che Fe è ben definita (infatti se 2k = 2kn ). Inoltre Fe è monotona non decrescente e t ∈ In,k , allora è anche t ∈ In+1,2k e 2n+1 uniformemente continua. Poniamo Fe(0) = 0 e Fe(1) = 1 e estendiamola a F definita su tutto [0, 1]. Tale F risulta essere una funzione di distribuzione (dunque vi è associata una probabilità), ed è anche uniformemente continua, ma per definizione la sua derivata è nulla su C c . Con i tre tipi di probabilità: discrete, assolutamente continue e singolari con F continua, esauriamo finalmente tutte le probabilità su R, nel senso che viene precisato dal seguente teorema (per la cui dimostrazione rimandiamo al [4]). Teorema 15 (di rappresentazione di Lebesgue). Ogni probabilità su (R, L) ha un’unica rappresentazione P = αd Pd + αa Pa + αs Ps dove αd , αa , αs ≥ 0, αd + αa + αs = 1, Pd è una probabilità discreta, Pa è una probabilità assolutamente continua e Ps è una probabilità singolare con funzione di distribuzione continua. 4.4 Integrale di Lebesgue-Stieltjes Gli integrali rispetto alle misure su R (e dunque in particolare rispetto alle misure di probabilità su R) possono essere calcolati tramite l’uso della funzione di distribuzione della probabilità, e in tal caso vengono anche detti integrali di Lebesgue–Stieltjes in analogia agli integrali di Stieltjes che si definiscono come generalizzazione dell’integrale di Riemann (si vedano gli approfondimenti). Definizione 32. Data una funzione di distribuzione F , la probabilità PF ad essa associata, e f ∈ L1 (PF ), si dice che f è integrabile rispetto ad F e si definisce integrale di Lebesgue-Stieltjes di f (rispetto ad F ), l’integrale Z Z f (x)dF (x) := f (x)dµF R R Nei casi in cui µF è discreta oppure assolutamente continua il calcolo dell’integrale si riduce al calcolo di una serie oppure di un integrale rispetto alla misura di Lebesgue. P Proposizione 14. Se ad F è associata una probabilità discreta, ovvero F (t) = i:ti ≤t pi , P∞ allora g : R → R è integrabile rispetto ad F se e solo se i=1 |g(ti)|pi < ∞ e in tal caso Z ∞ X g(x)dF (x) = g(ti)pi . R i=1 51 4.5. APPROFONDIMENTI Proposizione 15. Se ad F è associata una probabilità assolutamente continua, ovvero Rt R F (t) = −∞ f (x)dx, allora g : R → R è integrabile rispetto ad F se e solo se R |g(x)|f (x)dx < ∞ e in tal caso Z Z g(x)dF (x) = g(x)f (x)dx. R 4.5 R Approfondimenti 4.5.1 Teorema di rappresentazione di Riesz 4.5.2 Teorema di Radon-Nikodym 4.5.3 Funzioni assolutamente continue 4.5.4 Integrali di Stieltjes 52 CAPITOLO 4. PROBABILITÀ SU R Capitolo 5 Misura e integrazione in spazi prodotto In questo capitolo trattiamo la costruzione, dati due spazi di misura, dello spazio di misura prodotto dei due. Ovviamente la costruzione si applica poi per induzione alla creazione dello spazio di misura prodotto di qualsiasi n–pla di spazi di misura. L’integrazione serve in particolare per il calcolo di probabilità relativo a vettori aleatori (che sono funzioni misurabili definiti sul prodotto di spazi di probabilità). 5.1 Prodotto cartesiano e rettangoli Definizione 33. Se X e Y sono due insiemi. Il prodotto cartesiano X × Y è l’insieme di tutte le coppie ordinate (x, y) dove x ∈ X e y ∈ Y . Definizione 34. Se S ⊂ X e T ⊂ Y , chiameremo rettangolo l’insieme E = S ×T ⊂ X ×Y e chiameremo lati le sue componenti S e T . Osservazione 22. Ovviamente il concetto di rettangolo qui introdotto è una generalizzazione del concetto classico di rettangolo nel piano e coincide con quest’ultimo nel caso in cui S e T sono intervalli di R. Puntualizziamo ora nella proposizione seguente alcune proprietà dei rettangoli, la cui facile dimostrazione è lasciata per esercizio. Proposizione 16. a. Un rettangolo è vuoto se e solo se è vuoto almeno uno dei suoi lati. b. Siano E1 = S1 × T1 e E2 = S2 × T2 due rettangoli non vuoti. Allora E1 ⊂ E2 se e solo se S1 ⊂ S2 ∧ T1 ⊂ T2 . c. Siano E1 = S1 × T1 e E2 = S2 × T2 due rettangoli non vuoti. Allora E1 = E2 se e solo se S1 = S2 ∧ T1 = T2 . 53 54 CAPITOLO 5. MISURA E INTEGRAZIONE IN SPAZI PRODOTTO d. Siano E = S × T , E1 = S1 × T1 e E2 = S2 × T2 tre rettangoli non vuoti. Condizione necessaria e sufficiente affinché E sia unione disgiunta di E1 e E2 è che, alternativamente, S sia unione disgiunta di S1 e S2 con T = T1 = T2 oppure che T sia unione disgiunta di T1 e T2 con S = S1 = S2 . Supponiamo ora di avere due spazi misurabili (X, S) e (Y, T ) (ovvero S e T sono σ-algebre rispettivamente in X e in Y ). Vogliamo definire la σ-algebra prodotto. Definizione 35. Un rettangolo S × T appartenente al prodotto cartesiano di due spazi misurabili (X, S) e (Y, T ) è detto rettangolo misurabile se S ∈ S e T ∈ T . Chiamiamo insiemi elementari le unioni finite disgiunte di rettangoli misurabili. Si potrebbe mostrare che la famiglia degli insiemi elementari è un’algebra. Per costruire uno spazio di misura ci serve una σ–algebra: non facciamo altro che prendere quella generata dai rettangoli misurabili (o equivalentemente, dagli insiemi elementari). Definizione 36. La σ–algebra in X × Y generata dalla famiglia dei rettangoli misurabili è detta σ-algebra prodotto e la denotiamo con S ⊗ T . Esempio 17. Sia X = Y = R. Nel capitolo in cui abbiamo costruito, data una misura µ definita su un’algebra F0 , la misura che estende µ al completamento della σ–algebra generata da F0 , abbiamo visto una misura definita su R2 : la misura di Lebesgue definita sulla σ–algebra di Lebesgue L2 e dunque in particolare anche su B2 che vi è contenuta. La σ–algebra di Borel B2 era definita (fra l’altro) come generata dai rettangoli “veri” cioè aventi come basi degli intervalli. Abbiamo appena dato il modo di costruire un’altra (apparentemente!) σ–algebra su R2 : B1 ⊗ B1 . Allora un rettangolo misurabile è il prodotto cartesiano S × T in cui S e T sono boreliani di dimensione 1 (e non semplici intervalli). Il fatto interessante da notare è che B1 ⊗ B1 ≡ B2 . Infatti poiché B2 è generata da una famiglia (i rettangoli con lati gli intervalli) che è una sottofamiglia di quella (i rettangoli con lati boreliani) che genera B1 ⊗ B1 , B2 ⊂ B1 × B1 . D’altro canto se S è un intervallo allora la famiglia dei T tali che S × T ∈ B2 coincide con S 1 B . Infatti contiene R (S × R = n S × (−n, n] ∈ B2 ), è chiusa rispetto alla differenza e all’unione numerabile dunque è una σ-algebra che contiene gli intervalli e quindi è B1 . Allo stesso modo se T ∈ B1 , la famiglia degli S tali che S × T ∈ B2 è B1 (contiene gli intervalli...). Perciò tutti i rettangoli misurabili stanno in B2 e quindi B1 × B1 R ≡ B2 . 5.2 Sezioni Siano (X, S) e (Y, T ) spazi misurabili e (X × Y, S ⊗ T ) il loro prodotto cartesiano. Siano, inoltre, E un qualsiasi sottoinsieme di X × Y e x ∈ X e y ∈ Y due punti qualsiasi. 55 5.2. SEZIONI Definizione 37. Chiameremo sezione (o proiezione) di E rispetto a x (sinteticamente X-sezione se non serve porre l’accento sul particolare punto x che la determina) l’insieme: Ex = {y : (x, y) ∈ E}. Analogamente, chiameremo sezione (o proiezione) di E rispetto a y (Y -sezione) l’insieme: E y = {x : (x, y) ∈ E}. Y Y E Ex E y x E X y X Esempi di sezione Osservazione 23. Non è superfluo sottolineare, come evidenziato dagli esempi in figura, che una sezione non è un insieme del prodotto cartesiano ma un sottoinsieme di una delle sue componenti. Teorema 16. Ogni sezione di un insieme misurabile (nel prodotto) è misurabile (in X o in Y ). Dim. Sia A la classe degli insiemi E in S ⊗ T tali che Ex ∈ T per ogni x ∈ X. Se E = A × B allora Ex = B se x ∈ A ed è il vuoto altrimenti. Dunque A contiene i rettangoli misurabili. Inoltre è facile mostrare che A contiene X × Y , è chiusa rispetto alla formazione di complementari e di unioni numerabili disgiunte. Dunque A è una σ–algebra e coincide con S ⊗ T . Definiamo ora le sezioni delle funzioni definite su X × Y . Definizione 38. Data f funzione definita su X × Y e dati x ∈ X, y ∈ Y . Chiameremo la funzione fx definita sulla sezione Ex da fx (y) = f (x, y) sezione di f rispetto a x (o negli stessi modi alternativi visti per gli insiemi). Analogamente chiameremo la funzione f y definita sulla sezione E x da f y (x) = f (x, y) sezione di f rispetto a y. Esempio 18. Se 1l(x, y) = 1lE (x, y) è la funzione indicatrice del sottoinsieme E del prodotto cartesiano X × Y allora le sezioni 1lx (y) e 1ly (x) saranno, rispettivamente, le funzioni indicatrici di Ex e E y . Ovvero: 1lx (y) = 1lEx (y), 1ly (x) = 1lE y (x). 56 CAPITOLO 5. MISURA E INTEGRAZIONE IN SPAZI PRODOTTO In particolare, se E = A × B è un rettangolo allora: 1lE (x, y) = 1lA (x)1lB (y). Teorema 17. Sia f funzione S ⊗ T -misurabile. Allora per ogni x ∈ X, fx è T -misurabile e per ogni y ∈ Y , f y è S-misurabile. Dim. Dato un intervallo reale I, sia Q = f −1 (I). Per ipotesi Q ∈ S ⊗ T . Inoltre Qx = fx−1 (I). Per il teorema precedente, Qx ∈ T da cui la tesi per fx (per mostrare che fx−1 (B) ∈ T per ogni B ∈ B1 basta mostrare che fx−1 (I) per ogni intervallo I). La dimostrazione per f y è analoga. 5.3 Misura prodotto Ora estendiamo le nostre osservazioni al prodotto cartesiano in cui le componenti non sono più solo spazi misurabili ma sono spazi di misura. Si abbiano dunque (X, S, µ) e (Y, T , ν) spazi di misura σ–finiti. Osserviamo che l’ipotesi di σ–finitezza è fondamentale qui e nel seguito. Definiamo una misura sull’algebra degli insiemi elementari: ! n n [ X µ⊗ν Ai × Bi := µ(Ai )ν(Bi ). i=1 i=1 Lemma 10. µ ⊗ ν è una misura σ–finita sull’algebra degli insiemi elementari. La dimostrazione del lemma è simile a quanto visto in R e viene lasciata per esercizio al lettore. Come conseguenza si ha il seguente teorema che definisce la misura prodotto su S ⊗T. Teorema 18. Esiste ed è unica la misura λ, definita sulla σ–algebra che completa S ⊗ T , che coincide con µ ⊗ ν sugli insiemi elementari. Indichiamo anche λ con µ ⊗ ν. Dim. Segue dal lemma precedente e dal teorema di estensione ed unicità. 5.4 Integrale prodotto e integrali iterati In questa sezione investigheremo sulle relazioni che intercorrono tra gli integrali negli spazi prodotto e gli integrali negli spazi componenti. Nel prosieguo della sezione considereremo (X, S, µ) e (Y, T , ν) spazi di misura σ-finita e denoteremo con λ la misura prodotto. 57 5.4. INTEGRALE PRODOTTO E INTEGRALI ITERATI Definizione 39. Sia h una funzione definita su X × Y , tale che h ∈ L1 (λ). Allora il suo integrale è definito è denotato da: Z h(x, y)dλ(x, y). X×Y Tale integrale viene chiamato integrale doppio di h. Contemporaneamente si possono considerare (se esistono) gli integrali delle sezioni: Z Z hx (y)dν(y), e hy (x)dµ(x). Y Y Se questi integrali sono, come funzioni di x e di y rispettivamente, integrabili, allora si hanno gli integrali iterati. R Definizione 40. Se h è tale che esisatno la funzione f (x) = h (y)dν(y) e il suo x Y x R integrale X f (x)dµ(x) allora potremo scrivere Z Z Z f (x)dµ(x) = dµ(x) h(x, y)dν(y) (5.1) X X Y Equivalentemente, se hy è tale che esistano la funzione g(y) = R integrale Y g(y)dν(y), allora potremo scrivere Z Z Z g(y)dν(y) = dν(y) h(x, y)dµ(x). Y Y R X hy (x)dµ(x) e il suo (5.2) X Gli integrali 5.1 e 5.2 vengono chiamati integrali iterati. Abbiamo cosı̀ tre integrali di h : X × Y → R: quello doppio e i due iterati (uno integrando prima su X e poi su Y e l’altro viceversa). Una domanda sorge spontanea: i tre coincidono? L’esistenza di uno garantisce quella degli altri? Sotto certe condizioni si può rispondere affermativamente. Cominciamo col considerare un caso facile: se E = A×B è un rettangolo misurabile e h = 1lE allora l’integrale doppio è Z 1lE (x, y)dλ(x, y) = µ(A)ν(B), X×Y quelli iterati sono (ricordando che (1lE )x = 1lEx e (1lE )y = 1lE y ): Z Z Z Z dµ(x) 1lB (y)dν(y) dµ(x) 1lEx (y)dν(y) = A Y Y X Z ν(B)dµ(x) = µ(A)ν(B), = A che coincide con l’integrale prodotto. Allo stesso modo si ottiene che anche l’altro integrale iterato coincide con l’integrale prodotto. Dunque le indicatrici dei rettangoli misurabili sono funzioni che hanno la proprietà che gli integrali iterati e il prodotto coincidono. Il seguente teorema afferma che lo stesso vale per le funzioni indicatrici di elementi di S ⊗ T . 58 CAPITOLO 5. MISURA E INTEGRAZIONE IN SPAZI PRODOTTO Teorema 19. Siano (X, S, µ) e (Y, T , ν) due spazi di misura σ-finiti, sia E ∈ S ⊗ T e si indichi con λ la misura prodotto µ ⊗ ν. Allora Z Z Z Z Z (5.3) dν(y) 1lE y (x)dµ(x). 1lE (x, y)dλ = dµ(x) 1lEx (y)dν(y) = X×Y X Y Y X In altre parole l’integrale doppio e gli iterati coincidono. Dim. Sia A la famiglia degli insiemi E ⊂ X × Y per cui vale 5.3. Sappiamo già che A contiene i rettangoli misurabili (e dunque anche X × Y ): basterà mostrare che è una classe monotona e per il teorema della classe monotona (si vedano gli approfondimenti del Capitolo 2) per avere la tesi. Per i dettagli si veda il Teorema 8.6 del libro di Rudin [7]. Esempio 19. Il precedente teorema cade se viene a mancare l’ipotesi di σ-finitezza. Mostriamolo con un controesempio: siano X = Y = [0, 1] e S = T = B([0, 1]). Inoltre prendiamo come µ la misura di Lebesgue e come ν la misura del conteggio (ovviamente ν non è ‘sigma–finita). Infine, sia E = {(x, y) : x = y}. Evidentemente Z Z +∞ = ν(Ex )dν(x) 6= µ(E y )dµ(y) = 0. X Y Teorema 20 (di Fubini). Sia (X × Y, S ⊗ T , µ ⊗ ν) uno spazio di misura prodotto con le misure µ e ν σ–finite. Sia h : X × Y → R misurabile e tale che h ∈ L1 (µ ⊗ ν). Allora le sezioni hx e hy sono misurabili (T -misurabili e S-misurabili rispettivamente) per R µ-quasiRogni x ∈ X e ν-quasi ogni y ∈ Y . Inoltre le funzioni f (x) = Y hx (y)dν(y) e g(y) = X hy (x)dµ(x) sono rispettivamente L1 (µ) e L1 (ν) e Z Z Z h(x, y)dµ ⊗ ν(x, y) = f (x)dµ(x) = g(y)dν(y), X×Y X Y ovvero integrale doppio e iterati coincidono. Dim. Teorema 21 (di Tonelli). Sia (X × Y, S ⊗ T , µ ⊗ ν) uno spazio di misura prodotto con le misure µ e ν σ–finite. Sia h : X × Y → R misurabile e non negativa. Allora le funzioni f e g definite nel teorema di Fubini sono misurabili (S-misurabile e T -misurabile rispettivamente), h ∈ L1 (µ ⊗ ν) e integrale doppio e iterati coincidono. Dim. Osservazione 24. La reale difficoltà consiste nel verificare l’integrabilità di h ovvero nel capire se h ∈ L1 (λ) Esempio 20. Sia Dr il disco chiuso in R2 avente raggio r e centro nell’origine. La sua misura ZZ ZZ ρdρdθ dxdy = λ(Dr ) = Dr Dr 5.4. INTEGRALE PRODOTTO E INTEGRALI ITERATI 59 conduce al calcolo di un integrale doppio in coordinate polari che può essere svolto grazie al teorema di Fubini: Z r Z 2π Z r ZZ ρdρdθ = ρdρ dθ = 2π ρdρ = πr 2 0 Dr Esempio 21. Sia I = R∞ −∞ 0 0 2 e−x dx, Applicando Fubini in R2 ricaviamo: ZZ 2 2 2 I = e−(x +y ) dxdy R2 che in coordinate polari assume la forma: Z ∞Z 2 I = 0 2π 2 e−ρ ρdρdθ = π 0 dove, per il calcolo, abbiamo applicato nuovamente Fubini. Ciò conduce all’importante formula: Z √ 2 e−x dx = π R 60 CAPITOLO 5. MISURA E INTEGRAZIONE IN SPAZI PRODOTTO Bibliografia [1] P. Billingsley, Probability and measure. Third edition. Wiley Series in Probability and Mathematical Statistics. John Wiley & Sons, Inc., New York, 1995. [2] H. Brezis, Analisi funzionale, Liguori Editore, 1986 (consultare per l’Appendice sull’Integrazione Astratta a cura di C. Sbordone). [3] B. de Finetti, Teoria delle probabilità: sintesi introduttiva con appendice critica. Volumi primo e secondo. Nuova Biblioteca Scientifica Einaudi, Giulio Einaudi Editore, Torino, 1970. [4] A.N. Kolmogorov, S.V. Fomin, Elementi di teoria delle funzioni e di analisi funzionale, Edizioni Mir, 1980. [5] D. Pollard, A user’s guide to measure theoretic probability. Cambridge Series in Statistical and Probabilistic Mathematics. Cambridge University Press, Cambridge, 2002 [6] H.L. Royden, Real analysis. Third edition. Macmillan Publishing Company, New York, 1988. [7] W. Rudin, Real and complex analysis . Third edition. McGraw-Hill Book Co., New York, 1987. 61