Applicazioni delle serie e degli integrali al calcolo delle probabilità

Applicazioni delle serie e degli integrali generalizzati
al calcolo delle probabilità
Marco Bramanti
Gennaio 2012
Questi appunti, scritti per il corso di Analisi Matematica 1, esulano in realtà dal programma
del corso e sono pensati soltanto per dare, allo studente interessato, un'idea di alcuni utilizzi
che hanno nel Calcolo delle Probabilità certi concetti studiati in Analisi, precisamente le serie
e gli integrali (in particolare, integrali generalizzati e funzioni integrali). La presentazione è
informale: ci riferiremo ad alcune nozioni di base del calcolo delle probabilità in modo
abbastanza intuitivo. Per approfondimenti, si rimanda ad esempio al testo: M. Bramanti,
Calcolo delle Probabilità e Statistica. Ed. Esculapio, Bologna, 1997.
Serie numeriche e variabili casuali discrete
Discuteremo i concetti che ci interessano seguendo un esempio guida significativo.
Esempio. Si lancia una moneta tante volte, finché esce "testa". Sia \ il numero a"ß #ß $ß á b
che indica il lancio a cui esce testa per la prima volta. Si dice che \ è una variabile casuale,
che può assumere i valori "ß #ß $ß ÞÞÞß in dipendenza dall'esito dell'esperimento casuale del
lancio ripetuto della moneta. Vogliamo calcolare la probabilità con cui \ assume ciascun
valore intero, cioè
T a\ œ "bß T a\ œ #bß á
(che si legge "probabilità che \ valga "", "probabilità che \ valga #", ecc.). In ogni singolo
lancio la probabilità che esca "testa" è "Î#; ma poiché l'esempio della moneta per noi è solo il
pretesto per trattare un generico esperimento con solo due esiti possibili1, supponiamo più in
generale che la nostra "moneta" dia "testa" con probabilità :, un certo numero fissato in
a!ß "b, e "croce" con probabilità "  :Þ Chiediamoci quindi quanto vale
T a\ œ 5b.
Dire che \ œ 5 significa che per i primi 5  " lanci è sempre uscito "croce", e al 5-esimo
è uscito "testa", quindi si è realizzata una sequenza di 5 "eventi elementari" di probabilità,
rispettivamente,
a "  : b ß a"  : bß á ß a"  : bß :
e la probabilità della sequenza in questione è (poiché per l'indipendenza dei lanci si
moltiplicano semplicemente le probabilità),
T a\ œ 5b œ a"  :b5" :Þ
1 Per esempio, l'esperimento potrebbe essere: "Lancio un dado; vinco se faccio 6, perdo altrimenti". In
questo caso la probabilità di successo è : œ "Î', la probabilità di insuccesso è "  : œ &Î'Þ
1
M. Bramanti. Applicazioni delle serie e degli integrali al calcolo delle probabilità. Gennaio 2012.
_________________________________________________________________________________
Quindi, ad esempio, la probabilità che esca testa per la prima volta dopo non più di 10
lanci è
T a\ Ÿ "!b œ "a"  :b5" :Þ
"!
5œ"
Qual è invece la probabilità che "prima o poi" esca testa? Questo equivale a chiedersi
quanto vale
"T a\ œ 5b œ "a"  :b5" : œ :"a"  :b5" œ :"a"  :b5 œ
_
_
_
_
5œ"
5œ"
5œ"
5œ!
serie geometrica di ragione a"  :b, convergente
œ:†
"
"
œ : † œ "Þ
"  a"  : b
:
Questo significa che con probabilità " prima o poi esce testa. E anche: l'eventualità che,
lanciando la moneta più e più volte esca sempre croce, per quanto logicamente possibile, ha
probabilità nulla.
Estraiamo da questo esempio qualche osservazione generale. Per ogni "variabile aleatoria"
che può assumere valori interi positivi "ß #ß $ß ÞÞÞ si può definire la successione di valori
:5 œ T a\ œ 5bà
risulta:
! Ÿ :5 Ÿ " per ogni 5, e
":5 œ ".
_
5œ"
Una variabile casuale per cui si ha
:5 œ :a"  :b5"
si dice che segue la legge geometrica di parametro : − a!ß "b.
Tornando all'esempio specifico del lancio della moneta, chiediamoci ora: quanti lanci
dovremo fare, in media, prima che esca "testa" per la prima volta? Con linguaggio
probabilistico, vogliamo calcolare il valore atteso della variabile \ sopra definita, indicato
con I\ . Questo numero è una sorta di media pesata dei possibili valori di \ . Precisamente
si ha, per definizione:
I\ œ "5 † T a\ œ 5b,
_
5œ"
e questa formula vale per qualsiasi variabile casuale a valori interi positivi. Nel nostro caso si
avrà:
2
M. Bramanti. Applicazioni delle serie e degli integrali al calcolo delle probabilità. Gennaio 2012.
_________________________________________________________________________________
I\ œ "5:a"  :b5" œ :"5a"  :b5" .
_
_
5œ"
5œ"
Per calcolare questa serie, consideriamo, per > − a!ß "b, la serie
. 5
ˆ> ‰
.>
5œ"
"5>5" œ "
_
_
5œ"
Si può dimostrare2 che la serie delle derivate delle potenze è uguale alla derivata della serie,
ossia
. 5
. _
.
"
"
ˆ> ‰ œ ">5 œ Œ
œ
#,
.>
.>
.>
"

>
a
"

>
b
5œ"
5œ"
"
_
perciò applicando la formula per > œ "  :
I\ œ : †
"
a"  a"  : bb
#
œ:†
"
"
œ
Þ
:#
:
La conclusione è che il numero atteso di lanci da fare per ottenere "testa", nell'ipotesi che
in un singolo lancio esca testa con probabilità :, è "Î:. Questo vale in generale per qualsiasi
sequenza di prove ripetute, identiche e indipendenti tra loro, in cui la probabilità di successo
in una singola prova sia :. In particolare, più è improbabile che in una singola prova si
ottenga successo (quindi più piccolo è :), più lungo sarà il tempo medio di attesa (o meglio il
numero atteso di tentativi) per ottenere successo (più grande è "Î:). Ad esempio, se
l'esperimento è "Lancio un dado; vinco se faccio ', perdo altrimenti", sarà : œ "Î' e
I\ œ "Î: œ ', ossia: in media si dovrà lanciare il dado ' volte per ottenere un '.
Integrali e variabili casuali continue
Passiamo ora dalle variabili discrete alle variabili continue, e con ciò dalle serie numeriche
agli integrali (e integrali generalizzati).
Utilizziamo ancora un esempio specifico per introdurre un concetto più generale.
Esempio. Consideriamo un gruppo numeroso e omogeneo di persone (ad esempio: tutti gli
abitanti di Milano maschi nella fascia di età dai 30 ai 40 anni) e sia \ la statura di una
persona scelta a caso in questa popolazione. Anche questa \ è una "variabile casuale" (data
la scelta casuale della persona che viene esaminata), che può assumere valori reali (in un certo
2
Basta ragionare sulla successione delle somme parziali: per k>k " è:
" >5 œ
8
5œ!
"5>5" œ
8
5œ"
"  >8€"
, quindi (la somma finita si può derivare termine a termine)
">
8
.
. "  >8€"
a8 € "b>8 a"  >b € a"  >8€" b
"
"
>5  œ Œ
Ä
œ
Ž
#
.> 5œ!
.>
">
a"  >b
a"  >b#
per 8 Ä €_, perciò per definizione di serie convergente
"5>5" œ
_
5œ"
3
"
Þ
a"  >b#
M. Bramanti. Applicazioni delle serie e degli integrali al calcolo delle probabilità. Gennaio 2012.
_________________________________________________________________________________
intervallo ragionevole). In questo caso ha poco significato chiedersi qual è la probabilità che
una persona scelta a caso abbia esattamente una certa statura (espressa in centimetri,
millimetri, decimi di millimetri...), mentre è più sensato chiedersi qual è la probabilità che \
assuma valori in un certo intervallo: ci chiediamo cioè quanto vale
T a+ \ ,b.
Ad esempio, potremmo chiederci quanto vale T a"'!cm \ "(!cmb.
Si dice che \ è una variabile casuale continua per indicare che esprime una misura (che
può assumere qualsiasi valore reale in un dato intervallo). Per contro, la variabile casuale
dell'esempio precedente (lancio della moneta) è una variabile casuale discreta, ed esprime un
conteggio (assume valori interi positivi). Nel caso continuo per calcolare la probabilità di un
evento legato alla variabile casuale non utilizziamo una serie (come nel caso discreto) ma un
integrale, e anziché assegnare la successione e:5 f_
5œ" come nel caso discreto dovremo
assegnare una funzione 0 a>b, detta densità di probabilità.
Se 0\ a>b è la densità di probabilità della variabile casuale continua \ si ha per
definizione
T a+ \ ,b œ ( 0\ a>b.>Þ
,
+
Nell'esempio della statura, un modello realistico per la densità 0\ è quello Gaussiano:
0\ a>b œ
È#15
"
/
a>.b#
#5 #
a‡b
dove . − ‘ e 5 ā ! sono opportune costanti (che hanno la stessa dimensione fisica di \ , nel
nostro esempio sono espresse in centimetri). Si tratta della famosa "curva a campana", dal
caratteristico grafico "centrato" attorno al valore B œ . e che risulta tanto più "appuntito e
concentrato" quanto più piccolo è 5, tanto più "smussato e lentamente decrescente" quanto
più grande è 5 (nel grafico seguente, le curve sono Gaussiane per . œ & e 5 œ "# ß "ß #ß
rispettivamente).
0.7
0.6
0.5
0.4
0.3
0.2
0.1
2
4
6
8
10
Una variabile casuale continua avente densità a‡b si dice seguire legge normale R a.ß 5# b
di media . e varianza 5 # . Se in particolare . œ ! e 5 œ " (quindi la densità è semplicemente
#
/> Î# /È#1) la legge si dice normale standard R a!ß "b. Ritorneremo più avanti sul
significato dei parametri . e 5# . Si tratta della più importante legge di variabile casuale
continua, coinvolta in numerosissime questioni di probabilità, statistica e scienze.
4
M. Bramanti. Applicazioni delle serie e degli integrali al calcolo delle probabilità. Gennaio 2012.
_________________________________________________________________________________
Per il significato di probabilità deve risultare (per qualsiasi variabile continua):
0\ a>b € !ß (
€_
_
0\ a>b.> œ "
dove l'integrale scritto è un integrale generalizzato.
Verifichiamo questa proprietà per la densità Gaussiana data dalla a‡b. Si può dimostrare,
anzitutto, (con metodi di calcolo integrale in due variabili, che si studiano in Analisi 2) che
(
€_
_
/> Î# .> œ È#1Þ
#
Da questo fatto segue subito
(
€_
_
a‡‡b
" ># Î#
/
.> œ "
È #1
e quindi
(
per la a‡‡b.
€_
_
œ(
È#15
"
€_
_
/
È#15
"
a>.b#
#5 #
.> œ c> œ . € 5?à .> œ 5.?d
# #
/
 5#5?#
5.? œ (
€_
_
"  ?#
/ # .? œ "
È#1
Per una variabile casuale continua si definisce anche la funzione di ripartizione
J\ aBb œ T a\ Ÿ Bb œ (
B
_
0\ a>b.>Þ
Come si vede si tratta di una funzione integrale, definita da un integrale generalizzato.
Nel caso della Gaussiana si ha
J\ aBb œ (
B
_ È#15
"
/
a>.b#
#5 #
.>ß
funzione integrale che ha il caratteristico grafico "a esse", con asintoti orizzontali
C œ !ß C œ ":
1
0.8
0.6
0.4
0.2
-10
-5
5
5
10
M. Bramanti. Applicazioni delle serie e degli integrali al calcolo delle probabilità. Gennaio 2012.
_________________________________________________________________________________
La funzione J\ serve a calcolare le probabilità T a+ \ ,b per qualsiasi +ß , − ‘,
infatti risulta
T a+ \ ,b œ J\ a,b  J\ a+bÞ
Si tratta quindi di un oggetto matematico fondamentale nel calcolo delle probabilità. D'altro
canto sappiamo che la funzione Gaussiana

"
È#15 /
a>.b#
#5 #
ha una primitiva non esprimibile
elementarmente, quindi la sua funzione integrale J\ non può essere calcolata esplicitamente
in modo esatto. Può naturalmente essere calcolata, con grande accuratezza, con procedimenti
di calcolo numerico dell'integrale, facilmente realizzati da un software scientifico (oltre a
trovarsi tabulata in tavole numeriche). Ci interessa con ciò osservare che le funzioni integrali
(definite da integrali generalizzati) giocano un ruolo insostituibile nello studio probabilistico
della variabili continue.
Facciamo un altro passo avanti e discutiamo il concetto di valore atteso di una variabile
casuale continua. Si definisce:
I\ œ (
€_
_
>0\ a>b.>
(integrale generalizzato).
Calcoliamo I\ per la Gaussiana di densità a‡b. Si ha:
I\ œ (
œ(
€_
_
a. € 5?b
€_
>
_
È#15
"
/
a>.b#
#5 #
.> œ c> œ . € 5?à .> œ 5.?d
€_
€_
"  ?#
"  ?#
"  ?#
/ # .? œ .(
/ # .? € 5(
?
/ # .? œ
È #1
È#1
_ È#1
_
œ . † " € 5 † ! œ .ß
in quanto il primo integrale scritto vale " per a‡‡b, mentre il secondo è un integrale
generalizzato convergente, e vale zero perché l'integranda è dispari e l'intervallo di
integrazione è simmetrico.
Questo è il motivo per cui . si dice media della variabile casuale Gaussiana: ha proprio il
significato di valore atteso. Quanto al significato di 5, per spiegarlo occorre definire la
varianza di una variabile casuale, data da
Vara\ b œ I Ša\  I\ b# ‹ œ asi dimostrab œ I ˆ\ # ‰  aI\ b# .
Questo numero, positivo, è un indice di quanto la variabile sia "dispersa" rispetto al suo
valore atteso I\ .
Per la variabile Gaussiana di densità a‡b si ha quindi
Vara\ b œ I ˆ\ # ‰  .# ,
e per completare il calcolo della varianza occorre valutare I a\ # b che, per una qualsiasi
variabile continua, si calcola così:
6
M. Bramanti. Applicazioni delle serie e degli integrali al calcolo delle probabilità. Gennaio 2012.
_________________________________________________________________________________
I ˆ\ # ‰ œ (
€_
_
># 0\ a>b.> œ
(per la nostra Gaussiana)
œ(
€_
>#
_
È#15
"
œ(
œ .# (
€_
_
/
€_
_
a>.b#
#5 #
.> œ c> œ . € 5?à .> œ 5.?d
a. € 5?b#
"  ?#
/ # .? œ
È #1
€_
€_
"  ?#
"  ?#
"  ?#
/ # .? € #5.(
/ # .? € 5# (
/ # .? œ
?
?#
È #1
È#1
È#1
_
_
per quanto già osservato nel calcolo di I\ , e integrando per parti il terzo integrale
œ . † " € #5. † ! € 5 (
#
€_
#
_
Ú
w
"  ?#
?Ž
/ #  .? œ
È #1
Þ
€_
€_
?#
?#
"
"
œ .# € 5# Û–?
/ # —
€(
/ # .?ß œ .# € 5# e! € "f œ .# € 5# ß
È #1
È
#1
_
Ü
à
_
da cui
Vara\ b œ I ˆ\ # ‰  .# œ 5# ß
ed ecco perché la legge R a.ß 5# b si dice normale di media . e varianza 5# .
Possiamo infine tornare al nostro esempio numerico e chiederci quanto vale la probabilità
che la statura di una persona scelta a caso da una certa popolazione sia compresa
nell'intervallo a"'!cmß "(!cmb. Supponiamo ad esempio che la statura della popolazione in
esame segua la legge Gaussiana di media . œ "(&cm e varianza 5# œ %# cm# . Allora si ha:
T a"'! \ "(!b œ (
œ(
 &%
 "&
%
"(!
"'!
È #1 † %
"
/
a>"(&b#
#†%#
.> œ c> œ "(& € %?à .> œ %.?d
"  ?#
&
"&
/ # .? œ J Œ   J Œ 
È #1
%
%
dove J è la funzione di ripartizione corrispondente alla densità normale standard
#
"
 ?#
È #1 /
,i
cui valori si trovano tabulati sui testi di probabilità o si possono calcolare con software
matematico-statistici (ma anche con Excel3). Si trova
3
Cercare tra le funzioni statistiche quella che ha il nome DISTRIB.NORM.
7
M. Bramanti. Applicazioni delle serie e degli integrali al calcolo delle probabilità. Gennaio 2012.
_________________________________________________________________________________
&
"&
J Œ   J Œ  œ !Þ"!&'&  !Þ!!!!)) ¶ !Þ"ß
%
%
e la probabilità dell'evento che ci interessa è circa del 10%.
8