elementi di calcolo delle probabilita

1
CAPITOLO II
ELEMENTI DI CALCOLO DELLE PROBABILITA'
1. Spazio dei campioni ed eventi
•
Sia eseguito un esperimento (es. il lancio di un dado), si dice spazio dei campioni o spazio
campionario S l'insieme di tutti i possibili esiti (risultati) di quell'esperimento. Nel caso del lancio di un
dado lo spazio dei campioni è S = {1,2,3,4,5,6} . Possiamo darne una rappresentazione grafica con un
diagramma di Venn
•
Si dice evento un sottoinsieme dello spazio dei campioni.
1 2 3 4
Esempio il sottoinsieme {4,5} è un evento.
5 6
• Un evento si dice elementare se è un sottoinsieme dello spazio dei
campioni formato da un solo elemento. Lo spazio dei campioni è quindi l'insieme degli eventi
elementari.
• L'evento certo coincide con S
• L'evento impossibile è il sottoinsieme vuoto ∅
Fra l'evento certo e l'evento impossibile c'è tutta una vasta gamma di eventi che hanno diverse possibilità di
verificarsi. La teoria della probabilità è una teoria della misura che vuole appunto misurare la possibilità
che un evento ha di verificarsi. Si possono dare diverse definizioni di probabilità a seconda del contesto in
cui si devono applicare: sono ciascuna una generalizzazione dell'altra nel senso che la successiva
comprende la precedente come caso particolare. Esse sono:
1. La definizione classica o di Laplace
2. La definizione frequentistica o statistica
3. La definizione soggettiva
4. La definizione assiomatica.
2. La composizione degli eventi
•
Si dice evento somma o unione o totale di due eventi E1 e E2 l'evento che si verifica quando almeno
uno dei due si verifica. E' l'unione in senso insiemistico degli eventi e si indica con
E 1 ∪ E2.
•
Es: nel caso del lancio del dado se E 1 = { 1, 2 } ed E2 = { 2, 3, 4 }
allora E 1 ∪ E2 = { 1, 2, 3, 4 }
Si dice evento intersezione o composto o prodotto di due eventi E1 e E2 l'evento che si verifica
quando si verificano entrambi gli eventi. E' l'intersezione in senso insiemistico degli eventi e si indica
con E1 ∩ E2.
E2
Es: nel caso del lancio del dado se E 1 = { 1, 2, 3 } ed E2 = { 2, 3, 4 }. Allora
E1 ∩ E2
E1 ∩ E2 = { 2, 3 }
E1
•
Sia E un evento si dice evento contrario e si indica con non E l'evento che
si verifica quando non si verifica E. E e non E si dicono anche
opposti o complementari. Nell'esempio dei dadi se E = { 1, 2, 3 },
non E = { 4, 5, 6 }.
Non E
E
•
Due eventi E1 e E2 si dicono compatibili se si possono verificare
entrambi, cioè E1 ∩ E2 ≠∅
S
2
•
Due eventi E1 e E2 si dicono incompatibili se non si possono verificare entrambi, quindi il verificarsi
dell'uno esclude il verificarsi dell'altro. Ne segue che E 1 ∩ E2 = ∅
3. Definizione classica di probabilità
Sia dato uno spazio dei campioni formato da n eventi elementari, sia E un evento formato da m
eventi elementari, nell'ipotesi che tutti gli eventi elementari dello spazio dei campioni siano
m
equiprobabili, si definisce p ( E ) =
n
Tale probabilità gode delle seguenti proprietà:
1. 0 ≤ P (E) ≤ 1
2. P(E) = 0 se E è impossibile
3. P(E) = 1 se E è certo
N.B: tale definizione ha evidentemente un vizio logico in quanto la definizione contiene già il concetto
che deve definire. Tuttavia dire che gli eventi elementari dello spazio dei campioni devono essere
equiprobabili va inteso nel senso che si ritiene di non avere elementi tali che facciano pensare il contrario.
Ad esempio se sappiamo che un dado è stato fatto a regola d'arte con materiale omogeneo con spigoli
egualmente arrotondati ecc.. non abbiamo motivi per ritenere che una faccia abbia più probabilità di
verificarsi di altre. Ovviamente la condizione di equiprobabilità degli eventi elementari costituisce una
condizione perché si possa applicare la definizione classica.
4. Teoremi sulla probabilità
Teorema 4.1 : Teorema dell'evento unione di eventi incompatibili
Siano E1 e E2 due eventi incompatibili allora P(E1 ∪ E2 ) = P(E1) + P(E2).
Dim: siano m1 gli eventi elementari costituenti E 1 e m2 gli eventi elementari costituenti E 2, essendo E1 e E2
incompatibili non hanno elementi in comune per cui E 1 ∪ E2 è costituito da m1 + m2 elementi. Ne segue che
P(E1 ∪ E2 ) =
m1 + m2 m1 m2
+
=
= P(E1) + P(E2)
n
n
n
Es.: sia dato un mazzo di 40 carte, sia E 1 l'evento " esca un asso", sia E 2 l'evento " esca un re". Si vuole
calcolare la probabilità dell'evento "esca un asso o un re". Essendo gli eventi incompatibili tale probabilità si
4
4
1
+
ottiene
=
40 40
5
Teorema 4.2 : Teorema dell'evento unione di eventi compatibili
Siano E1 e E2 due eventi compatibili allora P(E1 ∪ E2 ) = P(E1) + P(E2) - P(E1 ∩ E2).
Dim: siano m1 gli eventi elementari costituenti E1 e m2 gli eventi elementari costituenti E2, poiché E1 e E2
sono compatibili ci saranno degli eventi elementari comuni, siano r. Per cui l’evento
E1 ∪ E2 è formato da m1 + m2 - r eventi elementari per cui P(E 1 ∪ E2 ) =
m1 + m2 − r
m
m
r
= 1 + 2 − =
n
n
n n
P(E1) + P(E2) - P(E1 ∩ E2)
N.B: il teorema 4.1 è un caso particolare del teorema 4.2 in quanto nel caso in cui E 1 e E2 siano incompatibili
allora P(E1 ∩ E2) = 0
Es.: sia dato un mazzo di 40 carte, sia E 1 l'evento "esca una carta di spadi" e E 2 l'evento "esca un asso",
l'evento E1 ∪ E2 è "esca una carta di spadi o un asso". E 1 e E2 sono compatibili in quanto può uscire anche
3
10
4
+
da cui si deve togliere la probabilità che esca l'asso di spadi perché
40 40
10
4
1
13
+
−
altrimenti sarebbe contata due volte. Per cui P(E 1 ∪ E2 ) =
=
40 40 40 40
l'asso di spadi. P(E1 ∪ E2 ) =
Teorema 4.3 : generalizzazione dei teoremi 4.1 e 4.2 nel caso di 3 eventi
Siano E1, E2, E3, 3 eventi qualsiasi, si dimostra che:
P(E1 ∪ E2 ∪ E3) = P(E1) + P(E2) + P(E3) - P(E1 ∩ E2) - P(E1 ∩ E3) - P(E2 ∩ E3) +
+P(E1 ∩ E2 ∩ E3)
Dim: alla somma della probabilità dei tre eventi si deve togliere la probabilità degli eventi a due a due
comuni altrimenti questi eventi sarebbero contati due volte ma si deve aggiungere la probabilità dell'evento
comune a tutti e tre gli eventi perché tale evento è stato contato tre volte in P(E 1) + P(E2) + P(E3) ma anche
tolto tre volte, per cui almeno una volta deve comparire.
Nel caso particolare in cui E1, E2, E3 siano a due a due incompatibili il teorema diventa:
P(E1 ∪ E2 ∪ E3) = P(E1) + P(E2) + P(E3)
Teorema 4.4: Probabilità dell'evento contrario ad un evento
P( non E) = 1 - P (E)
Dim:
P( E ∪ non E ) = P(S) =1. Tuttavia essendo E e non E incompatibili sarà
P( E ∪ non E ) = P (E) + P( non E) = 1 da cui P( non E) = 1 - P (E)
5. Probabilità condizionata
Def: La probabilità che un evento E 1 si verifichi nell'ipotesi che l'evento E 2 si sia verificato si dice
probabilità condizionata di E1 rispetto a E2 e si scrive P ( E1/ E2 ).
Def: se P ( E1/ E2 ) = P ( E1/ non E2 ) allora i due eventi si dicono stocasticamente indipendenti, il
che vuol dire che la probabilità dell'uno non dipende dal fatto che l'altro si sia oppure no verificato. In caso
contrario si dice che un evento è dipendente dall'altro.
Il modello di eventi indipendenti è costituito dalle estrazioni successive da un'urna di una pallina con
reintroduzione nell'urna di quella estratta precedentemente. Quando invece la pallina estratta non viene
reimmessa nell'urna, i due eventi "estrazioni successive" sono dipendenti.
Calcolo di P ( E1/ E2 )
Sia n il numero degli elementi che costituiscono lo spazio dei
campioni, m il numero degli eventi elementari di E 1 e k il
numero di quelli di E2, r il numero degli eventi elementari
di E1 ∩ E2.
E1
S formato da n
elementi
E2
m
E1∩E2
r
k
4
r
r
n
Per la definizione classica di probabilità P ( E1/ E2 ) =
=
=
k
k
n
E2 ) =
P( E1 ∩ E 2 )
P( E 2 ) .
Analogamente P ( E2/ E1 ) =
P( E1 ∩ E 2 )
P( E 2 ) . In conclusione P ( E1/
P( E1 ∩ E 2 )
P( E1 )
Risulta che P ( nonE1/ E2 ) = 1- P ( E1/ E2 ).
k −r
r
Infatti P( nonE1/ E2 ) =
= 1= 1- P ( E1/ E2 ).
k
k
Esempio1.
Si lanciano due dadi. Qual è la probabilità di avere come somma 8 (evento E 1) sapendo che il
risultato ha dato come somma un numero pari (evento E2)? Occorre cioè calcolare P ( E1/ E2 ).
Sarà E1 = { (2,6); (3,5); (4,4); (5,3); (6,2) }. Lo spazio dei campioni è in questo caso costituito dall'evento E 2
che è formato da 18 eventi elementari che sono i numeri pari.
5
Quindi P( E1/ E2 ) =
18
Esempio 2
Si lanciano tre monete. Sia E1 l'evento "non esce nessuna testa" ed E 2 l'evento "escono meno di due
teste". Si vuole calcolare P( E1/ E2 ).
Lo spazio dei campioni è E2 = { (T,C,C); (C,T,C); (C,C,T); (C,C,C) }, per cui essendo E1 = {(C,C,C) }, P( E1/
1
E2 ).=
4
Teorema 5.1: probabilità dell'evento intersezione di due eventi
P(E1 ∩ E2) = P(E1) P(E2/E1) = P(E2) P(E1/E2)
Dim: la formula si deduce direttamente dalla definizione di probabilità condizionata.
In particolare se E1 e E2 sono indipendenti, allora P(E2/E1) = P(E2) e P(E1/E2) = P(E1), quindi
P(E1 ∩ E2) = P(E1) P(E2)
Esempio:
Sia data un'urna con 20 palline bianche, 10 rosse e 5 nere. Facciamo due estrazioni successive con
reintroduzione. Calcolare la probabilità che si verifichi l'evento che la 1° pallina sia bianca e la seconda sia
rossa. E1= " la 1° estratta sia bianca", E 2 = " la 2° estratta sia rossa". Gli eventi sono indipendenti. Risulta
20 10
P(E1 ∩ E2) = P(E1) P(E2) =
.
35 35
Tale probabilità può essere calcolata anche direttamente sulla base della definizione. Infatti risulta che gli
eventi elementari che costituiscono lo spazio dei campioni sono le disposizioni con ripetizione di 35 elementi
di classe 2 che sono 352, gli eventi elementari che costituiscono l'evento
E1 ∩ E2 sono 20·10, cioè il numero di tutte le possibili coppie di cui la prima pallina è bianca e la seconda è
rossa. Ne risulta che P(E1 ∩ E2) =
Esempio:
20 ⋅10
35 2
5
Con i dati dell'esercizio precedente calcolare la stessa probabilità facendo però l'ipotesi che la 1° pallina
estratta non venga rimessa nell'urna. In tal caso gli eventi risultano dipendenti.
20 10
Risulta pertanto che P(E1 ∩ E2) = P(E1) P(E2/E1) =
35 34
Infatti rifacendo il calcolo sulla base della definizione risulta che lo spazio dei campioni è costituito dal
numero delle disposizioni senza ripetizione di 35 elementi di classe 2 cioè 35 · 34, mentre l'evento E 1 ∩ E2 è
formato da tutte le coppie di cui la 1° è bianca e la 2° è rossa che sono 20 · 10.
20 ⋅10
Ne segue che P(E1 ∩ E2) =
35 ⋅ 34
Teorema 5.2: probabilità dell'evento intersezione di più eventi
Esaminiamo il caso di tre eventi.
P(E1 ∩ E2 ∩ E3) = P(E1) P(E2/E1) P(E3 / (E1 ∩ E2))
Dim:
P(E1 ∩ E2 ∩ E3) = P((E1 ∩ E2) ∩ E3) = P(E1 ∩ E2) P(E3 / (E1 ∩ E2)) =
=P(E1) P(E2/E1) P(E3 / (E1 ∩ E2))
Esempio:
Sia data un'urna con 70 palline di cui 38 bianche, 22 verdi e 10 rosse. Calcolare la probabilità che
estraendo successivamente 3 palline, senza rimettere ogni volta la pallina estratta nell'urna, le 3 palline siano
tutte bianche. Sia E1 = "la 1° estratta sia bianca"; E2 = " la 2° estratta sia bianca";
E3 = " la 3° estratta sia bianca". Gli eventi sono fra loro dipendenti. Si tratta di calcolare
P(E1 ∩ E2 ∩ E3).
38 37 36
2109
Applicando il teorema si ha che P(E1 ∩ E2 ∩ E3) =
=
70 69 68 13685
Facendo il calcolo secondo la definizione lo spazio dei campioni è costituito da 70 * 69 * 68 eventi
elementari che sono le disposizioni senza ripetizione di 70 elementi di classe 3, mentre l'evento
38 * 37 * 36
E1 ∩ E2 ∩ E3 è costituito da 38*37*36 eventi elementari. Quindi P(E1 ∩ E2 ∩ E3) =
70 * 69 * 68
6. Il teorema di Bayes
Supponiamo di avere due urne U 1 e U2 contenenti rispettivamente 4 palline bianche e 6 nere e 3
bianche e 5 nere. Si estrae a sorte un’urna; dall’urna prescelta si estrae una pallina. Supponiamo che sia
bianca. Qual è la probabilità che essa provenga dall’urna U 1?
Tale problema si risolve con la formula di Bayes.
In generale il problema si pone nei termini seguenti: supponiamo che un evento E possa essere
determinato da n cause H 1, H2, ….Hi, ….Hn tali che Hi ∩ Hj = ∅, ∀ i ≠ j, cioè le cause siano a due a due
incompatibili, ed inoltre H1∪H2 ∪….Hi ∪...Hn = S che è l'evento certo (ciò è equivalente a dire che H 1, H2,
….Hi, ….Hn costituiscono una partizione di S). Supponiamo inoltre che siano note le P(H i) e le P(E / Hi) cioè
la probabilità che l'evento E si verifichi per la causa H i. Sappiamo inoltre che E si è verificato, vogliamo
calcolare che sia stata la causa H i a determinarlo, cioè vogliamo determinare P(H i / E). Si dimostra la formula
P( H i ) P( E / H i )
seguente: P(Hi / E) =
n
∑ P( H
k =1
k
) P( E / H k )
Infatti, per definizione, P(Hi / E) =
P( H i ∩ E ) P( H i ) P( E / H i )
=
P( E )
P( E )
n
Ma E = (E ∩ H1) ∪ (E ∩ H2) ∪ (E ∩ H3 ) ∪ ….∪ (E ∩ Hn ) allora P(E) =
∑P( H
k =1
k
) P ( E/ H k ) , quindi
6
P( H i ) P( E / H i )
P(Hi / E) =
n
∑ P( H
k =1
k
) P( E / H k )
come volevasi dimostrare.
Per quanto è stato detto la formula di Bayes può essere scritta anche P(H i / E) =
P ( H i ) P ( E/ H i )
.
P( E )
Nel caso dell'esempio precedente dell'urna risulta:
1
1
H1 = "estratta l'urna U1" ; P(H1) =
H2 =" è estratta l'urna U2" ; P(H2) =
2
2
4
2
3
E = " la pallina estratta sia bianca";
P(E/H 1) =
=
; P(E/H2) =
10
5
8
12
P( H 1 ) P( E / H 1 )
25
Occorre calcolare P(H1/E) =
=
=
12 13
P ( H 1 ) P ( E / H 1 ) + P ( H 2 ) P( E / H 2 )
+
25 28
1
16
5
=
=
1
3
31
+
5 16
p(Hi) si dice la probabilità a priori dell’evento H i, mentre P(Hi/E) si dice la probabilità a posteriori perché è
calcolata sapendo che si è verificato l’evento E.
7. Applicazione del Teorema del Bayes ai Test diagnostici
Un test diagnostico o screening è un test che viene applicato a soggetti che non presentano ancora
alcuna sintomatologia clinica, al fine di prevenire la malattia. Coloro che risultano positivi al test hanno una
maggiore probabilità di contrarre la malattia e in genere vengono sottoposti ad ulteriori accertamenti.
Introduciamo i seguenti simboli:
Em = è l’evento che il soggetto è malato
Es = è l’evento che il soggetto è sano
T+ = è l’evento che il risultato del test cui il soggetto è stato sottoposto è positivo
T- = è l’evento test negativo
Ci sono varie incertezze quando si esegue un test diagnostico.
Si verifica un falso negativo quando il test è negativo ma il soggetto è malato. La probabilità di un falso
negativo è P(T-/ Em).
Si verifica un falso positivo quando il test dà un risultato positivo ma il soggetto non è malato. La probabilità
di un falso positivo è P(T+/Es).
Si dice sensibilità di un test la probabilità di avere risultati positivi quando il soggetto è realmente malato,
cioè sensibilità = P(T+/Em). Risulta P(T+/Em) = 1- P(T-/ Em)
Si dice specificità di un test la probabilità di avere risultati negativi quando il soggetto è sano, cioè
specificità = P(T-/Es). Risulta P(T-/Es) = 1- P(T+/Es).
Nel caso dei test diagnostici è particolarmente importante calcolare la probabilità che l’individuo sia
malato nel caso in cui il test sia positivo, cioè P(Em/T+). Tale probabilità si dice valore predittivo di un test
positivo.
Dal teorema di Bayes risulta:
P(Em/T+) =
P( E m ) P(T + / E m )
P ( E m ) P (T + / E m ) + P ( E s ) P (T + / E s )
La P(Em) si dice anche prevalenza della malattia e viene determinata mediante indagine statistica su una
certa popolazione. Ovviamente P(Es) = 1- P(Em).
P(T+/Em) è la sensibilità del test.
7
P(T+/Es) è la probabilità di avere un falso positivo.
Analogamente si può calcolare il valore predittivo di un test negativo che è P(Es/T-).
Dal teorema di Bayes risulta:
P( E s / T − ) =
P ( E s ) P (T − / E s )
P ( E s ) P (T − / E s ) + P ( E m ) P (T − / E m )
Esempio.
Da un indagine risulta che in una certa regione si hanno 9,3 casi di tubercolosi per 100.000 abitanti,
inoltre tutti i soggetti di uno studio sono stati sottoposti ad una radiografia al torace per evidenziare
l’esistenza di una patologia infiammatoria, e la sensibilità del test è risultata pari a 0,7333 e la sua specificità
pari a 0,9715. Si chiede di calcolare il valore predittivo di un test positivo e quello di un test negativo.
+
Sarà valore predittivo del test positivo = P(Em/T ) =
P( E m ) P(T + / E m )
P ( E m ) P (T + / E m ) + P ( E s ) P (T + / E s )
Dai dati risulta:
P(Em) = 0,000093
P(Es) = 1-0,000093 = 0,999907
Sensibilità = P(T+/Em) = 0,7333
P(T+/Es) è l’evento contrario della specificità cioè 1- P(T -/Es) = 1- 0,9715 = 0,0285
Quindi si ha:
(0,000093)(0,73333)
= 0,00239
P(Em/T+) =
(0,000093)(0,73333) + (0,999907)(0,0285)
−
Inoltre il valore predittivo di un test negativo è P ( E s / T ) =
P ( E s ) P (T − / E s )
P ( E s ) P (T − / E s ) + P ( E m ) P (T − / E m )
Risulta:
P(T-/Es) = specificità = 0,9715
P(T-/Em) = 1- P(T+/Em) = 1- 0,7333 = 0,2667
(0,999907)(0,9715)
Quindi P(Es/T-) =
= 0,99997
(0,999907)(0,9715) + (0,000093)(0,2667)
La probabilità 0,0093% rappresenta la probabilità che un individuo di quella regione ha di essere affetto da
tubercolosi. Tale probabilità è definita probabilità a priori.
Dopo aver fatto la radiografia ed aver ottenuto un risultato positivo lo stesso soggetto ha una probabilità di
essere malato pari al 0,239%. Tale probabilità si dice probabilità a posteriori, in quanto considera una nuova
informazione cioè il risultato del test.
Osservazione: sarebbe auspicabile che un test diagnostico fosse altamente sensibile e altamente
specifico. In realtà però un simile test non esiste. Talvolta si è costretti a privilegiare la sensibilità o la
specificità. Un test sensibile è preferibile quando non individuare la malattia ha conseguenze pericolose, un
test specifico è importante quando ad essere dannoso è un risultato falso positivo.
Ad esempio come strumento diagnostico per individuare eventuali rigetti del rene si utilizza il livello
di creatinina sierica (composto chimico presente nel sangue) in milligrammi %. Un incremento di creatinina
è spesso associato ad una successiva insufficienza renale.
Nella prima colonna della tabella seguente ( M. Pagano, K. Gauvreau, Biostatistica, p. 111) sono riportati i
vari livelli di creatinina come possibili indicatori di rigetto ( nel senso che valori superiori a quello scelto
indicano un pericolo di rigetto) e nelle altre due la sensibilità e la specificità di un test che usasse
quell’indicatore.
Creatinina
sierica(mg%)
1,2
1,3
Sensibilità
Specificità
0,939
0,939
0,123
0,203
8
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
0,909
0,818
0,758
0,727
0,636
0,636
0,545
0,485
0,485
0,394
0,394
0,364
0,333
0,333
0,333
0,303
0,281
0,380
0,461
0,535
0,649
0,711
0,766
0,773
0,803
0,811
0,843
0,870
0,891
0,894
0,896
0,909
Come si vede dalla tabella aumentando la sensibilità diminuisce la specificità e viceversa.
Il rischio relativo
Il concetto di rischio relativo si pone quando si desidera confrontare le probabilità di malattia in due
differenti situazioni o gruppi. Il rischio relativo RR è la probabilità che un soggetto appartenente ad
un gruppo esposto a determinati fattori, sviluppi la malattia rispetto alla probabilità che un soggetto
appartenente ad un gruppo non esposto (gruppo controllo) sviluppi la stessa malattia. Più
precisamente è definito come la probabilità di malattia nel gruppo esposto diviso la probabilità di
malattia nel gruppo non esposto
RR=
P (malattia / esposto)
P (malattia / nonesposto )
Esempio: in uno studio sul cancro alla mammella, una donna è considerata come “esposta” se ha
partorito il primo bambino all’età di 25 anni o oltre. In un campione di 4540 donne che hanno
partorito il primo bambino prima dei 25 anni, 65 hanno sviluppato un cancro della mammella. Delle
1628 donne che hanno partorito il primo bambino all’età di 25 anni o oltre, a 31 è stato
diagnosticato un cancro alla mammella. Se assumiamo che i numeri sono abbastanza grandi da
soddisfare la definizione frequentista di probabilità, il rischio relativo di sviluppare un cancro alla
mammella è RR=
31 / 1628
= 1,33
65 / 4540
Un rischio relativo di 1,33 vuol dire che le donne che hanno partorito il primo bambino all’età di 25
anni o oltre hanno una probabilità superiore del 33% di sviluppare un cancro alla mammella rispetto
alle donne che hanno partorito ad un’età più giovane. In generale un rischio relativo di 1,0 indica
che le probabilità di malattia del gruppo esposto e di quello non esposto sono uguali; pertanto non
esiste un’associazione fra esposizione e malattia.
8. Definizione frequentista di probabilità
Def. Si dice frequenza assoluta fa il numero delle volte che un certo evento E si verifica. Es: si lancia una
moneta 100 volte "testa" esce 30 volte. Risulta fa = 30
Def. Si dice frequenza relativa fr il rapporto fra il numero dei successi di E ed il numero delle prove fatte n.
fr =
fa
. Risulta ovviamente 0 ≤ fr ≤ 1
n
9
Analogie e differenze fra frequenza relativa e probabilità:
• Analogie: sono entrambi numeri compresi fra 0 e 1, valgono 0 per eventi impossibili, 1 per eventi certi.
• Differenze: la probabilità è un concetto a priori, la frequenza relativa un concetto a posteriori che
necessita cioè di prove per essere definita.
Si pone il problema di vedere che relazione esiste fra frequenza relativa e probabilità ed in particolare che
1
significato pratico ha, per esempio, dire che la probabilità che lanciando una moneta esca "testa" è
.
2
Legge empirica del caso
Quando il numero delle prove è piccolo, la frequenza relativa di un evento ha un carattere aleatorio e
può cambiare notevolmente quando si ripeta per la seconda volta lo stesso numero di prove. Per esempio in
10 lanci di una moneta può capitare che "testa" esca due volte (f r =0,2), in altri 10 lanci "testa" può uscire
invece 8 volte (fr = 0,8).
L'esperienza dice che al crescere del numero delle prove fatte tutte nelle stesse condizioni, la
frequenza relativa pur variando, tende a stabilizzarsi attorno ad un valore, cioè ordinariamente le
fluttuazioni molto grandi sono sempre più rare, e tale valore attorno a cui le frequenze relative si
stabilizzeranno corrisponde al valore della probabilità dell'evento. In ciò consiste la legge empirica del caso.
Anche se impropriamente potremmo scrivere che lim
n →∞
fa
= P , impropriamente perché non si esclude che
n
si possano avere scostamenti notevoli dalla probabilità anche per valori alti di n.
Vanno fatte alcune osservazioni:
1. La legge non è dimostrabile ma è puramente empirica
2. Il caso " non ha memoria" per cui se lanciando una moneta viene "testa" molte volte di seguito, ciò non
ci autorizza a pensare che nel lancio successivo sia più probabile che esca "croce". Ogni lancio è
indipendente dagli altri già effettuati.
3. La legge empirica del caso dà un significato pratico al concetto di probabilità. La probabilità è la
frequenza relativa con cui un certo evento tende a presentarsi su un numero grande di prove.
4. La legge empirica del caso legittima la definizione frequentista o statistica di probabilità
Def: si definisce probabilità di un evento in senso statistico la frequenza relativa che esso assume su un
grande numero di prove eseguite tutte nelle medesime condizioni.
Tale definizione si applica in quei casi in cui non è applicabile la definizione classica in quanto viene
a mancare la condizione di equiprobabilità degli eventi elementari su cui essa si basa. Ad esempio se
abbiamo delle buone ragioni per ritenere che un dado sia truccato, non essendo per esempio costruito con
materiale omogeneo, non potremo ritenere equiprobabili l'uscita dei sei numeri per cui non potremo
1
assegnare alla probabilità di uscita del numero 1 il valore
. L'alternativa è quella di ripetere il lancio del
6
dado un numero elevato di volte, calcolare la frequenza relativa dell'uscita di 1 ed assumere per definizione
tale valore come probabilità dell'evento.
Tuttavia anche la definizione frequentista non può essere applicata sempre perché è necessario che
l'evento di cui si vuole definire la probabilità sia ripetibile nelle stesse condizioni. Per cui non potrei
calcolare in base a tale definizione la probabilità che in una partita di calcio vinca una squadra piuttosto che
l'altra. Per calcolare tale probabilità si può ricorrere alla definizione soggettiva
9. Definizione soggettiva di probabilità
La probabilità di un evento in senso soggettivo, cioè secondo l'opinione di un certo individuo, è il
prezzo P che è disposto a pagare (riscuotere) per ricevere (pagare) una somma unitaria al verificarsi
dell'evento. Per cui se l'individuo è disposto a pagare (riscuotere) una somma π per riscuotere (pagare) la
somma S al verificarsi dell'evento e nulla nel caso l'evento non si verifichi, egli attribuisce all'evento una
probabilità P =
π
S
.
10
Tale definizione è soggettiva ma non arbitraria perché impone che l'individuo sia "coerente" cioè sia disposto
a fare le sue scommesse sia come giocatore sia come banco.
Tale probabilità è egualmente compresa fra 0 e 1 perché è "coerente" pagare 1 lira per riscuotere una lira nel
caso del verificarsi di un evento certo, così come è "coerente" pagare 0 lire per ricevere una lira nel caso di
un evento impossibile.
Esempio: se uno scommettitore di cavalli attribuisce la probabilità 0,3 alla vittoria di un certo cavallo vuol
dire che è disposto a pagare (ricevere) 0,3 · 1000 € = 300 € per riscuotere (pagare) € 1000 nel caso il cavallo
vinca, nulla se il cavallo perde.
10. Definizione assiomatica di probabilità
Sia dato un insieme S di elementi detto spazio dei campioni, ed un suo sottoinsieme E detto evento, per
probabilità dell'evento E si intende il numero p(E) associato ad E definito dai seguenti assiomi:
1. P(E) ≥ 0
2. P(S) = 1
3. P(E1 ∪ E2 ∪ E3 ∪….. En ∪…..) = P(E1) + P(E2) + P(E3) +…. P(En) +… per ogni serie finita o infinita
numerabile di eventi disgiunti E1, E1, E1, .. En,…..
Partendo da tale definizione si ottengono tutti i teoremi che si sono dimostrati nel caso della definizione
classica. Ad esempio:
Teorema 1 P( non E) = 1 - P (E)
Dim:
P( E ∪ non E ) = P(S) =1 per l’assioma 2. Tuttavia essendo E e non E incompatibili sarà per l’assioma 3
P( E ∪ non E ) = P (E) + P( non E) = 1 da cui P(non E) = 1 - P (E)
Teorema 2 P(∅) = 0
Dim:
S e ∅ sono disgiunti per cui 1 = P(S) = P(S∪∅) = P(S)+P(∅), da cui P(∅)=1-P(S) = 0
Teorema 3 Per ogni evento E risulta 0 ≤ P(E) ≤ 1
Dim:
P(E) ≥ 0 per l’assioma 1, occorre dimostrare che P(E) ≤ 1. P(E) +P(nonE) = 1. Se fosse P(E) >1 allora
P(non E) sarebbe <0 che è impossibile visto l’assioma 1. Allora deve essere P(E) ≤ 1, come si voleva
dimostrare.
Teorema 4 Se E1 e E2 sono due eventi di S allora:
P(E1∪E2) = P(E1)+P(E2)-P(E1∩E2)
Dim:
Risulta E1∪E2 = (E1∩non E2) ∪(E2∩non E1)∪(E1∩E2)
Quindi per l’assioma 3: P(E1∪E2) = P(E1∩non E2) +P(E2∩non E1)+P(E1∩E2) (1)
E’ facile verificare che:
P(E1) = P(E1∩non E2) + P(E1∩E2) (2)
e che P(E2) = P(E2∩non E1)+ P(E1∩E2) (3)
Ricavando P(E1∩non E2) dalla (2) e P(E2∩non E1) dalla (3) e sostituendole nella (1) si ottiene la tesi
Naturalmente se E1 e E2 sono disgiunti, E1∩E2 = ∅ per cui per il teorema 2 P(E1∩E2 ) = P(∅) = 0 allora
P(E1∪E2) = P(E1)+P(E2)
Osservazione: si può rimanere sconcertati del fatto che sono state date della probabilità di un evento diverse
definizioni, tuttavia c'è da dire che esse sono ognuna una generalizzazione dell'altra nel senso che ogni
definizione contiene la precedente come caso particolare. Inoltre nonostante le diverse definizioni continuano
a valere gli stessi teoremi e le stesse proprietà.
Mostriamo come esempio che la definizione classica si può ottenere come caso particolare di quella
frequentista.
11
Sia dato un esperimento composto da n eventi elementari { e1, e2, e3, … en}. Ad esempio lanciando un dado
truccato lo spazio dei campioni è {1, 2, 3, 4, 5, 6 }. Facciamo m prove ( m lanci del dado) i singoli eventi
elementari si presentino n1, n2, n3,…. nn volte ( n1 volte il numero 1, n2 volte il numero 2 ecc..). Sarà n 1+ n2
n
n1 n 2
+
+ .... n =1 .
m m
m
nn
n
n1
n
Poiché il lim ( + .... ) = lim 1 + ...... + lim n = 1 sarà P(e1)+ P(e2)+ P(e3)+…. P(en) =1
m →∞ m
m →∞ m
m →∞ m
m
+n3+…. +nn = m ;
Supponiamo che gli eventi elementari e1, e2, e3, … en siano equiprobabili sarà P(e1) = P(e2) = …
1
= P(en) =
secondo la definizione classica.
n
Inoltre sia E l'evento { e1, e2, e3, … ek}, sia m il numero delle prove fatte, N E il numero delle volte in cui E si
è verificato e n1, n2, n3, n4…. nk il numero delle volte in cui si sono verificati e 1, e2, e3, … ek . Sarà n1+n2+
n3+ ... nk = NE.
In base alla definizione frequentista P(E) = lim
m →∞
n + n 2 + ...n k
n
NE
n
= lim ( 1
) = lim 1 + ...... lim k =
m
→
∞
m
→
∞
n
→
∞
m
m
m
m
= P(e1)+ P(e2)+ P(e3)+…. P(ek) . Nel caso delle equiprobabilità sarà quindi P(E) =
k
come nella definizione
n
classica.
A questo punto si ritrovano tutti i teoremi sulla probabilità degli eventi unione ed intersezione.
Esercizi sul calcolo delle probabilità
1. Supponiamo che la probabilità di avere inflazione I è 0,3 , che la probabilità di avere recessione R è
0,2 e che la probabilità di avere inflazione e recessione è 0,06. Qual è la probabilità di avere
inflazione o recessione? [ R. 0,44]
2. Abbiamo un mazzo di 52 carte , 13 cuori, 13 quadri, 13 picche, 13 fiori. Qual è la probabilità di
estrarre una carta di cuori o di quadri o un asso? [ R. 7/13]
3. Qual è la probabilità di avere due 6 in 2 lanci successivi di un dado? [R. 1/36]
4. Qual è la probabilità di avere un 6 su ciascun dado in un unico lancio di due dadi? [ R. 1/36]
5. Un’urna contiene 10 palline : 5 rosse, 3 bianche, 2 gialle. Calcola la probabilità di avere due palline
bianche in due estrazioni successive con reinbussolamento. [ R. 9/100]
6. Calcola la probabilità di avere 3 femmine in una famiglia con 3 figli [R. 1/8]
7. Si lanciano contemporaneamente due dadi, qual è la probabilità di avere 5 come somma dei numeri
usciti? [ R. 1/9]
8. Si lanciano contemporaneamente due dadi, qual è la probabilità di avere come somma dei numeri
usciti un numero ≤ 4 ? [ R. 1/6]
9. Un’urna contiene 10 palline: 5 rosse, 3 bianche, 2 gialle. Facciamo due estrazioni successive senza
reintroduzione, calcola la probabilità che la 2° estratta sia rossa sapendo che la 1° estratta è stata
rossa. [R. 4/9]
10. Dall’urna precedente facciamo 3 estrazioni successive senza reintroduzione, calcola la probabilità
che la 3° estratta sia rossa sapendo che la 1° estrata è stata rossa e la 2° non rossa. [ R. ½]
11. Dall’urna precedente facciamo due estrazioni successive, calcola la probabilità di avere due rosse sia
nel caso di estrazioni successive con reintroduzione che nel caso di estrazioni senza reintroduzione.
[ R. ¼, 2/9]
12. Dall’urna precedente facciamo 3 estrazioni successive, calcola la probabilità di avere 3 palline rosse
sia nel caso di estrazione con reintroduzione che senza. [ R. 1/8, 1/12]
13. Alberto ricorda le cifre del numero di telefono, salvo l’ultima, di una ragazza che ha conosciuto in
discoteca. Disponendo di due gettoni decide di telefonarle scegliendo a caso l’ultima cifra. Calcola la
probabilità che indovini il numero esatto tenendo presente che può fare al massimo due telefonate.
[ R. 0,2]
12
14. L’esperienza ha mostrato che su ogni 100000 pezzi prodotti in uno stabilimento durante il turno
diurno 200 sono difettosi e che su ogni 100000 pezzi prodotti durante il turno notturno 500 sono
difettosi. Nell’arco delle 24 ore 1000 pezzi sono prodotti durante il turno diurno e 600 durante il
turno notturno. Calcola la probabilità che:
a) un elemento preso a caso fra i 1600 elementi prodotti nelle 24 ore sia stato prodotto durante
il turno diurno e sia difettoso
b) sia stato prodotto durante il turno notturno e sia difettoso
c) sia stato prodotto durante il turno notturno e non sia difettoso
d) sia difettoso indipendentemente dal turno in cui sia stato prodotto
e) un pezzo difettoso preso a caso fra i 1600 pezzi prodotti durante le 24 ore provenga dal turno
diurno.
[ R. 0,00125, 0,00187, 0,37312, 0,00312, 0,4]
16.Sappiamo che la probabilità che in un certo giorno piova è 0,1; la probabilità che si abbia un
incidente automobilistico in un giorno qualsiasi è 0,005; la probabilità che si abbia un incidente
automobilistico in un giorno di pioggia è 0,012. Calcola:
a) La probabilità che un certo giorno piova e si abbia un incidente automobilistico
b) La probabilità che piova sapendo che si è avuto un incidente automobilistico [ R. 0,0012;
0,24]
17. Due urne contengono rispettivamente 26 palline rosse, 16 nere, 8 gialle la prima e 13 rosse, 18 nere e
9 gialle la seconda. Si estraggono contemporaneamente due palline dalla prima ed una dalla seconda
urna. Calcola la probabilità che:
a) Le tre palline siano rosse
b) Le tre palline siano di colore diverso [ R. 169/1960; 1144/6125]
18. Due urne contrassegnate dalle lettere A e B sono così composte: l’urna A contiene 60 palline rosse e
40 verdi; l’urna B contiene 20 palline rosse e 30 verdi. Si lanciano due dadi: se escono due numeri
uguali si estrae una pallina da A; in caso contrario si estrae una pallina da B. Si supponga che,
effettuata l’estrazione della pallina, questa risulti essere rossa. Calcola la probabilità che la pallina
rossa provenga dall’urna A. [ R . 3/13]
19. Tre macchine A,B,C producono rispettivamente il 20%, il 35% ed il 45% dei bulloni prodotti da una
certa fabbrica. Sul totale dei bulloni prodotti dalle tre macchine risultano difettosi il 5%, il 4% ed il
2% rispettivamente. Viene scelto un bullone a caso e viene trovato difettoso. Qual è la probabilità
che esso provenga dalla macchina B? [ R. 0,42]
20. In una scatoletta sono contenute 8 caramelle: alcune sono avvolte in carta rossa ed altre in carta
bianca; alcune sono al miele e altre al limone. Precisamente le caramelle sono distribuite come
segue:
carta rossa e sapore miele: 2
carta rossa e sapore limone: 1
carta bianca e sapore miele: 3
carta bianca e sapore limone: 2
Si estrae a caso una caramella. Calcola la probabilità che la caramella estratta sia al miele essendo
avvolta in carta rossa. [ R. 2/3]
21.I dati riportati di seguito derivano da uno studio che esamina l’uso della ventricolografia
radionuclidica quale test diagnostico per l’individuazione della patologia coronarica.
Test
Positivo
Negativo
Totale
Malattia
si
302
179
481
Totale
no
80
372
452
382
551
933
Determina:
a) la sensibilità e la specificità del test
b)
per una popolazione la cui probabilità di presentare
patologie coronariche è 0,10 calcola la probabilità che un soggetto presenti la malattia in
presenza di un risultato positivo al test della ventricolografia radionuclidica
c)
Calcola il valore predittivo di un test negativo
13
22. Uno studio ha affermato che la sensibilità della mammografia quale test di screening per
l’individuazione del cancro della mammella è 0,85; la sua specificità è 0,80.
a) Qual è la probabilità di un falso negativo?
b) Qual è la probabilità di un falso positivo?
c) In una popolazione in cui la probabilità che una donna abbia un cancro della mammella è
0,0025, qual è la probabilità che una donna abbia un cancro in presenza di una mammografia
positiva?
23.Per diversi metodi di contraccezione sono di seguito riportate le probabilità che una donna abbia una
gravidanza non prevista durante il primo anno di utilizzo
Metodo di contraccezione
Nessuno
Diaframma
Profilattico
Spirale
Pillola
Probabilità di gravidanza
0,431
0,149
0,106
0,071
0,037
Per ciascun metodo, calcola il rischio relativo di gravidanza per donne che usano questo metodo
rispetto alle donne che non utilizzano alcun tipo di precauzione. Come varia il rischio in funzione
del metodo di contraccezione?
Sul libro di testo Murray R. Spiegel, Statistica, Mc Graw-Hill esercizi sul calcolo combinatorio
e delle probabilità da p. 128 a p. 149