LA PROBABILITÀ

CENNI DI CALCOLO COMBINATORIO E DELLE
PROBABILITÀ
Appunti delle lezioni del Prof. Giuseppe Puggioni
a cura di M. Marras e B. Pettinelli
CALCOLO COMBINATORIO
Disposizioni semplici
Dati n elementi ( a1, a2, a3, a4,…….. an-1, an ) tra loro distinti, si dicono disposizioni semplici (D)
di classe h, per h < n, tutti i gruppi che si possono fare con gli n elementi prendendoli h per volta, in
modo che ogni gruppo di h elementi differisca dagli altri per qualche elemento o perché gli stessi
elementi sono diversamente ordinati.
Dn,h = n  (n-1)  (n-2)  (n-3) x………….(n-h+1)
Esempio
Con i 10 elementi distinti “S1 , T2 , A3 , T4 , I5 , S6 , T7 , I8 , C9 , A10” che compongono la parola
statistica il numero di disposizioni che si possono ottenere prendendo gli elementi a tre a tre è dato
da:
D10,3 = 10 x (10-1) x (10-3+1) = 10 x 9 x 8 = 720
Il risultato ottenuto sta ad indicare che il numero di gruppi che si possono ottenere con i 10
elementi prendendoli tre per volta e tale che ciascun gruppo differisca dagli altri per avere o un
elemento (lettera) diverso (si fa presente che le lettere anche se si ripetono si devono considerare
come elementi diversi in quanto distinti) o gli stessi elementi disposti diversamente è di 720.
In pratica dati n elementi distinti e stabilito il numero di essi che devono far parte di ogni gruppo
per la determinazione di Dn,h si calcola prima l’ultimo fattore che è = n – h + 1 e quindi si
aggiungono gli altri fattori, procedendo da destra verso sinistra, facendoli crescere di una unità
passando da un fattore all’altro fino a n.
Permutazioni semplici
Le permutazioni semplici sono il numero di gruppi ordinati e distinti che si possono formare con n
elementi disponendo gli stessi in ordine diverso
Pn = n!
Il simbolo n! prende il nome di fattoriale di n. Esso è dato dal prodotto dei primi n numeri naturali.
Così ad esempio 6! è dato da 1 x 2 x 3 x 4 x 5 x 6
Pn è un caso particole delle disposizioni quando h = n. Infatti in questa eventualità si avrebbe che
Dn,n, sarebbe uguale a n  (n-1)  (n-2)  (n-3) ………..(n-n+1). Appare del tutto evidente che
questo prodotto letto da destra verso sinistra non è nient'altro che il prodotto dei primi n numeri
naturali e cioè il fattoriale di n.
Combinazioni semplici
n  (n  1)  (n  2)  (n  3)  ..............(n  h  1)
Ph
h!
Si dicono combinazioni semplici di n elementi distinti di classe h, per h  n, tutti i possibili
gruppi che si possono fare con gli n elementi, prendendoli h per volta, in modo che ogni gruppo di h
elementi differisca dagli altri per almeno un elemento diverso
per cui sarà anche Dn,h= Cn,h  Ph
Cn,h 
Dn,h

2
Esempio:
Considerando i 10 elementi distinti che compongono la parola statistica il numero di combinazioni
che si possono ottenere prendendoli 4 per volta sarà:
C10,4 =
D10, 4
P4

10  9  8  7 10  9  8  7 5040


 210
4!
1 2  3  4
24
n
Cn,h viene indicato con il simbolo   che prende il nome di coefficiente binomiale
h
 n
Moltiplicando il numeratore e il denominatore di   per il fattoriale di n-h e il numeratore e il
 h
 n 
 per il fattoriale di h, si dimostra facilmente che
denominatore di 
 n  h
 n  n 
n!
   
 
 h   n  h  h ! n  h !
n
per cui essendo per h = n   = 1 sarà anche
n
 n  n

 =   = 1
n  n  0
n
per
2
n 1 n 1
poi decrescere simmetricamente. Per n dispari si hanno due valori massimi per h   e 
2 2 2 2
n
Il coefficiente binomiale   trova applicazione per lo sviluppo del binomio di Newton (a + b)n, la
h
Al crescere di h di unità in unità (da 0 a n) il valore del rapporto cresce, per n pari, fino a h 
n
cui soluzione è data da
n
  h  a
h
b n  h per h che assume i valori da 0 a n, in quanto fornisce i valori
h  
dei coefficienti da assegnare ai prodotti delle potenze dei due termini (ah e bn-h) che concorrono nel
calcolo della potenza del binomio.
Esempio:
Dovendo calcolare (a + b)10 i singoli termini del binomio saranno dati da:
10  0 10 0
  a b
= 1∙1∙ b10 = b10 (si ricorda che un numero elevato 0 è uguale a 1)
0
 
10  1 101
  a b
= 10 a1 b9 = 10 a b9
1
 
10  2 10 2
10  9 8 8
  a b
=
a b = 45 a8 b2
2
2
!
 
10  3 10 3 10  9  8 3 7
  a b
=
a b = 120 a3 b7
3
3
!
 
10  4 10 4 10  9  8  7 4 6
  a b =
a b = 210 a4 b6
4
4
!
 
3
10  5 10 5 10  9  8  7  6 5 5
  a b =
a b = 252 a5 b5
5
5
!
 
10  6 10 6 10  9  8  7  6  5 6 4
  a b
=
a b = 210 a6 b4
6
6
!
 
10  7 10 7 10  9  8  7  6  5  4 7 3
  a b
=
a b = 120 a7 b3
7
7
!
 
10  8 108 10  9  8  7  6  5  4  3 8 2
  a b
=
a b = 45 a8 b2
8
8
!
 
10  9 10 9 10  9  8  7  6  5  4  3  2 9 1
  a b
=
a b = 10 a9 b
9
9
!
 
10  10 1010 10  9  8  7  6  5  4  3  2  1 10 0
  a b
=
a b =1 a10 = a10
10
10
!
 
per cui (a + b)10 sarà uguale a:
b10+10 a b9+45 a2 b8+120 a3 b7+210 a4 b6+252 a5 b5+210 a6 b4+120 a7 b3+45 a8 b2+10 a9 b+a10
Osservando i valori assunti dai coefficienti si può verificare, così come si è già avuto modo di
10  10 
sottolineare, che essi assumono valore 1 per   e   e che il loro valore cresce al crescere di h
 0  10 
fino, essendo n pari, a n/2 cioè a 10/2 = 5, per poi diminuire simmetricamente.
4
CALCOLO DELLE PROBABILITÁ
CENNI INTRODUTTIVI
Gli eventi
Un fatto, un esperimento, si dicono casuali o aleatori quando il manifestarsi del fatto o
dell’esperimento non possono essere previsti con certezza.
Lo spazio campionario (Ω)
Lo spazio campionario o spazio degli eventi possibili è l’insieme di tutte le manifestazioni del fatto
casuale. Nel caso del lancio di un dado lo spazio campionario è dato da:
Ω = {1, 2, 3, 4, 5, 6}
Cosi lo spazio campionario del sesso in una coppia di fratelli, indicando con M maschio e con F
femmina, è formato dall’insieme
Ω = {MM, MF, FM, FF}
È del tutto evidente che mentre è noto il totale dei possibili risultati (spazio campionario), non può
invece essere previsto il risultato del singolo esperimento o prova o evento che sia.
Eventi semplici e eventi composti
Sono eventi semplici quelli derivanti da un solo risultato, sono invece eventi composti quelli che si
possono verificare in più modi. Nel lancio di un dado, ad esempio, è un evento semplice l’uscita del
5, che si indicherà E {5}, mentre è composto l’evento uscita di un numero pari, E{2, 4, 6}, in
quanto tale evento può verificarsi in tre possibili diversi modi (uscita del 2 o uscita del 4 o uscita del
6).
Gli eventi semplici sono anche denominati punti campione. L’insieme dei punti campione
costituisce lo spazio degli eventi possibili, per cui è denominato, come accennato, spazio
campionario.
Si deve tener presente:
1 - che gli elementi che formano lo spazio campionario non sempre sono punti campione. Infatti se
si considera l’evento sesso nella nascita di una coppia di fratelli di cui sopra, e si indica con A
nascita di due maschi, con B nascita di due femmine e con C nascita di un maschio e di una
femmina, gli elementi che costituiscono lo spazio campionario Ω = {A, B, C} non tutti sono
punti campione in quanto l’evento C può essere originato in due modi diversi: nascita di un
maschio e quindi di una femmina (MF) oppure nascita di una femmina e quindi di un maschio
(FM);
2 - lo stesso avvenimento o lo stesso esperimento possono dare origine a spazi campionari diversi,
come nel caso dell’evento sesso nella nascita di una coppia di fratelli;
3 - lo spazio campionario dei punti campione è quello che sicuramente fornisce più informazioni;
4 - un evento composto può essere decomposto in punti campione.
5
Evento certo e evento impossibile
Un evento dicesi certo se si verifica sempre. Ad esempio è certo che nel lancio di un dado esca un
numero da 1a 6. L’evento certo si indica con Ω in quanto rappresentando l’insieme di tutte le
manifestazioni possibili, necessariamente si deve verificare.
Un evento è impossibile se non può mai verificarsi. Ad esempio l’uscita del 7 nel lancio di un dado
con sei facce numerate da 1 a 6. L’evento impossibile si indica con il simbolo .
Eventi necessari
Due o più eventi si dicono necessari se in ogni prova si verifica almeno uno di essi. Ad esempio gli
eventi E1{1}, E2{2}, E3{3}, E4{4}, E5{5}, E6{6} associati al lancio di un dado sono necessari in
quanto in ogni prova sicuramente si verificherà uno di essi.
Eventi incompatibili e compatibili
Due eventi si dicono incompatibili quando non si possono verificare contemporaneamente. Se nel
lancio di una moneta esce testa è impossibile che nella stessa prova possa uscire croce. Così in una
partita di calcio i tre eventi possibili vittoria della squadra A, vittoria della B e pareggio è
impossibile che possano verificarsi più di uno alla volta contemporaneamente.
Gli eventi che non sono incompatibili si dicono compatibili. Così nel lancio di un dado l’evento A
uscita di un numero minore di 3 EA{1, 2} è compatibile con l’evento B uscita di un numero pari
EB{2, 4, 6}. Infatti se si verifica l’apparizione del numero 2 tale risultato verifica tutti e due gli
eventi.
Eventi indipendenti e eventi dipendenti
Uno o più eventi si dicono indipendenti se il verificarsi di uno in una prova non rende impossibile
il verificarsi di uno qualsiasi (anche lo stesso) degli eventi in altre prove. Ad esempio se nel lancio
di un dado esce il 2 , in un secondo, terzo, ecc, lancio si può ancora verificare l’uscita del 2 o di
qualsiasi altro evento, cioè di un numero da 1 a 6.
Quando gli eventi non sono indipendenti si dicono dipendenti. Se, ad esempio, da un’urna
contenente 90 palline numerate da 1 a 90, si estrae la pallina con il numero 10 e tale pallina non
viene reinserita nell’urna, l’uscita del 10 nella prima estrazione esclude che il 10 possa essere
estratto in una seconda estrazione.
Somma logica (o unione) di eventi semplici
Se E1, E2, E3,……… Ek sono eventi incompatibili
E = E1  E2  E3 ...… Ek
L’evento E così definito è chiamato evento totale o somma logica dei k eventi incompatibili. Ad
esempio se l’evento E è l’uscita di un numero inferiore a 4 nel lancio di un dado e cioè
E1 = 1 , E2 = 2 , E3 =  3 
Si scriverà
E = E1  E2  E3
Risulta quindi che l’evento composto E è dato dalla somma logica o unione di più eventi semplici.
Da quanto sopra si può dedurre facilmente che:
1 – se gli eventi sono compatibili devono essere considerati una volta sola. Così nel caso del lancio
di un dado, l’unione degli eventi E1 = 1, 2  e E2 = 2, 3, 5  sarà dato da:
E1  E2 = 1, 2, 3, 5  e non da E1  E2 = 1, 2, 2, 3, 5 
6
2 – più eventi incompatibili E1 , E2 , E3 ,…… Ek tutti appartenenti a Ω formano una classe completa
se e solo se
E1  E2  E3  …… Ek = Ω
Prodotto logico (o intersezione) di eventi indipendenti
Un evento E si dice prodotto logico o intersezione di k eventi indipendenti, tutti definiti nello
stesso spazio campionario Ω, quando esso è costituito da quella parte di Ω che appartiene
contemporaneamente a tutti i k eventi indipendenti. In questi casi si userà la notazione:
E = E1  E2  E3 …… Ek
Tale notazione (= prodotto logico o intersezione) sta a significare che quando si realizza E si
verificano contemporaneamente anche tutti gli eventi E1 , E2 , E3 ,…… Ek
Se nel lancio di un dado gli eventi attesi sono E1 = 2, 3, 4, E2 = 2, 3, 5 e, E3 = 2, 3, 6,
l’evento intersezione o prodotto logico è:
E1  E2  E3 = 2, 3
Da quanto detto, risulta chiaro che nel caso di uscita del 2 o del 3, si verificano
contemporaneamente E1, E2 e E3. È altrettanto evidente che se gli eventi sono incompatibili l’evento
intersezione sarà un evento impossibile in quanto non vi sono parti in comune. Così nel caso che
nel lancio di un dado l’evento che preveda ad es. E1 = 2 e E2 = 5e cioè che esca il due 2 e il 5,
che sono eventi incompatibili, sarà:
E1  E2 = Ø = impossibilità che si verifichi l’evento
Evento complementare
Un evento dicesi complementare dell’evento E, e si indica con il simbolo Ē, se si verifica nello
spazio campionario Ω quando non si verifica E. Cosi nell’estrazione da un’urna contenente palline
bianche e nere, l’evento complementare di E1 = B = estrazione di una pallina bianca è Ē2 = N =
estrazione di una pallina nera. Va da se che se nell’urna vi sono palline di diversi colori l’evento
complementare di E1 = B sarà Ē2 = NB, cioè estrazione di una pallina non bianca.
Da quanto sopra è del tutto evidente che:
a - anche Ē è una parte di Ω;
b-ĒE=Ω;
c - Ē  E = Ø.
LA PROBABILITÀ
Come opportunamente sottolinea Leti “sulla definizione di probabilità di un evento non c’è alcun
accordo in campo scientifico e ciò è stato fin dagli albori del calcolo delle probabilità: vi sono
scuole che si fronteggiano e si combattono e nell’ambito delle stesse scuole vi sono correnti
pugnaci e intransigenti (quasi quanto quelle dei nostri partiti).
Il fatto è che nella nostra vita noi abbiamo sempre a che fare con la probabilità e quindi nel nostro
linguaggio comune parliamo spesso di probabilità, però in modo piuttosto vago”.
Qui di seguito, sempre rifacendoci al Leti, si riportano le principali definizioni di probabilità,
avvertendo fin da ora che le definizioni a cui più frequentemente si fa riferimento negli studi sociali
sono la Classica e la Frequentista. Per questo motivo, per quanto esse siano state formulate prima
delle altre, vengono descritte per ultime.
7
LE DIVERSE IMPOSTAZIONI
1 - Definizione logica
La probabilità di un evento è data dalla misura dell’aspettativa di un evento, sulla quale misura vi
è concordanza della maggioranza degli individui.
Come sottolinea ancora Leti, “la probabilità, nell’approccio logico, è riguardata come un concetto
che modifica e amplia il campo di applicazione della logica formale: in questa per due proposizioni
A e B si può dichiarare soltanto o ‹A implica B› o ‹A confuta B›; con il concetto di probabilità
invece si esprime il grado di implicazione di B fornito da A. Quando questo concetto si applica ad
un insieme A di conoscenze su una situazione e ad un possibile risultato B, la probabilità indica la
misura con cui A implica B. La probabilità è dunque una misura dell’aspettativa di un evento,
misura che però deve avere una logica credibilità, essere tale cioè che su di essa concordi la
maggioranza degli individui e che, se un individuo è di parere discorde, questi è in errore. … ‹in
qual modo si può assegnare un numero al grado di aspettativa?› o, in breve, ‹come si può
misurarlo?›. Infatti diversi individui attribuiscono generalmente una diversa probabilità ad uno
stesso evento”. In ultima analisi la debolezza dell’approccio logico discende dal fatto che è
impossibile definire come si possa pervenire alla misura dell’aspettativa dell’evento.
2 - Definizione soggettivista
La probabilità è una stima del grado di aspettativa di un evento, stima che è personale,
caratteristica dell’individuo, ed ottenuta tramite l’esperienza che questi ha accumulato.
Una tale impostazione amplia al massimo il campo di applicazione della teoria della probabilità.
Tuttavia se essa è soddisfacente, ad esempio, per colui che decide di investire in un certo tipo di
azioni o di giocare certi numeri al lotto o ancora di uscire da casa con o senza ombrello, non lo è
invece per “coloro per i quali il mondo esterno è una realtà indipendente da loro e conoscibile.
Infatti, i giudizi probabilistici possono essere usati per conoscere questa realtà obiettiva, ma la
conoscenza obiettiva è possibile solo se le conclusioni non provengono da preferenze personali o da
pregiudizi dei singoli”. Le critiche all’impostazione soggettivista non concernono pertanto la
definizione di probabilità, quanto per le “conseguenze sulla conoscenza del reale” o per meglio
dire per il fatto che “rende impraticabile la via della conoscenza del reale”.
3 - Definizione assiomatica
La probabilità è una funzione additiva, non negativa e che come si vedrà secondo l’impostazione
classica al massimo può assumere il valore 1.
L’aspetto debole di questa impostazione discende dal fatto che con questa “visione si costruisce
tutta la teoria della probabilità, che è in sé coerente, ma che non può essere collegata con la realtà”.
4 - Definizione classica o probabilità a priori di un evento
La probabilità che ha un evento di verificarsi è data dal rapporto tra il numero dei casi favorevoli
all’evento e il totale dei casi possibili = spazio degli eventi possibili Ω, purché tutti i casi siano
ugualmente possibili
In termini analitici
n
Pr (E) =
N
Dove E è l’evento atteso, n il numero dei casi favorevoli e N quello di tutti i casi ugualmente
possibili. Ad esempio la probabilità che esca il 4 nel lancio di un dado con sei facce numerate dall’1
1
al 6 sarà: Pr (E4) =
in quanto essendovi un solo 4 n = 1 (casi favorevoli) e N = 6 (tutti i casi
6
ugualmente possibili);
8
cosi la probabilità che esca un numero pari nel lancio di un dado con sei facce numerate dall’1 al 6
sarà:
3 1
Pr (E2, 4, 6) =  in quanto essendovi tre numeri pari n = 3 casi favorevoli e N = 6 tutti i casi
6 2
ugualmente possibili;
cosi ancora se in una famiglia vi sono 3 figli quale è la probabilità che vi siano 2 maschi e 1
femmina?
Il totale dei casi possibili N sarà uguale a 8, che è dato da tutti i possibili eventi e cioè:
MMM, MMF, MFM, FMM, FFM, FMF, MFF, FFF = Ω
e quello dei casi favorevoli n sarà uguale a 3 in quanto dato dagli eventi
MMF, MFM, FMM
per cui la probabilità che in una famiglia con 3 figli vi siano 2 maschi e 1 femmina sarà di
3
8
Potendo n assumere i valori da 0 a N, sarà 0 ≤ n  N.
n
Dividendo ora tutto per N, ricordando che
= Pr (E), risulta che 0 ≤ Pr (E)  1.
N
È del tutto evidente che se n = 0 (ad es. uscita del numero 7 nel lancio di un dado con sei facce
0
numerate dall’1 al 6)
= 0 che significa impossibilità che si verifichi l’ evento. Se invece n = N
N
(ad es. uscita dell’1, o del 2 o del 3, o del 4, o del 5, o del 6 nel lancio di un dado con sei facce
N
numerate dall’1 al 6) si avrà = 1 che significa che si ha la certezza che si verifichi l’evento.
N
L’aspetto criticabile insito in questa definizione discende dal fatto che l’espressione ugualmente
possibili, non significa altro che tutti i casi devono essere ugualmente probabili. “Il circolo
vizioso appare evidente: per valutare una probabilità occorre conoscere preventivamente quali casi
devono considerarsi come ugualmente probabili” . In altri termini si è di fronte ad una tautologia,
circostanza questa che non è ammessa in sede di definizione di un concetto.
5 - Definizione frequentista
La probabilità di un evento è il limite, al crescere del numero delle esperienze, della serie delle
frequenze dell’evento ottenute da esperienze fatte in condizioni uguali.
In altri termini se relativamente ad un dato evento E si effettuano in condizioni uguali N prove (es.
uscita del 2 nel lancio di un dado) e n è il numero delle volte in cui l’evento si è verificato,
n
l’esperienza (e non la teoria matematica) dimostra che la frequenza relativa f data dal rapporto
N
al crescere di N tende alla probabilità Pr (E). Da tale evidenza discende il fatto che la probabilità Pr
(E) rappresenterebbe la misura idonea a prevedere la frequenza f dell’evento quando N è
sufficientemente grande.
Da quanto sopra risulta del tutto evidente che:
a - il valore di f varia al variare del numero delle prove;
b - f = Pr (E) solo per N =  e cioè se si effettuano un numero infinito di prove, eventualità questa
che è chiaramente impossibile.
c - è del tutto generica l’espressione sufficientemente grande. L’unica cosa che si può dire è che
sperimentalmente si è potuto verificare che tanto più grande è il numero delle prove, cioè N,
tanto più f tende a Pr (E).
Utilizzando la definizione frequentista, effettuando un gran numero di prove e reinserendo dopo
ogni prova la pallina estratta da una data urna, sarebbe quindi possibile stabilire qual è la probabilità
9
di estrarre una pallina bianca da tale urna di cui si supponga di non conoscere né il numero totale N
delle palline (= tutti i casi ugualmente possibili) né quello delle palline bianche n (= casi
favorevoli). Ovviamente dopo ogni prova, prima di reinserire la pallina nell’urna, lo sperimentatore
dovrà verificare che le palline siano tutte uguali (stessa grandezza, stesso peso, ecc.) in quanto,
come ripetutamente sottolineato, tutti i casi devono essere ugualmente possibili.
Dalla tabella e dal grafico di seguito riportati è possibile constatare che facendo crescere il numero
di gettate di due dadi con sei facce ciascuno e numerate da 1 a 6 , la frequenza relativa, che è
indicata in percentuale, con cui si verificano i punteggi (= somma dei numeri che appaiono nei due
dadi dopo ogni gettata), tende sempre più alla probabilità determinata a priori secondo
l’impostazione classica (l’esempio è tratto da L. Livi, Elementi di Statistica). Per inciso si fa
presente che ovviamente la somma della probabilità calcolate a priori è uguale a 1, perché è certo
che uno degli eventi previsti (= punteggi) si verificherà sicuramente in quanto essi essendo eventi
necessari rappreseno tutto lo spazio campionario.
Nel caso in esame, essendo state effettuate tutte le gettate dei due dadi nelle medesime condizioni,
la frequenza relativa con cui sono apparsi i vari punteggi dopo 7000 prove è una “stima corretta”
della probabilità a priori, che potremo chiamare probabilità a posteriori o probabilità statistica o
probabilità empirica. Da quanto visto si può affermare che:
a) se dopo le 7 mila gettate (= numero sufficientemente grande di gettate) la frequenza relativa
con cui si sono verificati i vari punteggi fosse molto diversa dalle corrispondenti probabilità
a priori significherebbe che i dadi sono quasi certamente “truccati”;
b) se si aumenta il numero di prove, ad esempio fino a 10, 20, 30 mila gettate, la frequenza
relativa con cui si verificheranno i vari punteggi tenderà ad avvicinarsi sempre di più alle
corrispondenti probabilità calcolate a priori. In base a tale evidenza ottenuta per via
sperimentale l’impostazione frequentista da alcuni è anche indicata come legge empirica
del caso, che legge non è in quanto per una sua verifica si dovrebbero effettuare un numero
infinito di prove, condizione questa che ovviamente non è possibile soddisfare.
É del tutto evidente che nel campo delle scienze sociali (e non solo in questo campo), se si vuole
stimare quale sia la probabilità che si verifichi un determinato evento (ad esempio che uno studente
che ha frequentato le lezioni superi l’esame di Statistica, o che nel corso di un anno un
automobilista incorra in 1, 2, ecc. incidenti stradali) si deve necessariamente ricorrere
all’impostazione frequentista e cioè alla probabilità a posteriori, in quanto a priori, a differenza
del lancio di una moneta o di un dado, non si conoscono né i casi favorevoli e tanto meno tutti
quelli possibili, considerati come ugualmente possibili così come previsto dall’impostazione
classica. In altri termini, si dovrà fare riferimento alla frequenza relativa dell’evento, ovviamente a
condizione che il numero delle osservazioni (in questo caso non si può più parlare di prove) sia
abbastanza o sufficientemente grande.
10
Frequenza
Somma
% dei
dei punti Probabilità punteggi
a priori
dei due
(a) calcolo
(a)
dadi
di
probabilità
(b)
2
1/36
2,8
Frequenza della somma dei punti
dopo
1000
lanci (%)
7000
lanci (%)
5
3,5
2,4
100 lanci
3
2/36
5,6
11
6,7
4,6
4
3/36
8,3
4
9,2
7,8
5
4/36
11,1
14
11,5
11,1
6
5/36
13,9
6
13,1
14,1
7
6/36
16,7
13
14,4
16,0
8
5/36
13,9
18
13,9
13,9
9
4/36
11,1
9
10,3
12,0
10
3/36
8,3
12
9,4
9,5
11
2/36
5,6
5
5,5
5,7
12
1/36
2,8
3
2,5
2,9
100
100
100
100
Totale
(a) Per la determinazione delle probabilità a priori dei singoli eventi (=somma dei punteggi dei due
dadi) sono stati applicati i postulati della probabilità totale e della probabilità composta che saranno
illustrati successivamente; (b) La frequenza percentuale dei punteggi è stata ottenuta moltiplicando
per 100 il valore dei singoli rapporti e quindi approssimando per eccesso il valore ottenuto alla prima
cifra decimale.
20
%
18
16
14
12
10
8
6
4
2
0
0
1
2
3
Probabilità a priori;
4
5
6
dopo 100 lanci;
11
7
8
dopo 1000 lanci;
9
10
11
dopo 7000 lanci
12
A questo punto si pongono però almeno due ordini di problemi di non poco conto:
1. che a differenza del caso dell’urna a cui si è fatto precedentemente riferimento e di cui si è
supposto di non conoscere né il numero totale delle palline, né quello delle palline bianche
in essa contenute, se si ripetesse lo stesso esperimento cioè lo stesso numero di prove, a
distanza di tempo si otterrebbe un risultato tendenzialmente identico, nell’ambito dei
fenomeni sociali invece questa condizione non sempre si verifica o si verifica raramente.
Ciò perché nel periodo che trascorre tra il momento in cui sono stati osservati sia i casi
favorevoli all’evento (CF) sia quelli possibili (CP) e il momento a cui si vuole riferire il
valore del rapporto CF/CP, possono essere intervenute, e di solito ciò avviene, cause
modificatrici tali da fare aumentare o diminuire le circostanze favorevoli al verificarsi di
quel dato evento. Se ad esempio in riferimento ad un dato periodo di tempo, si è rilevata la
frequenza relativa o, in altri termini, la probabilità che un soggetto, una volta contratta una
data malattia possa a causa della stessa morire1, essa avrà inevitabilmente un valore più o
meno limitato nel tempo, che, nel caso in esame, sarebbe in funzione del progresso medico e
farmacologico, del modificarsi delle condizioni igienico-sanitarie, ecc..
2. che i casi possibili (ovviamente non tutti ma un numero sufficientemente grande), non sono
come vuole l’enunciato della probabilità a priori ugualmente possibili, ma tutti
diversamente possibili. In altri termini è come se, ad esempio, si dovesse determinare la
probabilità di estrarre una pallina bianca da un’urna contenente palline bianche e nere non
tutte identiche, ma di diversa grandezza, diverso peso, ecc. e quindi ciascuna con una
diversa possibilità di essere afferrata da chi procede all’estrazione.
Per attenuare, seppure (almeno in linea teorica) non eliminare completamente, gli inconvenienti di
cui al punto 1, si rende necessario che la probabilità che ha un dato evento di verificarsi venga
periodicamente ricalcolata, ricalcolo che deve effettuarsi con una cadenza che sarà in funzione dalla
celerità con cui intervengono nuovi fattori, prima non presenti, che possono modificare le
circostanze favorevoli, come, ad esempio, nel caso della probabilità di morire dopo aver contratto
una data malattia che tenderà a modificarsi in modo più o meno rapido in funzione della velocità
con cui gli scienziati riusciranno a scoprire nuovi farmaci e mettere a punto protocolli terapeutici
più efficaci per la sua cura.
Per quanto attiene al fatto che le unità poste al denominatore siano tutte tra loro diverse (si tenga
presente che sono delle unità statistiche), comporta che il valore di f che viene assunto come
probabilità che si verifichi un dato evento, non è riferibile ad ogni singola unità come nel caso di
un’urna contenente palline tutte uguali, ma tale valore, volendo utilizzare un’espressione non da
tutti accettata, va inteso come probabilità media e come tale riferibile indistintamente a tutte le
unità.
Tornando all’esempio della probabilità di non sopravvivere ad una data malattia, il valore di f,
ottenuto dal rapporto tra deceduti per quella malattia e totale degli ammalati, esprimerebbe, in
riferimento al luogo (quartiere, o comune, o provincia, o regione, ecc.) e al momento a cui i dati si
riferiscono, quale è mediamente la probabilità che in quel dato gruppo popolazionistico un
generico individuo che abbia contratto quella malattia muoia, e non quale è la probabilità di morte
del signor x y, cioè del singolo individuo, appartenente a quella popolazione e che ha contratto
quella malattia.
Sempre in riferimento all’esempio di cui sopra, la probabilità così ottenuta, analogamente con
quanto visto per i rapporti di derivazione, per maggiore chiarezza potremmo, utilizzando
un’espressione che in generale non è condivisa dai probabilistici, chiamarla probabilità media
generica e sempre in analogia con tali rapporti potremmo denominare probabilità media specifica
il valore di f ottenuto dal rapporto tra, ad esempio, i maschi, o i maschi di una certa età, o i maschi
1
In questo caso la frequenza relativa sarà data dal rapporto tra il numero di ammalati e deceduti e il totale degli ammalati in una determinata unità
di tempo (ad es. un anno)
12
di una certa età e professione, ecc.deceduti e il totale degli individui che hanno contratto la malattia
appartenenti rispettivamente alle diverse categorie considerate nel numeratore del rapporto2.
Due esempi possono meglio aiutare a comprendere l’importanza dell’impostazione frequentista e
ad evidenziare i problemi connessi alla sua utilizzazione.
Il primo concerne la frequenza relativa dei promossi all’esame di maturità in Italia negli anni
scolastici 1971-72 e 1992-93.
Anno
Esaminati (Ei)
Promossi (Pi)
fi = Pi/Ei
scolastico Pubblicisti Privatisti Pubblicisti Privatisti Pubblicisti Privatisti
1971-72
333.242
43.806
305.990
24.683
0,92
0,56
1992-93
478.256
42.310
467.698
23.173
0,98
0,55
Dai valori delle fi riportati nella tabella emerge che mentre per i pubblicisti la probabilità di essere
promossi nell’a.s. 1992-93 risulta significativamente più elevata rispetto all’a.s. 1971-72 (98
promossi su 100 contro i 92 del 1971-72), quella dei privatisti non si è sostanzialmente modificata.
Un tale risultato sottolinea che se si vuole conoscere quale sia la probabilità per un privatista di
essere promosso in riferimento ad un anno successivo al 1992-93, non sarebbe errato assumere
come misura quella calcolata per il 1971-72, mentre altrettanto non potrebbe dirsi per i pubblicisti.
Da quanto detto ci si può ben rendere conto del perché vi sia l’esigenza di ricalcolare
periodicamente la probabilità che ha un dato evento di verificarsi in quando questo è il modo più
semplice per rassicuraci che la sua misura non si sia nel frattempo modificata e che quindi vada
ricalcolata.
Il secondo esempio è ripreso dalle conclusioni a cui sono pervenuti gli studi condotti già da tempo
dai demografi. Trattasi del rapporto percentuale dei sessi alla nascita, che, in riferimento sia a tempi
che a luoghi diversi, assume sempre valori compresi tra 105-106 maschi ogni 100 femmine (Pr(M)
= 0,512-0,515)3. Come si può osservare dalla tabella e soprattutto dal grafico, passando dalla
provincia di Cagliari, all’ intera regione sarda e quindi al totale dei nati in Italia, in altri termini
facendo aumentare il numero delle osservazioni, il rapporto di mascolinità (M/F x 100) tende
sempre di più a stabilizzarsi intorno al valore 105-106 M per 100 F. Questa evidenza, non solo ci
conferma che con l’aumentare del numero delle osservazioni la frequenza relativa è una stima
sempre più “corretta” della probabilità, come nel caso del lancio dei due dadi a cui si è fatto prima
riferimento, ma fornisce anche un’ulteriore conferma dell’invarianza nel corso del tempo del
rapporto M/F alla nascita.
2
Secondo un approccio probabilistico quindi, il valore ottenuto mediante un rapporto di derivazione, così come quelli dei rapporti di composizione,
può essere assunto, anzi è, una misura della probabilità che si verifichi un dato evento. È opportuno che si tenga presente che quando si vuole dare
tale significato ad un rapporto di derivazione bisogna porre particolare attenzione. Infatti, se si sta facendo, ad esempio, riferimento a fenomeni
ripetibili nell’unità di tempo considerata, si deve controllare che l’evento, relativamente ad una stessa unita, sia considerato una volta sola. In caso
contrario il valore ottenuto non potrebbe essere assunto come misura della probabilità che si verifichi quel dato evento, in considerazione anche del
fatto che, almeno in linea teorica, il valore del rapporto potrebbe anche risultare maggiore di 1. Se ad esempio si volesse determinare quale è la
probabilità che un individuo contragga l’influenza nel corso di un anno, non sarebbe corretto assumere come misura il valore del rapporto ottenuto
rapportando il numero dei casi di influenza (casi favorevoli ) nell’intervallo di tempo considerato al totale degli individui esposti alla malattia (tutti
i casi possibili). Infatti, essendo riguardo ad uno stesso individuo l’evento influenza ripetibile nel corso di un anno, se la metà delle persone esposte
avessero per ipotesi contratto una sola volta l’influenza e l’altra metà due volte, eventualità questa non impossibile, il valore del rapporto
risulterebbe uguale a 1,5, dato questo che starebbe a sottolineare che nel corso di un anno mediamente in quella data popolazione gli individui si
ammalano di influenza 1,5 volte e non la probabilità che uno contragga l’influenza come era stato richiesto. Se in una simile circostanza sarebbe
del tutto evidente che il valore ottenuto non può essere assunto come misura della probabilità che un soggetto contragga l’influenza, in quanto,
come ripetutamente sottolineato, la probabilità può assumere solo valori delimitati dall’intervallo 0 (=impossibilità che l’evento si verifichi) e 1 (=
certezza del verificarsi dell’evento), non altrettanto evidente lo sarebbe se il valore del rapporto fosse stato uguale, ad esempio, a 0,8. Se si vuole
determinare in modo corretto quale sia la probabilità che un individuo contragga l’influenza, al numeratore del rapporto si deve porre non il
numero dei casi di influenza, ma quello degli individui che si sono ammalati, individui che devono essere considerati una volta sola, potendo uno
stesso soggetto ammalarsi più di una volta. Stesso ragionamento va fatto se si vuole conoscere quale sia la probabilità di una, due, o più recidive.
3
Per tale motivo questo rapporto viene chiamato anche rapporto ferreo secondario dei sessi alla nascita. Secondario perché il rapporto primario
sarebbe quello al concepimento, dato questo che è ignoto in quanto non sempre è conosciuto il sesso del nascituro nelle nascite mancate (aborti
spontanei, terapeutici, volontari).
13
Rapporto di mascolinità (M/F x 100) e di composizione (M/MF) dei nati dal 1981 al 1991 nella
Provincia di Cagliari, in Sardegna e in Italia
Provincia di Cagliari
Sardegna
Italia
Anni
M/F x 100
M/MF (a)
M/F x 100
M/MF (a)
M/F x 100
M/MF (a)
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
102,77
104,69
106,61
107,39
106,8
108,02
105,86
106,81
109,15
105,26
108,27
0,507
0,511
0,516
0,518
0,515
0,519
0,514
0,516
0,522
0,513
0,520
105,8
105,2
105,7
106,2
106,7
107,0
106,4
107,0
108,1
104,1
108,2
0,514
0,513
0,514
0,515
0,516
0,517
0,516
0,517
0,519
0,510
0,520
105,8
106,0
106,2
106,0
105,8
106,2
106,7
106,4
106,2
106,2
106,3
0,514
0,515
0,515
0,515
0,514
0,515
0,516
0,516
0,515
0,515
0,515
(a) La frequenza relativa fM, data dal rapporto di composizione M/MF, rappresenta, come accennato,
la stima della probabilità che in una nascita si abbia maschio. Infatti fM è ottenuto rapportando il
numero n di nascite maschili (= casi favorevoli) al totale N dei nati (= numero dei casi possibili).
110
%
109
108
107
106
105
104
103
102
1981
1982
1983
1984
1985
1986
Prov. Cagliari;
1987
Sardegna;
14
1988
1989
Italia
1990
1991
ALCUNI IMPORTANTI TEOREMI
Teorema della probabilità totale
Dati k eventi incompatibili (E1, E2, E3,……… Ek), la probabilità che si verifichi la somma logica è
data dalla somma delle probabilità dei singoli eventi
Pr(E1  E2  E3 …… Ek) = Pr(E1) + Pr(E2) + Pr(E3)+……+Pr(Ek)
Utilizzando questo teorema è quindi possibile determinare quale sia la probabilità che nel lancio di
un dado esca il 2 o il 5. Essendo i due eventi, in riferimento ad una sola prova, incompatibili in
quanto in un lancio non possono comparire contemporaneamente il 2 e il 5 e essendo Pr(E2) =
Pr (E5) =
1
6
la probabilità che esca il 2 o il 5 sarà data da Pr(E2) + Pr (E5) =
1
6
+
1
6
=
2
6
=
1
6
e
1
.
3
Così se durante una lezione di statistica sono, ad esempio, presenti 80 studenti di cui 25 in possesso
della maturità scientifica, 15 di quella del classico, 35 di quella di istituti professionali e 5 di quella
linguistica, quale è la probabilità che estraendo a caso uno studente questo sia in possesso della
maturità classica o di quella linguistica?
Indicando con Pr(E1), Pr(E2), Pr(E3) e Pr(E4) rispettivamente le probabilità di estrarre uno studente
con la maturità scientifica, uno con la maturità classica, uno con la maturità di un istituto
professionale e uno con la maturità linguistica si avrebbe:
Pr(E1) =
25
80
, Pr(E2) =
15
80
, Pr(E3) =
35
80
, e Pr(E4) =
5
80
Essendo i due eventi E2 e E4 incompatibili in una sola prova, in quanto non possono realizzarsi
contemporaneamente, la probabilità che lo studente estratto sia in possesso della maturità classica
oppure di quella linguistica sarà data da:
Pr(E2) + Pr(E4) =
15
80
+
5
80
=
20
80
=
1
= 0,25
4
È del tutto ovvio che:
1. il teorema è utile soprattutto quando non si conosce la composizione della popolazione secondo
i vari caratteri (nel caso dell’esempio il numero di studenti secondo il tipo di diploma
posseduto), ma solo la probabilità dei singoli eventi, come nel caso del lancio di un dado;
2. nel caso in cui i k eventi formino una classe completa di eventi (cioè gli eventi siano
incompatibili e necessari come i numeri dall’1 al 6 nel lancio di un dado, o che in una nascita
si abbia maschio oppure femmina in quanto legati da un tale nesso di dipendenza per cui il
manifestarsi di un caso impedisce il verificarsi dell’altro o degli altri), l’evento E unione dei k
eventi non può che essere un evento certo e cioè:
Pr(E1) + Pr(E2) + Pr(E3) + Pr(E4) +…………+ Pr(Ek) = 1
In altri termini la probabilità di tutti gli eventi (casi o fenomeni) che si escludono reciprocamente è
uguale a 1 (= certezza) in quanto è certo che uno degli eventi dovrà verificarsi.
Teorema della probabilità composta
Se gli eventi E1, E2, E3,……… Ek sono reciprocamente indipendenti, la probabilità che si verifichi il
prodotto logico degli eventi è uguale al prodotto delle probabilità dei singoli eventi, e cioè:
Pr(E1  E2  E3 …… Ek) = Pr(E1) ∙ Pr(E2) ∙ Pr(E3)∙……∙Pr(Ek)
Utilizzando questo teorema è quindi possibile determinare quale sia la probabilità che lanciando due
volte un dado esca nel primo lancio il 2 e nel secondo il 5. Essendo i due eventi compatibili e
15
indipendenti in quanto la comparsa del 5 nel secondo lancio è indipendente dalla comparsa del 2 nel
1
6
primo e viceversa e essendo Pr(E2) =
5 sarà data da Pr(E2) ∙ Pr (E5) =
1
6
∙
1
6
=
e Pr (E5) =
1
6
, la probabilità che in due lanci escano il 2 e il
1
36
Così se in un’urna vi sono 200 palline di cui 50 bianche, 100 nere, 10 verdi e 40 rosse, facendo
quattro estrazioni, reinserendo ogni volta la pallina estratta, quale è la probabilità di estrarre 2
palline bianche, 1 nera e 1 rossa?
Indicando con Pr(E1), Pr(E2) e Pr(E3) rispettivamente le probabilità di estrarre rispettivamente 1
pallina bianca, 1 nera e 1 rossa si avrebbe:
Pr(E1) =
50
200
=
1
1
100
1
40
, Pr(E2) =
= e Pr(E3) =
=
200
200
5
4
2
Essendo i tre eventi (2 palline bianche, 1 nera e 1 rossa) compatibili e anche indipendenti in quanto
dopo ogni estrazione si è ipotizzato che la pallina estratta venga reinserita nell’urna e
conseguentemente possono realizzarsi in quattro estrazioni tutti e tre gli eventi attesi, la probabilità
cercata sarà data da:
Pr(E1) ∙ Pr(E1) ∙ Pr(E2) ∙ Pr(E3) =
1
1
1 1
∙ ∙ ∙ = 0,25 ∙ 0,25 ∙ 0,50 ∙ 0,20 = 0,00625
4
4
2 5
La probabilità che si verifichi l’evento risulta quindi del 6,25 ‰, cioè molto bassa.
N.B. - La probabilità di estrarre una pallina bianca è stata considerata due volte in quanto l’evento
atteso era di 2 palline bianche ovviamente in due estrazioni diverse e dopo aver sempre reinserito
la pallina dopo ogni estrazione.
Nei casi sopra descritti era prevista la reciproca indipendenza degli eventi in quanto dopo ogni
estrazione con il reinserimento della pallina estratta si provvedeva a ricostituire la situazione
iniziale. Una situazione tutt’altro diversa è invece quella che si verifica se dopo ogni estrazione non
si provvede a reinserire l’unità estratta. In questa eventualità non si può più parlare di eventi
reciprocamente indipendenti perché l’avverarsi dell’uno influisce sull’avverarsi dell’altro e così via
procedendo nelle successive estrazioni.
Il teorema della probabilità composta in queste circostanze può essere così enunciato “la
probabilità di un evento dovuto al concorso di due o più eventi (tre, quattro, ecc.) è uguale alla
probabilità che si avveri il primo di essi per la probabilità che ha il secondo di verificarsi dopo
essersi verificato il primo, per la probabilità che ha il terzo di verificarsi dopo che si sono avverati
il primo e il secondo e così di seguito”.
Per esempio, se la probabilità di estrarre il 20 e il 45 da due urne del lotto (cioè relativamente a due
1
1
1
diverse ruote) è di
∙
=
= 0,00012346, la probabilità di estrarre gli stessi due numeri da
8100
90 90
1
1
1
una medesima urna (stessa ruota) sarà invece di
∙
=
= 0,00012484
8010
90 89
In questo caso infatti i due eventi non sono indipendenti in quanto l’estrazione del primo numero
modifica la probabilità del secondo, dato che nell’urna dopo la prima estrazione vi saranno 89
palline e non 90.
Riprendendo l’esempio degli 80 studenti presenti ad una lezione di statistica ci si può chiedere
quale è la probabilità di estrarre a caso due studenti, senza reinserire l’unità estratta fra gli 80
presenti, di cui uno in possesso della maturità classica e l’altro di quella scientifica.
16
Trattasi di due eventi che, per quanto compatibili, non sono indipendenti, per cui la probabilità sarà
25
15
data non dal prodotto delle due probabilità (
∙
), ma dal prodotto della prima per la seconda
80
80
25 15
375
dopo che si è verificato il primo evento, cioè da
∙
=
= 0,059.
80
79 6320
In questi casi si parla di probabilità condizionata, cioè della probabilità che si verifichi l’evento E2
(estrazione dello studente in possesso della maturità scientifica) dopo che si è verificato E1
(estrazione dello studente in possesso della maturità classica). Se indichiamo con Pr(E2 | E1) la
probabilità condizionata di E2 ad E1, in termini formali sarà:
Pr( E1  E 2 )
Pr(E1  E2) = Pr(E1) ∙ Pr(E2 | E1) da cui Pr(E2 | E1) =
[1]
Pr( E1 )
È logico che:
se i due eventi sono indipendenti sarà Pr(E2 | E1) = Pr(E2) per cui Pr(E1  E2) = Pr(E1) ∙ Pr(E2)
e che:
Pr( E1  E 2 )
Pr( E 2 )
Per dare concretezza a quanto detto in base ai dati riportati nella tabella si supponga di voler
conoscere quale è la probabilità che scelto a caso un individuo questi sia un maschio e la cui prova
sia stata giudicata insufficiente
Pr(E1 | E2) =
Sesso
F
M
Totale
Esito della prova
Insufficiente
Sufficiente
20
60
10
30
30
90
Totale
80
40
120
Ricordando che la probabilità del verificarsi di un evento può essere stimata dalla frequenza relativa
con cui si presenta quell’evento si ha:
40 1
30 1
 = 0,333….; Pr (Ins) =
Pr(M) =
= = 0,25
120 3
120 4
Scelto a caso un maschio la probabilità che appartenga al gruppo di quelli per i quali la prova sia
stata giudicata insufficiente è
10 1
 = 0,25
Pr(Ins | M) =
40 4
Scegliendo adesso, sempre a caso, un individuo, la probabilità che esso sia un maschio del gruppo
dei giudicati insufficienti sarà:
10
1

Pr(Ins  M) =
= 0,083333….
120 12
Si può ora facilmente verificare, come indicato nella [1], che:
Pr(Ins | M) =
Pr(Ins  M) 0,08333
= 0,25

Pr(M)
0,3333
Nell’applicazione degli schemi probabilistici ai fenomeni sociali si deve tener ben presente che non
è quasi mai sicuro il giudizio sulla indipendenza degli eventi. Infatti se in linea generale si potrebbe
affermare che la morte di una persona sia un evento indipendente da quella di un’altra, tuttavia si
potrebbe anche verificare l’eventualità che la morte di un neonato non sia un evento indipendente
dalla morte della madre, in quanto, in particolari circostanze, il decesso della madre può fare
17
aumentare la probabilità di morte del neonato. Similmente potrebbero considerarsi come non
indipendenti i fallimenti di aziende legate da relazioni d’affari o l’incendio di due stabili adiacenti,
ecc.
Alcuni esempi di applicazione dei due teoremi
1° Esempio
Facendo due gettate di un dado con sei facce numerate da 1 a 6, quale è la probabilità che il 6
compaia nell’una o nell’altra gettata?
1
1
2
1
Sarebbe sbagliato rispondere che essa è data da Pr(E1)+Pr(E6) e cioè da
+
=
= in quanto
6
6
6
3
la comparsa del 6 nella prima gettata non esclude che il 6 ricompaia anche nella seconda. La
probabilità sarà quindi più piccola. Il problema va quindi risolto chiedendoci prima quale è la
probabilità che nelle due gettate compaia almeno una volta il 6, oppure non compaia e quindi quale
è la probabilità che il 6 non compaia in nessuna delle due gettate. Nel primo caso trattasi di due
eventi che si escludono reciprocamente e quindi si possono sommare le probabilità, somma che sarà
uguale a 1 in quanto certamente si verificherà o la prima o la seconda eventualità, nel secondo caso
essendo la non uscita del 6 né nella prima né nella seconda gettata due eventi compatibili e
5
5
25
indipendenti sarà data dal prodotto delle due probabilità e cioè da
∙
=
essendo 5 i casi
6
6
36
favorevoli che non compaia il 6. La probabilità quindi che compaia il 6 in una delle due gettate sarà
25
data da 1 = 0,3066….
36
2° Esempio
Riprendendo l’esempio relativo al lancio di due dadi, fatto per verificare empiricamente che
aumentando il numero delle prove (o delle osservazioni) la frequenza relativa f ottenuta dal rapporto
tra il numero di volte in cui si è verificato l’evento atteso e il totale delle prove (o delle
osservazioni) tende sempre più a convergere verso la probabilità che ha quel dato evento di
manifestarsi, vediamo adesso come sono state calcolate, applicando i due teoremi, le probabilità a
priori di ottenere come somma dei punteggi, ad esempio, 3 e 8.
La somma di 3 può verificarsi solo in due casi: uscita dell’1 nel primo dado e uscita del 2 nel
secondo, oppure uscita del 2 nel primo dado e dell’1 nel secondo.
Sia nel primo caso (uscita dell’1 e del 2) che nel secondo (uscita del 2 e dell’1) trattasi di eventi
compatibili ed indipendenti, per cui:
1 1
1
Pr(E1  E2) = Pr(E1) ∙ Pr(E2) =
∙
=
6 6 36
cosi la probabilità che si realizzi il secondo evento (uscita del 2 e dell’1) è dato da:
1 1 1
Pr(E2  E1) = Pr(E2) ∙ Pr(E1) =
∙ =
6 6 36
È evidente che se realizza l’evento 1 e 2 non si può verificare l’evento 2 e 1: Trattasi quindi di
eventi incompatibili per cui la probabilità di avere il punteggio 3 sarà data dalla somma delle due
probabilità e cioè:
1
1
2
+ =
36 36 36
Per ottenere invece 8 come somma dei punteggi dei due dadi questa può realizzarsi in 5 modi
diversi: 4 e 4; 3 e 5; 5 e 3; 6 e 2; 2 e 6.
Ciascuna di queste combinazioni, come visto per il caso precedente, ha probabilità di verificarsi
1
uguale a
. Anche in questo caso gli eventi (le varie combinazioni) sono incompatibili perché il
36
18
verificarsi di una qualsiasi esclude che possano verificarsi le altre, per cui la probabilità di avere
come somma dei punteggi 8 sarà data da:
1
1
1
1
1
5
+ + + + =
36 36 36 36 36 36
Si può ora verificare che le probabilità così ottenute sono le stesse riportate nella seconda colonna
della tabella a cui si è fatto riferimento per illustrare questi due casi.
3° Esempio
Un altro caso di utilizzazione congiunta dei due teoremi è fornito da questo esempio.
Immaginiamo una persona davanti a due urne perfettamente uguali e da cui si trovi alla stessa
distanza. In una vi sono 100 palline di cui 50 bianche e nell’altra 200 palline di cui 20 bianche. Si
desidera conoscere quale sia la probabilità che tale individuo, effettuando una estrazione, estragga
una pallina bianca.
50  20
70
Sarebbe certamente sbagliato dire che la probabilità sarebbe data da
=
=0,233….
100  300 300
Occorre in questo caso utilizzare sia il teorema della probabilità composta che quello della
probabilità totale. Ciò perché quella ipotetica persona dovrà prima decidere da quale urna estrarre la
pallina e quindi procedere all’estrazione. Ora la probabilità che scelga una o l’altra urna è uguale a
1
(si ricorda che le urne sono perfettamente identiche, poste alla stessa distanza da chi deve
2
effettuare l’estrazione e che questi non conosce il loro contenuto) e la probabilità di estrarre una
50
1
1
20
pallina bianca dalla prima urna è di
=
e di estrarla dall’altra di
=
100
2
200 10
Poiché la scelta di un’urna e quindi di estrarre una pallina bianca sono eventi compatibili ed
indipendenti, in quanto l’aver scelto un’urna non esclude che da essa possa essere estratta una
pallina bianca si applicherà il teorema della probabilità composta per cui per la prima urna la
probabilità sarà data da:
1
1
1
∙
=
2
2
4
e per la seconda da:
1
1
1
∙
=
2 10
20
Ora poiché se viene scelta la prima urna è escluso che la pallina possa essere estratta dall’altra urna
e viceversa, trattasi chiaramente di eventi che si escludono reciprocamente. Per trovare la
probabilità di estrarre una pallina bianca da una delle due urne si deve quindi applicare il teorema
della probabilità totale. La probabilità cercata sarà quindi uguale a:
1
6
1
+
=
= 0,3
4 20 20
19
4° Esempio
Si consideri la seguente distribuzione delle combinazioni matrimoniali secondo il luogo di nascita
dello sposo e della sposa
Luogo di nascita della sposa
Luogo di nascita dello sposo
Altro comune della
stessa provincia
(B’)
Stesso comune
(A’)
AA’
Stesso comune (A)
AB’
1997
BB’
368
Altro comune di altra provincia (C)
Totale
27
2081
7
405
BC’
30
CA’
Totale
AC’
57
BA’
Altro comune della stessa provincia (B)
Altro comune di altra
provincia
(C’)
CB’
CC’
81
13
3
97
2446
100
37
2583
Ci si può chiedere quali sarebbero state le combinazioni matrimoniali dei 2583 sposi se queste si
fossero realizzate a caso, o se si preferisce quale sia la distribuzione da attendersi a calcolo delle
probabilità. Ad una tale domanda si può rispondere (ovviamente tenendo fissi sia i totali di colonna
sia di riga in quanto essi sono i dati veri che provengono dall’osservazione empirica) applicando il
teorema della probabilità composta. Ciò perché gli eventi congiunti (= le singole combinazioni) si
devono considerare come compatibili ed indipendenti. In altre parole si deve ipotizzare che per lo
sposo nato in un dato comune la sua scelta della sposa non sia influenzata dal luogo di nascita di
quest’ultima e viceversa.
Per ottenere la probabilità che si abbia, ad esempio, la combinazione AC’ si dovrà moltiplicare la
probabilità che si verifichi l’evento A per la probabilità che si verifichi l’evento C’. Pr(A) è data
dal rapporto tra il totale di A (2081 sposi dello stesso comune) e il totale dei casi possibili (2583
sposi) e Pr(C’) dal rapporto tra il totale di C’ (37 spose nate in un comune di altra provincia) e il
2081 37

totale dei casi possibili (2583 sposi). Per cui Pr(AC’) = Pr (A) ∙ Pr(C’) =
= 0,0115
2583 2583
Qui di seguito sono riportati i calcoli per la determinazione della probabilità relativamente a tutte e
nove le combinazioni matrimoniali:
Pr(AA’) = Pr (A) ∙ Pr(A’) =
Pr(AB’) = Pr (A) ∙ Pr(B’) =
Pr(AC’) = Pr (A) ∙ Pr(C’) =
Pr(BA’) = Pr (B) ∙ Pr(A’) =
Pr(BB’) = Pr (B) ∙ Pr(B’) =
Pr(BC’) = Pr (B) ∙ Pr(C’) =
2081 2446

= 0,7629
2583 2583
2081 100

= 0,0312
2583 2583
2081 37

= 0,0115
2583 2583
405 2446

= 0,1485
2583 2583
405 100

= 0,0061
2583 2583
405 37

= 0,0022
2583 2583
20
97 2446

= 0,0356
2583 2583
97 100

Pr(CB’) = Pr (C) ∙ Pr(B’) =
= 0,0015
2583 2583
97
37

Pr(CC’) = Pr (C) ∙ Pr(C’) =
= 0,0005
2583 2583
Pr(CA’) = Pr (C) ∙ Pr(A’) =
È del tutto evidente che se si moltiplicano le probabilità ottenute per le singole combinazioni per il
totale dei casi (2583) si ricavano, come è possibile osservare nella tabella qui di seguito riportata, le
frequenze che si sarebbero avute se le combinazioni si fossero realizzate a calcolo di probabilità e
cioè se le unioni, secondo il luogo di nascita degli sposi, dipendessero solo dal caso. Lo stesso
risultato si ottiene più facilmente moltiplicando il totale di colonna per il totale di riga,
relativamente a ciascuna casella, e quindi dividendo per il totale generale. Ovviamente le frequenze
così determinate, e ciò si verifica quasi sempre, sono delle frequenze assolute teoriche e, come
sottolinea il Leti a proposito delle tabelle doppie medie aritmetiche, sui generis in quanto, come si
può osservare dalla tabella, esse sono rappresentate da numeri non interi.
Le distribuzioni delle frequenze teoriche così determinate, come si avrà modo di vedere,
risulteranno di fondamentale importanza quando si affronterà lo studio delle relazioni statistiche
(connessione e concordanza).
Luogo di nascita della sposa
Luogo di nascita dello sposo
Stesso comune
Altro comune della stessa provincia
Altro comune di altra provincia
Totale
Altro comune della
stessa provincia
Altro comune di altra
provincia
Totale
1970,62
80,57
29,81
2081,00
383,52
15,68
5,80
405,00
91,86
3,75
1,39
97,00
2446,00
100,00
37,00
2583,00
Stesso comune
21