Calcolo delle probabilità

La probabilità
Calcolo combinatorio ed elementi di
probabilità
Origini e definizioni
Il calcolo delle probabilità è nato intorno ai giochi di azzardo. Oggi è una disciplina a sé
stante che può essere di ausilio per molte altre discipline e studi, come ad esempio, la
biologia, la fisica, l'economia, la tecnologia e, ovviamente, le scienze statistiche e
sociali.
Tutto deriva dal concetto di CASO: alcuni lo definiscono come il risultato dell'azione di
molte concause indipendenti tra loro e non note. In filosofia il caso è qualcosa che si
verifica senza che se ne possa identificare la causa. Un evento che si manifesta 'a caso'
è un evento accidentale, imprevedibile, all'opposto di evento certo, prevedibile, che
non accade 'a caso'. Sembra una contraddizione in termini, ma non si può parlare di
probabilità associata ad un evento, se questo evento non è imprevedibile.
Origini e definizioni
Nel gioco d'azzardo, dadi, roulette, lotto, si può parlare di probabilità che si verifichi un
certo risultato (un evento, appunto) se tutti gli eventi non sono condizionati nel loro
manifestarsi, da elementi prevedibili. La faccia di un dato dalla forma perfetta, lanciato
su una superficie senza alcuna perturbazione, si presenta una volta su 6, tante quante
sono le facce, perché ciascuna ha la stessa probabilità di presentarsi, non avendo
elementi per stabilire che una faccia abbia una probabilità maggiore delle altre di
presentarsi. Nella roulette o nel lotto, ogni numero ha la stessa probabilità degli altri di
presentarsi se non ci sono 'trucchi' che condizionano il risultato dell'estrazione.
Una persona colpita perché che si trova sulla traiettoria di una palla da golf si può dire molto sfortunata, perché
quell'evento è imprevedibile e, di certo, quella persona non lo aveva previsto. Questo esempio può considerarsi
come la somma di eventi indipendenti tra loro (il tiro della pallina non a scopo offensivo e la presenza di un
individuo sulla sua traiettoria), ma può anche vedersi come una concomitanza di cause che forse potrebbero
non essere del tutto ignote.
Origini e definizioni
Insomma, cosa sia esattamente l'incertezza è ancora ragione di molte discussioni e se
ne parla fin dal 500 a.C. Einstein in persona diceva di non poter ammettere che Dio
giochi a dadi, intendendo che quello che ci sembra casuale è solo frutto di
informazioni mancanti, che, se fossero note, permetterebbero di determinare ogni
evento.
Supponiamo di lanciare una moneta: possono verificarsi due eventi, testa o croce, che
indichiamo con T e C
Se invece la lanciamo due volte abbiamo le seguenti possibilità:
(T;T); (T;C); (C;T); (C;C);
L’insieme di tutti i lanci possibili definisce lo spazio di probabilità dell’evento lancio
della moneta, anche detto spazio campionario.
Origini e definizioni
Un evento casuale viene detto aleatorio
● Un evento aleatorio è possibile, se può verificarsi (l’estrazione di una pallina
bianca da un’urna di palline bianche e nere è possibile)
● Un evento aleatorio è impossibile se non può può verificarsi (l’estrazione di una
pallina bianca da un’urna di palline nere è impossibile)
● Un evento aleatorio certo se si verifica sicuramente ((l’estrazione di una pallina
bianca da un’urna di palline bianche certo)
Due eventi si dicono incompatibili se il verificarsi di uno esclude il verificarsi dell’altro
(l’uscita T nel lancio di una moneta è incompatibile con l’uscita C)
Due eventi sono necessari se uno dei due deve necessariamente verificarsi (nel lancio
di una moneta deve verifiarsi o T o C)
Due eventi sono complementari se uno si verifica quando non si verifica l’altro.
Origini e definizioni
Nel calcolo delle probabilità è molto importante il concetto di evento e di prova. Nel
lancio di una moneta la prova è il lancio vero e proprio; gli eventi possibili sono
due, l’uscita di T o l’uscita di C.
Nel lancio del dado la prova è ancora il lancio vero e proprio; gli eventi possibili sono 6,
i sei risultati possibili, 1, 2, 3, 4, 5 e 6.
Tutti i dati a cui si può associare una probabilità sono detti aleatori. I numeri aleatori o
le variabili aleatorie, sono dette anche variabili casuali o stocastiche.
Se ad una distribuzione di risultati si associano le probabilità si ottiene una
distribuzione di probabilità
Origini e definizioni
Definizione soggettivista di probabilità
La probabilità è il grado di aspettativa sul verificarsi di un evento ed è espressa con un
numero reale p compreso tra 0 e 1: 0 ≤ p ≤ 1
Esempio: Nel lancio di una moneta si dice che T ha probabilità del 50% di verificarsi, cioè è 0,5 e questa è la
nostra fiducia nell’evento T.
Definizione classica di probabilità
La probabilità di un evento è il rapporto tra il numero di casi favorevoli e il numero di
quelli possibili (se non si può escludere che tutti i casi siano ugualmente possibili)
Esempio: Nel lancio del dado la probabilità che esca il numero 2 è ⅙=0.17 perché in tutto ci sono 6 facce (casi
possibili) e quella che attendo che esca è una sola (casi favorevoli)
Nel lancio di una moneta la probabilità che esca T è ½=0.5, perché il numero di casi possibili è 2 mentre quello
dei casi favorevoli è 1
Origini e definizioni
Esempio: Ancora nel casi del lancio di una moneta la probabilità che esca o T o C è 1 perché il numero di casi
favorevoli (2) e quello dei casi possibili (2) coincide.
Esempio: Da un’urna contenente 7 palline di cui 2 bianche, tre rosse e due nere, si estrae una pallina. Qual’è la
probabilità che la pallina estratta sia rossa? p=3/7 perché ho 3 casi favorevoli e 7 possibili.
Esempio: Lanciando due volte una moneta, qual’è la probabilità che esca TT, cioè T al primo lancio e T al
secondo lancio? Contiamo i casi possibili e i casi favorevoli: il caso favorevole è uno solo; i casi possibili sono:
TT, TC, CT, CC, cioè 4. La probabilità che esca TT è allora ¼ =0.25.
Se la lanciamo 3 volte, qual’è la probabilità che esca TCC? Ancora una volta il caso favorevole è uno solo,
mentre i casi possibili sono 8: TTT, TTC, TCT, TCC, CTT, CTC, CCT, CCC.
Se invece voglio la probabilità che si abbiano due teste e una croce, indipendentemente dall’ordine con cui si
presentano, i casi favorevoli salgono a 2, mentre i casi possibili sono sempre 8: p=2/8=¼=0.25
Infine, se voglio calcolare la probabilità di avere almeno due teste, indipendentemente dal terzo risultato,
p=3/8
Origini e definizioni
Definizione frequentista di probabilità -LEGGE EMPIRICA DEL CASO
La probabilità è il limite a cui tende la frequenza relativa dell’evento al tendere
all’infinito del numero di prove effettuate nelle stesse condizioni.
Questa definizione è impostata in modo più teorico delle due precedenti in quanto
nella pratica non è possibile ripetere all’infinito il numero di prove per determinare
esattamente la su probabilità. Essa però, operativamente, è utilizzata quando si ha a
disposizione una serie di prove di un evento e allora si stima come probabilità la
frequenza relativa con cui si presenta quell’evento. Tanto più numerose sono le prove,
quanto più accurata è la stima della probabilità ad esso associata è affidabile. Se si
considera come prove ripetute una serie temporale, può accadere che nelle varie
prove cambino le condizioni e la probabilità non sia effettivamente calcolabile.
Origini e definizioni
Vale a dire che se si ripete un esperimento (ad esempio lancio di dadi, lancio di
moneta, estrazione di palline da un urna) nelle stesse condizioni, a lungo andare la
frequenza relativa con cui un certo evento si manifesta tende a coincidere con la sua
probabilità.
Tale legge è anche detta ‘legge dei grandi numeri’ ed è quella a cui si appellano i
giocatori del lotto quando puntano sull’uscita dei numeri ritardatari. In realtà ad ogni
nuova estrazione le condizioni sono identiche alle precedenti estrazioni per cui ogni
numero ha la stessa probabilità di uscire e non probabilità maggiore perché non è
uscito da un certo numero di estrazioni.
Origini e definizioni
Esempio: Se voglio determinare la probabilità di rialzo di un titolo in borsa, la serie dei rialzi nel tempo può
essere indicativa, ma ad ogni rilevazione del valore del titolo sono cambiate le condizioni generali del mercato
quindi non è detto che la probabilità rilevata sia attendibile.
Se invece voglio determinare se lanciando una moneta la probabilità che esca C è 0,5, posso fare 1000 lanci
della moneta. Può capitare che si ottenga una probabilità di 0,6. In tal caso posso concludere che la moneta
non fosse perfettamente bilanciata e che quindi la probabilità delle due facce non fosse identica; oppure posso
pensare che 1000 lanci non fossero sufficienti perché troppo lontani dall’infinito della definizione di
probabilità; infine posso pensare che il lanci non fossero fatti tutti nelle stesse condizioni perché ad un certo
punto il lanciatore si è stancato ed è stato sostituito da un altro lanciatore.
Origini e definizioni
Definizione assiomatica di probabilità
La probabilità di un evento E è un numero p tale che 0 ≤ p(E) ≤ 1, se E è certo p(E) =1,
se E è impossibile p(E) =0, se E1 ed E2 sono incompatibili
p(E1 o E2)=p(E1) + p(E2)
Se due eventi sono indipendenti, p(E1 e E2)=p(E1)p(E2)
Se due eventi non sono indipendenti p(E1 e E2)=p(E1)p(E2|E1): la probabilità che si
verifichi sia E1 che E2 è pari alla probabilità di E1 moltiplicata per la probabilità di E2
condizionata al verificarsi di E1 (teorema delle probabilità composte)
Se due eventi non sono incompatibili (potrebbero verificarsi entrambi)
p(E1 o E2)=p(E1)+p(E1)+p(E1 e E2): la probabilità che si verifichi E1 o E2 è pari alla
somma delle probabilità di E1, E2 ed entrambi.
Calcolo combinatorio
E’ una branca della matematica che aiuta a contare i modi con cui si presentano gli
eventi ed è pertanto fondamentale nel calcolo delle probabilità. Richiamiamo allora
alcuni concetti utili.
Le permutazioni di N oggetti, rappresentano i modi in cui possiamo ordinare questi N
oggetti. Il primo oggetto può essere scelto tra N, il secondo tra N-1, ecc. Si può
dimostrare che PN=N(N-1)(N-2) … 3⋅2⋅1=N!
Inoltre 0!=1
Esempio: Le permutazioni di a, b, c, d sono 4!=4⋅3⋅2⋅1=24
abcd
bacd
cabd
dabc
abdc
acbd
bcda
cbad
dbac
acdb
adbc
bdac
cdab
dcab
adcb
badc
bcad
bdca
cadb
cbda
cdba
dacb
dbca
dcba
Calcolo combinatorio
Le disposizioni di N elementi presi k a k (anche detti di classe k), DN,k, rappresentano il
numero di gruppi di k elementi che si possono estrarre da N, dove elementi posti in
ordine diverso individuano gruppi diversi
DN,k=N(N-1)(N-2) … (N-k+1)
Esempio: Le disposizioni di 4 elementi a, b, c, d di classe 2 sono: D4,2=4⋅3=12 e precisamente:
ab
ba
ca
da
ac
bc
cb
db
ad
bd
cd
dc
Le disposizioni con ripetizione di N elementi di classe k, a differenza delle disposizioni
già viste, conteggiano anche gruppi in cui un elemento compare più di una volta. In
questo caso *DN,k=Nk in quanto ciascun elemento può essere scelto tra tutti gli N
elementi.
Esempio: Nell’esempio precedente le disposizioni con ripetizione di 4 elementi a, b, c, d di classe 2 sono:
D4,2=42=16 perché ai precedenti dobbiamo aggiungere i gruppi: aa bb cc dd
Calcolo combinatorio
Le combinazioni di N elementi di classe k, CN,k, rappresentano il numero di gruppi di k
elementi che si possono estrarre da N, indipendentemente dall’ordine degli elementi
nei gruppi
Esempio: Le combinazioni di 4 elementi a, b, c, d di classe 2 sono:
e precisamente ab bc cd ac bd ad
Le combinazioni con ripetizione di N elementi di classe k, conteggiano tutti i gruppi di
k elementi in cui ciascun elemento può comparire più di una volta.
Esempio: Le combinazioni con ripetizione di 4 elementi a, b, c, d di classe 2 sono: *C4,2=(5⋅4)/(2⋅1)=10 e basta
aggiungere a quelli visti prima i gruppi aa bb cc dd
Calcolo combinatorio
Esempi: calcoliamo la probabilità che lanciando due dadi contemporaneamente la somma dei punti che appare
sulla fascia superiore sia 2
Innanzi tutto dobbiamo contare i casi possibili e i casi favorevoli. I casi possibili sono tutte le coppie di numeri
con ripetizione presi tra 6 numeri. Quindi sono le disposizioni con ripetizione di 6 numeri di classe 2
*DN,k=Nk=62=36
I casi favorevoli sono solo 1 in quanto solo il caso in cui entrambi i dadi diano valore 1 può dare origine ad una
somma 2. Quindi la probabilità cercata è p(2)=1/36
Calcoliamo ora la probabilità che la somma delle facce superiori sia 3. Anche in questo caso i casi possibili sono
36, ma i casi favorevoli ora sono 2 perché la somma 3 si può ottenere con due possibili combinazioni: il primo
dado 1 e il secondo 2 o, viceversa, il primo 2 e il secondo 1. Quindi la probabilità cercata è p(3)=2/36
Analogamente p(4)=3/36; p(5)=4/36; p(6)=5/36; p(7)=6/36; p(8)=5/36; p(9)=4/36; p(10)=3/36; p(11)=2/36;
p(12)=1/36
La somma di queste probabilità è, ovviamente, 1 in quanto (1+2+3+4+5+6+5+4+3+2+1)/36=1
Teorema di Bayes
Nel calcolo di una probabilità, possiamo anche tenere conto degli eventi che possono
modificare la valutazione di un certo evento E. Per fare ciò ricordiamo che il teorema
delle probabilità composte, visto prima, diceva che
p(E e H)=p(E)p(H|E) ma è anche vero che p(H e E)=p(H)p(E|H)
Ma allora, dal momento che p(E e H)=p(H e E) anche p(E)p(H|E)=p(H)p(E|H)
da qui
cioè la probabilità di un evento E subordinatamente ad H è uguale alla probabilità di E
per la probabilità di H dato E diviso per la probabilità di H
p(E) è la probabilità a priori; p(E|H) è la probabilità a posteriori; p(H|E) è la
verosimiglianza
Teorema di Bayes
Esempio: Si hanno due urne A e B. L’urna A contiene nove palline bianche e una nera, l’urna B contiene 9
palline nere e una bianca. E’ stata estratta una pallina bianca da una delle due urne. Determiniamo la
probabilità che la pallina sia estratta dall’urna A.
Se non sapessimo che la pallina estratta è bianca, la probabilità sarebbe pari a ½ in quanto non si avrebbero
informazioni per determinare alcuna probabilità quindi daremmo metà probabilità a ciascuna urna. Sapere
però che la pallina estratta è bianca è una informazione importante.
Diciamo che E è l’evento ‘estrazione dall’urna A’, mentre H è l’evento estrazione di una pallina bianca. p(E)=½
(due casi possibili, uno favorevole); p(H)=½ (due casi possibili, uno favorevole)
p(E/H) è la probabilità di estrarre dall’urna A dato che la pallina estratta è bianca (incognita).
p(H/E)=9/10 è la probabilità di estrarre una pallina bianca dato che l’urna è A. Allora per la formula di Bayes:
Teorema di Bayes
Il teorema di Bayes è di tale importanza che, come conseguenza della sua assunzione,
è nata una vera e propria branca della statistica, denominata appunto statistica
bayesiana. Essa cerca di sfruttare un insieme di conoscenze che portano alla
formazione di convizioni non immediate e, talvolta, differenti da quelle a cui si arriva
con la statistica classica.
Secondo gli statistici bayesiani ogni fenomeno ha alla sua base una certa distribuzione
a priori di probabilità e la decisione che si prende rispetto a quel fenomeno è
condizionata da essa. Spesso tale probabilità è di tipo soggettivo e si fa molto uso di
informazioni rilevate in altre occasioni simili a quella in oggetto ma accadute in
passato o in altri contesti.
Teorema di Bayes
Esempio: Una compagnia di assicurazioni ritiene che gli assicurati possano essere suddivisi in due classi: a
rischio di incidente e non a rischio di incidente. Le loro statistiche mostrano che una persona a rischio avrà un
incidente di qualche tipo all'interno di un periodo fissato di un anno con probabilità 0,4, mentre tale probabilità
è pari a 0,2 per le persone non a rischio. Supponiamo che il 30% delle persone sia a rischio, qual è la probabilità
che un nuovo assicurato abbia un incidente nel primo anno di polizza? Supponiamo poi che un nuovo
assicurato abbia un incidente entro un anno dalla prima stipulazione della polizza. Qual è la probabilità che sia
a rischio?
Si considerino i seguenti eventi:
●
I = il nuovo assicurato ha un incidente entro il primo anno dalla stipulazione della polizza
●
R = la persona è a rischio
p(I)=0,30 * 0,40 + 0,70 * 0,20 = 0,26 (prob. di incidente nel primo anno di polizza)
Per il teorema di Bayes, la probabilità che l’automobilista sia a rischio dato che ha avuto un incidente nel primo
anno di polizza è:
Distribuzioni di probabilità
Esistono diverse distribuzioni teoriche di probabilità (vedere slide 5 parte 1)
La più famosa e la più usata in statistica è la normale che ha le seguenti proprietà:
● è asintotica all’asse x nei valori
estremi del suo campo di definizione,
● è simmetrica rispetto al valore centrale
● cresce fino al valore centrale e poi
decresce fino allo zero
● moda, mediana e media aritmetica
coincidono
● ha due flessi, uno ascendente e uno
discendente, in corrispondenza di due valori che dipendono dalla media e dallo
scostamento quadratico medio.
Distribuzioni di probabilità
Un ruolo molto importante fra le infinite distribuzioni normali è svolto dalla
distribuzione normale standardizzata che ha media aritmetica uguale a 0 e
scostamento quadratico medio uguale a 1, ossia dalla distribuzione N(0;1)
Essa rappresenta la probabilità di un evento rilevato con una variabile standardizza.
L’area sotto la curva normale standardizzata fino ad un certo valore z è la frequenza
relativa delle unità che presentano valore del carattere fino al valore z. L’area tra due
valori, z’ e z’’, rappresenta la frequenza relativa, e quindi la probabilità, che si verifichi
un valore compreso tra z’ e z’’. L’altezza della curva in corrispondenza di un valore z è la
densità, ovvero la probabilità che si verifichi esattamente z.
Distribuzioni di probabilità
Il valore della funzione di ripartizione (area sotto la curva) e della densità (ordinata in
corrispondenza di z) si possono trovare con l’uso di tavole (vedi slide 5 parte 1)
Qualsiasi siano i parametri μ (media) e
σ (scarto quadratico medio), l’area della
porzione di curva delimitata dalla media
e un’ordinata espressa in termini di
deviazioni standard è costante
μ+σ= 34.13% della distribuzione
μ+2σ= 47.73% della distribuzione
μ+3σ= 49.86% della distribuzione