1 CAPITOLO II ELEMENTI DI CALCOLO DELLE PROBABILITA' 1. Spazio dei campioni ed eventi • Sia eseguito un esperimento (es. il lancio di un dado), si dice spazio dei campioni o spazio campionario S l'insieme di tutti i possibili esiti (risultati) di quell'esperimento. Nel caso del lancio di un dado lo spazio dei campioni è S = {1,2,3,4,5,6} . Possiamo darne una rappresentazione grafica con un diagramma di Venn • Si dice evento un sottoinsieme dello spazio dei campioni. 1 2 3 4 Esempio il sottoinsieme {4,5} è un evento. 5 6 • Un evento si dice elementare se è un sottoinsieme dello spazio dei campioni formato da un solo elemento. Lo spazio dei campioni è quindi l'insieme degli eventi elementari. • L'evento certo coincide con S • L'evento impossibile è il sottoinsieme vuoto ∅ Fra l'evento certo e l'evento impossibile c'è tutta una vasta gamma di eventi che hanno diverse possibilità di verificarsi. La teoria della probabilità è una teoria della misura che vuole appunto misurare la possibilità che un evento ha di verificarsi. Si possono dare diverse definizioni di probabilità a seconda del contesto in cui si devono applicare: sono ciascuna una generalizzazione dell'altra nel senso che la successiva comprende la precedente come caso particolare. Esse sono: 1. La definizione classica o di Laplace 2. La definizione frequentistica o statistica 3. La definizione soggettiva 4. La definizione assiomatica. 2. La composizione degli eventi • Si dice evento somma o unione o totale di due eventi E1 e E2 l'evento che si verifica quando almeno uno dei due si verifica. E' l'unione in senso insiemistico degli eventi e si indica con E 1 ∪ E2. • Es: nel caso del lancio del dado se E 1 = { 1, 2 } ed E2 = { 2, 3, 4 } allora E 1 ∪ E2 = { 1, 2, 3, 4 } Si dice evento intersezione o composto o prodotto di due eventi E1 e E2 l'evento che si verifica quando si verificano entrambi gli eventi. E' l'intersezione in senso insiemistico degli eventi e si indica con E1 ∩ E2. E2 Es: nel caso del lancio del dado se E 1 = { 1, 2, 3 } ed E2 = { 2, 3, 4 }. Allora E1 ∩ E2 E1 ∩ E2 = { 2, 3 } E1 • Sia E un evento si dice evento contrario e si indica con non E l'evento che si verifica quando non si verifica E. E e non E si dicono anche opposti o complementari. Nell'esempio dei dadi se E = { 1, 2, 3 }, non E = { 4, 5, 6 }. Non E E • Due eventi E1 e E2 si dicono compatibili se si possono verificare entrambi, cioè E1 ∩ E2 ≠∅ S 2 • Due eventi E1 e E2 si dicono incompatibili se non si possono verificare entrambi, quindi il verificarsi dell'uno esclude il verificarsi dell'altro. Ne segue che E 1 ∩ E2 = ∅ 3. Definizione classica di probabilità Sia dato uno spazio dei campioni formato da n eventi elementari, sia E un evento formato da m eventi elementari, nell'ipotesi che tutti gli eventi elementari dello spazio dei campioni siano m equiprobabili, si definisce p ( E ) = n Tale probabilità gode delle seguenti proprietà: 1. 0 ≤ P (E) ≤ 1 2. P(E) = 0 se E è impossibile 3. P(E) = 1 se E è certo N.B: tale definizione ha evidentemente un vizio logico in quanto la definizione contiene già il concetto che deve definire. Tuttavia dire che gli eventi elementari dello spazio dei campioni devono essere equiprobabili va inteso nel senso che si ritiene di non avere elementi tali che facciano pensare il contrario. Ad esempio se sappiamo che un dado è stato fatto a regola d'arte con materiale omogeneo con spigoli egualmente arrotondati ecc.. non abbiamo motivi per ritenere che una faccia abbia più probabilità di verificarsi di altre. Ovviamente la condizione di equiprobabilità degli eventi elementari costituisce una condizione perché si possa applicare la definizione classica. 4. Teoremi sulla probabilità Teorema 4.1 : Teorema dell'evento unione di eventi incompatibili Siano E1 e E2 due eventi incompatibili allora P(E1 ∪ E2 ) = P(E1) + P(E2). Dim: siano m1 gli eventi elementari costituenti E 1 e m2 gli eventi elementari costituenti E 2, essendo E1 e E2 incompatibili non hanno elementi in comune per cui E 1 ∪ E2 è costituito da m1 + m2 elementi. Ne segue che P(E1 ∪ E2 ) = m1 + m2 m1 m2 + = = P(E1) + P(E2) n n n Es.: sia dato un mazzo di 40 carte, sia E 1 l'evento " esca un asso", sia E 2 l'evento " esca un re". Si vuole calcolare la probabilità dell'evento "esca un asso o un re". Essendo gli eventi incompatibili tale probabilità si 4 4 1 + ottiene = 40 40 5 Teorema 4.2 : Teorema dell'evento unione di eventi compatibili Siano E1 e E2 due eventi compatibili allora P(E1 ∪ E2 ) = P(E1) + P(E2) - P(E1 ∩ E2). Dim: siano m1 gli eventi elementari costituenti E1 e m2 gli eventi elementari costituenti E2, poiché E1 e E2 sono compatibili ci saranno degli eventi elementari comuni, siano r. Per cui l’evento E1 ∪ E2 è formato da m1 + m2 - r eventi elementari per cui P(E 1 ∪ E2 ) = m1 + m2 − r m m r = 1 + 2 − = n n n n P(E1) + P(E2) - P(E1 ∩ E2) N.B: il teorema 4.1 è un caso particolare del teorema 4.2 in quanto nel caso in cui E 1 e E2 siano incompatibili allora P(E1 ∩ E2) = 0 Es.: sia dato un mazzo di 40 carte, sia E 1 l'evento "esca una carta di spadi" e E 2 l'evento "esca un asso", l'evento E1 ∪ E2 è "esca una carta di spadi o un asso". E 1 e E2 sono compatibili in quanto può uscire anche 3 10 4 + da cui si deve togliere la probabilità che esca l'asso di spadi perché 40 40 10 4 1 13 + − altrimenti sarebbe contata due volte. Per cui P(E 1 ∪ E2 ) = = 40 40 40 40 l'asso di spadi. P(E1 ∪ E2 ) = Teorema 4.3 : generalizzazione dei teoremi 4.1 e 4.2 nel caso di 3 eventi Siano E1, E2, E3, 3 eventi qualsiasi, si dimostra che: P(E1 ∪ E2 ∪ E3) = P(E1) + P(E2) + P(E3) - P(E1 ∩ E2) - P(E1 ∩ E3) - P(E2 ∩ E3) + +P(E1 ∩ E2 ∩ E3) Dim: alla somma della probabilità dei tre eventi si deve togliere la probabilità degli eventi a due a due comuni altrimenti questi eventi sarebbero contati due volte ma si deve aggiungere la probabilità dell'evento comune a tutti e tre gli eventi perché tale evento è stato contato tre volte in P(E 1) + P(E2) + P(E3) ma anche tolto tre volte, per cui almeno una volta deve comparire. Nel caso particolare in cui E1, E2, E3 siano a due a due incompatibili il teorema diventa: P(E1 ∪ E2 ∪ E3) = P(E1) + P(E2) + P(E3) Teorema 4.4: Probabilità dell'evento contrario ad un evento P( non E) = 1 - P (E) Dim: P( E ∪ non E ) = P(S) =1. Tuttavia essendo E e non E incompatibili sarà P( E ∪ non E ) = P (E) + P( non E) = 1 da cui P( non E) = 1 - P (E) 5. Probabilità condizionata Def: La probabilità che un evento E 1 si verifichi nell'ipotesi che l'evento E 2 si sia verificato si dice probabilità condizionata di E1 rispetto a E2 e si scrive P ( E1/ E2 ). Def: se P ( E1/ E2 ) = P ( E1/ non E2 ) allora i due eventi si dicono stocasticamente indipendenti, il che vuol dire che la probabilità dell'uno non dipende dal fatto che l'altro si sia oppure no verificato. In caso contrario si dice che un evento è dipendente dall'altro. Il modello di eventi indipendenti è costituito dalle estrazioni successive da un'urna di una pallina con reintroduzione nell'urna di quella estratta precedentemente. Quando invece la pallina estratta non viene reimmessa nell'urna, i due eventi "estrazioni successive" sono dipendenti. Calcolo di P ( E1/ E2 ) Sia n il numero degli elementi che costituiscono lo spazio dei campioni, m il numero degli eventi elementari di E 1 e k il numero di quelli di E2, r il numero degli eventi elementari di E1 ∩ E2. E1 S formato da n elementi E2 m E1∩E2 r k 4 r r n Per la definizione classica di probabilità P ( E1/ E2 ) = = = k k n E2 ) = P( E1 ∩ E 2 ) P( E 2 ) . Analogamente P ( E2/ E1 ) = P( E1 ∩ E 2 ) P( E 2 ) . In conclusione P ( E1/ P( E1 ∩ E 2 ) P( E1 ) Risulta che P ( nonE1/ E2 ) = 1- P ( E1/ E2 ). k −r r Infatti P( nonE1/ E2 ) = = 1= 1- P ( E1/ E2 ). k k Esempio1. Si lanciano due dadi. Qual è la probabilità di avere come somma 8 (evento E 1) sapendo che il risultato ha dato come somma un numero pari (evento E2)? Occorre cioè calcolare P ( E1/ E2 ). Sarà E1 = { (2,6); (3,5); (4,4); (5,3); (6,2) }. Lo spazio dei campioni è in questo caso costituito dall'evento E 2 che è formato da 18 eventi elementari che sono i numeri pari. 5 Quindi P( E1/ E2 ) = 18 Esempio 2 Si lanciano tre monete. Sia E1 l'evento "non esce nessuna testa" ed E 2 l'evento "escono meno di due teste". Si vuole calcolare P( E1/ E2 ). Lo spazio dei campioni è E2 = { (T,C,C); (C,T,C); (C,C,T); (C,C,C) }, per cui essendo E1 = {(C,C,C) }, P( E1/ 1 E2 ).= 4 Teorema 5.1: probabilità dell'evento intersezione di due eventi P(E1 ∩ E2) = P(E1) P(E2/E1) = P(E2) P(E1/E2) Dim: la formula si deduce direttamente dalla definizione di probabilità condizionata. In particolare se E1 e E2 sono indipendenti, allora P(E2/E1) = P(E2) e P(E1/E2) = P(E1), quindi P(E1 ∩ E2) = P(E1) P(E2) Esempio: Sia data un'urna con 20 palline bianche, 10 rosse e 5 nere. Facciamo due estrazioni successive con reintroduzione. Calcolare la probabilità che si verifichi l'evento che la 1° pallina sia bianca e la seconda sia rossa. E1= " la 1° estratta sia bianca", E 2 = " la 2° estratta sia rossa". Gli eventi sono indipendenti. Risulta 20 10 P(E1 ∩ E2) = P(E1) P(E2) = . 35 35 Tale probabilità può essere calcolata anche direttamente sulla base della definizione. Infatti risulta che gli eventi elementari che costituiscono lo spazio dei campioni sono le disposizioni con ripetizione di 35 elementi di classe 2 che sono 352, gli eventi elementari che costituiscono l'evento E1 ∩ E2 sono 20·10, cioè il numero di tutte le possibili coppie di cui la prima pallina è bianca e la seconda è rossa. Ne risulta che P(E1 ∩ E2) = Esempio: 20 ⋅10 35 2 5 Con i dati dell'esercizio precedente calcolare la stessa probabilità facendo però l'ipotesi che la 1° pallina estratta non venga rimessa nell'urna. In tal caso gli eventi risultano dipendenti. 20 10 Risulta pertanto che P(E1 ∩ E2) = P(E1) P(E2/E1) = 35 34 Infatti rifacendo il calcolo sulla base della definizione risulta che lo spazio dei campioni è costituito dal numero delle disposizioni senza ripetizione di 35 elementi di classe 2 cioè 35 · 34, mentre l'evento E 1 ∩ E2 è formato da tutte le coppie di cui la 1° è bianca e la 2° è rossa che sono 20 · 10. 20 ⋅10 Ne segue che P(E1 ∩ E2) = 35 ⋅ 34 Teorema 5.2: probabilità dell'evento intersezione di più eventi Esaminiamo il caso di tre eventi. P(E1 ∩ E2 ∩ E3) = P(E1) P(E2/E1) P(E3 / (E1 ∩ E2)) Dim: P(E1 ∩ E2 ∩ E3) = P((E1 ∩ E2) ∩ E3) = P(E1 ∩ E2) P(E3 / (E1 ∩ E2)) = =P(E1) P(E2/E1) P(E3 / (E1 ∩ E2)) Esempio: Sia data un'urna con 70 palline di cui 38 bianche, 22 verdi e 10 rosse. Calcolare la probabilità che estraendo successivamente 3 palline, senza rimettere ogni volta la pallina estratta nell'urna, le 3 palline siano tutte bianche. Sia E1 = "la 1° estratta sia bianca"; E2 = " la 2° estratta sia bianca"; E3 = " la 3° estratta sia bianca". Gli eventi sono fra loro dipendenti. Si tratta di calcolare P(E1 ∩ E2 ∩ E3). 38 37 36 2109 Applicando il teorema si ha che P(E1 ∩ E2 ∩ E3) = = 70 69 68 13685 Facendo il calcolo secondo la definizione lo spazio dei campioni è costituito da 70 * 69 * 68 eventi elementari che sono le disposizioni senza ripetizione di 70 elementi di classe 3, mentre l'evento 38 * 37 * 36 E1 ∩ E2 ∩ E3 è costituito da 38*37*36 eventi elementari. Quindi P(E1 ∩ E2 ∩ E3) = 70 * 69 * 68 6. Il teorema di Bayes Supponiamo di avere due urne U 1 e U2 contenenti rispettivamente 4 palline bianche e 6 nere e 3 bianche e 5 nere. Si estrae a sorte un’urna; dall’urna prescelta si estrae una pallina. Supponiamo che sia bianca. Qual è la probabilità che essa provenga dall’urna U 1? Tale problema si risolve con la formula di Bayes. In generale il problema si pone nei termini seguenti: supponiamo che un evento E possa essere determinato da n cause H 1, H2, ….Hi, ….Hn tali che Hi ∩ Hj = ∅, ∀ i ≠ j, cioè le cause siano a due a due incompatibili, ed inoltre H1∪H2 ∪….Hi ∪...Hn = S che è l'evento certo (ciò è equivalente a dire che H 1, H2, ….Hi, ….Hn costituiscono una partizione di S). Supponiamo inoltre che siano note le P(H i) e le P(E / Hi) cioè la probabilità che l'evento E si verifichi per la causa H i. Sappiamo inoltre che E si è verificato, vogliamo calcolare che sia stata la causa H i a determinarlo, cioè vogliamo determinare P(H i / E). Si dimostra la formula P( H i ) P( E / H i ) seguente: P(Hi / E) = n ∑ P( H k =1 k ) P( E / H k ) Infatti, per definizione, P(Hi / E) = P( H i ∩ E ) P( H i ) P( E / H i ) = P( E ) P( E ) n Ma E = (E ∩ H1) ∪ (E ∩ H2) ∪ (E ∩ H3 ) ∪ ….∪ (E ∩ Hn ) allora P(E) = ∑P( H k =1 k ) P ( E/ H k ) , quindi 6 P( H i ) P( E / H i ) P(Hi / E) = n ∑ P( H k =1 k ) P( E / H k ) come volevasi dimostrare. Per quanto è stato detto la formula di Bayes può essere scritta anche P(H i / E) = P ( H i ) P ( E/ H i ) . P( E ) Nel caso dell'esempio precedente dell'urna risulta: 1 1 H1 = "estratta l'urna U1" ; P(H1) = H2 =" è estratta l'urna U2" ; P(H2) = 2 2 4 2 3 E = " la pallina estratta sia bianca"; P(E/H 1) = = ; P(E/H2) = 10 5 8 12 P( H 1 ) P( E / H 1 ) 25 Occorre calcolare P(H1/E) = = = 12 13 P ( H 1 ) P ( E / H 1 ) + P ( H 2 ) P( E / H 2 ) + 25 28 1 16 5 = = 1 3 31 + 5 16 p(Hi) si dice la probabilità a priori dell’evento H i, mentre P(Hi/E) si dice la probabilità a posteriori perché è calcolata sapendo che si è verificato l’evento E. 7. Applicazione del Teorema del Bayes ai Test diagnostici Un test diagnostico o screening è un test che viene applicato a soggetti che non presentano ancora alcuna sintomatologia clinica, al fine di prevenire la malattia. Coloro che risultano positivi al test hanno una maggiore probabilità di contrarre la malattia e in genere vengono sottoposti ad ulteriori accertamenti. Introduciamo i seguenti simboli: Em = è l’evento che il soggetto è malato Es = è l’evento che il soggetto è sano T+ = è l’evento che il risultato del test cui il soggetto è stato sottoposto è positivo T- = è l’evento test negativo Ci sono varie incertezze quando si esegue un test diagnostico. Si verifica un falso negativo quando il test è negativo ma il soggetto è malato. La probabilità di un falso negativo è P(T-/ Em). Si verifica un falso positivo quando il test dà un risultato positivo ma il soggetto non è malato. La probabilità di un falso positivo è P(T+/Es). Si dice sensibilità di un test la probabilità di avere risultati positivi quando il soggetto è realmente malato, cioè sensibilità = P(T+/Em). Risulta P(T+/Em) = 1- P(T-/ Em) Si dice specificità di un test la probabilità di avere risultati negativi quando il soggetto è sano, cioè specificità = P(T-/Es). Risulta P(T-/Es) = 1- P(T+/Es). Nel caso dei test diagnostici è particolarmente importante calcolare la probabilità che l’individuo sia malato nel caso in cui il test sia positivo, cioè P(Em/T+). Tale probabilità si dice valore predittivo di un test positivo. Dal teorema di Bayes risulta: P(Em/T+) = P( E m ) P(T + / E m ) P ( E m ) P (T + / E m ) + P ( E s ) P (T + / E s ) La P(Em) si dice anche prevalenza della malattia e viene determinata mediante indagine statistica su una certa popolazione. Ovviamente P(Es) = 1- P(Em). P(T+/Em) è la sensibilità del test. 7 P(T+/Es) è la probabilità di avere un falso positivo. Analogamente si può calcolare il valore predittivo di un test negativo che è P(Es/T-). Dal teorema di Bayes risulta: P( E s / T − ) = P ( E s ) P (T − / E s ) P ( E s ) P (T − / E s ) + P ( E m ) P (T − / E m ) Esempio. Da un indagine risulta che in una certa regione si hanno 9,3 casi di tubercolosi per 100.000 abitanti, inoltre tutti i soggetti di uno studio sono stati sottoposti ad una radiografia al torace per evidenziare l’esistenza di una patologia infiammatoria, e la sensibilità del test è risultata pari a 0,7333 e la sua specificità pari a 0,9715. Si chiede di calcolare il valore predittivo di un test positivo e quello di un test negativo. + Sarà valore predittivo del test positivo = P(Em/T ) = P( E m ) P(T + / E m ) P ( E m ) P (T + / E m ) + P ( E s ) P (T + / E s ) Dai dati risulta: P(Em) = 0,000093 P(Es) = 1-0,000093 = 0,999907 Sensibilità = P(T+/Em) = 0,7333 P(T+/Es) è l’evento contrario della specificità cioè 1- P(T -/Es) = 1- 0,9715 = 0,0285 Quindi si ha: (0,000093)(0,73333) = 0,00239 P(Em/T+) = (0,000093)(0,73333) + (0,999907)(0,0285) − Inoltre il valore predittivo di un test negativo è P ( E s / T ) = P ( E s ) P (T − / E s ) P ( E s ) P (T − / E s ) + P ( E m ) P (T − / E m ) Risulta: P(T-/Es) = specificità = 0,9715 P(T-/Em) = 1- P(T+/Em) = 1- 0,7333 = 0,2667 (0,999907)(0,9715) Quindi P(Es/T-) = = 0,99997 (0,999907)(0,9715) + (0,000093)(0,2667) La probabilità 0,0093% rappresenta la probabilità che un individuo di quella regione ha di essere affetto da tubercolosi. Tale probabilità è definita probabilità a priori. Dopo aver fatto la radiografia ed aver ottenuto un risultato positivo lo stesso soggetto ha una probabilità di essere malato pari al 0,239%. Tale probabilità si dice probabilità a posteriori, in quanto considera una nuova informazione cioè il risultato del test. Osservazione: sarebbe auspicabile che un test diagnostico fosse altamente sensibile e altamente specifico. In realtà però un simile test non esiste. Talvolta si è costretti a privilegiare la sensibilità o la specificità. Un test sensibile è preferibile quando non individuare la malattia ha conseguenze pericolose, un test specifico è importante quando ad essere dannoso è un risultato falso positivo. Ad esempio come strumento diagnostico per individuare eventuali rigetti del rene si utilizza il livello di creatinina sierica (composto chimico presente nel sangue) in milligrammi %. Un incremento di creatinina è spesso associato ad una successiva insufficienza renale. Nella prima colonna della tabella seguente ( M. Pagano, K. Gauvreau, Biostatistica, p. 111) sono riportati i vari livelli di creatinina come possibili indicatori di rigetto ( nel senso che valori superiori a quello scelto indicano un pericolo di rigetto) e nelle altre due la sensibilità e la specificità di un test che usasse quell’indicatore. Creatinina sierica(mg%) 1,2 1,3 Sensibilità Specificità 0,939 0,939 0,123 0,203 8 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 0,909 0,818 0,758 0,727 0,636 0,636 0,545 0,485 0,485 0,394 0,394 0,364 0,333 0,333 0,333 0,303 0,281 0,380 0,461 0,535 0,649 0,711 0,766 0,773 0,803 0,811 0,843 0,870 0,891 0,894 0,896 0,909 Come si vede dalla tabella aumentando la sensibilità diminuisce la specificità e viceversa. Il rischio relativo Il concetto di rischio relativo si pone quando si desidera confrontare le probabilità di malattia in due differenti situazioni o gruppi. Il rischio relativo RR è la probabilità che un soggetto appartenente ad un gruppo esposto a determinati fattori, sviluppi la malattia rispetto alla probabilità che un soggetto appartenente ad un gruppo non esposto (gruppo controllo) sviluppi la stessa malattia. Più precisamente è definito come la probabilità di malattia nel gruppo esposto diviso la probabilità di malattia nel gruppo non esposto RR= P (malattia / esposto) P (malattia / nonesposto ) Esempio: in uno studio sul cancro alla mammella, una donna è considerata come “esposta” se ha partorito il primo bambino all’età di 25 anni o oltre. In un campione di 4540 donne che hanno partorito il primo bambino prima dei 25 anni, 65 hanno sviluppato un cancro della mammella. Delle 1628 donne che hanno partorito il primo bambino all’età di 25 anni o oltre, a 31 è stato diagnosticato un cancro alla mammella. Se assumiamo che i numeri sono abbastanza grandi da soddisfare la definizione frequentista di probabilità, il rischio relativo di sviluppare un cancro alla mammella è RR= 31 / 1628 = 1,33 65 / 4540 Un rischio relativo di 1,33 vuol dire che le donne che hanno partorito il primo bambino all’età di 25 anni o oltre hanno una probabilità superiore del 33% di sviluppare un cancro alla mammella rispetto alle donne che hanno partorito ad un’età più giovane. In generale un rischio relativo di 1,0 indica che le probabilità di malattia del gruppo esposto e di quello non esposto sono uguali; pertanto non esiste un’associazione fra esposizione e malattia. 8. Definizione frequentista di probabilità Def. Si dice frequenza assoluta fa il numero delle volte che un certo evento E si verifica. Es: si lancia una moneta 100 volte "testa" esce 30 volte. Risulta fa = 30 Def. Si dice frequenza relativa fr il rapporto fra il numero dei successi di E ed il numero delle prove fatte n. fr = fa . Risulta ovviamente 0 ≤ fr ≤ 1 n 9 Analogie e differenze fra frequenza relativa e probabilità: • Analogie: sono entrambi numeri compresi fra 0 e 1, valgono 0 per eventi impossibili, 1 per eventi certi. • Differenze: la probabilità è un concetto a priori, la frequenza relativa un concetto a posteriori che necessita cioè di prove per essere definita. Si pone il problema di vedere che relazione esiste fra frequenza relativa e probabilità ed in particolare che 1 significato pratico ha, per esempio, dire che la probabilità che lanciando una moneta esca "testa" è . 2 Legge empirica del caso Quando il numero delle prove è piccolo, la frequenza relativa di un evento ha un carattere aleatorio e può cambiare notevolmente quando si ripeta per la seconda volta lo stesso numero di prove. Per esempio in 10 lanci di una moneta può capitare che "testa" esca due volte (f r =0,2), in altri 10 lanci "testa" può uscire invece 8 volte (fr = 0,8). L'esperienza dice che al crescere del numero delle prove fatte tutte nelle stesse condizioni, la frequenza relativa pur variando, tende a stabilizzarsi attorno ad un valore, cioè ordinariamente le fluttuazioni molto grandi sono sempre più rare, e tale valore attorno a cui le frequenze relative si stabilizzeranno corrisponde al valore della probabilità dell'evento. In ciò consiste la legge empirica del caso. Anche se impropriamente potremmo scrivere che lim n →∞ fa = P , impropriamente perché non si esclude che n si possano avere scostamenti notevoli dalla probabilità anche per valori alti di n. Vanno fatte alcune osservazioni: 1. La legge non è dimostrabile ma è puramente empirica 2. Il caso " non ha memoria" per cui se lanciando una moneta viene "testa" molte volte di seguito, ciò non ci autorizza a pensare che nel lancio successivo sia più probabile che esca "croce". Ogni lancio è indipendente dagli altri già effettuati. 3. La legge empirica del caso dà un significato pratico al concetto di probabilità. La probabilità è la frequenza relativa con cui un certo evento tende a presentarsi su un numero grande di prove. 4. La legge empirica del caso legittima la definizione frequentista o statistica di probabilità Def: si definisce probabilità di un evento in senso statistico la frequenza relativa che esso assume su un grande numero di prove eseguite tutte nelle medesime condizioni. Tale definizione si applica in quei casi in cui non è applicabile la definizione classica in quanto viene a mancare la condizione di equiprobabilità degli eventi elementari su cui essa si basa. Ad esempio se abbiamo delle buone ragioni per ritenere che un dado sia truccato, non essendo per esempio costruito con materiale omogeneo, non potremo ritenere equiprobabili l'uscita dei sei numeri per cui non potremo 1 assegnare alla probabilità di uscita del numero 1 il valore . L'alternativa è quella di ripetere il lancio del 6 dado un numero elevato di volte, calcolare la frequenza relativa dell'uscita di 1 ed assumere per definizione tale valore come probabilità dell'evento. Tuttavia anche la definizione frequentista non può essere applicata sempre perché è necessario che l'evento di cui si vuole definire la probabilità sia ripetibile nelle stesse condizioni. Per cui non potrei calcolare in base a tale definizione la probabilità che in una partita di calcio vinca una squadra piuttosto che l'altra. Per calcolare tale probabilità si può ricorrere alla definizione soggettiva 9. Definizione soggettiva di probabilità La probabilità di un evento in senso soggettivo, cioè secondo l'opinione di un certo individuo, è il prezzo P che è disposto a pagare (riscuotere) per ricevere (pagare) una somma unitaria al verificarsi dell'evento. Per cui se l'individuo è disposto a pagare (riscuotere) una somma π per riscuotere (pagare) la somma S al verificarsi dell'evento e nulla nel caso l'evento non si verifichi, egli attribuisce all'evento una probabilità P = π S . 10 Tale definizione è soggettiva ma non arbitraria perché impone che l'individuo sia "coerente" cioè sia disposto a fare le sue scommesse sia come giocatore sia come banco. Tale probabilità è egualmente compresa fra 0 e 1 perché è "coerente" pagare 1 lira per riscuotere una lira nel caso del verificarsi di un evento certo, così come è "coerente" pagare 0 lire per ricevere una lira nel caso di un evento impossibile. Esempio: se uno scommettitore di cavalli attribuisce la probabilità 0,3 alla vittoria di un certo cavallo vuol dire che è disposto a pagare (ricevere) 0,3 · 1000 € = 300 € per riscuotere (pagare) € 1000 nel caso il cavallo vinca, nulla se il cavallo perde. 10. Definizione assiomatica di probabilità Sia dato un insieme S di elementi detto spazio dei campioni, ed un suo sottoinsieme E detto evento, per probabilità dell'evento E si intende il numero p(E) associato ad E definito dai seguenti assiomi: 1. P(E) ≥ 0 2. P(S) = 1 3. P(E1 ∪ E2 ∪ E3 ∪….. En ∪…..) = P(E1) + P(E2) + P(E3) +…. P(En) +… per ogni serie finita o infinita numerabile di eventi disgiunti E1, E1, E1, .. En,….. Partendo da tale definizione si ottengono tutti i teoremi che si sono dimostrati nel caso della definizione classica. Ad esempio: Teorema 1 P( non E) = 1 - P (E) Dim: P( E ∪ non E ) = P(S) =1 per l’assioma 2. Tuttavia essendo E e non E incompatibili sarà per l’assioma 3 P( E ∪ non E ) = P (E) + P( non E) = 1 da cui P(non E) = 1 - P (E) Teorema 2 P(∅) = 0 Dim: S e ∅ sono disgiunti per cui 1 = P(S) = P(S∪∅) = P(S)+P(∅), da cui P(∅)=1-P(S) = 0 Teorema 3 Per ogni evento E risulta 0 ≤ P(E) ≤ 1 Dim: P(E) ≥ 0 per l’assioma 1, occorre dimostrare che P(E) ≤ 1. P(E) +P(nonE) = 1. Se fosse P(E) >1 allora P(non E) sarebbe <0 che è impossibile visto l’assioma 1. Allora deve essere P(E) ≤ 1, come si voleva dimostrare. Teorema 4 Se E1 e E2 sono due eventi di S allora: P(E1∪E2) = P(E1)+P(E2)-P(E1∩E2) Dim: Risulta E1∪E2 = (E1∩non E2) ∪(E2∩non E1)∪(E1∩E2) Quindi per l’assioma 3: P(E1∪E2) = P(E1∩non E2) +P(E2∩non E1)+P(E1∩E2) (1) E’ facile verificare che: P(E1) = P(E1∩non E2) + P(E1∩E2) (2) e che P(E2) = P(E2∩non E1)+ P(E1∩E2) (3) Ricavando P(E1∩non E2) dalla (2) e P(E2∩non E1) dalla (3) e sostituendole nella (1) si ottiene la tesi Naturalmente se E1 e E2 sono disgiunti, E1∩E2 = ∅ per cui per il teorema 2 P(E1∩E2 ) = P(∅) = 0 allora P(E1∪E2) = P(E1)+P(E2) Osservazione: si può rimanere sconcertati del fatto che sono state date della probabilità di un evento diverse definizioni, tuttavia c'è da dire che esse sono ognuna una generalizzazione dell'altra nel senso che ogni definizione contiene la precedente come caso particolare. Inoltre nonostante le diverse definizioni continuano a valere gli stessi teoremi e le stesse proprietà. Mostriamo come esempio che la definizione classica si può ottenere come caso particolare di quella frequentista. 11 Sia dato un esperimento composto da n eventi elementari { e1, e2, e3, … en}. Ad esempio lanciando un dado truccato lo spazio dei campioni è {1, 2, 3, 4, 5, 6 }. Facciamo m prove ( m lanci del dado) i singoli eventi elementari si presentino n1, n2, n3,…. nn volte ( n1 volte il numero 1, n2 volte il numero 2 ecc..). Sarà n 1+ n2 n n1 n 2 + + .... n =1 . m m m nn n n1 n Poiché il lim ( + .... ) = lim 1 + ...... + lim n = 1 sarà P(e1)+ P(e2)+ P(e3)+…. P(en) =1 m →∞ m m →∞ m m →∞ m m +n3+…. +nn = m ; Supponiamo che gli eventi elementari e1, e2, e3, … en siano equiprobabili sarà P(e1) = P(e2) = … 1 = P(en) = secondo la definizione classica. n Inoltre sia E l'evento { e1, e2, e3, … ek}, sia m il numero delle prove fatte, N E il numero delle volte in cui E si è verificato e n1, n2, n3, n4…. nk il numero delle volte in cui si sono verificati e 1, e2, e3, … ek . Sarà n1+n2+ n3+ ... nk = NE. In base alla definizione frequentista P(E) = lim m →∞ n + n 2 + ...n k n NE n = lim ( 1 ) = lim 1 + ...... lim k = m → ∞ m → ∞ n → ∞ m m m m = P(e1)+ P(e2)+ P(e3)+…. P(ek) . Nel caso delle equiprobabilità sarà quindi P(E) = k come nella definizione n classica. A questo punto si ritrovano tutti i teoremi sulla probabilità degli eventi unione ed intersezione. Esercizi sul calcolo delle probabilità 1. Supponiamo che la probabilità di avere inflazione I è 0,3 , che la probabilità di avere recessione R è 0,2 e che la probabilità di avere inflazione e recessione è 0,06. Qual è la probabilità di avere inflazione o recessione? [ R. 0,44] 2. Abbiamo un mazzo di 52 carte , 13 cuori, 13 quadri, 13 picche, 13 fiori. Qual è la probabilità di estrarre una carta di cuori o di quadri o un asso? [ R. 7/13] 3. Qual è la probabilità di avere due 6 in 2 lanci successivi di un dado? [R. 1/36] 4. Qual è la probabilità di avere un 6 su ciascun dado in un unico lancio di due dadi? [ R. 1/36] 5. Un’urna contiene 10 palline : 5 rosse, 3 bianche, 2 gialle. Calcola la probabilità di avere due palline bianche in due estrazioni successive con reinbussolamento. [ R. 9/100] 6. Calcola la probabilità di avere 3 femmine in una famiglia con 3 figli [R. 1/8] 7. Si lanciano contemporaneamente due dadi, qual è la probabilità di avere 5 come somma dei numeri usciti? [ R. 1/9] 8. Si lanciano contemporaneamente due dadi, qual è la probabilità di avere come somma dei numeri usciti un numero ≤ 4 ? [ R. 1/6] 9. Un’urna contiene 10 palline: 5 rosse, 3 bianche, 2 gialle. Facciamo due estrazioni successive senza reintroduzione, calcola la probabilità che la 2° estratta sia rossa sapendo che la 1° estratta è stata rossa. [R. 4/9] 10. Dall’urna precedente facciamo 3 estrazioni successive senza reintroduzione, calcola la probabilità che la 3° estratta sia rossa sapendo che la 1° estrata è stata rossa e la 2° non rossa. [ R. ½] 11. Dall’urna precedente facciamo due estrazioni successive, calcola la probabilità di avere due rosse sia nel caso di estrazioni successive con reintroduzione che nel caso di estrazioni senza reintroduzione. [ R. ¼, 2/9] 12. Dall’urna precedente facciamo 3 estrazioni successive, calcola la probabilità di avere 3 palline rosse sia nel caso di estrazione con reintroduzione che senza. [ R. 1/8, 1/12] 13. Alberto ricorda le cifre del numero di telefono, salvo l’ultima, di una ragazza che ha conosciuto in discoteca. Disponendo di due gettoni decide di telefonarle scegliendo a caso l’ultima cifra. Calcola la probabilità che indovini il numero esatto tenendo presente che può fare al massimo due telefonate. [ R. 0,2] 12 14. L’esperienza ha mostrato che su ogni 100000 pezzi prodotti in uno stabilimento durante il turno diurno 200 sono difettosi e che su ogni 100000 pezzi prodotti durante il turno notturno 500 sono difettosi. Nell’arco delle 24 ore 1000 pezzi sono prodotti durante il turno diurno e 600 durante il turno notturno. Calcola la probabilità che: a) un elemento preso a caso fra i 1600 elementi prodotti nelle 24 ore sia stato prodotto durante il turno diurno e sia difettoso b) sia stato prodotto durante il turno notturno e sia difettoso c) sia stato prodotto durante il turno notturno e non sia difettoso d) sia difettoso indipendentemente dal turno in cui sia stato prodotto e) un pezzo difettoso preso a caso fra i 1600 pezzi prodotti durante le 24 ore provenga dal turno diurno. [ R. 0,00125, 0,00187, 0,37312, 0,00312, 0,4] 16.Sappiamo che la probabilità che in un certo giorno piova è 0,1; la probabilità che si abbia un incidente automobilistico in un giorno qualsiasi è 0,005; la probabilità che si abbia un incidente automobilistico in un giorno di pioggia è 0,012. Calcola: a) La probabilità che un certo giorno piova e si abbia un incidente automobilistico b) La probabilità che piova sapendo che si è avuto un incidente automobilistico [ R. 0,0012; 0,24] 17. Due urne contengono rispettivamente 26 palline rosse, 16 nere, 8 gialle la prima e 13 rosse, 18 nere e 9 gialle la seconda. Si estraggono contemporaneamente due palline dalla prima ed una dalla seconda urna. Calcola la probabilità che: a) Le tre palline siano rosse b) Le tre palline siano di colore diverso [ R. 169/1960; 1144/6125] 18. Due urne contrassegnate dalle lettere A e B sono così composte: l’urna A contiene 60 palline rosse e 40 verdi; l’urna B contiene 20 palline rosse e 30 verdi. Si lanciano due dadi: se escono due numeri uguali si estrae una pallina da A; in caso contrario si estrae una pallina da B. Si supponga che, effettuata l’estrazione della pallina, questa risulti essere rossa. Calcola la probabilità che la pallina rossa provenga dall’urna A. [ R . 3/13] 19. Tre macchine A,B,C producono rispettivamente il 20%, il 35% ed il 45% dei bulloni prodotti da una certa fabbrica. Sul totale dei bulloni prodotti dalle tre macchine risultano difettosi il 5%, il 4% ed il 2% rispettivamente. Viene scelto un bullone a caso e viene trovato difettoso. Qual è la probabilità che esso provenga dalla macchina B? [ R. 0,42] 20. In una scatoletta sono contenute 8 caramelle: alcune sono avvolte in carta rossa ed altre in carta bianca; alcune sono al miele e altre al limone. Precisamente le caramelle sono distribuite come segue: carta rossa e sapore miele: 2 carta rossa e sapore limone: 1 carta bianca e sapore miele: 3 carta bianca e sapore limone: 2 Si estrae a caso una caramella. Calcola la probabilità che la caramella estratta sia al miele essendo avvolta in carta rossa. [ R. 2/3] 21.I dati riportati di seguito derivano da uno studio che esamina l’uso della ventricolografia radionuclidica quale test diagnostico per l’individuazione della patologia coronarica. Test Positivo Negativo Totale Malattia si 302 179 481 Totale no 80 372 452 382 551 933 Determina: a) la sensibilità e la specificità del test b) per una popolazione la cui probabilità di presentare patologie coronariche è 0,10 calcola la probabilità che un soggetto presenti la malattia in presenza di un risultato positivo al test della ventricolografia radionuclidica c) Calcola il valore predittivo di un test negativo 13 22. Uno studio ha affermato che la sensibilità della mammografia quale test di screening per l’individuazione del cancro della mammella è 0,85; la sua specificità è 0,80. a) Qual è la probabilità di un falso negativo? b) Qual è la probabilità di un falso positivo? c) In una popolazione in cui la probabilità che una donna abbia un cancro della mammella è 0,0025, qual è la probabilità che una donna abbia un cancro in presenza di una mammografia positiva? 23.Per diversi metodi di contraccezione sono di seguito riportate le probabilità che una donna abbia una gravidanza non prevista durante il primo anno di utilizzo Metodo di contraccezione Nessuno Diaframma Profilattico Spirale Pillola Probabilità di gravidanza 0,431 0,149 0,106 0,071 0,037 Per ciascun metodo, calcola il rischio relativo di gravidanza per donne che usano questo metodo rispetto alle donne che non utilizzano alcun tipo di precauzione. Come varia il rischio in funzione del metodo di contraccezione? Sul libro di testo Murray R. Spiegel, Statistica, Mc Graw-Hill esercizi sul calcolo combinatorio e delle probabilità da p. 128 a p. 149