Calcolo delle probabilità Laboratorio di Bioinformatica Corso A aa 2005-2006 Statistica Calcolo delle probabilità Dai risultati di un esperimento si determinano alcune caratteristiche della popolazione Dalle caratteristiche note della popolazione si prevede il risultato di un altro esperimento 1 La probabilità nel linguaggio corrente • è probabile che fra poco piova; • con questo titolo di studio vi sono buone probabilità di trovare lavoro; • è probabile che l’incendio sia d’origine dolosa; • ho poche probabilità di superare l’esame. Utilizziamo frequentemente il termine probabilità quando ci riferiamo a situazioni incerte, a fenomeni che possono o non verificarsi. Evento certo Evento impossibile Estrazione di una pallina rossa da un’urna contenente 10 palline rosse Estrazione di una pallina gialla da un’urna contenente 10 palline rosse Evento aleatorio o causale = evento incerto e possibile Estrazione di una pallina gialla da un’urna contenente 6 palline rosse e 4 gialle 2 Esempi dal gioco d’azzardo • Ottenere testa lanciando in alto una moneta molto probabile • Totalizzare 3 con il lancio di un dado meno probabile • Puntare sul 18 alla roulette e vincere poco probabile Il calcolo delle probabilità Il calcolo delle probabilità cerca di formulare delle valutazioni numeriche della possibilità di verificarsi di eventi aleatori o casuali. 3 Definizione della probabilità di un evento Attenzione: Non esiste un solo modo per definire la probabilità • Definizione classica • Definizione frequentista • Definizione soggettiva La probabilità classica E’ la definizione più ‘spontanea’ di probabilità Se lanciamo una moneta regolare quale probabilità probabilità assegniamo all’ all’uscita di “testa” testa”? Il 50% cioè cioè 1/2 Se estraiamo una carta da un regolare mazzo di 40 carte, quale probabilità probabilità assegniamo al fatto di pescare una carta di fiori? 10 su 40 cioè cioè 1/4 4 La probabilità classica La probabilità di un evento è il rapporto tra il numero dei casi favorevoli e il numero dei casi possibili (purché questi ultimi siano ugualmente possibili) . p= # eventi favorevoli # eventi possibili Lancio della moneta evento= A = uscita di testa esiti possibili = {testa, croce} # esiti possibili = 2 # esiti favorevoli = 1 p ( A) = # esiti possibili 1 = = 50% # esiti favorevoli 2 5 Estrazione di una carta A = estrazione di una carta con seme fiori esiti possibili = le quaranta carte della briscola # esiti possibili = 40 # esiti favorevoli = # carte con seme fiori = 10 p ( A) = # esiti favorevoli 10 1 = = = 25% # esiti possibili 40 4 Lancio di un dado A = ottenere un numero pari # esiti possibili = 6 esiti favorevoli = {2, 4, 6} # esiti favorevoli = 3 p ( A) = # esiti favorevoli 3 1 = = = 50% # esiti possibili 6 2 6 Proprietà p= # eventi favorevoli # eventi possibili • p è un numero razionale, compreso fra 0e1 • se l’evento è impossibile → non esistono casi favorevoli → la sua probabilità è nulla • se l’evento è certo → tutti i casi sono favorevoli → la sua probabilità è 1 Osservazioni • Caratteristica essenziale per poter applicare la definizione classica: tutti i casi sono egualmente possibili (Ad esempio, nel lancio della moneta le due facce devono avere eguale possibilità di presentarsi) • La definizione si può applicare solo quando l’insieme dei casi è un insieme finito 7 Quando si applica • In tutti i casi nei quali per ragioni di simmetria si possano pensare egualmente possibili tutti i casi. (Esempi: lancio di monete o dadi non truccati, estrazione del lotto, tombola etc.) Esempi ai quali non si può applicare • Calcolare la probabilità per una persona di 40 anni di raggiungere l’età di 60 anni, • la probabilità di subire un furto, • la probabilità che un nuovo medicinale dia esiti positivi nella cura di una malattia. La probabilità nella concezione frequentista (o statistica) • Concezione frequentista: per conoscere la probabilità di un evento si deve ricorrere all’esperimento • Si applicare quando: – si possono eseguire quante prove si vogliono sull’evento, – sono disponibili tavole con i risultati di rilevazioni statistiche relative a un certo fenomeno (ad esempio, le tavole di mortalità e di sopravvivenza). 8 La definizione frequentista Si definisce frequenza relativa di un evento in n prove effettuate nelle stesse condizioni, il rapporto fra il numero k delle prove nelle quali l’evento si è verificato e il numero n delle prove effettuate: f = k n Esempio: si lancia n = 1000 volte una moneta in aria e si conta quante volte k esce testa. La definizione frequentista La probabilità di un evento è il limite della frequenza relativa dell'evento, quando il numero delle prove tende all'infinito. k n→∞ n p = lim 9 Applicazioni della concezione frequentista • Il campo di applicazione della concezione frequentista è molto vasto, in quanto la definizione può essere applicata a fenomeni dei quali si posseggano dati statistici riguardanti fenomeni passati che si sono verificati in condizioni analoghe. Ad esempio, si potranno calcolare, per una data popolazione, la probabilità di morte o di sopravvivenza degli individui o la probabilità di nascita di maschi o di femmine. Si hanno pure importanti applicazioni nella medicina, nella psicologia, nell’economia, nella meccanica quantistica e, in generale, in tutte le scienze per le quali si possono utilizzare metodi statistici Legge empirica del caso • In una serie di prove, ripetute un gran numero di volte, eseguite tutte nelle stesse condizioni, la frequenza “tende” ad assumere valori prossimi alla probabilità dell’evento e, generalmente, l’approssimazione è tanto maggiore quanto più numerose sono le prove eseguite. 10 La concezione soggettiva della probabilità • Qual è la probabilità per uno studente di trovare impiego subito dopo il conseguimento del diploma? • Qual è la probabilità che un certo pilota vinca il prossimo Gran Premio di Formula 1? • Qual è la probabilità che un nuovo modello di automobile ha d'incontrare il favore del pubblico? Per eventi del tipo indicato non è possibile valutare la probabilità né secondo la concezione classica, perché non si possono determinare i casi possibili e i casi favorevoli, né secondo la concezione frequentista, perché gli eventi non sono ripetibili. 11 La definizione soggettiva In questi casi si stima la probabilità in base allo stato d'informazione. La probabilità P(E) di un evento E è la misura del grado di fiducia che un individuo attribuisce, in base alle sue informazioni e alle sue opinioni, al verificarsi dell’evento E. La definizione soggettiva “più operativa” La probabilità di un evento è il prezzo che un individuo razionale ritiene equo pagare per ricevere 1 se l'evento si verifica (e 0 altrimenti). L’attribuzione della probabilità deve essere coerente, nel senso che si deve anche essere disposti ad accettare la scommessa inversa, ossia a ricevere p e pagare 1 al verificarsi di E 12 Teoria assiomatica della probabilità • S = spazio campionario = insieme di tutti i possibili esiti di un esperimento • evento elementare = un qualsiasi elemento di S • evento = un qualunque sottoinsieme E dello spazio campionario S • si dice che l’evento E si è realizzato se il risultato dell’esperimento è un elemento di E Lancio di un dado • S = spazio campionario = {1, 2, 3, 4, 5, 6} • eventi elementari = {1}, {2}, {3}, {4}, {5}, {6} • evento = {esce un numero pari} = {2, 4, 6} 13 Lancio di una moneta • S = spazio campionario = {testa,croce} • eventi elementari = {testa}, {croce} • eventi = Ø, {testa}, {croce}, S Operazioni con gli eventi • La somma logica (o unione) di due eventi A e B è l’evento che si verifica quando si verifica almeno uno degli eventi A o B, cioè A∪ B • Il prodotto logico (o intersezione) di due eventi A e B è l’evento che si verifica se si verificano entrambi gli eventi A e B, cioè A∩ B • L’ evento contrario dell’evento A è l’evento che si verifica se e solo se non si verifica A, cioè A è il sottoinsieme complementare di A rispetto a S. 14 Operazioni con gli eventi • Due eventi A e B si dicono incompatibili (o mutuamente esclusivi) se non hanno eventi elementari in comune, cioè se il realizzarsi di uno dei due esclude la realizzazione dell’altro. • In altre parole se A∩ B = ∅ Definizione formale (assiomatica) della probabilità • Sia S uno spazio campionario • Sia P una funzione a valori reali definita sui sottoinsiemi di S (eventi) a valori reali tale che: – 0 ≤ P(E) ≤ 1 – P(S)=1 – Per ogni coppia di eventi E1 ed E2 incompatibili si ha P(E1 U E2) = P(E1)+P(E2) P(E) si dice probabilità dell’evento E 15 Commenti Se interpretiamo la probabilità come grado di fiducia: • 0 ≤ P(E) ≤ 1 Misuriamo la fiducia con valori che vanno da 0 (nessuna fiducia) a 1 (completa fiducia). (1=100%) • P(S)=1 L’evento S è certo (contiene tutti i possibili risultati dell’esperimento) • E1∩E2 =Ø implica P(E1 U E2)= P(E1)+P(E2) Se due eventi sono incompatibili la probabilità che si verifichi uno dei due è la somma delle probabilità Se S contiene infiniti elementi La terza condizione diventa • Per successioni di eventi E1, E2, … a due a due incompatibili, cioè t. c. Ei ∩ Ej = Ø se i ≠ j si ha ∞ ∞ P U Ei = ∑ P (Ei ) i =1 i =1 16 La definizione classica • Se S è uno spazio campionario formato da n elementi che riteniamo equiprobabili, per ogni un evento elementare {e}, P({e}) = 1/n • Dato un qualunque evento E, la sua probabilità è la somma delle probabilità degli eventi elementari che contiene P(E) = # elementi di E / n = # casi favorevoli / # casi possibili Relazioni elementari • Probabilità del complementare E ed E sono eventi incompatibili 1 = P( S ) = P( E ∪ E ) = P( E ) + P( E ) S () P E = 1 − P (E ) E E • Monotonia Se E2 ⊂ E1 , P ( E1 ) = P ( E2 ) + P ( E1 − E2 ) P( E1 ) ≥ P( E2 ) E1\E2 E1 E2 17 Relazioni elementari E1 E1 ∩ E2 E2 P(E1)= P(E1 - E2) + P(E1 ∩ E2) P(E2) = P (E2 - E1) + P (E1 ∩ E2) + - P(E1UE2)=P (E1 - E2)+P(E1∩E2)+P (E2-E1) = P(E1) + P (E2) - P(E1UE2) = P(E1∩E2) Quindi P(E1) + P (E2) - P(E1UE2) = P(E1∩E2) ovvero P(E1UE2) = P(E1) + P (E2) - P(E1∩E2) 18