Calcolo delle Probabilità pr - 1 Che collegamento c’è tra gli strumenti statistici per lo studio dei fenomeni reali e il calcolo delle probabilità? Vedremo che non sempre la conoscenza delle caratteristiche di un fenomeno può essere conseguita osservando tutta la popolazione ma deve essere estratto un campione (rilevazione parziale) La STATISTICA INDUTTIVA o INFERENZIALE intende descrivere non tanto ciò che traspare dalle manifestazioni osservate (rilevazioni parziali), ma quello che emergerebbe qualora la rilevazione fosse estesa all’insieme di tutte le manifestazione del fenomeno. L’incertezza che deriva dalla parzialità della rilevazione è dominata dalla TEORIA DELLE PROBABILITÀ pr - 2 1 TERMINOLOGIA EVENTI: entità caratterizzate da aleatorietà, qualcosa che può verificarsi oppure no La Juventus vincerà il campionato anche quest’anno? Gli eventi si indicano con le lettere maiuscole dell’alfabeto latino E1 =“La Juventus vincerà il campionato anche quest’anno” Si chiama evento complementare ad E il verificarsi di tutto ciò che non è E e si indica con E E1 =“La Juventus non vincerà il campionato quest’anno” Si indica con la lettera dell’alfabeto greco Ω l’insieme di tutti i possibili risultati di un esperimento, per esperimento si intende una prova il cui esito è incerto. Viene anche chiamato evento certo o spazio campionario E1=Vincerà la Juve, E2=Vincerà la Lazio, E3=Vincerà la Roma, E4=Vincerà il Parma, E5=Vincerà il Milan…. Ω è l’insieme di tutti gli eventi Ei, per i=1,….,18 pr - 3 TERMINOLOGIA Al verificarsi di un evento verrà associata una PROBABILITA’ P(E1)=Probabilità che la Juventus vinca il campionato Se chiedessimo di assegnare questa probabilità a un tifoso della Juve, a un tifoso dell’Inter (che pensa sempre che quest’anno sia quello buono), a un tifoso del Torino, o a una persona oggetiva, tecnicamente preparata a livello calcistico otterremmo 4 valori diversi di probabilità Come è possibile assegnare correttamente la probabilità agli eventi? pr - 4 2 PROPRIETA’ FORMALI La probabilità non è mai un numero negativo, verrà assegnata probabilità 0 agli eventi che ci si aspetta che non si verifichino (evento quasi impossibile) e probabilità 1 agli eventi che ci si aspetta che si verifichino (evento quasi certo) Siccome ogni evento è contenuto in Ω ( Ei ⊂ Ω ) 0 < P(Ei) < P(Ω) =1 P(Ω)=P(“tutto quello che può accadere”)=P(“evento certo”)=1 pr - 5 PROPRIETA’ FORMALI Se due eventi E1 e E2 non possono verificarsi contemporaneamente (la loro intersezione coincide con l’insieme vuoto) diremo che sono incompatibili, E1 ∩ E2 = ∅ ⇔ P( E1 ∩ E2 ) = 0 Probabilità che vinca il campionato la Juve e anche l’Inter? Siccome non possono vincere entrambe, gli eventi sono incompatibili, la probabilità della loro intersezione è uguale a 0 pr - 6 3 PROPRIETA’ FORMALI Se si vuole calcolare la probabilità che si verifichi l’evento E1 oppure l’evento E2 (E1 unito E2) e i due eventi sono incompatibili allora la probabilità dell’unione è uguale alla somma delle probabilità P( E1 ∪ E2 ) = P( E1 ) + P ( E2 ) Probabilità che vinca il campionato una squadra romana? Siccome non possono vincere entrambe, gli eventi sono incompatibili, la probabilità della loro unione è uguale alla probabilità che vinca la Roma, più la probabilità che vinca la Lazio. pr - 7 ASSIOMI E’ possibile riassumere quanto visto fino ad ora negli assiomi di Kolmogorov 1. ∀E ⊂ Ω, P( E ) ≥ 0 2. P (Ω ) = 1 3. Se E1 ∩ E2 = ∅ allora P ( E1 ∪ E2 ) = P( E1 ) + P ( E2 ) pr - 8 4 ALCUNE REGOLE E ∪ E = Ω quindi P( E ) + P ( E ) = 1 e dunque P ( E ) = 1 − P ( E ) Se E1 ∩ E2 ≠ ∅ allora P ( E1 ∪ E2 ) = P( E1 ) + P( E2 ) − P ( E1 ∩ E2 ) pr - 9 EVENTI ELEMENTARI Insiemi contenenti un solo elemento In generale lo spazio campionario viene descritto in termini di eventi elementari Ω = {ω1 , ω2 ,..., ωn } Se gli eventi elementari sono tutti equiprobabili, cioè P ({ω1}) = P ({ω2 }) = ........ = P ({ωn } ) Allora la probabilità di un evento qualsiasi E composto da più eventi elementari P (E) = # casi favorevoli (all'evento) # casi possibili (dell'esperimento) pr - 10 5 PROBABILITA’ CONDIZIONATA Dati due eventi E1 ed E2 di cui se ne conoscono le probabilità P(E1) e P(E2) ci chiediamo se la probabilità del verificarsi dell’uno varia sapendo che si è verificato l’altro P( E1 | E2 ) = P ( E1 ∩ E2 ) con P ( E2 ) > 0 P ( E2 ) ESEMPIO: Lancio di un dado E1 = ‘estrarre un numero pari’ ; E2 = ‘estrarre un numero >=4’ P(E1) =3/6 ; P(E2)=3/6 La probabilità di estrarre un numero pari cambia se si sa che il numero estratto è >=4? P( E1 | E2 ) = P({4,6}) P( E1 ∩ E2 ) 2/6 2 1 = = = ≠ P( E2 ) P({4,5,6} ) 3 6 3 2 pr - 11 EVENTI INDIPENDENTI Due eventi E1 e E2 si diranno indipendenti se la probabilità del verificarsi dell’uno rimane invariata sapendo che si è verificato l’altro, cioè P ( E1 | E2 ) = P ( E1 ) e P ( E2 | E1 ) = P ( E2 ) P ( E1 ∩ E2 ) = P( E1 ) ⋅ P( E2 ) Se due eventi sono indipendenti P ( E1 ∩ E2 ) P ( E1 ∩ E2 ) Infatti = P( E1 ) e P( E2 | E1 ) = = P( E2 ) P( E1 | E2 ) = P ( E2 ) Eventi compatibili ma indipendenti! Eventi compatibili ma indipendenti! P ( E1 ) ESEMPIO: Mazzo di 40 carte E1 = ‘estrarre una carta di denari’ P(E1) = 10/40 ; E2 = ‘estrarre un asso’ P(E2)=4/40 La probabilità di estrarre una carta di denari cambia se si sa che la carta estratta è un asso? P ( E1 | E2 ) = P ( E1 ∩ E2 ) P (asso di denari) 1 40 1 10 = = = = P ( E2 ) P (asso) 4 40 4 40 P ( E1 ∩ E2 ) = P ( E1 ) ⋅ P ( E2 ) = 10 4 1 ⋅ = 40 40 40 pr - 12 6 EVENTI INDIPENDENTI Eventi compatibili ma indipendenti! Eventi compatibili ma indipendenti! ESEMPIO 2: Mazzo di 40 carte E1 = ‘estrarre una carta di denari’ P(E1) = 10/40 ; E2 = ‘estrarre una figura’ P(E2)=12/40 La probabilità di estrarre una carta di denari cambia se si sa che la carta estratta è una figura? P ( E1 | E2 ) = P ( E1 ∩ E 2 ) P (figura di denari) 3 40 3 10 = = = = P ( E2 ) P (figura) 12 40 12 40 P ( E1 ∩ E2 ) = P ( E1 ) ⋅ P ( E2 ) = figura non figura 10 12 3 ⋅ = 40 40 40 denari 3 7 10 non denari 9 21 30 12 28 40 condizionate di riga figura non figura denari 0.25 0.25 non denari 0.75 0.75 pr - 13 LEGGI DI DE MORGAN E1 ∩ E2 = E1 ∪ E2 E1 ∪ E2 = E1 ∩ E2 L’operazione di “complementazione” scambia l’operazione di unione con l’operazione di intersezione e viceversa pr - 14 7 SCHEMI DI CAMPIONAMENTO Si supponga di estrarre una pallina da un urna a) Estrazione con rimessa, la probabilità di estrazione di una singola pallina rimane costante in ogni estrazione b) Estrazione senza rimessa, la probabilità di estrazione di una singola pallina cambia Si supponga di estrarre una unità da una popolazione a) Campionamento con ripetizione (eventi indipendenti) b) Campionamento senza ripetizione (eventi condizionati) pr - 15 COEFFICIENTE BINOMIALE In quanti modo posso estrarre in blocco (senza rimessa) k elementi da un’insieme di n elementi? Combinazioni di n elementi presi k alla volta n n! = k ( n − k )!k ! dove n ! = n ⋅ ( n − 1) ⋅ ( n − 2 ) ⋅ ........ ⋅ 2 ⋅1 Proprietà: n n n n 0! = 1, = 1, = n, = 0 1 k n−k pr - 16 8 ESEMPIO: COEFFICIENTE BINOMIALE Nell’aula oggi ci sono 20 studenti: 10 di SPC, 7 di SPM e 3 di SPE. Decido di chiamare alla lavagna 3 studenti. 1. Quante sono le possibili combinazioni? 2. Qual è la probabilità che siano tutti di SPC? 3. Se ne chiamo 1 per corso di laurea, quante sono le possibili combinazioni? 4. Qual è la probabilità che siano uno per ognuno dei tre corsi di laurea? 20 1) = 1140 3 10 3 120 10 9 8 = 0.105 che è uguale a ⋅ ⋅ 2) = 20 19 18 20 1140 3 10 7 3 3) = 210 1 1 1 10 7 3 1 1 1 210 10 ⋅ 7 ⋅ 3 = 0.184 che è uguale a 3! 4) = 1140 20 20 ⋅19 ⋅18 3 SPM,SPC,SPE; SPM, SPE, SPC; SPC,SPM,SPE; SPC,SPE,SPM; SPE,SPC,SPM; SPE,SPM,SPC pr - 17 ESERCIZIO: ESTRAZIONE SENZA RIMESSA Da un’urna contenente 15 palline (5 rosse, 5 verdi e 5 blu), se ne estraggono 2 senza reimmissione; calcolare la probabilità che queste siano dello stesso colore. Soluzione: N=15 5 rosse; 5 verdi; 5 blu n=2 (senza reimmissione) Trattandosi di estrazioni senza reimmissione non vi è l’indipendenza delle prove, infatti la composizione dell’urna si modifica ad ogni estrazione. Inoltre viene chiesta la probabilità che si estraggano due palline dello stesso colore e non di un colore particolare. Si fa osservare che nell’urna vi sono palline di tre colori differenti presenti in pari numero (5 rosse; 5 verdi; 5 blu), pertanto la probabilità cercata sarà data dalla seguente espressione: Pr{“2 dello stesso colore”} = 3 ⋅ 5 4 ⋅ = 0.285714 15 14 pr - 18 9 PRINCIPIO DELLE PROBABILITA’ TOTALI Se A1 , A2 , ..., Ak sono una partizione di Ω ed E è un qualsiasi altro evento k P( E ) = ∑ P ( E | Ai ) P ( Ai ) i =1 Se Seconosciamo conosciamoleleprobabilità probabilitàdegli deglieventi eventididiuna unapartizione partizione(a(apriori) priori)eeconosciamo conosciamoleleprobabilità probabilità condizionate condizionatedel delverificarsi verificarsididiun unqualsiasi qualsiasialtro altroevento eventoagli aglieventi eventidella dellapartizione, partizione,siamo siamosempre sempreinin grado gradodidicalcolare calcolarelalaprobabilità probabilitàdell’evento dell’eventostesso stesso Partizione di Ω k eventi A1, A2 , ..., Ak sono una partizione se e solo se k ∪ Ai = Ω i e scelti a caso due eventi Ai e A j allora Ai ∩ A j =∅ pr - 19 FORMULA DI BAYES Se A1 , A2 , ..., Ak sono una partizione di Ω ed E è un qualsiasi altro evento P ( Ai | E ) = P ( E | Ai ) P ( Ai ) k ∑ P ( E | Ai ) P ( Ai ) i =1 Se Sesappiamo sappiamoche chesisièèverificato verificatol’evento l’eventoEEsiamo siamoiningrado gradodidicalcolare calcolarelalaprobabilità probabilitàche chesisisia sia verificato verificatol’evento l’eventoAAi.i.Dato Datol’effetto l’effettosiamo siamoiningrado gradodidicalcolare calcolarelalaprobabilità probabilitàdella dellacausa causache che loloha hagenerato generato(probabilità (probabilitàaaposteriori). posteriori).E’ E’come comese senoi noiaggiornassimo aggiornassimolelenostre nostreconoscenze conoscenze a seguito del verificarsi dell’evento E. aapriori su A priori su Ai a seguito del verificarsi dell’evento E. i La diventauna una probabilità probabilitàaaposteriori posterioriP(A P(Ai|E) Laprobabilità probabilitàaapriori prioriP(A P(Ai)i)diventa i|E) pr - 20 10 ESEMPIO pr - 21 ESEMPIO N° cubetti esaminati N° cubetti difettosi 10 20 25 P(Ai) P(E|Ai) 0.21 0.03 0.29 0.05 0.50 0.04 P(E)=P(E|A1)P(A1)+P(E|A2)P(A2)+P(E|A3)P(A3) = 0.04 IMPIANTO A IMPIANTO B IMPIANTO C A1 A2 A3 300 400 700 1400 a) Probabilità totali b) Formula di Bayes P(A1|E)= [P(E|A1)P(A1)]/P(E) = 0.18 pr - 22 11