Calcolo delle Probabilità Che collegamento c’è tra gli strumenti statistici visti fino ad ora per lo studio dei fenomeni reali e il calcolo delle probabilità? Non sempre la conoscenza delle caratteristiche di un fenomeno può essere conseguita osservando tutta la popolazione ma deve essere estratto un campione (rilevazione parziale) La STATISTICA INDUTTIVA o INFERENZIALE intende descrivere non tanto ciò che traspare dalle manifestazioni osservate (rilevazioni parziali), ma quello che emergerebbe qualora la rilevazione fosse estesa all’insieme di tutte le manifestazione del fenomeno. L’incertezza che deriva dalla parzialità della rilevazione è dominata dalla TEORIA DELLE PROBABILITÀ 1 TERMINOLOGIA EVENTI: entità caratterizzate da aleatorietà, qualcosa che può verificarsi oppure no La Juventus vincerà il campionato anche quest’anno? Gli eventi si indicano con le lettere maiuscole dell’alfabeto latino E1 =“La Juventus vincerà il campionato anche quest’anno” Si chiama evento complementare ad E il verificarsi di tutto ciò che non è E e si indica con E E1 =“La Juventus non vincerà il campionato quest’anno” Si indica con la lettera dell’alfabeto greco Ω l’insieme di tutti i possibili risultati di un esperimento, per esperimento si intende una prova il cui esito è incerto. Viene anche chiamato evento certo o spazio campionario E1=Vince la Juve, E2=Vince la Lazio, E3=Vince la Roma, E4=Vince il Parma, E5=Vince il Milan…. Ω è l’insieme di tutti gli eventi Ei, per i=1,….,20 NOTA: quando sono state fatte queste slides, ovviamente la Juve era in serie A TERMINOLOGIA Al verificarsi di un evento viene associata una PROBABILITA’ P(E1)=Probabilità che la Juventus vinca il campionato Se chiedessimo di assegnare questa probabilità a un tifoso della Juve, a un tifoso dell’Inter (che pensa sempre che quest’anno sia quello buono), a un tifoso del Torino, o a una persona oggettiva, tecnicamente preparata a livello calcistico otterremmo 4 valori diversi di probabilità Come è possibile assegnare correttamente la probabilità agli eventi? 2 PROPRIETA’ FORMALI La probabilità non è mai un numero negativo, verrà assegnata probabilità 0 agli eventi che ci si aspetta che non si verifichino (evento quasi impossibile) e probabilità 1 all’eventi che ci si aspetta che si verifichino (evento quasi certo) Siccome ogni evento è contenuto in Ω ( Ei ⊂ Ω) 0 < P(Ei) < P(Ω) =1 P(Ω)=P(“tutto quello che può accadere”)=P(“evento certo”)=1 PROPRIETA’ FORMALI Se due eventi E1 e E2 non possono verificarsi contemporaneamente (la loro intersezione coincide con l’insieme vuoto) diremo che sono incompartibili, E1 ∩ E 2 = ∅ ⇔ P ( E1 ∩ E 2 ) = 0 Probabilità che vinca il campionato la Juve e anche l’Inter? Siccome non possono vincere entrambe, gli eventi sono incompatibili, la probabilità della loro intersezione è uguale a 0 3 PROPRIETA’ FORMALI Se si vuole calcolare la probabilità che si verifichi l’evento E1 oppure l’evento E2 (E1 unito E2) e i due eventi sono incompatibili allora la probabilità dell’unione è uguale alla somma delle probabilità P ( E 1 ∪ E 2 ) = P ( E1 ) + P ( E 2 ) Probabilità che vinca il campionato una squadra romana? Siccome non possono vincere entrambe, gli eventi sono incompatibili, la probabilità della loro unione è uguale alla probabilità che vinca la Roma, più la probabilità che vinca la Lazio. ASSIOMI E’ possibile riassumere quanto visto fino ad ora negli assiomi di Kolmogorov 1. ∀E ⊂ Ω, P(E) ≥ 0 2. P(Ω) = 1 3. Se E1 ∩ E2 = ∅ allora P(E1 ∪ E2 ) = P(E1) + P(E2 ) 4 ALCUNE REGOLE E ∪ E = Ω quindi P( E ) + P( E ) = 1 e dunque P( E ) = 1 − P( E ) Se E1 ∩ E2 ≠ ∅ allora P( E1 ∪ E2 ) = P( E1 ) + P( E2 ) − P ( E1 ∩ E2 ) EVENTI ELEMENTARI Insiemi contenenti un solo elemento In generale lo spazio campionario viene descritto in termini di eventi elementari Ω = {ω1 , ω2 ,..., ωn } Se gli eventi elementari sono tutti equiprobabili, cioè P ({ω1}) = P ({ω2 }) = ........ = P ({ωn } ) Allora la probabilità di un evento qualsiasi E composto da più eventi elementari P(E) = # casi favorevoli (all'evento) # casi possibili (dell'esperimento) 5 PROBABILITA’ CONDIZIONATA Se abbiamo due eventi E1 e E2 e ne conoscono le probabilità P(E1) e P(E2) chi chiediamo se la probabilità del verificarsi dell’uno varia sapendo che si è verificato l’altro P ( E1 | E 2 ) = P ( E1 ∩ E 2 ) co n P ( E 2 ) > 0 P (E2 ) ESEMPIO: Lancio di un dado E1 = ‘estrarre un numero pari’ ; E2 = ‘estrarre un numero >=4’ P(E1) =3/6 ; P(E2)=3/6 La probabilità di estrarre un numero pari cambia se si sa che il numero estratto è >=4? P ( E1 | E 2 ) = P ({4 ,6 }) P ( E1 ∩ E 2 ) 2/6 2 1 = = = ≠ P (E2 ) P ({4,5,6 } ) 3 6 3 2 EVENTI INDIPENDENTI Due eventi E1 e E2 si diranno indipendenti se la probabilità del verificarsi dell’uno rimane invariata sapendo che si è verificato l’altro, cioè P ( E1 | E 2 ) = P ( E1 ) e P ( E 2 | E1 ) = P ( E 2 ) Se due eventi sono indipendenti Infatti P ( E1 | E 2 ) = Eventi compatibili ma Eventi compatibili ma indipendenti! indipendenti! P ( E1 ∩ E 2 ) = P ( E1 ) ⋅ P ( E 2 ) P ( E1 ∩ E 2 ) P ( E1 ∩ E 2 ) = P ( E1 ) e P ( E 2 | E1 ) = = P ( E2 ) P ( E2 ) P ( E1 ) ESEMPIO: Mazzo di 40 carte E1 = ‘estrarre una carta di denari’ P(E1) = 10/40 ; E2 = ‘estrarre un asso’ P(E2)=4/40 La probabilità di estrarre una carta di denari cambia se si sa che la carta estratta è un asso? P ( E1 | E 2 ) = P ( E1 ∩ E 2 ) 1 40 1 10 P (a s so d i d e n ari) = = = = 4 40 4 40 P(E2 ) P (a ss o ) P ( E1 ∩ E 2 ) = P ( E1 ) ⋅ P ( E 2 ) = 10 4 1 ⋅ = 40 40 40 6 EVENTI INDIPENDENTI Eventi compatibili ma indipendenti! Eventi compatibili ma indipendenti! ESEMPIO 2: Mazzo di 40 carte E1 = ‘estrarre una carta di denari’ P(E1) = 10/40 ; E2 = ‘estrarre una figura’ P(E2)=12/40 La probabilità di estrarre una carta di denari cambia se si sa che la carta estratta è una figura? P ( E1 | E 2 ) = P ( E1 ∩ E 2 ) P (fig u ra d i d en ari) 3 40 3 10 = = = = P (E2 ) P (fig u ra) 12 40 12 40 P ( E1 ∩ E 2 ) = P ( E1 ) ⋅ P ( E 2 ) = 10 12 3 ⋅ = 40 40 40 LEGGI DI DE MORGAN E1 ∩ E2 = E1 ∪ E2 E1 ∪ E2 = E1 ∩ E2 L’operazione di “complementazione” scambia l’operazione di unione con l’operazione di intersezione e viceversa 7 SCHEMI DI CAMPIONAMENTO Si supponga di estrarre una pallina da un urna a) Estrazione con rimessa, la probabilità di estrazione di una singola pallina rimane costante in ogni estrazione b) Estrazione senza rimessa, la probabilità di estrazione di una singola pallina cambia Si supponga di estrarre una unità da una popolazione a) Campionamento con ripetizione (eventi indipendenti) b) Campionamento senza ripetizione (eventi condizionati) COEFFICIENTE BINOMIALE In quanti modo posso estrarre in blocco (senza rimessa) k elementi da un’insieme di n elementi? Combinazioni di n elementi presi k alla volta n n! = k ( n − k )!k ! dove n ! = n ⋅ ( n − 1) ⋅ ( n − 2 ) ⋅ ........ ⋅ 2 ⋅1 Proprietà: n n n n 0! = 1, = 1, = n, = 0 1 k n−k 8 ESEMPIO: COEFFICIENTE BINOMIALE Nell’aula oggi ci sono 20 studenti: 10 di SPO, 7 di SAM e 3 di SIE. Decido di chiamare alla lavagna 3 studenti. 1. Quante sono le possibili combinazioni? 2. Qual è la probabilità che siano tutti di SPO? 3. Se ne chiamo 1 per corso di laurea, quante sono le possibili combinazioni? 4. Qual è la probabilità che siano uno per ognuno dei tre corsi di laurea? 20 1) = 1140 3 10 3 120 10 9 8 = 0.105 che è uguale a ⋅ ⋅ 2) = 20 19 18 20 1140 3 10 7 3 3) = 210 1 1 1 10 7 3 1 1 1 210 10 ⋅ 7 ⋅ 3 4) = = 0.184 che è uguale a 3! 1140 20 20 ⋅19 ⋅18 3 SAM,SPO,SIE; SAM, SIE,SPO; SPO,SAM,SIE; SPO,SIE,SAM; SIE,SPO,SAM; SIE,SAM,SPO ESERCIZIO: ESTRAZIONE SENZA RIMESSA Da un’urna contenente 15 palline (5 rosse, 5 verdi e 5 blu), se ne estraggono 2 senza reimmissione; calcolare la probabilità che queste siano dello stesso colore. Soluzione: N=15 5 rosse; 5 verdi; 5 blu n=2 (senza reimmissione) Trattandosi di estrazioni senza reimmissione non vi è l’indipendenza delle prove, infatti la composizione dell’urna si modifica ad ogni estrazione. Inoltre viene chiesta la probabilità che si estraggano due palline dello stesso colore e non di un colore particolare. Si fa osservare che nell’urna vi sono palline di tre colori differenti presenti in pari numero (5 rosse; 5 verdi; 5 blu), pertanto la probabilità cercata sarà data dalla seguente espressione: Pr{“2 dello stesso colore”} = 3 ⋅ 5 4 ⋅ = 0.285714 15 14 9 PRINCIPIO DELLE PROBABILITA’ TOTALI Se A1, A2 , ..., Ak sono una partizione di Ω ed E è un qualsiasi altro evento k P( E) = ∑ P ( E | Ai ) P ( Ai ) i =1 Se si conoscono le probabilità degli eventi di una partizione (a priori) e si conoscono le Se si conoscono le probabilità degli eventi di qualsiasi una partizione (a priori) si conoscono probabilità condizionate del verificarsi di un altro evento aglie eventi della le probabilità condizionate del verificarsi di un qualsiasi altro evento agli eventi partizione, si è sempre in grado di calcolare la probabilità dell’evento stesso della partizione, si è sempre in grado di calcolare la probabilità dell’evento stesso Partizione di W k eventi A1, A2 , ..., Ak sono una partizione se e solo se k U Ai = Ω i e scelti a caso due eventi Ai e Aj allora Ai ∩ Aj =∅ FORMULA DI BAYES Se A1 , A2 , ..., Ak sono una partizione di Ω ed E è un qualsiasi altro evento P ( Ai | E ) = P ( E | Ai ) P ( Ai ) k ∑ P ( E | Ai ) P ( Ai ) i =1 Se si sa che si è verificato l’evento E si è in grado di calcolare la probabilità Se si sa che si è verificato l’evento E si è in grado di calcolare la probabilità che si sia verificato l’evento Ai. Dato l’effetto è possibile calcolare la che si sia verificato l’evento Ai. Dato l’effetto è possibile calcolare la probabilità della causa che lo ha generato (probabilità a posteriori). E’ come probabilità della causa che lo ha generato (probabilità a posteriori). E’ come se le conoscenze a priori su Ai a seguito del verificarsi dell’evento E se le conoscenze a priori su Ai a seguito del verificarsi dell’evento E venissero aggiornate venissero aggiornate La probabilità a priori P(Ai) diventa una probabilità a posteriori P(Ai|E) La probabilità a priori P(Ai) diventa una probabilità a posteriori P(Ai|E) 10 ESEMPIO ESEMPIO N° cubetti esaminati IMPIANTO A IMPIANTO B IMPIANTO C A1 A2 A3 300 400 700 N° cubetti difettosi 10 20 25 P(Ai) P(E|Ai) 0.21 0.03 0.29 0.05 0.50 0.04 1400 a) Probabilità totali P(E) = P(E|A1)P(A1) + P(E|A2)P(A2) + P(E|A3)P(A3) = 0.04 b) Formula di Bayes P(A1|E) = [P(E|A1)P(A1)]/P(E) = 0.18 11