Università del Piemonte Orientale Corso di Laurea Triennale di Infermieristica Pediatrica ed Ostetricia Corso di Statistica Medica Elementi di calcolo delle probabilità CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità 1 In questa lezione parleremo di: Probabilità: definizione e stima Dominio della variabile e spazio campionario Eventi e probabilità di un evento Probabilità del verificarsi di due eventi CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità 2 Probabilità: valutazione della possibilità che accada (o sia accaduto) un evento. Esempi: 1. La probabilità di incontrare una persona conosciuta ieri 2. La probabilità che domani piova 3. La probabilità che la Juventus batta il Perugia alla prima partita di campionato 4. La probabilità di lanciare una moneta ed ottenere testa 5. La probabilità che un bambino nato oggi viva almeno 80 anni 6. La probabilità che un campione di sangue presenti una concentrazione di emoglobina di 14,456 g/100ml CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità Evento, che può Probabilità che verificarsi o non l’evento si verificarsi verifichi CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità 3 4 Evento Probabilità Incontro di ... La probabilità di incontrare una persona conosciuta ieri Pioggia La probabilità che domani piova Vittoria della J sulla P alla prima partita La probabilità che la Juventus batta il Perugia alla prima partita di campionato Testa La probabilità di lanciare una moneta ed ottenere testa 80° compleanno La probabilità che un bambino nato oggi viva almeno 80 anni Campione ematico con Hb= 14,456 g/100ml La probabilità che un campione di sangue presenti una concentrazione di emoglobina di 14,456 g/100ml CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità 5 Queste affermazioni appartengono a due categorie diverse: Le affermazioni 1-3 indicano la propensione soggettiva a valutare la possibilità che l’evento accada (giudizio di un esperto). Le affermazioni 4-6 consentono la risposta in base alla definizione di uno spazio campionario ed alla misura della probabilità associata all’evento. Noi parleremo di probabilità limitatamente a questa seconda accezione. CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità 6 La stima della probabilità: A priori: • Simmetria (geometria): lancio di moneta o di dado, estrazione del lotto • Logica¹ ‘se x è vero allora consegue che y deve essere pari a….’ A posteriori: • Frequenza di un evento osservata in un numero molto alto di prove • Limite della frequenza di un evento osservata per un numero di prove tendente all’infinito ¹ Corrisponde alla stima della probabilità conseguente alla formulazione di un’ipotesi. L’argomento sarà ripreso nelle prossime lezioni CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità 7 probabilità di ottenere croce 0,90 0,80 prob. 0,70 0,60 prob. 0,50 0,40 0,30 0,20 0,10 0,00 0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 n. lanci CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità 8 105 • La variabile “risultato del lancio di un dado” può assumere solo alcuni valori in un intervallo, nel caso i valori 1,2,3,4,5,6 (variabile discreta); • la variabile “stato all’età di 80 anni” può assumere due soli valori (vivo, morto) (variabile binaria); • la variabile “concentrazione di emoglobina” può assumere tutti i valori in un intervallo (variabile continua). CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità 9 L’intervallo in cui sono compresi i valori che possono essere assunti da una variabile è detto ‘dominio della variabile’ o ‘spazio campionario’. Approfondiremo dapprima il caso delle variabili discrete e delle variabili binarie. CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità 10 Probabilità di un evento P = r/N Dove r = frequenza dell’evento N = Numero di possibili eventi Evento = estrazione di un asso di cuori r = 1 (c’è un asso di cuori nel mazzo) N = 40 (il mazzo è di 40 carte) P=1/40=0,025 Evento = estrazione di un topo maschio dalla gabbia r = 10 (numero di topi di sesso maschile) N = 20 (numero totale di topi) P=10/20=0,5 CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità 11 Alcune ulteriori definizioni e regole: Spazio Campionario (S): l’insieme di tutte le possibili evenienze. P(S) = 1 La probabilità di un evento è compresa nell’intervallo 0 (evento impossibile) - 1 (evento certo) 0 <= P(A) <= 1 CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità 12 Eventi e probabilità complementari Dato un evento, le due condizioni "evento che si verifica" ed "evento che non si verifica" esauriscono tutte le possibilità. Pertanto: P(evento che si verifica) + P(evento che non si verifica) = 1 e P(evento che si verifica) = 1 - P(evento che non si verifica) CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità 13 Parliamo in questo caso di probabilità complementari. NON A A Cosa possiamo dire relativamente alla probabilità di due eventi? CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità 14 Dati due eventi possiamo essere interessati al verificarsi di uno qualsiasi dei due. oppure al verificarsi di entrambi. oppure al verificarsi di uno solo se un altro si è già verificato. CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità 15 Il verificarsi di entrambi gli eventi è indicato come ‘intersezione’ (A ∩ B) e la probabilità è la probabilità dell’intersezione P( A ∩ B ) CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità 16 Il verificarsi di uno qualsiasi dei due è indicato come ‘unione’ (A ∪ B) e la probabilità è la probabilità dell’unione P( A ∪ B ) CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità 17 La probabilità del verificarsi di un evento solo se un'altro si è già verificato è definita Probabilità Condizionata. CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità 18 Quando due eventi non possono mai verificarsi contemporaneamente parliamo di ‘eventi mutuamente esclusivi’ o disgiunti. P( A ∩ B ) = 0 CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità 19 Nel caso di eventi mutuamente esclusivi la probabilità del verificarsi di uno o l'altro dei due (probabilità dell'unione) è data da: P ( A ∪ B ) = P ( A ) + P (B ) La probabilità di uno o l'altro tra due eventi mutuamente esclusivi è data dalla somma delle probabilità di ciascuno dei due eventi CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità 20 Es. la probabilità di avere testa o croce ad un lancio di una moneta è: P (testa o croce) = P (testa) + P (croce) = 0,5 + 0,5 La stessa regola si può estendere alla probabilità di uno (o più) tra n eventi mutuamente esclusivi. P(A o B o C) = P(A∪B∪C) = P(A) + P(B) + P(C) CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità 21 La probabilità del realizzarsi di uno o l’altro tra due eventi non mutuamente esclusivi è la somma delle probabilità di ciascuno dei due eventi sottratta della probabilità di entrambi (che altrimenti verrebbe conteggiata due volte) P(A o B) = P(A) + P(B) – P(A e B) P(A ∪B) = P(A) + P(B) – P(A ∩B) CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità 22 Es. la probabilità di estrarre una carta di segno (cuori) o (figura) da un mazzo di 40 carte: P (cuori o figura) = P(cuori) + P(figura) – P(cuori e figura) = 10/40 + 12/40 - 3/40 = 19/40 = 0,475 Es. la probabilità di avere un numero <=3 o un pari ad un lancio di dado è: P (<=3 o pari) = P (<=3) + P (pari) – P(<=3 e pari) = 3/6 + 3/6 – 1/6=5/6 CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità 23 La regola precedente del calcolo della probabilità di due eventi esclusivi si ricava dalla regola generale considerando che, se gli eventi sono esclusivi, la probabilità che si verifichino entrambi è 0 Es. la probabilità di avere un numero che sia <=3 o >=5 ad un lancio di dado: P (<=3 o >=5) = P (<=3) + P (>=5) –P(<=3 e >=5) = 3/6 + 2/6 – 0/6 = 5/6 CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità 24 Verifichiamo queste regole nel caso di uno spazio campionario di dimensioni limitate e composto da elementi discreti, ad es. dato dal lancio di una moneta e dal lancio di un dado. Lo spazio campionario è definito come l’insieme di tutti i possibili risultati. Nel caso dato N = 12. DADO Moneta 1 2 3 4 5 6 T X X X X X X C X X X X X X CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità 25 Iniziamo considerando la probabilità di uno dei due eventi. Ev. 1. Estrazione di un 3 al lancio del dado DADO Moneta 1 2 3 4 5 6 T X X X X X X C X X X X X X CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità 26 r=2; N=12 P(dado=3) = 2/12 = 1/6 Si noti che in questo caso la probabilità non tiene conto del lancio della moneta (viene definita ‘probabilità marginale’). CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità 27 Ev. 2. Testa al lancio della moneta DADO Moneta 1 2 3 4 5 6 T X X X X X X C X X X X X X r=6; N=12 P(testa) = 6/12 = 1/2 Si noti che in questo caso la probabilità non tiene conto del lancio del dado (probabilità marginale). CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità 28 Passiamo quindi a valutare l'estensione dello spazio campionario corrispondente al verificarsi dei due eventi (uno o l'altro). Estrazione di 3 al lancio del dado o testa al lancio della moneta. DADO Moneta 1 2 3 4 5 6 T X X X X X X C X X X X X X CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità 29 • dado = 3 Æ r = 2 ; N = 12; P(dado = 3) = 2/12 • moneta = testa Æ r=6 ; N = 12; P(testa) = 6/12 • sia 3 sia testa = 1/12 p(dado = 3 o moneta = testa) = p(dado = 3) + p(testa) - p(dado = 3 e moneta = testa) = 1/6 + 1/2 – 1/12 = 2/12 + 6/12 -1/12 = 7/12 CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità 30 La probabilità del realizzarsi congiunto di due eventi è data dal prodotto della probabilità del primo evento per la probabilità del secondo essendosi verificato il primo: P(A e B) = P(A) P(B|A) P(A ∩ B) = P(A) P(B|A) P(B|A) è la probabilità del verificarsi di B quando A si è verificato (probabilità condizionata) CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità Se due eventi sono indipendenti 31 P(B|A) = P(B) e quindi la probabilità che si verifichino entrambi è data dal prodotto delle probabilità di ciascuno dei due eventi. P(A ∩ B) = P(A) P(B) se P(B|A) = P(B) Due eventi sono indipendenti quando la probabilità che accada il primo non cambia la probabilità che accada il secondo. P(A|B) = P(A|nonB) = P(A) Esempio: La probabilità che sia estratto un numero del lotto non è influenzata dal fatto che sia stato estratto la settimana precedente. CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità 32 La probabilità del realizzarsi congiunto di due eventi secondo lo spazio campionario Es. Estrazione di 3 al lancio del dado e croce al lancio della moneta I due eventi sono indipendenti: i due lanci non si influenzano reciprocamente. DADO Moneta 1 2 3 4 5 6 T X X X X X X C X X X X X X CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità 33 Possiamo verificare che la probabilità congiunta dei due eventi occupa 1 / 12 dello spazio campionario. Cosa accade dall'applicazione delle regole del calcolo della probabilità? Dado =3 Æ r=2 ; N=12; P(dado=3) = 2/12 = 1/6 Moneta = testa Æ r=6 ; N=12; P(testa) = 6/12 = 1/2 p(dado=3 ∩ testa) = p(dado=3) * p(testa|dado=3) = = p(dado=3) * p(testa) = 1/6 * 1/2 = 1/12 Si verifica che nel caso di eventi indipendenti la probabilità dei due eventi è il prodotto delle probabilità marginali. CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità 34 Un metodo per valutare empiricamente se due variabili sono associate è quello di confrontare la distribuzione di probabilità osservata con quella che ci si attenderebbe se le due variabili fossero indipendenti. L’argomento sarà ripreso nelle lezioni sull’inferenza statistica. CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità 35 Esercizi consigliati da: Fowler et al, ed Edises. • Cap 9 (p 225) es 5 • Cap 9 (p 225) es 6 • Cap 9 (p 225) es 8 CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità 36