Università del Piemonte Orientale Corso di Laurea Triennale di

Università del Piemonte Orientale
Corso di Laurea Triennale di Infermieristica
Pediatrica ed Ostetricia
Corso di Statistica Medica
Elementi di calcolo delle probabilità
CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità
1
In questa lezione parleremo di:
ƒ Probabilità: definizione e stima
ƒ Dominio della variabile e spazio campionario
ƒ Eventi e probabilità di un evento
ƒ Probabilità del verificarsi di due eventi
CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità
2
Probabilità: valutazione della possibilità che accada
(o sia accaduto) un evento.
Esempi:
1. La probabilità di incontrare una persona conosciuta ieri
2. La probabilità che domani piova
3. La probabilità che la Juventus batta il Perugia alla
prima partita di campionato
4. La probabilità di lanciare una moneta ed ottenere testa
5. La probabilità che un bambino nato oggi viva almeno
80 anni
6. La probabilità che un campione di sangue presenti una
concentrazione di emoglobina di 14,456 g/100ml
CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità
Evento, che può
Probabilità che
verificarsi o non
l’evento si
verificarsi
verifichi
CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità
3
4
Evento
Probabilità
Incontro di ...
La probabilità di incontrare una
persona conosciuta ieri
Pioggia
La probabilità che domani
piova
Vittoria della J sulla P alla
prima partita
La probabilità che la Juventus
batta il Perugia alla prima
partita di campionato
Testa
La probabilità di lanciare una
moneta ed ottenere testa
80° compleanno
La probabilità che un bambino
nato oggi viva almeno 80 anni
Campione ematico con Hb=
14,456 g/100ml
La probabilità che un
campione di sangue presenti
una concentrazione di
emoglobina di 14,456 g/100ml
CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità
5
Queste affermazioni appartengono a due categorie
diverse:
Le affermazioni 1-3 indicano la propensione soggettiva
a valutare la possibilità che l’evento accada (giudizio di
un esperto).
Le affermazioni 4-6 consentono la risposta in base alla
definizione di uno spazio campionario ed alla misura
della probabilità associata all’evento.
Noi parleremo di probabilità limitatamente a questa
seconda accezione.
CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità
6
La stima della probabilità:
A priori:
• Simmetria (geometria): lancio di moneta o di dado,
estrazione del lotto
• Logica¹ ‘se x è vero allora consegue che y deve
essere pari a….’
A posteriori:
• Frequenza di un evento osservata in un numero
molto alto di prove
• Limite della frequenza di un evento osservata per un
numero di prove tendente all’infinito
¹ Corrisponde alla stima della probabilità conseguente alla formulazione di un’ipotesi. L’argomento sarà
ripreso nelle prossime lezioni
CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità
7
probabilità di ottenere croce
0,90
0,80
prob.
0,70
0,60
prob.
0,50
0,40
0,30
0,20
0,10
0,00
0
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
n. lanci
CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità
8
105
• La variabile “risultato del lancio di un
dado” può assumere solo alcuni valori in
un intervallo, nel caso i valori 1,2,3,4,5,6
(variabile discreta);
• la variabile “stato all’età di 80 anni” può
assumere due soli valori (vivo, morto)
(variabile binaria);
• la variabile “concentrazione di
emoglobina” può assumere tutti i valori in
un intervallo (variabile continua).
CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità
9
L’intervallo in cui sono compresi i valori che
possono essere assunti da una variabile è detto
‘dominio della variabile’ o ‘spazio campionario’.
Approfondiremo dapprima il caso delle variabili
discrete e delle variabili binarie.
CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità
10
Probabilità di un evento
P = r/N
Dove
r = frequenza dell’evento
N = Numero di possibili eventi
Evento = estrazione di un asso di cuori
r = 1 (c’è un asso di cuori nel mazzo)
N = 40 (il mazzo è di 40 carte)
P=1/40=0,025
Evento = estrazione di un topo maschio dalla gabbia
r = 10 (numero di topi di sesso maschile)
N = 20 (numero totale di topi)
P=10/20=0,5
CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità
11
Alcune ulteriori definizioni e regole:
Spazio Campionario (S): l’insieme di tutte le possibili
evenienze.
P(S) = 1
La probabilità di un evento è compresa nell’intervallo
0 (evento impossibile)
-
1 (evento certo)
0 <= P(A) <= 1
CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità
12
Eventi e probabilità complementari
Dato un evento, le due condizioni "evento che si verifica" ed
"evento che non si verifica" esauriscono tutte le possibilità.
Pertanto:
P(evento che si verifica) + P(evento che non si verifica) = 1
e
P(evento che si verifica) = 1 - P(evento che non si verifica)
CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità
13
Parliamo in questo caso di probabilità complementari.
NON A
A
Cosa possiamo dire relativamente alla probabilità di
due eventi?
CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità
14
Dati due eventi possiamo essere interessati al verificarsi di
uno qualsiasi dei due.
oppure al verificarsi di entrambi.
oppure al verificarsi di uno solo se un altro si è già verificato.
CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità
15
Il verificarsi di entrambi gli eventi è indicato come ‘intersezione’
(A ∩ B)
e la probabilità è la probabilità dell’intersezione
P( A ∩ B )
CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità
16
Il verificarsi di uno qualsiasi dei due è indicato come ‘unione’
(A ∪ B)
e la probabilità è la probabilità dell’unione
P( A ∪ B )
CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità
17
La probabilità del verificarsi di un evento solo se un'altro
si è già verificato è definita Probabilità Condizionata.
CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità
18
Quando due eventi non possono mai verificarsi
contemporaneamente parliamo di ‘eventi mutuamente
esclusivi’ o disgiunti.
P( A ∩ B ) = 0
CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità
19
Nel caso di eventi mutuamente esclusivi la probabilità del
verificarsi di uno o l'altro dei due (probabilità dell'unione) è
data da:
P ( A ∪ B ) = P ( A ) + P (B )
La probabilità di uno o l'altro tra due eventi mutuamente
esclusivi è data dalla somma delle probabilità di ciascuno
dei due eventi
CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità
20
Es. la probabilità di avere testa o croce
ad un lancio di una moneta è:
P (testa o croce) = P (testa) + P (croce) = 0,5 + 0,5
La stessa regola si può estendere alla probabilità di uno
(o più) tra n eventi mutuamente esclusivi.
P(A o B o C) = P(A∪B∪C) = P(A) + P(B) + P(C)
CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità
21
La probabilità del realizzarsi di uno o l’altro tra due
eventi non mutuamente esclusivi è la somma delle
probabilità di ciascuno dei due eventi sottratta della
probabilità di entrambi (che altrimenti verrebbe
conteggiata due volte)
P(A o B) = P(A) + P(B) – P(A e B)
P(A ∪B) = P(A) + P(B) – P(A ∩B)
CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità
22
Es. la probabilità di estrarre una carta di segno (cuori) o
(figura) da un mazzo di 40 carte:
P (cuori o figura) = P(cuori) + P(figura) – P(cuori e figura)
= 10/40 + 12/40 - 3/40 = 19/40 = 0,475
Es. la probabilità di avere un numero <=3 o un pari ad
un lancio di dado è:
P (<=3 o pari) = P (<=3) + P (pari) – P(<=3 e pari)
= 3/6 + 3/6 – 1/6=5/6
CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità
23
La regola precedente del calcolo della probabilità di due
eventi esclusivi si ricava dalla regola generale
considerando che, se gli eventi sono esclusivi, la
probabilità che si verifichino entrambi è 0
Es. la probabilità di avere un numero che sia <=3 o >=5
ad un lancio di dado:
P (<=3 o >=5) = P (<=3) + P (>=5) –P(<=3 e >=5)
= 3/6 + 2/6 – 0/6 = 5/6
CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità
24
Verifichiamo queste regole nel caso di uno spazio
campionario di dimensioni limitate e composto da
elementi discreti, ad es. dato dal lancio di una moneta
e dal lancio di un dado.
Lo spazio campionario è definito come l’insieme di tutti
i possibili risultati.
Nel caso dato N = 12.
DADO
Moneta
1
2
3
4
5
6
T
X
X
X
X
X
X
C
X
X
X
X
X
X
CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità
25
Iniziamo considerando la probabilità di uno dei due eventi.
Ev. 1. Estrazione di un 3 al lancio del dado
DADO
Moneta
1
2
3
4
5
6
T
X
X
X
X
X
X
C
X
X
X
X
X
X
CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità
26
r=2; N=12
P(dado=3) = 2/12 = 1/6
Si noti che in questo caso la probabilità non tiene
conto del lancio della moneta (viene definita
‘probabilità marginale’).
CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità
27
Ev. 2. Testa al lancio della moneta
DADO
Moneta
1
2
3
4
5
6
T
X
X
X
X
X
X
C
X
X
X
X
X
X
r=6; N=12
P(testa) = 6/12 = 1/2
Si noti che in questo caso la probabilità non tiene conto
del lancio del dado (probabilità marginale).
CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità
28
Passiamo quindi a valutare l'estensione dello spazio
campionario corrispondente al verificarsi dei due eventi
(uno o l'altro).
Estrazione di 3 al lancio del dado o testa al lancio della moneta.
DADO
Moneta
1
2
3
4
5
6
T
X
X
X
X
X
X
C
X
X
X
X
X
X
CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità
29
• dado = 3 Æ r = 2 ; N = 12; P(dado = 3) = 2/12
• moneta = testa Æ r=6 ;
N = 12; P(testa) = 6/12
• sia 3 sia testa = 1/12
p(dado = 3 o moneta = testa)
= p(dado = 3) + p(testa) - p(dado = 3 e moneta = testa)
= 1/6 + 1/2 – 1/12 = 2/12 + 6/12 -1/12 = 7/12
CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità
30
La probabilità del realizzarsi congiunto di due eventi
è data dal prodotto della probabilità del primo evento per la
probabilità del secondo essendosi verificato il primo:
P(A e B) = P(A) P(B|A)
P(A ∩ B) = P(A) P(B|A)
P(B|A) è la
probabilità del verificarsi di B quando A si è verificato
(probabilità condizionata)
CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità
Se due eventi sono indipendenti
31
P(B|A) = P(B)
e quindi la probabilità che si verifichino entrambi è data dal
prodotto delle probabilità di ciascuno dei due eventi.
P(A ∩ B) = P(A) P(B)
se P(B|A) = P(B)
Due eventi sono indipendenti quando la probabilità che accada il
primo non cambia la probabilità che accada il secondo.
P(A|B) = P(A|nonB) = P(A)
Esempio: La probabilità che sia estratto un numero del lotto
non è influenzata dal fatto che sia stato estratto la settimana
precedente.
CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità
32
La probabilità del realizzarsi congiunto di due eventi
secondo lo spazio campionario
Es. Estrazione di 3 al lancio del dado e croce al lancio della
moneta
I due eventi sono indipendenti: i due lanci non si influenzano
reciprocamente.
DADO
Moneta
1
2
3
4
5
6
T
X
X
X
X
X
X
C
X
X
X
X
X
X
CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità
33
Possiamo verificare che la probabilità congiunta dei due
eventi occupa 1 / 12 dello spazio campionario.
Cosa accade dall'applicazione delle regole del calcolo
della probabilità?
Dado =3 Æ r=2 ; N=12; P(dado=3) = 2/12 = 1/6
Moneta = testa Æ r=6 ; N=12; P(testa) = 6/12 = 1/2
p(dado=3 ∩ testa) = p(dado=3) * p(testa|dado=3) =
= p(dado=3) * p(testa) = 1/6 * 1/2 = 1/12
Si verifica che nel caso di eventi indipendenti la probabilità
dei due eventi è il prodotto delle probabilità marginali.
CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità
34
Un metodo per valutare empiricamente se due variabili
sono associate è quello di confrontare la distribuzione
di probabilità osservata con quella che ci si
attenderebbe se le due variabili fossero indipendenti.
L’argomento sarà ripreso nelle lezioni sull’inferenza
statistica.
CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità
35
Esercizi consigliati
da: Fowler et al, ed Edises.
• Cap 9 (p 225) es 5
• Cap 9 (p 225) es 6
• Cap 9 (p 225) es 8
CdL Infermieristica Pediatrica ed Ostetricia - Statistica Medica - Probabilità
36