7. Nozioni di Calcolo delle Probabilità_SDS

Appunti di Statistica Sociale
Università Kore di Enna
NOZIONI DI CALCOLO DELLE PROBABILITÀ
ESPERIMENTO CASUALE: un esperimento si dice casuale quando gli esiti (manifestazioni o eventi)
non possono essere previsti con certezza.
PROVA: le ripetizioni, o occasioni in cui avviene un esperimento sono dette prove. Il numero di
prove si indica in genere con N o n.
EVENTO: è il risultato, o l’esito osservabile di una prova casuale. L’evento casuale è uno dei
possibili esiti di un esperimento casuale.
SPAZIO CAMPIONARIO: è l’insieme di tutti i possibili esiti di un esperimento, e si indica con Ω. Un
qualsiasi sottoinsieme di Ω si indica con E⊂Ω.
ESEMPIO 1:
In Calcolo delle Probabilità:
L’esperimento può essere il lancio di un dado non truccato, n volte;
La prova è il singolo lancio;
L’esito o evento è il risultato del singolo lancio;
Il numero di prove sono gli n lanci.
In Statistica:
L’esperimento è un’indagine volta a misurare una variabile X, su N unità statistiche (u.s.);
La prova è la singola osservazione condotta su ciascuna u.s.;
L’esito o evento è il risultato dell’osservazione, cioè la modalità k sulla singola u.s.;
Il numero di prove è dato delle N osservazioni.
Pensiamo al lancio di un dado non truccato:
• Ω = {1, 2, 3, 4, 5, 6} spazio campionario di tutti i possibili risultati;
• P(E) = P(“1”) = 1/6: probabilità dell’evento E.
• E1, E2, …, E6: eventi semplici o elementari ed equiprobabili.
• A = x < 3 (1, 2): E1∪E2, evento composto (unione di due eventi semplici).
• E = 7: evento impossibile (∅), non può verificarsi e non appartiene a Ω.
• E = x < 7: evento certo (Ω), che si verifica sempre.
Lo spazio campionario Ω è l’insieme di tutti gli eventi semplici.
Gli eventi si dicono necessari quando in ogni prova si verifica almeno uno di essi.
Due eventi si dicono incompatibili quando non si possono verificare contemporaneamente. Ad
esempio:
– in una prova/lancio non possono uscire contemporaneamente sia 1 che 2;
– in una partita di calcio gli eventi di Ω = {vittoria, pareggio, sconfitta} sono
incompatibili tra loro, se ne può verificare solo uno dei tre.
Due eventi semplici di Ω sono tra loro necessariamente incompatibili.
Due eventi che si possono verificare contemporaneamente si dicono compatibili. Dati:
– A1 = {1, 2}: x < 3;
– A2 = {1, 3, 5}: x = numero dispari;
essi sono eventi composti e compatibili se e solo se esce x = 1.
Docente: Fabio Aiello
A.A. 2010/11
1
Appunti di Statistica Sociale
Università Kore di Enna
Un evento A si dice intersezione, o prodotto logico, di altri due eventi A1, A2∈Ω, quando essi si
verificano simultaneamente:
A = A1∩A2 = {1}
e quindi sono compatibili.
Se gli eventi sono incompatibili l’evento intersezione è nullo:
A = A1∩A2 = ∅
Un evento E si dice unione, o somma logica, di altri due eventi A1, A2∈Ω, quando si verifica
almeno uno di essi, o soltanto uno di essi, o entrambi:
– A1 = {1, 2}
– A2 = {1, 3, 5}
– E = A1 ∪A2 = {1, 2, 3, 5}
Un evento composto è dato dall’unione di eventi semplici, ad es. E = {x = # dispari} è composto da:
{1}∪{3}∪{5}.
L’evento Ē si dice complementare di E, perché si verifica se e solo se non si verifica E.
Infine:
i.
ii.
iii.
P(Ω) = 1;
P(∅) = 0;
P(Ei) =≥ 0 ∀ i; nel nostro es. P(Ei) = 1/6 sempre.
DEFINIZIONI DI PROBABILITÀ
Generalmente, la probabilità a priori, o classica, di un evento E, è indicata con P(E) ed è definita
come il rapporto tra i casi favorevoli al verificarsi di E ed i casi possibili.
Se un evento si può verificare in N modi mutuamente esclusivi ed ugualmente probabili e se m di
questi possiedono una data caratteristica E, la probabilità di verificarsi di E è data da:
m
P( E ) = .
N
I casi favorevoli m sono scelti tra quelli ugualmente possibili (equiprobabili).
Quanti sono i casi favorevoli e i casi possibili?
È una domanda difficile da soddisfare nelle Scienze Sociali.
CONCEZIONE FREQUENTISTA – LEGGE EMPIRICA DEL CASO
In una serie di (N) prove, o osservazioni, ripetute molte volte e nelle medesime condizioni
relativamente ad un evento E, se x è il numero di volte in cui E si è verificato, allora la frequenza
relativa di E, x/N = fx, è approssimativamente uguale alla probabilità di E:
x
= f x P( E )
N
In base alla legge empirica del caso, al crescere di N l’approssimazione di fx a P(E) è sempre più
stretta. Essa è anche detta probabilità empirica, o a posteriori. È usata quando non si conosce a
priori il numero di casi favorevoli e il numero di casi possibili.
Critiche all’approccio frequentista:
– difficile (nelle Scienze Sociali) realizzare prove nelle medesime condizioni;
– la presenza di eventi rari;
– le prove non si possono replicare in numero infinito, né nelle medesime condizioni;
quindi, fx è una stima della quantità incognita P(E).
Docente: Fabio Aiello
A.A. 2010/11
2
Appunti di Statistica Sociale
Università Kore di Enna
CONCEZIONE SOGGETTIVISTICA – LA PROBABILITÀ DEL VERIFICARSI
La probabilità che un evento si verifichi è un numero non negativo e non maggiore di 1, che
esprime il grado di fiducia che un individuo coerente attribuisce al verificarsi dell’evento, in base
alle proprie conoscenze. Questa definizione non si basa sulla ripetibilità di un dato processo.
ASSIOMI DELLA PROBABILITÀ (KOLMOGOROV, 1913)
1. Dato un processo che genera n risultati mutuamente esclusivi (eventi elementari), E1, E2, …,
Ei, …, En, la probabilità di un dato evento Ei è sempre un numero non negativo minore di 1:
0 ≤ P(Ei) ≤ 1
∀ i = 1, 2, …, n.
Gli eventi si dicono mutuamente esclusivi se non si possono verificare contemporaneamente.
Questa è la proprietà della esclusività, secondo cui tutti i possibili eventi E1, E2, …, Ei, …,
En, non si devono sovrapporre.
2. La somma delle probabilità di tutti gli eventi mutuamente esclusivi è pari a 1:
P(E1) +…+ P(Ei) +…+ P(En) = 1
Questa è la proprietà della esaustività, riferita al fatto che si devono considerare tutti gli
eventi semplici di Ω, la cui probabilità totale è pari a 1.
3. Dati due qualsiasi eventi mutuamente esclusivi, Ei ed Ej, la probabilità che si verifichi
almeno uno dei due, o entrambi è uguale alla somma delle probabilità di verificarsi dei
singoli eventi:
P(Ei°Ej) = P(Ei) + P(Ej).
Tipi di probabilità in tabelle di contingenza a 2-vie
Dati 111 soggetti distribuiti congiuntamente secondo due caratteri, la variabile genere, G, con m = 2
categorie, G1, G2, e la variabile frequenza di uso di cocaina, F, con n = 3 categorie, F1, F2, F3.
La variabile doppia (G, F) da luogo alla seguente tabella di contingenza:
Genere
Freq. Uso Bassa (A)
Cocaina Media (B)
Alta (C)
Tot.
M
32
18
25
75
F
7
20
9
36
Tot.
39
38
34
111
dove G1 = M e G2 = F sono le due categorie mutuamente esclusive del genere, così come F1 = A, F2
= B e F3 = C lo sono della frequenza di uso di cocaina.
LA PROBABILITÀ CONGIUNTA
Se siamo interessati alla probabilità che estratto a caso un soggetto dal gruppo originale di individui,
questo presenti simultaneamente delle caratteristiche rilevate su entrambe le variabili, allora
dobbiamo calcolare la probabilità congiunta.
Ad esempio, se ci chiediamo: qual è la probabilità che estratto un soggetto a caso dall’insieme
originale, esso sia maschio (M) e contemporaneamente consumi cocaina con un’alta frequenza
(C)?
Per rispondere alla domanda dobbiamo selezionare i soggetti che soddisfano congiuntamente
entrambe le condizioni (incrocio colonna M e riga C).
Docente: Fabio Aiello
A.A. 2010/11
3
Appunti di Statistica Sociale
Università Kore di Enna
P(M∩C) =
25
= 0.2252
111
P(M∩C) è nota come probabilità congiunta.
LA PROBABILITÀ MARGINALE
La probabilità marginale del genere è data dalla somma delle probabilità di ciascuna categoria Gi,
rispetto a tutte le n categorie di B, fissato i = 1, 2 e ∀ j = 1, 2, 3:
P(Gi) = ΣjP(Gi∩Fj)
Es.
P(G1) = P(M) =
( G1 ∩ F1 ) + ( G1 ∩ F2 ) + ( G1 ∩ F3 ) = (32 + 18 + 25) =
111
N
75
= 0.6757
111
i = 1 e j = 1, 2, 3. P(M) è nota come probabilità marginale.
LA PROBABILITÀ CONDIZIONATA
È frequente che l’insieme di tutti i possibili risultati di interesse sia individuato in un sottoinsieme
di un totale originale, riducendone la dimensione originale in funzione di alcune caratteristiche
possedute da un gruppo ristretto di casi. Le probabilità calcolate su questo nuovo gruppo sono dette
probabilità condizionate e la numerosità del gruppo rappresenta il nuovo numero di casi possibili.
Qual è la probabilità che un soggetto abbia consumato cocaina con frequenza alta (C), dato che è
un maschio (M)?
P(C|M) =
Docente: Fabio Aiello
25
= 0.33
75
A.A. 2010/11
4
Appunti di Statistica Sociale
Università Kore di Enna
ALTRE PROPRIETÀ DELLE PROBABILITÀ
LEGGE DEL PRODOTTO O PRINCIPIO DELLE PROBABILITÀ COMPOSTE
Sia A un evento la cui probabilità di verificarsi è P(A)>0.
Si definiscono prove condizionate da A quelle che si verificano soltanto dopo che A si è verificato.
Allora, “la probabilità condizionata dell’evento B dato A” è:
P ( B | A) =
P( A ∩ B)
P( A)
posto P(A) ≠ 0.
Analogamente, “la probabilità condizionata dell’evento A dato B” è:
P( A | B) =
P( A ∩ B)
P( B)
posto P(B) ≠ 0.
La legge del prodotto permette di calcolare una probabilità da altre probabilità. Ad esempio, la
probabilità congiunta può essere determinata come:
P(A∩B) = P(B|A)⋅P(A)
per P(A) ≠ 0, oppure come:
P(A∩B) = P(A|B)⋅P(B)
per P(B) ≠ 0.
Se i due eventi sono indipendenti, allora il verificarsi del primo lascia inalterata la probabilità di
verificarsi del secondo. In tal caso, le probabilità condizionate diventano, rispettivamente:
P(A|B) = P(A)
P(B|A) = P(B)
e quindi:
P(A∩B) = P(A)⋅P(B)
per P(A) ≠ 0 e P(B) ≠ 0. Ovvero, se i due eventi considerati sono indipendenti, allora, la probabilità
congiunta è uguale al prodotto delle due probabilità marginali.
Verificare se P(M∩C) = P(M)⋅P(C).
LEGGE DELLA SOMMA O PRINCIPIO RISTRETTO DELLE PROBABILITÀ TOTALI
Attiene alla probabilità che si verifichi uno di due eventi, A e B, oppure entrambi. Tale probabilità è
quella dell’unione di due eventi:
P(E) = P(A∪B).
Sappiamo già, che quando gli eventi sono mutuamente esclusivi o incompatibili, allora:
P(E) = P(A∪B) = P(A)+P(B).
Docente: Fabio Aiello
A.A. 2010/11
5
Appunti di Statistica Sociale
Università Kore di Enna
Quando invece non lo sono:
P(E) = P(A∪B) = P(A)+P(B)–P(A∩B).
ES: se estraiamo a caso un soggetto dai 111, qual è la probabilità che esso sia maschio (M) o abbia
usato cocaina con frequenza elevata (C), o entrambe le cose?
P(E) = P(M∪C) = P(M)+P(C)–P(M∩C).
Docente: Fabio Aiello
A.A. 2010/11
6