Appunti di Statistica Sociale Università Kore di Enna NOZIONI DI CALCOLO DELLE PROBABILITÀ ESPERIMENTO CASUALE: un esperimento si dice casuale quando gli esiti (manifestazioni o eventi) non possono essere previsti con certezza. PROVA: le ripetizioni, o occasioni in cui avviene un esperimento sono dette prove. Il numero di prove si indica in genere con N o n. EVENTO: è il risultato, o l’esito osservabile di una prova casuale. L’evento casuale è uno dei possibili esiti di un esperimento casuale. SPAZIO CAMPIONARIO: è l’insieme di tutti i possibili esiti di un esperimento, e si indica con Ω. Un qualsiasi sottoinsieme di Ω si indica con E⊂Ω. ESEMPIO 1: In Calcolo delle Probabilità: L’esperimento può essere il lancio di un dado non truccato, n volte; La prova è il singolo lancio; L’esito o evento è il risultato del singolo lancio; Il numero di prove sono gli n lanci. In Statistica: L’esperimento è un’indagine volta a misurare una variabile X, su N unità statistiche (u.s.); La prova è la singola osservazione condotta su ciascuna u.s.; L’esito o evento è il risultato dell’osservazione, cioè la modalità k sulla singola u.s.; Il numero di prove è dato delle N osservazioni. Pensiamo al lancio di un dado non truccato: • Ω = {1, 2, 3, 4, 5, 6} spazio campionario di tutti i possibili risultati; • P(E) = P(“1”) = 1/6: probabilità dell’evento E. • E1, E2, …, E6: eventi semplici o elementari ed equiprobabili. • A = x < 3 (1, 2): E1∪E2, evento composto (unione di due eventi semplici). • E = 7: evento impossibile (∅), non può verificarsi e non appartiene a Ω. • E = x < 7: evento certo (Ω), che si verifica sempre. Lo spazio campionario Ω è l’insieme di tutti gli eventi semplici. Gli eventi si dicono necessari quando in ogni prova si verifica almeno uno di essi. Due eventi si dicono incompatibili quando non si possono verificare contemporaneamente. Ad esempio: – in una prova/lancio non possono uscire contemporaneamente sia 1 che 2; – in una partita di calcio gli eventi di Ω = {vittoria, pareggio, sconfitta} sono incompatibili tra loro, se ne può verificare solo uno dei tre. Due eventi semplici di Ω sono tra loro necessariamente incompatibili. Due eventi che si possono verificare contemporaneamente si dicono compatibili. Dati: – A1 = {1, 2}: x < 3; – A2 = {1, 3, 5}: x = numero dispari; essi sono eventi composti e compatibili se e solo se esce x = 1. Docente: Fabio Aiello A.A. 2010/11 1 Appunti di Statistica Sociale Università Kore di Enna Un evento A si dice intersezione, o prodotto logico, di altri due eventi A1, A2∈Ω, quando essi si verificano simultaneamente: A = A1∩A2 = {1} e quindi sono compatibili. Se gli eventi sono incompatibili l’evento intersezione è nullo: A = A1∩A2 = ∅ Un evento E si dice unione, o somma logica, di altri due eventi A1, A2∈Ω, quando si verifica almeno uno di essi, o soltanto uno di essi, o entrambi: – A1 = {1, 2} – A2 = {1, 3, 5} – E = A1 ∪A2 = {1, 2, 3, 5} Un evento composto è dato dall’unione di eventi semplici, ad es. E = {x = # dispari} è composto da: {1}∪{3}∪{5}. L’evento Ē si dice complementare di E, perché si verifica se e solo se non si verifica E. Infine: i. ii. iii. P(Ω) = 1; P(∅) = 0; P(Ei) =≥ 0 ∀ i; nel nostro es. P(Ei) = 1/6 sempre. DEFINIZIONI DI PROBABILITÀ Generalmente, la probabilità a priori, o classica, di un evento E, è indicata con P(E) ed è definita come il rapporto tra i casi favorevoli al verificarsi di E ed i casi possibili. Se un evento si può verificare in N modi mutuamente esclusivi ed ugualmente probabili e se m di questi possiedono una data caratteristica E, la probabilità di verificarsi di E è data da: m P( E ) = . N I casi favorevoli m sono scelti tra quelli ugualmente possibili (equiprobabili). Quanti sono i casi favorevoli e i casi possibili? È una domanda difficile da soddisfare nelle Scienze Sociali. CONCEZIONE FREQUENTISTA – LEGGE EMPIRICA DEL CASO In una serie di (N) prove, o osservazioni, ripetute molte volte e nelle medesime condizioni relativamente ad un evento E, se x è il numero di volte in cui E si è verificato, allora la frequenza relativa di E, x/N = fx, è approssimativamente uguale alla probabilità di E: x = f x P( E ) N In base alla legge empirica del caso, al crescere di N l’approssimazione di fx a P(E) è sempre più stretta. Essa è anche detta probabilità empirica, o a posteriori. È usata quando non si conosce a priori il numero di casi favorevoli e il numero di casi possibili. Critiche all’approccio frequentista: – difficile (nelle Scienze Sociali) realizzare prove nelle medesime condizioni; – la presenza di eventi rari; – le prove non si possono replicare in numero infinito, né nelle medesime condizioni; quindi, fx è una stima della quantità incognita P(E). Docente: Fabio Aiello A.A. 2010/11 2 Appunti di Statistica Sociale Università Kore di Enna CONCEZIONE SOGGETTIVISTICA – LA PROBABILITÀ DEL VERIFICARSI La probabilità che un evento si verifichi è un numero non negativo e non maggiore di 1, che esprime il grado di fiducia che un individuo coerente attribuisce al verificarsi dell’evento, in base alle proprie conoscenze. Questa definizione non si basa sulla ripetibilità di un dato processo. ASSIOMI DELLA PROBABILITÀ (KOLMOGOROV, 1913) 1. Dato un processo che genera n risultati mutuamente esclusivi (eventi elementari), E1, E2, …, Ei, …, En, la probabilità di un dato evento Ei è sempre un numero non negativo minore di 1: 0 ≤ P(Ei) ≤ 1 ∀ i = 1, 2, …, n. Gli eventi si dicono mutuamente esclusivi se non si possono verificare contemporaneamente. Questa è la proprietà della esclusività, secondo cui tutti i possibili eventi E1, E2, …, Ei, …, En, non si devono sovrapporre. 2. La somma delle probabilità di tutti gli eventi mutuamente esclusivi è pari a 1: P(E1) +…+ P(Ei) +…+ P(En) = 1 Questa è la proprietà della esaustività, riferita al fatto che si devono considerare tutti gli eventi semplici di Ω, la cui probabilità totale è pari a 1. 3. Dati due qualsiasi eventi mutuamente esclusivi, Ei ed Ej, la probabilità che si verifichi almeno uno dei due, o entrambi è uguale alla somma delle probabilità di verificarsi dei singoli eventi: P(Ei°Ej) = P(Ei) + P(Ej). Tipi di probabilità in tabelle di contingenza a 2-vie Dati 111 soggetti distribuiti congiuntamente secondo due caratteri, la variabile genere, G, con m = 2 categorie, G1, G2, e la variabile frequenza di uso di cocaina, F, con n = 3 categorie, F1, F2, F3. La variabile doppia (G, F) da luogo alla seguente tabella di contingenza: Genere Freq. Uso Bassa (A) Cocaina Media (B) Alta (C) Tot. M 32 18 25 75 F 7 20 9 36 Tot. 39 38 34 111 dove G1 = M e G2 = F sono le due categorie mutuamente esclusive del genere, così come F1 = A, F2 = B e F3 = C lo sono della frequenza di uso di cocaina. LA PROBABILITÀ CONGIUNTA Se siamo interessati alla probabilità che estratto a caso un soggetto dal gruppo originale di individui, questo presenti simultaneamente delle caratteristiche rilevate su entrambe le variabili, allora dobbiamo calcolare la probabilità congiunta. Ad esempio, se ci chiediamo: qual è la probabilità che estratto un soggetto a caso dall’insieme originale, esso sia maschio (M) e contemporaneamente consumi cocaina con un’alta frequenza (C)? Per rispondere alla domanda dobbiamo selezionare i soggetti che soddisfano congiuntamente entrambe le condizioni (incrocio colonna M e riga C). Docente: Fabio Aiello A.A. 2010/11 3 Appunti di Statistica Sociale Università Kore di Enna P(M∩C) = 25 = 0.2252 111 P(M∩C) è nota come probabilità congiunta. LA PROBABILITÀ MARGINALE La probabilità marginale del genere è data dalla somma delle probabilità di ciascuna categoria Gi, rispetto a tutte le n categorie di B, fissato i = 1, 2 e ∀ j = 1, 2, 3: P(Gi) = ΣjP(Gi∩Fj) Es. P(G1) = P(M) = ( G1 ∩ F1 ) + ( G1 ∩ F2 ) + ( G1 ∩ F3 ) = (32 + 18 + 25) = 111 N 75 = 0.6757 111 i = 1 e j = 1, 2, 3. P(M) è nota come probabilità marginale. LA PROBABILITÀ CONDIZIONATA È frequente che l’insieme di tutti i possibili risultati di interesse sia individuato in un sottoinsieme di un totale originale, riducendone la dimensione originale in funzione di alcune caratteristiche possedute da un gruppo ristretto di casi. Le probabilità calcolate su questo nuovo gruppo sono dette probabilità condizionate e la numerosità del gruppo rappresenta il nuovo numero di casi possibili. Qual è la probabilità che un soggetto abbia consumato cocaina con frequenza alta (C), dato che è un maschio (M)? P(C|M) = Docente: Fabio Aiello 25 = 0.33 75 A.A. 2010/11 4 Appunti di Statistica Sociale Università Kore di Enna ALTRE PROPRIETÀ DELLE PROBABILITÀ LEGGE DEL PRODOTTO O PRINCIPIO DELLE PROBABILITÀ COMPOSTE Sia A un evento la cui probabilità di verificarsi è P(A)>0. Si definiscono prove condizionate da A quelle che si verificano soltanto dopo che A si è verificato. Allora, “la probabilità condizionata dell’evento B dato A” è: P ( B | A) = P( A ∩ B) P( A) posto P(A) ≠ 0. Analogamente, “la probabilità condizionata dell’evento A dato B” è: P( A | B) = P( A ∩ B) P( B) posto P(B) ≠ 0. La legge del prodotto permette di calcolare una probabilità da altre probabilità. Ad esempio, la probabilità congiunta può essere determinata come: P(A∩B) = P(B|A)⋅P(A) per P(A) ≠ 0, oppure come: P(A∩B) = P(A|B)⋅P(B) per P(B) ≠ 0. Se i due eventi sono indipendenti, allora il verificarsi del primo lascia inalterata la probabilità di verificarsi del secondo. In tal caso, le probabilità condizionate diventano, rispettivamente: P(A|B) = P(A) P(B|A) = P(B) e quindi: P(A∩B) = P(A)⋅P(B) per P(A) ≠ 0 e P(B) ≠ 0. Ovvero, se i due eventi considerati sono indipendenti, allora, la probabilità congiunta è uguale al prodotto delle due probabilità marginali. Verificare se P(M∩C) = P(M)⋅P(C). LEGGE DELLA SOMMA O PRINCIPIO RISTRETTO DELLE PROBABILITÀ TOTALI Attiene alla probabilità che si verifichi uno di due eventi, A e B, oppure entrambi. Tale probabilità è quella dell’unione di due eventi: P(E) = P(A∪B). Sappiamo già, che quando gli eventi sono mutuamente esclusivi o incompatibili, allora: P(E) = P(A∪B) = P(A)+P(B). Docente: Fabio Aiello A.A. 2010/11 5 Appunti di Statistica Sociale Università Kore di Enna Quando invece non lo sono: P(E) = P(A∪B) = P(A)+P(B)–P(A∩B). ES: se estraiamo a caso un soggetto dai 111, qual è la probabilità che esso sia maschio (M) o abbia usato cocaina con frequenza elevata (C), o entrambe le cose? P(E) = P(M∪C) = P(M)+P(C)–P(M∩C). Docente: Fabio Aiello A.A. 2010/11 6