CENNI DI CALCOLO COMBINATORIO E DELLE PROBABILITÀ Appunti delle lezioni del Prof. Giuseppe Puggioni a cura di M. Marras e B. Pettinelli CALCOLO COMBINATORIO Disposizioni semplici Dati n elementi ( a1, a2, a3, a4,…….. an-1, an ) tra loro distinti, si dicono disposizioni semplici (D) di classe h, per h < n, tutti i gruppi che si possono fare con gli n elementi prendendoli h per volta, in modo che ogni gruppo di h elementi differisca dagli altri per qualche elemento o perché gli stessi elementi sono diversamente ordinati. Dn,h = n (n-1) (n-2) (n-3) x………….(n-h+1) Esempio Con i 10 elementi distinti “S1 , T2 , A3 , T4 , I5 , S6 , T7 , I8 , C9 , A10” che compongono la parola statistica il numero di disposizioni che si possono ottenere prendendo gli elementi a tre a tre è dato da: D10,3 = 10 x (10-1) x (10-3+1) = 10 x 9 x 8 = 720 Il risultato ottenuto sta ad indicare che il numero di gruppi che si possono ottenere con i 10 elementi prendendoli tre per volta e tale che ciascun gruppo differisca dagli altri per avere o un elemento (lettera) diverso (si fa presente che le lettere anche se si ripetono si devono considerare come elementi diversi in quanto distinti) o gli stessi elementi disposti diversamente è di 720. In pratica dati n elementi distinti e stabilito il numero di essi che devono far parte di ogni gruppo per la determinazione di Dn,h si calcola prima l’ultimo fattore che è = n – h + 1 e quindi si aggiungono gli altri fattori, procedendo da destra verso sinistra, facendoli crescere di una unità passando da un fattore all’altro fino a n. Permutazioni semplici Le permutazioni semplici sono il numero di gruppi ordinati e distinti che si possono formare con n elementi disponendo gli stessi in ordine diverso Pn = n! Il simbolo n! prende il nome di fattoriale di n. Esso è dato dal prodotto dei primi n numeri naturali. Così ad esempio 6! è dato da 1 x 2 x 3 x 4 x 5 x 6 Pn è un caso particole delle disposizioni quando h = n. Infatti in questa eventualità si avrebbe che Dn,n, sarebbe uguale a n (n-1) (n-2) (n-3) ………..(n-n+1). Appare del tutto evidente che questo prodotto letto da destra verso sinistra non è nient'altro che il prodotto dei primi n numeri naturali e cioè il fattoriale di n. Combinazioni semplici n (n 1) (n 2) (n 3) ..............(n h 1) Ph h! Si dicono combinazioni semplici di n elementi distinti di classe h, per h n, tutti i possibili gruppi che si possono fare con gli n elementi, prendendoli h per volta, in modo che ogni gruppo di h elementi differisca dagli altri per almeno un elemento diverso per cui sarà anche Dn,h= Cn,h Ph Cn,h Dn,h 2 Esempio: Considerando i 10 elementi distinti che compongono la parola statistica il numero di combinazioni che si possono ottenere prendendoli 4 per volta sarà: C10,4 = D10, 4 P4 10 9 8 7 10 9 8 7 5040 210 4! 1 2 3 4 24 n Cn,h viene indicato con il simbolo che prende il nome di coefficiente binomiale h n Moltiplicando il numeratore e il denominatore di per il fattoriale di n-h e il numeratore e il h n per il fattoriale di h, si dimostra facilmente che denominatore di n h n n n! h n h h ! n h ! n per cui essendo per h = n = 1 sarà anche n n n = = 1 n n 0 n per 2 n 1 n 1 poi decrescere simmetricamente. Per n dispari si hanno due valori massimi per h e 2 2 2 2 n Il coefficiente binomiale trova applicazione per lo sviluppo del binomio di Newton (a + b)n, la h Al crescere di h di unità in unità (da 0 a n) il valore del rapporto cresce, per n pari, fino a h n cui soluzione è data da n h a h b n h per h che assume i valori da 0 a n, in quanto fornisce i valori h dei coefficienti da assegnare ai prodotti delle potenze dei due termini (ah e bn-h) che concorrono nel calcolo della potenza del binomio. Esempio: Dovendo calcolare (a + b)10 i singoli termini del binomio saranno dati da: 10 0 10 0 a b = 1∙1∙ b10 = b10 (si ricorda che un numero elevato 0 è uguale a 1) 0 10 1 101 a b = 10 a1 b9 = 10 a b9 1 10 2 10 2 10 9 8 8 a b = a b = 45 a8 b2 2 2 ! 10 3 10 3 10 9 8 3 7 a b = a b = 120 a3 b7 3 3 ! 10 4 10 4 10 9 8 7 4 6 a b = a b = 210 a4 b6 4 4 ! 3 10 5 10 5 10 9 8 7 6 5 5 a b = a b = 252 a5 b5 5 5 ! 10 6 10 6 10 9 8 7 6 5 6 4 a b = a b = 210 a6 b4 6 6 ! 10 7 10 7 10 9 8 7 6 5 4 7 3 a b = a b = 120 a7 b3 7 7 ! 10 8 108 10 9 8 7 6 5 4 3 8 2 a b = a b = 45 a8 b2 8 8 ! 10 9 10 9 10 9 8 7 6 5 4 3 2 9 1 a b = a b = 10 a9 b 9 9 ! 10 10 1010 10 9 8 7 6 5 4 3 2 1 10 0 a b = a b =1 a10 = a10 10 10 ! per cui (a + b)10 sarà uguale a: b10+10 a b9+45 a2 b8+120 a3 b7+210 a4 b6+252 a5 b5+210 a6 b4+120 a7 b3+45 a8 b2+10 a9 b+a10 Osservando i valori assunti dai coefficienti si può verificare, così come si è già avuto modo di 10 10 sottolineare, che essi assumono valore 1 per e e che il loro valore cresce al crescere di h 0 10 fino, essendo n pari, a n/2 cioè a 10/2 = 5, per poi diminuire simmetricamente. 4 CALCOLO DELLE PROBABILITÁ CENNI INTRODUTTIVI Gli eventi Un fatto, un esperimento, si dicono casuali o aleatori quando il manifestarsi del fatto o dell’esperimento non possono essere previsti con certezza. Lo spazio campionario (Ω) Lo spazio campionario o spazio degli eventi possibili è l’insieme di tutte le manifestazioni del fatto casuale. Nel caso del lancio di un dado lo spazio campionario è dato da: Ω = {1, 2, 3, 4, 5, 6} Cosi lo spazio campionario del sesso in una coppia di fratelli, indicando con M maschio e con F femmina, è formato dall’insieme Ω = {MM, MF, FM, FF} È del tutto evidente che mentre è noto il totale dei possibili risultati (spazio campionario), non può invece essere previsto il risultato del singolo esperimento o prova o evento che sia. Eventi semplici e eventi composti Sono eventi semplici quelli derivanti da un solo risultato, sono invece eventi composti quelli che si possono verificare in più modi. Nel lancio di un dado, ad esempio, è un evento semplice l’uscita del 5, che si indicherà E {5}, mentre è composto l’evento uscita di un numero pari, E{2, 4, 6}, in quanto tale evento può verificarsi in tre possibili diversi modi (uscita del 2 o uscita del 4 o uscita del 6). Gli eventi semplici sono anche denominati punti campione. L’insieme dei punti campione costituisce lo spazio degli eventi possibili, per cui è denominato, come accennato, spazio campionario. Si deve tener presente: 1 - che gli elementi che formano lo spazio campionario non sempre sono punti campione. Infatti se si considera l’evento sesso nella nascita di una coppia di fratelli di cui sopra, e si indica con A nascita di due maschi, con B nascita di due femmine e con C nascita di un maschio e di una femmina, gli elementi che costituiscono lo spazio campionario Ω = {A, B, C} non tutti sono punti campione in quanto l’evento C può essere originato in due modi diversi: nascita di un maschio e quindi di una femmina (MF) oppure nascita di una femmina e quindi di un maschio (FM); 2 - lo stesso avvenimento o lo stesso esperimento possono dare origine a spazi campionari diversi, come nel caso dell’evento sesso nella nascita di una coppia di fratelli; 3 - lo spazio campionario dei punti campione è quello che sicuramente fornisce più informazioni; 4 - un evento composto può essere decomposto in punti campione. 5 Evento certo e evento impossibile Un evento dicesi certo se si verifica sempre. Ad esempio è certo che nel lancio di un dado esca un numero da 1a 6. L’evento certo si indica con Ω in quanto rappresentando l’insieme di tutte le manifestazioni possibili, necessariamente si deve verificare. Un evento è impossibile se non può mai verificarsi. Ad esempio l’uscita del 7 nel lancio di un dado con sei facce numerate da 1 a 6. L’evento impossibile si indica con il simbolo . Eventi necessari Due o più eventi si dicono necessari se in ogni prova si verifica almeno uno di essi. Ad esempio gli eventi E1{1}, E2{2}, E3{3}, E4{4}, E5{5}, E6{6} associati al lancio di un dado sono necessari in quanto in ogni prova sicuramente si verificherà uno di essi. Eventi incompatibili e compatibili Due eventi si dicono incompatibili quando non si possono verificare contemporaneamente. Se nel lancio di una moneta esce testa è impossibile che nella stessa prova possa uscire croce. Così in una partita di calcio i tre eventi possibili vittoria della squadra A, vittoria della B e pareggio è impossibile che possano verificarsi più di uno alla volta contemporaneamente. Gli eventi che non sono incompatibili si dicono compatibili. Così nel lancio di un dado l’evento A uscita di un numero minore di 3 EA{1, 2} è compatibile con l’evento B uscita di un numero pari EB{2, 4, 6}. Infatti se si verifica l’apparizione del numero 2 tale risultato verifica tutti e due gli eventi. Eventi indipendenti e eventi dipendenti Uno o più eventi si dicono indipendenti se il verificarsi di uno in una prova non rende impossibile il verificarsi di uno qualsiasi (anche lo stesso) degli eventi in altre prove. Ad esempio se nel lancio di un dado esce il 2 , in un secondo, terzo, ecc, lancio si può ancora verificare l’uscita del 2 o di qualsiasi altro evento, cioè di un numero da 1 a 6. Quando gli eventi non sono indipendenti si dicono dipendenti. Se, ad esempio, da un’urna contenente 90 palline numerate da 1 a 90, si estrae la pallina con il numero 10 e tale pallina non viene reinserita nell’urna, l’uscita del 10 nella prima estrazione esclude che il 10 possa essere estratto in una seconda estrazione. Somma logica (o unione) di eventi semplici Se E1, E2, E3,……… Ek sono eventi incompatibili E = E1 E2 E3 ...… Ek L’evento E così definito è chiamato evento totale o somma logica dei k eventi incompatibili. Ad esempio se l’evento E è l’uscita di un numero inferiore a 4 nel lancio di un dado e cioè E1 = 1 , E2 = 2 , E3 = 3 Si scriverà E = E1 E2 E3 Risulta quindi che l’evento composto E è dato dalla somma logica o unione di più eventi semplici. Da quanto sopra si può dedurre facilmente che: 1 – se gli eventi sono compatibili devono essere considerati una volta sola. Così nel caso del lancio di un dado, l’unione degli eventi E1 = 1, 2 e E2 = 2, 3, 5 sarà dato da: E1 E2 = 1, 2, 3, 5 e non da E1 E2 = 1, 2, 2, 3, 5 6 2 – più eventi incompatibili E1 , E2 , E3 ,…… Ek tutti appartenenti a Ω formano una classe completa se e solo se E1 E2 E3 …… Ek = Ω Prodotto logico (o intersezione) di eventi indipendenti Un evento E si dice prodotto logico o intersezione di k eventi indipendenti, tutti definiti nello stesso spazio campionario Ω, quando esso è costituito da quella parte di Ω che appartiene contemporaneamente a tutti i k eventi indipendenti. In questi casi si userà la notazione: E = E1 E2 E3 …… Ek Tale notazione (= prodotto logico o intersezione) sta a significare che quando si realizza E si verificano contemporaneamente anche tutti gli eventi E1 , E2 , E3 ,…… Ek Se nel lancio di un dado gli eventi attesi sono E1 = 2, 3, 4, E2 = 2, 3, 5 e, E3 = 2, 3, 6, l’evento intersezione o prodotto logico è: E1 E2 E3 = 2, 3 Da quanto detto, risulta chiaro che nel caso di uscita del 2 o del 3, si verificano contemporaneamente E1, E2 e E3. È altrettanto evidente che se gli eventi sono incompatibili l’evento intersezione sarà un evento impossibile in quanto non vi sono parti in comune. Così nel caso che nel lancio di un dado l’evento che preveda ad es. E1 = 2 e E2 = 5e cioè che esca il due 2 e il 5, che sono eventi incompatibili, sarà: E1 E2 = Ø = impossibilità che si verifichi l’evento Evento complementare Un evento dicesi complementare dell’evento E, e si indica con il simbolo Ē, se si verifica nello spazio campionario Ω quando non si verifica E. Cosi nell’estrazione da un’urna contenente palline bianche e nere, l’evento complementare di E1 = B = estrazione di una pallina bianca è Ē2 = N = estrazione di una pallina nera. Va da se che se nell’urna vi sono palline di diversi colori l’evento complementare di E1 = B sarà Ē2 = NB, cioè estrazione di una pallina non bianca. Da quanto sopra è del tutto evidente che: a - anche Ē è una parte di Ω; b-ĒE=Ω; c - Ē E = Ø. LA PROBABILITÀ Come opportunamente sottolinea Leti “sulla definizione di probabilità di un evento non c’è alcun accordo in campo scientifico e ciò è stato fin dagli albori del calcolo delle probabilità: vi sono scuole che si fronteggiano e si combattono e nell’ambito delle stesse scuole vi sono correnti pugnaci e intransigenti (quasi quanto quelle dei nostri partiti). Il fatto è che nella nostra vita noi abbiamo sempre a che fare con la probabilità e quindi nel nostro linguaggio comune parliamo spesso di probabilità, però in modo piuttosto vago”. Qui di seguito, sempre rifacendoci al Leti, si riportano le principali definizioni di probabilità, avvertendo fin da ora che le definizioni a cui più frequentemente si fa riferimento negli studi sociali sono la Classica e la Frequentista. Per questo motivo, per quanto esse siano state formulate prima delle altre, vengono descritte per ultime. 7 LE DIVERSE IMPOSTAZIONI 1 - Definizione logica La probabilità di un evento è data dalla misura dell’aspettativa di un evento, sulla quale misura vi è concordanza della maggioranza degli individui. Come sottolinea ancora Leti, “la probabilità, nell’approccio logico, è riguardata come un concetto che modifica e amplia il campo di applicazione della logica formale: in questa per due proposizioni A e B si può dichiarare soltanto o ‹A implica B› o ‹A confuta B›; con il concetto di probabilità invece si esprime il grado di implicazione di B fornito da A. Quando questo concetto si applica ad un insieme A di conoscenze su una situazione e ad un possibile risultato B, la probabilità indica la misura con cui A implica B. La probabilità è dunque una misura dell’aspettativa di un evento, misura che però deve avere una logica credibilità, essere tale cioè che su di essa concordi la maggioranza degli individui e che, se un individuo è di parere discorde, questi è in errore. … ‹in qual modo si può assegnare un numero al grado di aspettativa?› o, in breve, ‹come si può misurarlo?›. Infatti diversi individui attribuiscono generalmente una diversa probabilità ad uno stesso evento”. In ultima analisi la debolezza dell’approccio logico discende dal fatto che è impossibile definire come si possa pervenire alla misura dell’aspettativa dell’evento. 2 - Definizione soggettivista La probabilità è una stima del grado di aspettativa di un evento, stima che è personale, caratteristica dell’individuo, ed ottenuta tramite l’esperienza che questi ha accumulato. Una tale impostazione amplia al massimo il campo di applicazione della teoria della probabilità. Tuttavia se essa è soddisfacente, ad esempio, per colui che decide di investire in un certo tipo di azioni o di giocare certi numeri al lotto o ancora di uscire da casa con o senza ombrello, non lo è invece per “coloro per i quali il mondo esterno è una realtà indipendente da loro e conoscibile. Infatti, i giudizi probabilistici possono essere usati per conoscere questa realtà obiettiva, ma la conoscenza obiettiva è possibile solo se le conclusioni non provengono da preferenze personali o da pregiudizi dei singoli”. Le critiche all’impostazione soggettivista non concernono pertanto la definizione di probabilità, quanto per le “conseguenze sulla conoscenza del reale” o per meglio dire per il fatto che “rende impraticabile la via della conoscenza del reale”. 3 - Definizione assiomatica La probabilità è una funzione additiva, non negativa e che come si vedrà secondo l’impostazione classica al massimo può assumere il valore 1. L’aspetto debole di questa impostazione discende dal fatto che con questa “visione si costruisce tutta la teoria della probabilità, che è in sé coerente, ma che non può essere collegata con la realtà”. 4 - Definizione classica o probabilità a priori di un evento La probabilità che ha un evento di verificarsi è data dal rapporto tra il numero dei casi favorevoli all’evento e il totale dei casi possibili = spazio degli eventi possibili Ω, purché tutti i casi siano ugualmente possibili In termini analitici n Pr (E) = N Dove E è l’evento atteso, n il numero dei casi favorevoli e N quello di tutti i casi ugualmente possibili. Ad esempio la probabilità che esca il 4 nel lancio di un dado con sei facce numerate dall’1 1 al 6 sarà: Pr (E4) = in quanto essendovi un solo 4 n = 1 (casi favorevoli) e N = 6 (tutti i casi 6 ugualmente possibili); 8 cosi la probabilità che esca un numero pari nel lancio di un dado con sei facce numerate dall’1 al 6 sarà: 3 1 Pr (E2, 4, 6) = in quanto essendovi tre numeri pari n = 3 casi favorevoli e N = 6 tutti i casi 6 2 ugualmente possibili; cosi ancora se in una famiglia vi sono 3 figli quale è la probabilità che vi siano 2 maschi e 1 femmina? Il totale dei casi possibili N sarà uguale a 8, che è dato da tutti i possibili eventi e cioè: MMM, MMF, MFM, FMM, FFM, FMF, MFF, FFF = Ω e quello dei casi favorevoli n sarà uguale a 3 in quanto dato dagli eventi MMF, MFM, FMM per cui la probabilità che in una famiglia con 3 figli vi siano 2 maschi e 1 femmina sarà di 3 8 Potendo n assumere i valori da 0 a N, sarà 0 ≤ n N. n Dividendo ora tutto per N, ricordando che = Pr (E), risulta che 0 ≤ Pr (E) 1. N È del tutto evidente che se n = 0 (ad es. uscita del numero 7 nel lancio di un dado con sei facce 0 numerate dall’1 al 6) = 0 che significa impossibilità che si verifichi l’ evento. Se invece n = N N (ad es. uscita dell’1, o del 2 o del 3, o del 4, o del 5, o del 6 nel lancio di un dado con sei facce N numerate dall’1 al 6) si avrà = 1 che significa che si ha la certezza che si verifichi l’evento. N L’aspetto criticabile insito in questa definizione discende dal fatto che l’espressione ugualmente possibili, non significa altro che tutti i casi devono essere ugualmente probabili. “Il circolo vizioso appare evidente: per valutare una probabilità occorre conoscere preventivamente quali casi devono considerarsi come ugualmente probabili” . In altri termini si è di fronte ad una tautologia, circostanza questa che non è ammessa in sede di definizione di un concetto. 5 - Definizione frequentista La probabilità di un evento è il limite, al crescere del numero delle esperienze, della serie delle frequenze dell’evento ottenute da esperienze fatte in condizioni uguali. In altri termini se relativamente ad un dato evento E si effettuano in condizioni uguali N prove (es. uscita del 2 nel lancio di un dado) e n è il numero delle volte in cui l’evento si è verificato, n l’esperienza (e non la teoria matematica) dimostra che la frequenza relativa f data dal rapporto N al crescere di N tende alla probabilità Pr (E). Da tale evidenza discende il fatto che la probabilità Pr (E) rappresenterebbe la misura idonea a prevedere la frequenza f dell’evento quando N è sufficientemente grande. Da quanto sopra risulta del tutto evidente che: a - il valore di f varia al variare del numero delle prove; b - f = Pr (E) solo per N = e cioè se si effettuano un numero infinito di prove, eventualità questa che è chiaramente impossibile. c - è del tutto generica l’espressione sufficientemente grande. L’unica cosa che si può dire è che sperimentalmente si è potuto verificare che tanto più grande è il numero delle prove, cioè N, tanto più f tende a Pr (E). Utilizzando la definizione frequentista, effettuando un gran numero di prove e reinserendo dopo ogni prova la pallina estratta da una data urna, sarebbe quindi possibile stabilire qual è la probabilità 9 di estrarre una pallina bianca da tale urna di cui si supponga di non conoscere né il numero totale N delle palline (= tutti i casi ugualmente possibili) né quello delle palline bianche n (= casi favorevoli). Ovviamente dopo ogni prova, prima di reinserire la pallina nell’urna, lo sperimentatore dovrà verificare che le palline siano tutte uguali (stessa grandezza, stesso peso, ecc.) in quanto, come ripetutamente sottolineato, tutti i casi devono essere ugualmente possibili. Dalla tabella e dal grafico di seguito riportati è possibile constatare che facendo crescere il numero di gettate di due dadi con sei facce ciascuno e numerate da 1 a 6 , la frequenza relativa, che è indicata in percentuale, con cui si verificano i punteggi (= somma dei numeri che appaiono nei due dadi dopo ogni gettata), tende sempre più alla probabilità determinata a priori secondo l’impostazione classica (l’esempio è tratto da L. Livi, Elementi di Statistica). Per inciso si fa presente che ovviamente la somma della probabilità calcolate a priori è uguale a 1, perché è certo che uno degli eventi previsti (= punteggi) si verificherà sicuramente in quanto essi essendo eventi necessari rappreseno tutto lo spazio campionario. Nel caso in esame, essendo state effettuate tutte le gettate dei due dadi nelle medesime condizioni, la frequenza relativa con cui sono apparsi i vari punteggi dopo 7000 prove è una “stima corretta” della probabilità a priori, che potremo chiamare probabilità a posteriori o probabilità statistica o probabilità empirica. Da quanto visto si può affermare che: a) se dopo le 7 mila gettate (= numero sufficientemente grande di gettate) la frequenza relativa con cui si sono verificati i vari punteggi fosse molto diversa dalle corrispondenti probabilità a priori significherebbe che i dadi sono quasi certamente “truccati”; b) se si aumenta il numero di prove, ad esempio fino a 10, 20, 30 mila gettate, la frequenza relativa con cui si verificheranno i vari punteggi tenderà ad avvicinarsi sempre di più alle corrispondenti probabilità calcolate a priori. In base a tale evidenza ottenuta per via sperimentale l’impostazione frequentista da alcuni è anche indicata come legge empirica del caso, che legge non è in quanto per una sua verifica si dovrebbero effettuare un numero infinito di prove, condizione questa che ovviamente non è possibile soddisfare. É del tutto evidente che nel campo delle scienze sociali (e non solo in questo campo), se si vuole stimare quale sia la probabilità che si verifichi un determinato evento (ad esempio che uno studente che ha frequentato le lezioni superi l’esame di Statistica, o che nel corso di un anno un automobilista incorra in 1, 2, ecc. incidenti stradali) si deve necessariamente ricorrere all’impostazione frequentista e cioè alla probabilità a posteriori, in quanto a priori, a differenza del lancio di una moneta o di un dado, non si conoscono né i casi favorevoli e tanto meno tutti quelli possibili, considerati come ugualmente possibili così come previsto dall’impostazione classica. In altri termini, si dovrà fare riferimento alla frequenza relativa dell’evento, ovviamente a condizione che il numero delle osservazioni (in questo caso non si può più parlare di prove) sia abbastanza o sufficientemente grande. 10 Frequenza Somma % dei dei punti Probabilità punteggi a priori dei due (a) calcolo (a) dadi di probabilità (b) 2 1/36 2,8 Frequenza della somma dei punti dopo 1000 lanci (%) 7000 lanci (%) 5 3,5 2,4 100 lanci 3 2/36 5,6 11 6,7 4,6 4 3/36 8,3 4 9,2 7,8 5 4/36 11,1 14 11,5 11,1 6 5/36 13,9 6 13,1 14,1 7 6/36 16,7 13 14,4 16,0 8 5/36 13,9 18 13,9 13,9 9 4/36 11,1 9 10,3 12,0 10 3/36 8,3 12 9,4 9,5 11 2/36 5,6 5 5,5 5,7 12 1/36 2,8 3 2,5 2,9 100 100 100 100 Totale (a) Per la determinazione delle probabilità a priori dei singoli eventi (=somma dei punteggi dei due dadi) sono stati applicati i postulati della probabilità totale e della probabilità composta che saranno illustrati successivamente; (b) La frequenza percentuale dei punteggi è stata ottenuta moltiplicando per 100 il valore dei singoli rapporti e quindi approssimando per eccesso il valore ottenuto alla prima cifra decimale. 20 % 18 16 14 12 10 8 6 4 2 0 0 1 2 3 Probabilità a priori; 4 5 6 dopo 100 lanci; 11 7 8 dopo 1000 lanci; 9 10 11 dopo 7000 lanci 12 A questo punto si pongono però almeno due ordini di problemi di non poco conto: 1. che a differenza del caso dell’urna a cui si è fatto precedentemente riferimento e di cui si è supposto di non conoscere né il numero totale delle palline, né quello delle palline bianche in essa contenute, se si ripetesse lo stesso esperimento cioè lo stesso numero di prove, a distanza di tempo si otterrebbe un risultato tendenzialmente identico, nell’ambito dei fenomeni sociali invece questa condizione non sempre si verifica o si verifica raramente. Ciò perché nel periodo che trascorre tra il momento in cui sono stati osservati sia i casi favorevoli all’evento (CF) sia quelli possibili (CP) e il momento a cui si vuole riferire il valore del rapporto CF/CP, possono essere intervenute, e di solito ciò avviene, cause modificatrici tali da fare aumentare o diminuire le circostanze favorevoli al verificarsi di quel dato evento. Se ad esempio in riferimento ad un dato periodo di tempo, si è rilevata la frequenza relativa o, in altri termini, la probabilità che un soggetto, una volta contratta una data malattia possa a causa della stessa morire1, essa avrà inevitabilmente un valore più o meno limitato nel tempo, che, nel caso in esame, sarebbe in funzione del progresso medico e farmacologico, del modificarsi delle condizioni igienico-sanitarie, ecc.. 2. che i casi possibili (ovviamente non tutti ma un numero sufficientemente grande), non sono come vuole l’enunciato della probabilità a priori ugualmente possibili, ma tutti diversamente possibili. In altri termini è come se, ad esempio, si dovesse determinare la probabilità di estrarre una pallina bianca da un’urna contenente palline bianche e nere non tutte identiche, ma di diversa grandezza, diverso peso, ecc. e quindi ciascuna con una diversa possibilità di essere afferrata da chi procede all’estrazione. Per attenuare, seppure (almeno in linea teorica) non eliminare completamente, gli inconvenienti di cui al punto 1, si rende necessario che la probabilità che ha un dato evento di verificarsi venga periodicamente ricalcolata, ricalcolo che deve effettuarsi con una cadenza che sarà in funzione dalla celerità con cui intervengono nuovi fattori, prima non presenti, che possono modificare le circostanze favorevoli, come, ad esempio, nel caso della probabilità di morire dopo aver contratto una data malattia che tenderà a modificarsi in modo più o meno rapido in funzione della velocità con cui gli scienziati riusciranno a scoprire nuovi farmaci e mettere a punto protocolli terapeutici più efficaci per la sua cura. Per quanto attiene al fatto che le unità poste al denominatore siano tutte tra loro diverse (si tenga presente che sono delle unità statistiche), comporta che il valore di f che viene assunto come probabilità che si verifichi un dato evento, non è riferibile ad ogni singola unità come nel caso di un’urna contenente palline tutte uguali, ma tale valore, volendo utilizzare un’espressione non da tutti accettata, va inteso come probabilità media e come tale riferibile indistintamente a tutte le unità. Tornando all’esempio della probabilità di non sopravvivere ad una data malattia, il valore di f, ottenuto dal rapporto tra deceduti per quella malattia e totale degli ammalati, esprimerebbe, in riferimento al luogo (quartiere, o comune, o provincia, o regione, ecc.) e al momento a cui i dati si riferiscono, quale è mediamente la probabilità che in quel dato gruppo popolazionistico un generico individuo che abbia contratto quella malattia muoia, e non quale è la probabilità di morte del signor x y, cioè del singolo individuo, appartenente a quella popolazione e che ha contratto quella malattia. Sempre in riferimento all’esempio di cui sopra, la probabilità così ottenuta, analogamente con quanto visto per i rapporti di derivazione, per maggiore chiarezza potremmo, utilizzando un’espressione che in generale non è condivisa dai probabilistici, chiamarla probabilità media generica e sempre in analogia con tali rapporti potremmo denominare probabilità media specifica il valore di f ottenuto dal rapporto tra, ad esempio, i maschi, o i maschi di una certa età, o i maschi 1 In questo caso la frequenza relativa sarà data dal rapporto tra il numero di ammalati e deceduti e il totale degli ammalati in una determinata unità di tempo (ad es. un anno) 12 di una certa età e professione, ecc.deceduti e il totale degli individui che hanno contratto la malattia appartenenti rispettivamente alle diverse categorie considerate nel numeratore del rapporto2. Due esempi possono meglio aiutare a comprendere l’importanza dell’impostazione frequentista e ad evidenziare i problemi connessi alla sua utilizzazione. Il primo concerne la frequenza relativa dei promossi all’esame di maturità in Italia negli anni scolastici 1971-72 e 1992-93. Anno Esaminati (Ei) Promossi (Pi) fi = Pi/Ei scolastico Pubblicisti Privatisti Pubblicisti Privatisti Pubblicisti Privatisti 1971-72 333.242 43.806 305.990 24.683 0,92 0,56 1992-93 478.256 42.310 467.698 23.173 0,98 0,55 Dai valori delle fi riportati nella tabella emerge che mentre per i pubblicisti la probabilità di essere promossi nell’a.s. 1992-93 risulta significativamente più elevata rispetto all’a.s. 1971-72 (98 promossi su 100 contro i 92 del 1971-72), quella dei privatisti non si è sostanzialmente modificata. Un tale risultato sottolinea che se si vuole conoscere quale sia la probabilità per un privatista di essere promosso in riferimento ad un anno successivo al 1992-93, non sarebbe errato assumere come misura quella calcolata per il 1971-72, mentre altrettanto non potrebbe dirsi per i pubblicisti. Da quanto detto ci si può ben rendere conto del perché vi sia l’esigenza di ricalcolare periodicamente la probabilità che ha un dato evento di verificarsi in quando questo è il modo più semplice per rassicuraci che la sua misura non si sia nel frattempo modificata e che quindi vada ricalcolata. Il secondo esempio è ripreso dalle conclusioni a cui sono pervenuti gli studi condotti già da tempo dai demografi. Trattasi del rapporto percentuale dei sessi alla nascita, che, in riferimento sia a tempi che a luoghi diversi, assume sempre valori compresi tra 105-106 maschi ogni 100 femmine (Pr(M) = 0,512-0,515)3. Come si può osservare dalla tabella e soprattutto dal grafico, passando dalla provincia di Cagliari, all’ intera regione sarda e quindi al totale dei nati in Italia, in altri termini facendo aumentare il numero delle osservazioni, il rapporto di mascolinità (M/F x 100) tende sempre di più a stabilizzarsi intorno al valore 105-106 M per 100 F. Questa evidenza, non solo ci conferma che con l’aumentare del numero delle osservazioni la frequenza relativa è una stima sempre più “corretta” della probabilità, come nel caso del lancio dei due dadi a cui si è fatto prima riferimento, ma fornisce anche un’ulteriore conferma dell’invarianza nel corso del tempo del rapporto M/F alla nascita. 2 Secondo un approccio probabilistico quindi, il valore ottenuto mediante un rapporto di derivazione, così come quelli dei rapporti di composizione, può essere assunto, anzi è, una misura della probabilità che si verifichi un dato evento. È opportuno che si tenga presente che quando si vuole dare tale significato ad un rapporto di derivazione bisogna porre particolare attenzione. Infatti, se si sta facendo, ad esempio, riferimento a fenomeni ripetibili nell’unità di tempo considerata, si deve controllare che l’evento, relativamente ad una stessa unita, sia considerato una volta sola. In caso contrario il valore ottenuto non potrebbe essere assunto come misura della probabilità che si verifichi quel dato evento, in considerazione anche del fatto che, almeno in linea teorica, il valore del rapporto potrebbe anche risultare maggiore di 1. Se ad esempio si volesse determinare quale è la probabilità che un individuo contragga l’influenza nel corso di un anno, non sarebbe corretto assumere come misura il valore del rapporto ottenuto rapportando il numero dei casi di influenza (casi favorevoli ) nell’intervallo di tempo considerato al totale degli individui esposti alla malattia (tutti i casi possibili). Infatti, essendo riguardo ad uno stesso individuo l’evento influenza ripetibile nel corso di un anno, se la metà delle persone esposte avessero per ipotesi contratto una sola volta l’influenza e l’altra metà due volte, eventualità questa non impossibile, il valore del rapporto risulterebbe uguale a 1,5, dato questo che starebbe a sottolineare che nel corso di un anno mediamente in quella data popolazione gli individui si ammalano di influenza 1,5 volte e non la probabilità che uno contragga l’influenza come era stato richiesto. Se in una simile circostanza sarebbe del tutto evidente che il valore ottenuto non può essere assunto come misura della probabilità che un soggetto contragga l’influenza, in quanto, come ripetutamente sottolineato, la probabilità può assumere solo valori delimitati dall’intervallo 0 (=impossibilità che l’evento si verifichi) e 1 (= certezza del verificarsi dell’evento), non altrettanto evidente lo sarebbe se il valore del rapporto fosse stato uguale, ad esempio, a 0,8. Se si vuole determinare in modo corretto quale sia la probabilità che un individuo contragga l’influenza, al numeratore del rapporto si deve porre non il numero dei casi di influenza, ma quello degli individui che si sono ammalati, individui che devono essere considerati una volta sola, potendo uno stesso soggetto ammalarsi più di una volta. Stesso ragionamento va fatto se si vuole conoscere quale sia la probabilità di una, due, o più recidive. 3 Per tale motivo questo rapporto viene chiamato anche rapporto ferreo secondario dei sessi alla nascita. Secondario perché il rapporto primario sarebbe quello al concepimento, dato questo che è ignoto in quanto non sempre è conosciuto il sesso del nascituro nelle nascite mancate (aborti spontanei, terapeutici, volontari). 13 Rapporto di mascolinità (M/F x 100) e di composizione (M/MF) dei nati dal 1981 al 1991 nella Provincia di Cagliari, in Sardegna e in Italia Provincia di Cagliari Sardegna Italia Anni M/F x 100 M/MF (a) M/F x 100 M/MF (a) M/F x 100 M/MF (a) 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 102,77 104,69 106,61 107,39 106,8 108,02 105,86 106,81 109,15 105,26 108,27 0,507 0,511 0,516 0,518 0,515 0,519 0,514 0,516 0,522 0,513 0,520 105,8 105,2 105,7 106,2 106,7 107,0 106,4 107,0 108,1 104,1 108,2 0,514 0,513 0,514 0,515 0,516 0,517 0,516 0,517 0,519 0,510 0,520 105,8 106,0 106,2 106,0 105,8 106,2 106,7 106,4 106,2 106,2 106,3 0,514 0,515 0,515 0,515 0,514 0,515 0,516 0,516 0,515 0,515 0,515 (a) La frequenza relativa fM, data dal rapporto di composizione M/MF, rappresenta, come accennato, la stima della probabilità che in una nascita si abbia maschio. Infatti fM è ottenuto rapportando il numero n di nascite maschili (= casi favorevoli) al totale N dei nati (= numero dei casi possibili). 110 % 109 108 107 106 105 104 103 102 1981 1982 1983 1984 1985 1986 Prov. Cagliari; 1987 Sardegna; 14 1988 1989 Italia 1990 1991 ALCUNI IMPORTANTI TEOREMI Teorema della probabilità totale Dati k eventi incompatibili (E1, E2, E3,……… Ek), la probabilità che si verifichi la somma logica è data dalla somma delle probabilità dei singoli eventi Pr(E1 E2 E3 …… Ek) = Pr(E1) + Pr(E2) + Pr(E3)+……+Pr(Ek) Utilizzando questo teorema è quindi possibile determinare quale sia la probabilità che nel lancio di un dado esca il 2 o il 5. Essendo i due eventi, in riferimento ad una sola prova, incompatibili in quanto in un lancio non possono comparire contemporaneamente il 2 e il 5 e essendo Pr(E2) = Pr (E5) = 1 6 la probabilità che esca il 2 o il 5 sarà data da Pr(E2) + Pr (E5) = 1 6 + 1 6 = 2 6 = 1 6 e 1 . 3 Così se durante una lezione di statistica sono, ad esempio, presenti 80 studenti di cui 25 in possesso della maturità scientifica, 15 di quella del classico, 35 di quella di istituti professionali e 5 di quella linguistica, quale è la probabilità che estraendo a caso uno studente questo sia in possesso della maturità classica o di quella linguistica? Indicando con Pr(E1), Pr(E2), Pr(E3) e Pr(E4) rispettivamente le probabilità di estrarre uno studente con la maturità scientifica, uno con la maturità classica, uno con la maturità di un istituto professionale e uno con la maturità linguistica si avrebbe: Pr(E1) = 25 80 , Pr(E2) = 15 80 , Pr(E3) = 35 80 , e Pr(E4) = 5 80 Essendo i due eventi E2 e E4 incompatibili in una sola prova, in quanto non possono realizzarsi contemporaneamente, la probabilità che lo studente estratto sia in possesso della maturità classica oppure di quella linguistica sarà data da: Pr(E2) + Pr(E4) = 15 80 + 5 80 = 20 80 = 1 = 0,25 4 È del tutto ovvio che: 1. il teorema è utile soprattutto quando non si conosce la composizione della popolazione secondo i vari caratteri (nel caso dell’esempio il numero di studenti secondo il tipo di diploma posseduto), ma solo la probabilità dei singoli eventi, come nel caso del lancio di un dado; 2. nel caso in cui i k eventi formino una classe completa di eventi (cioè gli eventi siano incompatibili e necessari come i numeri dall’1 al 6 nel lancio di un dado, o che in una nascita si abbia maschio oppure femmina in quanto legati da un tale nesso di dipendenza per cui il manifestarsi di un caso impedisce il verificarsi dell’altro o degli altri), l’evento E unione dei k eventi non può che essere un evento certo e cioè: Pr(E1) + Pr(E2) + Pr(E3) + Pr(E4) +…………+ Pr(Ek) = 1 In altri termini la probabilità di tutti gli eventi (casi o fenomeni) che si escludono reciprocamente è uguale a 1 (= certezza) in quanto è certo che uno degli eventi dovrà verificarsi. Teorema della probabilità composta Se gli eventi E1, E2, E3,……… Ek sono reciprocamente indipendenti, la probabilità che si verifichi il prodotto logico degli eventi è uguale al prodotto delle probabilità dei singoli eventi, e cioè: Pr(E1 E2 E3 …… Ek) = Pr(E1) ∙ Pr(E2) ∙ Pr(E3)∙……∙Pr(Ek) Utilizzando questo teorema è quindi possibile determinare quale sia la probabilità che lanciando due volte un dado esca nel primo lancio il 2 e nel secondo il 5. Essendo i due eventi compatibili e 15 indipendenti in quanto la comparsa del 5 nel secondo lancio è indipendente dalla comparsa del 2 nel 1 6 primo e viceversa e essendo Pr(E2) = 5 sarà data da Pr(E2) ∙ Pr (E5) = 1 6 ∙ 1 6 = e Pr (E5) = 1 6 , la probabilità che in due lanci escano il 2 e il 1 36 Così se in un’urna vi sono 200 palline di cui 50 bianche, 100 nere, 10 verdi e 40 rosse, facendo quattro estrazioni, reinserendo ogni volta la pallina estratta, quale è la probabilità di estrarre 2 palline bianche, 1 nera e 1 rossa? Indicando con Pr(E1), Pr(E2) e Pr(E3) rispettivamente le probabilità di estrarre rispettivamente 1 pallina bianca, 1 nera e 1 rossa si avrebbe: Pr(E1) = 50 200 = 1 1 100 1 40 , Pr(E2) = = e Pr(E3) = = 200 200 5 4 2 Essendo i tre eventi (2 palline bianche, 1 nera e 1 rossa) compatibili e anche indipendenti in quanto dopo ogni estrazione si è ipotizzato che la pallina estratta venga reinserita nell’urna e conseguentemente possono realizzarsi in quattro estrazioni tutti e tre gli eventi attesi, la probabilità cercata sarà data da: Pr(E1) ∙ Pr(E1) ∙ Pr(E2) ∙ Pr(E3) = 1 1 1 1 ∙ ∙ ∙ = 0,25 ∙ 0,25 ∙ 0,50 ∙ 0,20 = 0,00625 4 4 2 5 La probabilità che si verifichi l’evento risulta quindi del 6,25 ‰, cioè molto bassa. N.B. - La probabilità di estrarre una pallina bianca è stata considerata due volte in quanto l’evento atteso era di 2 palline bianche ovviamente in due estrazioni diverse e dopo aver sempre reinserito la pallina dopo ogni estrazione. Nei casi sopra descritti era prevista la reciproca indipendenza degli eventi in quanto dopo ogni estrazione con il reinserimento della pallina estratta si provvedeva a ricostituire la situazione iniziale. Una situazione tutt’altro diversa è invece quella che si verifica se dopo ogni estrazione non si provvede a reinserire l’unità estratta. In questa eventualità non si può più parlare di eventi reciprocamente indipendenti perché l’avverarsi dell’uno influisce sull’avverarsi dell’altro e così via procedendo nelle successive estrazioni. Il teorema della probabilità composta in queste circostanze può essere così enunciato “la probabilità di un evento dovuto al concorso di due o più eventi (tre, quattro, ecc.) è uguale alla probabilità che si avveri il primo di essi per la probabilità che ha il secondo di verificarsi dopo essersi verificato il primo, per la probabilità che ha il terzo di verificarsi dopo che si sono avverati il primo e il secondo e così di seguito”. Per esempio, se la probabilità di estrarre il 20 e il 45 da due urne del lotto (cioè relativamente a due 1 1 1 diverse ruote) è di ∙ = = 0,00012346, la probabilità di estrarre gli stessi due numeri da 8100 90 90 1 1 1 una medesima urna (stessa ruota) sarà invece di ∙ = = 0,00012484 8010 90 89 In questo caso infatti i due eventi non sono indipendenti in quanto l’estrazione del primo numero modifica la probabilità del secondo, dato che nell’urna dopo la prima estrazione vi saranno 89 palline e non 90. Riprendendo l’esempio degli 80 studenti presenti ad una lezione di statistica ci si può chiedere quale è la probabilità di estrarre a caso due studenti, senza reinserire l’unità estratta fra gli 80 presenti, di cui uno in possesso della maturità classica e l’altro di quella scientifica. 16 Trattasi di due eventi che, per quanto compatibili, non sono indipendenti, per cui la probabilità sarà 25 15 data non dal prodotto delle due probabilità ( ∙ ), ma dal prodotto della prima per la seconda 80 80 25 15 375 dopo che si è verificato il primo evento, cioè da ∙ = = 0,059. 80 79 6320 In questi casi si parla di probabilità condizionata, cioè della probabilità che si verifichi l’evento E2 (estrazione dello studente in possesso della maturità scientifica) dopo che si è verificato E1 (estrazione dello studente in possesso della maturità classica). Se indichiamo con Pr(E2 | E1) la probabilità condizionata di E2 ad E1, in termini formali sarà: Pr( E1 E 2 ) Pr(E1 E2) = Pr(E1) ∙ Pr(E2 | E1) da cui Pr(E2 | E1) = [1] Pr( E1 ) È logico che: se i due eventi sono indipendenti sarà Pr(E2 | E1) = Pr(E2) per cui Pr(E1 E2) = Pr(E1) ∙ Pr(E2) e che: Pr( E1 E 2 ) Pr( E 2 ) Per dare concretezza a quanto detto in base ai dati riportati nella tabella si supponga di voler conoscere quale è la probabilità che scelto a caso un individuo questi sia un maschio e la cui prova sia stata giudicata insufficiente Pr(E1 | E2) = Sesso F M Totale Esito della prova Insufficiente Sufficiente 20 60 10 30 30 90 Totale 80 40 120 Ricordando che la probabilità del verificarsi di un evento può essere stimata dalla frequenza relativa con cui si presenta quell’evento si ha: 40 1 30 1 = 0,333….; Pr (Ins) = Pr(M) = = = 0,25 120 3 120 4 Scelto a caso un maschio la probabilità che appartenga al gruppo di quelli per i quali la prova sia stata giudicata insufficiente è 10 1 = 0,25 Pr(Ins | M) = 40 4 Scegliendo adesso, sempre a caso, un individuo, la probabilità che esso sia un maschio del gruppo dei giudicati insufficienti sarà: 10 1 Pr(Ins M) = = 0,083333…. 120 12 Si può ora facilmente verificare, come indicato nella [1], che: Pr(Ins | M) = Pr(Ins M) 0,08333 = 0,25 Pr(M) 0,3333 Nell’applicazione degli schemi probabilistici ai fenomeni sociali si deve tener ben presente che non è quasi mai sicuro il giudizio sulla indipendenza degli eventi. Infatti se in linea generale si potrebbe affermare che la morte di una persona sia un evento indipendente da quella di un’altra, tuttavia si potrebbe anche verificare l’eventualità che la morte di un neonato non sia un evento indipendente dalla morte della madre, in quanto, in particolari circostanze, il decesso della madre può fare 17 aumentare la probabilità di morte del neonato. Similmente potrebbero considerarsi come non indipendenti i fallimenti di aziende legate da relazioni d’affari o l’incendio di due stabili adiacenti, ecc. Alcuni esempi di applicazione dei due teoremi 1° Esempio Facendo due gettate di un dado con sei facce numerate da 1 a 6, quale è la probabilità che il 6 compaia nell’una o nell’altra gettata? 1 1 2 1 Sarebbe sbagliato rispondere che essa è data da Pr(E1)+Pr(E6) e cioè da + = = in quanto 6 6 6 3 la comparsa del 6 nella prima gettata non esclude che il 6 ricompaia anche nella seconda. La probabilità sarà quindi più piccola. Il problema va quindi risolto chiedendoci prima quale è la probabilità che nelle due gettate compaia almeno una volta il 6, oppure non compaia e quindi quale è la probabilità che il 6 non compaia in nessuna delle due gettate. Nel primo caso trattasi di due eventi che si escludono reciprocamente e quindi si possono sommare le probabilità, somma che sarà uguale a 1 in quanto certamente si verificherà o la prima o la seconda eventualità, nel secondo caso essendo la non uscita del 6 né nella prima né nella seconda gettata due eventi compatibili e 5 5 25 indipendenti sarà data dal prodotto delle due probabilità e cioè da ∙ = essendo 5 i casi 6 6 36 favorevoli che non compaia il 6. La probabilità quindi che compaia il 6 in una delle due gettate sarà 25 data da 1 = 0,3066…. 36 2° Esempio Riprendendo l’esempio relativo al lancio di due dadi, fatto per verificare empiricamente che aumentando il numero delle prove (o delle osservazioni) la frequenza relativa f ottenuta dal rapporto tra il numero di volte in cui si è verificato l’evento atteso e il totale delle prove (o delle osservazioni) tende sempre più a convergere verso la probabilità che ha quel dato evento di manifestarsi, vediamo adesso come sono state calcolate, applicando i due teoremi, le probabilità a priori di ottenere come somma dei punteggi, ad esempio, 3 e 8. La somma di 3 può verificarsi solo in due casi: uscita dell’1 nel primo dado e uscita del 2 nel secondo, oppure uscita del 2 nel primo dado e dell’1 nel secondo. Sia nel primo caso (uscita dell’1 e del 2) che nel secondo (uscita del 2 e dell’1) trattasi di eventi compatibili ed indipendenti, per cui: 1 1 1 Pr(E1 E2) = Pr(E1) ∙ Pr(E2) = ∙ = 6 6 36 cosi la probabilità che si realizzi il secondo evento (uscita del 2 e dell’1) è dato da: 1 1 1 Pr(E2 E1) = Pr(E2) ∙ Pr(E1) = ∙ = 6 6 36 È evidente che se realizza l’evento 1 e 2 non si può verificare l’evento 2 e 1: Trattasi quindi di eventi incompatibili per cui la probabilità di avere il punteggio 3 sarà data dalla somma delle due probabilità e cioè: 1 1 2 + = 36 36 36 Per ottenere invece 8 come somma dei punteggi dei due dadi questa può realizzarsi in 5 modi diversi: 4 e 4; 3 e 5; 5 e 3; 6 e 2; 2 e 6. Ciascuna di queste combinazioni, come visto per il caso precedente, ha probabilità di verificarsi 1 uguale a . Anche in questo caso gli eventi (le varie combinazioni) sono incompatibili perché il 36 18 verificarsi di una qualsiasi esclude che possano verificarsi le altre, per cui la probabilità di avere come somma dei punteggi 8 sarà data da: 1 1 1 1 1 5 + + + + = 36 36 36 36 36 36 Si può ora verificare che le probabilità così ottenute sono le stesse riportate nella seconda colonna della tabella a cui si è fatto riferimento per illustrare questi due casi. 3° Esempio Un altro caso di utilizzazione congiunta dei due teoremi è fornito da questo esempio. Immaginiamo una persona davanti a due urne perfettamente uguali e da cui si trovi alla stessa distanza. In una vi sono 100 palline di cui 50 bianche e nell’altra 200 palline di cui 20 bianche. Si desidera conoscere quale sia la probabilità che tale individuo, effettuando una estrazione, estragga una pallina bianca. 50 20 70 Sarebbe certamente sbagliato dire che la probabilità sarebbe data da = =0,233…. 100 300 300 Occorre in questo caso utilizzare sia il teorema della probabilità composta che quello della probabilità totale. Ciò perché quella ipotetica persona dovrà prima decidere da quale urna estrarre la pallina e quindi procedere all’estrazione. Ora la probabilità che scelga una o l’altra urna è uguale a 1 (si ricorda che le urne sono perfettamente identiche, poste alla stessa distanza da chi deve 2 effettuare l’estrazione e che questi non conosce il loro contenuto) e la probabilità di estrarre una 50 1 1 20 pallina bianca dalla prima urna è di = e di estrarla dall’altra di = 100 2 200 10 Poiché la scelta di un’urna e quindi di estrarre una pallina bianca sono eventi compatibili ed indipendenti, in quanto l’aver scelto un’urna non esclude che da essa possa essere estratta una pallina bianca si applicherà il teorema della probabilità composta per cui per la prima urna la probabilità sarà data da: 1 1 1 ∙ = 2 2 4 e per la seconda da: 1 1 1 ∙ = 2 10 20 Ora poiché se viene scelta la prima urna è escluso che la pallina possa essere estratta dall’altra urna e viceversa, trattasi chiaramente di eventi che si escludono reciprocamente. Per trovare la probabilità di estrarre una pallina bianca da una delle due urne si deve quindi applicare il teorema della probabilità totale. La probabilità cercata sarà quindi uguale a: 1 6 1 + = = 0,3 4 20 20 19 4° Esempio Si consideri la seguente distribuzione delle combinazioni matrimoniali secondo il luogo di nascita dello sposo e della sposa Luogo di nascita della sposa Luogo di nascita dello sposo Altro comune della stessa provincia (B’) Stesso comune (A’) AA’ Stesso comune (A) AB’ 1997 BB’ 368 Altro comune di altra provincia (C) Totale 27 2081 7 405 BC’ 30 CA’ Totale AC’ 57 BA’ Altro comune della stessa provincia (B) Altro comune di altra provincia (C’) CB’ CC’ 81 13 3 97 2446 100 37 2583 Ci si può chiedere quali sarebbero state le combinazioni matrimoniali dei 2583 sposi se queste si fossero realizzate a caso, o se si preferisce quale sia la distribuzione da attendersi a calcolo delle probabilità. Ad una tale domanda si può rispondere (ovviamente tenendo fissi sia i totali di colonna sia di riga in quanto essi sono i dati veri che provengono dall’osservazione empirica) applicando il teorema della probabilità composta. Ciò perché gli eventi congiunti (= le singole combinazioni) si devono considerare come compatibili ed indipendenti. In altre parole si deve ipotizzare che per lo sposo nato in un dato comune la sua scelta della sposa non sia influenzata dal luogo di nascita di quest’ultima e viceversa. Per ottenere la probabilità che si abbia, ad esempio, la combinazione AC’ si dovrà moltiplicare la probabilità che si verifichi l’evento A per la probabilità che si verifichi l’evento C’. Pr(A) è data dal rapporto tra il totale di A (2081 sposi dello stesso comune) e il totale dei casi possibili (2583 sposi) e Pr(C’) dal rapporto tra il totale di C’ (37 spose nate in un comune di altra provincia) e il 2081 37 totale dei casi possibili (2583 sposi). Per cui Pr(AC’) = Pr (A) ∙ Pr(C’) = = 0,0115 2583 2583 Qui di seguito sono riportati i calcoli per la determinazione della probabilità relativamente a tutte e nove le combinazioni matrimoniali: Pr(AA’) = Pr (A) ∙ Pr(A’) = Pr(AB’) = Pr (A) ∙ Pr(B’) = Pr(AC’) = Pr (A) ∙ Pr(C’) = Pr(BA’) = Pr (B) ∙ Pr(A’) = Pr(BB’) = Pr (B) ∙ Pr(B’) = Pr(BC’) = Pr (B) ∙ Pr(C’) = 2081 2446 = 0,7629 2583 2583 2081 100 = 0,0312 2583 2583 2081 37 = 0,0115 2583 2583 405 2446 = 0,1485 2583 2583 405 100 = 0,0061 2583 2583 405 37 = 0,0022 2583 2583 20 97 2446 = 0,0356 2583 2583 97 100 Pr(CB’) = Pr (C) ∙ Pr(B’) = = 0,0015 2583 2583 97 37 Pr(CC’) = Pr (C) ∙ Pr(C’) = = 0,0005 2583 2583 Pr(CA’) = Pr (C) ∙ Pr(A’) = È del tutto evidente che se si moltiplicano le probabilità ottenute per le singole combinazioni per il totale dei casi (2583) si ricavano, come è possibile osservare nella tabella qui di seguito riportata, le frequenze che si sarebbero avute se le combinazioni si fossero realizzate a calcolo di probabilità e cioè se le unioni, secondo il luogo di nascita degli sposi, dipendessero solo dal caso. Lo stesso risultato si ottiene più facilmente moltiplicando il totale di colonna per il totale di riga, relativamente a ciascuna casella, e quindi dividendo per il totale generale. Ovviamente le frequenze così determinate, e ciò si verifica quasi sempre, sono delle frequenze assolute teoriche e, come sottolinea il Leti a proposito delle tabelle doppie medie aritmetiche, sui generis in quanto, come si può osservare dalla tabella, esse sono rappresentate da numeri non interi. Le distribuzioni delle frequenze teoriche così determinate, come si avrà modo di vedere, risulteranno di fondamentale importanza quando si affronterà lo studio delle relazioni statistiche (connessione e concordanza). Luogo di nascita della sposa Luogo di nascita dello sposo Stesso comune Altro comune della stessa provincia Altro comune di altra provincia Totale Altro comune della stessa provincia Altro comune di altra provincia Totale 1970,62 80,57 29,81 2081,00 383,52 15,68 5,80 405,00 91,86 3,75 1,39 97,00 2446,00 100,00 37,00 2583,00 Stesso comune 21