Esercizio n.1. Il problema ci propone tre insiemi A, B ed R che si intersecano parzialmente e sono parte di un insieme U di 1200 soggetti sottoposti ad una analisi del sangue per determinarne il gruppo sanguigno di appartenenza. Tralasciando per comodità il segno di intersezione abbiamo: n(ABR) = 80, n(AB) = 240, n(AR) = 210, n(BR) = 120, per un totale di n(A )= 400, n(B) = 620, n(R) = 500. I rimanenti vengono considerati come appartenenti al gruppo 0 (zero). (AA̅)(BB̅) (RR̅) = (ABAB̅A̅BA̅B̅)(RR̅) = ABRABR̅AB̅RAB̅R̅A̅BRA̅BR̅A̅B̅RA̅B̅R̅ = U Essi costituiscono una partizione dell’insieme U. Per calcolare il numero di elementi di ciascun insieme (o evento) possiamo costruire un diagramma di Venn notando che: ABR = 80; ABR̅ = 160; AB̅R = 130; AB̅R̅ = 30; A̅BR= 40; A̅BR̅ = 340; A̅B̅R = 250; A̅B̅R̅ = 170. Considerando come evento l’appartenenza a ciascuno di questi insiemi possiamo costruire 8 eventi possibili con le loro probabilità: P{ABR} = 80/1200 = 0,6667 = p1 U 170 B P{ABR̅} = 160/1200 = 0,1333 = p2 P{AB̅R} = 130/1200 = 0,18033 = p3 A 340 P{AB̅R̅} = 30/1200 = 0,02500 = p4 160 8 P{A̅BR} = 40/1200 = 0,033333 = p5 40 80 P{A̅BR̅} = 340/1200 = 0,28333 = p6 30 1300 P{A̅B̅R} = 250/1200 = 0,20833 = p7 130 250 R P{A̅B̅R̅} = 170/1200 = 0,141667 = p8 Gli 8 eventi sono a due a due incompatibili e la loro somma è un evento certo. Con le loro probabilità PK formano una distribuzione di probabilità. Infatti : 30 0,6667+0,1333+0,18033+0,02500+0,03333+0,28333+0,20833+0,141667 = 1 R R p1 p2 p3 p4 p5 p6 p7 p8 Esercizio n.2 Completiamo la tabella data con i totali marginali: Voto\Scuola Scientifico Altra scuola Totale Buono 42 12 54 Sufficiente 65 34 99 Totale 107 46 153 Dividendo ciascun valore per il totale generale otteniamo le frequenze relative che consideriamo come probabilità dei rispettivi eventi: Voto\Scuola Scientifico Sc Altra scuola As Totale Buono Bu 0,275 0,078 0,353 Sufficiente Suf 0,425 0,222 0,647 Totale 0,699 0,301 1,000 Per determinare il coefficiente di correlazione tra le due caratteristiche (scuola media e voto in matematica) bisogna la probabilità condizionata che uno studente del liceo scientifico abbia ottenuto un voto buono e confrontarla con la probabilità di un buon voto tra tutti gli studenti. Per il teorema sulle probabilità condizionate abbiamo infatti la relazione P{BuSc} = P{Sc} P{Bu/Sc}, dalla quale si ricava: P{Bu/Sc} = P{BuSc}/P{Sc} = 0,275/0,699 = 0,393 Dividendo questo valore per la probabilità totale di ottenere un buon voto in Matematica si calcola il coefficiente di correlazione: ρ= P{Bu / Sc} 0,393 = = 1.12 P{Bu } 0,353 Essendo questo valore maggiore di 1 si può ipotizzare che il voto in Matematica e il tipo di scuola media sono correlati. b) Nel problema sono intervenute tre distribuzioni di probabilità. Quella principale con 4 eventi BuSc, BuAs, SufSc, SufAs con probabilità rispettivamente di: 0,275, 0,078, 0,425 e 0,222. Le altre due sono le distribuzioni marginali di tipo bernoulliano con due eventi (Bu, Suf) e probabilità P{Bu} = 0,353 e P{Su} = 0,647. L'altra avrà anche due eventi (Sc, Al) con probabilità P{Sc} = 0,699 e P{As} = 0,301. Facoltativo. Verifichiamo l'ipotesi H0 che le due caratteristiche siano indipendenti. In questo caso avremo che il 50% degli studenti provenienti dallo scientifico (Sc)avranno ottenuto un buon voto, gli altri 50% sufficiente. Lo stesso per quelli di altre scuole (As) riassunto nella seguente tabella. Voto\Scuola Scientifico Altra scuola Totale Buono 53,5 23,5 77 Sufficiente 53,5 23,5 77 Totale 107 47 154 Confrontando le due tabelle con il test del 2si ottiene: 2 = (42 - 53,5)2/53,5 + (65-53,5)2/53,5 + (12-23,5)2/23,5 + (35-23,5)2/23,5 = 26,5 Essendo questo valore superiore al valore critico per un grado di libertà (nr - 1) (nc - 1) = 1 Dobbiamo rifiutare l'ipotesi che le due caratteristiche siano indipendenti e assumere quella alternativa che siano correlate. Esercizio n. 3 I valori della variabile aleatoria che segue una distribuzione normale di speranza matematica mu scarto quadratico medio s si ottengono dalla formula si ottengono mediante la formula che la definisce: z = (x - )/s. Pertanto z1 = (105 – 180)/24 = -3,125, z2 = (140 – 180)/24 = -1.667 e z3 = (200 – 180)/24 = 0,833. La probabilità che C sia minore di 105 si legge sulla tabella della funzione di ripartizione F(z). Tenendo conto che le tabelle presentano i valori della F(z) da zero in poi e quindi l'area sotto la curva normale da 0 all'infinito è uguale a 0,5, tenendo anche conto che la funzione densità di probabilità f(z) è simmetrica rispetto all'origine, i valori trovati sulle tabelle devono venir aumentati di 0,5 per i valori di z positivi, devono venir sottratti da 0,5 per i valori di z negativi. L'area sotto la curva normale da - a -3.15 sarà data da 0,5 il valore letto in tabella per z positivo. La probabilità cercata è data da P{C<105} = 0,5 - F(3,125). Perciò: P{C<105} = 0,5 - 0,4991 = 0,0009 Analogamente per P{C>200} bisogna sottrarre da 0,5 (area totale da 0 a +) il valore della F(0,833). Quindi P{C>200}= 0,5-0,2967 =0,2033. Esercizio n. 4 L'intervallo di confidenza per la media di un campione di 100 elementi è dato dal valore critico di z per il livello di confidenza indicato, moltiplicato per lo scarto quadratico medio del campione e diviso per la radice quadrata del numero di elementi del campione. In simboli: s dove n=100, s = 25,7. E quindi se z90= 1,65; z95=1,96 e z99 =2 ,58 troviamo: zc n Al livello di confidenza del 90%: 166,5 1,65*25,8/10 = 166,5 4,257 Al livello di confidenza del 95%: 166,5 1,96*25,8/10 = 166,5 5,057 Al livello di confidenza del 99%: 166,5 2,58*25,8/10 = 166,5 6,656 Per trovare la numerosità del campione che assicuri un intervallo minore di 3mg/ml poniamo: 2 s s zc 3 da cui ricaviamo z c n dalla quale troviamo n = z c e di conseguenza: 3 n 3 per zc = 1,96 sarà n = 284; per zc=1,65 sarà n = 201 e per zc=2,58 si ottiene n = 492. s Esercizio n. 5 Poiché la probabilità che la patologia si presenti è molto piccola (0,0005) possiamo dire di trovarci di fronte ad eventi rari. Poiché, a quanto se ne sa gli eventi sino anche indipendenti possiamo pensare di applicare la distribuzione di Poisson con una media ipotetica che possiamo derivare dalla distribuzione binomiale: m = n*p = 40000*0,0005 = 20. m k e m Nella distribuzione di Poisson la probabilità di ottenere k successi è data da: pk = . k! Di conseguenza possiamo calcolare la probabilità di ottenere 0, 1, 2 successi: m 0 e m m1e m m 2 e m p0 = ; p1 = ; p2 = 0! 1! 2! Pertanto la probabilità di trovare più di due individui affetti da questa patologia sarà: P{k>2} = 1 – (p0 + p1 + p2).