Esercizio n.1. Il problema ci propone tre insiemi A, B ed R che si

Esercizio n.1.
Il problema ci propone tre insiemi A, B ed R che si intersecano parzialmente e sono parte di
un insieme U di 1200 soggetti sottoposti ad una analisi del sangue per determinarne il
gruppo sanguigno di appartenenza. Tralasciando per comodità il segno di intersezione
abbiamo: n(ABR) = 80, n(AB) = 240, n(AR) = 210, n(BR) = 120, per un totale di n(A )= 400,
n(B) = 620, n(R) = 500. I rimanenti vengono considerati come appartenenti al gruppo 0
(zero).
(AA̅)(BB̅) (RR̅) = (ABAB̅A̅BA̅B̅)(RR̅) =
ABRABR̅AB̅RAB̅R̅A̅BRA̅BR̅A̅B̅RA̅B̅R̅ = U
Essi costituiscono una partizione dell’insieme U.
Per calcolare il numero di elementi di ciascun insieme (o evento) possiamo costruire un
diagramma di Venn notando che:
ABR = 80; ABR̅ = 160; AB̅R = 130; AB̅R̅ = 30; A̅BR= 40; A̅BR̅ = 340; A̅B̅R = 250; A̅B̅R̅ = 170.
Considerando come evento l’appartenenza a ciascuno di questi insiemi possiamo costruire
8 eventi possibili con le loro probabilità:
P{ABR} = 80/1200 = 0,6667 = p1
U
170
B
P{ABR̅} = 160/1200 = 0,1333 = p2
P{AB̅R} = 130/1200 = 0,18033 = p3
A
340
P{AB̅R̅} = 30/1200 = 0,02500 = p4
160
8
P{A̅BR} = 40/1200 = 0,033333 = p5
40
80
P{A̅BR̅} = 340/1200 = 0,28333 = p6
30
1300
P{A̅B̅R} = 250/1200 = 0,20833 = p7
130
250
R
P{A̅B̅R̅} = 170/1200 = 0,141667 = p8
Gli 8 eventi sono a due a due incompatibili e la loro somma è un evento certo. Con le loro
probabilità PK formano una distribuzione di probabilità.
Infatti :
30
0,6667+0,1333+0,18033+0,02500+0,03333+0,28333+0,20833+0,141667 = 1
R
R
p1
p2
p3
p4
p5
p6
p7
p8
Esercizio n.2
Completiamo la tabella data con i totali marginali:
Voto\Scuola Scientifico
Altra scuola
Totale
Buono
42
12
54
Sufficiente
65
34
99
Totale
107
46
153
Dividendo ciascun valore per il totale generale otteniamo le frequenze relative che consideriamo
come probabilità dei rispettivi eventi:
Voto\Scuola
Scientifico
Sc
Altra scuola
As
Totale
Buono Bu
0,275
0,078
0,353
Sufficiente
Suf
0,425
0,222
0,647
Totale
0,699
0,301
1,000
Per determinare il coefficiente di correlazione tra le due caratteristiche (scuola media e voto in
matematica) bisogna la probabilità condizionata che uno studente del liceo scientifico abbia
ottenuto un voto buono e confrontarla con la probabilità di un buon voto tra tutti gli studenti.
Per il teorema sulle probabilità condizionate abbiamo infatti la relazione
P{BuSc} = P{Sc} P{Bu/Sc}, dalla quale si ricava: P{Bu/Sc} = P{BuSc}/P{Sc} = 0,275/0,699 = 0,393
Dividendo questo valore per la probabilità totale di ottenere un buon voto in Matematica si
calcola il coefficiente di correlazione:
ρ=
P{Bu / Sc} 0,393
=
= 1.12
P{Bu }
0,353
Essendo questo valore maggiore di 1 si può ipotizzare che il voto in Matematica e il tipo di scuola
media sono correlati.
b) Nel problema sono intervenute tre distribuzioni di probabilità. Quella principale con 4 eventi
BuSc, BuAs, SufSc, SufAs con probabilità rispettivamente di: 0,275, 0,078, 0,425 e 0,222.
Le altre due sono le distribuzioni marginali di tipo bernoulliano con due eventi (Bu, Suf) e
probabilità P{Bu} = 0,353 e P{Su} = 0,647. L'altra avrà anche due eventi (Sc, Al) con probabilità
P{Sc} = 0,699 e P{As} = 0,301.
Facoltativo. Verifichiamo l'ipotesi H0 che le due caratteristiche siano indipendenti. In questo
caso avremo che il 50% degli studenti provenienti dallo scientifico (Sc)avranno ottenuto un buon
voto, gli altri 50% sufficiente. Lo stesso per quelli di altre scuole (As) riassunto nella seguente
tabella.
Voto\Scuola Scientifico
Altra scuola
Totale
Buono
53,5
23,5
77
Sufficiente
53,5
23,5
77
Totale
107
47
154
Confrontando le due tabelle con il test del 2si ottiene:
2 = (42 - 53,5)2/53,5 + (65-53,5)2/53,5 + (12-23,5)2/23,5 + (35-23,5)2/23,5 = 26,5
Essendo questo valore superiore al valore critico per un grado di libertà (nr - 1) (nc - 1) = 1
Dobbiamo rifiutare l'ipotesi che le due caratteristiche siano indipendenti e assumere quella
alternativa che siano correlate.
Esercizio n. 3
I valori della variabile aleatoria che segue una distribuzione normale di speranza matematica mu
scarto quadratico medio s si ottengono dalla formula si ottengono mediante la formula che la
definisce:
z = (x - )/s. Pertanto z1 = (105 – 180)/24 = -3,125, z2 = (140 – 180)/24 = -1.667 e
z3 = (200 – 180)/24 = 0,833.
La probabilità che C sia minore di 105 si legge sulla tabella della funzione di ripartizione F(z).
Tenendo conto che le tabelle presentano i valori della F(z) da zero in poi e quindi l'area sotto la
curva normale da 0 all'infinito è uguale a 0,5, tenendo anche conto che la funzione densità di
probabilità f(z) è simmetrica rispetto all'origine, i valori trovati sulle tabelle devono venir
aumentati di 0,5 per i valori di z positivi, devono venir sottratti da 0,5 per i valori di z negativi.
L'area sotto la curva normale da - a -3.15 sarà data da 0,5 il valore letto in tabella per z positivo.
La probabilità cercata è data da
P{C<105} = 0,5 - F(3,125). Perciò: P{C<105} = 0,5 - 0,4991 = 0,0009
Analogamente per P{C>200} bisogna sottrarre da 0,5 (area totale da 0 a +) il valore della
F(0,833).
Quindi P{C>200}= 0,5-0,2967 =0,2033.
Esercizio n. 4
L'intervallo di confidenza per la media di un campione di 100 elementi è dato dal valore critico di z
per il livello di confidenza indicato, moltiplicato per lo scarto quadratico medio del campione e
diviso per la radice quadrata del numero di elementi del campione. In simboli:
s
dove n=100, s = 25,7. E quindi se z90= 1,65; z95=1,96 e z99 =2 ,58 troviamo:
zc
n
Al livello di confidenza del 90%: 166,5  1,65*25,8/10 = 166,5  4,257
Al livello di confidenza del 95%: 166,5  1,96*25,8/10 = 166,5  5,057
Al livello di confidenza del 99%: 166,5  2,58*25,8/10 = 166,5  6,656
Per trovare la numerosità del campione che assicuri un intervallo minore di 3mg/ml poniamo:
2
s
 s
zc
 3 da cui ricaviamo z c  n dalla quale troviamo n =  z c  e di conseguenza:
3
n
 3
per zc = 1,96 sarà n = 284; per zc=1,65 sarà n = 201 e per zc=2,58 si ottiene n = 492.
s
Esercizio n. 5
Poiché la probabilità che la patologia si presenti è molto piccola (0,0005) possiamo dire di trovarci
di fronte ad eventi rari. Poiché, a quanto se ne sa gli eventi sino anche indipendenti possiamo
pensare di applicare la distribuzione di Poisson con una media ipotetica che possiamo derivare
dalla distribuzione binomiale: m = n*p = 40000*0,0005 = 20.
m k e m
Nella distribuzione di Poisson la probabilità di ottenere k successi è data da: pk =
.
k!
Di conseguenza possiamo calcolare la probabilità di ottenere 0, 1, 2 successi:
m 0 e m
m1e  m
m 2 e m
p0 =
; p1 =
; p2 =
0!
1!
2!
Pertanto la probabilità di trovare più di due individui affetti da questa patologia sarà:
P{k>2} = 1 – (p0 + p1 + p2).