Prova scritta di Statistica
30 Settembre 2013 – Programma Cerasoli
1. Un certo tipo di uva da vino cresce in due regioni distinte A e B che
occasionalmente sono infestate da parassiti. Sia A l’evento “la regione A è infestata
da parassiti” e sia B l’evento “la regione B è infestata da parassiti”. Siano
Se la regione A è infestata da parassiti, qual è la
probabilità che sia infestata da parassiti anche la regione B?
2. Sia X una variabile aleatoria geometrica di parametro p. Provare che
.
3. Una industria produce anelli per catene. Il laboratorio di ricerca dell’industria
modella la lunghezza di un anello con una variabile aleatoria X di media 5 cm e di
varianza 0.04 cm. La lunghezza di un anello è definita in maniera tale che la
lunghezza della catena è pari alla somma della lunghezza degli anelli. L’azienda
vende catene di 50 m. Per sicurezza, ogni catena è costruita con 1002 anelli.
L’azienda garantisce che la catena è non più piccola di 50 metri. Se per caso una
catena risulta più piccola, la catena viene sostituita gratuitamente. Calcolare la % di
catene prodotte dall’azienda con una lunghezza inferiore a 50 m. Se si vuole che
questa percentuale sia del 20%, da quanti anelli deve essere composta la catena?
4. Il seguente elenco contiene le temperature in gradi Fahreneit di un motore per una
navetta spaziale. Costruire un istogramma con ampiezza delle classi pari a 5.
Determinare gli indici di posizione e commentarli anche in relazione all’istogramma
così costruito.
66 70 69 68 67 72 73 70 57 63 70 78
67 67 53 67 75 70 81 76 79 75 76 58
Soluzioni
1. Si tratta di calcolare
P ( B | A) =
P ( AI B )
P ( A)
=
P ( A ) + P ( B ) − P ( AU B )
P( A)
=
3/ 4+2/5−4/5
.
3/ 4
2. Il risultato segue osservando che
P ( X ≤ n ) = p + p (1 − p ) + L + p (1 − p )n −1 = p{1 + (1 − p ) + L + (1 − p ) n −1}
1 − (1 − p )n 
n
= p
 = 1 − (1 − p )
 1 − (1 − p ) 
1002
3. La lunghezza di una catena è la v.a. L = ∑ X i dove X i ≈ N ( 5, 0.04 ) Pertanto la
i =1
v.a. L è gaussiana di media 50,1m e di varianza 0,408m. La percentuale di
catene prodotte dall'azienda con una lunghezza inferiore a 50m risulta essere
50 − 50.1 

P ( X ≤ 50 ) = P  Z ≤
 = P ( Z ≤ −0.0158 ) = 0.4936 . Si tratta di imporre che
0.4008 

50 − 0.05 × n
= −0.84 = z0.80 .
Risolvendo
rispetto
a
n
l'equazione
0.0004 × n
0.0025 n 2 - 0.100282 n +2500=0 da cui si ricava n=1011.
4. Il campo di variazione del campione casuale risulta essere 28. Dividendo per 5
classi, l'ampiezza risulta essere 5,6 che si può arrotondare a 6. La tabella delle
frequenze assolute risulta essere
Classi
Freq.
52-58
3
58-64
1
64-70
10
70-76
6
76-82
3
e quindi l'istogramma risulta essere
Istogram m a
12
10
8
6
4
2
0
52-58
58-64
64-70
70-76
76-82
Dati
Gli indici di posizione sono media 69.56, moda 70 e mediana 70. La distribuzione risulta
essere simmetrica rispetto agli indici di posizione, in disaccordo al grafico costruito.
Pertanto andrebbe cambiata la ripartizione in classi oppure andrebbe valutato l'indice di
simmetria.
Prova scritta di Statistica
30 Settembre 2013 – Programma Cristallo/Gallo
1. Campioni di emissioni selezionati da tre fornitori sono classificati in conformità a
delle specifiche sulla qualità dell’aria. I risultati su 100 campioni sono dati in
tabella:
Fornitori
1
2
3
Totale
Conformi
Si
No
22
8
25
5
30
10
77
23
Totale
30
30
40
100
Sia A l’evento “un campione selezionato a caso proviene dal fornitore 1” e sia B
l’evento “un campione selezionato a caso soddisfa le specifiche”. Calcolare
Stabilire se i due eventi sono indipendenti. Sapendo che il
campione estratto proviene dal fornitore 2, qual è la probabilità che non sia
conforme alle specifiche?
2. Un produttore farmaceutico asserisce che un particolare farmaco dia un parziale
miglioramento dei sintomi di angina pectoris nell'80% dei pazienti. Un medico
prescrive questo farmaco a 5 dei suoi pazienti affetti da angina e dopo qualche
mese trova che soltanto 2 mostrano un miglioramento dei sintomi. Assumendo
che l'affermazione del produttore sia vera, calcolare la probabilità che il medico
trovi che 2 o meno pazienti presentano un miglioramento dei sintomi.
3. Vengono intervistati 36 abitanti di una certa città, a cui viene chiesto il numero di
vani presente nella propria abitazione. Le 36 risposte ottenute sono le seguenti:
1;3;4;2;2;4;5;5;1;1;2;3;4;3;2;6;6;1;2;2;3;2;1;3;4;2;3;3;3;5;6;4;2;2;4;2:
a) Costruire la tavola delle frequenze relative e delle frequenze cumulate.
b) Fornire un rappresentazione grafica ”a torta” delle risposte.
c) Determinare media, moda, mediana e varianza delle risposte.
d) La stessa indagine è stata svolta in una diversa città, e le risposte fornite dal
medesimo numero di intervistati hanno dato un valor medio uguale a 2.5 ed una
varianza uguale a 3.6. Le due popolazioni hanno la stessa media?
Soluzioni
1. P ( AI B ) =
P ( A B) =
S
P ( AI B )
P(B | C) =
C
AI B
P ( B)
=
AI BC
22
8
C
=
; P ( AI B ) =
=
;
100
S
100
22 / 100
30
≠ P( A) =
⇒ A e B non sono indipendenti
77 / 100
100
P (C I B C )
C
P( B )
=
5
.
23
2. Si tratta di calcolare P ( X ≤ 2 ) con X binomiale di parametri n=5 e p=0.80.Il valore
risulta 0.057.
3. La tabella richiesta risulta essere
Modalita' Freq.ass. Freq. Rel.
Freq. Cum.
1
5
0,138889
0,138889
2
11
0,305556
0,444444
3
8
0,222222
0,666667
4
6
0,166667
0,833333
5
3
0,083333
0,916667
6
3
0,083333
1
Il grafico a torta ha la forma
Grafico a torta
1
2
3
4
5
6
La media e la mediana risultano essere 3, la moda vale 2. La varianza vale 2.17.
Per rispondere all’ultimo quesito è necessario effettuare un T-test sulla differenza tra le
medie. La statistica test risulta essere Stat =
S
2
p
X1 − X 2
1 1
S p2  + 
 n1 n2 
n1 − 1) S12 + ( n2 − 1) S 22
(
=
n1 + n2 − 2
dove
= 2.88
Poiché la statistica test ha valore 1.49 che risulta inferiore al quantile t0.025;70 = 1.99 l’ipotesi
nulla che le medie sono uguali non si rigetta.