Prova scritta
Complementi di Probabilità e Statistica
10 Luglio 2007
1. Nel collaudare un lotto mediante campionamento, si effettuano delle verifiche per
classificare in conformi e difettosi gli esemplari del campione prelevato. Si assuma che il
lotto sia costituito da N pezzi, di cui D difettosi. Si supponga di effettuare n = 5 ≤ N
estrazioni (senza ripetizione) e di accettare il lotto solo se nel campione selezionato si
trovano al più d pezzi difettosi. Sia Pa la probabilità che il lotto venga accettato. Fissato d, si
D

chiama curva operativa del collaudo, la curva che effettua il grafico delle coppie  , Pa 
N

D
. Riportare su un solo grafico le curve operative
al variare della frazione di pezzi difettosi
N
del collaudo corrispondenti a d = 1,2,3,4,5 (quindi 5 curve), per N = 5000 e frazione di
pezzi difettosi che varia da 0 a non oltre il 30%.
2. Su una linea di produzione di barattoli di aranciata dal contenuto nominale di 33cl, sono stati
prelevati 20 campioni di 4 barattoli ciascuno, ottenendo le seguenti stime campionarie:
20
∑ x j = 678.00cl
j =1
20
∑s
j =1
2
j
= 216.80cl 2
USL − µ µ − LSL 
,
Si valuti la capacità del processo C pk = min 
 nell’ipotesi che i limiti
3σ 
 3σ
prescritti siano pari al valore nominale ± 5%.
3. Il modello di vita dell’apparato propulsivo di un sottomarino atomico ha un tasso di guasto
pari a z (t ) = 2t 3 guasti/mese. Determinare l’affidabilità del sistema a 2 mesi.
4. Un esperimento assegna a caso una persona a un tipo di dieta: dieta A (normale), dieta B
(cibo pesante) , dieta C (programma alimentare controllato). Dopo 5 settimane, questo è il
peso acquisito in grammi:
Gruppo A (dieta standard):
Gruppo B (dieta pesante):
Gruppo C (dieta controllata):
11.8
13.6
9.2
12.0
14.4
9.6
10.7
12.8
8.6
9.1
13.0
8.5
12.1
13.4
9.8
(a) Effettuare una analisi ANOVA completa.
(b) Verificare se il campione nella sua interezza può ritenersi gaussiano con un test di
ipotesi.
•
Correzioni martedi’ 17 Luglio 2007, ore 9.30.
Soluzioni prova scritta di Complementi di Probabilità e
Statistica del 10 Luglio 2007
1. Si tratta di calcolare la probabilità P ( X ≤ d ) per d=1,2,3,4 poiché per d=5 il valore di tale
probabilità vale sempre 1. Per calcolare tale probabilità basta utilizzare la funzione
DISTRIB.IPERGEOM di Excel, costruire la tavola della massa di probabilità
P ( X = x), x = 0,1,2,3,4 per D=5000*p, con p che va da 0.01 a 0.30 con passo 0.01 (o altro
passo che si ritiene più appropriato) e poi sommare opportunamente le colonne per
determinare P ( X ≤ d ) .
Curve di collaudo
Prob. accettare
1,1
1
d=1
0,9
d=2
0,8
d=3
0,7
d=4
0,6
0,
28
0,
25
0,
22
0,
19
0,
16
0,
13
0,
10
0,
07
0,
04
0,
01
0,5
% difettosità
2. La media totale sarà data da X =
1 20
∑ x j = 33,9cl
20 j =1
mentre la varianza campionaria è data
1  20 2 
 ∑ s j  = 10,84. Dai dati del problema si ha che USL = 33(1 + 0.05) = 34,65
20  j =1 
mentre LSL = 33(1 − 0.05) = 31,35. Pertanto si ha
da S 2 =
 34,65 − 33,9 33,9 − 31,35 
,
C pk = min 
 = min{0,0759;0,0735} = 0,0735.
9,877 
 9,877
 t

 t 3 
 t4
3. L’affidabilità del sistema è data da R (t ) = exp − ∫ z ( s )ds  = exp − 2∫ s ds  = exp −
 2
 0

 0

tratta dunque di calcolare R(2).
4. Si tratta di effettuare un’anova ad un fattore, ossia
RIEPILOGO
Gruppi Conteggio
A
5
B
5
C
5
e
Somma
55,7
67,2
45,7
Media
Varianza
11,14
1,613
13,44
0,388
9,14
0,338

 Si

ANALISI VARIANZA
Origine della
variazione
SQ
Tra gruppi
46,3
In gruppi
9,356
Totale
gdl
55,656
Valore di
significatività
2,26E-05
MQ
F
2
23,15 29,69218
12 0,779667
F crit
3,88529
14
In base ai dati si rigetta l’ipotesi che i trattamenti abbiano media uguale. Poiché i campioni
hanno taglia 5, il box-plot dei dati risulta essere
Box-plot
16
14
12
10
8
6
4
2
0
q1
min
q2
max
q3
1
2
3
Diete
Dal box plot, si evince che tutte e tre le coppie di medie dovrebbero essere statisticamente diverse.
Per convalidare questa tesi effettuiamo un test di Fisher, ossia
A
B
2,3
A
B
C
C
2
4,3
Il quantile di riferimento è 1.22 dal quale si evince che le diete sono tutte mediamente diverse.
Infine per validare il risultato è necessario effettuare una analisi dei residui, ad esempio mediante
l’uso di un Q-Q plot.
1.2
1
0.8
0.6
Serie1
0.4
0.2
0
-3
-2
-1
0
1
2
Dall’uso del Q-Q plot la distribuzione gaussiana risulta dubbia. Pertanto si effettua un Test di KS.
Dati
Cum.emp. Cum.Teor.
Diff.
-2.04 0.066667
0.00629 0.060377
-0.64 0.133333 0.216847 0.083513
-0.64
0.2 0.216847 0.016847
-0.54 0.266667 0.254447 0.01222
-0.44 0.333333 0.295207 0.038126
-0.44
0.4 0.295207 0.104793
-0.04 0.466667 0.480487 0.013821
0.06 0.533333 0.529254 0.004079
0.16
0.6 0.577586 0.022414
0.46 0.666667
0.71318 0.046514
0.66 0.733333 0.790268 0.056935
0.66
0.8 0.790268 0.009732
0.86 0.866667 0.853601 0.013065
0.96 0.933333 0.879869 0.053465
0.96
1 0.879869 0.120131
La statistica test vale 0.12 che confrontata con il quantile di riferimento 0.33, fa ritenere
gaussiana la distribuzione dei residui.
Infine verifichiamo che il campione casuale nella sua interezza ha legge gaussiana.
Dati
8.5
8.6
9.1
9.2
9.6
9.8
10.7
11.8
12
12.1
12.8
13
13.4
13.6
14.4
Cum.emp.
0.066667
0.133333
0.2
0.266667
0.333333
0.4
0.466667
0.533333
0.6
0.666667
0.733333
0.8
0.866667
0.933333
1
Cum.teor.
0.084274
0.092315
0.141103
0.152652
0.204936
0.23465
0.393058
0.610801
0.648736
0.667188
0.783456
0.811766
0.861134
0.882175
0.94385
Diff.
0.017607
0.041018
0.058897
0.114015
0.128398
0.16535
0.073608
0.077468
0.048736
0.000521
0.050123
0.011766
0.005533
0.051158
0.05615
La statistica test vale 0.165, che risulta inferiore al quantile 0.33, da cui non si rigetta
l’ipotesi di distribuzione gaussiana per il campione.