s_121121

STATISTICA E CALCOLO DELLE PROB.
Mercoledì 21 novembre 2012
Prof. Cesare Svelto
Tempo a disposizione 2 ore 00 min (30+25+20+15+30)
1a P.I. AA 2012/2013
Aula VS.8 ore 13.15
Cognome e nome: ___________________________________ _____________________
Matricola e firma __ __ __ __ __ __
(stampatello)
_____________________(firma leggibile)
Esercizi svolti (almeno parzialmente): 1 2 3 4 5 (8+7+7+4+7 = 33p)
(crocettare)
N.B. Si devono crocettare tutti i sottopunti cui si è almeno parzialmente risposto [e.g. 1a), 1c), 1d) etc.].
Occorre svolgere tutti gli esercizi, almeno parzialmente, per poter consegnare il compito.
SOLUZIONI
Esercizio 1 (tempo stimato 30 min)
(svolgere su questo foglio e sul retro)
1) Si viene incaricati di effettuare un test statistico su una ditta che imbottiglia acque minerali. Si vuole
controllare l’esatto livello medio di acqua presente nelle bottiglie, dichiarato 1.5 l dalla ditta. È noto che le
macchine imbottigliatrici hanno una deviazione standard del riempimento  = 10 ml. Si esaminano quindi
due casse da 6 bottiglie e ne misuriamo il contenuto, ottenendo i seguenti valori:
Litri di acqua: 1.493, 1.503, 1.500, 1.483, 1.479, 1.496, 1.467, 1.501, 1.495, 1.502, 1.475, 1.486.
1a) Si calcolino media e varianza campionaria e si disegni il box-plot dei dati.
1b) Si riportino i dati in un diagramma rami-e-foglie e da questo si ottenga un istogramma dei dati.
1c) Si effettui un test statistico allo scopo di valutare se il riempimento delle bottiglie è diverso da quello
dichiarato, con livello di significatività del 5 %.

1a) media campionaria = x 
1 n
 xi =1.49 l
n i 1
n

varianza campionaria = s 2 
(x  x)
i 1
i
n 1
2
 1.4 10-4 l2
da cui la deviazione standard campionaria vale s  11.8 ml
L’insieme dei dati ordinati, per valori crescenti, è:
Litri di acqua: 1.467, 1.475, 1.479, 1.483, 1.486, 1.493, 1.495, 1.496, 1.500, 1.501, 1.502, 1.503.
BOX PLOT:
min = 1.467 l
Q1 = 1.480 l
M = 1.494 l
Q3 = 1.50075 l
max =1.503 l
DIQ=Q3-Q1=0.02075 l
I baffi comprendono tutti i punti rimanenti, in quanto tutti i valori misurati sono contenuti all’interno di 1.5
volte la dinamica interquartile dal box.
_______
Pag. 1/8
Esercizio 1 (continua)
1b) Dai 12 dati ordinati, possiamo scegliere i valori numerici fino al centesimo di litro come rami/classi e i
millesimi di litro come foglie, ottenendo i seguenti :
Diagramma rami-e-foglie
Istogramma
5
40
Foglie Freq.
7
1
1.47
59
2
1.48
36
2
30
3
20
2
10
frequenza percentuale [%]
1.46
4
frequenza assoluta
Rami
1
1.49
356
3
1.5
0123
4
0
0
1.46
1.47
1.48
1.49
1.5
quantità di liquido [l]
1c) Dato che la varianza è nota, si può effettuare un test Z. Seguiamo gli 8 passi descritti nel libro di testo.
1. Il parametro di interesse è la quantità attesa (media µ) di liquido
2. H0:  = 1.5 l
3. H1:   1.5 l (il test è a due lati, in quanto espressamente richiesto dal testo: si vuole rivelare una
qualsiasi differenza)
4. livello di significatività richiesto  = 0.05
5. La statistica di test è la statistica Z: z0 
X 
X

X 
/ n
6. Rifiutiamo H0 se z0 > Z/2 = 1.96 oppure z0 < -Z/2 = -1.96 (questi valori si ricavano dalla tabella della
funzione cumulativa per una VNS in corrispondenza di un valore di probabilità /2=0.025)
7. Calcoliamo quindi z0, z0 
X 
X

X   1.49  1.5

 3.46
 / n 0.01 / 12
8. Conclusione: dato che z0 = -3.46 < -Z/2 = -1.96 possiamo rifiutare l’ipotesi nulla con livello di
significatività 0.05: c’è abbastanza evidenza che l’ipotesi nulla sia falsa e che il riempimento delle
bottiglie sia diverso (inferiore in questo caso) al valore dichiarato di 1.5 l.
Concludiamo che il livello di riempimento delle bottiglie è significativamente diverso da 1.5 l.
_______
Pag. 2/8
Esercizio 2 (25 minuti)
(svolgere su questo foglio e sul retro)
2a)
2b)
2c)
2d)
Sapendo che la potenza consumata da una lampada al neon segue una distribuzione normale, con valor
medio pari a 50 W e varianza di 16 W2, si calcoli la probabilità che l’illuminazione di un’aula, che
utilizza 25 di questi neon, richieda più di 1260 W.
Questi neon sono abbastanza difettosi, mediamente 1 su 20 non funziona. Quanto vale la probabilità
che, appena installati, nel locale ci siano 2 neon non funzionanti?
Considerando tutte le aule di una sede universitaria, mediamente si brucia un neon ogni settimana.
Giustificando la risposta, si valuti la probabilità che in 4 settimane si bruci più di 1 neon.
Dobbiamo prevedere una stima di spesa su 10 anni, per il costo delle sostituzioni dei neon. Supponendo
che le condizioni restino inalterate nel tempo, si stimi la probabilità di dover sostituire non più di 530
neon in 10 anni.
2a)
Dato che i 25 neon hanno potenze che possiamo considerare statisticamente indipendenti, la variabile
(sempre gaussiana) “potenza consumata da 25 neon” avrà valor medio e varianza pari rispettivamente a
 =2550 W= 1250 W e  2 = 2516 W2 =400 W2 (si vedano gli appunti sulla combinazione lineare di
variabili statisticamente indipendenti). Per calcolare la probabilità standardizziamo la variabile casuale
gaussiana, e ricorriamo quindi alla tabella dei valori della distribuzione cumulativa (z) per una variabile
x
normale standard (VNS). Ricordiamo che z 
è la VNS ricavata da x.

1260   
1260  1250 


P( x  1260)  P z 
  P z 
  P( z  0.5)  1  P( z  0.5)  30.85%

20




2b) Dato che ogni prova è un processo di Bernoulli (il neon o è guasto oppure non lo è, ovvero successo o
insuccesso), le prove sono indipendenti e la probabilità di successo in ogni prova è costante, la probabilità di
x termosifoni guasti (“successo”) su n segue la distribuzione binomiale, con probabilità di successo p =0.05:
n
 25 
2
P(2 successi su 20 prove )    p x (1  p) n  x   0.05 (0.95) 25 2  23 %
 x
2
n
 25  25! 25  24
n!
avendo ricordato che   
e dunque   
=300

2 1
 x  x!(n  x)!
 2  23!2!
2c) In prima approssimazione possiamo utilizzare una statistica poissoniana, in quanto i neon sono molti,
ognuno con una probabilità di rottura in un determinato istante molto bassa. Inoltre in prima approssimazione
il singolo evento di rottura si può considerare scorrelato dagli altri.
e   x
La funzione di probabilità di una variabile poissoniana X vale f ( x) 
,
x  0,1,2...
x!
con valor medio  =  e varianza 2 = .
Nel caso considerato, il valor medio vale  = 1 neon/settimana  4 settimane = 4 neon.
La probabilità che si bruci più di 1 neon in 4 settimane vale:
e 4 4 0 e 4 41
P( x  1)  1  P( x  0)  P( x  1)  1 

 1  0.018  0.073  90.9%
0!
1!
2d)
Data la complessità del calcolo tramite la formula della poissoniana (che richiederebbe di calcolare e
sommare più di 500 probabilità elementari), decidiamo di sfruttare l’approssimazione gaussiana. Valor medio
e varianza valgono  =2 =  = 5210 = 520 (le settimane in un anno sono 52).
L’approssimazione è valida in quanto  >>5. Calcoliamo quindi la probabilità tramite standardizzazione,
considerando che l’approssimazione è più precisa se si sceglie come estremo dell’intervallo di integrazione il
valor medio tra l’ultimo valore escluso ed il primo accettato:
_______
Pag. 3/8

530.5   
530.5  520 

  P( z  0.46)  67.7 %
P( x  530.5)  P z 
  P z 

520 



In effetti il calcolo esatto tramite la distribuzione poissoniana (effettuato a calcolatore) fornisce una
probabilità pari a 67.9%, in ottimo accordo con l’approssimazione effettuata.
_______
Pag. 4/8
Esercizio 3 (20 minuti)
(svolgere su questo foglio e sul retro)
3) Nello studio del prezzo medio di un nuovo modello di laptop si registrano i valori di prezzo al pubblico
in 9 negozi, ottenendo una media di 1500 € e una deviazione standard campionaria di 166 €.
La casa madre produttrice del televisore dichiara invece un prezzo di vendita al pubblico pari a 1400 €.
3a) Si effettui un test statistico per cercare di dimostrare, con significatività del 5 %, che i negozianti
vendono a un prezzo superiore a quello indicato dalla casa madre. Che tipo di test si è svolto, perché, quale è
l’esito?
3b) Si calcoli il valore P per il test effettuato.
3a) Non disponendo di un valore di varianza dichiarato dalla casa madre (o da altri), dovremo utilizzare la
varianza dei dati disponibili nel campione selezionato. Il numero di gradi di libertà è  = n – 1 = 8. La
deviazione standard campionaria è s=166 €.
Effettuiamo quindi un test t perché dobbiamo eseguire una verifica del valor medio con varianza non nota:
1. Il parametro di interesse è il prezzo medio 
2. H0:  = 1400 €
3. H1:  > 1400 € (il test è a un lato solo, in quanto vogliamo dimostrare che il prezzo di vendita al
pubblico è superiore a quello indicato dalla casa madre)
4. livello di significatività richiesto  = 0.05 (attenzione, su un solo lato)
5. La statistica di test è ora la statistica t: t 0 
X  X 

sX
s/ n
6. Rifiutiamo H0 se t0 > t,8 = 1.860. Questo risultato si ricava dalla tabella dei punti percentuale della
distribuzione t, con  = 8 in corrispondenza di una probabilità  = 0.05
7. Calcoliamo quindi t0: t 0 
X 
X   1500  1400


 1.807
sX
sX / n
166 / 9
8. Conclusione: dato che t0 =1.807 < t,8 = 1.860 non possiamo rifiutare l’ipotesi nulla con livello di
significatività 0.05: non c’è abbastanza evidenza che l’ipotesi nulla sia falsa (anche se di poco, non si
cade ancora nella regione di rifiuto).
Il prezzo di vendita dichiarato dalla casa produttrice, secondo questo test, deve dunque essere ritenuto
attendibile (rispetto a quello riscontrato sul mercato) ovvero il prezzo dei negozianti non è superiore (con
significatività del 5 %) a quello della casa madre.
3b) Il valore P, che corrisponde al livello di significatività di soglia tra l’accettazione ed il rifiuto di H0, si
può ricavare direttamente dalla tabella dei valori della funzione cumulativa (della statistica Z o t a seconda
del caso):
tP,8 = t0 = 1.807, per cui valore ricavato è Pt < 0.05 = 5 % (minore di poco ma in maniera non quantificabile
dalla tabella).
L’interpretazione di questo valore è che l’ipotesi nulla sarebbe stata dichiarata falsa per qualsiasi livello di
significatività  maggiore del 5 %+ con >0 anche se non quantificabile in maniera precisa. In questo caso
con  = 5 % non si è potuto rifiutare H0.
_______
Pag. 5/8
Esercizio 4 (15 minuti)
(svolgere su questo foglio e sul retro)
4) Si effettuano misure dell’andamento della tensione nel tempo in uscita da un circuito e si registrano i
seguenti valori:
Tempo [s]
Tensione [V]
1.0
-10.1
1.1
-5.2
1.2
0.1
1.3
5.0
4a) Si disegni il diagramma cartesiano con i punti sperimentali e la corrispondente retta di regressione.
4b) Quanto vale il tasso di crescita c, in unità del Sistema Internazionale, della tensione con il tempo?
NOTA: Si ricorda che il coefficiente angolare ed il termine noto della retta di regressione lineare valgono
m
 x  y   x  x y   y  m x
b
n
n x   x 
n xi yi   xi  y i
2
i
n x   xi 
2
i
2
i
i
i
i
i
i
2
2
i
i
4a) Scegliamo il tempo come variabile x e la tensione misurata come y, applichiamo le formule riportate
nella Nota e otteniamo: m= 50.6 V/s e b=-60.7 V.
Il grafico con i punti sperimentali e la retta di regressione ai minimi quadrati è:
15
10
Tensione [V]
5
0
-5
-10
-15
0.7
0.9
1.1
1.3
1.5
Tem po [us]
4b) Il tasso di crescita cercato è esattamente dato dal coefficiente angolare della retta di regressione, vale
quindi c=50.6 V/s=50.6×106 V/s.
_______
Pag. 6/8
Esercizio 5 (30 minuti)
(svolgere su questo foglio e sul retro)
5) Si eseguono 3 misure indipendenti della massa m di una sfera realizzata con un materiale sconosciuto.
A) Nella misura A si raggiunge il perfetto equilibrio in una bilancia a due bracci utilizzando un peso
campione con massa 31.031 kg noto con incertezza estesa di 15 g al 99.7 %.
B) La misura B è letta con una bilancia digitale ideale, con risoluzione 400 g, al valore di 31.2 kg.
C) La misura C ricava la massa incognita dal volume e densità della sfera. Si ipotizza che il materiale
sconosciuto abbia una densità di massa volumica =10.0(1) kg/dm3 e il diametro della sfera viene
misurato pari a D=20 cm “esatti” impiegando un calibro centesimale (che risolve 1/100 di millimetro).
5a) Si ricavi la misura della massa mA e esprimendo l’incertezza tipo a due cifre in notazione compatta.
5b) Si ricavi la misura della massa mB e esprimendo l’incertezza tipo a due cifre in notazione compatta.
5c) Si ricavi l’equazione della misura della massa mC, il suo valore, e la sua incertezza relativa. Si ricavi la
misura della massa mC e esprimendo l’incertezza tipo a due cifre in notazione compatta.
5d) Si valuti la compatibilità tra le 3 misure ricavate. Se qualche misura non è risultata compatibile con le
altre, si provi a individuarne le possibili ragioni.
5e) Si ricavi la miglior stima della massa m della sfera e la sua incertezza standard.
4a) La massa è mA=31.313 kg. Dall’incertezza estesa U(mA)=15 g con fattore di copertura k=3, per il 99.7 %
di confidenza, si ricava l’incertezza tipo u(mA)=U(mA)/k=5 g. La misura è:
mA = 31.0310(50) kg
4b) La massa è mB=31.2 kg. Dalla risoluzione mB=400 g si ricava una incertezza di quantizzazione
u(mB)=mB/ 12 =120 g. La misura è:
mB = 31.200(12) kg
4c) La massa è mC==4/3r3, con r raggio della sfera e dunque l’equazione della misura è
mC=4/3D3/8=/6 D3. Sostituendo i valori numerici del caso si ricava mC=41.89 kg.
Essendo
l’equazione della misura una produttoria degli ingressi, ci conviene ragionare in termini di incertezze relative.
Sarà ur(mC)= u r2    9u r2 D  . L’incertezza relativa sulla densità è ur()=u()/0.01=1 %. Il diametro
D=20 cm=2 dm è misurato con risoluzione L=D=10 m e dunque con incertezza u(D)=D/ 12 3 m. Si
ha allora una incertezza relativa ur(D)=u(D)/D(3×10-6)/(2×10-1)=1.5×10-5=10 ppm, che è del tutto
trascurabile
rispetto
all’incertezza
relativa
sulla
densità.
Allora
ur(mC)ur()=1 %
e
u(mC)=ur(mC)mC0.42 kg. La misura è:
mC = 41.89(42) kg
4d) La compatibilità tra due misure di massa, assunte indipendenti, viene valutata con il criterio di
compatibilità standard:
m  m  k u 2 (m )  u 2 (m )
Applicando tale criterio si ricava immediatamente che mA e mB sono tra loro compatibili già per k1.46
(dunque non per k=1 ma per k=2 e k=3) mentre mC è incompatibile sia con mA che con mB. Il valore mC
_______
Pag. 7/8
misurato risulta fortemente distante dagli altri due e questo è probabilmente dovuto a una errata stima della
densità  del materiale della sfera.
4e) La miglior stima della misura si ottiene dalla media pesata delle misure compatibili:
mA
m
 2 B
u ( mA ) u ( mB )
mMP=
=31.0313 kg31.031 kg
1
1

u 2 ( mA ) u 2 ( mB )
2
con una incertezza (tipo o standard) della media pesata:
u(mMP)=
1
1
1
 2
2
u ( P) u ( Pw )
=0.00499 kg5 g
mMP=31.013 kg0.005 kg o anche mMP=31.013(50) kg
_______
Pag. 8/8