s_070219

STATISTICA E MISURAZIONE
lunedì 19 febbraio 2007
Prof. Cesare Svelto
Tempo a disposizione 2 ore
Prova in itinere AA 2006/2007
Aula V.S.9 ore 13.00
Cognome: __________________________
Nome: _____________________
(stampatello)
Matricola: __ __ __ __ __ __
Firma: _____________________ (firma leggibile)
Esercizi svolti (almeno parzialmente): 1 2 3 4 (11+7+7+8=33pt)
(crocettare)
N.B. Gli esercizi non crocettati non saranno corretti; quelli crocettati ma neppure iniziati comporteranno una
penalità. Sarà anche penalizzato chi consegna un compito “gravemente insufficiente”.
SOLUZIONI
Esercizio 1 (tempo stimato 40 m)
(svolgere su questo foglio e sul retro)
1) Per valutare l’efficacia di un sistema di raffreddamento per CPU, la temperatura del processore viene
monitorata per 2 ore acquisendo una lettura ogni 10 minuti. I valori complessivamente acquisiti sono:
T (°C) = 35; 42; 38; 44; 60; 63; 58; 55; 59; 49; 51; 55; 54.
1a) Si calcolino media e varianza campionaria dei dati.
1b) Si disegni il diagramma a scatola (box plot) dei dati, avendo prima ricavato i parametri caratteristici
(quartili, dinamica interquartile, valore dei baffi, etc.). Si riporti anche il diagramma a punti (dot diagram).
1c) Si riportino i dati in un diagramma ramo-e-foglia (stem-and-leaf) e da questo si disegni l’istogramma
corrispondente.
1d) Si disegni la serie temporale dei dati in funzione del tempo.
1e) Considerando solo i primi 5 punti di misura, si decida (oltre che dal grafico del punto 1d) o da una sua
espansione sui primi punti) anche in base a un modello di regressione ai minimi quadrati, se è evidente un
trend positivo o negativo. Si ricavi quanto vale la deriva temporale, esprimendola anche in unità SI, sui primi
40 minuti di misurazione.
Nota: Si ricorda che il coefficiente angolare ed il termine noto della retta di regressione ai minimi quadrati si ottengono come:
m
n xi yi   xi  y i
n x   xi 
2
2
i

1a) La media campionaria è T= T 
x  y x x y
b
n x   x 
2
i
i
2
i
i
i
2
i
i

 y  m x
i
i
n
 y  mx
1 n
 Ti =51 °C
n i 1
n

La varianza campionaria è s2= 
 (T  T )
i 1
2
i
n 1
=78.17 °C2
1b) Per disegnare il box-plot dei dati dobbiamo innanzitutto calcolare la mediana e il primo e terzo quartile. I
13 dati ordinati sono
T (°C) = 35; 38; 42; 44; 49; 51; 54; 55; 55; 58; 59; 60; 63.
La mediana, pari al 50-esimo percentile, per cui Imediana = (13+1)50 /100 = 7, quindi la mediana è pari al
settimo dato.
Mediana= 54 °C.
Il primo quartile è il 25-esimo percentile, per cui I1Q = (13+1)25 /100 = 3.5, quindi:
primo quartile= 42+(44-42) 0.5 = 43 °C = Q1
Il terzo quartile è il 75-esimo percentile, per cui I3Q = (13+1)75 /100 = 10.5, quindi:
terzo quartile= 58+(59-58) 0.5 = 58.5 °C = Q3
La dinamica interquartile vale DIQ= Q3-Q1= 15.5 °C.
Pag.1/6
I baffi si possono estendere fino a 1.5DIQ = 23.25 °C al di là del primo e del terzo quartile, quindi fino a
19.75 kg e 81.75 kg. Ricordiamo comunque che i baffi si fermano all’ultimo dato contenuto entro il limite
calcolato: in questo caso sino al dato 1 (baffo inferiore) pari a 35 , e sino all’ultimo dato (baffo superiore)
pari a 63 kg.
In figura è riportato anche il diagramma a punti.
1
35
45
50
55
Temperatura [°C]
foglie
58
249
145589
03
Frequenza
1c) rami
3
4
5
6
40
60
65
50-59
60-69
7
6
5
4
3
2
1
0
30-39
40-49
T [°C]
Temperatura, T (°C)
1d) La serie temporale dei dati è:
70
60
50
40
30
0
20
40
60
80
100
120
Tempo, t (min)
60
60
55
50
y o T (°C)
Temperatura, T (°C)
1e) I primi 5 dati riguardano un intervallo temporale di 40 minuti e corrispondono ai due vettori:
t (min) 0
10
20
30
40
T (°C)
35
42
38
44
60
Il grafico corrispondente (non richiesto) è qui sotto a sinistra:
45
40
50
40
35
30
30
0
10
20
Tempo, t (min)
30
40
0
10
20
30
x o t (min)
Pag.2/6
40
e dal diagramma cartesiano, anche già da quello del punto 1e), appare evidente un trend positivo della
temperatura nel tempo (nel secondo e anche nel primo grafico tale andamento tendenziale è rappresentato
dalla linea tratteggiata, disegnata qualitativamente e che non è la retta di regressione ai minimi quadrati).
Applicando le formule della regressione lineare ai minimi quadrati, si ricava un coefficiente angolare e
un termine noto della retta che sono rispettivamente:
n xi yi   xi  y i
m=
=0.52 °C/min=8.710-3 K/s
2
n xi2   xi 
b= y  mx =33.4 °C=306.55 K
La retta di regressione è mostrata unitamente ai punti sperimentali nel diagramma bordato a tratto-punto.
Pag.3/6
Esercizio 2 (tempo stimato 25 m)
(svolgere su questo foglio e sul retro)
2) Un locale è riscaldato con 3 stufette elettriche dello stesso modello, che il costruttore specifica con una
potenza a distribuzione di probabilità normale, con valor medio 1 kW e deviazione standard 100 W.
2a) Si esprima in dBm la potenza media complessiva delle 3 stufette accese contemporaneamente.
2b) Il contatore elettrico del locale è limitato a 3.3 kW. Quanto vale la probabilità che con le tre stufe accese
salti il contatore?
2c) Ogni stufetta ha il 5% di probabilità di rottura entro un anno. Quanto vale la probabilità che in un anno
se ne rompano meno di 2 sulle tre utilizzate?
2d) In un intero condominio si utilizzano 100 stufette. Se mediamente se ne guastano 5 all’anno, quanto vale
la probabilità che in 3 anni quelle sostituite per guasto siano esattamente 10?
2a) La potenza media complessiva delle tre stufette è pari a 3 kW, che corrispondono a
 3  10 6 mW 
  64.8 dB
10 log 10 

1
mW


2b) La variabile aleatoria Y pari alla somma delle tre potenze (che ipotizziamo scorrelate) ha valor medio
pari alla somma dei valori medi:
3
E (Y )   E ( Pi )  3 kW
i 1
e varianza pari alla somma delle tre varianze ( V(Pi)=0.01 kW2 ):
3
V (Y )  V ( Pi )  0.03 kW 2
i 1
Per cui la sua deviazione standard vale  Y  3 P  0.173 kW
Calcoliamo la probabilità cercata (di superare 3.3 kW di consumo) tramite standardizzazione:
3.3 kW    
3.3  3 

P(Y  3.3 kW )  P z 
  z 
  P( z  1.73)  4.2%

0.173 

 
2c) Il fenomeno di rottura o meno di una stufetta segue una statistica binomiale: dato che ogni prova è un
processo di Bernoulli (rotta o non rotta), le prove sono indipendenti e la probabilità di successo in ogni prova
è costante. La probabilità di x rotture su n stufette segue la distribuzione binomiale, con probabilità di
successo p =0.05 :
n
 n
P(meno di 2 rotte )  P( x  0)  P( x  1)    p x (1  p) n  x
   p x (1  p) n  x

x
 x


x 0
x 1
 3
 3
0
1
  0.05 (0.95) 30   0.05 (0.95) 31  0.857  0.135  99.3%
0
1
 
 
2d) Questo processo segue una distribuzione di tipo poissoniano, in quanto ogni singolo evento è un
processo di Bernoulli, gli eventi si possono considerare scorrelati e la probabilità di avvenimento (rottura) in
un brave intervallo di tempo è molto piccola.
e  x
La funzione di probabilità di una variabile poissoniana X vale f ( x) 
,
x  0,1,2...
x!
Il valor medio in questo caso vale  = 5 /anno × 3 anni= 15, per cui
e   x
e 151510
P( x  10) 

 4.86%
x!
10!
Pag.4/6
Esercizio 3 (tempo stimato 25 m)
(svolgere su questo foglio e sul retro)
3) Nell’ambito di uno studio sulla luminosità di un modello di monitor LCD la casa produttrice dichiara un
valor medio di 330 cd/m2, con varianza 256 cd2/m4. Si misurano 25 monitor, ottenendo un valor medio di
luminosità pari a 310 cd/m2.
3a) Si effettui un test statistico per cercare di dimostrare, con livello di significatività dell’1 %, che la
luminosità del monitor è inferiore a quella indicata dalla casa madre.
3b) Si definisca la potenza di un test statistico
3c) Si calcoli la potenza del test effettuato e la probabilità  di errore di tipo II, nel caso in cui il valor medio
effettivo dell’intera popolazione di monitor prodotti sia 315 cd/m2.
3a) Effettuiamo il test statistico richiesto (test Z, in quanto vogliamo verificare il valor medio di una
popolazione a varianza nota,  =casa= 256 cd/m2=16 cd/m2). Seguiamo gli 8 passi descritti nel libro di
testo.
1. Il parametro di interesse è la luminosità media 
2. H0:  = 330 cd/m2
3. H1:  < 330 cd/m2 (il test è a un lato solo, in quanto vogliamo dimostrare che la luminosità è inferiore
a quella indicata dalla casa madre)
4. Livello di significatività richiesto  = 0.01 (attenzione, su un solo lato)
5. La statistica di test è la statistica Z: z0 
X 
X

X 
/ n
6. Rifiutiamo H0 se Z < -Z  -2.33. Questo risultato si ricava dalla tabella della funzione cumulativa in
corrispondenza di un valore di probabilità  = 0.01.
7. Calcoliamo quindi z0: z 0 
X 
/ n

310  330

 10
 6.25
3.2
16 / 25
8. Conclusione: dato che z0=-6.25 < -2.33 possiamo rifiutare l’ipotesi nulla con livello di
significatività 0.01: c’è notevole evidenza che l’ipotesi nulla sia falsa.
3b) La potenza di un test statistico è la probabilità di rifiutare l’ipotesi nulla quando questa è falsa.
Potenza = 1 - 
La potenza è un parametro che ci descrive la capacità del test di rivelare le differenze della realtà rispetto ad
H0.
3c) La probabilità  di errore di tipo II si ottiene calcolando la probabilità che il valore misurato ricada nella
regione di accettazione, nonostante il valor medio reale sia diverso da H0.
La regione di accettazione è Z > -2.33 (variabile standardizzata ricavata al punto 6 di 4a)), che corrisponde a
X 

n
Z  330-3.2×2.33 cd/m2  322.54 cd/m2
Se il valor medio reale è pari a 315 cd/m2, la probabilità di errore di tipo II vale
  P( X  322.54 cd/m 2 , con   315 cd/m 2 ) 

X   
322.54  315 

P Z 
 P Z 
  PZ  2.35  0.94%  1%


3
.
2


X 

Per cui potenza del test = 1 -   99 %
Pag.5/6
Esercizio 4 (tempo stimato 30 m)
(svolgere su questo foglio e sul retro)
4) Una pista da sci è inclinata di =20 ° dall’orizzontale e questo angolo è stato misurato con U()=6 ° con
k=3. Uno sciatore di discesa libera si lancia sulla pista (velocità iniziale v0=0) e scende per un percorso
rettilineo di 400(2) m, misurati lungo la pista.
4a) Si calcoli il dislivello h della pista, con la sua incertezza tipo.
4b) Se gli attriti vari comportano una perdita complessiva del 60 % nel trasferimento tra energia potenziale
ed energia cinetica, quanto vale la velocità v1 dello sciatore al termine del percorso?
4c) Si calcoli l’incertezza relativa della velocità finale e si dica quale delle variabili misurate ne fornisce il
contributo più rilevante.
4d) Si discuta la compatibilità tra la misura di velocità v1 e una seconda misura v2=30.000.12 m/s.
Nota: si utilizzi un valore dell’accelerazione di gravità sulla pista g=9.806 65(2) m/s2
4a) Il cammino percorso lungo la pista è l=4002 m.
L’angolo di inclinazione della pista è =202 °=0.3490.035 rad.
Il dislivello della pista è dunque h=l sin=136.81 m.
2
2
 h 
 h 
u(h)=   u 2 (l)    u 2 ( ) 
 l 
  
sin  2 u 2 (l)  l cos  2 u 2 ( ) 
0.47  173.07 m 13 m
4b) L’energia potenziale è Ep=mgh e l’energia cinetica acquisita, pari al 40 % dell’energia potenziale persa
1
durante la discesa, è Ec= mv12 =0.4Ep. Si ricava dunque: v1= 0.8gh =32.761 m/s (118 km/h).
2
4c) Partendo dalla relazione funzionale v1= 0.8gh (produttoria a esponenti ½), calcoliamo l’incertezza
relativa di v1 (funzione delle incertezze relative di g e h):
ur(g)=u(g)/g2×10-6 e ur(h)=u(h)/h9.6×10-2
1 2
1
ur g   ur2 h  (1/2)ur(h)4.8×10-2 quasi totalmente dovuta alla misura dell’angolo .
4
4
(non richiesto) L’incertezza tipo di v1 vale quindi u(v1)=v1ur(v1)=1.573 m/s=1.6 m/s
La misura di v1 con l’incertezza tipo in notazione compatta è v1=32.8(1.6) m/s
ur(v1)=
4d) Siamo in presenza di due misure indipendenti della stessa grandezza che hanno fornito valori di misura
diversi tra loro. Valutiamo la compatibilità tra le due misure secondo il criterio di compatibilità standard che
prevede di confrontare la distanza tra i due valori con una combinazione delle due incertezze standard,
secondo la relazione: v1  v2  kcomp u 2 (v1 )  u 2 (v2 ) con kcomp=1,2,3 fattore di copertura per la valutazione
della
compatibilità.
Sostituendo
i
valori
numerici
32.8 m/s  30.00 m/s  kcomp (1.6 m/s )2  (0.12 m/s )2  kcomp (1.6 m/s )
del
caso,
si
ottiene:
ovvero 2.8/1.6<kcomp e dunque
kcomp>1.75.
Vi è dunque compatibilità tra le due misure per un fattore di copertura kcomp=2, e naturalmente anche
per un fattore di copertura kcomp=3, mentre non si ha compatibilità per kcomp=1.
Pag.6/6