s_050912 - Politecnico di Milano

STATISTICA E MISURAZIONE
lunedì 12 settembre2005
Prof. Cesare Svelto
Tempo a disposizione 2h30min
Cognome: _________________________
Matricola e firma __ __ __ __ __ __
Terzo appello AA 2004/2005
Aula V.s.9 ore 12.30
Nome: _______________________
(stampatello)
_______________________ (firma leggibile)
Esercizi svolti (almeno parzialmente): 1 2 3 4 5 (5 + 8 + 6 + 8 + 6=33p)
(crocettare)
N.B. gli esercizi non crocettati non saranno corretti; quelli crocettati ma neanche iniziati comporteranno
una penalità; se possibile, si chiede di crocettare anche i sottopunti svolti.
SOLUZIONI
(20 min)
Esercizio 1
(svolgere su questo foglio e sul retro)
1) Si dia la definizione, e se ne illustri il significato con un esempio, di ciascuno dei seguenti termini
metrologici:
1a) errore di misura (polarizzazione)
1b) incertezza
1c) sensibilità
1d) ripetibilità
1e) stabilità
1f) Si dispone di due segnali alternati (un’onda sinusoidale e un’onda quadra) con la medesima ampiezza di
50 mA che vengono inviati ciascuno a un carico da 200 . Dopo avere ricavato i valori efficaci in tensione,
per i due segnali, si calcolino in watt e si esprimano in dBm le potenze sviluppate sui due carichi.
1a,b,c,d,e)
Si vedano il libro e/o gli appunti del Corso.
1f) In entrambi i casi Ip=50 mA e, con R=200 , si ottiene una tensione di picco Vp=RIp=10 V.
caso 1]
Il segnale sinusoidale alternato avrà una ampiezza efficace V1,eff=Vp/ 2 =7.07 V. La potenza sviluppata sul
carico è P1=(V1,eff)2/R=(Vp)2/(2R)=(100 V2)/(400 )=0.25 W=250 mW=+30 dBm-6 dB=+24 dBm.
caso 2]
Il segnale a onda quadra alternato avrà una ampiezza efficace V2,eff=Vp=10 V. La potenza sviluppata sul
carico è P2=(V2,eff)2/R=(Vp)2/R=(100 V2)/(200 )=0.5 W=500 mW=+30 dBm-3 dB=+27 dBm (esattamente il
doppio che nel caso precedente ed esattamente la potenza che svilupperebbe una tensione continua da 10 V
applicata al carico).
_______
Pag. 1/8
(35 min)
Esercizio 2
(svolgere su questo foglio e sul retro)
2) Si vuole calcolare il tempo che occorre per scrivere 6 file da 800 MB su un DVD da 4.7 GB.
La velocità di scrittura dei file sul DVD è di 8× (v=11.08 MB/s, nota con incertezza estesa di 3.6×10-3
con fattore di copertura k=3).
La dimensione di ciascun file ha un valore compreso tra Dmin=798 MB e Dmax=802 MB, con densità di
probabilità (PDF) triangolare.
Il tempo che occorre all’operatore umano per individuare il singolo file da copiare e iniziarne la copia è
stato misurato con un orologio analogico da polso, con lancetta-cronografo contasecondi, ottenendo un valore
TO=4 s.
2a) Si ricavi la misura indiretta del tempo di scrittura TS dell’intero DVD. Si esprima il risultato usando la
notazione compatta per l’incertezza tipo.
2b) Si calcoli l’incertezza relativa ur(TS).
2c) Se la misura di TO fosse stata ottenuta da 100 letture ripetute con varianza campionaria 1 s2 (e valor
medio ancora TO=4 s), quanto varrebbe l’incertezza u(TS) in questo caso? Si confronti tale valore con quello
ottenuto precedentemente.
2d) (Opzionale) Si valuti lo spazio mediamente non utilizzato sul disco (spazio rimasto vuoto sul DVD dopo
la scrittura dei 6 file) esprimendo l’incertezza estesa su questa grandezza a un livello di confidenza del 95 %.
immaginando di scrivere 1000 DVD secondo questa procedura e con le ipotesi fatte, con quale probabilità
potrà capitare che i 6 file non trovino spazio sufficiente sul disco.
2a) Il tempo cercato è TS=6(TO+T) con T tempo di scrittura del singolo file.
Dmax  Dmin
=800 MB
2
D  Dmin 2 MB
u(D)= max
=0.8165 MB0.82 MB

24
6
u D  0.82 MB

ur(D)=
1.0×10-3=0.1%
D
800 MB
D=
(valore centrale dell’intervallo di valori possibili)
(deviazione standard della PDF triangolare)
(incertezza relativa)
v=11.08 MB/s
ur(v)=Ur(v)/k = (3.6×10-3)/3=1.2×10-3=0.12%
Il tempo di scrittura del singolo file è
D
800 MB
T= 
72.202 s
v 11.08 MB/s
[[ 1 min e 12 s ]]
ur(T)= ur2 D  ur2 v  1  1.2 ×10-3= 2.44 ×10-31.6×10-3
u(T)=ur(T)×T=1.210-3 s=1.2 ms=0.0012 s
T=72.20(12) s
TO=4 s
TO=1 s
T
u(TO)= O =2.910-1 s=0.29 s
12
2
2
[[ 7 minuti e ½ ]]
TS=6(TO+T)=6×76.20 s=457.20 s
u(TS)=6 u 2 TO   u 2 T  6×u(TO)1.8 s
essendo u2(T)<< u2(TO)
Esprimendo il risultato in notazione compatta, si ottiene
TS=457.2(1.8) s
_______
Pag. 2/8
Esercizio 2
(continua)
2b) ur(TS)=
u TS 
1 .8 s

=4×10-3=0.4%
TS
457.2 s
s TO  1 s
 =0.1 s
10
n
In questo caso, essendo ancora u2(T)<< u2(TO), si ha u(TS)6×u(TO)0.6 s.
Rispetto al caso precedente, si osserva ora una significativa riduzione dell’incertezza sul tempo di
scrittura (si è ridotta di un fattore 3 rispetto al caso di prima). Invece il tempo di scrittura totale non è
cambiato significativamente.
2c) u(TO)=
2d) Lo spazio che rimane vuoto sul disco, dopo la scrittura dei 6 file da 800 MB (valore medio) è
Cres=C-6×D=4.7 GB×(1024 MB/GB)-6×800 MB=(4812.8-4800) MB=12.8 MB.
L’incertezza sullo spazio residuo, essendo per ipotesi trascurabile/nulla l’incertezza sulla capacità del
disco, sarà uguale a 6 volte l’incertezza sulla dimensione del singolo file. Pertanto,
u(Cres)=6×u(D)=6×0.82 MB4.92 MB.
Tale valore di incertezza su Cres non è molto lontano dal valore stesso dello spazio residuo. Tuttavia, dato
il modello di PDF (triangolare e dunque uguale a zero al di fuori degli estremi Dmin e Dmax), saremo sempre
sicuri che la dimensione di ciascun file è D≤ Dmax=802 MB e pertanto la capacità scritta sul DVD sarà in
ogni caso Cscritta≤ 6Dmax=6×802 MB=4812 MB/(1024 MB/GB)=4.699GB<4.7 GB. Dunque la probabilità che
i 6 file non trovino spazio sufficiente sul disco è uguale a zero.
_______
Pag. 3/8
(30 min)
Esercizio 3
(svolgere su questo foglio e sul retro)
3) Si vuole fare uno studio statistico sul tempo di attesa per ottenere la prima risposta dall’operatore in un
call center telefonico. Allo scopo, si effettua una raccolta dati che ha portato al campione:
T (s) = 14; 18; 25; 16; 19; 20; 22; 19; 28; 17; 18; 24.
3a) Si individuino media, deviazione standard campionaria e gli altri parametri (riassuntivi) caratteristici del
campione.
3b) Utilizzando un numero di classi pari a 4 per l’analisi statistica, si disegni l’istogramma della frequenza
assoluta dei dati.
3c) Sempre con le 4 classi del punto precedente, si disegni l’istogramma della frequenza cumulativa relativa
dei dati.
3d) Dopo avere calcolato, con le formule e spiegazioni del caso, i valori caratteristici del box-plot dei dati, si
disegni questa rappresentazione grafica (con tutti i punti misurati) commentando il box-plot ottenuto.
3a) Il numero di dati contenuti nel campione è n=12.
1 n
1
La media campionaria dei dati è T   Ti  240 s   20 s .
n i 1
12
La varianza campionaria dei dati è sT2 


1 n
1  n 2 
180 s 2
2
2


T

T

T

n
T

 16.36 s 2 .


 i
  i

n  1 i 1
n  1  i1 
12

La deviazione standard campionaria dei dati è sT  sT2  4.05 s  4 s .
Gli altri parametri riassuntivi sono Tmin=14 s; Tmax=28 s; Tmediana=19 s.
3b-c) Riportiamo i dati ordinati (secondo valori crescenti):
T (s) = 14; 16; 17; 18; 18; 19; 19; 20; 22; 24; 25; 28
Con 12 dati un numero sensato di classi è 4 (ricordiamo la legge 1+log2(n)), ad esempio possiamo scegliere i
seguenti intervalli per l’istogramma:
Intervallo frequenza freq. cumulativa
14 - 17
3
3
18 - 21
5
8
22 - 25
3
11
26 - 29
1
12
Frequenza assoluta
5
4
3
2
1
0
12
14
16
18
14
16
18
20
22
24
26
28
30
24
26
28
30
Frequenza cumulativa
12
10
8
6
4
2
0
12
20
22
Tempo di attesa [s]
3d) Per disegnare il box-plot dei dati dobbiamo innanzitutto calcolare la mediana e il primo e terzo quartile.
La mediana è il 50-esimo percentile, per cui Tmediana = (12+1)50 /100 = 6.5, quindi la mediana è la media tra
il sesto ed il settimo dato, che valgono entrambi 19 s.
Mediana=19 s.
Il primo quartile è il 25-esimo percentile, per cui I1Q = (12+1)25 /100 = 3.25, quindi il primo quartile è dato
da:
primo quartile= [ 17 + (18 – 17)  0.25 ] s= 17.25 s = Q1
_______
Pag. 4/8
Il terzo quartile è il 75-esimo percentile, per cui I3Q = (12+1)75 /100 = 9.75, quindi il terzo quartile è dato
da:
terzo quartile= [ 22 + (24 – 22)  0.75 ] s= 23.5 s = Q3
La dinamica interquartile vale DIQ= Q3-Q1= 6.25 s.
I baffi si possono estendere fino a 1.5DIQ = 9.375 s al di là del primo e terzo quartile, quindi fino a
17.25-9.375=7.875 s e 23.5+9.375=32.875 s. Ricordiamo comunque che i baffi si fermano all’ultimo dato
contenuto entro questo limite (di 1.5DIQ): in questo caso sino al primo e all’ultimo dato del campione (non
ci sono outliers).
In figura (box-plot) sono riportati anche i punti sperimentali.
1
14
16
18
20
22
Tempo di attesa [s]
24
26
28
_______
Pag. 5/8
(35 min)
(svolgere su
Esercizio 4
questo foglio e sul retro)
4) Nell’ambito di uno studio sul prezzo medio di un PC laptop, con specificate prestazioni tecniche, si
registrano i valori di prezzo al pubblico in 9 negozi:
C [k€] = 2.6 ; 2.4 ; 2.7 ; 2.5 ; 2.6 ; 2.2 ; 2.4 ; 2.7 ; 2.4.
La casa madre produttrice del laptop dichiara un prezzo di vendita al pubblico pari a 2.4 k€ con varianza
di 0.64 k€2.
4a) Si calcolino la media e la deviazione standard campionaria per il prezzo in negozio.
4b) Si effettui un test statistico per cercare di dimostrare, con significatività del 5 %, che i negozianti
vendono a un prezzo superiore a quello indicato dalla casa madre (i cui dati sono attendibili). Che tipo di test
si è svolto, perché, quale è l’esito?
4c) Si ripeta il test del punto 4b) ritenendo non attendibile la varianza fornita dalla casa madre. Che tipo di
test si è svolto, perché, quale è l’esito?
4d) Si calcoli il valore P per entrambi i test effettuati.
4e) Il numero di negozi inclusi nel campione da noi analizzato viene portato da 9 a 900 ottenendo comunque
la stessa media e varianza campionaria del punto 4a). Si ricalcali il test del punto 4c) in queste condizioni.
4a) La media campionaria, sulle n=9 determinazioni di prezzo disponibili, è
22.5 k €
1 n
1 9
C   Ci   Ci 
 2.5 k €
n i 1
9 i 1
9
La varianza campionaria è
sC2 
1 n
1  n 2 
1
0.22 k € 2
2
2
2




C

C

C

n
C

56
.
47

56
.
25
k
€

 0.0275 k € 2



i
  i

n  1 i 1
n  1  i 1 
8
 8
con una deviazione standard campionaria
sC= sC2 0.166 k€=166 €
4b) Effettuiamo il test statistico richiesto (test Z, in quanto vogliamo verificare il valor medio di una
popolazione a varianza nota, =casa= 0.64 k € 2 =0.8 k€). Seguiamo gli 8 passi descritti nel libro di testo.
1. Il parametro di interesse è il prezzo medio 
2. H0:  = 2.5 k€
3. H1:  > 2.5 k€ (il test è a un lato solo, in quanto vogliamo dimostrare che il prezzo di vendita al
pubblico è superiore a quello indicato dalla casa madre)
4. livello di significatività richiesto  = 0.05 (attenzione, su un solo lato)
5. La statistica di test è la statistica Z: z0 
X 
X

X 
/ n
6. Rifiutiamo H0 se Z > Z  1.64. Questo risultato si ricava dalla tabella della funzione cumulativa in
corrispondenza di un valore di probabilità , ossia da P=1-(Z)=(-Z)=0.05  Z 1.64
7. Calcoliamo quindi z0: z 0 
C 
C

C 
/ n

2.5  2.4
0.8 / 9

0.1
0.3

 0.375
0.8 / 3 0.8
8. Conclusione: dato che z0=0.375 < Z  1.64 non possiamo rifiutare l’ipotesi nulla con livello di
significatività 0.05: non c’è abbastanza evidenza che l’ipotesi nulla sia falsa.
Il prezzo di vendita dichiarato dalla casa produttrice, secondo questo test, deve dunque essere ritenuto
attendibile (rispetto a quello riscontrato sul mercato) ovvero il prezzo dei negozianti non è superiore (con
significatività del 5 %) a quello della casa madre.
_______
Pag. 6/8
4c) Ripetiamo ora il test, non fidandoci della varianza dichiarata dalla casa madre. Dovremo utilizzare la
varianza dei dati disponibili nel campione selezionato. Il numero di gradi di libertà è  = n – 1 = 8. La
deviazione standard campionaria, v. punto 4a), è sC=0.166 k€.
Effettuiamo quindi un test t perché dobbiamo eseguire una verifica del valor medio con varianza non nota:
1. Il parametro di interesse è il prezzo medio 
2. H0:  = 2.5 k€
3. H1:  > 2.5 k€ (il test è a un lato solo, in quanto vogliamo dimostrare che il prezzo di vendita al
pubblico è superiore a quello indicato dalla casa madre)
4. livello di significatività richiesto  = 0.05 (attenzione, su un solo lato)
5. La statistica di test è ora la statistica t: t 0 
X  X 

sX
s/ n
6. Rifiutiamo H0 se t0 > t,8 = 1.860. Questo risultato si ricava dalla tabella dei punti percentuale della
distribuzione t, con  = 8 in corrispondenza di una probabilità  = 0.05
7. Calcoliamo quindi t0: t0 
C  C 
2.5  2.4
0.1
0.3




 1.807
sC
sC / n 0.166 / 9 0.166 / 3 0.166
8. Conclusione: dato che t0 =1.807 < t,8 = 1.860 non possiamo rifiutare l’ipotesi nulla con livello di
significatività 0.05: non c’è abbastanza evidenza che l’ipotesi nulla sia falsa (anche se di poco, non si
cade ancora nella regione di rifiuto).
Il prezzo di vendita dichiarato dalla casa produttrice, secondo questo test, deve dunque essere ritenuto
attendibile (rispetto a quello riscontrato sul mercato) ovvero il prezzo dei negozianti non è superiore (con
significatività del 5 %) a quello della casa madre.
4d) Il valore P, che corrisponde al livello di significatività di soglia tra l’accettazione ed il rifiuto di H0, si
può ricavare direttamente dalla tabella dei valori della funzione cumulativa (della statistica Z o t a seconda
del caso):
ZP = z0 = 0.375, per cui il valore ricavato è PZ = 1- ( z0 )  0.35 = 35 %.
L’interpretazione di questo valore è che l’ipotesi nulla sarebbe stata dichiarata falsa per qualsiasi livello di
significatività  maggiore del 35 %. In questo caso con  = 5 % non si è potuto rifiutare H0.
tP,8 = t0 = 1.807, per cui valore ricavato è Pt < 0.05 = 5 % (minore di poco ma in maniera non quantificabile
dalla tabella).
L’interpretazione di questo valore è che l’ipotesi nulla sarebbe stata dichiarata falsa per qualsiasi livello di
significatività  maggiore del 5 %+ con >0 anche se non quantificabile in maniera precisa. In questo caso
con  = 5 % non si è potuto rifiutare H0.
4e) La deviazione standard campionaria su un campione di 900 negozi è ancora sC=0.166 k€, come per il
punto 4a). La deviazione standard del valor medio, ancora con C  2.5 k € come per il punto 4a), è ora
sC  sC / n  0.166 k € / 30  0.00553 k €  5,53 € . Ripetendo il test t, per  = 899   = inf. gradi di libertà,
si ha ora t0 
C 
0.1

 18.1  t ,inf .  1.645 e quindi rifiutiamo l’ipotesi nulla concludendo che
sC
0.005533
il prezzo di vendita dei negozianti è effettivamente superiore (sempre con significatività del 5 %) a quello
dichiarato dalla casa madre produttrice.
_______
Pag. 7/8
(25 min)
Esercizio 5
(svolgere su questo foglio e sul retro)
5a) Sapendo che la potenza consumata da un PC segue una distribuzione normale, con valor medio pari a
270 W e varianza di 64 W2, si calcoli la probabilità che un PC consumi meno di 250 W.
5b) Il Politecnico di Milano decide di attrezzare una nuova aula informatizzata con 50 PC. Il vincitore della
gara d’appalto garantisce una probabilità del 90 % che un PC sia correttamente funzionante all’acquisto.
Quanto vale la probabilità che ci siano meno di 3 PC guasti nell’ordine totale?
5c) Il gestore dell’aula viene mediamente chiamato 2 volte al giorno per piccoli interventi di riparazione o
ripristino delle configurazioni di un PC. Quanto vale la probabilità che in 5 giorni venga chiamato
esattamente 8 volte? Si descriva la distribuzione statistica utilizzata motivandone l’utilizzo.
5a)
Per calcolare la probabilità standardizziamo la variabile casuale gaussiana, e ricorriamo quindi alla
tabella dei valori della distribuzione cumulativa (z) per una variabile normale standard (VNS). Ricordiamo
x
che z 
è la VNS ricavata da x.

250   
250  270 


P( x  250)  P z 
  P z 
  P( z  2.5)   (2.5)  0.00621  0.6 %
 
8



5b) Dato che ogni prova è un processo di Bernoulli (un PC o è guasto oppure non lo è, ovvero successo o
insuccesso), le prove sono indipendenti e la probabilità di successo in ogni prova è costante, la probabilità di
x PC guasti su n segue la distribuzione binomiale, con probabilità di successo p =0.1:
 n
 50 
2
P(2 successi su 50 prove )    p x (1  p) n x   0.1 (0.9) 502  0.078  7.8 %
 x
2
n
 50  50! 50  49
n!
avendo ricordato che   
e dunque   
=1225

2 1
 x  x!(n  x)!
 2  48!2!
Viene richiesta la probabilità di trovare meno di 3 PC guasti, quindi:
P( x  3)  P( x  2)  P( x  1)  P( x  0)  0.078  0.029  0.005  11.2%
avendo calcolato le probabilità P(x=0) e P(x=1) come descritto in precedenza, per P(x=2).
5c) In prima approssimazione possiamo utilizzare una statistica poissoniana, in quanto i malfunzionamenti
possibili in un’aula di 50 PC sono molti, ciascuno con una probabilità di avvenimento abbastanza bassa.
Inoltre i singoli malfunzionamenti si possono considerare scorrelati (a meno di casi particolari).
e   x
,
x  0,1,2...
La funzione di probabilità di una variabile poissoniana X vale f ( x) 
x!
con valor medio  =  e varianza 2 = .
Nel caso considerato, il valor medio vale  = 2 chiamate/giorno  5 giorni = 10 chiamate.
la probabilità di ricevere esattamente 8 chiamate in 5 giorni vale:
e    x e 10108
P( x  8) 

 11.26 %
x!
8!
_______
Pag. 8/8