s_080221

annuncio pubblicitario
STATISTICA E MISURAZIONE
giovedì 21 gennaio 2008
Prof. Cesare Svelto
Tempo a disposizione 2 ore
Secondo appello AA 2007/2008
Aula V.S.8 ore 13.00
Cognome: __________________________
Nome: _____________________
(stampatello)
Matricola: __ __ __ __ __ __
Firma: _____________________ (firma leggibile)
Esercizi svolti (almeno parzialmente): 1 2 3 4 5 (7+7+7+8+4=33pt)
(crocettare)
N.B. Gli esercizi non crocettati non saranno corretti; quelli crocettati ma neppure iniziati comporteranno una
penalità. Sarà anche penalizzato chi consegna un compito “gravemente insufficiente”.
SOLUZIONI
Esercizio 1 (tempo stimato 25 m)
(svolgere su questo foglio e sul retro)
1)
1a)
1b)
1c)
1d)
Siamo interessati a controllare la velocità di download da un sito web. Misuriamo i bit trasmessi al
secondo in 10 intervalli di tempo abbastanza lontani da poterli considerare non correlati:
X [kbit/s]: 97.0 100.0 101.1 89.3 94.9 105.6 100.5 96.3 93.6 103.0
Si calcoli il 40-esimo percentile dei dati.
Si costruisca un diagramma rami e foglie dai dati misurati.
Si riportino i dati nel grafico di probabilità normale. Che conclusioni possiamo trarre da questo grafico?
Si rappresenti il box-plot dei dati.
Normal Probability Plot
0.95
0.90
Probabilità
0.75
0.50
0.25
0.10
0.05
90
92
94
96
98
Dati
100
102
104
106
2a)
I 10 dati ordinati sono X [kbit/s]: 89.3 93.6 94.9 96.3 97.0 100.0 100.5 101.1 103.0 105.6
La formula generale per ricavare l’indice di un generico k-esimo percentile è: Ik = (n+1)k /100.
Dall’indice si ricava quindi il valore esatto con un’interpolazione lineare tra i due dati (con indici
corrispondenti all’intero prima e dopo di Ik ), per cui I40p = (10+1)40 /100 = 4.4. Quindi il 40-esimo
percentile è compreso tra il quarto e il quinto dato, per interpolazione otteniamo:
40-esimo percentile = 96.3+(97-96.3)0.4 = 96.58 kbit/s
2b)
Diagramma rami e foglie: con n = 10 si possono scegliere 3 rami
Rami
Foglie
8
9.3
9
4.9
7.0
6.3
3.6
10
0.0
5.6
0.5
1.1
3.0
Pag.1/8
Si noti che il diagramma rami e foglie non è particolarmente efficace in questo caso, in quanto la
distribuzione sembrerebbe particolarmente asimmetrica, mentre non lo è in realtà. Un’appropriata scelta delle
classi per un istogramma ne mostrerebbe la simmetria (che verrà confermata dal grafico di probabilità).
2c) Si riportano in tabella i valori dei dati ordinati e la corrispondente frequenza cumulativa osservata
Normal Probability Plot
x(j) F(j)=(j-0.5)/n
89.3
0.05
93.6
0.15
94.9
0.25
96.3
0.35
97
0.45
100
0.55
100.5
0.65
101.1
0.75
103
0.85
105.6
0.95
0.95
0.90
0.75
Probability
j
1
2
3
4
5
6
7
8
9
10
0.50
0.25
Dal grafico di probabilità
normale, che ha una andamento
abbastanza lineare, possiamo
stimare che i dati seguano una
distribuzione gaussiana.
Comunque 10 dati sono troppo
pochi per uno studio esaustivo del
tipo di distribuzione statistica.
0.10
0.05
90
92
94
96
98
Data
100
102
104
106
Frequenza assoluta
2d) Per disegnare il box-plot dei dati dobbiamo innanzitutto calcolare la mediana e il primo e terzo quartile.
I 10 dati ordinati sono X [kbit/s]: 89.3 93.6 94.9 96.3 97.0 100.0 100.5 101.1 103.0 105.6
La mediana è il 50-esimo percentile, per cui Imediana = (10+1)50 /100 = 5.5, quindi la mediana è data dalla
media tra il quinto ed il sesto dato. Mediana= (97+100)/2 = 98.5 kbit/s
Il primo quartile è il 25-esimo percentile, per cui I1Q = (10+1)25 /100 = 2.75, quindi il primo quartile è
compreso tra il secondo e il terzo dato. Per interpolazione otteniamo:
4
primo quartile= 93.6+(94.9-93.6)0.75
= 94.575 kbit/s = Q1
Il terzo quartile è il 75-esimo percentile, per cui I3Q = (10+1)75 /100 = 8.25, quindi il terzo quartile è
3
compreso tra l’ottavo e il nono dato. Per interpolazione otteniamo:
terzo quartile= 101.1+(103-101.1)0.25
= 101.575 kbit/s = Q3
2
La dinamica interquartile vale DIQ= Q3-Q1= 7 kbit/s
I baffi si possono estendere
fino a 1.5DIQ = 10.5 kbit/s, quindi fino a 94.575-10.5= 84.075 kbit/s e
1
101.575 +10.5= 112.075 kbit/s. Minimo dato=89.3 kbit/s. Massimo dato=105.6 kbit/s
0
Sia nella parte inferiore
che in quella
superiore95tutti i dati sono
compresi105
nei baffi, che
dunque terminano
85
90
100
110
all’ultimo dato compreso nell’insieme dei dati ordinati (estremi del range).
1
88
90
92
94
96
98
Valori di x
100
102
104
106
108
Pag.2/8
Esercizio 2 (tempo stimato 25 m)
(svolgere su questo foglio e sul retro)
2)
2a)
2b)
2c)
2d)
Si consideri un flusso di trasmissione dati tra due PC con bit error rate costante, pari a 10-8, in cui i
singoli errori si possono considerare completamente scorrelati (non si presentano burst di errori).
Che tipo di distribuzione può descrivere la variabile casuale “numero di errori su n bit”? Spiegare i
motivi della propria scelta.
Quanto vale la probabilità che su 108 bit trasmessi ci sia al massimo 1 errore?
Il sistema di trasmissione funziona a “pacchetti” di 108 bit. Un pacchetto è considerato “corretto” se
contiene al massimo 1 bit errato. Quanto vale la probabilità che su 10 pacchetti esattamente 8 siano
“corretti”?
Un tipo di bullone pesa mediamente 20 g, con varianza 1 g2. Quanto vale la probabilità che una
confezione da 100 bulloni pesi più di 2010 g?
2a)
La variabile casuale “numero di errori” segue una distribuzione poissoniana. Infatti in questo caso si
parte da un processo di Bernoulli (un bit può essere solo giusto o sbagliato), con una probabilità di
“successo” (bit errato) molto bassa ed un numero molto alto di estrazioni. Inoltre gli errori si possono
considerare scorrelati.
Siamo quindi nelle condizioni in cui si può considerare valido il limite per n→ di una distribuzione
e   x
binomiale: è possibile dimostrare che f ( x) 
,
x  0,1,2... si ottiene matematicamente dalla
x!
distribuzione binomiale quando il numero di estrazioni n è molto alto e la probabilità di successo p è molto
bassa, con  = np.
2b)
Su 108 bit il valor medio di errore vale  = 10-8 errori/bit  108 bit= 1.
La probabilità di avere al massimo 1 errore è pari a
e   0 e   1 e 110 e 111
P(x≤1)= P( x  0)  P( x  1) 



 36.8%+36.8%=73.6 %
0!
1!
0!
1!
2c)
In questo caso utilizziamo una distribuzione binomiale, dato che ogni prova è un processo di
Bernoulli (il pacchetto può essere ricevuto in maniera corretta oppure non corretta), le prove sono
indipendenti e la probabilità di successo in ogni prova è costante p =0.736.
La probabilità che su 10 pacchetti (n=10) esattamente 8 siano corretti (x=8) vale:
n
P(8 pacchetti " corretti" )    p 8 (1  p) n 8  27.0 %
8
2d)
La distribuzione di probabilità del valor medio del peso di 100 bulloni è sicuramente ben
approssimata da una distribuzione normale (teorema del limite centrale). Per cui calcoliamo la probabilità
tramite standardizzazione, considerando che con =100×20 g =2000 g e 2=100×1 g2 da cui =10 g .
2010   
2010  2000 


P(x>2010)= P z 
  P z 
  P( z  1)  P( z  1) 15.9 %

10




Pag.3/8
Esercizio 3 (tempo stimato 25 m)
(svolgere su questo foglio e sul retro)
3) Si desidera verificare la capacità di carica di un modello di batteria per cellulare. I valori misurati per 10
batterie sono:
C = 620, 664, 641, 612, 637, 651, 623, 609, 635, 654 [mAh].
La casa produttrice dichiara una capacità di carica media di 650 mAh. La deviazione standard tipica della
capacità di carica di una batteria è pari al 5 % del suo valor medio.
3a) Si dia una definizione di Potenza di un test statistico.
3b) Si effettui un test statistico, con livello di significatività pari all’1 %, con lo scopo di verificare se la
carica della batteria è inferiore a quella dichiarata dalla casa produttrice. Si utilizzi la varianza tipica.
3c) Quanto vale il valore P del test effettuato?
3d) Decidiamo di non fidarci della varianza dichiarata dalla casa produttrice ed effettuiamo quindi un nuovo
test, basandoci sempre sui dati/valori disponibili. Possiamo in questo caso giudicare non attendibile la
capacità di carica dichiarata dalla casa, sempre con livello significatività pari all’1 %?
3a) La potenza di un test statistico è la probabilità di rifiutare l’ipotesi nulla quando questa è falsa. È
uguale a 1- la probabilità  di errore di tipo II:
Potenza = 1 -  = 1 - P(errore di tipo II) = 1 - P(accettare H0 quando H0 è falsa)
La potenza è un parametro che ci descrive la capacità del test di rivelare le differenze della realtà rispetto
all’ipotesi H0.
3b) Calcoliamo il valore medio delle 10 misure effettuate (media campionaria):
 1 n
X   X i  634.6 mAh
n i 1
Effettuiamo quindi il test statistico richiesto (test Z, in quanto vogliamo verificare il valor medio di una
popolazione a varianza nota,  = 5%×650 mAh= 32.5 mAh). Seguiamo gli 8 passi descritti nel libro di testo.
1. Il parametro di interesse è il la capacità di carica media 
2. H0:  = 650 mAh
3. H1:  < 650 mAh (il test è a un lato solo, in quanto vogliamo dimostrare che la batteria ha una carica
inferiore a quella dichiarata)
4. livello di significatività richiesto  = 0.01 (attenzione, su un solo lato)
5. La statistica di test è la statistica Z: z0 
X 
X

X 
/ n
6. Rifiutiamo H0 se Z < Z = -2.326. (questo risultato si ricava dalla tabella della funzione cumulativa in
corrispondenza di un valore di probabilità )
7. Calcoliamo quindi z0, z 0 
X 
X

X 
/ n

634.6  650
32.5 / 10
 1.50
8. Conclusione: dato che z0=-1.50 > -2.326 non possiamo rifiutare l’ipotesi nulla con livello di
significatività 0.01: non c’è abbastanza evidenza che l’ipotesi nulla sia falsa.
La carica della batteria dichiarata dalla casa produttrice, secondo questo test, deve dunque essere ritenuta
attendibile.
3c)
Il valore P, che corrisponde al livello di significatività di soglia tra l’accettazione ed il rifiuto di H0, si può
ricavare direttamente dalla tabella dei valori della funzione cumulativa:
ZP = z0 = -1.50, per cui il valore P = (z0)=6.7 %.
Pag.4/8
L’interpretazione di questo valore è che l’ipotesi nulla sarebbe stata dichiarata falsa per qualsiasi livello di
significatività  maggiore del 6.7 %. In questo caso con  = 1 % non si è potuto rifiutare H0.
3d)
Ripetiamo ora il test, non fidandoci della varianza media. Dovremo utilizzare la varianza dei dati disponibili
nel campione selezionato. Il numero di gradi di libertà è  = n – 1 = 9. Calcoliamo la deviazione standard
campionaria.
s(X)=
1 n
X k  X 2 =18.5 mAh

n  1 k 1
Effettuiamo quindi un test t (verifica del valor medio con varianza non nota).
1. Il parametro di interesse è il la capacità di carica media 
2. H0:  = 650 mAh
3. H1:  < 650 mAh (il test è a un lato solo, in quanto vogliamo dimostrare che la batteria ha una carica
inferiore a quella dichiarata)
4. livello di significatività richiesto  = 0.01 (attenzione, su un solo lato)
5. La statistica di test è ora la statistica t: t 0 
X  X 

sX
s/ n
6. Rifiutiamo H0 se t0 < -t,9 = -2.821. (questo risultato si ricava dalla tabella dei punti percentuale della
distribuzione t, con  = 9)
7. Calcoliamo quindi t0, t 0 
X   X   634.6  650


 2.63
sX
s/ n
18.5 / 10
8. Conclusione: dato che t0 =-2.63 > -2.821 non possiamo ancora rifiutare l’ipotesi nulla con livello di
significatività 0.01. (in questo caso la soglia di rifiuto è molto vicina e magari con qualche campione
in più si riuscirebbe a realizzare un test che smentisca l’ipotesi nulla, anche con  = 0.01).
Pag.5/8
Esercizio 4 (tempo stimato 30 m)
(svolgere su questo foglio e sul retro)
4) Un recipiente cilindrico con base circolare di raggio r e altezza h contiene azoto (N2) alla pressione
p=5 kPa, nota con incertezza trascurabile.
4a) La misurazione dell’altezza del recipiente è stata ripetuta più volte, fornendo i seguenti risultati:
h=[32.00, 32.20, 29.99, 31.31, 33.00, 32.00, 30.00] cm (7 misure ripetute)
Si ricavi la misura hu(h)
4b) La temperatura del sistema risulta  =127 °C con U()=10 °C per k=2.5. Il raggio interno del recipiente è
stato stimato r =30 cm, con arrotondamento a 1 cm. La costante molare dei gas vale R=8.31 Jmol-1K-1
con incertezza relativa all’1.7 %.
Si ricavi la misura del numero di moli di gas n presenti nel recipiente, supponendo applicabile
l’equazione dei gas perfetti pV=nRT. Se ne esprima l’incertezza in notazione concisa.
4a) Dalle n=7 misure ripetute, si ricava un valor medio
h= h 
1 n
 hi =31.50 cm
n i 1
e una incertezza di categoria A
u(h)=uA(h)=
n
1
 hi  h
nn  1 i 1

2
=0.43 cm
La misura è h=31.50 0.43 cm.
4b) Dalla legge dei gas perfetti, pV=nRT, si ricava il numero di moli n= pV/(RT), dove il volume del cilindro
vale V=h×r2. Secondo questa misurazione indiretta, il numero di moli è dunque espresso da n 
phr 2
.
RT
Per ottenere il valore di n, sostituiamo nella sua espressione i valori dati :
R=8.31 J mol-1K-1
T=(127+273.15) K(127+273) K=400 K
3
p=5 kPa=5×10 Pa r=30.0 cm=0.3 m
h=31.50 cm
phr 2
0.134 mol
RT
Dato che l’equazione della misura è una produttoria delle grandezze d’ingresso, l’incertezza relativa
dell’uscita è semplicemente legata alle incertezze relative degli ingressi dall’espressione
n=
ur(n)= u r2  p   u r2 h   4u r2 r   u r2 R   u r2 T   u r2 h   4u r2 r   u r2 R   u r2 T 
ur(p)0 (incertezza “trascurabile”, come dichiarato nel testo)
Calcoliamo le incertezze relative dei singoli ingressi:
ur(R)=1.7 %
ur(T)=u(T)/T=[U(T)/k]/T=[4 K]/(400 K)=1 %
La misura del raggio è stata arrotondata, per cui è affetta da una incertezza di quantizzazione
u(r)=r/ 12 2.9 mm e quindi l’incertezza relativa sul raggio risulta
ur(r)=u(r)/r=[2.9×10-3/3×10-1] = 0.97 %.
ur(h)= u(h)/h=0.43 cm/31.5 cm  1.4%
Da queste si ottiene l’incertezza relativa su n:
Pag.6/8
ur(n)= u r2 h   4u r2 r   u r2 R   u r2 T  
 1.96  4  0.94  2.89  1%  3.1 %
e quindi una incertezza assoluta
u(n)=ur(n)×n=4.2×10-3 mol
La misura indiretta di n espressa in notazione concisa è infine n=0.134(42) mol.
Pag.7/8
Esercizio 5 (tempo stimato 15 m)
(svolgere su questo foglio e sul retro)
5a)
5b)
5c)
Ripetibilità, riproducibilità, stabilità: si forniscano le definizioni di queste 3 caratteristiche di una
misura.
Si facciano 3 esempi specifici, anche con dei valori numerici, che illustrano i 3 concetti del punto 5a).
Dopo avere indicato l’espressione analitica da utilizzare e dopo averne brevemente spiegato il suo
significato e utilità, si trasformino in dBm i seguenti valori di potenza elettrica: P1=16 W; P2=125 nW;
P3=20 W.
5a) Vedi Libro e Appunti del Corso.
5b) Vedi Libro e Appunti del Corso.
5c) P(dBm)=10log10[(P(W)/(1 mW)] I tre valori specifici sono dunque P1=16 W=4×4×(1 W)=+42 dBm;
P2=125 nW=(1 µW)/8=-39 dBm; P3=20 W=2×10×(1 µW)=-17 dBm.
Pag.8/8
Scarica