s_040203

annuncio pubblicitario
STATISTICA E MISURAZIONE
martedì 3 febbraio 2004
Prof. Cesare Svelto
Tempo a disposizione 2 ore e 30 minuti
Seconda prova in itinere AA 2003/2004
Aula Vs.8 ore 9.15
Cognome e nome: ___________________________________ _____________________
Matricola e firma __ __ __ __ __ __
(stampatello)
_____________________(firma leggibile)
Esercizi svolti (almeno parzialmente): 1 2 3 4 5 (7+8+7+(7+3)+3=32p+3)
(crocettare)
N.B. gli esercizi non crocettati non saranno corretti; quelli crocettati ma neanche iniziati comporteranno una
penalità.
Esercizio 1
(svolgere su questo foglio e sul retro)
1a) Si dia una definizione delle seguenti probabilità, riguardanti un test statistico:
 Livello di significatività
 Potenza
 Valore P
1b) Supponiamo di dover verificare se la velocità media di una particolare connessione ISDN è pari a
115 kB/s. Decidiamo una regione di accettazione [110;120] kB/s. Effettuiamo quindi 100 misure che ci
forniscono un valor medio di 118 kB/s con una deviazione standard campionaria pari a 20 kB/s (che si può
considerare la deviazione standard del processo, dato l’elevato numero di campioni).
Calcolare il livello di significatività del test.
Mostrare questa situazione attraverso il grafico della PDF della media campionaria.
1c) Se il valor medio reale della velocità di trasmissione fosse 124 kB/s, quanto varrebbe la probabilità  di
errore di tipo II?
Si mostri anche graficamente il significato di .
1a) Il livello di significatività di un test statistico è la probabilità di rifiutare l’ipotesi nulla, quando questa è
vera. Si denota tipicamente con la lettera greca , e corrisponde alla probabilità di commettere un errore di
tipo I:
Livello di significatività  = P(errore di tipo I) = P(rifiutare H0 quando H0 è vera)
La potenza di un test statistico è la probabilità di rifiutare l’ipotesi nulla quando questa è falsa. È uguale a 1la probabilità  di errore di tipo II:
Potenza = 1 -  = 1 - P(errore di tipo II) = 1 - P(accettare H0 quando H0 è falsa)
La potenza è un parametro che ci descrive la capacità del test di rivelare le differenze della realtà rispetto ad
H0.
Il valore P di un test statistico è il più piccolo livello di significatività  che porterebbe a rifiutare l’ipotesi
nulla H0.
1b) Il livello di significatività del test si ottiene calcolando la probabilità che la media campionaria esca dalla
regione di accettazione, supponendo vera l’ipotesi nulla, che in questo caso è H 0 :   115 kB/s .
_______
Pag. 1/10
Esercizio 1 (continua)
La deviazione standard della media campionaria vale  X 
X
n

20
 2 kB/s (avendo considerato X = sX
100
dato l’elevato numero di dati).
Per calcolare la probabilità standardizziamo la variabile casuale v (media dei campioni, gaussiana per il
teorema del limite centrale) e ricorriamo quindi alla tabella dei valori della distribuzione cumulativa normale
standard. Si ottiene


110   
120   
  P z 

  Pv  110 o v  120 con   115  P z 





X
X




110  115 
120  115 


 P z 
  P z 
  Pz  2.5  Pz  2.5  0.00621  0.00621  0.0124
2
2




Il livello di significatività del test è pari dunque all’ 1.24%.
Riportiamo in figura il significato grafico di : è l’area scura sotto le due code (di sinistra e di destra) della
gaussiana corrispondente alla PDF della media campionaria.
/2
/2
1c) La probabilità  di errore di tipo II (di accettare H0 quando è falsa) è la probabilità che la media
campionaria cada all’interno della regione di accettazione, quando il valor medio della popolazione ha un
valore diverso da quello dell’ipotesi nulla. In questo caso  = 124 kB/s e la deviazione standard del valor

20
medio non è cambiata,  X  X 
 2 kB/s, per cui possiamo calcolare  per standardizzazione:
n
100


120   
110   
120  124 
110  124 

  P z 
  P z 
  P z 




X  
X 
2
2





 Pz  2  Pz  7   0.02275 - 0  2.3 %
  P110  v  120 con   124  P z 
Riportiamo in figura il significato grafico di  per l’esercizio considerato: è l’area sottesa dalla gaussiana
(PDF della media campionaria) che cade entro la regione di accettazione, quando il valor medio della
popolazione è diverso dall’ipotesi nulla (in questo caso  = 124 kB/s).
_______
Pag. 2/10
Esercizio 1 (continua)

_______
Pag. 3/10
Esercizio 2
(svolgere su questo foglio e sul retro)
2) Da una ditta di assemblaggio di PC ci viene chiesto di controllare la potenza media dissipata da un nuovo
processore, che causa a volte problemi di sovraccarico dell’alimentatore (pur se dimensionato correttamente
secondo le specifiche). Lo scopo dell’analisi è di fare eventualmente causa alla casa produttrice del
processore per i danni arrecati alla ditta dalle troppo numerose riparazioni in garanzia. La casa produttrice
fornisce i seguenti dati: potenza media 235 W, con deviazione standard pari a 50 W. Misuriamo quindi le
potenze assorbite da 10 diversi processori, ottenendo i seguenti valori:
Pass = 329, 265, 274, 243, 227, 260, 334, 252, 271, 244 W
2a) Si vuole controllare l’ipotesi della casa madre, decidere quindi se è possibile intentare un’azione
giuridica, con livello di significatività pari all’ 1 % (si consideri attendibile la deviazione standard fornita dal
produttore).
2b) Quanto vale il valore P del test effettuato?
2c) Visto il clima di sfiducia nei confronti della casa produttrice, vi viene chiesto di ripetere il test non
utilizzando la deviazione standard fornita dal costruttore. È possibile con questo test smentire la casa madre
con livello di significatività pari all’1 %?
2a) Calcoliamo il valore medio delle 10 misure effettuate (media campionaria):
1 n
X   Pass,i =269.9 W
n i 1
Effettuiamo quindi il test statistico richiesto (test Z, in quanto vogliamo verificare il valor medio di una
popolazione a varianza nota). Seguiamo gli 8 passi descritti nel libro di testo.
1. Il parametro di interesse è la potenza media dissipata 
2. H0:  = 235 W
3. H1:  > 235 W (il test è ad un lato solo, in quanto vogliamo dimostrare che il processore consuma più
di quanto dichiarato)
4. livello di significatività richiesto  = 0.01 (attenzione, su un solo lato)
5. La statistica di test è la statistica Z: z0 
X 
X

X 
/ n
6. Rifiutiamo H0 se Z > Z = 2.326. (questo risultato si ricava dalla tabella della funzione cumulativa in
corrispondenza di un valore di probabilità )
7. Calcoliamo quindi z0, z 0 
X 
X

X 
/ n

269.9  235
50 / 10
 2.207
8. Conclusione: dato che z0=2.207 < 2.326 non possiamo rifiutare l’ipotesi nulla con livello di
significatività 0.01: non c’è abbastanza evidenza che l’ipotesi nulla sia falsa.
Riportiamo nelle figure seguenti i grafici delle densità di probabilità, sia della variabile reale sia della
variabile standardizzata. Teniamo presente che il valore di potenza che corrisponde a Z = 2.326 è
Pass, = 271.77 W, che è la nostra soglia di rifiuto.
_______
Pag. 4/10
Esercizio 2 (continua)
X  269.9 W
Pass, = 271.77 W
regione di rifiuto
z0 = 2.207
Z = 2.326
2b)
Il valore P, che corrisponde al livello di significatività di soglia tra l’accettazione ed il rifiuto di H0, si può
ricavare direttamente dalla tabella dei valori della funzione cumulativa:
ZP = z0 = 2.207, per cui il valore P =0.0136.
L’interpretazione di questo valore è che l’ipotesi nulla sarebbe stata dichiarata falsa per qualsiasi livello di
significatività  maggiore dell’ 1.36 %. In questo caso con  = 1 % non si è potuto rifiutare H0.
2c)
Ripetiamo ora il test, non fidandoci della varianza dichiarata dalla casa costruttrice. Il numero di gradi di
libertà  = n – 1 = 9. Calcoliamo la deviazione standard campionaria.
s X  
1 n
X k  X 2  35.43 W

n  1 k 1
Effettuiamo quindi un test t.
1. Il parametro di interesse è la potenza media dissipata 
2. H0:  = 235 W
3. H1:  > 235 W (il test è ad un lato solo, in quanto vogliamo dimostrare che il processore consuma più
di quanto dichiarato)
4. livello di significatività richiesto  = 0.01
5. La statistica di test è ora la statistica t: t 0 
X  X 

sX
s/ n
6. Rifiutiamo H0 se t0 > t,9 = 2.821. (questo risultato si ricava dalla tabella dei punti percentuale della
distribuzione t, con  = 9)
7. Calcoliamo quindi t0, t 0 
X   X   269.9  235


 3.115
sX
s / n 35.43 / 10
8. Conclusione: dato che t0 =3.115 >2.821 rifiutiamo l’ipotesi nulla con livello di significatività 0.01: c’è
abbastanza evidenza che l’ipotesi nulla sia falsa (si cade ora nella regione di rifiuto).
_______
Pag. 5/10
Esercizio 2 (continua)
Commento: la distribuzione t è più larga della gaussiana, per cui a parità di  la regione di accettazione è più
estesa. Però in questo caso la deviazione standard campionaria (dai nostri dati sperimentali) si è dimostrata
nettamente inferiore alla deviazione standard fornita dalla casa produttrice, stringendo quindi notevolmente la
curva di probabilità.
Per esemplificare graficamente riportiamo in figura le due distribuzioni: la gaussiana del primo test e la
distribuzione t del secondo.
t,9
t 0  z0
z
In figura sono stati riportati i valori di soglia sulla scala della potenza, applicando la formula inversa della
standardizzazione. Si nota che il valore del test, 269.9 W, che corrisponde a t0 e a z0 nelle due
normalizzazioni, è maggiore della soglia del test t, mentre è minore della soglia del test Z.
_______
Pag. 6/10
Esercizio 3
(svolgere su questo foglio e sul retro)
3a) Quali e quante sono le unità di misura fondamentali (o di base) del Sistema Internazionale?
3b) Si indichi il livello di accuratezza (almeno l’ordine di grandezza) con cui oggi si sanno realizzare queste
unità.
3c) Perché a volte può essere utile impiegare unità di misura logaritmiche?
3a)
Vedi libro e appunti del corso.
3b)
Vedi libro e appunti del corso.
3c)
Vedi libro e appunti del corso.
_______
Pag. 7/10
Esercizio 4
(svolgere su questo foglio e sul retro)
4) Un processore a 2.5 GHz (valore noto con incertezza trascurabile) elabora i dati di un segnale periodico
campionato. Su ciascun dato campionato e acquisito (in un intervallo di tempo trascurabile) si esegue una
operazione di elaborazione (condizionamento) di durata Telab = 8 Tc con incertezza u(Telab) = 1 Tc (Tc è il
periodo di clock del processore).
Per ciascun periodo del segnale misurato, si vuole determinare il valore medio della forma d’onda
acquisita su N punti (numero fissato) e salvare tale valore sul disco fisso (HD) del computer. L’operazione di
media, per evitare problemi di overflow, è eseguita ad ogni campione acquisito secondo la formula
x i 1 
i x i  dato i
i 1
e dunque per i=0, 1, …, N-1.
Si ipotizza che tanto una moltiplicazione quanto una somma richiedano (sempre!) 4 periodi di clock, che
una divisione richieda 121 Tc e che il tempo di scrittura su HD segua una distribuzione di probabilità
triangolare compresa tra 1 s e 2 s.
4a) Si ricavi il valore atteso del tempo di misura (Tmis, che termina con l’avvenuta scrittura su HD) di una
singola media per una forma d’onda sinusoidale (valore efficace 2.3 V, offset 0.1 V, e periodo 20 ms)
sovracampionata esattamente di un fattore 10 000 rispetto al limite di Nyquist (fs,Nyquist=2fw con i pedici
s=sampling e w=waveform).
4b) Quanto vale l’incertezza standard u(Tmis) del tempo di misura?
4c) OPZIONALE - Come varierebbe l’incertezza u(Tmis) se la frequenza di lavoro del processore avesse una
incertezza estesa di 410-6 con fattore di copertura k=2? Si stimi il nuovo valore di u(Tmis).
4a)
Per frequenza e periodo di clock del processore valgono le relazioni: fc=2.5 GHz e Tc=1/fc=0.4 ns.
L’onda campionata, di fatto 1/100 della tensione di rete europea più un certo offset (i valori di ampiezza
comunque non sono rilevanti per la soluzione di questo problema), ha una frequenza fw=1/(20 ms)=50 Hz. Il
campionamento avviene a frequenza fs=104fs,Nyquist=1042fw=104100 Hz=106 Hz=1 MHz con la generazione
di un dato ogni Ts=1/fs=1 s. Pertanto, in un periodo Tw=20 ms dell’onda vengono prelevati
N=Tw/Ts=20 000 campioni.
L’operazione di elaborazione (condizionamento) del dato acquisito ha durata Telab=81 Tc=3.20.4 ns mentre
ciascun calcolo della media (parziale) dura Tmedia=(Tmoltiplicazione+Tsomma)+Tdivisione=(4Tc+4Tc)+12Tc=20Tc=8 ns.
Essendo la somma di questi due tempi inferiore al periodo di campionamento Ts=1 s, il tempo di misura
cercato è dunque (valore atteso):
Tmis=T(per acquisire N-1 campioni)+ T(tempo per acquisire, elaborare, e mediare l’ultimo campione)+ T(tempo di scrittura su HD del risultato finale)
Tmis=(N-1)Ts+(Ts+Telab+Tmedia)+Tscrittura=NTs+Telab+Tmedia+Tscrittura
L’ultimo tempo non è ancora stato calcolato: dalla distribuzione triangolare, Tscrittura=(2 s+1 s)/2=1.5 s.
Dunque, il valore atteso del tempo di misura è Tm=20 0001 µs+3.2 ns+8 ns+1.5 s=20 001.5112 s20 ms.
Il tempo per le altre N-1 elaborazioni e medie non è stato contato, in quanto avvengono in parallelo al
campionamento: il processore le effettua mentre aspetta il prossimo dato.
_______
Pag. 8/10
Esercizio 4 (continua)
4b)
L’incertezza su Tmedia, essendo per ipotesi nulle le incertezze di Tmoltiplicazione e Tsomma (tempi “sempre” uguali a
4Tc) è pari alla incertezza su Tdivisione e pertanto u(Tmedia)=u(Tdivisione)=2Tc/ 12 =0.23 ns (distribuzione
uniforme con piena larghezza 2Tc). Dalle 2 cifre significative su questa incertezza, si può (e si dovrebbe)
anche riscrivere Tmedia=8.00 ns.
Per essere più precisi, la distribuzione dei valori non è uniforme, ma è quantizzata. Il calcolo dell’incertezza
andrebbe quindi effettuato a partire dalla definizione di deviazione standard per una distribuzione di 3 valori

2
1 n
=0.32 ns. Però in questo caso l’assunzione di
( xi   ) 2  Tc

3
n i 1
probabilità uniforme per i tre valori è forse poco realistica (il valore centrale sarà sicuramente più ricorrente),
quindi decidiamo di mantenere come stima del valore di incertezza il valore calcolato precedentemente.
Sempre dalla distribuzione triangolare, si ricava che u(Tscrittura)=(2 s-1 s)/ 24 =0.20 s (incertezza con 2
cifre significative e, coerentemente, Tscrittura=1.50 s).
A questo punto, l’incertezza sul tempo di misura si ricava da
u2(Tmis)=N2u2(Ts)+ u2(Telab)+ u2(Tmedia)+ u2(Tscrittura)=0+(0.4 ns)2+(0.23 ns)2+(0.20 s(0.20 s
per cui u(Tmis)0.20 s, sostanzialmente limitata dalla incertezza del tempo di scrittura su HD. Il periodo di
campionamento è considerato esente da incertezza perchè deriva direttamente dal clock del computer (dato
per ipotesi con incertezza trascurabile).
discreti equiprobabili: u(Tdivisione)=  
4c)
In questo caso il processore ha una frequenza nota con incertezza estesa (il valore fornito è certamente una
incertezza relativa) U(fc)=410-6fc=410-62.5109 Hz=10 kHz che, divisa per il fattore di copertura k=2,
porta a una incertezza standard u(fc)=U(fc)/k=5 kHz con ur(fc)=u(fc)/fc=210-6. In termini del periodo di clock,
essendo Tc=1/fc, si ricava immediatamente che ur(Tc)=ur(fc)=210-6 e quindi l’incertezza standard sul periodo
di clock è u(Tc)=Ur(Tc)Tc=210-60.4 ns=0.8 fs=0.810-15 s=800 as.
Questa incertezza non nulla comporta un incremento nelle incertezze dei tempi Telab, Tmedia, e Tscrittura, che
sono tutti dipendenti da Tc. Tuttavia, data la modestissima entità di u(Tc) rispetto a Tc stesso (10-6 appunto) e
dato che le incertezze di Telab, Tmedia, e Tscrittura sono frazioni ben più considerevoli di 1 ppm, l’aumento di
incertezza complessiva su Tmis sarà del tutto trascurabile.
Non trascurabile potrebbe invece essere il contributo di incertezza dovuto al tempo di campionamento, che è
proporzionale al periodo di clock del processore e quindi avrà la stessa incertezza relativa
ur(Ts)=ur(Tc)=210-6, per cui:
N2u2(Ts)=(200001 s210-6)2=(0.04 s)2
Pertanto, ora
u2(Tmis)=N2u2(Ts)+ u2(Telab)+ u2(Tmedia)+ u2(Tscrittura)=(0.04 s)2+(0.4 ns)2+(0.23 ns)2+(0.20 s0.0416 s
da cui ancora
u(Tmis) 0.20 s.
_______
Pag. 9/10
Esercizio 5
(svolgere su questo foglio e sul retro)
5) Si consideri la tratta di trasmissione in figura: un generatore di segnale eroga una potenza PG che subisce
un’attenuazione di 17 dB in una linea di trasmissione; un preamplificatore rigenera quindi il segnale con un
guadagno di tensione pari a 10.
5a) Calcolare la potenza di segnale PR al ricevitore, esprimendola sia in W che in dBm, per le seguenti
potenze trasmesse:
PG1= 1 mW; PG2= 5 W; PG3= 200 nW.
PG
Trasmettitore
PR
Linea A = 17 dB
G =10
Ricevitore
5a)
Esprimiamo il guadagno dell’amplificatore in dB (attenzione che il guadagno è di tensione e dunque in
ampiezza e non in potenza).
GdB = 20log10(10)= 20 dB.
Per cui l’intera tratta ha un guadagno complessivo pari a 20 – 17 dB= 3 dB, che in potenza significa un
fattore 2.
Per cui PR = 2PG, quindi
PR1= 2 mW; PR2= 10 W; PR3= 400 nW.
In dBm, ricordando che PdBm = 10log10(P/1mW),
PR1= 3 dBm; PR2= -20 dBm; PR3= -34 dBm.
Le potenze in dBm ricevute si potevano anche calcolare direttamente sommando 3 dB (guadagno della tratta)
alla potenza del trasmettitore, ovviamente dopo averla espressa in dBm (PG1= 0 dBm; PG2= -23 dBm;
PG3= -37 dBm).
Oppure si poteva effettuare l’intero calcolo in lineare: attenuazione di 17 dB = dividere per 50 la potenza;
guadagno 10 in tensione = guadagno 100 in potenza.
_______
Pag. 10/10
Scarica