STATISTICA E MISURAZIONE martedì 3 febbraio 2004 Prof. Cesare Svelto Tempo a disposizione 2 ore e 30 minuti Seconda prova in itinere AA 2003/2004 Aula Vs.8 ore 9.15 Cognome e nome: ___________________________________ _____________________ Matricola e firma __ __ __ __ __ __ (stampatello) _____________________(firma leggibile) Esercizi svolti (almeno parzialmente): 1 2 3 4 5 (7+8+7+(7+3)+3=32p+3) (crocettare) N.B. gli esercizi non crocettati non saranno corretti; quelli crocettati ma neanche iniziati comporteranno una penalità. Esercizio 1 (svolgere su questo foglio e sul retro) 1a) Si dia una definizione delle seguenti probabilità, riguardanti un test statistico: Livello di significatività Potenza Valore P 1b) Supponiamo di dover verificare se la velocità media di una particolare connessione ISDN è pari a 115 kB/s. Decidiamo una regione di accettazione [110;120] kB/s. Effettuiamo quindi 100 misure che ci forniscono un valor medio di 118 kB/s con una deviazione standard campionaria pari a 20 kB/s (che si può considerare la deviazione standard del processo, dato l’elevato numero di campioni). Calcolare il livello di significatività del test. Mostrare questa situazione attraverso il grafico della PDF della media campionaria. 1c) Se il valor medio reale della velocità di trasmissione fosse 124 kB/s, quanto varrebbe la probabilità di errore di tipo II? Si mostri anche graficamente il significato di . 1a) Il livello di significatività di un test statistico è la probabilità di rifiutare l’ipotesi nulla, quando questa è vera. Si denota tipicamente con la lettera greca , e corrisponde alla probabilità di commettere un errore di tipo I: Livello di significatività = P(errore di tipo I) = P(rifiutare H0 quando H0 è vera) La potenza di un test statistico è la probabilità di rifiutare l’ipotesi nulla quando questa è falsa. È uguale a 1la probabilità di errore di tipo II: Potenza = 1 - = 1 - P(errore di tipo II) = 1 - P(accettare H0 quando H0 è falsa) La potenza è un parametro che ci descrive la capacità del test di rivelare le differenze della realtà rispetto ad H0. Il valore P di un test statistico è il più piccolo livello di significatività che porterebbe a rifiutare l’ipotesi nulla H0. 1b) Il livello di significatività del test si ottiene calcolando la probabilità che la media campionaria esca dalla regione di accettazione, supponendo vera l’ipotesi nulla, che in questo caso è H 0 : 115 kB/s . _______ Pag. 1/10 Esercizio 1 (continua) La deviazione standard della media campionaria vale X X n 20 2 kB/s (avendo considerato X = sX 100 dato l’elevato numero di dati). Per calcolare la probabilità standardizziamo la variabile casuale v (media dei campioni, gaussiana per il teorema del limite centrale) e ricorriamo quindi alla tabella dei valori della distribuzione cumulativa normale standard. Si ottiene 110 120 P z Pv 110 o v 120 con 115 P z X X 110 115 120 115 P z P z Pz 2.5 Pz 2.5 0.00621 0.00621 0.0124 2 2 Il livello di significatività del test è pari dunque all’ 1.24%. Riportiamo in figura il significato grafico di : è l’area scura sotto le due code (di sinistra e di destra) della gaussiana corrispondente alla PDF della media campionaria. /2 /2 1c) La probabilità di errore di tipo II (di accettare H0 quando è falsa) è la probabilità che la media campionaria cada all’interno della regione di accettazione, quando il valor medio della popolazione ha un valore diverso da quello dell’ipotesi nulla. In questo caso = 124 kB/s e la deviazione standard del valor 20 medio non è cambiata, X X 2 kB/s, per cui possiamo calcolare per standardizzazione: n 100 120 110 120 124 110 124 P z P z P z X X 2 2 Pz 2 Pz 7 0.02275 - 0 2.3 % P110 v 120 con 124 P z Riportiamo in figura il significato grafico di per l’esercizio considerato: è l’area sottesa dalla gaussiana (PDF della media campionaria) che cade entro la regione di accettazione, quando il valor medio della popolazione è diverso dall’ipotesi nulla (in questo caso = 124 kB/s). _______ Pag. 2/10 Esercizio 1 (continua) _______ Pag. 3/10 Esercizio 2 (svolgere su questo foglio e sul retro) 2) Da una ditta di assemblaggio di PC ci viene chiesto di controllare la potenza media dissipata da un nuovo processore, che causa a volte problemi di sovraccarico dell’alimentatore (pur se dimensionato correttamente secondo le specifiche). Lo scopo dell’analisi è di fare eventualmente causa alla casa produttrice del processore per i danni arrecati alla ditta dalle troppo numerose riparazioni in garanzia. La casa produttrice fornisce i seguenti dati: potenza media 235 W, con deviazione standard pari a 50 W. Misuriamo quindi le potenze assorbite da 10 diversi processori, ottenendo i seguenti valori: Pass = 329, 265, 274, 243, 227, 260, 334, 252, 271, 244 W 2a) Si vuole controllare l’ipotesi della casa madre, decidere quindi se è possibile intentare un’azione giuridica, con livello di significatività pari all’ 1 % (si consideri attendibile la deviazione standard fornita dal produttore). 2b) Quanto vale il valore P del test effettuato? 2c) Visto il clima di sfiducia nei confronti della casa produttrice, vi viene chiesto di ripetere il test non utilizzando la deviazione standard fornita dal costruttore. È possibile con questo test smentire la casa madre con livello di significatività pari all’1 %? 2a) Calcoliamo il valore medio delle 10 misure effettuate (media campionaria): 1 n X Pass,i =269.9 W n i 1 Effettuiamo quindi il test statistico richiesto (test Z, in quanto vogliamo verificare il valor medio di una popolazione a varianza nota). Seguiamo gli 8 passi descritti nel libro di testo. 1. Il parametro di interesse è la potenza media dissipata 2. H0: = 235 W 3. H1: > 235 W (il test è ad un lato solo, in quanto vogliamo dimostrare che il processore consuma più di quanto dichiarato) 4. livello di significatività richiesto = 0.01 (attenzione, su un solo lato) 5. La statistica di test è la statistica Z: z0 X X X / n 6. Rifiutiamo H0 se Z > Z = 2.326. (questo risultato si ricava dalla tabella della funzione cumulativa in corrispondenza di un valore di probabilità ) 7. Calcoliamo quindi z0, z 0 X X X / n 269.9 235 50 / 10 2.207 8. Conclusione: dato che z0=2.207 < 2.326 non possiamo rifiutare l’ipotesi nulla con livello di significatività 0.01: non c’è abbastanza evidenza che l’ipotesi nulla sia falsa. Riportiamo nelle figure seguenti i grafici delle densità di probabilità, sia della variabile reale sia della variabile standardizzata. Teniamo presente che il valore di potenza che corrisponde a Z = 2.326 è Pass, = 271.77 W, che è la nostra soglia di rifiuto. _______ Pag. 4/10 Esercizio 2 (continua) X 269.9 W Pass, = 271.77 W regione di rifiuto z0 = 2.207 Z = 2.326 2b) Il valore P, che corrisponde al livello di significatività di soglia tra l’accettazione ed il rifiuto di H0, si può ricavare direttamente dalla tabella dei valori della funzione cumulativa: ZP = z0 = 2.207, per cui il valore P =0.0136. L’interpretazione di questo valore è che l’ipotesi nulla sarebbe stata dichiarata falsa per qualsiasi livello di significatività maggiore dell’ 1.36 %. In questo caso con = 1 % non si è potuto rifiutare H0. 2c) Ripetiamo ora il test, non fidandoci della varianza dichiarata dalla casa costruttrice. Il numero di gradi di libertà = n – 1 = 9. Calcoliamo la deviazione standard campionaria. s X 1 n X k X 2 35.43 W n 1 k 1 Effettuiamo quindi un test t. 1. Il parametro di interesse è la potenza media dissipata 2. H0: = 235 W 3. H1: > 235 W (il test è ad un lato solo, in quanto vogliamo dimostrare che il processore consuma più di quanto dichiarato) 4. livello di significatività richiesto = 0.01 5. La statistica di test è ora la statistica t: t 0 X X sX s/ n 6. Rifiutiamo H0 se t0 > t,9 = 2.821. (questo risultato si ricava dalla tabella dei punti percentuale della distribuzione t, con = 9) 7. Calcoliamo quindi t0, t 0 X X 269.9 235 3.115 sX s / n 35.43 / 10 8. Conclusione: dato che t0 =3.115 >2.821 rifiutiamo l’ipotesi nulla con livello di significatività 0.01: c’è abbastanza evidenza che l’ipotesi nulla sia falsa (si cade ora nella regione di rifiuto). _______ Pag. 5/10 Esercizio 2 (continua) Commento: la distribuzione t è più larga della gaussiana, per cui a parità di la regione di accettazione è più estesa. Però in questo caso la deviazione standard campionaria (dai nostri dati sperimentali) si è dimostrata nettamente inferiore alla deviazione standard fornita dalla casa produttrice, stringendo quindi notevolmente la curva di probabilità. Per esemplificare graficamente riportiamo in figura le due distribuzioni: la gaussiana del primo test e la distribuzione t del secondo. t,9 t 0 z0 z In figura sono stati riportati i valori di soglia sulla scala della potenza, applicando la formula inversa della standardizzazione. Si nota che il valore del test, 269.9 W, che corrisponde a t0 e a z0 nelle due normalizzazioni, è maggiore della soglia del test t, mentre è minore della soglia del test Z. _______ Pag. 6/10 Esercizio 3 (svolgere su questo foglio e sul retro) 3a) Quali e quante sono le unità di misura fondamentali (o di base) del Sistema Internazionale? 3b) Si indichi il livello di accuratezza (almeno l’ordine di grandezza) con cui oggi si sanno realizzare queste unità. 3c) Perché a volte può essere utile impiegare unità di misura logaritmiche? 3a) Vedi libro e appunti del corso. 3b) Vedi libro e appunti del corso. 3c) Vedi libro e appunti del corso. _______ Pag. 7/10 Esercizio 4 (svolgere su questo foglio e sul retro) 4) Un processore a 2.5 GHz (valore noto con incertezza trascurabile) elabora i dati di un segnale periodico campionato. Su ciascun dato campionato e acquisito (in un intervallo di tempo trascurabile) si esegue una operazione di elaborazione (condizionamento) di durata Telab = 8 Tc con incertezza u(Telab) = 1 Tc (Tc è il periodo di clock del processore). Per ciascun periodo del segnale misurato, si vuole determinare il valore medio della forma d’onda acquisita su N punti (numero fissato) e salvare tale valore sul disco fisso (HD) del computer. L’operazione di media, per evitare problemi di overflow, è eseguita ad ogni campione acquisito secondo la formula x i 1 i x i dato i i 1 e dunque per i=0, 1, …, N-1. Si ipotizza che tanto una moltiplicazione quanto una somma richiedano (sempre!) 4 periodi di clock, che una divisione richieda 121 Tc e che il tempo di scrittura su HD segua una distribuzione di probabilità triangolare compresa tra 1 s e 2 s. 4a) Si ricavi il valore atteso del tempo di misura (Tmis, che termina con l’avvenuta scrittura su HD) di una singola media per una forma d’onda sinusoidale (valore efficace 2.3 V, offset 0.1 V, e periodo 20 ms) sovracampionata esattamente di un fattore 10 000 rispetto al limite di Nyquist (fs,Nyquist=2fw con i pedici s=sampling e w=waveform). 4b) Quanto vale l’incertezza standard u(Tmis) del tempo di misura? 4c) OPZIONALE - Come varierebbe l’incertezza u(Tmis) se la frequenza di lavoro del processore avesse una incertezza estesa di 410-6 con fattore di copertura k=2? Si stimi il nuovo valore di u(Tmis). 4a) Per frequenza e periodo di clock del processore valgono le relazioni: fc=2.5 GHz e Tc=1/fc=0.4 ns. L’onda campionata, di fatto 1/100 della tensione di rete europea più un certo offset (i valori di ampiezza comunque non sono rilevanti per la soluzione di questo problema), ha una frequenza fw=1/(20 ms)=50 Hz. Il campionamento avviene a frequenza fs=104fs,Nyquist=1042fw=104100 Hz=106 Hz=1 MHz con la generazione di un dato ogni Ts=1/fs=1 s. Pertanto, in un periodo Tw=20 ms dell’onda vengono prelevati N=Tw/Ts=20 000 campioni. L’operazione di elaborazione (condizionamento) del dato acquisito ha durata Telab=81 Tc=3.20.4 ns mentre ciascun calcolo della media (parziale) dura Tmedia=(Tmoltiplicazione+Tsomma)+Tdivisione=(4Tc+4Tc)+12Tc=20Tc=8 ns. Essendo la somma di questi due tempi inferiore al periodo di campionamento Ts=1 s, il tempo di misura cercato è dunque (valore atteso): Tmis=T(per acquisire N-1 campioni)+ T(tempo per acquisire, elaborare, e mediare l’ultimo campione)+ T(tempo di scrittura su HD del risultato finale) Tmis=(N-1)Ts+(Ts+Telab+Tmedia)+Tscrittura=NTs+Telab+Tmedia+Tscrittura L’ultimo tempo non è ancora stato calcolato: dalla distribuzione triangolare, Tscrittura=(2 s+1 s)/2=1.5 s. Dunque, il valore atteso del tempo di misura è Tm=20 0001 µs+3.2 ns+8 ns+1.5 s=20 001.5112 s20 ms. Il tempo per le altre N-1 elaborazioni e medie non è stato contato, in quanto avvengono in parallelo al campionamento: il processore le effettua mentre aspetta il prossimo dato. _______ Pag. 8/10 Esercizio 4 (continua) 4b) L’incertezza su Tmedia, essendo per ipotesi nulle le incertezze di Tmoltiplicazione e Tsomma (tempi “sempre” uguali a 4Tc) è pari alla incertezza su Tdivisione e pertanto u(Tmedia)=u(Tdivisione)=2Tc/ 12 =0.23 ns (distribuzione uniforme con piena larghezza 2Tc). Dalle 2 cifre significative su questa incertezza, si può (e si dovrebbe) anche riscrivere Tmedia=8.00 ns. Per essere più precisi, la distribuzione dei valori non è uniforme, ma è quantizzata. Il calcolo dell’incertezza andrebbe quindi effettuato a partire dalla definizione di deviazione standard per una distribuzione di 3 valori 2 1 n =0.32 ns. Però in questo caso l’assunzione di ( xi ) 2 Tc 3 n i 1 probabilità uniforme per i tre valori è forse poco realistica (il valore centrale sarà sicuramente più ricorrente), quindi decidiamo di mantenere come stima del valore di incertezza il valore calcolato precedentemente. Sempre dalla distribuzione triangolare, si ricava che u(Tscrittura)=(2 s-1 s)/ 24 =0.20 s (incertezza con 2 cifre significative e, coerentemente, Tscrittura=1.50 s). A questo punto, l’incertezza sul tempo di misura si ricava da u2(Tmis)=N2u2(Ts)+ u2(Telab)+ u2(Tmedia)+ u2(Tscrittura)=0+(0.4 ns)2+(0.23 ns)2+(0.20 s(0.20 s per cui u(Tmis)0.20 s, sostanzialmente limitata dalla incertezza del tempo di scrittura su HD. Il periodo di campionamento è considerato esente da incertezza perchè deriva direttamente dal clock del computer (dato per ipotesi con incertezza trascurabile). discreti equiprobabili: u(Tdivisione)= 4c) In questo caso il processore ha una frequenza nota con incertezza estesa (il valore fornito è certamente una incertezza relativa) U(fc)=410-6fc=410-62.5109 Hz=10 kHz che, divisa per il fattore di copertura k=2, porta a una incertezza standard u(fc)=U(fc)/k=5 kHz con ur(fc)=u(fc)/fc=210-6. In termini del periodo di clock, essendo Tc=1/fc, si ricava immediatamente che ur(Tc)=ur(fc)=210-6 e quindi l’incertezza standard sul periodo di clock è u(Tc)=Ur(Tc)Tc=210-60.4 ns=0.8 fs=0.810-15 s=800 as. Questa incertezza non nulla comporta un incremento nelle incertezze dei tempi Telab, Tmedia, e Tscrittura, che sono tutti dipendenti da Tc. Tuttavia, data la modestissima entità di u(Tc) rispetto a Tc stesso (10-6 appunto) e dato che le incertezze di Telab, Tmedia, e Tscrittura sono frazioni ben più considerevoli di 1 ppm, l’aumento di incertezza complessiva su Tmis sarà del tutto trascurabile. Non trascurabile potrebbe invece essere il contributo di incertezza dovuto al tempo di campionamento, che è proporzionale al periodo di clock del processore e quindi avrà la stessa incertezza relativa ur(Ts)=ur(Tc)=210-6, per cui: N2u2(Ts)=(200001 s210-6)2=(0.04 s)2 Pertanto, ora u2(Tmis)=N2u2(Ts)+ u2(Telab)+ u2(Tmedia)+ u2(Tscrittura)=(0.04 s)2+(0.4 ns)2+(0.23 ns)2+(0.20 s0.0416 s da cui ancora u(Tmis) 0.20 s. _______ Pag. 9/10 Esercizio 5 (svolgere su questo foglio e sul retro) 5) Si consideri la tratta di trasmissione in figura: un generatore di segnale eroga una potenza PG che subisce un’attenuazione di 17 dB in una linea di trasmissione; un preamplificatore rigenera quindi il segnale con un guadagno di tensione pari a 10. 5a) Calcolare la potenza di segnale PR al ricevitore, esprimendola sia in W che in dBm, per le seguenti potenze trasmesse: PG1= 1 mW; PG2= 5 W; PG3= 200 nW. PG Trasmettitore PR Linea A = 17 dB G =10 Ricevitore 5a) Esprimiamo il guadagno dell’amplificatore in dB (attenzione che il guadagno è di tensione e dunque in ampiezza e non in potenza). GdB = 20log10(10)= 20 dB. Per cui l’intera tratta ha un guadagno complessivo pari a 20 – 17 dB= 3 dB, che in potenza significa un fattore 2. Per cui PR = 2PG, quindi PR1= 2 mW; PR2= 10 W; PR3= 400 nW. In dBm, ricordando che PdBm = 10log10(P/1mW), PR1= 3 dBm; PR2= -20 dBm; PR3= -34 dBm. Le potenze in dBm ricevute si potevano anche calcolare direttamente sommando 3 dB (guadagno della tratta) alla potenza del trasmettitore, ovviamente dopo averla espressa in dBm (PG1= 0 dBm; PG2= -23 dBm; PG3= -37 dBm). Oppure si poteva effettuare l’intero calcolo in lineare: attenuazione di 17 dB = dividere per 50 la potenza; guadagno 10 in tensione = guadagno 100 in potenza. _______ Pag. 10/10