STATISTICA E MISURAZIONE lunedì 12 settembre2005 Prof. Cesare Svelto Tempo a disposizione 2h30min Cognome: _________________________ Matricola e firma __ __ __ __ __ __ Terzo appello AA 2004/2005 Aula V.s.9 ore 12.30 Nome: _______________________ (stampatello) _______________________ (firma leggibile) Esercizi svolti (almeno parzialmente): 1 2 3 4 5 (5 + 8 + 6 + 8 + 6=33p) (crocettare) N.B. gli esercizi non crocettati non saranno corretti; quelli crocettati ma neanche iniziati comporteranno una penalità; se possibile, si chiede di crocettare anche i sottopunti svolti. SOLUZIONI (20 min) Esercizio 1 (svolgere su questo foglio e sul retro) 1) Si dia la definizione, e se ne illustri il significato con un esempio, di ciascuno dei seguenti termini metrologici: 1a) errore di misura (polarizzazione) 1b) incertezza 1c) sensibilità 1d) ripetibilità 1e) stabilità 1f) Si dispone di due segnali alternati (un’onda sinusoidale e un’onda quadra) con la medesima ampiezza di 50 mA che vengono inviati ciascuno a un carico da 200 . Dopo avere ricavato i valori efficaci in tensione, per i due segnali, si calcolino in watt e si esprimano in dBm le potenze sviluppate sui due carichi. 1a,b,c,d,e) Si vedano il libro e/o gli appunti del Corso. 1f) In entrambi i casi Ip=50 mA e, con R=200 , si ottiene una tensione di picco Vp=RIp=10 V. caso 1] Il segnale sinusoidale alternato avrà una ampiezza efficace V1,eff=Vp/ 2 =7.07 V. La potenza sviluppata sul carico è P1=(V1,eff)2/R=(Vp)2/(2R)=(100 V2)/(400 )=0.25 W=250 mW=+30 dBm-6 dB=+24 dBm. caso 2] Il segnale a onda quadra alternato avrà una ampiezza efficace V2,eff=Vp=10 V. La potenza sviluppata sul carico è P2=(V2,eff)2/R=(Vp)2/R=(100 V2)/(200 )=0.5 W=500 mW=+30 dBm-3 dB=+27 dBm (esattamente il doppio che nel caso precedente ed esattamente la potenza che svilupperebbe una tensione continua da 10 V applicata al carico). _______ Pag. 1/8 (35 min) Esercizio 2 (svolgere su questo foglio e sul retro) 2) Si vuole calcolare il tempo che occorre per scrivere 6 file da 800 MB su un DVD da 4.7 GB. La velocità di scrittura dei file sul DVD è di 8× (v=11.08 MB/s, nota con incertezza estesa di 3.6×10-3 con fattore di copertura k=3). La dimensione di ciascun file ha un valore compreso tra Dmin=798 MB e Dmax=802 MB, con densità di probabilità (PDF) triangolare. Il tempo che occorre all’operatore umano per individuare il singolo file da copiare e iniziarne la copia è stato misurato con un orologio analogico da polso, con lancetta-cronografo contasecondi, ottenendo un valore TO=4 s. 2a) Si ricavi la misura indiretta del tempo di scrittura TS dell’intero DVD. Si esprima il risultato usando la notazione compatta per l’incertezza tipo. 2b) Si calcoli l’incertezza relativa ur(TS). 2c) Se la misura di TO fosse stata ottenuta da 100 letture ripetute con varianza campionaria 1 s2 (e valor medio ancora TO=4 s), quanto varrebbe l’incertezza u(TS) in questo caso? Si confronti tale valore con quello ottenuto precedentemente. 2d) (Opzionale) Si valuti lo spazio mediamente non utilizzato sul disco (spazio rimasto vuoto sul DVD dopo la scrittura dei 6 file) esprimendo l’incertezza estesa su questa grandezza a un livello di confidenza del 95 %. immaginando di scrivere 1000 DVD secondo questa procedura e con le ipotesi fatte, con quale probabilità potrà capitare che i 6 file non trovino spazio sufficiente sul disco. 2a) Il tempo cercato è TS=6(TO+T) con T tempo di scrittura del singolo file. Dmax Dmin =800 MB 2 D Dmin 2 MB u(D)= max =0.8165 MB0.82 MB 24 6 u D 0.82 MB ur(D)= 1.0×10-3=0.1% D 800 MB D= (valore centrale dell’intervallo di valori possibili) (deviazione standard della PDF triangolare) (incertezza relativa) v=11.08 MB/s ur(v)=Ur(v)/k = (3.6×10-3)/3=1.2×10-3=0.12% Il tempo di scrittura del singolo file è D 800 MB T= 72.202 s v 11.08 MB/s [[ 1 min e 12 s ]] ur(T)= ur2 D ur2 v 1 1.2 ×10-3= 2.44 ×10-31.6×10-3 u(T)=ur(T)×T=1.210-3 s=1.2 ms=0.0012 s T=72.20(12) s TO=4 s TO=1 s T u(TO)= O =2.910-1 s=0.29 s 12 2 2 [[ 7 minuti e ½ ]] TS=6(TO+T)=6×76.20 s=457.20 s u(TS)=6 u 2 TO u 2 T 6×u(TO)1.8 s essendo u2(T)<< u2(TO) Esprimendo il risultato in notazione compatta, si ottiene TS=457.2(1.8) s _______ Pag. 2/8 Esercizio 2 (continua) 2b) ur(TS)= u TS 1 .8 s =4×10-3=0.4% TS 457.2 s s TO 1 s =0.1 s 10 n In questo caso, essendo ancora u2(T)<< u2(TO), si ha u(TS)6×u(TO)0.6 s. Rispetto al caso precedente, si osserva ora una significativa riduzione dell’incertezza sul tempo di scrittura (si è ridotta di un fattore 3 rispetto al caso di prima). Invece il tempo di scrittura totale non è cambiato significativamente. 2c) u(TO)= 2d) Lo spazio che rimane vuoto sul disco, dopo la scrittura dei 6 file da 800 MB (valore medio) è Cres=C-6×D=4.7 GB×(1024 MB/GB)-6×800 MB=(4812.8-4800) MB=12.8 MB. L’incertezza sullo spazio residuo, essendo per ipotesi trascurabile/nulla l’incertezza sulla capacità del disco, sarà uguale a 6 volte l’incertezza sulla dimensione del singolo file. Pertanto, u(Cres)=6×u(D)=6×0.82 MB4.92 MB. Tale valore di incertezza su Cres non è molto lontano dal valore stesso dello spazio residuo. Tuttavia, dato il modello di PDF (triangolare e dunque uguale a zero al di fuori degli estremi Dmin e Dmax), saremo sempre sicuri che la dimensione di ciascun file è D≤ Dmax=802 MB e pertanto la capacità scritta sul DVD sarà in ogni caso Cscritta≤ 6Dmax=6×802 MB=4812 MB/(1024 MB/GB)=4.699GB<4.7 GB. Dunque la probabilità che i 6 file non trovino spazio sufficiente sul disco è uguale a zero. _______ Pag. 3/8 (30 min) Esercizio 3 (svolgere su questo foglio e sul retro) 3) Si vuole fare uno studio statistico sul tempo di attesa per ottenere la prima risposta dall’operatore in un call center telefonico. Allo scopo, si effettua una raccolta dati che ha portato al campione: T (s) = 14; 18; 25; 16; 19; 20; 22; 19; 28; 17; 18; 24. 3a) Si individuino media, deviazione standard campionaria e gli altri parametri (riassuntivi) caratteristici del campione. 3b) Utilizzando un numero di classi pari a 4 per l’analisi statistica, si disegni l’istogramma della frequenza assoluta dei dati. 3c) Sempre con le 4 classi del punto precedente, si disegni l’istogramma della frequenza cumulativa relativa dei dati. 3d) Dopo avere calcolato, con le formule e spiegazioni del caso, i valori caratteristici del box-plot dei dati, si disegni questa rappresentazione grafica (con tutti i punti misurati) commentando il box-plot ottenuto. 3a) Il numero di dati contenuti nel campione è n=12. 1 n 1 La media campionaria dei dati è T Ti 240 s 20 s . n i 1 12 La varianza campionaria dei dati è sT2 1 n 1 n 2 180 s 2 2 2 T T T n T 16.36 s 2 . i i n 1 i 1 n 1 i1 12 La deviazione standard campionaria dei dati è sT sT2 4.05 s 4 s . Gli altri parametri riassuntivi sono Tmin=14 s; Tmax=28 s; Tmediana=19 s. 3b-c) Riportiamo i dati ordinati (secondo valori crescenti): T (s) = 14; 16; 17; 18; 18; 19; 19; 20; 22; 24; 25; 28 Con 12 dati un numero sensato di classi è 4 (ricordiamo la legge 1+log2(n)), ad esempio possiamo scegliere i seguenti intervalli per l’istogramma: Intervallo frequenza freq. cumulativa 14 - 17 3 3 18 - 21 5 8 22 - 25 3 11 26 - 29 1 12 Frequenza assoluta 5 4 3 2 1 0 12 14 16 18 14 16 18 20 22 24 26 28 30 24 26 28 30 Frequenza cumulativa 12 10 8 6 4 2 0 12 20 22 Tempo di attesa [s] 3d) Per disegnare il box-plot dei dati dobbiamo innanzitutto calcolare la mediana e il primo e terzo quartile. La mediana è il 50-esimo percentile, per cui Tmediana = (12+1)50 /100 = 6.5, quindi la mediana è la media tra il sesto ed il settimo dato, che valgono entrambi 19 s. Mediana=19 s. Il primo quartile è il 25-esimo percentile, per cui I1Q = (12+1)25 /100 = 3.25, quindi il primo quartile è dato da: primo quartile= [ 17 + (18 – 17) 0.25 ] s= 17.25 s = Q1 _______ Pag. 4/8 Il terzo quartile è il 75-esimo percentile, per cui I3Q = (12+1)75 /100 = 9.75, quindi il terzo quartile è dato da: terzo quartile= [ 22 + (24 – 22) 0.75 ] s= 23.5 s = Q3 La dinamica interquartile vale DIQ= Q3-Q1= 6.25 s. I baffi si possono estendere fino a 1.5DIQ = 9.375 s al di là del primo e terzo quartile, quindi fino a 17.25-9.375=7.875 s e 23.5+9.375=32.875 s. Ricordiamo comunque che i baffi si fermano all’ultimo dato contenuto entro questo limite (di 1.5DIQ): in questo caso sino al primo e all’ultimo dato del campione (non ci sono outliers). In figura (box-plot) sono riportati anche i punti sperimentali. 1 14 16 18 20 22 Tempo di attesa [s] 24 26 28 _______ Pag. 5/8 (35 min) (svolgere su Esercizio 4 questo foglio e sul retro) 4) Nell’ambito di uno studio sul prezzo medio di un PC laptop, con specificate prestazioni tecniche, si registrano i valori di prezzo al pubblico in 9 negozi: C [k€] = 2.6 ; 2.4 ; 2.7 ; 2.5 ; 2.6 ; 2.2 ; 2.4 ; 2.7 ; 2.4. La casa madre produttrice del laptop dichiara un prezzo di vendita al pubblico pari a 2.4 k€ con varianza di 0.64 k€2. 4a) Si calcolino la media e la deviazione standard campionaria per il prezzo in negozio. 4b) Si effettui un test statistico per cercare di dimostrare, con significatività del 5 %, che i negozianti vendono a un prezzo superiore a quello indicato dalla casa madre (i cui dati sono attendibili). Che tipo di test si è svolto, perché, quale è l’esito? 4c) Si ripeta il test del punto 4b) ritenendo non attendibile la varianza fornita dalla casa madre. Che tipo di test si è svolto, perché, quale è l’esito? 4d) Si calcoli il valore P per entrambi i test effettuati. 4e) Il numero di negozi inclusi nel campione da noi analizzato viene portato da 9 a 900 ottenendo comunque la stessa media e varianza campionaria del punto 4a). Si ricalcali il test del punto 4c) in queste condizioni. 4a) La media campionaria, sulle n=9 determinazioni di prezzo disponibili, è 22.5 k € 1 n 1 9 C Ci Ci 2.5 k € n i 1 9 i 1 9 La varianza campionaria è sC2 1 n 1 n 2 1 0.22 k € 2 2 2 2 C C C n C 56 . 47 56 . 25 k € 0.0275 k € 2 i i n 1 i 1 n 1 i 1 8 8 con una deviazione standard campionaria sC= sC2 0.166 k€=166 € 4b) Effettuiamo il test statistico richiesto (test Z, in quanto vogliamo verificare il valor medio di una popolazione a varianza nota, =casa= 0.64 k € 2 =0.8 k€). Seguiamo gli 8 passi descritti nel libro di testo. 1. Il parametro di interesse è il prezzo medio 2. H0: = 2.5 k€ 3. H1: > 2.5 k€ (il test è a un lato solo, in quanto vogliamo dimostrare che il prezzo di vendita al pubblico è superiore a quello indicato dalla casa madre) 4. livello di significatività richiesto = 0.05 (attenzione, su un solo lato) 5. La statistica di test è la statistica Z: z0 X X X / n 6. Rifiutiamo H0 se Z > Z 1.64. Questo risultato si ricava dalla tabella della funzione cumulativa in corrispondenza di un valore di probabilità , ossia da P=1-(Z)=(-Z)=0.05 Z 1.64 7. Calcoliamo quindi z0: z 0 C C C / n 2.5 2.4 0.8 / 9 0.1 0.3 0.375 0.8 / 3 0.8 8. Conclusione: dato che z0=0.375 < Z 1.64 non possiamo rifiutare l’ipotesi nulla con livello di significatività 0.05: non c’è abbastanza evidenza che l’ipotesi nulla sia falsa. Il prezzo di vendita dichiarato dalla casa produttrice, secondo questo test, deve dunque essere ritenuto attendibile (rispetto a quello riscontrato sul mercato) ovvero il prezzo dei negozianti non è superiore (con significatività del 5 %) a quello della casa madre. _______ Pag. 6/8 4c) Ripetiamo ora il test, non fidandoci della varianza dichiarata dalla casa madre. Dovremo utilizzare la varianza dei dati disponibili nel campione selezionato. Il numero di gradi di libertà è = n – 1 = 8. La deviazione standard campionaria, v. punto 4a), è sC=0.166 k€. Effettuiamo quindi un test t perché dobbiamo eseguire una verifica del valor medio con varianza non nota: 1. Il parametro di interesse è il prezzo medio 2. H0: = 2.5 k€ 3. H1: > 2.5 k€ (il test è a un lato solo, in quanto vogliamo dimostrare che il prezzo di vendita al pubblico è superiore a quello indicato dalla casa madre) 4. livello di significatività richiesto = 0.05 (attenzione, su un solo lato) 5. La statistica di test è ora la statistica t: t 0 X X sX s/ n 6. Rifiutiamo H0 se t0 > t,8 = 1.860. Questo risultato si ricava dalla tabella dei punti percentuale della distribuzione t, con = 8 in corrispondenza di una probabilità = 0.05 7. Calcoliamo quindi t0: t0 C C 2.5 2.4 0.1 0.3 1.807 sC sC / n 0.166 / 9 0.166 / 3 0.166 8. Conclusione: dato che t0 =1.807 < t,8 = 1.860 non possiamo rifiutare l’ipotesi nulla con livello di significatività 0.05: non c’è abbastanza evidenza che l’ipotesi nulla sia falsa (anche se di poco, non si cade ancora nella regione di rifiuto). Il prezzo di vendita dichiarato dalla casa produttrice, secondo questo test, deve dunque essere ritenuto attendibile (rispetto a quello riscontrato sul mercato) ovvero il prezzo dei negozianti non è superiore (con significatività del 5 %) a quello della casa madre. 4d) Il valore P, che corrisponde al livello di significatività di soglia tra l’accettazione ed il rifiuto di H0, si può ricavare direttamente dalla tabella dei valori della funzione cumulativa (della statistica Z o t a seconda del caso): ZP = z0 = 0.375, per cui il valore ricavato è PZ = 1- ( z0 ) 0.35 = 35 %. L’interpretazione di questo valore è che l’ipotesi nulla sarebbe stata dichiarata falsa per qualsiasi livello di significatività maggiore del 35 %. In questo caso con = 5 % non si è potuto rifiutare H0. tP,8 = t0 = 1.807, per cui valore ricavato è Pt < 0.05 = 5 % (minore di poco ma in maniera non quantificabile dalla tabella). L’interpretazione di questo valore è che l’ipotesi nulla sarebbe stata dichiarata falsa per qualsiasi livello di significatività maggiore del 5 %+ con >0 anche se non quantificabile in maniera precisa. In questo caso con = 5 % non si è potuto rifiutare H0. 4e) La deviazione standard campionaria su un campione di 900 negozi è ancora sC=0.166 k€, come per il punto 4a). La deviazione standard del valor medio, ancora con C 2.5 k € come per il punto 4a), è ora sC sC / n 0.166 k € / 30 0.00553 k € 5,53 € . Ripetendo il test t, per = 899 = inf. gradi di libertà, si ha ora t0 C 0.1 18.1 t ,inf . 1.645 e quindi rifiutiamo l’ipotesi nulla concludendo che sC 0.005533 il prezzo di vendita dei negozianti è effettivamente superiore (sempre con significatività del 5 %) a quello dichiarato dalla casa madre produttrice. _______ Pag. 7/8 (25 min) Esercizio 5 (svolgere su questo foglio e sul retro) 5a) Sapendo che la potenza consumata da un PC segue una distribuzione normale, con valor medio pari a 270 W e varianza di 64 W2, si calcoli la probabilità che un PC consumi meno di 250 W. 5b) Il Politecnico di Milano decide di attrezzare una nuova aula informatizzata con 50 PC. Il vincitore della gara d’appalto garantisce una probabilità del 90 % che un PC sia correttamente funzionante all’acquisto. Quanto vale la probabilità che ci siano meno di 3 PC guasti nell’ordine totale? 5c) Il gestore dell’aula viene mediamente chiamato 2 volte al giorno per piccoli interventi di riparazione o ripristino delle configurazioni di un PC. Quanto vale la probabilità che in 5 giorni venga chiamato esattamente 8 volte? Si descriva la distribuzione statistica utilizzata motivandone l’utilizzo. 5a) Per calcolare la probabilità standardizziamo la variabile casuale gaussiana, e ricorriamo quindi alla tabella dei valori della distribuzione cumulativa (z) per una variabile normale standard (VNS). Ricordiamo x che z è la VNS ricavata da x. 250 250 270 P( x 250) P z P z P( z 2.5) (2.5) 0.00621 0.6 % 8 5b) Dato che ogni prova è un processo di Bernoulli (un PC o è guasto oppure non lo è, ovvero successo o insuccesso), le prove sono indipendenti e la probabilità di successo in ogni prova è costante, la probabilità di x PC guasti su n segue la distribuzione binomiale, con probabilità di successo p =0.1: n 50 2 P(2 successi su 50 prove ) p x (1 p) n x 0.1 (0.9) 502 0.078 7.8 % x 2 n 50 50! 50 49 n! avendo ricordato che e dunque =1225 2 1 x x!(n x)! 2 48!2! Viene richiesta la probabilità di trovare meno di 3 PC guasti, quindi: P( x 3) P( x 2) P( x 1) P( x 0) 0.078 0.029 0.005 11.2% avendo calcolato le probabilità P(x=0) e P(x=1) come descritto in precedenza, per P(x=2). 5c) In prima approssimazione possiamo utilizzare una statistica poissoniana, in quanto i malfunzionamenti possibili in un’aula di 50 PC sono molti, ciascuno con una probabilità di avvenimento abbastanza bassa. Inoltre i singoli malfunzionamenti si possono considerare scorrelati (a meno di casi particolari). e x , x 0,1,2... La funzione di probabilità di una variabile poissoniana X vale f ( x) x! con valor medio = e varianza 2 = . Nel caso considerato, il valor medio vale = 2 chiamate/giorno 5 giorni = 10 chiamate. la probabilità di ricevere esattamente 8 chiamate in 5 giorni vale: e x e 10108 P( x 8) 11.26 % x! 8! _______ Pag. 8/8