STATISTICA E MISURAZIONE lunedì 19 febbraio 2007 Prof. Cesare Svelto Tempo a disposizione 2 ore Prova in itinere AA 2006/2007 Aula V.S.9 ore 13.00 Cognome: __________________________ Nome: _____________________ (stampatello) Matricola: __ __ __ __ __ __ Firma: _____________________ (firma leggibile) Esercizi svolti (almeno parzialmente): 1 2 3 4 (11+7+7+8=33pt) (crocettare) N.B. Gli esercizi non crocettati non saranno corretti; quelli crocettati ma neppure iniziati comporteranno una penalità. Sarà anche penalizzato chi consegna un compito “gravemente insufficiente”. SOLUZIONI Esercizio 1 (tempo stimato 40 m) (svolgere su questo foglio e sul retro) 1) Per valutare l’efficacia di un sistema di raffreddamento per CPU, la temperatura del processore viene monitorata per 2 ore acquisendo una lettura ogni 10 minuti. I valori complessivamente acquisiti sono: T (°C) = 35; 42; 38; 44; 60; 63; 58; 55; 59; 49; 51; 55; 54. 1a) Si calcolino media e varianza campionaria dei dati. 1b) Si disegni il diagramma a scatola (box plot) dei dati, avendo prima ricavato i parametri caratteristici (quartili, dinamica interquartile, valore dei baffi, etc.). Si riporti anche il diagramma a punti (dot diagram). 1c) Si riportino i dati in un diagramma ramo-e-foglia (stem-and-leaf) e da questo si disegni l’istogramma corrispondente. 1d) Si disegni la serie temporale dei dati in funzione del tempo. 1e) Considerando solo i primi 5 punti di misura, si decida (oltre che dal grafico del punto 1d) o da una sua espansione sui primi punti) anche in base a un modello di regressione ai minimi quadrati, se è evidente un trend positivo o negativo. Si ricavi quanto vale la deriva temporale, esprimendola anche in unità SI, sui primi 40 minuti di misurazione. Nota: Si ricorda che il coefficiente angolare ed il termine noto della retta di regressione ai minimi quadrati si ottengono come: m n xi yi xi y i n x xi 2 2 i 1a) La media campionaria è T= T x y x x y b n x x 2 i i 2 i i i 2 i i y m x i i n y mx 1 n Ti =51 °C n i 1 n La varianza campionaria è s2= (T T ) i 1 2 i n 1 =78.17 °C2 1b) Per disegnare il box-plot dei dati dobbiamo innanzitutto calcolare la mediana e il primo e terzo quartile. I 13 dati ordinati sono T (°C) = 35; 38; 42; 44; 49; 51; 54; 55; 55; 58; 59; 60; 63. La mediana, pari al 50-esimo percentile, per cui Imediana = (13+1)50 /100 = 7, quindi la mediana è pari al settimo dato. Mediana= 54 °C. Il primo quartile è il 25-esimo percentile, per cui I1Q = (13+1)25 /100 = 3.5, quindi: primo quartile= 42+(44-42) 0.5 = 43 °C = Q1 Il terzo quartile è il 75-esimo percentile, per cui I3Q = (13+1)75 /100 = 10.5, quindi: terzo quartile= 58+(59-58) 0.5 = 58.5 °C = Q3 La dinamica interquartile vale DIQ= Q3-Q1= 15.5 °C. Pag.1/6 I baffi si possono estendere fino a 1.5DIQ = 23.25 °C al di là del primo e del terzo quartile, quindi fino a 19.75 kg e 81.75 kg. Ricordiamo comunque che i baffi si fermano all’ultimo dato contenuto entro il limite calcolato: in questo caso sino al dato 1 (baffo inferiore) pari a 35 , e sino all’ultimo dato (baffo superiore) pari a 63 kg. In figura è riportato anche il diagramma a punti. 1 35 45 50 55 Temperatura [°C] foglie 58 249 145589 03 Frequenza 1c) rami 3 4 5 6 40 60 65 50-59 60-69 7 6 5 4 3 2 1 0 30-39 40-49 T [°C] Temperatura, T (°C) 1d) La serie temporale dei dati è: 70 60 50 40 30 0 20 40 60 80 100 120 Tempo, t (min) 60 60 55 50 y o T (°C) Temperatura, T (°C) 1e) I primi 5 dati riguardano un intervallo temporale di 40 minuti e corrispondono ai due vettori: t (min) 0 10 20 30 40 T (°C) 35 42 38 44 60 Il grafico corrispondente (non richiesto) è qui sotto a sinistra: 45 40 50 40 35 30 30 0 10 20 Tempo, t (min) 30 40 0 10 20 30 x o t (min) Pag.2/6 40 e dal diagramma cartesiano, anche già da quello del punto 1e), appare evidente un trend positivo della temperatura nel tempo (nel secondo e anche nel primo grafico tale andamento tendenziale è rappresentato dalla linea tratteggiata, disegnata qualitativamente e che non è la retta di regressione ai minimi quadrati). Applicando le formule della regressione lineare ai minimi quadrati, si ricava un coefficiente angolare e un termine noto della retta che sono rispettivamente: n xi yi xi y i m= =0.52 °C/min=8.710-3 K/s 2 n xi2 xi b= y mx =33.4 °C=306.55 K La retta di regressione è mostrata unitamente ai punti sperimentali nel diagramma bordato a tratto-punto. Pag.3/6 Esercizio 2 (tempo stimato 25 m) (svolgere su questo foglio e sul retro) 2) Un locale è riscaldato con 3 stufette elettriche dello stesso modello, che il costruttore specifica con una potenza a distribuzione di probabilità normale, con valor medio 1 kW e deviazione standard 100 W. 2a) Si esprima in dBm la potenza media complessiva delle 3 stufette accese contemporaneamente. 2b) Il contatore elettrico del locale è limitato a 3.3 kW. Quanto vale la probabilità che con le tre stufe accese salti il contatore? 2c) Ogni stufetta ha il 5% di probabilità di rottura entro un anno. Quanto vale la probabilità che in un anno se ne rompano meno di 2 sulle tre utilizzate? 2d) In un intero condominio si utilizzano 100 stufette. Se mediamente se ne guastano 5 all’anno, quanto vale la probabilità che in 3 anni quelle sostituite per guasto siano esattamente 10? 2a) La potenza media complessiva delle tre stufette è pari a 3 kW, che corrispondono a 3 10 6 mW 64.8 dB 10 log 10 1 mW 2b) La variabile aleatoria Y pari alla somma delle tre potenze (che ipotizziamo scorrelate) ha valor medio pari alla somma dei valori medi: 3 E (Y ) E ( Pi ) 3 kW i 1 e varianza pari alla somma delle tre varianze ( V(Pi)=0.01 kW2 ): 3 V (Y ) V ( Pi ) 0.03 kW 2 i 1 Per cui la sua deviazione standard vale Y 3 P 0.173 kW Calcoliamo la probabilità cercata (di superare 3.3 kW di consumo) tramite standardizzazione: 3.3 kW 3.3 3 P(Y 3.3 kW ) P z z P( z 1.73) 4.2% 0.173 2c) Il fenomeno di rottura o meno di una stufetta segue una statistica binomiale: dato che ogni prova è un processo di Bernoulli (rotta o non rotta), le prove sono indipendenti e la probabilità di successo in ogni prova è costante. La probabilità di x rotture su n stufette segue la distribuzione binomiale, con probabilità di successo p =0.05 : n n P(meno di 2 rotte ) P( x 0) P( x 1) p x (1 p) n x p x (1 p) n x x x x 0 x 1 3 3 0 1 0.05 (0.95) 30 0.05 (0.95) 31 0.857 0.135 99.3% 0 1 2d) Questo processo segue una distribuzione di tipo poissoniano, in quanto ogni singolo evento è un processo di Bernoulli, gli eventi si possono considerare scorrelati e la probabilità di avvenimento (rottura) in un brave intervallo di tempo è molto piccola. e x La funzione di probabilità di una variabile poissoniana X vale f ( x) , x 0,1,2... x! Il valor medio in questo caso vale = 5 /anno × 3 anni= 15, per cui e x e 151510 P( x 10) 4.86% x! 10! Pag.4/6 Esercizio 3 (tempo stimato 25 m) (svolgere su questo foglio e sul retro) 3) Nell’ambito di uno studio sulla luminosità di un modello di monitor LCD la casa produttrice dichiara un valor medio di 330 cd/m2, con varianza 256 cd2/m4. Si misurano 25 monitor, ottenendo un valor medio di luminosità pari a 310 cd/m2. 3a) Si effettui un test statistico per cercare di dimostrare, con livello di significatività dell’1 %, che la luminosità del monitor è inferiore a quella indicata dalla casa madre. 3b) Si definisca la potenza di un test statistico 3c) Si calcoli la potenza del test effettuato e la probabilità di errore di tipo II, nel caso in cui il valor medio effettivo dell’intera popolazione di monitor prodotti sia 315 cd/m2. 3a) Effettuiamo il test statistico richiesto (test Z, in quanto vogliamo verificare il valor medio di una popolazione a varianza nota, =casa= 256 cd/m2=16 cd/m2). Seguiamo gli 8 passi descritti nel libro di testo. 1. Il parametro di interesse è la luminosità media 2. H0: = 330 cd/m2 3. H1: < 330 cd/m2 (il test è a un lato solo, in quanto vogliamo dimostrare che la luminosità è inferiore a quella indicata dalla casa madre) 4. Livello di significatività richiesto = 0.01 (attenzione, su un solo lato) 5. La statistica di test è la statistica Z: z0 X X X / n 6. Rifiutiamo H0 se Z < -Z -2.33. Questo risultato si ricava dalla tabella della funzione cumulativa in corrispondenza di un valore di probabilità = 0.01. 7. Calcoliamo quindi z0: z 0 X / n 310 330 10 6.25 3.2 16 / 25 8. Conclusione: dato che z0=-6.25 < -2.33 possiamo rifiutare l’ipotesi nulla con livello di significatività 0.01: c’è notevole evidenza che l’ipotesi nulla sia falsa. 3b) La potenza di un test statistico è la probabilità di rifiutare l’ipotesi nulla quando questa è falsa. Potenza = 1 - La potenza è un parametro che ci descrive la capacità del test di rivelare le differenze della realtà rispetto ad H0. 3c) La probabilità di errore di tipo II si ottiene calcolando la probabilità che il valore misurato ricada nella regione di accettazione, nonostante il valor medio reale sia diverso da H0. La regione di accettazione è Z > -2.33 (variabile standardizzata ricavata al punto 6 di 4a)), che corrisponde a X n Z 330-3.2×2.33 cd/m2 322.54 cd/m2 Se il valor medio reale è pari a 315 cd/m2, la probabilità di errore di tipo II vale P( X 322.54 cd/m 2 , con 315 cd/m 2 ) X 322.54 315 P Z P Z PZ 2.35 0.94% 1% 3 . 2 X Per cui potenza del test = 1 - 99 % Pag.5/6 Esercizio 4 (tempo stimato 30 m) (svolgere su questo foglio e sul retro) 4) Una pista da sci è inclinata di =20 ° dall’orizzontale e questo angolo è stato misurato con U()=6 ° con k=3. Uno sciatore di discesa libera si lancia sulla pista (velocità iniziale v0=0) e scende per un percorso rettilineo di 400(2) m, misurati lungo la pista. 4a) Si calcoli il dislivello h della pista, con la sua incertezza tipo. 4b) Se gli attriti vari comportano una perdita complessiva del 60 % nel trasferimento tra energia potenziale ed energia cinetica, quanto vale la velocità v1 dello sciatore al termine del percorso? 4c) Si calcoli l’incertezza relativa della velocità finale e si dica quale delle variabili misurate ne fornisce il contributo più rilevante. 4d) Si discuta la compatibilità tra la misura di velocità v1 e una seconda misura v2=30.000.12 m/s. Nota: si utilizzi un valore dell’accelerazione di gravità sulla pista g=9.806 65(2) m/s2 4a) Il cammino percorso lungo la pista è l=4002 m. L’angolo di inclinazione della pista è =202 °=0.3490.035 rad. Il dislivello della pista è dunque h=l sin=136.81 m. 2 2 h h u(h)= u 2 (l) u 2 ( ) l sin 2 u 2 (l) l cos 2 u 2 ( ) 0.47 173.07 m 13 m 4b) L’energia potenziale è Ep=mgh e l’energia cinetica acquisita, pari al 40 % dell’energia potenziale persa 1 durante la discesa, è Ec= mv12 =0.4Ep. Si ricava dunque: v1= 0.8gh =32.761 m/s (118 km/h). 2 4c) Partendo dalla relazione funzionale v1= 0.8gh (produttoria a esponenti ½), calcoliamo l’incertezza relativa di v1 (funzione delle incertezze relative di g e h): ur(g)=u(g)/g2×10-6 e ur(h)=u(h)/h9.6×10-2 1 2 1 ur g ur2 h (1/2)ur(h)4.8×10-2 quasi totalmente dovuta alla misura dell’angolo . 4 4 (non richiesto) L’incertezza tipo di v1 vale quindi u(v1)=v1ur(v1)=1.573 m/s=1.6 m/s La misura di v1 con l’incertezza tipo in notazione compatta è v1=32.8(1.6) m/s ur(v1)= 4d) Siamo in presenza di due misure indipendenti della stessa grandezza che hanno fornito valori di misura diversi tra loro. Valutiamo la compatibilità tra le due misure secondo il criterio di compatibilità standard che prevede di confrontare la distanza tra i due valori con una combinazione delle due incertezze standard, secondo la relazione: v1 v2 kcomp u 2 (v1 ) u 2 (v2 ) con kcomp=1,2,3 fattore di copertura per la valutazione della compatibilità. Sostituendo i valori numerici 32.8 m/s 30.00 m/s kcomp (1.6 m/s )2 (0.12 m/s )2 kcomp (1.6 m/s ) del caso, si ottiene: ovvero 2.8/1.6<kcomp e dunque kcomp>1.75. Vi è dunque compatibilità tra le due misure per un fattore di copertura kcomp=2, e naturalmente anche per un fattore di copertura kcomp=3, mentre non si ha compatibilità per kcomp=1. Pag.6/6