STATISTICA E MISURAZIONE giovedì 21 gennaio 2008 Prof. Cesare Svelto Tempo a disposizione 2 ore Secondo appello AA 2007/2008 Aula V.S.8 ore 13.00 Cognome: __________________________ Nome: _____________________ (stampatello) Matricola: __ __ __ __ __ __ Firma: _____________________ (firma leggibile) Esercizi svolti (almeno parzialmente): 1 2 3 4 5 (7+7+7+8+4=33pt) (crocettare) N.B. Gli esercizi non crocettati non saranno corretti; quelli crocettati ma neppure iniziati comporteranno una penalità. Sarà anche penalizzato chi consegna un compito “gravemente insufficiente”. SOLUZIONI Esercizio 1 (tempo stimato 25 m) (svolgere su questo foglio e sul retro) 1) 1a) 1b) 1c) 1d) Siamo interessati a controllare la velocità di download da un sito web. Misuriamo i bit trasmessi al secondo in 10 intervalli di tempo abbastanza lontani da poterli considerare non correlati: X [kbit/s]: 97.0 100.0 101.1 89.3 94.9 105.6 100.5 96.3 93.6 103.0 Si calcoli il 40-esimo percentile dei dati. Si costruisca un diagramma rami e foglie dai dati misurati. Si riportino i dati nel grafico di probabilità normale. Che conclusioni possiamo trarre da questo grafico? Si rappresenti il box-plot dei dati. Normal Probability Plot 0.95 0.90 Probabilità 0.75 0.50 0.25 0.10 0.05 90 92 94 96 98 Dati 100 102 104 106 2a) I 10 dati ordinati sono X [kbit/s]: 89.3 93.6 94.9 96.3 97.0 100.0 100.5 101.1 103.0 105.6 La formula generale per ricavare l’indice di un generico k-esimo percentile è: Ik = (n+1)k /100. Dall’indice si ricava quindi il valore esatto con un’interpolazione lineare tra i due dati (con indici corrispondenti all’intero prima e dopo di Ik ), per cui I40p = (10+1)40 /100 = 4.4. Quindi il 40-esimo percentile è compreso tra il quarto e il quinto dato, per interpolazione otteniamo: 40-esimo percentile = 96.3+(97-96.3)0.4 = 96.58 kbit/s 2b) Diagramma rami e foglie: con n = 10 si possono scegliere 3 rami Rami Foglie 8 9.3 9 4.9 7.0 6.3 3.6 10 0.0 5.6 0.5 1.1 3.0 Pag.1/8 Si noti che il diagramma rami e foglie non è particolarmente efficace in questo caso, in quanto la distribuzione sembrerebbe particolarmente asimmetrica, mentre non lo è in realtà. Un’appropriata scelta delle classi per un istogramma ne mostrerebbe la simmetria (che verrà confermata dal grafico di probabilità). 2c) Si riportano in tabella i valori dei dati ordinati e la corrispondente frequenza cumulativa osservata Normal Probability Plot x(j) F(j)=(j-0.5)/n 89.3 0.05 93.6 0.15 94.9 0.25 96.3 0.35 97 0.45 100 0.55 100.5 0.65 101.1 0.75 103 0.85 105.6 0.95 0.95 0.90 0.75 Probability j 1 2 3 4 5 6 7 8 9 10 0.50 0.25 Dal grafico di probabilità normale, che ha una andamento abbastanza lineare, possiamo stimare che i dati seguano una distribuzione gaussiana. Comunque 10 dati sono troppo pochi per uno studio esaustivo del tipo di distribuzione statistica. 0.10 0.05 90 92 94 96 98 Data 100 102 104 106 Frequenza assoluta 2d) Per disegnare il box-plot dei dati dobbiamo innanzitutto calcolare la mediana e il primo e terzo quartile. I 10 dati ordinati sono X [kbit/s]: 89.3 93.6 94.9 96.3 97.0 100.0 100.5 101.1 103.0 105.6 La mediana è il 50-esimo percentile, per cui Imediana = (10+1)50 /100 = 5.5, quindi la mediana è data dalla media tra il quinto ed il sesto dato. Mediana= (97+100)/2 = 98.5 kbit/s Il primo quartile è il 25-esimo percentile, per cui I1Q = (10+1)25 /100 = 2.75, quindi il primo quartile è compreso tra il secondo e il terzo dato. Per interpolazione otteniamo: 4 primo quartile= 93.6+(94.9-93.6)0.75 = 94.575 kbit/s = Q1 Il terzo quartile è il 75-esimo percentile, per cui I3Q = (10+1)75 /100 = 8.25, quindi il terzo quartile è 3 compreso tra l’ottavo e il nono dato. Per interpolazione otteniamo: terzo quartile= 101.1+(103-101.1)0.25 = 101.575 kbit/s = Q3 2 La dinamica interquartile vale DIQ= Q3-Q1= 7 kbit/s I baffi si possono estendere fino a 1.5DIQ = 10.5 kbit/s, quindi fino a 94.575-10.5= 84.075 kbit/s e 1 101.575 +10.5= 112.075 kbit/s. Minimo dato=89.3 kbit/s. Massimo dato=105.6 kbit/s 0 Sia nella parte inferiore che in quella superiore95tutti i dati sono compresi105 nei baffi, che dunque terminano 85 90 100 110 all’ultimo dato compreso nell’insieme dei dati ordinati (estremi del range). 1 88 90 92 94 96 98 Valori di x 100 102 104 106 108 Pag.2/8 Esercizio 2 (tempo stimato 25 m) (svolgere su questo foglio e sul retro) 2) 2a) 2b) 2c) 2d) Si consideri un flusso di trasmissione dati tra due PC con bit error rate costante, pari a 10-8, in cui i singoli errori si possono considerare completamente scorrelati (non si presentano burst di errori). Che tipo di distribuzione può descrivere la variabile casuale “numero di errori su n bit”? Spiegare i motivi della propria scelta. Quanto vale la probabilità che su 108 bit trasmessi ci sia al massimo 1 errore? Il sistema di trasmissione funziona a “pacchetti” di 108 bit. Un pacchetto è considerato “corretto” se contiene al massimo 1 bit errato. Quanto vale la probabilità che su 10 pacchetti esattamente 8 siano “corretti”? Un tipo di bullone pesa mediamente 20 g, con varianza 1 g2. Quanto vale la probabilità che una confezione da 100 bulloni pesi più di 2010 g? 2a) La variabile casuale “numero di errori” segue una distribuzione poissoniana. Infatti in questo caso si parte da un processo di Bernoulli (un bit può essere solo giusto o sbagliato), con una probabilità di “successo” (bit errato) molto bassa ed un numero molto alto di estrazioni. Inoltre gli errori si possono considerare scorrelati. Siamo quindi nelle condizioni in cui si può considerare valido il limite per n→ di una distribuzione e x binomiale: è possibile dimostrare che f ( x) , x 0,1,2... si ottiene matematicamente dalla x! distribuzione binomiale quando il numero di estrazioni n è molto alto e la probabilità di successo p è molto bassa, con = np. 2b) Su 108 bit il valor medio di errore vale = 10-8 errori/bit 108 bit= 1. La probabilità di avere al massimo 1 errore è pari a e 0 e 1 e 110 e 111 P(x≤1)= P( x 0) P( x 1) 36.8%+36.8%=73.6 % 0! 1! 0! 1! 2c) In questo caso utilizziamo una distribuzione binomiale, dato che ogni prova è un processo di Bernoulli (il pacchetto può essere ricevuto in maniera corretta oppure non corretta), le prove sono indipendenti e la probabilità di successo in ogni prova è costante p =0.736. La probabilità che su 10 pacchetti (n=10) esattamente 8 siano corretti (x=8) vale: n P(8 pacchetti " corretti" ) p 8 (1 p) n 8 27.0 % 8 2d) La distribuzione di probabilità del valor medio del peso di 100 bulloni è sicuramente ben approssimata da una distribuzione normale (teorema del limite centrale). Per cui calcoliamo la probabilità tramite standardizzazione, considerando che con =100×20 g =2000 g e 2=100×1 g2 da cui =10 g . 2010 2010 2000 P(x>2010)= P z P z P( z 1) P( z 1) 15.9 % 10 Pag.3/8 Esercizio 3 (tempo stimato 25 m) (svolgere su questo foglio e sul retro) 3) Si desidera verificare la capacità di carica di un modello di batteria per cellulare. I valori misurati per 10 batterie sono: C = 620, 664, 641, 612, 637, 651, 623, 609, 635, 654 [mAh]. La casa produttrice dichiara una capacità di carica media di 650 mAh. La deviazione standard tipica della capacità di carica di una batteria è pari al 5 % del suo valor medio. 3a) Si dia una definizione di Potenza di un test statistico. 3b) Si effettui un test statistico, con livello di significatività pari all’1 %, con lo scopo di verificare se la carica della batteria è inferiore a quella dichiarata dalla casa produttrice. Si utilizzi la varianza tipica. 3c) Quanto vale il valore P del test effettuato? 3d) Decidiamo di non fidarci della varianza dichiarata dalla casa produttrice ed effettuiamo quindi un nuovo test, basandoci sempre sui dati/valori disponibili. Possiamo in questo caso giudicare non attendibile la capacità di carica dichiarata dalla casa, sempre con livello significatività pari all’1 %? 3a) La potenza di un test statistico è la probabilità di rifiutare l’ipotesi nulla quando questa è falsa. È uguale a 1- la probabilità di errore di tipo II: Potenza = 1 - = 1 - P(errore di tipo II) = 1 - P(accettare H0 quando H0 è falsa) La potenza è un parametro che ci descrive la capacità del test di rivelare le differenze della realtà rispetto all’ipotesi H0. 3b) Calcoliamo il valore medio delle 10 misure effettuate (media campionaria): 1 n X X i 634.6 mAh n i 1 Effettuiamo quindi il test statistico richiesto (test Z, in quanto vogliamo verificare il valor medio di una popolazione a varianza nota, = 5%×650 mAh= 32.5 mAh). Seguiamo gli 8 passi descritti nel libro di testo. 1. Il parametro di interesse è il la capacità di carica media 2. H0: = 650 mAh 3. H1: < 650 mAh (il test è a un lato solo, in quanto vogliamo dimostrare che la batteria ha una carica inferiore a quella dichiarata) 4. livello di significatività richiesto = 0.01 (attenzione, su un solo lato) 5. La statistica di test è la statistica Z: z0 X X X / n 6. Rifiutiamo H0 se Z < Z = -2.326. (questo risultato si ricava dalla tabella della funzione cumulativa in corrispondenza di un valore di probabilità ) 7. Calcoliamo quindi z0, z 0 X X X / n 634.6 650 32.5 / 10 1.50 8. Conclusione: dato che z0=-1.50 > -2.326 non possiamo rifiutare l’ipotesi nulla con livello di significatività 0.01: non c’è abbastanza evidenza che l’ipotesi nulla sia falsa. La carica della batteria dichiarata dalla casa produttrice, secondo questo test, deve dunque essere ritenuta attendibile. 3c) Il valore P, che corrisponde al livello di significatività di soglia tra l’accettazione ed il rifiuto di H0, si può ricavare direttamente dalla tabella dei valori della funzione cumulativa: ZP = z0 = -1.50, per cui il valore P = (z0)=6.7 %. Pag.4/8 L’interpretazione di questo valore è che l’ipotesi nulla sarebbe stata dichiarata falsa per qualsiasi livello di significatività maggiore del 6.7 %. In questo caso con = 1 % non si è potuto rifiutare H0. 3d) Ripetiamo ora il test, non fidandoci della varianza media. Dovremo utilizzare la varianza dei dati disponibili nel campione selezionato. Il numero di gradi di libertà è = n – 1 = 9. Calcoliamo la deviazione standard campionaria. s(X)= 1 n X k X 2 =18.5 mAh n 1 k 1 Effettuiamo quindi un test t (verifica del valor medio con varianza non nota). 1. Il parametro di interesse è il la capacità di carica media 2. H0: = 650 mAh 3. H1: < 650 mAh (il test è a un lato solo, in quanto vogliamo dimostrare che la batteria ha una carica inferiore a quella dichiarata) 4. livello di significatività richiesto = 0.01 (attenzione, su un solo lato) 5. La statistica di test è ora la statistica t: t 0 X X sX s/ n 6. Rifiutiamo H0 se t0 < -t,9 = -2.821. (questo risultato si ricava dalla tabella dei punti percentuale della distribuzione t, con = 9) 7. Calcoliamo quindi t0, t 0 X X 634.6 650 2.63 sX s/ n 18.5 / 10 8. Conclusione: dato che t0 =-2.63 > -2.821 non possiamo ancora rifiutare l’ipotesi nulla con livello di significatività 0.01. (in questo caso la soglia di rifiuto è molto vicina e magari con qualche campione in più si riuscirebbe a realizzare un test che smentisca l’ipotesi nulla, anche con = 0.01). Pag.5/8 Esercizio 4 (tempo stimato 30 m) (svolgere su questo foglio e sul retro) 4) Un recipiente cilindrico con base circolare di raggio r e altezza h contiene azoto (N2) alla pressione p=5 kPa, nota con incertezza trascurabile. 4a) La misurazione dell’altezza del recipiente è stata ripetuta più volte, fornendo i seguenti risultati: h=[32.00, 32.20, 29.99, 31.31, 33.00, 32.00, 30.00] cm (7 misure ripetute) Si ricavi la misura hu(h) 4b) La temperatura del sistema risulta =127 °C con U()=10 °C per k=2.5. Il raggio interno del recipiente è stato stimato r =30 cm, con arrotondamento a 1 cm. La costante molare dei gas vale R=8.31 Jmol-1K-1 con incertezza relativa all’1.7 %. Si ricavi la misura del numero di moli di gas n presenti nel recipiente, supponendo applicabile l’equazione dei gas perfetti pV=nRT. Se ne esprima l’incertezza in notazione concisa. 4a) Dalle n=7 misure ripetute, si ricava un valor medio h= h 1 n hi =31.50 cm n i 1 e una incertezza di categoria A u(h)=uA(h)= n 1 hi h nn 1 i 1 2 =0.43 cm La misura è h=31.50 0.43 cm. 4b) Dalla legge dei gas perfetti, pV=nRT, si ricava il numero di moli n= pV/(RT), dove il volume del cilindro vale V=h×r2. Secondo questa misurazione indiretta, il numero di moli è dunque espresso da n phr 2 . RT Per ottenere il valore di n, sostituiamo nella sua espressione i valori dati : R=8.31 J mol-1K-1 T=(127+273.15) K(127+273) K=400 K 3 p=5 kPa=5×10 Pa r=30.0 cm=0.3 m h=31.50 cm phr 2 0.134 mol RT Dato che l’equazione della misura è una produttoria delle grandezze d’ingresso, l’incertezza relativa dell’uscita è semplicemente legata alle incertezze relative degli ingressi dall’espressione n= ur(n)= u r2 p u r2 h 4u r2 r u r2 R u r2 T u r2 h 4u r2 r u r2 R u r2 T ur(p)0 (incertezza “trascurabile”, come dichiarato nel testo) Calcoliamo le incertezze relative dei singoli ingressi: ur(R)=1.7 % ur(T)=u(T)/T=[U(T)/k]/T=[4 K]/(400 K)=1 % La misura del raggio è stata arrotondata, per cui è affetta da una incertezza di quantizzazione u(r)=r/ 12 2.9 mm e quindi l’incertezza relativa sul raggio risulta ur(r)=u(r)/r=[2.9×10-3/3×10-1] = 0.97 %. ur(h)= u(h)/h=0.43 cm/31.5 cm 1.4% Da queste si ottiene l’incertezza relativa su n: Pag.6/8 ur(n)= u r2 h 4u r2 r u r2 R u r2 T 1.96 4 0.94 2.89 1% 3.1 % e quindi una incertezza assoluta u(n)=ur(n)×n=4.2×10-3 mol La misura indiretta di n espressa in notazione concisa è infine n=0.134(42) mol. Pag.7/8 Esercizio 5 (tempo stimato 15 m) (svolgere su questo foglio e sul retro) 5a) 5b) 5c) Ripetibilità, riproducibilità, stabilità: si forniscano le definizioni di queste 3 caratteristiche di una misura. Si facciano 3 esempi specifici, anche con dei valori numerici, che illustrano i 3 concetti del punto 5a). Dopo avere indicato l’espressione analitica da utilizzare e dopo averne brevemente spiegato il suo significato e utilità, si trasformino in dBm i seguenti valori di potenza elettrica: P1=16 W; P2=125 nW; P3=20 W. 5a) Vedi Libro e Appunti del Corso. 5b) Vedi Libro e Appunti del Corso. 5c) P(dBm)=10log10[(P(W)/(1 mW)] I tre valori specifici sono dunque P1=16 W=4×4×(1 W)=+42 dBm; P2=125 nW=(1 µW)/8=-39 dBm; P3=20 W=2×10×(1 µW)=-17 dBm. Pag.8/8