STATISTICA E CALCOLO DELLE PROB. Mercoledì 21 novembre 2012 Prof. Cesare Svelto Tempo a disposizione 2 ore 00 min (30+25+20+15+30) 1a P.I. AA 2012/2013 Aula VS.8 ore 13.15 Cognome e nome: ___________________________________ _____________________ Matricola e firma __ __ __ __ __ __ (stampatello) _____________________(firma leggibile) Esercizi svolti (almeno parzialmente): 1 2 3 4 5 (8+7+7+4+7 = 33p) (crocettare) N.B. Si devono crocettare tutti i sottopunti cui si è almeno parzialmente risposto [e.g. 1a), 1c), 1d) etc.]. Occorre svolgere tutti gli esercizi, almeno parzialmente, per poter consegnare il compito. SOLUZIONI Esercizio 1 (tempo stimato 30 min) (svolgere su questo foglio e sul retro) 1) Si viene incaricati di effettuare un test statistico su una ditta che imbottiglia acque minerali. Si vuole controllare l’esatto livello medio di acqua presente nelle bottiglie, dichiarato 1.5 l dalla ditta. È noto che le macchine imbottigliatrici hanno una deviazione standard del riempimento = 10 ml. Si esaminano quindi due casse da 6 bottiglie e ne misuriamo il contenuto, ottenendo i seguenti valori: Litri di acqua: 1.493, 1.503, 1.500, 1.483, 1.479, 1.496, 1.467, 1.501, 1.495, 1.502, 1.475, 1.486. 1a) Si calcolino media e varianza campionaria e si disegni il box-plot dei dati. 1b) Si riportino i dati in un diagramma rami-e-foglie e da questo si ottenga un istogramma dei dati. 1c) Si effettui un test statistico allo scopo di valutare se il riempimento delle bottiglie è diverso da quello dichiarato, con livello di significatività del 5 %. 1a) media campionaria = x 1 n xi =1.49 l n i 1 n varianza campionaria = s 2 (x x) i 1 i n 1 2 1.4 10-4 l2 da cui la deviazione standard campionaria vale s 11.8 ml L’insieme dei dati ordinati, per valori crescenti, è: Litri di acqua: 1.467, 1.475, 1.479, 1.483, 1.486, 1.493, 1.495, 1.496, 1.500, 1.501, 1.502, 1.503. BOX PLOT: min = 1.467 l Q1 = 1.480 l M = 1.494 l Q3 = 1.50075 l max =1.503 l DIQ=Q3-Q1=0.02075 l I baffi comprendono tutti i punti rimanenti, in quanto tutti i valori misurati sono contenuti all’interno di 1.5 volte la dinamica interquartile dal box. _______ Pag. 1/8 Esercizio 1 (continua) 1b) Dai 12 dati ordinati, possiamo scegliere i valori numerici fino al centesimo di litro come rami/classi e i millesimi di litro come foglie, ottenendo i seguenti : Diagramma rami-e-foglie Istogramma 5 40 Foglie Freq. 7 1 1.47 59 2 1.48 36 2 30 3 20 2 10 frequenza percentuale [%] 1.46 4 frequenza assoluta Rami 1 1.49 356 3 1.5 0123 4 0 0 1.46 1.47 1.48 1.49 1.5 quantità di liquido [l] 1c) Dato che la varianza è nota, si può effettuare un test Z. Seguiamo gli 8 passi descritti nel libro di testo. 1. Il parametro di interesse è la quantità attesa (media µ) di liquido 2. H0: = 1.5 l 3. H1: 1.5 l (il test è a due lati, in quanto espressamente richiesto dal testo: si vuole rivelare una qualsiasi differenza) 4. livello di significatività richiesto = 0.05 5. La statistica di test è la statistica Z: z0 X X X / n 6. Rifiutiamo H0 se z0 > Z/2 = 1.96 oppure z0 < -Z/2 = -1.96 (questi valori si ricavano dalla tabella della funzione cumulativa per una VNS in corrispondenza di un valore di probabilità /2=0.025) 7. Calcoliamo quindi z0, z0 X X X 1.49 1.5 3.46 / n 0.01 / 12 8. Conclusione: dato che z0 = -3.46 < -Z/2 = -1.96 possiamo rifiutare l’ipotesi nulla con livello di significatività 0.05: c’è abbastanza evidenza che l’ipotesi nulla sia falsa e che il riempimento delle bottiglie sia diverso (inferiore in questo caso) al valore dichiarato di 1.5 l. Concludiamo che il livello di riempimento delle bottiglie è significativamente diverso da 1.5 l. _______ Pag. 2/8 Esercizio 2 (25 minuti) (svolgere su questo foglio e sul retro) 2a) 2b) 2c) 2d) Sapendo che la potenza consumata da una lampada al neon segue una distribuzione normale, con valor medio pari a 50 W e varianza di 16 W2, si calcoli la probabilità che l’illuminazione di un’aula, che utilizza 25 di questi neon, richieda più di 1260 W. Questi neon sono abbastanza difettosi, mediamente 1 su 20 non funziona. Quanto vale la probabilità che, appena installati, nel locale ci siano 2 neon non funzionanti? Considerando tutte le aule di una sede universitaria, mediamente si brucia un neon ogni settimana. Giustificando la risposta, si valuti la probabilità che in 4 settimane si bruci più di 1 neon. Dobbiamo prevedere una stima di spesa su 10 anni, per il costo delle sostituzioni dei neon. Supponendo che le condizioni restino inalterate nel tempo, si stimi la probabilità di dover sostituire non più di 530 neon in 10 anni. 2a) Dato che i 25 neon hanno potenze che possiamo considerare statisticamente indipendenti, la variabile (sempre gaussiana) “potenza consumata da 25 neon” avrà valor medio e varianza pari rispettivamente a =2550 W= 1250 W e 2 = 2516 W2 =400 W2 (si vedano gli appunti sulla combinazione lineare di variabili statisticamente indipendenti). Per calcolare la probabilità standardizziamo la variabile casuale gaussiana, e ricorriamo quindi alla tabella dei valori della distribuzione cumulativa (z) per una variabile x normale standard (VNS). Ricordiamo che z è la VNS ricavata da x. 1260 1260 1250 P( x 1260) P z P z P( z 0.5) 1 P( z 0.5) 30.85% 20 2b) Dato che ogni prova è un processo di Bernoulli (il neon o è guasto oppure non lo è, ovvero successo o insuccesso), le prove sono indipendenti e la probabilità di successo in ogni prova è costante, la probabilità di x termosifoni guasti (“successo”) su n segue la distribuzione binomiale, con probabilità di successo p =0.05: n 25 2 P(2 successi su 20 prove ) p x (1 p) n x 0.05 (0.95) 25 2 23 % x 2 n 25 25! 25 24 n! avendo ricordato che e dunque =300 2 1 x x!(n x)! 2 23!2! 2c) In prima approssimazione possiamo utilizzare una statistica poissoniana, in quanto i neon sono molti, ognuno con una probabilità di rottura in un determinato istante molto bassa. Inoltre in prima approssimazione il singolo evento di rottura si può considerare scorrelato dagli altri. e x La funzione di probabilità di una variabile poissoniana X vale f ( x) , x 0,1,2... x! con valor medio = e varianza 2 = . Nel caso considerato, il valor medio vale = 1 neon/settimana 4 settimane = 4 neon. La probabilità che si bruci più di 1 neon in 4 settimane vale: e 4 4 0 e 4 41 P( x 1) 1 P( x 0) P( x 1) 1 1 0.018 0.073 90.9% 0! 1! 2d) Data la complessità del calcolo tramite la formula della poissoniana (che richiederebbe di calcolare e sommare più di 500 probabilità elementari), decidiamo di sfruttare l’approssimazione gaussiana. Valor medio e varianza valgono =2 = = 5210 = 520 (le settimane in un anno sono 52). L’approssimazione è valida in quanto >>5. Calcoliamo quindi la probabilità tramite standardizzazione, considerando che l’approssimazione è più precisa se si sceglie come estremo dell’intervallo di integrazione il valor medio tra l’ultimo valore escluso ed il primo accettato: _______ Pag. 3/8 530.5 530.5 520 P( z 0.46) 67.7 % P( x 530.5) P z P z 520 In effetti il calcolo esatto tramite la distribuzione poissoniana (effettuato a calcolatore) fornisce una probabilità pari a 67.9%, in ottimo accordo con l’approssimazione effettuata. _______ Pag. 4/8 Esercizio 3 (20 minuti) (svolgere su questo foglio e sul retro) 3) Nello studio del prezzo medio di un nuovo modello di laptop si registrano i valori di prezzo al pubblico in 9 negozi, ottenendo una media di 1500 € e una deviazione standard campionaria di 166 €. La casa madre produttrice del televisore dichiara invece un prezzo di vendita al pubblico pari a 1400 €. 3a) Si effettui un test statistico per cercare di dimostrare, con significatività del 5 %, che i negozianti vendono a un prezzo superiore a quello indicato dalla casa madre. Che tipo di test si è svolto, perché, quale è l’esito? 3b) Si calcoli il valore P per il test effettuato. 3a) Non disponendo di un valore di varianza dichiarato dalla casa madre (o da altri), dovremo utilizzare la varianza dei dati disponibili nel campione selezionato. Il numero di gradi di libertà è = n – 1 = 8. La deviazione standard campionaria è s=166 €. Effettuiamo quindi un test t perché dobbiamo eseguire una verifica del valor medio con varianza non nota: 1. Il parametro di interesse è il prezzo medio 2. H0: = 1400 € 3. H1: > 1400 € (il test è a un lato solo, in quanto vogliamo dimostrare che il prezzo di vendita al pubblico è superiore a quello indicato dalla casa madre) 4. livello di significatività richiesto = 0.05 (attenzione, su un solo lato) 5. La statistica di test è ora la statistica t: t 0 X X sX s/ n 6. Rifiutiamo H0 se t0 > t,8 = 1.860. Questo risultato si ricava dalla tabella dei punti percentuale della distribuzione t, con = 8 in corrispondenza di una probabilità = 0.05 7. Calcoliamo quindi t0: t 0 X X 1500 1400 1.807 sX sX / n 166 / 9 8. Conclusione: dato che t0 =1.807 < t,8 = 1.860 non possiamo rifiutare l’ipotesi nulla con livello di significatività 0.05: non c’è abbastanza evidenza che l’ipotesi nulla sia falsa (anche se di poco, non si cade ancora nella regione di rifiuto). Il prezzo di vendita dichiarato dalla casa produttrice, secondo questo test, deve dunque essere ritenuto attendibile (rispetto a quello riscontrato sul mercato) ovvero il prezzo dei negozianti non è superiore (con significatività del 5 %) a quello della casa madre. 3b) Il valore P, che corrisponde al livello di significatività di soglia tra l’accettazione ed il rifiuto di H0, si può ricavare direttamente dalla tabella dei valori della funzione cumulativa (della statistica Z o t a seconda del caso): tP,8 = t0 = 1.807, per cui valore ricavato è Pt < 0.05 = 5 % (minore di poco ma in maniera non quantificabile dalla tabella). L’interpretazione di questo valore è che l’ipotesi nulla sarebbe stata dichiarata falsa per qualsiasi livello di significatività maggiore del 5 %+ con >0 anche se non quantificabile in maniera precisa. In questo caso con = 5 % non si è potuto rifiutare H0. _______ Pag. 5/8 Esercizio 4 (15 minuti) (svolgere su questo foglio e sul retro) 4) Si effettuano misure dell’andamento della tensione nel tempo in uscita da un circuito e si registrano i seguenti valori: Tempo [s] Tensione [V] 1.0 -10.1 1.1 -5.2 1.2 0.1 1.3 5.0 4a) Si disegni il diagramma cartesiano con i punti sperimentali e la corrispondente retta di regressione. 4b) Quanto vale il tasso di crescita c, in unità del Sistema Internazionale, della tensione con il tempo? NOTA: Si ricorda che il coefficiente angolare ed il termine noto della retta di regressione lineare valgono m x y x x y y m x b n n x x n xi yi xi y i 2 i n x xi 2 i 2 i i i i i i 2 2 i i 4a) Scegliamo il tempo come variabile x e la tensione misurata come y, applichiamo le formule riportate nella Nota e otteniamo: m= 50.6 V/s e b=-60.7 V. Il grafico con i punti sperimentali e la retta di regressione ai minimi quadrati è: 15 10 Tensione [V] 5 0 -5 -10 -15 0.7 0.9 1.1 1.3 1.5 Tem po [us] 4b) Il tasso di crescita cercato è esattamente dato dal coefficiente angolare della retta di regressione, vale quindi c=50.6 V/s=50.6×106 V/s. _______ Pag. 6/8 Esercizio 5 (30 minuti) (svolgere su questo foglio e sul retro) 5) Si eseguono 3 misure indipendenti della massa m di una sfera realizzata con un materiale sconosciuto. A) Nella misura A si raggiunge il perfetto equilibrio in una bilancia a due bracci utilizzando un peso campione con massa 31.031 kg noto con incertezza estesa di 15 g al 99.7 %. B) La misura B è letta con una bilancia digitale ideale, con risoluzione 400 g, al valore di 31.2 kg. C) La misura C ricava la massa incognita dal volume e densità della sfera. Si ipotizza che il materiale sconosciuto abbia una densità di massa volumica =10.0(1) kg/dm3 e il diametro della sfera viene misurato pari a D=20 cm “esatti” impiegando un calibro centesimale (che risolve 1/100 di millimetro). 5a) Si ricavi la misura della massa mA e esprimendo l’incertezza tipo a due cifre in notazione compatta. 5b) Si ricavi la misura della massa mB e esprimendo l’incertezza tipo a due cifre in notazione compatta. 5c) Si ricavi l’equazione della misura della massa mC, il suo valore, e la sua incertezza relativa. Si ricavi la misura della massa mC e esprimendo l’incertezza tipo a due cifre in notazione compatta. 5d) Si valuti la compatibilità tra le 3 misure ricavate. Se qualche misura non è risultata compatibile con le altre, si provi a individuarne le possibili ragioni. 5e) Si ricavi la miglior stima della massa m della sfera e la sua incertezza standard. 4a) La massa è mA=31.313 kg. Dall’incertezza estesa U(mA)=15 g con fattore di copertura k=3, per il 99.7 % di confidenza, si ricava l’incertezza tipo u(mA)=U(mA)/k=5 g. La misura è: mA = 31.0310(50) kg 4b) La massa è mB=31.2 kg. Dalla risoluzione mB=400 g si ricava una incertezza di quantizzazione u(mB)=mB/ 12 =120 g. La misura è: mB = 31.200(12) kg 4c) La massa è mC==4/3r3, con r raggio della sfera e dunque l’equazione della misura è mC=4/3D3/8=/6 D3. Sostituendo i valori numerici del caso si ricava mC=41.89 kg. Essendo l’equazione della misura una produttoria degli ingressi, ci conviene ragionare in termini di incertezze relative. Sarà ur(mC)= u r2 9u r2 D . L’incertezza relativa sulla densità è ur()=u()/0.01=1 %. Il diametro D=20 cm=2 dm è misurato con risoluzione L=D=10 m e dunque con incertezza u(D)=D/ 12 3 m. Si ha allora una incertezza relativa ur(D)=u(D)/D(3×10-6)/(2×10-1)=1.5×10-5=10 ppm, che è del tutto trascurabile rispetto all’incertezza relativa sulla densità. Allora ur(mC)ur()=1 % e u(mC)=ur(mC)mC0.42 kg. La misura è: mC = 41.89(42) kg 4d) La compatibilità tra due misure di massa, assunte indipendenti, viene valutata con il criterio di compatibilità standard: m m k u 2 (m ) u 2 (m ) Applicando tale criterio si ricava immediatamente che mA e mB sono tra loro compatibili già per k1.46 (dunque non per k=1 ma per k=2 e k=3) mentre mC è incompatibile sia con mA che con mB. Il valore mC _______ Pag. 7/8 misurato risulta fortemente distante dagli altri due e questo è probabilmente dovuto a una errata stima della densità del materiale della sfera. 4e) La miglior stima della misura si ottiene dalla media pesata delle misure compatibili: mA m 2 B u ( mA ) u ( mB ) mMP= =31.0313 kg31.031 kg 1 1 u 2 ( mA ) u 2 ( mB ) 2 con una incertezza (tipo o standard) della media pesata: u(mMP)= 1 1 1 2 2 u ( P) u ( Pw ) =0.00499 kg5 g mMP=31.013 kg0.005 kg o anche mMP=31.013(50) kg _______ Pag. 8/8