Problemi sui test di ipotesi per la media Problema M1 Un costruttore produce un modello di lampada che ha una vita tipica di 1600 ore. Sulla popolazione (infinita) di tali lampade si può definire una variabile causale X che assume, per ciascun esemplare, valore uguale alla vita espressa in ore. Dai dati storici della produzione si è individuato che la variabile X presenta, per l'intera popolazione, un valore della media pari a 1600 ed un valore della deviazione standard pari a 120. µ = 1600 ; σ = 120 Il costruttore vuole verificare se l’invecchiamento della linea di produzione possa aver determinato una variazione della media di tale variabile X tale da rendere necessaria una manutenzione straordinaria dei macchinari. Si considera negativa sia la diminuzione della media (minore qualità), sia l’aumento della media (minore turn-over delle lampade già installate con conseguente riduzione del mercato). Si vuole condurre il test con una fiducia del 96% (α = 4%). Allo scopo viene prelevato un campione di 100 lampade da cui si determina il valore della media campionaria che risulta pari a 1570. L’ipotesi principale che viene assunta è: H0 : µ = µ0 = 1600 ed il test viene svolto con la statistica campionaria Z: Z= X n − µ0 σ n che presenta una distribuzione di tipo "normale standardizzata". I valori della X ricavati dal campione di 100 elementi portano a: X n = 1570 Dato che l'ipotesi è del tipo "µ = µ0" si esegue un test di tipo "bilaterale" (o "a 2 code") Dalle tabelle si ricavano i valori critici della Z per α = 0,04 che, per la simmetria della distribuzione, sono di uguale valore assoluto e di segno opposto : zc inf = - 2,05 , zc sup = + 2,05 La regione di rifiuto della H0 è pertanto: Z < zc inf oppure Z > zc sup Determiniamo il valore della Z corrispondente ai dati del campione ricavando: Z= X n − µ0 1570 − 1600 ⇒ zn = = − 2,5 σ 120 10 n Dato che zn cade nella regione di rifiuto inferiore Z < zc richiesta: inf posso rifiutare H0 con la fiducia la media della variabile X per l'intera popolazione non è uguale a 1600. Come conseguenza del rifiuto eseguito è possibile sostenere che la vita tipica delle lampade prodotte non è più di 1600 ore. Se si fosse richiesta una fiducia del 99% (α = 1%) nel rifiuto di H0 si sarebbero trovati i valori critici zc inf = - 2,58 ; zc sup = + 2,58 Dal campione si è ricavato un valore di zn = -2,5 che sarebbe rimasto nella regione di non rifiuto di H0, pertanto non sarebbe stato possibile rifiutare H0 con la fiducia richiesta ed il test non avrebbe dato risultati utili. Problema M2 Il costruttore del problema precedente garantisce che le lampade da lui prodotte hanno una vita tipica superiore a 1570 ore. Un importante cliente ritiene che ciò non sia vero e richiede al costruttore una verifica. Il costruttore preleva un campione di 100 lampade e organizza un test per convincere il cliente che le sue supposizioni sono prive di fondamento. Sulla popolazione (infinita) delle lampade si definisce anche in questo caso una variabile causale X che assume, per ciascun esemplare, valore uguale alla vita espressa in ore. Dai dati storici della produzione si è individuato che la variabile X presenta una deviazione standard per l'intera popolazione σ = 120. L'ipotesi principale che viene sottoposta al test è: H0 : µ < µ0 = 1570 ed il test viene svolto, con una fiducia richiesta del 95%, utilizzando la statistica campionaria Z: Z= X n − µ0 σ n che presenta una distribuzione di tipo "normale standardizzata". I valori della X ricavati dal campione di 100 elementi portano a: X n = 1591 Dato che l'ipotesi è del tipo "µ < µ0" si esegue un test di tipo "unilaterale" (o "a 1 coda") Dalle tabelle si ricava il valore critico della Z per α = 0,05: zc sup = + 1,645 La regione di rifiuto della H0 è pertanto: Z > zc sup Determiniamo il valore della Z corrispondente ai dati del campione ricavando: Z= X n − µ0 1591 − 1570 ⇒ zn = = + 1,75 σ 120 10 n Dato che zn cade nella regione di rifiuto Z > zc sup posso rifiutare H0 con la fiducia richiesta: la media della variabile X per l'intera popolazione non è minore o uguale a 1570. Il risultato del test mostra al cliente che i suoi dubbi sulla qualità delle lampade prodotte non sono plausibili, e lo fa con una fiducia del 95%. Problema M3 Un costruttore afferma che le funi in acciaio di sua produzione hanno un carico di rottura non inferiore a 8000 N, ma un cliente teme che tale valore sia ottimistico e decide di acquistare una campionatura con cui verificare personalmente l’affermazione del costruttore con una fiducia del 95% per il test. Sulla popolazione (infinita) delle funi si definisce una variabile causale X che assume, per ciascun esemplare, valore uguale al carico di rottura espresso in newton ( N ). L'ipotesi principale che viene sottoposta al test è: H0 : µ ≥ µ0 = 8000 Si acquistano 6 funi e si determinano la media campionaria e la varianza campionaria corretta: X n = 7750 ; S n2 = 21025 ⇒ S n = 145 Dato che il campione è di soli 6 elementi il test viene condotto con la fiducia richiesta del 95%, utilizzando la statistica campionaria T: T= X n − µ0 Sn n che presenta una distribuzione di tipo "t di Student". Dato che l'ipotesi è del tipo "µ > µ0" si esegue un test di tipo "unilaterale" (o "a 1 coda") Il campione ha n = 6 pertanto si usa la t di Student con 5 gradi di libertà: dalle tabelle si ricava il valore critico della T per α = 0,05 che risulta: tc inf = - 2,015 La regione di rifiuto della H0 è pertanto: T < tc inf Dai dati del campione si ricava: T= X n − µ0 7750 − 8000 ⇒ tn = = − 4,22 Sn 145 6 n Dato che tn cade nella regione di rifiuto T < tc inf posso rifiutare H0 con la fiducia richiesta: la media della variabile X per l'intera popolazione non è maggiore o uguale a 8000. Come conseguenza del rifiuto di H0 si può sostenere, con il 95% di fiducia, che la affermazione del costruttore sul fatto che il carico di rottura delle sue funi è non inferiore a 8000 newton non è corretta. Problema M4 Una cooperativa di tassisti vuole verificare il consumo urbano di un nuovo modello di vettura che il costruttore afferma essere non superiore a 5 l/100km. Vengono acquistate 8 vetture e si procede ad una sperimentazione che si vuole condurre, con un livello di fiducia del 99%, allo scopo di evitare l’acquisto di un “bidone” che consuma più di quanto reclamizzato. Si definisce una variabile casuale X che assume, per ciascun elemento della popolazione infinita delle auto, valore uguale al valore del consumo urbano espresso in litri / 100 km. In conseguenza dello scopo del test si definisce la seguente ipotesi principale: H0 : µ ≤ µ0 = 5 Condotta la sperimentazione su strada si determinano la media campionaria e la varianza campionaria corretta relative al consumo urbano delle vetture: X n = 5,5 ; S n = 0,6 Dato che il campione è di soli 8 elementi il test viene condotto con la fiducia richiesta del 99%, utilizzando la statistica campionaria T: T= X n − µ0 Sn n che presenta una distribuzione di tipo "t di Student". Dato che l'ipotesi è del tipo "µ < µ0" si esegue un test di tipo "unilaterale" (o "a 1 coda") Il campione ha n = 8 pertanto si usa la t di Student con 7 gradi di libertà: dalle tabelle si ricava il valore critico della T per α = 0,01 che risulta: tc sup = 2,998 . La regione di rifiuto della H0 è pertanto: T > tc sup = 2,998 Dai dati del campione si è ricavato: X n = 5,5 ; S n = 0,6 da cui si ottiene: T= X n − µ0 5,5 − 5 ⇒ tn = = + 2,35 Sn 0,6 8 n Dato che tn NON cade nella regione di rifiuto T > tc sup = 2,998 il risultato del test non permette di rifiutare H0 con la fiducia richiesta. Non si è pertanto autorizzati a scartare l’ipotesi secondo cui il consumo delle vetture è non superiore a 5 l/100km. Problema M5 Un costruttore di trasformatori deve acquistare del filo di rame per avvolgere le bobine da un nuovo fornitore. Egli vuole verificare se il diametro tipico del filo è realmente di 1,54 mm pertanto ordina una campionatura di 26 matasse per condurre, con una fiducia del 95%, un test “a due code” in quanto intende scartare la eventuale fornitura sia per un diametro inferiore, sia per un diametro superiore al pattuito. Il costruttore di trasformatori definisce una variabile casuale X che assume, per ciascun elemento della popolazione infinita delle matasse di filo, valore uguale al valore medio del diametro del filo espresso in centesimi di millimetro e misurato in 5 punti distanti più di un metro l'uno dall'altro. L'ipotesi principale che viene sottoposta al test è: H0 : µ = µ0 = 154 Dato che non si conosce la varianza della X e che il campione è di 26 elementi il test viene condotto con la fiducia richiesta del 95%, utilizzando la statistica campionaria T: T= X n − µ0 Sn n che presenta una distribuzione di tipo "t di Student". Dato che l'ipotesi è del tipo "µ = µ0" si esegue un test di tipo "bilaterale" (o "a 2 code") Il campione ha n = 26 pertanto si usa la t di Student con 25 gradi di libertà: dalle tabelle si ricavano i due valori critici della T per α = 0,05 che risultano: tc inf = -2,060 e tc sup = 2,060 La regione di rifiuto della H0 è pertanto: T < tc inf = -2,060 oppure T > tc sup = 2,060 Dal campione si ricavano i seguenti valori: X n = 160 ; S n = 23 pertanto: T= X n − µ0 160 − 154 ⇒ tn = = 1,330 Sn 23 26 n Dato che il valore della T non appartiene alla regione di rifiuto non è possibile rifiutare H0 con la fiducia richiesta pertanto: il costruttore di trasformatori non è autorizzato ad affermare che il diametro tipico del filo sia diverso da 1,54 mm. Problema M6 Un costruttore realizza una presa BNC, indicata come "Mod. A", che presenta un valore tipico della perdita di 0,2 dB (a 3 GHz). Un campione di 30 prototipi realizzati con un procedimento meno costoso, che indichiamo come "Mod. B", sembra evidenziare una perdita maggiore: è un fatto accidentale oppure il nuovo processo porta a realizzare prodotti scadenti? Si desidera dare una risposta con una fiducia del 95%. Notiamo che i valori delle perdite sono espressi in dB, cioè in una scala non lineare. Poiché le variabili casuali di cui abbiamo studiato le distribuzioni sono lineari è necessario operare una linearizzazione della scala al momento in cui si definisce la variabile casuale con cui effettuare il test: Indicando con Vin e Vout rispettivamente il valore efficace del segnale in ingresso ed in uscita dalla presa, il valore in dB della perdita della presa, che indichiamo PdB, viene definito come PdB = 20 log10 Vin Vout Definiamo quindi una variabile casuale X che assume, per ciascuna presa, valore uguale al rapporto fra Vin e Vout misurato a 3 GHz. Dopo avere definito la variabile casuale X possiamo valutare il suo valore medio µA per la popolazione delle prese "Mod. A" assumendo che esso coincida con il valore che corrisponde alla perdita tipica di 0,2 dB ricavabile dai dati storici della produzione: ⎛ 0, 2 ⎞ ⎜ ⎟ V V PdB = 20 log10 in = 0,2 ⇒ in = 10⎝ 20 ⎠ = 1,023 Vout Vout da cui: µA = 1,023 Il test verrà condotto allo scopo di verificare se il nuovo processo produttivo provoca un aumento della perdita a 3 GHz rispetto a quella tipica del Mod. A. La ipotesi principale che viene elaborata e sottoposta al test è la seguente: H0 : µ < µ0 = 1,023 La fiducia richiesta al test è pari al 95% pertanto α = 0,05. Dato che non si conosce la varianza della X il test viene condotto con la fiducia richiesta del 95%, utilizzando la statistica campionaria T: T= X n − µ0 Sn n che presenta una distribuzione di tipo "t di Student". La elevata numerosità del campione (n = 30) avrebbe permesso di approssimare la T con una distribuzione normale standardizzata, ma si è preferito usare la soluzione rigorosa. Dato che l'ipotesi è del tipo "µ < µ0" si esegue un test di tipo "unilaterale" (o "a 1 coda") Il campione ha n = 30 pertanto si usa la t di Student con 29 gradi di libertà: dalle tabelle si ricava il valore critico della T per α = 0,05 che risulta: tc sup = 1,699 La regione di rifiuto della H0 è pertanto: T > tc sup = 1,699 Le misurazioni condotte sui 30 elementi "Mod. B" del campione hanno dato i seguenti risultati: frequenza Vin / Vout misurato a 3 GHz 3 1,025 7 1,030 10 1,035 7 1,040 3 1,045 Elaborando i dati emersi dalle misurazioni condotte sui prototipi "Mod. B" del campione si ottengono i seguenti risultati: 1 Xn = n ∑X n j ⇒ j =1 ⇒ Xn = 3 ⋅1,025 + 7 ⋅1,030 + 10 ⋅1,035 + 7 ⋅1,040 + 3 ⋅1,025 = 1,035 30 1 S = n −1 ∑ (X e 2 n n − Xn) ⇒ 2 j j =1 3 ⋅ (− 0,010 ) + 7 ⋅ (− 0,005) + 10 ⋅ (0 ) + 7 ⋅ (+ 0,005) + 3 ⋅ (+ 0,010 ) ⇒ S = = 29 0,00095 = = 0,00003275 29 2 2 2 2 2 n da cui: S n = S n2 ⇒ ⇒ S n = 0,00003275 = 0,0057 Dai dati del campione è quindi possibile esprimere anche la perdita (media campionaria) della presa "Mod. B" in dB ottenendo: PdB = 20 log10 Vin ⇒ Vout ⇒ PdB = 20 log10 1,035 ≈ 0,3 dB 2 Dal campione si sono ricavano i seguenti valori: X n = 1,035 ; S n = 0,0057 pertanto: T= X n − µ0 1,035 − 1,023 ⇒ tn = = + 11,5 0,0057 Sn 30 n Dato che tn cade nella regione di rifiuto T > tc sup posso rifiutare H0 con la fiducia richiesta: la media della variabile X per la popolazione futura "Mod. B" non è minore o uguale a 1,023. Come conseguenza del rifiuto di H0 si può sostenere, con il 95% di fiducia, che il nuovo processo produttivo provoca una diminuzione della qualità del prodotto. Il fatto che il campione dei 30 prototipi mostri una perdita di circa 0,3 dB non è dovuto alla aleatorietà del campionamento, ma appare plausibile sostenere che è provocato da una sistematica diminuzione delle qualità del prodotto. _______________________________ Qualora si volesse individuare l’intervallo di confidenza al 95% per la perdita della presa BNC Mod. B si opera nel seguente modo: dalla tabella della t di Student con 29 gradi di libertà si individuano i due valori dei quantili che lasciano il 2,5% in ciascuna delle due code: tQinf = − 2,045 e tQsup = + 2,045 Xn + Sn t Qinf ≤ µ ≤ X n + Sn t Qsup n n 0,0057 0,0057 1,035 + ⋅ (− 2,045) ≤ µ ≤ 1,035 + ⋅ (+ 2,045) 5,47 5,47 1,033 ≤ µ ≤ 1,037 da cui si ricavano le due espressioni equivalenti: 1,033 ≤ µ ≤ 1,037 e 0,28 dB ≤ µ ≤ 0,32 dB Problema M7 Il signor Pinco Pallo, assemblatore di Personal Computer, deve acquistare una grande partita di memorie RAM. Da riviste specializzate ha appreso che il costruttore delle memorie ha recentemente migliorato il processo produttivo ed il valore tipico dell’assorbimento di corrente del suo prodotto è passato da 50 mA a 45 mA. Pinco Pallo vuole assicurarsi che le RAM acquistate siano della nuova serie e non “fondi di magazzino” pertanto organizza un test statistico su un campione di 25 elementi. Preliminarmente definisce una variabile casuale X che assume valori uguali alla intensità della corrente assorbita dal chip di memoria misurata in mA. Fissa un valore del rischio di prima specie α = 1% e accetta un rischio di errore di seconda specie β ≤ 5% - In altri termini si può dire che fissa la fiducia del test al 99% e richiede una potenza minima del 95% contro l’ipotesi alternativa. Nella definizione della ipotesi principale e di quella alternativa Pinco Pallo opera con l'obiettivo di poter ottenere informazioni utili ad evitare l'acquisto di un prodotto obsoleto: con quest'ottica l'ipotesi principale, che si cerca di rifiutare, è quella per cui il valore tipico dell’assorbimento di corrente è di 45 mA. Le ipotesi che Pinco Pallo elabora sono pertanto le seguenti: H0 : µ ≤ µ0 = 45 α = 1% H1 : µ = µ1 = 50 β ≤ 5% Dal campione si ricavano sia la media campionaria sia la deviazione standard campionaria corretta per la variabile casuale X: X n = 48 ; S n2 = 25 ⇒ Sn = 5 Dato che il campione è di 25 elementi e non è conosciuta la varianza σ2 il test viene condotto mediante la variabile casuale T= X n − µ0 Sn n che segue la distribuzione t di Student. Il campione ha n = 25 pertanto la t di Student è con 24 gradi di libertà. Data la forma della ipotesi H0 il test è di tipo "unilaterale" e dalle tabelle si ricava il valore critico della T per la H0 che risulta tc0 = + 2,492 La regione di rifiuto della H0 è pertanto T > tc0 = + 2,492 µ 0 − µ1 è possibile ricavare il valore critico della t di Student Sn n relativo alla ipotesi H1 che risulta tc1 = - 2,508: ricordando che tc1 = tc 0 + Dal valore della tc1 = - 2,508:si individua il corrispondente valore di β che risulta compreso fra 0,005 e 0,01. Da questi valori si ricava la potenza del test (potenza = 1 – β ): il test può essere condotto in quanto la potenza che esprime contro H1 è superiore al minimo richiesto nella specifica del test. Risultato del test Il valore tn della variabile T calcolata a partire dai valori corrispondenti al campione esaminato è: T= X n − µ0 48 − 45 ⇒ tn = = +3 Sn 5 25 n Il valore tn della T cade nella regione di rifiuto della H0 e, con una fiducia del 99%, si può sostenere che le RAM acquistate hanno un assorbimento tipico maggiore di quello dei dispositivi prodotti con il nuovo processo. Pinco Pallo rifiuterà la fornitura delle memorie che gli stavano per essere vendute come prodotte mediante il nuovo processo.