CLAMED STATISTICA APPLICATA Esercizi di preparazione all'esame 1. Sia X ∼ N (−7, 4). (a) Calcolare P (−10, 5 ≤ X ≤ −7, 5); (b) calcolare il valore di x tale che P (X > x) = 0, 1. SOLUZIONE (a) Se si indica con Z un variabile casuale con distribuzione normale standard, si ha P (−10, 5 ≤ X ≤ −7, 5) = P (−1, 75 < Z < −0.25) = Φ(−0, 25) − Φ(−1, 75) = 0, 4013 − 0, 0401 = 0, 361 (b) inoltre ( ) x+7 P (X > x) = P Z > = P (Z > z) = P (Z > 1, 28) = 0, 1 2 quindi x+7 2 = 1, 28 e x = −4, 44. 2. Sia X1 , . . . , X16 un campione i.i.d. con Xi ∼ N (0, 16). (a) Determinare la distribuzione campionaria di (b) calcolare P (−3 < X < 3); (c) calcolare P (−3 < X̄ < 3). X̄ ; SOLUZIONE (a) X̄ ∼ N (0, 1); (b) P (−3 < X < 3) = 0, 5468; (c) P (−3 < X̄ < 3) = 0, 997. 3. Siano sia Y X una variabile casuale con distribuzione normale di media una variabile casuale con distribuzione (a) P (−2 < X < 6); (b) P (X > 0); (c) P (−1, 86 < Y < 2, 896) t di Student con 8 µX = 3 e varianza σ 2 = 16 e gradi di libert. Calcolare: SOLUZIONE (a) P (−2 < X < 6) = 0, 6677; (b) P (X > 0) = 0, 7734; (c) P (−1, 86 < Y < 2, 896) = 0, 94 (questo valore si ricava dalle tavole della distribuzione Student con 8 gradi di libert). 1 t di 4. Un'urna contiene un numero molto elevato di palline. noto che il 30% delle palline nell'urna di colore bianco. Si eettua un campione casuale semplice di numerosit (a) Descrivere la distribuzione campionaria di P, n = 100 dall'urna. la proporzione campionaria di palline bianche nel campione. (b) Calcolare la probabilit approssimata che P assuma un valore maggiore di 0, 35. SOLUZIONE (a) Per il teorema del limite centrale, π e varianza π(1 − π)/n P ha distribuzione asintotica normale con valore atteso dove, in questo caso, π = 0, 3 e n = 100. Si ha quindi P ≈ N (0, 3; 0, 0021). (b) Utilizzando la distribuzione approssimata ricavata nel punto precedente si vede che P (P > 0, 35) ≈ 0, 1378. 5. L'amministratore di una importante compagnia fornitrice di energia elettrica, con un milione di clienti, aerma che almeno l'80% dei sui clienti sono molto soddisfatti del servizio fornito. Allo scopo di vericare questa aermazione un giornale locale eettua un'indagine. Mediante un campionamento casuale semplice vengono selezionati 100 clienti della compagnia e 73 di questi si dichiarano molto soddisfatti del servizio ricevuto. (a) Utilizzare i dati dell'indagine per calcolare una stima puntuale della proporzione di clienti soddisfatti. (b) Calcolare l'errore standard della stima al punto precedente spiegando se la quantit calcolata un valore esatto o, a sua volta, un valore stimato. (c) Mediante un opportuno test di signicativit al livello del 5% vericare l'aermazione dell'amministratore. Riportare: il sistema di ipotesi, la statistica test, le regioni di accettazione e di riuto, il p-value e le conclusioni. (d) Confrontare l'errore standard calcolato al punto (b) con quello utilizzato per il calcolo della statistica test. Sono diversi tra loro? Se s, spiegarne il motivo. SOLUZIONE π la proporzione di clienti soddisfatti, una stima puntuale di π 73 soddisfatti nel campione, ossia π̂ = 100 = 0, 73. (a) Se si indica con di clienti la proporzione (b) L'errore standard per la stima al punto precedente dato da √ SE(π̂) = poich il valore di π non noto π(1 − π) . 100 necessario utilizzare una stima dell'errore standard data da √ d SE(π̂) = π̂(1 − π̂) = 0.0444 100 2 (c) Si vuole vericare il sistema di ipotesi { H0 : π ≥ 0.8 H1 : π < 0.8 ed una statistica test per la verica di questa ipotesi √ d0 (π̂) = SE data da z = (π̂ − 0.8)/SE0 dove 0.8(1 − 0.8) = 0.04. 100 Il valore osservato della statistica test quindi stribuzione normale standard si vede che z = −1.75. p-value=0.04. Inoltre, dalle tavole della di- Possiamo concludere che d dati forniscono un evidenza empirica a favore dell'ipotesi alternativa, ossia contro l'aermazione dell'amministratore. Tale ipotesi statisticamente signicativa ma non altamente signicativa. (d) Gli errori standard calcolati nei punti precedenti sono diversi tra loro in quanto il primo utilizza il vero valore di secondo π, poi stimato attraverso la proporzione campionaria, mentre il calcolato sotto l'ipotesi nulla, e quindi nel caso in cui π = 0.8. 6. Da accordi contrattuali, il numero di unit difettose all'interno di una partita di merce acquistata non pu superare il 15%. L'acquirente vuole vericare mediante un test statistico se la proporzione di pezzi difettosi all'interno di una fornitura supera il limite contrattuale. A questo scopo estrae un campione casuale di 100 unit e 19 di queste risultano difettose. Indicare quali fra i seguenti il sistema di ipotesi appropriato per questo test. (A) H0 : π̂ > .15, H1 : π̂ ≤ .15 (B) H0 : x̄ ≤ .15, H1 : x̄ > .15 (C) H0 : π ≤ .15, H1 : π > .15 (D) H0 : π ≤ .19, H1 : π > .19 (E) H0 : π̂ ≤ .15, H1 : π̂ > .15 (F) H0 : π > .15, H1 : π ≤ .15 SOLUZIONE (C) H0 : π ≤ .15, H1 : π > .15 7. Uno scienziato politico ritiene che le donne siano meno favorevoli degli uomini a politiche di intervento militare. Allo scopo di vericare la validit di questa teoria, lo scienziato sviluppa un questionario nel quale, ai soggetti intervistati, viene chiesto di esprimere la propria opinione, in una scala da 1 a 5 (1= assolutamente contrario , 5= assolutamente favorevole ) riguardo ad ognuno degli interventi militari eettuati dall'Italia negli ultimi 20 anni. Il punteggio di ogni soggetto intervistato ottenuto come somma dei punteggi delle domande. Lo scienziato seleziona casualmente 50 coppie sposate e somministra il questionario ad ognuna delle 100 persone cos individuate. Rispondendo alle seguenti domande, spiegare come lo scienziato pu utilizzare questi dati per vericare la sua teoria. 3 (a) Qual l'unit sperimentale? (b) Da quante popolazioni sono estratte le unit sperimentali? Identicare la/le popolazio- ne/popolazioni. (c) Quante misurazioni sono state eettuate per ogni unit campionaria? Identicare tale/tali misurazione/misurazioni. (d) Denire il parametro/parametri di interesse in questo studio. (e) Specicare un appropriato sistema di ipotesi. (f ) Indicare il test statistico che si ritiene pi appropriato per vericare l'ipotesi del punto precedente e vericare se sono soddisfatti gli assunti sottostanti l'analisi. SOLUZIONE (a) L'unit campionaria (b) In questo caso vi costituita da una coppia sposata. solo una popolazione, composta da coppie sposate. Il testo dell'esercizio non consente di essere pi precisi riguardo altri aspetti caratterizzanti la popolazione (ad esempio area geograca di residenza, et etc.). (c) Vengono eettuate due misurazioni per ogni unit statistica: il punteggio relativo al questionario somministrato al marito ed il punteggio della moglie. (d) Se si indica con e con µB µA il punteggio medio dei mariti all'interno della popolazione di riferimento, il punteggio delle mogli, il parametro di interesse µD = µA − µB . (e) un appropriato sistema di ipotesi { Si noti che diventa anche possibile denire H0 : µ D = 0 H1 : µ D > 0 µ = µB − µA ed in questo caso l'ipotesi alternativa H1 : µD < 0. (f ) In questo caso opportuno applicare un test t di Student per dati appaiati. Gli assunti del XA,i e XB,i rappresentano il punteggio rispettivamente del marito i-esima, allora Xi = XA,i − XB,i , per i = 1, . . . , 50 rappresenta un campione i.i.d da una popolazione normale con valore atteso µ. È ragionevole ritenere che il campione sia i.i.d. in quanto le coppie sono selezionate casualmente. Tuttavia, le variabili Xi non hanno sicuramente distribuzione normale perch i punteggi sono discreti. Il modello prevedono che se e della moglie della coppia teorema del limite centrale consente per di aermare che la distribuzione della statistica test rappresenta una approssimazione della distribuzione t di Student con 49 gradi di libert. 8. All'inizio dell'anno scolastico vengono preparate 20 domande per un test di ammissione. Di queste 20 domande ne vengono selezionate casualmente 10 e il test cos ottenuto viene somministrato a 9 studenti estratti in modo casuale dalla lista degli iscritti al primo anno. Al termine dell'anno scolastico viene somministrato agli stessi studenti un test composto dalle 10 domande non selezionate per il primo questionario. Il numero di risposte corrette nel primo e nel secondo test sono riportate nella seguente tabella. Studente 1 2 3 4 Primo 3 0 6 Secondo 5 1 5 4 5 6 7 8 9 7 4 3 2 1 4 7 10 9 7 10 8 (a) Vericare, mediante una procedura per la verica delle ipotesi al livello 1% i. l'ipotesi che il numero medio di risposte esatte del primo test sia diverso da quello del secondo test; ii. l'ipotesi che il numero medio di risposte esatte del primo test sia minore di quello del secondo test. Presentare, per entrambi i casi: il sistema di ipotesi, la statistica test, le regioni di accettazione e di riuto del test, il p-value e le conclusioni. (b) Elencare gli assunti sottostanti l'analisi; (c) discutere, in questo contesto specico, la validit degli assunti del punto precedente. SOLUZIONE Si indica con D la variabile dierenza tra il numero di risposte esatte del secondo questionario e il numero di risposte esatte del primo questionario. I valori osservati della variabile D sono i seguenti. 2 1 −1 0 6 6 5 9 4 La media e la deviazione standard dei valori osservati della variabile 10, 78 e D sono: d¯ = 3, 56, s2D = sD = 3, 28. Si vuole vericare inizialmente il seguente sistema di ipotesi { Si utilizza un test t H0 : µ D = 0 H1 : µD ̸= 0 di Student e dalle tavole della distribuzione si vede che la regione di accettazione del test t di Student con 8 gradi di libert data dall'intervallo che ha per estremi i valori -3,355 e +3,355. Il valore osservato della statistica test t= 3, 56 − 0 d¯ − 0 √ = 3, 26 = sd /9 3, 28/ 9 che cade all'interno della regione di accettazione. I dati non consento quindi di riutare l'ipotesi nulla. Dalle tavole si riesce inoltre a determinare che il 2%. Nel caso invece in cui si voglia vericare l'ipotesi { H0 : µ D = 0 H1 : µ D > 0 5 p-value ha un valore compreso tra 1% e la regione di accettazione include tutti i valori della statistica test inferiori a +2,896 e quindi in questo caso i dati portano all'accettazione dell'ipotesi alternativa e il p-value un valore compreso tra 0,5% e 1%. Il test t di Student si basa sull'assunto che i valori osservati della variabile i.i.d. campione D rappresentino un da una popolazione con distribuzione normale. Poich gli studenti sono estratti casualmente dalla lista degli iscritti, il campione quanto la variabile D i.i.d. ma l'assunto di normalit non rispettato in assume solo valori interi. In questo caso, per il teorema del limite centrale, la distribuzione della statistica test solo approssimata dalla distribuzione t di Student. 9. Si deve vericare se due diversi processi produttivi hanno una diversa produttivit media oraria. Siano µA e µB , rispettivamente, il numero medio di pezzi prodotti in un'ora dai due processi. Le ipotesi nulla e alternativa sono: { H0 : µA − µB = 0 H1 : µA − µB > 0 Utilizzando un campione di 25 coppie di osservazioni appaiate, le medie campionarie sono rispettivamente x̄A = 60 e x̄B = 50. Si pu riutare l'ipotesi nulla con una probabilit dell'errore di primo tipo uguale a 5% se: (a) La deviazione standard campionaria delle dierenze 15? (b) La deviazione standard campionaria delle dierenze 28? (c) La deviazione standard campionaria delle dierenze 40? SOLUZIONE Dalle tavole della distribuzione t di Student con 24 gradi di libert si vede che quindi la regione di riuto del test costituita dall'intervallo (1, 71; +∞). t24;0,05 = 1, 71 e Nei tre casi considerati la statistica test assume valore, rispettivamente, (a) t = 3, 33 (b) t = 1, 78 (c) t = 1, 25 e quindi si riuta l'ipotesi nulla nei casi (a) e (b). 10. Un'industria di generi alimentari produce dei sacchetti di farina da un chilo. A questo scopo dispone di due macchine riempitrici identiche. Durante la fase di riempimento, parte della farina non entra nei sacchetti e viene raccolta in un apposito scomparto per poi essere rimossa e smaltita, perch inquinata dal contatto con gli ingranaggi e non pi idonea all'alimentazione. Allo scopo di confrontare il funzionamento delle due macchine riempitrici, per ognuna viene pesata la quantit di farina sprecata in cinque turni di lavoro di otto ore. I dati, in chili, sono riportati nella tabella seguente. macchinario 1 8,20 9,03 10,58 10,81 9,37 macchinario 2 10,92 10,76 11,39 10,79 14,23 6 (a) Vericare mediante un opportuno test di ipotesi che, in media, vi sia una dierenza nella quantit di scarto prodotto dalle due macchine riempitrici. Fornire i. il sistema di ipotesi; ii. la statistica test; iii. le regioni di accettazione e di riuto del test al livello del 5%; iv. il p-value (approssimato); v. le conclusioni. (b) Spiegare se possibile riformulare il problema del punto precedente come problema di analisi della varianza. In caso di risposta aermativa riportare la tabella ANOVA corrispondente. In caso di risposta negativa spiegare, in modo dettagliato, i motivi per i quali il test ANOVA non adeguato a rispondere alla domanda del punto precedente. SOLUZIONE (a) Se µ1 la media relativa al primo macchinario e vericare il seguente In questo caso quella del secondo, il sistema che si vuole H0 : µ 1 = µ 2 H1 : µ1 ̸= µ2 appropriato utilizzare una statistica test 11, 618, s21 x̄1 = 9, 598, x̄2 = √ d = σ̂ 2/5 = 0, 82 e SE quindi e { µ2 = 1, 19 2 e s2 t per dati non appaiati. Si calcolano = 2, 2 di modo che σ̂ 2 = (4×s21 +4×s22 )/8 = 1, 69 il valore osservato della statistica test risulta essere t= 9, 598 − 11, 618 = −2, 45. 0, 82 t di Student con 8 gradi di libert tazione del test l'intervallo (−2, 306; 2, 306). Il valore osservato alla regione di riuto e il 0, 02 < p-value < 0, 05. Dalle tavole della distribuzione si vede che la regione di accetdella statistica test appartiene Possiamo concludere che l'ipotesi che vi sia una dierenza tra i due macchinari statisticamente signicativa. (b) La verica d'ipotesi del punto precedente si poteva eettuare anche mediante l'analisi della varianza e la tavola ANOVA associata la seguente SQ g.d.l. QM F Fra gruppi 10,20 1 10,20 6,025 Nei gruppi 13,55 8 1,69 Totale 23,75 9 Fonte di var. Si noti che la somma dei quadrati nei gruppi gia stata calcolata nel punto (a) mentre la somma dei quadrati fra i gruppi data da SQT RA = 5 × (x̄1 − x̄)2 + 5 × (x̄2 − x̄)2 = 10, 2 dove x̄ = (x̄1 + x̄2 )/2 = 10, 61. 7 11. Un'associazione consumatori eettua un confronto tra tre diversi tipi di paraurti anteriore adottati da una casa automobilistica. Viene eettuato un test simulando uno scontro frontale di un auto contro un muro di mattoni alla velocit di 20 km all'ora. La variabile risposta relativa al danno subito dall'auto, misurato dal costo della riparazione. Dato l'elevato costo della sperimentazione, lo studio viene condotto solo su due auto per ognuno dei tre tipi di paraurti. I dati, in centinaia di euro, sono riportati nella tabella seguente tipo A tipo B tipo C 1 2 11 3 4 15 (a) Calcolare le medie campionarie dei tre gruppi; (b) calcolare le varianze campionarie dei tre gruppi; (c) calcolare la somma dei quadrati e i quadrati medi ENTRO i gruppi; (d) calcolare la somma dei quadrati e i quadrati medi TRA i gruppi; (e) vericare l'ipotesi che il costo medio relativo ai tre tipi di paraurti sia lo stesso. Riportare: il sistema di ipotesi, la statistica test, la regione di accettazione e di riuto del test, il p-value approssimato, le conclusioni. (f ) Riportare i risultati dell'analisi all'interno di una tabella ANOVA. SOLUZIONE (a) (b) (c) (d) x̄A = 2, x̄B = 3, x̄C = 13; s2A = 2, s2B = 2, s2C = 8; SQEN T RO = 2 + 2 + 8 = 12; x̄ = 6, SQT RA = 2(2 − 6)2 + 2(3 − 6)2 + 2(13 − 6)2 = 148. (e) Si vuole vericare il sistema di ipotesi { H0 : µA = µB = µC H1 : almeno due medie sulla base della statistica test F con 2 e 3 gradi di libert. regione di riuto, al livello del 5% test statistica test 0, 025. f = 18, 5 sono diverse tra loro l'intervallo a cui corrisponde un Dalle tavole si vede che la (9, 55; +∞). p-value Il valore osservato della maggiore di 0, 01 ma minore di Possiamo concludere che l'ipotesi che vi sia almeno una dierenza tra le medie statisticamente signicativa, ma non altamente signicativa. (f ) La tabella ANOVA riportata di seguito Fonte di var. SQ g.d.l. QM F FRA gruppi 148 2 74 18,05 12 3 4 160 5 ENTRO gruppi Totale 8 12. Un economista vuole studiare come dierisce il costo orario della manodopera specializzata in 5 diversi paesi della comunit europea. A questo scopo si eettua il seguente esperimento. In ognuno dei 5 paesi si individuano 6 citt diverse e in ogni citt viene assegnato ad un idraulico il compito di riparare un guasto. Si rileva quindi il costo orario dividendo il costo della manodopera indicato nella fattura per il numero esatto di ore impiegate per la riparazione. I dati, con alcune statistiche di sintesi, sono riportati di seguito. Inoltre, il graco sottostante mette a confronto i box-plot dei dati. s2i 56,3 63,1 52,4 61,3 65,6 67,9 61,1 33,9 41,7 44,9 51,7 43,8 41,5 55,4 46,5 32,8 63,9 61,5 51,1 57,0 64,8 67,7 61,0 36,4 59,5 58,0 47,8 58,3 63,1 51,7 56,4 31,3 55,1 45,7 45,0 60,1 49,3 53,2 51,4 34.1 45 50 55 60 65 X1 X2 X3 X4 X5 x̄i X1 X2 X3 9 X4 X5 (a) Confrontare mediante la procedura ANOVA il costo medio orario della manodopera nei cinque paesi. Fornire i seguenti dati: i. Il sistema di ipotesi; ii. la statistica test; iii. le regioni di accettazione e riuto del test; iv. la tabella ANOVA; v. il p-value approssimato; vi. le conclusioni. (b) Elencare gli assunti sottostanti l'analisi e discutere brevemente, per quanto possibile sulla base delle informazioni fornite, la validit di tali assunti nel problema in analisi. SOLUZIONE Se si indicano con µi per i = 1, . . . , 5 le medie delle 5 popolazioni a confronto il sistema di ipotesi che si vuole vericare { H0 : µ1 = µ2 = µ3 = µ4 = µ5 H1 : almeno due medie sono diverse tra loro Questo sistema di ipotesi si pu vericare mediante una statistica test F con 4 e 25 gradi di libert. Quindi ad un livello di signicativit del 5% l'ipotesi nulla viene riutata per valori della statistica test maggiori di 2,76 (regione di riuto). Le quantit necessarie al calcolo della statistica test si calcolano in modo agevole a partire le statistiche di sintesi fornite nel testo dell'esercizio. Nel seguito verr riportata solo la tavola ANOVA SQ g.d.l. QM F Fra gruppi 959,9 4 240,0 7,12 Nei gruppi 842,6 25 33,7 Totale 1802,5 29 F si ricava che il Fonte di var. Dalle tavole della distribuzione p-value un valore inferiore a 0,01 e quindi i dati supportano l'ipotesi che vi sia una dierenza tra le medie, e tale ipotesi altamente signicativa. In estrema sintesi, gli assunti sottostanti l'analisi condotta sono i seguenti: le variabili spondenti alle 5 popolazioni sono tra loro indipendenti, hanno media Inoltre, per ogni popolazione i dati rappresentano un campione i.i.d.. µi Xi corri- e varianza comune σ2. I dati forniti sul problema in analisi non presentano indicazioni che possano far pensare ad una deviazione dagli assunti. In particolare i box-plot non forniscono una indicazione forte contro l'assunto di normalit e neppure contro l'assunto di omoschedasticit (varianze uguali). 13. Un'azienda commerciale ha eettuato un'indagine campionaria mediante la quale ha chiesto a 12 clienti l'ammontare, in euro, dell'ultima spesa eettuata presso il proprio punto vendita, rilevando i seguenti dati: 10 cliente A B C D E F G H I L M N spesa 1,46 12,02 7,2 17,24 10,84 0,1 5,23 15,91 9,67 12,11 3,06 3,96 A seguito di una riorganizzazione del posizionamento della merce sugli scaali l'azienda commerciale ha nuovamente intervistato il campione dei 12 clienti chiedendo loro l'ammontare dell'ultima spesa eettuata dopo la riorganizzazione. Le risposte ottenute sono le seguenti: cliente A B C D E F G H I L M N spesa 4,91 9,54 20,74 19,05 5,55 20,24 9,99 5,55 21,26 9,59 20,52 20,11 Mediante un opportuno test vericare l'ipotesi che la spesa media dei clienti sia aumentata dopo la riorganizzazione interna. Riportare ognuno dei seguenti punti: (a) formalizzazione del problema e descrizione degli assunti sottostanti l'analisi; (b) sistema di ipotesi; (c) statistica test; (d) regione di accettazione e di riuto; (e) valore osservato della statistica test e conclusioni; (f ) p-value. SOLUZIONE (a) Se si indica con D la variabile relativa alla dierenza tra il valore della seconda spesa e il valore della prima, si assume che la distribuzione di di media da µD e varianza 2. σD D sia (approssimativamente) normale I dati disponibili costituiscono un campione casuale semplice D. (b) Si vuole vericare il seguente sistema di ipotesi { H0 : µ D = 0 H1 : µ D > 0 (c) Per la verica di questo sistema di ipotesi conviene utilizzare un test l'ipotesi nulla, segue una distribuzione (d) Dalle tavole della distribuzione t cliente dierenza A 3,45 D B -2,48 da cui si vede che D̄−0 √ che, sotto SD / 12 di Student con 11 gradi di libert. si vede, al livello del 5%, l'ipotesi nulla viene riutata se il valore osservato della statistica test (e) I valori osservati di t t= maggiore di 1,796. sono C 13,54 d¯ = 5, 69 e D 1,81 E -5,29 sD = 9, 94 F 20,14 G 4,76 di modo che H -10,36 t = 1, 98. I 11,59 L -2,52 M 17,46 N 16,15 Possiamo concludere che, al livello del 5%, i dati portano al riuto dell'ipotesi nulla. (f ) Il p-value un valore compreso tra il 2,5% e il 5%. L'ipotesi alternativa quindi statisticamente signicativa ma non altamente signicativa. 11 14. Per una certa regione italiana, si vuole stimare il numero di famiglie che hanno gli in età scolare. Dall'elenco di tutte le famiglie della regione se ne estraggono casualmente 100 e di queste 41 dichiarano di avere gli in età scolare. (a) Fornire una stima puntuale della proporzione di famiglie con gli in età scolare. (b) Calcolare l'errore standard per la stima del punto precedente. (c) Assumendo che la vera proporzione di famiglie con gli in et scolare nella regione di interesse sia uguale a π = 0, 52, calcolare l'errore campionario associato alla stima dei punti precedenti e commentare l'entit di tale errore. SOLUZIONE (a) Indicando con π la proporzione di famiglie con gli in età scolare si ha √ (b) L'errore standard associato alla stima è d SE(π̂) = √ 0,41(1−0,41) 100 SE(π̂) = π̂ = 41 100 = 0, 41. π(1−π) che può essere stimato come 100 = 0, 0491. π noto, possibile calcolare in modo esatto l'errore standard che SE = 0, 05. L'errore assoluto di stima dato da (0.41 − 0.52) = −.11. (c) Nel caso in cui il valore di risulta essere uguale a Ossia il valore stimato di 11 punti percentuali al di sotto del valore reale, che corrisponde a 2.2 errori standard. Si tratta quindi di un errore di stima particolarmente consistente. 15. In un impianto di imbottigliamento si riempiono bottiglie di plastica con una bibita alla cola. L'etichetta riporta che la bottiglia contiene 300 millilitri. segue una distribuzione normale di media µ = 298 In realt, il contenuto delle bottiglie millilitri e deviazione standard σ=3 ml. (a) Qual la probabilit che una bottiglia contenga meno di 295 ml? (b) Qual la probabilit che, il contenuto medio di una confezione da 6 bottiglie sia inferiore a 295 ml? SOLUZIONE Se indichiamo con di liquido di 6 X la quantit di liquido contenuta in una bottiglia e con X̄ la quantit media bottiglie si ha (a) P (X < 295) = 0, 1586 (b) P (X̄ < 295) = 0, 0071 16. Indicare la risposta corretta. (A) Si conduce un test ANOVA per confrontare le medie di k gruppi. Se le medie campionarie risultano tutte uguali tra loro (evento estremamente improbabile) il valore assunto dalla statistica test F uguale a (a) 1,0 (b) 0,0 (c) un valore tra 0,0 e 1,0 (d) un valore negativo 12 (e) innito (B) In un test ANOVA con 4 gruppi e una numerosit campionaria totale di 44, il valore osservato F della statistica test risulta uguale a 2.33. In questo caso il p-value (a) esattamente uguale a 0,05 (b) inferiore a 0,05 (c) superiore a 0,05 (d) non si pu dire perch non si conoscono le somme dei quadrati tra e entro i gruppi. (C) Nell'ANOVA, per determinare se il test osservato della statistica F statisticamente signicativo si confronta il valore con un valore critico. Quali informazioni sono necessarie per determinare il valore critico? (a) La numerosit campionaria e il numero dei gruppi; (b) la media e la deviazione standard di ogni gruppo; (c) il rapporto dei quadrati medi; (d) le somme dei quadrati. SOLUZIONE (A): (b) 0,0 (B): (c) superiore a 0,05 (C): (a) La numerosit campionaria e il numero dei gruppi 17. Nell'impostare una procedura di verica di ipotesi si decide di ssare la signicativit del test al livello 0, 001 invece del tradizionale (Indicare con una X 0, 05. Quali saranno le conseguenze di questa scelta? la/e risposta/e corretta/e). Si riduce la probabilit di commettere un errore del primo tipo. Si riduce il Aumenta la probabilit di commettere un errore del secondo tipo. Se Aumenta la probabilit di commettere un errore del primo tipo. Se Si riduce la probabilit di commettere un errore del secondo tipo. p-value del test. vera l'ipotesi nulla si riduce la probabilit di accettare l'ipotesi alternativa. vera l'ipotesi alternativa aumenta la probabilit di commettere un errore. SOLUZIONE X Si riduce la probabilit di commettere un errore del primo tipo. Si riduce il X X X p-value del test. Aumenta la probabilit di commettere un errore del secondo tipo. Se vera l'ipotesi nulla si riduce la probabilit di accettare l'ipotesi alternativa. Aumenta la probabilit di commettere un errore del primo tipo. Se vera l'ipotesi alternativa aumenta la probabilit di commettere un errore. 13 Si riduce la probabilit di commettere un errore del secondo tipo. 18. Una casa automobilistica sta sperimentando delle innovazioni da apportare al motore di un certo modello di auto. Allo scopo di vericare l'impatto di tali innovazioni in relazione ai consumi delle auto, si conduce il seguente esperimento. Si producono nove auto, 3 con il motore tradizionale (indicato con A) tre con il tipo di variazione B e tre con il tipo di variazione C. Viene quindi rilevato quanti chilometri ognuna di queste auto percorre con 40 litri di carburante. I dati ottenuti sono riportati nella tabella seguente: Motore A B C Obiettivo di questo studio km percorsi 613 525 602 469 427 525 484 456 402 quello di vericare se vi sono delle dierenze in termini di consumi medi per le tre tipologie di motore. (a) Specicare l'ipotesi nulla e alternativa. (b) Specicare quale procedura si ritiene pi appropriata per vericare il sistema di ipotesi del punto precedente ed elencare le assunzioni alla base di tale procedura. (c) Calcolare il test statistico appropriato. (d) Fornire la regione di accettazione e di riuto del test al livello α = 0, 01. (e) Riportare le conclusioni dell'analisi. SOLUZIONE (a) Se si indicano con µA , µB e µC il numero medio di chilometri percorsi con 40 litri di carburante rispettivamente dalle auto di tipo A, B e C, il sistema di ipotesi che si vuole vericare il seguente { H0 : µA = µB = µC H1 : almeno due medie sono diverse tra loro (b) Nell'ipotesi che siano soddisfatti gli assunti richiesti, il sistema di ipotesi del punto precedente pu essere opportunamente vericato mediante l'applicazione di un test ANOVA. (c) Per brevit si riporta di seguito solo la tavola ANOVA con la sintesi delle quantit richieste per il calcolo della statistica test. Fonte di var. SQ g.d.l. QM F FRA gruppi 29600,67 2 14800,33 6,88 ENTRO gruppi 12907,33 6 2151,22 Totale 42508,00 8 14 (d) Dalle tavole della distribuzione F si vede che, al livello dell'1%, il test porta al riuto dell'ipotesi nulla per valori superiori a 10,9. (e) Poich il valore della statistica test inferiore a 10,9 possiamo concludere che, al livello dell'1%, i dati non forniscono l'indicazione che vi sia una dierenza tra le tre medie. Il un valore compreso tra 2, 5% e p-value assume 5%. 19. Indicare la risposta corretta. (A) In una procedura di verica delle ipotesi, il tivit α p-value risulta pi grande del livello di signica- stabilito. Quali conclusioni si dovrebbero trarre? (a) non si dovrebbe riutare l'ipotesi nulla; (b) si dovrebbe riutare l'ipotesi nulla; (c) si dovrebbe aumentare il valore di (d) α; impossibile che si verichi questa situazione perch il α p-value e il livello di signicativit sono la stessa cosa. (B) In una procedura di verica delle ipotesi il livello di signicativit assume il valore α = 0, 01. Questo signica che: (a) la probabilit che l'ipotesi alternativa sia vera uguale a 0,01; (b) l'ipotesi nulla viene riutata il 1% delle volte; (c) se l'ipotesi nulla falsa, questa viene riutata il 1% delle volte; (d) se l'ipotesi nulla vera, questa viene riutata il 1% delle volte; t con ipotesi alternativa unilaterale sinistra. Il livello di signicativit uguanumerosit campionaria n = 24. Indicare quale, tra i seguenti, costituisce il (C) Si esegue un test le a α = 0, 05 e valore critico appropriato. (a) 2,069 (b) -2,029 (c) 1,714 (d) -1,714 (e) 1,711 (f ) -1,711 (g) 2,064 (h) -2,064 SOLUZIONE (A): (a) non si dovrebbe riutare l'ipotesi nulla. (B): (d) se l'ipotesi nulla vera, questa viene riutata il 1% delle volte. (C): (d) -1,714 15