PROVE SCRITTE PER L’ESAME DI STATISTICA I Prof.ssa R. Siciliano Legenda: D = Statistica descrittiva I = Inferenza statistica P = Calcolo delle probabilità R = Regressione lineare semplice Esercizio 1 R Alcuni dati campionari hanno fornito: x = 150 y = 40 sy = 5 sx = 9 Coefficiente di correlazione lineare r = - 0,95. a) Determinare le rette di equazione y = a + bx. b) Stimare il valore di y per x = 120. Esercizio 2 I Un campione di 16 determinazioni casuali indipendenti di una v.c. normale avente media e varianza ignote, ha mostrato una media campionaria pari a 68 ed una stima corretta della varianza pari a 9. Determinare gli intervalli di confidenza per la stima della media ai livelli di confidenza del 95% e del 99%. Esercizio 3 I Un’azienda commerciale vuole lanciare un nuovo prodotto su una certa zona e desidera effettuare una campagna pubblicitaria su un quotidiano locale. Allo scopo di effettuare una corretta decisione viene considerata una v.c. X “reddito medio mensile per famiglia“ che si suppone sia distribuita normalmente con media ignota e s.q.m. = 20 dollari. Si fissa la seguente regola di decisione: - se il reddito medio mensile per famiglia è maggiore o uguale a 400 dollari si effettua la campagna; - se il reddito medio mensile per famiglia è inferiore ai 400 dollari, non si effettua la campagna; Scelto un campione casuale n = 100 a) si fissino le ipotesi b) si verifichi l’ipotesi nulla al livello di significatività del 5% c) si determinino alcuni valori della funzione di potenza e della curva operativa, tracciando una delle due curve. I valori alternativi siano 398,61; 396,71; 394,71; 392,71. Esercizio 4 I Determinare il valore di z tale che: P z Z z 0,7372 Esercizio 5 D a) Si costruisca una distribuzione per classi in maniera tale che Q1 + Q3 = Me b) Si commentino i risultati. 2 Esercizio 6 R Dato un campione di 15 abitazioni, si vuole stabilire se c’è relazione tra il valore di vendita (variabile dipendente Y) e la superficie dell’abitazione computata ai fini del riscaldamento (variabile indipendente X), fissato il rischio = 0,01 e l’errore standard della regressione sxy = 2,910 Numero civico 1 34,4 Area da riscaldare (xi) 1,858 2 34,4 1,858 3 25,7 1,347 4 35,9 1,635 5 29,1 1,793 6 30,4 1,115 7 25,8 1,440 8 35,9 1,793 9 28,5 1,477 10 29,2 1,394 11 36,7 1,765 12 29,3 1,291 13 24,5 1,431 14 33,8 1,756 15 26,8 1,477 443,4 23,161 Totale Valore Stabilito(yi) yi2 1183, 36 750,7 6 660,4 9 1288, 81 846,8 1 416,1 6 665,6 4 1288, 81 812,2 5 852,6 4 1346, 89 858,4 9 600,2 5 1142, 44 718,2 4 1343 2,04 3 xi yi xi2 3,452 63,915 2,525 43,539 1,814 34,618 2,673 58,697 3,215 52,176 1,243 22,746 2,074 37,153 3,215 64,369 2,182 42,095 1,943 40,705 3,115 64,776 1,667 37,826 2,048 35,060 3,084 59,353 2,182 39,854 36,432 696,611 Esercizio 7 I Dato un campione di 314 alunni delle scuole elementari si vuole verificare l’indipendenza tra rendimento scolastico (misurato da tre valutazioni qualitative dell’insegnante) e numero dei figli della famiglia di appartenenza. N.figli 1 2 3 4 5 più di 5 Totale Rendimento Scolastico Scarso Sufficien te 3 1 7 23 19 30 14 13 15 14 46 34 104 115 Totale Buono 3 17 22 19 18 16 95 7 47 71 46 47 96 314 Esercizio 8 I Un’azienda elettronica registra il 20% ( = 0,20) di pezzi difettosi. A seguito di una modifica dei processi è necessario verificare se la percentuale diminuisce. Per un campione casuale di 100 transistor risulta p=0,14. Si verifichi l’ipotesi (con = 0,05) che il nuovo processo non sia migliore del vecchio. Si calcoli, inoltre, supponendo che = 0,15. 4 Esercizio 9 R Alcuni dati campionari hanno fornito: x = 150 y = 40 sy = 5 sx = 9 Coefficiente di correlazione lineare r = - 0,95. a) Determinare le rette di equazione y = a + bx. b) Stimare il valore di y per x = 120. Esercizio 10 I La lunghezza media delle pannocchie di grano è stata, nel passato, uguale a 23 cm. a) si vuole sottoporre a test l’ipotesi che le pannocchie di un anno abbiano una lunghezza media diversa, sulla base di un campione di 40 elementi con un = 0,04. La media del campione è x = 24,35. 30 29 29 27 29 30 20 28 16 23 27 30 19 27 17 25 25 22 21 29 23 16 23 22 18 28 29 16 17 24 27 18 29 26 23 20 30 30 24 28 b) si determini la potenza del test per un valore alternativo di 19,5. Esercizio 11 I In una ditta viene sottoposta a 40 uomini e 50 donne una prova attitudinale per valutare la capacità nello svolgere un determinato lavoro. I risultati sono stati i seguenti: xu = 79,5 xd = 85,6 ~s = 9,8 ~ sd = 10,6 u a) Sottoporre a verifica i risultati con = 0,01. b) Con uguale a 0,01 fino a quale valore della differenza tra i valori medi si accetta l’ipotesi nulla? Esercizio 12 I In uno studio sul decadimento radioattivo sono stati osservati il numero dei decadimenti in 440 periodi di tempo costanti. Le frequenze osservate sono riportate nella tavola seguente N. decadimenti 0 1 2 3 4 5 6 7 8 9 Totale Freq. Osservate 18 53 103 107 82 46 18 10 2 1 440 Verificare se la distribuzione esposta nella tavola segue una distribuzione di Poisson al livello di significatività del 5%. 5 Esercizio 13 D Data la seguente tabella: Classi di reddito mensile (migliaia di £. 1971) meno di 150 150 – 250 250 – 350 350 – 450 450 e più Totale Redditieri ni Redditi stimati delle classi xini 100 50 30 15 5 200 10.000 10.000 9.000 6.000 3.000 38.000 a) Si calcoli il Rapporto di Concentrazione. b) Si disegni la curva di concentrazione. Esercizio 14 I La media delle stature di un campione n = 25 coscritti nati nel 1965 è di 176,5 cm., con s 1 = 7 cm.; la media delle stature di un campione n = 30 coscritti nati nel 1930 è di 162,4 cm., con s 2 = 6,5 cm.. Si supponga che le stature si distribuiscano normalmente e fissata la soglia dello 0,05: a) si verifichi l’ipotesi che la data di nascita non esercita alcuna influenza sulla statura. Esercizio 15 I Nel 1975 la spesa media giornaliera per consumi alimentari (in migliaia di lire) di un campione di 21 famiglie di professori universitari, estratte senza ripetizione dall’universo di appartenenza, era di £. 15.000 con s = £. 1.000. Fissato il livello del 5 % si determini l’intervallo di confidenza per la media: a) non potendo formulare alcuna ipotesi sulla distribuzione della popolazione; b) ipotizzando che la popolazione sia distribuita normalmente. Esercizio 16 I Da valutazioni empiriche risulta che negli Stati Uniti si verificano 8 incidenti automobilistici mortali in ogni ora, durante i fine settimana. Assumendo che tali incidenti avvengano indipendentemente gli uni dagli altri, calcolare la probabilità: a) che trascorra un’ora senza incidenti; b) che trascorrano 15 minuti con un solo incidente; c) che trascorrano quattro intervalli consecutivi di 15 minuti ciascuno con un solo incidente in ognuno di essi; d) che si abbiano quattro incidenti in un ora. A che cosa è dovuta la differenza tra i risultati c) e d)? 6 Esercizio 17 P In un libro di 520 pagine si trovano 390 errori tipografici. - Qual è la probabilità che quattro pagine, scelte a caso dal tipografo come saggio del suo lavoro, siano esenti da errori? - Si discuta della distribuzione di probabilità scelta. Esercizio 18 I Dalle statistiche di produzione risulta che il 30% delle batterie prodotte è difettoso. - Qual è la probabilità di selezionare un campione di n = 64 batterie con una proporzione di difetti maggiore o uguale al 20%, campionando da un lotto di N = 1.000 pezzi? Esercizio 19 I In una nota catena di negozi di abbigliamento si vendono in media 25 capi per negozio in ogni settimana. Si è però notato in un campione di n = 36 negozi, che durante i saldi invernali ed estivi tali vendite aumentano. Trovare una regola di decisione affinché il manager possa decidere se è opportuno, in tali periodi, l’assunzione di altre commesse, con = 6 ed = 0,05. Quindi calcolare l’errore di seconda specie () in corrispondenza di una media alternativa all’universo 1 = 27, verificando l’effetto della numerosità campionaria su , per n = 36 ed n = 100. Esercizio 20 R Si discuta, brevemente, del significato da attribuire al Coefficiente di Determinazione (o indice di miglioramento lineare); ed inoltre si evidenzi il suo legame con il Coefficiente di correlazione lineare. Esercizio 21 P Si lancia 500 volte una moneta; determinare la probabilità che si presenti un numero di teste superiore a 260. Esercizio 22 I Si effettui un confronto tra due sussidi didattici sulla base di due campioni sottoposti separatamente a ciascuno dei due sussidi. E’ noto che la varianza della prima popolazione è pari a 64 punti e quella della seconda popolazione è pari a 144 punti. Il primo campione di 80 studenti ha riportato un punteggio medio di 68 punti ed il secondo campione di 120 studenti ha riportato un punteggio medio di 65 punti. Si vuole verificare se i due sussidi hanno pari efficienza, in termini di punteggi medi. Si ponga = 0,02. Esercizio 23 I Siano dati gli eventi xi (i = 1,2,3,4,5) le cui frequenze osservate fi sono riportate in tabella. Verificare se gli eventi sono equiprobabili, al livello di significatività = 0,05. Numero eventi xi 1 2 3 4 5 TOT Numero osservazioni fi 58 50 32 40 20 200 7 Esercizio 24 R Determinare La retta interpolatrice dei minimi quadrati per i seguenti dati: X 1 3 4 6 8 9 Y 1 2 4 5 5 7 Si valuti la bontà dell’adattamento. Esercizio 25 P Una commissione è formata da 6 democratici e 5 repubblicani. Tre dei rappresentanti di ciascun partito sono uomini. Se si sceglie come presidente un uomo, qual è la probabilità che sia repubblicano? Esercizio 26 I Un’azienda vuole stimare la proporzione d’uso del prodotto di vendita. L’errore ammesso è minore del 5% con un rischio del 10%. Qual è la dimensione campionaria opportuna? Esercizio 27 I Un’impresa che produce batterie rileva difetti di produzione nel 30% dei casi. Si sperimenta un nuovo procedimento per ridurre la proporzione di difetti. Si estrae un campione di numerosità n = 64 da una popolazione di 1.000 batterie e si riscontrano 15 difetti. Fissato il rischio = 0,01, si può concludere che, con il nuovo procedimento, si ottiene un decremento significativo della proporzione di difetti? Esercizio 28 P Sia A l’insieme dei numeri pari non superiore a 90 e B l’insieme dei multipli di 5 non superiori a 90. Si è interessati alla probabilità che il primo numero estratto nel gioco del lotto, sulla ruota di Napoli, sia un numero pari o un numero multiplo di 5. Esercizio 29 I Dato un campione di 314 alunni delle scuole elementari si vuole verificare l’indipendenza tra rendimento scolastico (misurato da tre valutazioni qualitative dell’insegnante) ed il numero di figli della famiglia di appartenenza. N.Figli 1 2 3 4 5 più di 5 Totale Scarso 3 7 19 14 15 46 Sufficien te 1 23 30 13 14 34 104 114 Buono Totale 3 17 22 19 18 16 7 47 71 46 47 96 95 314 8 Esercizio 30 R Un sociologo viene assunto in un carcere minorile per studiare se esiste relazione tra intelligenza e crimine. A tale scopo costruisce un indice di criminalità (IC) che tiene conto sia della gravità che della frequenza dei reati commessi dai giovani, mentre l’intelligenza viene misurata con un indice del quoziente di intelligenza (QI) ottenuto da alcuni test a cui si sottopone un campione di 18 ragazzi detenuti: (IC) Yi 26,2 33,0 17,5 25,25 20,3 31,9 21,1 22,7 10,7 22,1 18,6 35,5 38,0 30,0 19,7 41,1 39,6 25,15 (QI) Xi 110 89 102 98 110 98 122 119 120 92 116 85 73 90 104 82 134 114 a) stimare la retta di regressione per valutare l’influenza del quoziente intellettivo sui crimini commessi. b) si valuti l’ipotesi che non esista relazione tra le due variabili, fissando un livello di significatività = 0,05. c) si costruisca l’intervallo di confidenza per il coefficiente angolare, fissando un livello di fiducia = 0,05. Esercizio 31 I Da un processo produttivo di barre di acciaio si estrae un campione di n1 = 49 barre e si osserva che il punto medio di rottura è di 318 cm. Inoltre, il direttore di produzione deve valutare se introdurre un nuovo processo nel quale al posto dell’acciaio si impiega una nuova lega. A tal fine considera un campione di n2 = 64 barre della nuova lega il cui punto medio di rottura è 314 cm. Sapendo che lo s.q.m. del processo di produzione dell’acciaio è di 21 cm. e quello della nuova lega è 24 cm., decidere se il punto medio di rottura è significativamente maggiore di quello della lega. Il rischio legato alla decisione sia posto pari a 0,05. Esercizio 32 I a) Data una variabile X distribuita normalmente con media 50 e varianza 100, trovare P(38 < x < 47) b) Data una variabile X distribuita normalmente con media 40 e varianza 100, trovare il valore soglia x* di X tale che P(X > x*) = 0,1423. 9 Esercizio 33 I Sono di seguito riportati i dati relativi alle ore di trasmissione alla televisione per alcuni tipi di programmi nel 1994: Spettacoli Ore di trasmissione RAI 1 musica RAI 2 RAI 3 86 59 109 RAI 1 sceneggiati e telefilmRAI 2 RAI 3 522 934 217 RAI 1 filmRAI 2 RAI 3 446 459 340 RAI 1 cartoni e comicheRAI 2 RAI 3 167 102 5 RAI 1 inchieste e documentari RAI 2 RAI 3 335 109 266 RAI 1 pubblicità RAI 2 RAI 3 168 135 8 Determinare la distribuzione doppia “tipo di spettacolo/rete televisiva” per le ore di trasmissione e verificare se i diversi tipi di spettacolo sono connessi con le reti oppure se sono indipendenti. Costruire inoltre la tabella delle contingenze e determinare il coefficiente di contingenza. Esercizio 34 I Di 300 arance prelevate a caso da una partita consegnate ad un supermercato 25 sono risultate invendibili perché troppo mature. a) Si verifichi che la probabilità di estrarre un’arancia invendibile sia uguale a 0,01 con un livello di significatività dello 0,05. b) Si determini la potenza del test sotto l’ipotesi alternativa che la probabilità di estrarre un’arancia invendibile sia uguale a 0,08. 10 Esercizio 35 D Un commerciante possiede 6 negozi dislocati lungo un percorso rettilineo. Nella tabella che segue sono indicate le distanze (in Km) dal primo negozio e il numero di rifornimenti che vengono effettuati in un mese per ciascun negozio. Negozi Distanze Numero di dal negozio riforniment A i mensili A 0 10 B 5 5 C 20 9 D 50 10 E 80 30 F 100 27 a) A quale distanza il commerciante deve costruire il deposito centrale che rifornisce tutti i negozi in modo tale da minimizzare le distanze da percorrere ogni mese? b) Si commenti con un esempio numerico quando occorre utilizzare la mediana rispetto alla media aritmetica. Esercizio 36 I Da una popolazione si estrae un campione di ampiezza 100. Nella seguente tabella sono riportati i valori raggruppati in classi. Verificare se la popolazione risulta normalmente distribuita al livello di significatività dello 0,01. Classi <5 5─┤10 10─┤15 15─┤20 20─┤25 >25 Frequen ze 8 10 23 30 18 11 Esercizio 37 I Un’impresa che produce filo metallico ritiene che il punto di rottura è 80 Kg. con varianza pari a 16 Kg., e vende alla clientela comunicando tali specifiche. Un cliente seleziona casualmente 64 matasse la cui media campionaria è 79 Kg. a) Egli deve decidere se accettare o meno al partita con un livello di significatività del 5%. b) Se si configura l’ipotesi alternativa pari a 78 Kg. calcolare la probabilità dell’errore di seconda specie. Esercizio 38 I In un gioco vengono lanciate ripetutamente 3 monete. Un giocatore ritiene che le monete siano truccate. Egli, in 200 lanci, ha osservato la seguente distribuzione del numero di teste: Teste Freque nze 0 1 8 1 6 3 2 8 4 3 3 5 Si può ritenere che il giocatore abbia ragione ad un livello di significatività del 5%. 11 Esercizio 39 R Per il controllo di gestione di una catena di fast-food la direzione ha effettuato una rilevazione dei costi sostenuti - espressi in migliaia di lire - (Y) in relazione alle presenze giornaliere (X) con i risultati illustrati nella seguente tabella. X 1.470 1.965 788 1.620 855 1.210 Y 7.250 8.886 4.214 7.580 4.526 5.784 a) Supponendo che tra i costi sostenuti e le presenze giornaliere intercorra una relazione lineare si determini la stima della retta di regressione lineare. b) Si determini l’indice di determinazione lineare. c) Si verifichi l’ipotesi che il coefficiente di regressione sia pari a zero con un livello di significatività dello 0,05. Esercizio 40 R Un campo è suddiviso in appezzamenti unitari per verificare l’incidenza della quantità di nuovo fertilizzante sulla resa della coltivazione di mais. Nella tabella seguente sono riportate le rese dei diversi appezzamenti Y e le relative quantità di fertilizzante impiegato X. X Y 0 , 4 1 6 0 , 4 1 2 0 , 6 1 8 0 , 6 1 6 0 , 8 2 3 0 , 8 2 8 1 1 3 2 2 5 1 , 2 3 2 1 , 2 3 4 1 , 4 3 8 1 , 4 3 4 1 , 6 4 0 1 , 8 4 3 a) determinare la retta di regressione dei minimi quadrati spiegando il significato dei parametri. b) determinare il coefficiente di correlazione lineare. Esercizio 41 I Il direttore del personale di una grande società presume che ci sia una relazione tra assenteismo ed età dei dipendenti. Nella tabella che segue sono riportate le informazioni sull’età e sui giorni di assenza per un campione di 100 lavoratori. Giorni di assenza Età 1├ ─5 5├─ 10 10├─ 15 15├─ 20 TOTA LE 20├─30 30├─40 40├─50 50├─60 60├─65 TOTALE 0 0 0 0 10 10 0 0 20 10 10 40 10 20 0 0 0 30 20 0 0 0 0 20 30 20 20 10 20 100 12 a) Verificare se esiste una relazione di dipendenza in media tra i due caratteri mediante il rapporto di correlazione di Pearson. b) Verificare con un test statistico l’ipotesi nulla che il coefficiente di correlazione lineare tra i due caratteri sia pari a 0. 13 Esercizio 42 I Per sottoporre a test l’ipotesi che in una pesata automatica il valore medio sia di 150 grammi con uno scarto quadratico medio di 5 grammi si decide di accettare l’ipotesi nulla se in un campione di 100 confezioni il peso medio risulta compreso tra 149 e 151 grammi. Dire quali sono: a) l’ipotesi nulla e l’ipotesi alternativa; b) il livello di significatività; c) le condizioni in cui si compie un errore di prima specie; d) le condizioni in cui si compie un errore di seconda specie; Esercizio 43 I Una macchina produce un tipo di catene di bicicletta con lunghezza normalmente distribuita, con media pari a 150 cm. e scarto quadratico medio pari a 3 cm. Per un certo tipo di biciclette si richiede che le catene abbiano lunghezza una lunghezza compresa tra 152 e 156 cm., in caso contrario la catena, prima di poter essere utilizzata, deve essere modificata. a) Qual è la percentuale di catene prodotte dalla macchina che vengono utilizzate senza essere modificate? b) Se la macchina viene regolata in modo che la lunghezza delle catene abbia media pari a 154 cm. (lo scarto quadratico medio si suppone rimanga costante), qual è la percentuale di catene utilizzate senza modifiche? c) É conveniente la nuova regolazione? Esercizio 44 D Descrivere statisticamente i dati in tabella. Classi di superficie per ettari 0,00─1,00 1,01─2,00 2,01─3,00 3,01─5,00 5,01─10,00 10,01─20,00 20,01─50,00 50,01─250,00 TOTALE Nume ro di aziend e 1.164 682 414 477 467 240 111 51 3.606 Esercizio 45 I Si verifichi con un test statistico l’adattamento della normale alla distribuzione di frequenze relativa alla tabella riportata nell’esercizio precedente. 14 Esercizio 46 D Si consideri la seguente tabella: Distribuzione unitaria del reddito e della spesa mensile in un collettivo di 30 famiglie. Famig Reddito Spesa lie (lire in (lire in migliaia) migliaia) 1° 2.000 1.800 2° 4.000 2.500 3° 1.000 800 4° 1.000 800 5° 4.000 1.800 6° 3.000 1.800 7° 1.000 800 8° 1.000 1.200 9° 2.000 1.200 10° 2.000 1.200 11° 1.000 800 12° 1.000 800 13° 3.000 1.200 14° 1.000 800 15° 1.000 1.200 16° 3.000 1.800 17° 3.000 1.800 18° 1.000 800 19° 4.000 2.500 20° 3.000 1.800 21° 1.000 800 22° 2.000 1.800 23° 2.000 1.800 24° 2.000 1.200 25° 3.000 1.800 26° 2.000 1.800 27° 1.000 800 28° 2.000 1.800 29° 1.000 1.200 30° 1.000 1.800 a) Classificare le famiglie rispetto a classi di reddito (0─┤1.000; 1.000─┤2.000; 2.000─┤3.000; 3.000─┤4.000) e classi di spesa (0─┤800; 800─┤1.200; 1.200─┤1.800; 1.800─┤2.500). b) Determinare il numero di famiglie aventi un livello di reddito non superiore a 2.000 e un livello di spesa non superiore a 1.800. Esercizio 47 D Calcolare il rapporto di concentrazione per la distribuzione del reddito di cui all’esercizio precedente e rappresentare la curva di concentrazione. 15 Esercizio 48 I Supponiamo che la distribuzione delle stature di 5.000 studenti maschi di 20 anni sia normale con media 169,5 cm. e scarto quadratico medio 6,5 cm.. Se estraiamo 100 campioni casuali di 30 elementi quante delle 100 medie possiamo aspettarci che siano comprese tra 168 e 171 cm.? Esercizio 49 I Supponiamo che un quiz implichi 40 domande e che uno studente abbia fornito 16 risposte corrette. Fissando un livello di significatività dello 0,01, sottoporre a test l’ipotesi che la probabilità di rispondere correttamente a ciascuna domanda sia pari a 0,5 contro l’ipotesi alternativa che sia diversa da 0,5. Disegnare la funzione potenza del test. Esercizio 50 D a) Si completi la seguente distribuzione doppia di frequenze affinché si abbia la massima concordanza dati i marginali indicati in tabella, giustificandone la scelta. Y y1 y2 y3 X x1 x2 x3 40 40 20 10 90 120 40 b) Si calcoli il rapporto di correlazione Y2 X . c) Si discuta il concetto di indipendenza in statistica. Esercizio 51 D Le osservazioni seguenti sono i risultati di uno studio volto ad accertare la relazione tra il peso finale di un prodotto (Y) e la quantità di materia prima impiegata (X). X (Kg) Y (Kg) 1,8 2,5 1,1 2,3 1,5 2,6 1,2 2,4 2,0 2,2 4,2 4,7 4,0 4,6 4,2 4,6 4,2 4,9 4,5 4,2 a) Si calcolino le stime dei parametri del modello di regressione lineare. b) Si verifichi, al livello di significatività del 5%, l’ipotesi che l’aumento di un Kg di materia prima produca un incremento di peso del prodotto finale pari a 0,5 Kg. 16 Esercizio 52 I In un campione di 373 studenti universitari è stata rilevata la votazione riportata all’esame di maturità, distintamente per maschi e femmine: Voto 36─42 Sesso Maschi Femmine TOTALE 87 43 130 43─48 49─54 56 44 100 TOTALE 55─60 31 42 73 22 48 70 196 177 373 Si costruisca l’intervallo di confidenza per la differenza tra le votazioni medie dei maschi e delle femmine con un livello di confidenza pari a 0,99. Esercizio 53 I Un grossista afferma che in base alla sua esperienza il 70% delle massaie acquista solitamente nei supermercati. Un’indagine di mercato ha riscontrato 406 acquirenti da supermercati su un totale di 600 massaie. Si verifichi se l’affermazione del grossista può ritenersi corretta ad un livello di significatività dello 0,01. Esercizio 54 D Si consideri la seguente tabella relativa agli Esercizi Extralberghieri al 1983. Regioni PIEMONTE VALLE D’AOSTA LOMBARDIA TRENTINO A. ADIGE VENETO FRIULI-V.GIULIA LIGURIA EMILIA ROMAGNA TOSCANA UMBRIA Numero di campeggi e villaggi turistici 137 70 201 86 Posti letto 36.816 21.700 63.841 28.214 185 29 180 95 166.449 29.853 51.772 72.710 176 29 110.215 8.838 a) Si descrivano i dati in tabella con opportuni indici statistici. b) Si determini la retta di regressione. c) Si calcoli l’indice di determinazione lineare. Esercizio 55 P Un’urna contiene 3 gettoni rossi, 5 gialli e 2 bianchi; si estrae un gettone, si osserva il colore, lo si rimette nell’urna e si estrae un secondo gettone. Determinare la probabilità che i gettoni così estratti siano: a) uno rosso e uno giallo; b) dello stesso colore. 17 Esercizio 56 I Un campione di 40 capsule di analgesico è stato fabbricato da una macchina A con peso medio 330 mg e varianza campionaria corretta 40 mg. Un’altra macchina B ha prodotto 50 capsule con peso medio 320 mg e varianza campionaria corretta 42,25 mg. Sottoporre a test l’ipotesi che le due macchine producano capsule di analgesico con lo stesso peso medio ad un livello di significatività del 5%. Esercizio 57 I Trovare un intervallo di confidenza al 99% per la media di una popolazione normalmente distribuita con varianza 100, avendo ottenuto un valore medio campionario di 68,63 da un campione di: a) 25 elementi; b) 50 elementi; c) Come varia l’intervallo in funzione della numerosità campionaria? Esercizio 58 D Si mettono a confronto tre lotti di lampadine elettriche della stessa potenza prodotte da tre ditte diverse. I saggi effettuati sui tre lotti hanno dato i seguenti risultati: Caratteristica Durata media (ore) Scarto Lotto 1 1.500 Lotto 2 1.400 Lotto 3 1.550 125 140 150 Quale giudizio potete dare sulla scelta dei tre lotti? Esercizio 59 I Nella Regione Campania la precipitazione media annua di pioggia è stata calcolata in cm. 48 con deviazione standard di cm. 16,5. Supponendo che la distribuzione delle precipitazioni segue una distribuzione normale, dire qual è la probabilità che nel corrente anno si abbiano tra 42 e 60 cm. di pioggia e quanti dei prossimi 25 anni potranno presentare lo stesso carattere. Esercizio 60 R Alcuni dati relativi ad un campione di 40 unità hanno fornito con riferimento a due variabili X ed Y i seguenti valori: Media della variabile X = 150, Media della variabile Y = 40 Varianza della variabile X = 81 Varianza della variabile Y = 25 Coefficiente di correlazione lineare r = 0,95. a) Determinare le rette di equazione y = a + bx, e x = a’ + b’y. b) Calcolare l’intervallo di confidenza per la media al 97% ed al 95,4%. 18 Esercizio 61 I La Euromercato S.p.a. è una società specializzata nella distribuzione di articoli di abbigliamento attraverso una catena di 100 negozi. In base al tipo di concorrenza, questi ultimi sono stati riportati in due gruppi, ed il responsabile del centro studi si chiede se questa classificazione corrisponda anche ad un diverso numero medio giornaliero di clienti. A questo scopo, 24 negozi vengono scelti a caso tra quelli di apertura nel corso dell’ultimo trimestre. I valori ottenuti sono riportati nella tabella che segue: Tipo di negozio 1 2 205 205 193 212 201 212 192 206 194 209 197 210 196 205 190 199 206 204 207 200 209 210 202 208 Verificare se esiste una differenza nel numero medio giornaliero di clienti, scegliendo un = 0,10. 19 Esercizio 62 R I dati relativi ad un numero di dipendenti ed al giro d’affari di un’industria per un periodo di undici anni sono i seguenti: anno Dip end enti giro di affari (in milioni) 1977 294 624 1978 271 661 1979 314 728 1980 356 782 1981 383 819 1982 369 869 1983 402 938 1984 422 1.023 1985 475 1.136 1986 475 1.227 1987 486 1.317 a) calcolare le stime dei coefficienti della retta di regressione; b) calcolare il coefficiente di determinazione; c) verificare le ipotesi: H0: 1 = 0 e H0: = 0. 20 Esercizio 63 I Data la tabella a doppia entrata seguente: Altezza Sesso 155-165 165-175 175-185 Totale Maschio 3 17 10 30 Femmina 7 8 5 20 10 25 15 50 Totale a) Misurare il grado di dipendenza dell’altezza dal sesso, e descrivere lo strumento statistico scelto nei suoi aspetti generali e interessanti. b) Misurare il grado di connessione tra classi di altezza e sesso, e descrivere, come sopra, lo strumento statistico scelto. c) Fare inferenza sulla tavola di contingenza. d) Calcolare l’intervallo di confidenza di media e varianza della popolazione da cui proviene il campione delle 50 unità considerate. Esercizio 64 D In uno studio relativo alla vendita di miscela presso i distributori di carburanti, si sono ottenuti i seguenti dati relativi a 50 distributori (ettolitri di miscela venduti in un giorno): 126 124 91 100 104 95 101 114 134 117 98 102 110 125 148 108 115 135 117 93 144 112 82 136 115 129 113 132 105 118 122 109 136 125 88 133 95 122 107 137 114 124 118 119 116 106 104 115 128 105 1. Costruire la distribuzione di frequenza, giustificando il numero di classi scelto. 2. Calcolare la media, la mediana e la moda. Esercizio 65 I Un campione di 15 batterie ha una durata media di x =8900 ore con uno scarto quadratico medio s=500 ore. Si costruisca un intervallo al 90% per la media della popolazione senza poter assumere che la durata di tutte le batterie segue una normale. Esercizio 66 I Un allevatore possiede una mandria di 150 bovini che vuol distribuire in due stalle A e B. Tali stalle possono accogliere tutta la mandria. I bovini si ripartiscono in modo equiprobabile ed indipendente nell’una e nell’altra stalla. Sia X la v.c. uguale al numero di vacche che scelgono la 21 stalla A. 1. Qual’è la distribuzione di probabilità di X. 2. Fornire e giustificare l’evento “il numero di vacche che scelgono A è superiore od uguale a 80”. 3. Ogni stalla ha N posti disponibili: N [75, 150]: a) Con la v.c. X e N spiegare l’evento A: tutte le vacche trovano un posto. b) Determinare il valore minimo di N perché la probabilità di A sia superiore a 0,9. 22 Esercizio 67 D Su due lotti di 20 pezzi ciascuno si è effettuata la misura del carico di rottura (espresso in Kg./cm 2). I valori sono i seguenti 90 86 91 88 93 86 82 90 83 86 88 82 86 90 91 93 80 88 85 95 120 86 91 100 93 86 82 103 83 86 88 99 86 90 91 106 80 88 85 98 1) Calcolare la media, la moda e la mediana. 2) Tracciare i Boxplot. 3) Commentare e valutare le differenze rilevate tra i due lotti. Esercizio 68 I Si supponga che il 50% di un ampio campione di studenti che sostengono per la prima volta un dato esame lo superino co un voto superiore a 24/30. Si valutino numero medio e deviazione standard del numero di studenti che, sostenendo detto esame per la prima volta, lo superano riportando un voto superiore a 24/30. Esercizio 69 I Un campione casuale di 30 segretarie, viene sottoposto ad una prova di videoscrittura. I risultati della prova sono x = 63 parole al minuto con s = 5 p.a.m.. a) si verifichi l’ipotesi che le segretarie non superino in media la velocità di 60 p.a.m. ( = 0,01) b) si supponga che se la velocità media è di almeno 64 p.a.m. si ha una differenza del valore ipotizzato della media che è considerata importante. Si determini la probabilità dell’errore di prima specie, e dell’errore di seconda specie. Esercizio 70 D Per la coltivazione di una nuova vite di vino, un’azienda vinicola ha analizzato la quantità di magnesio (in mg.) contenuta in 84 campioni di terreno nella provincia di Avellino e 72 campioni di terreno nella provincia di Benevento. I risultati sono riportati in tabella: Classi (in mg.) Campioni di terreno A Ammontare di magnesio in A Campioni di terreno B Ammontare di magnesio in B 0-5 5-15 15 18 20 108 8 8 40 112 15-40 19 304 10 400 40-60 60-70 70-100 12 6 14 600 390 1260 25 15 6 1025 975 426 Quale delle due province presenta terreni con una concentrazione di magnesio più elevata? 23 Esercizio 71 I I punteggi dei Q.I. dei volontari che si arruolano nella Protezione Civile in un dato anno si distribuiscono secondo una normale con media pari a 110 e s.q.m. pari a 10. La Protezione Civile vuole fornire un addestramento avanzato al 25% di reclutare che ha presentato il punteggio Q.I. più elevato. Qual è il punteggio minimo richiesto per l’ammissione al predetto addestramento avanzato? Esercizio 72 I Un’importante fabbrica tedesca di automobili, nell’intento di migliorare la qualità dei servizi offerti alla clientela, si rivolge ad un consulente statistico che elabora un modello di previsione dei tempi di consegna dei nuovi modelli di auto commissionate. Il consulente, ritenendo che esiste una relazione lineare tra la distanza di spedizione ed il tempo di consegna, considera un campione casuale di 8 automobili e rileva i seguenti dati: Auto Distanza percorsa in km. 1 60 2 156 3 148 4 168 5 180 6 300 7 235 8 195 Tempo di consegna in giorni 20 24 32 28 43 27 45 38 a) Si determini la retta di regressione; b) Si verifichi l’ipotesi che sia il coefficiente di regressione che quello di correlazione siano uguali a zero. Esercizio 73 D Un centro commerciale, costituito da sei capannoni, deve adeguare gli impianti elettrici alla legge 46/90. Allo scopo interpella una ditta di impiantistica industriale che prospetta la possibilità o di porre in essere sei centrali per ogni capannone, oppure un’unica centrale per tutti i capannoni a prezzo naturalmente più basso. I proprietari dei sei capannoni si accordano per questa seconda eventualità. Nella tabella sono riportate le distanze (in metri) dal primo capannone: CAPANNONE DISTANZE 1 2 3 4 5 6 0 16 45 90 122 164 Dove si prevede verrà posizionata la centrale? 24 Esercizio 74 I Si lancia 6.000 volte un dado regolare. Sia X la variabile casuale relativa all’evento E3 “Uscita della faccia 3”. Determinare il numero K affinché la probabilità di ottenere “3” un numero di volte compreso tra 1.000-K e 1.000+K sia uguale a 0,25. Esercizio 75 I Il Sig. Rossi, che vive in un paese del Centro Italia, desidera aprire un negozio in franchising con la Stefanel S.p.A., la quale per decidere se è opportuno aprire un negozio, invia un esperto a visitare il paese. L’esperto riferisce che il luogo ha tutte le caratteristiche per l’apertura ma, per decidere sull’opportunità economica, bisogna che venga valutata la variabile casuale X “reddito medio mensile per famiglia” che si distribuisce come una normale con media incognita e s.q.m = 400. Scelto un campione casuale di 50 famiglie si fissa la seguente regola di decisione: il negozio verrà aperto se il reddito medio per famiglia risulterà maggiore o uguale a £1.700.000. a) Si fissino le ipotesi; b) Si verifichi l’ipotesi nulla al livello di significatività del 5%; c) Si determini la curva di potenza del test per i seguenti valori alternativi: £1.630.000, £1.650.000, £1.675.000. Esercizio 76 I La tabella si riferisce ad un campione di studenti che hanno aderito alla richiesta di compilare un questionario per lo studio della relazione tra altezza dei genitori ed altezza dei figli maggiorenni. 1) Costruire la tavola a doppia entrata delle unità statistiche di osservazione costituite dalla coppia (padre, figlio) con riferimento all’altezza delle sottounità padre e figlio, distribuite in tre classi di statura di uguale ampiezza.. 2) Calcolare il rapporto di correlazione di Pearson, rispetto alle classi di altezza dei padri. 3) Selezionare un campione sistematico di 10 soggetti dalla popolazione dei padri e verificare che il campione possa ritenersi casualmente estratto da quella popolazione in termini di media. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 A lt ez 158 za 157 150 163 165 170 163 163 158 155 160 160 167 160 161 Altezza padre 165 155 160 158 183 172 169 175 165 155 160 158 180 170 172 Altezza madre 150 151 153 158 160 160 158 165 150 151 153 158 165 156 169 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 25 Alt ezz a 175 160 160 162 165 172 164 168 170 154 167 170 154 161 167 Altezza padre 172 160 164 170 182 175 181 172 180 172 170 174 173 162 165 Altezza madre 175 150 154 154 160 166 162 160 170 156 165 165 155 158 159 Esercizio 77 P In un luna park due ragazzi giocano al tiro al bersaglio, entrambi hanno a disposizione tre tiri. Le probabilità di colpirlo al primo, al secondo e al terzo tiro sono: I tiro II tiro III tiro Per il I ragazzo 0.4 0.5 0.7 Per il II ragazzo 0.2 0.6 0.7 Chi dei due ragazzi ha maggiore probabilità di colpire il bersaglio: 1) una sola volta 2) almeno una volta dopo i tre tiri. Esercizio 78 I Una grande azienda americana desidera migliorare il rendimento dei suoi impiegati. A tal fine seleziona un campione di 20 impiegati ai quali viene chiesto di frequentare due corsi di addestramento professionale. L’azienda è interessata alle valutazioni espresse dai suoi impiegati sui due corsi, tenuti: dal professor Pearson - corso P dal professor Desabie - corso D. Nella tabella sono riportati i giudizi sui due corsi, misurati con una scala di punteggio da 1 a 5: Soggetti P D Soggetti P D 1 2 3 4 5 6 7 8 9 10 3 1 2 4 3 3 2 2 4 3 4 3 3 3 4 4 3 3 5 4 11 12 13 14 15 16 17 18 19 20 2 3 4 3 4 5 4 3 4 4 5 4 4 3 5 5 4 5 3 4 a) Si costruisca la distribuzione di frequenze doppia (P,D) e le rispettive distribuzioni marginali. b) Supposto che i 20 soggetti siano stati estratti casualmente da una popolazione che segue una distribuzione normale, si verifichi, al livello 5% , che: H0 : P D 0 in alternativa H1: P D 0 . c) Si valuti il grado di dipendenza in media scegliendo l’indice statistico più appropriato. 26 Esercizio 79 I Un settimanale ha effettuato un’indagine sui giovani in cerca di lavoro, analizzando un campione di 60 ragazzi di 25 anni, di cui 32 provengono dalle regioni del Centro-Nord e 28 da quelle del Sud ed Isole. La distribuzione dei ragazzi del Centro-Nord in base al titolo di studio è risultata essere di 11 ragazzi con licenza media, 16 con diploma di scuola superiore, 5 con laurea, mentre la distribuzione dei ragazzi del Sud ed Isole in base al titolo di studio è risultata essere di 11 ragazzi con licenza media, 8 ragazzi con diploma e 9 con laurea. Si verifichi se esiste una relazione tra il titolo di studio e l’area geografica di provenienza. Esercizio 80 R Una piccola ditta produttrice di articoli sportivi alcuni mesi fa ha dato inizio ad una campagna pubblicitaria televisiva. In tabella sono riportate le vendite mensili (in milioni) ed il numero di passaggi televisivi mensili dello spot relativi ad un campione di sette mesi. Vend ite 18 24 25 11 32 15 40 Numero di passaggi televisivi 30 35 38 20 45 25 60 1) Si può affermare sulla base dei dati che esiste una relazione tra le vendite ed il numero di volte in cui lo spot è mandato in onda? 2) si verifichi la significatività del coefficiente di regressione; 3) si determini il residuo della stima delle vendite relativo al quinto mese di campagna. Esercizio 81 I Una ditta americana che produce bibite, desidera esaminare il prezzo delle lattine di aranciata nonchè l’offerta di limonata. A tal fine viene effettuata una indagine esaminando un campione di 50 distributori di bibite. Dall’indagine risulta che il prezzo medio delle lattine di aranciata è 1.364$ con uno scarto corretto pari 0.073$. Inoltre 11 distributori vendono anche la limonata. 1) Si verifichi se il prezzo dell’aranciata è significativamente diverso da 1.30$; 2) si verifichi se meno del 25% dei distributori commercializzano limonata; 3) si calcoli la dimensione del campione che occorre esaminare per stimare opportunamente la frequenza relativa dei distributori che vendono limonata ad un livello di fiducia del 90%, e per un intevallo di ampiezza 8% rispetto alla frequenza reale. 27 Esercizio 82 I Un'analista statistico addetto al controllo di qualità in un'azienda produttrice di pasta sta valutando le prestazioni offerte da due macchinari per la produzione di un particolare formato di pasta. Egli osserva per ciascun macchinario un campione casuale di scarti della produzione giornaliera in termini di peso espresso in oncia (unità di misura di peso inglese corrispondente a 30 grammi) della pasta non corrispondente al formato standard: Macchinario A Macchinario B 20 10 17 7 10 18 14 6 10 8 9 7 7 6 8 a. Questi dati forniscono all'analista una prova per sostenere che esiste una differenza tra le due medie del peso degli scarti di pasta? Si consideri un livello di significatività dello 0.05 e si supponga che il peso segua una distribuzione normale. b. Cosa cambia se svolgiamo lo stesso test se esprimiamo il peso in grammi? c. Si può sostenere che il peso medio nel macchinario A è maggiore di almeno 2 once rispetto al peso medio nel macchinario B? d. Si disegni un 'boxplot' dei dati relativi a ciascun macchinario commentando i risultati del confronto. Esercizio 83 R Un comune ha messo a disposizione dei residenti fondi a tassi agevolati. Supponiamo che per investigare se esiste una relazione tra l'ammontare y del prestito erogato dall'ente, in milioni di lire, e il reddito lordo annuale x, in milioni di lire, dei contraenti si considera un campione casuale di n=8 prestiti ottenendo i seguenti risultati: X Y 24 39.7 33 49.0 35 54.6 39 56.0 45 64.8 47 63.9 61 84.3 67 108.3 a. Riportare i dati in un grafico. b. Stimare la retta di regressione di y su x e riportarla nel grafico. c. Qual è, secondo la retta stimata, l'interpretazione del coefficiente di regressione? d. Calcolare il coefficiente di determinazione lineare della retta stimata. e. Verificare l'ipotesi che il coefficiente di regressione sia pari a 1.8 con un livello di significatività dello 0.05. Esercizio 84 D Un gestore di un patrimonio di 100.000.000 deve dividere il suo investimento tra tre tipologie di azioni dovendo scegliere, indipendentemente dal rendimento e dal rischio, tra i seguenti due pacchetti: 28 Azioni del settore bancario Azioni del settore industriale Azioni del settore hightech I pacchetto 45.000.000 II pacchetto 20.000.000 30.000.000 50.000.000 25.000.000 30.000.000 Analizzare le potenziali scelte dell’investitore 29 Esercizio 85 D Una società di intermediazione finanziaria gestisce sei diversi fondi comuni d’investimento. La distribuzione del suo patrimonio (in miliardi) tra i sei diversi fondi è riportata nella seguente tabella. Fondi Comuni Patrimonio investito 18 25 35 50 70 29 A B C D E F a) Si valuti, calcolando un opportuno indice statistico, il grado di diversificazione del portafoglio. b) Si rappresenti graficamente la distribuzione del patrimonio tra le varie attività rispetto alla situazione di equidistribuzione. Esercizio 86 R In una gara di nuoto (100 metri stile libero) sono state rilevate l’altezza (in centimetri) di sette nuotatori ed il tempo da essi impiegato in secondi: Tempo impiegato 57 79 62 77 67 73 70 Altezza 190 168 185 170 182 177 175 a) Si verifichi se la velocità è influenzata dall’altezza; b) Si calcoli il coefficiente di correlazione e si indichi qual è l’unità di misura del coefficiente di correlazione; c) Si sottoponga a verifica l’ipotesi che il coefficiente di regressione sia diverso da zero. Esercizio 87 I Uno studio condotto tre anni fa presso la facoltà di Economia di Napoli ha rivelato che il 10% degli studenti utilizzava lenti a contatto. Di recente è stato intervistato un campione di 200 studenti della stressa facoltà e si è riscontrato che 30 di essi utilizzano lenti a contatto. a) In base a tale risultato è possibile affermare, ad un livello di significatività del 95%, che la proporzione di utilizzatori di lenti a contatto è aumentata? b) Si disegni il grafico della funzione potenza del test. 30 Esercizio 88 I In un gioco vengono lanciate ripetutamente 3 monete. Un giocatore ritiene che le monete siano truccate. Egli, in 200 lanci, ha osservato la seguente distribuzione del numero di teste: Teste Frequenze 0 18 1 63 2 84 3 35 Si può ritenere che il giocatore abbia ragione ad un livello di significatività del 5%? Esercizio 89 I La direzione commerciale di una industria di abbigliamento sportivo ha stabilito che un particolare modello di scarpe può essere venduto ad un prezzo (espresso in dollari) che può variare da un minimo di $70 ad un massimo di $150. La direzione vuole valutare il grado di dipendenza in media del prezzo rispetto alla localizzazione del negozio in cui il prodotto è in vendita, distinguendo tra negozi del centro città, della periferia e della provincia. Sulla base di un campione di 120 negozi sono stati rilevati i dati riportati nella seguente tabella. Localizzazione del negozio centro città periferia provincia Prezzo in dollari 70—\90 90—\110 110—\130 130—\150 70—\90 90—\110 110—\130 130—\150 70—\90 90—\110 110—\130 130—\150 TOTALE a. b. c. d. e. Numero di negozi 0 10 20 20 5 10 10 5 10 30 0 0 120 Si può ritenere che il prezzo scelto dal negoziante sia statisticamente indipendente dalla localizzazione del negozio? Si valuti il grado di dipendenza in media scegliendo l'indice statistico più appropriato. Si fornisca una rappresentazione grafica della distribuzione del prezzo. Si verifichi con un test statistico l'ipotesi che indipendentemente dalla localizzazione del negozio il prezzo medio delle scarpe sia $108. Si verifichi che non ci sia una differenza significativa tra il prezzo medio delle scarpe in vendita in città ed il prezzo medio delle scarpe in vendita in periferia. 31 Esercizio 90 I Nella regione Campania la precipitazione media annua di pioggia è stata calcolata in cm 48 con deviazione standard di cm 16,5. Supponendo che la distribuzione delle precipitazioni segue una curva normale, dire qual è la probabilità che nel corrente anno si abbiano tra 42 e 60 centimetri di pioggia e quanti dei prossimi 25 anni potranno presentare lo stesso carattere. Esercizio 91 R Alcuni dati relativi ad un campione di 40 unità hanno fornito con riferimento a due variabili X ed Y i seguenti valori: media della variabile X = 150, media della variabile Y = 40 varianza della variabile X = 81, varianza della variabile Y = 25 coefficiente di correlazione lineare = 0,95. a. Determinare le rette di equazione y = a+bx, e x = a'+b'y, b. Calcolare l'intervallo di confidenza per la media al 97% ed al 95,4%. Esercizio 92 I Data la tabella a doppia entrata seguente: Sesso Altezza 155-165 Maschio Femmina Totale totale 166-175 3 7 10 176-185 17 8 25 10 5 15 30 20 50 a. Misurare il grado di dipendenza dell'altezza dal sesso, e descrivere lo strumento statistico scelto nei suoi aspetti generali ed interessanti. b. Misurare il grado di connessione tra classi di altezza e sesso, e descrivere, come sopra, lo strumento statistico scelto. c. Fare inferenza sulla tavola di contingenza. d. Calcolare l'intervallo di confidenza di media e varianza della popolazione da cui proviene il campione delle 50 unità considerate. 32 Esercizio 93 D La distribuzione di frequenze degli investimenti, in miliardi di lire, delle aziende di un settore è risultata la seguente: Investimenti 1—5 5 — 10 10 — 20 20 — 50 50 — 100 oltre 100 (in media 180) Frequenze 180 255 118 30 12 5 a) Calcolando gli opportuni indici statistici si descrivi il fenomeno. b) Si rappresenti la distribuzione mediante un istogramma di frequenze oppure mediante il grafico a scatola (box-plot) illustrandone il significato. c) Si analizzi la concentrazione degli investimenti. Un certo tipo di caramelle viene venduto mescolando, in maniera casuale, il 60% di caramelle rosse ed il 40% di caramelle gialle. a) Con riferimento ad una confezione di 200 caramelle, si determini la probabilità che il numero di caramelle rosse sia maggiore di 130 e b) che il numero di caramelle rosse sia compreso tra 110 e 125. c) Si determini il numero di caramelle rosse che devono trovarsi in una confezione affinchè la probabilità risulti pari a 0.5. Esercizio 94 I Agli studenti che si sono presentati ad un esame sono stati assegnati, in maniera casuale, due compiti diversi. I risultati sono stati i seguenti: Numero studenti voto medio varianza corretta COMPITO A 60 25.4 14 COMPITO B 40 24 12 Gli studenti del compito A si sono lamentati sostenendo che la loro prova era più difficile. Alla luce dei risultati, in termini di voto medio la loro protesta può ritenersi fondata al livello di significatività del 5%? 33 Esercizio 95 R Su un campione di individui maschi (della stessa età) partecipanti ad un corso di atletica, si sono rilevate le seguenti variabili: tempo impiegato per correre un percorso di 2400 metri (in minuti) e peso corporeo (in Kg). individui A B C D E F G Tempo peso 12,37 8,85 13,08 14,03 10,05 12,12 10,54 81,47 68,84 83,32 87,66 71,45 79,15 73,32 a) Si determini la retta di regressione lineare tra i due fenomeni avente significato logico e se ne illustri la validità; si commenti il tempo di percorrenza teorico per un individuo di 60 Kg. b) Si valuti la bontà di accostamento del modello ai dati osservati. c) Si verifichi l'ipotesi che il coefficiente di regressione è pari a zero per un livello di significatività del 5%. Esercizio 96 D Si consideri la seguente tabella. Anno 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 a) b) Nuclei familiari dotati di televisione (centinaia di migliaia) (X) 13 20 23 25 27 31 36 46 55 63 70 76 81 85 Numero di malati mentali ricoverati (per 1000 abitanti) (Y) 8 8 9 10 11 11 12 16 18 19 20 21 22 23 Calcolare il coefficiente di correlazione lineare delle due variabili. Commentare il risultato ottenuto. 34 Esercizio 97 I Una bevanda alcolica è posta in vendita sul mercato americano da parecchi mesi ed è noto che la cifra d' affari mensili segue una legge normale con media 156:364 dollari e scarto quadratico medio 19.000 dollari. Viene programmata una campagna pubblicitaria. La cifra d'affari delle vendite degli otto mesi successivi alla fine della campagna pubblicitaria è di 165.000 dollari. Si suppone che lo scarto quadratico medio resti constante. a) La campagna pubblicitaria ha aumentato il livello medio delle vendite del 10%? b) Quale valore critico è necessario assumere per rifiutare l'ipotesi nulla limitando all'1% la probabilità dell'errore di primo tipo? c) Calcolare la potenza del test per valori alternativi 170.000, 171.000, 168.000, rispettivamente, e tracciare il grafico. Esercizio 98 I Il Preside della Facoltà di Economia desidera stimare la proporzione di studenti iscritti ai corsi di specializzazione post-universitaria della pubblica amministrazione che sono laureati in Economia, con un errore di stima di 0,05 e con un livello di confidenza del 90%. Qual è la dimensione che il campione deve avere se non vi è alcuna possibilità di stimare il valore approssimativo delle proporzione prima di formare il campione? Esercizio 98 I Il responsabile della contabilità di una grande compagnia di vendita al minuto desidera confrontare le ricevute della spesa per il pranzo dei funzionari nel reparto di vendita e nel reparto di produzione. In ciascun reparto viene estratto un campione di 15 ricevute e si hanno i seguenti risultati: reparto di vendita media campionaria $ 42.50 varianza campionaria corretta: $ 90.25 reparto di produzione media campionaria $ 35.75 varianza campionaria corretta: $ 67.24 a) Con quale livello di significatività vi sono elementi per sostenere che l'importo medio delle ricevute della spesa per il pranzo nel reparto di vendita sia superiore a quello nel reparto di produzione? Quale supposizione è necessaria per poter eseguire il test? b) Si calcoli la potenza del test qualora la differenza fra gli importi medi nei due reparti sia pari a $ 5.14, $ 4.51, $ 4.11 rispettivamente. c) Si disegni il grafico della funzione potenza del test illustrando come questo si modifica qualora il campione estratto in ciascun reparto sia pari a 30 ricevute. Esercizio 99 I Una compagnia televisiva che trasmette programmi via cavo vorrebbe stimare la proporzione dei suoi clienti che acquistano la guida televisiva dei programmi via cavo. La compagnia vorrebbe il 95% di confidenza che la sua stima sia corretta entro un intervallo di 0.05 intorno alla proporzione reale. L'esperienza passata indica che il 30% dei suoi clienti compra la guida televisiva. Quale sarà la dimensione del campione? 35 Esercizio 100 R L'esperto di statistica di una grossa fabbrica americana di automobili vorrebbe sviluppare un modello statistico per prevedere i tempi di consegna (i giorni che trascorrono dall'ordinazione dell'automobile fino all'effettiva consegna) di automobili nuove, ordinate dai vari clienti. Lo statistico ritiene che esiste una relazione lineare tra numero di "optional" richiesti sull'automobile e tempo di consegna. Si seleziona un campione casuale di 16 automobili, con i risultati nella tabella che segue. Automobile Numero di optional ordinati 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Tempo di consegna (in giorni) 3 4 4 7 7 8 9 11 12 12 14 16 17 20 23 25 25 32 26 38 34 41 39 46 44 51 53 58 61 64 66 70 a) Si disegni il diagramma di dispersione. b) Si definisca il modello, si determinino le stime dei parametri e si interpreti sia l'intercetta che il coefficiente angolare in questo problema. c) Se si richiedono 16 optional su un'automobile, quanti giorni si dovranno prevedere per la consegna? d) Si calcoli l'indice di determinazione lineare e se ne interpreti il suo significato in questo problema. e) Per quale livello di significatività si può dimostrare l'esistenza di una relazione lineare tra il numero di optional e il tempo di consegna? Esercizio 101 I Il direttore della banca di una piccola città vorrebbe stabilire la proporzione di depositanti che vengono pagati settimanalmente. Su un campione casuale di 100 depositanti, 30 affermano di essere pagati settimanalmente. a) Si rilevi la stima per intervallo, con confidenza del 90%, della proporzione reale di depositanti della banca che vengono pagati settimanalmente. b) Se il direttore di banca vuole il 90% di confidenza che la sua stima sia corretta entro un intervallo di 0.05 intorno alla proporzione reale di depositari pagati settimanalmente, quale sarà la dimensione del campione? 36 Esercizio 102 I Un campione casuale di 500 telefonate extraurbane rivelò la seguente distribuzione di durata delle telefonate (in minuti): Durata (in minuti) 0 |- 5 5 |- 10 10 |- 15 15 |- 20 20 |- 25 25 |- 30 Frequenze 48 84 164 126 50 28 a) Si descrivino i dati in tabella. b) Ad un livello di significatività di 0.01 si può ritenere che i dati seguano una distribuzione normale. Esercizio 103 R Si considerino i dati in tabella 1 relativi al prezzo ed alle quantità vendute di un nuovo concime biologico: Prezzo Quantità 9 11 12 13 15 16 15 15 14 10 a) Si stimi la retta di regressione; b) si calcoli l’indice di determinazione lineare; c) si verifichi l’ipotesi nulla che il coefficiente di regressione è pari a zero. Esercizio 104 I Una compagnia aerea deve stabilire il numero di posti di prima classe di una nuova linea. Sulla base dell’esperienza si sa che il 12% dei posti disponibili sono di prima classe. In un volo di prova sono stati richiesti 20 posti di prima classe su un totale di 100 posti disponibili. a) Si verifichi l’ipotesi nulla che la percentuale di posti di prima classe sia pari al 12%; b) si calcoli la potenza del test per una ipotesi alternativa che tale percentuale sia pari al 15%, considerando un livello di significatività = 0.01; c) a quanto deve essere uguale la numerosità del campione se si fissa un errore di stima = 0.2 ? 37