PROVE SCRITTE PER
L’ESAME DI STATISTICA I
Prof.ssa R. Siciliano
Legenda:
 D = Statistica descrittiva
 I = Inferenza statistica
 P = Calcolo delle probabilità
 R = Regressione lineare semplice
Esercizio 1 R
Alcuni dati campionari hanno fornito:
x = 150 y = 40
sy = 5
sx = 9
Coefficiente di correlazione lineare r = - 0,95.
a) Determinare le rette di equazione y = a + bx.
b) Stimare il valore di y per x = 120.
Esercizio 2 I
Un campione di 16 determinazioni casuali indipendenti di una v.c. normale avente media e
varianza ignote, ha mostrato una media campionaria pari a 68 ed una stima corretta della
varianza pari a 9.
Determinare gli intervalli di confidenza per la stima della media ai livelli di confidenza del 95%
e del 99%.
Esercizio 3 I
Un’azienda commerciale vuole lanciare un nuovo prodotto su una certa zona e desidera
effettuare una campagna pubblicitaria su un quotidiano locale.
Allo scopo di effettuare una corretta decisione viene considerata una v.c. X “reddito medio
mensile per famiglia“ che si suppone sia distribuita normalmente con media ignota e s.q.m. = 20
dollari.
Si fissa la seguente regola di decisione:
- se il reddito medio mensile per famiglia è maggiore o uguale a 400 dollari si effettua la
campagna;
- se il reddito medio mensile per famiglia è inferiore ai 400 dollari, non si effettua la campagna;
Scelto un campione casuale n = 100
a) si fissino le ipotesi
b) si verifichi l’ipotesi nulla al livello di significatività del 5%
c) si determinino alcuni valori della funzione di potenza e della curva operativa, tracciando una
delle due curve. I valori alternativi siano 398,61; 396,71; 394,71; 392,71.
Esercizio 4 I
Determinare il valore di z tale che:
P  z  Z  z  0,7372
Esercizio 5 D
a) Si costruisca una distribuzione per classi in maniera tale che Q1 + Q3 = Me
b) Si commentino i risultati.
2
Esercizio 6 R
Dato un campione di 15 abitazioni, si vuole stabilire se c’è relazione tra il valore di vendita
(variabile dipendente Y) e la superficie dell’abitazione computata ai fini del riscaldamento
(variabile indipendente X), fissato il rischio  = 0,01 e l’errore standard della regressione sxy =
2,910
Numero
civico
1
34,4
Area da
riscaldare
(xi)
1,858
2
34,4
1,858
3
25,7
1,347
4
35,9
1,635
5
29,1
1,793
6
30,4
1,115
7
25,8
1,440
8
35,9
1,793
9
28,5
1,477
10
29,2
1,394
11
36,7
1,765
12
29,3
1,291
13
24,5
1,431
14
33,8
1,756
15
26,8
1,477
443,4
23,161
Totale
Valore
Stabilito(yi)
yi2
1183,
36
750,7
6
660,4
9
1288,
81
846,8
1
416,1
6
665,6
4
1288,
81
812,2
5
852,6
4
1346,
89
858,4
9
600,2
5
1142,
44
718,2
4
1343
2,04
3
xi yi
xi2
3,452
63,915
2,525
43,539
1,814
34,618
2,673
58,697
3,215
52,176
1,243
22,746
2,074
37,153
3,215
64,369
2,182
42,095
1,943
40,705
3,115
64,776
1,667
37,826
2,048
35,060
3,084
59,353
2,182
39,854
36,432
696,611
Esercizio 7 I
Dato un campione di 314 alunni delle scuole elementari si vuole verificare l’indipendenza tra
rendimento scolastico (misurato da tre valutazioni qualitative dell’insegnante) e numero dei figli
della famiglia di appartenenza.
N.figli
1
2
3
4
5
più di 5
Totale
Rendimento Scolastico
Scarso
Sufficien
te
3
1
7
23
19
30
14
13
15
14
46
34
104
115
Totale
Buono
3
17
22
19
18
16
95
7
47
71
46
47
96
314
Esercizio 8 I
Un’azienda elettronica registra il 20% ( = 0,20) di pezzi difettosi. A seguito di una modifica
dei processi è necessario verificare se la percentuale diminuisce. Per un campione casuale di 100
transistor risulta p=0,14. Si verifichi l’ipotesi (con  = 0,05) che il nuovo processo non sia
migliore del vecchio. Si calcoli, inoltre,  supponendo che  = 0,15.
4
Esercizio 9 R
Alcuni dati campionari hanno fornito:
x = 150 y = 40
sy = 5
sx = 9
Coefficiente di correlazione lineare r = - 0,95.
a) Determinare le rette di equazione y = a + bx.
b) Stimare il valore di y per x = 120.
Esercizio 10
I
La lunghezza media delle pannocchie di grano è stata, nel passato, uguale a 23 cm.
a) si vuole sottoporre a test l’ipotesi che le pannocchie di un anno abbiano una lunghezza media
diversa, sulla base di un campione di 40 elementi con un  = 0,04.
La media del campione è x = 24,35.
30
29
29
27
29
30
20
28
16
23
27
30
19
27
17
25
25
22
21
29
23
16
23
22
18
28
29
16
17
24
27
18
29
26
23
20
30
30
24
28
b) si determini la potenza del test per un valore alternativo di 19,5.
Esercizio 11
I
In una ditta viene sottoposta a 40 uomini e 50 donne una prova attitudinale per valutare la
capacità nello svolgere un determinato lavoro. I risultati sono stati i seguenti:
xu = 79,5
xd = 85,6
~s = 9,8 ~
sd = 10,6
u
a) Sottoporre a verifica i risultati con  = 0,01.
b) Con  uguale a 0,01 fino a quale valore della differenza tra i valori medi si accetta l’ipotesi
nulla?
Esercizio 12
I
In uno studio sul decadimento radioattivo sono stati osservati il numero dei decadimenti in 440
periodi di tempo costanti. Le frequenze osservate sono riportate nella tavola seguente
N.
decadimenti
0
1
2
3
4
5
6
7
8
9
Totale
Freq. Osservate
18
53
103
107
82
46
18
10
2
1
440
Verificare se la distribuzione esposta nella tavola segue una distribuzione di Poisson al livello di
significatività del 5%.
5
Esercizio 13
D
Data la seguente tabella:
Classi di reddito
mensile
(migliaia
di £. 1971)
meno di 150
150 – 250
250 – 350
350 – 450
450 e più
Totale
Redditieri
ni
Redditi stimati delle classi
xini
100
50
30
15
5
200
10.000
10.000
9.000
6.000
3.000
38.000
a) Si calcoli il Rapporto di Concentrazione.
b) Si disegni la curva di concentrazione.
Esercizio 14
I
La media delle stature di un campione n = 25 coscritti nati nel 1965 è di 176,5 cm., con s 1 = 7
cm.; la media delle stature di un campione n = 30 coscritti nati nel 1930 è di 162,4 cm., con s 2 =
6,5 cm.. Si supponga che le stature si distribuiscano normalmente e fissata la soglia dello 0,05:
a) si verifichi l’ipotesi che la data di nascita non esercita alcuna influenza sulla statura.
Esercizio 15
I
Nel 1975 la spesa media giornaliera per consumi alimentari (in migliaia di lire) di un campione
di 21 famiglie di professori universitari, estratte senza ripetizione dall’universo di appartenenza,
era di £. 15.000 con s = £. 1.000.
Fissato il livello del 5 % si determini l’intervallo di confidenza per la media:
a) non potendo formulare alcuna ipotesi sulla distribuzione della popolazione;
b) ipotizzando che la popolazione sia distribuita normalmente.
Esercizio 16
I
Da valutazioni empiriche risulta che negli Stati Uniti si verificano 8 incidenti automobilistici
mortali in ogni ora, durante i fine settimana. Assumendo che tali incidenti avvengano
indipendentemente gli uni dagli altri, calcolare la probabilità:
a) che trascorra un’ora senza incidenti;
b) che trascorrano 15 minuti con un solo incidente;
c) che trascorrano quattro intervalli consecutivi di 15 minuti ciascuno con un solo incidente in
ognuno di essi;
d) che si abbiano quattro incidenti in un ora.
A che cosa è dovuta la differenza tra i risultati c) e d)?
6
Esercizio 17
P
In un libro di 520 pagine si trovano 390 errori tipografici.
- Qual è la probabilità che quattro pagine, scelte a caso dal tipografo come saggio del suo lavoro,
siano esenti da errori?
- Si discuta della distribuzione di probabilità scelta.
Esercizio 18
I
Dalle statistiche di produzione risulta che il 30% delle batterie prodotte è difettoso.
- Qual è la probabilità di selezionare un campione di n = 64 batterie con una proporzione di
difetti maggiore o uguale al 20%, campionando da un lotto di N = 1.000 pezzi?
Esercizio 19
I
In una nota catena di negozi di abbigliamento si vendono in media 25 capi per negozio in ogni
settimana. Si è però notato in un campione di n = 36 negozi, che durante i saldi invernali ed
estivi tali vendite aumentano. Trovare una regola di decisione affinché il manager possa
decidere se è opportuno, in tali periodi, l’assunzione di altre commesse, con  = 6 ed  = 0,05.
Quindi calcolare l’errore di seconda specie () in corrispondenza di una media alternativa
all’universo 1 = 27, verificando l’effetto della numerosità campionaria su , per n = 36 ed n =
100.
Esercizio 20
R
Si discuta, brevemente, del significato da attribuire al Coefficiente di Determinazione (o indice
di miglioramento lineare); ed inoltre si evidenzi il suo legame con il Coefficiente di correlazione
lineare.
Esercizio 21
P
Si lancia 500 volte una moneta; determinare la probabilità che si presenti un numero di teste
superiore a 260.
Esercizio 22
I
Si effettui un confronto tra due sussidi didattici sulla base di due campioni sottoposti
separatamente a ciascuno dei due sussidi. E’ noto che la varianza della prima popolazione è pari
a 64 punti e quella della seconda popolazione è pari a 144 punti.
Il primo campione di 80 studenti ha riportato un punteggio medio di 68 punti ed il secondo
campione di 120 studenti ha riportato un punteggio medio di 65 punti. Si vuole verificare se i
due sussidi hanno pari efficienza, in termini di punteggi medi. Si ponga  = 0,02.
Esercizio 23
I
Siano dati gli eventi xi (i = 1,2,3,4,5) le cui frequenze osservate fi sono riportate in tabella.
Verificare se gli eventi sono equiprobabili, al livello di significatività  = 0,05.
Numero
eventi
xi
1
2
3
4
5
TOT
Numero
osservazioni
fi
58
50
32
40
20
200
7
Esercizio 24
R
Determinare La retta interpolatrice dei minimi quadrati per i seguenti dati:
X
1
3
4
6
8
9
Y
1
2
4
5
5
7
Si valuti la bontà dell’adattamento.
Esercizio 25
P
Una commissione è formata da 6 democratici e 5 repubblicani. Tre dei rappresentanti di ciascun
partito sono uomini. Se si sceglie come presidente un uomo, qual è la probabilità che sia
repubblicano?
Esercizio 26
I
Un’azienda vuole stimare la proporzione d’uso del prodotto di vendita. L’errore ammesso è
minore del 5% con un rischio del 10%. Qual è la dimensione campionaria opportuna?
Esercizio 27
I
Un’impresa che produce batterie rileva difetti di produzione nel 30% dei casi. Si sperimenta un
nuovo procedimento per ridurre la proporzione di difetti. Si estrae un campione di numerosità n
= 64 da una popolazione di 1.000 batterie e si riscontrano 15 difetti. Fissato il rischio  = 0,01,
si può concludere che, con il nuovo procedimento, si ottiene un decremento significativo della
proporzione di difetti?
Esercizio 28
P
Sia A l’insieme dei numeri pari non superiore a 90 e B l’insieme dei multipli di 5 non superiori
a 90. Si è interessati alla probabilità che il primo numero estratto nel gioco del lotto, sulla ruota
di Napoli, sia un numero pari o un numero multiplo di 5.
Esercizio 29
I
Dato un campione di 314 alunni delle scuole elementari si vuole verificare l’indipendenza tra
rendimento scolastico (misurato da tre valutazioni qualitative dell’insegnante) ed il numero di
figli della famiglia di appartenenza.
N.Figli
1
2
3
4
5
più di
5
Totale
Scarso
3
7
19
14
15
46
Sufficien
te
1
23
30
13
14
34
104
114
Buono
Totale
3
17
22
19
18
16
7
47
71
46
47
96
95
314
8
Esercizio 30
R
Un sociologo viene assunto in un carcere minorile per studiare se esiste relazione tra intelligenza
e crimine. A tale scopo costruisce un indice di criminalità (IC) che tiene conto sia della gravità
che della frequenza dei reati commessi dai giovani, mentre l’intelligenza viene misurata con un
indice del quoziente di intelligenza (QI) ottenuto da alcuni test a cui si sottopone un campione di
18 ragazzi detenuti:
(IC)
Yi
26,2
33,0
17,5
25,25
20,3
31,9
21,1
22,7
10,7
22,1
18,6
35,5
38,0
30,0
19,7
41,1
39,6
25,15
(QI)
Xi
110
89
102
98
110
98
122
119
120
92
116
85
73
90
104
82
134
114
a) stimare la retta di regressione per valutare l’influenza del quoziente intellettivo sui crimini
commessi.
b) si valuti l’ipotesi che non esista relazione tra le due variabili, fissando un livello di
significatività  = 0,05.
c) si costruisca l’intervallo di confidenza per il coefficiente angolare, fissando un livello di
fiducia  = 0,05.
Esercizio 31
I
Da un processo produttivo di barre di acciaio si estrae un campione di n1 = 49 barre e si osserva
che il punto medio di rottura è di 318 cm. Inoltre, il direttore di produzione deve valutare se
introdurre un nuovo processo nel quale al posto dell’acciaio si impiega una nuova lega. A tal
fine considera un campione di n2 = 64 barre della nuova lega il cui punto medio di rottura è 314
cm. Sapendo che lo s.q.m. del processo di produzione dell’acciaio è di 21 cm. e quello della
nuova lega è 24 cm., decidere se il punto medio di rottura è significativamente maggiore di
quello della lega. Il rischio legato alla decisione sia posto pari a 0,05.
Esercizio 32
I
a) Data una variabile X distribuita normalmente con media 50 e varianza 100, trovare P(38 < x <
47)
b) Data una variabile X distribuita normalmente con media 40 e varianza 100, trovare il valore
soglia x* di X tale che P(X > x*) = 0,1423.
9
Esercizio 33
I
Sono di seguito riportati i dati relativi alle ore di trasmissione alla televisione per alcuni tipi di
programmi nel 1994:
Spettacoli
Ore di
trasmissione
RAI 1

musica RAI 2
RAI 3

86
59
109
RAI 1

sceneggiati e telefilmRAI 2
RAI 3

522
934
217
RAI 1

filmRAI 2
RAI 3

446
459
340
RAI 1

cartoni e comicheRAI 2
RAI 3

167
102
5
RAI 1

inchieste e documentari RAI 2
RAI 3

335
109
266
RAI 1

pubblicità RAI 2
RAI 3

168
135
8
Determinare la distribuzione doppia “tipo di spettacolo/rete televisiva” per le ore di trasmissione
e verificare se i diversi tipi di spettacolo sono connessi con le reti oppure se sono indipendenti.
Costruire inoltre la tabella delle contingenze e determinare il coefficiente di contingenza.
Esercizio 34
I
Di 300 arance prelevate a caso da una partita consegnate ad un supermercato 25 sono risultate
invendibili perché troppo mature.
a) Si verifichi che la probabilità di estrarre un’arancia invendibile sia uguale a 0,01 con un
livello di significatività dello 0,05.
b) Si determini la potenza del test sotto l’ipotesi alternativa che la probabilità di estrarre
un’arancia invendibile sia uguale a 0,08.
10
Esercizio 35 D
Un commerciante possiede 6 negozi dislocati lungo un percorso rettilineo. Nella tabella che
segue sono indicate le distanze (in Km) dal primo negozio e il numero di rifornimenti che
vengono effettuati in un mese per ciascun negozio.
Negozi
Distanze
Numero di
dal negozio
riforniment
A
i mensili
A
0
10
B
5
5
C
20
9
D
50
10
E
80
30
F
100
27
a) A quale distanza il commerciante deve costruire il deposito centrale che rifornisce tutti i
negozi in modo tale da minimizzare le distanze da percorrere ogni mese?
b) Si commenti con un esempio numerico quando occorre utilizzare la mediana rispetto alla
media aritmetica.
Esercizio 36
I
Da una popolazione si estrae un campione di ampiezza 100. Nella seguente tabella sono riportati
i valori raggruppati in classi. Verificare se la popolazione risulta normalmente distribuita al
livello di significatività dello 0,01.
Classi
<5
5─┤10
10─┤15
15─┤20
20─┤25
>25
Frequen
ze
8
10
23
30
18
11
Esercizio 37 I
Un’impresa che produce filo metallico ritiene che il punto di rottura è 80 Kg. con varianza pari a
16 Kg., e vende alla clientela comunicando tali specifiche. Un cliente seleziona casualmente 64
matasse la cui media campionaria è 79 Kg.
a) Egli deve decidere se accettare o meno al partita con un livello di significatività del 5%.
b) Se si configura l’ipotesi alternativa pari a 78 Kg. calcolare la probabilità dell’errore di
seconda specie.
Esercizio 38
I
In un gioco vengono lanciate ripetutamente 3 monete. Un giocatore ritiene che le monete siano
truccate. Egli, in 200 lanci, ha osservato la seguente distribuzione del numero di teste:
Teste
Freque
nze
0
1
8
1
6
3
2
8
4
3
3
5
Si può ritenere che il giocatore abbia ragione ad un livello di significatività del 5%.
11
Esercizio 39
R
Per il controllo di gestione di una catena di fast-food la direzione ha effettuato una rilevazione
dei costi sostenuti - espressi in migliaia di lire - (Y) in relazione alle presenze giornaliere (X)
con i risultati illustrati nella seguente tabella.
X
1.470
1.965
788
1.620
855
1.210
Y
7.250
8.886
4.214
7.580
4.526
5.784
a) Supponendo che tra i costi sostenuti e le presenze giornaliere intercorra una relazione lineare
si determini la stima della retta di regressione lineare.
b) Si determini l’indice di determinazione lineare.
c) Si verifichi l’ipotesi che il coefficiente di regressione sia pari a zero con un livello di
significatività dello 0,05.
Esercizio 40
R
Un campo è suddiviso in appezzamenti unitari per verificare l’incidenza della quantità di nuovo
fertilizzante sulla resa della coltivazione di mais. Nella tabella seguente sono riportate le rese dei
diversi appezzamenti Y e le relative quantità di fertilizzante impiegato X.
X
Y
0
,
4
1
6
0
,
4
1
2
0
,
6
1
8
0
,
6
1
6
0
,
8
2
3
0
,
8
2
8
1
1
3
2
2
5
1
,
2
3
2
1
,
2
3
4
1
,
4
3
8
1
,
4
3
4
1
,
6
4
0
1
,
8
4
3
a) determinare la retta di regressione dei minimi quadrati spiegando il significato dei parametri.
b) determinare il coefficiente di correlazione lineare.
Esercizio 41
I
Il direttore del personale di una grande società presume che ci sia una relazione tra assenteismo
ed età dei dipendenti. Nella tabella che segue sono riportate le informazioni sull’età e sui giorni
di assenza per un campione di 100 lavoratori.
Giorni di
assenza
Età
1├
─5
5├─
10
10├─
15
15├─
20
TOTA
LE
20├─30
30├─40
40├─50
50├─60
60├─65
TOTALE
0
0
0
0
10
10
0
0
20
10
10
40
10
20
0
0
0
30
20
0
0
0
0
20
30
20
20
10
20
100
12
a) Verificare se esiste una relazione di dipendenza in media tra i due caratteri mediante il
rapporto di correlazione di Pearson.
b) Verificare con un test statistico l’ipotesi nulla che il coefficiente di correlazione lineare tra i
due caratteri sia pari a 0.
13
Esercizio 42 I
Per sottoporre a test l’ipotesi che in una pesata automatica il valore medio sia di 150 grammi con
uno scarto quadratico medio di 5 grammi si decide di accettare l’ipotesi nulla se in un campione
di 100 confezioni il peso medio risulta compreso tra 149 e 151 grammi. Dire quali sono:
a) l’ipotesi nulla e l’ipotesi alternativa;
b) il livello di significatività;
c) le condizioni in cui si compie un errore di prima specie;
d) le condizioni in cui si compie un errore di seconda specie;
Esercizio 43
I
Una macchina produce un tipo di catene di bicicletta con lunghezza normalmente distribuita,
con media pari a 150 cm. e scarto quadratico medio pari a 3 cm.
Per un certo tipo di biciclette si richiede che le catene abbiano lunghezza una lunghezza
compresa tra 152 e 156 cm., in caso contrario la catena, prima di poter essere utilizzata, deve
essere modificata.
a) Qual è la percentuale di catene prodotte dalla macchina che vengono utilizzate senza essere
modificate?
b) Se la macchina viene regolata in modo che la lunghezza delle catene abbia media pari a 154
cm. (lo scarto quadratico medio si suppone rimanga costante), qual è la percentuale di catene
utilizzate senza modifiche?
c) É conveniente la nuova regolazione?
Esercizio 44
D
Descrivere statisticamente i dati in tabella.
Classi di
superficie per
ettari
0,00─1,00
1,01─2,00
2,01─3,00
3,01─5,00
5,01─10,00
10,01─20,00
20,01─50,00
50,01─250,00
TOTALE
Nume
ro di
aziend
e
1.164
682
414
477
467
240
111
51
3.606
Esercizio 45
I
Si verifichi con un test statistico l’adattamento della normale alla distribuzione di frequenze
relativa alla tabella riportata nell’esercizio precedente.
14
Esercizio 46
D
Si consideri la seguente tabella:
Distribuzione unitaria del reddito e della spesa mensile in un collettivo di 30 famiglie.
Famig
Reddito
Spesa
lie
(lire in
(lire in
migliaia)
migliaia)
1°
2.000
1.800
2°
4.000
2.500
3°
1.000
800
4°
1.000
800
5°
4.000
1.800
6°
3.000
1.800
7°
1.000
800
8°
1.000
1.200
9°
2.000
1.200
10°
2.000
1.200
11°
1.000
800
12°
1.000
800
13°
3.000
1.200
14°
1.000
800
15°
1.000
1.200
16°
3.000
1.800
17°
3.000
1.800
18°
1.000
800
19°
4.000
2.500
20°
3.000
1.800
21°
1.000
800
22°
2.000
1.800
23°
2.000
1.800
24°
2.000
1.200
25°
3.000
1.800
26°
2.000
1.800
27°
1.000
800
28°
2.000
1.800
29°
1.000
1.200
30°
1.000
1.800
a) Classificare le famiglie rispetto a classi di reddito (0─┤1.000; 1.000─┤2.000; 2.000─┤3.000;
3.000─┤4.000) e classi di spesa (0─┤800; 800─┤1.200; 1.200─┤1.800; 1.800─┤2.500).
b) Determinare il numero di famiglie aventi un livello di reddito non superiore a 2.000 e un
livello di spesa non superiore a 1.800.
Esercizio 47
D
Calcolare il rapporto di concentrazione per la distribuzione del reddito di cui all’esercizio
precedente e rappresentare la curva di concentrazione.
15
Esercizio 48
I
Supponiamo che la distribuzione delle stature di 5.000 studenti maschi di 20 anni sia normale
con media 169,5 cm. e scarto quadratico medio 6,5 cm.. Se estraiamo 100 campioni casuali di
30 elementi quante delle 100 medie possiamo aspettarci che siano comprese tra 168 e 171 cm.?
Esercizio 49
I
Supponiamo che un quiz implichi 40 domande e che uno studente abbia fornito 16 risposte
corrette. Fissando un livello di significatività dello 0,01, sottoporre a test l’ipotesi che la
probabilità di rispondere correttamente a ciascuna domanda sia pari a 0,5 contro l’ipotesi
alternativa che sia diversa da 0,5. Disegnare la funzione potenza del test.
Esercizio 50 D
a) Si completi la seguente distribuzione doppia di frequenze affinché si abbia la massima
concordanza dati i marginali indicati in tabella, giustificandone la scelta.
Y
y1
y2
y3
X
x1
x2
x3
40
40
20
10
90
120
40
b) Si calcoli il rapporto di correlazione Y2 X .
c) Si discuta il concetto di indipendenza in statistica.
Esercizio 51
D
Le osservazioni seguenti sono i risultati di uno studio volto ad accertare la relazione tra il peso
finale di un prodotto (Y) e la quantità di materia prima impiegata (X).
X
(Kg)
Y
(Kg)
1,8
2,5
1,1
2,3
1,5
2,6
1,2
2,4
2,0
2,2
4,2
4,7
4,0
4,6
4,2
4,6
4,2
4,9
4,5
4,2
a) Si calcolino le stime dei parametri del modello di regressione lineare.
b) Si verifichi, al livello di significatività del 5%, l’ipotesi che l’aumento di un Kg di materia
prima produca un incremento di peso del prodotto finale pari a 0,5 Kg.
16
Esercizio 52
I
In un campione di 373 studenti universitari è stata rilevata la votazione riportata all’esame di
maturità, distintamente per maschi e femmine:
Voto
36─42
Sesso
Maschi
Femmine
TOTALE
87
43
130
43─48
49─54
56
44
100
TOTALE
55─60
31
42
73
22
48
70
196
177
373
Si costruisca l’intervallo di confidenza per la differenza tra le votazioni medie dei maschi e delle
femmine con un livello di confidenza pari a 0,99.
Esercizio 53
I
Un grossista afferma che in base alla sua esperienza il 70% delle massaie acquista solitamente
nei supermercati. Un’indagine di mercato ha riscontrato 406 acquirenti da supermercati su un
totale di 600 massaie.
Si verifichi se l’affermazione del grossista può ritenersi corretta ad un livello di significatività
dello 0,01.
Esercizio 54 D
Si consideri la seguente tabella relativa agli Esercizi Extralberghieri al 1983.
Regioni
PIEMONTE
VALLE D’AOSTA
LOMBARDIA
TRENTINO A.
ADIGE
VENETO
FRIULI-V.GIULIA
LIGURIA
EMILIA
ROMAGNA
TOSCANA
UMBRIA
Numero di
campeggi e villaggi
turistici
137
70
201
86
Posti letto
36.816
21.700
63.841
28.214
185
29
180
95
166.449
29.853
51.772
72.710
176
29
110.215
8.838
a) Si descrivano i dati in tabella con opportuni indici statistici.
b) Si determini la retta di regressione.
c) Si calcoli l’indice di determinazione lineare.
Esercizio 55
P
Un’urna contiene 3 gettoni rossi, 5 gialli e 2 bianchi; si estrae un gettone, si osserva il colore, lo
si rimette nell’urna e si estrae un secondo gettone. Determinare la probabilità che i gettoni così
estratti siano:
a) uno rosso e uno giallo;
b) dello stesso colore.
17
Esercizio 56
I
Un campione di 40 capsule di analgesico è stato fabbricato da una macchina A con peso medio
330 mg e varianza campionaria corretta 40 mg.
Un’altra macchina B ha prodotto 50 capsule con peso medio 320 mg e varianza campionaria
corretta 42,25 mg.
Sottoporre a test l’ipotesi che le due macchine producano capsule di analgesico con lo stesso
peso medio ad un livello di significatività del 5%.
Esercizio 57
I
Trovare un intervallo di confidenza al 99% per la media di una popolazione normalmente
distribuita con varianza 100, avendo ottenuto un valore medio campionario di 68,63 da un
campione di:
a) 25 elementi;
b) 50 elementi;
c) Come varia l’intervallo in funzione della numerosità campionaria?
Esercizio 58
D
Si mettono a confronto tre lotti di lampadine elettriche della stessa potenza prodotte da tre ditte diverse.
I saggi effettuati sui tre lotti hanno dato i seguenti risultati:
Caratteristica
Durata media
(ore)
Scarto
Lotto 1
1.500
Lotto 2
1.400
Lotto 3
1.550
125
140
150
Quale giudizio potete dare sulla scelta dei tre lotti?
Esercizio 59
I
Nella Regione Campania la precipitazione media annua di pioggia è stata calcolata in cm. 48
con deviazione standard di cm. 16,5. Supponendo che la distribuzione delle precipitazioni segue
una distribuzione normale, dire qual è la probabilità che nel corrente anno si abbiano tra 42 e 60
cm. di pioggia e quanti dei prossimi 25 anni potranno presentare lo stesso carattere.
Esercizio 60
R
Alcuni dati relativi ad un campione di 40 unità hanno fornito con riferimento a due variabili X
ed Y i seguenti valori:
Media della variabile X = 150,
Media della variabile Y = 40
Varianza della variabile X = 81
Varianza della variabile Y = 25
Coefficiente di correlazione lineare r = 0,95.
a) Determinare le rette di equazione y = a + bx, e x = a’ + b’y.
b) Calcolare l’intervallo di confidenza per la media al 97% ed al 95,4%.
18
Esercizio 61
I
La Euromercato S.p.a. è una società specializzata nella distribuzione di articoli di abbigliamento
attraverso una catena di 100 negozi. In base al tipo di concorrenza, questi ultimi sono stati
riportati in due gruppi, ed il responsabile del centro studi si chiede se questa classificazione
corrisponda anche ad un diverso numero medio giornaliero di clienti. A questo scopo, 24 negozi
vengono scelti a caso tra quelli di apertura nel corso dell’ultimo trimestre. I valori ottenuti sono
riportati nella tabella che segue:
Tipo di negozio
1
2
205
205
193
212
201
212
192
206
194
209
197
210
196
205
190
199
206
204
207
200
209
210
202
208
Verificare se esiste una differenza nel numero medio giornaliero di clienti, scegliendo un  =
0,10.
19
Esercizio 62
R
I dati relativi ad un numero di dipendenti ed al giro d’affari di un’industria per un periodo di
undici anni sono i seguenti:
anno
Dip
end
enti
giro
di
affari
(in
milioni)
1977
294
624
1978
271
661
1979
314
728
1980
356
782
1981
383
819
1982
369
869
1983
402
938
1984
422
1.023
1985
475
1.136
1986
475
1.227
1987
486
1.317
a) calcolare le stime dei coefficienti della retta di regressione;
b) calcolare il coefficiente di determinazione;
c) verificare le ipotesi: H0: 1 = 0 e H0:  = 0.
20
Esercizio 63
I
Data la tabella a doppia entrata seguente:
Altezza
Sesso
155-165
165-175
175-185
Totale
Maschio
3
17
10
30
Femmina
7
8
5
20
10
25
15
50
Totale
a) Misurare il grado di dipendenza dell’altezza dal sesso, e descrivere lo strumento
statistico scelto nei suoi aspetti generali e interessanti.
b) Misurare il grado di connessione tra classi di altezza e sesso, e descrivere, come sopra,
lo strumento statistico scelto.
c) Fare inferenza sulla tavola di contingenza.
d) Calcolare l’intervallo di confidenza di media e varianza della popolazione da cui
proviene il campione delle 50 unità considerate.
Esercizio 64
D
In uno studio relativo alla vendita di miscela presso i distributori di carburanti, si sono ottenuti i
seguenti dati relativi a 50 distributori (ettolitri di miscela venduti in un giorno):
126
124
91
100
104
95
101
114
134
117
98
102
110
125
148
108
115
135
117
93
144
112
82
136
115
129
113
132
105
118
122
109
136
125
88
133
95
122
107
137
114
124
118
119
116
106
104
115
128
105
1. Costruire la distribuzione di frequenza, giustificando il numero di classi scelto.
2. Calcolare la media, la mediana e la moda.
Esercizio 65
I
Un campione di 15 batterie ha una durata media di x =8900 ore con uno scarto quadratico
medio s=500 ore. Si costruisca un intervallo al 90% per la media della popolazione senza poter
assumere che la durata di tutte le batterie segue una normale.
Esercizio 66
I
Un allevatore possiede una mandria di 150 bovini che vuol distribuire in due stalle A e B. Tali
stalle possono accogliere tutta la mandria. I bovini si ripartiscono in modo equiprobabile ed
indipendente nell’una e nell’altra stalla. Sia X la v.c. uguale al numero di vacche che scelgono la
21
stalla A.
1. Qual’è la distribuzione di probabilità di X.
2. Fornire e giustificare l’evento “il numero di vacche che scelgono A è superiore od uguale a
80”.
3. Ogni stalla ha N posti disponibili: N [75, 150]:
a) Con la v.c. X e N spiegare l’evento A: tutte le vacche trovano un posto.
b) Determinare il valore minimo di N perché la probabilità di A sia superiore a 0,9.
22
Esercizio 67 D
Su due lotti di 20 pezzi ciascuno si è effettuata la misura del carico di rottura (espresso in
Kg./cm 2). I valori sono i seguenti
90
86
91
88
93
86
82
90
83
86
88
82
86
90
91
93
80
88
85
95
120
86
91
100
93
86
82
103
83
86
88
99
86
90
91
106
80
88
85
98
1) Calcolare la media, la moda e la mediana.
2) Tracciare i Boxplot.
3) Commentare e valutare le differenze rilevate tra i due lotti.
Esercizio 68
I
Si supponga che il 50% di un ampio campione di studenti che sostengono per la prima volta un
dato esame lo superino co un voto superiore a 24/30. Si valutino numero medio e deviazione
standard del numero di studenti che, sostenendo detto esame per la prima volta, lo superano
riportando un voto superiore a 24/30.
Esercizio 69
I
Un campione casuale di 30 segretarie, viene sottoposto ad una prova di videoscrittura.
I risultati della prova sono x = 63 parole al minuto con s = 5 p.a.m..
a) si verifichi l’ipotesi che le segretarie non superino in media la velocità di 60 p.a.m. ( = 0,01)
b) si supponga che se la velocità media è di almeno 64 p.a.m. si ha una differenza del valore
ipotizzato della media che è considerata importante. Si determini la probabilità dell’errore di
prima specie, e dell’errore di seconda specie.
Esercizio 70 D
Per la coltivazione di una nuova vite di vino, un’azienda vinicola ha analizzato la quantità di
magnesio (in mg.) contenuta in 84 campioni di terreno nella provincia di Avellino e 72 campioni
di terreno nella provincia di Benevento. I risultati sono riportati in tabella:
Classi
(in
mg.)
Campioni
di
terreno A
Ammontare di
magnesio in A
Campioni
di
terreno B
Ammontare di
magnesio in B
0-5
5-15
15
18
20
108
8
8
40
112
15-40
19
304
10
400
40-60
60-70
70-100
12
6
14
600
390
1260
25
15
6
1025
975
426
Quale delle due province presenta terreni con una concentrazione di magnesio più elevata?
23
Esercizio 71
I
I punteggi dei Q.I. dei volontari che si arruolano nella Protezione Civile in un dato anno si
distribuiscono secondo una normale con media pari a 110 e s.q.m. pari a 10.
La Protezione Civile vuole fornire un addestramento avanzato al 25% di reclutare che ha
presentato il punteggio Q.I. più elevato.
Qual è il punteggio minimo richiesto per l’ammissione al predetto addestramento avanzato?
Esercizio 72
I
Un’importante fabbrica tedesca di automobili, nell’intento di migliorare la qualità dei servizi
offerti alla clientela, si rivolge ad un consulente statistico che elabora un modello di previsione
dei tempi di consegna dei nuovi modelli di auto commissionate. Il consulente, ritenendo che
esiste una relazione lineare tra la distanza di spedizione ed il tempo di consegna, considera un
campione casuale di 8 automobili e rileva i seguenti dati:
Auto
Distanza
percorsa
in km.
1
60
2
156
3
148
4
168
5
180
6
300
7
235
8
195
Tempo di
consegna
in giorni
20
24
32
28
43
27
45
38
a) Si determini la retta di regressione;
b) Si verifichi l’ipotesi che sia il coefficiente di regressione che quello di correlazione siano
uguali a zero.
Esercizio 73
D
Un centro commerciale, costituito da sei capannoni, deve adeguare gli impianti elettrici alla
legge 46/90. Allo scopo interpella una ditta di impiantistica industriale che prospetta la
possibilità o di porre in essere sei centrali per ogni capannone, oppure un’unica centrale per tutti
i capannoni a prezzo naturalmente più basso.
I proprietari dei sei capannoni si accordano per questa seconda eventualità. Nella tabella sono
riportate le distanze (in metri) dal primo capannone:
CAPANNONE
DISTANZE
1
2
3
4
5
6
0
16
45
90
122
164
Dove si prevede verrà posizionata la centrale?
24
Esercizio 74
I
Si lancia 6.000 volte un dado regolare. Sia X la variabile casuale relativa all’evento E3 “Uscita
della faccia 3”. Determinare il numero K affinché la probabilità di ottenere “3” un numero di
volte compreso tra 1.000-K e 1.000+K sia uguale a 0,25.
Esercizio 75
I
Il Sig. Rossi, che vive in un paese del Centro Italia, desidera aprire un negozio in franchising
con la Stefanel S.p.A., la quale per decidere se è opportuno aprire un negozio, invia un esperto a
visitare il paese. L’esperto riferisce che il luogo ha tutte le caratteristiche per l’apertura ma, per
decidere sull’opportunità economica, bisogna che venga valutata la variabile casuale X “reddito
medio mensile per famiglia” che si distribuisce come una normale con media incognita e s.q.m
= 400.
Scelto un campione casuale di 50 famiglie si fissa la seguente regola di decisione: il negozio
verrà aperto se il reddito medio per famiglia risulterà maggiore o uguale a £1.700.000.
a) Si fissino le ipotesi;
b) Si verifichi l’ipotesi nulla al livello di significatività del 5%;
c) Si determini la curva di potenza del test per i seguenti valori alternativi: £1.630.000,
£1.650.000, £1.675.000.
Esercizio 76
I
La tabella si riferisce ad un campione di studenti che hanno aderito alla richiesta di compilare un
questionario per lo studio della relazione tra altezza dei genitori ed altezza dei figli maggiorenni.
1) Costruire la tavola a doppia entrata delle unità statistiche di osservazione costituite dalla
coppia (padre, figlio) con riferimento all’altezza delle sottounità padre e figlio, distribuite in tre
classi di statura di uguale ampiezza..
2) Calcolare il rapporto di correlazione di Pearson, rispetto alle classi di altezza dei padri.
3) Selezionare un campione sistematico di 10 soggetti dalla popolazione dei padri e verificare
che il campione possa ritenersi casualmente estratto da quella popolazione in termini di media.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
A
lt
ez
158
za
157
150
163
165
170
163
163
158
155
160
160
167
160
161
Altezza
padre
165
155
160
158
183
172
169
175
165
155
160
158
180
170
172
Altezza
madre
150
151
153
158
160
160
158
165
150
151
153
158
165
156
169
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
25
Alt
ezz
a
175
160
160
162
165
172
164
168
170
154
167
170
154
161
167
Altezza
padre
172
160
164
170
182
175
181
172
180
172
170
174
173
162
165
Altezza
madre
175
150
154
154
160
166
162
160
170
156
165
165
155
158
159
Esercizio 77
P
In un luna park due ragazzi giocano al tiro al bersaglio, entrambi hanno a disposizione tre tiri.
Le probabilità di colpirlo al primo, al secondo e al terzo tiro sono:
I tiro
II tiro
III tiro
Per il I ragazzo
0.4
0.5
0.7
Per il II ragazzo
0.2
0.6
0.7
Chi dei due ragazzi ha maggiore probabilità di colpire il bersaglio:
1) una sola volta
2) almeno una volta dopo i tre tiri.
Esercizio 78
I
Una grande azienda americana desidera migliorare il rendimento dei suoi impiegati. A tal fine
seleziona un campione di 20 impiegati ai quali viene chiesto di frequentare due corsi di
addestramento professionale. L’azienda è interessata alle valutazioni espresse dai suoi impiegati
sui due corsi, tenuti:
 dal professor Pearson - corso P
 dal professor Desabie - corso D.
Nella tabella sono riportati i giudizi sui due corsi, misurati con una scala di punteggio da 1 a 5:
Soggetti
P
D
Soggetti
P
D
1
2
3
4
5
6
7
8
9
10
3
1
2
4
3
3
2
2
4
3
4
3
3
3
4
4
3
3
5
4
11
12
13
14
15
16
17
18
19
20
2
3
4
3
4
5
4
3
4
4
5
4
4
3
5
5
4
5
3
4
a) Si costruisca la distribuzione di frequenze doppia (P,D) e le rispettive distribuzioni marginali.
b) Supposto che i 20 soggetti siano stati estratti casualmente da una popolazione che segue una
distribuzione normale, si verifichi, al livello   5% , che:
H0 : P   D  0 in alternativa H1: P   D  0 .
c) Si valuti il grado di dipendenza in media scegliendo l’indice statistico più appropriato.
26
Esercizio 79
I
Un settimanale ha effettuato un’indagine sui giovani in cerca di lavoro, analizzando un
campione di 60 ragazzi di 25 anni, di cui 32 provengono dalle regioni del Centro-Nord e 28 da
quelle del Sud ed Isole. La distribuzione dei ragazzi del Centro-Nord in base al titolo di studio è
risultata essere di 11 ragazzi con licenza media, 16 con diploma di scuola superiore, 5 con
laurea, mentre la distribuzione dei ragazzi del Sud ed Isole in base al titolo di studio è risultata
essere di 11 ragazzi con licenza media, 8 ragazzi con diploma e 9 con laurea. Si verifichi se
esiste una relazione tra il titolo di studio e l’area geografica di provenienza.
Esercizio 80
R
Una piccola ditta produttrice di articoli sportivi alcuni mesi fa ha dato inizio ad una campagna
pubblicitaria televisiva.
In tabella sono riportate le vendite mensili (in milioni) ed il numero di passaggi televisivi
mensili dello spot relativi ad un campione di sette mesi.
Vend
ite
18
24
25
11
32
15
40
Numero di passaggi
televisivi
30
35
38
20
45
25
60
1) Si può affermare sulla base dei dati che esiste una relazione tra le vendite ed il numero di volte
in cui lo spot è mandato in onda?
2) si verifichi la significatività del coefficiente di regressione;
3) si determini il residuo della stima delle vendite relativo al quinto mese di campagna.
Esercizio 81
I
Una ditta americana che produce bibite, desidera esaminare il prezzo delle lattine di aranciata
nonchè l’offerta di limonata. A tal fine viene effettuata una indagine esaminando un campione di
50 distributori di bibite. Dall’indagine risulta che il prezzo medio delle lattine di aranciata è
1.364$ con uno scarto corretto pari 0.073$. Inoltre 11 distributori vendono anche la limonata.
1) Si verifichi se il prezzo dell’aranciata è significativamente diverso da 1.30$;
2) si verifichi se meno del 25% dei distributori commercializzano limonata;
3) si calcoli la dimensione del campione che occorre esaminare per stimare opportunamente la
frequenza relativa dei distributori che vendono limonata ad un livello di fiducia del 90%, e per
un intevallo di ampiezza  8% rispetto alla frequenza reale.
27
Esercizio 82
I
Un'analista statistico addetto al controllo di qualità in un'azienda produttrice di pasta sta
valutando le prestazioni offerte da due macchinari per la produzione di un particolare formato di
pasta. Egli osserva per ciascun macchinario un campione casuale di scarti della produzione
giornaliera in termini di peso espresso in oncia (unità di misura di peso inglese corrispondente a
30 grammi) della pasta non corrispondente al formato standard:
Macchinario
A
Macchinario
B
20
10
17
7
10
18
14
6
10
8
9
7
7
6
8
a. Questi dati forniscono all'analista una prova per sostenere che esiste una differenza tra le due
medie del peso degli scarti di pasta? Si consideri un livello di significatività dello 0.05 e si
supponga che il peso segua una distribuzione normale.
b. Cosa cambia se svolgiamo lo stesso test se esprimiamo il peso in grammi?
c. Si può sostenere che il peso medio nel macchinario A è maggiore di almeno 2 once rispetto al
peso medio nel macchinario B?
d. Si disegni un 'boxplot' dei dati relativi a ciascun macchinario commentando i risultati del
confronto.
Esercizio 83
R
Un comune ha messo a disposizione dei residenti fondi a tassi agevolati. Supponiamo che per
investigare se esiste una relazione tra l'ammontare y del prestito erogato dall'ente, in milioni di
lire, e il reddito lordo annuale x, in milioni di lire, dei contraenti si considera un campione
casuale di n=8 prestiti ottenendo i seguenti risultati:
X
Y
24
39.7
33
49.0
35
54.6
39
56.0
45
64.8
47
63.9
61
84.3
67
108.3
a. Riportare i dati in un grafico.
b. Stimare la retta di regressione di y su x e riportarla nel grafico.
c. Qual è, secondo la retta stimata, l'interpretazione del coefficiente di regressione?
d. Calcolare il coefficiente di determinazione lineare della retta stimata.
e. Verificare l'ipotesi che il coefficiente di regressione sia pari a 1.8 con un livello di
significatività dello 0.05.
Esercizio 84
D
Un gestore di un patrimonio di 100.000.000 deve dividere il suo investimento tra tre tipologie di
azioni dovendo scegliere, indipendentemente dal rendimento e dal rischio, tra i seguenti due
pacchetti:
28
Azioni del settore
bancario
Azioni del settore
industriale
Azioni del settore hightech
I pacchetto
45.000.000
II pacchetto
20.000.000
30.000.000
50.000.000
25.000.000
30.000.000
Analizzare le potenziali scelte dell’investitore
29
Esercizio 85
D
Una società di intermediazione finanziaria gestisce sei diversi fondi comuni d’investimento.
La distribuzione del suo patrimonio (in miliardi) tra i sei diversi fondi è riportata nella seguente
tabella.
Fondi Comuni
Patrimonio
investito
18
25
35
50
70
29
A
B
C
D
E
F
a) Si valuti, calcolando un opportuno indice statistico, il grado di diversificazione del
portafoglio.
b) Si rappresenti graficamente la distribuzione del patrimonio tra le varie attività rispetto alla
situazione di equidistribuzione.
Esercizio 86
R
In una gara di nuoto (100 metri stile libero) sono state rilevate l’altezza (in centimetri) di sette
nuotatori ed il tempo da essi impiegato in secondi:
Tempo impiegato
57
79
62
77
67
73
70
Altezza
190
168
185
170
182
177
175
a) Si verifichi se la velocità è influenzata dall’altezza;
b) Si calcoli il coefficiente di correlazione e si indichi qual è l’unità di misura del coefficiente di
correlazione;
c) Si sottoponga a verifica l’ipotesi che il coefficiente di regressione sia diverso da zero.
Esercizio 87
I
Uno studio condotto tre anni fa presso la facoltà di Economia di Napoli ha rivelato che il 10%
degli studenti utilizzava lenti a contatto. Di recente è stato intervistato un campione di 200
studenti della stressa facoltà e si è riscontrato che 30 di essi utilizzano lenti a contatto.
a) In base a tale risultato è possibile affermare, ad un livello di significatività del 95%, che la
proporzione di utilizzatori di lenti a contatto è aumentata?
b) Si disegni il grafico della funzione potenza del test.
30
Esercizio 88 I
In un gioco vengono lanciate ripetutamente 3 monete. Un giocatore ritiene che le monete siano
truccate. Egli, in 200 lanci, ha osservato la seguente distribuzione del numero di teste:
Teste
Frequenze
0
18
1
63
2
84
3
35
Si può ritenere che il giocatore abbia ragione ad un livello di significatività del 5%?
Esercizio 89
I
La direzione commerciale di una industria di abbigliamento sportivo ha stabilito che un
particolare modello di scarpe può essere venduto ad un prezzo (espresso in dollari) che può
variare da un minimo di $70 ad un massimo di $150. La direzione vuole valutare il grado di
dipendenza in media del prezzo rispetto alla localizzazione del negozio in cui il prodotto è in
vendita, distinguendo tra negozi del centro città, della periferia e della provincia. Sulla base di
un campione di 120 negozi sono stati rilevati i dati riportati nella seguente tabella.
Localizzazione
del negozio
centro città
periferia
provincia
Prezzo
in dollari
70—\90
90—\110
110—\130
130—\150
70—\90
90—\110
110—\130
130—\150
70—\90
90—\110
110—\130
130—\150
TOTALE
a.
b.
c.
d.
e.
Numero di negozi
0
10
20
20
5
10
10
5
10
30
0
0
120
Si può ritenere che il prezzo scelto dal negoziante sia statisticamente indipendente dalla
localizzazione del negozio?
Si valuti il grado di dipendenza in media scegliendo l'indice statistico più appropriato.
Si fornisca una rappresentazione grafica della distribuzione del prezzo.
Si verifichi con un test statistico l'ipotesi che indipendentemente dalla localizzazione del
negozio il prezzo medio delle scarpe sia $108.
Si verifichi che non ci sia una differenza significativa tra il prezzo medio delle scarpe in vendita
in città ed il prezzo medio delle scarpe in vendita in periferia.
31
Esercizio 90
I
Nella regione Campania la precipitazione media annua di pioggia è stata calcolata in cm 48 con
deviazione standard di cm 16,5. Supponendo che la distribuzione delle precipitazioni segue una
curva normale, dire qual è la probabilità che nel corrente anno si abbiano tra 42 e 60 centimetri
di pioggia e quanti dei prossimi 25 anni potranno presentare lo stesso carattere.
Esercizio 91
R
Alcuni dati relativi ad un campione di 40 unità hanno fornito con riferimento a due variabili X
ed Y i seguenti valori:
media della variabile X = 150,
media della variabile Y = 40
varianza della variabile X = 81,
varianza della variabile Y = 25
coefficiente di correlazione lineare = 0,95.
a. Determinare le rette di equazione y = a+bx, e x = a'+b'y,
b. Calcolare l'intervallo di confidenza per la media al 97% ed al 95,4%.
Esercizio 92
I
Data la tabella a doppia entrata seguente:
Sesso
Altezza
155-165
Maschio
Femmina
Totale
totale
166-175
3
7
10
176-185
17
8
25
10
5
15
30
20
50
a. Misurare il grado di dipendenza dell'altezza dal sesso, e descrivere lo strumento statistico
scelto nei suoi aspetti generali ed interessanti.
b. Misurare il grado di connessione tra classi di altezza e sesso, e descrivere, come sopra, lo
strumento statistico scelto.
c. Fare inferenza sulla tavola di contingenza.
d. Calcolare l'intervallo di confidenza di media e varianza della popolazione da cui proviene il
campione delle 50 unità considerate.
32
Esercizio 93
D
La distribuzione di frequenze degli investimenti, in miliardi di lire, delle aziende di un settore è
risultata la seguente:
Investimenti
1—5
5 — 10
10 — 20
20 — 50
50 — 100
oltre 100
(in media 180)
Frequenze
180
255
118
30
12
5
a) Calcolando gli opportuni indici statistici si descrivi il fenomeno.
b) Si rappresenti la distribuzione mediante un istogramma di frequenze oppure mediante il grafico
a scatola (box-plot) illustrandone il significato.
c) Si analizzi la concentrazione degli investimenti.
Un certo tipo di caramelle viene venduto mescolando, in maniera casuale, il 60% di caramelle rosse
ed il 40% di caramelle gialle.
a) Con riferimento ad una confezione di 200 caramelle, si determini la probabilità che il numero di
caramelle rosse sia maggiore di 130 e
b) che il numero di caramelle rosse sia compreso tra 110 e 125.
c) Si determini il numero di caramelle rosse che devono trovarsi in una confezione affinchè la
probabilità risulti pari a 0.5.
Esercizio 94
I
Agli studenti che si sono presentati ad un esame sono stati assegnati, in maniera casuale, due compiti diversi. I
risultati sono stati i seguenti:
Numero studenti
voto medio
varianza corretta
COMPITO A
60
25.4
14
COMPITO B
40
24
12
Gli studenti del compito A si sono lamentati sostenendo che la loro prova era più difficile. Alla
luce dei risultati, in termini di voto medio la loro protesta può ritenersi fondata al livello di
significatività del 5%?
33
Esercizio 95
R
Su un campione di individui maschi (della stessa età) partecipanti ad un corso di atletica, si sono rilevate le seguenti
variabili: tempo impiegato per correre un percorso di 2400 metri (in minuti) e peso corporeo (in Kg).
individui
A
B
C
D
E
F
G
Tempo
peso
12,37
8,85
13,08
14,03
10,05
12,12
10,54
81,47
68,84
83,32
87,66
71,45
79,15
73,32
a) Si determini la retta di regressione lineare tra i due fenomeni avente significato logico e se ne
illustri la validità; si commenti il tempo di percorrenza teorico per un individuo di 60 Kg.
b) Si valuti la bontà di accostamento del modello ai dati osservati.
c) Si verifichi l'ipotesi che il coefficiente di regressione è pari a zero per un livello di significatività
del 5%.
Esercizio 96
D
Si consideri la seguente tabella.
Anno
1974
1975
1976
1977
1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
a)
b)
Nuclei
familiari
dotati di
televisione
(centinaia
di migliaia)
(X)
13
20
23
25
27
31
36
46
55
63
70
76
81
85
Numero di
malati
mentali
ricoverati
(per 1000
abitanti)
(Y)
8
8
9
10
11
11
12
16
18
19
20
21
22
23
Calcolare il coefficiente di correlazione lineare delle due variabili.
Commentare il risultato ottenuto.
34
Esercizio 97
I
Una bevanda alcolica è posta in vendita sul mercato americano da parecchi mesi ed è noto che la
cifra d' affari mensili segue una legge normale con media 156:364 dollari e scarto quadratico
medio 19.000 dollari. Viene programmata una campagna pubblicitaria. La cifra d'affari delle
vendite degli otto mesi successivi alla fine della campagna pubblicitaria è di 165.000 dollari. Si
suppone che lo scarto quadratico medio resti constante.
a) La campagna pubblicitaria ha aumentato il livello medio delle vendite del 10%?
b) Quale valore critico è necessario assumere per rifiutare l'ipotesi nulla limitando all'1% la
probabilità dell'errore di primo tipo?
c) Calcolare la potenza del test per valori alternativi 170.000, 171.000, 168.000, rispettivamente, e
tracciare il grafico.
Esercizio 98
I
Il Preside della Facoltà di Economia desidera stimare la proporzione di studenti iscritti ai corsi di
specializzazione post-universitaria della pubblica amministrazione che sono laureati in
Economia, con un errore di stima di  0,05 e con un livello di confidenza del 90%. Qual è la
dimensione che il campione deve avere se non vi è alcuna possibilità di stimare il valore
approssimativo delle proporzione prima di formare il campione?
Esercizio 98
I
Il responsabile della contabilità di una grande compagnia di vendita al minuto desidera
confrontare le ricevute della spesa per il pranzo dei funzionari nel reparto di vendita e nel
reparto di produzione. In ciascun reparto viene estratto un campione di 15 ricevute e si hanno i
seguenti risultati:
reparto di vendita
media campionaria
$ 42.50
varianza campionaria
corretta: $ 90.25
reparto di produzione
media campionaria
$ 35.75
varianza campionaria
corretta: $ 67.24
a) Con quale livello di significatività vi sono elementi per sostenere che l'importo medio delle
ricevute della spesa per il pranzo nel reparto di vendita sia superiore a quello nel reparto di
produzione? Quale supposizione è necessaria per poter eseguire il test?
b) Si calcoli la potenza del test qualora la differenza fra gli importi medi nei due reparti sia pari
a $ 5.14, $ 4.51, $ 4.11 rispettivamente.
c) Si disegni il grafico della funzione potenza del test illustrando come questo si modifica
qualora il campione estratto in ciascun reparto sia pari a 30 ricevute.
Esercizio 99
I
Una compagnia televisiva che trasmette programmi via cavo vorrebbe stimare la proporzione
dei suoi clienti che acquistano la guida televisiva dei programmi via cavo. La compagnia
vorrebbe il 95% di confidenza che la sua stima sia corretta entro un intervallo di  0.05 intorno
alla proporzione reale. L'esperienza passata indica che il 30% dei suoi clienti compra la guida
televisiva. Quale sarà la dimensione del campione?
35
Esercizio 100
R
L'esperto di statistica di una grossa fabbrica americana di automobili vorrebbe sviluppare un
modello statistico per prevedere i tempi di consegna (i giorni che trascorrono dall'ordinazione
dell'automobile fino all'effettiva consegna) di automobili nuove, ordinate dai vari clienti. Lo
statistico ritiene che esiste una relazione lineare tra numero di "optional" richiesti
sull'automobile e tempo di consegna. Si seleziona un campione casuale di 16 automobili, con i
risultati nella tabella che segue.
Automobile
Numero di
optional ordinati
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
Tempo di
consegna
(in giorni)
3
4
4
7
7
8
9
11
12
12
14
16
17
20
23
25
25
32
26
38
34
41
39
46
44
51
53
58
61
64
66
70
a) Si disegni il diagramma di dispersione.
b) Si definisca il modello, si determinino le stime dei parametri e si interpreti sia l'intercetta che
il coefficiente angolare in questo problema.
c) Se si richiedono 16 optional su un'automobile, quanti giorni si dovranno prevedere per la
consegna?
d) Si calcoli l'indice di determinazione lineare e se ne interpreti il suo significato in questo
problema.
e) Per quale livello di significatività si può dimostrare l'esistenza di una relazione lineare tra il
numero di optional e il tempo di consegna?
Esercizio 101
I
Il direttore della banca di una piccola città vorrebbe stabilire la proporzione di depositanti che
vengono pagati settimanalmente. Su un campione casuale di 100 depositanti, 30 affermano di
essere pagati settimanalmente.
a) Si rilevi la stima per intervallo, con confidenza del 90%, della proporzione reale di
depositanti della banca che vengono pagati settimanalmente.
b) Se il direttore di banca vuole il 90% di confidenza che la sua stima sia corretta entro un
intervallo di  0.05 intorno alla proporzione reale di depositari pagati settimanalmente, quale
sarà la dimensione del campione?
36
Esercizio 102
I
Un campione casuale di 500 telefonate extraurbane rivelò la seguente distribuzione di durata
delle telefonate (in minuti):
Durata (in minuti)
0 |- 5
5 |- 10
10 |- 15
15 |- 20
20 |- 25
25 |- 30
Frequenze
48
84
164
126
50
28
a) Si descrivino i dati in tabella.
b) Ad un livello di significatività di 0.01 si può ritenere che i dati seguano una distribuzione
normale.
Esercizio 103
R
Si considerino i dati in tabella 1 relativi al prezzo ed alle quantità vendute di un nuovo concime
biologico:
Prezzo
Quantità
9
11
12
13
15
16
15
15
14
10
a) Si stimi la retta di regressione;
b) si calcoli l’indice di determinazione lineare;
c) si verifichi l’ipotesi nulla che il coefficiente di regressione è pari a zero.
Esercizio 104
I
Una compagnia aerea deve stabilire il numero di posti di prima classe di una nuova linea. Sulla
base dell’esperienza si sa che il 12% dei posti disponibili sono di prima classe. In un volo di
prova sono stati richiesti 20 posti di prima classe su un totale di 100 posti disponibili.
a) Si verifichi l’ipotesi nulla che la percentuale di posti di prima classe sia pari al 12%;
b) si calcoli la potenza del test per una ipotesi alternativa che tale percentuale sia pari al 15%,
considerando un livello di significatività  = 0.01;
c) a quanto deve essere uguale la numerosità del campione se si fissa un errore di stima  = 0.2 ?
37