Facoltà di Economia - Esame di Statistica – 11

annuncio pubblicitario
1
Facoltà di Economia - Esame di Statistica – 06.06.2006
3. Delle due variabili statistiche X e Y riportate in tabella
xi
0.50
0.55
0.70
1.00
1.20
yi
y1
y2
y3
y4
y5
si conosce la retta di regressione di Y x : 2.885 x  0.5 y  2.880 ed il coefficiente di correlazione
  0.971. Si determinino la media e la varianza della variabile Y.
5. Data la seguente tabella relativa alla variabile statistica doppia (X,Y), si calcolino:
a. le medie, le varianze di X e Y, e le loro mediane;
b. le medie e le mediane della Y condizionatamente a ciascun valore della X.
Supponendo che la tabella provenga da un campione casuale di 100 osservazioni si calcoli il valore
dell’indice descrittivo  2 .
Y
-1
0
1
2
-1
0,05
0,03
0,10
0,22
0
0,03
0,02
0,10
0,15
1
0,07
0,10
0,05
0,08
X
Facoltà di Economia - Esame di Statistica – 29.06.2006
2. La resistenza Y allo strappo di una carta da imballaggio usata in un’industria manifatturiera è
legata alla percentuale X di cellulosa contenuta nella miscela iniziale. Sono stati rilevati i seguenti
19 campioni
Y
X
Y
X
101.4
117.4
117.1
106.2
131.9
146.9
146.8
133.9
111.3
123.0
1.0
1.5
1.5
1.5
2.0
2.0
2.2
2.4
2.5
2.5
125.1
145.2
134.3
144.5
143.7
146.9
147.0
148.2
149.0
2.8
2.8
3.0
3.0
3.2
3.3
3.3
3.5
3.6
Si costruisca la retta di regressione di Y|x e si valuti lo scarto tra il valore della resistenza osservata
ed il valore assunto nel modello, corrispondenti al primo quartile della percentuale di cellulosa.
Facoltà di Economia - Esame di Statistica –20.07.2006
1. Della variabile statistica doppia (X,Y) con medie  x  0.85 ,  y  5.30 e deviazioni standard
 x  2.30 ,  y  1.08 , sono date le due rette di regressione:
Y | x:
y  4.93  0.436 x
X | y : y  4.87  0.510 x
Si determini la varianza residua della Y rispetto alla retta Y|x.
1
2
5. Nella seguente tabella sono riportati gli emolumenti mensili netti dichiarati da due liberi
professionisti relativamente al primo semestre del 2000. Tali emolumenti sono stati rilevati in Euro
per il primo professionista e in migliaia di Lire per il secondo.
Si vuole calcolare la differenza tra le medie aritmetiche dei due emolumenti e la differenza della
variabilità relativa mediante i coefficienti di variazione. Si commentino le conclusioni.
mese
Gennaio
Febbraio
Marzo
Aprile
Maggio
Giugno
Professionista 1 (Euro)
4514
3242
3145
5120
2765
4344
Professionista 2 (migliaia di Lire)
4376
9473
6895
6530
5342
6000
Facoltà di Economia - Esame di Statistica –14.09.2006
1. In base ai dati riportati in tabella, relativi alla variabile statistica doppia (X,Y), si costruisca la retta di
regressione lineare, calcolando la varianza spiegata dal modello. Si valuti inoltre di quanto migliora o
peggiora percentualmente la varianza spiegata nei due seguenti casi:
a. eliminando la prima e l’ultima coppia di dati;
b. eliminando la terza e la sesta coppia di dati.
xi
-1.5
0.2
1.0
2.3
2.5
3.4
6.2
yi
-3.05
-0.16
2.98
3.41
3.75
4.20
10.04
5. Alla partenza da Cagliari sono stati intervistati 20 giovani turisti ai quali, tra le varie domande, è stato
chiesto il numero dei giorni trascorsi in città e la propria fascia d’età. In base alle risposte fornite nel seguito,
a. si costruisca la tabella a doppia entrata delle variabili numero di giorni e fascia d’età.
Limitatamente al numero di giorni
b. si costruisca il grafico della funzione cumulativa delle frequenze;
c. si determinino il primo e l’ultimo quartile;
d. media, mediana, moda e varianza.
giorni
età
giorni
età
2
2
1
0
3
5
3
3
1
1
16-18
19-21
19-21
25-27
22-24
30-32
19-21
22-24
16-18
19-21
0
0
2
3
3
3
1
2
5
3
19-21
22-24
22-24
25-27
16-18
22-24
25-27
22-24
25-27
19-21
Facoltà di Economia - Esame di Statistica – 6.11.2006
3. Data la seguente tabella relativa ai valori osservati delle variabili statistiche X, Y e Z, si
costruiscano le rette di regressione di Y|x e di Z|x e si valuti quale delle due relazioni è descritta
meglio dal modello lineare.
xi
-3.02
-1.05
0
2.12
2.27
3.03
3.59
4.15
5.01
5.64
6.13
6.80
yi
-1.10
0.14
0.65
0.65
1.48
2.00
2.25
2.84
3.30
3.65
5.05
5.45
zi
0.16
2.14
3.01
2.20
2.20
1.02
0.05
-1.14
-3.02
-3.21
-4.12
-450
2
3
Facoltà di Economia - Esame di Statistica – 11.12.2006
2. Una compagnia aerea (attualmente in crisi!) sa che, in media il 65%, dei propri voli ha ritardo. La
rilevazione dei ritardi ha fornito i seguenti dati:
Ritardo (in centesimi di ora)
0-10
10-20
20-30
30-50
50-100
Numero di voli
2000
3000
2500
2000
500
a) Calcolare la media e la deviazione standard del tempo di ritardo per i voli ritardati.
b) La compagnia ha valutato che ciascun volo ritardato produce una perdita fissa di 170 Euro e una
perdita variabile di 100 Euro per ogni minuto di ritardo: qual è la perdita media mensile stimata?
c) Si stabilisca se si ha maggiore variabilità nelle perdite o nel tempo di ritardo.
3. Della variabile statistica doppia (X, Y) si conoscono le rette di regressione:
5 x  16 y  120  0
X|y
x  5 y  60  0
Y|x
Si stabilisca quale delle due variabili ha valore medio maggiore e quale delle due ha maggiore varianza.
Facoltà di Economia - Esame di Statistica – 20.02.07
1. Un negoziante al dettaglio acquista per rivendere una partita di ananas, che classifica in base al
peso, ottenendo la seguente tabella di frequenza
peso (gr)
n. ananas
(250-300] (300-350] (350-400] (400-450] (450-500] (500-550] (550-600] (600-700] (700-800]
3
10
15
25
32
20
19
4
2
Il negoziante adotta la seguente strategia di vendita: ritira dalla vendita il 10% degli ananas di peso
inferiore; destina a un ristorante quelli che pesano oltre i 600 gr chiedendone 7 Euro al kg; mette in
vendita al prezzo di 8 Euro al kg quelli che hanno un peso superiore ai 450gr e a 6 Euro al kg i
rimanenti.
a. Avendo pagato la partita a 3 Euro al kg, si determini il valore del guadagno atteso dal
negoziante.
b. Si può affermare che la distribuzione di frequenza del peso degli ananas è
approssimativamente simmetrica?
3. Un certo materiale avente proprietà chimiche che dipendono dalla durata della sua esposizione a
un certo trattamento termico, viene controllato in base al tempo di esposizione. Al variare del
numero dei giorni, è stata rilevata la percentuale della sostanza Z che si è sviluppata al suo interno,
ottenendo i seguenti dati
n. giorni di
esposizione
% di sostanza Z
rilevata
0
1
3
4
5
6
7
9
7.9
12.0
9.5
11.3
11.8
11.3
4.2
0.4
a) Si costruisca la retta di regressione. b) Si calcoli la varianza spiegata dal modello e si valuti
se la varianza residua supera o meno il 50% della varianza totale. c) Si determini inoltre la
percentuale di sostanza Z che ci si dovrebbe aspettare per un’esposizione del materiale di
due giorni. d) Infine si dia una valutazione dell’errore percentuale su Z, rispetto al valore
osservato, che si commette assumendo il valore fornito dal modello in assenza di
esposizione.
3
4
Facoltà di Economia - Esame di Statistica – 4.07.2002
1. Da una serie di 5 rilevazioni sulla variabile statistica doppia (X,Y) sono state ricavate le due rette
di regressione di Y rispetto ad x, e di X rispetto ad y :
Y | x:
y  3.654  0.686 x
X | y:
y  2.785  0.904 x
Purtroppo – come si vede nella tabella seguente che contiene i dati originari - sono andati perduti i
dati numerici relativi alla coppia ( x 4 , y 4 ),
xi
-1
0
2
x4
12
yi
3
3
4
y4
10
E’ possibile ricostruirli univocamente? E se sì, quali sono questi valori?
Facoltà di Economia - Esame di Statistica – 20. 11.2004
2. Di una variabile statistica X sono stati rilevati i seguenti valori x1=-1.3, x2=-0.2, x3=0.0, x4=1.5,
x5=2.8, x6=3.6, x7=4.0. In loro corrispondenza si sono ottenuti i valori della variabile Y: y1=4.2,
y2=7.5, y3=4.4, y4=,5.6, y5=5.5, y6=3.0, y7=4.8 e, separatamente, i valori della variabile Z: z1=3.2,
z2=4.0, z3=3.6, z4=4.8, z5=5.4, z6=5.6, z7=6.0.
Si stabilisca con l’uso di indici descrittivi, quale tra le due variabili Y e Z ha una migliore relazione
lineare con la variabile X.
Facoltà di Economia - Esame di Statistica – 08.05.2003
5. Data la seguente tabella relativa alle variabili X e Y,
xi
0
1
2
3
4
yi
1
1.8
3.3
4.5
6.3
si costruisca la retta di regressione di Y|x e si individuino i punti che hanno, rispettivamente, scarto
minimo e massimo dalla retta.
Si valuti inoltre lo scarto medio dei punti dalla retta.
Facoltà di Economia - Esame di Statistica – 21.11.2003
1. In base ai dati contenuti nella seguente tabella, assumendo che tra le variabili statistiche X e Y esista una
relazione di tipo lineare, si stabilisca se tale relazione è rappresentata meglio dalla retta di regressione di Y|x
oppure dalla retta di X|y.
xi
yi
104.2 106.1 105.6 106.3 101.7 104.4 102.0 103.8 104.0 101.5 101.9 100.6 104.9 106.2 103.1
39.8
40.4
39.9
40.8
33.7
39.5
33.0
37.0
37.6
33.2
33.9
29.9
39.5
Facoltà di Economia - Esame di Statistica – 25.09.2003
3. Y e X indicano, rispettivamente, in unità standard la quantità offerta di un certo bene e il
corrispondente prezzo di mercato. In base ai dati forniti qui di seguito:
yi
70
65
50
56
57
79
57
55
66
52
70
64
xi
10
12
5
11
9
10
6
8
13
7
10
8
  x )( yi   y )  134.25 ;
x
( x
i
i
i
4
2
i
 1053 ;
y
i
2
i
 46581
40.6
35.1
5
a. si valuti la correlazione lineare tra le variabili Y e X e la bontà di adattamento al modello
lineare;
b. si determini la retta di regressione della quantità offerta in funzione del prezzo;
c. in base al modello, si calcoli la differenza tra le offerte che si registrano in corrispondenza
dei prezzi pari a 7 e 14.
Facoltà di Economia - Esame di Statistica – 24.09.2001
3. Da una distribuzione di frequenza bidimensionale della variabile statistica (X, Y) si è ricavata la
retta di regressione di Y sopra X ottenendo
y  1.7 x  5.3
e la retta di X sopra Y
x  0.58 y  3.5 .
Si determinino:
a) i valori medi di X e di Y;
si stabilisca:
b) quale delle due variabili ha una maggiore variabilità rispetto alla media e in che misura;
si valuti se:
c) il modello lineare rappresenta in maniera soddisfacente la relazione tra X e Y.
Facoltà di Economia - Esame di Statistica – 20.09.2004
4. La tabella delle frequenze relative rilevate sulla coppia di variabili statistiche (X,Y) ha fornito la
seguente sintesi, (dati fittizi)
Y
[3.2, 4.5)
[4.5, 7.0)
[7.0, 8.0)
[8.0, 10.0)
X
[-2.0, 0.0)
0.00
0.05
0.05
0.00
0.10
[0.0, 0.5)
0.10
0.15
0.05
0.00
0.30
[0.5, 1.5)
0.00
0.20
0.15
0.05
0.40
[1.5, 3.0)
0.00
0.10
0.10
0.00
0.20
0.10
0.50
0.35
0.05
Si calcoli la covarianza di (X,Y) e l’indice di correlazione lineare.
Si costruisca la retta di regressione di Y|x, specificando quanta parte della variabilità della Y è
attribuibile al modello lineare.
Facoltà di Economia - Esame di Statistica – 22.06.2004
2. Data la seguente tabella di 6 coppie di dati fittizi, (xi,yi), i=1,…,6,
xi
0.0
3.2
4.0
4.8
5.5
7.0
yi
-3.0
2.5
5.3
5.3
6.0
5.5
a. si costruisca la retta di regressione di Y|x e si calcoli il coefficiente di correlazione lineare;
b. si aggiunga un’ulteriore coppia di numeri (x7,y7) che lasci invariata la retta. Che cosa accade
al coefficiente di correlazione lineare?
5
6
Facoltà di Economia - Esame di Statistica – 29.07.2003
1. Due variabili X e Y hanno rispettivamente medie 5 e 6 e deviazioni standard 4 e 1. Sapendo che la
covarianza tra di esse è pari a 2,
a. si determini il valore che assume Y quando x=4.
b. A quali valori di X corrisponde l’intervallo 4  y8?
Facoltà di Economia - Esame di Statistica – 27.02.2002
5. Supponendo che tra il tempo X di permanenza dei clienti allo sportello di una banca e il numero
medio Y di operazioni sbrigate in quell’intervallo di tempo vi sia una relazione di tipo lineare. Con i
dati raccolti in tabella si costruisca la retta di regressione di Y|x e si calcoli la parte della varianza
che il modello non riesce a spiegare.
xi
yi
2
3.0
4
3.4
6
4.0
8
4.5
10
4.4
12
5.0
Facoltà di Economia - Esame di Statistica – 16.01.2002
5. Date le variabili statistiche X e Y con medie x  4 e y  5.71 , legate tra loro da una covarianza
pari a –16.43, si determini l’equazione della retta di regressione di Y|x, sapendo che la varianza
spiegata dal modello lineare è pari a 7.47, valore che rappresenta l’88% della varianza totale.
Facoltà di Economia - Esame di Statistica – 08.05.2003
5. Data la seguente tabella relativa alle variabili X e Y,
xi
0
1
2
3
4
yi
1
1.8
3.3
4.5
6.3
si costruisca la retta di regressione di Y|x e si individuino i punti che hanno, rispettivamente, scarto
minimo e massimo dalla retta.
Si valuti inoltre lo scarto medio dei punti dalla retta.
Facoltà di Economia - Esame di Statistica – 26.06.2008
4. Il consumo medio di elettricità Y per l’uso di pompe di calore è stato rilevato per diversi gradi della
temperatura ambientale esterna X, ottenendo i seguenti dati (in unità di consumo convenzionalmente
espressi):
xi
-5
-4
-3
-2
-1
0
1
2
3
4
5
yi
23.4
18.8
19.7
18.0
14.2
13.7
15.7
12.1
9.7
10.3
6.5
a. Si costruisca la retta di regressione dei consumi per le sole prime 6 temperature più basse e se ne
calcoli la varianza spiegata.
b. Si ripeta la costruzione per le restanti 5 temperature e si calcoli la variazione della percentuale di
varianza spiegata dai due modelli.
6
7
Facoltà di Economia - Esame di Statistica – 6.02.2006
1. Su 8 unità statistiche sono stati rilevati i valori delle variabili X e Y che le caratterizzano, ottenendo i
seguenti valori sintetici
8
 xi  38 ,
i 1
8
 yi  24 ,
i 1
8
2
 xi  436 ,
i 1
8
2
 yi  220 .
i 1
Sapendo che la retta di regressione di Y|x ha la seguente equazione: y  0.06  0.62 x , si determini
a. il coefficiente di correlazione lineare tra X e Y;
b. la retta di regressione di X|y.
Facoltà di Economia - Esame di Statistica – 25.09.2007
3. Sono state rilevati i valori della variabile X=”anni di invecchiamento di una partita di Vernaccia”
e Y=”quantità di produzione” (in unità standard)
xi
2
4
6
8
10
12
yi
3.0
3.4
4.0
4.5
4.4
5.0
Assumendo che tra X e Y vi sia una relazione lineare, si costruisca la retta di regressione di Y|x e si
confronti la variabilità della Y con la variabilità della X, calcolando la differenza tra le due
variabilità relative.
Facoltà di Economia - Esame di Statistica – 24.01.2011
5. La rilevazione della capacità ricettiva negli Alberghi della provincia di Cagliari nel 2009 ha
fornito i seguenti dati:





333 letti in 18 alberghi di categoria 1 stella
439 letti in 18 alberghi di categoria 2 stelle
1694 letti in 6 alberghi di categoria 5 stelle
4466 letti in 64 alberghi di categoria 3 stelle
13779 letti in 46 alberghi di categoria 4 stelle
a. Si costruisca la funzione cumulativa delle frequenze degli alberghi in funzione della categoria,
determinando la mediana della distribuzione e la distanza tra il terzo e il primo quartile.
b. Si calcoli il numero medio di letti per ciascuna categoria d’albergo e si determinino media,
mediana e le dispersioni assoluta e relativa di tali nuovi dati.
Facoltà di Economia - Esame di Statistica – 21.02.2011
5. Una società alberghiera ha raccolto i dati relativi alle presenze dei clienti in 9 settimane in un
albergo della propria catena. Di seguito sono riportati i dati che riguardano: X = TOL (rapporto tra
letti occupati e letti disponibili) e Y = variazione percentuale dei ricavi rispetto alla stessa
settimana dell’anno precedente.
X
0.450
0.575
0.925
0.975
0.970
0.840
0.725
1.00
0.750
Y
-0.20
-0.15
0.00
0.17
0.10
0.15
0.33
0.25
-0.01
a. Si costruisca la retta di regressione delle variazioni dei ricavi rispetto al TOL.
b. Se si aggiungono i dati relativi a un’ulteriore settimana: x10=0.885, y10=0.16, qual è la
variazione percentuale della bontà del modello lineare?
7
Scarica