1 Facoltà di Economia - Esame di Statistica – 06.06.2006 3. Delle due variabili statistiche X e Y riportate in tabella xi 0.50 0.55 0.70 1.00 1.20 yi y1 y2 y3 y4 y5 si conosce la retta di regressione di Y x : 2.885 x 0.5 y 2.880 ed il coefficiente di correlazione 0.971. Si determinino la media e la varianza della variabile Y. 5. Data la seguente tabella relativa alla variabile statistica doppia (X,Y), si calcolino: a. le medie, le varianze di X e Y, e le loro mediane; b. le medie e le mediane della Y condizionatamente a ciascun valore della X. Supponendo che la tabella provenga da un campione casuale di 100 osservazioni si calcoli il valore dell’indice descrittivo 2 . Y -1 0 1 2 -1 0,05 0,03 0,10 0,22 0 0,03 0,02 0,10 0,15 1 0,07 0,10 0,05 0,08 X Facoltà di Economia - Esame di Statistica – 29.06.2006 2. La resistenza Y allo strappo di una carta da imballaggio usata in un’industria manifatturiera è legata alla percentuale X di cellulosa contenuta nella miscela iniziale. Sono stati rilevati i seguenti 19 campioni Y X Y X 101.4 117.4 117.1 106.2 131.9 146.9 146.8 133.9 111.3 123.0 1.0 1.5 1.5 1.5 2.0 2.0 2.2 2.4 2.5 2.5 125.1 145.2 134.3 144.5 143.7 146.9 147.0 148.2 149.0 2.8 2.8 3.0 3.0 3.2 3.3 3.3 3.5 3.6 Si costruisca la retta di regressione di Y|x e si valuti lo scarto tra il valore della resistenza osservata ed il valore assunto nel modello, corrispondenti al primo quartile della percentuale di cellulosa. Facoltà di Economia - Esame di Statistica –20.07.2006 1. Della variabile statistica doppia (X,Y) con medie x 0.85 , y 5.30 e deviazioni standard x 2.30 , y 1.08 , sono date le due rette di regressione: Y | x: y 4.93 0.436 x X | y : y 4.87 0.510 x Si determini la varianza residua della Y rispetto alla retta Y|x. 1 2 5. Nella seguente tabella sono riportati gli emolumenti mensili netti dichiarati da due liberi professionisti relativamente al primo semestre del 2000. Tali emolumenti sono stati rilevati in Euro per il primo professionista e in migliaia di Lire per il secondo. Si vuole calcolare la differenza tra le medie aritmetiche dei due emolumenti e la differenza della variabilità relativa mediante i coefficienti di variazione. Si commentino le conclusioni. mese Gennaio Febbraio Marzo Aprile Maggio Giugno Professionista 1 (Euro) 4514 3242 3145 5120 2765 4344 Professionista 2 (migliaia di Lire) 4376 9473 6895 6530 5342 6000 Facoltà di Economia - Esame di Statistica –14.09.2006 1. In base ai dati riportati in tabella, relativi alla variabile statistica doppia (X,Y), si costruisca la retta di regressione lineare, calcolando la varianza spiegata dal modello. Si valuti inoltre di quanto migliora o peggiora percentualmente la varianza spiegata nei due seguenti casi: a. eliminando la prima e l’ultima coppia di dati; b. eliminando la terza e la sesta coppia di dati. xi -1.5 0.2 1.0 2.3 2.5 3.4 6.2 yi -3.05 -0.16 2.98 3.41 3.75 4.20 10.04 5. Alla partenza da Cagliari sono stati intervistati 20 giovani turisti ai quali, tra le varie domande, è stato chiesto il numero dei giorni trascorsi in città e la propria fascia d’età. In base alle risposte fornite nel seguito, a. si costruisca la tabella a doppia entrata delle variabili numero di giorni e fascia d’età. Limitatamente al numero di giorni b. si costruisca il grafico della funzione cumulativa delle frequenze; c. si determinino il primo e l’ultimo quartile; d. media, mediana, moda e varianza. giorni età giorni età 2 2 1 0 3 5 3 3 1 1 16-18 19-21 19-21 25-27 22-24 30-32 19-21 22-24 16-18 19-21 0 0 2 3 3 3 1 2 5 3 19-21 22-24 22-24 25-27 16-18 22-24 25-27 22-24 25-27 19-21 Facoltà di Economia - Esame di Statistica – 6.11.2006 3. Data la seguente tabella relativa ai valori osservati delle variabili statistiche X, Y e Z, si costruiscano le rette di regressione di Y|x e di Z|x e si valuti quale delle due relazioni è descritta meglio dal modello lineare. xi -3.02 -1.05 0 2.12 2.27 3.03 3.59 4.15 5.01 5.64 6.13 6.80 yi -1.10 0.14 0.65 0.65 1.48 2.00 2.25 2.84 3.30 3.65 5.05 5.45 zi 0.16 2.14 3.01 2.20 2.20 1.02 0.05 -1.14 -3.02 -3.21 -4.12 -450 2 3 Facoltà di Economia - Esame di Statistica – 11.12.2006 2. Una compagnia aerea (attualmente in crisi!) sa che, in media il 65%, dei propri voli ha ritardo. La rilevazione dei ritardi ha fornito i seguenti dati: Ritardo (in centesimi di ora) 0-10 10-20 20-30 30-50 50-100 Numero di voli 2000 3000 2500 2000 500 a) Calcolare la media e la deviazione standard del tempo di ritardo per i voli ritardati. b) La compagnia ha valutato che ciascun volo ritardato produce una perdita fissa di 170 Euro e una perdita variabile di 100 Euro per ogni minuto di ritardo: qual è la perdita media mensile stimata? c) Si stabilisca se si ha maggiore variabilità nelle perdite o nel tempo di ritardo. 3. Della variabile statistica doppia (X, Y) si conoscono le rette di regressione: 5 x 16 y 120 0 X|y x 5 y 60 0 Y|x Si stabilisca quale delle due variabili ha valore medio maggiore e quale delle due ha maggiore varianza. Facoltà di Economia - Esame di Statistica – 20.02.07 1. Un negoziante al dettaglio acquista per rivendere una partita di ananas, che classifica in base al peso, ottenendo la seguente tabella di frequenza peso (gr) n. ananas (250-300] (300-350] (350-400] (400-450] (450-500] (500-550] (550-600] (600-700] (700-800] 3 10 15 25 32 20 19 4 2 Il negoziante adotta la seguente strategia di vendita: ritira dalla vendita il 10% degli ananas di peso inferiore; destina a un ristorante quelli che pesano oltre i 600 gr chiedendone 7 Euro al kg; mette in vendita al prezzo di 8 Euro al kg quelli che hanno un peso superiore ai 450gr e a 6 Euro al kg i rimanenti. a. Avendo pagato la partita a 3 Euro al kg, si determini il valore del guadagno atteso dal negoziante. b. Si può affermare che la distribuzione di frequenza del peso degli ananas è approssimativamente simmetrica? 3. Un certo materiale avente proprietà chimiche che dipendono dalla durata della sua esposizione a un certo trattamento termico, viene controllato in base al tempo di esposizione. Al variare del numero dei giorni, è stata rilevata la percentuale della sostanza Z che si è sviluppata al suo interno, ottenendo i seguenti dati n. giorni di esposizione % di sostanza Z rilevata 0 1 3 4 5 6 7 9 7.9 12.0 9.5 11.3 11.8 11.3 4.2 0.4 a) Si costruisca la retta di regressione. b) Si calcoli la varianza spiegata dal modello e si valuti se la varianza residua supera o meno il 50% della varianza totale. c) Si determini inoltre la percentuale di sostanza Z che ci si dovrebbe aspettare per un’esposizione del materiale di due giorni. d) Infine si dia una valutazione dell’errore percentuale su Z, rispetto al valore osservato, che si commette assumendo il valore fornito dal modello in assenza di esposizione. 3 4 Facoltà di Economia - Esame di Statistica – 4.07.2002 1. Da una serie di 5 rilevazioni sulla variabile statistica doppia (X,Y) sono state ricavate le due rette di regressione di Y rispetto ad x, e di X rispetto ad y : Y | x: y 3.654 0.686 x X | y: y 2.785 0.904 x Purtroppo – come si vede nella tabella seguente che contiene i dati originari - sono andati perduti i dati numerici relativi alla coppia ( x 4 , y 4 ), xi -1 0 2 x4 12 yi 3 3 4 y4 10 E’ possibile ricostruirli univocamente? E se sì, quali sono questi valori? Facoltà di Economia - Esame di Statistica – 20. 11.2004 2. Di una variabile statistica X sono stati rilevati i seguenti valori x1=-1.3, x2=-0.2, x3=0.0, x4=1.5, x5=2.8, x6=3.6, x7=4.0. In loro corrispondenza si sono ottenuti i valori della variabile Y: y1=4.2, y2=7.5, y3=4.4, y4=,5.6, y5=5.5, y6=3.0, y7=4.8 e, separatamente, i valori della variabile Z: z1=3.2, z2=4.0, z3=3.6, z4=4.8, z5=5.4, z6=5.6, z7=6.0. Si stabilisca con l’uso di indici descrittivi, quale tra le due variabili Y e Z ha una migliore relazione lineare con la variabile X. Facoltà di Economia - Esame di Statistica – 08.05.2003 5. Data la seguente tabella relativa alle variabili X e Y, xi 0 1 2 3 4 yi 1 1.8 3.3 4.5 6.3 si costruisca la retta di regressione di Y|x e si individuino i punti che hanno, rispettivamente, scarto minimo e massimo dalla retta. Si valuti inoltre lo scarto medio dei punti dalla retta. Facoltà di Economia - Esame di Statistica – 21.11.2003 1. In base ai dati contenuti nella seguente tabella, assumendo che tra le variabili statistiche X e Y esista una relazione di tipo lineare, si stabilisca se tale relazione è rappresentata meglio dalla retta di regressione di Y|x oppure dalla retta di X|y. xi yi 104.2 106.1 105.6 106.3 101.7 104.4 102.0 103.8 104.0 101.5 101.9 100.6 104.9 106.2 103.1 39.8 40.4 39.9 40.8 33.7 39.5 33.0 37.0 37.6 33.2 33.9 29.9 39.5 Facoltà di Economia - Esame di Statistica – 25.09.2003 3. Y e X indicano, rispettivamente, in unità standard la quantità offerta di un certo bene e il corrispondente prezzo di mercato. In base ai dati forniti qui di seguito: yi 70 65 50 56 57 79 57 55 66 52 70 64 xi 10 12 5 11 9 10 6 8 13 7 10 8 x )( yi y ) 134.25 ; x ( x i i i 4 2 i 1053 ; y i 2 i 46581 40.6 35.1 5 a. si valuti la correlazione lineare tra le variabili Y e X e la bontà di adattamento al modello lineare; b. si determini la retta di regressione della quantità offerta in funzione del prezzo; c. in base al modello, si calcoli la differenza tra le offerte che si registrano in corrispondenza dei prezzi pari a 7 e 14. Facoltà di Economia - Esame di Statistica – 24.09.2001 3. Da una distribuzione di frequenza bidimensionale della variabile statistica (X, Y) si è ricavata la retta di regressione di Y sopra X ottenendo y 1.7 x 5.3 e la retta di X sopra Y x 0.58 y 3.5 . Si determinino: a) i valori medi di X e di Y; si stabilisca: b) quale delle due variabili ha una maggiore variabilità rispetto alla media e in che misura; si valuti se: c) il modello lineare rappresenta in maniera soddisfacente la relazione tra X e Y. Facoltà di Economia - Esame di Statistica – 20.09.2004 4. La tabella delle frequenze relative rilevate sulla coppia di variabili statistiche (X,Y) ha fornito la seguente sintesi, (dati fittizi) Y [3.2, 4.5) [4.5, 7.0) [7.0, 8.0) [8.0, 10.0) X [-2.0, 0.0) 0.00 0.05 0.05 0.00 0.10 [0.0, 0.5) 0.10 0.15 0.05 0.00 0.30 [0.5, 1.5) 0.00 0.20 0.15 0.05 0.40 [1.5, 3.0) 0.00 0.10 0.10 0.00 0.20 0.10 0.50 0.35 0.05 Si calcoli la covarianza di (X,Y) e l’indice di correlazione lineare. Si costruisca la retta di regressione di Y|x, specificando quanta parte della variabilità della Y è attribuibile al modello lineare. Facoltà di Economia - Esame di Statistica – 22.06.2004 2. Data la seguente tabella di 6 coppie di dati fittizi, (xi,yi), i=1,…,6, xi 0.0 3.2 4.0 4.8 5.5 7.0 yi -3.0 2.5 5.3 5.3 6.0 5.5 a. si costruisca la retta di regressione di Y|x e si calcoli il coefficiente di correlazione lineare; b. si aggiunga un’ulteriore coppia di numeri (x7,y7) che lasci invariata la retta. Che cosa accade al coefficiente di correlazione lineare? 5 6 Facoltà di Economia - Esame di Statistica – 29.07.2003 1. Due variabili X e Y hanno rispettivamente medie 5 e 6 e deviazioni standard 4 e 1. Sapendo che la covarianza tra di esse è pari a 2, a. si determini il valore che assume Y quando x=4. b. A quali valori di X corrisponde l’intervallo 4 y8? Facoltà di Economia - Esame di Statistica – 27.02.2002 5. Supponendo che tra il tempo X di permanenza dei clienti allo sportello di una banca e il numero medio Y di operazioni sbrigate in quell’intervallo di tempo vi sia una relazione di tipo lineare. Con i dati raccolti in tabella si costruisca la retta di regressione di Y|x e si calcoli la parte della varianza che il modello non riesce a spiegare. xi yi 2 3.0 4 3.4 6 4.0 8 4.5 10 4.4 12 5.0 Facoltà di Economia - Esame di Statistica – 16.01.2002 5. Date le variabili statistiche X e Y con medie x 4 e y 5.71 , legate tra loro da una covarianza pari a –16.43, si determini l’equazione della retta di regressione di Y|x, sapendo che la varianza spiegata dal modello lineare è pari a 7.47, valore che rappresenta l’88% della varianza totale. Facoltà di Economia - Esame di Statistica – 08.05.2003 5. Data la seguente tabella relativa alle variabili X e Y, xi 0 1 2 3 4 yi 1 1.8 3.3 4.5 6.3 si costruisca la retta di regressione di Y|x e si individuino i punti che hanno, rispettivamente, scarto minimo e massimo dalla retta. Si valuti inoltre lo scarto medio dei punti dalla retta. Facoltà di Economia - Esame di Statistica – 26.06.2008 4. Il consumo medio di elettricità Y per l’uso di pompe di calore è stato rilevato per diversi gradi della temperatura ambientale esterna X, ottenendo i seguenti dati (in unità di consumo convenzionalmente espressi): xi -5 -4 -3 -2 -1 0 1 2 3 4 5 yi 23.4 18.8 19.7 18.0 14.2 13.7 15.7 12.1 9.7 10.3 6.5 a. Si costruisca la retta di regressione dei consumi per le sole prime 6 temperature più basse e se ne calcoli la varianza spiegata. b. Si ripeta la costruzione per le restanti 5 temperature e si calcoli la variazione della percentuale di varianza spiegata dai due modelli. 6 7 Facoltà di Economia - Esame di Statistica – 6.02.2006 1. Su 8 unità statistiche sono stati rilevati i valori delle variabili X e Y che le caratterizzano, ottenendo i seguenti valori sintetici 8 xi 38 , i 1 8 yi 24 , i 1 8 2 xi 436 , i 1 8 2 yi 220 . i 1 Sapendo che la retta di regressione di Y|x ha la seguente equazione: y 0.06 0.62 x , si determini a. il coefficiente di correlazione lineare tra X e Y; b. la retta di regressione di X|y. Facoltà di Economia - Esame di Statistica – 25.09.2007 3. Sono state rilevati i valori della variabile X=”anni di invecchiamento di una partita di Vernaccia” e Y=”quantità di produzione” (in unità standard) xi 2 4 6 8 10 12 yi 3.0 3.4 4.0 4.5 4.4 5.0 Assumendo che tra X e Y vi sia una relazione lineare, si costruisca la retta di regressione di Y|x e si confronti la variabilità della Y con la variabilità della X, calcolando la differenza tra le due variabilità relative. Facoltà di Economia - Esame di Statistica – 24.01.2011 5. La rilevazione della capacità ricettiva negli Alberghi della provincia di Cagliari nel 2009 ha fornito i seguenti dati: 333 letti in 18 alberghi di categoria 1 stella 439 letti in 18 alberghi di categoria 2 stelle 1694 letti in 6 alberghi di categoria 5 stelle 4466 letti in 64 alberghi di categoria 3 stelle 13779 letti in 46 alberghi di categoria 4 stelle a. Si costruisca la funzione cumulativa delle frequenze degli alberghi in funzione della categoria, determinando la mediana della distribuzione e la distanza tra il terzo e il primo quartile. b. Si calcoli il numero medio di letti per ciascuna categoria d’albergo e si determinino media, mediana e le dispersioni assoluta e relativa di tali nuovi dati. Facoltà di Economia - Esame di Statistica – 21.02.2011 5. Una società alberghiera ha raccolto i dati relativi alle presenze dei clienti in 9 settimane in un albergo della propria catena. Di seguito sono riportati i dati che riguardano: X = TOL (rapporto tra letti occupati e letti disponibili) e Y = variazione percentuale dei ricavi rispetto alla stessa settimana dell’anno precedente. X 0.450 0.575 0.925 0.975 0.970 0.840 0.725 1.00 0.750 Y -0.20 -0.15 0.00 0.17 0.10 0.15 0.33 0.25 -0.01 a. Si costruisca la retta di regressione delle variazioni dei ricavi rispetto al TOL. b. Se si aggiungono i dati relativi a un’ulteriore settimana: x10=0.885, y10=0.16, qual è la variazione percentuale della bontà del modello lineare? 7