Esercitazione di STATISTICA DESCRITTIVA – Prima parte Esercizio 1: In un dato anno, per 100 famiglie raggruppate per ripartizione territoriale di residenza, sono stati osservati i seguenti dati relativi alla spesa annua per consumi alimentari (X) e per vestiario (Y), espressi in percentuale del reddito: Ripartizione territoriale X Y Reddito totale delle Numero di famiglie Nord-Est 25 20 2 20 Nord-Ovest 25 22 2 25 Centro 30 10 2,1 30 Sud e isole 35 15 1,5 25 famiglie (miliardi di lire) a) Si determini, mediante un opportuno indice, se per il complesso delle 100 famiglie vi sia una maggiore variabilità nella distribuzione della spesa annua per consumi alimentari o in quella della spesa per vestiario. b) Si valuti la spesa media totale (per consumi alimentari e per vestiario) per famiglia. Esercizio 2: I 200 studenti iscritti ad un certo corso di laurea si ripartiscono tra 120 maschi e 80 femmine. Con riferimento alla votazione conseguita nell’esame di maturità (variabile X, espressa in sessantesimi) sono state raccolte le seguenti informazioni: ni Maschi M1(X) X0,5 s.q.m. 120 44,5 42 1,5 80 46,9 42 0,8 Femmine a) Determinare il voto medio di diploma e lo scarto quadratico medio per il complesso dei 200 studenti. b) Fornire, mediante un opportuno indice, una valutazione sulla simmetria della distribuzione dei 200 voti. c) Nell’ipotesi che un’altra studentessa si iscrivi al corso di laurea e sapendo che, in tal caso, il voto medio di diploma delle 81 studentesse risulterebbe pari a 47, si determini il voto di diploma di tale studentessa e come si modificherebbe corrispondentemente, lo scarto quadratico medio. Esercizio 3: Per un campione di 100 dipendenti di un’azienda è stata rilevata la retribuzione annua nel 2001, espressa in migliaia di euro, e sono stati determinati i seguenti indici di sintesi: M(X)=2,5; Q1=1,4; Me=2,4; Q3=6,2; M(X2)=56,5. 1) Si stabilisca se la distribuzione considerata presenti o meno asimmetria e, in caso, affermativo, se ne determini il grado mediante un opportuno indice. 2) Sapendo che la proporzione dei dipendenti con reddito annuo superiore a 12,6 è del 35%, si determini il numero dei dipendenti, tra i 100 osservati, la cui retribuzione si discosta dalla media per meno di 0,1 migliaia di euro. 3) Con riferimento ad un secondo campione di 40 dipendenti dell’azienda, con contratto di formazione lavoro, si osserva una media aritmetica delle retribuzioni pari a 11,5 e media quadratica pari a 12,5. Esercizio 4: Per 10 autovetture viene registrata l'età (variabile X, espressa in anni), la spesa media annua per manutenzione (variabile Y, espressa in decine di euro) e il nome del proprietario (variabile Z): xi 4 5 5 6 2 6 8 6 2 6 yi 40 50 60 65 35 70 70 50 30 30 zi Mario Luca Bruno Marco Mario Gianni Sergio Paolo Paolo Marco a) Indicare cosa rappresenta il valore 6 riportato nella prima riga della tabella: una frequenza; una modalità del carattere; l'unità statistica di riferimento; il posto d'ordine. b) Indicare cosa rappresenta la parola “Sergio” riportata nella terza riga della tabella: una frequenza; una modalità del carattere; l'unità statistica di riferimento; il posto d'ordine. c) Per ciascuno dei tre caratteri considerati, indicare se si tratti di un carattere qualitativo non ordinabile, qualitativo ordinabile, quantitativo discreto o quantitativo continuo. d) Indicare il valore presentato dalla moda, dalla media e dalla varianza di X. e) Indicare il valore della funzione di ripartizione empirica (frequenza cumulata relativa) in corrispondenza di una spesa media annua di 50 decine di euro. e) Indicare il valore presentato dal secondo decile della distribuzione di Y. Esercizio 5: Per un dato carattere X si hanno informazioni relative a due gruppi di 8 e, rispettivamente, 12 unità: nel primo, la media vale 30 e la varianza 36; nel secondo, la media vale 20 e la varianza 25. a) Indicare quale delle due distribuzioni presenti effettivamente maggiore variabilità, motivando la risposta. b) Determinare la media e la varianza dei voti per il complesso dei 20 studenti. Esercizio 6: Data la seguente distribuzione di 20 fondi azionari secondo il rendimento percentuale a un anno: Rendimento percentuale a un anno 5 – 10 10 – 15 15 - 20 20 - 25 25 – 35 Totale Numero di fondi 3 5 4 2 6 20 a) determinarne la media aritmetica e la varianza; b) supponendo di osservare un ulteriore fondo azionario con rendimento pari al 24,5%, indicare come si modificherebbe la media aritmetica riferita al collettivo dei 21 fondi, rispetto a quella valutata nel punto a): i) diminuirebbe; ii) rimarrebbe immutata; iii) aumenterebbe; iv) impossibile rispondere senza svolgere i calcoli; c) individuare la classe modale della distribuzione. Esercizio 7: La distribuzione degli operai di una fabbrica secondo l’età (espressa in anni) presenta i seguenti valori di sintesi: xmin=18,2; Q1=25,3; Q2=36,4; Q3=48,7; xmax=56,8. Coerentemente con tali informazioni, indicare tra le alternative proposte quella di volta in volta plausibile per: a) la forma: i) perfetta simmetria; ii) asimmetria negativa; iii) asimmetria positiva; iv) situazione non qualificabile, data l’assenza di informazioni sulla media aritmetica; b) la moda: i) 20,2; ii) 26,4; iii) 37,5; iv) informazioni insufficienti per rispondere; c) la media aritmetica: i) 18,5; ii) 37,2; iii) 37,8; iv) informazioni insufficienti per rispondere; d) la funzione di ripartizione empirica F(37): i) 0,38; ii) 0,48; iii) 0,52; iv) 0,8; v) informazioni insufficienti per rispondere. e) Sapendo, infine, che le intensità osservate risultano superiori a 19,6 nell’85% dei casi, indicare l’intervallo di valori ammissibili per F(20). Esercizio 8: Con riferimento agli studenti iscritti ad una facoltà, si sa che il 60% è costituito da maschi e per questi la distribuzione secondo il voto medio degli esami sostenuti presenta media aritmetica e varianza (non corretta) rispettivamente pari a 23,7 e 72,25. Sapendo, inoltre, che per le femmine tale distribuzione presenta media aritmetica e varianza (non corretta) rispettivamente pari a 25,2 e 64, determinare la media e la varianza della distribuzione riferita a tutti gli studenti iscritti. Esercizio 9: Nella città A, per ciascun mese di un dato anno, viene rilevato il numero di giorni di pioggia, pervenendo alla seguente serie incompleta di osservazioni: gennaio febbraio marzo aprile maggio giugno luglio agosto settembre ottobre novembre dicembre 5 2 8 ? 2 1 0 0 ? 10 15 5 a) Determinare il valore assunto dalle due intensità mancanti, sapendo che il numero medio di giorni di pioggia per ciascun mese dell’anno è 5 e che il numero di giorni di pioggia rilevato nel mese di aprile è il doppio di quello rilevato in settembre. b) Supponendo ora che nei mesi di aprile e settembre siano stati registrati, rispettivamente, 10 e 8 giorni di pioggia, determinare il valore assunto dalla funzione di ripartizione empirica nel punto x=7, nonché i quartili della distribuzione. c) Sulla base delle informazioni ricavate, stabilire cosa si possa concludere in merito alla presenza o meno di asimmetria nella distribuzione considerata. Esercizio 10: Ad un gruppo di cinefili viene chiesto di esprimere un voto su alcuni cult-movies, riportati di seguito insieme al punteggio complessivamente ricevuto da parte degli intervistati: Blade Runner E.T. Il gattopardo Metropolis Otto e ½ Pulp fiction Quarto potere I 400 colpi 120 88 90 100 92 110 100 100 a) Indicare cosa rappresenta il numero 88 riportato nella tabella: i) una unità statistica; ii) una frequenza; iii) una modalità; iv) un rango. b) Indicare cosa rappresenta ciascun film riportato nella tabella: i) una unità statistica; ii) una modalità; iv) un’osservazione; iv) un carattere qualitativo. c) Indicare quante sono le unità statistiche considerate nella tabella. d) Determinare il valore assunto dalla funzione di ripartizione empirica in corrispondenza di un punteggio pari a 95. e) Indicare i valori assunti, rispettivamente, dalla moda e dalla mediana. Esercizio 11: Si valutino le seguenti situazioni alternative riferite alla distribuzione di un carattere quantitativo X: a) M(X)=0 e ciò implica che: i) la distribuzione è simmetrica; ii) la varianza vale 1; iii) il numero di unità che presentano una modalità positiva è pari al numero di unità che presentano una modalità negativa; iv) la somma delle intensità negative è, in valore assoluto, pari alla somma delle intensità positive; b) il coefficiente di variazione vale 1 e ciò implica che: i) la varianza e la media della distribuzione coincidono; ii) la variabile è stata standardizzata; iii) la media coincide con lo scarto quadratico medio; iv) tutte le unità presentano la stessa modalità del carattere; c) M(X)=10 e Var(X)=20 e, per Y = 2 + 4 X, ciò implica che: i) M(Y)=40 e Var(Y)=80; ii) M(Y)=42 e Var(Y)=82; iii) M(Y)=42 e Var(Y)=324; iv) M(Y)=40 e Var(Y)=320; v) M(Y)=42 e Var(Y)=320.