Esercitazione statistica descrittiva - I parte

annuncio pubblicitario
Esercitazione di STATISTICA DESCRITTIVA – Prima parte
Esercizio 1: In un dato anno, per 100 famiglie raggruppate per ripartizione territoriale di residenza, sono stati osservati i seguenti dati relativi alla spesa
annua per consumi alimentari (X) e per vestiario (Y), espressi in percentuale del reddito:
Ripartizione territoriale
X
Y
Reddito totale delle
Numero di famiglie
Nord-Est
25
20
2
20
Nord-Ovest
25
22
2
25
Centro
30
10
2,1
30
Sud e isole
35
15
1,5
25
famiglie (miliardi di lire)
a)
Si determini, mediante un opportuno indice, se per il complesso delle 100 famiglie vi sia una maggiore variabilità nella distribuzione della spesa
annua per consumi alimentari o in quella della spesa per vestiario.
b)
Si valuti la spesa media totale (per consumi alimentari e per vestiario) per famiglia.
Esercizio 2: I 200 studenti iscritti ad un certo corso di laurea si ripartiscono tra 120 maschi e 80 femmine. Con riferimento alla votazione conseguita
nell’esame di maturità (variabile X, espressa in sessantesimi) sono state raccolte le seguenti informazioni:
ni
Maschi
M1(X)
X0,5
s.q.m.
120
44,5
42
1,5
80
46,9
42
0,8
Femmine
a)
Determinare il voto medio di diploma e lo scarto quadratico medio per il complesso dei 200 studenti.
b)
Fornire, mediante un opportuno indice, una valutazione sulla simmetria della distribuzione dei 200 voti.
c)
Nell’ipotesi che un’altra studentessa si iscrivi al corso di laurea e sapendo che, in tal caso, il voto medio di diploma delle 81 studentesse risulterebbe
pari a 47, si determini il voto di diploma di tale studentessa e come si modificherebbe corrispondentemente, lo scarto quadratico medio.
Esercizio 3: Per un campione di 100 dipendenti di un’azienda è stata rilevata la retribuzione annua nel 2001, espressa in migliaia di euro, e sono stati
determinati i seguenti indici di sintesi: M(X)=2,5; Q1=1,4; Me=2,4; Q3=6,2; M(X2)=56,5.
1) Si stabilisca se la distribuzione considerata presenti o meno asimmetria e, in caso, affermativo, se ne determini il grado mediante un
opportuno indice.
2)
Sapendo che la proporzione dei dipendenti con reddito annuo superiore a 12,6 è del 35%, si determini il numero dei dipendenti, tra i 100
osservati, la cui retribuzione si discosta dalla media per meno di 0,1 migliaia di euro.
3)
Con riferimento ad un secondo campione di 40 dipendenti dell’azienda, con contratto di formazione lavoro, si osserva una media aritmetica
delle retribuzioni pari a 11,5 e media quadratica pari a 12,5.
Esercizio 4: Per 10 autovetture viene registrata l'età (variabile X, espressa in anni), la spesa media annua per manutenzione (variabile Y, espressa in
decine di euro) e il nome del proprietario (variabile Z):
xi
4
5
5
6
2
6
8
6
2
6
yi
40
50
60
65
35
70
70
50
30
30
zi
Mario
Luca
Bruno
Marco
Mario
Gianni
Sergio
Paolo
Paolo
Marco
a)
Indicare cosa rappresenta il valore 6 riportato nella prima riga della tabella: una frequenza; una modalità del carattere; l'unità statistica di riferimento;
il posto d'ordine.
b)
Indicare cosa rappresenta la parola “Sergio” riportata nella terza riga della tabella: una frequenza; una modalità del carattere; l'unità statistica di
riferimento; il posto d'ordine.
c)
Per ciascuno dei tre caratteri considerati, indicare se si tratti di un carattere qualitativo non ordinabile, qualitativo ordinabile, quantitativo discreto o
quantitativo continuo.
d)
Indicare il valore presentato dalla moda, dalla media e dalla varianza di X.
e)
Indicare il valore della funzione di ripartizione empirica (frequenza cumulata relativa) in corrispondenza di una spesa media annua di 50 decine di
euro.
e)
Indicare il valore presentato dal secondo decile della distribuzione di Y.
Esercizio 5: Per un dato carattere X si hanno informazioni relative a due gruppi di 8 e, rispettivamente, 12 unità: nel primo, la media vale 30 e la varianza
36; nel secondo, la media vale 20 e la varianza 25.
a)
Indicare quale delle due distribuzioni presenti effettivamente maggiore variabilità, motivando la risposta.
b)
Determinare la media e la varianza dei voti per il complesso dei 20 studenti.
Esercizio 6: Data la seguente distribuzione di 20 fondi azionari secondo il rendimento percentuale a un anno:
Rendimento percentuale a un anno
5 – 10
10 – 15
15 - 20
20 - 25
25 – 35
Totale
Numero di fondi
3
5
4
2
6
20
a) determinarne la media aritmetica e la varianza;
b) supponendo di osservare un ulteriore fondo azionario con rendimento pari al 24,5%, indicare come si modificherebbe la media aritmetica riferita al
collettivo dei 21 fondi, rispetto a quella valutata nel punto a): i) diminuirebbe; ii) rimarrebbe immutata; iii) aumenterebbe;
iv) impossibile rispondere senza svolgere i calcoli;
c) individuare la classe modale della distribuzione.
Esercizio 7: La distribuzione degli operai di una fabbrica secondo l’età (espressa in anni) presenta i seguenti valori di sintesi: xmin=18,2; Q1=25,3;
Q2=36,4; Q3=48,7; xmax=56,8.
Coerentemente con tali informazioni, indicare tra le alternative proposte quella di volta in volta plausibile per:
a) la forma: i) perfetta simmetria; ii) asimmetria negativa; iii) asimmetria positiva; iv) situazione non qualificabile, data l’assenza di informazioni sulla
media aritmetica;
b) la moda: i) 20,2; ii) 26,4; iii) 37,5; iv) informazioni insufficienti per rispondere;
c) la media aritmetica: i) 18,5; ii) 37,2; iii) 37,8; iv) informazioni insufficienti per rispondere;
d) la funzione di ripartizione empirica F(37): i) 0,38; ii) 0,48; iii) 0,52; iv) 0,8; v) informazioni insufficienti per rispondere.
e) Sapendo, infine, che le intensità osservate risultano superiori a 19,6 nell’85% dei casi, indicare l’intervallo di valori ammissibili per F(20).
Esercizio 8: Con riferimento agli studenti iscritti ad una facoltà, si sa che il 60% è costituito da maschi e per questi la distribuzione secondo il voto medio
degli esami sostenuti presenta media aritmetica e varianza (non corretta) rispettivamente pari a 23,7 e 72,25. Sapendo, inoltre, che per le femmine tale
distribuzione presenta media aritmetica e varianza (non corretta) rispettivamente pari a 25,2 e 64, determinare la media e la varianza della distribuzione
riferita a tutti gli studenti iscritti.
Esercizio 9: Nella città A, per ciascun mese di un dato anno, viene rilevato il numero di giorni di pioggia, pervenendo alla seguente serie incompleta di
osservazioni:
gennaio
febbraio
marzo
aprile
maggio
giugno
luglio
agosto
settembre
ottobre
novembre dicembre
5
2
8
?
2
1
0
0
?
10
15
5
a) Determinare il valore assunto dalle due intensità mancanti, sapendo che il numero medio di giorni di pioggia per ciascun mese dell’anno è 5 e che il
numero di giorni di pioggia rilevato nel mese di aprile è il doppio di quello rilevato in settembre.
b) Supponendo ora che nei mesi di aprile e settembre siano stati registrati, rispettivamente, 10 e 8 giorni di pioggia, determinare il valore assunto dalla
funzione di ripartizione empirica nel punto x=7, nonché i quartili della distribuzione.
c) Sulla base delle informazioni ricavate, stabilire cosa si possa concludere in merito alla presenza o meno di asimmetria nella distribuzione considerata.
Esercizio 10: Ad un gruppo di cinefili viene chiesto di esprimere un voto su alcuni cult-movies, riportati di seguito insieme al punteggio complessivamente
ricevuto da parte degli intervistati:
Blade Runner
E.T.
Il gattopardo
Metropolis
Otto e ½
Pulp fiction
Quarto potere
I 400 colpi
120
88
90
100
92
110
100
100
a) Indicare cosa rappresenta il numero 88 riportato nella tabella: i) una unità statistica; ii) una frequenza; iii) una modalità; iv) un rango.
b) Indicare cosa rappresenta ciascun film riportato nella tabella: i) una unità statistica; ii) una modalità; iv) un’osservazione; iv) un carattere qualitativo.
c) Indicare quante sono le unità statistiche considerate nella tabella.
d) Determinare il valore assunto dalla funzione di ripartizione empirica in corrispondenza di un punteggio pari a 95.
e) Indicare i valori assunti, rispettivamente, dalla moda e dalla mediana.
Esercizio 11: Si valutino le seguenti situazioni alternative riferite alla distribuzione di un carattere quantitativo X:
a) M(X)=0 e ciò implica che: i) la distribuzione è simmetrica; ii) la varianza vale 1; iii) il numero di unità che presentano una modalità positiva è pari al
numero di unità che presentano una modalità negativa;
iv) la somma delle intensità negative è, in valore assoluto, pari alla somma delle intensità positive;
b) il coefficiente di variazione vale 1 e ciò implica che: i) la varianza e la media della distribuzione coincidono; ii) la variabile è stata standardizzata; iii) la
media coincide con lo scarto quadratico medio; iv) tutte le unità presentano la stessa modalità del carattere;
c) M(X)=10 e Var(X)=20 e, per Y = 2 + 4 X, ciò implica che: i) M(Y)=40 e Var(Y)=80; ii) M(Y)=42 e Var(Y)=82; iii) M(Y)=42 e Var(Y)=324; iv) M(Y)=40 e
Var(Y)=320; v) M(Y)=42 e Var(Y)=320.
Scarica