Corso di Statistica Prof.ssa Grazia Laganà A.A. 2015/2016 Esercitazione di Statistica 1. Esercizio La seguente serie è relativa ad una variabile continua X rilevata su 10 individui: 1,2 1,5 2,1 2,8 3,3 3,6 4,2 5,9 6,8 sintetizzare i dati in una distribuzione costituita dalle classi 1-|2, 2-|4 e 4-|7 disegnarne l’istogramma corrispondente. 2. Esercizio Calcolare la moda e la media 3. Esercizio Data la seguente serie di valori di una variabile continua X rilevata su 12 individui 6,0 6,4 10,2 10,0 11,8 7,2 4,5 8,1 5,1 9,8 10,9 10,0 determinare il valore dei tre quartili della variabile. 4. Esercizio Sulla base della distribuzione riportata nella tabella successiva calcolare il coefficiente di variazione 5. Esercizio Data la seguente distribuzione doppia: a) determinare la media e la varianza della distribuzione di X condizionata a Y=0; b) determinare la media e la varianza della distribuzione di Y condizionata a X=10; 6. Esercizio Una azienda ha 550 dipendenti di cui 50 sono dirigenti, 100 impiegati e 400 operai. L’età media dei dirigenti è 51 anni, quella degli impiegati è 39 anni e quella degli operai è 42 anni. Qual è l’età media dei dipendenti in complesso? N.B.: non svolgere i calcoli ma impostare e commentare l’esercizio 7. Esercizio Le due seguenti tabelle riportano, rispettivamente, il peso (in Kg) e l’altezza (in cm) degli iscritti al corso di nuoto per principianti presso una determinata piscina: Valutare, mediante il calcolo di un indice opportuno, quale delle due distribuzioni presenta maggiore variabilità. Commentare. 8. Esercizio Si riporta di seguito il Box-plot costruito a partire dalle età degli individui che hanno partecipato ad un focus group organizzato da un’azienda alimentare per valutare l’interesse dei consumatori in merito al lancio di un nuovo prodotto. Individuare i cinque valori rappresentativi della distribuzione e commentare il tipo di distribuzione. 9. Esercizio I quartili dell’età di un collettivo di partecipanti ad un test erano nell’ordine 27, 41 e 59 . a) Vuol dire che: 1 su 4 era più giovane di ... anni 1 su 4 era più vecchio di ... anni 2 su 4 erano fra ... e ... anni la metà aveva più di ... anni b) Si sa inoltre che media e deviazione standard erano rispettivamente pari a 42 e 12. Secondo questi dati, si può capire se la distribuzione sembra Normale o no? c) quale indice di posizione è adatto per descrivere sinteticamente la distribuzione? Nota: La statistica bidimensionale o bivariata si occupa dello studio del grado di dipendenza di due caratteri distinti della stessa unità statistica. E’ possibile, ad esempio, studiare il legame che esiste tra il peso e l’altezza di un gruppo di persone oppure, considerando 100 famiglie, si può studiare il legame che esiste tra il numero di membri di una famiglia e il numero di automobili di proprietà di ciascuna famiglia ecc.. Il tipo di dipendenza che si studia è solo la “dipendenza statistica”, e non è detto che ogni volta che si nota una dipendenza statistica c’è anche una dipendenza causa-effetto tra le due variabili in esame. Ecco un esempio significativo: statisticamente si può di mostrare che gli studenti con i piedi piccoli fanno più errori di ortografica di quelli con i piedi grandi. Questo non significa che l’avere i piedi piccoli sia la causa del fare errori di ortografia, piuttosto i ragazzi con i piedi piccoli sono i più giovani e per questo fanno più di frequente errori di ortografia. In questo caso c’è una terza variabile, l’età degli studenti, che genera la relazione di causa-effetto. 10. Esercizio Sia X la variabile voto dello scrutinio ed Y la variabile studente pendolare, studente non 2 2 pendolare, determinare Mx, My, σ x , σ y