STATISTICA I - CORSO DI LAUREA IN STATISTICA a.a. 2004/2005 Prova intermedia del 01 aprile 2005 Esercizio 1 La Tabella 1 contiene alcuni dati relativi a 14 aziende. Tabella 1 – Dati (fittizi) su alcune aziende Azienda Settore Numero di sedi 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Primario Primario Primario Primario Secondario Secondario Secondario Secondario Secondario Secondario Secondario Terziario Terziario Terziario 4 1 2 1 3 2 3 3 2 4 1 3 3 2 Fatturato Livello Numero (migliaia innovazione dipendenti di euro) tecnologica 2235 545 854 976 336 402 1071 1197 555 1526 534 1008 2438 550 Medio [missing] Medio Basso Medio Basso Medio [missing] Alto Medio Basso Basso Medio Alto 141 35 49 64 41 45 68 70 32 40 39 62 137 39 Con riferimento ai dati della Tabella 1: a) scrivere la distribuzione delle frequenze assolute, relative e cumulate relative (ove ammissibile) dei caratteri Settore, Numero di sedi, Fatturato e Livello di innovazione tecnologica. NOTA: per il Fatturato usare classi di ampiezza pari a 500 mila euro; b) calcolare un indice di posizione (il più informativo possibile) per i caratteri Settore, Numero di sedi e Livello di innovazione tecnologica; c) rappresentare la distribuzione di frequenze e la funzione di ripartizione empirica del carattere Numero di sedi; d) disegnare l’istogramma e la funzione di ripartizione dedotta dall’istogramma del carattere Fatturato; e) calcolare la proporzione di aziende con fatturato compreso tra 600 mila e 1800 mila euro. Relativamente al carattere Numero di dipendenti calcolare: f) campo di variazione; g) scarto interquartile; h) varianza e scarto quadratico medio; i) coefficiente di variazione. Relativamente al carattere Fatturato calcolare: j) primo e terzo quartile, utilizzando la funzione di ripartizione dedotta dall’istogramma definita al punto d). 05/04/05 Esercizio 2 Rispondere ai seguenti quesiti, spiegando brevemente le ragioni della risposta: (a) Quale media lascia invariato il prodotto dei valori della successione? (b) Che cos’è una media aritmetica ponderata? (c) Se si aggiunge una costante a ognuno dei dati di una successione, come si modifica la media aritmetica? (d) Se si aggiunge una costante a ognuno dei dati di una successione, come si modifica la deviazione standard? (e) Se raddoppia ognuno dei dati di una successione, come si modifica la media aritmetica? (f) Se raddoppia ognuno dei dati di una successione, come si modifica la deviazione standard? (g) Se si cambia il segno a ognuno dei dati di una successione, come si modifica la media aritmetica? (h) Se si cambia il segno a ognuno dei dati di una successione, come si modifica la deviazione standard? (i) Se la deviazione standard di un insieme di valori è zero, cosa significa? (j) Se la media quadratica di un insieme di valori è zero, cosa significa? In questo caso, media aritmetica e media geometrica saranno anch’esse pari a zero? (k) Se la media aritmetica di un insieme di valori è zero, quanto vale la varianza? (l) Che cosa rappresenta la derivata prima della funzione di ripartizione dedotta dall’istogramma? (m) Quali sono le principali differenze tra un esperimento controllato e uno studio sul campo? (n) Quali sono i vantaggi e gli svantaggi della formulazione aperta e chiusa delle domande in un questionario postale? Esercizio 3 Enunciare e dimostrare la proprietà di baricentro e la proprietà dei minimi quadrati della media aritmetica. Perché queste due proprietà sono importanti? Esercizio 4 Un gruppo di persone ha una temperatura corporea media di 98.6 gradi Fahreneheit, con una deviazione standard di 0.3 °F. Sapendo che °C=(5/9)(°F-32°) calcolare media aritmetica, deviazione standard e varianza in gradi centigradi. 05/04/05 SOLUZIONE Esercizio 1 (soluzione parziale) n 4 7 3 14 f 0.29 0.50 0.21 1.00 n 3 4 5 2 14 f 0.21 0.29 0.36 0.14 1.00 F 0.21 0.50 0.86 1.00 Livello innovazione tecnologica Basso Medio Alto n 4 6 2 12 f 0.33 0.50 0.17 1.00 F 0.33 0.83 1.00 [missing] Totale complessivo 2 14 Settore Primario Secondario Terziario Indice: moda='Secondario' Numero di sedi 1 2 3 4 Indice: media aritmetica=2.4 Indice: mediana='Medio' Fatturato inf 0 500 1000 1500 2000 sup 500 1000 1500 2000 2500 n 2 6 3 1 2 f 0.143 0.429 0.214 0.071 0.143 N 2 8 11 12 14 F 0.143 0.571 0.786 0.857 1.000 prop(X<600) = 0.143 + (600-500)*0.857143/1000 = prop(X<1800) = 0.786 + (1800-1500)*0.142857/1000 = prop(X<1800)-prop(X<600) = Q1 = 500 + (0.25-0.143)*1000/0.857143 = Q3 = 1000 + (0.75-0.571)*1000/0.428571 = amp 500 500 500 500 500 dens*1000 0.285714 0.857143 0.428571 0.142857 0.285714 0.229 0.829 0.600 625.000 1416.667 05/04/05 Numero dipendenti campo variazione Q1 Q3 Q3-Q1 media var sd CV 109 39 68 29 61.571 1145.531 33.846 0.550 Esercizio 2 Rispondere ai seguenti quesiti, spiegando brevemente le ragioni della risposta: a) Quale media lascia invariato il prodotto dei valori della successione? Media geometrica. b) Che cos’è una media aritmetica ponderata? E’ una media in cui ad ogni valore viene associato un peso: n n i =1 i =1 ∑ xi pi / ∑ pi c) Se si aggiunge una costante a ognuno dei dati di una successione, come si modifica la media aritmetica? M(X+a)=a+M(X). d) Se si aggiunge una costante a ognuno dei dati di una successione, come si modifica la deviazione standard? σ(X+a)=σ(X). e) Se raddoppia ognuno dei dati di una successione, come si modifica la media aritmetica? M(2X)=2M(X). f) Se raddoppia ognuno dei dati di una successione, come si modifica la deviazione standard? σ(2X)=2σ(X) g) Se si cambia il segno a ognuno dei dati di una successione, come si modifica la media aritmetica? M(-1*X)= -1*M(X). h) Se si cambia il segno a ognuno dei dati di una successione, come si modifica la deviazione standard? σ(-1*X)=σ(X) i) Se la deviazione standard di un insieme di valori è zero, cosa significa? La variabile statistica è degenere (tutte le u.s. presentano la stessa modalità del carattere). j) Se la media quadratica di un insieme di valori è zero, cosa significa? La variabile è degenere in 0 (tutte le u.s. presentano la modalità 0). In questo caso, media aritmetica e media geometrica saranno anch’esse pari a zero? Sì. k) Se la media aritmetica di un insieme di valori è zero, quanto vale la varianza? V(X)=M(X2). l) Che cosa rappresenta la derivata prima della funzione di ripartizione dedotta dall’istogramma? La derivata prima rappresenta la pendenza dei segmenti di retta che uniscono due estremi di classe successivi. m) Quali sono le principali differenze tra un esperimento controllato e uno studio sul campo? In un esperimento le unità statistiche sono assegnate casualmente al trattamento, quindi eventuali differenze nella risposta tra gruppo trattato e gruppo di controllo sono da attribuirsi al trattamento. In uno studio sul campo, in generale, le unità statistiche non sono assegnate a caso al trattamento e altri fattori (detti di disturbo), oltre al trattamento possono influire sulla risposta. n) Quali sono i vantaggi e gli svantaggi della formulazione aperta e chiusa delle domande in un questionario postale? Le domande aperte sono utili nel caso in cui le modalità di risposta non siano note a priori, ma sono più ‘faticose’ per gli intervistati e più difficili da trattare in fase di analisi dei risultati. 05/04/05 Esercizio 3 Vedi libro di testo. Esercizio 4 Indichiamo con Y la temperatura espressa in °C e con X la temperatura in °F. Sappiamo che M(X)= 98.6 °F e σ(X)= 0.3 °F, V(X)=0.32=0.09. Applicando la trasformazione °C=(5/9)(°F-32°) da gradi Fahreneheit a gradi centigradi otteniamo: M(Y)= (5/9)(98.6 -32)=37, V(Y)= (5/9)2(0.09)=0.03, σ(Y)= (5/9)(0.3)=0.17. 05/04/05