Media – Varianza – Deviazione Standard x̄ media n 1 X · xi n i=1 m 1 X · fi xi n i=1 s2 varianza n 1 X · (xi − x̄)2 n i=1 m 1 X · fi · (xi − x̄)2 n i=1 s dev. standard v u n u1 X t · (xi − x̄)2 n i=1 v u m u1 X t · fi · (xi − x̄)2 n i=1 s2 n X 1 · (xi − x̄)2 n − 1 i=1 m X 1 · fi · (xi − x̄)2 n − 1 i=1 v u u t v u u t campionaria s2 campionaria n X 1 · (xi − x̄)2 n − 1 i=1 m X 1 · fi · (xi − x̄)2 n − 1 i=1 Matematica con Elementi di Statistica, Anna Torre – a.a. 2013-2014 Varianza – Deviazione Standard Le espressioni della varianza (e della deviazione standard) possono essere riscritte come segue: 1 2 s = · n X n i=1 2 x2 i − n x̄ o 1 2 s = · n X m i=1 2 fi x2 i − n x̄ Infatti, n X i=1 (xi − x̄)2 = = n X 2) = (x2 − 2x x̄ + x̄ i i i=1 2 x2 i − 2x̄(n x̄) + n x̄ = i=1 n X n X i=1 x2 i − 2x̄ n X i=1 n X xi + i=1 2 x2 i − n x̄ Matematica con Elementi di Statistica, Anna Torre – a.a. 2013-2014 n X i=1 x̄2 = Esercizi Esercizio 1. Nel rilevare l’altezza in cm di un gruppo di reclute si è ottenuta la seguente tabella delle frequenze. Calcolare media, mediana e quartili. Soluzione: cm fass 166 1 168 3 169 6 170 11 171 8 172 6 173 4 174 3 175 1 178 1 fcum 1 4 10 21 29 35 39 42 43 44 n = 44 dimensione del campione x̄ ≃ 170.9 media x22 + x23 Me = = 171 mediana 2 x11 + x12 q1 = = 170 primo quartile 2 x33 + x34 = 172 terzo quartile q3 = 2 q3 − q1 = 2 distanza interquartile La distanza interquartile è un altro indice di dispersione, legato alla nozione di mediana. La mediana suddivide l’insieme dei dati ordinati {xi} in due parti ugualmente numerose. I quartili si ottengono suddividendo i dati ordinati in quattro parti ugualmente numerose. Matematica con Elementi di Statistica, Anna Torre – a.a. 2013-2014 Esercizi Esercizio 2. Trovare media, mediana, moda, varianza e deviazione standard dei seguenti dati non ordinati e non raggruppati. Tracciare l’istogramma delle frequenze. 7 4 10 9 15 12 7 8 11 4 14 10 5 14 1 10 8 12 6 5 Matematica con Elementi di Statistica, Anna Torre – a.a. 2013-2014 Esercizi Soluzione: si costruisce la tabella della distribuzione di frequenza x fass x̄ = 2 s 1 1 4 2 5 2 6 1 7 2 8 2 9 1 10 3 11 1 12 2 14 2 15 1 20 1 (1 + 8 + 10 + 6 + 14 + 16 + 9 + 30 + 11 + 24 + 28 + 15) = 8.6 20 1 (57.76 + 42.32 + 25.92 + 6.76 + 5.12 + 0.72 + 0.16 + 5.88+ = 20 +5.76 + 23.12 + 58.33 + 40.96) ≃ 13.64 s ≃ 3.69 moda = 10.0 mediana = 8.5 Matematica con Elementi di Statistica, Anna Torre – a.a. 2013-2014 Esercizio Un’indagine su un campione di n = 100 studenti, che hanno sostenuto la prova scritta di matematica, ha prodotto il seguente risultato. Le votazioni in centesimi sono state raggruppate in quattro classi. classe 20 − 40 40 − 60 60 − 80 80 − 100 fi 10 20 50 20 100 fi/n 0.10 0.20 0.50 0.20 1.00 Le classi sono di uguale ampiezza e contigue. Matematica con Elementi di Statistica, Anna Torre – a.a. 2013-2014 Esercizio Nell’ipotesi di distribuzione uniforme, è naturale associare a ciascuna classe, come rappresentante, il valore centrale ri della classe stessa. classe 20 − 40 40 − 60 60 − 80 80 − 100 media = ri 30 50 70 90 fi 10 20 50 20 Fi 10 30 80 100 1 · (10 · 30 + 20 · 50 + 50 · 70 + 20 · 90) = 66 100 mediana = 70 (guardando solo i rappresentanti) varianza = 1 · (10 · 362 + 20 · 162 + 50 · 42 + 20 · 242) = 21.44 100 Matematica con Elementi di Statistica, Anna Torre – a.a. 2013-2014 Esercizio 100 50 80 40 60 30 40 20 20 10 20 40 60 80 Poligono delle frequenze 100 20 40 60 80 Ogiva di frequenza Matematica con Elementi di Statistica, Anna Torre – a.a. 2013-2014 100 Esercizio Calcolo della mediana: 50 40 30 20 10 20 40 60 68 80 100 area totale = 20 · (10 + 20 + 50 + 20) = 2000 Cerchiamo il valore x = Me tale che 20 · 10 + 20 · 20 + (x − 60) · 50 = 1000 ⇒ x = 68 ⇒ Me = 68 Matematica con Elementi di Statistica, Anna Torre – a.a. 2013-2014 Esercizio 100 80 60 50 40 20 20 40 60 68 80 100 Calcolo della mediana: interpolazione lineare sui punti A = (60, 30) e B = (80, 80) y = 50 5 ⇒ (50 − 30) = · (x − 60) ⇒ x = 68 ⇒ Me = 68 5 y − 30 = · (x − 60) 2 2 Domande: (a) qual è il voto massimo preso dal 10% degli studenti con i voti peggiori? [40] (b) Calcolare i quartili dall’ogiva di frequenza. [q1 = 55 , q2 = 78] Matematica con Elementi di Statistica, Anna Torre – a.a. 2013-2014 Esercizio 100 100 80 80 60 60 50 40 40 20 25 20 20 40 60 68 80 100 100 100 80 80 75 60 60 40 40 20 20 20 40 55 60 20 40 60 80 100 10 20 40 60 80 100 78 Matematica con Elementi di Statistica, Anna Torre – a.a. 2013-2014 100 Distribuzione Normale • istogramma delle frequenze di un insieme di misure relative a una grandezza che può variare con continuità • popolazione molto numerosa, costituita da una quantità praticamente illimitata di individui (popolazione infinita) • area dell’istogramma uguale a 1 (normalizzata) • aumentando il numero di intervallini n = 5, 9, 17, . . . l’istogramma tende a stabilizzarsi intorno a una forma limite: la curva di distribuzione delle frequenze 2 • nel caso in figura: y = Ae−B(x−C) distribuzione normale o gaussiana Matematica con Elementi di Statistica, Anna Torre – a.a. 2013-2014 Distribuzione Normale CURVE GAUSSIANE y = Ae−B(x−C) 2 Se la distribuzione è di tipo gaussiano con • media aritmetica µ • deviazione standard σ si ha 1 1 √ B = C = µ 2 2σ σ 2π La corrispondente curva normale sarà A = y = 1 √ σ 2π (x − µ)2 − 2σ 2 e Curva normale standardizzata: 0 2 1 − x2 e y = √ 2π µ = 0,σ = 1 Matematica con Elementi di Statistica, Anna Torre – a.a. 2013-2014