Statistica Misure di tendenza centrale Misure di tendenza centrale Medie ferme Medie di posizione * Media aritmetica * Moda * Media geometrica * Mediana Ecc. 51 Medie ferme • Le medie ferme si calcolano usando tutti i valori a disposizione. • Rischio: è possibile che valori molto alti o molto bassi con poca frequenza possano falsare il valore centrale, o meglio quello rappresentativo dei dati. 52 Docente: Ivan Zivko 1 Statistica Medie Ferme: media aritmetica • È la somma di tutti i valori diviso il loro numero totale. • Media aritmetica: x f x f .... xn f n x 1 1 2 2 N n x f i i i 1 N 53 Medie Ferme: media aritmetica • Esempio 1: considera le note di 5 studenti: – 3, 4, 5.5, 6, 4.5. 3 4 5.5 6 4.5 23 x 4.6 5 5 54 Docente: Ivan Zivko 2 Statistica Medie Ferme: media aritmetica • Osservazione: la media aritmetica si può calcolare disponendo anche solo delle frequenze relative. x1 f1 .... xn f n f f x1 1 ...xn n N N N x1 f rel .1 ... xn f rel .n x 55 Medie Ferme: media aritmetica • Esempio 2: se i dati sono molti e dobbiamo suddividerli in una tabella bisognerà usare le frequenze. NOTE N. Studenti (Freq. Freq. relativa Assoluta) 3 4 0.17 4 6 0.25 4.5 8 0.33 5 3 0.125 5.5 2 0.083 6 1 0.042 TOTALE 24 1 56 Docente: Ivan Zivko 3 Statistica Medie Ferme: media aritmetica • Esempio 2: per calcolare la media aritmetica si possono usare sia le frequenze assolute che quelle relative. 3 4 4 6 4.5 8 5 3 5.5 2 6 1 104 x 4.33 24 24 x 0.17 3 0.25 4 0.33 4.5 0.125 5 0.083 5.5 0.042 6 4.33 57 Medie Ferme: media aritmetica • Se i dati sono suddivisi in classi per calcolare la media aritmetica bisogna prendere i valori centrali delle classi. • Esempio 3: salario dei dipendenti. Classi di stipendio (in migliaia di CHF) Numero dipendenti (Freq. Assoluta) Centro classi [50, 60[ 10 55 [60, 70[ 20 65 [70, 80[ 15 75 TOTALE 45 x Docente: Ivan Zivko 55 10 65 20 75 15 2975 66.11 45 45 58 4 Statistica Medie Ferme: media aritmetica • È chiaro che suddividendo i dati in classi perdiamo delle informazioni, e quindi commetteremo un piccolo errore. • L’errore dovuto all’uso delle classi sarà: a err. 2x a 59 Medie Ferme: media aritmetica • La media aritmetica ha in genere una buona stabilità, che cresce con l'aumentare dei dati. • Quando nei dati ci sono valori estremi particolarmente „pesanti“ la media aritmetica può essere molto influenzata da essi anche se in realtà non hanno una grande frequenza. 60 Docente: Ivan Zivko 5 Statistica Medie Ferme: media geometrica • La media geometrica viene usata per dati che variano in progressione temporale, per esempio per gli indici. • Media geometrica: f1 f2 x x1 x2 .... xnf n N 61 Medie Ferme: media geometrica • Esempio: È dato un bene di valore C. Questo bene nel primo anno aumenta il valore dell’ 8%, nel secondo del 12%, nel terzo del 9% e nel quarto del 5%. Si vuole trovare l’aumento percentuale medio. Da ciò si possono trovare i moltiplicatori: M 1 C (1 0.08) M 2 M 1 (1 0.12) C (1 0.08) (1 0.12) ecc. 62 Docente: Ivan Zivko 6 Statistica Medie Ferme: media geometrica • Quindi alla fine dei quattro anni l’aumento si calcolerà come segue: C (1 0.08) (1 0.12) (1 0.09) (1 0.05) C 1.08 1.12 1.09 1.05 C 1.3843872 • Il moltiplicatore medio sarà: 4 1.3843872 1.0847 Che equivale a un aumento percentuale annuo del 0.0847 8.47% 63 Medie Ferme: media geometrica • Se avessimo fatto la media aritmetica avremmo ottenuto un aumento dell’8.5%. • Se per ogni anno usiamo questo aumento non otteniamo il risultato esatto. 64 Docente: Ivan Zivko 7 Statistica Medie di posizione • Come detto quando ci sono valori estremi troppo grandi la media aritmetica non va più bene. • Non possiamo semplicemente non tenere conto di questi valori, perchè non seguiremmo i principi fondamentali della statistica. • A differenza delle medie ferme con le medie di posizione possiamo anche cercare il valore medio di variabili qualitative. 65 Medie di posizione: Moda • La moda è quella media che viene associata alla modalità con frequenza più alta. • Essa è tanto più esatta quanto più la sua frequenza è elevata rispetto alle altre (se è maggiore del 50% è molto buona). • Se le frequenze sono simili la moda perde la sua efficacia. Se ci sono due modalità con frequenza uguale si dice che la classe è bimodale. 66 Docente: Ivan Zivko 8 Statistica Medie di posizione: Moda • Esempio 1: colore dei capelli di un gruppo. Colore capelli Frequenza assoluta Castani 70 Biondi 30 Rossi 30 Altro 10 Moda Castani 67 Medie di posizione: Moda • Il calcolo diventa un po’ più complicato se abbiamo dei dati suddivisi in classi. • Prima di tutto bisogna determinare la classe modale, che è semplicemente la classe con frequenza più elevata. • Per trovare il valore modale si userà la formula poi: 1 Moda Linf . a 1 2 68 Docente: Ivan Zivko 9 Statistica Medie di posizione: Moda Linf . Limite inferiore della classe modale 1 (Freq. assoluta classe modale) (Freq. ass. classe precedente) 2 (Freq. assoluta classe modale) (Freq. ass. classe successiva) a ampiezza delle classi 69 Medie di posizione: Moda • Esempio 2: altezze di un gruppo. Classi (Altezza) Freq. assoluta [158, 162[ 4 [162, 166[ 7 [166, 170[ 13 [170, 174[ 18 [174, 178[ 8 Totale 50 70 Docente: Ivan Zivko 10 Statistica Medie di posizione: Moda • La classe modale è la classe [170, 174[. Usando la formula: (18 13) 5 4 170 4 (18 13) (18 8) 5 10 5 170 4 170 1.333 171.333 15 Moda 170 71 Medie di posizione: Mediana • Si definisce mediana di un insieme di elementi, disposti in ordine crescente o decrescente, il valore che occupa la posizione centrale. • Esempio 1: se il numero di elementi è dispari. 8, 12, 7, 4, 9, 10, 55 Bisogna prima metterli in ordine crescente. 4, 7, 8, 9, 10, 12, 55 Mediana 9 Docente: Ivan Zivko 72 11 Statistica Medie di posizione: Mediana • Esempio 2: se il numero di elementi è pari. 36, 72, 82, 84, 98, 105 I due valori centrali sono 82 e 84, perciò: Mediana 82 84 83 2 73 Medie di posizione: Mediana • Se i dati sono molti, e quindi vengono rappresentati in una tabella per determinare la mediana si guardano le frequenze cumulate. • La mediana è quella modalità in cui la frequenza cumulata supera il 50%. 74 Docente: Ivan Zivko 12 Statistica Medie di posizione: Mediana • Esempio 3: numero di interrogazioni per studente. Numero interrogazioni Freq. assoluta Freq. cumulata 0 3 3 1 6 9 2 4 13 3 2 15 Totale 75 Medie di posizione: Mediana • Esempio 3: in questo caso la frequenza cumulata viene superata nella seconda modalità, quindi: Mediana 1 76 Docente: Ivan Zivko 13 Statistica Medie di posizione: Mediana • Se i dati sono suddivisi in classi bisogna prima di tutto determinare la classe mediana, che è la classe in cui la frequenza cumulata supera il 50%. • Poi per trovare il valore mediano si userà la formula: N f cumulata classe precedente Mediana Linf . 2 f classe mediana a 77 Medie di posizione: Mediana • Esempio 3: prendiamo l’esempio delle altezze. Classi (Altezza) Freq. assoluta Freq. cumulata [158, 162[ 4 4 [162, 166[ 7 11 [166, 170[ 14 25 [170, 174[ 17 42 [174, 178[ 8 50 Totale 50 78 Docente: Ivan Zivko 14 Statistica Medie di posizione: Mediana • La classe mediana è la classe [170, 174[. Usando la formula: 50 11 25 11 Mediana 166 2 4 166 4 14 14 14 166 4 170 14 79 Docente: Ivan Zivko 15