STATISTICA STATISTICA… IMBROGLIONA Luce Clara I S I S “A I.S.I.S A.Tilgher Tilgher” Ercolano NA Destinatari: Alunni della 3 classe della SS1G e alunni del Biennio della SS”G Gli alunni devono conoscere e saper calcolare la media aritmetica semplice e ponderata. In appendice breve appunto sulla media Luce Clara INDICE LA STATISTICA PUÒ INGANNARE? TRILUSSA DICEVA “ SI!” DIAP 5 NOTIZIE DAI GIORNALI: SARANNO VERE? DIAP 12 STRUMENTI CONTROL ’INGANNO: INDICI DI VARIABILITÀ À DIAP 16 UN POLITICO INFURIATO… DIAP 25 DIAP 27 QUALCHE NOZIONE SULLA MEDIA ARITMETICA Luce Clara Che cos cos’è è la statistica Nata N t per d descrivere i lle caratteristiche tt i ti h demografiche, economiche, … degli stati, è l'insieme delle tecniche utilizzate per raccogliere, elaborare e interpretare i dati cche da e riguardano gua da o co collettività, e à, a al fine ed di studiare un fenomeno e poterne prevedere gli sviluppi. sviluppi Luce Clara • PROBLEMA MOLTO IMPORTANTE: LA MEDIA RAPPRESENTA IL FENOMENO CHE STIAMO STUDIANDO? O la statistica ci p può imbrogliare? g Luce Clara STATISTICA! Luce Clara Sofia mangia g DUE POLLI Anna è digiuna Luce Clara STATISTICAMENTE ... HANNO MANGIATO UN POLLO CIASCUNA! LO DICE LA MEDIA ARITMETICA! …e, se nun entra nelle spese tue, t'entra ne la statistica lo stesso perch'è c'è un antro che ne magna due. Trilussa Luce Clara LA STATISTICA Sai che d'è la statistica? È na' cosa che serve pe fa un conto in generale de la gente che nasce, che sta male, che more,, che va in carcere e che spósa. p Ma pè me la statistica curiosa è dove c'entra la percentuale, pè via che, lì, la media è sempre eguale puro co' la persona bisognosa. Me spiego: da li conti che se fanno seconno le statistiche d d'adesso adesso risurta che te tocca un pollo all'anno: e, se nun entra nelle spese tue, tt'entra entra ne la statistica lo stesso perch'è c'è un antro che ne magna due. Trilussa • Luce Clara REGIONE A PERSONA REGIONE B REDDITO PERSONA REDDITO A 1020 A 520 B 1200 B 650 C 1400 C 550 D 1080 D 780 E 1100 E 1600 F 1300 F 750 G 1250 G 1950 H 1150 H 1700 I 1250 I 1750 L 1350 L 1850 Luce Clara TOTALE 12100 TOTALE 12100 Consideriamo il reddito di 10 persone che abitano in due regioni Calcolate le due medie.. Cosa possiamo osservare? LA MEDIA ARITMETICA DELLE 10 PERSONE è UGUALE ED è PARI A 1210 EURO PROCAPITE VUOL DIRE CHE IN MEDIA OGNI PERSONA GUADAGNA PIU’ O MENO 1200 EURO È FALSO,, CE NE ACCORGIAMO GUARDANDOLE LE 2 TABELLE! IN PARTICOLARE LA REGIONE B PRESENTA REDDITI MOLTO BASSI Luce Clara Leggiamo questa notizia: Da un ‘i D ‘indagine d i statistica t ti ti il reddito ddit medio della regione x e risultato essere di 1150 euro procapite SICURAMENTE DA UN PUNTO DI VISTA MATEMATICO E E’ ESATTO IL CALCOLO DELLA MEDIA E GIUSTO MA…… Non avendo i dati di tutti i redditi non possiamo dire se questo dato rappresenta la realtà, o indica una situazione simile a quella vista nella tabella della regione b: redditi molto bassi e redditi molto alti Luce Clara la media è importante per la descrizione sintetica di un fenomeno statistico Ha però H ò il lilimite it di non d darcii alcuna l informazione sulla distribuzione dei dati Luce Clara NOTIZIA NON CHIARA PER UNO STATISTICO Primo rialzo da giugno 2013 per il tasso di occupazione in Italia. Si è attestato al 55,6%, aumentando dello 0,2% rispetto ai dodici mesi prima prima. * L’AUMENTO DELLO 0,2% È LO STESSO IN TUTTE LE REGIONI? È UGUALE AL SUD, AL CENTRO, AL NORD? E SE L’AUMENTO FOSSE DELLO 05% AL NORD, DELLO 0,3% AL CENTRO E CI FOSSE STATA UNA DIMINUZIONE DELLO 0,2% AL SUD (-2%)? LA MEDIA NON REGISTREREBBE UN AUMENTO MEDIO DELLO 0,2%, 0 2% CHE NON RAPPRESENTA LA REALTA REALTA’? ? *http://www.milanofinanza.it http://www milanofinanza it Luce Clara NOTIZIA CHIARA PER UNO STATISTICO Primo rialzo da giugno 2013 per il tasso di occupazione in Italia. Si è attestato al 55,6%, aumentando dello 0,2% % rispetto ai dodici mesi prima. I DATI SULL’AUMENTO PERCENTUALE SONO RIPORTATI NELLA TABELLA SEGUENTE REGIONI AUMENTO /DIMINUZIONE PERCENTUALE DISOCCUPAZIONE REGIONI DEL NORD REGIONI DEL NORD +0 5% +0,5% REGIONI DEL CENTRO REGIONI DEL CENTRO +0,3% REGIONI DEL SUD E ISOLE ‐0,2% Luce Clara Ma i matematici hanno uno strumento… strumento che permette di capire la verità? U strumento Uno t t matematico…… t ti Quale? GLI INDICI DI Variabilita Variabilita’ Luce Clara Esempio In tre differenti prove di matematica 4 studenti hanno riportato le seguenti valutazioni 1° studente 2° studente t d t 3° studente 4° studente media 1a Prova 3 5 8 9 6,25 2a Prova 5 7 6 7 6,25 3a Prova 6 7 6 6 6,25 In tutte e tre le prove la media è 6,25 ma i dati sono chiaramente distribuiti in modo diverso Luce Clara vo oto dispersione 9,5 9 5 9 8,5 8 7,5 7 6,5 6 5,5 5 45 4,5 4 3,5 3 2,5 2 1,5 1 0,5 0 1 studente 2 studente 3 studente 4 studente 0 1 2 numero prova Luce Clara 3 4 1° studente 2° studente 3° studente 4° studente media 1a Prova 3 5 8 9 6 25 6,25 2a Prova 5 7 6 7 6 25 6,25 3a Prova 6 7 6 6 6 25 6,25 • nel caso della 1a prova e 2a prova sarà opportuno oppo tu o fare aeu un recupero ecupe o pe per a alcuni cu studenti • nel caso della 3a prova l’insegnante può ritenere it che h glili obiettivi bi tti i siano i stati t ti raggiunti i ti dalla classe, anche se ad un livello solo sufficiente Luce Clara In statistica è possibile valutare in modo sintetico l distribuzione la di t ib i dei d i dati d ti mediante di t gli li indici i di i di variabilità (o dispersione) Vedremo i seguenti indici • Campo di variazione •Varianza e scarto quadratico medio •Scarto quadratico medio relativo Luce Clara Campo di variazione E’ il più semplice degli indici di variazione: Si calcola facendo la differenza tra il dato più grande e il dato più piccolo Campo variazione = x max – x min Rappresenta app ese ta l’ampiezza a p e a dell’intervallo de te va o dei de dati dat Luce Clara Esempio Consideriamo le valutazioni della pprima pprova 1° studente 2° studente 3° studente 4° studente t d t media 1a Prova 3 5 8 9 6,25 Xmax = 9; X i =3 Xmin Luce Clara R Range =9–3=6 Calcoliamo il Range per tutte le tre prove 1a Prova 1° studente 2° studente 3° studente 4° studente media range Range g 1a pprova = 6 ⇒ Range 3a prova = 1 ⇒ 2a Prova 3a Prova 3 5 8 9 2 7 8 8 6 7 6 6 6,25 6 6,25 6 6,25 1 dati ppiù dispersi, p , risultati più eterogenei dati più concentrati, risultati più omogenei Range 2a prova = Range 1a prova = 6 Stessa Distribuzione? Luce Clara Osservazioni: 1.. Il ccampo po di d variazione v o e dà d informazioni o o sulla su distribuzione dei dati: • più R è piccolo più i dati sono concentrati; • più R è grande più i dati sono dispersi. 2. R è espresso nella stessa unità di misura dei dati 3. Tuttavia R tiene conto solo dei dati estremi della distribuzione e non di tutti i dati, pertanto distribuzioni diverse ma con gli stessi valori estremi hanno range uguali Es. Range 1aprova = Range 2a prova. ma distribuzione 1a prova ≠ Distribuzione 2a prova Luce Clara Varianza e Scarto quadratico medio Sono gli indici di variabilità più utilizzati utilizzati, e tengono conto della distribuzione di tutti i dati. Varianza Rappresenta la media aritmetica dei quadrati q adrati delle distanze dei dati dalla media M V i Varianza =σ Luce Clara 2 ( x = 1 ) ( 2 ) 2 ( − x + x 2 − x + ..... + x n − x n ) 2 Esempio - Varianza Consideriamo le valutazioni della pprima pprova 1° studente 2° studente 2 3° studente 4° studente media 1a Prova 3 5 8 9 6,25 (Δx1)2 = (3 – 6,25 )2 = 10,5625; (Δx2)2 = (5 – 6,25 )2 = 1,5625; (Δx3)2 = (8 – 6,25 )2 = 3,0625; (Δx4)2 = (9 – 6,25 )2 = 7,5625; σ2 = 10,5625+1,5625+3,0625+7,5625 = 5,6875 4 Luce Clara Calcoliamo la Varianza per tutte le tre prove 1a Prova 1 studente 1° 2° studente 3° studente 4° st studente dente media varianza 2a Prova 3a Prova 3 5 8 9 2 7 8 8 6 7 6 6 6,25 5,69 6,25 6,19 6,25 0,19 Varianza 1approva = 5,69 ⇒ Varianza 3a prova = 0,19 ⇒ dati ppiù dispersi, p risultati più eterogenei dati più concentrati, risultati i l i più iù omogeneii Varianza 2a pr. ≠ Varianza 3 pr “Le Distribuzioni Differiscono” Luce Clara Scarto quadratico medio o Deviazione standard È uguale alla radice quadrata della varianza (x − x ) + (x 2 Scarto quadr. quadr medio = σ = 1 Scarto quadr medio = Luce Clara 2 ∑ (x − x ) n ) − x + ..... + xn − x n n 2 i 1 n ( 2 = 2 ( ) Δ x ∑ i 1 n ) 2 Esempio - Scarto quadratico medio Riprendiamo p le valutazioni della prima p prova p 1a Prova 1° studente 2° studente 2 3° studente 4° studente media di n σ= Luce Clara ∑ (Δx ) i 1 n 3 5 8 9 scarti da M -3,25 -1 1,25 25 1,75 2,75 62 6,25 0 00 0,00 scarti2 10,5625 1 5625 1,5625 3,0625 7,5625 5,6875 68 2 = σ 2 = 5,6875 ≈ 2,3848 Calcoliamo lo Scarto quadratico medio per tutte le prove 1a Prova 1 studente 1° 2° studente 3° studente 4° studente 4 media scarto t quadratico d ti 2a Prova 3 5 8 9 2 7 8 8 6 7 6 6 6,25 2 38 2,38 6,25 2 49 2,49 6,25 0 43 0,43 Scarto q. 1aprova = 2,38 ⇒ Scarto qq. 3approva = 0,43 ⇒ Scarto q. 1a pr. ≠ Scarto q. 1a pr Luce Clara 3a Prova dati più dispersi, risultati più eterogenei dati ppiù concentrati, risultati più omogenei “Le Distribuzioni Differiscono” Osservazioni: 1. La varianza σ2 e lo scarto quadratico medio σ danno informazioni sulla distribuzione dei dati: • più σ2 e σ sono piccoli più i dati sono concentrati; • più σ2 e σ sono grandi più i dati sono dispersi. 2. Entrambi gli indici tengono conto di tutti i dati della distribuzione Luce Clara 4. La varianza è espressa p mediante il qquadrato dell’unità di misura dei dati 5. Lo scarto quadratico nella stessa unità di misura dei dati e ppertanto viene ppreferito alla varianza Luce Clara SCARTO QUADRATICO MEDIO RELATIVO Questo indice ha il vantaggio di essere compreso tra 0 ed 1 Più σREL SI AVVICINA A ZERO dati più concentrati, risultati più omogenei Più σREL SI AVVICINA AD UNO dati più dispersi, Luce Clara risultati i l i più iù eterogeneii 1 PROVA 3 PROVA 1 STUD. 1 STUD 2 STUD. 3 STUD. 4 STUD. 3 5 8 9 6 7 6 6 MEDIA σ σREL 6,25 6 25 2,38 0,61 6,25 6 25 0,43 0,11 CALCOLIAMO σREL ricordando che σx =scarto q quadratico medio μx= media aritmetica n=numero dei dati σREL (1 prova)=2,38/(6,25· √4-1)= √ 2,38/( 6,25·1,732)= 2,38/3,897=0,61 Luce Clara L disoccupazione La di i è aumentata t t in i media di dello d ll 0,2 0 2 %, % È un buon risultato dateci fiducia, nel prossimo quinquennio se ci rieleggerete aumenterà t à ancora Ci può’ dire la fonte dei dati e un indice di variazione? Magari lo scarto quadratico relativo l ti Luce Clara E adesso cosa dico? Uno scarto Quadraticomedio relativo pari a 0,9? Non credevo che nelle scuole insegnassero Statististica ! Luce Clara QUALCHE APPUNTO SULLA MEDIA ARITMETICA Luce Clara • • • • • • • • Luce Clara INDICI DI DIMENSIONE Gli indici di dimensione danno l’espressione l espressione sintetica di un fenomeno quando i è rappresentato da un certo numero di osservazioni quantitative. In altre parole essi permettono di sostituire un unico significativo valore ad una serie di dati statistici. Secondo Cauchy la media di un insieme di valori è un valore compreso tra il minimo e il massimo. In statistica si distinguono di solito due tipi di medie. medie di calcolo: sono quelle che si calcolano tenendo conto di tutti i valori della distribuzione; 1)M di aritmetica 1)Media it ti 2) Media geometrica 3) Media armonica 4)) Media quadratica medie di posizione; sono quelle che si calcolano tenendo conto solo di alcuni valori della distribuzione Mediana 2) Moda • La media aritmetica Si definisce media aritmetica di più numeri quel valore che, sostituito ai dati, lascia invariata la loro somma IIndicando di d id dati ti con lle x la l d definizione fi i i di media aritmetica semplice che si ricava è x1 + x2 ..... + xn M= n Esempio: 7, 8, 12, 15, 18 Ma = 60 / 5 = 12 Luce Clara Nel caso di una distribuzione di frequenze ad esempio Esempio: determinare l’età media di 50 giovani presenti in una pizzeria un sabato sera; indichiamo con xi l’età e con yi y il numero di giovani per ogni classe di età. x1y1 + x2 y2 +.....+ xn yn M= N Luce Clara 14*4 + 15*6 + 16*12 + 17*18 + 18*10 824 M = ————————————————— = —— = 16,48 50 50 Luce Clara