Marilena Pillati - Elementi di Statistica e Informatica (SVIC) “Le rappresentazioni grafiche” Le rappresentazioni grafiche Descrivono diversi aspetti dell’informazione contenuta nei dati e si basano sulla rappresentazione di corrispondenze tra dati numerici e enti geometrici elementari (punti, segmenti, linee, figure, volumi, ecc.) o, alternativamente, tratteggi, colorazioni, ecc.. Le rappresentazioni grafiche Le distribuzioni di frequenza di variabili qualitative possono essere efficacemente rappresentate con segmenti o barre (orizzontali o verticali) proporzionali alla frequenza di ogni modalità (diagrammi a barre e diagrammi a nastri) 1 Marilena Pillati - Elementi di Statistica e Informatica (SVIC) “Le rappresentazioni grafiche” Diagramma a nastri Marrone Nero Azzurro Verde 0 20 20 40 Maschi Maschi 60 40 80 100 60 Femmine Femmine Diagramma a barre 2 Marilena Pillati - Elementi di Statistica e Informatica (SVIC) “Le rappresentazioni grafiche” Diagramma a barre Voti 18 19 20 21 22 23 24 25 26 27 28 29 30 Totale Studenti 3 5 7 5 10 6 10 6 11 6 5 10 4 88 12 10 8 6 4 2 0 18 19 20 21 22 23 24 25 26 27 28 29 30 3 Marilena Pillati - Elementi di Statistica e Informatica (SVIC) “Le rappresentazioni grafiche” Diagramma circolare (o a torta) { { Serve a raffigurare la composizione di un insieme di n unità statistiche in k classi. Un cerchio è ripartito in k settori circolari proporzionali alle frequenze relative delle classi. Diagramma a torta 21,6% 26,1% 22,7% 29,6% 4 Marilena Pillati - Elementi di Statistica e Informatica (SVIC) “Le rappresentazioni grafiche” Istogramma di frequenza Consente di rappresentare in coordinate cartesiane distribuzioni di frequenze assolute o relative per caratteri quantitativi 5 Marilena Pillati - Elementi di Statistica e Informatica (SVIC) “Le rappresentazioni grafiche” Esempio di istogramma (classi di uguale ampiezza) Classi di reddito annuo Frequenze 10.000-12.500 200 12.500-15.000 500 15.000-17.500 700 17.500-20.000 1200 20.000-22.500 1800 22.500-25.000 2600 25.000-27.500 3000 27.500-30.000 3100 30.000-32.500 2400 32.500-35.000 1900 35.000-37.500 1000 37.500-40.000 800 40.000-42.500 500 42.500-45.000 300 TOTALE 20000 Esempio di istogramma con classi di pari ampiezza frequenze 3000 2000 1000 reddito 10.000 20.000 30.000 40.000 50.000 6 Marilena Pillati - Elementi di Statistica e Informatica (SVIC) “Le rappresentazioni grafiche” Si supponga ora di raggruppare le prime 3 e le ultime 3 classi, che hanno ora, rispettivamente, frequenza 1400 e frequenza 1600. Come sarà il nuovo istogramma? Se continuiamo ad indicare le frequenze in ordinata, otteniamo quanto esposto nella diapositiva seguente. Istogramma sbagliato frequenze 3000 2000 1500 1000 reddito 10.000 20.000 30.000 40.000 50.000 7 Marilena Pillati - Elementi di Statistica e Informatica (SVIC) “Le rappresentazioni grafiche” Il nuovo istogramma ha un profilo ben diverso dal precedente: la classe iniziale e quella finale hanno frequenze dilatate, solo perché la loro ampiezza è tripla rispetto alle altre. Di questo occorre tenere conto. Come? Dividendo, per ogni classe, la frequenza per l’ampiezza della classe stessa. Si ottiene così, per ogni classe, la densità di frequenza, che nell’istogramma sarà riportata in ordinata. Accorpamento delle prime 3 e delle ultime 3 classi Classi di reddito annuo Frequenze ni Ampiezza Densità di classi frequenza di h i = n i /d i 10.000-17.500 1400 7.500 0,19 17.500-20.000 1200 2.500 0,48 20.000-22.500 1800 2.500 0,72 22.500-25.000 2600 2.500 1,04 25.000-27.500 3000 2.500 1,20 27.500-30.000 3100 2.500 1,24 30.000-32.500 2400 2.500 0,96 32.500-35.000 1900 2.500 0,76 35.000-37.500 1000 2.500 0,40 37.500-45.000 1600 7.500 0,21 20000 ------ ------ TOTALE 8 Marilena Pillati - Elementi di Statistica e Informatica (SVIC) “Le rappresentazioni grafiche” 1,20 1,00 0,80 densità di frequenza Istogramma corretto 0,60 0,40 0,20 reddito 10.000 20.000 30.000 40.000 50.000 Istogramma di frequenza Su ciascun intervallo, rappresentato in ascissa, si costruisce un rettangolo di altezza pari alla densità di frequenza della classe corrispondente, definita come il rapporto tra la frequenza e l’ampiezza della classe. In tal modo l’area di ogni rettangolo risulta proporzionale alla frequenza della classe rappresentata 9 Marilena Pillati - Elementi di Statistica e Informatica (SVIC) “Le rappresentazioni grafiche” Andamento del tasso di disoccupazione italiana dal settembre 1997 al luglio 2003 14,0% 12,0% 10,0% 11,7% 11,9% 11,6% 10,1% 9,3% 8,9% 8,3% 8,0% 6,0% 4,0% 2,0% set-97 dic-97 mar-98 giu-98 set-98 dic-98 mar-99 giu-99 set-99 dic-99 mar-00 giu-00 set-00 dic-00 mar-01 giu-01 set-01 dic-01 mar-02 giu-02 set-02 dic-02 mar-03 giu-03 0,0% Concentrazione di PM10 rilevato nelle province dell’Emilia Romagna dal 4 al 13 febbraio 2005 10 Marilena Pillati - Elementi di Statistica e Informatica (SVIC) “Le rappresentazioni grafiche” 11