La divulgazione della statistica Master in comunicazione e divulgazione scientifica Candidato: Romolo Salini Relatore: prof. Giuseppe Manuppella www.apav.it SITO SCIENZE, MATEMATICA E SOCIETA' Statistica La statistica Sai ched’è la Statistica? E’ na cosa Che serve pè fa un conto in generale Della gente che nasce, che sta male Che more, che va in carcere che sposa. Ma pè me la statistica curiosa è dove c’entra la percentuale Pe’ via che lì, la media è sempre uguale Puro la persona bisognosa. Me spiego:da li conti che se fanno Dicono le statistiche d’adesso Risulta che te tocca un pollo all’anno E, se non entra ne le spese tue, t’entra nella statistica lo stesso perché c’è un antro che se ne magna due. IL METODO STATISTICO Fenomeno collettivo F Universo statistico o popolazione statistica Misure del carattere M Indici caratteristici Tale procedimento viene chiamato STATISTICA DESCRITTIVA Estrazione del campione a o Statistica descrittiva ä Sottoinsieme di F ö Statistica descrittiva F a campionamento ä C o M I inferenza M’ Statistica inferenziale ö I’ Indici caratteristici campionari popolazione descritta da campionamento o pianificazione campione parametri inferenza funzioni campionarie statistiche STATISTICA DESCRITTIVA - programmazione della ricerca - misura dei caratteri e raccolta dei dati - spoglio ed elaborazione dei dati - presentazione dei risultati 1. Programmazione della ricerca - scelta del campione numero e tipo di caratteri metodo per raccogliere ed immagazzinare dati elaborazione dati risultati che si vorrebbero ottenere 2. Misure dei caratteri - caratteri qualitativi e quantitativi frequenze simbolismo errori di misura Manifestazioni del fenomeno I modalità Popolazione statistica qualitative quantitative serie statistiche Mutabile (carattere) seriazioni statistiche continue discrete variabile Frequenza assoluta: è il numero delle volte con cui una modalità di un carattere si presenta nel nostro insieme di misure Frequenza relativa: Frequenza %: è il rapporto tra la frequenza assoluta e il numero totale delle frequenze assolute, cioè il numero totale delle misure effettuate frequenza relativa % Frequenza cumulata: si ottiene sommando alla frequenza assoluta le frequenze delle modalità che la precedono Raccolta dei dati - fonti dei dati - registrazione dei dati - codifica dei dati Spoglio dei dati - ordinare ed aggregare le informazioni normalmente o elettronicamente Rappresentazione dei dati Modi di rappresentazione dei dati 1. Rappresentazione ALGEBRICA 2. Rappresentazione TABELLARE 3. Rappresentazione GRAFICA 4. Rappresentazione SINTETICA 5. Rappresentazione ANALITICA Rappresentazioni grafiche •diagramma cartesiano •box-plot •diagramma areale •piramide delle età •diagramma a torta •diagramma stem-and-leaf •istogramma •cartogramma •ortogramma •ideogramma Rappresentazioni grafiche: istogramma Istogramma delle altezze 9 8 frequenze assolute Classe Frequenza <160 2 161-165 4 166-170 5 171-175 8 176-180 6 181-185 4 186-190 3 191-195 2 >195 1 7 6 5 4 3 2 1 0 <160 161-165 166-170 171-175 176-180 181-185 186-190 191-195 >195 classi Asse orizzontale Asse verticale Misure della variabile casuale numero assoluto, oppure la frequenza relativa o quella percentuale, con cui compaiono i valori di ogni classe Rappresentazioni grafiche: I poligoni - costruzione •I poligoni sono figure utilizzate solitamente per la rappresentazione di frequenze relative o percentuali di una dato fenomeno osservato. 9 8 7 •L’area sottesa dal poligono è sempre pari ad 1 (100%). 6 5 Poligono 4 3 100% 2 1 0 •Asse x: fenomeno suddiviso in classi 60-70 71-80 81-90 91-100 101-110 111-120 121-130 131-140 141-150 151-160 161-170 >171 • Asse y: frequenza relativa o percentuale di ciascuna classe. 9 8 7 6 5 Istogramma Linea spezzata 4 3 2 1 0 60-70 71-80 81-90 91-100 101-110 111-120 121-130 131-140 141-150 151-160 161-170 >171 •I poligoni possono essere costruiti anche a partire dagli istogrammi… Rappresentazioni grafiche: I poligoni - costruzione 9 8 7 6 5 Istogramma Linea spezzata 4 3 2 1 0 60-70 71-80 81-90 91-100 101110 111120 121130 131140 141150 151160 161170 >171 Rappresentazioni grafiche: I poligoni 9 8 7 6 5 Poligono 4 3 2 1 0 60-70 71-80 81-90 91-100 101110 111120 121130 131140 141150 151160 161170 >171 Rappresentazioni grafiche: Ortogramma H 20000 G 20000 F 50000 E 18000 D 10000 C 15000 B 25000 A 5000 0 10000 20000 30000 40000 50000 60000 Rappresentazioni grafiche: Diagramma areale 3% 12% 15% Le frequenze o le quantità di una variabile qualitativa sono rappresentate da superfici di figure piane, come quadrati, rettangoli o, più frequentemente, cerchi oppure loro parti. 12% 9% 6% 11% 32% A B C D E F G H Rappresentazioni grafiche: Diagramma a torta Vantaggi: fare capire con immediatezza che la somma di tutte le classi è uguale ad 1 (o 100%) Svantaggi: non evidenziano bene le differenze non troppo marcate Torta tridimensionale 3% 12% 15% 12% 9% 6% 11% 32% A B C D E F G H Rappresentazioni grafiche: Ideogramma o pittogramma I diagrammi a figure, detti anche diagrammi simbolici o pittogrammi, sono costituite da figure o oggetti simbolici, ciascuna figura rappresenta un carattere qualitativo; inoltre l’altezza delle figure deve essere proporzionale alle frequenze quando le basi sono uguali A B C Pittogramma della produzione mensile di auto di 3 case automobilistiche: la prima ha prodotto 100 mila auto, la seconda 180 mila e la terza 320 mila Rappresentazioni grafiche: Cartogramma Mappe geografiche Suddivisione dei dati in classi Creazione di una scala cromatica Cartogramma del rapporto di mascolinità nelle regioni italiane – dati Censimento Istat 2001 Colorazione delle zone