Elementi di STATISTICA DESCRITTIVA Parleremo di……... • • • • • • Perché studiare la statistica Che cos’è oggi la statistica Fasi del metodo statistico Presentazione dei dati: tabelle di frequenza Presentazione dei dati: diagrammi Numeri indici di un insieme di dati: media aritmetica, moda, mediana La statistica è utile per…. • Costruire modelli interpretativi della realtà • Scegliere e valutare le informazioni che ci vengono date quotidianamente La statistica è lo studio quantitativo dei fenomeni collettivi • Studio quantitativo perché realizzato tramite numeri • Fenomeni collettivi perché riguardano una pluralità di elementi Un approccio statistico ad un problema si articola nelle seguenti fasi: • Definizione del problema • Individuazione della popolazione e dei caratteri oggetto dell’indagine • Raccolta dei dati mediante questionari, interviste, consultazione di archivi,…. • Presentazione dei dati in tabelle e grafici • Interpretazione e analisi dei dati Trascrizione dei dati in tabelle I dati, una volta enumerati e classificati, vengono trascritti in tabelle o tavole statistiche. Esempio Viene condotta un’indagine sull’età delle 40 persone presenti in una discoteca, in un certo giorno. I risultati sono riassunti dalla seguente tabella di frequenza. (la frequenza corrispondente ai giovani aventi 17 anni è 13) Frequenza Età 5 7 15 13 14 15 16 17 La frequenza di un dato statistico è il numero di volte che quel dato compare. Si chiama, poi, frequenza relativa f di un dato statistico, il rapporto tra la sua frequenza n e la somma N di tutte le frequenze. In simboli f=n/N I grafici statistici possono assumere varie forme a seconda del tipo di fenomeno che si studia. Tra i più diffusi ricordiamo: • • • • Ortogramma Aerogramma Istogramma Ideogramma L’ortogramma è costituito da rettangoli di uguale base e di altezza proporzionale alla frequenza di ciascun dato L’aerogramma si ottiene dividendo un cerchio in settori circolari aventi un angolo al centro proporzionale alle frequenze che rappresentano Ia 33% 53% 14% L’istogramma consiste in un insieme di rettangoli adiacenti aventi aree proporzionali alla frequenza del dato statistico 14 12 10 8 6 4 2 0 calcio nuoto altro Ia Ib Ic Id L’ideogramma è un tipo di rappresentazione grafica che consiste nel rappresentare gli oggetti in esame mediante immagini stilizzate. Esempio Se vogliamo rappresentare la densità di popolazione (numero di abitanti per km2) di alcune nazioni europee,possiamo servirci del seguente ideogramma.Un disco colorato rappresenta trenta abitanti. Media aritmetica Se i voti riportati in una materia scolastica sono 3, 6, 4, 7, la loro media è: (3+6+4+7)/4 = 20/4 = 5 cioè media aritmetica = somma di tutti i dati numero dei dati Media aritmetica pesata = (somma dei dati per le loro frequenze) / (somma delle frequenze) Si chiama moda di una distribuzione di frequenze il dato avente la massima frequenza. Esempio Considerata la seguente tabella che mostra la distribuzione, secondo le età, dei 60 studenti che seguono un certo corso di studi , si ha che la moda è 21. Infatti questo è il termine (età) cui corrisponde la massima frequenza. Età 20 21 22 23 24 Numero studenti 12 20 18 7 3 Si chiama mediana il dato di mezzo quando i dati stessi sono disposti in ordine. Ad esempio, per l’insieme dei dati numerici(già disposti in ordine crescente) 2, 5, 6, 9, 10 la mediana è 6 DISTRIBUZIONE PER CLASSI • IN UNA DISTRIBUZIONE PER CLASSI • PER TROVARE LA MEDIA ARITMETICA DEVO TROVARE I VALORI CENTRALI DI OGNI CLASSE ESEMPIO • DATA LA CLASSE 0-5 IL SUO VALORE CENTRALE SARA’ 2,5 • TROVATA LA DISTRIBUZIONE PER CLASSI PROCEDO COME IN UNA DISTRIBUZIONE DISCRETA. MODA • IN UNA DISTRIBUZIONE PER CLASSI -SE LE CLASSI HANNO LA STESSA AMPIEZZA LA MODA E’ LA CLASSE CON LA MAGGIOR FREQUENZA. • - SE LE CLASSI HANNO AMPIEZZA DIVERSA SI COSTRUISCE LA COLONNA DELLE FREQUENZE ASSOLUTE DIVISO L’AMPIEZZA ( cioè l’altezza degli istrogrammi ) LA CLASSE MODALE E’ LA CLASSE CON LA MAGGIORE ALTEZZA MEDIANA • In una distribuzione per classi si deve costruire la colonna delle frequenze cumulate • Si prende la meta’ del totale delle frequenze • Si vede in quale classe cade questa numero • Si trova cosi la classe mediana ESEMPIO ESEMPIO RICOVERI 0-4 5-9 10-14 15-19 20-24 25-30 FREQUENZE ASSOLUTE 732 928 264 56 12 8 FREQUENZE CUMULATE 732 732+928=1660 1660+264=1924 1980 1992 2000 • La meta di 2000 è 1000 perciò per arrivare alla mediana dobbiamo contare le prime mille persone che cadono nella classe 5-9 che contiene 928 persone • Faremo la seguente proporzione • 928: 268=5 :x • Frequenza classe mediana : ( 1000-frequenza cumulata prima classe mediana) = ampiezza della classe mediana : x • Troviamo x = 1,44 • Percio il valore mediano dei giorni di ricovero sarà 5+1,44 = 6 giorni Scarto quadratico medio • Radice quadrata della media aritmetica degli scarti al quadrato Altre medie • Media geometrica • Radice ennesima del prodotto degli enne termini