LA STATISTICA By prof. Pietro Rossi La STATISTICA può essere vista come la scienza che organizza ed analizza informazioni (dati quantitativi e/o qualitativi) per fini descrittivi o per fare previsioni. Statistica descrittiva La statistica è lo studio quantitativo dei fenomeni collettivi Studio quantitativo perché realizzato tramite numeri Fenomeni collettivi perché riguardano una pluralità di elementi • Popolazione statistica: insieme o collettività entro cui si studia il fenomeno - Esempio: la popolazione statistica relativa a tutti gli elettori. • Unità statistica: ogni elemento della popolazione statistica. • Campione statistico: un qualsiasi insieme di unità statistiche prese da tutta la popolazione, che rappresenta una porzione della popolazione (campione rappresentativo). • Variabili (o caratteri): sono le caratteristiche della popolazione che si vogliono studiare. Ogni CARATTERE viene descritto mediante le MODALITA’ con cui esso si può manifestare. I CARATTERI possono essere di due tipi: QUALITATIVI: se le loro modalità sono descritte da attributi (sesso, mezzo di trasporto, etc…..) QUANTITATIVI: se le loro modalità sono descritte da numeri (età, altezza, etc…) Un approccio statistico ad un problema si articola nelle seguenti fasi: Definizione del problema Individuazione della popolazione e dei caratteri oggetto dell’indagine Raccolta dei dati mediante questionari, interviste, consultazione di archivi,…. Presentazione dei dati in tabelle e grafici Interpretazione e analisi dei dati Trascrizione dei dati in tabelle . I dati, una volta enumerati e classificati, vengono trascritti in tabelle o tavole statistiche Esempio Viene condotta un’indagine sull’età delle 40 persone presenti in una discoteca, in un certo giorno. I risultati sono riassunti dalla seguente tabella di frequenza. (la frequenza corrispondente ai giovani aventi 17 anni è 13) Frequenza Età 5 7 15 14 15 16 13 17 La frequenza di un dato statistico è il numero di volte che quel dato compare. Si chiama, poi, frequenza relativa f di un dato statistico, il rapporto tra la sua frequenza n e la somma N di tutte le frequenze. In simboli f=n/N I grafici statistici possono assumere varie forme a seconda del tipo di fenomeno che si studia. Tra i più diffusi ricordiamo: ORTOGRAMMA AEROGRAMMA ISTOGRAMMA IDEOGRAMMA L’ortogramma è costituito da rettangoli di uguale base e di altezza proporzionale alla frequenza di ciascun dato L’aerogramma si ottiene dividendo un cerchio in settori circolari aventi un angolo al centro proporzionale alle frequenze che rappresentano Ia 33% 53% 14% L’istogramma consiste in un insieme di rettangoli adiacenti aventi aree proporzionali alla frequenza del dato statistico 14 12 10 8 6 4 2 0 calcio nuoto altro Ia Ib Ic Id L’ideogramma è un tipo di rappresentazione grafica che consiste nel rappresentare gli oggetti in esame mediante immagini stilizzate. Esempio Se vogliamo rappresentare la densità di popolazione (numero di abitanti per km2) di alcune nazioni europee,possiamo servirci del seguente ideogramma.Un disco colorato rappresenta trenta abitanti. Media aritmetica Se i voti riportati in una materia scolastica sono 3, 6, 4, 7, la loro media è: (3+6+4+7)/4 = 20/4 = 5 cioè media aritmetica = somma di tutti i dati numero dei dati Si chiama moda di una distribuzione di frequenze il dato avente la massima frequenza. Esempio Considerata la seguente tabella che mostra la distribuzione, secondo le età, dei 60 studenti che seguono un certo corso di studi , si ha che la moda è 21. Infatti questo è il termine (età) cui corrisponde la massima frequenza. Età 20 21 22 23 24 Numero studenti 12 20 18 7 3 Si chiama mediana il dato di mezzo quando i dati stessi sono disposti in ordine. Ad esempio, per l’insieme dei dati numerici(già disposti in ordine crescente) 2, 5, 6, 9, 10 la mediana è 6