A cura di: Manuela Mangione •Cos’è? Una scienza che studia dei fenomeni collettivi fornendo strumenti che servono per ottenere tutte le informazioni che possono interessare • Perché studiare la statistica? Una delle esigenze fondamentali della società moderna è la possibilità di avere informazioni corrette e in modo rapido sintesi di dati sotto forma di sondaggi, grafici,... Statistica descrittiva Si occupa della raccolta, del riordino, nonché della presentazione e dell’analisi dei dati ottenuti dalla studio di un fenomeno collettivo Statistica inferenziale Si occupa di estendere i risultati ottenuti con la statistica descrittiva a insiemi più numerosi di quelli studiati (sondaggi di voto e exit-pool). • 2300 a. C. : scritti cinesi con annotazioni su misure di terreni e numerazioni degli abitanti • Bibbia : censimenti degli Ebrei da parte degli Egizi; censimenti demografici e catasti da parte del popolo egizio • Impero Romano : varie registrazioni dei dati relativi all’Impero • Medioevo : scarsa documentazione • 1600 1700 : tabelle comparative delle risorse geografiche ed economiche dei vari Stati • 1800 Laplace : calcolo delle probabilità, si associa modelli probabilistici allo studio di fenomeni statistici • 1900 : statistica come scienza autonoma , formalizzazione dell’inferenza statistica Fasi di un indagine statistica • Definizione degli obiettivi • Individuazione del fenomeno e del collettivo • Raccolta dei dati • Spoglio e trascrizione dei dati • Elaborazione dei dati • Interpretazione dei risultati e divulgazione Raccolta dei dati •Natura dei dati •Metodi di raccolta dei dati (globale o campionaria) • Rilevazioni preliminari o definitive; occasionali, periodiche o continue •Tecnica di raccolta dei dati ( uso di registri , intervista, compilazione di questionari con risposta aperta o chiusa) Organi predisposti alla raccolta dei dati Spoglio e trascrizione dei dati •Enumerazione dei dati •Classificazione •Trascrizione in tabelle (semplici , complesse, a doppia entrata) (serie e seriazioni) ELABORAZIONE DEI DATI 1) Considerando gli studenti della classe si prepari una tabella semplice dalla quale risulti la loro distribuzione per età. Grafico 2) Considerando gli studenti della classe costruire una tabella composta per stabilire il numero di fratelli e sorelle degli studenti stessi. Grafico 3) Costruire una tabella a doppia entrata per classificare il numero degli studenti in base al colore dei capelli e degli occhi. ELABORAZIONE DEI DATI Esercizio proposto Ad un concorso partecipano 398 persone le quali provengono da diverse scuole secondo quanto mostra la seguente tabella: Scuola di provenienza Num Candidati Rapporti Rapporti % Liceo Classico 84 0,211 21,11 Liceo Scientifico 52 0,131 13,07 Istituto Tecnico Comm 120 0,302 30,15 Altri Istituti Tecnici 96 0,241 24,12 Istituto Magistrale 32 0,080 8,04 Altre Scuole 14 0,035 3,52 Totale 398 1 100 Calcolare qual è il peso di ciascuna scuola sul numero totale dei candidati. (Rapporti di composizione) ELABORAZIONE DEI DATI Misure di tendenza centrali Misure di variabilità Misure di concentrazione ELABORAZIONE DEI DATI Misure di tendenza centrali Data una distribuzione di dati disposti in ordine crescente o decrescente si definisce media un qualunque valore non minore del più piccolo e non maggiore del più grande Esempio: 7 10 20 52 Importanza: fornisce un’indicazione sintetica dei dati di una distribuzione secondo un criterio stabilito a priori • Medie di calcolo (medie ferme) •Medie di posizione ELABORAZIONE DEI DATI Medie di calcolo: Media aritmetica Media aritmetica semplice: (proporre ad allievi) Esempio 1: Consideriamo gli arrivi di ospiti stranieri, nella totalità degli esercizi ricettivi italiani, per i mesi estivi dell’anno xxxx: Mesi Giugno Arrivi ( in migliaia di unità) Calcolare la presenza media di stranieri nei mesi 2.257 estivi Luglio 2.989 Agosto 2.632 Settembre 2.694 M = 2643 migliaia ELABORAZIONE DEI DATI Medie di calcolo: Media aritmetica Esempio 2 (proporre ad allievi): Calcolare il numero medio dei vani delle abitazioni occupate in una certa provincia italiana con i dati della seguente tabella: Media aritm ponderata= N. vani 1 2 3 4 5 6 7 o più TOTALE N. abitazioni x*p 5.044 5044 43.939 87878 67.855 203565 75.254 301016 41.842 209210 10.760 64560 8.441 67528 253.135 938.801 3,71 ELABORAZIONE DEI DATI Medie di calcolo: Media aritmetica n •Media aritmetica semplice: xi I =1 n n •Media aritmetica ponderata: xipi I =1 n pi i=1 •Caratteristiche e proprietà della media aritmetica: • la somma degli scarti dalla media aritmetica è nulla; • la somma dei quadrati degli scarti dalla media è minima ELABORAZIONE DEI DATI (ancora un esempio di media aritmetica nel caso di distribuzione per classi) Classi di età Numero di persone Valori centrali Vc*num pers 20-25 10 22,5 225 27,5 25-30 15 412,5 32,5 650 30-35 20 37,5 412,5 35-40 11 42,5 127,5 40-45 3 47,5 47,5 45-50 1 1875 Totale 60 Media 31,25 NB = il calcolo, in questo caso, viene effettuato sostituendo a ciascuna classe il termine centrale Altre medie di calcolo • Media geometrica semplice e ponderata (Mg) • Media quadratica semplice e ponderata (M2) • Media armonica semplice e ponderata (Ma) In pratica qual è meglio usare? Non è possibile fissare regole precise: dipenderà dal tipo di problema che suggerirà di usare una piuttosto che l’altra…. M2 > M > Mg > M a Altre medie di calcolo (esercizi da proporre agli allievi) 1) Deposito un capitale di 1 euro in banca per 3 anni. La banca mi calcola gli interessi ad un tasso composto annuo del 7% per il primo anno, 7.5% per il secondo, 8% per il terzo. Determinare il tasso medio applicato dalla banca. 2) Con una bilancia di precisione sono state determinate le differenze di peso tra 4 lamine di titanio rispetto a una di riferimento, ottenendo i seguenti valori - 4, 3, 5, - 3. Determinare la differenza media del peso delle lamine da quella di riferimento. 3) Per 3 anni consecutivi ho speso, per riscaldare il mio appartamento, sempre lo stesso importo di 500 euro, acquistando il metano a euro 0,29 /MC il primo anno, a euro 0,32/MC il secondo e a euro 0,32/MC il terzo. Voglio determinare il costo medio di un MC di metano per l’intero periodo. ELABORAZIONE DEI DATI Medie di posizione: Moda Moda o termine modale di una distribuzione è il termine al quale corrisponde la massima frequenza Es: Nota la distribuzione Esito lancio di un dado: Frequenze 1 7 2 11 3 4 5 9 14 6 6 3 Totale 50 Moda? 4 N. B. = Non si può parlare di moda nel caso di una distribuzione non ponderata oppure nel caso in cui, pur essendo la distribuzione ponderata , i termini si presentano tutti con la stessa frequenza (sono tutte mode!!). ELABORAZIONE DEI DATI Medie di posizione: Moda Caso di distribuzione per classi A) se le classi hanno tutte uguale ampiezza, si dice classe modale quella a cui corrisponde la maggiore frequenza B) se le classi non hanno uguale ampiezza, la classe modale è quella a cui corrisponde il più alto rapporto tra frequenza e ampiezza della classe Classi 0-100 100-200 200-400 400-600 600-1000 Frequenze 5000 6500 12300 14200 18400 Ampiezza classi 100 100 200 200 400 Freq/amp Classe modale 50 65 400-600 61,5 71 46 ELABORAZIONE DEI DATI Medie di posizione: Mediana La mediana è il termine che occupa il posto centrale nella distribuzione quando i dati son disposti in ordine cresecente Es Distribuzioni semplici: 3, 8, 6, 21, 15 Me :8 e se aggiungessi Me= (8+15)/2=11,5 anche il termine 45? Distribuzioni ponderate: Termini Frequenze Freq cumulate 20 21 22 23 26 30 60/2=30 Me = 21 Totale 12 20 18 7 2 1 60 12 32 50 57 59 60 ELABORAZIONE DEI DATI Medie di posizione: Mediana 400/2= 200 Distribuzioni per classi: Classi di età Frequenze Frequenze cumulate 20-30 60 60 30-40 92 152 40-50 114 266 50-60 86 352 60-70 40 392 70-80 8 400 Totale 400 Me= 40 + x 48:114=x:10 x = 4,21 Me = 44,21 Ipotesi:i dati si distribuiscono all’interno della classe in modo uniforme