Dipartimento di Statistica Regione Toscana Comune di Firenze Progetto di diffusione della cultura Statistica Esplorazione dei dati Cos’è la STATISTICA Statistica Descrittiva Introduzione alla statistica descrittiva Dati e variabili Tabelle Grafici (torte, barre, istogrammi, box-plot) Indici sintetici di posizione e variabilità Carla Rampichini Dipartimento di Statistica “G. Parenti” Università di Firenze le medie (moda, mediana, media aritmetica) variabilità Materiale: http://www.ds.unifi.it/didattica/percorsi/concorsoscuole/ Statistica e matematica La statistica è una scienza quantitativa, ma il modo di pensare ‘statistico’ è diverso da quello ‘matematico’ per almeno 2 aspetti la statistica non può prescindere dal contesto (dati) la logica dell’inferenza statistica: se questa particolare ipotesi fosse vera, quanto sarebbe verosimile ottenere dei dati come i nostri? Statistica, dati, variabilità La statistica è una scienza che ragiona partendo dai dati Il principio fondamentale della Statistica è la variabilità dei dati Se il mondo fosse perfettamente prevedibile e non ci fosse variabilità, non ci sarebbe bisogno della Statistica Cos’è la STATISTICA? Scrivete due frasi che spieghino significa per voi il termine Statistica perchè potrebbe essere utile per voi conoscere un po’ di Statistica Cosa pensiamo sia la STATISTICA? cosa Chi legge la definizione che ha scritto? trascrivete il numero di lettere che compongono ciascuna parola scritta nella prima frase I numeri che avete scritto sono DATI Tuttavia NON tutti i numeri sono DATI (e non tutti i dati sono numeri …) I numeri 10, 3, 7 non sono dati di per sè, ma lo sono se si riferiscono al n. di lettere che compongono le prime tre parole della frase Cos’è la STATISTICA Esistono molte definizioni, una prima definizione generalmente accettata è la seguente: La STATISTICA studia i modi in cui un FENOMENO COLLETTIVO può essere sintetizzato, analizzato e quindi compreso Con il termine STATISTICA, nel linguaggio di tutti i giorni, si indicano anche semplicemente i risultati numerici (le statistiche richiamate nei telegiornali, ad esempio: l'inflazione, il PIL etc.) di un processo di sintesi dei dati osservati. FENOMENO è tutto ciò che è direttamente o indirettamente osservabile (facciamo un po’ di esempi) ¾Altezza ¾Vendite di un’azienda ¾Sport preferito ¾………………… Bartolomei (2007) ¾Intelligenza ¾ Ansia ¾Emozione ¾…………… Come si studiano i fenomeni: un po’ Osservazioni sui fenomeni di esempi 9 9 9 9 Un’ urna contiene n palline uguali. Di quante osservazioni abbiamo bisogno per conoscere le caratteristiche delle palline? … Una Nel vostro liceo sono iscritti N alunni. Qual è il loro sport preferito? ... n1 calcio, n2 basket, n3 … Tizio è affetto da una rarissima patologia. Come conoscere l’evoluzione della malattia? … Osservare e studiare Tizio nel tempo Qual è il reddito degli italiani? … Bisogna rilevare il reddito di tutta la popolazione Bartolomei (2007) Bartolomei (2007) Come può essere un fenomeno? tipico collettivo atipico Si presenta sempre nello stesso modo, per cui l’osservazione di un solo caso Una certa fornisce le caratteristiche caratteristica degli altri nelle medesime è rilevata circostanze, ovvero un più o meno solo esperimento frequentemente, consente di conoscere ma non sempre i risultati nelle stesse condizioni Bartolomei (2007) È sufficiente osservare una sola volta che l’acqua distillata in riva al mare bolle a 100° centigradi, per poter affermare che nelle stesse condizioni ciò avviene sempre 9 Le caratteristiche individuali variano, in genere, da persona a persona 9 La nascita di un bambino è un fatto … individuale 9 L’emigrazione è un fatto … collettivo 9 individuale Riguarda un solo soggetto Riguarda un’insieme di soggetti (popolazione) Fenomeno (Esempi) Tipico: Atipico: L’acqua distillata in riva al mare bolle a 100° centigradi Il colore degli occhi dei ragazzi della Classe Bartolomei (2007) Fenomeno Fenomeni collettivamente tipici (Esempi) Individuale: Collettivo: Nascita di un bambino Natalità di una popolazione Trasferimento di una persona da uno Stato ad un altro Emigrazione Bartolomei (2007) possono essere considerati collettivamente tipici Cosa significa misurare ricondurlo a schemi Per ¾poterlo misurare e descrivere ¾ricavare leggi e/o regolarità ¾conoscere il suo andamento ¾prevederlo e modificarlo Bartolomei (2007) (es. ogni 105 maschi nascono 100 femmine) Bartolomei (2007) Cosa significa … Studiare un fenomeno I fenomeni atipici osservati su un gran numero di casi, se presentano delle regolarità, 9Stabilire una corrispondenza tra alcune proprietà dei numeri e certe proprietà degli oggetti 9Assegnare particolari caratteristiche matematiche a particolari attributi 9Assegnare un modello formale a oggetti e eventi secondo una regola, purché sia consistente 9Creare una corrispondenza biunivoca fra una grandezza ed un numero (o una categoria) Bartolomei (2007) Le origini della statistica Esigenza di conoscere quantitativamente alcuni fenomeni sociali 9Mosè ………… volle conoscere l’ammontare della popolazione israelita 9Servio Tullio … istituì il “Census” 9Carlo Magno … istituì rilevazioni a carattere finanziario e amministrativo Bartolomei (2007) Variabilità Riprendete le frasi scritte prima: tutte le parole che avete scritto contengono lo stesso numero di lettere? Osservate che la stessa misurazione ‘numero di lettere’ può dare luogo a risultati diversi – a seconda della parola considerata. Questo fatto illustra uno dei concetti fondamentali della statistica: la variabilità La Statistica Inizialmente scienza che si occupava degli avvenimenti notevoli dello Stato (da “Status”) Insieme di teorie e metodi che permettono di studiare i fenomeni collettivamente tipici Disciplina che studia quantitativamente i fenomeni collettivamente tipici, allo scopo di mettere in luce le leggi e le regolarità nascoste Bartolomei (2007) Misuriamo tutti lo stesso oggetto A gruppi di 5: trovate un metodo per misurare con un righello il diametro della pallina che vi ho dato Utilizzando il vostro metodo, misurate due volte il diametro della pallina al millimetro più vicino, esprimete la misura in millimetri Inseriamo le vostre misure in un foglio di lavoro Osserviamo che non tutte le misure sono uguali: la maggior parte dovrebbero essere vicine al diametro programmato dalla ditta che ha prodotto le palline (valore vero). vero Perchè le misure variano? Perchè le misure non sono uguali?Îvariabilità Il metodo di misura utilizzato può essere diverso di voi avrà bloccato la pallina tra due libri e misurato la distanza tra i libri Altri avranno avvolto il nastro millimetrato intorno alla pallina, misurato la lunghezza del filo e quindi diviso per π Diagramma a barre delle misure qualcuno Ogni gruppo ha misurato la sua pallina e le palline non sono perfettamente uguali Tuttavia la maggior parte delle differenze sono dovute a errori di misura. È difficile misurare il diametro di una sfera! Contiamo quante volte si presenta ciascun valoreÎfrequenze Costruiamo il grafico In In ascissa scriviamo i valori in millimetri ordinata riportiamo il valore delle frequenze Che forma ha il grafico? Come mai ha questa forma? Il grafico mostra una ‘gobba’ in corrispondenza del valore ‘vero’, questo è tipico delle distribuzioni degli errori di misura Discussione Osservando il grafico, scegliete 2 numeri che vi sembrano ragionevoli per completare questa frase: “La misura tipica del diametro è di circa ____ mm , con uno scarto in più o in meno di circa ____ mm” Come potremmo ridurre la variabilità nelle misure? Utilizzando un’unica palina Utilizzando tutti lo stesso metodo di misura insegnando a tutti come si misura il diametro Potremmo eliminare completamente la variabilità delle misure? no, non è possibile! Esempio: se il diametro vero è 49.5 mm. quando misuriamo il diametro con il righello al mm più prossimo, qualcuno riporterà 50 e altri 49 mm, a seconda che pensino che la misura sia un po’ sopra o un po’ sotto 49.5 mm Variabili statistiche Variabili statistiche Variabili e unità di osservazione Una variabile è una caratteristica (p.e. genere) di una persona o di una cosa alla quale può essere assegnata una quantità (numero, p.e. età) o una descrizione (categoria) o femmina p.e maschio La persona o la cosa cui sono assegnati il numero o la categoria è detta unità di osservazione (o unità statistica) I dati sono l’insieme di numeri o categorie registrati per le unità di osservazione La variabilità si riferisce al fatto che la variabile assume un valore diverso a seconda dell’unità di osservazione considerata Quando avete contato il numero di lettere che formano le parole avete registrato dei dati Per questi dati, le unità di osservazione sono le parole che avete scritto. Qual è la variabile? La variabile è la lunghezza della parola, misurata in termini di numero di lettere che la compongono Questa caratteristica può assumere i valori (modalità): 1,2,3 …, fino a ?? Chi ha scritto la parola più lunga? Insieme di unità statistiche Gruppo di elementi di qualsiasi natura Collettivo statistico Universo - Popolazione Unità Statistiche (classificazione) semplici (classificazione) composte Finito 9 9 9 Una persona Un soldato Un albero Bartolomei (2007) 9 9 9 Una famiglia Un reggimento Un bosco quando è possibile togliere uno dopo l’altro tutti gli elementi che lo costituiscono Bartolomei (2007) Infinito quando non è finito Conosciamo la classe (popolazione) Non esistono due studenti uguali, gli studenti (unità di osservazione) variano da uno all’altro in molti modi interessanti Un buon metodo per iniziare a pensare alla variabilità consiste nel raccogliere DATI sugli studenti di questa classe: come è ciascuno di voi rispetto agli altri? Rispondete al questionario in modo anonimo e saltate le domande cui non volete o non potete rispondere Problemi di misura … Attenzione dobbiamo utilizzare tutti lo stesso STRUMENTO DI MISURA perché i dati siano confrontabili ATTENZIONE AI PROBLEMI DI MISURA! Contiamo le risposte … Analizeremo oggi le risposte ad una delle domande. Utilizzeremo gli aItri dati raccolti insieme la prossima volta leggiamo alcune delle risposte alla domanda 5 scrivi un numero a caso tra 1 e 20 Contiamo le risposte creando una TABELLA DI SPOGLIO (foglio di lavoro) Rappresentiamo graficamente i dati. Lavorate insieme a gruppi di 5. Come si misura la frequenza del battito cardiaco? p.e. scegliamo di contare i battiti per 10 secondi e poi moltiplichiamo per 6 Alcuni grafici … Ci sono molti modi di rappresentare la DISTRIBUZIONE dei dati Istogrammi e diagrammi a barre Torte Dot-plot Altri … Esempio: 100 numeri estratti a caso tra 1 e 20