Introduzione alla statistica descrittiva - UniFI

Dipartimento di Statistica Regione Toscana Comune di Firenze
Progetto di diffusione della cultura Statistica
Esplorazione dei dati
Cos’è la STATISTICA
„ Statistica Descrittiva
„
Introduzione alla
statistica descrittiva
… Dati
e variabili
… Tabelle
… Grafici (torte, barre, istogrammi, box-plot)
… Indici sintetici di posizione e variabilità
Carla Rampichini
Dipartimento di Statistica “G. Parenti”
Università di Firenze
le medie (moda, mediana, media aritmetica)
„ variabilità
„
Materiale:
http://www.ds.unifi.it/didattica/percorsi/concorsoscuole/
Statistica e matematica
„
La statistica è una scienza quantitativa, ma
il modo di pensare ‘statistico’ è diverso da
quello ‘matematico’ per almeno 2 aspetti
la statistica non può prescindere dal contesto
(dati)
… la logica dell’inferenza statistica: se questa
particolare ipotesi fosse vera, quanto sarebbe
verosimile ottenere dei dati come i nostri?
…
Statistica, dati, variabilità
La statistica è una scienza che ragiona
partendo dai dati
„ Il principio fondamentale della Statistica è
la variabilità dei dati
„ Se il mondo fosse perfettamente
prevedibile e non ci fosse variabilità, non
ci sarebbe bisogno della Statistica
„
Cos’è la STATISTICA?
„
Scrivete due frasi che spieghino
significa per voi il termine Statistica
… perchè potrebbe essere utile per voi conoscere un
po’ di Statistica
Cosa pensiamo sia la STATISTICA?
… cosa
„
„
„
„
„
Chi legge la definizione che ha scritto?
trascrivete il numero di lettere che
compongono ciascuna parola scritta nella
prima frase
I numeri che avete scritto sono DATI
Tuttavia NON tutti i numeri sono DATI (e non
tutti i dati sono numeri …)
I numeri 10, 3, 7 non sono dati di per sè, ma lo
sono se si riferiscono al n. di lettere che
compongono le prime tre parole della frase
Cos’è la STATISTICA
„
Esistono molte definizioni, una prima definizione
generalmente accettata è la seguente:
La STATISTICA studia i modi in cui un
FENOMENO COLLETTIVO può essere
sintetizzato, analizzato e quindi compreso
„
Con il termine STATISTICA, nel linguaggio di tutti i
giorni, si indicano anche semplicemente i risultati
numerici (le statistiche richiamate nei telegiornali, ad
esempio: l'inflazione, il PIL etc.) di un processo di
sintesi dei dati osservati.
FENOMENO
è
tutto ciò che è
direttamente o indirettamente
osservabile
(facciamo un po’ di esempi)
¾Altezza
¾Vendite di un’azienda
¾Sport preferito
¾…………………
Bartolomei (2007)
¾Intelligenza
¾ Ansia
¾Emozione
¾……………
Come si studiano i fenomeni: un po’
Osservazioni sui fenomeni
di esempi
9
9
9
9
Un’ urna contiene n palline uguali. Di quante osservazioni
abbiamo bisogno per conoscere le caratteristiche delle
palline?
… Una
Nel vostro liceo sono iscritti N alunni. Qual è
il loro sport preferito?
... n1 calcio, n2 basket, n3 …
Tizio è affetto da una rarissima patologia. Come conoscere
l’evoluzione della malattia?
… Osservare e studiare Tizio nel tempo
Qual è il reddito degli italiani?
… Bisogna rilevare il reddito di tutta la popolazione
Bartolomei (2007)
Bartolomei (2007)
Come può essere un fenomeno?
tipico
collettivo
atipico
Si presenta sempre
nello stesso modo,
per cui l’osservazione
di un solo caso
Una certa
fornisce le caratteristiche
caratteristica
degli altri nelle medesime
è rilevata
circostanze, ovvero un
più o meno
solo esperimento
frequentemente,
consente di conoscere
ma non sempre
i risultati nelle stesse
condizioni
Bartolomei (2007)
È sufficiente osservare una sola volta che
l’acqua distillata in riva al mare bolle a 100°
centigradi, per poter affermare che nelle
stesse condizioni ciò avviene sempre
9 Le caratteristiche individuali variano, in
genere, da persona a persona
9 La nascita di un bambino è un fatto …
individuale
9 L’emigrazione è un fatto … collettivo
9
individuale
Riguarda
un solo
soggetto
Riguarda
un’insieme
di soggetti
(popolazione)
Fenomeno
(Esempi)
Tipico:
Atipico:
™L’acqua distillata
in riva al mare
bolle a 100°
centigradi
™Il colore degli occhi
dei ragazzi della
Classe
Bartolomei (2007)
Fenomeno
Fenomeni collettivamente tipici
(Esempi)
Individuale:
Collettivo:
™Nascita di
un bambino
™Natalità di una
popolazione
™Trasferimento di una
persona da uno Stato
ad un altro
™Emigrazione
Bartolomei (2007)
possono essere considerati
collettivamente tipici
Cosa significa misurare
ricondurlo
a schemi
Per
¾poterlo misurare e descrivere
¾ricavare leggi e/o regolarità
¾conoscere il suo andamento
¾prevederlo e modificarlo
Bartolomei (2007)
(es. ogni 105 maschi nascono 100 femmine)
Bartolomei (2007)
Cosa significa …
Studiare un
fenomeno
I fenomeni atipici
osservati su un gran numero di casi,
se presentano delle regolarità,
9Stabilire una corrispondenza tra alcune proprietà
dei numeri e certe proprietà degli oggetti
9Assegnare particolari caratteristiche matematiche
a particolari attributi
9Assegnare un modello formale a oggetti e eventi
secondo una regola, purché sia consistente
9Creare una corrispondenza biunivoca fra una
grandezza ed un numero (o una categoria)
Bartolomei (2007)
Le origini
della
statistica
Esigenza di conoscere
quantitativamente
alcuni fenomeni sociali
9Mosè ………… volle conoscere l’ammontare
della popolazione israelita
9Servio Tullio … istituì il “Census”
9Carlo Magno … istituì rilevazioni a carattere
finanziario e amministrativo
Bartolomei (2007)
Variabilità
„
„
Riprendete le frasi scritte prima: tutte le parole che avete
scritto contengono lo stesso numero di lettere?
Osservate che la stessa misurazione ‘numero di lettere’
può dare luogo a risultati diversi – a seconda della
parola considerata.
Questo fatto illustra uno dei concetti
fondamentali della statistica:
la variabilità
La Statistica
™Inizialmente scienza che si occupava degli
avvenimenti notevoli dello Stato (da “Status”)
™Insieme di teorie e metodi che permettono di
studiare i fenomeni collettivamente tipici
™Disciplina che studia quantitativamente i
fenomeni collettivamente tipici, allo scopo di
mettere in luce le leggi e le regolarità nascoste
Bartolomei (2007)
Misuriamo tutti lo stesso oggetto
„
„
„
„
A gruppi di 5: trovate un metodo per misurare
con un righello il diametro della pallina che vi ho
dato
Utilizzando il vostro metodo, misurate due volte
il diametro della pallina al millimetro più vicino,
esprimete la misura in millimetri
Inseriamo le vostre misure in un foglio di lavoro
Osserviamo che non tutte le misure sono uguali:
la maggior parte dovrebbero essere vicine al
diametro programmato dalla ditta che ha
prodotto le palline (valore vero).
vero
Perchè le misure variano?
Perchè le misure non sono uguali?Îvariabilità
„
Il metodo di misura utilizzato può essere diverso
di voi avrà bloccato la pallina tra due libri e
misurato la distanza tra i libri
… Altri avranno avvolto il nastro millimetrato intorno alla
pallina, misurato la lunghezza del filo e quindi diviso
per π
Diagramma a barre delle misure
„
… qualcuno
„
Ogni gruppo ha misurato la sua pallina e le
palline non sono perfettamente uguali
Tuttavia la maggior parte delle differenze sono
dovute a errori di misura.
È difficile misurare il diametro di una sfera!
„
Contiamo quante volte si presenta ciascun
valoreÎfrequenze
Costruiamo il grafico
… In
… In
„
ascissa scriviamo i valori in millimetri
ordinata riportiamo il valore delle frequenze
Che forma ha il grafico? Come mai ha questa
forma?
Il grafico mostra una ‘gobba’ in corrispondenza
del valore ‘vero’, questo è tipico delle
distribuzioni degli errori di misura
Discussione
„
Osservando il grafico, scegliete 2 numeri che vi
sembrano ragionevoli per completare questa frase:
“La misura tipica del diametro è di circa ____ mm , con
uno scarto in più o in meno di circa ____ mm”
„
Come potremmo ridurre la variabilità nelle misure?
… Utilizzando un’unica palina
… Utilizzando tutti lo stesso metodo di misura
… insegnando a tutti come si misura il diametro
„
Potremmo eliminare completamente la variabilità delle
misure?
no, non è possibile!
Esempio: se il diametro vero è 49.5 mm. quando misuriamo il
diametro con il righello al mm più prossimo, qualcuno
riporterà 50 e altri 49 mm, a seconda che pensino che la
misura sia un po’ sopra o un po’ sotto 49.5 mm
Variabili statistiche
Variabili statistiche
Variabili e unità di osservazione
Una variabile è una caratteristica (p.e. genere) di una
persona o di una cosa alla quale può essere assegnata una
quantità (numero, p.e. età) o una descrizione (categoria)
o femmina
p.e maschio
„
La persona o la cosa cui sono assegnati il
numero o la categoria è detta unità di
osservazione (o unità statistica)
„
I dati sono l’insieme di numeri o categorie
registrati per le unità di osservazione
„
La variabilità si riferisce al fatto che la
variabile assume un valore diverso a
seconda dell’unità di osservazione
considerata
Quando avete contato il numero di lettere che
formano le parole avete registrato dei dati
„ Per questi dati, le unità di osservazione sono le
parole che avete scritto.
„ Qual è la variabile?
La variabile è la lunghezza della parola, misurata
in termini di numero di lettere che la
compongono
„ Questa caratteristica può assumere i valori
(modalità): 1,2,3 …, fino a ??
„ Chi ha scritto la parola più lunga?
„
Insieme di
unità statistiche
Gruppo di elementi
di qualsiasi natura
Collettivo statistico
Universo - Popolazione
Unità Statistiche
(classificazione)
semplici
(classificazione)
composte
Finito
9
9
9
Una persona
Un soldato
Un albero
Bartolomei (2007)
9
9
9
Una famiglia
Un reggimento
Un bosco
quando
è possibile togliere
uno dopo l’altro
tutti gli elementi
che lo costituiscono
Bartolomei (2007)
Infinito
quando
non è finito
Conosciamo la classe (popolazione)
„
Non esistono due studenti uguali, gli
studenti (unità di osservazione) variano da
uno all’altro in molti modi interessanti
„
Un buon metodo per iniziare a pensare
alla variabilità consiste nel raccogliere
DATI sugli studenti di questa classe:
come è ciascuno di voi rispetto agli altri?
„
Rispondete al questionario in modo
anonimo e saltate le domande cui non
volete o non potete rispondere
Problemi di misura …
„
Attenzione
dobbiamo utilizzare tutti lo stesso
STRUMENTO DI MISURA perché i dati
siano confrontabili
„
ATTENZIONE AI PROBLEMI DI MISURA!
Contiamo le risposte …
„
Analizeremo oggi le risposte ad una delle domande.
Utilizzeremo gli aItri dati raccolti insieme la prossima volta
„
leggiamo alcune delle risposte alla domanda 5
scrivi un numero a caso tra 1 e 20
„
Contiamo le risposte creando una TABELLA DI
SPOGLIO (foglio di lavoro)
„
Rappresentiamo graficamente i dati.
Lavorate insieme a gruppi di 5.
Come si misura la frequenza del battito
cardiaco?
p.e. scegliamo di contare i battiti per 10
secondi e poi moltiplichiamo per 6
Alcuni grafici …
Ci sono molti modi di rappresentare la
DISTRIBUZIONE dei dati
Istogrammi e diagrammi a barre
„ Torte
„ Dot-plot
„ Altri …
„
Esempio: 100 numeri estratti a caso tra 1 e 20