Descrivere insieme di dati
La rappresentazione grafica dei dati
Grafici per dati discreti
Grafici per dati continui
Esercitazioni di statistica
La rappresentazione grafica dei dati
Stefania Spina
Universitá di Napoli Federico II
[email protected]
1 Ottobre 2014
Stefania Spina
Esercitazioni di statistica
1/42
Descrivere insieme di dati
La rappresentazione grafica dei dati
Grafici per dati discreti
Grafici per dati continui
Definizioni
Introduzione
E’ molto importante che i risultati numerici di uno studio siano
presentati in modo chiaro e conciso, in modo che il lettore possa
notare facilmente le caratteristiche essenziali dei dati.
Questo diventa particolarmente importante quando si devono trattare
molti dati, il che capita spesso quando si eseguono sondaggi o
esperimenti controllati.
Stefania Spina
Esercitazioni di statistica
2/42
Descrivere insieme di dati
La rappresentazione grafica dei dati
Grafici per dati discreti
Grafici per dati continui
Definizioni
Analisi monovariata
Analisi monovariata: insieme di tecniche che prendono in
considerazione una variabile alla volta.
Il punto di partenza dell’analisi monovariata è la distribuzione di
frequenza.
Stefania Spina
Esercitazioni di statistica
3/42
Descrivere insieme di dati
La rappresentazione grafica dei dati
Grafici per dati discreti
Grafici per dati continui
Definizioni
Le distribuzioni unitarie e di frequenza
Supponiamo di aver rilevato su di un collettivo di otto studenti i seguenti sei caratteri:
sesso, voto in statistica sociale, colore degli occhi, livello di soddisfazione per il corso di
statistica sociale, altezza e peso.
I dati sono registrati in una tabella, chiamata anche matrice dei dati.
Ogni riga della tabella descrive il profilo di uno studente; ogni colonna illustra la
distribuzione unitaria semplice dei sei caratteri oggetto di studio.
Beppe
Maria
Eva
Francesco
Mario
Piero
Roberta
Luca
Sesso
Maschio
Femmina
Femmina
Maschio
Maschio
Maschio
Femmina
Maschio
Voto Statistica Sociale
26
30
18
26
30
18
24
18
Stefania Spina
Colore occhi
Neri
Verdi
Marrone
Marrone
Azzurri
Azzurri
Marrone
Verdi
Soddisfazione
molto
molto
poco
abbastanza
molto
per niente
abbastanza
poco
Esercitazioni di statistica
Statura
160
169
150
180
185
190
174
170
Peso
60
65
55
65
90
95
60
67
4/42
Descrivere insieme di dati
La rappresentazione grafica dei dati
Grafici per dati discreti
Grafici per dati continui
Definizioni
Le distribuzioni unitarie e di frequenza
La distribuzione unitaria del carattere descrive, in maniera analitica,
le modalità di ciascuna unità statistica, ma non consente di
rappresentare, in maniera sintetica, le caratteristiche del fenomeno
osservato.
Per fornire una descrizione sintetica, a partire della distribuzione
unitaria, dovremmo esaminare ogni colonna della matrice,
considerando la frequenza con cui si presenta la modalità del
carattere esaminato.
Stefania Spina
Esercitazioni di statistica
5/42
Descrivere insieme di dati
La rappresentazione grafica dei dati
Grafici per dati discreti
Grafici per dati continui
Definizioni
Frequenza assoluta e Distribuzione di frequenza
Il primo e più semplice strumento di sintesi e analisi dei dati è la
distribuzione di frequenza.
Una frequenza (assoluta) è il numero di volte che si manifesta
la modalità di una variabile.
Una tabella di frequenza o distribuzione di frequenza registra
ogni categoria, valore, o classe di valori che una variabile
potrebbe avere e il corrispondente numero di volte che ognuna di
esse ricorre nei dati. La frequenza assoluta della i-ma modalità è
indicata con ni .
Stefania Spina
Esercitazioni di statistica
6/42
Descrivere insieme di dati
La rappresentazione grafica dei dati
Grafici per dati discreti
Grafici per dati continui
Definizioni
Esempio: Distribuzione di frequenza (frequenze
assolute)
Stefania Spina
Esercitazioni di statistica
7/42
Descrivere insieme di dati
La rappresentazione grafica dei dati
Grafici per dati discreti
Grafici per dati continui
Definizioni
Frequenza relativa
La frequenza relativa (fi = nni ) è data dal rapporto fra ciascuna
frequenza assoluta (ni ) e la somma di tutte frequenze assolute
(n).
La frequenza relativa cumulata (Fi ) è la somma della
frequenza relativa associata ad una modalità con quelle di tutte
le modalità precedenti.
(n.b. può essere definita anche la frequenza assoluta cumulata - Ni ).
Per calcolare la distribuzione delle frequenze cumulate, la variabile
deve essere almeno misurata su una scala di tipo ordinale.
Stefania Spina
Esercitazioni di statistica
8/42
Descrivere insieme di dati
La rappresentazione grafica dei dati
Grafici per dati discreti
Grafici per dati continui
Definizioni
Esempio: Distribuzioni di frequenze cumulate
assolute, relative e le percentuali corrispondenti
Stefania Spina
Esercitazioni di statistica
9/42
Descrivere insieme di dati
La rappresentazione grafica dei dati
Grafici per dati discreti
Grafici per dati continui
Definizioni
Distribuzione di frequenza per variabili continue
(n.b. possono essere definite anche le %, le frequenze assolute
cumulate e le frequenze relative cumulate)
Stefania Spina
Esercitazioni di statistica
10/42
Descrivere insieme di dati
La rappresentazione grafica dei dati
Grafici per dati discreti
Grafici per dati continui
Definizioni
Esempio: Distribuzione di frequenza per classi
X: Tempo impiegato per svolgere a casa un compito al computer (in
minuti)
Dati rilevati su n = 30 studenti
Stefania Spina
Esercitazioni di statistica
11/42
Descrivere insieme di dati
La rappresentazione grafica dei dati
Grafici per dati discreti
Grafici per dati continui
Definizioni
Introduzione
I grafici rappresentano un modo per veicolare le informazioni,
utilizzando elementi esclusivamente visivi.
Si ricorre ad essi per rendere più chiari ed immediatamente
leggibili i dati statistici.
Per ogni distribuzione statistica è possibile individuare la
rappresentazione grafica più adatta, ossia l’immagine che è in grado
di sposare correttezza metodologica e chiarezza espositiva.
Quando si decide di utilizzare una rappresentazione grafica bisogna
tener presente:
il fenomeno oggetto di studio;
il livello di misura associato alla variabile esaminata (nominale,
ordinale, ecc);
la tipologia della distribuzione di frequenza (unitaria, in classi).
Stefania Spina
Esercitazioni di statistica
12/42
Descrivere insieme di dati
La rappresentazione grafica dei dati
Grafici per dati discreti
Grafici per dati continui
Definizioni
Grafici per dati discreti
Il diagramma a torta rappresenta i dati sottoforma di fette o sezioni
di un cerchio.
Ogni fetta rappresenta una categoria e la dimensione della fetta è
proporzionale alla frequenza relativa della categoria.
Il diagramma a barre rappresenta la frequenza assoluta o la
frequenza relativa di una tabella di frequenza sottoforma di un
rettangolo o barra o colonna.
Stefania Spina
Esercitazioni di statistica
13/42
Descrivere insieme di dati
La rappresentazione grafica dei dati
Grafici per dati discreti
Grafici per dati continui
Grafico a torta
Diagramma a barre
Altri grafici per dati discreti
Grafici a torta
I grafici a torta consentono di visualizzare come la totalità di un
fenomeno si ripartisce, in percentuale, fra le sue componenti.
Fatturato nel settore delle Telecomunicazioni nel 1999.
Stefania Spina
Esercitazioni di statistica
14/42
Descrivere insieme di dati
La rappresentazione grafica dei dati
Grafici per dati discreti
Grafici per dati continui
Grafico a torta
Diagramma a barre
Altri grafici per dati discreti
Esempio: Grafico a torta
Spese del Governo in Danimarca e Olanda, 1992-1995
Assistenza sociale
Istruzione
Beni accessori
Salute
Altro
Totale
Stefania Spina
Danimarca
39.9
10.6
1.8
1.1
46.6
100
Esercitazioni di statistica
Olanda
37.2
10.1
3.2
14.3
35.2
100
15/42
Descrivere insieme di dati
La rappresentazione grafica dei dati
Grafici per dati discreti
Grafici per dati continui
Grafico a torta
Diagramma a barre
Altri grafici per dati discreti
Esempio: Grafico a torta
Percentuale delle spese governative in Olanda
Stefania Spina
Esercitazioni di statistica
16/42
Descrivere insieme di dati
La rappresentazione grafica dei dati
Grafici per dati discreti
Grafici per dati continui
Grafico a torta
Diagramma a barre
Altri grafici per dati discreti
Esercizio: Tabella di frequenze
Calcolare le frequenze assolute e relative e loro rappresentazione
grafica
Beppe
Maria
Eva
Francesco
Mario
Piero
Roberta
Luca
Stefania Spina
Genere
Maschio
Femmina
Femmina
Maschio
Maschio
Maschio
Femmina
Maschio
Esercitazioni di statistica
17/42
Descrivere insieme di dati
La rappresentazione grafica dei dati
Grafici per dati discreti
Grafici per dati continui
Maschio
Femmina
Totale
Grafico a torta
Diagramma a barre
Altri grafici per dati discreti
Frequenza assoluta
5
3
8
⇓
frequenza relativa =
Maschio
Femmina
Totale
frequenza assoluta
totale frequenze assolute
Frequenza relativa
0.625
0.375
1
Stefania Spina
Esercitazioni di statistica
18/42
Descrivere insieme di dati
La rappresentazione grafica dei dati
Grafici per dati discreti
Grafici per dati continui
Grafico a torta
Diagramma a barre
Altri grafici per dati discreti
Grafico torta
Stefania Spina
Esercitazioni di statistica
19/42
Descrivere insieme di dati
La rappresentazione grafica dei dati
Grafici per dati discreti
Grafici per dati continui
Grafico a torta
Diagramma a barre
Altri grafici per dati discreti
Diagramma a barre
Stefania Spina
Esercitazioni di statistica
20/42
Descrivere insieme di dati
La rappresentazione grafica dei dati
Grafici per dati discreti
Grafici per dati continui
Grafico a torta
Diagramma a barre
Altri grafici per dati discreti
Diagramma a barre multiple
Il diagramma a barre multiple consente di visualizzare come due o
più fenomeni si sono evoluti nel tempo o come mutano rispetto a
diverse aree geografiche.
Stefania Spina
Esercitazioni di statistica
21/42
Descrivere insieme di dati
La rappresentazione grafica dei dati
Grafici per dati discreti
Grafici per dati continui
Grafico a torta
Diagramma a barre
Altri grafici per dati discreti
Diagramma a barre suddivise
Il diagramma a barre suddivise consente di mettere in evidenza i
mutamenti che un fenomeno subisce nel tempo o in diverse aree
geografiche, ridistribuendosi rispetto alle proprie modalità.
Stefania Spina
Esercitazioni di statistica
22/42
Descrivere insieme di dati
La rappresentazione grafica dei dati
Grafici per dati discreti
Grafici per dati continui
Grafico a torta
Diagramma a barre
Altri grafici per dati discreti
Esempio: Diagramma a barre
Stefania Spina
Esercitazioni di statistica
23/42
Descrivere insieme di dati
La rappresentazione grafica dei dati
Grafici per dati discreti
Grafici per dati continui
Grafico a torta
Diagramma a barre
Altri grafici per dati discreti
0
50
100
150
200
Diagramma a barre
Professori ordinari
Professori associati
Stefania Spina
Ricercatori
Esercitazioni di statistica
24/42
Descrivere insieme di dati
La rappresentazione grafica dei dati
Grafici per dati discreti
Grafici per dati continui
Grafico a torta
Diagramma a barre
Altri grafici per dati discreti
Esercizio: Diagramma a barre
Stefania Spina
Esercitazioni di statistica
25/42
Descrivere insieme di dati
La rappresentazione grafica dei dati
Grafici per dati discreti
Grafici per dati continui
Grafico a torta
Diagramma a barre
Altri grafici per dati discreti
0
1000
2000
3000
4000
5000
Diagramma a barre
Architettura
Economia
Giurisprudenza
Ingegneria
Stefania Spina
Lett. e Fil.
Sc. Form
Esercitazioni di statistica
Sc. Mat. Fis. Nat
Sc. Pol.
26/42
Descrivere insieme di dati
La rappresentazione grafica dei dati
Grafici per dati discreti
Grafici per dati continui
Grafico a torta
Diagramma a barre
Altri grafici per dati discreti
Altri grafici per dati discreti: Diagrammi in coordinate
polari
Si utilizzano per rappresentare serie cicliche.
Le serie cicliche sono distribuzioni in cui non è dato stabilire quale sia il termine iniziale assoluto e
quello finale assoluto della serie, cioè senza un inizio ed una fine certi dell’andamento del
fenomeno.
Esempio : I nati, i matrimoni, le vendite di determinati prodotti, fenomeni astronomici o atmosferici
e così via secondo i mesi dell’anno, i giorni della settimana ecc.
Stefania Spina
Esercitazioni di statistica
27/42
Descrivere insieme di dati
La rappresentazione grafica dei dati
Grafici per dati discreti
Grafici per dati continui
Grafico a torta
Diagramma a barre
Altri grafici per dati discreti
Altri grafici per dati discreti: Cartogrammi
I cartogrammi sono grafici utili per rappresentare serie territoriali, cioè serie relative a caratteri
geografici, le cui modalità sono luoghi, nazioni, regioni, province, etc.
Per costruire un cartogramma occorre disporre di una carta geografica o topografica in cui siano
chiaramente delimitate le diverse zone, regioni, circoscrizioni (geografiche, politiche,
amministrative) rispetto alle quali viene analizzata l’intensità o la frequenza di uno o più caratteri
(es. nati, morti, reddito pro capite, secondo le Regioni, Province, Comuni).
Stefania Spina
Esercitazioni di statistica
28/42
Descrivere insieme di dati
La rappresentazione grafica dei dati
Grafici per dati discreti
Grafici per dati continui
Diagramma a punti
Istogramma
Rappresentazioni di tipo informatico
Grafici per dati continui: Diagramma a punti
Un diagramma a punti è un grafico usato per piccole quantità di dati in cui ogni
osservazione è indicata da un punto su un singolo asse orizzontale.
L’asse del grafico è suddiviso in modo tale che ogni punto, rappresentante i dati, occupi
un posto univoco sull’asse. Quando più d’una osservazione presenta lo stesso valore, i
punti vengono impilati l’uno sopra l’altro.
Stefania Spina
Esercitazioni di statistica
29/42
Descrivere insieme di dati
La rappresentazione grafica dei dati
Grafici per dati discreti
Grafici per dati continui
Diagramma a punti
Istogramma
Rappresentazioni di tipo informatico
Istogramma
Un istogramma è molto simile a un diagramma a barre ma la scala
di misura dell’asse delle ascisse deve tener conto che i dati sono
intrinsecamente ordinati.
L’istogramma è un grafico costituito da barre non distanziate, dove
ogni barra possiede un’area proporzionale alla frequenza della
classe.
Distinguiamo istogramma:
con ampiezze delle classi uguali (Es classi età 5-10,11-15)
con ampiezze delle classi diverse (Es classi età 5 - 8, 8 - 15,
15 - 30)
Stefania Spina
Esercitazioni di statistica
30/42
Descrivere insieme di dati
La rappresentazione grafica dei dati
Grafici per dati discreti
Grafici per dati continui
Diagramma a punti
Istogramma
Rappresentazioni di tipo informatico
Esempio: Istogramma con ampiezze delle classi
uguali
Stefania Spina
Esercitazioni di statistica
31/42
Descrivere insieme di dati
La rappresentazione grafica dei dati
Grafici per dati discreti
Grafici per dati continui
Diagramma a punti
Istogramma
Rappresentazioni di tipo informatico
Costruzione delle classi di un istogramma
Numero k di classi e determinazione dell’ampiezza per classi di
uguale ampiezza
Stefania Spina
Esercitazioni di statistica
32/42
Descrivere insieme di dati
La rappresentazione grafica dei dati
Grafici per dati discreti
Grafici per dati continui
Diagramma a punti
Istogramma
Rappresentazioni di tipo informatico
Esempio: Istogramma con ampiezze delle classi
uguali
18 `a 22
22 a 26
26 a 30
Totale
Frequenza assoluta
3
3
2
8
Stefania Spina
Esercitazioni di statistica
33/42
Descrivere insieme di dati
La rappresentazione grafica dei dati
Grafici per dati discreti
Grafici per dati continui
Diagramma a punti
Istogramma
Rappresentazioni di tipo informatico
Esempio: Istogramma con ampiezze delle classi
uguali
1.5
1.0
0.5
0.0
Frequency
2.0
2.5
3.0
istogramma età
18
20
22
Stefania Spina
24
26
28
votoEsercitazioni di statistica
30
34/42
Descrivere insieme di dati
La rappresentazione grafica dei dati
Grafici per dati discreti
Grafici per dati continui
Diagramma a punti
Istogramma
Rappresentazioni di tipo informatico
Esempio: Istogramma con ampiezze delle classi
diverse
1
L’ultima classe è stata chiusa a 102 anni
Stefania Spina
Esercitazioni di statistica
35/42
Descrivere insieme di dati
La rappresentazione grafica dei dati
Grafici per dati discreti
Grafici per dati continui
Diagramma a punti
Istogramma
Rappresentazioni di tipo informatico
Costruzione di un istogramma con ampiezze delle
classi diverse
L’istogramma si compone di tanti rettangoli contigui quante sono le
classi da rappresentare.
La base del rettangolo coincide con l’ampiezza della classe
ai = xi − xi−1 .
Per costruire il rettangolo occorre definire l’altezza, definita densità
di frequenza, data dal rapporto hi = anii
Stefania Spina
Esercitazioni di statistica
36/42
Descrivere insieme di dati
La rappresentazione grafica dei dati
Grafici per dati discreti
Grafici per dati continui
Diagramma a punti
Istogramma
Rappresentazioni di tipo informatico
Esempio: Istogramma con ampiezze delle classi
diverse
Stefania Spina
Esercitazioni di statistica
37/42
Descrivere insieme di dati
La rappresentazione grafica dei dati
Grafici per dati discreti
Grafici per dati continui
Diagramma a punti
Istogramma
Rappresentazioni di tipo informatico
Esempio: Istogramma con ampiezze delle classi
diverse
Stefania Spina
Esercitazioni di statistica
38/42
Descrivere insieme di dati
La rappresentazione grafica dei dati
Grafici per dati discreti
Grafici per dati continui
Diagramma a punti
Istogramma
Rappresentazioni di tipo informatico
Esercizio: Istogramma con ampiezze delle classi
diverse
Stefania Spina
Esercitazioni di statistica
39/42
Descrivere insieme di dati
La rappresentazione grafica dei dati
Grafici per dati discreti
Grafici per dati continui
Diagramma a punti
Istogramma
Rappresentazioni di tipo informatico
Esercizio: Istogramma con ampiezze delle classi
diverse
Stefania Spina
Esercitazioni di statistica
40/42
Descrivere insieme di dati
La rappresentazione grafica dei dati
Grafici per dati discreti
Grafici per dati continui
Diagramma a punti
Istogramma
Rappresentazioni di tipo informatico
Ideogrammi o pittogrammi
Gli ideogrammi o pittogrammi sono rappresentazioni grafiche aventi carattere molto
divulgativo perché si avvalgono di figure, simboli, generalmente tutti simili tra loro,
aventi un’immediata attinenza con il carattere considerato (figure umane, oggetti ecc.)
e di grandezza o numero variabile per indicare l’entità della frequenza o dell’intensità
del carattere rappresentato.
Qualsiasi carattere statistico (qualitativo o quantitativo) può essere rappresentato con
questa tipologia di grafici.
Stefania Spina
Esercitazioni di statistica
41/42
Descrivere insieme di dati
La rappresentazione grafica dei dati
Grafici per dati discreti
Grafici per dati continui
Diagramma a punti
Istogramma
Rappresentazioni di tipo informatico
Le facce di Chernoff
Le facce di Chernoff sono una rappresentazione grafica particolare in
cui si utilizzano i tratti di un volto (occhi, naso, bocca) per
rappresentare le diverse componenti di un’informazione.
Tali rappresentazioni sono adatte sia per distribuzioni statistiche
semplici che multiple.
Stefania Spina
Esercitazioni di statistica
42/42