Lucidi Lezione 2 - Dipartimento di Economia, Statistica e Finanza

Corso di Laurea: Economia Aziendale
Insegnamento: Statistica (Ia parte)
Docente: G.Latorre, D.Costanzo, M.Misuraca
Docente: G.Latorre, D.Costanzo, M.Misuraca
Lezione n° 02
1 – Descrivere (statisticamente) una popolazione
L d
La descrizione di una popolazione passa attraverso due fasi:
ii
di
l i
tt
d f i
la formazione dei dati
la formazione dei dati
la sintesi dei dati
la sintesi dei dati
La formazione del dato statistico prevede:
1) l’osservazione del fenomeno oggetto di studio sulle unità del collettivo statistico
2) l’annotazione sistematica, unità per unità, della modalità rilevata
Per ogni unità statistica si dispone, in generale, di un’ingente mole di informazioni che occorre P
i ità t ti ti
i di
i
l di ’i
t
l di i f
i i h
organizzare sistematicamente al fine di renderne agevole l’elaborazione
Il processo di raccolta dei dati sulle unità statistiche può essere realizzata ad esempio con la compilazione di questionari
L’insieme dei dati relativi ai caratteri rilevati su una stessa popolazione è detto Data Set
La sintesi dei dati avviene attraverso l’uso di strumenti matematico/statistici
Corso di Laurea: Economia Aziendale
Insegnamento: Statistica (Ia parte)
Docente: G.Latorre, D.Costanzo, M.Misuraca
Docente: G.Latorre, D.Costanzo, M.Misuraca
2 – Le distribuzioni statistiche
Lezione n° 02
LLe distribuzioni statistiche
di t ib i i t ti ti h descrivono il modo in cui uno o più caratteri, rappresentativi di un d
i
il
d i
i
iù
tt i
t ti i di
certo fenomeno, si manifestano (d’ora in avanti diremo “si distribuiscono”) in una popolazione oggetto di studio
L’elenco delle modalità osservate, unità per unità si chiama distribuzione unitaria
Possiamo considerare diversi tipi di distribuzione a seconda di quanti caratteri statistici Possiamo
considerare diversi tipi di distribuzione a seconda di quanti caratteri statistici
prendiamo in considerazione:
un singolo carattere statistico (quantitativo o qualitativo) ‐> distribuzione unitaria semplice
più caratteri statistici (quantitativi o qualitativi) ‐> distribuzione unitaria multipla
un caso particolare è quello in cui consideriamo solo due caratteri: in tal caso si parla in generale di distribuzioni doppie
in tal caso si parla in generale di distribuzioni doppie
A seconda del numero di caratteri studiati dobbiamo utilizzare strumenti diversi per analizzare p
per un solo carattere, di statistica bivariata
p
,
per due p
il fenomeno: si parla di statistica univariata
caratteri e di statistica multivariata per più caratteri: in questo parte del corso studieremo gli strumenti della statistica univariata e bivariata
Corso di Laurea: Economia Aziendale
Insegnamento: Statistica (Ia parte)
Docente: G.Latorre, D.Costanzo, M.Misuraca
Docente: G.Latorre, D.Costanzo, M.Misuraca
3 – Rappresentazione statistica dei dati
Lezione n° 02
Quando parliamo di “rappresentazione statistica” dei dati stiamo in effetti rappresentando in Q
d
li
di “
t i
t ti ti ” d i d ti ti
i ff tti
t d i
che modo il carattere (fenomeno) oggetto di studio si manifesta nel collettivo, cioè la sua distribuzione
Da un punto di vista formale possiamo utilizzare una tabella per rappresentare la distribuzione
Codice intervista Sesso Età Altezza Colore
(unità statistiche)
occhi
1
F
23
156
Neri
…
2
F
26
171
Verdi …
3
M
23
175
Castani …
4
F
28
163
Neri
…
5
M
21
170
Azzurri …
6
M
24
184
Castani …
7
M
28
178
Castani …
8
F
20
165
Azzurri …
9
F
19
166
Verdi …
10
M
22
180
Neri
…
…
…
…
…
…
…
In questa tabella abbiamo allo stesso tempo più caratteri, sia quantitativi che qualitativi, quindi possiamo parlare di distribuzione unitaria multipla: ciascuna colonna (esclusa la prima) può però anche essere vista come una distribuzione unitaria semplice (del
distribuzione unitaria semplice (del sesso, dell’età, dell’altezza, …). Ogni cella rappresenta l’osservazione di quel carattere per l’unità indicata sulla riga corrispondente
Corso di Laurea: Economia Aziendale
Insegnamento: Statistica (Ia parte)
Docente: G.Latorre, D.Costanzo, M.Misuraca
Docente: G.Latorre, D.Costanzo, M.Misuraca
Lezione n° 02
4 – Notazione
Popolazione di N elementi →
P= {u1 , u2 , ..., ui , ..., un }
ui = i‐esima unità statistica
(per i=1,2,...,n)
indica una generica unità della popolazione
i = può assumere qualsiasi valore intero compreso tra 1 e N
N = numerosità della popolazione
Per i caratteri utilizzeremo le lettere maiuscole, mentre per le modalità quelle minuscole: Carattere → X (qualitativo o quantitativo)
X (qualitativo o quantitativo)
Modalità → x 1 , x 2 , ..., x i , ..., x n
modalità del carattere X osservata sulla i‐esima unità statistica
Le modalità non sono distinte: una modalità può essere osservata/misurata su più unità
Corso di Laurea: Economia Aziendale
Insegnamento: Statistica (Ia parte)
Docente: G.Latorre, D.Costanzo, M.Misuraca
Docente: G.Latorre, D.Costanzo, M.Misuraca
5 – Distribuzioni di frequenze
Lezione n° 02
Quando abbiamo tantissime unità statistiche può non essere conveniente avere una lunga lista con tutte le modalità osservate:
Nello studiare un collettivo di aziende proviamo ad es. a rispondere alle seguenti domande:
Qual è l’assetto societario più frequente? Qual è la percentuale di aziende che hanno un numero di addetti inferiore a 15?
In tal caso è possibile utilizzare una diversa rappresentazione dei dati, più “compatta”, detta distribuzione di frequenze: dobbiamo prendere in considerazione un carattere per volta, quindi se la nostra distribuzione unitaria multipla è composta da 4 caratteri è necessario costruire 4 distinte distribuzioni di frequenza
Per rappresentare i dati come distribuzione di frequenza innanzi tutto dobbiamo fare un elenco di tutte le modalità che sono state osservate nel collettivo, quindi contare su quante unità statistiche abbiamo osservato quella specifica modalità
Corso di Laurea: Economia Aziendale
Insegnamento: Statistica (Ia parte)
Docente: G.Latorre, D.Costanzo, M.Misuraca
Docente: G.Latorre, D.Costanzo, M.Misuraca
6 – Serie storiche e territoriali
Lezione n° 02
È possibile considerare un particolare tipo di distribuzione comunemente utilizzata per studiare in che modo un certo fenomeno si è evoluto/presentato in tempi o luoghi differenti
Se il nostro riferimento è il tempo parliamo di serie storica: rappresenta l’evoluzione temporale di un carattere quantitativo (ad es. il prezzo di un prodotto rilevato anno per anno in un dato arco di tempo le quotazioni di un titolo nelle diverse giornate di contrattazione in Borsa ecc )
tempo, le quotazioni di un titolo nelle diverse giornate di contrattazione in Borsa, ecc.)
Se il nostro riferimento è lo spazio parliamo di serie territoriale: rappresenta la manifestazione di Se
il nostro riferimento è lo spazio parliamo di serie territoriale: rappresenta la manifestazione di
un carattere quantitativo in un dato istante in luoghi differenti (ad es. il numero di turisti in un dato anno rilevati per ogni regione d’Italia, il numero di addetti dei diversi stabilimenti posseduti da una certa industria)
Ovviamente per studiare tali distribuzioni esistono degli strumenti particolari, ma in generale per d
descrivere i dati è possibile utilizzare anche tutti gli strumenti che vedremo durante questo corso
i
i d ti è
ibil tili
h t tti li t
ti h
d
d
t
t
Corso di Laurea: Economia Aziendale
Insegnamento: Statistica (Ia parte)
Docente: G.Latorre, D.Costanzo, M.Misuraca
Docente: G.Latorre, D.Costanzo, M.Misuraca
Lezione n° 02
7 – Notazione
In generale una distribuzione di frequenze per un carattere con k modalità distinte si presenta nella forma:
X
n
x1
n1
x2
n2
…
…
xi
ni
…
…
xk
nk
totale
N
Nel prosieguo indicheremo con:
xi la generica i‐esima modalità del carattere X (con i=1,2,…,k)
ni la i‐esima frequenza della modalità xi
La frequenza indica equivalentemente:
1) il numero di volte che la modalità è stata rilevata sul collettivo
2) il numero di unità statistiche che presentano la stessa modalità
k
N = ∑ n i = n 1 + n 2 + ...+ n i + ...+ n k
i= 1
Si legge “sommatoria per i che va da 1 a k di n con i”
Corso di Laurea: Economia Aziendale
Insegnamento: Statistica (Ia parte)
Docente: G.Latorre, D.Costanzo, M.Misuraca
Docente: G.Latorre, D.Costanzo, M.Misuraca
8 – Esempio
Lezione n° 02
Corso di Laurea: Economia Aziendale
Insegnamento: Statistica (Ia parte)
Docente: G.Latorre, D.Costanzo, M.Misuraca
Docente: G.Latorre, D.Costanzo, M.Misuraca
9 – Esercizio
Lezione n° 02
È stato effettuato un sondaggio tra i consumatori di una marca di succo di frutta
per rilevare il gusto preferito. Di seguito sono riportate le preferenze registrate:
PERA PESCA ALBICOCCA ANANAS MELA ARANCIA MELA PESCA
ALBICOCCA MELA PESCA MELA PESCA ALBICOCCA ANANAS PERA
PESCA ALBICOCCA ANANAS PERA ALBICOCCA PESCA ARANCIA PERA
PERA ANANAS MELA PERA ALBICOCCA MELA ARANCIA PERA MELA
ARANCIA ALBICOCCA PERA PESCA MELA ANANAS ARANCIA PESCA
PESCA ARANCIA PERA PERA ANANAS MELA PERA ALBICOCCA MELA
1) Indicare inoltre qual è il collettivo la sua numerosità la natura del carattere studiato
1) Indicare inoltre qual è il collettivo, la sua numerosità, la natura del carattere studiato
2) Costruire la distribuzione di frequenza del carattere “gusto preferito”
3) Quanti sono i consumatori che preferiscono il succo di frutta alla pera?
Corso di Laurea: Economia Aziendale
Insegnamento: Statistica (Ia parte)
Docente: G.Latorre, D.Costanzo, M.Misuraca
Docente: G.Latorre, D.Costanzo, M.Misuraca
10 – Migliorare la leggibilità dei dati
Lezione n° 02
Abbiamo visto come in presenza di tantissime osservazioni sia conveniente trasformare la lista dei dati, che abbiamo chiamato distribuzione unitaria (semplice per un solo carattere, multipla per più caratteri), in una distribuzione di frequenza
In tal modo abbiamo una rappresentazione compatta di tutte le informazioni raccolte: qual è il carattere, quali sono le modalità, quanto grande è il collettivo, quante unità statistiche hanno presentato ciascuna delle diverse modalità
Questa rappresentazione in taluni casi non è sufficiente. Supponiamo infatti di considerare per d
due collettivi la distribuzione di frequenza del carattere Genere:
ll tti i l di t ib i
di f
d l
tt
G
Genere
n
Genere
n
Maschile
45
Maschile
75
Femminile
55
Femminile
55
Dalla lettura delle due tabelle vediamo come Dalla
lettura delle due tabelle vediamo come
nel secondo collettivo ci siano più soggetti di genere maschile ma lo stesso numero di soggetti di genere femminile
soggetti di genere femminile
Corso di Laurea: Economia Aziendale
Insegnamento: Statistica (Ia parte)
Docente: G.Latorre, D.Costanzo, M.Misuraca
Docente: G.Latorre, D.Costanzo, M.Misuraca
11 – Frequenze assolute e relative
Lezione n° 02
SSe nella lettura della tabella precedente non teniamo conto della diversa numerosità del ll l tt
d ll t b ll
d t
t i
t d ll di
ità d l
collettivo siamo portati a credere che “l’importanza” del genere femminile sia esattamente
la stessa quando invece non è così
Dobbiamo allora considerare il numero di unità statistiche che presentano una certa modalità in rapporto alla dimensione del collettivo che stiamo esaminando
Il conteggio delle unità statistiche che presentano una certa modalità, che abbiamo indicato come frequenza, è definito più correttamente come frequenza assoluta, per distinguerlo dal conteggio delle unità statistiche che presentano una certa modalità del carattere in relazione
conteggio delle unità statistiche che presentano una certa modalità del carattere in relazione alla numerosità del collettivo, detto frequenza relativa
p
(
q
q
)
I dati riportati nella tabella (distribuzione di frequenze con frequenze assolute) sono trasformati dividendo ciascuna frequenza assoluta per la numerosità del collettivo, ottenendo così una nuova rappresentazione dei dati (distribuzione di frequenze con frequenze relative)
In tal modo nella lettura dei dati possiamo indicare anche il peso che quella modalità ha nella descrizione del collettivo rispetto al carattere che ci interessa
Corso di Laurea: Economia Aziendale
Insegnamento: Statistica (Ia parte)
Docente: G.Latorre, D.Costanzo, M.Misuraca
Docente: G.Latorre, D.Costanzo, M.Misuraca
Lezione n° 02
12 – Notazione
IIn generale una distribuzione di frequenze relative per un carattere con k
l
di t ib i
di f
l ti
tt
k modalità distinte si d lità di ti t i
presenta nella forma:
X
f
x1
f1
x2
f2
…
…
xi
fi
…
…
xk
fk
totale
1
0 ≤ fi ≤ 1
Nel prosieguo indicheremo con:
xi la generica i‐esima modalità del carattere X (con i=1,2,…,k)
fi la i‐esima frequenza relativa della modalità xi
ni
fi =
, i=1,2,...,k
N
La frequenza relativa indica:
1) l’importanza della i‐esima modalità nel collettivo studiato
2) il numero di unità statistiche che presentano la stessa modalità rispetto alla dimensione del collettivo
k
∑
i= 1
fi = f1 + f2 + ...+ fi + ...+ fk = 1
Corso di Laurea: Economia Aziendale
Insegnamento: Statistica (Ia parte)
Docente: G.Latorre, D.Costanzo, M.Misuraca
Docente: G.Latorre, D.Costanzo, M.Misuraca
Lezione n° 02
13 – Esempio
Consideriamo di voler studiare il n°
C
id i
di l t di
il ° di figli per famiglia in un collettivo di 50 famiglie, indicato di fi li
f i li i
ll tti di 50 f i li i di t
con A, e in un secondo collettivo di 100 famiglie, indicato con B
n
0
5
1
12
2
19
3
9
4
4
5
1
Totale 50
X
n
0
20
1
10
2
35
3
15
4
10
5
10
Totale 100
COLLETT
TIVO B
COLLETT
TIVO A
X
• È corretto affermare
ff
che
h la
l famiglie
f i li con un figlio
fi li
sono più numerose nel collettivo A?
• È corretto
tt affermare
ff
che
h la
l famiglie
f i li con due
d figli
fi li
sono più numerose nel collettivo B?
• In A le famiglie con un figlio sono lo 0,24 del totale
delle famiglie, mentre in B sono lo 0,1. Le famiglie
con un solo figlio sono più numerose in A
• In A le famiglie con due figli sono lo 0,38 del totale
delle famiglie, mentre in B sono lo 0,35. Le famiglie
con due figli sono più numerose in A
X
0
1
2
3
4
5
Totale
n
5
12
19
9
4
1
50
A
f
n
0,10
,
20
0,24 10
0,38 35
0,18 15
0 08 10
0,08
0,02 10
1 100
B
f
0,20
,
0,10
0,35
0,15
0 10
0,10
0,10
1
Corso di Laurea: Economia Aziendale
Insegnamento: Statistica (Ia parte)
Docente: G.Latorre, D.Costanzo, M.Misuraca
Docente: G.Latorre, D.Costanzo, M.Misuraca
Lezione n° 02
14 – Frequenze percentuali
ÈÈ possibile una ulteriore trasformazione dei dati che ne facilita la comprensione e li rende di possibile una ulteriore trasformazione dei dati che ne facilita la comprensione e li rende di
fatto fruibili a tutta la collettività
Moltiplicando le frequenze relative per cento si rappresentano i dati in termini percentuali: in Moltiplicando
le frequenze relative per cento si rappresentano i dati in termini percentuali: in
questo modo è come se stessimo considerando un ipotetico collettivo di 100 unità statistiche nel quale il numero di unità che presentano una certa modalità è proporzionale a quello che si è osservato nella realtà e sul quale abbiamo rilevato i dati
q
Sesso
Fr. relativa
perc.
Sesso
Fr. relativa
perc.
M hil
Maschile
45/100 0 45
45/100=0,45
45%
M hil
Maschile
75/130 0 58
75/130=0,58
58%
Femminile
55/100=0,55
55%
Femminile
55/130=0,42
42%
Totale
100/100=1
100/100
1
100%
Totale
130/130=1
130/130
1
100%
Il 45% dei soggetti del primo collettivo è di sesso maschile, a fronte di un 55% di sesso femminile. Nel secondo le percentuali sono rispettivamente del 58% e del 42%
d l
Dalla lettura delle due tabelle si ricava che il peso relativo dei soggetti di sesso maschile è più basso nel secondo collettivo: se questo fosse stato composto da 100 unità come il primo avremmo dovuto osservato solo 42 unità invece di 55 per avere la stessa importanza
Corso di Laurea: Economia Aziendale
Insegnamento: Statistica (Ia parte)
Docente: G.Latorre, D.Costanzo, M.Misuraca
Docente: G.Latorre, D.Costanzo, M.Misuraca
Lezione n° 02
15 – Notazione
In generale una distribuzione di frequenze percentuali per un carattere con k modalità distinte si presenta nella forma:
X
p
x1
p1
x2
p2
…
…
xi
pi
…
…
xk
pk
totale
1
Nel prosieguo indicheremo con:
xi la generica i‐esima modalità del carattere X (con i=1,2,…,k)
pi la i‐esima frequenza percentuale della modalità xi
ni
pi = x 100 = fi x 100 (i=1,2,...,k)
N
La frequenza percentuale indica:
1) l’importanza della modalità in un ipotetico collettivo di 100 unità
2) l numero di unità statistiche che presentano la stessa modalità in l numero di unità statistiche che presentano la stessa modalità in
un ipotetico collettivo di 100 unità statistiche
k
0 ≤ pi ≤ 100
∑
i= 1
p i = p 1 + p 2 + ...+ p i + ...+ p k = 1 0 0
Corso di Laurea: Economia Aziendale
Insegnamento: Statistica (Ia parte)
Docente: G.Latorre, D.Costanzo, M.Misuraca
Docente: G.Latorre, D.Costanzo, M.Misuraca
16 – Un diverso tipo di rappresentazione
Lezione n° 02
L’utilizzo di tabelle riepilogative è senza dubbio molto utile, sia perché abbiamo immediatamente un quadro generale della manifestazione del fenomeno che ci interessa nel collettivo oggetto di studio sia perché in tal modo possiamo presentare a terzi i risultati della nostra rilevazione con un
studio sia perché in tal modo possiamo presentare a terzi i risultati della nostra rilevazione con un buon livello informativo (non tutti studiano la Statistica…)
Esiste un altro strumento molto importante per la rappresentazione dei dati che presenta talvolta p
p
pp
p
un potere informativo superiore a quello delle distribuzioni: si tratta in sostanza di effettuare una ulteriore trasformazione dei dati e di rappresentarli sotto forma di grafico
I grafici sono più veloci e più semplici da interpretare di una tabella, e soddisfano tre esigenze:
1) dare una visione d’insieme efficace del fenomeno
2) rendere possibile il confronto tra fenomeni diversi, al fine di scoprire delle relazioni tra loro 3) aumentare l’intelligibilità dei dati e delle loro elaborazioni facilitandone una lettura di sintesi
3) aumentare l’intelligibilità dei dati e delle loro elaborazioni facilitandone una lettura di sintesi
Corso di Laurea: Economia Aziendale
Insegnamento: Statistica (Ia parte)
Docente: G.Latorre, D.Costanzo, M.Misuraca
Docente: G.Latorre, D.Costanzo, M.Misuraca
Lezione n° 02
17 – Rappresentazioni grafiche
Esistono tantissime rappresentazioni grafiche: alcune sono più idonee a rappresentare i caratteri quantitativi (discreti o continui), altre a rappresentare i caratteri qualitativi (sconnessi o ordinali)
Ovviamente la scelta del tipo di rappresentazione influenza notevolmente la comprensione del fenomeno perché in assenza di una tabella esplicativa in alcuni casi non abbiamo più nessuna idea di come i dati si sono presentati nel collettivo, soprattutto se, come visto, abbiamo delle frequenze p
p
q
relative o percentuali
Grafici a nastri
per caratteri qualitativi (non ordinati) e quantitativi
Grafici a barre
per caratteri qualitativi e caratteri quantitativi
Grafici ad aree
per caratteri quantitativi continui nel tempo
Grafici a torta
per caratteri qualitativi non ordinati o ordinati ciclici
Grafici radar
Grafici radar
per caratteri ciclici
per caratteri ciclici
Corso di Laurea: Economia Aziendale
Insegnamento: Statistica (Ia parte)
Docente: G.Latorre, D.Costanzo, M.Misuraca
Docente: G.Latorre, D.Costanzo, M.Misuraca
Lezione n° 02
18 – Caratteristiche di un grafico
Affinché la rappresentazione grafica sia di chiara ed univoca interpretazione è necessario che nella sua costruzione vengano rispettate alcune regole
Titolo del grafico
È necessario innanzi tutto che nel titolo del grafico ci sia l’indicazione del tipo di carattere e del collettivo:
60
Titolo asse
50
40
30
“
l d d d
à
“Percentuale di individui con età >17
per indice di massa corporea”
20
10
0
Sottopeso Normopeso Sovrappeso
Titolo asse
Obeso
ÈÈ poi necessario indicare le modalità poi necessario indicare le modalità
del carattere che studiamo, e l’unità di misura se è quantitativo
Corso di Laurea: Economia Aziendale
Insegnamento: Statistica (Ia parte)
Docente: G.Latorre, D.Costanzo, M.Misuraca
Docente: G.Latorre, D.Costanzo, M.Misuraca
Lezione n° 02
19 – Grafici a nastri e a barre
Nelle rappresentazioni grafiche a nastri e a barre rappresentiamo le distribuzioni unitarie semplici N
ll
t i i fi h
ti
b
ti
l di t ib i i it i
li i
per caratteri quantitativi (discreti o continui) e le distribuzioni di frequenza assoluta per caratteri qualitativi (ordinati rettilinei o non ordinati)
GRAFICO A BARRE
GRAFICO A NASTRI
Percentuale di individui con più di 17 anni per indice di massa corporea
Stranieri residenti per area geografica
60
Nord
50
40
C t
Centro
%
30
20
Mezzogiorno
10
0
100
200
300
400
500
migliaia
600
700
800
900
0
Sottopeso
Normopeso
Sovrappeso
Obeso
Corso di Laurea: Economia Aziendale
Insegnamento: Statistica (Ia parte)
Docente: G.Latorre, D.Costanzo, M.Misuraca
Docente: G.Latorre, D.Costanzo, M.Misuraca
Lezione n° 02
20 – Grafici a barre 3D o multiple
Nelle rappresentazioni grafiche a barre possiamo anche operare delle modifiche di ordine formale o sostanziale: infatti possiamo utilizzare una rappresentazione a barre tridimensionale per puro gusto estetico oppure possiamo affiancare più grafici a barre per effettuare un confronto tra più distribuzioni
Distribuzione del titolo di studio
70
8863
9,000
8251
8,000
7,000
6119
60
50
6,000
1971
40
5,000
4,000
3,000
Occupati per settore di attività
1981
1991
30
1895
2,000
1,000
2001
20
1176
10
0
Laurea
Maturità
Qualif. Profess.
0
Licenza media
Lic. Elementare
Agricoltura
Industria
Servizi
Corso di Laurea: Economia Aziendale
Insegnamento: Statistica (Ia parte)
Docente: G.Latorre, D.Costanzo, M.Misuraca
Docente: G.Latorre, D.Costanzo, M.Misuraca
Lezione n° 02
21 – Grafici ad aree
Quando dobbiamo rappresentare dei caratteri quantitativi continui nel tempo può essere utile utilizzare le rappresentazioni ad aree: anche in tal caso come nel precedente è possibile inserire nel grafico un unico collettivo o confrontare il fenomeno che ci interessa in diversi collettivo
Distribuzione del titolo di studio
Occupati per settore di attività
4,000
100
3,500
90
3,000
80
2,500
70
2,000
60
50
1,500
40
1,000
30
500
20
0
1995
10
1996
1997
1998
1999
0
2000
2001
Servizi
Industria
Agricoltura
g
Corso di Laurea: Economia Aziendale
Insegnamento: Statistica (Ia parte)
Docente: G.Latorre, D.Costanzo, M.Misuraca
Docente: G.Latorre, D.Costanzo, M.Misuraca
Lezione n° 02
22 – Grafici a torta
Nella rappresentazione a torta (a due o tre dimensioni) possiamo rappresentare la distribuzione di frequenze percentuali di un fenomeno espresso per mezzo di un carattere qualitativo
Distribuzione per provincia di residenza dei laureati del Lazio in cerca di prima occupazione
RI
10%
FR
20%
Fetta : x = Torta : 360°
RM
45%
LT
25%
RM
LT
L’idea è che ogni “fetta” della torta è proporzionale alla manifestazione del carattere in quella unità statistica Se
carattere in quella unità statistica. Se volessimo tracciarlo manualmente:
FR
VT
RI
Con questa proporzione troviamo l’angolo di una fetta, noto il fatto che il cerchio ha un angolo di 360
(la fetta è il numero di unità con quella specifica modalità, la torta la dimensione del collettivo)
dimensione del collettivo)
Corso di Laurea: Economia Aziendale
Insegnamento: Statistica (Ia parte)
Docente: G.Latorre, D.Costanzo, M.Misuraca
Docente: G.Latorre, D.Costanzo, M.Misuraca
Lezione n° 02
23 – Grafici a radar
1996
Per i fenomeni che è possibile rappresentare con dei caratteri qualitativi ciclici (ad es. quelli che osserviamo nei diversi mesi dell’anno
nei diversi mesi dell
anno o nei diversi giorni della o nei diversi giorni della
settimana) è idonea una rappresentazione detta “a radar” per la sua particolare forma
Su uno stesso grafico possiamo rappresentare più collettivi (in questo esempio il collettivo è l’anno, le unità i diversi mesi). L’area evidenziata è proporzionale alla dimensione del fenomeno nel collettivo
Matrimoni per mese di celebrazione
1994
1995
1996
1997
1998
Gen.
Feb.
Mar.
Apr.
Mag.
Giu.
Lug.
Ago.
Set.
Ott.
Nov.
Dic.
8.441
8.174
7.451
7.155
7.189
8.188
8.567
7.911
7.025
8.647
8.606
9.597
9.560
8.178
9.048
28.253
25.051
23.423
24.104
20.653
27.386
28.337
24.953
27.663
31.023
40.762
40.208
45.000
40.649
38.732
36.473
36.362
30.745
33.988
33.659
24.715
23.433
26.391
29.019
29.392
54.816
58.655
53.837
50.395
51.106
32.892
30.109
29.810
29.686
30.938
4.973
4.725
4.898
4.807
4.663
16.102
16.791
14.632
15.069
14.984