Esercitazione
2
A. Iodice
Frequenze
cumulate
Esercitazione 2
Frequenze
retrocumulate
Statistica
Funzione di
ripartizione
empirica
Alfonso Iodice D’Enza
[email protected]
Indici robusti
Università degli studi di Cassino
A. Iodice ()
Esercitazione 2
Statistica
1 / 41
Outline
Esercitazione
2
A. Iodice
Frequenze
cumulate
1
Frequenze cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
A. Iodice ()
Esercitazione 2
Statistica
2 / 41
Outline
Esercitazione
2
A. Iodice
Frequenze
cumulate
1
Frequenze cumulate
2
Frequenze retrocumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
A. Iodice ()
Esercitazione 2
Statistica
2 / 41
Outline
Esercitazione
2
A. Iodice
Frequenze
cumulate
1
Frequenze cumulate
2
Frequenze retrocumulate
3
Funzione di ripartizione empirica
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
A. Iodice ()
Esercitazione 2
Statistica
2 / 41
Outline
Esercitazione
2
A. Iodice
Frequenze
cumulate
1
Frequenze cumulate
2
Frequenze retrocumulate
3
Funzione di ripartizione empirica
4
Indici robusti
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
A. Iodice ()
Esercitazione 2
Statistica
2 / 41
Distribuzioni cumulate
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
frequenza cumulata
la frequenza assoluta cumulata corrispondente ad una data
modalità di un carattere, indica il numero di unità della
popolazione considerata che presentano un valore del carattere
minore o uguale a quella modalità. Analogamente, le frequenze
cumulate relative e percentuali fanno riferimento a frazioni del
collettivo considerato.
A. Iodice ()
Esercitazione 2
Statistica
3 / 41
Distribuzioni cumulate
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
frequenza cumulata
la frequenza assoluta cumulata corrispondente ad una data
modalità di un carattere, indica il numero di unità della
popolazione considerata che presentano un valore del carattere
minore o uguale a quella modalità. Analogamente, le frequenze
cumulate relative e percentuali fanno riferimento a frazioni del
collettivo considerato.
frequenze assolute cumulate
La frequenza assoluta cumulata Nj della j-esima modalità è
data da:
Nj = n1 + n2 + . . . + nj
A. Iodice ()
Esercitazione 2
Statistica
3 / 41
Distribuzioni cumulate
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
frequenze relative cumulate
La frequenza relativa cumulata Fj della j-esima modalità è
data da:
Fj = f1 + f2 + . . . + fj
Indici robusti
A. Iodice ()
Esercitazione 2
Statistica
4 / 41
Distribuzioni cumulate
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
frequenze relative cumulate
La frequenza relativa cumulata Fj della j-esima modalità è
data da:
Fj = f1 + f2 + . . . + fj
frequenze percentuali cumulate
La frequenza percentuale cumulata Pj della j-esima modalità è
data da:
Pj = p1 + p2 + . . . + pj
A. Iodice ()
Esercitazione 2
Statistica
4 / 41
Distribuzioni cumulate: tabelle
Esercitazione
2
Distribuzioni cumulate
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
A. Iodice ()
Esercitazione 2
Statistica
5 / 41
Distribuzioni cumulate: tabelle
Esercitazione
2
Distribuzioni cumulate
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
A. Iodice ()
Esercitazione 2
Statistica
5 / 41
Distribuzioni cumulate: tabelle
Esercitazione
2
Distribuzioni cumulate
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
A. Iodice ()
Esercitazione 2
Statistica
5 / 41
Distribuzioni retrocumulate
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
frequenza retrocumulata
la frequenza assoluta retrocumulata corrispondente ad una data
modalità di un carattere, indica il numero di unità della
popolazione considerata che presentano un valore del carattere
maggiore o uguale a quella modalità. Analogamente, le
frequenze retrocumulate relative e percentuali fanno riferimento
a frazioni del collettivo considerato.
A. Iodice ()
Esercitazione 2
Statistica
6 / 41
Distribuzioni retrocumulate
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
frequenza retrocumulata
la frequenza assoluta retrocumulata corrispondente ad una data
modalità di un carattere, indica il numero di unità della
popolazione considerata che presentano un valore del carattere
maggiore o uguale a quella modalità. Analogamente, le
frequenze retrocumulate relative e percentuali fanno riferimento
a frazioni del collettivo considerato.
frequenze assolute retrocumulate
La frequenza assoluta retrocumulata RNj della j-esima delle
K modalità del carattere è data da:
RNj = nj + nj+1 + . . . + nK
A. Iodice ()
Esercitazione 2
Statistica
6 / 41
Distribuzioni retrocumulate
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
frequenze relative retrocumulate
La frequenza relativa retrocumulata RFj della j-esima delle K
modalità del carattere è data da:
Funzione di
ripartizione
empirica
RFj = fj + fj+1 + . . . + fK
Indici robusti
A. Iodice ()
Esercitazione 2
Statistica
7 / 41
Distribuzioni retrocumulate
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
frequenze relative retrocumulate
La frequenza relativa retrocumulata RFj della j-esima delle K
modalità del carattere è data da:
Funzione di
ripartizione
empirica
Indici robusti
RFj = fj + fj+1 + . . . + fK
frequenze percentuali retrocumulate
La frequenza percentuale cumulata Pj della j-esima delle K
modalità del carattere è data da:
RPj = pj + pj+1 + . . . + pK
A. Iodice ()
Esercitazione 2
Statistica
7 / 41
Distribuzioni cumulate: tabelle
Esercitazione
2
Distribuzioni retrocumulate
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
A. Iodice ()
Esercitazione 2
Statistica
8 / 41
Distribuzioni cumulate: tabelle
Esercitazione
2
Distribuzioni retrocumulate
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
A. Iodice ()
Esercitazione 2
Statistica
8 / 41
Distribuzioni cumulate: tabelle
Esercitazione
2
Distribuzioni retrocumulate
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
A. Iodice ()
Esercitazione 2
Statistica
8 / 41
Frequenze cumulate vs. retrocumulate
Esercitazione
2
A. Iodice
Frequenze
cumulate
E’ possibile ottenere le frequenze retrocumulate a partire dalle
cumulate, e viceversa:
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
A. Iodice ()
Esercitazione 2
Statistica
9 / 41
Frequenze cumulate vs. retrocumulate
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
E’ possibile ottenere le frequenze retrocumulate a partire dalle
cumulate, e viceversa:
RNj = nj +nj+1 +. . .+nK = N −(n1 +. . .+nj−1 ) = N −Nj−1
Funzione di
ripartizione
empirica
Indici robusti
A. Iodice ()
Esercitazione 2
Statistica
9 / 41
Frequenze cumulate vs. retrocumulate
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
E’ possibile ottenere le frequenze retrocumulate a partire dalle
cumulate, e viceversa:
RNj = nj +nj+1 +. . .+nK = N −(n1 +. . .+nj−1 ) = N −Nj−1
La stessa relazione riguarda ovviamente anche le distribuzioni
relative e percentuale.
RFj = 1 − Fj−1
RPj = 100 − Pj−1
A. Iodice ()
Esercitazione 2
Statistica
9 / 41
ottenere le frequenze di una modalità a partire
dalle distribuzioni cumulate
Esercitazione
2
A. Iodice
Supponendo di conoscere Nj , frequenza assoluta cumulata
della j-esima modalità di un carattere, si ha che
Frequenze
cumulate
Frequenze
retrocumulate
Nj = n1 + · · · + nj−1 + nj = Nj−1 + nj
da cui
nj = Nj − Nj−1
Funzione di
ripartizione
empirica
Indici robusti
ovvero basterà sottrarre alla frequenza cumulata della j-esima
modalità (Nj ) la frequenza cumulata della j − 1-esima
modalità (Nj−1 ).
A. Iodice ()
Esercitazione 2
Statistica
10 / 41
ottenere le frequenze di una modalità a partire
dalle distribuzioni cumulate
Esercitazione
2
A. Iodice
Supponendo di conoscere Nj , frequenza assoluta cumulata
della j-esima modalità di un carattere, si ha che
Frequenze
cumulate
Frequenze
retrocumulate
Nj = n1 + · · · + nj−1 + nj = Nj−1 + nj
da cui
nj = Nj − Nj−1
Funzione di
ripartizione
empirica
Indici robusti
ovvero basterà sottrarre alla frequenza cumulata della j-esima
modalità (Nj ) la frequenza cumulata della j − 1-esima
modalità (Nj−1 ).
analogamente...
fj = Fj − Fj−1
pj = Pj − Pj−1
A. Iodice ()
Esercitazione 2
Statistica
10 / 41
Funzione di ripartizione
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Si consideri il carattere X, carattere quantitativo discreto con
K + 1 modalità, tali che x0 ≤ x1 ≤ · · · ≤ xK oppure il
carattere X quantitativo continuo suddiviso in K classi
[x0 , x1 ], )x1 , x2 ], . . . , )xK−1 , xK ]; la distribuzione delle
frequenze relative cumulate pụ essere rappresentata tramite
la seguente funzione di ripartizione
Indici robusti
A. Iodice ()
Esercitazione 2
Statistica
11 / 41
Funzione di ripartizione
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
Si consideri il carattere X, carattere quantitativo discreto con
K + 1 modalità, tali che x0 ≤ x1 ≤ · · · ≤ xK oppure il
carattere X quantitativo continuo suddiviso in K classi
[x0 , x1 ], )x1 , x2 ], . . . , )xK−1 , xK ]; la distribuzione delle
frequenze relative cumulate pụ essere rappresentata tramite
la seguente funzione di ripartizione

0
per x < x0




F1
per x0 ≤ x ≤ x1



F2
per x1 < x ≤ x2
F (x) =
... ...
...





F
per
x
K
K−1 < x ≤ xK


1
per x > xK
A. Iodice ()
Esercitazione 2
Statistica
11 / 41
Esempio di costruzione di una f. di ripartizione
Esercitazione
2
A. Iodice
Si consideri il carattere età, variabile continua suddivisa in
classi e rappresentata in tabella
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
A. Iodice ()
Esercitazione 2
Statistica
12 / 41
Esempio di costruzione di una f. di ripartizione
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
la funzione di ripartizione corrispondente è...

0
per x < 10




 0.25 per 10 ≤ x ≤ 30
0.7
per 30 < x ≤ 50
F (x) =


0.9
per 50 < x ≤ 70



1
per 70 < x ≤ 90
A. Iodice ()
Esercitazione 2
Statistica
12 / 41
Rappresentazione grafica di una f. di ripartizione:
caso discreto
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
variabile discreta
n.f igli
0
1
2
3
4
A. Iodice ()
absF reqs
5
5
3
3
4
cum.F reqs
5
10
13
16
20
Esercitazione 2
relF reqs
0.25
0.25
0.15
0.15
0.2
cum.relF r.
0.25
0.50
0.65
0.80
1.00
Statistica
13 / 41
Rappresentazione grafica di una f. di ripartizione:
caso discreto
Esercitazione
2
A. Iodice
Frequenze
cumulate
Step function
la funzione di ripartizione ottenuta è rappresentabile graficamente
come segue:
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
A. Iodice ()
Esercitazione 2
Statistica
14 / 41
Rappresentazione grafica di una f. di ripartizione:
caso continuo
Esercitazione
2
A. Iodice
Frequenze
cumulate
Si consideri la distribuzione di frequenze relativa alla variabile peso in
chilogrammi.
Frequenze
retrocumulate
fino a 50
(50,55]
(55,60]
(60,65]
(65,70]
(70,75]
(75,80]
(80,85]
(85,90]
oltre 90
Funzione di
ripartizione
empirica
Indici robusti
A. Iodice ()
f.abs
4.00
3.00
2.00
2.00
2.00
3.00
1.00
0.00
2.00
1.00
f.rel
0.20
0.15
0.10
0.10
0.10
0.15
0.05
0.00
0.10
0.05
Esercitazione 2
cum.f.abs
4.00
7.00
9.00
11.00
13.00
16.00
17.00
17.00
19.00
20.00
F(x)
0.20
0.35
0.45
0.55
0.65
0.80
0.85
0.85
0.95
1.00
Statistica
15 / 41
Rappresentazione grafica di una f. di ripartizione:
caso continuo
Esercitazione
2
A. Iodice
La funzione di ripartizione è rappresentata graficamente come
segue:
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
A. Iodice ()
Esercitazione 2
Statistica
16 / 41
Proprietà della funzione di ripartizione
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
La funzione di ripartizione di una variabile X, o di una
mutabile rettilinea (ordinabile), e con campo di variazione
[x0 , xK ], gode delle seguenti proprietà:
Indici robusti
A. Iodice ()
Esercitazione 2
Statistica
17 / 41
Proprietà della funzione di ripartizione
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
La funzione di ripartizione di una variabile X, o di una
mutabile rettilinea (ordinabile), e con campo di variazione
[x0 , xK ], gode delle seguenti proprietà:
1
F (X) = 0 per x < x0
2
F (X) = 1 per x > xK
3
F (X) è una funzione non decrescente
Indici robusti
A. Iodice ()
Esercitazione 2
Statistica
17 / 41
Proprietà della funzione di ripartizione
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
La funzione di ripartizione di una variabile X, o di una
mutabile rettilinea (ordinabile), e con campo di variazione
[x0 , xK ], gode delle seguenti proprietà:
1
F (X) = 0 per x < x0
2
F (X) = 1 per x > xK
3
F (X) è una funzione non decrescente
Indici robusti
A. Iodice ()
Esercitazione 2
Statistica
17 / 41
Proprietà della funzione di ripartizione
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
La funzione di ripartizione di una variabile X, o di una
mutabile rettilinea (ordinabile), e con campo di variazione
[x0 , xK ], gode delle seguenti proprietà:
1
F (X) = 0 per x < x0
2
F (X) = 1 per x > xK
3
F (X) è una funzione non decrescente
Indici robusti
A. Iodice ()
Esercitazione 2
Statistica
17 / 41
Proprietà della funzione di ripartizione
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
La funzione di ripartizione di una variabile X, o di una
mutabile rettilinea (ordinabile), e con campo di variazione
[x0 , xK ], gode delle seguenti proprietà:
1
F (X) = 0 per x < x0
2
F (X) = 1 per x > xK
3
F (X) è una funzione non decrescente
Indici robusti
A. Iodice ()
Esercitazione 2
Statistica
17 / 41
Calcolo percentili di variabili continue (suddivise in
classi)
Esercitazione
2
Per calcolare il valore di un generico percentile α si ricorre al calcolo
dell’equazione della retta passante per due punti.
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Retta passante per due punti
Dati due punti P1 = (x1 , y1 ) e P2 = (x2 , y2 ), l’equazione dell’unica retta
passante per P1 e P2 è descritta dalla seguente equazione
(x2 − x1 ) × (y − y1 ) − (y2 − y1 ) × (x − x1 ) = 0
si ottiene la seguente equazione
Indici robusti
x × (y2 − y1 ) − x1 × (y2 − y1 ) = (x2 − x1 ) × (y − y1 )
se y1 6= y2 l’equazione può essere riscritta in forma esplicita
x(y2 − y1 ) = x1 × (y2 − y1 ) + (x2 − x1 ) × (y − y1 )
da cui
x = x1 ×
A. Iodice ()
(y2 − y1 )
(y − y1 )
+
× (x2 − x1 )
(y2 − y1 )
(y2 − y1 )
Esercitazione 2
Statistica
18 / 41
Calcolo percentili di variabili continue (suddivise in
classi)
Esercitazione
2
A. Iodice
Frequenze
cumulate
Retta passante per due punti (epilogo...)
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
x = x1 ×
(y2 − y1 )
(y − y1 )
+
× (x2 − x1 )
(y2 − y1 ) (y2 − y1 )
la forma esplicita dell’equazione della retta passante per due punti è
Indici robusti
x = x1 +
A. Iodice ()
(y − y1 )
× (x2 − x1 )
(y2 − y1 )
Esercitazione 2
Statistica
19 / 41
Calcolo percentili di variabili continue (suddivise in
classi)
Esercitazione
2
A. Iodice
Frequenze
cumulate
Si supponga di voler calcolare il 72mo percentile, ovvero sia
α = 0.72.
Individuare graficamente il percentile α
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
A. Iodice ()
Esercitazione 2
Statistica
20 / 41
Calcolo percentili di variabili continue (suddivise in
classi)
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
Utilizzo dell’interpolazione
Una volta identificati i punti che delimitano il tratto della funzione di
partizione contenente l’α-mo percentile, si ricorre alla formalizzazione
della retta
(y − y1 )
× (x2 − x1 )
x = x1 +
(y2 − y1 )
In questo, per α = 0.72 risulta
P1 = (x1 = 70, y1 = 0.65)
P2 = (x2 = 75, y2 = 0.8)
y = α = 0.72
x =?, è il valore del percentile che si vuole trovare
A. Iodice ()
Esercitazione 2
Statistica
21 / 41
Calcolo percentili di variabili continue (suddivise in
classi)
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
Utilizzo dell’interpolazione
Una volta identificati i punti che delimitano il tratto della funzione di
partizione contenente l’α-mo percentile, si ricorre alla formalizzazione
della retta
(y − y1 )
x = x1 +
× (x2 − x1 )
(y2 − y1 )
sostituendo le quantità note
x = 70 +
A. Iodice ()
(.72 − 0.65)
× (75 − 70) = 72.33
(0.8 − 0.65)
Esercitazione 2
Statistica
22 / 41
Calcolo percentili di variabili continue (suddivise in
classi)
Esercitazione
2
A. Iodice
Il valore corrispondente al 72mo percentile, ovvero sia α = 0.72.
Individuare graficamente il valore corrispondente ad α
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
A. Iodice ()
Esercitazione 2
Statistica
23 / 41
Calcolo percentili di variabili continue (suddivise in
classi)
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
approssimazione del valore di un generico percentile tramite
F (x) F. di ripartizione
Funzione di
ripartizione
empirica
xα ' x1 + (x2 − x1 )
α − F (x1 )
F (x2 ) − F (x1 )
Indici robusti
x2 è la modalità per la quale F (x2 ) ≥ α
x1 è la modalità per la quale F (x2 ) < α
A. Iodice ()
Esercitazione 2
Statistica
24 / 41
Indici robusti (o di posizione): la moda
Esercitazione
2
A. Iodice
Frequenze
cumulate
La moda di una distribuzione di frequenze si indica con M o e
corrisponde alla modalità con la frequenza assoluta (relativa)
più alta
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
A. Iodice ()
Esercitazione 2
Statistica
25 / 41
Indici robusti (o di posizione): la moda
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
La moda di una distribuzione di frequenze si indica con M o e
corrisponde alla modalità con la frequenza assoluta (relativa)
più alta
Esempio
Dato un collettivo di 10 unità statistiche, si consideri la
seguente serie di osservazioni:
{1, 2, 3, 4, 4, 4, 4, 3, 4, 1}
risulta M o = 4, dal momento che la modalità 4 presente
cinque volte nel collettivo.
A. Iodice ()
Esercitazione 2
Statistica
25 / 41
Indici robusti (o di posizione): la moda
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
classe modale
E’ possibile calcolare la moda anche per variabili quantitative
continue raggruppate in classi: se le classi sono di ampiezza
diversa si fa riferimento alla densità di frequenza e non alla
frequenza di ciascuna classe.
A. Iodice ()
Esercitazione 2
Statistica
26 / 41
Indici robusti (o di posizione): la mediana
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
La mediana M e di una distribuzione corrisponde alla modalità
osservata sulla unità statistica centrale nella distribuzione
ordinata delle osservazioni
Funzione di
ripartizione
empirica
Indici robusti
A. Iodice ()
Esercitazione 2
Statistica
27 / 41
Indici robusti (o di posizione): la mediana
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
La mediana M e di una distribuzione corrisponde alla modalità
osservata sulla unità statistica centrale nella distribuzione
ordinata delle osservazioni
variabile X discreta
Si considerino le osservazioni ordinate dal valore minimo x1 al
valore massimo xn , la mediana M e sar data da
(
x( n+1 )
se n dispari
2
Me =
x( n ) +x( n +1)
2
2
se n pari
2
A. Iodice ()
Esercitazione 2
Statistica
27 / 41
La mediana per variabili discrete (dati in
distribuzione unitaria)
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Esempio (n dispari)
Dato un collettivo di 15 unità statistiche, si consideri la
seguente serie di osservazioni:
{29, 7, 18, 15, 27, 23, 14, 1, 25, 13, 18, 24, 28, 22, 5}
Funzione di
ripartizione
empirica
Indici robusti
che ordinata in modo crescente diventa
{1, 5, 7, 13, 14, 15, 18, 18, 22, 23, 24, 25, 27, 28, 29}
la mediana è data dalla modalità che occupa la posizione
n+1
2 = 16/2 = 8, vale a dire M e = 18
A. Iodice ()
Esercitazione 2
Statistica
28 / 41
La mediana per variabili discrete (dati in
distribuzione unitaria)
Esercitazione
2
A. Iodice
Frequenze
cumulate
Esempio (n pari)
Dato un collettivo di 12 unità statistiche, si consideri la
seguente serie di osservazioni:
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
{34, 42, 1, 34, 19, 42, 25, 35, 21, 15, 9, 10}
che ordinata in modo crescente diventa
{1, 9, 10, 15, 19, 21, 25, 34, 34, 35, 42, 42}
la mediana data dalla semi somma delle modalità che occupano
le posizioni n2 = 12/2 = 6 e n2 + 1 = (12/2) + 1 = 7, vale a
dire M e = 21+25
= 46
2
2 = 23
A. Iodice ()
Esercitazione 2
Statistica
29 / 41
La mediana per variabili discrete (dati in
distribuzione unitaria)
Esercitazione
2
Tornando ai voti degli studenti...
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
A. Iodice ()
Esercitazione 2
Statistica
30 / 41
La mediana per variabili discrete (dati organizzati
in frequenze)
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Se i dati della variabile X discreta sono noti mediante una
distribuzione di frequenze (seriazione) l’individuazione della
modalità assunta dall’unità statistica di posto centrale risulta
agevole se, calcolate le frequenze relative cumulate, si
considera la funzione di ripartizione F (x) (supponendo di aver
ordinato le modalità di X in modo crescente) .
Indici robusti
A. Iodice ()
Esercitazione 2
Statistica
31 / 41
La mediana per variabili discrete (dati organizzati
in frequenze)
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
Se i dati della variabile X discreta sono noti mediante una
distribuzione di frequenze (seriazione) l’individuazione della
modalità assunta dall’unità statistica di posto centrale risulta
agevole se, calcolate le frequenze relative cumulate, si
considera la funzione di ripartizione F (x) (supponendo di aver
ordinato le modalità di X in modo crescente) .
individuare la modalità x(i−1) tale che
F (x(i−1) ) < 0.5
A. Iodice ()
Esercitazione 2
Statistica
31 / 41
La mediana per variabili discrete (dati organizzati
in frequenze)
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
Se i dati della variabile X discreta sono noti mediante una
distribuzione di frequenze (seriazione) l’individuazione della
modalità assunta dall’unità statistica di posto centrale risulta
agevole se, calcolate le frequenze relative cumulate, si
considera la funzione di ripartizione F (x) (supponendo di aver
ordinato le modalità di X in modo crescente) .
individuare la modalità x(i−1) tale che
F (x(i−1) ) < 0.5
F (x(i) ) ≥ 0.5
A. Iodice ()
Esercitazione 2
Statistica
31 / 41
La mediana per variabili discrete (dati organizzati
in frequenze)
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
Se i dati della variabile X discreta sono noti mediante una
distribuzione di frequenze (seriazione) l’individuazione della
modalità assunta dall’unità statistica di posto centrale risulta
agevole se, calcolate le frequenze relative cumulate, si
considera la funzione di ripartizione F (x) (supponendo di aver
ordinato le modalità di X in modo crescente) .
individuare la modalità x(i−1) tale che
F (x(i−1) ) < 0.5
F (x(i) ) ≥ 0.5
La mediana data da M e = xi : tra le ni unità statistiche che
presentano la modalità xi ci saranno quelle di posizione
centrale (o delle posizioni centrali se n dispari)
A. Iodice ()
Esercitazione 2
Statistica
31 / 41
La mediana per variabili discrete (dati organizzati
in frequenze)
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
A. Iodice ()
Esercitazione 2
Statistica
32 / 41
La mediana per variabili discrete (dati organizzati
in frequenze)
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
A. Iodice ()
Esercitazione 2
Statistica
32 / 41
La mediana per variabili discrete (dati organizzati
in frequenze)
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
A. Iodice ()
Esercitazione 2
Statistica
32 / 41
La mediana per variabili discrete (dati organizzati
in frequenze)
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
A. Iodice ()
Esercitazione 2
Statistica
32 / 41
La mediana per variabili continue (suddivise in
classi)
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Nel caso di variabili continue, la suddivisione in classi delle
modalità del carattere consente l’identificazione della classe
mediana: in tale classe cadrà la modalità assunta dall’unità
statistica che occupa la posizione centrale della distribuzione
ordinata delle modalità
Indici robusti
A. Iodice ()
Esercitazione 2
Statistica
33 / 41
La mediana per variabili continue (suddivise in
classi)
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Nel caso di variabili continue, la suddivisione in classi delle
modalità del carattere consente l’identificazione della classe
mediana: in tale classe cadrà la modalità assunta dall’unità
statistica che occupa la posizione centrale della distribuzione
ordinata delle modalità
approssimazione del valore M e (tramite F (x) F. di ripartizione)
Indici robusti
M e ' xi−1 + (xi − xi−1 )
0.5 − F (xi−1 )
F (xi ) − F (xi−1 )
xi la modalità per la quale F (xi ) ≥ 0.5
xi−1 la modalità per la quale F (xi−1 ) < 0.5
A. Iodice ()
Esercitazione 2
Statistica
33 / 41
La mediana per variabili continue (suddivise in
classi)
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
A. Iodice ()
Esercitazione 2
Statistica
34 / 41
La mediana per variabili continue (suddivise in
classi)
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
A. Iodice ()
Esercitazione 2
Statistica
34 / 41
La mediana per variabili continue (suddivise in
classi)
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
A. Iodice ()
Esercitazione 2
Statistica
34 / 41
La mediana per variabili continue (suddivise in
classi)
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
A. Iodice ()
Esercitazione 2
Statistica
34 / 41
La mediana per variabili continue (suddivise in
classi)
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Trovati i valori xi , xi−1 , F (xi ) e F (xi−1 ) possibile ricavare il
valore approssimato di M e
Funzione di
ripartizione
empirica
Indici robusti
A. Iodice ()
Esercitazione 2
Statistica
35 / 41
La mediana per variabili continue (suddivise in
classi)
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Trovati i valori xi , xi−1 , F (xi ) e F (xi−1 ) possibile ricavare il
valore approssimato di M e
0.5 − F (xi−1 )
=
F (xi ) − F (xi−1 )
0.5 − 0.3897
=
= 80 + (100 − 80)
0.5247 − 0.3897
= 80 + 20 × 0.817 = 96.3407
Funzione di
ripartizione
empirica
M e 'xi−1 + (xi − xi−1 )
Indici robusti
A. Iodice ()
Esercitazione 2
Statistica
35 / 41
Rappresentazione grafica di una f. di ripartizione:
caso continuo
Esercitazione
2
A. Iodice
Frequenze
cumulate
Si consideri la distribuzione di frequenze relativa alla variabile peso in
chilogrammi.
Frequenze
retrocumulate
fino a 50
(50,55]
(55,60]
(60,65]
(65,70]
(70,75]
(75,80]
(80,85]
(85,90]
oltre 90
Funzione di
ripartizione
empirica
Indici robusti
A. Iodice ()
f.abs
4.00
3.00
2.00
2.00
2.00
3.00
1.00
0.00
2.00
1.00
f.rel
0.20
0.15
0.10
0.10
0.10
0.15
0.05
0.00
0.10
0.05
Esercitazione 2
cum.f.abs
4.00
7.00
9.00
11.00
13.00
16.00
17.00
17.00
19.00
20.00
F(x)
0.20
0.35
0.45
0.55
0.65
0.80
0.85
0.85
0.95
1.00
Statistica
36 / 41
Calcolo percentili di variabili continue (suddivise in
classi)
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Utilizzo dell’interpolazione
In questo caso α = 0.5
Funzione di
ripartizione
empirica
Indici robusti
x = x1 +
(y − y1 )
× (x2 − x1 )
(y2 − y1 )
sostituendo le quantità note
x = 60 +
A. Iodice ()
(.5 − 0.45)
× (65 − 60) = 62.5 = M e
(0.55 − 0.45)
Esercitazione 2
Statistica
37 / 41
Calcolo percentili di variabili continue (suddivise in
classi)
Esercitazione
2
Individuare graficamente il valore corrispondente ad α
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
A. Iodice ()
Esercitazione 2
Statistica
38 / 41
Proprietà della mediana
Esercitazione
2
A. Iodice
la mediana sempre un valore osservato su una delle unità
statistiche oggetto di studio
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
A. Iodice ()
Esercitazione 2
Statistica
39 / 41
Proprietà della mediana
Esercitazione
2
A. Iodice
la mediana sempre un valore osservato su una delle unità
statistiche oggetto di studio
Frequenze
cumulate
Frequenze
retrocumulate
la mediana minimizza la somma degli scarti in valore
assoluto. Dato un valore c,
Funzione di
ripartizione
empirica
n
X
Indici robusti
|xi − c|
i=1
minima se (e solo se) c ≡ M e.
A. Iodice ()
Esercitazione 2
Statistica
39 / 41
Proprietà della mediana
Esercitazione
2
A. Iodice
la mediana sempre un valore osservato su una delle unità
statistiche oggetto di studio
Frequenze
cumulate
Frequenze
retrocumulate
la mediana minimizza la somma degli scarti in valore
assoluto. Dato un valore c,
Funzione di
ripartizione
empirica
n
X
Indici robusti
|xi − c|
i=1
minima se (e solo se) c ≡ M e.
resistenza della mediana ai valori estremi
A. Iodice ()
Esercitazione 2
Statistica
39 / 41
Quantili di una distribuzione
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
La mediana corrisponde alla modalità assunta dall’unità
statistica che bipartisce la distribuzione ordinata delle
osservazioni Il 50% delle unità statistiche si trova alla sinistra
della mediana, l’altro 50% alla sua destra. Analogamente
possibile definire i seguenti quantili di una distribuzione.
Funzione di
ripartizione
empirica
Indici robusti
A. Iodice ()
Esercitazione 2
Statistica
40 / 41
Quantili di una distribuzione
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
La mediana corrisponde alla modalità assunta dall’unità
statistica che bipartisce la distribuzione ordinata delle
osservazioni Il 50% delle unità statistiche si trova alla sinistra
della mediana, l’altro 50% alla sua destra. Analogamente
possibile definire i seguenti quantili di una distribuzione.
Funzione di
ripartizione
empirica
primo quartile Q1 : corrisponde alla modalità assunta
dall’unità statistica per il quale 14 n (25%) delle unità
statistiche presenta valori ad esso inferiori
Indici robusti
secondo quartile Q2 : coincide con la mediana
terzo quartile Q3 : corrisponde alla modalità assunta
dall’unità statistica per il quale 34 n (75%) delle unità
statistiche presenta valori ad esso inferiori
decili
A. Iodice ()
Esercitazione 2
Statistica
40 / 41
Quartili in distribuzione unitaria)
Esercitazione
2
A. Iodice
Frequenze
cumulate
Esempio (n dispari)
Dato un collettivo di 15 unità statistiche, si consideri la
seguente serie di osservazioni:
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
{29, 7, 18, 15, 27, 23, 14, 1, 25, 13, 18, 24, 28, 22, 5}
che ordinata in modo crescente diventa
Indici robusti
{1, 5, 7, 13, 14, 15, 18, 18, 22, 23, 24, 25, 27, 28, 29}
la posizione di Q1 (n + 1) ∗
la posizione di Q2 (n + 1) ∗
la posizione di Q3 (n + 1) ∗
A. Iodice ()
Esercitazione 2
1
4
2
4
1
4
= 16/4 = 4, Q1 = 13
= 16 ∗ 2/4 = 8, Q2 = 18
= 16 ∗ 3/4 = 12, Q3 = 25
Statistica
41 / 41
Rappresentazione grafica di una f. di ripartizione:
caso continuo
Esercitazione
2
A. Iodice
Frequenze
cumulate
Si consideri la distribuzione di frequenze relativa alla variabile peso in
chilogrammi.
Frequenze
retrocumulate
fino a 50
(50,55]
(55,60]
(60,65]
(65,70]
(70,75]
(75,80]
(80,85]
(85,90]
oltre 90
Funzione di
ripartizione
empirica
Indici robusti
A. Iodice ()
f.abs
4.00
3.00
2.00
2.00
2.00
3.00
1.00
0.00
2.00
1.00
f.rel
0.20
0.15
0.10
0.10
0.10
0.15
0.05
0.00
0.10
0.05
Esercitazione 2
cum.f.abs
4.00
7.00
9.00
11.00
13.00
16.00
17.00
17.00
19.00
20.00
F(x)
0.20
0.35
0.45
0.55
0.65
0.80
0.85
0.85
0.95
1.00
Statistica
42 / 41
Calcolo percentili di variabili continue (suddivise in
classi)
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Utilizzo dell’interpolazione
In questo caso α = 0.25
Funzione di
ripartizione
empirica
Indici robusti
x = x1 +
(y − y1 )
× (x2 − x1 )
(y2 − y1 )
sostituendo le quantità note
x = 50 +
A. Iodice ()
(.25 − 0.2)
× (55 − 50) = 51.66 = Q1
(0.35 − 0.2)
Esercitazione 2
Statistica
43 / 41
Calcolo percentili di variabili continue (suddivise in
classi)
Esercitazione
2
Individuare graficamente il valore corrispondente ad α
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
A. Iodice ()
Esercitazione 2
Statistica
44 / 41
Calcolo percentili di variabili continue (suddivise in
classi)
Esercitazione
2
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Utilizzo dell’interpolazione
In questo caso α = 0.75
Funzione di
ripartizione
empirica
Indici robusti
x = x1 +
(y − y1 )
× (x2 − x1 )
(y2 − y1 )
sostituendo le quantità note
x = 70 +
A. Iodice ()
(.75 − 0.65)
× (75 − 70) = 73.33 = Q3
(0.8 − 0.65)
Esercitazione 2
Statistica
45 / 41
Calcolo percentili di variabili continue (suddivise in
classi)
Esercitazione
2
Individuare graficamente il valore corrispondente ad α
A. Iodice
Frequenze
cumulate
Frequenze
retrocumulate
Funzione di
ripartizione
empirica
Indici robusti
A. Iodice ()
Esercitazione 2
Statistica
46 / 41