PERCENTILI E OUTLIERS
PERCENTILI E OUTLIERS
Alessandra Micheletti ‐ UniMI
1
Alessandra Micheletti ‐ UniMI
2
In Excel il p‐esimo percentile e' cosi' definito
y = (1 − g ) x j +1 + gx j + 2
dove j ; g sono la parte intera e quella decimale, rispettivamente, di (n ‐1)p.
Per il calcolo dei percentili con Excel, usare la funzione statistica
PERCENTILE(matrice;k)
ESEMPIO
Usiamo il nostro dataset.xlsx
Ordiniamo i dati per valori di Larghezza della mano destra? crescenti.
Calcoliamo il quinto percentile di x=Larghezza della mano destra? p=0,05= 5%
j=(35‐1)*0,05=1,7 quindi j=1 e g=0,7
yy=(1‐0,7)x
(1 0,7)x2+0,7x3 3 = =(0,3)*14+0,7*15,4=14,98
(0,3) 14+0,7 15,4 14,98
Alessandra Micheletti ‐ UniMI
3
Alessandra Micheletti ‐ UniMI
4
In presenza di outliers
In
presenza di outliers bisogna chiedersi se tali dati provengano o meno bisogna chiedersi se tali dati provengano o meno
dalla stessa distribuzione degli altri.
Per ilil calcolo dei quartili con Excel: usare
Per
con Excel: usare la funzione
la funzione statistica
QUARTILE(dati;quarto)
Per creare una variabile
i bil che
h effettua
ff
una verifica
ifi di una
di
condizione
di i
( d
(ad esempio verifica se un dato e’ un outlier) usare la funzione
SE(test; [se_vero]; [se_falso])
Si possono
p
usare anche p
piu’ funzioni SE una dentro l’altra p
per creare p
piu’ di due alternative
Alessandra Micheletti ‐ UniMI
5
ESERCIZIO (s ogiamolo insieme)
ESERCIZIO (svogiamolo
Usiamo il nostro dataset.xlsx Per ciascuna delle variabili
larghezza della mano destra?
lunghezza del dito medio della mano destra?
Calcolare i q
quartili Q
Q1, Q2, Q3 e identificare
,Q ,Q
ggli outliers , se presenti, , p
,
verificando se sono deboli o forti.
Alessandra Micheletti ‐ UniMI
6
ESERCIZIO per gli studenti
ESERCIZIO per gli
st denti
Usiamo il dataset genomi.xls
Considerare la variabile
lunghezza gene=fine‐inizio
Per le varie specie considerate. Calcolare i quartili Q1, Q2, Q3 e identificare
ggli outliers , se presenti, verificando
, p
,
se sono deboli o forti.
Qual e’ la proporzione di outliers presenti nelle varie specie? Cambia o resta
uguale al variare
al variare della specie?
Alessandra Micheletti ‐ UniMI
7