PERCENTILI E OUTLIERS PERCENTILI E OUTLIERS Alessandra Micheletti ‐ UniMI 1 Alessandra Micheletti ‐ UniMI 2 In Excel il p‐esimo percentile e' cosi' definito y = (1 − g ) x j +1 + gx j + 2 dove j ; g sono la parte intera e quella decimale, rispettivamente, di (n ‐1)p. Per il calcolo dei percentili con Excel, usare la funzione statistica PERCENTILE(matrice;k) ESEMPIO Usiamo il nostro dataset.xlsx Ordiniamo i dati per valori di Larghezza della mano destra? crescenti. Calcoliamo il quinto percentile di x=Larghezza della mano destra? p=0,05= 5% j=(35‐1)*0,05=1,7 quindi j=1 e g=0,7 yy=(1‐0,7)x (1 0,7)x2+0,7x3 3 = =(0,3)*14+0,7*15,4=14,98 (0,3) 14+0,7 15,4 14,98 Alessandra Micheletti ‐ UniMI 3 Alessandra Micheletti ‐ UniMI 4 In presenza di outliers In presenza di outliers bisogna chiedersi se tali dati provengano o meno bisogna chiedersi se tali dati provengano o meno dalla stessa distribuzione degli altri. Per ilil calcolo dei quartili con Excel: usare Per con Excel: usare la funzione la funzione statistica QUARTILE(dati;quarto) Per creare una variabile i bil che h effettua ff una verifica ifi di una di condizione di i ( d (ad esempio verifica se un dato e’ un outlier) usare la funzione SE(test; [se_vero]; [se_falso]) Si possono p usare anche p piu’ funzioni SE una dentro l’altra p per creare p piu’ di due alternative Alessandra Micheletti ‐ UniMI 5 ESERCIZIO (s ogiamolo insieme) ESERCIZIO (svogiamolo Usiamo il nostro dataset.xlsx Per ciascuna delle variabili larghezza della mano destra? lunghezza del dito medio della mano destra? Calcolare i q quartili Q Q1, Q2, Q3 e identificare ,Q ,Q ggli outliers , se presenti, , p , verificando se sono deboli o forti. Alessandra Micheletti ‐ UniMI 6 ESERCIZIO per gli studenti ESERCIZIO per gli st denti Usiamo il dataset genomi.xls Considerare la variabile lunghezza gene=fine‐inizio Per le varie specie considerate. Calcolare i quartili Q1, Q2, Q3 e identificare ggli outliers , se presenti, verificando , p , se sono deboli o forti. Qual e’ la proporzione di outliers presenti nelle varie specie? Cambia o resta uguale al variare al variare della specie? Alessandra Micheletti ‐ UniMI 7