Fondamenti di informatica Funzioni statistiche Ordinamenti e filtri Funzioni statistiche: mediana u La media è un valore “centrale” u Si potrebbe pensare che, confrontando la media con i dati da cui è ricavata, all'incirca il 50% dei dati sia al di sotto della media, il 50% al di sopra u Non è vero: la media è molto sensibile ai valori estremi § 9 persone che guadagnano 10.000$ e una che guadagna 110.000$ § Il reddito medio delle 10 persone è uguale a 20.000$ § Il reddito medio è il doppio del reddito del 90% della popolazione Mediana u La precedente osservazione fa, in alcuni casi, preferire alla media la mediana come indice di posizione centrale u La mediana un valore m tale che almeno metà delle osservazioni sono maggiori o uguali a m, e almeno metà sono minori o uguali a m § Valore centrale in un insieme ordinato di dati u È una misura robusta § Poco influenzata dalla presenza di dati anomali u In Excel: MEDIANA(n1;n2;...) Moda u La moda è il valore con frequenza più alta nei dati § Non risente di picchi § Molto instabile u In Excel: MODA(n1;n2;...) u Esempio: § 1 1 2 2 3 3 1 4 2 3 1 5 3 2 1 1 § La moda è 1 Distribuzione Indici di dispersione u Indicano se una distribuzione è dispersa o “concentrata” intorno alla posizione centrale u Riassumono bene l'insieme della distribuzione u Varianza s2, deviazione standard s n 1 2 2 s = ∑ (xi − x ) n i =1 u In EXCEL: VAR(intervallo) e DEV.ST(intervallo) Quartili e percentili u Dato un insieme di valori ordinato, il percentile pesimo è il valore che separa p% dei dati dal resto u La mediana puo` essere interpretata come il 50-esimo percentile u In Excel: PERCENTILE(range;p) dove 0 <= p <= 1 u Il quartile separa un quarto dei dati dal resto u Si parla di primo (25%), secondo (50%), terzo (75%) quartile u In Excel: QUARTILE(range;n) dove n = 1, 2 o 3 Ordinamenti e filtri u Per facilitare la gestione e l'analisi di un gruppo di dati correlati, è possibile vedere un intervallo di celle in una “tabella excel” u Una tabella excel contiene dati correlati in una serie di righe e colonne, in cui le righe rappresentano oggetti e le colonne rappresentano proprietà degli oggetti u Utilizzando le funzionalità per le tabelle (ordinamenti e filtri) è quindi possibile gestire i dati nelle righe e nelle colonne di una tabella in modo indipendente dai dati nelle altre righe e colonne del foglio di lavoro u La riga contenente i nomi delle proprietà viene detta “riga di intestazione” Ordinamenti e filtri Ordinamenti e filtri