Fondamenti di informatica
Funzioni statistiche
Ordinamenti e filtri
Funzioni statistiche: mediana
u  La media è un valore “centrale”
u  Si potrebbe pensare che, confrontando la media con i
dati da cui è ricavata, all'incirca il 50% dei dati sia al di
sotto della media, il 50% al di sopra
u  Non è vero: la media è molto sensibile ai valori
estremi
§  9 persone che guadagnano 10.000$ e una che
guadagna 110.000$
§  Il reddito medio delle 10 persone è uguale a
20.000$
§  Il reddito medio è il doppio del reddito del 90%
della popolazione
Mediana
u La precedente osservazione fa, in alcuni casi, preferire
alla media la mediana come indice di posizione centrale
u La mediana un valore m tale che almeno metà delle
osservazioni sono maggiori o uguali a m, e almeno
metà sono minori o uguali a m
§  Valore centrale in un insieme ordinato di dati
u È una misura robusta
§  Poco influenzata dalla presenza di dati anomali
u In Excel: MEDIANA(n1;n2;...)
Moda
u  La moda è il valore con frequenza più alta nei dati
§  Non risente di picchi
§  Molto instabile
u  In Excel: MODA(n1;n2;...)
u  Esempio:
§  1 1 2 2 3 3 1 4 2 3 1 5 3 2 1 1
§  La moda è 1
Distribuzione
Indici di dispersione
u  Indicano se una distribuzione è dispersa o
“concentrata” intorno alla posizione centrale
u  Riassumono bene l'insieme della distribuzione
u  Varianza s2, deviazione standard s
n
1
2
2
s = ∑ (xi − x )
n i =1
u  In EXCEL: VAR(intervallo) e DEV.ST(intervallo)
Quartili e percentili
u  Dato un insieme di valori ordinato, il percentile pesimo è il valore che separa p% dei dati dal resto
u  La mediana puo` essere interpretata come il 50-esimo
percentile
u  In Excel: PERCENTILE(range;p) dove 0 <= p <= 1
u  Il quartile separa un quarto dei dati dal resto
u  Si parla di primo (25%), secondo (50%), terzo (75%)
quartile
u  In Excel: QUARTILE(range;n) dove n = 1, 2 o 3
Ordinamenti e filtri
u  Per facilitare la gestione e l'analisi di un gruppo di dati correlati, è
possibile vedere un intervallo di celle in una “tabella excel”
u  Una tabella excel contiene dati correlati in una serie di righe e
colonne, in cui le righe rappresentano oggetti e le colonne
rappresentano proprietà degli oggetti
u  Utilizzando le funzionalità per le tabelle (ordinamenti e filtri) è
quindi possibile gestire i dati nelle righe e nelle colonne di una
tabella in modo indipendente dai dati nelle altre righe e colonne
del foglio di lavoro
u  La riga contenente i nomi delle proprietà viene detta “riga di
intestazione”
Ordinamenti e filtri
Ordinamenti e filtri