(in %) Principi di Statistica

annuncio pubblicitario
Andrea Bonanomi
Università Cattolica del Sacro Cuore
Principi di Statistica Descrittiva
Milano, 9 gennaio 2015
Camera di Commercio
Principi di
Statistica
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
RIPETIBILITA’
ATTUALE
RIPETIBILITA’
VIRTUALE
RILEVAZIONE
TOTALE
RILEVAZIONE
PARZIALE
UNIVERSO
CAMPIONE
INSIEME UNITA’
STATISTICHE RILEVATE
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
REALTA’
Principi di
Statistica
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
FENOMENI NON COSTANTI
(attitudine a variare)
RILEVAZIONE
1. Individuazione di uno o più CARATTERI sui quali
acquisire le informazioni
2. Individuazione delle UNITA’ STATISTICHE
portatori del carattere in studio
3. Procedimento di misurazione del carattere che
porta alla individuazione delle MODALITA’ con cui
il carattere si presenta
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
Esempio di rilevazione di dati in Excel
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
BRANCHE DELLA STATISTICA
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
statistica descrittiva
sintesi delle osservazioni campionarie o dei dati
censuari
statistica probabilistica
studio del meccanismo generatore delle realizzazioni
campionarie
(modello  campione)
statistica inferenziale
dal campione al suo meccanismo generatore
(campione modello)
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
FASI RICERCA STATISTICA
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
- Identificazione del problema
- Astrazione
- individuazione variabili osservabili/ proxy
- Rilevazione
- sperimentazione, questionari, …
- Spoglio dei dati
- organizzazione dati
- classificazione
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
- Elaborazione dei dati
- sintesi
- interpretazione
- inferenza
osservazione:
una prima statistica consiste nel
costruire le tabelle riassuntive
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
Data – Set Esempio:
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
94 immobili venduti in un anno da un’agenzia
immobiliare.
Vengono rilevate le seguenti variabili:
Codice, Indirizzo, Valore, Categoria Energetica, Giorni sul
mercato, Metratura, Numero di Stanze.
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
TABELLE DI FREQUENZA
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
organizzazione dei dati elementari
prospetti/elenchi delle osservazioni
se i dati sono tanti è utile riorganizzarli in TABELLE
utilizzando la nozione fondamentale di FREQUENZA
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
Non ha molto senso…meglio raggruppare i valori in classi!
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
Gli indici si posizione sono misure sintetiche (‘valori
caratteristici’) che descrivono la tendenza centrale di un
fenomeno
La tendenza centrale è, in prima approssimazione, la
modalità della relativa variabile verso la quale i casi
tendono a gravitare, ossia il ‘baricentro’ della
distribuzione
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
ALCUNI INDICI TIPICI
Principi di
Statistica
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
- moda
- percentili di ordine p
non analitici
- mediana
- medie potenziate
aritmetica
armonica
geometrica
quadratica…….
analitici
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
da qualitativi in su
 MODA (o norma)
da qualitativi ordinati in su
 MEDIANA (o percentili)
da quantitativi
 MEDIE
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
MODA
Principi di
Statistica
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
MODALITA’ A CUI E’ ASSOCIATA LA MAGGIOR
FREQUENZA O DENSITA’ DI FREQUENZA
• può essere calcolata sia per caratteri qualitativi che
quantitativi
• può non essere unica
•VANTAGGI: può essere sempre calcolata
•SVANTAGGI: - perdita di informazioni
- no confronti
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
Max frequenza: 28
Moda: “Bunker Hill Dr”
Utile per i caratteri qualitativi non ordinabili.
Per gli altri caratteri non è informativa
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
ESEMPIO
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
VARIABILE QUANTITATIVA RAGGRUPPATA IN CLASSI: si
calcolano le densità di frequenza
classi età numero lettori
classi età numero lettori
6-|11
11-|14
14-|20
20-|25
25-|35
35-!45
45-|55
55-|65
65 -|80
totale
6-|11
11-|14
14-|20
20-|25
25-|35
35-!45
45-|55
55-|65
65 -|80
totale
221
573
2883
2864
5449
5384
4607
3692
2694
28367
221
573
2883
2864
5449
5384
4607
3692
2694
28367
ai
5
3
6
5
10
10
10
10
15
Fonte; ISTAT, indagine sulla
lettura e su altro impiego del
tempo libero, 1986
Classe modale: 20-|25
Mo=(20+25)/2=22.5
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
li
44.2
191
480.5
572.8
544.9
538.4
460.7
369.2
179.6
MEDIANA
Principi di
Statistica
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
MODALITA’ CHE OCCUPA LA POSIZIONE
CENTRALE NELLA SEQUENZA ORDINATA DEI DATI
•può essere calcolata sia per caratteri qualitativi che
quantitativi purchè ordinabili
• percentile di ordine 0.5
•VANTAGGI: non risente dei valori estremi
•SVANTAGGI: solo per caratteri ordinabili - perdita di
informazioni - no confronti
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
Formule operative di calcolo per i vari tipi di caratteri
ordinabili
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
numerosità dei dati n = pari/dispari
esempio caso carattere quantitativo discreto:
n = dispari
Me = x0.5 = valore di posizione (n+1)/2
n = pari
Me = x0.5 = semisomma dei valori di posto n/2 ed (n/2+1)
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
caso n=94 pari

n/2=47 e (n/2+1)=48

sulle Ni=53
con le frequenze relative  sulle Fi=0.564
Mediana= 4
 4 stanze per abitazione
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
PERCENTILE di ordine p
Principi di
Statistica
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
MODALITA’ CHE DIVIDE LA DISTRIBUZIONE
ORDINATA DEI DATI IN PIU’ PARTI
• può essere calcolato sia per caratteri qualitativi che
quantitativi purché ordinabili
• 0<p<1
• valore preceduto da almeno il p% dei casi e seguito
da almeno il (1-p)% dei casi
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
Alcuni esempi sono
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
 dividono in 4 parti la distribuzione
quartili
xmin
xmax
decili
 dividono in 10 parti la distribuzione
percentili
 dividono in 100 parti la distribuzione
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
Per i QUARTILI
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
x0.25 = Q1 = 1° quartile
(lascia alla sua sinistra il 25% e alla sua destra il 75%)
x0.50 = Q2 = 2° quartile
(lascia alla sua sinistra il 50% e alla sua destra il 50%)
x0.75 = Q3 = 3° quartile
(lascia alla sua sinistra il 75% e alla sua destra il 25%)
Q1
xmin
Q2
Q3
xmax
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
In generale: il percentile xp di ordine p è quella modalità
che è:
- preceduta da almeno p% dei casi
- superata da almeno (1p)% dei casi
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
Grafici BOX–PLOT
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
(o BOX&WHISKERS)
GRAFICO RIASSUNTIVO DEI MAGGIORI INDICI
DESCRITTIVI UNIVARIATI CHE CONSENTE CONFRONTI
“VISIVI” TRA DIVERSE VARIABILI
Per ogni variabile vengono rappresentate:
- mediana (Q2)
- I e III quartile (Q1 e Q3)
- Differenza interquartile H = Q3 – Q1
- minimo e massimo
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
500
Il BOX è la scatola
rossa.
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
400
Q3
300
BOX
200
Q2
Q1
100
0
E’ delimitata da Q1 e
Q3 mentre la linea
nera al suo interno
indica la mediana
Q2.
Tra Q3 e Q1 si trova il
50% delle unità
statistiche.
-100
N=
406
Cilindrata in cc
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
500
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
W
H
I
S
K
E
R
S
Q3 + 1.5(Q3Q1) o xmax
400
300
Q3
200
Q2
100
Q1
Q1  1.5(Q3Q1) o xmin
0
-100
N=
406
Cilindrata in cc
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
xmax
300
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
200
Valori
anomali
124
9
20
103
7
8
32
102
Q3 + 1.5(Q3Q1)
100
(outliers)
0
N=
400
Potenza (CV)
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
MEDIA ARITMETICA
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
•La media è il valore caratteristico più noto fra quelli che rilevano la
tendenza centrale
•E’ il valore atteso di una successiva rilevazione
•E’ la parte del totale delle intensità che spetta a ciascuna unità
Può essere calcolata solo per variabili quantitative
ATTENZIONE: Molto spesso è comodo associare alle modalità
qualitative codici numerici (es. numero di matricola, codice
identificativo cliente). Nonostante la ricodifica, la variabile rimane
connotata secondo la caratteristica intrinseca del fenomeno di cui
essa è rilevazione.
NON HA SENSO FARE LA MEDIA DEL NUMERO DI CODICE!!!!!!!!!!
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
•VANTAGGI: - molto immediata
- la più conosciuta e usata
- è lo stimatore ottimale della media
di una popolazione nella stima
puntuale e intervallare
•SVANTAGGI:
- assume anche valori non osservati - risente
dei valori estremi e degli outliers
1 n
x  (  )   xi
n i 1
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
La mediana varia maggiormente passando da un
campione all’altro, mentre la media è più stabile 
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
La media può essere utilizzata per la statistica
induttiva mentre la mediana non può essere
utilizzata
La mediana è stabile rispetto ai valori estremi,
mentre la media non lo è.
Questo può comportare vantaggi e svantaggi a
seconda dei casi
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
INDICI DI VARIABILITA’
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
- indice sintetico di posizione è utile per alcuni confronti
- appare tuttavia insufficiente
- sintesi troppo spinta, perde informazioni
- interessano anche indicatori della diversità
(molteplicità) dei valori di un carattere
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
..senza variabilità non ci sarebbe la
statistica…
Se tutti votassimo lo stesso partito alle elezioni (=moda),
non ci sarebbero i sondaggi, ne le previsioni elettorali…il
voto politico sarebbe una unica modalità…
Se tutte le persone fossero alte uguali (=media) non
esisterebbe la variabile altezza, perché non la
misureremmo…
La statistica si basa sulla diversità, studia
l’attitudine a variare dei fenomeni
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
MUTABILITA’
Principi di
Statistica
LA VARIABILITA’ DEI FENOMENI QUALITATIVI
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
Per misurarla si usano gli indici di eterogeneità
•Sono indici che si basano sulla frequenze relative o
percentuali
•Non sono vincolati da un particolare ordinamento delle
modalità
•Quindi possono essere calcolati per qualsiasi tipo di
fenomeno
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
MUTABILITA’
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
LA VARIABILITA’ DEI FENOMENI QUALITATIVI
Proprietà degli indici di eterogeneità
•Sono sempre positivi
•Sono massimi quando ad ogni modalità assunta dal fenomeno
corrisponde la stessa frequenza, cioè fi=1/k per ogni i
•Sono minimi quando il fenomeno assume una sola modalità, cioè
una pi è uguale a 1 e tutte le altre (k-1) sono uguali a 0
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
MUTABILITA’
Principi di
Statistica
LA VARIABILITA’ DEI FENOMENI QUALITATIVI
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
Indice di eterogeneità di Gini
k
E1  1   pi2
i 1
Assume valori compresi tra 0 (minimo) e (k-1)/k (massimo)
Per normalizzarlo in modo che vari tra 0 e 1 bisogna
dividerlo per il suo massimo:
E1*
k
 E1
k 1
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
Altissima eterogeneità, valore prossimo a uno.
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
VARIABILITA’
Principi di
Statistica
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
LA VARIABILITA’ DEI FENOMENI QUANTITATIVI
Per misurarla si usano
•gli indici di variabilità globale
si basano sulle differenze tra i valori delle modalità
•gli indici di dispersione
si basano sulle differenze tra i valori delle modalità e un
prefissato indice di posizione
Entrambi possono essere calcolati
solo per fenomeni quantitativi
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
VARIABILITA’
Principi di
Statistica
LA VARIABILITA’ DEI FENOMENI QUANTITATIVI
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
Proprietà degli indici di variabilità e di
dispersione
•Sono sempre positivi
•Sono uguali a zero quando tutte le unità osservate assumono la
stessa modalità, la variabile statistica in tal caso si dice degenere
•Sono invarianti per traslazione, cioè se ad ogni xi viene aggiunta una
quantità c costante, la variabilità di X non cambia
NOTA: per gli indici di variabilità e dispersione non è immediata la determinazione del
loro valore massimo, tralasceremo il calcolo dei valori normalizzati degli indici
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
VARIABILITA’
Descrittiva
LA VARIABILITA’ DEI FENOMENI QUANTITATIVI
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
1700
1400
2000
1700
1650
1750
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
VARIABILITA’
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
LA VARIABILITA’ DEI FENOMENI QUANTITATIVI
Indici di variabilità globale
Differenza Interquartile D.I. = Q3-Q1
Campo di Variazione K= xmax-xmin
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
VARIABILITA’
Descrittiva
LA VARIABILITA’ DEI FENOMENI QUANTITATIVI
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
Indici di dispersione
Varianza
Si basa sulla differenze tra i valori delle modalità e la loro
media.
xi
x
xi  x
Si considerano gli scostamenti al quadrato per evitare compensazioni tra
distanze positive e negative.
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
VARIANZA
Se si considera una tabella di rilevazione, la varianza
aritmetica è data dalla seguente formula
n
2
n
1
1
2
    xi  x    xi2   x 
n i 1
n i 1
2
FORMULA
OPERATIVA
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
VARIANZA: problemi
Principi di
Statistica
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
Elevando al quadrato si perde l’unità
di misura del fenomeno
Ex. Se si è partiti dal peso, la varianza risulta
espressa in kg2
SCARTO QUADRATICO
MEDIO
  2
E’ un indice assoluto, cioè risente
dell’unità di misura del fenomeno, e ciò
impedisce di fare confronti di variabilità
E’ lo stimatore ottimale della variabilità
nella stima puntuale e intervallare
E’ un numero puro, non risente della scala di
misurazione
COEFFICIENTE DI
VARIAZIONE
CV 

x
Indice relativo
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
SIMMETRIA
Principi di
Statistica
Una v.s. è simmetrica rispetto ad un centro c se:
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
- per ogni xi = c  k
- esiste un xj = c  k (simmetrico)
con stessa frequenza:
f(xi) = f(xj)
8
7
6
5
4
3
2
1
0
N=
23
X
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
• ASIMMETRIA POSITIVA (a sinistra)
8
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
7
6
5
4
3
2
1
0
N=
23
X
curva obliqua a sinistra  Mo < Me < 
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
• ASIMMETRIA NEGATIVA (a destra)
Principi di
Statistica
8
Descrittiva
7
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
6
5
4
3
2
1
0
N=
23
X
curva obliqua a destra 
 <Me < Mo
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
Indici di simmetria o asimmetria
Indice di FISHER o di SKEWNESS
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
(più comunemente usato)
-3
M[(X)3]

1 
 3
3


se asimmetria sinistra
se asimmetria destra
se simmetria
NB



1 > 0
1 < 0
1 = 0
( = 0 ) è solo sintomo di simmetria !!
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Indici di curtosi
Principi di
Statistica
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
Se una distribuzione è simmetrica o quasi
simmetrica allora può esser più o meno appuntita o
più o meno appiattita rispetto alla distribuzione
normale (o di Gauss)
Se la curva è
• più appuntita si dice
curva Leptocurtica
• più appiattita si dice
curva Platicurtica
-  K < + 
Se K = 0 distribuzione normale
se K > 0 curva leptocurtica
Se K < 0 curva platicurtica.


4


x

x
f
i
i

1 
i
K 4
 3
 
i f i 


Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
Indice di curtosi
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
IMPORTANTE
Si può utilizzare anche lo strumento di excel
“Strumenti>analisi dati>statistica descrittiva”
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
Distribuzione
gaussiana
DISTRIBUZIONE NORMALE
o gaussiana
Y

X
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
Distribuzione
gaussiana
• La curva normale o curva di Gauss è una distribuzione teorica
di punteggi in una popolazione
• Riguarda solo le variabili metriche continue, quindi le misure
almeno su scale a intervalli equivalenti
• L’importanza di questa distribuzione è dovuta al fatto che
molti dei fenomeni osservati si distribuiscono normalmente
o con forme che si approssimano alla curva normale
• Inoltre gran parte della statistica inferenziale si basa sulle
proprietà di questa distribuzione
• La curva NORMALE è interamente definita dai parametri  (la
media che corrisponde al valore x con la frequenza massima)
e  (dev. st.)
• Poiché la distribuzione normale varia al variare di  e  si
può parlare di famiglia di distribuzioni normali con medie e
deviazioni standard diverse
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
Funzione di densità
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
Distribuzione
gaussiana
E’ definita dalla seguente funzione di densità:
Y  f x  
1
 2
2
e
1  x  
 

2  
dove:
=media della popolazione
=dev. st. della popolazione
=costante (=3.14)
e=costante (=2.718)
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
Distribuzione
gaussiana
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
Distribuzione
gaussiana
Qualsiasi siano i parametri  e , l’AREA sottesa dall’intera
curva è = 1

Area(, ) 
 f(X)dX  1

L’area sottesa alla curva
normale rappresenta la
PROBABILITA’ degli intervalli!
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
Distribuzione
gaussiana
la porzione di curva delimitata dalla media e
un’ordinata espressa in termini di deviazioni
standard è costante
 += 34.13% della distribuzione
 +2= 47.73% della distribuzione
 +3= 49.86% della distribuzione
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
Porzioni della distribuzione comprese tra 
1,2,3 deviazioni standard da  (in %)
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
Distribuzione
gaussiana
Y
99.73%
95.46%
68.26%
-3 -2 -
+ +2 +3
X
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
Distribuzione
gaussiana
Per gli usi pratici della distribuzione normale si ricorre alla
CURVA NORMALE STANDARDIZZATA
l’equazione della curva dipende da un solo parametro, zeta;
Y  f z  
1
2
e
1
 z2
2
I valori di questa distribuzione sono tabulati
z 
X  X
X
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
Distribuzione
gaussiana
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Principi di
Statistica
Per testare che una distribuzione ha un andamento
«simile» o «approssimabile» a quello della Normale:
Descrittiva
Distrib. di frequenza
Indici di posizione
Indici di dispersione
Indici di forma
Distribuzione
gaussiana
1)Test appositi (Kolmogorov-Smirnov)molto
complessi e di difficilissima accettazione
2)Valutazione degli indici di asimmetria e curtosi:
Se gli indici di asimmetria e curtosi sono compresi tra
-1 e +1, allora la distribuzione è approssimabile con
la normale/gaussiana
Andrea Bonanomi, Università Cattolica del Sacro Cuore, Principi di Statistica,
Milano, 09/01/15
Scarica