Statistica descrittiva per l’Estimo
Paolo Rosato
Dipartimento di Ingegneria Civile e Architettura
Piazzale Europa 1 - 34127 Trieste. Italia
Tel: +39-040-5583569. Fax: +39-040-55835 80
E-mail: [email protected]
1
A cosa serve la statistica nell’estimo
La statistica è uno strumento utile/indispensabile per studiare e
sintetizzare fenomeni che si manifestano in modo incerto e/o sui
quali non è possibile avere una completa conoscenza.
Il prezzo degli immobili è uno di questi fenomeni, poiché:
1. La conoscenza dei prezzi è incompleta (mercato opaco)
2. Le caratteristiche degli immobili che influiscono sui prezzi non
sono perfettamente note
3. Le transazioni sono poche
4. Le fonti di dati sono scarse e poco omogenee
5. I prezzi che si formano hanno una forte componente specifica e
casuale
Prof. Paolo Rosato
2
A cosa serve la statistica nell’estimo
Immobile
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Media
Serie
A
1.950
1.800
1.900
1.950
1.850
2.100
1.910
1.930
2.000
1.974
1.860
1.930
1.950
2.050
1.980
1.950
1.870
1.900
1.950
1.850
1.850
1.910
1.930
2.050
1.974
1.860
1.930
1.950
2.150
1.740
1.933
B
2.000
1.800
1.850
1.900
1.850
1.800
1.910
1.930
1.850
1.900
1.860
1.800
1.850
2.050
1.980
1.850
2.050
1.800
2.150
1.800
2.100
1.910
2.100
2.100
1.800
1.800
1.800
2.000
2.150
2.200
1.931
?
Prof. Paolo Rosato
3
La statistica si articola in due ambiti
principali
Statistica descrittiva: sintetizza e rappresenta i dati osservati (p.e.
caratteristiche degli immobili e prezzi) mediante grafici e indici che
descrivono tendenze e variabilità
•Indicatori di tendenza centrale
•Indicatori di dispersione
•Distribuzioni
•Indicatori di forma
Prof. Paolo Rosato
4
La statistica di articola in due ambiti
principali
Statistica inferenziale: tenta di stabilire delle relazioni fra i dati
osservati (p.e. caratteristiche dell’immobile e prezzo di mercato),
spesso apparentemente disordinati, fornendone una valutazione
probabilistica
•La regressione semplice
•La regressione multipla
Prof. Paolo Rosato
5
La statistica descrittiva
Gli indicatori di tendenza centrale:
•Media semplice
•Media geometrica
•Media armonica
•Media ponderata
•Mediana
•Moda
Prof. Paolo Rosato
6
Alcuni semplici indicatori statistici di tendenza
centrale
Media semplice (Ms): Rapporto fra la somma dei valori (Vi) ed
il loro numero (n).
n
Ms 
V
i 1
i
n
Prof. Paolo Rosato
7
Alcuni semplici indicatori statistici di tendenza
centrale
Media armonica (Mh): Reciproco della media aritmetica dei
reciproci dei valori (Vi). Si usa quando è utile calcolare il
reciproco dei dati: il potere di acquisto medio della
moneta è il reciproco della media armonica dei prezzi.
Mh 
n
n

i 1
1
V
Prof. Paolo Rosato
i
8
Alcuni semplici indicatori statistici di tendenza
centrale
Media geometrica (Mg): Radice n-esima del prodotto degli (n)
valori (Vi). Si usa quando ha senso moltiplicare fra loro i
dati statistici: determinare il tasso d'incremento medio o
di decremento di prezzi.
Ms  n
n
V
i
i 1
Prof. Paolo Rosato
9
Alcuni semplici indicatori statistici di tendenza
centrale
Media quadratica (Mg): Radice quadrata della media semplice
del quadrato degli (n) valori (Vi). Si usa per mettere in
evidenza l’esistenza di valori anomali, che si scostano
molto dai valori centrali.
n
Mq 
V
i 1
2
i
n
Prof. Paolo Rosato
10
Alcuni semplici indicatori statistici di tendenza
centrale
Media ponderata (Mp): Rapporto fra la somma dei valori (Vi)
moltiplicati per il loro peso (wi) e la somma dei pesi (wi).
E’ per ponderare il dato in funzione di una specifica
caratteristica.
n
Mp 
V  w
i
i 1
i
n
w
i 1
Prof. Paolo Rosato
i
11
Alcuni semplici indicatori statistici di tendenza
centrale
Moda o norma (Md): Data una distribuzione è il valore (V), o
classe di valori più frequente
Moda serie A
Prof. Paolo Rosato
Moda serie B
12
Alcuni semplici indicatori statistici di tendenza
centrale
Mediana (Me): Data una serie di valori (Vi), il valore mediano è
quel valore che divide a metà la serie
Mediana serie A
Mediana serie B
Prof. Paolo Rosato
13
Alcuni semplici indicatori statistici di tendenza
centrale
Indicatore
Media semplice
Media armonica
Media geometrica
Media quadratica
Moda
Mediana
Distribuzione
Simmetrica Asimmetrica
1.933,27
1.931,33
1.929,72
1.923,49
1.931,49
1.927,36
1.935,06
1.935,40
1.950,00
1.800,00
1.930,00
1.900,00
Prof. Paolo Rosato
14
Alcuni semplici indicatori statistici di dispersione
Scostamento quadratico medio (Smq): Rapporto fra la
sommatoria dei quadrati degli scostamenti dalla media e
il numero di osservazioni (n)
2
n
S mq 
 V  M 
i 1
i
s
n
Prof. Paolo Rosato
15
Alcuni semplici indicatori statistici di dispersione
Varianza (σ2): Rapporto fra la sommatoria dei quadrati degli
scostamenti dalla media e il numero di osservazioni (n)
meno 1
2
n
 
2
 V  M 
i 1
i
s
n 1
Prof. Paolo Rosato
16
Alcuni semplici indicatori statistici di dispersione
Deviazione Standard (σ): Radice quadrata della Varianza
2
n

 V  M 
i 1
i
s
n 1
Prof. Paolo Rosato
17
Alcuni semplici indicatori statistici di dispersione
Coefficiente di variazione (γ): Rapporto fra deviazione
standard (σ) e la media (Ms)
2
n
 V  M 
i 1

i
s
n 1
Ms
Prof. Paolo Rosato
18
Alcuni semplici indicatori statistici di dispersione
Indicatore
Scost. quadratico medio
Varianza
Deviazione standard
Coefficiente di variazione
Distribuzione
Simmetrica Asimmetrica
6.921,73
15.738,22
7.160,41
16.280,92
84,62
127,60
0,04
0,07
Prof. Paolo Rosato
19
Alcuni semplici indicatori statistici di dispersione
I quartili
Valori che ripartiscono una serie ordinata di dati in
quattro sottoinsiemi di uguale numerosità
Distribuzione
Indicatore
Simmetrica Asimmetrica
Minimo
1.740,0
1.800,0
Primo quartile
1.877,5
1.812,5
Secondo quartile (mediana)
1.930,0
1.900,0
Terzo quartile
1.740,0
1.800,0
Massimo
2.150,0
2.200,0
Prof. Paolo Rosato
20
Alcuni semplici indicatori statistici di dispersione
Il grafico Box-Plot
Rappresentazione grafica dei valori dei quartili
Prof. Paolo Rosato
21
Gli indicatori statistici di forma
La distribuzione normale (gaussiana)
1
F Vi  
e
 2

1
Vi  M s 2 /  2
2
F(Vi) = Frequenza con cui si rileva un certo valore Vi
Ms = Media;
σ = Deviazione standard.
Prof. Paolo Rosato
22
Gli indicatori statistici di forma
La distribuzione normale (gaussiana) che approssima
i dati dell’esempio
F Vi   0,004715  e

1
Vi 1.933, 27 2 / 7169 , 41
2
Prof. Paolo Rosato
23
La distribuzione normale (gaussiana)
Distribuzione normale
0,007
0,006
Probabilità
0,005
0,004
0,003
0,002
0,001
0
1600
1700
1800
1900
2000
2100
2200
2300
Valore
Ms +/- σ
Da
1803,74
A
2058,93
% casi
68,27
Ms +/- 2σ
1676,14
2186,53
95,45
Ms +/- 3σ
1548,54
2314,12
99,73
24
La distribuzione normale cumulata
Distribuzione normale cumulata
1
0,9
0,8
Probabilità cumulata
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
1600
1700
1800
1900
2000
2100
2200
2300
Valore
Prof. Paolo Rosato
25
La distribuzione normale e reale
Prof. Paolo Rosato
26
Alcuni semplici indicatori statistici di forma
Indice di asimmetria (skewness): β di Fisher normalizzato e corretto
per la numerosità: positivo coda asimmetrica verso valori più alti,
negativo: coda asimmetrica verso i valori più bassi.
1
 Vi  M s 




n  1 n  2 i   
β>0
β=0
Prof. Paolo Rosato
3
β<0
27
Alcuni semplici indicatori statistici di forma
Indice di curtosi: k valuta il grado si adesione ad una distribuzione
normale; positivo: concentrazione maggiore attorno alla
media, negativo: concentrazione maggiore sulle code.
4
2


n  n  1
V

M
3

n

1



 i
s 
k 

 

 n  1  n  2   n  3 i     n  2   n  3
k>0
k=0
Prof. Paolo Rosato
k<0
28