Statistica descrittiva per l’Estimo Paolo Rosato Dipartimento di Ingegneria Civile e Architettura Piazzale Europa 1 - 34127 Trieste. Italia Tel: +39-040-5583569. Fax: +39-040-55835 80 E-mail: [email protected] 1 A cosa serve la statistica nell’estimo La statistica è uno strumento utile/indispensabile per studiare e sintetizzare fenomeni che si manifestano in modo incerto e/o sui quali non è possibile avere una completa conoscenza. Il prezzo degli immobili è uno di questi fenomeni, poiché: 1. La conoscenza dei prezzi è incompleta (mercato opaco) 2. Le caratteristiche degli immobili che influiscono sui prezzi non sono perfettamente note 3. Le transazioni sono poche 4. Le fonti di dati sono scarse e poco omogenee 5. I prezzi che si formano hanno una forte componente specifica e casuale Prof. Paolo Rosato 2 A cosa serve la statistica nell’estimo Immobile 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 Media Serie A 1.950 1.800 1.900 1.950 1.850 2.100 1.910 1.930 2.000 1.974 1.860 1.930 1.950 2.050 1.980 1.950 1.870 1.900 1.950 1.850 1.850 1.910 1.930 2.050 1.974 1.860 1.930 1.950 2.150 1.740 1.933 B 2.000 1.800 1.850 1.900 1.850 1.800 1.910 1.930 1.850 1.900 1.860 1.800 1.850 2.050 1.980 1.850 2.050 1.800 2.150 1.800 2.100 1.910 2.100 2.100 1.800 1.800 1.800 2.000 2.150 2.200 1.931 ? Prof. Paolo Rosato 3 La statistica si articola in due ambiti principali Statistica descrittiva: sintetizza e rappresenta i dati osservati (p.e. caratteristiche degli immobili e prezzi) mediante grafici e indici che descrivono tendenze e variabilità •Indicatori di tendenza centrale •Indicatori di dispersione •Distribuzioni •Indicatori di forma Prof. Paolo Rosato 4 La statistica di articola in due ambiti principali Statistica inferenziale: tenta di stabilire delle relazioni fra i dati osservati (p.e. caratteristiche dell’immobile e prezzo di mercato), spesso apparentemente disordinati, fornendone una valutazione probabilistica •La regressione semplice •La regressione multipla Prof. Paolo Rosato 5 La statistica descrittiva Gli indicatori di tendenza centrale: •Media semplice •Media geometrica •Media armonica •Media ponderata •Mediana •Moda Prof. Paolo Rosato 6 Alcuni semplici indicatori statistici di tendenza centrale Media semplice (Ms): Rapporto fra la somma dei valori (Vi) ed il loro numero (n). n Ms V i 1 i n Prof. Paolo Rosato 7 Alcuni semplici indicatori statistici di tendenza centrale Media armonica (Mh): Reciproco della media aritmetica dei reciproci dei valori (Vi). Si usa quando è utile calcolare il reciproco dei dati: il potere di acquisto medio della moneta è il reciproco della media armonica dei prezzi. Mh n n i 1 1 V Prof. Paolo Rosato i 8 Alcuni semplici indicatori statistici di tendenza centrale Media geometrica (Mg): Radice n-esima del prodotto degli (n) valori (Vi). Si usa quando ha senso moltiplicare fra loro i dati statistici: determinare il tasso d'incremento medio o di decremento di prezzi. Ms n n V i i 1 Prof. Paolo Rosato 9 Alcuni semplici indicatori statistici di tendenza centrale Media quadratica (Mg): Radice quadrata della media semplice del quadrato degli (n) valori (Vi). Si usa per mettere in evidenza l’esistenza di valori anomali, che si scostano molto dai valori centrali. n Mq V i 1 2 i n Prof. Paolo Rosato 10 Alcuni semplici indicatori statistici di tendenza centrale Media ponderata (Mp): Rapporto fra la somma dei valori (Vi) moltiplicati per il loro peso (wi) e la somma dei pesi (wi). E’ per ponderare il dato in funzione di una specifica caratteristica. n Mp V w i i 1 i n w i 1 Prof. Paolo Rosato i 11 Alcuni semplici indicatori statistici di tendenza centrale Moda o norma (Md): Data una distribuzione è il valore (V), o classe di valori più frequente Moda serie A Prof. Paolo Rosato Moda serie B 12 Alcuni semplici indicatori statistici di tendenza centrale Mediana (Me): Data una serie di valori (Vi), il valore mediano è quel valore che divide a metà la serie Mediana serie A Mediana serie B Prof. Paolo Rosato 13 Alcuni semplici indicatori statistici di tendenza centrale Indicatore Media semplice Media armonica Media geometrica Media quadratica Moda Mediana Distribuzione Simmetrica Asimmetrica 1.933,27 1.931,33 1.929,72 1.923,49 1.931,49 1.927,36 1.935,06 1.935,40 1.950,00 1.800,00 1.930,00 1.900,00 Prof. Paolo Rosato 14 Alcuni semplici indicatori statistici di dispersione Scostamento quadratico medio (Smq): Rapporto fra la sommatoria dei quadrati degli scostamenti dalla media e il numero di osservazioni (n) 2 n S mq V M i 1 i s n Prof. Paolo Rosato 15 Alcuni semplici indicatori statistici di dispersione Varianza (σ2): Rapporto fra la sommatoria dei quadrati degli scostamenti dalla media e il numero di osservazioni (n) meno 1 2 n 2 V M i 1 i s n 1 Prof. Paolo Rosato 16 Alcuni semplici indicatori statistici di dispersione Deviazione Standard (σ): Radice quadrata della Varianza 2 n V M i 1 i s n 1 Prof. Paolo Rosato 17 Alcuni semplici indicatori statistici di dispersione Coefficiente di variazione (γ): Rapporto fra deviazione standard (σ) e la media (Ms) 2 n V M i 1 i s n 1 Ms Prof. Paolo Rosato 18 Alcuni semplici indicatori statistici di dispersione Indicatore Scost. quadratico medio Varianza Deviazione standard Coefficiente di variazione Distribuzione Simmetrica Asimmetrica 6.921,73 15.738,22 7.160,41 16.280,92 84,62 127,60 0,04 0,07 Prof. Paolo Rosato 19 Alcuni semplici indicatori statistici di dispersione I quartili Valori che ripartiscono una serie ordinata di dati in quattro sottoinsiemi di uguale numerosità Distribuzione Indicatore Simmetrica Asimmetrica Minimo 1.740,0 1.800,0 Primo quartile 1.877,5 1.812,5 Secondo quartile (mediana) 1.930,0 1.900,0 Terzo quartile 1.740,0 1.800,0 Massimo 2.150,0 2.200,0 Prof. Paolo Rosato 20 Alcuni semplici indicatori statistici di dispersione Il grafico Box-Plot Rappresentazione grafica dei valori dei quartili Prof. Paolo Rosato 21 Gli indicatori statistici di forma La distribuzione normale (gaussiana) 1 F Vi e 2 1 Vi M s 2 / 2 2 F(Vi) = Frequenza con cui si rileva un certo valore Vi Ms = Media; σ = Deviazione standard. Prof. Paolo Rosato 22 Gli indicatori statistici di forma La distribuzione normale (gaussiana) che approssima i dati dell’esempio F Vi 0,004715 e 1 Vi 1.933, 27 2 / 7169 , 41 2 Prof. Paolo Rosato 23 La distribuzione normale (gaussiana) Distribuzione normale 0,007 0,006 Probabilità 0,005 0,004 0,003 0,002 0,001 0 1600 1700 1800 1900 2000 2100 2200 2300 Valore Ms +/- σ Da 1803,74 A 2058,93 % casi 68,27 Ms +/- 2σ 1676,14 2186,53 95,45 Ms +/- 3σ 1548,54 2314,12 99,73 24 La distribuzione normale cumulata Distribuzione normale cumulata 1 0,9 0,8 Probabilità cumulata 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 1600 1700 1800 1900 2000 2100 2200 2300 Valore Prof. Paolo Rosato 25 La distribuzione normale e reale Prof. Paolo Rosato 26 Alcuni semplici indicatori statistici di forma Indice di asimmetria (skewness): β di Fisher normalizzato e corretto per la numerosità: positivo coda asimmetrica verso valori più alti, negativo: coda asimmetrica verso i valori più bassi. 1 Vi M s n 1 n 2 i β>0 β=0 Prof. Paolo Rosato 3 β<0 27 Alcuni semplici indicatori statistici di forma Indice di curtosi: k valuta il grado si adesione ad una distribuzione normale; positivo: concentrazione maggiore attorno alla media, negativo: concentrazione maggiore sulle code. 4 2 n n 1 V M 3 n 1 i s k n 1 n 2 n 3 i n 2 n 3 k>0 k=0 Prof. Paolo Rosato k<0 28