Interpretazione matematico-statistica dei metodi di stima diretti

52
Interpretazione matematico-statistica dei metodi di stima diretti
Gabriele Brondino†
Interpretazione matematico-statistica
dei metodi di stima diretti
Parole chiave: metodi di stima diretti, valore di mercato, prezzo di compravendita, regressione lineare multipla, Sales Comparison Approach, Nearest Neighbors Appraisal Technique.
Abstract Partendo dai presupposti dettati dai postulati estimativi dell’ordinarietà, della previsione e della
comparazione, il legame tra la stima del Valore di Mercato e il Prezzo di Compravendita può essere spiegato da un punto di vista matematico.
Il modello di Prezzo di Compravendita e un campione estimativo significativo sono strumenti centrali per
lo sviluppo di uno dei qualsiasi metodi di stima diretti del Valore di Mercato.
Obiettivo del presente studio è quello di descrivere le relazioni matematico-statistiche - nonché le difficoltà di applicazione – alla base dei metodi di stima diretti, prendendo spunto da casi studio pseudo-reali.
Di seguito si prenderà quindi in considerazione un campione estimativo particolarmente numeroso e
si fornirà una stima del Valore di Mercato del bene oggetto di stima attraverso la metodologia statistica nota come Regressione lineare multipla; si provvederà quindi ad applicare anche il cosiddetto Sales
Comparison Approach (SCA) per stimare il Valore di Mercato nel caso di un campione estimativo di bassa
numerosità. Infine si valuterà l'utilità pratica e le condizioni di applicazioni di un metodo di stima noto come
Nearest Neighbors Appraisal Technique (NNAT).
Si consideri un appartamento di 80 m2 situato in un quartiere popolare della Città di Torino, costruito
intorno agli anni ‘50, parzialmente ristrutturato, avente due arie, una cantina, ecc.
Supponiamo che tale appartamento debba essere stimato. Il tecnico chiamato ad eseguire la stima
dovrà innanzitutto verificare se si possa costruire un campione estimativo per poter eseguire una stima diretta del Valore di Mercato di tale appartamento. Il campione estimativo dovrà essere costituito
da un certo numero di appartamenti simili a quello oggetto della stima, recentemente compravenduti e geograficamente limitrofi. Il tecnico dovrà procedere nella stima seguendo i postulati estimativi
della previsione, dell’ordinarietà e della comparazione.
PREZZO e VALORE di MERCATO
Il Valore di Mercato di un bene immobile oggetto di stima è definito come il più probabile Prezzo di
Compravendita del bene stesso. Il Prezzo di Compravendita, invece, è la quantità monetaria scambiata tra compratore e venditore durante un atto di compravendita.
Dalla definizione sopra fornita, si evince come la stima del Valore di Mercato sia in qualche modo
legato al Prezzo di Compravendita. Nel prosieguo si cercherà di chiarire questo legame da un punto
di vista matematico. Per il momento è sufficiente sottolineare che nella pratica estimativa il Valore di
Mercato si può stimare per via diretta solo se di tutti gli elementi del campione estimativo si conosce
il reale Prezzo di Compravendita.
La stima del Valore di Mercato eseguita per via diretta deve rispettare il postulato dell’ordinarietà.
†
Ricercatore in Estimo presso la Facoltà di Architettura II del Politecnico di Torino
53
Pertanto, il valore ottenuto non deve coincidere esattamente con il Prezzo effettivo che verrà scambiato tra le parti, quanto piuttosto con il Prezzo più probabile! Ovvero con quello che in un mercato
perfetto verrebbe a formarsi e che la maggioranza dei tecnici stimerebbe.
D’altra parte la stima del Valore di Mercato deve soddisfare anche il postulato della previsione. Pertanto la stima del Valore di Mercato non deve discostarsi molto dal Prezzo reale di Compravendita che si
andrà a realizzare dopo l’avvenuta stima. E’ evidente come i due postulati risultino almeno apparentemente in contraddizione. Vedremo come dal punto di vista statistico si supera questo ostacolo.
Tutti i metodi di stima diretta del Valore di Mercato di un bene (Sales Comparison Approach, Regressione, Stima monoparametrica diretta, ecc.) possono essere definiti attraverso l’introduzione di modelli matematici o statistici. In tal modo si possono cogliere similitudini, differenze, limiti e vantaggi
dei singoli metodi.
Il MODELLO del VALORE di MERCATO
Ritorniamo al caso dell’appartamento di 80 m2. Compito del tecnico è fornire una stima del suo Valore di Mercato. Per fare ciò occorre che il tecnico si chieda quali siano le caratteristiche (o variabili)
che definiscono il Valore di Mercato dell’appartamento oggetto della stima. Lungi dal pretendere di
redigere un elenco completo, possiamo tentare di individuare alcune delle caratteristiche capaci di
influire sulla formazione del Valore di Mercato dell’appartamento:
• coordinate geografiche dell’appartamento
• grado di sicurezza del vicinato
• servizi presenti nelle vicinanze dell’appartamento
• superficie commerciale
• anno di costruzione
• stato di conservazione dell’appartamento
• stato di conservazione del fabbricato
• numero di arie
• presenza di cantina
• dinamicità del mercato immobiliare
• tassi di interesse per l’accensione di mutui
• indici sulle prospettive future dell’economia
• ...
Le caratteristiche elencate (e quelle non elencate) possono essere raggruppate in diversi modi. Ad
esempio si può convenire con il fatto che alcune di esse facciano riferimento all’ubicazione (posizione geografica, vicinato, ...), altre alle caratteristiche tecniche dell’abitazione (superficie, anno di
costruzione, ...), altre ancora si concentrino sugli andamenti economici e finanziari locali e globali
(dinamicità del mercato immobiliare, tassi, indici, ...).
Alcune caratteristiche sono facilmente rilevabili (es. numero di arie), altre sono di più difficile rilevazione (es. grado di sicurezza del vicinato). Vi sono caratteristiche che possono essere rilevate senza
errori (es. numero di arie) ma anche caratteristiche che nella rilevazione possono dare origine ad
errori di misura (es. anno di costruzione). Le caratteristiche possono poi essere suddivise in quantitative (es. superficie), perché le informazioni raccolte sono numeri, e caratteristiche qualitative (es.
stato di conservazione dell’abitazione), perché i dati rilevati sono delle categorie e non dei numeri.
Si supponga di essere in grado di rilevare per il bene oggetto di stima tutti i valori delle caratteristiche che determinano il suo Valore di Mercato (che indicheremo con VM0). Ad esempio, si supponga
che le coordinate geografiche dell’appartamento siano x01=7.1403 (latitudine) e x02=45.0456 (longitudine). Allo stesso modo si convenga che il grado di sicurezza del vicinato sia descrivibile come
x03=”Buono”, e così via per le altre caratteristiche. Dal punto di vista matematico è semplice supporre che VM0 sia una funzione (complessa sin che si vuole) delle caratteristiche che ne determinano il
valore, ovvero che
VM0 = h0(x01, x02,…)
(1)
52
Interpretazione matematico-statistica dei metodi di stima diretti
Gabriele Brondino†
Interpretazione matematico-statistica
dei metodi di stima diretti
Parole chiave: metodi di stima diretti, valore di mercato, prezzo di compravendita, regressione lineare multipla, Sales Comparison Approach, Nearest Neighbors Appraisal Technique.
Abstract Partendo dai presupposti dettati dai postulati estimativi dell’ordinarietà, della previsione e della
comparazione, il legame tra la stima del Valore di Mercato e il Prezzo di Compravendita può essere spiegato da un punto di vista matematico.
Il modello di Prezzo di Compravendita e un campione estimativo significativo sono strumenti centrali per
lo sviluppo di uno dei qualsiasi metodi di stima diretti del Valore di Mercato.
Obiettivo del presente studio è quello di descrivere le relazioni matematico-statistiche - nonché le difficoltà di applicazione – alla base dei metodi di stima diretti, prendendo spunto da casi studio pseudo-reali.
Di seguito si prenderà quindi in considerazione un campione estimativo particolarmente numeroso e
si fornirà una stima del Valore di Mercato del bene oggetto di stima attraverso la metodologia statistica nota come Regressione lineare multipla; si provvederà quindi ad applicare anche il cosiddetto Sales
Comparison Approach (SCA) per stimare il Valore di Mercato nel caso di un campione estimativo di bassa
numerosità. Infine si valuterà l'utilità pratica e le condizioni di applicazioni di un metodo di stima noto come
Nearest Neighbors Appraisal Technique (NNAT).
Si consideri un appartamento di 80 m2 situato in un quartiere popolare della Città di Torino, costruito
intorno agli anni ‘50, parzialmente ristrutturato, avente due arie, una cantina, ecc.
Supponiamo che tale appartamento debba essere stimato. Il tecnico chiamato ad eseguire la stima
dovrà innanzitutto verificare se si possa costruire un campione estimativo per poter eseguire una stima diretta del Valore di Mercato di tale appartamento. Il campione estimativo dovrà essere costituito
da un certo numero di appartamenti simili a quello oggetto della stima, recentemente compravenduti e geograficamente limitrofi. Il tecnico dovrà procedere nella stima seguendo i postulati estimativi
della previsione, dell’ordinarietà e della comparazione.
PREZZO e VALORE di MERCATO
Il Valore di Mercato di un bene immobile oggetto di stima è definito come il più probabile Prezzo di
Compravendita del bene stesso. Il Prezzo di Compravendita, invece, è la quantità monetaria scambiata tra compratore e venditore durante un atto di compravendita.
Dalla definizione sopra fornita, si evince come la stima del Valore di Mercato sia in qualche modo
legato al Prezzo di Compravendita. Nel prosieguo si cercherà di chiarire questo legame da un punto
di vista matematico. Per il momento è sufficiente sottolineare che nella pratica estimativa il Valore di
Mercato si può stimare per via diretta solo se di tutti gli elementi del campione estimativo si conosce
il reale Prezzo di Compravendita.
La stima del Valore di Mercato eseguita per via diretta deve rispettare il postulato dell’ordinarietà.
†
Ricercatore in Estimo presso la Facoltà di Architettura II del Politecnico di Torino
53
Pertanto, il valore ottenuto non deve coincidere esattamente con il Prezzo effettivo che verrà scambiato tra le parti, quanto piuttosto con il Prezzo più probabile! Ovvero con quello che in un mercato
perfetto verrebbe a formarsi e che la maggioranza dei tecnici stimerebbe.
D’altra parte la stima del Valore di Mercato deve soddisfare anche il postulato della previsione. Pertanto la stima del Valore di Mercato non deve discostarsi molto dal Prezzo reale di Compravendita che si
andrà a realizzare dopo l’avvenuta stima. E’ evidente come i due postulati risultino almeno apparentemente in contraddizione. Vedremo come dal punto di vista statistico si supera questo ostacolo.
Tutti i metodi di stima diretta del Valore di Mercato di un bene (Sales Comparison Approach, Regressione, Stima monoparametrica diretta, ecc.) possono essere definiti attraverso l’introduzione di modelli matematici o statistici. In tal modo si possono cogliere similitudini, differenze, limiti e vantaggi
dei singoli metodi.
Il MODELLO del VALORE di MERCATO
Ritorniamo al caso dell’appartamento di 80 m2. Compito del tecnico è fornire una stima del suo Valore di Mercato. Per fare ciò occorre che il tecnico si chieda quali siano le caratteristiche (o variabili)
che definiscono il Valore di Mercato dell’appartamento oggetto della stima. Lungi dal pretendere di
redigere un elenco completo, possiamo tentare di individuare alcune delle caratteristiche capaci di
influire sulla formazione del Valore di Mercato dell’appartamento:
• coordinate geografiche dell’appartamento
• grado di sicurezza del vicinato
• servizi presenti nelle vicinanze dell’appartamento
• superficie commerciale
• anno di costruzione
• stato di conservazione dell’appartamento
• stato di conservazione del fabbricato
• numero di arie
• presenza di cantina
• dinamicità del mercato immobiliare
• tassi di interesse per l’accensione di mutui
• indici sulle prospettive future dell’economia
• ...
Le caratteristiche elencate (e quelle non elencate) possono essere raggruppate in diversi modi. Ad
esempio si può convenire con il fatto che alcune di esse facciano riferimento all’ubicazione (posizione geografica, vicinato, ...), altre alle caratteristiche tecniche dell’abitazione (superficie, anno di
costruzione, ...), altre ancora si concentrino sugli andamenti economici e finanziari locali e globali
(dinamicità del mercato immobiliare, tassi, indici, ...).
Alcune caratteristiche sono facilmente rilevabili (es. numero di arie), altre sono di più difficile rilevazione (es. grado di sicurezza del vicinato). Vi sono caratteristiche che possono essere rilevate senza
errori (es. numero di arie) ma anche caratteristiche che nella rilevazione possono dare origine ad
errori di misura (es. anno di costruzione). Le caratteristiche possono poi essere suddivise in quantitative (es. superficie), perché le informazioni raccolte sono numeri, e caratteristiche qualitative (es.
stato di conservazione dell’abitazione), perché i dati rilevati sono delle categorie e non dei numeri.
Si supponga di essere in grado di rilevare per il bene oggetto di stima tutti i valori delle caratteristiche che determinano il suo Valore di Mercato (che indicheremo con VM0). Ad esempio, si supponga
che le coordinate geografiche dell’appartamento siano x01=7.1403 (latitudine) e x02=45.0456 (longitudine). Allo stesso modo si convenga che il grado di sicurezza del vicinato sia descrivibile come
x03=”Buono”, e così via per le altre caratteristiche. Dal punto di vista matematico è semplice supporre che VM0 sia una funzione (complessa sin che si vuole) delle caratteristiche che ne determinano il
valore, ovvero che
VM0 = h0(x01, x02,…)
(1)
54
Interpretazione matematico-statistica dei metodi di stima diretti
Gabriele Brondino
Se oltre ai valori delle caratteristiche x0j (j=1,2,...) si conoscesse anche il valore della funzione h0 non
vi sarebbero grossi problemi e la stima sarebbe una questione molto semplice. Purtroppo la realtà
è ben più complessa.
Il MODELLO del PREZZO di COMPRAVENDITA
Che il Prezzo di Compravendita di un bene immobile sia in qualche modo legato al Valore di Mercato
è scontato. Non a caso il postulato della previsione richiede che il tecnico fornisca un giudizio di
valore capace di avvicinarsi al Prezzo reale di Compravendita che si potrebbe realizzare nel mercato
(previsione). D’altra parte quasi mai il Valore di Mercato risultante da una perizia estimativa coincide
esattamente con il Prezzo reale di Compravendita del bene stimato.
Come spiegare questa (a volte anche notevole) differenza?
Innanzitutto occorre chiedersi da dove proviene questa diversità. Se il mercato immobiliare fosse
perfetto, infatti, la differenza tenderebbe ad annullarsi. In un mercato perfetto venditori e compratori
sarebbero numerosi, guidati dalla razionalità, completamente informati sull’andamento del mercato,
ecc. Non è difficile concludere che la compravendita di un bene immobile raramente soddisfa queste
condizioni. Ad esempio i venditori spesso non prendono la decisione di vendita seguendo i criteri
razionali (si pensi ad esempio al caso in cui una persona debba vendere un alloggio per esigenze
economiche). Allo stesso modo i compratori possono trovarsi meno informati sul mercato che un
venditore istituzionale, come ad esempio un costruttore edile.
In un atto di compravendita di un immobile non è difficile trovare molte imperfezioni del mercato. Ovvero è comune trovare caratteristiche che influiscono nella formazione del Prezzo ma non
nella formazione del Valore di Mercato (es. l’urgenza per un venditore di cedere il proprio bene
immobile). Per questo motivo è ragionevole supporre che tra Prezzo e Valore di Mercato sussista
la seguente relazione
P0 = VM0 + δ0 = h0(x01,x02,…) + δ0
(2)
essendo P0 il Prezzo di Compravendita del bene e δ0 la differenza dovuta alle variabili che non influiscono nella determinazione del Valore di Mercato ma soltanto nella formazione del Prezzo (es.
condizioni economiche del venditore).
Prima di proseguire occorre approfondire ulteriormente il discorso sul termine δ0. Matematicamente
esso va considerato come una variabile casuale.
Tale affermazione trova una giustificazione nella definizione che l’Estimo dà del Valore di Mercato:
il più probabile Prezzo di Compravendita. Infatti se δ0 è una variabile casuale, allora la definizione di
Prezzo si traduce nell’imporre che il valore atteso della variabile sia nullo, ovvero che
E(δ0) = 0
(3)
Il legame tra Prezzo e Valore di Mercato descritto dalla (2) consente di spiegare (molto genericamente) la formazione del Prezzo di Compravendita, ma soprattutto consente di trovare la strada con cui
giungere ad una stima del Valore di Mercato (obiettivo di ogni procedura di stima diretta).
Per concretizzare quanto sopra definito matematicamente, supponiamo che l’appartamento di 80
m2 abbia un Valore di Mercato pari a 180000 €. Esigenze economiche da parte del venditore potrebbero indurlo a venderlo ad un Prezzo di soli 150000 €.
La differenza, pari a 30000 €, sarebbe una delle possibili realizzazioni della variabile casuale δ0.
55
SEMPLIFICAZIONI del MODELLO del VALORE di MERCATO
Per determinare il Valore di Mercato per via diretta la disciplina estimativa impone che venga raccolto un campione estimativo di beni simili a quello oggetto di stima.
Per ciascuno degli n beni che costituiscono il campione estimativo si rilevano il Prezzo di Compravendita e il valore di ciascuna delle caratteristiche che influenzano la formazione di VM0
Pi , xi1, xi2 , …. ∀ i ∈ {1, 2, …, n} ⊆ I0
(4)
Per I0 si intende l’insieme di beni simili al bene oggetto di stima.
I metodi di stima diretta utilizzano i dati raccolti sul campione estimativo per giungere ad una stima
del Valore di Mercato. Alcuni di questi metodi ipotizzano la forma della funzione h0 che lega le caratteristiche influenti su VM0.
Altri metodi giungono ad una stima della funzione attraverso l’utilizzo dei dati campionari.
In entrambe è però necessario introdurre alcune semplificazioni al modello del Valore di Mercato
definito dall’equazione (1).
Prima Semplificazione: Beni Simili
Chi e come può aiutarci a definire la funzione h0 capace di consentirci di determinare VM0?
Purtroppo nessuno è in grado di definire con precisione tale funzione. Per cercare di superare questo primo ostacolo occorre fare uso del postulato estimativo alla base dei metodi di stima diretti,
quello della comparazione. La traduzione matematica di questo postulato è la seguente
VMi = h(xi1, xi2, …) per ∀ i ∈ {0, 1, 2, …, n}
(5)
In pratica si suppone che il Valore di Mercato dei beni simili (qui indicati con l’indice i) a quello oggetto
di stima sia una funzione h delle rispettive caratteristiche. Per i beni simili si suppone che la formazione del Valore di Mercato segua la medesima legge di quella che genera il VM0 (ovvero la funzione
h). Generalmente per beni simili si intende che i beni abbiano valori delle caratteristiche solo in parte
differenti dai corrispettivi valori rilevati per il bene oggetto di stima, ovvero che esista almeno una
caratteristica j per cui x0j = xij per qualsiasi bene i, e che tendenzialmente abbiano valori in gran parte
uguali a quelli assunti dal bene oggetto di stima. Una definizione matematica più rigorosa di similarità
può essere fornita ricorrendo ai cosiddetti indici di similarità di cui si farà cenno successivamente.
Nella comune pratica estimativa la posizione geografica dell’appartamento viene gestita ricorrendo
al concetto di similarità. Ovvero si prendono in considerazione soltanto appartamenti ubicati nelle
vicinanze di quello oggetto di stima e compravenduti di recente. Ovviamente una tale strategia
implica che il concetto di vicinanza venga ulteriormente chiarito. In genere tale chiarimento si
basa sulla conoscenza che il tecnico ha del mercato nel quale si trova il bene oggetto di stima. In
termini più semplici, è il tecnico a decidere che, nel campione estimativo, possono rientrare solo gli
appartamenti che si trovano ad una distanza inferiore ai 500 m da quello oggetto di stima. Esistono
ovviamente dei metodi più formali per definire il concetto di vicinanza. Essi fanno riferimento a
metodi statistici che consentono di ottenere in modo automatico la distanza capace di determinare
il campione estimativo.
Il recente sviluppo delle tecnologie che consentono la georeferenziazione degli immobili sta favorendo l’adozione di modelli matematici in grado di gestire esplicitamente le caratteristiche geografiche dei beni. Tali modelli sono una valida alternativa alla soluzione che prevede di considerare
nel campione estimativo solo gli appartamenti vicini a quello oggetto di stima. Tuttavia i modelli
spaziali richiedono una grande quantità di dati georeferiti, software statistici opportuni e buone
conoscenze statistiche. Tutti elementi che non favoriscono l’adozione di queste metodologie nella
pratica estimativa. Nonostante i promettenti risultati che ci si attende dai modelli spaziali, nelle
pagine successive si gestirà la componente geografica dei beni immobili ricorrendo al concetto di
vicinanza in precedenza descritto.
54
Interpretazione matematico-statistica dei metodi di stima diretti
Gabriele Brondino
Se oltre ai valori delle caratteristiche x0j (j=1,2,...) si conoscesse anche il valore della funzione h0 non
vi sarebbero grossi problemi e la stima sarebbe una questione molto semplice. Purtroppo la realtà
è ben più complessa.
Il MODELLO del PREZZO di COMPRAVENDITA
Che il Prezzo di Compravendita di un bene immobile sia in qualche modo legato al Valore di Mercato
è scontato. Non a caso il postulato della previsione richiede che il tecnico fornisca un giudizio di
valore capace di avvicinarsi al Prezzo reale di Compravendita che si potrebbe realizzare nel mercato
(previsione). D’altra parte quasi mai il Valore di Mercato risultante da una perizia estimativa coincide
esattamente con il Prezzo reale di Compravendita del bene stimato.
Come spiegare questa (a volte anche notevole) differenza?
Innanzitutto occorre chiedersi da dove proviene questa diversità. Se il mercato immobiliare fosse
perfetto, infatti, la differenza tenderebbe ad annullarsi. In un mercato perfetto venditori e compratori
sarebbero numerosi, guidati dalla razionalità, completamente informati sull’andamento del mercato,
ecc. Non è difficile concludere che la compravendita di un bene immobile raramente soddisfa queste
condizioni. Ad esempio i venditori spesso non prendono la decisione di vendita seguendo i criteri
razionali (si pensi ad esempio al caso in cui una persona debba vendere un alloggio per esigenze
economiche). Allo stesso modo i compratori possono trovarsi meno informati sul mercato che un
venditore istituzionale, come ad esempio un costruttore edile.
In un atto di compravendita di un immobile non è difficile trovare molte imperfezioni del mercato. Ovvero è comune trovare caratteristiche che influiscono nella formazione del Prezzo ma non
nella formazione del Valore di Mercato (es. l’urgenza per un venditore di cedere il proprio bene
immobile). Per questo motivo è ragionevole supporre che tra Prezzo e Valore di Mercato sussista
la seguente relazione
P0 = VM0 + δ0 = h0(x01,x02,…) + δ0
(2)
essendo P0 il Prezzo di Compravendita del bene e δ0 la differenza dovuta alle variabili che non influiscono nella determinazione del Valore di Mercato ma soltanto nella formazione del Prezzo (es.
condizioni economiche del venditore).
Prima di proseguire occorre approfondire ulteriormente il discorso sul termine δ0. Matematicamente
esso va considerato come una variabile casuale.
Tale affermazione trova una giustificazione nella definizione che l’Estimo dà del Valore di Mercato:
il più probabile Prezzo di Compravendita. Infatti se δ0 è una variabile casuale, allora la definizione di
Prezzo si traduce nell’imporre che il valore atteso della variabile sia nullo, ovvero che
E(δ0) = 0
(3)
Il legame tra Prezzo e Valore di Mercato descritto dalla (2) consente di spiegare (molto genericamente) la formazione del Prezzo di Compravendita, ma soprattutto consente di trovare la strada con cui
giungere ad una stima del Valore di Mercato (obiettivo di ogni procedura di stima diretta).
Per concretizzare quanto sopra definito matematicamente, supponiamo che l’appartamento di 80
m2 abbia un Valore di Mercato pari a 180000 €. Esigenze economiche da parte del venditore potrebbero indurlo a venderlo ad un Prezzo di soli 150000 €.
La differenza, pari a 30000 €, sarebbe una delle possibili realizzazioni della variabile casuale δ0.
55
SEMPLIFICAZIONI del MODELLO del VALORE di MERCATO
Per determinare il Valore di Mercato per via diretta la disciplina estimativa impone che venga raccolto un campione estimativo di beni simili a quello oggetto di stima.
Per ciascuno degli n beni che costituiscono il campione estimativo si rilevano il Prezzo di Compravendita e il valore di ciascuna delle caratteristiche che influenzano la formazione di VM0
Pi , xi1, xi2 , …. ∀ i ∈ {1, 2, …, n} ⊆ I0
(4)
Per I0 si intende l’insieme di beni simili al bene oggetto di stima.
I metodi di stima diretta utilizzano i dati raccolti sul campione estimativo per giungere ad una stima
del Valore di Mercato. Alcuni di questi metodi ipotizzano la forma della funzione h0 che lega le caratteristiche influenti su VM0.
Altri metodi giungono ad una stima della funzione attraverso l’utilizzo dei dati campionari.
In entrambe è però necessario introdurre alcune semplificazioni al modello del Valore di Mercato
definito dall’equazione (1).
Prima Semplificazione: Beni Simili
Chi e come può aiutarci a definire la funzione h0 capace di consentirci di determinare VM0?
Purtroppo nessuno è in grado di definire con precisione tale funzione. Per cercare di superare questo primo ostacolo occorre fare uso del postulato estimativo alla base dei metodi di stima diretti,
quello della comparazione. La traduzione matematica di questo postulato è la seguente
VMi = h(xi1, xi2, …) per ∀ i ∈ {0, 1, 2, …, n}
(5)
In pratica si suppone che il Valore di Mercato dei beni simili (qui indicati con l’indice i) a quello oggetto
di stima sia una funzione h delle rispettive caratteristiche. Per i beni simili si suppone che la formazione del Valore di Mercato segua la medesima legge di quella che genera il VM0 (ovvero la funzione
h). Generalmente per beni simili si intende che i beni abbiano valori delle caratteristiche solo in parte
differenti dai corrispettivi valori rilevati per il bene oggetto di stima, ovvero che esista almeno una
caratteristica j per cui x0j = xij per qualsiasi bene i, e che tendenzialmente abbiano valori in gran parte
uguali a quelli assunti dal bene oggetto di stima. Una definizione matematica più rigorosa di similarità
può essere fornita ricorrendo ai cosiddetti indici di similarità di cui si farà cenno successivamente.
Nella comune pratica estimativa la posizione geografica dell’appartamento viene gestita ricorrendo
al concetto di similarità. Ovvero si prendono in considerazione soltanto appartamenti ubicati nelle
vicinanze di quello oggetto di stima e compravenduti di recente. Ovviamente una tale strategia
implica che il concetto di vicinanza venga ulteriormente chiarito. In genere tale chiarimento si
basa sulla conoscenza che il tecnico ha del mercato nel quale si trova il bene oggetto di stima. In
termini più semplici, è il tecnico a decidere che, nel campione estimativo, possono rientrare solo gli
appartamenti che si trovano ad una distanza inferiore ai 500 m da quello oggetto di stima. Esistono
ovviamente dei metodi più formali per definire il concetto di vicinanza. Essi fanno riferimento a
metodi statistici che consentono di ottenere in modo automatico la distanza capace di determinare
il campione estimativo.
Il recente sviluppo delle tecnologie che consentono la georeferenziazione degli immobili sta favorendo l’adozione di modelli matematici in grado di gestire esplicitamente le caratteristiche geografiche dei beni. Tali modelli sono una valida alternativa alla soluzione che prevede di considerare
nel campione estimativo solo gli appartamenti vicini a quello oggetto di stima. Tuttavia i modelli
spaziali richiedono una grande quantità di dati georeferiti, software statistici opportuni e buone
conoscenze statistiche. Tutti elementi che non favoriscono l’adozione di queste metodologie nella
pratica estimativa. Nonostante i promettenti risultati che ci si attende dai modelli spaziali, nelle
pagine successive si gestirà la componente geografica dei beni immobili ricorrendo al concetto di
vicinanza in precedenza descritto.
56
Interpretazione matematico-statistica dei metodi di stima diretti
Gabriele Brondino
Partendo dal postulato della comparazione è dunque possibile supporre che esista un’unica funzione
h capace di determinare il Valore di Mercato di un gruppo di beni simili, pertanto si può con ragionevolezza ridefinire VM0 come
VM0 ≡ h(x01, x02, …)
(6)
L’introduzione di questa prima semplificazione consente di riformulare la domanda da cui si è partiti:
chi e come può aiutarci a definire la funzione h (e non più h0) capace di consentirci di determinare
VM0? Questo piccolo cambiamento consentirà di superare l’ostacolo.
Ma per sapere come fare è necessario pazientare ancora un attimo. Prima, infatti, è necessario prendere coscienza della necessità di introdurre un’ulteriore semplificazione.
Seconda Semplificazione: Caratteristiche Incognite o Non Misurabili
La correttezza matematica del modello introdotto si scontra con la difficile realtà della pratica estimativa. Non è infatti scontato che le caratteristiche influenti il Valore di Mercato siano rilevabili o che
sia semplice identificare tutte le caratteristiche in grado di influire su VM0. Ad esempio può capitare
che una caratteristica come “la distanza dai complessi scolastici” non sia considerata influente nella
determinazione del Valore di Mercato e pertanto non venga rilevata.
Ma questo non è detto che sia vero.
Più spesso capita che la caratteristica sia considerata influente sul Valore di Mercato ma che risulti
impossibile (o troppo costoso) rilevare i dati. Ad esempio la caratteristica “grado di sicurezza del
vicinato” può essere difficile da misurare (a differenza di quanto capita negli Stati Uniti).
Vi possono inoltre essere variabili facili da rilevare (es. presenza di cantina) ma di cui non si possiede
l’informazione per alcuni elementi del campione.
In tal caso se la caratteristica non è considerata di fondamentale importanza nella formazione del
Valore di Mercato si può pensare di non prenderla in considerazione.
Indipendentemente dal fatto che una o più caratteristiche siano incognite, non rilevabili o non rilevate, dal punto di vista matematico occorre apportare una modifica alle formule (5) e (6) che definiscono il Valore di Mercato del bene oggetto di stima e dei beni ad esso simili
VMi = hR (xi1, xi2, …, xiJ) + ηi
∀ i ∈ {0, 1, 2, …, n}
funzione dei valori rilevati x01, x02, ..., x0J.
Giunti a questo punto, dopo aver introdotto due semplificazioni del modello che definisce il Valore di
Mercato e raccolto i dati sulle J caratteristiche del bene oggetto di stima, ci si aspetterebbe che la
stima di VM0 sia ormai cosa fatta. Purtroppo non è così, anzi finora si sono semplicemente evidenziate le approssimazioni e gli errori che si introducono nella stima del Valore di Mercato.
La funzione hR, infatti, non è ancora nota (... e ahimè non lo sarà mai!).
Terza Semplificazione: la Forma della funzione hR
Nell’introduzione di questa sezione si è detto come i metodi di stima diretta si dividono in due gruppi:
quelli che ipotizzano la forma della funzione hR (allora si era parlato di h0) e quelli che giungono alla
stima di hR partendo dai dati campionari raccolti.
In entrambi i casi però il rischio di commettere un errore è molto forte. Se si ipotizza, ad esempio, che
il Valore di Mercato per l’appartamento di 80 m2 da noi considerato in precedenza e per gli appartamenti ad esso simili dipenda dalla caratteristica Superficie in modo lineare, ovvero che
VMi =...+ βj Superficieij + ηi ∀ i ∈ {0, 1, 2, …, n}
non è detto che tale ipotesi sia errata e che invece la vera funzione del Valore di Mercato sia la più
complessa
VMi = … + βj Superficieij +βj+1 I(Superficiei(j+1) > 75) + hi
∀ i ∈ {0, 1, 2, …, n}
Non si vuole qui entrare nei dettagli delle formule sopra indicate. Esse rappresentano soltanto un
esempio di come nella definizione della funzione del Valore di Mercato vi possano essere degli errori
di forma quando si fanno delle ipotesi.
Un discorso del tutto analogo si può fare per quei metodi, come ad esempio la regressione, per i
quali sono previste procedure (di selezione del modello) capaci di individuare in maniera autonoma
la forma della funzione che meglio si adatta ai dati campionari raccolti.
Pertanto da quanto esposto risulta indispensabile apportare un’ulteriore modifica alla formula (7)
del Valore di Mercato
(7)
In questa nuova definizione il Valore di Mercato è la somma del valore assunto dalla funzione h ristretta (hR), ovvero valutata sulle sole caratteristiche rilevate, e di un termine di errore (ηi).
La formula (7) esprime in forma matematica un concetto molto semplice: se nella definizione del
Valore di Mercato si dimenticano, non si rilevano o non si possono rilevare alcune caratteristiche,
allora si introduce un errore che, genericamente, indichiamo con il termine ηi. Tale errore risulta di
dimensioni trascurabili se le caratteristiche escluse, ovvero quelle avente un indice superiore a J,
sono tali da non modificare in modo significativo il Valore di Mercato. In questo caso allora
VMi ≈ hR (xi1, xi2, …, xiJ) ∀ i ∈ {0, 1, 2, …, n}
57
(8)
Può capitare tuttavia che questa approssimazione non sia ragionevole. Ovvero che gli errori ηi non
siano trascurabili. Purtroppo in questo caso gli strumenti matematici non possono fare molto.
Al massimo si può cercare di sostituire le caratteristiche mancanti con altre che siano con esse
positivamente correlate. Se non si può percorrere questa strada dal punto di vista matematico si dovrebbe interrompere il procedimento di stima. Ma la pratica estimativa richiede comunque la stima
di un Valore e l’errore η0 viene compensato con metodi non matematici.
Prima di proseguire cerchiamo di riassumere quanto fino ad ora ottenuto. Supponendo di prendere
in considerazione un insieme di beni simili a quello oggetto di stima e selezionando le J caratteristiche che influiscono nella determinazione di VM0 , il Valore di Mercato è definito da (8) come una
VMi = f(xi1, xi2, …, xiJ) + νi + ηi
∀ i ∈ {0, 1, 2, …, n}
(9)
dove νi è l’errore dovuto alla non corretta definizione della forma della funzione hR. Fortunatamente la formula (9) non deve essere ulteriormente semplificata. Essa rappresenta il modello matematico del Valore di Mercato da cui partire per la stima di VM0.
Prima di proseguire, tuttavia, è necessario chiedersi quali effetti sulla stima di VM0 possono avere gli
errori ηi e νi.
A tal proposito dal punto di vista matematico possono presentarsi tre casi:
(a) gli errori sono nulli o trascurabili: νi ≈ 0, ηi ≈ 0;
(b) gli errori non sono trascurabili ma hanno un andamento casuale, ovvero sono delle variabili
casuali gaussiane con valore atteso nullo: νi ~ N(0, σν), ηi ~ N(0, ση);
(c) gli errori non sono trascurabili e non hanno un andamento casuale, ovvero non sono distribuiti
come delle gaussiane.
Quando gli errori sono del tipo (a) o (b) gli effetti sulla stima di VM0 non sono generalmente trascurabili ma possono essere comunque gestiti da molti metodi di stima. Diverso è il caso in cui gli
errori siano del tipo (c), in tal caso si dovrebbe interrompere la procedura di stima o comunque si
dovrebbero apportare delle correzioni ai risultati ottenuti.
Ma per apportare delle correzioni si dovrebbero conoscere le entità di tali errori attraverso l’esecuzione di studi su campioni di grandi dimensioni (per poter valutare l’errore di forma) eseguiti
attraverso la rilevazione di un gran numero di caratteristiche (per valutare l’errore dovuto alle
56
Interpretazione matematico-statistica dei metodi di stima diretti
Gabriele Brondino
Partendo dal postulato della comparazione è dunque possibile supporre che esista un’unica funzione
h capace di determinare il Valore di Mercato di un gruppo di beni simili, pertanto si può con ragionevolezza ridefinire VM0 come
VM0 ≡ h(x01, x02, …)
(6)
L’introduzione di questa prima semplificazione consente di riformulare la domanda da cui si è partiti:
chi e come può aiutarci a definire la funzione h (e non più h0) capace di consentirci di determinare
VM0? Questo piccolo cambiamento consentirà di superare l’ostacolo.
Ma per sapere come fare è necessario pazientare ancora un attimo. Prima, infatti, è necessario prendere coscienza della necessità di introdurre un’ulteriore semplificazione.
Seconda Semplificazione: Caratteristiche Incognite o Non Misurabili
La correttezza matematica del modello introdotto si scontra con la difficile realtà della pratica estimativa. Non è infatti scontato che le caratteristiche influenti il Valore di Mercato siano rilevabili o che
sia semplice identificare tutte le caratteristiche in grado di influire su VM0. Ad esempio può capitare
che una caratteristica come “la distanza dai complessi scolastici” non sia considerata influente nella
determinazione del Valore di Mercato e pertanto non venga rilevata.
Ma questo non è detto che sia vero.
Più spesso capita che la caratteristica sia considerata influente sul Valore di Mercato ma che risulti
impossibile (o troppo costoso) rilevare i dati. Ad esempio la caratteristica “grado di sicurezza del
vicinato” può essere difficile da misurare (a differenza di quanto capita negli Stati Uniti).
Vi possono inoltre essere variabili facili da rilevare (es. presenza di cantina) ma di cui non si possiede
l’informazione per alcuni elementi del campione.
In tal caso se la caratteristica non è considerata di fondamentale importanza nella formazione del
Valore di Mercato si può pensare di non prenderla in considerazione.
Indipendentemente dal fatto che una o più caratteristiche siano incognite, non rilevabili o non rilevate, dal punto di vista matematico occorre apportare una modifica alle formule (5) e (6) che definiscono il Valore di Mercato del bene oggetto di stima e dei beni ad esso simili
VMi = hR (xi1, xi2, …, xiJ) + ηi
∀ i ∈ {0, 1, 2, …, n}
funzione dei valori rilevati x01, x02, ..., x0J.
Giunti a questo punto, dopo aver introdotto due semplificazioni del modello che definisce il Valore di
Mercato e raccolto i dati sulle J caratteristiche del bene oggetto di stima, ci si aspetterebbe che la
stima di VM0 sia ormai cosa fatta. Purtroppo non è così, anzi finora si sono semplicemente evidenziate le approssimazioni e gli errori che si introducono nella stima del Valore di Mercato.
La funzione hR, infatti, non è ancora nota (... e ahimè non lo sarà mai!).
Terza Semplificazione: la Forma della funzione hR
Nell’introduzione di questa sezione si è detto come i metodi di stima diretta si dividono in due gruppi:
quelli che ipotizzano la forma della funzione hR (allora si era parlato di h0) e quelli che giungono alla
stima di hR partendo dai dati campionari raccolti.
In entrambi i casi però il rischio di commettere un errore è molto forte. Se si ipotizza, ad esempio, che
il Valore di Mercato per l’appartamento di 80 m2 da noi considerato in precedenza e per gli appartamenti ad esso simili dipenda dalla caratteristica Superficie in modo lineare, ovvero che
VMi =...+ βj Superficieij + ηi ∀ i ∈ {0, 1, 2, …, n}
non è detto che tale ipotesi sia errata e che invece la vera funzione del Valore di Mercato sia la più
complessa
VMi = … + βj Superficieij +βj+1 I(Superficiei(j+1) > 75) + hi
∀ i ∈ {0, 1, 2, …, n}
Non si vuole qui entrare nei dettagli delle formule sopra indicate. Esse rappresentano soltanto un
esempio di come nella definizione della funzione del Valore di Mercato vi possano essere degli errori
di forma quando si fanno delle ipotesi.
Un discorso del tutto analogo si può fare per quei metodi, come ad esempio la regressione, per i
quali sono previste procedure (di selezione del modello) capaci di individuare in maniera autonoma
la forma della funzione che meglio si adatta ai dati campionari raccolti.
Pertanto da quanto esposto risulta indispensabile apportare un’ulteriore modifica alla formula (7)
del Valore di Mercato
(7)
In questa nuova definizione il Valore di Mercato è la somma del valore assunto dalla funzione h ristretta (hR), ovvero valutata sulle sole caratteristiche rilevate, e di un termine di errore (ηi).
La formula (7) esprime in forma matematica un concetto molto semplice: se nella definizione del
Valore di Mercato si dimenticano, non si rilevano o non si possono rilevare alcune caratteristiche,
allora si introduce un errore che, genericamente, indichiamo con il termine ηi. Tale errore risulta di
dimensioni trascurabili se le caratteristiche escluse, ovvero quelle avente un indice superiore a J,
sono tali da non modificare in modo significativo il Valore di Mercato. In questo caso allora
VMi ≈ hR (xi1, xi2, …, xiJ) ∀ i ∈ {0, 1, 2, …, n}
57
(8)
Può capitare tuttavia che questa approssimazione non sia ragionevole. Ovvero che gli errori ηi non
siano trascurabili. Purtroppo in questo caso gli strumenti matematici non possono fare molto.
Al massimo si può cercare di sostituire le caratteristiche mancanti con altre che siano con esse
positivamente correlate. Se non si può percorrere questa strada dal punto di vista matematico si dovrebbe interrompere il procedimento di stima. Ma la pratica estimativa richiede comunque la stima
di un Valore e l’errore η0 viene compensato con metodi non matematici.
Prima di proseguire cerchiamo di riassumere quanto fino ad ora ottenuto. Supponendo di prendere
in considerazione un insieme di beni simili a quello oggetto di stima e selezionando le J caratteristiche che influiscono nella determinazione di VM0 , il Valore di Mercato è definito da (8) come una
VMi = f(xi1, xi2, …, xiJ) + νi + ηi
∀ i ∈ {0, 1, 2, …, n}
(9)
dove νi è l’errore dovuto alla non corretta definizione della forma della funzione hR. Fortunatamente la formula (9) non deve essere ulteriormente semplificata. Essa rappresenta il modello matematico del Valore di Mercato da cui partire per la stima di VM0.
Prima di proseguire, tuttavia, è necessario chiedersi quali effetti sulla stima di VM0 possono avere gli
errori ηi e νi.
A tal proposito dal punto di vista matematico possono presentarsi tre casi:
(a) gli errori sono nulli o trascurabili: νi ≈ 0, ηi ≈ 0;
(b) gli errori non sono trascurabili ma hanno un andamento casuale, ovvero sono delle variabili
casuali gaussiane con valore atteso nullo: νi ~ N(0, σν), ηi ~ N(0, ση);
(c) gli errori non sono trascurabili e non hanno un andamento casuale, ovvero non sono distribuiti
come delle gaussiane.
Quando gli errori sono del tipo (a) o (b) gli effetti sulla stima di VM0 non sono generalmente trascurabili ma possono essere comunque gestiti da molti metodi di stima. Diverso è il caso in cui gli
errori siano del tipo (c), in tal caso si dovrebbe interrompere la procedura di stima o comunque si
dovrebbero apportare delle correzioni ai risultati ottenuti.
Ma per apportare delle correzioni si dovrebbero conoscere le entità di tali errori attraverso l’esecuzione di studi su campioni di grandi dimensioni (per poter valutare l’errore di forma) eseguiti
attraverso la rilevazione di un gran numero di caratteristiche (per valutare l’errore dovuto alle
58
Interpretazione matematico-statistica dei metodi di stima diretti
Gabriele Brondino
caratteristiche generalmente non rilevate e/o rilevabili).
Purtroppo però la realtà della pratica estimativa è caratterizzata da campioni estimativi di dimensioni
piccole e da una certa difficoltà di reperimento dei dati relativi ad alcune caratteristiche. Gli studi
di grandi dimensioni non sono frequenti e, pertanto, non è molto facile verificare se gli errori ηi e νi
siano del tipo (c). Prima di proseguire bisogna affermare con molta chiarezza che affinché la stima
del Valore di Mercato del bene oggetto di stima (VM0) sia “buona” è necessario che gli errori dovuti
al numero limitato di caratteristiche considerate (ηi) e quelli dettati dall’errore di forma (νi) siano
del tipo (a) o (b). Se così non fosse allora tutte le procedure di stima e i relativi errori risulterebbero
affetti da imprecisioni e le stime ottenute non avrebbero significato pratico.
Così come un grande chef non può cucinare un grande piatto se le materie prime sono di pessima
qualità, allo stesso modo un metodo statistico o estimativo per quanto teoricamente esatto non può
fornire una stima di qualità in presenza di errori del tipo (c).
MODIFICHE al MODELLO del PREZZO di COMPRAVENDITA
Si è già detto che per giungere ad una stima del Valore di Mercato del bene oggetto di stima occorre
fare uso dei Prezzi di Compravendita rilevati sui beni che costituiscono il campione estimativo.
Per poter svolgere tale operazione, indipendentemente dal metodo di stima utilizzato, occorre
• estendere il modello del Prezzo di Compravendita (2) a tutti gli elementi del campione estimativo
(operazione assolutamente lecita e ragionevole);
• sostituire nel modello (2) esteso la definizione di Valore di Mercato (9) introdotta a seguito delle
semplificazioni viste in precedenza;
• ipotizzare che gli errori ηi e νi siano del tipo (a) o (b), ovvero che siano trascurabili o casuali.
L’esecuzione di tali operazioni algebriche consente di costruire la seguente formula:
Pi = VMi + δ i = f(xi1, xi2, …, xiJ) + νi+ηi+δi
∀ i ∈ {0, 1, 2, …, n}
(10)
Sotto l’ipotesi che gli errori ηi e νi siano del tipo (a) o (b) la formula (10) si può ulteriormente semplificare in quella che possiamo definire come Modello della formazione del Prezzo di Compravendita:
Pi = f(xi1, xi2, …, xiJ) +εi
∀ i ∈ {0, 1, 2, …, n}
(11)
avendo cura di definire le variabili casuali εi (aventi valore atteso 0) come somma degli errori νi, ηi e
δi per qualsiasi i compreso tra 0 e n.
Nel seguito verranno descritti i principali metodi di stima diretta del Valore di Mercato, ovvero gli
algoritmi che consentono di giungere ad ottenere un valore numerico che indicheremo come
VM0 = f (x01, x02, …, x0J)
(12)
essendo f la stima della funzione f del Valore di Mercato.
Occorre a questo punto chiarire che nel gergo estimativo per Valore di Mercato si intende il giudizio di stima fornito dal tecnico/perito al termine della consulenza/perizia. Pertanto a rigor di logica
avremmo dovuto chiamare Valore di Mercato la quantità monetaria indicata generalmente nella formula (12). Tuttavia dal punto di vista matematico l’adozione di questa convenzione avrebbe ingenerato parecchia confusione. è più corretto (matematicamente) considerare il Valore di Mercato VM0
come un valore incognito e in alcun modo non conoscibile. E definire la quantità monetaria risultante
dalla procedura di stima diretta VM0 come Stima del Valore di Mercato.
59
METODI di STIMA DIRETTI del VALORE di MERCATO
Il modello di Prezzo di Compravendita (11) e un campione estimativo sono gli strumenti necessari
per lo sviluppo di uno dei qualsiasi metodi di stima diretti del Valore di Mercato. Di seguito prenderemo in considerazione alcuni di questi metodi cercando di descriverne i dettagli matematici e
le difficoltà di applicazione, prendendo spunto da casi studio pseudo-reali.
Dapprima si prenderà in considerazione un campione estimativo particolarmente numeroso e si fornirà una stima del Valore di Mercato del bene oggetto di stima attraverso la metodologia statistica
nota come Regressione. Di seguito si provvederà ad applicare il cosiddetto Sales Comparison Approach
(SCA) per stimare il Valore di Mercato nel caso di un campione estimativo di bassa numerosità. Infine si
valuterà l’utilità pratica e le condizioni di applicazioni di un metodo di stima noto come Nearest Neighbors Appraisal Technique (NNAT).
La descrizione matematica della Regressione e del SCA, con relativo confronto, seguirà lo schema e la
dicitura introdotti da Isakson (2002) nell’articolo dal titolo The Linear Algebra of the Sales Comparison
Approach. Si sottolinea inoltre come la Regressione sia in realtà una classe di metodi in continuo ampliamento e aggiornamento. La disponibilità di software statistici e la costruzione di banche dati delle
transazioni sempre più ampie e complete inducono a pensare che nei prossimi anni questa classe di
metodi verrà sempre più utilizzata in ambito estimativo.
Per avere un quadro più chiaro e completo sui metodi di Regressione si rimanda al testo di Hastie
ed altri (2001) dal titolo The Element of Statistical Learning. Data Mining, Inference and Prediction.
Nel medesimo testo è anche possibile trovare i fondamenti teorici del metodo indicato come NNTA.
REGRESSIONE LINEARE MULTIPLA
Nell’ambito estimativo un ruolo importante (soprattutto in un contesto extra italiano) è costituito
dalle cosiddette stime di massa (mass appraisal).
Tali stime sono utilizzate principalmente in ambito fiscale consentendo di fornire una valutazione del
valore di mercato di un gran numero di beni. Esistono molti metodi matematici e statistici che possono
essere utilizzati per effettuare una stima di massa. Tra questi metodi la regressione lineare multipla è
tra i più noti. Nonostante questo metodo non sia necessariamente il più adatto in molti dei casi pratici,
esso è certamente il più semplice da comprendere e da applicare. In particolare la regressione è un
metodo statistico molto noto che ormai risulta implementato in un gran numero di software.
Di seguito verrà presentato un caso studio e, attraverso di esso, verrà descritto il modello di regressione lineare multipla.
Il Campione Estimativo
Nel caso di stime di massa il campione estimativo è costituito da un gran numero di beni compravenduti di recente sui quali si provvede a rilevare un buon numero di caratteristiche. Il metodo della
regressione lineare multipla può essere utilizzato se il campione è formato da beni ubicati nelle
vicinanze. Il campione estimativo di seguito analizzato consiste in una banca dati di 52 transazioni
recentemente avvenute, per le quali si conoscono le informazioni relative alle seguenti caratteristiche: Prezzo, Superficie, Arie, Balconi, Cantina, Piano, Ascensore, Anno di Costruzione e Stato di
Conservazione dell’unità immobiliare. Le transazioni sono avvenute in una zona geografica specifica
e caratterizzata da una tipologia costruttiva economico-popolare.
Si ipotizza che le caratteristiche rilevate siano quelle che influiscono nella determinazione del valore
di mercato dei beni compravenduti nella zona.
Tale ipotesi risulta certamente difficile da accettare. E’ più ragionevole e corretto pensare che anche altre caratteristiche influenzino la formazione del Valore di Mercato. Pertanto per ciascun bene
considerato la componente di errore ηi (equazione 7) non può considerarsi nulla. Risulta tuttavia
altrettanto ragionevole supporre che gli errori ηi siano del cosiddetto tipo (b), ovvero di entità non
trascurabile ma con andamento casuale ηi ~ N(0, ση).
I dati raccolti sui 52 elementi del campione estimativo sono organizzati nella seguente tabella (di cui
si riporta soltanto uno stralcio)
58
Interpretazione matematico-statistica dei metodi di stima diretti
Gabriele Brondino
caratteristiche generalmente non rilevate e/o rilevabili).
Purtroppo però la realtà della pratica estimativa è caratterizzata da campioni estimativi di dimensioni
piccole e da una certa difficoltà di reperimento dei dati relativi ad alcune caratteristiche. Gli studi
di grandi dimensioni non sono frequenti e, pertanto, non è molto facile verificare se gli errori ηi e νi
siano del tipo (c). Prima di proseguire bisogna affermare con molta chiarezza che affinché la stima
del Valore di Mercato del bene oggetto di stima (VM0) sia “buona” è necessario che gli errori dovuti
al numero limitato di caratteristiche considerate (ηi) e quelli dettati dall’errore di forma (νi) siano
del tipo (a) o (b). Se così non fosse allora tutte le procedure di stima e i relativi errori risulterebbero
affetti da imprecisioni e le stime ottenute non avrebbero significato pratico.
Così come un grande chef non può cucinare un grande piatto se le materie prime sono di pessima
qualità, allo stesso modo un metodo statistico o estimativo per quanto teoricamente esatto non può
fornire una stima di qualità in presenza di errori del tipo (c).
MODIFICHE al MODELLO del PREZZO di COMPRAVENDITA
Si è già detto che per giungere ad una stima del Valore di Mercato del bene oggetto di stima occorre
fare uso dei Prezzi di Compravendita rilevati sui beni che costituiscono il campione estimativo.
Per poter svolgere tale operazione, indipendentemente dal metodo di stima utilizzato, occorre
• estendere il modello del Prezzo di Compravendita (2) a tutti gli elementi del campione estimativo
(operazione assolutamente lecita e ragionevole);
• sostituire nel modello (2) esteso la definizione di Valore di Mercato (9) introdotta a seguito delle
semplificazioni viste in precedenza;
• ipotizzare che gli errori ηi e νi siano del tipo (a) o (b), ovvero che siano trascurabili o casuali.
L’esecuzione di tali operazioni algebriche consente di costruire la seguente formula:
Pi = VMi + δ i = f(xi1, xi2, …, xiJ) + νi+ηi+δi
∀ i ∈ {0, 1, 2, …, n}
(10)
Sotto l’ipotesi che gli errori ηi e νi siano del tipo (a) o (b) la formula (10) si può ulteriormente semplificare in quella che possiamo definire come Modello della formazione del Prezzo di Compravendita:
Pi = f(xi1, xi2, …, xiJ) +εi
∀ i ∈ {0, 1, 2, …, n}
(11)
avendo cura di definire le variabili casuali εi (aventi valore atteso 0) come somma degli errori νi, ηi e
δi per qualsiasi i compreso tra 0 e n.
Nel seguito verranno descritti i principali metodi di stima diretta del Valore di Mercato, ovvero gli
algoritmi che consentono di giungere ad ottenere un valore numerico che indicheremo come
VM0 = f (x01, x02, …, x0J)
(12)
essendo f la stima della funzione f del Valore di Mercato.
Occorre a questo punto chiarire che nel gergo estimativo per Valore di Mercato si intende il giudizio di stima fornito dal tecnico/perito al termine della consulenza/perizia. Pertanto a rigor di logica
avremmo dovuto chiamare Valore di Mercato la quantità monetaria indicata generalmente nella formula (12). Tuttavia dal punto di vista matematico l’adozione di questa convenzione avrebbe ingenerato parecchia confusione. è più corretto (matematicamente) considerare il Valore di Mercato VM0
come un valore incognito e in alcun modo non conoscibile. E definire la quantità monetaria risultante
dalla procedura di stima diretta VM0 come Stima del Valore di Mercato.
59
METODI di STIMA DIRETTI del VALORE di MERCATO
Il modello di Prezzo di Compravendita (11) e un campione estimativo sono gli strumenti necessari
per lo sviluppo di uno dei qualsiasi metodi di stima diretti del Valore di Mercato. Di seguito prenderemo in considerazione alcuni di questi metodi cercando di descriverne i dettagli matematici e
le difficoltà di applicazione, prendendo spunto da casi studio pseudo-reali.
Dapprima si prenderà in considerazione un campione estimativo particolarmente numeroso e si fornirà una stima del Valore di Mercato del bene oggetto di stima attraverso la metodologia statistica
nota come Regressione. Di seguito si provvederà ad applicare il cosiddetto Sales Comparison Approach
(SCA) per stimare il Valore di Mercato nel caso di un campione estimativo di bassa numerosità. Infine si
valuterà l’utilità pratica e le condizioni di applicazioni di un metodo di stima noto come Nearest Neighbors Appraisal Technique (NNAT).
La descrizione matematica della Regressione e del SCA, con relativo confronto, seguirà lo schema e la
dicitura introdotti da Isakson (2002) nell’articolo dal titolo The Linear Algebra of the Sales Comparison
Approach. Si sottolinea inoltre come la Regressione sia in realtà una classe di metodi in continuo ampliamento e aggiornamento. La disponibilità di software statistici e la costruzione di banche dati delle
transazioni sempre più ampie e complete inducono a pensare che nei prossimi anni questa classe di
metodi verrà sempre più utilizzata in ambito estimativo.
Per avere un quadro più chiaro e completo sui metodi di Regressione si rimanda al testo di Hastie
ed altri (2001) dal titolo The Element of Statistical Learning. Data Mining, Inference and Prediction.
Nel medesimo testo è anche possibile trovare i fondamenti teorici del metodo indicato come NNTA.
REGRESSIONE LINEARE MULTIPLA
Nell’ambito estimativo un ruolo importante (soprattutto in un contesto extra italiano) è costituito
dalle cosiddette stime di massa (mass appraisal).
Tali stime sono utilizzate principalmente in ambito fiscale consentendo di fornire una valutazione del
valore di mercato di un gran numero di beni. Esistono molti metodi matematici e statistici che possono
essere utilizzati per effettuare una stima di massa. Tra questi metodi la regressione lineare multipla è
tra i più noti. Nonostante questo metodo non sia necessariamente il più adatto in molti dei casi pratici,
esso è certamente il più semplice da comprendere e da applicare. In particolare la regressione è un
metodo statistico molto noto che ormai risulta implementato in un gran numero di software.
Di seguito verrà presentato un caso studio e, attraverso di esso, verrà descritto il modello di regressione lineare multipla.
Il Campione Estimativo
Nel caso di stime di massa il campione estimativo è costituito da un gran numero di beni compravenduti di recente sui quali si provvede a rilevare un buon numero di caratteristiche. Il metodo della
regressione lineare multipla può essere utilizzato se il campione è formato da beni ubicati nelle
vicinanze. Il campione estimativo di seguito analizzato consiste in una banca dati di 52 transazioni
recentemente avvenute, per le quali si conoscono le informazioni relative alle seguenti caratteristiche: Prezzo, Superficie, Arie, Balconi, Cantina, Piano, Ascensore, Anno di Costruzione e Stato di
Conservazione dell’unità immobiliare. Le transazioni sono avvenute in una zona geografica specifica
e caratterizzata da una tipologia costruttiva economico-popolare.
Si ipotizza che le caratteristiche rilevate siano quelle che influiscono nella determinazione del valore
di mercato dei beni compravenduti nella zona.
Tale ipotesi risulta certamente difficile da accettare. E’ più ragionevole e corretto pensare che anche altre caratteristiche influenzino la formazione del Valore di Mercato. Pertanto per ciascun bene
considerato la componente di errore ηi (equazione 7) non può considerarsi nulla. Risulta tuttavia
altrettanto ragionevole supporre che gli errori ηi siano del cosiddetto tipo (b), ovvero di entità non
trascurabile ma con andamento casuale ηi ~ N(0, ση).
I dati raccolti sui 52 elementi del campione estimativo sono organizzati nella seguente tabella (di cui
si riporta soltanto uno stralcio)
60
Interpretazione matematico-statistica dei metodi di stima diretti
Gabriele Brondino
61
Tabella 1 Stralcio della banca dati delle 52 transazioni che costituiscono il campione estimativo
Prezzo
Sup.
Arie
Balconi
Cantina
Piano
Ascensore
Anno
Conservazione
79800
45
2
1
Presente
0
Assente
1930
Non Ristr.
65100
45
2
1
Assente
0
Assente
1950
Non Ristr.
••••
••
•
•
••••
•
••••
••••
••••
76800
55
2
1
Presente
3
Assente
1930
Ristr.-Nuovo
P=
Dalla Tabella 1 emerge come alcune caratteristiche (Prezzo, Superficie Arie, Balconi, Piano e
Anno di Costruzione) sono di tipo quantitativo. Le altre (Cantina, Ascensore e Conservazione),
invece, sono caratteristiche di tipo qualitativo.
Per queste ultime è necessario procedere ad una codifica numerica prima di applicare le formule
della regressione (e anche quelle del Sales Comparison Approach). Le caratteristiche Cantina e
Ascensore saranno codificate sostituendo il numero 0 (1) nel caso in cui si presenti la modalità
Assente (Presente).
Allo stesso modo la caratteristica Conservazione sarà codificata sostituendo il numero 0 (1) nel
caso in cui si presenti la modalità Non Ristrutturato (Ristrutturato-Nuovo). Si procederà ora alla
presentazione delle formule che costituiscono il cuore della regressione lineare multipla. Contemporaneamente si cercherà di facilitare la comprensione delle formule inserendovi i valori presentati nello stralcio di banca dati di Tabella 1.
(13)
Tale modello è quello noto nell’ambito statistico come Modello di Regressione Lineare Multipla. Il
Prezzo risulta pertanto funzione di una somma di termini.
I primi J termini sono dovuti alle caratteristiche ritenute potenzialmente influenti nella formazione
del Prezzo. L’ultimo termine rappresenta l’errore dovuto alle componenti descritte nel seguito della formula (11). Il sistema di n equazioni (13) è di tipo lineare e pertanto può essere sinteticamente
rappresentato mediante la seguente formulazione matriciale
P = Xβ +ε
(14)
ove P, β e ε sono rispettivamente il vettore dei Prezzi, dei Parametri da stimare e degli Errori
••
•
pn
∈M(nx1)
X=
∙ ∙
x11
x12
•••
x1j
x21
x22
•••
x2j
••
•
••
•
••
••
•
xn1
xn2
•••
xnJ
β=
β2
••
•
βJ
∙ ∙
ε1
ε=
ε2
••
•
εn
∈M(nx1)
(15)
∙
•
∙
(16)
∈M(nxJ)
Sostituendo i valori raccolti sul campione estimativo (Tabella 1) nel vettore dei Prezzi e nella matrice delle Caratteristiche si ottiene
Riprendendo il modello del Prezzo di Compravendita nella versione descritta dalla formula (11) ed
introducendo l’ipotesi di linearità nei parametri delle caratteristiche si ottiene la seguente versione
∀ i ∈ {1, 2, …, n}
p2
β1
mentre X è la matrice delle caratteristiche
Ipotesi di linearità del modello
Pi = xi1β1 + xi2 β2 + …+ xiJ βJ + εi
∙ ∙
∈M(Jx1)
p1
P=
∙
79800
65100
••
•
76800
∙
∈M(52x1)
X=
∙
1
45
•••
0
1
45
•••
0
••
•
••
•
••
•
••
•
1
55
•••
1
∙
∈M(52x9)
La prima colonna della matrice X contiene un vettore di valori unitari, ovvero di 1, questo per fare sì
che si stimi la cosiddetta intercetta (si rammenti come in una retta l’intercetta è l’intersezione della
retta con l’asse delle ordinate). La seconda colonna è relativa ai valori della Superficie per i singoli elementi del campione. L’ultima colonna della matrice è ottenuta trasformando la caratteristica
Conservazione secondo la codifica precedentemente introdotta. Ritornando alla formula matriciale
(14) il problema consiste nello stimare il vettore dei Parametri β. Tale vettore può essere stimato per
mezzo di numerosi metodi statistici. Tuttavia il più semplice e noto è quello denominato dei minimi
quadrati. In tale metodo, infatti, la stima dei Parametri si ottiene cercando di minimizzare il quadrato
degli errori, ovvero cercando di minimizzare la quantità ε′ε.
Minimi Quadrati
Descrivere il metodo dei minimi quadrati per la stima dei Parametri del modello (14) non è l’obiettivo
di queste righe. Si rimanda al testo di Hastie et. al. (2001) o ad altri testi di statistica per una comprensione di come si deriva la seguente formula
β=(X'X) -1X'p
(17)
La formula (17) consente di ottenere la stima del vettore dei parametri ricorrendo esclusivamente
ai dati estimativi in possesso, ossia alla matrice delle Caratteristiche e al vettore dei Prezzi. Si vuole
60
Interpretazione matematico-statistica dei metodi di stima diretti
Gabriele Brondino
61
Tabella 1 Stralcio della banca dati delle 52 transazioni che costituiscono il campione estimativo
Prezzo
Sup.
Arie
Balconi
Cantina
Piano
Ascensore
Anno
Conservazione
79800
45
2
1
Presente
0
Assente
1930
Non Ristr.
65100
45
2
1
Assente
0
Assente
1950
Non Ristr.
••••
••
•
•
••••
•
••••
••••
••••
76800
55
2
1
Presente
3
Assente
1930
Ristr.-Nuovo
P=
Dalla Tabella 1 emerge come alcune caratteristiche (Prezzo, Superficie Arie, Balconi, Piano e
Anno di Costruzione) sono di tipo quantitativo. Le altre (Cantina, Ascensore e Conservazione),
invece, sono caratteristiche di tipo qualitativo.
Per queste ultime è necessario procedere ad una codifica numerica prima di applicare le formule
della regressione (e anche quelle del Sales Comparison Approach). Le caratteristiche Cantina e
Ascensore saranno codificate sostituendo il numero 0 (1) nel caso in cui si presenti la modalità
Assente (Presente).
Allo stesso modo la caratteristica Conservazione sarà codificata sostituendo il numero 0 (1) nel
caso in cui si presenti la modalità Non Ristrutturato (Ristrutturato-Nuovo). Si procederà ora alla
presentazione delle formule che costituiscono il cuore della regressione lineare multipla. Contemporaneamente si cercherà di facilitare la comprensione delle formule inserendovi i valori presentati nello stralcio di banca dati di Tabella 1.
(13)
Tale modello è quello noto nell’ambito statistico come Modello di Regressione Lineare Multipla. Il
Prezzo risulta pertanto funzione di una somma di termini.
I primi J termini sono dovuti alle caratteristiche ritenute potenzialmente influenti nella formazione
del Prezzo. L’ultimo termine rappresenta l’errore dovuto alle componenti descritte nel seguito della formula (11). Il sistema di n equazioni (13) è di tipo lineare e pertanto può essere sinteticamente
rappresentato mediante la seguente formulazione matriciale
P = Xβ +ε
(14)
ove P, β e ε sono rispettivamente il vettore dei Prezzi, dei Parametri da stimare e degli Errori
••
•
pn
∈M(nx1)
X=
∙ ∙
x11
x12
•••
x1j
x21
x22
•••
x2j
••
•
••
•
••
••
•
xn1
xn2
•••
xnJ
β=
β2
••
•
βJ
∙ ∙
ε1
ε=
ε2
••
•
εn
∈M(nx1)
(15)
∙
•
∙
(16)
∈M(nxJ)
Sostituendo i valori raccolti sul campione estimativo (Tabella 1) nel vettore dei Prezzi e nella matrice delle Caratteristiche si ottiene
Riprendendo il modello del Prezzo di Compravendita nella versione descritta dalla formula (11) ed
introducendo l’ipotesi di linearità nei parametri delle caratteristiche si ottiene la seguente versione
∀ i ∈ {1, 2, …, n}
p2
β1
mentre X è la matrice delle caratteristiche
Ipotesi di linearità del modello
Pi = xi1β1 + xi2 β2 + …+ xiJ βJ + εi
∙ ∙
∈M(Jx1)
p1
P=
∙
79800
65100
••
•
76800
∙
∈M(52x1)
X=
∙
1
45
•••
0
1
45
•••
0
••
•
••
•
••
•
••
•
1
55
•••
1
∙
∈M(52x9)
La prima colonna della matrice X contiene un vettore di valori unitari, ovvero di 1, questo per fare sì
che si stimi la cosiddetta intercetta (si rammenti come in una retta l’intercetta è l’intersezione della
retta con l’asse delle ordinate). La seconda colonna è relativa ai valori della Superficie per i singoli elementi del campione. L’ultima colonna della matrice è ottenuta trasformando la caratteristica
Conservazione secondo la codifica precedentemente introdotta. Ritornando alla formula matriciale
(14) il problema consiste nello stimare il vettore dei Parametri β. Tale vettore può essere stimato per
mezzo di numerosi metodi statistici. Tuttavia il più semplice e noto è quello denominato dei minimi
quadrati. In tale metodo, infatti, la stima dei Parametri si ottiene cercando di minimizzare il quadrato
degli errori, ovvero cercando di minimizzare la quantità ε′ε.
Minimi Quadrati
Descrivere il metodo dei minimi quadrati per la stima dei Parametri del modello (14) non è l’obiettivo
di queste righe. Si rimanda al testo di Hastie et. al. (2001) o ad altri testi di statistica per una comprensione di come si deriva la seguente formula
β=(X'X) -1X'p
(17)
La formula (17) consente di ottenere la stima del vettore dei parametri ricorrendo esclusivamente
ai dati estimativi in possesso, ossia alla matrice delle Caratteristiche e al vettore dei Prezzi. Si vuole
62
Interpretazione matematico-statistica dei metodi di stima diretti
Gabriele Brondino
far notare che β è una stima del vettore dei Parametri β e che pertanto si genera un errore di stima
che viene esplicitamente gestito attraverso lo strumento degli intervalli di fiducia (di cui si dirà in
seguito). Sostituendo nella formula (17) i valori raccolti sul campione estimativo si ottiene il vettore
contenente la stima dei parametri incogniti del modello (13)
β=
∙ ∙
−863649.3
1071.8
−6775.1
6403.4
−3078.4
−642.6
6906.0
459.1
18008.0
63
stime ottenute per i parametri delle caratteristiche Arie e Cantina risultino non ragionevoli.
Questo potrebbe far pensare che la Regressione sia un metodo non adatto per analizzare i dati di
un campione estimativo. Nella realtà, invece, la formula (17) ottenuta mediante i minimi quadrati è
soltanto il primo passo di un cammino lungo e spesso complesso.
Pur ribadendo che non è nell’intenzione di questo scritto approfondire il tema della Regressione, nel
seguito si presenteranno i risultati ottenuti eseguendo un’analisi metodica sui dati della Tabella 1.
Selezione del Modello
∈M(9x1)
Il vettore delle stime dei Parametri ottenuto contiene nove valori numerici a cui è necessario assegnare un significato estimativo. Tralasciando il primo termine (l’intercetta) che ha prevalentemente
un significato matematico, concentriamoci subito sul secondo valore 1071.8, esso fa riferimento alla
caratteristica Superficie e rappresenta l’incremento del Valore di Mercato di un Bene per ogni m2 in
più. Non si tratta del Prezzo Unitario, quest’ultimo infatti si ottiene dividendo il Prezzo per la Superficie. Il significato del parametro relativo alla Superficie è differente. Matematicamente rappresenta
una derivata prima, mentre dal punto di vista estimativo è la differenza di valore tra due beni del tutto
identici tranne per il fatto che uno dei due ha un m2 di Superficie in più.
Continuando nell’analisi dei valori contenuti nel vettore delle stime dei parametri si incontra -6775.1.
Questo risultato ha un significato matematico ma non può certamente averne uno estimativo. Esso,
infatti, rappresenta l’incremento del Valore di Mercato di un Bene per ogni Aria in più. Come dire che
se vi sono due appartamenti, uno con un solo affaccio e l’altro con due, allora il secondo tende a
valere di meno perché ha due arie! E’ chiaramente un controsenso. Ma non c’è da stupirsi troppo di
questa apparente contraddizione. Il motivo sarà meglio chiarito nella sezione successiva, quando si
sottolineerà come l’applicazione pratica della regressione richiede una grande esperienza e l’adozione di metodi denominati di selezione del modello.
Continuando a scorrere i valori contenuti nel vettore delle stime si scopre che un balcone in più fa sì
che il Valore di Mercato abbia un incremento di 6403.4 €, mentre la presenza della cantina provoca
addirittura un decremento del Valore di 3078.4 € (anche in questo caso si tratta ovviamente di un
risultato privo di significato estimativo). Interessante notare come dai numeri ottenuti emerga che
gli appartamenti ai piani superiori tendano ad avere un Valore di Mercato inferiore, essendo la stima
del parametro negativa: -642.6 €. Tuttavia questo risultato, apparentemente contro il buon senso,
può avere un suo fondamento nel fatto che in alcuni casi i fabbricati in cui si trovano le unità del
campione sono privi di ascensore. La presenza dell’ascensore risulta contribuire all’incremento del
Valore (+6906.0 €), ma forse sarebbe stato più opportuno studiare l’effetto congiunto (interazione)
delle caratteristiche Piano e Ascensore.
Verso il fondo del vettore delle stime si trova il valore 459.1, che fa riferimento alla caratteristica
Anno di Costruzione. Così se vi sono due unità, la prima costruita nel 1940 e la seconda nel 1950,
la differenza di Valore di Mercato tra le due dovuta all’anno di costruzione è pari a 459.1(19501940)=4591.0 €. Infine l’ultimo elemento del vettore delle stime indica che la differenza di Valore tra
un’unità ristrutturata e una non ristrutturata risulta pari a 18008.0 €.
Nonostante la soluzione matematica (17) del problema (14) sia (quasi) sempre ottenibile, può capitare che il risultato non abbia una valenza estimativa. Nel caso in esame si è già evidenziato come le
Finora si è supposto che tutte le caratteristiche raccolte sul campione estimativo siano legate al
Valore di Mercato. Questo è ragionevole almeno quanto supporre che esistano altre caratteristiche
influenti nella determinazione del Valore di Mercato. Tuttavia occorre ricordarsi che i dati raccolti
sono un campione e non l’intera popolazione delle transazioni. Ne consegue una limitata capacità
esplicativa, ovvero una difficoltà nell’individuare correttamente tutte le caratteristiche significativamente influenti e nel valutare correttamente il livello delle singole influenze. In altre parole a causa della limitata numerosità degli elementi del campione estimativo e della variabilità presente nei
Prezzi, la Regressione consente di individuare e valutare l’influenza soltanto di un sottoinsieme delle
caratteristiche che davvero influiscono nella formazione del Valore di Mercato.
Nella letteratura statistica esistono diversi metodi per svolgere la cosiddetta selezione del modello.
Tra i più utilizzati vi è la cosiddetta stepwise regression. Questa procedura richiede di costruire un
modello iniziale contenente le caratteristiche che si ipotizza influenzino il Valore di Mercato e di cui
si dispone dei dati. Nei passi successivi la procedura provvede ad eliminare via via le caratteristiche che, dall’analisi dei dati, non risultano statisticamente significative nella formazione del Valore
di Mercato. Al termine della procedura si ottiene un modello finale costituito da un sottoinsieme di
caratteristiche e dalle conseguenti stime dei parametri. Nel caso studio in esame la procedura è
stata applicata partendo da un modello iniziale costituito dalle otto caratteristiche di Tabella 1 più
l’interazione tra le caratteristiche Piano e Ascensore. Il modello risultato “vincente” dalla procedura
di selezione è contenuto in Tabella 2.
Tabella 2 Modello vincente della stepwise regression applicata sul campione estimativo
Caratteristica
Stima
Errore standard
Statistica t
Pr(>|t|)
(Intercetta)
-829802.12
223256.58
-3.717
0.000556 ***
Superficie
1135.86
254.53
4.463
5.37e-05 ***
Piano
-1289.04
1031.02
-1.250
0.217671
70.34
6085.52
0.012
0.990829
18022.50
3792.45
4.752
2.09e-05 ***
Anno
438.22
116.79
3.752
0.000500 ***
Piano : Ascensore
2637.16
1738.06
1.517
0.136186
Ascensore
Conservazione
Per leggere rapidamente i risultati contenuti nella Tabella 2 occorre scorrere subito l’ultima colonna,
quella denominata Pr(>|t|).
Tale colonna contiene i cosiddetti p-value, ovvero quei numeri che indicano la presenza di una significatività statistica quando assumono valori inferiori a 0.05.
Nel caso in esame sono quattro le righe in cui i p-value assumono valori inferiori a 0.05, per identificarle rapidamente è sufficiente cercare il simbolo ***. Così si scopre che l’intercetta, la Superficie,
l’Anno di Costruzione e lo stato di Conservazione sono le caratteristiche che risultano statisticamente significative nella formazione del Valore di Mercato.
Quest’affermazione va compresa correttamente. Non intende dire che soltanto queste caratteristi-
62
Interpretazione matematico-statistica dei metodi di stima diretti
Gabriele Brondino
far notare che β è una stima del vettore dei Parametri β e che pertanto si genera un errore di stima
che viene esplicitamente gestito attraverso lo strumento degli intervalli di fiducia (di cui si dirà in
seguito). Sostituendo nella formula (17) i valori raccolti sul campione estimativo si ottiene il vettore
contenente la stima dei parametri incogniti del modello (13)
β=
∙ ∙
−863649.3
1071.8
−6775.1
6403.4
−3078.4
−642.6
6906.0
459.1
18008.0
63
stime ottenute per i parametri delle caratteristiche Arie e Cantina risultino non ragionevoli.
Questo potrebbe far pensare che la Regressione sia un metodo non adatto per analizzare i dati di
un campione estimativo. Nella realtà, invece, la formula (17) ottenuta mediante i minimi quadrati è
soltanto il primo passo di un cammino lungo e spesso complesso.
Pur ribadendo che non è nell’intenzione di questo scritto approfondire il tema della Regressione, nel
seguito si presenteranno i risultati ottenuti eseguendo un’analisi metodica sui dati della Tabella 1.
Selezione del Modello
∈M(9x1)
Il vettore delle stime dei Parametri ottenuto contiene nove valori numerici a cui è necessario assegnare un significato estimativo. Tralasciando il primo termine (l’intercetta) che ha prevalentemente
un significato matematico, concentriamoci subito sul secondo valore 1071.8, esso fa riferimento alla
caratteristica Superficie e rappresenta l’incremento del Valore di Mercato di un Bene per ogni m2 in
più. Non si tratta del Prezzo Unitario, quest’ultimo infatti si ottiene dividendo il Prezzo per la Superficie. Il significato del parametro relativo alla Superficie è differente. Matematicamente rappresenta
una derivata prima, mentre dal punto di vista estimativo è la differenza di valore tra due beni del tutto
identici tranne per il fatto che uno dei due ha un m2 di Superficie in più.
Continuando nell’analisi dei valori contenuti nel vettore delle stime dei parametri si incontra -6775.1.
Questo risultato ha un significato matematico ma non può certamente averne uno estimativo. Esso,
infatti, rappresenta l’incremento del Valore di Mercato di un Bene per ogni Aria in più. Come dire che
se vi sono due appartamenti, uno con un solo affaccio e l’altro con due, allora il secondo tende a
valere di meno perché ha due arie! E’ chiaramente un controsenso. Ma non c’è da stupirsi troppo di
questa apparente contraddizione. Il motivo sarà meglio chiarito nella sezione successiva, quando si
sottolineerà come l’applicazione pratica della regressione richiede una grande esperienza e l’adozione di metodi denominati di selezione del modello.
Continuando a scorrere i valori contenuti nel vettore delle stime si scopre che un balcone in più fa sì
che il Valore di Mercato abbia un incremento di 6403.4 €, mentre la presenza della cantina provoca
addirittura un decremento del Valore di 3078.4 € (anche in questo caso si tratta ovviamente di un
risultato privo di significato estimativo). Interessante notare come dai numeri ottenuti emerga che
gli appartamenti ai piani superiori tendano ad avere un Valore di Mercato inferiore, essendo la stima
del parametro negativa: -642.6 €. Tuttavia questo risultato, apparentemente contro il buon senso,
può avere un suo fondamento nel fatto che in alcuni casi i fabbricati in cui si trovano le unità del
campione sono privi di ascensore. La presenza dell’ascensore risulta contribuire all’incremento del
Valore (+6906.0 €), ma forse sarebbe stato più opportuno studiare l’effetto congiunto (interazione)
delle caratteristiche Piano e Ascensore.
Verso il fondo del vettore delle stime si trova il valore 459.1, che fa riferimento alla caratteristica
Anno di Costruzione. Così se vi sono due unità, la prima costruita nel 1940 e la seconda nel 1950,
la differenza di Valore di Mercato tra le due dovuta all’anno di costruzione è pari a 459.1(19501940)=4591.0 €. Infine l’ultimo elemento del vettore delle stime indica che la differenza di Valore tra
un’unità ristrutturata e una non ristrutturata risulta pari a 18008.0 €.
Nonostante la soluzione matematica (17) del problema (14) sia (quasi) sempre ottenibile, può capitare che il risultato non abbia una valenza estimativa. Nel caso in esame si è già evidenziato come le
Finora si è supposto che tutte le caratteristiche raccolte sul campione estimativo siano legate al
Valore di Mercato. Questo è ragionevole almeno quanto supporre che esistano altre caratteristiche
influenti nella determinazione del Valore di Mercato. Tuttavia occorre ricordarsi che i dati raccolti
sono un campione e non l’intera popolazione delle transazioni. Ne consegue una limitata capacità
esplicativa, ovvero una difficoltà nell’individuare correttamente tutte le caratteristiche significativamente influenti e nel valutare correttamente il livello delle singole influenze. In altre parole a causa della limitata numerosità degli elementi del campione estimativo e della variabilità presente nei
Prezzi, la Regressione consente di individuare e valutare l’influenza soltanto di un sottoinsieme delle
caratteristiche che davvero influiscono nella formazione del Valore di Mercato.
Nella letteratura statistica esistono diversi metodi per svolgere la cosiddetta selezione del modello.
Tra i più utilizzati vi è la cosiddetta stepwise regression. Questa procedura richiede di costruire un
modello iniziale contenente le caratteristiche che si ipotizza influenzino il Valore di Mercato e di cui
si dispone dei dati. Nei passi successivi la procedura provvede ad eliminare via via le caratteristiche che, dall’analisi dei dati, non risultano statisticamente significative nella formazione del Valore
di Mercato. Al termine della procedura si ottiene un modello finale costituito da un sottoinsieme di
caratteristiche e dalle conseguenti stime dei parametri. Nel caso studio in esame la procedura è
stata applicata partendo da un modello iniziale costituito dalle otto caratteristiche di Tabella 1 più
l’interazione tra le caratteristiche Piano e Ascensore. Il modello risultato “vincente” dalla procedura
di selezione è contenuto in Tabella 2.
Tabella 2 Modello vincente della stepwise regression applicata sul campione estimativo
Caratteristica
Stima
Errore standard
Statistica t
Pr(>|t|)
(Intercetta)
-829802.12
223256.58
-3.717
0.000556 ***
Superficie
1135.86
254.53
4.463
5.37e-05 ***
Piano
-1289.04
1031.02
-1.250
0.217671
70.34
6085.52
0.012
0.990829
18022.50
3792.45
4.752
2.09e-05 ***
Anno
438.22
116.79
3.752
0.000500 ***
Piano : Ascensore
2637.16
1738.06
1.517
0.136186
Ascensore
Conservazione
Per leggere rapidamente i risultati contenuti nella Tabella 2 occorre scorrere subito l’ultima colonna,
quella denominata Pr(>|t|).
Tale colonna contiene i cosiddetti p-value, ovvero quei numeri che indicano la presenza di una significatività statistica quando assumono valori inferiori a 0.05.
Nel caso in esame sono quattro le righe in cui i p-value assumono valori inferiori a 0.05, per identificarle rapidamente è sufficiente cercare il simbolo ***. Così si scopre che l’intercetta, la Superficie,
l’Anno di Costruzione e lo stato di Conservazione sono le caratteristiche che risultano statisticamente significative nella formazione del Valore di Mercato.
Quest’affermazione va compresa correttamente. Non intende dire che soltanto queste caratteristi-
Interpretazione matematico-statistica dei metodi di stima diretti
Gabriele Brondino
65
che influenzano la formazione del Valore di Mercato. Essa indica piuttosto che dall’analisi dei dati
mediante la Regressione emerge che queste caratteristiche influiscono sul Valore con un elevato
livello di fiducia. Ovviamente esiste la possibilità che le altre caratteristiche considerate nel modello
iniziale possano influire sul Valore di Mercato. Dai dati tuttavia non vi sono indizi sufficienti perché tali
caratteristiche (esempio Arie, Cantina, Balconi, ...) siano considerate influenti.
Dopo aver individuato le caratteristiche che statisticamente influiscono sulla formazione del Valore
di Mercato si tratta di valutarne la loro influenza. Dall’osservazione dei valori ottenuti nella Tabella 2
si ha che l’incremento di Valore dovuto ad un m2 in più è pari a 1135.86 €.
Allo stesso modo due unità del tutto simili tranne per il fatto che la prima è Non Ristrutturata e l’altra
Ristrutturata o Nuova hanno una differenza stimata di valore pari a 18022.50 €. Il cosiddetto prezzo
marginale della caratteristica Anno di Costruzione è pari a 438.22 € per anno. Per le caratteristiche
non influenti (Piano, Ascensore e la loro interazione) i valori di stima ottenuti non sono significativi e
quindi non vanno presi in considerazione.
Prima di proseguire nell’analisi di Regressione occorre sottolineare che le stime dei parametri di
Tabella 2 sono state ottenute dall’analisi di un campione. Questo significa che le stime sono affette
da una componente di incertezza dovuta alla procedura di campionamento. In termini concreti, se si
fosse estratto un campione differente non si sarebbero ottenute esattamente le medesime stime. Si
sarebbero ricavati valori vicini a quelli riportati in Tabella 2 ma non esattamente uguali.
Per gestire questa componente di incertezza dovuta alla procedura di campionamento, ed in alcun
modo eliminabile, occorre costruire gli intervalli di fiducia sulle stime dei parametri.
La stima del parametro relativo alla Superficie è di 1135.86 €/m2.
Un'indicazione dell’incertezza di stima è fornita dal valore della colonna Standard Error: 254.53 €/m2.
Attraverso questi due valori è possibile costruire un intervallo di fiducia (al 95% di fiducia) sottraendo
e sommando il doppio dello Standard Error alla stima: 1135.86±2·254.53 = (626.80; 1644.92).
Questa formula, seppur non esatta (lo Standard Error andrebbe moltiplicato per un coefficiente dipendente dalla distribuzione statistica t di Student), consente di poter affermare che: con un livello di fiducia del 95% il valore vero del parametro relativo alla Superficie è compreso tra un minimo di 627 € e
un massimo di 1645 € circa. Dal punto di vista pratico si tratta di un intervallo molto ampio ma che può
essere ridotto solo aumentando la numerosità del campione. In ogni caso l’indicazione di un intervallo
di fiducia in luogo di un valore puntuale unico consente di visualizzare con immediatezza l’incertezza
insita nella stima dovuta alla variabilità dei prezzi e al tipo di campionamento.
Le stime puntuali (ed intervallari) dei parametri delle caratteristiche significative del modello vincente possono essere molto utili anche nell’applicazione del Sales Comparison Approach.
cosiddetto coefficiente di determinazione multipla, noto come R2.
Tale coefficiente può assumere valori nell’intervallo [0,1] e rappresenta la proporzione di variabilità
spiegata dal modello (14) rispetto alla variabilità naturale presente nell’andamento dei prezzi P. Tanto
più il valore di R2 si avvicina a 1, tanto più il modello spiega una grande proporzione della variabilità
presente nei prezzi. Nel caso studio in esame il valore del coefficiente di determinazione lineare è
pari a 0.755, un valore tendente verso l’unità ma non troppo. Si può pensare di verificare la validità
delle ipotesi sui residui attraverso questo valore numerico? La risposta è senza alcun dubbio no!
Tuttavia non è raro incontrare testi in ambito estimativo che riducono l’analisi della bontà del modello esclusivamente all’osservazione del valore di R2. Di fronte a questa tendenza occorre ribadire che
gli strumenti per la verifica delle ipotesi sugli errori sono principalmente di carattere grafico. E che il
valore di R2 consente esclusivamente di valutare il grado di variabilità spiegata dal modello.
I grafici per lo studio della validità delle ipotesi del modello sono molteplici e non sempre di facile
lettura. Eppure costituiscono l’insostituibile strumento per poter ritenere valida un’analisi di Regressione. I residui ottenuti per i dati del caso studio in esame sono rappresentanti in Illustrazione 1.
Verifica del Modello
L’andamento dei residui rispetto ai valori previsti mediante le stime dei parametri (grafico a sinistra
di Illustrazione 1) si caratterizza per una distribuzione casuale dei dati (ovvero senza un presenza di
periodicità), per avere un andamento medio (linea rossa) prossimo a zero e per avere una variabilità
dei dati costante rispetto ai valori previsti. Queste considerazioni permettono di poter affermare che
non vi sono ragioni per poter rifiutare le ipotesi che gli errori siano indipendenti, con valore atteso
nullo e varianza costante. Il grafico di probabilità normale (a destra di Illustrazione 1) consiste nella
rappresentazione della distribuzione cumulata dei residui (cerchi) e della distribuzione teorica cumulata di una variabile casuale gaussiana (segmento di retta). L’ipotesi di normalità degli errori (alla
base della costruzione degli intervalli di fiducia) non si può rifiutare qualora i cerchi si sovrappongano al segmento di retta. Osservando l’andamento ottenuto per il caso studio si può con una certa
ragionevolezza accettare anche l’ipotesi di normalità.
Dalle considerazioni svolte emerge che il modello risultato vincente dalla procedura di selezione
soddisfa le ipotesi sugli errori. Trattasi pertanto di un modello statisticamente corretto. E’ anche un
modello utile? A questa risposta si può rispondere osservando come l’indice R2 assuma un valore
certamente elevato (0.755) ma non troppo. Infatti circa il 25% (1-0.755) della variabilità dei prezzi
rimane non spiegata dal modello. Tale percentuale è dovuta a tutte le cause e semplificazioni elencate nelle pagine precedenti. In termini estimativi il modello ottenuto può ritenersi utile per avere una
La procedura di stima basata sul metodo dei minimi quadrati e la costruzione degli intervalli di
fiducia si fondano su ipotesi riguardanti il vettore degli errori ε. Tali procedure richiedono infatti
che le componenti del vettore siano indipendenti, abbiano valore atteso nullo, varianza costante
e distribuite normalmente. Se queste ipotesi non fossero soddisfatte allora tutti i risultati ottenuti
sarebbero discutibili. Ma come fare a verificare la ragionevolezza di tali ipotesi se non si possono
osservare direttamente gli errori?
Il vettore ε, infatti, è inconoscibile! Infatti se si osserva la formula (14) si nota come per poter determinare ε si dovrebbe conoscere il valore di β. Nella realtà, però, si può ottenere soltanto la stima del
vettore dei parametri, ovvero β. Ne consegue che per verificare la validità delle ipotesi sul vettore
casuale ε occorre analizzare il comportamento della sua realizzazione denominata vettore dei residui
ε= P-X β
(18)
Ricavato il vettore dei residui occorre chiedersi quale strumento sia il più adatto a verificare le
ipotesi sugli errori. A questa domanda la risposta più frequente in ambito estimativo è costituita dal
R Residuals
e s i d u a l s vsv sFitted
F itte d
2
1
0
-1
-3
1 0 5
60000
80000
100000
Fitted
F i t t e d values
v a lu e s
8
1 0 6
-2
10000
0
-1 0 0 0 0
1 0 6
-3 0 0 0 0
N Normal
o r m a l QQ -- QQ
SStandardized
t a n d a r d i z e d rresiduals
e s id u a ls
8
RResiduals
e s id u a ls
64
1 0 5
-2
-1
0
1
2
Theoretical
T h e o r e t i c a l Quantiles
Q u a n t ile s
Illustrazione
: Grafici
dei residui. A sinistra: andamento dei residui rispetto ai valori
Illustrazione 1 1Grafici
dei residui
previsti
modello.
destra:
il grafico
diprevisti
probabilità
normale.
A
sinistradal
andamento
deiAresidui
rispetto
ai valori
dal modello.
A destra il grafico di probabilità normale
Interpretazione matematico-statistica dei metodi di stima diretti
Gabriele Brondino
65
che influenzano la formazione del Valore di Mercato. Essa indica piuttosto che dall’analisi dei dati
mediante la Regressione emerge che queste caratteristiche influiscono sul Valore con un elevato
livello di fiducia. Ovviamente esiste la possibilità che le altre caratteristiche considerate nel modello
iniziale possano influire sul Valore di Mercato. Dai dati tuttavia non vi sono indizi sufficienti perché tali
caratteristiche (esempio Arie, Cantina, Balconi, ...) siano considerate influenti.
Dopo aver individuato le caratteristiche che statisticamente influiscono sulla formazione del Valore
di Mercato si tratta di valutarne la loro influenza. Dall’osservazione dei valori ottenuti nella Tabella 2
si ha che l’incremento di Valore dovuto ad un m2 in più è pari a 1135.86 €.
Allo stesso modo due unità del tutto simili tranne per il fatto che la prima è Non Ristrutturata e l’altra
Ristrutturata o Nuova hanno una differenza stimata di valore pari a 18022.50 €. Il cosiddetto prezzo
marginale della caratteristica Anno di Costruzione è pari a 438.22 € per anno. Per le caratteristiche
non influenti (Piano, Ascensore e la loro interazione) i valori di stima ottenuti non sono significativi e
quindi non vanno presi in considerazione.
Prima di proseguire nell’analisi di Regressione occorre sottolineare che le stime dei parametri di
Tabella 2 sono state ottenute dall’analisi di un campione. Questo significa che le stime sono affette
da una componente di incertezza dovuta alla procedura di campionamento. In termini concreti, se si
fosse estratto un campione differente non si sarebbero ottenute esattamente le medesime stime. Si
sarebbero ricavati valori vicini a quelli riportati in Tabella 2 ma non esattamente uguali.
Per gestire questa componente di incertezza dovuta alla procedura di campionamento, ed in alcun
modo eliminabile, occorre costruire gli intervalli di fiducia sulle stime dei parametri.
La stima del parametro relativo alla Superficie è di 1135.86 €/m2.
Un'indicazione dell’incertezza di stima è fornita dal valore della colonna Standard Error: 254.53 €/m2.
Attraverso questi due valori è possibile costruire un intervallo di fiducia (al 95% di fiducia) sottraendo
e sommando il doppio dello Standard Error alla stima: 1135.86±2·254.53 = (626.80; 1644.92).
Questa formula, seppur non esatta (lo Standard Error andrebbe moltiplicato per un coefficiente dipendente dalla distribuzione statistica t di Student), consente di poter affermare che: con un livello di fiducia del 95% il valore vero del parametro relativo alla Superficie è compreso tra un minimo di 627 € e
un massimo di 1645 € circa. Dal punto di vista pratico si tratta di un intervallo molto ampio ma che può
essere ridotto solo aumentando la numerosità del campione. In ogni caso l’indicazione di un intervallo
di fiducia in luogo di un valore puntuale unico consente di visualizzare con immediatezza l’incertezza
insita nella stima dovuta alla variabilità dei prezzi e al tipo di campionamento.
Le stime puntuali (ed intervallari) dei parametri delle caratteristiche significative del modello vincente possono essere molto utili anche nell’applicazione del Sales Comparison Approach.
cosiddetto coefficiente di determinazione multipla, noto come R2.
Tale coefficiente può assumere valori nell’intervallo [0,1] e rappresenta la proporzione di variabilità
spiegata dal modello (14) rispetto alla variabilità naturale presente nell’andamento dei prezzi P. Tanto
più il valore di R2 si avvicina a 1, tanto più il modello spiega una grande proporzione della variabilità
presente nei prezzi. Nel caso studio in esame il valore del coefficiente di determinazione lineare è
pari a 0.755, un valore tendente verso l’unità ma non troppo. Si può pensare di verificare la validità
delle ipotesi sui residui attraverso questo valore numerico? La risposta è senza alcun dubbio no!
Tuttavia non è raro incontrare testi in ambito estimativo che riducono l’analisi della bontà del modello esclusivamente all’osservazione del valore di R2. Di fronte a questa tendenza occorre ribadire che
gli strumenti per la verifica delle ipotesi sugli errori sono principalmente di carattere grafico. E che il
valore di R2 consente esclusivamente di valutare il grado di variabilità spiegata dal modello.
I grafici per lo studio della validità delle ipotesi del modello sono molteplici e non sempre di facile
lettura. Eppure costituiscono l’insostituibile strumento per poter ritenere valida un’analisi di Regressione. I residui ottenuti per i dati del caso studio in esame sono rappresentanti in Illustrazione 1.
Verifica del Modello
L’andamento dei residui rispetto ai valori previsti mediante le stime dei parametri (grafico a sinistra
di Illustrazione 1) si caratterizza per una distribuzione casuale dei dati (ovvero senza un presenza di
periodicità), per avere un andamento medio (linea rossa) prossimo a zero e per avere una variabilità
dei dati costante rispetto ai valori previsti. Queste considerazioni permettono di poter affermare che
non vi sono ragioni per poter rifiutare le ipotesi che gli errori siano indipendenti, con valore atteso
nullo e varianza costante. Il grafico di probabilità normale (a destra di Illustrazione 1) consiste nella
rappresentazione della distribuzione cumulata dei residui (cerchi) e della distribuzione teorica cumulata di una variabile casuale gaussiana (segmento di retta). L’ipotesi di normalità degli errori (alla
base della costruzione degli intervalli di fiducia) non si può rifiutare qualora i cerchi si sovrappongano al segmento di retta. Osservando l’andamento ottenuto per il caso studio si può con una certa
ragionevolezza accettare anche l’ipotesi di normalità.
Dalle considerazioni svolte emerge che il modello risultato vincente dalla procedura di selezione
soddisfa le ipotesi sugli errori. Trattasi pertanto di un modello statisticamente corretto. E’ anche un
modello utile? A questa risposta si può rispondere osservando come l’indice R2 assuma un valore
certamente elevato (0.755) ma non troppo. Infatti circa il 25% (1-0.755) della variabilità dei prezzi
rimane non spiegata dal modello. Tale percentuale è dovuta a tutte le cause e semplificazioni elencate nelle pagine precedenti. In termini estimativi il modello ottenuto può ritenersi utile per avere una
La procedura di stima basata sul metodo dei minimi quadrati e la costruzione degli intervalli di
fiducia si fondano su ipotesi riguardanti il vettore degli errori ε. Tali procedure richiedono infatti
che le componenti del vettore siano indipendenti, abbiano valore atteso nullo, varianza costante
e distribuite normalmente. Se queste ipotesi non fossero soddisfatte allora tutti i risultati ottenuti
sarebbero discutibili. Ma come fare a verificare la ragionevolezza di tali ipotesi se non si possono
osservare direttamente gli errori?
Il vettore ε, infatti, è inconoscibile! Infatti se si osserva la formula (14) si nota come per poter determinare ε si dovrebbe conoscere il valore di β. Nella realtà, però, si può ottenere soltanto la stima del
vettore dei parametri, ovvero β. Ne consegue che per verificare la validità delle ipotesi sul vettore
casuale ε occorre analizzare il comportamento della sua realizzazione denominata vettore dei residui
ε= P-X β
(18)
Ricavato il vettore dei residui occorre chiedersi quale strumento sia il più adatto a verificare le
ipotesi sugli errori. A questa domanda la risposta più frequente in ambito estimativo è costituita dal
R Residuals
e s i d u a l s vsv sFitted
F itte d
2
1
0
-1
-3
1 0 5
60000
80000
100000
Fitted
F i t t e d values
v a lu e s
8
1 0 6
-2
10000
0
-1 0 0 0 0
1 0 6
-3 0 0 0 0
N Normal
o r m a l QQ -- QQ
SStandardized
t a n d a r d i z e d rresiduals
e s id u a ls
8
RResiduals
e s id u a ls
64
1 0 5
-2
-1
0
1
2
Theoretical
T h e o r e t i c a l Quantiles
Q u a n t ile s
Illustrazione
: Grafici
dei residui. A sinistra: andamento dei residui rispetto ai valori
Illustrazione 1 1Grafici
dei residui
previsti
modello.
destra:
il grafico
diprevisti
probabilità
normale.
A
sinistradal
andamento
deiAresidui
rispetto
ai valori
dal modello.
A destra il grafico di probabilità normale
66
Interpretazione matematico-statistica dei metodi di stima diretti
Gabriele Brondino
stima dei cosiddetti prezzi marginali (gli elementi del vettore delle stime).
Esso può considerarsi parzialmente utile per effettuare stime di massa, anche se va detto che il modello potrebbe essere largamente migliorabile aumentando la numerosità campionaria e la quantità
di caratteristiche rilevate (in particolare quelle relative alla componente spaziale).
Certamente il modello stimato non risulta uno strumento adatto per eseguire la stima di un singolo
bene, per questo obiettivo occorre ricorrere al SCA.
Stima del Valore di Mercato
La Regressione Lineare Multipla viene considerata in ambito estimativo un metodo da utilizzarsi per
le cosiddette stime di massa. Ovvero per quelle valutazioni che richiedono la formulazione di un
giudizio di valore su di un gran numero di beni contemporaneamente. L’operazione matematica da
compiersi, dopo aver ottenuto il vettore delle stime dei parametri, è infatti molto semplice
VM0= f (x01,x02, •••, x0J ) =X0β
Nelle righe seguenti ci si soffermerà sulla giustificazione matematica del metodo. Sui collegamenti
che esistono tra SCA e la Regressione Lineare Multipla. Il tutto a partire da un caso studio.
Il Campione Estimativo
Un quesito di stima richiede di fornire un giudizio sul Valore di Mercato di un bene di 45 m2, avente
due arie, un balcone, con cantina, al piano terreno, non ristrutturato, sito in un fabbricato degli anni
50 privo di ascensore (Tabella 3).
Tabella 3 Caratteristiche rilevate sul bene oggetto di stima e sul campione estimativo
(19)
ove
X0=[x01 x02 ••• x0J ]∈M(1×J)
(20)
In termini pratici la stima del Valore di Mercato di un bene si ottiene dalla moltiplicazione del vettore
X0 e del vettore delle stime dei parametri. Il vettore X0 è costituito dai valori delle caratteristiche
osservati per il bene oggetto di stima. Nel caso di stime di massa il vettore X0 diventa una matrice
con un numero di righe pari al numero di beni da stimare, cosicché si ottiene non una singola stima
del Valore di Mercato ma un vettore. Richiamando il caso studio, se si volesse valutare un bene immobile non ristrutturato con una Superficie di 50 m2 inserito in un fabbricato costruito nel 1950 si
otterrebbe
VM0= X0β = [1 50 0 1950]
∙
−829802.12
1135.86
18922.50
438.22
∙
Come già in precedenza ricordato la descrizione del metodo di Regressione Lineare Multipla qui riportata non ha l’ambizione di essere esaustiva. Trattasi di una presentazione svolta con due obiettivi
di fondo. Far emergere la stretta similitudine matematica esistente tra la Regressione Lineare Multipla e il SCA. Ed evidenziare come i risultati ottenuti dalla procedura di Regressione possono essere
una base di partenza per l’applicazione pratica del SCA.
SALES COMPARISON APPROACH
Prezzo
Sup.
Arie
Balconi
Cantina
Piano
Ascensore
Anno
Conservazione
?????
45
2
1
Presente
0
Assente
1950
Non Ristrutt.
68300
38
2
2
Presente
1
Assente
1940
Non Ristrutt.
91300
60
2
1
Presente
5
Presente
1950
Non Ristrutt.
78400
40
2
1
Assente
1
Presente
1950
Non Ristrutt.
53900
45
2
1
Presente
2
Assente
1950
Non Ristrutt.
Per provvedere ad una stima per via diretta tramite SCA si seleziona un campione estimativo formato da quattro unità simili al bene oggetto di stima (Tabella 3) ed ubicate nel medesimo contesto
geografico.
Il bene e gli elementi del campione si trovano nella stessa zona delle unità considerate in Tabella 1,
cosicché da poter giustificare l’utilizzo dei risultati ottenuti dalla regressione.
Come si evince facilmente dall’osservazione della Tabella 3, il bene oggetto di stima e gli elementi
del campione estimativo hanno in comune il numero di arie e lo stato di conservazione. Pertanto
queste due caratteristiche possono essere eliminate in quanto non capaci di spiegare la variazione
di valore. Allora procedendo alla codifica delle variabili qualitative e richiamando le definizioni matematiche sinora introdotte si ha che
∙ ∙
68300
= 81512.3
I quesiti che richiedono la formulazione di un giudizio di stima sul Valore di Mercato di un bene
singolo sono la norma nella pratica estimativa. Tali stime sono utilizzate in contesti differenti e
spesso servono per redimere controversie giuridiche. Tra i molti metodi di stima, diretti e indiretti,
un ruolo centrale è ricoperto dal Sales Comparison Approach.
67
P=
91300
78400
53900
∈M(4×1)
X=
∙
38 2 1 1 0 1940
60 1 1 5 5 1950
40 1 0 1 1 1950
45 1 1 2 0 1950
∙
∈M(4×6)
X0= [45 1 1 0 0 1950] ∈ M(1x6)
Si noti che la penultima colonna di X è stata ottenuta moltiplicando il numero di Piani con la colonna codificata della variabile Ascensore, questo per sottolineare il fatto che la presenza dell’ascensore influisce sul valore soprattutto in funzione del piano in cui si trova l’unità (ovvero l’interazione
tra le due caratteristiche).
66
Interpretazione matematico-statistica dei metodi di stima diretti
Gabriele Brondino
stima dei cosiddetti prezzi marginali (gli elementi del vettore delle stime).
Esso può considerarsi parzialmente utile per effettuare stime di massa, anche se va detto che il modello potrebbe essere largamente migliorabile aumentando la numerosità campionaria e la quantità
di caratteristiche rilevate (in particolare quelle relative alla componente spaziale).
Certamente il modello stimato non risulta uno strumento adatto per eseguire la stima di un singolo
bene, per questo obiettivo occorre ricorrere al SCA.
Stima del Valore di Mercato
La Regressione Lineare Multipla viene considerata in ambito estimativo un metodo da utilizzarsi per
le cosiddette stime di massa. Ovvero per quelle valutazioni che richiedono la formulazione di un
giudizio di valore su di un gran numero di beni contemporaneamente. L’operazione matematica da
compiersi, dopo aver ottenuto il vettore delle stime dei parametri, è infatti molto semplice
VM0= f (x01,x02, •••, x0J ) =X0β
Nelle righe seguenti ci si soffermerà sulla giustificazione matematica del metodo. Sui collegamenti
che esistono tra SCA e la Regressione Lineare Multipla. Il tutto a partire da un caso studio.
Il Campione Estimativo
Un quesito di stima richiede di fornire un giudizio sul Valore di Mercato di un bene di 45 m2, avente
due arie, un balcone, con cantina, al piano terreno, non ristrutturato, sito in un fabbricato degli anni
50 privo di ascensore (Tabella 3).
Tabella 3 Caratteristiche rilevate sul bene oggetto di stima e sul campione estimativo
(19)
ove
X0=[x01 x02 ••• x0J ]∈M(1×J)
(20)
In termini pratici la stima del Valore di Mercato di un bene si ottiene dalla moltiplicazione del vettore
X0 e del vettore delle stime dei parametri. Il vettore X0 è costituito dai valori delle caratteristiche
osservati per il bene oggetto di stima. Nel caso di stime di massa il vettore X0 diventa una matrice
con un numero di righe pari al numero di beni da stimare, cosicché si ottiene non una singola stima
del Valore di Mercato ma un vettore. Richiamando il caso studio, se si volesse valutare un bene immobile non ristrutturato con una Superficie di 50 m2 inserito in un fabbricato costruito nel 1950 si
otterrebbe
VM0= X0β = [1 50 0 1950]
∙
−829802.12
1135.86
18922.50
438.22
∙
Come già in precedenza ricordato la descrizione del metodo di Regressione Lineare Multipla qui riportata non ha l’ambizione di essere esaustiva. Trattasi di una presentazione svolta con due obiettivi
di fondo. Far emergere la stretta similitudine matematica esistente tra la Regressione Lineare Multipla e il SCA. Ed evidenziare come i risultati ottenuti dalla procedura di Regressione possono essere
una base di partenza per l’applicazione pratica del SCA.
SALES COMPARISON APPROACH
Prezzo
Sup.
Arie
Balconi
Cantina
Piano
Ascensore
Anno
Conservazione
?????
45
2
1
Presente
0
Assente
1950
Non Ristrutt.
68300
38
2
2
Presente
1
Assente
1940
Non Ristrutt.
91300
60
2
1
Presente
5
Presente
1950
Non Ristrutt.
78400
40
2
1
Assente
1
Presente
1950
Non Ristrutt.
53900
45
2
1
Presente
2
Assente
1950
Non Ristrutt.
Per provvedere ad una stima per via diretta tramite SCA si seleziona un campione estimativo formato da quattro unità simili al bene oggetto di stima (Tabella 3) ed ubicate nel medesimo contesto
geografico.
Il bene e gli elementi del campione si trovano nella stessa zona delle unità considerate in Tabella 1,
cosicché da poter giustificare l’utilizzo dei risultati ottenuti dalla regressione.
Come si evince facilmente dall’osservazione della Tabella 3, il bene oggetto di stima e gli elementi
del campione estimativo hanno in comune il numero di arie e lo stato di conservazione. Pertanto
queste due caratteristiche possono essere eliminate in quanto non capaci di spiegare la variazione
di valore. Allora procedendo alla codifica delle variabili qualitative e richiamando le definizioni matematiche sinora introdotte si ha che
∙ ∙
68300
= 81512.3
I quesiti che richiedono la formulazione di un giudizio di stima sul Valore di Mercato di un bene
singolo sono la norma nella pratica estimativa. Tali stime sono utilizzate in contesti differenti e
spesso servono per redimere controversie giuridiche. Tra i molti metodi di stima, diretti e indiretti,
un ruolo centrale è ricoperto dal Sales Comparison Approach.
67
P=
91300
78400
53900
∈M(4×1)
X=
∙
38 2 1 1 0 1940
60 1 1 5 5 1950
40 1 0 1 1 1950
45 1 1 2 0 1950
∙
∈M(4×6)
X0= [45 1 1 0 0 1950] ∈ M(1x6)
Si noti che la penultima colonna di X è stata ottenuta moltiplicando il numero di Piani con la colonna codificata della variabile Ascensore, questo per sottolineare il fatto che la presenza dell’ascensore influisce sul valore soprattutto in funzione del piano in cui si trova l’unità (ovvero l’interazione
tra le due caratteristiche).
68
Interpretazione matematico-statistica dei metodi di stima diretti
Gabriele Brondino
Partendo dalla formulazione generale (11) del modello del Prezzo di Compravendita il SCA elabora
una strategia capace di apportare delle correzioni al vettore dei prezzi P a partire dalle differenze
esistenti tra gli elementi del campione e il bene oggetto di stima X-IX0.
ovvero sono i prezzi rilevati sugli elementi del campione estimativo a cui viene apportata una
modifica dovuta alle differenze nei valori delle caratteristiche. Richiamando i valori delle caratteristiche rilevate sugli elementi del campione estimativo e quelle del bene oggetto di stima si ottiene che
Ipotesi di linearità del modello
Il fondamento matematico del SCA è il famoso sviluppo in serie di Taylor, argomento ben noto dell’Analisi Matematica. Una funzione reale continua può essere ben approssimata da un modello lineare
attorno ad uno specifico punto. Così se si vuole approssimare linearmente la funzione del Valore di
Mercato f in un intorno del punto rappresentato dal vettore X0 si ottiene
f(Xi) = f(X0) + (Xi– X0) f’(X0) + ρi
∀i∈ {1, 2, …, n}
f (X) = I f (X0 ) + (X– I X0 ) β + ρ
(22)
Si noti che in questo caso il vettore dei parametri β ha il medesimo significato di quello introdotto
nella Regressione (formula 14). Rappresenta cioè un vettore contenente le variazioni di prezzo corrispondenti ad una variazione unitaria delle caratteristiche.
Il limite matematico dell’approssimazione matematica sta nel fatto che essa vale solo in un intorno
del punto X0. Al di fuori di questo intorno l’errore di approssimazione ρ può non essere trascurabile.
Tutto sta nel capire quale sia l’intorno per cui l’errore sia trascurabile. Ed è proprio questo il punto
debole della procedura SCA dal punto di vista pratico. Non vi sono strumenti per verificare se gli
elementi del campione estimativo appartengano ad un intorno nel quale l’errore di approssimazione
sia da considerarsi trascurabile.
Modello di Stima
Mediante alcune operazioni algebriche e richiamando il legame (11) esistente tra il vettore dei Prezzi
e la funzione del Valore di Mercato si può giungere alla formulazione matematica del SCA (risultato
ottenuto adattando le formulazioni contenute nell’articolo di Isakson del 2002)
I f (X0 ) = f (X) − (X−I X0 ) β − ρ
= P − ε − (X−I X0 ) β − ρ
(23)
= P + (I X0−X) β − (ρ + ε)
essendo I = [1, 1, .., 1]' ∈M(nx1). Il sistema lineare (23) è costituito da n equazioni lineari aventi ciascuna come risultato il Valore di Mercato del bene oggetto di stima. Infatti If(X0) è un vettore colonna di
dimensione n i cui elementi sono tutti uguali al Valore di Mercato f(X0). La formula (23) permette di
scomporre il Valore di Mercato in due componenti: il cosiddetto vettore dei prezzi corretti e il vettore
degli errori. I prezzi corretti S risultano pertanto definiti da
S = P + (I X0 – X) β
(I X0 – X) =
(21)
Il Valore di Mercato corrispondente al bene i del campione estimativo è una somma di tre termini:
il Valore di Mercato (incognito) del bene oggetto di stima, il prodotto matriciale tra il vettore delle
variazioni delle caratteristiche e la derivata prima di f nel punto X0, un termine contenente l’errore
di approssimazione che si genera qualora non si considerino termini di ordine superiore al primo.
Per trasformare la formula (21) in forma matriciale è sufficiente introdurre un vettore colonna I di
dimensione n
(24)
69
∙
7
−1
0
−1
0 10
−15
0
0
−5 −5
0
5
0
1
−1 −1
0
0
0
0
−2
0
0
∙
Ancora oscuro invece è il significato del nuovo vettore introdotto β, perché non si è fatto uso del
vettore β indicato nella formula (23)? Il vettore β ha per elementi le derivate prime della funzione f
valutate nel punto X0 (note come prezzi marginali). Il problema è che la funzione f è incognita così
come le sue derivate parziali rispetto alle caratteristiche. Ma allora come definire le componenti di
β? Nella pratica tali valori sono definiti dal perito sulla base della propria esperienza e conoscenza
del mercato immobiliare locale. Esiste tuttavia la possibilità di ricavare i valori delle componenti di
β attraverso l’analisi dei dati, ad esempio per mezzo di un’analisi di Regressione o della cosiddetta
Paired Analysis. Qualsiasi sia la strada percorsa, giudizio dell’esperto o metodi analitici, il risultato è
che il vettore β potrà soltanto essere approssimato da un vettore che è stato chiamato β.
Nel caso studio in esame si possono utilizzare i risultati ottenuti dalla Regressione svolta sulle 52
transazioni considerate in precedenza. Così i prezzi marginali per le caratteristiche Superficie, Stato
di Conservazione e Anno di Costruzione possono essere definiti rispettivamente pari a: 1135.86,
18922.50 e 438.22 €. Di questi valori quello relativo allo Stato di Conservazione risulta inutile, essendo tale caratteristica uguale per tutti gli elementi del campione e per il bene oggetto di stima.
I prezzi marginali per le altre caratteristiche si suppone siano il frutto dell’esperienza del perito così
da poter affermare che
β=
∙
1135.86
3180
640
−2240
3760
438.22
∙
S=
∙
79693
66662
83199
58380
∙
Prima di proseguire nello studio delle fondamenta matematiche del SCA e di addentrarci nella cosiddetta fase di riconciliazione dei dati, occorre richiamare per un attimo la formula (23) sostituendo in
essa la definizione di vettore dei prezzi corretti (24).
Il risultato è la comparsa di una nuova componente di errore dovuta all’approssimazione che si introduce sostituendo l’incognito valore di β con β, allora definendo β = β + θ con θ ∈ M(Jx1) si ottiene
I f (X0) = S – ((I X0 - X) θ+ρ+ε) ↦ S – I f (X0) = (I X0 - X) θ+ρ+ε
(25)
In sintesi la (25) afferma che la differenza tra i prezzi corretti ottenuti tramite ciascun elemento del
campione estimativo e il VM0 è dovuto a tre componenti di errore:
• quella dovuta all’utilizzo di prezzi marginali stimati o scelti da esperti (θ);
• quella dovuta all’approssimazione lineare nell’intorno di X0 e che pertanto tiene conto di eventuali effetti di non linearità non trascurabili (ρ);
• quella dovuta alla variabilità dei prezzi rispetto ai valori di mercato (ε).
68
Interpretazione matematico-statistica dei metodi di stima diretti
Gabriele Brondino
Partendo dalla formulazione generale (11) del modello del Prezzo di Compravendita il SCA elabora
una strategia capace di apportare delle correzioni al vettore dei prezzi P a partire dalle differenze
esistenti tra gli elementi del campione e il bene oggetto di stima X-IX0.
ovvero sono i prezzi rilevati sugli elementi del campione estimativo a cui viene apportata una
modifica dovuta alle differenze nei valori delle caratteristiche. Richiamando i valori delle caratteristiche rilevate sugli elementi del campione estimativo e quelle del bene oggetto di stima si ottiene che
Ipotesi di linearità del modello
Il fondamento matematico del SCA è il famoso sviluppo in serie di Taylor, argomento ben noto dell’Analisi Matematica. Una funzione reale continua può essere ben approssimata da un modello lineare
attorno ad uno specifico punto. Così se si vuole approssimare linearmente la funzione del Valore di
Mercato f in un intorno del punto rappresentato dal vettore X0 si ottiene
f(Xi) = f(X0) + (Xi– X0) f’(X0) + ρi
∀i∈ {1, 2, …, n}
f (X) = I f (X0 ) + (X– I X0 ) β + ρ
(22)
Si noti che in questo caso il vettore dei parametri β ha il medesimo significato di quello introdotto
nella Regressione (formula 14). Rappresenta cioè un vettore contenente le variazioni di prezzo corrispondenti ad una variazione unitaria delle caratteristiche.
Il limite matematico dell’approssimazione matematica sta nel fatto che essa vale solo in un intorno
del punto X0. Al di fuori di questo intorno l’errore di approssimazione ρ può non essere trascurabile.
Tutto sta nel capire quale sia l’intorno per cui l’errore sia trascurabile. Ed è proprio questo il punto
debole della procedura SCA dal punto di vista pratico. Non vi sono strumenti per verificare se gli
elementi del campione estimativo appartengano ad un intorno nel quale l’errore di approssimazione
sia da considerarsi trascurabile.
Modello di Stima
Mediante alcune operazioni algebriche e richiamando il legame (11) esistente tra il vettore dei Prezzi
e la funzione del Valore di Mercato si può giungere alla formulazione matematica del SCA (risultato
ottenuto adattando le formulazioni contenute nell’articolo di Isakson del 2002)
I f (X0 ) = f (X) − (X−I X0 ) β − ρ
= P − ε − (X−I X0 ) β − ρ
(23)
= P + (I X0−X) β − (ρ + ε)
essendo I = [1, 1, .., 1]' ∈M(nx1). Il sistema lineare (23) è costituito da n equazioni lineari aventi ciascuna come risultato il Valore di Mercato del bene oggetto di stima. Infatti If(X0) è un vettore colonna di
dimensione n i cui elementi sono tutti uguali al Valore di Mercato f(X0). La formula (23) permette di
scomporre il Valore di Mercato in due componenti: il cosiddetto vettore dei prezzi corretti e il vettore
degli errori. I prezzi corretti S risultano pertanto definiti da
S = P + (I X0 – X) β
(I X0 – X) =
(21)
Il Valore di Mercato corrispondente al bene i del campione estimativo è una somma di tre termini:
il Valore di Mercato (incognito) del bene oggetto di stima, il prodotto matriciale tra il vettore delle
variazioni delle caratteristiche e la derivata prima di f nel punto X0, un termine contenente l’errore
di approssimazione che si genera qualora non si considerino termini di ordine superiore al primo.
Per trasformare la formula (21) in forma matriciale è sufficiente introdurre un vettore colonna I di
dimensione n
(24)
69
∙
7
−1
0
−1
0 10
−15
0
0
−5 −5
0
5
0
1
−1 −1
0
0
0
0
−2
0
0
∙
Ancora oscuro invece è il significato del nuovo vettore introdotto β, perché non si è fatto uso del
vettore β indicato nella formula (23)? Il vettore β ha per elementi le derivate prime della funzione f
valutate nel punto X0 (note come prezzi marginali). Il problema è che la funzione f è incognita così
come le sue derivate parziali rispetto alle caratteristiche. Ma allora come definire le componenti di
β? Nella pratica tali valori sono definiti dal perito sulla base della propria esperienza e conoscenza
del mercato immobiliare locale. Esiste tuttavia la possibilità di ricavare i valori delle componenti di
β attraverso l’analisi dei dati, ad esempio per mezzo di un’analisi di Regressione o della cosiddetta
Paired Analysis. Qualsiasi sia la strada percorsa, giudizio dell’esperto o metodi analitici, il risultato è
che il vettore β potrà soltanto essere approssimato da un vettore che è stato chiamato β.
Nel caso studio in esame si possono utilizzare i risultati ottenuti dalla Regressione svolta sulle 52
transazioni considerate in precedenza. Così i prezzi marginali per le caratteristiche Superficie, Stato
di Conservazione e Anno di Costruzione possono essere definiti rispettivamente pari a: 1135.86,
18922.50 e 438.22 €. Di questi valori quello relativo allo Stato di Conservazione risulta inutile, essendo tale caratteristica uguale per tutti gli elementi del campione e per il bene oggetto di stima.
I prezzi marginali per le altre caratteristiche si suppone siano il frutto dell’esperienza del perito così
da poter affermare che
β=
∙
1135.86
3180
640
−2240
3760
438.22
∙
S=
∙
79693
66662
83199
58380
∙
Prima di proseguire nello studio delle fondamenta matematiche del SCA e di addentrarci nella cosiddetta fase di riconciliazione dei dati, occorre richiamare per un attimo la formula (23) sostituendo in
essa la definizione di vettore dei prezzi corretti (24).
Il risultato è la comparsa di una nuova componente di errore dovuta all’approssimazione che si introduce sostituendo l’incognito valore di β con β, allora definendo β = β + θ con θ ∈ M(Jx1) si ottiene
I f (X0) = S – ((I X0 - X) θ+ρ+ε) ↦ S – I f (X0) = (I X0 - X) θ+ρ+ε
(25)
In sintesi la (25) afferma che la differenza tra i prezzi corretti ottenuti tramite ciascun elemento del
campione estimativo e il VM0 è dovuto a tre componenti di errore:
• quella dovuta all’utilizzo di prezzi marginali stimati o scelti da esperti (θ);
• quella dovuta all’approssimazione lineare nell’intorno di X0 e che pertanto tiene conto di eventuali effetti di non linearità non trascurabili (ρ);
• quella dovuta alla variabilità dei prezzi rispetto ai valori di mercato (ε).
70
Interpretazione matematico-statistica dei metodi di stima diretti
Gabriele Brondino
Stima del Valore di Mercato
Ricavato il vettore dei cosiddetti prezzi corretti dal punto di vista matematico la cosiddetta riconciliazione consiste semplicemente in una moltiplicazione matriciale
VM0 = W'S
(26)
tra il vettore S e il vettore colonna dei pesi W = [w1, w2, .., wn]’ ∈ M(nx1), ovvero un vettore la cui somma
degli elementi è pari a 1 o, equivalentemente, I’W=1.
In questo modo si può giungere alla stima del Valore di Mercato del bene considerato nel caso studio
sino ad ora analizzato utilizzando un vettore di pesi uniforme (ovvero assegnando il medesimo peso
a tutti gli elementi del campione estimativo)
∙ ∙
79693
VM0=W ' S=
[ —14
1 —
1
—
4 4
1
—
4
]
66662
83199
= 71983.65
58380
Pertanto dall’applicazione del SCA al caso studio in esame si deduce che il Valore di Mercato del
bene oggetto di stima è pari a circa 71980 €.
Ottenuto il risultato numerico di stima la domanda che sorge spontanea è: ma questo valore è
davvero sensato? Certamente a questa domanda un esperto del mercato immobiliare della zona
potrebbe dare una risposta sensata in pochi istanti basandosi sulla propria esperienza e conoscenza.
Osservando tuttavia la domanda da un punto di vista matematico-statistico, la questione può essere
ulteriormente approfondita cercando di rispondere alle seguenti domande:
• esiste un modo per valutare la bontà della stima ottenuta (come avviene per la Regressione
Lineare Multipla) o addirittura per associare ad essa una misura della sua incertezza? Si noti a
tal proposito che per l’ambito estimativo il SCA è un metodo deterministico ... ma l’incertezza
rimane comunque come testimoniato dalle componenti di errore presenti in (25).
• è possibile cercare di studiare gli effetti generati dall’errore θ dovuto all’utilizzo del vettore β?
• Esiste un metodo per cercare di individuare l’intorno del punto X0 onde limitare gli effetti che le
componenti di non linearità non trascurabili (ρ) possono avere sul risultato di stima?
• Esiste un metodo per determinare il vettore dei pesi W affinché la stima sia la più corretta possibile, ovvero che si avvicini al valore incognito vero del Valore di Mercato?
A queste domande si cercherà di fornire una risposta facendo ricorso a grafici, alle misure di distanza e alla simulazione. Per contro la pratica attuale del SCA prevede che alla domanda sulla sensatezza dei risultati ottenuti si dia una risposta basandosi su indici che mirano a monitorare la variabilità
presente nel vettore S. Ad esempio se si osservano le componenti del vettore dei prezzi corretti, si
ha che la differenza tra il valore massimo e quello minimo è pari a
max(S) – min(S) = 83199 – 58380 = 24819
tale cifra risulta pari al 34.5% del Valore di Mercato di Stima. Una variazione così elevata comporta
immediatamente il rifiuto del risultato ottenuto.
Pertanto dal punto di vista estimativo la questione si risolve andando a cercare un campione estimativo differente, oppure rivedendo il vettore dei pesi, ecc.
71
Il fatto che non sempre mediante la procedura del SCA sia possibile ottenere una stima del Valore
di Mercato genera un’ulteriore questione dal punto di vista matematico: in che condizioni e con che
frequenza il SCA non offre risultati accettabili?
Paired Analysis
Prima di tentare di rispondere alle domande emerse nella sezione precedente, sembra opportuno
spendere alcune righe per cercare di comprendere la cosiddetta Paired Analysis (PA) da un punto di
vista matematico. Si è già detto che tale metodologia serve a fornire una valutazione per gli elementi
del vettore β. Non si è però ancora accennato al fatto che la PA è semplicemente un caso particolare
del SCA e, più precisamente della formula (24).
La PA può essere adottata quando nel campione estimativo si trovano due elementi aventi valori
identici per tutte le caratteristiche tranne una. Purtroppo nel caso studio in esame non si hanno due
elementi del campione che soddisfano tale condizione (vedi Tabella 3). Pertanto ipotizziamo di avere
a che fare con due unità simili in tutto (ad esempio perché si trovano nello stesso fabbricato) tranne
per il fatto che una si trova al secondo piano e l’altra al terzo. Il prezzo per la prima è risultato pari a
84000 €, quello per la seconda di 88000 €. Ci si chiede quale sia la variazione di valore dovuta alla
caratteristica interazione tra Ascensore e Piano. Senza pensarci troppo verrebbe da dire 4000 €, in
quanto l’unità al terzo piano ha un prezzo superiore a quella del secondo proprio pari a tale quantità.
Bene, questo è esattamente il ragionamento che sta alla base del PA, e che trova la sua giustificazione nella formula (24) ove il ruolo del bene oggetto di stima viene giocato dall’unità denominata r
pr = ps + (xrj− xsj) βj
Proposte per la Verifica della Bontà del SCA
↦
βj =
pr - ps
__________
xrj− xsj
(27)
Il SCA è una metodologia estimativa deterministica che si fonda sull’approssimazione lineare della
funzione del Valore di Mercato nell’intorno del punto X0.
Risulta pertanto necessario verificare che
• l’approssimazione lineare sia ragionevole;
• i valori assegnati alle componenti del vettore β siano sensati;
• gli elementi del campione estimativo si trovino in un intorno di X0.
Per cercare di verificare la bontà di tali ipotesi proponiamo innanzitutto di utilizzare dei grafici di
dispersione.
Rappresentando su di un piano cartesiano i Prezzi di Compravendita dei beni del campione
estimativo (ordinate) rispetto ai corrispondenti valori delle caratteristiche (ascisse) si ottengono
tanti diagrammi di dispersione quante sono le caratteristiche utilizzate nel SCA (Illustrazione 2).
Ai diagrammi così ottenuti si aggiungono due curve, la prima (tratteggiata) è ottenuta mediante
metodi di approssimazione non parametrici. La seconda (segmento rosso) è un segmento di
retta che ha come pendenza il prezzo marginale della caratteristica e passa per la stima del
Valore di Mercato (quadrato rosso). Dal confronto degli andamenti delle due curve si possono
fare considerazioni in merito all’ipotesi che l’approssimazione lineare sia ragionevole. Più le due
curve si sovrappongono, più l’ipotesi risulta accettabile. Viceversa se le due curve seguono andamenti differenti allora l’approssimazione lineare può considerarsi debole e, conseguentemente, l’errore θ potrebbe non essere così trascurabile. Dall’osservazione dei grafici di dispersione
di Illustrazione 2 si evince che nel caso di studio in esame l’approssimazione lineare introdotta
per la caratteristica Piano risulta inaccettabile. In tal caso, infatti, dai dati del campione pare che
il Prezzo aumenti con andamento quadratico al crescere del Piano. Tuttavia la retta tracciata
utilizzando il prezzo marginale della caratteristica Piano indica che il Prezzo dovrebbe decrescere
70
Interpretazione matematico-statistica dei metodi di stima diretti
Gabriele Brondino
Stima del Valore di Mercato
Ricavato il vettore dei cosiddetti prezzi corretti dal punto di vista matematico la cosiddetta riconciliazione consiste semplicemente in una moltiplicazione matriciale
VM0 = W'S
(26)
tra il vettore S e il vettore colonna dei pesi W = [w1, w2, .., wn]’ ∈ M(nx1), ovvero un vettore la cui somma
degli elementi è pari a 1 o, equivalentemente, I’W=1.
In questo modo si può giungere alla stima del Valore di Mercato del bene considerato nel caso studio
sino ad ora analizzato utilizzando un vettore di pesi uniforme (ovvero assegnando il medesimo peso
a tutti gli elementi del campione estimativo)
∙ ∙
79693
VM0=W ' S=
[ —14
1 —
1
—
4 4
1
—
4
]
66662
83199
= 71983.65
58380
Pertanto dall’applicazione del SCA al caso studio in esame si deduce che il Valore di Mercato del
bene oggetto di stima è pari a circa 71980 €.
Ottenuto il risultato numerico di stima la domanda che sorge spontanea è: ma questo valore è
davvero sensato? Certamente a questa domanda un esperto del mercato immobiliare della zona
potrebbe dare una risposta sensata in pochi istanti basandosi sulla propria esperienza e conoscenza.
Osservando tuttavia la domanda da un punto di vista matematico-statistico, la questione può essere
ulteriormente approfondita cercando di rispondere alle seguenti domande:
• esiste un modo per valutare la bontà della stima ottenuta (come avviene per la Regressione
Lineare Multipla) o addirittura per associare ad essa una misura della sua incertezza? Si noti a
tal proposito che per l’ambito estimativo il SCA è un metodo deterministico ... ma l’incertezza
rimane comunque come testimoniato dalle componenti di errore presenti in (25).
• è possibile cercare di studiare gli effetti generati dall’errore θ dovuto all’utilizzo del vettore β?
• Esiste un metodo per cercare di individuare l’intorno del punto X0 onde limitare gli effetti che le
componenti di non linearità non trascurabili (ρ) possono avere sul risultato di stima?
• Esiste un metodo per determinare il vettore dei pesi W affinché la stima sia la più corretta possibile, ovvero che si avvicini al valore incognito vero del Valore di Mercato?
A queste domande si cercherà di fornire una risposta facendo ricorso a grafici, alle misure di distanza e alla simulazione. Per contro la pratica attuale del SCA prevede che alla domanda sulla sensatezza dei risultati ottenuti si dia una risposta basandosi su indici che mirano a monitorare la variabilità
presente nel vettore S. Ad esempio se si osservano le componenti del vettore dei prezzi corretti, si
ha che la differenza tra il valore massimo e quello minimo è pari a
max(S) – min(S) = 83199 – 58380 = 24819
tale cifra risulta pari al 34.5% del Valore di Mercato di Stima. Una variazione così elevata comporta
immediatamente il rifiuto del risultato ottenuto.
Pertanto dal punto di vista estimativo la questione si risolve andando a cercare un campione estimativo differente, oppure rivedendo il vettore dei pesi, ecc.
71
Il fatto che non sempre mediante la procedura del SCA sia possibile ottenere una stima del Valore
di Mercato genera un’ulteriore questione dal punto di vista matematico: in che condizioni e con che
frequenza il SCA non offre risultati accettabili?
Paired Analysis
Prima di tentare di rispondere alle domande emerse nella sezione precedente, sembra opportuno
spendere alcune righe per cercare di comprendere la cosiddetta Paired Analysis (PA) da un punto di
vista matematico. Si è già detto che tale metodologia serve a fornire una valutazione per gli elementi
del vettore β. Non si è però ancora accennato al fatto che la PA è semplicemente un caso particolare
del SCA e, più precisamente della formula (24).
La PA può essere adottata quando nel campione estimativo si trovano due elementi aventi valori
identici per tutte le caratteristiche tranne una. Purtroppo nel caso studio in esame non si hanno due
elementi del campione che soddisfano tale condizione (vedi Tabella 3). Pertanto ipotizziamo di avere
a che fare con due unità simili in tutto (ad esempio perché si trovano nello stesso fabbricato) tranne
per il fatto che una si trova al secondo piano e l’altra al terzo. Il prezzo per la prima è risultato pari a
84000 €, quello per la seconda di 88000 €. Ci si chiede quale sia la variazione di valore dovuta alla
caratteristica interazione tra Ascensore e Piano. Senza pensarci troppo verrebbe da dire 4000 €, in
quanto l’unità al terzo piano ha un prezzo superiore a quella del secondo proprio pari a tale quantità.
Bene, questo è esattamente il ragionamento che sta alla base del PA, e che trova la sua giustificazione nella formula (24) ove il ruolo del bene oggetto di stima viene giocato dall’unità denominata r
pr = ps + (xrj− xsj) βj
Proposte per la Verifica della Bontà del SCA
↦
βj =
pr - ps
__________
xrj− xsj
(27)
Il SCA è una metodologia estimativa deterministica che si fonda sull’approssimazione lineare della
funzione del Valore di Mercato nell’intorno del punto X0.
Risulta pertanto necessario verificare che
• l’approssimazione lineare sia ragionevole;
• i valori assegnati alle componenti del vettore β siano sensati;
• gli elementi del campione estimativo si trovino in un intorno di X0.
Per cercare di verificare la bontà di tali ipotesi proponiamo innanzitutto di utilizzare dei grafici di
dispersione.
Rappresentando su di un piano cartesiano i Prezzi di Compravendita dei beni del campione
estimativo (ordinate) rispetto ai corrispondenti valori delle caratteristiche (ascisse) si ottengono
tanti diagrammi di dispersione quante sono le caratteristiche utilizzate nel SCA (Illustrazione 2).
Ai diagrammi così ottenuti si aggiungono due curve, la prima (tratteggiata) è ottenuta mediante
metodi di approssimazione non parametrici. La seconda (segmento rosso) è un segmento di
retta che ha come pendenza il prezzo marginale della caratteristica e passa per la stima del
Valore di Mercato (quadrato rosso). Dal confronto degli andamenti delle due curve si possono
fare considerazioni in merito all’ipotesi che l’approssimazione lineare sia ragionevole. Più le due
curve si sovrappongono, più l’ipotesi risulta accettabile. Viceversa se le due curve seguono andamenti differenti allora l’approssimazione lineare può considerarsi debole e, conseguentemente, l’errore θ potrebbe non essere così trascurabile. Dall’osservazione dei grafici di dispersione
di Illustrazione 2 si evince che nel caso di studio in esame l’approssimazione lineare introdotta
per la caratteristica Piano risulta inaccettabile. In tal caso, infatti, dai dati del campione pare che
il Prezzo aumenti con andamento quadratico al crescere del Piano. Tuttavia la retta tracciata
utilizzando il prezzo marginale della caratteristica Piano indica che il Prezzo dovrebbe decrescere
72
Interpretazione matematico-statistica dei metodi di stima diretti
Gabriele Brondino
linearmente. L’ipotesi di linearità non è dunque in questo caso ragionevole così come pare discutibile pure il valore prescelto di prezzo marginale.
73
La matrice H è costituita da n+1 righe che rappresentano le differenze tra i valori delle caratteristiche rilevate sul bene oggetto di stima e quelli rilevati sugli elementi del campione estimativo. La
prima riga è costituita da J valori nulli perché si riferisce al bene oggetto di stima medesimo. Nel
caso studio da noi analizzato si ottiene
H=
∙
0 0
7 −1
−15 0
5 0
0 0
0
0
0
1
0
0 0 0
−1 0 10
−5 −5 0
−1 −1 0
−2 0 0
∙
La matrice H è costituita da J colonne che fanno riferimento alle rispettive caratteristiche utilizzate
nella stima del Valore di Mercato. I valori numerici contenuti nelle differenti colonne sono espressi
in differenti unità di misura. Ad esempio nel caso in esame la prima colonna contiene le differenze di
m2 esistenti tra il bene oggetto di stima e gli elementi del campione, mentre la seconda esprime una
differenza nel numero di balconi. Da quanto detto non è dunque possibile procedere al calcolo di
una matrice delle distanze tra le righe di H senza una previa normalizzazione o una qualche altra trasformazione. Un’altra osservazione che va fatta riguarda il peso che ogni caratteristica ha nella stima
di VM0. Il fatto che gli elementi del vettore dei prezzi marginali non siano tutti uguali testimonia come
le colonne della matrice I X0-X influenzino la stima del Valore di Mercato in maniera differente. Sulla
base di quest’ultima considerazione si suggerisce di calcolare la matrice delle distanze partendo da
Illustrazione 2 Grafici di dispersione del Prezzo rispetto alle caratteristiche utilizzate nel SCA. I quadrati neri sono i valori rilevati
sul campione estimativo. La curva tratteggiata è la stima non parametrica dell'andamento dei Prezzi rispetto alla caratteristica
considerata. Il quadrato rosso rappresenta la stima del Valore di Mercato del bene oggetto di stima.
La curva rossa è ottenuta utilizzando il prezzo marginale della caratteristica analizzata.
I grafici di dispersione sopra descritti sono molto utili per verificare la bontà dell’approssimazione
lineare e la sensatezza delle componenti di β.
Tuttavia non sono di grande aiuto nella verifica che gli elementi del campione estimativo si trovino
in un intorno del punto X0.
Per cercare di svolgere questo compito si propone di ricorrere alla costruzione di una matrice delle
distanze tra il bene oggetto di stima e gli elementi del campione estimativo.
Tale matrice deve contenere dei numeri capaci di esprimere la distanza tra un bene e l’altro rispetto
alle differenze dovute ai differenti valori assunti dalle caratteristiche prese in considerazione.
Per giungere alla costruzione di tale matrice occorre innanzitutto partire dalla seguente definizione
H=
∙
01xJ
I X0− X
∙
∈m(n+1)xJ
(28)
H diag (β)∈M(n+1)×J
(29)
Questa nuova matrice è composta da colonne aventi tutte la medesima unità di misura: gli euro!
I valori di questa matrice sono le correzioni (o aggiustamenti) che sono dovute ai differenti beni e
alle diverse caratteristiche. Infatti diag (β) è una matrice quadrata avente tutti gli elementi nulli eccetto quelli sulla diagonale principale che sono pari ai prezzi marginali
diag (β) =
∙
1135.86
0
0
0
0
0
0
3180
0
0
0
0
0
0
640
0
0
0
0
0
0
−2240
0
0
0
0
0
0
3370
0
0
0
0
0
0
438.22
∙
allora si ottiene che
H diag (β) =
∙
0
7951
−17038
5679
0
0
−3180
0
0
0
0
0
0
640
0
0
2240
11200
2240
4480
0
0
−18800
−3760
0
0
4382
0
0
0
∙
72
Interpretazione matematico-statistica dei metodi di stima diretti
Gabriele Brondino
linearmente. L’ipotesi di linearità non è dunque in questo caso ragionevole così come pare discutibile pure il valore prescelto di prezzo marginale.
73
La matrice H è costituita da n+1 righe che rappresentano le differenze tra i valori delle caratteristiche rilevate sul bene oggetto di stima e quelli rilevati sugli elementi del campione estimativo. La
prima riga è costituita da J valori nulli perché si riferisce al bene oggetto di stima medesimo. Nel
caso studio da noi analizzato si ottiene
H=
∙
0 0
7 −1
−15 0
5 0
0 0
0
0
0
1
0
0 0 0
−1 0 10
−5 −5 0
−1 −1 0
−2 0 0
∙
La matrice H è costituita da J colonne che fanno riferimento alle rispettive caratteristiche utilizzate
nella stima del Valore di Mercato. I valori numerici contenuti nelle differenti colonne sono espressi
in differenti unità di misura. Ad esempio nel caso in esame la prima colonna contiene le differenze di
m2 esistenti tra il bene oggetto di stima e gli elementi del campione, mentre la seconda esprime una
differenza nel numero di balconi. Da quanto detto non è dunque possibile procedere al calcolo di
una matrice delle distanze tra le righe di H senza una previa normalizzazione o una qualche altra trasformazione. Un’altra osservazione che va fatta riguarda il peso che ogni caratteristica ha nella stima
di VM0. Il fatto che gli elementi del vettore dei prezzi marginali non siano tutti uguali testimonia come
le colonne della matrice I X0-X influenzino la stima del Valore di Mercato in maniera differente. Sulla
base di quest’ultima considerazione si suggerisce di calcolare la matrice delle distanze partendo da
Illustrazione 2 Grafici di dispersione del Prezzo rispetto alle caratteristiche utilizzate nel SCA. I quadrati neri sono i valori rilevati
sul campione estimativo. La curva tratteggiata è la stima non parametrica dell'andamento dei Prezzi rispetto alla caratteristica
considerata. Il quadrato rosso rappresenta la stima del Valore di Mercato del bene oggetto di stima.
La curva rossa è ottenuta utilizzando il prezzo marginale della caratteristica analizzata.
I grafici di dispersione sopra descritti sono molto utili per verificare la bontà dell’approssimazione
lineare e la sensatezza delle componenti di β.
Tuttavia non sono di grande aiuto nella verifica che gli elementi del campione estimativo si trovino
in un intorno del punto X0.
Per cercare di svolgere questo compito si propone di ricorrere alla costruzione di una matrice delle
distanze tra il bene oggetto di stima e gli elementi del campione estimativo.
Tale matrice deve contenere dei numeri capaci di esprimere la distanza tra un bene e l’altro rispetto
alle differenze dovute ai differenti valori assunti dalle caratteristiche prese in considerazione.
Per giungere alla costruzione di tale matrice occorre innanzitutto partire dalla seguente definizione
H=
∙
01xJ
I X0− X
∙
∈m(n+1)xJ
(28)
H diag (β)∈M(n+1)×J
(29)
Questa nuova matrice è composta da colonne aventi tutte la medesima unità di misura: gli euro!
I valori di questa matrice sono le correzioni (o aggiustamenti) che sono dovute ai differenti beni e
alle diverse caratteristiche. Infatti diag (β) è una matrice quadrata avente tutti gli elementi nulli eccetto quelli sulla diagonale principale che sono pari ai prezzi marginali
diag (β) =
∙
1135.86
0
0
0
0
0
0
3180
0
0
0
0
0
0
640
0
0
0
0
0
0
−2240
0
0
0
0
0
0
3370
0
0
0
0
0
0
438.22
∙
allora si ottiene che
H diag (β) =
∙
0
7951
−17038
5679
0
0
−3180
0
0
0
0
0
0
640
0
0
2240
11200
2240
4480
0
0
−18800
−3760
0
0
4382
0
0
0
∙
Interpretazione matematico-statistica dei metodi di stima diretti
Gabriele Brondino
La matrice così ottenuta consente di poter affermare che, a causa della differenza di superficie
esistente tra il bene oggetto di stima e il primo elemento del campione estimativo (seconda riga), la
correzione di prezzo risulta pari a 7951 €; mentre il fatto che il primo elemento del campione estimativo abbia due balconi, ovvero uno in più del bene oggetto di stima, comporta che il suo prezzo di
vendita debba essere deprezzato di una quantità pari a 3180 €. La matrice così ottenuta è composta
da elementi misurati sulla medesima scala di misura (€) e ha colonne correttamente pesate. Ne consegue che risulta un candidato ideale per costruire la matrice delle distanze
D = dist (H diag (β)) ∈M(n+1)x(n+1)
(30)
La matrice D è ottenuta applicando la distanza euclidea tra le coppie di vettori riga di H diag(β).
Gli elementi di questa matrice misurano la distanza tra il bene oggetto di stima e gli elementi del
campione estimativo in €. Così se si vuole avere un’indicazione di quale sia la distanza esistente tra
il bene oggetto di stima e gli elementi del campione estimativo è sufficiente osservare i valori della
prima riga (o colonna).
D=
∙
0
9877
27734
7199
4480
9877
0
32977
7002
9877
27734
32977
0
28687
26247
7199
7002
28687
0
7199
∙
4480
9877
26247
7199
0
Le distanze tra il bene oggetto di stima e gli elementi del campione estimativo risultano pari rispettivamente a 9877, 27734, 7199 e 4480 €. Questi valori consentono di individuare quali siano gli
elementi del campione estimativo più vicini al bene oggetto di stima. E, conseguentemente, possono
essere di grande utilità nel definire un intorno per il punto X0. A tal proposito si suggerisce di applicare la metodologia statistica nota come Multidimensional Scaling (Hastie et al., 2001) per ottenere
una rappresentazione grafica della matrice delle distanze D.
Proposte per la definizione del vettore pesi W
Sviluppando algebricamente la formulazione della stima del Valore di Mercato (26) si può giungere
alla definizione della differenza tra la stima di VM0 e il valore della funzione del Valore di Mercato nel
punto X0
|VM0 – f(X0)| = |W’S – W’I f (X0)|= W’((I X0 - X) θ+ρ+ε)
1
4
5000
10000
15000
20000
25000
30000
2
3
Illustrazione 3
Rappresentazione grafica
della proiezione
sul piano della matrice
delle distanze
(Multidimensional Scaling)
-5 0 0 0
0
5000
10000
15000
20000
25000
La mappa rappresentata in Illustrazione 3 è stata ottenuta applicando il metodo della Multidimensional Scaling metrico sulla matrice delle distanze D.
Illustrazione 1: Rappresentazione grafica della proiezione sul piano della matrice delle
distanze (Multidimensional Scaling).
(31)
Dalla (31) si evince che per cercare di minimizzare l’errore di stima occorre cercare di rendere minimi
i seguenti termini W’(I X0 - X) θ e W’ρ. Il primo dei due termini di errore è funzione delle differenze
di valori osservate tra il bene oggetto di stima e gli elementi del campione I X0-X. Ne consegue che
i beni del campione estimativo più distanti dal bene oggetto di stima generano errori di maggiore
entità. Allo stesso modo il secondo termine di errore assume valori più elevati quando si considerano
beni di comparazione più distanti dal bene oggetto di stima. Infatti, in presenza di funzioni del Valore
di Mercato non troppo irregolari, l’errore di approssimazione lineare si fa più elevato man mano che
ci si allontana dal bene oggetto di stima. Per cercare di limitare gli effetti negativi generati dai beni
di comparazione più distanti dal bene oggetto di stima si propone di utilizzare un vettore pesi W
definito mediante la prima riga (o colonna) della matrice D. Ad esempio
5000
-5 0 0 0
0
0
75
Il grafico è di facile lettura, il punto rosso rappresenta il bene oggetto di stima mentre gli altri punti
sono i quattro elementi del campione estimativo. Senza grandi difficoltà si deduce che il secondo
elemento del campione ha una distanza dal bene oggetto di stima superiore a 25000 € e ha, rispetto agli altri tre elementi del campione, una posizione marginale. Per cercare di limitare gli errori
introdotti dall’approssimazione lineare della funzione del Valore di Mercato si può pertanto decidere
di eliminare dal campione estimativo il secondo elemento. Tuttavia questa decisione comporterebbe un’ulteriore diminuzione della già scarsa numerosità campionaria. Allora, sempre partendo dalla
semplice osservazione della mappa bidimensionale, si può decidere di utilizzare un vettore pesi W
che dipenda dalle distanze degli elementi dal bene oggetto di stima.
W' =
-1 0 0 0 0
74
∙
d-1
d-1
12
13
__________ __________
Σ d-1
1j
•••
Σ d-1
1j
d-1
1(n+1)
__________
Σ d-1
1j
∙
(32)
Questo vettore assegna un peso agli elementi del campione che è inversamente proporzionale alla
loro distanza dal bene oggetto di stima. Ovviamente l’applicazione di un tale vettore peso genera
una stima del Valore di Mercato differente da quella ottenuta in precedenza (adottando un vettore
di pesi uniforme), infatti
VM0 = W'S = [0.202 0.072 0.278 0.447]
∙ ∙
79693
66662
83199
58380
= 70202.04
Interpretazione matematico-statistica dei metodi di stima diretti
Gabriele Brondino
La matrice così ottenuta consente di poter affermare che, a causa della differenza di superficie
esistente tra il bene oggetto di stima e il primo elemento del campione estimativo (seconda riga), la
correzione di prezzo risulta pari a 7951 €; mentre il fatto che il primo elemento del campione estimativo abbia due balconi, ovvero uno in più del bene oggetto di stima, comporta che il suo prezzo di
vendita debba essere deprezzato di una quantità pari a 3180 €. La matrice così ottenuta è composta
da elementi misurati sulla medesima scala di misura (€) e ha colonne correttamente pesate. Ne consegue che risulta un candidato ideale per costruire la matrice delle distanze
D = dist (H diag (β)) ∈M(n+1)x(n+1)
(30)
La matrice D è ottenuta applicando la distanza euclidea tra le coppie di vettori riga di H diag(β).
Gli elementi di questa matrice misurano la distanza tra il bene oggetto di stima e gli elementi del
campione estimativo in €. Così se si vuole avere un’indicazione di quale sia la distanza esistente tra
il bene oggetto di stima e gli elementi del campione estimativo è sufficiente osservare i valori della
prima riga (o colonna).
D=
∙
0
9877
27734
7199
4480
9877
0
32977
7002
9877
27734
32977
0
28687
26247
7199
7002
28687
0
7199
∙
4480
9877
26247
7199
0
Le distanze tra il bene oggetto di stima e gli elementi del campione estimativo risultano pari rispettivamente a 9877, 27734, 7199 e 4480 €. Questi valori consentono di individuare quali siano gli
elementi del campione estimativo più vicini al bene oggetto di stima. E, conseguentemente, possono
essere di grande utilità nel definire un intorno per il punto X0. A tal proposito si suggerisce di applicare la metodologia statistica nota come Multidimensional Scaling (Hastie et al., 2001) per ottenere
una rappresentazione grafica della matrice delle distanze D.
Proposte per la definizione del vettore pesi W
Sviluppando algebricamente la formulazione della stima del Valore di Mercato (26) si può giungere
alla definizione della differenza tra la stima di VM0 e il valore della funzione del Valore di Mercato nel
punto X0
|VM0 – f(X0)| = |W’S – W’I f (X0)|= W’((I X0 - X) θ+ρ+ε)
1
4
5000
10000
15000
20000
25000
30000
2
3
Illustrazione 3
Rappresentazione grafica
della proiezione
sul piano della matrice
delle distanze
(Multidimensional Scaling)
-5 0 0 0
0
5000
10000
15000
20000
25000
La mappa rappresentata in Illustrazione 3 è stata ottenuta applicando il metodo della Multidimensional Scaling metrico sulla matrice delle distanze D.
Illustrazione 1: Rappresentazione grafica della proiezione sul piano della matrice delle
distanze (Multidimensional Scaling).
(31)
Dalla (31) si evince che per cercare di minimizzare l’errore di stima occorre cercare di rendere minimi
i seguenti termini W’(I X0 - X) θ e W’ρ. Il primo dei due termini di errore è funzione delle differenze
di valori osservate tra il bene oggetto di stima e gli elementi del campione I X0-X. Ne consegue che
i beni del campione estimativo più distanti dal bene oggetto di stima generano errori di maggiore
entità. Allo stesso modo il secondo termine di errore assume valori più elevati quando si considerano
beni di comparazione più distanti dal bene oggetto di stima. Infatti, in presenza di funzioni del Valore
di Mercato non troppo irregolari, l’errore di approssimazione lineare si fa più elevato man mano che
ci si allontana dal bene oggetto di stima. Per cercare di limitare gli effetti negativi generati dai beni
di comparazione più distanti dal bene oggetto di stima si propone di utilizzare un vettore pesi W
definito mediante la prima riga (o colonna) della matrice D. Ad esempio
5000
-5 0 0 0
0
0
75
Il grafico è di facile lettura, il punto rosso rappresenta il bene oggetto di stima mentre gli altri punti
sono i quattro elementi del campione estimativo. Senza grandi difficoltà si deduce che il secondo
elemento del campione ha una distanza dal bene oggetto di stima superiore a 25000 € e ha, rispetto agli altri tre elementi del campione, una posizione marginale. Per cercare di limitare gli errori
introdotti dall’approssimazione lineare della funzione del Valore di Mercato si può pertanto decidere
di eliminare dal campione estimativo il secondo elemento. Tuttavia questa decisione comporterebbe un’ulteriore diminuzione della già scarsa numerosità campionaria. Allora, sempre partendo dalla
semplice osservazione della mappa bidimensionale, si può decidere di utilizzare un vettore pesi W
che dipenda dalle distanze degli elementi dal bene oggetto di stima.
W' =
-1 0 0 0 0
74
∙
d-1
d-1
12
13
__________ __________
Σ d-1
1j
•••
Σ d-1
1j
d-1
1(n+1)
__________
Σ d-1
1j
∙
(32)
Questo vettore assegna un peso agli elementi del campione che è inversamente proporzionale alla
loro distanza dal bene oggetto di stima. Ovviamente l’applicazione di un tale vettore peso genera
una stima del Valore di Mercato differente da quella ottenuta in precedenza (adottando un vettore
di pesi uniforme), infatti
VM0 = W'S = [0.202 0.072 0.278 0.447]
∙ ∙
79693
66662
83199
58380
= 70202.04
Interpretazione matematico-statistica dei metodi di stima diretti
Gabriele Brondino
Tabella 4 Distribuzioni ed indici dei Prezzi marginali delle caratteristiche
Caratteristica
Distrib
Min
Max
Superficie
Normale
Balconi
Uniforme
3100
3300
Cantina
Uniforme
600
650
Piano
Uniforme
-2250
-2230
Ascensore
Uniforme
3700
3800
Anno
Normale
Media
St.Dev
1135.86
254.53
438.22
116.79
8 e -0 4
Si è già detto che il vettore β dei cosiddetti prezzi marginali è in realtà incognito. Esso viene stimato
con β da parte di esperti dando però origine alla componente di errore θ.
In precedenza ci si è chiesti se fosse possibile studiare gli effetti generati da θ sull’errore di stima.
Alla luce della formula (31) la risposta è positiva. Infatti ipotizzando una distribuzione di probabilità
per il vettore θ si può ricavare l’andamento distribuzionale della differenza tra la stima del Valore
di Mercato e il valore della funzione in X0. Tale soluzione è certamente molto interessante da un
punto di vista teorico perché consente di poter valutare la correttezza dello stimatore del Valore di
Mercato ottenuto mediante SCA. Tuttavia dal punto di vista pratico esiste un’altra questione molto
interessante: è possibile associare al giudizio di stima una misura della sua incertezza?
Il SCA viene considerato un metodo deterministico e la stima del Valore di Mercato non viene accompagnata da nessuna misura di incertezza. Le cosiddette stime intervallari, infatti, sono attualmente
appannaggio esclusivamente delle procedure statistiche, quali ad esempio la Regressione Lineare
Multipla. Ma componenti di incertezza sono presenti anche in una stima ottenuta mediante SCA.
In particolare le componenti del vettore β vengono definite dagli esperti in condizioni che raramente
possono definirsi certe. Si consideri ad esempio il prezzo marginale della variabile Balconi nel caso
di studio analizzato: 3180 €. Questo valore può essere ottenuto consultando bollettini del settore,
oppure interrogando un certo numero di esperti del mercato immobiliare locale. In questo secondo
caso occorre chiedersi se sia possibile che tutti gli esperti interrogati abbiano indicato esattamente
in 3180 € l’incremento di valore dovuto alla presenza di un balcone in più. Più ragionevolmente gli
esperti contattati hanno indicato valori compresi in un intervallo, ad esempio tra 3100 e 3300 €. Il
prezzo marginale utilizzato con buona probabilità è semplicemente la media dei valori ottenuti interrogando il campione di esperti del settore. Ma allora occorre chiedersi se è possibile studiare gli
effetti sulla stima del Valore di Mercato generati dall’incertezza nella definizione del prezzo marginale
di una caratteristica.
Ricorrendo alla simulazione Monte Carlo è possibile studiare l’incertezza di stima nel Valore di Mercato che si viene a generare partendo da valori incerti delle componenti del vettore β. Supponiamo
a titolo esemplificativo che tutte le componenti del vettore dei prezzi marginali siano affette da incertezza. In particolare si ipotizzi che i valori puntuali del vettore β siano sostituiti da variabili casuali
secondo quanto indicato in Tabella 4.
I prezzi marginali delle caratteristiche Superficie e Anno di Costruzione sono stati ottenuti da un’analisi di regressione. Per questo motivo ad essi è stata assegnata una distribuzione gaussiana (normale) avente come valore medio quello utilizzato in precedenza come valore puntuale, e come deviazione standard il valore di Standard Error di Tabella 2. L’incertezza nell’assegnazione dei prezzi
marginali delle restanti caratteristiche si è ipotizzato possa essere descritta mediante delle variabili
casuali uniformi. Gli estremi delle variabili casuali uniformi sono stati scelti a caso. L’obiettivo di queste righe è, infatti, quello di mostrare la facilità con la quale si può gestire esplicitamente l’incertezza
presente in una procedura di SCA. Non è invece compito di queste righe di discutere il metodo più
corretto per rappresentare l’incertezza nell’assegnazione dei prezzi marginali (si auspica tuttavia un
approfondimento di tale argomento).
Trasformate in variabili casuali le componenti del vettore β la simulazione Monte Carlo consiste nel
ripetere la procedura di stima del Valore di Mercato per un numero desiderato di volte (nel nostro
caso 10000). In ciascuna di queste iterazioni si provvede ad estrarre casualmente dei prezzi marginali dalle distribuzioni indicate in Tabella 4. Il risultato che si ottiene dall’applicazione della simulazione Monte Carlo è un insieme di 10000 stime del Valore di Mercato. L’Illustrazione 4 contiene una
rappresentazione grafica della distribuzione empirica di questo insieme di realizzazioni.
4 e -0 4
Proposte per lo studio dell’incertezza di stima
77
0e+00
La stima del Valore di Mercato così ottenuta è da preferirsi a quella ricavata mediante un vettore
pesi uniforme. Infatti, gli effetti negativi dovuti al secondo elemento del campione estimativo (vedi
Illustrazione 3) risultano smorzati dal valore del peso utilizzato: 0.072 a fronte del precedente ¼.
Si sottolinea infine come il vettore (32) rappresenti soltanto una delle molteplici alternative percorribili nella definizione del vettore pesi.
Densità
D e n s ity
76
68500
69000
69500
70000
70500
71000
N N= =1 10000
0 0 0 0 Bandwidth
B a n d w i d t h= 47.3
= 4 7 .3
Illustrazione
1: Funzione
di empirica
densità della
empirica
della
Stima
del Valore
dimediante
Mercatole ottenuta
Illustrazione
4 Funzione
di densità
Stima del
Valore
di Mercato
ottenuta
10000 replicazioni della
medianteMonte
le 10000
replicazioni
della simulazione
Monte 69940,
Carlo. mediana
Indici statistici:
minimo
simulazione
Carlo. Indici
statistici: minimo
68740, primo quartile
70180, media
70160, terzo quartile
70400,
massimo
71050
68740,
primo
quartile 69940, mediana 70180, media 70160, terzo quartile 70400,
massimo 71050.
La media calcolata sulle 10000 stime ottenute via Monte Carlo risulta pari a 70160 €.
Tale valore risulta prossimo al valore puntuale precedentemente ottenuto, 70202.04 €. Tuttavia ben
più interessante è notare come, grazie alla simulazione, è possibile associare alla stima puntuale anche un’indicazione dell’incertezza di stima dovuta alla procedura di assegnazione dei prezzi marginali. Per esempio si può indicare che le 10000 simulazioni hanno generato stime del Valore di Mercato
comprese tra un minimo di 68740 € e un massimo di 71050 €.
Da notare che questo non è un intervallo di fiducia.
BIBLIOGRAFIA
Hastie T., Tibshirani R., Friedman J., The Element of Statistical Learning. Data Mining, Inference and Prediction. Springer, 2001.
Isakson H. R., The Linear Algebra of the Sales Comparison Approach, Journal of Real Estate Research, 24(2), pagg117-128, 2002.
Interpretazione matematico-statistica dei metodi di stima diretti
Gabriele Brondino
Tabella 4 Distribuzioni ed indici dei Prezzi marginali delle caratteristiche
Caratteristica
Distrib
Min
Max
Superficie
Normale
Balconi
Uniforme
3100
3300
Cantina
Uniforme
600
650
Piano
Uniforme
-2250
-2230
Ascensore
Uniforme
3700
3800
Anno
Normale
Media
St.Dev
1135.86
254.53
438.22
116.79
8 e -0 4
Si è già detto che il vettore β dei cosiddetti prezzi marginali è in realtà incognito. Esso viene stimato
con β da parte di esperti dando però origine alla componente di errore θ.
In precedenza ci si è chiesti se fosse possibile studiare gli effetti generati da θ sull’errore di stima.
Alla luce della formula (31) la risposta è positiva. Infatti ipotizzando una distribuzione di probabilità
per il vettore θ si può ricavare l’andamento distribuzionale della differenza tra la stima del Valore
di Mercato e il valore della funzione in X0. Tale soluzione è certamente molto interessante da un
punto di vista teorico perché consente di poter valutare la correttezza dello stimatore del Valore di
Mercato ottenuto mediante SCA. Tuttavia dal punto di vista pratico esiste un’altra questione molto
interessante: è possibile associare al giudizio di stima una misura della sua incertezza?
Il SCA viene considerato un metodo deterministico e la stima del Valore di Mercato non viene accompagnata da nessuna misura di incertezza. Le cosiddette stime intervallari, infatti, sono attualmente
appannaggio esclusivamente delle procedure statistiche, quali ad esempio la Regressione Lineare
Multipla. Ma componenti di incertezza sono presenti anche in una stima ottenuta mediante SCA.
In particolare le componenti del vettore β vengono definite dagli esperti in condizioni che raramente
possono definirsi certe. Si consideri ad esempio il prezzo marginale della variabile Balconi nel caso
di studio analizzato: 3180 €. Questo valore può essere ottenuto consultando bollettini del settore,
oppure interrogando un certo numero di esperti del mercato immobiliare locale. In questo secondo
caso occorre chiedersi se sia possibile che tutti gli esperti interrogati abbiano indicato esattamente
in 3180 € l’incremento di valore dovuto alla presenza di un balcone in più. Più ragionevolmente gli
esperti contattati hanno indicato valori compresi in un intervallo, ad esempio tra 3100 e 3300 €. Il
prezzo marginale utilizzato con buona probabilità è semplicemente la media dei valori ottenuti interrogando il campione di esperti del settore. Ma allora occorre chiedersi se è possibile studiare gli
effetti sulla stima del Valore di Mercato generati dall’incertezza nella definizione del prezzo marginale
di una caratteristica.
Ricorrendo alla simulazione Monte Carlo è possibile studiare l’incertezza di stima nel Valore di Mercato che si viene a generare partendo da valori incerti delle componenti del vettore β. Supponiamo
a titolo esemplificativo che tutte le componenti del vettore dei prezzi marginali siano affette da incertezza. In particolare si ipotizzi che i valori puntuali del vettore β siano sostituiti da variabili casuali
secondo quanto indicato in Tabella 4.
I prezzi marginali delle caratteristiche Superficie e Anno di Costruzione sono stati ottenuti da un’analisi di regressione. Per questo motivo ad essi è stata assegnata una distribuzione gaussiana (normale) avente come valore medio quello utilizzato in precedenza come valore puntuale, e come deviazione standard il valore di Standard Error di Tabella 2. L’incertezza nell’assegnazione dei prezzi
marginali delle restanti caratteristiche si è ipotizzato possa essere descritta mediante delle variabili
casuali uniformi. Gli estremi delle variabili casuali uniformi sono stati scelti a caso. L’obiettivo di queste righe è, infatti, quello di mostrare la facilità con la quale si può gestire esplicitamente l’incertezza
presente in una procedura di SCA. Non è invece compito di queste righe di discutere il metodo più
corretto per rappresentare l’incertezza nell’assegnazione dei prezzi marginali (si auspica tuttavia un
approfondimento di tale argomento).
Trasformate in variabili casuali le componenti del vettore β la simulazione Monte Carlo consiste nel
ripetere la procedura di stima del Valore di Mercato per un numero desiderato di volte (nel nostro
caso 10000). In ciascuna di queste iterazioni si provvede ad estrarre casualmente dei prezzi marginali dalle distribuzioni indicate in Tabella 4. Il risultato che si ottiene dall’applicazione della simulazione Monte Carlo è un insieme di 10000 stime del Valore di Mercato. L’Illustrazione 4 contiene una
rappresentazione grafica della distribuzione empirica di questo insieme di realizzazioni.
4 e -0 4
Proposte per lo studio dell’incertezza di stima
77
0e+00
La stima del Valore di Mercato così ottenuta è da preferirsi a quella ricavata mediante un vettore
pesi uniforme. Infatti, gli effetti negativi dovuti al secondo elemento del campione estimativo (vedi
Illustrazione 3) risultano smorzati dal valore del peso utilizzato: 0.072 a fronte del precedente ¼.
Si sottolinea infine come il vettore (32) rappresenti soltanto una delle molteplici alternative percorribili nella definizione del vettore pesi.
Densità
D e n s ity
76
68500
69000
69500
70000
70500
71000
N N= =1 10000
0 0 0 0 Bandwidth
B a n d w i d t h= 47.3
= 4 7 .3
Illustrazione
1: Funzione
di empirica
densità della
empirica
della
Stima
del Valore
dimediante
Mercatole ottenuta
Illustrazione
4 Funzione
di densità
Stima del
Valore
di Mercato
ottenuta
10000 replicazioni della
medianteMonte
le 10000
replicazioni
della simulazione
Monte 69940,
Carlo. mediana
Indici statistici:
minimo
simulazione
Carlo. Indici
statistici: minimo
68740, primo quartile
70180, media
70160, terzo quartile
70400,
massimo
71050
68740,
primo
quartile 69940, mediana 70180, media 70160, terzo quartile 70400,
massimo 71050.
La media calcolata sulle 10000 stime ottenute via Monte Carlo risulta pari a 70160 €.
Tale valore risulta prossimo al valore puntuale precedentemente ottenuto, 70202.04 €. Tuttavia ben
più interessante è notare come, grazie alla simulazione, è possibile associare alla stima puntuale anche un’indicazione dell’incertezza di stima dovuta alla procedura di assegnazione dei prezzi marginali. Per esempio si può indicare che le 10000 simulazioni hanno generato stime del Valore di Mercato
comprese tra un minimo di 68740 € e un massimo di 71050 €.
Da notare che questo non è un intervallo di fiducia.
BIBLIOGRAFIA
Hastie T., Tibshirani R., Friedman J., The Element of Statistical Learning. Data Mining, Inference and Prediction. Springer, 2001.
Isakson H. R., The Linear Algebra of the Sales Comparison Approach, Journal of Real Estate Research, 24(2), pagg117-128, 2002.