52 Interpretazione matematico-statistica dei metodi di stima diretti Gabriele Brondino† Interpretazione matematico-statistica dei metodi di stima diretti Parole chiave: metodi di stima diretti, valore di mercato, prezzo di compravendita, regressione lineare multipla, Sales Comparison Approach, Nearest Neighbors Appraisal Technique. Abstract Partendo dai presupposti dettati dai postulati estimativi dell’ordinarietà, della previsione e della comparazione, il legame tra la stima del Valore di Mercato e il Prezzo di Compravendita può essere spiegato da un punto di vista matematico. Il modello di Prezzo di Compravendita e un campione estimativo significativo sono strumenti centrali per lo sviluppo di uno dei qualsiasi metodi di stima diretti del Valore di Mercato. Obiettivo del presente studio è quello di descrivere le relazioni matematico-statistiche - nonché le difficoltà di applicazione – alla base dei metodi di stima diretti, prendendo spunto da casi studio pseudo-reali. Di seguito si prenderà quindi in considerazione un campione estimativo particolarmente numeroso e si fornirà una stima del Valore di Mercato del bene oggetto di stima attraverso la metodologia statistica nota come Regressione lineare multipla; si provvederà quindi ad applicare anche il cosiddetto Sales Comparison Approach (SCA) per stimare il Valore di Mercato nel caso di un campione estimativo di bassa numerosità. Infine si valuterà l'utilità pratica e le condizioni di applicazioni di un metodo di stima noto come Nearest Neighbors Appraisal Technique (NNAT). Si consideri un appartamento di 80 m2 situato in un quartiere popolare della Città di Torino, costruito intorno agli anni ‘50, parzialmente ristrutturato, avente due arie, una cantina, ecc. Supponiamo che tale appartamento debba essere stimato. Il tecnico chiamato ad eseguire la stima dovrà innanzitutto verificare se si possa costruire un campione estimativo per poter eseguire una stima diretta del Valore di Mercato di tale appartamento. Il campione estimativo dovrà essere costituito da un certo numero di appartamenti simili a quello oggetto della stima, recentemente compravenduti e geograficamente limitrofi. Il tecnico dovrà procedere nella stima seguendo i postulati estimativi della previsione, dell’ordinarietà e della comparazione. PREZZO e VALORE di MERCATO Il Valore di Mercato di un bene immobile oggetto di stima è definito come il più probabile Prezzo di Compravendita del bene stesso. Il Prezzo di Compravendita, invece, è la quantità monetaria scambiata tra compratore e venditore durante un atto di compravendita. Dalla definizione sopra fornita, si evince come la stima del Valore di Mercato sia in qualche modo legato al Prezzo di Compravendita. Nel prosieguo si cercherà di chiarire questo legame da un punto di vista matematico. Per il momento è sufficiente sottolineare che nella pratica estimativa il Valore di Mercato si può stimare per via diretta solo se di tutti gli elementi del campione estimativo si conosce il reale Prezzo di Compravendita. La stima del Valore di Mercato eseguita per via diretta deve rispettare il postulato dell’ordinarietà. † Ricercatore in Estimo presso la Facoltà di Architettura II del Politecnico di Torino 53 Pertanto, il valore ottenuto non deve coincidere esattamente con il Prezzo effettivo che verrà scambiato tra le parti, quanto piuttosto con il Prezzo più probabile! Ovvero con quello che in un mercato perfetto verrebbe a formarsi e che la maggioranza dei tecnici stimerebbe. D’altra parte la stima del Valore di Mercato deve soddisfare anche il postulato della previsione. Pertanto la stima del Valore di Mercato non deve discostarsi molto dal Prezzo reale di Compravendita che si andrà a realizzare dopo l’avvenuta stima. E’ evidente come i due postulati risultino almeno apparentemente in contraddizione. Vedremo come dal punto di vista statistico si supera questo ostacolo. Tutti i metodi di stima diretta del Valore di Mercato di un bene (Sales Comparison Approach, Regressione, Stima monoparametrica diretta, ecc.) possono essere definiti attraverso l’introduzione di modelli matematici o statistici. In tal modo si possono cogliere similitudini, differenze, limiti e vantaggi dei singoli metodi. Il MODELLO del VALORE di MERCATO Ritorniamo al caso dell’appartamento di 80 m2. Compito del tecnico è fornire una stima del suo Valore di Mercato. Per fare ciò occorre che il tecnico si chieda quali siano le caratteristiche (o variabili) che definiscono il Valore di Mercato dell’appartamento oggetto della stima. Lungi dal pretendere di redigere un elenco completo, possiamo tentare di individuare alcune delle caratteristiche capaci di influire sulla formazione del Valore di Mercato dell’appartamento: • coordinate geografiche dell’appartamento • grado di sicurezza del vicinato • servizi presenti nelle vicinanze dell’appartamento • superficie commerciale • anno di costruzione • stato di conservazione dell’appartamento • stato di conservazione del fabbricato • numero di arie • presenza di cantina • dinamicità del mercato immobiliare • tassi di interesse per l’accensione di mutui • indici sulle prospettive future dell’economia • ... Le caratteristiche elencate (e quelle non elencate) possono essere raggruppate in diversi modi. Ad esempio si può convenire con il fatto che alcune di esse facciano riferimento all’ubicazione (posizione geografica, vicinato, ...), altre alle caratteristiche tecniche dell’abitazione (superficie, anno di costruzione, ...), altre ancora si concentrino sugli andamenti economici e finanziari locali e globali (dinamicità del mercato immobiliare, tassi, indici, ...). Alcune caratteristiche sono facilmente rilevabili (es. numero di arie), altre sono di più difficile rilevazione (es. grado di sicurezza del vicinato). Vi sono caratteristiche che possono essere rilevate senza errori (es. numero di arie) ma anche caratteristiche che nella rilevazione possono dare origine ad errori di misura (es. anno di costruzione). Le caratteristiche possono poi essere suddivise in quantitative (es. superficie), perché le informazioni raccolte sono numeri, e caratteristiche qualitative (es. stato di conservazione dell’abitazione), perché i dati rilevati sono delle categorie e non dei numeri. Si supponga di essere in grado di rilevare per il bene oggetto di stima tutti i valori delle caratteristiche che determinano il suo Valore di Mercato (che indicheremo con VM0). Ad esempio, si supponga che le coordinate geografiche dell’appartamento siano x01=7.1403 (latitudine) e x02=45.0456 (longitudine). Allo stesso modo si convenga che il grado di sicurezza del vicinato sia descrivibile come x03=”Buono”, e così via per le altre caratteristiche. Dal punto di vista matematico è semplice supporre che VM0 sia una funzione (complessa sin che si vuole) delle caratteristiche che ne determinano il valore, ovvero che VM0 = h0(x01, x02,…) (1) 52 Interpretazione matematico-statistica dei metodi di stima diretti Gabriele Brondino† Interpretazione matematico-statistica dei metodi di stima diretti Parole chiave: metodi di stima diretti, valore di mercato, prezzo di compravendita, regressione lineare multipla, Sales Comparison Approach, Nearest Neighbors Appraisal Technique. Abstract Partendo dai presupposti dettati dai postulati estimativi dell’ordinarietà, della previsione e della comparazione, il legame tra la stima del Valore di Mercato e il Prezzo di Compravendita può essere spiegato da un punto di vista matematico. Il modello di Prezzo di Compravendita e un campione estimativo significativo sono strumenti centrali per lo sviluppo di uno dei qualsiasi metodi di stima diretti del Valore di Mercato. Obiettivo del presente studio è quello di descrivere le relazioni matematico-statistiche - nonché le difficoltà di applicazione – alla base dei metodi di stima diretti, prendendo spunto da casi studio pseudo-reali. Di seguito si prenderà quindi in considerazione un campione estimativo particolarmente numeroso e si fornirà una stima del Valore di Mercato del bene oggetto di stima attraverso la metodologia statistica nota come Regressione lineare multipla; si provvederà quindi ad applicare anche il cosiddetto Sales Comparison Approach (SCA) per stimare il Valore di Mercato nel caso di un campione estimativo di bassa numerosità. Infine si valuterà l'utilità pratica e le condizioni di applicazioni di un metodo di stima noto come Nearest Neighbors Appraisal Technique (NNAT). Si consideri un appartamento di 80 m2 situato in un quartiere popolare della Città di Torino, costruito intorno agli anni ‘50, parzialmente ristrutturato, avente due arie, una cantina, ecc. Supponiamo che tale appartamento debba essere stimato. Il tecnico chiamato ad eseguire la stima dovrà innanzitutto verificare se si possa costruire un campione estimativo per poter eseguire una stima diretta del Valore di Mercato di tale appartamento. Il campione estimativo dovrà essere costituito da un certo numero di appartamenti simili a quello oggetto della stima, recentemente compravenduti e geograficamente limitrofi. Il tecnico dovrà procedere nella stima seguendo i postulati estimativi della previsione, dell’ordinarietà e della comparazione. PREZZO e VALORE di MERCATO Il Valore di Mercato di un bene immobile oggetto di stima è definito come il più probabile Prezzo di Compravendita del bene stesso. Il Prezzo di Compravendita, invece, è la quantità monetaria scambiata tra compratore e venditore durante un atto di compravendita. Dalla definizione sopra fornita, si evince come la stima del Valore di Mercato sia in qualche modo legato al Prezzo di Compravendita. Nel prosieguo si cercherà di chiarire questo legame da un punto di vista matematico. Per il momento è sufficiente sottolineare che nella pratica estimativa il Valore di Mercato si può stimare per via diretta solo se di tutti gli elementi del campione estimativo si conosce il reale Prezzo di Compravendita. La stima del Valore di Mercato eseguita per via diretta deve rispettare il postulato dell’ordinarietà. † Ricercatore in Estimo presso la Facoltà di Architettura II del Politecnico di Torino 53 Pertanto, il valore ottenuto non deve coincidere esattamente con il Prezzo effettivo che verrà scambiato tra le parti, quanto piuttosto con il Prezzo più probabile! Ovvero con quello che in un mercato perfetto verrebbe a formarsi e che la maggioranza dei tecnici stimerebbe. D’altra parte la stima del Valore di Mercato deve soddisfare anche il postulato della previsione. Pertanto la stima del Valore di Mercato non deve discostarsi molto dal Prezzo reale di Compravendita che si andrà a realizzare dopo l’avvenuta stima. E’ evidente come i due postulati risultino almeno apparentemente in contraddizione. Vedremo come dal punto di vista statistico si supera questo ostacolo. Tutti i metodi di stima diretta del Valore di Mercato di un bene (Sales Comparison Approach, Regressione, Stima monoparametrica diretta, ecc.) possono essere definiti attraverso l’introduzione di modelli matematici o statistici. In tal modo si possono cogliere similitudini, differenze, limiti e vantaggi dei singoli metodi. Il MODELLO del VALORE di MERCATO Ritorniamo al caso dell’appartamento di 80 m2. Compito del tecnico è fornire una stima del suo Valore di Mercato. Per fare ciò occorre che il tecnico si chieda quali siano le caratteristiche (o variabili) che definiscono il Valore di Mercato dell’appartamento oggetto della stima. Lungi dal pretendere di redigere un elenco completo, possiamo tentare di individuare alcune delle caratteristiche capaci di influire sulla formazione del Valore di Mercato dell’appartamento: • coordinate geografiche dell’appartamento • grado di sicurezza del vicinato • servizi presenti nelle vicinanze dell’appartamento • superficie commerciale • anno di costruzione • stato di conservazione dell’appartamento • stato di conservazione del fabbricato • numero di arie • presenza di cantina • dinamicità del mercato immobiliare • tassi di interesse per l’accensione di mutui • indici sulle prospettive future dell’economia • ... Le caratteristiche elencate (e quelle non elencate) possono essere raggruppate in diversi modi. Ad esempio si può convenire con il fatto che alcune di esse facciano riferimento all’ubicazione (posizione geografica, vicinato, ...), altre alle caratteristiche tecniche dell’abitazione (superficie, anno di costruzione, ...), altre ancora si concentrino sugli andamenti economici e finanziari locali e globali (dinamicità del mercato immobiliare, tassi, indici, ...). Alcune caratteristiche sono facilmente rilevabili (es. numero di arie), altre sono di più difficile rilevazione (es. grado di sicurezza del vicinato). Vi sono caratteristiche che possono essere rilevate senza errori (es. numero di arie) ma anche caratteristiche che nella rilevazione possono dare origine ad errori di misura (es. anno di costruzione). Le caratteristiche possono poi essere suddivise in quantitative (es. superficie), perché le informazioni raccolte sono numeri, e caratteristiche qualitative (es. stato di conservazione dell’abitazione), perché i dati rilevati sono delle categorie e non dei numeri. Si supponga di essere in grado di rilevare per il bene oggetto di stima tutti i valori delle caratteristiche che determinano il suo Valore di Mercato (che indicheremo con VM0). Ad esempio, si supponga che le coordinate geografiche dell’appartamento siano x01=7.1403 (latitudine) e x02=45.0456 (longitudine). Allo stesso modo si convenga che il grado di sicurezza del vicinato sia descrivibile come x03=”Buono”, e così via per le altre caratteristiche. Dal punto di vista matematico è semplice supporre che VM0 sia una funzione (complessa sin che si vuole) delle caratteristiche che ne determinano il valore, ovvero che VM0 = h0(x01, x02,…) (1) 54 Interpretazione matematico-statistica dei metodi di stima diretti Gabriele Brondino Se oltre ai valori delle caratteristiche x0j (j=1,2,...) si conoscesse anche il valore della funzione h0 non vi sarebbero grossi problemi e la stima sarebbe una questione molto semplice. Purtroppo la realtà è ben più complessa. Il MODELLO del PREZZO di COMPRAVENDITA Che il Prezzo di Compravendita di un bene immobile sia in qualche modo legato al Valore di Mercato è scontato. Non a caso il postulato della previsione richiede che il tecnico fornisca un giudizio di valore capace di avvicinarsi al Prezzo reale di Compravendita che si potrebbe realizzare nel mercato (previsione). D’altra parte quasi mai il Valore di Mercato risultante da una perizia estimativa coincide esattamente con il Prezzo reale di Compravendita del bene stimato. Come spiegare questa (a volte anche notevole) differenza? Innanzitutto occorre chiedersi da dove proviene questa diversità. Se il mercato immobiliare fosse perfetto, infatti, la differenza tenderebbe ad annullarsi. In un mercato perfetto venditori e compratori sarebbero numerosi, guidati dalla razionalità, completamente informati sull’andamento del mercato, ecc. Non è difficile concludere che la compravendita di un bene immobile raramente soddisfa queste condizioni. Ad esempio i venditori spesso non prendono la decisione di vendita seguendo i criteri razionali (si pensi ad esempio al caso in cui una persona debba vendere un alloggio per esigenze economiche). Allo stesso modo i compratori possono trovarsi meno informati sul mercato che un venditore istituzionale, come ad esempio un costruttore edile. In un atto di compravendita di un immobile non è difficile trovare molte imperfezioni del mercato. Ovvero è comune trovare caratteristiche che influiscono nella formazione del Prezzo ma non nella formazione del Valore di Mercato (es. l’urgenza per un venditore di cedere il proprio bene immobile). Per questo motivo è ragionevole supporre che tra Prezzo e Valore di Mercato sussista la seguente relazione P0 = VM0 + δ0 = h0(x01,x02,…) + δ0 (2) essendo P0 il Prezzo di Compravendita del bene e δ0 la differenza dovuta alle variabili che non influiscono nella determinazione del Valore di Mercato ma soltanto nella formazione del Prezzo (es. condizioni economiche del venditore). Prima di proseguire occorre approfondire ulteriormente il discorso sul termine δ0. Matematicamente esso va considerato come una variabile casuale. Tale affermazione trova una giustificazione nella definizione che l’Estimo dà del Valore di Mercato: il più probabile Prezzo di Compravendita. Infatti se δ0 è una variabile casuale, allora la definizione di Prezzo si traduce nell’imporre che il valore atteso della variabile sia nullo, ovvero che E(δ0) = 0 (3) Il legame tra Prezzo e Valore di Mercato descritto dalla (2) consente di spiegare (molto genericamente) la formazione del Prezzo di Compravendita, ma soprattutto consente di trovare la strada con cui giungere ad una stima del Valore di Mercato (obiettivo di ogni procedura di stima diretta). Per concretizzare quanto sopra definito matematicamente, supponiamo che l’appartamento di 80 m2 abbia un Valore di Mercato pari a 180000 €. Esigenze economiche da parte del venditore potrebbero indurlo a venderlo ad un Prezzo di soli 150000 €. La differenza, pari a 30000 €, sarebbe una delle possibili realizzazioni della variabile casuale δ0. 55 SEMPLIFICAZIONI del MODELLO del VALORE di MERCATO Per determinare il Valore di Mercato per via diretta la disciplina estimativa impone che venga raccolto un campione estimativo di beni simili a quello oggetto di stima. Per ciascuno degli n beni che costituiscono il campione estimativo si rilevano il Prezzo di Compravendita e il valore di ciascuna delle caratteristiche che influenzano la formazione di VM0 Pi , xi1, xi2 , …. ∀ i ∈ {1, 2, …, n} ⊆ I0 (4) Per I0 si intende l’insieme di beni simili al bene oggetto di stima. I metodi di stima diretta utilizzano i dati raccolti sul campione estimativo per giungere ad una stima del Valore di Mercato. Alcuni di questi metodi ipotizzano la forma della funzione h0 che lega le caratteristiche influenti su VM0. Altri metodi giungono ad una stima della funzione attraverso l’utilizzo dei dati campionari. In entrambe è però necessario introdurre alcune semplificazioni al modello del Valore di Mercato definito dall’equazione (1). Prima Semplificazione: Beni Simili Chi e come può aiutarci a definire la funzione h0 capace di consentirci di determinare VM0? Purtroppo nessuno è in grado di definire con precisione tale funzione. Per cercare di superare questo primo ostacolo occorre fare uso del postulato estimativo alla base dei metodi di stima diretti, quello della comparazione. La traduzione matematica di questo postulato è la seguente VMi = h(xi1, xi2, …) per ∀ i ∈ {0, 1, 2, …, n} (5) In pratica si suppone che il Valore di Mercato dei beni simili (qui indicati con l’indice i) a quello oggetto di stima sia una funzione h delle rispettive caratteristiche. Per i beni simili si suppone che la formazione del Valore di Mercato segua la medesima legge di quella che genera il VM0 (ovvero la funzione h). Generalmente per beni simili si intende che i beni abbiano valori delle caratteristiche solo in parte differenti dai corrispettivi valori rilevati per il bene oggetto di stima, ovvero che esista almeno una caratteristica j per cui x0j = xij per qualsiasi bene i, e che tendenzialmente abbiano valori in gran parte uguali a quelli assunti dal bene oggetto di stima. Una definizione matematica più rigorosa di similarità può essere fornita ricorrendo ai cosiddetti indici di similarità di cui si farà cenno successivamente. Nella comune pratica estimativa la posizione geografica dell’appartamento viene gestita ricorrendo al concetto di similarità. Ovvero si prendono in considerazione soltanto appartamenti ubicati nelle vicinanze di quello oggetto di stima e compravenduti di recente. Ovviamente una tale strategia implica che il concetto di vicinanza venga ulteriormente chiarito. In genere tale chiarimento si basa sulla conoscenza che il tecnico ha del mercato nel quale si trova il bene oggetto di stima. In termini più semplici, è il tecnico a decidere che, nel campione estimativo, possono rientrare solo gli appartamenti che si trovano ad una distanza inferiore ai 500 m da quello oggetto di stima. Esistono ovviamente dei metodi più formali per definire il concetto di vicinanza. Essi fanno riferimento a metodi statistici che consentono di ottenere in modo automatico la distanza capace di determinare il campione estimativo. Il recente sviluppo delle tecnologie che consentono la georeferenziazione degli immobili sta favorendo l’adozione di modelli matematici in grado di gestire esplicitamente le caratteristiche geografiche dei beni. Tali modelli sono una valida alternativa alla soluzione che prevede di considerare nel campione estimativo solo gli appartamenti vicini a quello oggetto di stima. Tuttavia i modelli spaziali richiedono una grande quantità di dati georeferiti, software statistici opportuni e buone conoscenze statistiche. Tutti elementi che non favoriscono l’adozione di queste metodologie nella pratica estimativa. Nonostante i promettenti risultati che ci si attende dai modelli spaziali, nelle pagine successive si gestirà la componente geografica dei beni immobili ricorrendo al concetto di vicinanza in precedenza descritto. 54 Interpretazione matematico-statistica dei metodi di stima diretti Gabriele Brondino Se oltre ai valori delle caratteristiche x0j (j=1,2,...) si conoscesse anche il valore della funzione h0 non vi sarebbero grossi problemi e la stima sarebbe una questione molto semplice. Purtroppo la realtà è ben più complessa. Il MODELLO del PREZZO di COMPRAVENDITA Che il Prezzo di Compravendita di un bene immobile sia in qualche modo legato al Valore di Mercato è scontato. Non a caso il postulato della previsione richiede che il tecnico fornisca un giudizio di valore capace di avvicinarsi al Prezzo reale di Compravendita che si potrebbe realizzare nel mercato (previsione). D’altra parte quasi mai il Valore di Mercato risultante da una perizia estimativa coincide esattamente con il Prezzo reale di Compravendita del bene stimato. Come spiegare questa (a volte anche notevole) differenza? Innanzitutto occorre chiedersi da dove proviene questa diversità. Se il mercato immobiliare fosse perfetto, infatti, la differenza tenderebbe ad annullarsi. In un mercato perfetto venditori e compratori sarebbero numerosi, guidati dalla razionalità, completamente informati sull’andamento del mercato, ecc. Non è difficile concludere che la compravendita di un bene immobile raramente soddisfa queste condizioni. Ad esempio i venditori spesso non prendono la decisione di vendita seguendo i criteri razionali (si pensi ad esempio al caso in cui una persona debba vendere un alloggio per esigenze economiche). Allo stesso modo i compratori possono trovarsi meno informati sul mercato che un venditore istituzionale, come ad esempio un costruttore edile. In un atto di compravendita di un immobile non è difficile trovare molte imperfezioni del mercato. Ovvero è comune trovare caratteristiche che influiscono nella formazione del Prezzo ma non nella formazione del Valore di Mercato (es. l’urgenza per un venditore di cedere il proprio bene immobile). Per questo motivo è ragionevole supporre che tra Prezzo e Valore di Mercato sussista la seguente relazione P0 = VM0 + δ0 = h0(x01,x02,…) + δ0 (2) essendo P0 il Prezzo di Compravendita del bene e δ0 la differenza dovuta alle variabili che non influiscono nella determinazione del Valore di Mercato ma soltanto nella formazione del Prezzo (es. condizioni economiche del venditore). Prima di proseguire occorre approfondire ulteriormente il discorso sul termine δ0. Matematicamente esso va considerato come una variabile casuale. Tale affermazione trova una giustificazione nella definizione che l’Estimo dà del Valore di Mercato: il più probabile Prezzo di Compravendita. Infatti se δ0 è una variabile casuale, allora la definizione di Prezzo si traduce nell’imporre che il valore atteso della variabile sia nullo, ovvero che E(δ0) = 0 (3) Il legame tra Prezzo e Valore di Mercato descritto dalla (2) consente di spiegare (molto genericamente) la formazione del Prezzo di Compravendita, ma soprattutto consente di trovare la strada con cui giungere ad una stima del Valore di Mercato (obiettivo di ogni procedura di stima diretta). Per concretizzare quanto sopra definito matematicamente, supponiamo che l’appartamento di 80 m2 abbia un Valore di Mercato pari a 180000 €. Esigenze economiche da parte del venditore potrebbero indurlo a venderlo ad un Prezzo di soli 150000 €. La differenza, pari a 30000 €, sarebbe una delle possibili realizzazioni della variabile casuale δ0. 55 SEMPLIFICAZIONI del MODELLO del VALORE di MERCATO Per determinare il Valore di Mercato per via diretta la disciplina estimativa impone che venga raccolto un campione estimativo di beni simili a quello oggetto di stima. Per ciascuno degli n beni che costituiscono il campione estimativo si rilevano il Prezzo di Compravendita e il valore di ciascuna delle caratteristiche che influenzano la formazione di VM0 Pi , xi1, xi2 , …. ∀ i ∈ {1, 2, …, n} ⊆ I0 (4) Per I0 si intende l’insieme di beni simili al bene oggetto di stima. I metodi di stima diretta utilizzano i dati raccolti sul campione estimativo per giungere ad una stima del Valore di Mercato. Alcuni di questi metodi ipotizzano la forma della funzione h0 che lega le caratteristiche influenti su VM0. Altri metodi giungono ad una stima della funzione attraverso l’utilizzo dei dati campionari. In entrambe è però necessario introdurre alcune semplificazioni al modello del Valore di Mercato definito dall’equazione (1). Prima Semplificazione: Beni Simili Chi e come può aiutarci a definire la funzione h0 capace di consentirci di determinare VM0? Purtroppo nessuno è in grado di definire con precisione tale funzione. Per cercare di superare questo primo ostacolo occorre fare uso del postulato estimativo alla base dei metodi di stima diretti, quello della comparazione. La traduzione matematica di questo postulato è la seguente VMi = h(xi1, xi2, …) per ∀ i ∈ {0, 1, 2, …, n} (5) In pratica si suppone che il Valore di Mercato dei beni simili (qui indicati con l’indice i) a quello oggetto di stima sia una funzione h delle rispettive caratteristiche. Per i beni simili si suppone che la formazione del Valore di Mercato segua la medesima legge di quella che genera il VM0 (ovvero la funzione h). Generalmente per beni simili si intende che i beni abbiano valori delle caratteristiche solo in parte differenti dai corrispettivi valori rilevati per il bene oggetto di stima, ovvero che esista almeno una caratteristica j per cui x0j = xij per qualsiasi bene i, e che tendenzialmente abbiano valori in gran parte uguali a quelli assunti dal bene oggetto di stima. Una definizione matematica più rigorosa di similarità può essere fornita ricorrendo ai cosiddetti indici di similarità di cui si farà cenno successivamente. Nella comune pratica estimativa la posizione geografica dell’appartamento viene gestita ricorrendo al concetto di similarità. Ovvero si prendono in considerazione soltanto appartamenti ubicati nelle vicinanze di quello oggetto di stima e compravenduti di recente. Ovviamente una tale strategia implica che il concetto di vicinanza venga ulteriormente chiarito. In genere tale chiarimento si basa sulla conoscenza che il tecnico ha del mercato nel quale si trova il bene oggetto di stima. In termini più semplici, è il tecnico a decidere che, nel campione estimativo, possono rientrare solo gli appartamenti che si trovano ad una distanza inferiore ai 500 m da quello oggetto di stima. Esistono ovviamente dei metodi più formali per definire il concetto di vicinanza. Essi fanno riferimento a metodi statistici che consentono di ottenere in modo automatico la distanza capace di determinare il campione estimativo. Il recente sviluppo delle tecnologie che consentono la georeferenziazione degli immobili sta favorendo l’adozione di modelli matematici in grado di gestire esplicitamente le caratteristiche geografiche dei beni. Tali modelli sono una valida alternativa alla soluzione che prevede di considerare nel campione estimativo solo gli appartamenti vicini a quello oggetto di stima. Tuttavia i modelli spaziali richiedono una grande quantità di dati georeferiti, software statistici opportuni e buone conoscenze statistiche. Tutti elementi che non favoriscono l’adozione di queste metodologie nella pratica estimativa. Nonostante i promettenti risultati che ci si attende dai modelli spaziali, nelle pagine successive si gestirà la componente geografica dei beni immobili ricorrendo al concetto di vicinanza in precedenza descritto. 56 Interpretazione matematico-statistica dei metodi di stima diretti Gabriele Brondino Partendo dal postulato della comparazione è dunque possibile supporre che esista un’unica funzione h capace di determinare il Valore di Mercato di un gruppo di beni simili, pertanto si può con ragionevolezza ridefinire VM0 come VM0 ≡ h(x01, x02, …) (6) L’introduzione di questa prima semplificazione consente di riformulare la domanda da cui si è partiti: chi e come può aiutarci a definire la funzione h (e non più h0) capace di consentirci di determinare VM0? Questo piccolo cambiamento consentirà di superare l’ostacolo. Ma per sapere come fare è necessario pazientare ancora un attimo. Prima, infatti, è necessario prendere coscienza della necessità di introdurre un’ulteriore semplificazione. Seconda Semplificazione: Caratteristiche Incognite o Non Misurabili La correttezza matematica del modello introdotto si scontra con la difficile realtà della pratica estimativa. Non è infatti scontato che le caratteristiche influenti il Valore di Mercato siano rilevabili o che sia semplice identificare tutte le caratteristiche in grado di influire su VM0. Ad esempio può capitare che una caratteristica come “la distanza dai complessi scolastici” non sia considerata influente nella determinazione del Valore di Mercato e pertanto non venga rilevata. Ma questo non è detto che sia vero. Più spesso capita che la caratteristica sia considerata influente sul Valore di Mercato ma che risulti impossibile (o troppo costoso) rilevare i dati. Ad esempio la caratteristica “grado di sicurezza del vicinato” può essere difficile da misurare (a differenza di quanto capita negli Stati Uniti). Vi possono inoltre essere variabili facili da rilevare (es. presenza di cantina) ma di cui non si possiede l’informazione per alcuni elementi del campione. In tal caso se la caratteristica non è considerata di fondamentale importanza nella formazione del Valore di Mercato si può pensare di non prenderla in considerazione. Indipendentemente dal fatto che una o più caratteristiche siano incognite, non rilevabili o non rilevate, dal punto di vista matematico occorre apportare una modifica alle formule (5) e (6) che definiscono il Valore di Mercato del bene oggetto di stima e dei beni ad esso simili VMi = hR (xi1, xi2, …, xiJ) + ηi ∀ i ∈ {0, 1, 2, …, n} funzione dei valori rilevati x01, x02, ..., x0J. Giunti a questo punto, dopo aver introdotto due semplificazioni del modello che definisce il Valore di Mercato e raccolto i dati sulle J caratteristiche del bene oggetto di stima, ci si aspetterebbe che la stima di VM0 sia ormai cosa fatta. Purtroppo non è così, anzi finora si sono semplicemente evidenziate le approssimazioni e gli errori che si introducono nella stima del Valore di Mercato. La funzione hR, infatti, non è ancora nota (... e ahimè non lo sarà mai!). Terza Semplificazione: la Forma della funzione hR Nell’introduzione di questa sezione si è detto come i metodi di stima diretta si dividono in due gruppi: quelli che ipotizzano la forma della funzione hR (allora si era parlato di h0) e quelli che giungono alla stima di hR partendo dai dati campionari raccolti. In entrambi i casi però il rischio di commettere un errore è molto forte. Se si ipotizza, ad esempio, che il Valore di Mercato per l’appartamento di 80 m2 da noi considerato in precedenza e per gli appartamenti ad esso simili dipenda dalla caratteristica Superficie in modo lineare, ovvero che VMi =...+ βj Superficieij + ηi ∀ i ∈ {0, 1, 2, …, n} non è detto che tale ipotesi sia errata e che invece la vera funzione del Valore di Mercato sia la più complessa VMi = … + βj Superficieij +βj+1 I(Superficiei(j+1) > 75) + hi ∀ i ∈ {0, 1, 2, …, n} Non si vuole qui entrare nei dettagli delle formule sopra indicate. Esse rappresentano soltanto un esempio di come nella definizione della funzione del Valore di Mercato vi possano essere degli errori di forma quando si fanno delle ipotesi. Un discorso del tutto analogo si può fare per quei metodi, come ad esempio la regressione, per i quali sono previste procedure (di selezione del modello) capaci di individuare in maniera autonoma la forma della funzione che meglio si adatta ai dati campionari raccolti. Pertanto da quanto esposto risulta indispensabile apportare un’ulteriore modifica alla formula (7) del Valore di Mercato (7) In questa nuova definizione il Valore di Mercato è la somma del valore assunto dalla funzione h ristretta (hR), ovvero valutata sulle sole caratteristiche rilevate, e di un termine di errore (ηi). La formula (7) esprime in forma matematica un concetto molto semplice: se nella definizione del Valore di Mercato si dimenticano, non si rilevano o non si possono rilevare alcune caratteristiche, allora si introduce un errore che, genericamente, indichiamo con il termine ηi. Tale errore risulta di dimensioni trascurabili se le caratteristiche escluse, ovvero quelle avente un indice superiore a J, sono tali da non modificare in modo significativo il Valore di Mercato. In questo caso allora VMi ≈ hR (xi1, xi2, …, xiJ) ∀ i ∈ {0, 1, 2, …, n} 57 (8) Può capitare tuttavia che questa approssimazione non sia ragionevole. Ovvero che gli errori ηi non siano trascurabili. Purtroppo in questo caso gli strumenti matematici non possono fare molto. Al massimo si può cercare di sostituire le caratteristiche mancanti con altre che siano con esse positivamente correlate. Se non si può percorrere questa strada dal punto di vista matematico si dovrebbe interrompere il procedimento di stima. Ma la pratica estimativa richiede comunque la stima di un Valore e l’errore η0 viene compensato con metodi non matematici. Prima di proseguire cerchiamo di riassumere quanto fino ad ora ottenuto. Supponendo di prendere in considerazione un insieme di beni simili a quello oggetto di stima e selezionando le J caratteristiche che influiscono nella determinazione di VM0 , il Valore di Mercato è definito da (8) come una VMi = f(xi1, xi2, …, xiJ) + νi + ηi ∀ i ∈ {0, 1, 2, …, n} (9) dove νi è l’errore dovuto alla non corretta definizione della forma della funzione hR. Fortunatamente la formula (9) non deve essere ulteriormente semplificata. Essa rappresenta il modello matematico del Valore di Mercato da cui partire per la stima di VM0. Prima di proseguire, tuttavia, è necessario chiedersi quali effetti sulla stima di VM0 possono avere gli errori ηi e νi. A tal proposito dal punto di vista matematico possono presentarsi tre casi: (a) gli errori sono nulli o trascurabili: νi ≈ 0, ηi ≈ 0; (b) gli errori non sono trascurabili ma hanno un andamento casuale, ovvero sono delle variabili casuali gaussiane con valore atteso nullo: νi ~ N(0, σν), ηi ~ N(0, ση); (c) gli errori non sono trascurabili e non hanno un andamento casuale, ovvero non sono distribuiti come delle gaussiane. Quando gli errori sono del tipo (a) o (b) gli effetti sulla stima di VM0 non sono generalmente trascurabili ma possono essere comunque gestiti da molti metodi di stima. Diverso è il caso in cui gli errori siano del tipo (c), in tal caso si dovrebbe interrompere la procedura di stima o comunque si dovrebbero apportare delle correzioni ai risultati ottenuti. Ma per apportare delle correzioni si dovrebbero conoscere le entità di tali errori attraverso l’esecuzione di studi su campioni di grandi dimensioni (per poter valutare l’errore di forma) eseguiti attraverso la rilevazione di un gran numero di caratteristiche (per valutare l’errore dovuto alle 56 Interpretazione matematico-statistica dei metodi di stima diretti Gabriele Brondino Partendo dal postulato della comparazione è dunque possibile supporre che esista un’unica funzione h capace di determinare il Valore di Mercato di un gruppo di beni simili, pertanto si può con ragionevolezza ridefinire VM0 come VM0 ≡ h(x01, x02, …) (6) L’introduzione di questa prima semplificazione consente di riformulare la domanda da cui si è partiti: chi e come può aiutarci a definire la funzione h (e non più h0) capace di consentirci di determinare VM0? Questo piccolo cambiamento consentirà di superare l’ostacolo. Ma per sapere come fare è necessario pazientare ancora un attimo. Prima, infatti, è necessario prendere coscienza della necessità di introdurre un’ulteriore semplificazione. Seconda Semplificazione: Caratteristiche Incognite o Non Misurabili La correttezza matematica del modello introdotto si scontra con la difficile realtà della pratica estimativa. Non è infatti scontato che le caratteristiche influenti il Valore di Mercato siano rilevabili o che sia semplice identificare tutte le caratteristiche in grado di influire su VM0. Ad esempio può capitare che una caratteristica come “la distanza dai complessi scolastici” non sia considerata influente nella determinazione del Valore di Mercato e pertanto non venga rilevata. Ma questo non è detto che sia vero. Più spesso capita che la caratteristica sia considerata influente sul Valore di Mercato ma che risulti impossibile (o troppo costoso) rilevare i dati. Ad esempio la caratteristica “grado di sicurezza del vicinato” può essere difficile da misurare (a differenza di quanto capita negli Stati Uniti). Vi possono inoltre essere variabili facili da rilevare (es. presenza di cantina) ma di cui non si possiede l’informazione per alcuni elementi del campione. In tal caso se la caratteristica non è considerata di fondamentale importanza nella formazione del Valore di Mercato si può pensare di non prenderla in considerazione. Indipendentemente dal fatto che una o più caratteristiche siano incognite, non rilevabili o non rilevate, dal punto di vista matematico occorre apportare una modifica alle formule (5) e (6) che definiscono il Valore di Mercato del bene oggetto di stima e dei beni ad esso simili VMi = hR (xi1, xi2, …, xiJ) + ηi ∀ i ∈ {0, 1, 2, …, n} funzione dei valori rilevati x01, x02, ..., x0J. Giunti a questo punto, dopo aver introdotto due semplificazioni del modello che definisce il Valore di Mercato e raccolto i dati sulle J caratteristiche del bene oggetto di stima, ci si aspetterebbe che la stima di VM0 sia ormai cosa fatta. Purtroppo non è così, anzi finora si sono semplicemente evidenziate le approssimazioni e gli errori che si introducono nella stima del Valore di Mercato. La funzione hR, infatti, non è ancora nota (... e ahimè non lo sarà mai!). Terza Semplificazione: la Forma della funzione hR Nell’introduzione di questa sezione si è detto come i metodi di stima diretta si dividono in due gruppi: quelli che ipotizzano la forma della funzione hR (allora si era parlato di h0) e quelli che giungono alla stima di hR partendo dai dati campionari raccolti. In entrambi i casi però il rischio di commettere un errore è molto forte. Se si ipotizza, ad esempio, che il Valore di Mercato per l’appartamento di 80 m2 da noi considerato in precedenza e per gli appartamenti ad esso simili dipenda dalla caratteristica Superficie in modo lineare, ovvero che VMi =...+ βj Superficieij + ηi ∀ i ∈ {0, 1, 2, …, n} non è detto che tale ipotesi sia errata e che invece la vera funzione del Valore di Mercato sia la più complessa VMi = … + βj Superficieij +βj+1 I(Superficiei(j+1) > 75) + hi ∀ i ∈ {0, 1, 2, …, n} Non si vuole qui entrare nei dettagli delle formule sopra indicate. Esse rappresentano soltanto un esempio di come nella definizione della funzione del Valore di Mercato vi possano essere degli errori di forma quando si fanno delle ipotesi. Un discorso del tutto analogo si può fare per quei metodi, come ad esempio la regressione, per i quali sono previste procedure (di selezione del modello) capaci di individuare in maniera autonoma la forma della funzione che meglio si adatta ai dati campionari raccolti. Pertanto da quanto esposto risulta indispensabile apportare un’ulteriore modifica alla formula (7) del Valore di Mercato (7) In questa nuova definizione il Valore di Mercato è la somma del valore assunto dalla funzione h ristretta (hR), ovvero valutata sulle sole caratteristiche rilevate, e di un termine di errore (ηi). La formula (7) esprime in forma matematica un concetto molto semplice: se nella definizione del Valore di Mercato si dimenticano, non si rilevano o non si possono rilevare alcune caratteristiche, allora si introduce un errore che, genericamente, indichiamo con il termine ηi. Tale errore risulta di dimensioni trascurabili se le caratteristiche escluse, ovvero quelle avente un indice superiore a J, sono tali da non modificare in modo significativo il Valore di Mercato. In questo caso allora VMi ≈ hR (xi1, xi2, …, xiJ) ∀ i ∈ {0, 1, 2, …, n} 57 (8) Può capitare tuttavia che questa approssimazione non sia ragionevole. Ovvero che gli errori ηi non siano trascurabili. Purtroppo in questo caso gli strumenti matematici non possono fare molto. Al massimo si può cercare di sostituire le caratteristiche mancanti con altre che siano con esse positivamente correlate. Se non si può percorrere questa strada dal punto di vista matematico si dovrebbe interrompere il procedimento di stima. Ma la pratica estimativa richiede comunque la stima di un Valore e l’errore η0 viene compensato con metodi non matematici. Prima di proseguire cerchiamo di riassumere quanto fino ad ora ottenuto. Supponendo di prendere in considerazione un insieme di beni simili a quello oggetto di stima e selezionando le J caratteristiche che influiscono nella determinazione di VM0 , il Valore di Mercato è definito da (8) come una VMi = f(xi1, xi2, …, xiJ) + νi + ηi ∀ i ∈ {0, 1, 2, …, n} (9) dove νi è l’errore dovuto alla non corretta definizione della forma della funzione hR. Fortunatamente la formula (9) non deve essere ulteriormente semplificata. Essa rappresenta il modello matematico del Valore di Mercato da cui partire per la stima di VM0. Prima di proseguire, tuttavia, è necessario chiedersi quali effetti sulla stima di VM0 possono avere gli errori ηi e νi. A tal proposito dal punto di vista matematico possono presentarsi tre casi: (a) gli errori sono nulli o trascurabili: νi ≈ 0, ηi ≈ 0; (b) gli errori non sono trascurabili ma hanno un andamento casuale, ovvero sono delle variabili casuali gaussiane con valore atteso nullo: νi ~ N(0, σν), ηi ~ N(0, ση); (c) gli errori non sono trascurabili e non hanno un andamento casuale, ovvero non sono distribuiti come delle gaussiane. Quando gli errori sono del tipo (a) o (b) gli effetti sulla stima di VM0 non sono generalmente trascurabili ma possono essere comunque gestiti da molti metodi di stima. Diverso è il caso in cui gli errori siano del tipo (c), in tal caso si dovrebbe interrompere la procedura di stima o comunque si dovrebbero apportare delle correzioni ai risultati ottenuti. Ma per apportare delle correzioni si dovrebbero conoscere le entità di tali errori attraverso l’esecuzione di studi su campioni di grandi dimensioni (per poter valutare l’errore di forma) eseguiti attraverso la rilevazione di un gran numero di caratteristiche (per valutare l’errore dovuto alle 58 Interpretazione matematico-statistica dei metodi di stima diretti Gabriele Brondino caratteristiche generalmente non rilevate e/o rilevabili). Purtroppo però la realtà della pratica estimativa è caratterizzata da campioni estimativi di dimensioni piccole e da una certa difficoltà di reperimento dei dati relativi ad alcune caratteristiche. Gli studi di grandi dimensioni non sono frequenti e, pertanto, non è molto facile verificare se gli errori ηi e νi siano del tipo (c). Prima di proseguire bisogna affermare con molta chiarezza che affinché la stima del Valore di Mercato del bene oggetto di stima (VM0) sia “buona” è necessario che gli errori dovuti al numero limitato di caratteristiche considerate (ηi) e quelli dettati dall’errore di forma (νi) siano del tipo (a) o (b). Se così non fosse allora tutte le procedure di stima e i relativi errori risulterebbero affetti da imprecisioni e le stime ottenute non avrebbero significato pratico. Così come un grande chef non può cucinare un grande piatto se le materie prime sono di pessima qualità, allo stesso modo un metodo statistico o estimativo per quanto teoricamente esatto non può fornire una stima di qualità in presenza di errori del tipo (c). MODIFICHE al MODELLO del PREZZO di COMPRAVENDITA Si è già detto che per giungere ad una stima del Valore di Mercato del bene oggetto di stima occorre fare uso dei Prezzi di Compravendita rilevati sui beni che costituiscono il campione estimativo. Per poter svolgere tale operazione, indipendentemente dal metodo di stima utilizzato, occorre • estendere il modello del Prezzo di Compravendita (2) a tutti gli elementi del campione estimativo (operazione assolutamente lecita e ragionevole); • sostituire nel modello (2) esteso la definizione di Valore di Mercato (9) introdotta a seguito delle semplificazioni viste in precedenza; • ipotizzare che gli errori ηi e νi siano del tipo (a) o (b), ovvero che siano trascurabili o casuali. L’esecuzione di tali operazioni algebriche consente di costruire la seguente formula: Pi = VMi + δ i = f(xi1, xi2, …, xiJ) + νi+ηi+δi ∀ i ∈ {0, 1, 2, …, n} (10) Sotto l’ipotesi che gli errori ηi e νi siano del tipo (a) o (b) la formula (10) si può ulteriormente semplificare in quella che possiamo definire come Modello della formazione del Prezzo di Compravendita: Pi = f(xi1, xi2, …, xiJ) +εi ∀ i ∈ {0, 1, 2, …, n} (11) avendo cura di definire le variabili casuali εi (aventi valore atteso 0) come somma degli errori νi, ηi e δi per qualsiasi i compreso tra 0 e n. Nel seguito verranno descritti i principali metodi di stima diretta del Valore di Mercato, ovvero gli algoritmi che consentono di giungere ad ottenere un valore numerico che indicheremo come VM0 = f (x01, x02, …, x0J) (12) essendo f la stima della funzione f del Valore di Mercato. Occorre a questo punto chiarire che nel gergo estimativo per Valore di Mercato si intende il giudizio di stima fornito dal tecnico/perito al termine della consulenza/perizia. Pertanto a rigor di logica avremmo dovuto chiamare Valore di Mercato la quantità monetaria indicata generalmente nella formula (12). Tuttavia dal punto di vista matematico l’adozione di questa convenzione avrebbe ingenerato parecchia confusione. è più corretto (matematicamente) considerare il Valore di Mercato VM0 come un valore incognito e in alcun modo non conoscibile. E definire la quantità monetaria risultante dalla procedura di stima diretta VM0 come Stima del Valore di Mercato. 59 METODI di STIMA DIRETTI del VALORE di MERCATO Il modello di Prezzo di Compravendita (11) e un campione estimativo sono gli strumenti necessari per lo sviluppo di uno dei qualsiasi metodi di stima diretti del Valore di Mercato. Di seguito prenderemo in considerazione alcuni di questi metodi cercando di descriverne i dettagli matematici e le difficoltà di applicazione, prendendo spunto da casi studio pseudo-reali. Dapprima si prenderà in considerazione un campione estimativo particolarmente numeroso e si fornirà una stima del Valore di Mercato del bene oggetto di stima attraverso la metodologia statistica nota come Regressione. Di seguito si provvederà ad applicare il cosiddetto Sales Comparison Approach (SCA) per stimare il Valore di Mercato nel caso di un campione estimativo di bassa numerosità. Infine si valuterà l’utilità pratica e le condizioni di applicazioni di un metodo di stima noto come Nearest Neighbors Appraisal Technique (NNAT). La descrizione matematica della Regressione e del SCA, con relativo confronto, seguirà lo schema e la dicitura introdotti da Isakson (2002) nell’articolo dal titolo The Linear Algebra of the Sales Comparison Approach. Si sottolinea inoltre come la Regressione sia in realtà una classe di metodi in continuo ampliamento e aggiornamento. La disponibilità di software statistici e la costruzione di banche dati delle transazioni sempre più ampie e complete inducono a pensare che nei prossimi anni questa classe di metodi verrà sempre più utilizzata in ambito estimativo. Per avere un quadro più chiaro e completo sui metodi di Regressione si rimanda al testo di Hastie ed altri (2001) dal titolo The Element of Statistical Learning. Data Mining, Inference and Prediction. Nel medesimo testo è anche possibile trovare i fondamenti teorici del metodo indicato come NNTA. REGRESSIONE LINEARE MULTIPLA Nell’ambito estimativo un ruolo importante (soprattutto in un contesto extra italiano) è costituito dalle cosiddette stime di massa (mass appraisal). Tali stime sono utilizzate principalmente in ambito fiscale consentendo di fornire una valutazione del valore di mercato di un gran numero di beni. Esistono molti metodi matematici e statistici che possono essere utilizzati per effettuare una stima di massa. Tra questi metodi la regressione lineare multipla è tra i più noti. Nonostante questo metodo non sia necessariamente il più adatto in molti dei casi pratici, esso è certamente il più semplice da comprendere e da applicare. In particolare la regressione è un metodo statistico molto noto che ormai risulta implementato in un gran numero di software. Di seguito verrà presentato un caso studio e, attraverso di esso, verrà descritto il modello di regressione lineare multipla. Il Campione Estimativo Nel caso di stime di massa il campione estimativo è costituito da un gran numero di beni compravenduti di recente sui quali si provvede a rilevare un buon numero di caratteristiche. Il metodo della regressione lineare multipla può essere utilizzato se il campione è formato da beni ubicati nelle vicinanze. Il campione estimativo di seguito analizzato consiste in una banca dati di 52 transazioni recentemente avvenute, per le quali si conoscono le informazioni relative alle seguenti caratteristiche: Prezzo, Superficie, Arie, Balconi, Cantina, Piano, Ascensore, Anno di Costruzione e Stato di Conservazione dell’unità immobiliare. Le transazioni sono avvenute in una zona geografica specifica e caratterizzata da una tipologia costruttiva economico-popolare. Si ipotizza che le caratteristiche rilevate siano quelle che influiscono nella determinazione del valore di mercato dei beni compravenduti nella zona. Tale ipotesi risulta certamente difficile da accettare. E’ più ragionevole e corretto pensare che anche altre caratteristiche influenzino la formazione del Valore di Mercato. Pertanto per ciascun bene considerato la componente di errore ηi (equazione 7) non può considerarsi nulla. Risulta tuttavia altrettanto ragionevole supporre che gli errori ηi siano del cosiddetto tipo (b), ovvero di entità non trascurabile ma con andamento casuale ηi ~ N(0, ση). I dati raccolti sui 52 elementi del campione estimativo sono organizzati nella seguente tabella (di cui si riporta soltanto uno stralcio) 58 Interpretazione matematico-statistica dei metodi di stima diretti Gabriele Brondino caratteristiche generalmente non rilevate e/o rilevabili). Purtroppo però la realtà della pratica estimativa è caratterizzata da campioni estimativi di dimensioni piccole e da una certa difficoltà di reperimento dei dati relativi ad alcune caratteristiche. Gli studi di grandi dimensioni non sono frequenti e, pertanto, non è molto facile verificare se gli errori ηi e νi siano del tipo (c). Prima di proseguire bisogna affermare con molta chiarezza che affinché la stima del Valore di Mercato del bene oggetto di stima (VM0) sia “buona” è necessario che gli errori dovuti al numero limitato di caratteristiche considerate (ηi) e quelli dettati dall’errore di forma (νi) siano del tipo (a) o (b). Se così non fosse allora tutte le procedure di stima e i relativi errori risulterebbero affetti da imprecisioni e le stime ottenute non avrebbero significato pratico. Così come un grande chef non può cucinare un grande piatto se le materie prime sono di pessima qualità, allo stesso modo un metodo statistico o estimativo per quanto teoricamente esatto non può fornire una stima di qualità in presenza di errori del tipo (c). MODIFICHE al MODELLO del PREZZO di COMPRAVENDITA Si è già detto che per giungere ad una stima del Valore di Mercato del bene oggetto di stima occorre fare uso dei Prezzi di Compravendita rilevati sui beni che costituiscono il campione estimativo. Per poter svolgere tale operazione, indipendentemente dal metodo di stima utilizzato, occorre • estendere il modello del Prezzo di Compravendita (2) a tutti gli elementi del campione estimativo (operazione assolutamente lecita e ragionevole); • sostituire nel modello (2) esteso la definizione di Valore di Mercato (9) introdotta a seguito delle semplificazioni viste in precedenza; • ipotizzare che gli errori ηi e νi siano del tipo (a) o (b), ovvero che siano trascurabili o casuali. L’esecuzione di tali operazioni algebriche consente di costruire la seguente formula: Pi = VMi + δ i = f(xi1, xi2, …, xiJ) + νi+ηi+δi ∀ i ∈ {0, 1, 2, …, n} (10) Sotto l’ipotesi che gli errori ηi e νi siano del tipo (a) o (b) la formula (10) si può ulteriormente semplificare in quella che possiamo definire come Modello della formazione del Prezzo di Compravendita: Pi = f(xi1, xi2, …, xiJ) +εi ∀ i ∈ {0, 1, 2, …, n} (11) avendo cura di definire le variabili casuali εi (aventi valore atteso 0) come somma degli errori νi, ηi e δi per qualsiasi i compreso tra 0 e n. Nel seguito verranno descritti i principali metodi di stima diretta del Valore di Mercato, ovvero gli algoritmi che consentono di giungere ad ottenere un valore numerico che indicheremo come VM0 = f (x01, x02, …, x0J) (12) essendo f la stima della funzione f del Valore di Mercato. Occorre a questo punto chiarire che nel gergo estimativo per Valore di Mercato si intende il giudizio di stima fornito dal tecnico/perito al termine della consulenza/perizia. Pertanto a rigor di logica avremmo dovuto chiamare Valore di Mercato la quantità monetaria indicata generalmente nella formula (12). Tuttavia dal punto di vista matematico l’adozione di questa convenzione avrebbe ingenerato parecchia confusione. è più corretto (matematicamente) considerare il Valore di Mercato VM0 come un valore incognito e in alcun modo non conoscibile. E definire la quantità monetaria risultante dalla procedura di stima diretta VM0 come Stima del Valore di Mercato. 59 METODI di STIMA DIRETTI del VALORE di MERCATO Il modello di Prezzo di Compravendita (11) e un campione estimativo sono gli strumenti necessari per lo sviluppo di uno dei qualsiasi metodi di stima diretti del Valore di Mercato. Di seguito prenderemo in considerazione alcuni di questi metodi cercando di descriverne i dettagli matematici e le difficoltà di applicazione, prendendo spunto da casi studio pseudo-reali. Dapprima si prenderà in considerazione un campione estimativo particolarmente numeroso e si fornirà una stima del Valore di Mercato del bene oggetto di stima attraverso la metodologia statistica nota come Regressione. Di seguito si provvederà ad applicare il cosiddetto Sales Comparison Approach (SCA) per stimare il Valore di Mercato nel caso di un campione estimativo di bassa numerosità. Infine si valuterà l’utilità pratica e le condizioni di applicazioni di un metodo di stima noto come Nearest Neighbors Appraisal Technique (NNAT). La descrizione matematica della Regressione e del SCA, con relativo confronto, seguirà lo schema e la dicitura introdotti da Isakson (2002) nell’articolo dal titolo The Linear Algebra of the Sales Comparison Approach. Si sottolinea inoltre come la Regressione sia in realtà una classe di metodi in continuo ampliamento e aggiornamento. La disponibilità di software statistici e la costruzione di banche dati delle transazioni sempre più ampie e complete inducono a pensare che nei prossimi anni questa classe di metodi verrà sempre più utilizzata in ambito estimativo. Per avere un quadro più chiaro e completo sui metodi di Regressione si rimanda al testo di Hastie ed altri (2001) dal titolo The Element of Statistical Learning. Data Mining, Inference and Prediction. Nel medesimo testo è anche possibile trovare i fondamenti teorici del metodo indicato come NNTA. REGRESSIONE LINEARE MULTIPLA Nell’ambito estimativo un ruolo importante (soprattutto in un contesto extra italiano) è costituito dalle cosiddette stime di massa (mass appraisal). Tali stime sono utilizzate principalmente in ambito fiscale consentendo di fornire una valutazione del valore di mercato di un gran numero di beni. Esistono molti metodi matematici e statistici che possono essere utilizzati per effettuare una stima di massa. Tra questi metodi la regressione lineare multipla è tra i più noti. Nonostante questo metodo non sia necessariamente il più adatto in molti dei casi pratici, esso è certamente il più semplice da comprendere e da applicare. In particolare la regressione è un metodo statistico molto noto che ormai risulta implementato in un gran numero di software. Di seguito verrà presentato un caso studio e, attraverso di esso, verrà descritto il modello di regressione lineare multipla. Il Campione Estimativo Nel caso di stime di massa il campione estimativo è costituito da un gran numero di beni compravenduti di recente sui quali si provvede a rilevare un buon numero di caratteristiche. Il metodo della regressione lineare multipla può essere utilizzato se il campione è formato da beni ubicati nelle vicinanze. Il campione estimativo di seguito analizzato consiste in una banca dati di 52 transazioni recentemente avvenute, per le quali si conoscono le informazioni relative alle seguenti caratteristiche: Prezzo, Superficie, Arie, Balconi, Cantina, Piano, Ascensore, Anno di Costruzione e Stato di Conservazione dell’unità immobiliare. Le transazioni sono avvenute in una zona geografica specifica e caratterizzata da una tipologia costruttiva economico-popolare. Si ipotizza che le caratteristiche rilevate siano quelle che influiscono nella determinazione del valore di mercato dei beni compravenduti nella zona. Tale ipotesi risulta certamente difficile da accettare. E’ più ragionevole e corretto pensare che anche altre caratteristiche influenzino la formazione del Valore di Mercato. Pertanto per ciascun bene considerato la componente di errore ηi (equazione 7) non può considerarsi nulla. Risulta tuttavia altrettanto ragionevole supporre che gli errori ηi siano del cosiddetto tipo (b), ovvero di entità non trascurabile ma con andamento casuale ηi ~ N(0, ση). I dati raccolti sui 52 elementi del campione estimativo sono organizzati nella seguente tabella (di cui si riporta soltanto uno stralcio) 60 Interpretazione matematico-statistica dei metodi di stima diretti Gabriele Brondino 61 Tabella 1 Stralcio della banca dati delle 52 transazioni che costituiscono il campione estimativo Prezzo Sup. Arie Balconi Cantina Piano Ascensore Anno Conservazione 79800 45 2 1 Presente 0 Assente 1930 Non Ristr. 65100 45 2 1 Assente 0 Assente 1950 Non Ristr. •••• •• • • •••• • •••• •••• •••• 76800 55 2 1 Presente 3 Assente 1930 Ristr.-Nuovo P= Dalla Tabella 1 emerge come alcune caratteristiche (Prezzo, Superficie Arie, Balconi, Piano e Anno di Costruzione) sono di tipo quantitativo. Le altre (Cantina, Ascensore e Conservazione), invece, sono caratteristiche di tipo qualitativo. Per queste ultime è necessario procedere ad una codifica numerica prima di applicare le formule della regressione (e anche quelle del Sales Comparison Approach). Le caratteristiche Cantina e Ascensore saranno codificate sostituendo il numero 0 (1) nel caso in cui si presenti la modalità Assente (Presente). Allo stesso modo la caratteristica Conservazione sarà codificata sostituendo il numero 0 (1) nel caso in cui si presenti la modalità Non Ristrutturato (Ristrutturato-Nuovo). Si procederà ora alla presentazione delle formule che costituiscono il cuore della regressione lineare multipla. Contemporaneamente si cercherà di facilitare la comprensione delle formule inserendovi i valori presentati nello stralcio di banca dati di Tabella 1. (13) Tale modello è quello noto nell’ambito statistico come Modello di Regressione Lineare Multipla. Il Prezzo risulta pertanto funzione di una somma di termini. I primi J termini sono dovuti alle caratteristiche ritenute potenzialmente influenti nella formazione del Prezzo. L’ultimo termine rappresenta l’errore dovuto alle componenti descritte nel seguito della formula (11). Il sistema di n equazioni (13) è di tipo lineare e pertanto può essere sinteticamente rappresentato mediante la seguente formulazione matriciale P = Xβ +ε (14) ove P, β e ε sono rispettivamente il vettore dei Prezzi, dei Parametri da stimare e degli Errori •• • pn ∈M(nx1) X= ∙ ∙ x11 x12 ••• x1j x21 x22 ••• x2j •• • •• • •• •• • xn1 xn2 ••• xnJ β= β2 •• • βJ ∙ ∙ ε1 ε= ε2 •• • εn ∈M(nx1) (15) ∙ • ∙ (16) ∈M(nxJ) Sostituendo i valori raccolti sul campione estimativo (Tabella 1) nel vettore dei Prezzi e nella matrice delle Caratteristiche si ottiene Riprendendo il modello del Prezzo di Compravendita nella versione descritta dalla formula (11) ed introducendo l’ipotesi di linearità nei parametri delle caratteristiche si ottiene la seguente versione ∀ i ∈ {1, 2, …, n} p2 β1 mentre X è la matrice delle caratteristiche Ipotesi di linearità del modello Pi = xi1β1 + xi2 β2 + …+ xiJ βJ + εi ∙ ∙ ∈M(Jx1) p1 P= ∙ 79800 65100 •• • 76800 ∙ ∈M(52x1) X= ∙ 1 45 ••• 0 1 45 ••• 0 •• • •• • •• • •• • 1 55 ••• 1 ∙ ∈M(52x9) La prima colonna della matrice X contiene un vettore di valori unitari, ovvero di 1, questo per fare sì che si stimi la cosiddetta intercetta (si rammenti come in una retta l’intercetta è l’intersezione della retta con l’asse delle ordinate). La seconda colonna è relativa ai valori della Superficie per i singoli elementi del campione. L’ultima colonna della matrice è ottenuta trasformando la caratteristica Conservazione secondo la codifica precedentemente introdotta. Ritornando alla formula matriciale (14) il problema consiste nello stimare il vettore dei Parametri β. Tale vettore può essere stimato per mezzo di numerosi metodi statistici. Tuttavia il più semplice e noto è quello denominato dei minimi quadrati. In tale metodo, infatti, la stima dei Parametri si ottiene cercando di minimizzare il quadrato degli errori, ovvero cercando di minimizzare la quantità ε′ε. Minimi Quadrati Descrivere il metodo dei minimi quadrati per la stima dei Parametri del modello (14) non è l’obiettivo di queste righe. Si rimanda al testo di Hastie et. al. (2001) o ad altri testi di statistica per una comprensione di come si deriva la seguente formula β=(X'X) -1X'p (17) La formula (17) consente di ottenere la stima del vettore dei parametri ricorrendo esclusivamente ai dati estimativi in possesso, ossia alla matrice delle Caratteristiche e al vettore dei Prezzi. Si vuole 60 Interpretazione matematico-statistica dei metodi di stima diretti Gabriele Brondino 61 Tabella 1 Stralcio della banca dati delle 52 transazioni che costituiscono il campione estimativo Prezzo Sup. Arie Balconi Cantina Piano Ascensore Anno Conservazione 79800 45 2 1 Presente 0 Assente 1930 Non Ristr. 65100 45 2 1 Assente 0 Assente 1950 Non Ristr. •••• •• • • •••• • •••• •••• •••• 76800 55 2 1 Presente 3 Assente 1930 Ristr.-Nuovo P= Dalla Tabella 1 emerge come alcune caratteristiche (Prezzo, Superficie Arie, Balconi, Piano e Anno di Costruzione) sono di tipo quantitativo. Le altre (Cantina, Ascensore e Conservazione), invece, sono caratteristiche di tipo qualitativo. Per queste ultime è necessario procedere ad una codifica numerica prima di applicare le formule della regressione (e anche quelle del Sales Comparison Approach). Le caratteristiche Cantina e Ascensore saranno codificate sostituendo il numero 0 (1) nel caso in cui si presenti la modalità Assente (Presente). Allo stesso modo la caratteristica Conservazione sarà codificata sostituendo il numero 0 (1) nel caso in cui si presenti la modalità Non Ristrutturato (Ristrutturato-Nuovo). Si procederà ora alla presentazione delle formule che costituiscono il cuore della regressione lineare multipla. Contemporaneamente si cercherà di facilitare la comprensione delle formule inserendovi i valori presentati nello stralcio di banca dati di Tabella 1. (13) Tale modello è quello noto nell’ambito statistico come Modello di Regressione Lineare Multipla. Il Prezzo risulta pertanto funzione di una somma di termini. I primi J termini sono dovuti alle caratteristiche ritenute potenzialmente influenti nella formazione del Prezzo. L’ultimo termine rappresenta l’errore dovuto alle componenti descritte nel seguito della formula (11). Il sistema di n equazioni (13) è di tipo lineare e pertanto può essere sinteticamente rappresentato mediante la seguente formulazione matriciale P = Xβ +ε (14) ove P, β e ε sono rispettivamente il vettore dei Prezzi, dei Parametri da stimare e degli Errori •• • pn ∈M(nx1) X= ∙ ∙ x11 x12 ••• x1j x21 x22 ••• x2j •• • •• • •• •• • xn1 xn2 ••• xnJ β= β2 •• • βJ ∙ ∙ ε1 ε= ε2 •• • εn ∈M(nx1) (15) ∙ • ∙ (16) ∈M(nxJ) Sostituendo i valori raccolti sul campione estimativo (Tabella 1) nel vettore dei Prezzi e nella matrice delle Caratteristiche si ottiene Riprendendo il modello del Prezzo di Compravendita nella versione descritta dalla formula (11) ed introducendo l’ipotesi di linearità nei parametri delle caratteristiche si ottiene la seguente versione ∀ i ∈ {1, 2, …, n} p2 β1 mentre X è la matrice delle caratteristiche Ipotesi di linearità del modello Pi = xi1β1 + xi2 β2 + …+ xiJ βJ + εi ∙ ∙ ∈M(Jx1) p1 P= ∙ 79800 65100 •• • 76800 ∙ ∈M(52x1) X= ∙ 1 45 ••• 0 1 45 ••• 0 •• • •• • •• • •• • 1 55 ••• 1 ∙ ∈M(52x9) La prima colonna della matrice X contiene un vettore di valori unitari, ovvero di 1, questo per fare sì che si stimi la cosiddetta intercetta (si rammenti come in una retta l’intercetta è l’intersezione della retta con l’asse delle ordinate). La seconda colonna è relativa ai valori della Superficie per i singoli elementi del campione. L’ultima colonna della matrice è ottenuta trasformando la caratteristica Conservazione secondo la codifica precedentemente introdotta. Ritornando alla formula matriciale (14) il problema consiste nello stimare il vettore dei Parametri β. Tale vettore può essere stimato per mezzo di numerosi metodi statistici. Tuttavia il più semplice e noto è quello denominato dei minimi quadrati. In tale metodo, infatti, la stima dei Parametri si ottiene cercando di minimizzare il quadrato degli errori, ovvero cercando di minimizzare la quantità ε′ε. Minimi Quadrati Descrivere il metodo dei minimi quadrati per la stima dei Parametri del modello (14) non è l’obiettivo di queste righe. Si rimanda al testo di Hastie et. al. (2001) o ad altri testi di statistica per una comprensione di come si deriva la seguente formula β=(X'X) -1X'p (17) La formula (17) consente di ottenere la stima del vettore dei parametri ricorrendo esclusivamente ai dati estimativi in possesso, ossia alla matrice delle Caratteristiche e al vettore dei Prezzi. Si vuole 62 Interpretazione matematico-statistica dei metodi di stima diretti Gabriele Brondino far notare che β è una stima del vettore dei Parametri β e che pertanto si genera un errore di stima che viene esplicitamente gestito attraverso lo strumento degli intervalli di fiducia (di cui si dirà in seguito). Sostituendo nella formula (17) i valori raccolti sul campione estimativo si ottiene il vettore contenente la stima dei parametri incogniti del modello (13) β= ∙ ∙ −863649.3 1071.8 −6775.1 6403.4 −3078.4 −642.6 6906.0 459.1 18008.0 63 stime ottenute per i parametri delle caratteristiche Arie e Cantina risultino non ragionevoli. Questo potrebbe far pensare che la Regressione sia un metodo non adatto per analizzare i dati di un campione estimativo. Nella realtà, invece, la formula (17) ottenuta mediante i minimi quadrati è soltanto il primo passo di un cammino lungo e spesso complesso. Pur ribadendo che non è nell’intenzione di questo scritto approfondire il tema della Regressione, nel seguito si presenteranno i risultati ottenuti eseguendo un’analisi metodica sui dati della Tabella 1. Selezione del Modello ∈M(9x1) Il vettore delle stime dei Parametri ottenuto contiene nove valori numerici a cui è necessario assegnare un significato estimativo. Tralasciando il primo termine (l’intercetta) che ha prevalentemente un significato matematico, concentriamoci subito sul secondo valore 1071.8, esso fa riferimento alla caratteristica Superficie e rappresenta l’incremento del Valore di Mercato di un Bene per ogni m2 in più. Non si tratta del Prezzo Unitario, quest’ultimo infatti si ottiene dividendo il Prezzo per la Superficie. Il significato del parametro relativo alla Superficie è differente. Matematicamente rappresenta una derivata prima, mentre dal punto di vista estimativo è la differenza di valore tra due beni del tutto identici tranne per il fatto che uno dei due ha un m2 di Superficie in più. Continuando nell’analisi dei valori contenuti nel vettore delle stime dei parametri si incontra -6775.1. Questo risultato ha un significato matematico ma non può certamente averne uno estimativo. Esso, infatti, rappresenta l’incremento del Valore di Mercato di un Bene per ogni Aria in più. Come dire che se vi sono due appartamenti, uno con un solo affaccio e l’altro con due, allora il secondo tende a valere di meno perché ha due arie! E’ chiaramente un controsenso. Ma non c’è da stupirsi troppo di questa apparente contraddizione. Il motivo sarà meglio chiarito nella sezione successiva, quando si sottolineerà come l’applicazione pratica della regressione richiede una grande esperienza e l’adozione di metodi denominati di selezione del modello. Continuando a scorrere i valori contenuti nel vettore delle stime si scopre che un balcone in più fa sì che il Valore di Mercato abbia un incremento di 6403.4 €, mentre la presenza della cantina provoca addirittura un decremento del Valore di 3078.4 € (anche in questo caso si tratta ovviamente di un risultato privo di significato estimativo). Interessante notare come dai numeri ottenuti emerga che gli appartamenti ai piani superiori tendano ad avere un Valore di Mercato inferiore, essendo la stima del parametro negativa: -642.6 €. Tuttavia questo risultato, apparentemente contro il buon senso, può avere un suo fondamento nel fatto che in alcuni casi i fabbricati in cui si trovano le unità del campione sono privi di ascensore. La presenza dell’ascensore risulta contribuire all’incremento del Valore (+6906.0 €), ma forse sarebbe stato più opportuno studiare l’effetto congiunto (interazione) delle caratteristiche Piano e Ascensore. Verso il fondo del vettore delle stime si trova il valore 459.1, che fa riferimento alla caratteristica Anno di Costruzione. Così se vi sono due unità, la prima costruita nel 1940 e la seconda nel 1950, la differenza di Valore di Mercato tra le due dovuta all’anno di costruzione è pari a 459.1(19501940)=4591.0 €. Infine l’ultimo elemento del vettore delle stime indica che la differenza di Valore tra un’unità ristrutturata e una non ristrutturata risulta pari a 18008.0 €. Nonostante la soluzione matematica (17) del problema (14) sia (quasi) sempre ottenibile, può capitare che il risultato non abbia una valenza estimativa. Nel caso in esame si è già evidenziato come le Finora si è supposto che tutte le caratteristiche raccolte sul campione estimativo siano legate al Valore di Mercato. Questo è ragionevole almeno quanto supporre che esistano altre caratteristiche influenti nella determinazione del Valore di Mercato. Tuttavia occorre ricordarsi che i dati raccolti sono un campione e non l’intera popolazione delle transazioni. Ne consegue una limitata capacità esplicativa, ovvero una difficoltà nell’individuare correttamente tutte le caratteristiche significativamente influenti e nel valutare correttamente il livello delle singole influenze. In altre parole a causa della limitata numerosità degli elementi del campione estimativo e della variabilità presente nei Prezzi, la Regressione consente di individuare e valutare l’influenza soltanto di un sottoinsieme delle caratteristiche che davvero influiscono nella formazione del Valore di Mercato. Nella letteratura statistica esistono diversi metodi per svolgere la cosiddetta selezione del modello. Tra i più utilizzati vi è la cosiddetta stepwise regression. Questa procedura richiede di costruire un modello iniziale contenente le caratteristiche che si ipotizza influenzino il Valore di Mercato e di cui si dispone dei dati. Nei passi successivi la procedura provvede ad eliminare via via le caratteristiche che, dall’analisi dei dati, non risultano statisticamente significative nella formazione del Valore di Mercato. Al termine della procedura si ottiene un modello finale costituito da un sottoinsieme di caratteristiche e dalle conseguenti stime dei parametri. Nel caso studio in esame la procedura è stata applicata partendo da un modello iniziale costituito dalle otto caratteristiche di Tabella 1 più l’interazione tra le caratteristiche Piano e Ascensore. Il modello risultato “vincente” dalla procedura di selezione è contenuto in Tabella 2. Tabella 2 Modello vincente della stepwise regression applicata sul campione estimativo Caratteristica Stima Errore standard Statistica t Pr(>|t|) (Intercetta) -829802.12 223256.58 -3.717 0.000556 *** Superficie 1135.86 254.53 4.463 5.37e-05 *** Piano -1289.04 1031.02 -1.250 0.217671 70.34 6085.52 0.012 0.990829 18022.50 3792.45 4.752 2.09e-05 *** Anno 438.22 116.79 3.752 0.000500 *** Piano : Ascensore 2637.16 1738.06 1.517 0.136186 Ascensore Conservazione Per leggere rapidamente i risultati contenuti nella Tabella 2 occorre scorrere subito l’ultima colonna, quella denominata Pr(>|t|). Tale colonna contiene i cosiddetti p-value, ovvero quei numeri che indicano la presenza di una significatività statistica quando assumono valori inferiori a 0.05. Nel caso in esame sono quattro le righe in cui i p-value assumono valori inferiori a 0.05, per identificarle rapidamente è sufficiente cercare il simbolo ***. Così si scopre che l’intercetta, la Superficie, l’Anno di Costruzione e lo stato di Conservazione sono le caratteristiche che risultano statisticamente significative nella formazione del Valore di Mercato. Quest’affermazione va compresa correttamente. Non intende dire che soltanto queste caratteristi- 62 Interpretazione matematico-statistica dei metodi di stima diretti Gabriele Brondino far notare che β è una stima del vettore dei Parametri β e che pertanto si genera un errore di stima che viene esplicitamente gestito attraverso lo strumento degli intervalli di fiducia (di cui si dirà in seguito). Sostituendo nella formula (17) i valori raccolti sul campione estimativo si ottiene il vettore contenente la stima dei parametri incogniti del modello (13) β= ∙ ∙ −863649.3 1071.8 −6775.1 6403.4 −3078.4 −642.6 6906.0 459.1 18008.0 63 stime ottenute per i parametri delle caratteristiche Arie e Cantina risultino non ragionevoli. Questo potrebbe far pensare che la Regressione sia un metodo non adatto per analizzare i dati di un campione estimativo. Nella realtà, invece, la formula (17) ottenuta mediante i minimi quadrati è soltanto il primo passo di un cammino lungo e spesso complesso. Pur ribadendo che non è nell’intenzione di questo scritto approfondire il tema della Regressione, nel seguito si presenteranno i risultati ottenuti eseguendo un’analisi metodica sui dati della Tabella 1. Selezione del Modello ∈M(9x1) Il vettore delle stime dei Parametri ottenuto contiene nove valori numerici a cui è necessario assegnare un significato estimativo. Tralasciando il primo termine (l’intercetta) che ha prevalentemente un significato matematico, concentriamoci subito sul secondo valore 1071.8, esso fa riferimento alla caratteristica Superficie e rappresenta l’incremento del Valore di Mercato di un Bene per ogni m2 in più. Non si tratta del Prezzo Unitario, quest’ultimo infatti si ottiene dividendo il Prezzo per la Superficie. Il significato del parametro relativo alla Superficie è differente. Matematicamente rappresenta una derivata prima, mentre dal punto di vista estimativo è la differenza di valore tra due beni del tutto identici tranne per il fatto che uno dei due ha un m2 di Superficie in più. Continuando nell’analisi dei valori contenuti nel vettore delle stime dei parametri si incontra -6775.1. Questo risultato ha un significato matematico ma non può certamente averne uno estimativo. Esso, infatti, rappresenta l’incremento del Valore di Mercato di un Bene per ogni Aria in più. Come dire che se vi sono due appartamenti, uno con un solo affaccio e l’altro con due, allora il secondo tende a valere di meno perché ha due arie! E’ chiaramente un controsenso. Ma non c’è da stupirsi troppo di questa apparente contraddizione. Il motivo sarà meglio chiarito nella sezione successiva, quando si sottolineerà come l’applicazione pratica della regressione richiede una grande esperienza e l’adozione di metodi denominati di selezione del modello. Continuando a scorrere i valori contenuti nel vettore delle stime si scopre che un balcone in più fa sì che il Valore di Mercato abbia un incremento di 6403.4 €, mentre la presenza della cantina provoca addirittura un decremento del Valore di 3078.4 € (anche in questo caso si tratta ovviamente di un risultato privo di significato estimativo). Interessante notare come dai numeri ottenuti emerga che gli appartamenti ai piani superiori tendano ad avere un Valore di Mercato inferiore, essendo la stima del parametro negativa: -642.6 €. Tuttavia questo risultato, apparentemente contro il buon senso, può avere un suo fondamento nel fatto che in alcuni casi i fabbricati in cui si trovano le unità del campione sono privi di ascensore. La presenza dell’ascensore risulta contribuire all’incremento del Valore (+6906.0 €), ma forse sarebbe stato più opportuno studiare l’effetto congiunto (interazione) delle caratteristiche Piano e Ascensore. Verso il fondo del vettore delle stime si trova il valore 459.1, che fa riferimento alla caratteristica Anno di Costruzione. Così se vi sono due unità, la prima costruita nel 1940 e la seconda nel 1950, la differenza di Valore di Mercato tra le due dovuta all’anno di costruzione è pari a 459.1(19501940)=4591.0 €. Infine l’ultimo elemento del vettore delle stime indica che la differenza di Valore tra un’unità ristrutturata e una non ristrutturata risulta pari a 18008.0 €. Nonostante la soluzione matematica (17) del problema (14) sia (quasi) sempre ottenibile, può capitare che il risultato non abbia una valenza estimativa. Nel caso in esame si è già evidenziato come le Finora si è supposto che tutte le caratteristiche raccolte sul campione estimativo siano legate al Valore di Mercato. Questo è ragionevole almeno quanto supporre che esistano altre caratteristiche influenti nella determinazione del Valore di Mercato. Tuttavia occorre ricordarsi che i dati raccolti sono un campione e non l’intera popolazione delle transazioni. Ne consegue una limitata capacità esplicativa, ovvero una difficoltà nell’individuare correttamente tutte le caratteristiche significativamente influenti e nel valutare correttamente il livello delle singole influenze. In altre parole a causa della limitata numerosità degli elementi del campione estimativo e della variabilità presente nei Prezzi, la Regressione consente di individuare e valutare l’influenza soltanto di un sottoinsieme delle caratteristiche che davvero influiscono nella formazione del Valore di Mercato. Nella letteratura statistica esistono diversi metodi per svolgere la cosiddetta selezione del modello. Tra i più utilizzati vi è la cosiddetta stepwise regression. Questa procedura richiede di costruire un modello iniziale contenente le caratteristiche che si ipotizza influenzino il Valore di Mercato e di cui si dispone dei dati. Nei passi successivi la procedura provvede ad eliminare via via le caratteristiche che, dall’analisi dei dati, non risultano statisticamente significative nella formazione del Valore di Mercato. Al termine della procedura si ottiene un modello finale costituito da un sottoinsieme di caratteristiche e dalle conseguenti stime dei parametri. Nel caso studio in esame la procedura è stata applicata partendo da un modello iniziale costituito dalle otto caratteristiche di Tabella 1 più l’interazione tra le caratteristiche Piano e Ascensore. Il modello risultato “vincente” dalla procedura di selezione è contenuto in Tabella 2. Tabella 2 Modello vincente della stepwise regression applicata sul campione estimativo Caratteristica Stima Errore standard Statistica t Pr(>|t|) (Intercetta) -829802.12 223256.58 -3.717 0.000556 *** Superficie 1135.86 254.53 4.463 5.37e-05 *** Piano -1289.04 1031.02 -1.250 0.217671 70.34 6085.52 0.012 0.990829 18022.50 3792.45 4.752 2.09e-05 *** Anno 438.22 116.79 3.752 0.000500 *** Piano : Ascensore 2637.16 1738.06 1.517 0.136186 Ascensore Conservazione Per leggere rapidamente i risultati contenuti nella Tabella 2 occorre scorrere subito l’ultima colonna, quella denominata Pr(>|t|). Tale colonna contiene i cosiddetti p-value, ovvero quei numeri che indicano la presenza di una significatività statistica quando assumono valori inferiori a 0.05. Nel caso in esame sono quattro le righe in cui i p-value assumono valori inferiori a 0.05, per identificarle rapidamente è sufficiente cercare il simbolo ***. Così si scopre che l’intercetta, la Superficie, l’Anno di Costruzione e lo stato di Conservazione sono le caratteristiche che risultano statisticamente significative nella formazione del Valore di Mercato. Quest’affermazione va compresa correttamente. Non intende dire che soltanto queste caratteristi- Interpretazione matematico-statistica dei metodi di stima diretti Gabriele Brondino 65 che influenzano la formazione del Valore di Mercato. Essa indica piuttosto che dall’analisi dei dati mediante la Regressione emerge che queste caratteristiche influiscono sul Valore con un elevato livello di fiducia. Ovviamente esiste la possibilità che le altre caratteristiche considerate nel modello iniziale possano influire sul Valore di Mercato. Dai dati tuttavia non vi sono indizi sufficienti perché tali caratteristiche (esempio Arie, Cantina, Balconi, ...) siano considerate influenti. Dopo aver individuato le caratteristiche che statisticamente influiscono sulla formazione del Valore di Mercato si tratta di valutarne la loro influenza. Dall’osservazione dei valori ottenuti nella Tabella 2 si ha che l’incremento di Valore dovuto ad un m2 in più è pari a 1135.86 €. Allo stesso modo due unità del tutto simili tranne per il fatto che la prima è Non Ristrutturata e l’altra Ristrutturata o Nuova hanno una differenza stimata di valore pari a 18022.50 €. Il cosiddetto prezzo marginale della caratteristica Anno di Costruzione è pari a 438.22 € per anno. Per le caratteristiche non influenti (Piano, Ascensore e la loro interazione) i valori di stima ottenuti non sono significativi e quindi non vanno presi in considerazione. Prima di proseguire nell’analisi di Regressione occorre sottolineare che le stime dei parametri di Tabella 2 sono state ottenute dall’analisi di un campione. Questo significa che le stime sono affette da una componente di incertezza dovuta alla procedura di campionamento. In termini concreti, se si fosse estratto un campione differente non si sarebbero ottenute esattamente le medesime stime. Si sarebbero ricavati valori vicini a quelli riportati in Tabella 2 ma non esattamente uguali. Per gestire questa componente di incertezza dovuta alla procedura di campionamento, ed in alcun modo eliminabile, occorre costruire gli intervalli di fiducia sulle stime dei parametri. La stima del parametro relativo alla Superficie è di 1135.86 €/m2. Un'indicazione dell’incertezza di stima è fornita dal valore della colonna Standard Error: 254.53 €/m2. Attraverso questi due valori è possibile costruire un intervallo di fiducia (al 95% di fiducia) sottraendo e sommando il doppio dello Standard Error alla stima: 1135.86±2·254.53 = (626.80; 1644.92). Questa formula, seppur non esatta (lo Standard Error andrebbe moltiplicato per un coefficiente dipendente dalla distribuzione statistica t di Student), consente di poter affermare che: con un livello di fiducia del 95% il valore vero del parametro relativo alla Superficie è compreso tra un minimo di 627 € e un massimo di 1645 € circa. Dal punto di vista pratico si tratta di un intervallo molto ampio ma che può essere ridotto solo aumentando la numerosità del campione. In ogni caso l’indicazione di un intervallo di fiducia in luogo di un valore puntuale unico consente di visualizzare con immediatezza l’incertezza insita nella stima dovuta alla variabilità dei prezzi e al tipo di campionamento. Le stime puntuali (ed intervallari) dei parametri delle caratteristiche significative del modello vincente possono essere molto utili anche nell’applicazione del Sales Comparison Approach. cosiddetto coefficiente di determinazione multipla, noto come R2. Tale coefficiente può assumere valori nell’intervallo [0,1] e rappresenta la proporzione di variabilità spiegata dal modello (14) rispetto alla variabilità naturale presente nell’andamento dei prezzi P. Tanto più il valore di R2 si avvicina a 1, tanto più il modello spiega una grande proporzione della variabilità presente nei prezzi. Nel caso studio in esame il valore del coefficiente di determinazione lineare è pari a 0.755, un valore tendente verso l’unità ma non troppo. Si può pensare di verificare la validità delle ipotesi sui residui attraverso questo valore numerico? La risposta è senza alcun dubbio no! Tuttavia non è raro incontrare testi in ambito estimativo che riducono l’analisi della bontà del modello esclusivamente all’osservazione del valore di R2. Di fronte a questa tendenza occorre ribadire che gli strumenti per la verifica delle ipotesi sugli errori sono principalmente di carattere grafico. E che il valore di R2 consente esclusivamente di valutare il grado di variabilità spiegata dal modello. I grafici per lo studio della validità delle ipotesi del modello sono molteplici e non sempre di facile lettura. Eppure costituiscono l’insostituibile strumento per poter ritenere valida un’analisi di Regressione. I residui ottenuti per i dati del caso studio in esame sono rappresentanti in Illustrazione 1. Verifica del Modello L’andamento dei residui rispetto ai valori previsti mediante le stime dei parametri (grafico a sinistra di Illustrazione 1) si caratterizza per una distribuzione casuale dei dati (ovvero senza un presenza di periodicità), per avere un andamento medio (linea rossa) prossimo a zero e per avere una variabilità dei dati costante rispetto ai valori previsti. Queste considerazioni permettono di poter affermare che non vi sono ragioni per poter rifiutare le ipotesi che gli errori siano indipendenti, con valore atteso nullo e varianza costante. Il grafico di probabilità normale (a destra di Illustrazione 1) consiste nella rappresentazione della distribuzione cumulata dei residui (cerchi) e della distribuzione teorica cumulata di una variabile casuale gaussiana (segmento di retta). L’ipotesi di normalità degli errori (alla base della costruzione degli intervalli di fiducia) non si può rifiutare qualora i cerchi si sovrappongano al segmento di retta. Osservando l’andamento ottenuto per il caso studio si può con una certa ragionevolezza accettare anche l’ipotesi di normalità. Dalle considerazioni svolte emerge che il modello risultato vincente dalla procedura di selezione soddisfa le ipotesi sugli errori. Trattasi pertanto di un modello statisticamente corretto. E’ anche un modello utile? A questa risposta si può rispondere osservando come l’indice R2 assuma un valore certamente elevato (0.755) ma non troppo. Infatti circa il 25% (1-0.755) della variabilità dei prezzi rimane non spiegata dal modello. Tale percentuale è dovuta a tutte le cause e semplificazioni elencate nelle pagine precedenti. In termini estimativi il modello ottenuto può ritenersi utile per avere una La procedura di stima basata sul metodo dei minimi quadrati e la costruzione degli intervalli di fiducia si fondano su ipotesi riguardanti il vettore degli errori ε. Tali procedure richiedono infatti che le componenti del vettore siano indipendenti, abbiano valore atteso nullo, varianza costante e distribuite normalmente. Se queste ipotesi non fossero soddisfatte allora tutti i risultati ottenuti sarebbero discutibili. Ma come fare a verificare la ragionevolezza di tali ipotesi se non si possono osservare direttamente gli errori? Il vettore ε, infatti, è inconoscibile! Infatti se si osserva la formula (14) si nota come per poter determinare ε si dovrebbe conoscere il valore di β. Nella realtà, però, si può ottenere soltanto la stima del vettore dei parametri, ovvero β. Ne consegue che per verificare la validità delle ipotesi sul vettore casuale ε occorre analizzare il comportamento della sua realizzazione denominata vettore dei residui ε= P-X β (18) Ricavato il vettore dei residui occorre chiedersi quale strumento sia il più adatto a verificare le ipotesi sugli errori. A questa domanda la risposta più frequente in ambito estimativo è costituita dal R Residuals e s i d u a l s vsv sFitted F itte d 2 1 0 -1 -3 1 0 5 60000 80000 100000 Fitted F i t t e d values v a lu e s 8 1 0 6 -2 10000 0 -1 0 0 0 0 1 0 6 -3 0 0 0 0 N Normal o r m a l QQ -- QQ SStandardized t a n d a r d i z e d rresiduals e s id u a ls 8 RResiduals e s id u a ls 64 1 0 5 -2 -1 0 1 2 Theoretical T h e o r e t i c a l Quantiles Q u a n t ile s Illustrazione : Grafici dei residui. A sinistra: andamento dei residui rispetto ai valori Illustrazione 1 1Grafici dei residui previsti modello. destra: il grafico diprevisti probabilità normale. A sinistradal andamento deiAresidui rispetto ai valori dal modello. A destra il grafico di probabilità normale Interpretazione matematico-statistica dei metodi di stima diretti Gabriele Brondino 65 che influenzano la formazione del Valore di Mercato. Essa indica piuttosto che dall’analisi dei dati mediante la Regressione emerge che queste caratteristiche influiscono sul Valore con un elevato livello di fiducia. Ovviamente esiste la possibilità che le altre caratteristiche considerate nel modello iniziale possano influire sul Valore di Mercato. Dai dati tuttavia non vi sono indizi sufficienti perché tali caratteristiche (esempio Arie, Cantina, Balconi, ...) siano considerate influenti. Dopo aver individuato le caratteristiche che statisticamente influiscono sulla formazione del Valore di Mercato si tratta di valutarne la loro influenza. Dall’osservazione dei valori ottenuti nella Tabella 2 si ha che l’incremento di Valore dovuto ad un m2 in più è pari a 1135.86 €. Allo stesso modo due unità del tutto simili tranne per il fatto che la prima è Non Ristrutturata e l’altra Ristrutturata o Nuova hanno una differenza stimata di valore pari a 18022.50 €. Il cosiddetto prezzo marginale della caratteristica Anno di Costruzione è pari a 438.22 € per anno. Per le caratteristiche non influenti (Piano, Ascensore e la loro interazione) i valori di stima ottenuti non sono significativi e quindi non vanno presi in considerazione. Prima di proseguire nell’analisi di Regressione occorre sottolineare che le stime dei parametri di Tabella 2 sono state ottenute dall’analisi di un campione. Questo significa che le stime sono affette da una componente di incertezza dovuta alla procedura di campionamento. In termini concreti, se si fosse estratto un campione differente non si sarebbero ottenute esattamente le medesime stime. Si sarebbero ricavati valori vicini a quelli riportati in Tabella 2 ma non esattamente uguali. Per gestire questa componente di incertezza dovuta alla procedura di campionamento, ed in alcun modo eliminabile, occorre costruire gli intervalli di fiducia sulle stime dei parametri. La stima del parametro relativo alla Superficie è di 1135.86 €/m2. Un'indicazione dell’incertezza di stima è fornita dal valore della colonna Standard Error: 254.53 €/m2. Attraverso questi due valori è possibile costruire un intervallo di fiducia (al 95% di fiducia) sottraendo e sommando il doppio dello Standard Error alla stima: 1135.86±2·254.53 = (626.80; 1644.92). Questa formula, seppur non esatta (lo Standard Error andrebbe moltiplicato per un coefficiente dipendente dalla distribuzione statistica t di Student), consente di poter affermare che: con un livello di fiducia del 95% il valore vero del parametro relativo alla Superficie è compreso tra un minimo di 627 € e un massimo di 1645 € circa. Dal punto di vista pratico si tratta di un intervallo molto ampio ma che può essere ridotto solo aumentando la numerosità del campione. In ogni caso l’indicazione di un intervallo di fiducia in luogo di un valore puntuale unico consente di visualizzare con immediatezza l’incertezza insita nella stima dovuta alla variabilità dei prezzi e al tipo di campionamento. Le stime puntuali (ed intervallari) dei parametri delle caratteristiche significative del modello vincente possono essere molto utili anche nell’applicazione del Sales Comparison Approach. cosiddetto coefficiente di determinazione multipla, noto come R2. Tale coefficiente può assumere valori nell’intervallo [0,1] e rappresenta la proporzione di variabilità spiegata dal modello (14) rispetto alla variabilità naturale presente nell’andamento dei prezzi P. Tanto più il valore di R2 si avvicina a 1, tanto più il modello spiega una grande proporzione della variabilità presente nei prezzi. Nel caso studio in esame il valore del coefficiente di determinazione lineare è pari a 0.755, un valore tendente verso l’unità ma non troppo. Si può pensare di verificare la validità delle ipotesi sui residui attraverso questo valore numerico? La risposta è senza alcun dubbio no! Tuttavia non è raro incontrare testi in ambito estimativo che riducono l’analisi della bontà del modello esclusivamente all’osservazione del valore di R2. Di fronte a questa tendenza occorre ribadire che gli strumenti per la verifica delle ipotesi sugli errori sono principalmente di carattere grafico. E che il valore di R2 consente esclusivamente di valutare il grado di variabilità spiegata dal modello. I grafici per lo studio della validità delle ipotesi del modello sono molteplici e non sempre di facile lettura. Eppure costituiscono l’insostituibile strumento per poter ritenere valida un’analisi di Regressione. I residui ottenuti per i dati del caso studio in esame sono rappresentanti in Illustrazione 1. Verifica del Modello L’andamento dei residui rispetto ai valori previsti mediante le stime dei parametri (grafico a sinistra di Illustrazione 1) si caratterizza per una distribuzione casuale dei dati (ovvero senza un presenza di periodicità), per avere un andamento medio (linea rossa) prossimo a zero e per avere una variabilità dei dati costante rispetto ai valori previsti. Queste considerazioni permettono di poter affermare che non vi sono ragioni per poter rifiutare le ipotesi che gli errori siano indipendenti, con valore atteso nullo e varianza costante. Il grafico di probabilità normale (a destra di Illustrazione 1) consiste nella rappresentazione della distribuzione cumulata dei residui (cerchi) e della distribuzione teorica cumulata di una variabile casuale gaussiana (segmento di retta). L’ipotesi di normalità degli errori (alla base della costruzione degli intervalli di fiducia) non si può rifiutare qualora i cerchi si sovrappongano al segmento di retta. Osservando l’andamento ottenuto per il caso studio si può con una certa ragionevolezza accettare anche l’ipotesi di normalità. Dalle considerazioni svolte emerge che il modello risultato vincente dalla procedura di selezione soddisfa le ipotesi sugli errori. Trattasi pertanto di un modello statisticamente corretto. E’ anche un modello utile? A questa risposta si può rispondere osservando come l’indice R2 assuma un valore certamente elevato (0.755) ma non troppo. Infatti circa il 25% (1-0.755) della variabilità dei prezzi rimane non spiegata dal modello. Tale percentuale è dovuta a tutte le cause e semplificazioni elencate nelle pagine precedenti. In termini estimativi il modello ottenuto può ritenersi utile per avere una La procedura di stima basata sul metodo dei minimi quadrati e la costruzione degli intervalli di fiducia si fondano su ipotesi riguardanti il vettore degli errori ε. Tali procedure richiedono infatti che le componenti del vettore siano indipendenti, abbiano valore atteso nullo, varianza costante e distribuite normalmente. Se queste ipotesi non fossero soddisfatte allora tutti i risultati ottenuti sarebbero discutibili. Ma come fare a verificare la ragionevolezza di tali ipotesi se non si possono osservare direttamente gli errori? Il vettore ε, infatti, è inconoscibile! Infatti se si osserva la formula (14) si nota come per poter determinare ε si dovrebbe conoscere il valore di β. Nella realtà, però, si può ottenere soltanto la stima del vettore dei parametri, ovvero β. Ne consegue che per verificare la validità delle ipotesi sul vettore casuale ε occorre analizzare il comportamento della sua realizzazione denominata vettore dei residui ε= P-X β (18) Ricavato il vettore dei residui occorre chiedersi quale strumento sia il più adatto a verificare le ipotesi sugli errori. A questa domanda la risposta più frequente in ambito estimativo è costituita dal R Residuals e s i d u a l s vsv sFitted F itte d 2 1 0 -1 -3 1 0 5 60000 80000 100000 Fitted F i t t e d values v a lu e s 8 1 0 6 -2 10000 0 -1 0 0 0 0 1 0 6 -3 0 0 0 0 N Normal o r m a l QQ -- QQ SStandardized t a n d a r d i z e d rresiduals e s id u a ls 8 RResiduals e s id u a ls 64 1 0 5 -2 -1 0 1 2 Theoretical T h e o r e t i c a l Quantiles Q u a n t ile s Illustrazione : Grafici dei residui. A sinistra: andamento dei residui rispetto ai valori Illustrazione 1 1Grafici dei residui previsti modello. destra: il grafico diprevisti probabilità normale. A sinistradal andamento deiAresidui rispetto ai valori dal modello. A destra il grafico di probabilità normale 66 Interpretazione matematico-statistica dei metodi di stima diretti Gabriele Brondino stima dei cosiddetti prezzi marginali (gli elementi del vettore delle stime). Esso può considerarsi parzialmente utile per effettuare stime di massa, anche se va detto che il modello potrebbe essere largamente migliorabile aumentando la numerosità campionaria e la quantità di caratteristiche rilevate (in particolare quelle relative alla componente spaziale). Certamente il modello stimato non risulta uno strumento adatto per eseguire la stima di un singolo bene, per questo obiettivo occorre ricorrere al SCA. Stima del Valore di Mercato La Regressione Lineare Multipla viene considerata in ambito estimativo un metodo da utilizzarsi per le cosiddette stime di massa. Ovvero per quelle valutazioni che richiedono la formulazione di un giudizio di valore su di un gran numero di beni contemporaneamente. L’operazione matematica da compiersi, dopo aver ottenuto il vettore delle stime dei parametri, è infatti molto semplice VM0= f (x01,x02, •••, x0J ) =X0β Nelle righe seguenti ci si soffermerà sulla giustificazione matematica del metodo. Sui collegamenti che esistono tra SCA e la Regressione Lineare Multipla. Il tutto a partire da un caso studio. Il Campione Estimativo Un quesito di stima richiede di fornire un giudizio sul Valore di Mercato di un bene di 45 m2, avente due arie, un balcone, con cantina, al piano terreno, non ristrutturato, sito in un fabbricato degli anni 50 privo di ascensore (Tabella 3). Tabella 3 Caratteristiche rilevate sul bene oggetto di stima e sul campione estimativo (19) ove X0=[x01 x02 ••• x0J ]∈M(1×J) (20) In termini pratici la stima del Valore di Mercato di un bene si ottiene dalla moltiplicazione del vettore X0 e del vettore delle stime dei parametri. Il vettore X0 è costituito dai valori delle caratteristiche osservati per il bene oggetto di stima. Nel caso di stime di massa il vettore X0 diventa una matrice con un numero di righe pari al numero di beni da stimare, cosicché si ottiene non una singola stima del Valore di Mercato ma un vettore. Richiamando il caso studio, se si volesse valutare un bene immobile non ristrutturato con una Superficie di 50 m2 inserito in un fabbricato costruito nel 1950 si otterrebbe VM0= X0β = [1 50 0 1950] ∙ −829802.12 1135.86 18922.50 438.22 ∙ Come già in precedenza ricordato la descrizione del metodo di Regressione Lineare Multipla qui riportata non ha l’ambizione di essere esaustiva. Trattasi di una presentazione svolta con due obiettivi di fondo. Far emergere la stretta similitudine matematica esistente tra la Regressione Lineare Multipla e il SCA. Ed evidenziare come i risultati ottenuti dalla procedura di Regressione possono essere una base di partenza per l’applicazione pratica del SCA. SALES COMPARISON APPROACH Prezzo Sup. Arie Balconi Cantina Piano Ascensore Anno Conservazione ????? 45 2 1 Presente 0 Assente 1950 Non Ristrutt. 68300 38 2 2 Presente 1 Assente 1940 Non Ristrutt. 91300 60 2 1 Presente 5 Presente 1950 Non Ristrutt. 78400 40 2 1 Assente 1 Presente 1950 Non Ristrutt. 53900 45 2 1 Presente 2 Assente 1950 Non Ristrutt. Per provvedere ad una stima per via diretta tramite SCA si seleziona un campione estimativo formato da quattro unità simili al bene oggetto di stima (Tabella 3) ed ubicate nel medesimo contesto geografico. Il bene e gli elementi del campione si trovano nella stessa zona delle unità considerate in Tabella 1, cosicché da poter giustificare l’utilizzo dei risultati ottenuti dalla regressione. Come si evince facilmente dall’osservazione della Tabella 3, il bene oggetto di stima e gli elementi del campione estimativo hanno in comune il numero di arie e lo stato di conservazione. Pertanto queste due caratteristiche possono essere eliminate in quanto non capaci di spiegare la variazione di valore. Allora procedendo alla codifica delle variabili qualitative e richiamando le definizioni matematiche sinora introdotte si ha che ∙ ∙ 68300 = 81512.3 I quesiti che richiedono la formulazione di un giudizio di stima sul Valore di Mercato di un bene singolo sono la norma nella pratica estimativa. Tali stime sono utilizzate in contesti differenti e spesso servono per redimere controversie giuridiche. Tra i molti metodi di stima, diretti e indiretti, un ruolo centrale è ricoperto dal Sales Comparison Approach. 67 P= 91300 78400 53900 ∈M(4×1) X= ∙ 38 2 1 1 0 1940 60 1 1 5 5 1950 40 1 0 1 1 1950 45 1 1 2 0 1950 ∙ ∈M(4×6) X0= [45 1 1 0 0 1950] ∈ M(1x6) Si noti che la penultima colonna di X è stata ottenuta moltiplicando il numero di Piani con la colonna codificata della variabile Ascensore, questo per sottolineare il fatto che la presenza dell’ascensore influisce sul valore soprattutto in funzione del piano in cui si trova l’unità (ovvero l’interazione tra le due caratteristiche). 66 Interpretazione matematico-statistica dei metodi di stima diretti Gabriele Brondino stima dei cosiddetti prezzi marginali (gli elementi del vettore delle stime). Esso può considerarsi parzialmente utile per effettuare stime di massa, anche se va detto che il modello potrebbe essere largamente migliorabile aumentando la numerosità campionaria e la quantità di caratteristiche rilevate (in particolare quelle relative alla componente spaziale). Certamente il modello stimato non risulta uno strumento adatto per eseguire la stima di un singolo bene, per questo obiettivo occorre ricorrere al SCA. Stima del Valore di Mercato La Regressione Lineare Multipla viene considerata in ambito estimativo un metodo da utilizzarsi per le cosiddette stime di massa. Ovvero per quelle valutazioni che richiedono la formulazione di un giudizio di valore su di un gran numero di beni contemporaneamente. L’operazione matematica da compiersi, dopo aver ottenuto il vettore delle stime dei parametri, è infatti molto semplice VM0= f (x01,x02, •••, x0J ) =X0β Nelle righe seguenti ci si soffermerà sulla giustificazione matematica del metodo. Sui collegamenti che esistono tra SCA e la Regressione Lineare Multipla. Il tutto a partire da un caso studio. Il Campione Estimativo Un quesito di stima richiede di fornire un giudizio sul Valore di Mercato di un bene di 45 m2, avente due arie, un balcone, con cantina, al piano terreno, non ristrutturato, sito in un fabbricato degli anni 50 privo di ascensore (Tabella 3). Tabella 3 Caratteristiche rilevate sul bene oggetto di stima e sul campione estimativo (19) ove X0=[x01 x02 ••• x0J ]∈M(1×J) (20) In termini pratici la stima del Valore di Mercato di un bene si ottiene dalla moltiplicazione del vettore X0 e del vettore delle stime dei parametri. Il vettore X0 è costituito dai valori delle caratteristiche osservati per il bene oggetto di stima. Nel caso di stime di massa il vettore X0 diventa una matrice con un numero di righe pari al numero di beni da stimare, cosicché si ottiene non una singola stima del Valore di Mercato ma un vettore. Richiamando il caso studio, se si volesse valutare un bene immobile non ristrutturato con una Superficie di 50 m2 inserito in un fabbricato costruito nel 1950 si otterrebbe VM0= X0β = [1 50 0 1950] ∙ −829802.12 1135.86 18922.50 438.22 ∙ Come già in precedenza ricordato la descrizione del metodo di Regressione Lineare Multipla qui riportata non ha l’ambizione di essere esaustiva. Trattasi di una presentazione svolta con due obiettivi di fondo. Far emergere la stretta similitudine matematica esistente tra la Regressione Lineare Multipla e il SCA. Ed evidenziare come i risultati ottenuti dalla procedura di Regressione possono essere una base di partenza per l’applicazione pratica del SCA. SALES COMPARISON APPROACH Prezzo Sup. Arie Balconi Cantina Piano Ascensore Anno Conservazione ????? 45 2 1 Presente 0 Assente 1950 Non Ristrutt. 68300 38 2 2 Presente 1 Assente 1940 Non Ristrutt. 91300 60 2 1 Presente 5 Presente 1950 Non Ristrutt. 78400 40 2 1 Assente 1 Presente 1950 Non Ristrutt. 53900 45 2 1 Presente 2 Assente 1950 Non Ristrutt. Per provvedere ad una stima per via diretta tramite SCA si seleziona un campione estimativo formato da quattro unità simili al bene oggetto di stima (Tabella 3) ed ubicate nel medesimo contesto geografico. Il bene e gli elementi del campione si trovano nella stessa zona delle unità considerate in Tabella 1, cosicché da poter giustificare l’utilizzo dei risultati ottenuti dalla regressione. Come si evince facilmente dall’osservazione della Tabella 3, il bene oggetto di stima e gli elementi del campione estimativo hanno in comune il numero di arie e lo stato di conservazione. Pertanto queste due caratteristiche possono essere eliminate in quanto non capaci di spiegare la variazione di valore. Allora procedendo alla codifica delle variabili qualitative e richiamando le definizioni matematiche sinora introdotte si ha che ∙ ∙ 68300 = 81512.3 I quesiti che richiedono la formulazione di un giudizio di stima sul Valore di Mercato di un bene singolo sono la norma nella pratica estimativa. Tali stime sono utilizzate in contesti differenti e spesso servono per redimere controversie giuridiche. Tra i molti metodi di stima, diretti e indiretti, un ruolo centrale è ricoperto dal Sales Comparison Approach. 67 P= 91300 78400 53900 ∈M(4×1) X= ∙ 38 2 1 1 0 1940 60 1 1 5 5 1950 40 1 0 1 1 1950 45 1 1 2 0 1950 ∙ ∈M(4×6) X0= [45 1 1 0 0 1950] ∈ M(1x6) Si noti che la penultima colonna di X è stata ottenuta moltiplicando il numero di Piani con la colonna codificata della variabile Ascensore, questo per sottolineare il fatto che la presenza dell’ascensore influisce sul valore soprattutto in funzione del piano in cui si trova l’unità (ovvero l’interazione tra le due caratteristiche). 68 Interpretazione matematico-statistica dei metodi di stima diretti Gabriele Brondino Partendo dalla formulazione generale (11) del modello del Prezzo di Compravendita il SCA elabora una strategia capace di apportare delle correzioni al vettore dei prezzi P a partire dalle differenze esistenti tra gli elementi del campione e il bene oggetto di stima X-IX0. ovvero sono i prezzi rilevati sugli elementi del campione estimativo a cui viene apportata una modifica dovuta alle differenze nei valori delle caratteristiche. Richiamando i valori delle caratteristiche rilevate sugli elementi del campione estimativo e quelle del bene oggetto di stima si ottiene che Ipotesi di linearità del modello Il fondamento matematico del SCA è il famoso sviluppo in serie di Taylor, argomento ben noto dell’Analisi Matematica. Una funzione reale continua può essere ben approssimata da un modello lineare attorno ad uno specifico punto. Così se si vuole approssimare linearmente la funzione del Valore di Mercato f in un intorno del punto rappresentato dal vettore X0 si ottiene f(Xi) = f(X0) + (Xi– X0) f’(X0) + ρi ∀i∈ {1, 2, …, n} f (X) = I f (X0 ) + (X– I X0 ) β + ρ (22) Si noti che in questo caso il vettore dei parametri β ha il medesimo significato di quello introdotto nella Regressione (formula 14). Rappresenta cioè un vettore contenente le variazioni di prezzo corrispondenti ad una variazione unitaria delle caratteristiche. Il limite matematico dell’approssimazione matematica sta nel fatto che essa vale solo in un intorno del punto X0. Al di fuori di questo intorno l’errore di approssimazione ρ può non essere trascurabile. Tutto sta nel capire quale sia l’intorno per cui l’errore sia trascurabile. Ed è proprio questo il punto debole della procedura SCA dal punto di vista pratico. Non vi sono strumenti per verificare se gli elementi del campione estimativo appartengano ad un intorno nel quale l’errore di approssimazione sia da considerarsi trascurabile. Modello di Stima Mediante alcune operazioni algebriche e richiamando il legame (11) esistente tra il vettore dei Prezzi e la funzione del Valore di Mercato si può giungere alla formulazione matematica del SCA (risultato ottenuto adattando le formulazioni contenute nell’articolo di Isakson del 2002) I f (X0 ) = f (X) − (X−I X0 ) β − ρ = P − ε − (X−I X0 ) β − ρ (23) = P + (I X0−X) β − (ρ + ε) essendo I = [1, 1, .., 1]' ∈M(nx1). Il sistema lineare (23) è costituito da n equazioni lineari aventi ciascuna come risultato il Valore di Mercato del bene oggetto di stima. Infatti If(X0) è un vettore colonna di dimensione n i cui elementi sono tutti uguali al Valore di Mercato f(X0). La formula (23) permette di scomporre il Valore di Mercato in due componenti: il cosiddetto vettore dei prezzi corretti e il vettore degli errori. I prezzi corretti S risultano pertanto definiti da S = P + (I X0 – X) β (I X0 – X) = (21) Il Valore di Mercato corrispondente al bene i del campione estimativo è una somma di tre termini: il Valore di Mercato (incognito) del bene oggetto di stima, il prodotto matriciale tra il vettore delle variazioni delle caratteristiche e la derivata prima di f nel punto X0, un termine contenente l’errore di approssimazione che si genera qualora non si considerino termini di ordine superiore al primo. Per trasformare la formula (21) in forma matriciale è sufficiente introdurre un vettore colonna I di dimensione n (24) 69 ∙ 7 −1 0 −1 0 10 −15 0 0 −5 −5 0 5 0 1 −1 −1 0 0 0 0 −2 0 0 ∙ Ancora oscuro invece è il significato del nuovo vettore introdotto β, perché non si è fatto uso del vettore β indicato nella formula (23)? Il vettore β ha per elementi le derivate prime della funzione f valutate nel punto X0 (note come prezzi marginali). Il problema è che la funzione f è incognita così come le sue derivate parziali rispetto alle caratteristiche. Ma allora come definire le componenti di β? Nella pratica tali valori sono definiti dal perito sulla base della propria esperienza e conoscenza del mercato immobiliare locale. Esiste tuttavia la possibilità di ricavare i valori delle componenti di β attraverso l’analisi dei dati, ad esempio per mezzo di un’analisi di Regressione o della cosiddetta Paired Analysis. Qualsiasi sia la strada percorsa, giudizio dell’esperto o metodi analitici, il risultato è che il vettore β potrà soltanto essere approssimato da un vettore che è stato chiamato β. Nel caso studio in esame si possono utilizzare i risultati ottenuti dalla Regressione svolta sulle 52 transazioni considerate in precedenza. Così i prezzi marginali per le caratteristiche Superficie, Stato di Conservazione e Anno di Costruzione possono essere definiti rispettivamente pari a: 1135.86, 18922.50 e 438.22 €. Di questi valori quello relativo allo Stato di Conservazione risulta inutile, essendo tale caratteristica uguale per tutti gli elementi del campione e per il bene oggetto di stima. I prezzi marginali per le altre caratteristiche si suppone siano il frutto dell’esperienza del perito così da poter affermare che β= ∙ 1135.86 3180 640 −2240 3760 438.22 ∙ S= ∙ 79693 66662 83199 58380 ∙ Prima di proseguire nello studio delle fondamenta matematiche del SCA e di addentrarci nella cosiddetta fase di riconciliazione dei dati, occorre richiamare per un attimo la formula (23) sostituendo in essa la definizione di vettore dei prezzi corretti (24). Il risultato è la comparsa di una nuova componente di errore dovuta all’approssimazione che si introduce sostituendo l’incognito valore di β con β, allora definendo β = β + θ con θ ∈ M(Jx1) si ottiene I f (X0) = S – ((I X0 - X) θ+ρ+ε) ↦ S – I f (X0) = (I X0 - X) θ+ρ+ε (25) In sintesi la (25) afferma che la differenza tra i prezzi corretti ottenuti tramite ciascun elemento del campione estimativo e il VM0 è dovuto a tre componenti di errore: • quella dovuta all’utilizzo di prezzi marginali stimati o scelti da esperti (θ); • quella dovuta all’approssimazione lineare nell’intorno di X0 e che pertanto tiene conto di eventuali effetti di non linearità non trascurabili (ρ); • quella dovuta alla variabilità dei prezzi rispetto ai valori di mercato (ε). 68 Interpretazione matematico-statistica dei metodi di stima diretti Gabriele Brondino Partendo dalla formulazione generale (11) del modello del Prezzo di Compravendita il SCA elabora una strategia capace di apportare delle correzioni al vettore dei prezzi P a partire dalle differenze esistenti tra gli elementi del campione e il bene oggetto di stima X-IX0. ovvero sono i prezzi rilevati sugli elementi del campione estimativo a cui viene apportata una modifica dovuta alle differenze nei valori delle caratteristiche. Richiamando i valori delle caratteristiche rilevate sugli elementi del campione estimativo e quelle del bene oggetto di stima si ottiene che Ipotesi di linearità del modello Il fondamento matematico del SCA è il famoso sviluppo in serie di Taylor, argomento ben noto dell’Analisi Matematica. Una funzione reale continua può essere ben approssimata da un modello lineare attorno ad uno specifico punto. Così se si vuole approssimare linearmente la funzione del Valore di Mercato f in un intorno del punto rappresentato dal vettore X0 si ottiene f(Xi) = f(X0) + (Xi– X0) f’(X0) + ρi ∀i∈ {1, 2, …, n} f (X) = I f (X0 ) + (X– I X0 ) β + ρ (22) Si noti che in questo caso il vettore dei parametri β ha il medesimo significato di quello introdotto nella Regressione (formula 14). Rappresenta cioè un vettore contenente le variazioni di prezzo corrispondenti ad una variazione unitaria delle caratteristiche. Il limite matematico dell’approssimazione matematica sta nel fatto che essa vale solo in un intorno del punto X0. Al di fuori di questo intorno l’errore di approssimazione ρ può non essere trascurabile. Tutto sta nel capire quale sia l’intorno per cui l’errore sia trascurabile. Ed è proprio questo il punto debole della procedura SCA dal punto di vista pratico. Non vi sono strumenti per verificare se gli elementi del campione estimativo appartengano ad un intorno nel quale l’errore di approssimazione sia da considerarsi trascurabile. Modello di Stima Mediante alcune operazioni algebriche e richiamando il legame (11) esistente tra il vettore dei Prezzi e la funzione del Valore di Mercato si può giungere alla formulazione matematica del SCA (risultato ottenuto adattando le formulazioni contenute nell’articolo di Isakson del 2002) I f (X0 ) = f (X) − (X−I X0 ) β − ρ = P − ε − (X−I X0 ) β − ρ (23) = P + (I X0−X) β − (ρ + ε) essendo I = [1, 1, .., 1]' ∈M(nx1). Il sistema lineare (23) è costituito da n equazioni lineari aventi ciascuna come risultato il Valore di Mercato del bene oggetto di stima. Infatti If(X0) è un vettore colonna di dimensione n i cui elementi sono tutti uguali al Valore di Mercato f(X0). La formula (23) permette di scomporre il Valore di Mercato in due componenti: il cosiddetto vettore dei prezzi corretti e il vettore degli errori. I prezzi corretti S risultano pertanto definiti da S = P + (I X0 – X) β (I X0 – X) = (21) Il Valore di Mercato corrispondente al bene i del campione estimativo è una somma di tre termini: il Valore di Mercato (incognito) del bene oggetto di stima, il prodotto matriciale tra il vettore delle variazioni delle caratteristiche e la derivata prima di f nel punto X0, un termine contenente l’errore di approssimazione che si genera qualora non si considerino termini di ordine superiore al primo. Per trasformare la formula (21) in forma matriciale è sufficiente introdurre un vettore colonna I di dimensione n (24) 69 ∙ 7 −1 0 −1 0 10 −15 0 0 −5 −5 0 5 0 1 −1 −1 0 0 0 0 −2 0 0 ∙ Ancora oscuro invece è il significato del nuovo vettore introdotto β, perché non si è fatto uso del vettore β indicato nella formula (23)? Il vettore β ha per elementi le derivate prime della funzione f valutate nel punto X0 (note come prezzi marginali). Il problema è che la funzione f è incognita così come le sue derivate parziali rispetto alle caratteristiche. Ma allora come definire le componenti di β? Nella pratica tali valori sono definiti dal perito sulla base della propria esperienza e conoscenza del mercato immobiliare locale. Esiste tuttavia la possibilità di ricavare i valori delle componenti di β attraverso l’analisi dei dati, ad esempio per mezzo di un’analisi di Regressione o della cosiddetta Paired Analysis. Qualsiasi sia la strada percorsa, giudizio dell’esperto o metodi analitici, il risultato è che il vettore β potrà soltanto essere approssimato da un vettore che è stato chiamato β. Nel caso studio in esame si possono utilizzare i risultati ottenuti dalla Regressione svolta sulle 52 transazioni considerate in precedenza. Così i prezzi marginali per le caratteristiche Superficie, Stato di Conservazione e Anno di Costruzione possono essere definiti rispettivamente pari a: 1135.86, 18922.50 e 438.22 €. Di questi valori quello relativo allo Stato di Conservazione risulta inutile, essendo tale caratteristica uguale per tutti gli elementi del campione e per il bene oggetto di stima. I prezzi marginali per le altre caratteristiche si suppone siano il frutto dell’esperienza del perito così da poter affermare che β= ∙ 1135.86 3180 640 −2240 3760 438.22 ∙ S= ∙ 79693 66662 83199 58380 ∙ Prima di proseguire nello studio delle fondamenta matematiche del SCA e di addentrarci nella cosiddetta fase di riconciliazione dei dati, occorre richiamare per un attimo la formula (23) sostituendo in essa la definizione di vettore dei prezzi corretti (24). Il risultato è la comparsa di una nuova componente di errore dovuta all’approssimazione che si introduce sostituendo l’incognito valore di β con β, allora definendo β = β + θ con θ ∈ M(Jx1) si ottiene I f (X0) = S – ((I X0 - X) θ+ρ+ε) ↦ S – I f (X0) = (I X0 - X) θ+ρ+ε (25) In sintesi la (25) afferma che la differenza tra i prezzi corretti ottenuti tramite ciascun elemento del campione estimativo e il VM0 è dovuto a tre componenti di errore: • quella dovuta all’utilizzo di prezzi marginali stimati o scelti da esperti (θ); • quella dovuta all’approssimazione lineare nell’intorno di X0 e che pertanto tiene conto di eventuali effetti di non linearità non trascurabili (ρ); • quella dovuta alla variabilità dei prezzi rispetto ai valori di mercato (ε). 70 Interpretazione matematico-statistica dei metodi di stima diretti Gabriele Brondino Stima del Valore di Mercato Ricavato il vettore dei cosiddetti prezzi corretti dal punto di vista matematico la cosiddetta riconciliazione consiste semplicemente in una moltiplicazione matriciale VM0 = W'S (26) tra il vettore S e il vettore colonna dei pesi W = [w1, w2, .., wn]’ ∈ M(nx1), ovvero un vettore la cui somma degli elementi è pari a 1 o, equivalentemente, I’W=1. In questo modo si può giungere alla stima del Valore di Mercato del bene considerato nel caso studio sino ad ora analizzato utilizzando un vettore di pesi uniforme (ovvero assegnando il medesimo peso a tutti gli elementi del campione estimativo) ∙ ∙ 79693 VM0=W ' S= [ —14 1 — 1 — 4 4 1 — 4 ] 66662 83199 = 71983.65 58380 Pertanto dall’applicazione del SCA al caso studio in esame si deduce che il Valore di Mercato del bene oggetto di stima è pari a circa 71980 €. Ottenuto il risultato numerico di stima la domanda che sorge spontanea è: ma questo valore è davvero sensato? Certamente a questa domanda un esperto del mercato immobiliare della zona potrebbe dare una risposta sensata in pochi istanti basandosi sulla propria esperienza e conoscenza. Osservando tuttavia la domanda da un punto di vista matematico-statistico, la questione può essere ulteriormente approfondita cercando di rispondere alle seguenti domande: • esiste un modo per valutare la bontà della stima ottenuta (come avviene per la Regressione Lineare Multipla) o addirittura per associare ad essa una misura della sua incertezza? Si noti a tal proposito che per l’ambito estimativo il SCA è un metodo deterministico ... ma l’incertezza rimane comunque come testimoniato dalle componenti di errore presenti in (25). • è possibile cercare di studiare gli effetti generati dall’errore θ dovuto all’utilizzo del vettore β? • Esiste un metodo per cercare di individuare l’intorno del punto X0 onde limitare gli effetti che le componenti di non linearità non trascurabili (ρ) possono avere sul risultato di stima? • Esiste un metodo per determinare il vettore dei pesi W affinché la stima sia la più corretta possibile, ovvero che si avvicini al valore incognito vero del Valore di Mercato? A queste domande si cercherà di fornire una risposta facendo ricorso a grafici, alle misure di distanza e alla simulazione. Per contro la pratica attuale del SCA prevede che alla domanda sulla sensatezza dei risultati ottenuti si dia una risposta basandosi su indici che mirano a monitorare la variabilità presente nel vettore S. Ad esempio se si osservano le componenti del vettore dei prezzi corretti, si ha che la differenza tra il valore massimo e quello minimo è pari a max(S) – min(S) = 83199 – 58380 = 24819 tale cifra risulta pari al 34.5% del Valore di Mercato di Stima. Una variazione così elevata comporta immediatamente il rifiuto del risultato ottenuto. Pertanto dal punto di vista estimativo la questione si risolve andando a cercare un campione estimativo differente, oppure rivedendo il vettore dei pesi, ecc. 71 Il fatto che non sempre mediante la procedura del SCA sia possibile ottenere una stima del Valore di Mercato genera un’ulteriore questione dal punto di vista matematico: in che condizioni e con che frequenza il SCA non offre risultati accettabili? Paired Analysis Prima di tentare di rispondere alle domande emerse nella sezione precedente, sembra opportuno spendere alcune righe per cercare di comprendere la cosiddetta Paired Analysis (PA) da un punto di vista matematico. Si è già detto che tale metodologia serve a fornire una valutazione per gli elementi del vettore β. Non si è però ancora accennato al fatto che la PA è semplicemente un caso particolare del SCA e, più precisamente della formula (24). La PA può essere adottata quando nel campione estimativo si trovano due elementi aventi valori identici per tutte le caratteristiche tranne una. Purtroppo nel caso studio in esame non si hanno due elementi del campione che soddisfano tale condizione (vedi Tabella 3). Pertanto ipotizziamo di avere a che fare con due unità simili in tutto (ad esempio perché si trovano nello stesso fabbricato) tranne per il fatto che una si trova al secondo piano e l’altra al terzo. Il prezzo per la prima è risultato pari a 84000 €, quello per la seconda di 88000 €. Ci si chiede quale sia la variazione di valore dovuta alla caratteristica interazione tra Ascensore e Piano. Senza pensarci troppo verrebbe da dire 4000 €, in quanto l’unità al terzo piano ha un prezzo superiore a quella del secondo proprio pari a tale quantità. Bene, questo è esattamente il ragionamento che sta alla base del PA, e che trova la sua giustificazione nella formula (24) ove il ruolo del bene oggetto di stima viene giocato dall’unità denominata r pr = ps + (xrj− xsj) βj Proposte per la Verifica della Bontà del SCA ↦ βj = pr - ps __________ xrj− xsj (27) Il SCA è una metodologia estimativa deterministica che si fonda sull’approssimazione lineare della funzione del Valore di Mercato nell’intorno del punto X0. Risulta pertanto necessario verificare che • l’approssimazione lineare sia ragionevole; • i valori assegnati alle componenti del vettore β siano sensati; • gli elementi del campione estimativo si trovino in un intorno di X0. Per cercare di verificare la bontà di tali ipotesi proponiamo innanzitutto di utilizzare dei grafici di dispersione. Rappresentando su di un piano cartesiano i Prezzi di Compravendita dei beni del campione estimativo (ordinate) rispetto ai corrispondenti valori delle caratteristiche (ascisse) si ottengono tanti diagrammi di dispersione quante sono le caratteristiche utilizzate nel SCA (Illustrazione 2). Ai diagrammi così ottenuti si aggiungono due curve, la prima (tratteggiata) è ottenuta mediante metodi di approssimazione non parametrici. La seconda (segmento rosso) è un segmento di retta che ha come pendenza il prezzo marginale della caratteristica e passa per la stima del Valore di Mercato (quadrato rosso). Dal confronto degli andamenti delle due curve si possono fare considerazioni in merito all’ipotesi che l’approssimazione lineare sia ragionevole. Più le due curve si sovrappongono, più l’ipotesi risulta accettabile. Viceversa se le due curve seguono andamenti differenti allora l’approssimazione lineare può considerarsi debole e, conseguentemente, l’errore θ potrebbe non essere così trascurabile. Dall’osservazione dei grafici di dispersione di Illustrazione 2 si evince che nel caso di studio in esame l’approssimazione lineare introdotta per la caratteristica Piano risulta inaccettabile. In tal caso, infatti, dai dati del campione pare che il Prezzo aumenti con andamento quadratico al crescere del Piano. Tuttavia la retta tracciata utilizzando il prezzo marginale della caratteristica Piano indica che il Prezzo dovrebbe decrescere 70 Interpretazione matematico-statistica dei metodi di stima diretti Gabriele Brondino Stima del Valore di Mercato Ricavato il vettore dei cosiddetti prezzi corretti dal punto di vista matematico la cosiddetta riconciliazione consiste semplicemente in una moltiplicazione matriciale VM0 = W'S (26) tra il vettore S e il vettore colonna dei pesi W = [w1, w2, .., wn]’ ∈ M(nx1), ovvero un vettore la cui somma degli elementi è pari a 1 o, equivalentemente, I’W=1. In questo modo si può giungere alla stima del Valore di Mercato del bene considerato nel caso studio sino ad ora analizzato utilizzando un vettore di pesi uniforme (ovvero assegnando il medesimo peso a tutti gli elementi del campione estimativo) ∙ ∙ 79693 VM0=W ' S= [ —14 1 — 1 — 4 4 1 — 4 ] 66662 83199 = 71983.65 58380 Pertanto dall’applicazione del SCA al caso studio in esame si deduce che il Valore di Mercato del bene oggetto di stima è pari a circa 71980 €. Ottenuto il risultato numerico di stima la domanda che sorge spontanea è: ma questo valore è davvero sensato? Certamente a questa domanda un esperto del mercato immobiliare della zona potrebbe dare una risposta sensata in pochi istanti basandosi sulla propria esperienza e conoscenza. Osservando tuttavia la domanda da un punto di vista matematico-statistico, la questione può essere ulteriormente approfondita cercando di rispondere alle seguenti domande: • esiste un modo per valutare la bontà della stima ottenuta (come avviene per la Regressione Lineare Multipla) o addirittura per associare ad essa una misura della sua incertezza? Si noti a tal proposito che per l’ambito estimativo il SCA è un metodo deterministico ... ma l’incertezza rimane comunque come testimoniato dalle componenti di errore presenti in (25). • è possibile cercare di studiare gli effetti generati dall’errore θ dovuto all’utilizzo del vettore β? • Esiste un metodo per cercare di individuare l’intorno del punto X0 onde limitare gli effetti che le componenti di non linearità non trascurabili (ρ) possono avere sul risultato di stima? • Esiste un metodo per determinare il vettore dei pesi W affinché la stima sia la più corretta possibile, ovvero che si avvicini al valore incognito vero del Valore di Mercato? A queste domande si cercherà di fornire una risposta facendo ricorso a grafici, alle misure di distanza e alla simulazione. Per contro la pratica attuale del SCA prevede che alla domanda sulla sensatezza dei risultati ottenuti si dia una risposta basandosi su indici che mirano a monitorare la variabilità presente nel vettore S. Ad esempio se si osservano le componenti del vettore dei prezzi corretti, si ha che la differenza tra il valore massimo e quello minimo è pari a max(S) – min(S) = 83199 – 58380 = 24819 tale cifra risulta pari al 34.5% del Valore di Mercato di Stima. Una variazione così elevata comporta immediatamente il rifiuto del risultato ottenuto. Pertanto dal punto di vista estimativo la questione si risolve andando a cercare un campione estimativo differente, oppure rivedendo il vettore dei pesi, ecc. 71 Il fatto che non sempre mediante la procedura del SCA sia possibile ottenere una stima del Valore di Mercato genera un’ulteriore questione dal punto di vista matematico: in che condizioni e con che frequenza il SCA non offre risultati accettabili? Paired Analysis Prima di tentare di rispondere alle domande emerse nella sezione precedente, sembra opportuno spendere alcune righe per cercare di comprendere la cosiddetta Paired Analysis (PA) da un punto di vista matematico. Si è già detto che tale metodologia serve a fornire una valutazione per gli elementi del vettore β. Non si è però ancora accennato al fatto che la PA è semplicemente un caso particolare del SCA e, più precisamente della formula (24). La PA può essere adottata quando nel campione estimativo si trovano due elementi aventi valori identici per tutte le caratteristiche tranne una. Purtroppo nel caso studio in esame non si hanno due elementi del campione che soddisfano tale condizione (vedi Tabella 3). Pertanto ipotizziamo di avere a che fare con due unità simili in tutto (ad esempio perché si trovano nello stesso fabbricato) tranne per il fatto che una si trova al secondo piano e l’altra al terzo. Il prezzo per la prima è risultato pari a 84000 €, quello per la seconda di 88000 €. Ci si chiede quale sia la variazione di valore dovuta alla caratteristica interazione tra Ascensore e Piano. Senza pensarci troppo verrebbe da dire 4000 €, in quanto l’unità al terzo piano ha un prezzo superiore a quella del secondo proprio pari a tale quantità. Bene, questo è esattamente il ragionamento che sta alla base del PA, e che trova la sua giustificazione nella formula (24) ove il ruolo del bene oggetto di stima viene giocato dall’unità denominata r pr = ps + (xrj− xsj) βj Proposte per la Verifica della Bontà del SCA ↦ βj = pr - ps __________ xrj− xsj (27) Il SCA è una metodologia estimativa deterministica che si fonda sull’approssimazione lineare della funzione del Valore di Mercato nell’intorno del punto X0. Risulta pertanto necessario verificare che • l’approssimazione lineare sia ragionevole; • i valori assegnati alle componenti del vettore β siano sensati; • gli elementi del campione estimativo si trovino in un intorno di X0. Per cercare di verificare la bontà di tali ipotesi proponiamo innanzitutto di utilizzare dei grafici di dispersione. Rappresentando su di un piano cartesiano i Prezzi di Compravendita dei beni del campione estimativo (ordinate) rispetto ai corrispondenti valori delle caratteristiche (ascisse) si ottengono tanti diagrammi di dispersione quante sono le caratteristiche utilizzate nel SCA (Illustrazione 2). Ai diagrammi così ottenuti si aggiungono due curve, la prima (tratteggiata) è ottenuta mediante metodi di approssimazione non parametrici. La seconda (segmento rosso) è un segmento di retta che ha come pendenza il prezzo marginale della caratteristica e passa per la stima del Valore di Mercato (quadrato rosso). Dal confronto degli andamenti delle due curve si possono fare considerazioni in merito all’ipotesi che l’approssimazione lineare sia ragionevole. Più le due curve si sovrappongono, più l’ipotesi risulta accettabile. Viceversa se le due curve seguono andamenti differenti allora l’approssimazione lineare può considerarsi debole e, conseguentemente, l’errore θ potrebbe non essere così trascurabile. Dall’osservazione dei grafici di dispersione di Illustrazione 2 si evince che nel caso di studio in esame l’approssimazione lineare introdotta per la caratteristica Piano risulta inaccettabile. In tal caso, infatti, dai dati del campione pare che il Prezzo aumenti con andamento quadratico al crescere del Piano. Tuttavia la retta tracciata utilizzando il prezzo marginale della caratteristica Piano indica che il Prezzo dovrebbe decrescere 72 Interpretazione matematico-statistica dei metodi di stima diretti Gabriele Brondino linearmente. L’ipotesi di linearità non è dunque in questo caso ragionevole così come pare discutibile pure il valore prescelto di prezzo marginale. 73 La matrice H è costituita da n+1 righe che rappresentano le differenze tra i valori delle caratteristiche rilevate sul bene oggetto di stima e quelli rilevati sugli elementi del campione estimativo. La prima riga è costituita da J valori nulli perché si riferisce al bene oggetto di stima medesimo. Nel caso studio da noi analizzato si ottiene H= ∙ 0 0 7 −1 −15 0 5 0 0 0 0 0 0 1 0 0 0 0 −1 0 10 −5 −5 0 −1 −1 0 −2 0 0 ∙ La matrice H è costituita da J colonne che fanno riferimento alle rispettive caratteristiche utilizzate nella stima del Valore di Mercato. I valori numerici contenuti nelle differenti colonne sono espressi in differenti unità di misura. Ad esempio nel caso in esame la prima colonna contiene le differenze di m2 esistenti tra il bene oggetto di stima e gli elementi del campione, mentre la seconda esprime una differenza nel numero di balconi. Da quanto detto non è dunque possibile procedere al calcolo di una matrice delle distanze tra le righe di H senza una previa normalizzazione o una qualche altra trasformazione. Un’altra osservazione che va fatta riguarda il peso che ogni caratteristica ha nella stima di VM0. Il fatto che gli elementi del vettore dei prezzi marginali non siano tutti uguali testimonia come le colonne della matrice I X0-X influenzino la stima del Valore di Mercato in maniera differente. Sulla base di quest’ultima considerazione si suggerisce di calcolare la matrice delle distanze partendo da Illustrazione 2 Grafici di dispersione del Prezzo rispetto alle caratteristiche utilizzate nel SCA. I quadrati neri sono i valori rilevati sul campione estimativo. La curva tratteggiata è la stima non parametrica dell'andamento dei Prezzi rispetto alla caratteristica considerata. Il quadrato rosso rappresenta la stima del Valore di Mercato del bene oggetto di stima. La curva rossa è ottenuta utilizzando il prezzo marginale della caratteristica analizzata. I grafici di dispersione sopra descritti sono molto utili per verificare la bontà dell’approssimazione lineare e la sensatezza delle componenti di β. Tuttavia non sono di grande aiuto nella verifica che gli elementi del campione estimativo si trovino in un intorno del punto X0. Per cercare di svolgere questo compito si propone di ricorrere alla costruzione di una matrice delle distanze tra il bene oggetto di stima e gli elementi del campione estimativo. Tale matrice deve contenere dei numeri capaci di esprimere la distanza tra un bene e l’altro rispetto alle differenze dovute ai differenti valori assunti dalle caratteristiche prese in considerazione. Per giungere alla costruzione di tale matrice occorre innanzitutto partire dalla seguente definizione H= ∙ 01xJ I X0− X ∙ ∈m(n+1)xJ (28) H diag (β)∈M(n+1)×J (29) Questa nuova matrice è composta da colonne aventi tutte la medesima unità di misura: gli euro! I valori di questa matrice sono le correzioni (o aggiustamenti) che sono dovute ai differenti beni e alle diverse caratteristiche. Infatti diag (β) è una matrice quadrata avente tutti gli elementi nulli eccetto quelli sulla diagonale principale che sono pari ai prezzi marginali diag (β) = ∙ 1135.86 0 0 0 0 0 0 3180 0 0 0 0 0 0 640 0 0 0 0 0 0 −2240 0 0 0 0 0 0 3370 0 0 0 0 0 0 438.22 ∙ allora si ottiene che H diag (β) = ∙ 0 7951 −17038 5679 0 0 −3180 0 0 0 0 0 0 640 0 0 2240 11200 2240 4480 0 0 −18800 −3760 0 0 4382 0 0 0 ∙ 72 Interpretazione matematico-statistica dei metodi di stima diretti Gabriele Brondino linearmente. L’ipotesi di linearità non è dunque in questo caso ragionevole così come pare discutibile pure il valore prescelto di prezzo marginale. 73 La matrice H è costituita da n+1 righe che rappresentano le differenze tra i valori delle caratteristiche rilevate sul bene oggetto di stima e quelli rilevati sugli elementi del campione estimativo. La prima riga è costituita da J valori nulli perché si riferisce al bene oggetto di stima medesimo. Nel caso studio da noi analizzato si ottiene H= ∙ 0 0 7 −1 −15 0 5 0 0 0 0 0 0 1 0 0 0 0 −1 0 10 −5 −5 0 −1 −1 0 −2 0 0 ∙ La matrice H è costituita da J colonne che fanno riferimento alle rispettive caratteristiche utilizzate nella stima del Valore di Mercato. I valori numerici contenuti nelle differenti colonne sono espressi in differenti unità di misura. Ad esempio nel caso in esame la prima colonna contiene le differenze di m2 esistenti tra il bene oggetto di stima e gli elementi del campione, mentre la seconda esprime una differenza nel numero di balconi. Da quanto detto non è dunque possibile procedere al calcolo di una matrice delle distanze tra le righe di H senza una previa normalizzazione o una qualche altra trasformazione. Un’altra osservazione che va fatta riguarda il peso che ogni caratteristica ha nella stima di VM0. Il fatto che gli elementi del vettore dei prezzi marginali non siano tutti uguali testimonia come le colonne della matrice I X0-X influenzino la stima del Valore di Mercato in maniera differente. Sulla base di quest’ultima considerazione si suggerisce di calcolare la matrice delle distanze partendo da Illustrazione 2 Grafici di dispersione del Prezzo rispetto alle caratteristiche utilizzate nel SCA. I quadrati neri sono i valori rilevati sul campione estimativo. La curva tratteggiata è la stima non parametrica dell'andamento dei Prezzi rispetto alla caratteristica considerata. Il quadrato rosso rappresenta la stima del Valore di Mercato del bene oggetto di stima. La curva rossa è ottenuta utilizzando il prezzo marginale della caratteristica analizzata. I grafici di dispersione sopra descritti sono molto utili per verificare la bontà dell’approssimazione lineare e la sensatezza delle componenti di β. Tuttavia non sono di grande aiuto nella verifica che gli elementi del campione estimativo si trovino in un intorno del punto X0. Per cercare di svolgere questo compito si propone di ricorrere alla costruzione di una matrice delle distanze tra il bene oggetto di stima e gli elementi del campione estimativo. Tale matrice deve contenere dei numeri capaci di esprimere la distanza tra un bene e l’altro rispetto alle differenze dovute ai differenti valori assunti dalle caratteristiche prese in considerazione. Per giungere alla costruzione di tale matrice occorre innanzitutto partire dalla seguente definizione H= ∙ 01xJ I X0− X ∙ ∈m(n+1)xJ (28) H diag (β)∈M(n+1)×J (29) Questa nuova matrice è composta da colonne aventi tutte la medesima unità di misura: gli euro! I valori di questa matrice sono le correzioni (o aggiustamenti) che sono dovute ai differenti beni e alle diverse caratteristiche. Infatti diag (β) è una matrice quadrata avente tutti gli elementi nulli eccetto quelli sulla diagonale principale che sono pari ai prezzi marginali diag (β) = ∙ 1135.86 0 0 0 0 0 0 3180 0 0 0 0 0 0 640 0 0 0 0 0 0 −2240 0 0 0 0 0 0 3370 0 0 0 0 0 0 438.22 ∙ allora si ottiene che H diag (β) = ∙ 0 7951 −17038 5679 0 0 −3180 0 0 0 0 0 0 640 0 0 2240 11200 2240 4480 0 0 −18800 −3760 0 0 4382 0 0 0 ∙ Interpretazione matematico-statistica dei metodi di stima diretti Gabriele Brondino La matrice così ottenuta consente di poter affermare che, a causa della differenza di superficie esistente tra il bene oggetto di stima e il primo elemento del campione estimativo (seconda riga), la correzione di prezzo risulta pari a 7951 €; mentre il fatto che il primo elemento del campione estimativo abbia due balconi, ovvero uno in più del bene oggetto di stima, comporta che il suo prezzo di vendita debba essere deprezzato di una quantità pari a 3180 €. La matrice così ottenuta è composta da elementi misurati sulla medesima scala di misura (€) e ha colonne correttamente pesate. Ne consegue che risulta un candidato ideale per costruire la matrice delle distanze D = dist (H diag (β)) ∈M(n+1)x(n+1) (30) La matrice D è ottenuta applicando la distanza euclidea tra le coppie di vettori riga di H diag(β). Gli elementi di questa matrice misurano la distanza tra il bene oggetto di stima e gli elementi del campione estimativo in €. Così se si vuole avere un’indicazione di quale sia la distanza esistente tra il bene oggetto di stima e gli elementi del campione estimativo è sufficiente osservare i valori della prima riga (o colonna). D= ∙ 0 9877 27734 7199 4480 9877 0 32977 7002 9877 27734 32977 0 28687 26247 7199 7002 28687 0 7199 ∙ 4480 9877 26247 7199 0 Le distanze tra il bene oggetto di stima e gli elementi del campione estimativo risultano pari rispettivamente a 9877, 27734, 7199 e 4480 €. Questi valori consentono di individuare quali siano gli elementi del campione estimativo più vicini al bene oggetto di stima. E, conseguentemente, possono essere di grande utilità nel definire un intorno per il punto X0. A tal proposito si suggerisce di applicare la metodologia statistica nota come Multidimensional Scaling (Hastie et al., 2001) per ottenere una rappresentazione grafica della matrice delle distanze D. Proposte per la definizione del vettore pesi W Sviluppando algebricamente la formulazione della stima del Valore di Mercato (26) si può giungere alla definizione della differenza tra la stima di VM0 e il valore della funzione del Valore di Mercato nel punto X0 |VM0 – f(X0)| = |W’S – W’I f (X0)|= W’((I X0 - X) θ+ρ+ε) 1 4 5000 10000 15000 20000 25000 30000 2 3 Illustrazione 3 Rappresentazione grafica della proiezione sul piano della matrice delle distanze (Multidimensional Scaling) -5 0 0 0 0 5000 10000 15000 20000 25000 La mappa rappresentata in Illustrazione 3 è stata ottenuta applicando il metodo della Multidimensional Scaling metrico sulla matrice delle distanze D. Illustrazione 1: Rappresentazione grafica della proiezione sul piano della matrice delle distanze (Multidimensional Scaling). (31) Dalla (31) si evince che per cercare di minimizzare l’errore di stima occorre cercare di rendere minimi i seguenti termini W’(I X0 - X) θ e W’ρ. Il primo dei due termini di errore è funzione delle differenze di valori osservate tra il bene oggetto di stima e gli elementi del campione I X0-X. Ne consegue che i beni del campione estimativo più distanti dal bene oggetto di stima generano errori di maggiore entità. Allo stesso modo il secondo termine di errore assume valori più elevati quando si considerano beni di comparazione più distanti dal bene oggetto di stima. Infatti, in presenza di funzioni del Valore di Mercato non troppo irregolari, l’errore di approssimazione lineare si fa più elevato man mano che ci si allontana dal bene oggetto di stima. Per cercare di limitare gli effetti negativi generati dai beni di comparazione più distanti dal bene oggetto di stima si propone di utilizzare un vettore pesi W definito mediante la prima riga (o colonna) della matrice D. Ad esempio 5000 -5 0 0 0 0 0 75 Il grafico è di facile lettura, il punto rosso rappresenta il bene oggetto di stima mentre gli altri punti sono i quattro elementi del campione estimativo. Senza grandi difficoltà si deduce che il secondo elemento del campione ha una distanza dal bene oggetto di stima superiore a 25000 € e ha, rispetto agli altri tre elementi del campione, una posizione marginale. Per cercare di limitare gli errori introdotti dall’approssimazione lineare della funzione del Valore di Mercato si può pertanto decidere di eliminare dal campione estimativo il secondo elemento. Tuttavia questa decisione comporterebbe un’ulteriore diminuzione della già scarsa numerosità campionaria. Allora, sempre partendo dalla semplice osservazione della mappa bidimensionale, si può decidere di utilizzare un vettore pesi W che dipenda dalle distanze degli elementi dal bene oggetto di stima. W' = -1 0 0 0 0 74 ∙ d-1 d-1 12 13 __________ __________ Σ d-1 1j ••• Σ d-1 1j d-1 1(n+1) __________ Σ d-1 1j ∙ (32) Questo vettore assegna un peso agli elementi del campione che è inversamente proporzionale alla loro distanza dal bene oggetto di stima. Ovviamente l’applicazione di un tale vettore peso genera una stima del Valore di Mercato differente da quella ottenuta in precedenza (adottando un vettore di pesi uniforme), infatti VM0 = W'S = [0.202 0.072 0.278 0.447] ∙ ∙ 79693 66662 83199 58380 = 70202.04 Interpretazione matematico-statistica dei metodi di stima diretti Gabriele Brondino La matrice così ottenuta consente di poter affermare che, a causa della differenza di superficie esistente tra il bene oggetto di stima e il primo elemento del campione estimativo (seconda riga), la correzione di prezzo risulta pari a 7951 €; mentre il fatto che il primo elemento del campione estimativo abbia due balconi, ovvero uno in più del bene oggetto di stima, comporta che il suo prezzo di vendita debba essere deprezzato di una quantità pari a 3180 €. La matrice così ottenuta è composta da elementi misurati sulla medesima scala di misura (€) e ha colonne correttamente pesate. Ne consegue che risulta un candidato ideale per costruire la matrice delle distanze D = dist (H diag (β)) ∈M(n+1)x(n+1) (30) La matrice D è ottenuta applicando la distanza euclidea tra le coppie di vettori riga di H diag(β). Gli elementi di questa matrice misurano la distanza tra il bene oggetto di stima e gli elementi del campione estimativo in €. Così se si vuole avere un’indicazione di quale sia la distanza esistente tra il bene oggetto di stima e gli elementi del campione estimativo è sufficiente osservare i valori della prima riga (o colonna). D= ∙ 0 9877 27734 7199 4480 9877 0 32977 7002 9877 27734 32977 0 28687 26247 7199 7002 28687 0 7199 ∙ 4480 9877 26247 7199 0 Le distanze tra il bene oggetto di stima e gli elementi del campione estimativo risultano pari rispettivamente a 9877, 27734, 7199 e 4480 €. Questi valori consentono di individuare quali siano gli elementi del campione estimativo più vicini al bene oggetto di stima. E, conseguentemente, possono essere di grande utilità nel definire un intorno per il punto X0. A tal proposito si suggerisce di applicare la metodologia statistica nota come Multidimensional Scaling (Hastie et al., 2001) per ottenere una rappresentazione grafica della matrice delle distanze D. Proposte per la definizione del vettore pesi W Sviluppando algebricamente la formulazione della stima del Valore di Mercato (26) si può giungere alla definizione della differenza tra la stima di VM0 e il valore della funzione del Valore di Mercato nel punto X0 |VM0 – f(X0)| = |W’S – W’I f (X0)|= W’((I X0 - X) θ+ρ+ε) 1 4 5000 10000 15000 20000 25000 30000 2 3 Illustrazione 3 Rappresentazione grafica della proiezione sul piano della matrice delle distanze (Multidimensional Scaling) -5 0 0 0 0 5000 10000 15000 20000 25000 La mappa rappresentata in Illustrazione 3 è stata ottenuta applicando il metodo della Multidimensional Scaling metrico sulla matrice delle distanze D. Illustrazione 1: Rappresentazione grafica della proiezione sul piano della matrice delle distanze (Multidimensional Scaling). (31) Dalla (31) si evince che per cercare di minimizzare l’errore di stima occorre cercare di rendere minimi i seguenti termini W’(I X0 - X) θ e W’ρ. Il primo dei due termini di errore è funzione delle differenze di valori osservate tra il bene oggetto di stima e gli elementi del campione I X0-X. Ne consegue che i beni del campione estimativo più distanti dal bene oggetto di stima generano errori di maggiore entità. Allo stesso modo il secondo termine di errore assume valori più elevati quando si considerano beni di comparazione più distanti dal bene oggetto di stima. Infatti, in presenza di funzioni del Valore di Mercato non troppo irregolari, l’errore di approssimazione lineare si fa più elevato man mano che ci si allontana dal bene oggetto di stima. Per cercare di limitare gli effetti negativi generati dai beni di comparazione più distanti dal bene oggetto di stima si propone di utilizzare un vettore pesi W definito mediante la prima riga (o colonna) della matrice D. Ad esempio 5000 -5 0 0 0 0 0 75 Il grafico è di facile lettura, il punto rosso rappresenta il bene oggetto di stima mentre gli altri punti sono i quattro elementi del campione estimativo. Senza grandi difficoltà si deduce che il secondo elemento del campione ha una distanza dal bene oggetto di stima superiore a 25000 € e ha, rispetto agli altri tre elementi del campione, una posizione marginale. Per cercare di limitare gli errori introdotti dall’approssimazione lineare della funzione del Valore di Mercato si può pertanto decidere di eliminare dal campione estimativo il secondo elemento. Tuttavia questa decisione comporterebbe un’ulteriore diminuzione della già scarsa numerosità campionaria. Allora, sempre partendo dalla semplice osservazione della mappa bidimensionale, si può decidere di utilizzare un vettore pesi W che dipenda dalle distanze degli elementi dal bene oggetto di stima. W' = -1 0 0 0 0 74 ∙ d-1 d-1 12 13 __________ __________ Σ d-1 1j ••• Σ d-1 1j d-1 1(n+1) __________ Σ d-1 1j ∙ (32) Questo vettore assegna un peso agli elementi del campione che è inversamente proporzionale alla loro distanza dal bene oggetto di stima. Ovviamente l’applicazione di un tale vettore peso genera una stima del Valore di Mercato differente da quella ottenuta in precedenza (adottando un vettore di pesi uniforme), infatti VM0 = W'S = [0.202 0.072 0.278 0.447] ∙ ∙ 79693 66662 83199 58380 = 70202.04 Interpretazione matematico-statistica dei metodi di stima diretti Gabriele Brondino Tabella 4 Distribuzioni ed indici dei Prezzi marginali delle caratteristiche Caratteristica Distrib Min Max Superficie Normale Balconi Uniforme 3100 3300 Cantina Uniforme 600 650 Piano Uniforme -2250 -2230 Ascensore Uniforme 3700 3800 Anno Normale Media St.Dev 1135.86 254.53 438.22 116.79 8 e -0 4 Si è già detto che il vettore β dei cosiddetti prezzi marginali è in realtà incognito. Esso viene stimato con β da parte di esperti dando però origine alla componente di errore θ. In precedenza ci si è chiesti se fosse possibile studiare gli effetti generati da θ sull’errore di stima. Alla luce della formula (31) la risposta è positiva. Infatti ipotizzando una distribuzione di probabilità per il vettore θ si può ricavare l’andamento distribuzionale della differenza tra la stima del Valore di Mercato e il valore della funzione in X0. Tale soluzione è certamente molto interessante da un punto di vista teorico perché consente di poter valutare la correttezza dello stimatore del Valore di Mercato ottenuto mediante SCA. Tuttavia dal punto di vista pratico esiste un’altra questione molto interessante: è possibile associare al giudizio di stima una misura della sua incertezza? Il SCA viene considerato un metodo deterministico e la stima del Valore di Mercato non viene accompagnata da nessuna misura di incertezza. Le cosiddette stime intervallari, infatti, sono attualmente appannaggio esclusivamente delle procedure statistiche, quali ad esempio la Regressione Lineare Multipla. Ma componenti di incertezza sono presenti anche in una stima ottenuta mediante SCA. In particolare le componenti del vettore β vengono definite dagli esperti in condizioni che raramente possono definirsi certe. Si consideri ad esempio il prezzo marginale della variabile Balconi nel caso di studio analizzato: 3180 €. Questo valore può essere ottenuto consultando bollettini del settore, oppure interrogando un certo numero di esperti del mercato immobiliare locale. In questo secondo caso occorre chiedersi se sia possibile che tutti gli esperti interrogati abbiano indicato esattamente in 3180 € l’incremento di valore dovuto alla presenza di un balcone in più. Più ragionevolmente gli esperti contattati hanno indicato valori compresi in un intervallo, ad esempio tra 3100 e 3300 €. Il prezzo marginale utilizzato con buona probabilità è semplicemente la media dei valori ottenuti interrogando il campione di esperti del settore. Ma allora occorre chiedersi se è possibile studiare gli effetti sulla stima del Valore di Mercato generati dall’incertezza nella definizione del prezzo marginale di una caratteristica. Ricorrendo alla simulazione Monte Carlo è possibile studiare l’incertezza di stima nel Valore di Mercato che si viene a generare partendo da valori incerti delle componenti del vettore β. Supponiamo a titolo esemplificativo che tutte le componenti del vettore dei prezzi marginali siano affette da incertezza. In particolare si ipotizzi che i valori puntuali del vettore β siano sostituiti da variabili casuali secondo quanto indicato in Tabella 4. I prezzi marginali delle caratteristiche Superficie e Anno di Costruzione sono stati ottenuti da un’analisi di regressione. Per questo motivo ad essi è stata assegnata una distribuzione gaussiana (normale) avente come valore medio quello utilizzato in precedenza come valore puntuale, e come deviazione standard il valore di Standard Error di Tabella 2. L’incertezza nell’assegnazione dei prezzi marginali delle restanti caratteristiche si è ipotizzato possa essere descritta mediante delle variabili casuali uniformi. Gli estremi delle variabili casuali uniformi sono stati scelti a caso. L’obiettivo di queste righe è, infatti, quello di mostrare la facilità con la quale si può gestire esplicitamente l’incertezza presente in una procedura di SCA. Non è invece compito di queste righe di discutere il metodo più corretto per rappresentare l’incertezza nell’assegnazione dei prezzi marginali (si auspica tuttavia un approfondimento di tale argomento). Trasformate in variabili casuali le componenti del vettore β la simulazione Monte Carlo consiste nel ripetere la procedura di stima del Valore di Mercato per un numero desiderato di volte (nel nostro caso 10000). In ciascuna di queste iterazioni si provvede ad estrarre casualmente dei prezzi marginali dalle distribuzioni indicate in Tabella 4. Il risultato che si ottiene dall’applicazione della simulazione Monte Carlo è un insieme di 10000 stime del Valore di Mercato. L’Illustrazione 4 contiene una rappresentazione grafica della distribuzione empirica di questo insieme di realizzazioni. 4 e -0 4 Proposte per lo studio dell’incertezza di stima 77 0e+00 La stima del Valore di Mercato così ottenuta è da preferirsi a quella ricavata mediante un vettore pesi uniforme. Infatti, gli effetti negativi dovuti al secondo elemento del campione estimativo (vedi Illustrazione 3) risultano smorzati dal valore del peso utilizzato: 0.072 a fronte del precedente ¼. Si sottolinea infine come il vettore (32) rappresenti soltanto una delle molteplici alternative percorribili nella definizione del vettore pesi. Densità D e n s ity 76 68500 69000 69500 70000 70500 71000 N N= =1 10000 0 0 0 0 Bandwidth B a n d w i d t h= 47.3 = 4 7 .3 Illustrazione 1: Funzione di empirica densità della empirica della Stima del Valore dimediante Mercatole ottenuta Illustrazione 4 Funzione di densità Stima del Valore di Mercato ottenuta 10000 replicazioni della medianteMonte le 10000 replicazioni della simulazione Monte 69940, Carlo. mediana Indici statistici: minimo simulazione Carlo. Indici statistici: minimo 68740, primo quartile 70180, media 70160, terzo quartile 70400, massimo 71050 68740, primo quartile 69940, mediana 70180, media 70160, terzo quartile 70400, massimo 71050. La media calcolata sulle 10000 stime ottenute via Monte Carlo risulta pari a 70160 €. Tale valore risulta prossimo al valore puntuale precedentemente ottenuto, 70202.04 €. Tuttavia ben più interessante è notare come, grazie alla simulazione, è possibile associare alla stima puntuale anche un’indicazione dell’incertezza di stima dovuta alla procedura di assegnazione dei prezzi marginali. Per esempio si può indicare che le 10000 simulazioni hanno generato stime del Valore di Mercato comprese tra un minimo di 68740 € e un massimo di 71050 €. Da notare che questo non è un intervallo di fiducia. BIBLIOGRAFIA Hastie T., Tibshirani R., Friedman J., The Element of Statistical Learning. Data Mining, Inference and Prediction. Springer, 2001. Isakson H. R., The Linear Algebra of the Sales Comparison Approach, Journal of Real Estate Research, 24(2), pagg117-128, 2002. Interpretazione matematico-statistica dei metodi di stima diretti Gabriele Brondino Tabella 4 Distribuzioni ed indici dei Prezzi marginali delle caratteristiche Caratteristica Distrib Min Max Superficie Normale Balconi Uniforme 3100 3300 Cantina Uniforme 600 650 Piano Uniforme -2250 -2230 Ascensore Uniforme 3700 3800 Anno Normale Media St.Dev 1135.86 254.53 438.22 116.79 8 e -0 4 Si è già detto che il vettore β dei cosiddetti prezzi marginali è in realtà incognito. Esso viene stimato con β da parte di esperti dando però origine alla componente di errore θ. In precedenza ci si è chiesti se fosse possibile studiare gli effetti generati da θ sull’errore di stima. Alla luce della formula (31) la risposta è positiva. Infatti ipotizzando una distribuzione di probabilità per il vettore θ si può ricavare l’andamento distribuzionale della differenza tra la stima del Valore di Mercato e il valore della funzione in X0. Tale soluzione è certamente molto interessante da un punto di vista teorico perché consente di poter valutare la correttezza dello stimatore del Valore di Mercato ottenuto mediante SCA. Tuttavia dal punto di vista pratico esiste un’altra questione molto interessante: è possibile associare al giudizio di stima una misura della sua incertezza? Il SCA viene considerato un metodo deterministico e la stima del Valore di Mercato non viene accompagnata da nessuna misura di incertezza. Le cosiddette stime intervallari, infatti, sono attualmente appannaggio esclusivamente delle procedure statistiche, quali ad esempio la Regressione Lineare Multipla. Ma componenti di incertezza sono presenti anche in una stima ottenuta mediante SCA. In particolare le componenti del vettore β vengono definite dagli esperti in condizioni che raramente possono definirsi certe. Si consideri ad esempio il prezzo marginale della variabile Balconi nel caso di studio analizzato: 3180 €. Questo valore può essere ottenuto consultando bollettini del settore, oppure interrogando un certo numero di esperti del mercato immobiliare locale. In questo secondo caso occorre chiedersi se sia possibile che tutti gli esperti interrogati abbiano indicato esattamente in 3180 € l’incremento di valore dovuto alla presenza di un balcone in più. Più ragionevolmente gli esperti contattati hanno indicato valori compresi in un intervallo, ad esempio tra 3100 e 3300 €. Il prezzo marginale utilizzato con buona probabilità è semplicemente la media dei valori ottenuti interrogando il campione di esperti del settore. Ma allora occorre chiedersi se è possibile studiare gli effetti sulla stima del Valore di Mercato generati dall’incertezza nella definizione del prezzo marginale di una caratteristica. Ricorrendo alla simulazione Monte Carlo è possibile studiare l’incertezza di stima nel Valore di Mercato che si viene a generare partendo da valori incerti delle componenti del vettore β. Supponiamo a titolo esemplificativo che tutte le componenti del vettore dei prezzi marginali siano affette da incertezza. In particolare si ipotizzi che i valori puntuali del vettore β siano sostituiti da variabili casuali secondo quanto indicato in Tabella 4. I prezzi marginali delle caratteristiche Superficie e Anno di Costruzione sono stati ottenuti da un’analisi di regressione. Per questo motivo ad essi è stata assegnata una distribuzione gaussiana (normale) avente come valore medio quello utilizzato in precedenza come valore puntuale, e come deviazione standard il valore di Standard Error di Tabella 2. L’incertezza nell’assegnazione dei prezzi marginali delle restanti caratteristiche si è ipotizzato possa essere descritta mediante delle variabili casuali uniformi. Gli estremi delle variabili casuali uniformi sono stati scelti a caso. L’obiettivo di queste righe è, infatti, quello di mostrare la facilità con la quale si può gestire esplicitamente l’incertezza presente in una procedura di SCA. Non è invece compito di queste righe di discutere il metodo più corretto per rappresentare l’incertezza nell’assegnazione dei prezzi marginali (si auspica tuttavia un approfondimento di tale argomento). Trasformate in variabili casuali le componenti del vettore β la simulazione Monte Carlo consiste nel ripetere la procedura di stima del Valore di Mercato per un numero desiderato di volte (nel nostro caso 10000). In ciascuna di queste iterazioni si provvede ad estrarre casualmente dei prezzi marginali dalle distribuzioni indicate in Tabella 4. Il risultato che si ottiene dall’applicazione della simulazione Monte Carlo è un insieme di 10000 stime del Valore di Mercato. L’Illustrazione 4 contiene una rappresentazione grafica della distribuzione empirica di questo insieme di realizzazioni. 4 e -0 4 Proposte per lo studio dell’incertezza di stima 77 0e+00 La stima del Valore di Mercato così ottenuta è da preferirsi a quella ricavata mediante un vettore pesi uniforme. Infatti, gli effetti negativi dovuti al secondo elemento del campione estimativo (vedi Illustrazione 3) risultano smorzati dal valore del peso utilizzato: 0.072 a fronte del precedente ¼. Si sottolinea infine come il vettore (32) rappresenti soltanto una delle molteplici alternative percorribili nella definizione del vettore pesi. Densità D e n s ity 76 68500 69000 69500 70000 70500 71000 N N= =1 10000 0 0 0 0 Bandwidth B a n d w i d t h= 47.3 = 4 7 .3 Illustrazione 1: Funzione di empirica densità della empirica della Stima del Valore dimediante Mercatole ottenuta Illustrazione 4 Funzione di densità Stima del Valore di Mercato ottenuta 10000 replicazioni della medianteMonte le 10000 replicazioni della simulazione Monte 69940, Carlo. mediana Indici statistici: minimo simulazione Carlo. Indici statistici: minimo 68740, primo quartile 70180, media 70160, terzo quartile 70400, massimo 71050 68740, primo quartile 69940, mediana 70180, media 70160, terzo quartile 70400, massimo 71050. La media calcolata sulle 10000 stime ottenute via Monte Carlo risulta pari a 70160 €. Tale valore risulta prossimo al valore puntuale precedentemente ottenuto, 70202.04 €. Tuttavia ben più interessante è notare come, grazie alla simulazione, è possibile associare alla stima puntuale anche un’indicazione dell’incertezza di stima dovuta alla procedura di assegnazione dei prezzi marginali. Per esempio si può indicare che le 10000 simulazioni hanno generato stime del Valore di Mercato comprese tra un minimo di 68740 € e un massimo di 71050 €. Da notare che questo non è un intervallo di fiducia. BIBLIOGRAFIA Hastie T., Tibshirani R., Friedman J., The Element of Statistical Learning. Data Mining, Inference and Prediction. Springer, 2001. Isakson H. R., The Linear Algebra of the Sales Comparison Approach, Journal of Real Estate Research, 24(2), pagg117-128, 2002.