Economia Pubblica e Storia Economica Fausto Pacicco – [email protected] 1 Per preparare l’esame è sufficiente lo studio delle slide Tuttavia, per chi fosse interessato a rivedere alcuni concetti di statistica e/o approfondire/rivedere alcuni degli aspetti trattati in aula, suggerisco i seguenti testi (disponibili in biblioteca) Come si legge Il Sole 24 Ore – soprattutto per la parte di utilizzo di indici e indicatori Introductory econometrics : a modern approach, di J. M.Wooldridge oppure Introduction to econometrics, di G. Koop 2 Rivediamo alcuni concetti base di statistica: Ipotesi e test statistici P-Value Statistica base Retta, R quadro e regressione lineare Coefficienti di regressione e significatività Inoltre, vedremo l’interpretazione di alcuni output di eviews 3 Facciamo un esempio (preso da Wikipedia): Abbiamo una parte di un circuito elettrico (funzionante), con una lampadina ed un interruttore; assumiamo che il circuito e le sue parti siano «indistruttibili». Non sappiamo se il circuito è collegato ad una sorgente, sappiamo solo che il circuito è aperto (interruttore su OFF) Vogliamo sapere se Il circuito è collegato ad una sorgente di energia (ipotesi 1) Il circuito non è collegato ad una sorgente di energia(ipotesi 2) Notiamo che le ipotesi sono mutualmente esclusive (i.e. se la 1 è vera, la 2 non lo è, e viceversa) Una volta chiuso il circuito (interruttore su ON) abbiamo 2 possibili risposte: Lampadina accesa, c’è corrente ipotesi 1 accettata, ipotesi 2 rigettata Lampadina spenta ipotesi 2 accettata, ipotesi 1 rigettata Questo esempio è di tipo deterministico, cioè sappiamo con certezza se è vera la 1 o la 2 in base ai «dati» (l’osservazione della lampadina) Inoltre, non importa quante volte ripetiamo l’esperimento, poiché l’esito sarà sempre lo stesso 4 Nelle analisi di dati reali, dobbiamo tenere conto della componente di incertezza legata alla probabilità che un evento si verifichi o meno, soprattutto nei casi dove effettuiamo inferenza Nell’esempio precedente, il nostro «universo» era circoscritto al circuito ed alla sua sorgente di energia, per cui era perfettamente conosciuto Nella realtà, non abbiamo la perfetta conoscenza dell’universo, per cui il «caso» gioca un ruolo importante nei risultati Inoltre, dobbiamo capire se il campione in esame può essere ricondotto a distribuzioni note, per poter generalizzare i risultati e comparare le analisi Questo meccanismo di «riconduzione» a distribuzioni note, ci permette di capire se le ipotesi formulate sui fenomeni siano vere o false 5 Facciamo un altro esempio: Sappiamo che un paese ha una statura media di 175 cm nell’anno 2000; a seguito di cambiamenti (alimentari, economici, etc.) sospettiamo che essa sia cambiata (non ci importa, per ora, se sia maggiore o minore) Sappiamo che la variabile statura media si distribuisce come una Normale, con media 175 (indicata con µ0) e deviazione standard uguale a 300 , indicata con σ Non possiamo effettuare un censimento della popolazione, e dobbiamo effettuare un campionamento di n=20 persone, dove troviamo una media di 177,5 cm, indicata con 𝑋𝑋� 6 Abbiamo le nostre 2 ipotesi, circa la «nuova» media (indicata con µ1) H0 µ1 = 175 (chiamate ipotesi nulla, sta ad indicare che la media non è cambiata nel corso del tempo) 2. H1 µ1 ≠ 175 (chiamata ipotesi alternativa) 1. Allora, rispettando i criteri di costruzione della statistica test Z, sappiamo che il nostro test ha questo valore: 𝑍𝑍 = � 𝑋𝑋−µ 𝜎𝜎 𝑛𝑛 = 177,5−175 300∗20 = 0.645 Con il livello di significatività fissato al 5%, il valore critico di riferimento (quello contenuto sulle tabelle) è 1.96 (chiamato 𝑧𝑧𝛼𝛼/2 , poiché dobbiamo prendere il valore critico della distribuzione a 2 code) Allora, l’equivalenza delle ipotesi diventa 1. H0 µ = 175 2. H1 µ ≠ 175 𝑍𝑍 < 𝑧𝑧𝛼𝛼/2 𝑍𝑍 ≥ 𝑧𝑧𝛼𝛼/2 In questo caso, con la soglia di significatività al 5% accettiamo* H0, per cui non possiamo concludere che l’altezza media non si è modificata in maniera significativa *Attenzione, da un punto di vista statistico, dovremmo dire non rigettiamo H0, in quanto H0 viene data per vera sin dalla partenza dell’esperimento. Tuttavia, per comodità, utilizziamo un linguaggio più comune, fatto di «accettare» e «rigettare» 7 Tuttavia, a noi non interessa (in questo corso) calcolare a mano i valori di test, reperire i valori critici e confrontare l’esito I software calcolano automaticamente il p-value dei test: esso è compreso tra 0 ed 1 ed esprime la probabilità di osservare un valore della statistica test uguale o più estremo del valore ottenuto dal campione, sotto l’ipotesi nulla Nei software viene indicato solitamente come «p-value», «probability», «prob», e simili Le soglie con le quali confrontare il p-value della nostra ipotesi sono 3: 10% 0.1 , 5% 0.05 , 1% 0.01 Le diverse combinazioni possibili sono le seguenti: P-VALUE DEL NOSTRO TEST (ESEMPI) SOGLIE DI SIGNIFICATIVITÀ 0.1 (10%) 0.05 (5%) 0.01 (1%) p-value = 0.675 ACCETTO H0 ACCETTO H0 ACCETTO H0 p-value = 0.093 RIGETTO H0 ACCETTO H0 ACCETTO H0 p-value = 0.044 RIGETTO H0 RIGETTO H0 ACCETTO H0 p-value = 0.003 RIGETTO H0 RIGETTO H0 RIGETTO H0 8 Quindi, a prescindere dal calcolo della statistica test, siamo in grado di capire se e quali ipotesi sono valide Attenzione, ogni test ha sue specifiche ipotesi! Di solito i software riepilogano qual è l’ipotesi nulla Ipotesi nulla P-values Per i fini del nostro corso, le soglie sono «flessibili»: a partire dalla soglia più stringente (1%), se la teoria vi suggerisce dei risultati particolari, potete «ampliarla», prendendo quella del 5% o quella del 10% Abbiamo già visto quali sono le H0 dei test affrontati nel corso, oggi le rivediamo commentando alcuni output di Eviews 9 Media Mediana Max e Min Standard deviation P-value del Jarque- Bera Eviews permette di effettuare delle analisi di statistica univariata Inoltre, effettua il controllo della normalità delle serie, tramite il test Jarque- Bera che ha come H0 serie distribuita normalmente In questo caso, rigettiamo l’H0, in quanto il p-value è inferiore a qualunque soglia Attenzione, una Normale non è necessariamente una Normale standardizzata 10 P-values del Jarque- Bera La serie in basso (PROVA) è composta da estrazioni random da una Normale standardizzata; pur se il grafico non «sembra» una campana gaussiana, il test ci fa accettare H0, confermando che la serie ha una distribuzione normale 11 Coefficiente di correlazione tra l’elemento sulla colonna e sulla riga P-value del coefficiente di Pearson L’analisi bivariata in Eviews, ha il seguente output: Il coefficiente di Pearson varia da -1 a 1: il segno indica la direzione della correlazione, il valore assoluto la sua «forza» Attenzione, il valore assoluto non deve mai essere discusso in maniera generale («è alto», «è basso»), ma sempre in comparazione con altri coefficienti («è più alto di», «è più basso di») 12 Coefficiente di correlazione tra l’elemento sulla colonna e sulla riga P-value del coefficiente di Pearson L’H0 in questo caso è quella di coefficiente uguale a zero, Rigettiamo l’H0, per cui il nostro coefficiente di correlazione è statisticamente diverso da zero 13 Questo output ci permette di fare dei paragoni tra le diverse correlazioni: La serie originale del GDP è più correlata con il suo valore logaritmico che la serie alle differenze (0.95 VS 0.16), e sono entrambe significativamente diverse da zero La serie PROVA, non è significativamente correlata con le altre variabili, confermando il fatto che essa sia costituita da valori random 14 Se fossimo ad una lezione di matematica, potremmo parlare della generica funzione 𝑦𝑦 = 𝑓𝑓 𝑥𝑥 e, nello specifico, 𝑦𝑦 = 𝑎𝑎 + 𝑏𝑏 ∗ 𝑥𝑥, rappresentata dal seguente grafico Nel grafico, notiamo come la relazione tra y e x sia del tipo 𝑦𝑦 = 5 + 2 ∗ 𝑥𝑥, cioè a=5 e b=2. La funzione rappresenta, quindi, una retta Siamo in un ambiente deterministico, cioè conosciuto con esattezza, e riusciamo a vedere che tutti i valori della y sono perfettamente previsti come funzione della x 15 Tuttavia, i dati reali sono di natura stocastica: non possiamo osservare precisamente quali sono i «veri» valori assunti dai parametri che guidano i movimenti delle serie reali Inoltre, le serie economiche si muovono nell’insieme dei numeri reali, per cui non abbiamo valori sempre tali da poterli «ordinare» lungo una retta Piuttosto, abbiamo una nuvola di punti costituita dalle osservazioni Ciascun pallino rappresenta un’osservazione delle y reali 16 Allora, per riuscire a descrivere e prevedere come il fenomeno si comporta, ipotizziamo la presenza di una retta contenente i valori «ideali» della y (retta tratteggiata in rosso), diversi dalle y reali La retta rossa tratteggiata è una retta «fittata», cioè stimata in modo da riuscire a minimizzare lo scarto tra valori previsti (i punti sulla retta tratteggiata) e le osservazioni reali È esattamente quello di cui si occupa il metodo dei minimi quadrati (OLS) che abbiamo visto in precedenza 17 Poiché non siamo più in ambito deterministico, ma stocastico, i nostri modelli presentano una componente di errore (lo scarto tra retta «fittata» e dati reali) 𝑦𝑦� = 𝛼𝛼� + 𝛽𝛽̂ ∗ 𝑥𝑥 + 𝜀𝜀 Quello che era il b della retta «matematica» diventa il β, chiamato anche coefficiente della regressore Attenzione il simbolo «hat» (l’accento strambo), sta ad indicare che sono stime, non i valori reali Nella figura precedente abbiamo anche visto l’R-quadro, che rappresenta la porzione di varianza della Y spiegata dalla X (o dall’insieme delle X, in caso di regressione multivariata) È compreso tra 0 ed 1: 0 significa che X non riesce a spiegare per niente i movimenti della Y (i.e. la retta rossa tratteggiata non «intercetta» nessun punto nella nuvola di punti vista prima) 1 significa che X spiega perfettamente i movimenti della Y (come nel caso deterministico). In dati reali, l’R quadro non assume mai 1, se non in presenza di problemi del modello 18 Attenzione, l’R quadro si usa solo in maniera comparativa tra modelli analoghi, mai in maniera assoluta È un grave errore dire che un R quadro è alto senza compararlo con quelli di modelli analoghi (stimati da se stessi o trovati in letteratura). Per questo, non commentiamo il valore dell’R quadro nella figura precedente… Per come è costruito l’R quadro, se teniamo costante il numero di osservazioni nel nostro campione, all’aggiunta di regressori cresce, pur se i nuovi regressori non spiegano nulla singolarmente All’estremo, se il numero di regressori è uguale al numero di osservazioni, l’R quadro è pari a 1 Per questo motivo, si preferisce usare l’R quadro aggiustato Questo indice, sempre più basso dell’R quadro, penalizza la presenza di regressori che non contribuiscono a spiegare il fenomeno, ed è pertanto più affidabile 19 Variabile dipendente Dimensione campione Regressori (C indica sempre la costante) Valore del coefficiente beta P-value del coefficiente (test t) H0 – coefficiente uguale a zero Questo è l’output di una regressione lineare univariata Notate la presenza di 2 tipologie di test 20 P-value della significatività congiunta dei coefficienti (test F) H0 – coefficienti congiuntamente uguali a zero R quadro e R quadro adjusted 21 Nella regressione lineare (univariata o multivariata) dobbiamo valutare 2 test 1. Test t sui singoli coefficienti: questo test è volto a misurare se il coefficiente è statisticamente diverso da zero (discorso simile a quello visto in precedenza); le ipotesi sono: H0 β=0 H1 β≠0 Quindi, se il nostro p-value è inferiore alla soglia di significatività, rigettiamo l’H0, concludendo che il nostro coefficiente è statisticamente diverso da zero; significa che l’impatto della X in esame è diverso da zero. Viceversa, in caso di p-value superiore alla soglia 2. Test f sulla significatività congiunta dei coefficienti. Questo test valuta se tutti i regressori, congiuntamente, sono uguali tra di loro ed uguali a zero; le ipotesi sono: H0 𝛽𝛽1 = 𝛽𝛽2 = 𝛽𝛽3 = ⋯ = 0 H1 ∃ 𝛽𝛽 ≠ 0 (i.e. esiste almeno un beta diverso da zero) L’interpretazione è la classica dei test Rigettando ambo le H0, sappiamo che i nostri regressori «spiegano» una componente della indipendente; in caso contrario dobbiamo rimuovere i regressori non significativi (i.e. statisticamente non diversi da zero), e ristimare i nostri modelli 22 3 Criteri informativi La schermata sopra è l’output di una regressione lineare multivariata. Gli elementi sono gli stessi di una regressione lineare, «estesi» ad altri regressori I criteri informativi sono sempre da utilizzare solo in maniera comparata, cioè sempre per paragonare modelli alternativi (e.g. al posto di NX metto IMP ed EXP), preferendo i modelli con i criteri più bassi 23 3 Criteri informativi I criteri informativi ci informano circa l’ «efficienza» dei nostri modelli. In questo caso, il modello in logaritmi è più efficiente Di solito sono influenzati anche dal numero di parametri che facciamo stimare al modello (legato al numero di variabili), ma in questo caso è dovuto alla diversa log-likelihood del modello (che possiamo approssimare come una misura di bontà del modello) 24 Coefficienti Ma come interpretiamo gli output da un punto di vista economico? In questo caso, siamo in un modello Keynesiano, dove il GDP (la Y) è funzione di consumi (CONS), spesa pubblica (G), investimenti (I) e saldo commerciale con l’estero (NX) I beta sono da interpretare come impatto marginale ceteris paribus (i.e. tenendo fermi tutti gli altri regressori): Ad esempio, 1 unità incrementale di Consumi (in questo caso misurati in milioni di valuta nazionale, ma non è importante) comporta un incremento di 0.87 unità nel GDP Nel caso di modelli alle differenze, l’impatto si riversa sul delta; diciamo, cioè, che l’aumento delle serie tra periodi successivi è impattato dal beta 25 Già dalla porzione iniziale degli output, Eviews ci dice che tipo di regressione stiamo effettuando (cross-section, time series o panel) Nel primo caso, vediamo che Sample ha una certa estensione temporale, e che sono presenti anche Cross-sections included: abbiamo sia la componente temporale che quella cross-section, per cui siamo in una regressione panel Nel secondo caso, vediamo solo la presenza di Sample, l’estensione temporale, espressa in trimestri: in questo caso, si ha una regressione time-series Nel terzo caso, Sample assume solo valori pari tra 1 e 20, indicando una regressione cross-section*. *Attenzione, 1 20 potrebbero anche indicare degli anni, ma nel nostro caso (e nell’esame), le time series possono partire solo dal tardo 1800… 26