Economia Pubblica e Storia Economica
Fausto Pacicco – [email protected]
1
 Per preparare l’esame è sufficiente lo studio delle slide
 Tuttavia, per chi fosse interessato a rivedere alcuni concetti di statistica
e/o approfondire/rivedere alcuni degli aspetti trattati in aula, suggerisco
i seguenti testi (disponibili in biblioteca)
 Come si legge Il Sole 24 Ore – soprattutto per la parte di utilizzo di indici e
indicatori
 Introductory econometrics : a modern approach, di J. M.Wooldridge
oppure
 Introduction to econometrics, di G. Koop
2
 Rivediamo alcuni concetti base di statistica:
 Ipotesi e test statistici
 P-Value
 Statistica base
 Retta, R quadro e regressione lineare
 Coefficienti di regressione e significatività
 Inoltre, vedremo l’interpretazione di alcuni output di eviews
3
 Facciamo un esempio (preso da Wikipedia):
 Abbiamo una parte di un circuito elettrico (funzionante), con una lampadina ed
un interruttore; assumiamo che il circuito e le sue parti siano «indistruttibili».
 Non sappiamo se il circuito è collegato ad una sorgente, sappiamo solo che il
circuito è aperto (interruttore su OFF)
 Vogliamo sapere se
 Il circuito è collegato ad una sorgente di energia (ipotesi 1)
 Il circuito non è collegato ad una sorgente di energia(ipotesi 2)
 Notiamo che le ipotesi sono mutualmente esclusive (i.e. se la 1 è vera, la 2 non
lo è, e viceversa)
 Una volta chiuso il circuito (interruttore su ON) abbiamo 2 possibili risposte:
 Lampadina accesa, c’è corrente  ipotesi 1 accettata, ipotesi 2 rigettata
 Lampadina spenta  ipotesi 2 accettata, ipotesi 1 rigettata
 Questo esempio è di tipo deterministico, cioè sappiamo con certezza se è
vera la 1 o la 2 in base ai «dati» (l’osservazione della lampadina)
 Inoltre, non importa quante volte ripetiamo l’esperimento, poiché l’esito
sarà sempre lo stesso
4
 Nelle analisi di dati reali, dobbiamo tenere conto della componente di
incertezza legata alla probabilità che un evento si verifichi o meno,
soprattutto nei casi dove effettuiamo inferenza
 Nell’esempio precedente, il nostro «universo» era circoscritto al circuito
ed alla sua sorgente di energia, per cui era perfettamente conosciuto
 Nella realtà, non abbiamo la perfetta conoscenza dell’universo, per cui il
«caso» gioca un ruolo importante nei risultati
 Inoltre, dobbiamo capire se il campione in esame può essere ricondotto
a distribuzioni note, per poter generalizzare i risultati e comparare le
analisi
 Questo meccanismo di «riconduzione» a distribuzioni note, ci permette
di capire se le ipotesi formulate sui fenomeni siano vere o false
5
 Facciamo un altro esempio:
 Sappiamo che un paese ha una statura media di 175 cm nell’anno 2000; a
seguito di cambiamenti (alimentari, economici, etc.) sospettiamo che essa sia
cambiata (non ci importa, per ora, se sia maggiore o minore)
 Sappiamo che la variabile statura media si distribuisce come una Normale, con
media 175 (indicata con µ0) e deviazione standard uguale a 300 , indicata con
σ
 Non possiamo effettuare un censimento della popolazione, e dobbiamo
effettuare un campionamento di n=20 persone, dove troviamo una media di
177,5 cm, indicata con 𝑋𝑋�
6
 Abbiamo le nostre 2 ipotesi, circa la «nuova» media (indicata con µ1)
H0  µ1 = 175 (chiamate ipotesi nulla, sta ad indicare che la media non è cambiata
nel corso del tempo)
2. H1  µ1 ≠ 175 (chiamata ipotesi alternativa)
1.
 Allora, rispettando i criteri di costruzione della statistica test Z, sappiamo che il
nostro test ha questo valore:
𝑍𝑍 =
�
𝑋𝑋−µ
𝜎𝜎 𝑛𝑛
=
177,5−175
300∗20
= 0.645
 Con il livello di significatività fissato al 5%, il valore critico di riferimento
(quello contenuto sulle tabelle) è 1.96 (chiamato 𝑧𝑧𝛼𝛼/2 , poiché dobbiamo
prendere il valore critico della distribuzione a 2 code)
 Allora, l’equivalenza delle ipotesi diventa
1.
H0  µ = 175

2.
H1  µ ≠ 175

𝑍𝑍 < 𝑧𝑧𝛼𝛼/2
𝑍𝑍 ≥ 𝑧𝑧𝛼𝛼/2
 In questo caso, con la soglia di significatività al 5% accettiamo* H0, per cui non
possiamo concludere che l’altezza media non si è modificata in maniera
significativa
*Attenzione, da un punto di vista statistico, dovremmo dire non rigettiamo H0, in quanto H0 viene data per vera sin dalla partenza
dell’esperimento. Tuttavia, per comodità, utilizziamo un linguaggio più comune, fatto di «accettare» e «rigettare»
7
 Tuttavia, a noi non interessa (in questo corso) calcolare a mano i valori di
test, reperire i valori critici e confrontare l’esito
 I software calcolano automaticamente il p-value dei test: esso è compreso
tra 0 ed 1 ed esprime la probabilità di osservare un valore della
statistica test uguale o più estremo del valore ottenuto dal campione,
sotto l’ipotesi nulla
 Nei software viene indicato solitamente come «p-value», «probability»,
«prob», e simili
 Le soglie con le quali confrontare il p-value della nostra ipotesi sono 3:
 10%  0.1 , 5%  0.05 , 1%  0.01
 Le diverse combinazioni possibili sono le seguenti:
P-VALUE DEL NOSTRO
TEST (ESEMPI)
SOGLIE DI SIGNIFICATIVITÀ
0.1 (10%)
0.05 (5%)
0.01 (1%)
p-value = 0.675
ACCETTO H0 ACCETTO H0 ACCETTO H0
p-value = 0.093
RIGETTO H0
ACCETTO H0 ACCETTO H0
p-value = 0.044
RIGETTO H0
RIGETTO H0
ACCETTO H0
p-value = 0.003
RIGETTO H0
RIGETTO H0
RIGETTO H0
8
 Quindi, a prescindere dal calcolo della statistica test, siamo in grado di capire
se e quali ipotesi sono valide
 Attenzione, ogni test ha sue specifiche ipotesi!
 Di solito i software riepilogano qual è l’ipotesi nulla
Ipotesi nulla
P-values
 Per i fini del nostro corso, le soglie sono «flessibili»: a partire dalla soglia più
stringente (1%), se la teoria vi suggerisce dei risultati particolari, potete
«ampliarla», prendendo quella del 5% o quella del 10%
 Abbiamo già visto quali sono le H0 dei test affrontati nel corso, oggi le
rivediamo commentando alcuni output di Eviews
9
Media
Mediana
Max e Min
Standard
deviation
P-value del
Jarque- Bera
 Eviews permette di effettuare delle analisi di statistica univariata
 Inoltre, effettua il controllo della normalità delle serie, tramite il test Jarque-
Bera che ha come H0  serie distribuita normalmente
 In questo caso, rigettiamo l’H0, in quanto il p-value è inferiore a qualunque
soglia
 Attenzione, una Normale non è necessariamente una Normale standardizzata
10
P-values del
Jarque- Bera
 La serie in basso (PROVA) è composta da estrazioni random da una
Normale standardizzata; pur se il grafico non «sembra» una campana
gaussiana, il test ci fa accettare H0, confermando che la serie ha una
distribuzione normale
11
Coefficiente di correlazione tra
l’elemento sulla colonna e sulla riga
P-value del coefficiente di Pearson
 L’analisi bivariata in Eviews, ha il seguente output:
 Il coefficiente di Pearson varia da -1 a 1: il segno indica la direzione della
correlazione, il valore assoluto la sua «forza»
 Attenzione, il valore assoluto non deve mai essere discusso in maniera
generale («è alto», «è basso»), ma sempre in comparazione con altri
coefficienti («è più alto di», «è più basso di»)
12
Coefficiente di correlazione tra
l’elemento sulla colonna e sulla riga
P-value del coefficiente di Pearson
 L’H0 in questo caso è quella di coefficiente uguale a zero,
 Rigettiamo l’H0, per cui il nostro coefficiente di correlazione è statisticamente
diverso da zero
13
 Questo output ci permette di fare dei paragoni tra le diverse correlazioni:
 La serie originale del GDP è più correlata con il suo valore logaritmico che la
serie alle differenze (0.95 VS 0.16), e sono entrambe significativamente diverse
da zero
 La serie PROVA, non è significativamente correlata con le altre variabili,
confermando il fatto che essa sia costituita da valori random
14
 Se fossimo ad una lezione di matematica, potremmo parlare della generica
funzione 𝑦𝑦 = 𝑓𝑓 𝑥𝑥 e, nello specifico, 𝑦𝑦 = 𝑎𝑎 + 𝑏𝑏 ∗ 𝑥𝑥, rappresentata dal seguente
grafico
 Nel grafico, notiamo come la relazione tra y e x sia del tipo 𝑦𝑦 = 5 + 2 ∗ 𝑥𝑥, cioè
a=5 e b=2. La funzione rappresenta, quindi, una retta
 Siamo in un ambiente deterministico, cioè conosciuto con esattezza, e
riusciamo a vedere che tutti i valori della y sono perfettamente previsti come
funzione della x
15
 Tuttavia, i dati reali sono di natura stocastica: non possiamo osservare
precisamente quali sono i «veri» valori assunti dai parametri che guidano
i movimenti delle serie reali
 Inoltre, le serie economiche si muovono nell’insieme dei numeri reali,
per cui non abbiamo valori sempre tali da poterli «ordinare» lungo una
retta
 Piuttosto, abbiamo una nuvola di punti costituita dalle osservazioni
Ciascun pallino
rappresenta
un’osservazione
delle y reali
16
 Allora, per riuscire a descrivere e prevedere come il fenomeno si
comporta, ipotizziamo la presenza di una retta contenente i valori
«ideali» della y (retta tratteggiata in rosso), diversi dalle y reali
 La retta rossa tratteggiata è una retta «fittata», cioè stimata in modo da
riuscire a minimizzare lo scarto tra valori previsti (i punti sulla retta
tratteggiata) e le osservazioni reali
 È esattamente quello di cui si occupa il metodo dei minimi quadrati
(OLS) che abbiamo visto in precedenza
17
 Poiché non siamo più in ambito deterministico, ma stocastico, i nostri
modelli presentano una componente di errore (lo scarto tra retta «fittata»
e dati reali)
𝑦𝑦� = 𝛼𝛼� + 𝛽𝛽̂ ∗ 𝑥𝑥 + 𝜀𝜀
 Quello che era il b della retta «matematica» diventa il β, chiamato anche
coefficiente della regressore
 Attenzione il simbolo «hat» (l’accento strambo), sta ad indicare che sono
stime, non i valori reali
 Nella figura precedente abbiamo anche visto l’R-quadro, che rappresenta
la porzione di varianza della Y spiegata dalla X (o dall’insieme delle X, in
caso di regressione multivariata)
 È compreso tra 0 ed 1:
 0 significa che X non riesce a spiegare per niente i movimenti della Y (i.e. la
retta rossa tratteggiata non «intercetta» nessun punto nella nuvola di punti vista
prima)
 1 significa che X spiega perfettamente i movimenti della Y (come nel caso
deterministico). In dati reali, l’R quadro non assume mai 1, se non in presenza
di problemi del modello
18
 Attenzione, l’R quadro si usa solo in maniera comparativa tra modelli
analoghi, mai in maniera assoluta
 È un grave errore dire che un R quadro è alto senza compararlo con quelli di
modelli analoghi (stimati da se stessi o trovati in letteratura).
 Per questo, non commentiamo il valore dell’R quadro nella figura
precedente…
 Per come è costruito l’R quadro, se teniamo costante il numero di
osservazioni nel nostro campione, all’aggiunta di regressori cresce, pur
se i nuovi regressori non spiegano nulla singolarmente
 All’estremo, se il numero di regressori è uguale al numero di
osservazioni, l’R quadro è pari a 1
 Per questo motivo, si preferisce usare l’R quadro aggiustato
 Questo indice, sempre più basso dell’R quadro, penalizza la presenza di
regressori che non contribuiscono a spiegare il fenomeno, ed è pertanto
più affidabile
19
Variabile dipendente
Dimensione campione
Regressori (C indica sempre la
costante)
Valore del coefficiente beta
P-value del
coefficiente (test t)
H0 – coefficiente
uguale a zero
 Questo è l’output di una regressione lineare univariata
 Notate la presenza di 2 tipologie di test
20
P-value della significatività congiunta
dei coefficienti (test F)
H0 – coefficienti congiuntamente
uguali a zero
R quadro e R quadro adjusted
21
 Nella regressione lineare (univariata o multivariata) dobbiamo valutare 2 test
1.
Test t sui singoli coefficienti: questo test è volto a misurare se il coefficiente è
statisticamente diverso da zero (discorso simile a quello visto in precedenza); le
ipotesi sono:
 H0  β=0
 H1  β≠0
Quindi, se il nostro p-value è inferiore alla soglia di significatività, rigettiamo l’H0,
concludendo che il nostro coefficiente è statisticamente diverso da zero; significa
che l’impatto della X in esame è diverso da zero. Viceversa, in caso di p-value
superiore alla soglia
2. Test f sulla significatività congiunta dei coefficienti. Questo test valuta se tutti i
regressori, congiuntamente, sono uguali tra di loro ed uguali a zero; le ipotesi
sono:
 H0 𝛽𝛽1 = 𝛽𝛽2 = 𝛽𝛽3 = ⋯ = 0
 H1 ∃ 𝛽𝛽 ≠ 0 (i.e. esiste almeno un beta diverso da zero)
L’interpretazione è la classica dei test
 Rigettando ambo le H0, sappiamo che i nostri regressori «spiegano» una
componente della indipendente; in caso contrario dobbiamo rimuovere i
regressori non significativi (i.e. statisticamente non diversi da zero), e
ristimare i nostri modelli
22
3 Criteri
informativi
 La schermata sopra è l’output di una regressione lineare multivariata. Gli
elementi sono gli stessi di una regressione lineare, «estesi» ad altri regressori
 I criteri informativi sono sempre da utilizzare solo in maniera comparata, cioè
sempre per paragonare modelli alternativi (e.g. al posto di NX metto IMP ed
EXP), preferendo i modelli con i criteri più bassi
23
3 Criteri
informativi
 I criteri informativi ci informano circa l’ «efficienza» dei nostri modelli. In
questo caso, il modello in logaritmi è più efficiente
 Di solito sono influenzati anche dal numero di parametri che facciamo stimare
al modello (legato al numero di variabili), ma in questo caso è dovuto alla
diversa log-likelihood del modello (che possiamo approssimare come una
misura di bontà del modello)
24
Coefficienti
 Ma
come interpretiamo gli
output da un punto di vista
economico?
 In questo caso, siamo in un
modello Keynesiano, dove il
GDP (la Y) è funzione di consumi
(CONS), spesa pubblica (G),
investimenti
(I)
e
saldo
commerciale con l’estero (NX)
 I beta sono da interpretare come impatto marginale ceteris paribus (i.e.
tenendo fermi tutti gli altri regressori):
 Ad esempio, 1 unità incrementale di Consumi (in questo caso misurati in
milioni di valuta nazionale, ma non è importante) comporta un incremento di
0.87 unità nel GDP
 Nel caso di modelli alle differenze, l’impatto si riversa sul delta; diciamo,
cioè, che l’aumento delle serie tra periodi successivi è impattato dal beta
25
 Già dalla porzione iniziale degli output,
Eviews ci dice che tipo di regressione
stiamo effettuando (cross-section, time
series o panel)
 Nel primo caso, vediamo che Sample ha una
certa estensione temporale, e che sono
presenti anche Cross-sections included:
abbiamo sia la componente temporale che
quella cross-section, per cui siamo in una
regressione panel
 Nel secondo caso, vediamo solo la presenza
di Sample, l’estensione temporale, espressa
in trimestri: in questo caso, si ha una
regressione time-series
 Nel terzo caso, Sample assume solo valori
pari tra 1 e 20, indicando una regressione
cross-section*.
*Attenzione, 1 20 potrebbero anche indicare degli anni, ma nel nostro caso (e nell’esame), le time series possono partire solo dal tardo 1800…
26