La relazione tra EPL e Disoccupazione Appendice statistica dell’“Anti-Blanchard” - Brancaccio (2012) Domenico Suppa Università degli Studi di Napoli “Federico II” 13 maggio 2014 - Università del Sannio Domenico Suppa La relazione tra EPL e Disoccupazione OECD Employment Outlook 1999 Domenico Suppa La relazione tra EPL e Disoccupazione OECD Employment Outlook 2004 Domenico Suppa La relazione tra EPL e Disoccupazione Determinazione degli scarti dalle medie Domenico Suppa La relazione tra EPL e Disoccupazione Calcolo dell’indice di correlazione: ρ = Domenico Suppa La relazione tra EPL e Disoccupazione Sy ,x Sy Sx Proprietà dell’indice di correlazione • ρ(X , Y ) = ρ(Y , X ) : simmetria • ρ(X , X ) = 1 • −1 ≤ ρ(X , Y ) ≤ 1 • Invarianza rispetto a trasformazioni lineari delle variabili, a meno del segno. • ρ assume valore −1 o 1 se tra le variabili esiste una correlazione perfetta, rispettivamente negativa o positiva. • Se le variabili sono indipendenti, l’indice di correlazione tra esse è nullo. Ma: se ρ = 0, non è detto che le variabili siano indipendenti. Domenico Suppa La relazione tra EPL e Disoccupazione Interpretazione geometrica di ρ(Y , X ) y x ∀Y , X ∈ Rn Domenico Suppa ρ(Y , X ) = cos(θ ) La relazione tra EPL e Disoccupazione y i = α + β x i + εi Regressione lineare semplice: a, b, ei indicano, rispettivamente, le stime di α, β , εi , ∀i = 1, . . . , N: Modello stimato yi = a + bxi + ei Stima ŷi = a + bxi Residui ei = yi − ŷi Impieghiamo il metodo dei minimi quadrati per stimare α, β . N Risolvendo il problema di minimo min ∑ ei2 a,b i=1 otteniamo: q 2 ∑i (yi − y ) Sy ∑i (yi − y )(xi − x) q = ρ(x, y ) = ρy ,x b= 2 Sx 2 ∑i (xi − x) ∑i (xi − x) a = y − bx Domenico Suppa La relazione tra EPL e Disoccupazione Calcolo dei parametri(a, b), della stima (Ŷ ) e dei residui (e) √ Sy 4.221, 429 0, 208 = 0, 247 b = ρy ,x = √ Sx 2.992, 857 a = y − bx = 50, 71 − 0, 247(52, 14) = 37, 834 ei = yi − ŷi ŷi = a + bxi i X Y Ŷ e 1 2 3 4 5 6 7 20 30 40 60 65 70 80 35 20 80 90 30 60 40 42.77 45.24 47.71 52.66 53.89 55.13 57.60 -7.77 -25.24 32.29 37.34 -23.89 4.87 -17.60 52.14 50.71 50.71 0 Medie Domenico Suppa La relazione tra EPL e Disoccupazione 100 Rappresentazione grafica della retta di regressione ^ =a + bX Y i i 37.34 80 a= 37.834 32.29 b= 0.247 e4 ^ Y 60 e3 e6 4.87 Y e7 40 e5 e1 −17.6 −7.77 20 e2 −23.89 0 −25.24 0 20 40 60 80 100 X Domenico Suppa La relazione tra EPL e Disoccupazione Definizione dell’indice di determinazione: R 2 Devianza campionaria Varianza campionaria N N 2 DEV(X ) = ∑ [Xi − E (X )] i=1 ∑ [Xi −E (X )]2 VAR(X ) = i=1 N −1 Scomposizione della devianza della regressione DEV(Y ) = DEV(Ŷ ) + DEV(e) R2 = DEV(Ŷ ) DEV(e) ESS RSS = 1− = = 1− DEV(Y ) DEV(Y ) TSS TSS L’indice R 2 fornisce una misura della bontà di adattamento della retta di regressione ai dati, indicando quanta parte della variabilità totale di Y è spiegata dalla stima (Ŷ ) di Y (ottenuta dalla minimizzazione dei quadrati dei residui della regressione). Solo nel caso della regressione semplice R 2 = ρ 2 . Domenico Suppa La relazione tra EPL e Disoccupazione La “BONTÀ” statistica della regressione Se sono soddisfatte le seguenti ipotesi: 1. la relazione tra Y e X è lineare: Y = β0 + β1 X + ε; 2. X ha almeno due valori distinti ed è nota seza errori; 3. la media condizionata degli errori è zero: E (ε|X ) = 0;. • Allora: gli stimatori dei minimi quadrati sono non distorti. 4. gli errori sono tra loro incorrelati: ρ(εi , εj ) = 0 ∀i 6= j; 5. la varianza degli errori è costante è finita (omoschedasticità): σε2i = σ 2 ∀i = 1, . . . , N; • Allora vale la seguente proprietà finita: gli stimatori dei minimi quadrati hanno varianza minima tra tutti gli stimatori lineari e non distorti (sono BLUE: teorema di Gauss-Markov). 6. Gli errori sono tra loro indipendenti e distribuiti identicamente in modo normale con media zero e varianza costante; • Allora: gli stimatori dei minimi quadrati hanno varianza minima (sono i più efficienti) tra tutti gli stimatori possibili, non solo rispetto a quelli lineari e non distorti. Domenico Suppa La relazione tra EPL e Disoccupazione Il test sui parametri della regressione lineare (applicazioni) I Gli stimatori dei minimi quadrati sono combinazioni lineari delle variabili casuali εi . I Quindi, se gli errori sono tra loro indipendenti, anche se non sono distribuiti in modo normale, si può applicare il teorema limite centrale (se la numerosità campionaria è elevata). I Le stime risulteranno non distorte, consistenti e asintoticamente normali. I Sotto queste condizioni, lo stimatore standardizzato dei parametri si distribuisce come una variabile casuale t di Student. In particolare, l’ipotesi nulla (H0): il parametro β è uguale a zero, può essere rifiutata se la tc = SbB , calcolata sotto l’ipotesi H0, è in modulo maggiore del valore teorico t(α/2,N−2) determinato per il livello di significatività α e in corrispondenza di N − 2 gradi di libertà (sulle tavole statistiche della v. c. t di Student). Domenico Suppa La relazione tra EPL e Disoccupazione Individuazione della Regione critica per H0 : β = 0 0.3 0.2 0.1 tc 0.0 Densità della v. c. t di Student Individuazione della Regione Critica, RC(α=5%), per H0, GDL=5 tc α 2 α 2 − tα −3 2−2 −1 0 1 2 tα 23 v. c. t di Student Domenico Suppa La relazione tra EPL e Disoccupazione La regressione con il foglio elettronico B B Domenico Suppa La relazione tra EPL e Disoccupazione Il test sulla significatività del coefficiente angolare 0.3 0.2 0.1 tc=0.475 0.0 Densità della v. c. t di Student Collocazione della tc rispetto alla RC(α=5%) per H0, GDL=5 α 2 α 2 − tα −3 2−2 −1 0 tc 1 2 tα 23 v. c. t di Student Domenico Suppa La relazione tra EPL e Disoccupazione Il test su β in base al p-value 0.3 tc=0.475 0.1 0.2 p−value=0.654 p−value/2 p−value/2 0.0 Densità della v. c. t di Student p−value (GDL=5) −3 −2 −1 − tc 0 tc 1 2 3 v. c. t di Student Domenico Suppa La relazione tra EPL e Disoccupazione Formule utilizzate nel foglio elettronico • Correlazione: CORRELAZIONE(Y ;X ) • Regressione: REGR.LIN(Y ;X ;Intercetta={0|1};Info.={0|1}) • Regione critica per {H0 : β = 0}: INV.T(α;GDL) • p-value: DISTRIB.T( SbB ;GDL;Modo={1|2}) Nello scrivere le ultime due formule è necessario tener conto del fatto che il test è bidirezionale, per cui, nel caso dell’esempio numerico, avremo: INV.T(0, 05;5) e DISTRIB.T(0, 475;5;2). Nota: la funzione INV.T richiede il valore α per restituire il valore t corrispondente ad α/2. Domenico Suppa La relazione tra EPL e Disoccupazione L’indagine grafica della relazione tra due variabili Domenico Suppa La relazione tra EPL e Disoccupazione Incorrelazione e indipendenza probabilistica Domenico Suppa La relazione tra EPL e Disoccupazione Relazione stimata tra Disoccupazione e EPL (dati OCSE) Domenico Suppa La relazione tra EPL e Disoccupazione I dati OCSE • http://stats.oecd.org/ I Labour I Employment Protection I I (Data by theme) Strictness of employment protection – overall General Statistics I Key Short-Term Economic Indicators I Harmonised unemployment rate: all persons, s.a. • Paesi (27): Australia, Austria, Belgium, Canada, Czech Republic, Denmark, Finland, France, Germany, Greece, Hungary, Ireland, Italy, Japan, Korea, Mexico, Netherlands, New Zealand, Norway, Poland, Portugal, Slovak Republic, Spain, Sweden, Turkey, United Kingdom, United States. • Anni (24): 1985 - 2008. Domenico Suppa La relazione tra EPL e Disoccupazione