Le questioni metodologiche legate alla valutazione delle politiche

Primo rapporto di ricerca sul sistema di monitoraggio del mercato del lavoro e di valutazione degli effetti occupazionali del POR Calabria
Capitolo 15
Le questioni metodologiche legate alla valutazione delle
politiche formative del POR Calabria sull’occupazione
1
Introduzione
Il quadro di programmazione dei Fondi Strutturali per il periodo 2000-2006 sottolinea
il ruolo delle politiche formative nell’ambito delle politiche del lavoro al fine di perseguire
occupabilità ed equità sociale unitamente allo sviluppo competitivo del territorio, in
particolare nel Mezzogiorno. Alcuni degli obiettivi di natura strutturale cui mirano i
programmi del Fondo Sociale Europeo possono essere riassunti nei seguenti punti:
• Incrementare l’occupabilità dei soggetti in età lavorativa;
• Promuovere l’integrazione nel mercato del lavoro delle persone esposte a rischio
di esclusione sociale;
• Sviluppare un’offerta di istruzione, formazione professionale e orientamento che
consenta lo sviluppo di percorsi di apprendimento per tutto l’arco della vita.
L’orientamento delle politiche individuato da tale programma ha un forte impatto sulle
politiche pubbliche nazionali e regionali sia per l’influenza sul processo decisionale e
progettuale sia in quanto costituisce un rilevante canale finanziario. La valutazione empirica
del programma rappresenta una necessaria rendicontazione ai soggetti finanziatori degli esiti
dello stesso e costituisce inoltre un valido strumento per la realizzazione di fine tuning della
politica in itinere.
Sulla scia della letteratura empirica inerente la valutazione delle politiche del lavoro
incentrate sulla formazione, uno studio avente per oggetto il mercato del lavoro calabrese
dovrebbe prendere in esame le seguenti questioni:
• effetti del programma sull’evoluzione del sistema di formazione professionale
regionale;
• contributo del programma al conseguimento degli obiettivi equitativi rispetto ai
target di utenza;
• impatto delle politiche sull’occupabilità dei soggetti trattati;
• effetti del programma sulla capacità reddituale dei soggetti trattati;
• effetti del programma sull’economia regionale nel suo complesso ed eventuali
effetti indiretti.
L’evidenza empirica internazionale relativa all’efficacia dei corsi di formazione
professionale nell’ambito delle politiche attive del lavoro, indica che questi programmi
influenzano molto debolmente la capacità reddituale dei soggetti partecipanti ed
incrementano, in modo modesto, la probabilità di trovare un’occupazione. Complessivamente
“…the gains from existing programs are not sufficiently large to lift many out of poverty nor
to significantly reduce unemployment rates”.1
Come verrà sottolineato nella discussione seguente, il prerequisito per la valutazione
degli effetti del programma è l’adozione di una metodologia idonea allo scopo, che è
1
Heckman J.J. Lalonde R.J. e Smith J.A., “The Economics and Econometrics of Active Labor Market
Programs”, in AshenflelterO. E Card D. (a cura di) , Handbook of Labor Economics, vol. 3a, Elsevier Science,
Amsterdam, 1999, pg. 2080.
Dipartimento di Economia e Statistica, Università della Calabria, Arcavacata di Rende (CS)
368
Primo rapporto di ricerca sul sistema di monitoraggio del mercato del lavoro e di valutazione degli effetti occupazionali del POR Calabria
strettamente determinata dalla tipologia dei dati e delle informazioni a disposizione del
valutatore.
L’obiettivo di questo studio è quello di illustrare criticamente alcune metodologie di
valutazione dell’impatto dei programmi di formazione. Una preliminare descrizione degli
individui che hanno seguito corsi di formazione professionale nella regione Calabria,
mediante dati cross section, unitamente ad una prima valutazione degli esiti occupazionali dei
soggetti formati, è invece presenta nel capitolo 16.
2
Alcuni problemi metodologici
Un’accurata discussione sul tema delle politiche del lavoro, non può prescindere da
una valutazione empirica degli effetti che queste possono avere sugli obiettivi preposti. La
valutazione dell’efficacia di un intervento di politica economica nel mercato del lavoro
necessita di adeguate informazioni sia sugli individui a cui è stato somministrato il
trattamento, sia su un campione di controllo, esente dal trattamento stesso. La definizione di
entrambi i gruppi, ossia dei soggetti trattati e non trattati, è estremamente rilevante in quanto,
se la selezione degli individui trattati non è casuale, possono insorgere problemi di stima degli
effetti dell’intervento di politica dovuti alla presenza di fenomeni di sample selection bias.
La metodologia adottata per la misurazione dell’efficacia delle politiche di intervento
nel mercato del lavoro prevede dunque il confronto con una situazione controfattuale di non
intervento. La valutazione controfattuale dovrebbe basarsi sull’osservazione dell’andamento
della variabile obiettivo in condizioni di operatività di un intervento e di assenza dello stesso.
In realtà, questo confronto risulta irrealizzabile in quanto non è possibile osservare uno stesso
soggetto nello stesso intervallo di tempo in presenza e in assenza di un determinato intervento.
La non osservabilità del fenomeno nelle due situazioni può essere risolta mediante la
definizione di un “campione di controllo” ossia con l’individuazione di campioni relativi a
soggetti non esposti all’intervento rappresentativi della situazione controfattuale non
osservabile. Il problema dell’individuazione del campione di controllo consiste nella
possibilità che la selezione dei soggetti possa influenzare i risultati ottenuti. Se la selezione
avviene sulla base di caratteristiche correlate alla variabile risultato, quest’ultima non viene
influenzata solo dall’operare della politica ma anche da elementi non controllabili. Non
sarebbe più possibile, pertanto, confrontare due situazioni nelle quali la differenza nel
risultato dipende unicamente dalla politica adottata. Si assuma ad esempio che il corso di
formazione venga frequentato da individui disoccupati che non trovano occupazione perché
poco attivi nella ricerca di un lavoro, se questa variabile non è controllata dal ricercatore, è
possibile che il rendimento del corso di formazione venga sottostimato in quanto
somministrato ad individui che continueranno, anche dopo la frequenza del corso, a non
cercare lavoro in maniera efficace.
Le metodologie di individuazione del campione possono essere classificate in
“sperimentali” e “non sperimentali”.
• Metodologie sperimentali.
In questo caso i campioni vengono estratti casualmente dalla popolazione dei soggetti
potenzialmente idonei a partecipare a un determinato programma. La selezione casuale in
questo caso garantisce che la differenza tra i valori attesi della variabile obiettivo nei due
campioni, dei trattati e dei non trattati, garantisca una stima corretta dell’impatto della politica
sui soggetti esposti al trattamento. In pratica, nel caso in cui si disponga di un campione
sperimentale, l’impatto netto può essere ottenuto come differenza tra il risultato medio
conseguito dai trattati e quello realizzato dai non trattati.
• Metodologie non sperimentali
Questo approccio prevede la definizione di un campione composto di un gruppo di
partecipanti al programma e da un gruppo di non partecipanti scelti in modo da risultare più
Dipartimento di Economia e Statistica, Università della Calabria, Arcavacata di Rende (CS)
369
Primo rapporto di ricerca sul sistema di monitoraggio del mercato del lavoro e di valutazione degli effetti occupazionali del POR Calabria
vicini possibili ai partecipanti in base a delle caratteristiche ritenute rilevanti. Per una corretta
applicazione della metodologia di individuazione del campione è necessario che la variabile
risultato sia rilevabile e misurabile sia per i trattati che per i non trattati e che il metodo di
selezione non incorpori delle caratteristiche non osservabili correlate con la variabile obiettivo
poiché ciò potrebbe dare luogo a delle valutazioni erronee dell’impatto a causa di un
problema di sample selection bias.
Prima di affrontare le questioni metodologiche in dettaglio è necessario sottolineare la
necessità che alla base della definizione e della stima degli effetti del programma, e quindi
della costruzione del modello econometrico, ci sia un modello economico che fornisca una
guida alla specificazione delle relazioni empiriche e suggerisca la tipologia di dati richiesti per
stimare un modello di valutazione fondato su motivate assunzioni comportamentali. Metodi di
valutazione alternativi possono essere giudicati sulla base dei fondamenti economici sui quali
sono costruiti. Questo approccio è in contrasto con quello “case-by-case” della statistica, che
nell’ipotesi migliore può solo offrire una struttura intuitiva per motivare gli stimatori adottati.
In assenza di valide ipotesi teoriche comportamentali, questi metodi non sono utili per
confrontare i risultati provenienti da studi diversi o nel suggerire variabili esplicative.
Producono, al contrario, parametri di difficile interpretazione e sono inefficaci per rispondere
alle domande del policy maker. Il modello economico ha invece il compito di:
• suggerire una lista di variabili esplicative;
• suggerire restrizioni plausibili sui parametri utili per identificare il modello;
• suggerire forme funzionali specifiche per le equazioni da stimare.
3
Il problema valutativo
Come osservato nel paragrafo precedente il problema centrale nelle valutazioni di
policy è quello della costruzione del campione di controllo. Nel caso più semplice si può
immaginare che un individuo sia in grado di occupare uno di due stati mutualmente esclusivi:
“0” nel caso di assenza di trattamento e “1” in presenza di trattamento, dove D=0 indica
assenza di trattamento e D=1 indica presenza di trattamento. Il trattamento è associato alla
partecipazione al programma da valutare. Associato a ciascuno stato vi è un risultato o un
insieme di risultati. Supponiamo per semplicità che nel caso della partecipazione ad un
programma di formazione il risultato sia l’ottenimento di un lavoro. Possiamo esprimere
questo risultato in funzione di un set di variabili che lo determinano, X. Denominiamo i
possibili risultati Y0 e Y1 , che si riferiscono allo stato di non trattato e trattato rispettivamente.
Ad ogni individuo è associata una coppia di valori (Y0 ,Y1 ). Possiamo quindi scrivere il vettore
dei risultati per ciascuno stato come:
Y0 = µo ( X ) + U 0
Y1 = µ1 ( X ) + U 1
(1)
laddove E (Y0 | X ) = µ0 ( X ) e
E (Y1 | X ) = µ1 ( X ) . Il risultato dipende chiaramente dalle
decisioni prese da individui, imprese, famiglie e amministratori pubblici. Affinché le stime
econometriche producano dei parametri che rappresentano l’impatto netto del trattamento è
richiesto che la realizzazione di D non determini X dato il vettore dei risultati potenziali Y p .
Ossia che la funzione di densità condizionata sia:
f X | D, Y p = f X | Y p
(2)
altrimenti il parametro E (Y1 − Y0 | X , D = 1) non cattura l’effetto netto del trattamento sui
soggetti trattati e insorgono una serie di problemi tecnici.
Il guadagno ottenuto nel passare dallo stato 0 allo stato1 può essere indicato come:
(
)
(
)
Dipartimento di Economia e Statistica, Università della Calabria, Arcavacata di Rende (CS)
370
Primo rapporto di ricerca sul sistema di monitoraggio del mercato del lavoro e di valutazione degli effetti occupazionali del POR Calabria
∆ = Y1 − Y0
(3)
Se fosse possibile osservare un individuo in entrambi gli stati nello stesso periodo di
tempo non insorgerebbe alcun problema di stima. Il problema fondamentale che si incontra
nella valutazione dell’efficacia di un progetto risiede nel fatto che l’insieme di valori (Y1 ,Y0 )
non è noto e di conseguenza ∆ non può essere osservato. Tutti gli approcci al problema
valutativo tentano di ricostruire i dati mancanti. Questi tentativi differiscono nelle assunzioni
effettuate sulla relazione trai i dati mancanti e i dati disponibili e sulla base dei dati
disponibili. Molti approcci nell’ambito delle scienze sociali accettano l’idea che sia
impossibile ricostruire il ∆ per ciascun individuo. Allo stesso tempo, il problema valutativo si
sposta dal livello individuale a quello della popolazione di cui viene stimato il ∆ medio o
alcuni aspetti della sua distribuzione. Le questioni di rilievo consistono quindi proprio nella
definizione delle caratteristiche della distribuzione di interesse e nell’individuazione della
popolazione di riferimento.
4
Definizione della variabile obiettivo
Volendo fornire una semplice schematizzazione del problema da trattare possiamo
immaginare che dal punto di vista del pianificatore sociale, che considera lo stato 0 come
quello prevalente in assenza di intervento, le variabili di interesse possano essere le seguenti:
• La quota di individui che partecipano al programma e che ne traggono benefici:
Pr (Y1 > Y0 | D = 1) = Pr (∆ > 0 | D = 1)
•
(4)
la quota della popolazione che complessivamente trae beneficio dal programma (a
causa di eventuali benefici indiretti)
Pr (Y1 > Y0 | D = 1) Pr (D = 1) = Pr(∆ > 0 | D = 1) Pr ( D = 1)
• i quantili della funzione di distribuzione dell’impatto del programma
(5)
inf {∆ : F (∆ | D = 1) > q}
(6)
∆
•
la distribuzione dei benefici del programma al di sopra di una determinata soglia
F (∆ | D = 1, Y0 = y o )
(7)
• l’aumento della quota dei risultati al di sopra di una determinata soglia attribuibili
all’implementazione del programma:
(
)
(
)
Pr Y1 > y |D = 1 − Pr Y0 > y |D = 1
(8)
Molta della letteratura empirica considera unicamente l’effetto medio diretto del
programma su coloro i quali sono soggetti al trattamento.
5
Alcuni stimatori utilizzati per le valutazioni d’impatto.
Come è stato osservato, la valutazione impone un confronto tra il risultato degli
individui trattati rispetto a quello dei non trattati. Per ottenere il valore d’interesse
E (Y1 − Y0 | X , D = 1) è necessario costruire il controfattuale E (Y0 | X , D = 1) , che non è
osservabile, mentre esistono dati relativi a E (Y1 | X , D = 1) . Un individuo che ha partecipato
al programma viene quindi confrontato con un individuo che ha caratteristiche simili ma che
Dipartimento di Economia e Statistica, Università della Calabria, Arcavacata di Rende (CS)
371
Primo rapporto di ricerca sul sistema di monitoraggio del mercato del lavoro e di valutazione degli effetti occupazionali del POR Calabria
non ha partecipato al programma. Il problema è di conseguenza, quello di costruire un sistema
obiettivo per dimostrare che l’individuo utilizzato per il confronto è effettivamente idoneo a
svolgere questa funzione.
5.1
Lo stimatore “before -after”
Nella letteratura empirica è spesso utilizzato uno stimatore che confronta ciascun
individuo con se stesso utilizzando dati longitudinali. Questo metodo implica quindi la
disponibilità di osservazioni ripetute nel tempo riferite allo stesso soggetto. Indicando con
Y0 , t −1 il risultato dell’individuo prima della partecipazione al programma, questo stimatore fa
uso di questa variabile per approssimare lo stato in assenza di trattamento ipotizzando che
E (Y0 , t − Y0 , t −1 | D = 1) = 0
(9)
Se questa assunzione è valida lo stimatore consiste in:
Y 1 ,t − Y 0 , t
(10)
dove “1” indica che la stima è condizionata rispetto a D=1, mentre la barra indica la media
campionaria.
Per ogni individuo i benefici del programma possono essere indicati come:
Y1,t − Y0 , t = (Y1 ,t − Y0 , t −1 ) + (Y0 ,t −1 − Y0 ,t )
(11)
(
)
Il secondo termine Y0 , t −1 − Y0 ,t rappresenta l’errore di approssimazione. Se questo è in
media pari a zero, è possibile stimare l’impatto del programma sugli individui che partecipano
in termini della differenza dei guadagni medi ottenuti prima e dopo la partecipazione al
programma. Questi valori medi possono essere definiti in funzione di caratteristiche personali,
X. Se l’errore di approssimazione è pari a 0 è sufficiente avere dati cross section per due
periodi per calcolare l’esito del programma 2 . Naturalmente l’assunzione di media zero per
l’errore di approssimazione è facilmente violata ed in questo consiste il principale limite dello
stimatore.
5.2
Lo stimatore “difference-in-differences”
Questo stimatore , più usato del precedente, presuppone l’accesso a dati longitudinali o
a dati riferirti a cross section ripetute nel tempo. Nell’ipotesi in cui la variazione media del
risultato in assenza di partecipazione al programma è lo stesso sia per coloro che partecipano
che per quelli che non partecipano, ossia è valida la seguente espressione:
E (Y0 , t − Y0 , t −1 | D = 1) = E (Y0 , t − Y0 ,t −1 | D = 0)
(12)
allora lo stimatore difference-in-differences è dato da:
(Y
) (
)
− Y 0 ,t −1 1 − Y 0 ,t − Y 0 , t −1 0
(13)
Poiché non è possibile valutare il termine (Y1, t −Y 0 , t )1 − (Y0 , t −Y 0 ,t −1 )0 per ciascun
individuo, al fine di utilizzare lo stimatore è necessario effettuare ipotesi aggiuntive come nel
caso dello stimatore illustrato nel punto 5.1.
1 ,t
5.3
Lo stimatore cross section
Questo stimatore confronta i valori medi dei guadagni dei soggetti sottoposti e non
sottoposti al trattamento al tempo t.
L’assunzione chiave per questo stimatore consiste in:
E (Y0 , t | D = 1) = E (Y0 ,t | D = 0) ,
(14)
2
Questo punto sarà esaminato in dettaglio nel paragrafo 9.
Dipartimento di Economia e Statistica, Università della Calabria, Arcavacata di Rende (CS)
372
Primo rapporto di ricerca sul sistema di monitoraggio del mercato del lavoro e di valutazione degli effetti occupazionali del POR Calabria
ossia che in media un individuo che non partecipa al programma otterrebbe dal trattamento lo
stesso risultato di chi ha partecipato. Se questa assunzione è valida, allora lo stimatore cross
section è dato da:
Y 1, t 1 − Y 0 , t 0 .
(15)
Se un individuo partecipa al programma sulla base del risultato ottenibile in base alla
partecipazione al programma allora l’assunzione su cui è basato lo stimatore viene violata.
Questa assunzione è infatti soddisfatta solo se la partecipazione non è determinata dal risultato
ex-post.
( ) ( )
6
Metodologia sperimentale
Negli anni più recenti l’utilizzo di metodologia sperimentale ai fini della valutazione
delle politiche del lavoro è stata usata sempre più frequentemente, in particolar modo negli
Stati Uniti. Prima di illustrare i principi su cui si basano questi metodi è necessario
sottolineare che così come per quelli non sperimentali, la validità degli stimatori costruiti con
questa metodologia si basa su precise assunzioni comportamentali e statistiche. In quanto
segue, si assuma che il simbolo “*” indichi il risultato in presenza di assegnazione casuale
dell’individuo al programma. Di conseguenza, condizionatamente al set di variabili X per
ogni individuo si ottiene (Y1* , Y0* , D* ) in presenza di assegnazione casuale al programma e
(Y , Y
, D ) quando il programma opera in assenza di selezione casuale. Si assuma che R=1
indichi l’appartenenza al gruppo sperimentale degli individui trattati mentre R=0 indichi
appartenenza al gruppo di controllo sperimentale.
L’assunzione necessaria affinché la selezione risolva il problema della valutazione
degli effetti medi del trattamento sui trattati è che:
E (Y1* − Y0* | X , D* = 1) = E (Y1 − Y0 | D = 1) .
(16)
Questa assunzione indica che i valori attesi per gli individui trattati e per il gruppo di
controllo generati dalla selezione casuale producono i parametri rappresentativi della
popolazione. Assunzioni più stringenti sono però richieste al fine di stimare la distribuzione
degli effetti del programma F (∆ | D = 1) . Senza di queste i dati sperimentali così come quelli
non sperimentali non sono in grado di identificare la distribuzione degli impatti perché lo
stesso individuo non viene osservato contemporaneamente nei due stati di assenza e presenza
del trattamento. Altri problemi nell’implementazione della metodologia sperimentale derivano
dalla decisione individuale di partecipare al programma per cui il soggetto è stato selezionato
e dal drop out.
1
7
0
Il problema dell’inferenza nella metodologia sperimentale e non
sperimentale
Molti studi recenti manifestano un diffuso scetticismo nei confronti della metodologia
sperimentale che nel tentativo di superare la necessità di costruire un modello economico di
riferimento per la valutazione dell’impatto del programma, forniscono evidenza empirica che
non garantisce informazioni rilevanti né per il ricercatore né per il politico. Anzi, questi
metodi sembrano introdurre una serie di distorsioni nelle stime che li rendono inefficaci. Di
conseguenza, è necessario fare riferimento a metodi non sperimentali per la soluzione dei
problemi di selezione. In questo paragrafo si cercano di chiarire le differenze tra le due
metodologie. Nel diagramma 1 vengono presentati una serie di potenziali risultati riferiti
all’occupabilità di individui che hanno fatto training. Per i soggetti che hanno partecipato al
programma di formazione Y1 è uguale a 1 se l’individuo è occupato dopo aver completato il
programma e 0 altrimenti. Per chi non ha partecipato Y0 è definito in modo analogo. Come
Dipartimento di Economia e Statistica, Università della Calabria, Arcavacata di Rende (CS)
373
Primo rapporto di ricerca sul sistema di monitoraggio del mercato del lavoro e di valutazione degli effetti occupazionali del POR Calabria
nei paragrafi precedenti D=1 indica che una persona è stata selezionata per partecipare al
progetto. Quando il ricercatore osserva dei dati sperimentali è in grado di osservare sia Y1 che
Y0 per gli individui selezionati. Ossia, osserva i totali per riga e per colonna per gli individui
trattati, D=1, ma non la quota degli individui scelti per fare training che non avrebbero
trovato occupazione sia in assenza che in presenza di training, P001 . Al fine di stimare questo
valore sarebbe necessario assumere che la formazione non determina la non occupabilità di
chi non sarebbe comunque stato occupato in assenza di training. Questa assunzione, detta di
monotonicità, permette di fissare P101 =0 e, di conseguenza calcolare, dati i totali, le rimanenti
componenti della matrice. In questo caso, la variabile di interesse consiste in P011 che
definisce la quota di individui che cambia stato in presenza di formazione. Le stime effettuate
con dati sperimentali trovano, in generale, che questa quota è piuttosto bassa. Gli analisti che
hanno accesso a dati non sperimentali osservano solo i dati per colonna nella tabella D=1 e
D=0. Inoltre, ad essi è nota la quota di individui che partecipa ai progetti di formazione. Il
compito del ricercatore è quindi quello di trovare una serie di variabili e imporre una serie di
condizioni affinché i totali per riga nella matrice D=0 permettano di stimare i totali per riga
della matrice D=1.
Sia le metodologie sperimentali che non sperimentali necessitano quindi di una serie di
assunzioni aggiuntive al fine di stimare i parametri di interesse del modello.
Diagramma 1.1-Probabilità occupazionale secondo la partecipazione a corsi di formazione.
Y1
Y0
0
1
0
P001
P101
P.01
Y1
1
P011
P111
P.11
P0.1
P1.1
0
1
Y0
0
P000
P100
P.00
D=1
8
1
P010
P110
P.10
P0.0
P1.0
D=0
La costruzione del gruppo di controllo
Tutti gli stimatori utilizzati per la valutazione dell’impatto delle politiche si basano sui
tre principi illustrati nel paragrafo 5, che implicano il confronto tra gli individui trattati e non
trattati. Il confronto può verificarsi in un certo punto nel tempo come nello stimatore cross
section, confrontando lo stesso individuo prima e dopo il trattamento come nello stimatore
before-after, o mediante un ibrido di questi due metodi come con lo stimatore difference-indifferences. Questi stimatori differiscono per il modo in cui costruiscono il controfattuale
E (Y0 , t | X , D = 1) . In questo paragrafo, è illustrato il problema della costruzione del gruppo di
controllo mediante l’uso di metodi basati su tecniche di matching. In quanto segue, si
considera che il set di variabili X non condizioni D. Assumendo che X sia il set di variabili
condizionanti e Yp il vettore dei risultati potenziali definiti come Yt p = (Y0 , t , Y1, t ) , e
(
)
Y p = Y1 p , K , YTp , mentre X = ( X 1 , K , X T ) , si tratta di definire i valori ammissibili di X, sui
quali viene effettuato il condizionamento, per definire i parametri che caratterizzano:
(
)
(
)
)
f X | D, Y p = f X | Y p
(17)
p
p
p
dove f X | D, Y è la densità di X dato D e f X | Y è la densità di X dato Y .
Quando la partecipazione al progetto di training è volontaria, un valutatore che ha
accesso ai dati cross section è in grado di costruire la distribuzione dei risultati per i
partecipanti, F (Y1 | X , D = 1) , e per i non partecipanti, F (Y0 | X , D = 0 ) . Quest’ultima, viene
(
(
)
Dipartimento di Economia e Statistica, Università della Calabria, Arcavacata di Rende (CS)
374
Primo rapporto di ricerca sul sistema di monitoraggio del mercato del lavoro e di valutazione degli effetti occupazionali del POR Calabria
utilizzata per approssimare F (Y0 | X , D = 1) , e ciò introduce problemi di selezione. Usando
questa approssimazione infatti, la distorsione introdotta stimando E (Y1 − Y0 | X , D = 1) è data
da:
B( X ) = E(Y0 | X , D = 1) − E(Y0 | X , D = 0 )
(18)
Esistono metodologie in grado di eliminare o correggere questa distorsione.
8.1
Il metodo del matching
Il metodo del matching assume che l’analista abbia accesso ad un set di variabili
condizionanti in modo tale che, all’interno di ciascuno stato definito dal set X, la distribuzione
del risultato controfattuale dei partecipanti sia lo stesso di quello dei non partecipanti. La
letteratura statistica sul matching assume quindi l’accesso ad un set di variabili X in modo tale
che:
A1: (Y0 , Y1 )⊥D | X
(19)
Di
conseguenza,
per
la
distribuzione
dei
risultati
è
vero
che:
F (Y0 | D = 1, X ) = F (Y0 | D = 0, X ) = F (Y0 | X )
e
F (Y1 | D = 1, X ) = F (Y1 | D = 0, X ) = F (Y1 | X ) .
Se l’assunzione di ortogonalità è valida è possibile utilizzare i dati sui non-partecipanti
per misurare quello che i partecipanti avrebbero guadagnato se non avessero partecipato,
condizionatamente ad X. Per assicurare che questa assunzione abbia contenuto empirico è
inoltre necessario presupporre che esistano entrambi i gruppi di individui per ciascun set X
sulla base del quale si intende effettuare il confronto. Ossia:
A2: 0 < Pr ( D = 1 | X ) < 1 .
(20)
Date queste assunzioni la procedura di matching produce un gruppo di controllo simile
ad un gruppo di controllo sperimentale poiché dato X, la distribuzione del risultato
controfattuale per i partecipanti è identica a quella osservata per i non partecipanti. Ossia:
E (Yo | X , D = 1) = E (Yo | X , D = 0 )
(21)
e
E (Y1 | X , D = 1) = E (Y1 | X , D = 0 ) .
(22)
Quindi, per ogni punto in X, la distorsione B(X)=0. Ad ogni modo, questa assunzione
non implica l’assenza di distorsione da selezione E (U o | X , D = 1) = 0 . Al contrario, il
matching bilancia la distorsione in modo tale che:
E (U o | X , D = 1) = E (U o | X , D = 0 ) = E(U 0 | X ) .
(23)
Per rendere operativo il metodo del matching è necessario identificare per ciascun
individuo trattato un gruppo di individui simili. In pratica, è possibile costruire un gruppo
C(Xi) dove Xi rappresenta le caratteristiche dell’individuo i. Assumendo che esistano Nc
individui nel campione di controllo e Ni nel campione dei trattati, gli individui nel gruppo di
controllo simili ad i, sono gli individui j per i quali X j ∈ C ( X i ) , ossia l’insieme di individui
Ai = { j | X j ∈ c( X i }. Se W(i,j) è il peso riferito all’osservazione j nell’effettuazione del
confronto con l’osservazione i e, inoltre, si assume che la somma dei pesi è pari all’unità, è
possibile formare un gruppo di controllo dato da:
Nc
Y i = ∑ W (i , j )Y jc
c
(24)
J =1
c
e l’effetto stimato del trattamento per l’individuo i è Yi − Y i .
Dipartimento di Economia e Statistica, Università della Calabria, Arcavacata di Rende (CS)
375
Primo rapporto di ricerca sul sistema di monitoraggio del mercato del lavoro e di valutazione degli effetti occupazionali del POR Calabria
Esistono differenti schemi di matching proposti in letteratura.
• Lo stimatore nearest-neighbor.
Questo definisce Aj in modo tale che solo un j è selezionato poiché è il più vicino ad
Xi:
Ai =  j | Min || X i − X J ||
 j∈{1,L, N c }

dove || || è la metrica di Mahalanobis che esprime la distanza nello spazio delle caratteristiche:
'
−1
|| ||= (X i − X j ) Σ (X i − X j )
c
(25)
(26)
con Σ che misura la matrice delle covarianze nel gruppo di controllo. Lo schema di
c
ponderazione per questo stimatore è:
1 se j ∈ A j
W ij = 
0 altrimenti
• Lo stimatore kernel
(27)
Questo stimatore usa l’intero gruppo di controllo e ciascuna osservazione viene
utilizzata e pesata differentemente.
W (i , j ) =
(
K X j − Xi
)
K (X j − X i )
∑
j=1
Nc
(28)
dove K è un kernel, ossia una funzione di distribuzione standard.
L’impatto del trattamento è pertanto stimato formando la differenza media:
m=
8.2
1
Nt
∑ (Y
Nt
i =1
t
i
c
)
−Y i =
1
Nt
 t Nt
 Yi − ∑ W (i , j )Y jc
∑

i =1 
j =1
Nt




(29)
Il metodo del propensity score
Uno schema alternativo del metodo del matching si basa sull’uso della probabilità di
partecipare al programma, cosiddetto “propensity score”, ossia P( X ) = Pr (D = 1 | X ) . Date le
assunzioni A1 e A2 allora:
A3: (Y1 , Y0 ⊥D | P ( X ) per X ∈ χc )
(30)
dove χc indica un insieme in cui A2 è valida. Data A3, per costruire la media condizionata
E (Yo | P( X ), D = 1) riferita al gruppo di controllo, è necessario che:
B( P( X )) = E (Yo | P( X ), D = 1) − E (Y0 | P( X ), D = 0 ) = 0 .
(31)
Nell’ipotesi in cui l’esposizione al trattamento è casuale, data una popolazione di i
individui, se il propensity score è noto allora l’effetto medio del trattamento può essere
stimato come segue:
Dipartimento di Economia e Statistica, Università della Calabria, Arcavacata di Rende (CS)
376
Primo rapporto di ricerca sul sistema di monitoraggio del mercato del lavoro e di valutazione degli effetti occupazionali del POR Calabria
τ ≡ E{Y1i − Y0 i | Di = 1}
= E [E{Y1i − Y0 i | Di = 1, P( X i )}]
= E [E{Y1i | Di = 1, P ( X i )}− E {Y0 i | Di = 0, P( X i )}| Di = 1]
(32)
se:
D⊥X | P( X ) Balancing hypothesis
Y1 , Y0 ⊥D | X
Y1 , Y0 ⊥D | P( X ) Unconfoundedness hypothesis
Se queste ipotesi sono soddisfatte, le osservazioni con lo stesso propensity score
devono avere la stessa distribuzione dei valori osservati caratteristici indipendentemente dalla
presenza o assenza di trattamento. In altre parole, per un dato propensity score, l’esposizione
al trattamento è casuale e quindi le unità trattate e quelle di controllo devono essere in media
identiche all’osservazione. Qualunque modello standard di probabilità può essere usato per
stimare il propensity score. Per esempio, Pr ( Di = 1 | X i ) = F {h( X i )} dove F(.) è la normale o
la distribuzione cumulata logistica e h ( X i ) è una funzione di covariate con termini lineari o di
ordine più elevato. Ad ogni modo una stima del propensity score non è abbastanza per
valutare l’impatto medio del programma. La ragione è che la probabilità di osservare due
unità con esattamente lo stesso valore del propensity score è nulla poiché P(X) è una variabile
continua. Sono stati approntati vari metodi per superare tale problema. Tra i più usati
ricordiamo il nearest-neighbor matching, il radius matching, il kernel matching e lo
stratification matching.
9
Gli stimatori panel data
La possibilità di utilizzare dati che contengono informazioni ripetute nel tempo per lo
stesso individuo consente al ricercatore di esaminare l’evoluzione temporale della variabile
risultato e permette di controllare i problemi di selezione mediante l’ipotesi di separabilità tra
modello ed errore. Di seguito sono analizzati alcuni stimatori panel comunemente in uso,
soprattutto nella letteratura empirica di oltre oceano, per la valutazione dei programmi di
formazione.
9.1
Il modello ad effetti fissi
Si consideri un modello di regressione del tipo
Y = Xβ + D α + U
(33)
con E (U ) = 0 . La letteratura convenzionale è interessata al parametro α e il problema di
selezione nasce dalla correlazione tra D e U. I risultati potenziali differiscono proprio della
costante α. Nell’ipotesi di dati longitudinali, se si assume U1 ,t = U 0 ,t = U t cosicché
Y1 ,t − Y0 , t = α , è possibile che problemi di stima insorgano a causa della dipendenza di α da X
e, dunque, α( X ) . L’assunzione necessaria all’identificazione del modello, così come per lo
stimatore before-after illustrato precedentemente è che:
E (U 0 , t | X , D = 1) = E(U 0 ,t −1 | X , D = 1) t > k > t − 1
(34)
dove k rappresenta il periodo di occorrenza della partecipazione al programma.
Si possono ipotizzare differenti strutture per l’errore U che soddisfano o meno
l’assunzione di identificazione. L’ipotesi è soddisfatta, ad esempio, nel caso in cui l’errore
abbia una struttura del tipo “permanent-transitory”, ossia:
Dipartimento di Economia e Statistica, Università della Calabria, Arcavacata di Rende (CS)
377
Primo rapporto di ricerca sul sistema di monitoraggio del mercato del lavoro e di valutazione degli effetti occupazionali del POR Calabria
U t = φ + εt
(35)
dove εt è una variabile casuale con media zero, non autocorrelata e indipendente
rispetto a φ. Ma problemi differenti insorgono nelle ipotesi più realistiche di errore con
struttura autoregressiva del primo ordine o stazionario in covarianza. Il vantaggio del metodo
panel con effetti fissi consiste chiaramente nel fatto che per la stima non è necessario avere un
gruppo di controllo poiché il coefficiente d’interesse è dato da:
α = E (Yt | D = 1) − E (Yt −1 | D = 1)
(36)
e, di conseguenza non sono richieste informazioni su coloro i quali non partecipano al
programma ma solo sui partecipanti. Ad ogni modo, in presenza di non stazionarietà, ossia se
βt ≠ βt −1 non è più possibile fare a meno del gruppo di controllo. Lo stimatore ad effetti fissi
è anche robusto rispetto a problemi di campionamento non casuale.
9.2
L’utilizzo di dati cross section ripetuti nel tempo
Alcuni metodi validi per la stima con dati panel possono essere utilizzati anche avendo
a disposizione dati cross section ripetuti nel tempo. I metodi per la costruzione e gli stimatori
applicabili a questi dati cosiddetti pseudo panel non vengono illustrati in questa sede. Ci si
limita infatti ad illustrare una possibile applicazione alle cross section ripetute dello stimatore
panel con effetti fissi.
Si assuma che:
E (U t | D = 1) = E (U t −1 | D = 1)
(37)
E (U t | D = 0) = E (U t −1 | D = 0)
per t e t − 1 in modo tale che t > k > t − 1 . Il parametro d’interesse può essere definito
in termini di momenti riferiti alla popolazione come:
α = [E (Yt | D = 1) − E (Yt | D = 0)] − [E(Yt −1 | D = 1) − E(Yt −1 | D = 0 )]
(38)
con il corrispettivo termine riferito al campione rappresentato da:
(
(1)
( 0)
)(
(1)
( 0)
)
αˆ = Y t − Y t − Y t −1 − Y t −1 .
(39)
Se il campionamento è casuale, ne consegue la consistenza di α̂. In presenza di più di
due cross section l’assunzione su cui si basa questo stimatore può essere sottoposta a test.
Naturalmente, nel caso in cui quest’assunzione viene meno e l’errore presenta una struttura
autoregressiva o altro, i problemi di stima si complicano notevolmente e la consistenza non è
assicurata.
10
La pratica econometrica e la scelta dei dati
Uno dei principali insegnamenti che si può derivare dalla letteratura sulla valutazione
dei programmi di formazione è che la scelta effettuata dal valutatore in merito ai dati
utilizzati, la costruzione del gruppo di controllo e la specificazione del modello econometrico
ha effetti rilevanti sull’effetto stimato della partecipazione al programma. La scelta del gruppo
di controllo può influenzare, ad esempio, le proprietà statistiche di uno stimatore applicato al
campione. Sotto alcune condizioni, per alcuni gruppi di controllo, il semplice confronto tra
medie dei trattati e dei non-trattati può essere in grado di identificare il parametro d’interesse.
Al fine di valutare gli effetti delle politiche adottate è quindi fondamentale la scelta della fonte
dei dati per la costruzione del gruppo dei trattati e del gruppo di controllo. Sia nelle
valutazioni sperimentali che non sperimentali, la scelta riferita ai dati ha un impatto decisivo
sul costo della valutazione, sulla grandezza del campione esaminato (che influenza la
dimensione dell’effetto del training riconoscibile sotto il profilo statistico), sul tipo di
risultato misurabile, sul periodo temporale di osservazione della variabile risultato e sulle
Dipartimento di Economia e Statistica, Università della Calabria, Arcavacata di Rende (CS)
378
Primo rapporto di ricerca sul sistema di monitoraggio del mercato del lavoro e di valutazione degli effetti occupazionali del POR Calabria
caratteristiche dell’errore di misurazione della stessa. Una tipologia di dati utilizzabili allo
scopo di valutare gli esiti del programma può essere definita come segue.
• Dati provenienti da indagini preesistenti non attuate in relazione al programma.
Il vantaggio di usare set di dati già esistenti consiste chiaramente nel costo limitato e
nella dimensione del campione. Usare un set di dati già esistenti ha il vantaggio di limitare il
costo del disegno del campionamento e della raccolta dati e rende possibile la costruzione di
cross section ripetute e pseudo panel. Gli svantaggi consistono in primo luogo nelle difficoltà
associate alla costruzione del gruppo di controllo e nel fatto che è impossibile ottenere
variabili d’interesse specifiche in relazione al programma. Per l’Italia, un esempio è
l’indagine trimestrale sulle forze di lavoro ISTAT.
• Dati amministrativi.
Questi dati contengono informazioni raccolte per fini fiscali o di assistenza sociale. Il
vantaggio consiste nel basso costo e nel fatto che si suppongono immuni da alcuni tipi di
errore di misurazione. Lo svantaggio consiste nel fatto che spesso non contengono molte
informazioni sugli individui. I dati INPS rappresentano, in Italia, un set di dati con queste
caratteristiche.
• Dati raccolti espressamente per la valutazione del programma.
In questo caso il valutatore ha il pieno controllo sulle informazioni raccolte e, di
conseguenza, può rilevare le variabili specifiche d’interesse e, nel caso di metodologie nonsperimentali, alla luce del modello econometrico da utilizzare. Un ulteriore vantaggio è che
per la costruzione del gruppo di controllo si possono utilizzare soggetti all’interno dello stesso
mercato del lavoro locale. Naturalmente, la raccolta di dati specifici ha un costo elevato. A
questa categorie di dati appartengono quelli raccolti da società come ERVET per l’EmiliaRomagna e IReR per la regione Lombardia al fine di valutare l’impatto dei corsi di
formazione in queste regioni nell’ambito dei progetti realizzati con l’ausilio del Fondo Sociale
Europeo.
• Dati provenienti da fonti diverse.
Questa può essere la soluzione alla limitatezza delle informazioni provenienti dall’uso
di un’unica fonte. In Italia, l’ISFOL ha utilizzato questa metodologia al fine di fornire una
misura dell’efficacia della formazione professionale quale strumento di politica attiva del
lavoro nelle regioni del centro-nord.
Conclusioni
Le questioni metodologiche discusse in questo studio sono incentrate sui seguenti
punti.
•
•
•
•
Nella valutazione dell’impatto della formazione professionale è necessario
riconoscere la molteplicità dei parametri d’interesse. Questa molteplicità discende
anche dalla documentata eterogeneità dell’impatto sia sui singoli individui che su
differenti collettività. Questa eterogeneità ha, a sua volta, un impatto sulle
proprietà formali degli stimatori utilizzati.
La scelta di un metodo di valutazione dipende dalla variabile risultato d’interesse
e dal modello economico che genera la partecipazione al programma e il risultato
stesso.
Non esiste una metodologia universalmente corretta per costruire il gruppo di
controllo d’interesse. Anche la metodologia sperimentale è valida solo in base a
specifiche assunzioni comportamentali.
Il fatto che differenti stimatori conducono a differenti risultati è coerente con il
fatto che ciascuno di essi risolve differentemente il problema del sample selection
bias.
Dipartimento di Economia e Statistica, Università della Calabria, Arcavacata di Rende (CS)
379
Primo rapporto di ricerca sul sistema di monitoraggio del mercato del lavoro e di valutazione degli effetti occupazionali del POR Calabria
•
•
•
I dati ottenuti con metodologia sperimentale non necessariamente riducono la
distorsione in misura maggiore rispetto a quelli ottenuti con metodologie non
sperimentali.
Le metodologie sperimentali pur permettendo di superare il problema della
costruzione e specificazione del modello econometrico ai fini di valutare gli effetti
del programma, consentono di identificare un numero limitato di parametri e ne
escludono alcuni che possono essere di grande interesse per il policy maker.
Obiettivo di chi deve implementare uno specifico disegno di politica economica
dovrebbe infatti essere quello di rispondere a dei quesiti posti da modelli
economici teoricamente fondati.
L’implementazione di programmi su larga scala ha sicuramente un impatto su
tutta la popolazione, anche dei non trattati. La valutazione degli effetti indiretti del
programma resta dunque una questione aperta di cui il valutatore deve
necessariamente occuparsi.
Dipartimento di Economia e Statistica, Università della Calabria, Arcavacata di Rende (CS)
380