Documentos de Académico
Documentos de Profesional
Documentos de Cultura
DE ECONOMA
DEPARTAMENTO DE ECONOMA
PONTIFICIA DEL PER UNIVERSIDAD CATLICA
DEPARTAMENTO DE ECONOMA
PONTIFICIA DEL PER UNIVERSIDAD CATLICA
DEPARTAMENTO DE ECONOMA
PONTIFICIA DEL PER UNIVERSIDAD CATLICA
DEPARTAMENTO DE ECONOMA
PONTIFICIA DEL PER UNIVERSIDAD CATLICA
DEPARTAMENTO DE ECONOMA
PONTIFICIA DEL PER UNIVERSIDAD CATLICA
DEPARTAMENTO DE ECONOMA
PONTIFICIA DEL PER UNIVERSIDAD CATLICA
DEPARTAMENTO DE ECONOMA
PONTIFICIA DEL PER UNIVERSIDAD CATLICA
DEPARTAMENTO DE ECONOMA
PONTIFICIA DEL PER UNIVERSIDAD CATLICA
DEPARTAMENTO DE ECONOMA
DEPARTAMENTO DE ECONOMA
PONTIFICIA DEL PER UNIVERSIDAD CATLICA
DEPARTAMENTO DE ECONOMA
PONTIFICIA DEL PER UNIVERSIDAD CATLICA
DOCUMENTO DE TRABAJO N 283
ECONOMETRA DE EVALUACIN
DE IMPACTO
Luis Garca Nez
DOCUMENTO DE ECONOMA N 283
ECONOMETRA DE EVALUACIN
DE IMPACTO
Luis Garca Nez
Mayo, 2010
DEPARTAMENTO
DE ECONOMA
DOCUMENTO DE TRABAJO 283
http://www.pucp.edu.pe/departamento/economia/images/documentos/DDD283.pdf
Departamento de Economa Pontificia Universidad Catlica del Per,
Luis Garca Nez
Av. Universitaria 1801, Lima 32 Per.
Telfono: (51-1) 626-2000 anexos 4950 - 4951
Fax: (51-1) 626-2874
econo@pucp.edu.pe
www.pucp.edu.pe/departamento/economia/
Encargada de la Serie: Giovanna Aguilar Anda
Departamento de Economa Pontificia Universidad Catlica del Per,
gaguila@pucp.edu.pe
Luis Garca Nez
ECONOMA DE EVALUACIN DE IMPACTO / Luis Garca Nez
Lima, Departamento de Economa, 2010
(Documento de Trabajo 283)
Informalidad / Inferencia Causal / Evaluacin de Programas /
Regresin Discontinua / Variables Instrumentales / Matching
Las opiniones y recomendaciones vertidas en estos documentos son responsabilidad de sus
autores y no representan necesariamente los puntos de vista del Departamento Economa.
Hecho el Depsito Legal en la Biblioteca Nacional del Per N 2010-06580
ISSN 2079-8466 (Impresa)
ISSN 2079-8474 (En lnea)
Impreso en Cartolan Editora y Comercializadora E.I.R.L.
Pasaje Atlntida 113, Lima 1, Per.
Tiraje: 100 ejemplares
ECONOMETR A DE EVALUACI N DE I MPACTO
Luis Garca Nez
Resumen
En aos recient es los mt odos de evaluacin de impact o se han difundido
ampliament e en la invest igacin microeconmica aplicada. Sin embargo,
la variedad de mt odos responde a problemas part iculares y especficos
los cuales est n det erminados normalment e por los dat os disponibles y el
impact o que se busca medir. El present e document o resume las
principales corrient es disponibles en la lit erat ura act ual, poniendo nfasis
en los supuest os baj o los cuales el efect o t rat amient o promedio ATE y el
efect o t rat amient o promedio sobre los t rat ados ATET se encuent ran
ident ificados. Adicionalment e se present an algunos ej emplos de
aplicaciones prct icas de est os mt odos. Se busca hacer una
present acin didct ica que pueda ser t il a est udiant es avanzados y a
invest igadores aplicados que busquen conocer los principios bsicos de
est as t cnicas.
Abst ract
I n recent years t he program evaluat ion met hods have become very
popular in applied microeconomics. However, t he variet y of t hese
met hods responds t o specific problems, which are normally det ermined
by t he dat a available and t he impact t he researcher t ries t o measure.
This paper summarizes t he main met hods in t he current lit erat ure,
emphasizing t he assumpt ions under which t he average t reat ment effect
and t he average t reat ment effect on t he t reat ed are ident ified.
Addit ionally, aft er each sect ion I briefly present some applicat ions of
t hese met hods. This document is a didact ic present at ion aimed t o
advanced st udent s and applied researchers who wish t o learn t he basics
of t hese t echniques.
JEL Classificat ion codes: C13, C14, C31
Palabras Clave: I nferencia Causal, Evaluacin de Programas, Regresin
Discont inua, Variables I nst rument ales, Mat ching
2
ECONOMETR A DE EVALUACI N DE I MPACTO
Luis Garca Nez
1. I NTRODUCCI N
En dcadas recient es los est udios de evaluacin de impact o de polt icas
pblicas se han realizado con mt odos est adst icos y economt ricos cada
vez ms sofist icados, con el fin de obt ener una evaluacin cient ficament e
rigurosa. La popularidad de est os mt odos de evaluacin de impact o ha
llevado a que se busque aplicarlos en numerosos cont ext os. Sin embargo,
por lo general est os mt odos se basan en ciert os supuest os que
condicionan su radio de accin y que definen hast a donde se pueden
obt ener conclusiones valederas de las evaluaciones.
En est e document o se revisan algunas de est as populares t cnicas
ponindose nfasis en los aspect os met odolgicos. Se busca hacer una
present acin didct ica que pueda ser t il a est udiant es y a invest igadores
aplicados que busquen conocer los principios bsicos de est as t cnicas.
2. EL ANLI SI S DE I NFERENCI A CAUSAL EN ECONOM A
Desde t iempos muy remot os ha exist ido el int ers por est udiar las
relaciones causales en el mundo real. Tal como resume Holland ( 1985) , el
concept o de causalidad discut ido por los filsofos ha ido variando a lo
largo de los siglos. Sin embargo, el fondo de la discusin sigue siendo el
mismo: el int ers por hacer un est udio acerca de la relacin causal ent re
las variables. Est e est udio empieza con la pregunt a inicial de cualquier
est udio de impact o: cul es el efect o causal de una variable X sobre
ot ra variable Y? Responderla puede ser un asunt o no t an t rivial ni desde
el punt o de vist a analt ico ni desde los dat os. Pues para t ener una idea de
3
est e efect o, deberamos t ener alguna idea sobre la exist encia de una
relacin causal ent re est as variables.
Por mucho t iempo se pens que la est adst ica t ena poco que cont ribuir al
anlisis causal. La acept acin de la frase que la correlacin no implica
causalidad ha significado el lmit e que la est adst ica se ha puest o a si
misma en su cont ribucin a est e anlisis. Est o se debe a que
t radicionalment e la est adst ica inferencial ha est udiado la manera como
los dat os aparecen en el mundo real. Tal int ers conlleva al est udio de
la dist ribucin de probabilidad conj unt a de est as variables, la cual ent rega
las probabilidades de ocurrencia de ellas. Luego, cont ando con una
muest ra de observaciones de est as variables y haciendo algunos
supuest os simplificadores sobre la est ruct ura de est e proceso generador
de dat os, la est adst ica inferencial obt iene est imadores de los parmet ros
que configuran a t al proceso. Algunos de est os parmet ros como las
probabilidades y las esperanzas condicionales son llamados
parmet ros asociat ivos los cuales han sido ut ilizados como pieza clave
en el anlisis economt rico. Est os parmet ros no son det erminant es para
est ablecer relaciones causales ent re las variables. La presencia de
variables asociadas sin mayor sent ido, como en el caso de l as conocidas
regresiones espurias o la presencia de los llamados confounders ,
present a una limit acin import ant e para el anlisis de inferencia causal
con base en parmet ros asociat ivos
1
.
Sin embargo, como veremos en las siguient es secciones, la est adst ica s
t iene un papel import ant e en el anlisis causal. Est e lt imo va ms all
del mero anlisis de est adst ica inferencial t radicional. Hay aspect os
import ant es del proceso generador de dat os que no se limit an a decir que
dos variables econmicas est n correlacionadas y/ o asociadas, sino que
se t rat a de ver si efect ivament e puede comprobarse con los dat os que
una variable causa a ot ra. Con est e fin, la est adst ica inferencial es
1
Una int eresant e resea de los problemas que se pueden encont rar en est udios
observacionales en comparacin con est udios experiment ales se encuent ra en el
clsico document o de Cochran ( 1965) .
4
incorporada en el anlisis de causalidad como uno de sus inst rument os en
sus procedimient os.
Pero, en qu consist e el anlisis de inferencia causal? Desde los aos 20
del siglo pasado, se configur como el est udio de las variables del mundo
real, est ableciendo algn t ipo de ordenamient o secuencial o lgico ent re
ellas ( Goldberger 1972) . De est a manera, y baj o supuest os t ericos o de
j uicio no t est eables
2
( a menos que se realicen experiment os
cont rolados) se pues est ablecer una est ruct ura de ramificaciones causales
que une a aquellas variables y que generan los dat os observados. Est as
est ruct uras no se limit an solament e a las variables observables sino que
t ambin incluyen a aquellas que no son observables pero que suelen
t ener un rol import ant e en la est ruct ura ( Pearl 2000, 2009) . Est as
relaciones pueden ser escrit as en forma de ecuaciones, con lo cual se
definen los modelos de ecuaciones est ruct urales. En t ales ecuaciones se
represent an relaciones causales y no meras asociaciones empricas.
Cuando aplicamos est e anlisis a la economa, encont ramos que el
proceso generador de dat os est gobernado por relaciones econmicas
subyacent es a l ( vase por ej emplo, Haavelmo 1943, 1944) Est as
relaciones suelen ser simplificadas y sist emat izadas a t ravs de los
llamados modelos econmicos , los cuales definen clarament e a sus
variables exgenas y a sus endgenas. Es decir, los dat os econmicos no
ocurren por el mero azar sino que aparecen por relaciones ent re las
variables, en donde podemos dist inguir que unas variables ocasionan
algn efect o sobre ot ras. Las variables exgenas t ienen efect o sobre las
endgenas, y no al revs, y por ello podemos afirmar que las relaciones
de causalidad ent re variables econmicas t ienen en si mismas un
sust ent o en la t eora econmica.
2
Un ej emplo de un supuest o causal que no necesit a ser verificado es que ninguna
variable puede ocasionar un cambio en la edad de las personas.
5
El anlisis causal basado en ecuaciones est ruct urales es el ms complet o
pues ofrece una visin panormica del conj unt o lo cual permit e ent ender
especialment e a las dificult ades que pueden surgir en el proceso de
anlisis del efect o de una variable sobre ot ra. No obst ant e su uso no se
ha difundido ampliament e en est adst ica debido a que sus conclusiones
pueden depender muy sensiblement e de sus supuest os. En economa se
ut ilizan a t ravs de la versin de los modelos clsicos de ecuaciones
simult neas
3
. Sin embargo, algunos est udios ( por ej emplo, Lalonde,
1986) han comprobado que empricament e ent regan pobres result ados
en comparacin con mt odos experiment ales. Adicionalment e, las
est imaciones se basan en supuest os muy rest rict ivos sobre los t rminos
de pert urbacin de est as ecuaciones, siendo est as variables no
observables por el invest igador ( Angrist , I mbens y Rubin, 1996) . Por
lt imo, pueden ser complicados, y sobre t odo poco prct ico si el obj et ivo
es analizar el impact o ent re dos variables y no est amos muy int eresados
en est udiar a profundidad al rest o de variables que las circundan.
En est e document o nos concent ramos en el anlisis alt ernat ivo propuest o
por Neyman ( 1990) y Rubin ( 1974) y sint et izado por Holland ( 1985) ,
conocido como el modelo de result ados pot enciales . Est e modelo t iene
sus fundament os en los modelos de ecuaciones est ruct urales, aunque
est e enfoque es en general ms simple al basarse en los est udios
experiment ales, t eniendo al experiment o aleat orio cont rolado como su
paradigma. Se t rat a de aislar el efect o de x sobre y mant eniendo
cualquier ot ro fact or que afect e a y de manera cont rolada ; y para ello
se observan los result ados pot enciales de y ant e diferent es valores
hipot t icos de x . Tal est udio de valores pot enciales implica un avance en
t rminos met odolgicos y a su vez implica mayores desafos en t rminos
est adst icos debido a que algunos de los result ados pot enciales podran
ser no observables.
3
Aunque result en parecidos, los modelos de ecuaciones est ruct urales y los de
regresiones de ecuaciones simult neas t ienen algunas diferencias en cuant o a lo que
represent an realment e los parmet ros y en la nat uraleza de los t rminos de error
( Pearl, 2009, pg. 104) . Solo baj o algunos supuest os son equivalent es.
6
Siendo un poco ms especficos, supongamos que t enemos una poblacin
U
suj et a a est udio, cuyos element os son las unidades U i . Est as
unidades podran ser personas, empresas, inst it uciones, localidades, et c.)
Supongamos para simplificar que la variable x ( la variable causa )
puede t omar nicament e dos valores para cada unidad i:
i
x
0
y
i
x
1
, los
cuales t ienen un efect o pot encial sobre la variable y ( la variable efect o )
para cada unidad i , digamos
i
y
0
y
i
y
1
respect ivament e. Suponiendo que
t odo lo dems se mant iene const ant e, el efect o de una variacin de x
sobre y para cada unidad i ser simplement e la diferencia
i i
y y
0 1
.
Sin embargo, la aplicacin del supuest o de que cualquier ot ro fact or que
influencie a y debe est ar cont rolado exige que la unidad i sea expuest a
t ant o a
i
x
0
como a
i
x
1
al mismo t iempo y baj o exact ament e las mismas
condiciones. Est o no es posible pues si el individuo i ya fue expuest o a la
sit uacin
i
x
0
( la cual dio como result ado el valor
i
y
0
) , no es posible volver
en el pasado y deshacer lo hecho, y somet erlo ahora al valor
i
x
1
, con el
fin de observar
i
y
1
( el escenario cont rafact ual) . Dado que solo uno de los
dos result ados pot enciales es observable, el clculo de la diferencia
i i
y y
0 1
es imposible. Est e es el problema fundament al de la inferencia
causal.
Aunque se pudiera pensar que el escenario cont rafact ual puede ser
observado si en el fut uro a una unidad que se somet i a la sit uacin
i
x
0
ahora se le somet e a
i
x
1
, la observacin de y en est e caso no
correspondera al valor
i
y
1
necesario para calcular la diferencia pues se
violara el supuest o mencionado. Tal violacin ocurre porque al menos
alguna cosa debi cambiar en el t iempo
4
.
4
En algunos experiment os podra creerse que se puede conocer ambos est ados de la
nat uraleza, por ej emplo, encender y apagar la luz para ver el efect o de la corrient e
elct rica en un bombillo de luz. En est e ej emplo es casi seguro que cualquier ot ro fact or
que afect e la luminosidad del bombillo est baj o cont rol del invest igador y por lo t ant o
7
Por ello afirmamos que el punt o de part ida del anlisis de inferencia
causal enfrent a un serio problema de ident ificacin, el cual no puede ser
resuelt o simplement e con ms observaciones. Afort unadament e, los
orgenes del problema han sido est udiados y ent endidos, y por lo t ant o
somos capaces de proveer soluciones a l. Tales est rat egias se basan en
la aplicacin de supuest os y adems con un import ant e apoyo de la
est adst ica, se logra ident ificar el efect o causal. Est e document o se basa
j ust ament e en est as est rat egias de ident ificacin.
3. ALGUNAS CUESTI ONES BSI CAS
3. 1. Definicin del efect o t rat amient o promedio ( ATE)
5
Con el fin de est udiar la ident ificacin del efect o causal, formalicemos lo
expuest o ant eriorment e del modelo de Neyman- Rubin concent rndonos
en un caso especial. Supongamos que deseamos conocer el efect o de un
t rat amient o d ( por ej emplo una polt ica) sobre alguna variable de int ers
i
y ( un result ado) , para i = 1, N. , donde i indica una unidad i .
Por ej emplo,
Trat amient o ( d) Result ado ( y)
Ej ercicio diar io Presin Sangunea
Capacit acin laboral Salar ios
Un nuevo reglament o de t rnsit o Tasa de accident es de t rnsit o
Un medicament o Colest erol
el escenario ant es del t rat amient o y despus del t rat amient o puedes ser
considerados como los dos result ados pot enciales. En general no ocurre lo mismo en
ot ros est udios, en donde los dos escenarios mencionados no necesariament e mant ienen
const ant es a los dems fact ores que podran afect ar a la variable y . Por ej emplo, el
efect o de la lact ancia mat erna sobre la incidencia de enfermedades en los infant es no
puede ser est udiado observando simplement e el ant es y el despus de la exposicin
al t rat amient o pues exist en fact ores que cambian en forma nat ural ( como la edad y el
peso del nio) y adems ot ros fact ores podran cambiar circunst ancialment e ( como las
condiciones de vida de la familia) , a pesar que algunos fact ores s se mant engan
const ant es ( como el sexo del nio y su resist encia nat ural a las enfermedades) .
5
La not acin y definiciones que seguimos en est a seccin est influenciada en la
exposicin de Lee ( 2005) .
8
Aunque el t rat amient o podra ser en diferent es int ensidades, y al mismo
t iempo los result ados podran ser mlt iples, vamos a simplificar el anlisis
considerando que el t rat amient o d es binario, t omando el valor 1 si la
unidad recibe el t rat amient o y 0 si no la recibe.
=
recibe lo no i si
o tratamient el recibe i si
d
i
0
1
Tenemos una poblacin U de unidades, algunas de los cuales recibir un
t rat amient o. Cada unidad i puede ser descrit a por el siguient e conj unt o
) , , , , (
1 0 i i i i i
x d y y donde:
i
y
0
= result ado pot encial si la unidad i no recibi el t rat amient o
i
y
1
= result ado pot encial si la unidad i recibi el t rat amient o
i
x = vect or de caract erst icas observables de la unidad i
i
= vect or de caract erst icas no observables de la unidad i
Cabe mencionar que la condicin de observable o no observable de las
caract erst icas se define desde el punt o de vist a del invest igador o
evaluador de la polt ica.
Definamos el result ado observado
i
y como
i i i i i
y d y d y
0 1
) 1 ( + = el cual es
igual a uno de los result ados pot enciales. Asimismo podemos clasificar a
t odas las unidades de la poblacin segn la recepcin o no del
t rat amient o. Como nos preocupa analizar el impact o de polt icas ( micro)
econmicas, llamaremos a los recept ores de la polt ica como el grupo
beneficiario, definido como { } 1 | = =
i
d U i B . Al grupo de unidades que no
recibe el t rat amient o lo llamaremos grupo no beneficiario
6
{ } 0 | = =
i
d U i N .
6
En algunos est udios se le llama t ambin grupo de cont rol a aqul que no ha recibido el
t rat amient o. Sin embargo dado que el nfasis en est e est udio recae en los llamados
est udios observacionales ( vase seccin 4.2) en donde los dat os disponibles no
provienen de experiment os cont rolados, conviene llamar a est e grupo simplement e
como No Beneficiario, reservando el nombre de Grupo de Cont rol para aqul grupo
9
Lo nico que podemos observar para una unidad B i es el paquet e
) 1 , , (
1
= d x y
i i
y para una unidad N k en el grupo no beneficiario solo
observamos ) 0 , , (
0
= d x y
k k
.
Tal como se mencion ant es, el efect o t rat amient o individual para una
unidad i ,
i i i
y y
0 1
= , no est ident ificado pues uno de sus element os no
es observable. Sin embargo podra ser ms convenient e analizar el efect o
t rat amient o promedio para la poblacin ( ATE por sus siglas en ingls) .
Omit iendo el subndice i , el ATE es el parmet ro poblacional
) ( ) ( ) (
0 1 0 1
y E y E y y E ATE = = =
Debido a que los valores pot enciales
0
y y
1
y no son plenament e
observables para t odo U i , se debe t ener cuidado al est imar est e valor
esperado usando anlogos muest rales como el promedio simple por
ej emplo.
N i
N i
B i i
N B i
i
B
y y y
n
y
n
= =
1 1
^
donde
B
n es el nmero de beneficiarios y
N
n es el nmero de no
beneficiario.
El peligro de comet er un error con una est imacin de est a manera se
basa en el conocido problema de la seleccin : la no observacin de los
valores de
i
y
0
y
i
y
1
para algunos individuos podra responder a una
conduct a sist emt ica de los individuos o de los ot organt es del beneficio.
Por ej emplo, si se busca analizar el efect o de la part icipacin en
programas de ej ercicios fsicos en el est ado de salud medido como los
niveles de presin sangunea, es clarament e fact ible que aquellos que
finalment e acept en part icipar en el t rat amient o sean individuos que
que no recibe t rat amient o en est udios experiment ales o t ambin a un subgrupo de los
no beneficiarios que cumplen ciert as caract erst icas ( que se discut irn ms adelant e,
vase la seccin 4.1) en est udios observacionales.
10
t engan fuert es preferencias por la act ividad fsica, o que present en
det erminadas caract erst icas como su edad y peso. Por el cont rario,
aquellos que opt en por no part icipar en el programa podran haber
t omado est a decisin basndose en las mismas caract erst icas o
preferencias. En est e ej emplo est ara ocurriendo un problema de
aut oseleccin en el t rat amient o, donde la part icipacin en el programa
depender de las caract erst icas observables de las personas ( su edad y
peso) , o de caract erst icas no observables ( sus preferencias, hbit os de
vida, fact ores gent icos, et c. )
La seleccin podra haber venido de part e de los diseadores de la
polt ica. Por ej emplo, si fij an una poblacin obj et ivo para el t rat amient o, o
si priorizan a algunos grupos que ya de por s present en problemas de
presin art erial, nuevament e exist iran diferent es caract erst icas
( observables o no) en los grupos B y N.
Si est o es lo que est ocurriendo con el programa d , ent onces el
est imador propuest o
= = =
x
i i
d x x x ATET ATET ) 1 | Pr( |
Cabe mencionar que si hay caract erst icas no observables de los
individuos que no est n balanceadas, ent onces la diferencia de medias
condicionada a x no sera un buen est imador del efect o t rat amient o
promedio. Est a suele ser la principal deficiencia de est a t cnica.
Pero asumiendo que se cumple las condiciones de st rong ignorabilit y , la
discusin rest ant e es cmo encont rar dent ro de los no t rat ados a un
grupo de cont rol que compart a las mismas caract erst icas que el grupo
beneficiado y que pueda ser ut ilizado como el escenario cont rafact ual.
24
Est os supuest os son conocidos como st rong ignorabilit y . La principal debilidad de est e
mt odo es j ust ament e el cumplimient o en la realidad de est os supuest os. Decir que el
balanceo se produzca en observables no asegura que t al balanceo t ambin se cumpla
en no observables.
35
6. 1. Pareo exact o e inexact o
La respuest a a la int errogant e plant eada nos lleva a pregunt arnos si
efect ivament e exist irn individuos que t engan las mismas caract erst icas
pero que pert enezcan a grupos dist int os segn la recepcin del
t rat amient o.
Una primera forma de hacer est a bsqueda es mediant e el pareo exact o.
Para cada unidad B i con caract erst icas
i
x , se busca una unidad N j
que posea las mismas caract erst icas, es decir
j i
x x = . Los pares de cada
unidad i t omando como base a las caract erst icas x son aqul grupo
{ }
j i i
x x N j x A = = | ) ( . Luego el grupo de cont rol es la unin de t odos los
conj unt os
i
A , es decir
i
B i
A C
= .
Est a forma de hacer pareo t iene un problema conocido como el problema
de la dimensionalidad . Puest o que en los est udios con dat os
microeconmicos los individuos suelen t ener muchas caract erst icas
observables, es posible que para muchas unidades i no exist a su par
exact o j que compart a t odas esas caract erst icas ( por ej emplo, la edad,
el sexo, el nivel educat ivo, et c.) y por lo t ant o el grupo de cont rol C
podra t ener muy pocos element os o quizs ninguno.
Una alt ernat iva a la versin exact a del pareo es la llamada inexact a , en
donde se busca a unidades que sean parecidas a las t rat adas, aunque no
lleguen a t ener exact ament e las mismas caract erst icas. Para ello se
definen unos crit erios de cercana. En est e cont ext o los pares de la
unidad i son el grupo { } ) ( | ) (
i j i
x v x N j x A = donde ) (
i
x v define a una
vecindad cercana a
i
x .
Las unidades cercanas a i podran ser numerosas, por ello se suele
simular al escenario cont rafact ual
0
y con el promedio de est as unidades
36
cercanas
25
. Para realizar est e clculo se acost umbra promediarlos usando
ponderadores ) , ( j i con 1 ) , ( 0 j i , y 1 ) , ( =
i
A j
j i . Normalment e los
ponderadores est arn relacionados con la cercana de j a i , dndole
mayor peso a los que se encuent ren ms cerca.
Es import ant e not ar en est e moment o que el pareo podra hacerse con
reemplazo o sin reemplazo. Si se hace sin reemplazo, una unidad j no
beneficiaria no puede ser ut ilizada para reconst ruir el escenario
cont rafact ual de dos unidades B i dist int as. Puest o que est o t rae
problemas con prdidas de observaciones, el pareo con reemplazo s
permit e que una unidad j pueda ser ut ilizada ms de una vez, siendo de
especial ut ilidad cuando se t ienen pocas observaciones ( Dehej ia y Wahba,
2002) .
En cualquier caso, la frmula general del est imador de ATET con pareo
inexact o es
|
|
.
|
\
|
=
B i A j
j i
B i
y j i y
n
T E AT
0 1
) , (
1
Veamos a cont inuacin algunos casos especiales de pareo inexact o, los
cuales difieren ya sea en la conformacin del grupo
i
A a t ravs de la
definicin de vecindad, o difieren en los pesos asignados en ) , ( j i .
Un caso muy comn de pareo es aqul que se realiza segn el vecino
ms cercano ( nearest neighbor) . Se escoge a la unidad j que est ms
cerca de i usando la dist ancia eucldea. En est e caso
{ }
j i j i
x x j x A = min | ) (
25
Tal como sealan Dehej ia y Wahba ( 2002) , el hecho de t ener un grupo de comparacin
unit ario o numeroso no es un asunt o t rivial. Tener muchas unidades de comparacin
increment a la precisin de la est imacin del escenario cont rafact ual pero genera sesgos
debido a que se ut ilizan unidades que podran ser muy diferent es a la unidad t rat ada.
37
Normalment e est e conj unt o debera t ener solament e un element o
( 1 ) , ( = j i para el j ms cercano y 0 ) , ( = j i para cualquier ot ra unidad) ,
aunque podra t ener a ms de uno. Asimismo el invest igador puede
definir una dist ancia mnima ( llamada caliper ) como primer filt ro, con el
fin de hacer un pareo con individuos que est n realment e cercanos.
6. 2. Pareo mediant e el propensit y score .
Una forma alt ernat iva de resolver el problema de la dimensionalidad es
creando un punt aj e o propensit y score que resuma en una sola variable
a t odas las caract erst icas x de los individuos. En t rminos ms
especficos, el propensit y score es la est imacin de la probabilidad de ser
beneficiario del programa, ) | 1 Pr( ) ( x d x P = = . En un est udio muy celebrado,
Rosenbaum y Rubin ( 1983) demost raron que si x d y y | ) , (
0 1
, ent onces se
cumple que ) ( ) , (
0 1
x P y y . Est e result ado es de mucha import ancia pues
permit e que el pareo se pueda hacer con base en el propensit y score
( Dehej ia y Wahba, 1999, 2002) .
En la prct ica, el propensit y score es est imado mediant e regresiones logit
o probit . Una vez hecha est a est imacin, se puede hacer un pareo
mediant e, por ej emplo, el vecino ms cercano en t rminos de est e
punt aj e. En est e caso, t endramos que el conj unt o de unidades pares a
una unidad beneficiaria i es:
{ } ) (
) (
min | )) ( ( x P x P N j x P A
j i i
=
Normalment e est e conj unt o ser unit ario pues el propensit y score es una
variable cont inua que cuent a con un nmero ilimit ado de decimales. Al
igual que ant es es posible definir una dist ancia mnima, < ) (
) (
x P x P
j i
,
pudiendo ent onces ser el conj unt o ) (x A
i
vaco.
38
Una alt ernat iva es la conocida como radius mat ching, en donde
{ } r P N j x P A
j i
< =
i
P | )) ( (
A diferencia del vecino ms cercano, en el caso de radius mat ching el
conj unt o )) ( ( x P A
i
puede t ener ms de un element o. El ATET se est ima
considerando el promedio simple de los result ados y de los element os de
)) ( ( x P A
i
.
Un problema con los mt odos del vecino ms cercano y radius mat ching
es que consumen mucha informacin y pierden muchas observaciones,
las cuales podran cont ener informacin valiosa en la est imacin de los
escenarios cont rafact uales. Una alt ernat iva propuest a en la lit erat ura es
que se permit a que las unidades del grupo de comparacin )) ( ( x P A
i
sean
muchas alrededor del valor de x , pero ponderndolas segn una funcin
ponderadora llamada kernel
26
que da ms peso a unidades cercanas y
menor peso a las alej adas
27
. Luego el ponderador ) , ( j i es:
=
N j
i j
j i
h
P P
k
h
P P
k
j i
) (
) (
) , (
donde P es el propensit y score, ) ( k es un kernel
28
y h es el ancho de la
vent ana el cual det ermina cuant os valores
j
P alrededor de
i
P sern
incluidas en el clculo del promedio, es decir h define implcit ament e a
26
Un kernel es una funcin ) (x k que cumple algunas propiedades especficas. ( i) ) (x k es
simt rica alrededor de 0 y cont inua; ( ii)
=1 ) ( dz z k ,
= 0 ) ( dz z zk , <
dz z k ) ( ; ( iii)
0 ) ( = z k si
0
z z para un
0
z definido, o 0 ) ( z k z cuando z ; y ( iv)
< =
k dz z k z ) (
2
.
27
Vase Heckman, I chimura, Smit h y Todd ( 1998) .
28
Algunos ej emplos de funciones kernel muy ut ilizadas son la uniforme donde
] 1 [ 1 ) 2 / 1 ( ) ( < = z z k , la t riangular con ] 1 [ 1 ) 1 ( ) ( < = z z z k , la Epanechnikov donde
] 1 [ 1 ) 1 ( ) 4 / 3 ( ) (
2
< = z z z k , y la Gaussiana donde ) 2 / exp( ) 2 ( ) (
2 2 / 1
z z k =
.
39
una vecindad. Est a especificacin significa que el escenario cont rafact ual
es est imado a t ravs de la est imacin de la esperanza condicional de y
sobre x mediant e una regresin no paramt rica de y sobre x para las
unidades del grupo no beneficiario. Est a regresin no paramt rica calcula
el promedio simple de y en el int ervalo seleccionado h . Una alt ernat iva
usada es la regresin lineal local, la cual calcula no solo un int ercept o
sino t ambin una pendient e localment e en la vecindad.
En cualquiera de los dos casos, en la eleccin del ancho de la vent ana h
exist ir un t rade- off ent re eficiencia y sesgo, pues una vent ana ms
amplia abarca ms observaciones lo cual genera una mayor eficiencia en
las est imaciones, pero increment a el sesgo que se origina en la
est imacin al suavizarse una curva
29
. En el ext remo caso que h , el
valor de la regresin no paramt rica simplement e ent regara el promedio
de los valores de y del grupo no beneficiario, lo cual est ara alej ado de la
media condicional de y dado x . Por ot ro lado, si h es muy pequeo, se
cont ara con muy pocas observaciones lo cual rest a confiabilidad a las
predicciones.
Tal como sealan Heckman, I chimura, Smit h y Todd ( 1998) , una not able
diferencia ent re est a t cnica en comparacin con los experiment os
aleat orios cont rolados es en el grupo de cont rol que se genera. Mient ras
que en los experiment os, dada la nat uraleza del proceso, se garant iza
que las caract erst icas observables y no observables t ienen la misma
dist ribucin ent re los beneficiarios y cont roles, en el caso de dat os no
experiment ales nada garant iza que eso ocurra. Por ello es frecuent e que
el propensit y score no t enga el mismo soport e que ent re beneficiarios y
no beneficiarios. Por t al razn, y con el fin de excluir a individuos que no
t ienen un par en el ot ro grupo, se suele definir a un rango o soport e
comn ( common support ) , que es la int erseccin de los soport es de los
29
En Caliendo y Kopeinig ( 2005) se pueden encont rar algunos consej os prct icos a t omar
en cuent a para la implement acin del propensit y score mat ching.
40
beneficiarios y no beneficiarios en sus scores. El pareo se va a realizar
finalment e solament e ent re aquellos individuos que t engan un score
dent ro de dicho rango comn, eliminndose a t odos los individuos que
queden fuera de l.
Cuando se realiza un pareo de uno- a- uno ( como en el caso del vecino
ms cercano) despus de la definicin del soport e comn, la dist ribucin
del score ent re los beneficiarios y el grupo de cont rol debera ser muy
parecida. Si el rango en comn es muy pequeo o inexist ent e ent re los
propensit y scores de los beneficiarios y no beneficiarios, no se podr
realizar el pareo y adems ser una seal clara que los dos grupos no son
comparables.
Finalment e la expresin general del est imador del ATET con la definicin
del soport e comn es:
|
|
.
|
\
|
=
CS B i CS A j
j i
B i
y j i y
n
T E AT
0 1
) , (
1
donde CS hace referencia a que solo se t oma en cuent a a individuos que
pert enecen al soport e comn.
Las aplicaciones del mt odo de pareo en economa son numerossimas y
los campos en los que se ut iliza crecen da a da. En economa laboral, en
especial en lo que se refiere a programas de desempleo y ent renamient o,
pueden consult arse por ej emplo los mencionados t rabaj os de Heckman,
I chimura y Todd ( 1997) , Dehej ia y Wahba ( 2002) , Lechner ( 2000) y
Burga ( 2003) en el caso del programa peruano PROJOVEN.
Exist en algunos t emas adicionales acerca del Mt odo de Pareo que no se
present arn aqu. Un t ema crucial es la principal desvent aj a del mt odo
propuest o en su incapacidad para cont rolar el sesgo en no variables no
observables. Para evit ar est e inconvenient e la lit erat ura se ha apoyado en
41
el mt odo t radicional de diferencias en diferencias, el cual
desarrollaremos ms adelant e. Acerca de la eleccin ent re los algorit mos
propuest os para la const ruccin del escenario cont rafact ual, algunos
est udios los han comparado encont rando algunas vent aj as o desvent aj as
ent re ellos
30
. Un resumen de est as comparaciones se puede encont rar en
Vinha ( 2006) . Sobre el t ipo de t rat amient o, es posible ext ender el
procedimient o para el caso de t rat amient os mlt iples no binarios, en
donde es import ant e la int ensidad o het erogeneidad del mismo. Algunos
est udios han desarrollado est e anlisis que aun es relat ivament e nuevo
en economa ( vase por ej emplo Joffe y Rosenbaum, 1999; I mbens,
2000; Lechner, 2002) .
7. ENDOGENEI DAD DEL TRATAMI ENTO: EL MTODO DE
VARI ABLES I NSTRUMENTALES.
31
En ocasiones aun si los programas son diseados para ser asignados en
forma aleat oria ent re la poblacin obj et ivo, en la prct ica la recepcin o
no del t rat amient o est en manos de las personas quienes podran decidir
no recibirlo o logran recibirlo sin haber sido pre- seleccionados. En t al
sit uacin, las decisiones de las personas influyen en la variable
t rat amient o d , por lo cual se le debe considerar como una variable
endgena. De est a manera no se cumplen los supuest os ident ificadores
del ATE debido a la aut oseleccin generada- por lo que la diferencia de
medias
en
i i d i
u d y + + =
0
son est imadores consist ent es del ATE.
La variable d podra no expresar plenament e el obj et ivo de la polt ica
pues algunas personas podran decidir part icipar o no en ella; es decir, d
30
Un resumen de est as comparaciones se puede encont rar en Vinha ( 2006) .
31
Una revisin muy int uit iva del mt odo de variables inst rument ales se encuent ra en
Angrist y Krueger ( 2001) .
42
dependera de algunas variables no observables de preferencias, las
cuales est n capt uradas en el t rmino de error u .
A manera de ej emplo
32
, imaginemos que y es algn result ado ( por
ej emplo, el nivel educat ivo alcanzado por una persona i) y d indica si el
individuo part icip o no en el servicio milit ar. Est a variable d no ocurre al
azar ent re los individuos pues la part icipacin depende de la decisin de
ellos.
Supongamos que exist e una variable binaria z relacionada con d pero
que no con u. Por ej emplo, z podra represent ar un sort eo para designar
a los elegidos para el servicio milit ar. No t odos los sort eados hacen el
servicio milit ar ni t odos los que hacen el servicio fueron sort eados pero es
claro que exist e una asociacin ent re el sort eo y la part icipacin en el
servicio. Est e no cumplimient o de lo que indica el sort eo puede deberse a
muchas razones, como problemas de salud o mot ivacin. El no
cumplimient o de la int ervencin genera endogeneidad en la variable d .
Es bast ant e claro que en aplicaciones a la economa, en especial en
programas sociales, est e problema del no cumplimient o es de suma
import ancia.
33
Luego, si z cumple las condiciones usuales de las variables
inst rument ales ( est correlacionada con d pero no con u) , ent onces
podemos ident ificar y est imar al parmet ro
d
como el ATE en el modelo
i i d i
u d y + + =
0
. Calculando ) , cov( ) , cov( ) , cov(
0
z d z u d z y
d d
= + + = ,
t endremos que el parmet ro poblacional ) , cov( ) , cov( z d z y
d
= . Un anlogo
muest ral de est a expresin es un est imador de variables inst rument ales
del efect o t rat amient o promedio
d
.
32
Un ej emplo similar desarrolla Angrist ( 1990) . Vase t ambin Angrist , I mbens y Rubin
( 1996) .
33
En la lit erat ura mdica se propone un anlisis de la int encin del t rat amient o ( int ent ion-
t o- t reat analysis) en donde se compara el result ado promedio de aquellos seleccionados
por el programa versus el de aquellos no seleccionados por el programa, sin import ar si
cumplieron o no con el t rat amient o.
43
El rol de z en la ident ificacin del ATE mediant e variables inst rument ales
se ubica en que ext rae aquella variabilidad de d que no est relacionada
con u , y la asocia con la variabilidad de y relacionada a z . Si bien es
ciert o que est a est rat egia economt rica es t il t iene un cost o en t rminos
de la prdida de informacin que cont ienen las variables y y d .
Para est udiar est e lt imo aspect o, vale la pena pregunt arse qu es lo
que logra ident ificar exact ament e el est imador de variables
inst rument ales?
34
La respuest a a est a pregunt a se basa en el anlisis de
la het erogeneidad de las respuest as de los individuos ant e el
inst rument o. Siguiendo con el ej emplo del servicio milit ar, en la siguient e
t abla se muest ra los valores de d ( en las filas) condicionados a valores
de z ( por columnas) . Se dist inguen cuat ro t ipos de individuos
z = 1 z = 0 Ti po
Val ores de d 1 0 Cumplidores
1 1 Siempr e t omadores
0 0 Nunca t omador es
0 1 Desafiant es
Los cumplidores hacen lo que dice el programa. Los siempre t omadores
part icipan en el programa salgan o no sort eados. Los nunca t omadores
deciden no part icipar en cualquiera de las cont ingencias. Los desafiant es
hacen siempre lo cont rario.
Most raremos la est rat egia est ndar en la lit erat ura para est udiar la
relacin ent re el inst rument o propuest o z y las variables d e y , con el
fin de ident ificar el efect o t rat amient o promedio ATE. Observando los
valores de d condicionados a lo que obt engamos de z , se puede
descomponer a d en dos variables dummy, d
1
y d
0
, las cuales son
cont ingent es a los valores de z . Ambas variables t oman el valor de 1 si
el individuo part icipa en el programa y 0 si no part icipa. Aunque
34
Un desarrollo ms general se encuent ra en I mbens y Angrist ( 1994) . En est a part e
seguiremos las exposiciones simplificadas que son est ndares en la lit erat ura ( Lee
2005, Wooldridge 2001) .
44
aparent ement e ambas dummies sean iguales, en la realidad solo son
observables parcialment e. Si part icipa en el programa, ent onces vemos
que 1
1
= d , si no part icipa en el programa observaremos que 0
0
= d .
Est a relacin ent re d y z se puede modelar para cualquier unidad i
como
i i i i i
d z d z d
1 0
) 1 ( + =
A su vez, la variable result ado y se relaciona con d mediant e la ecuacin
) ( ) 1 (
0 1 0 1 0 i i i i i i i i i
y y d y y d y d y + = + =
donde clarament e
i i
y y
0
= si
i i
d d
0
= , e
i i
y y
1
= si
i i
d d
1
= . Reemplazando la
ecuacin de
i
d en
i
y de la pgina ant erior y con un poco de algebra se
obt iene ( omit iendo el subndice i ) :
) )( ( ) (
0 1 0 1 0 1 0 0
y y d d z y y d y y + + =
Si se asume que z es independient e de y
1
, y
0
, d
1
y d
0
,
)) )( (( )) ( ( ) ( ) 1 | (
0 1 0 1 0 1 0 0
y y d d E y y d E y E z y E + + = =
)) ( ( ) ( ) 0 | (
0 1 0 0
y y d E y E z y E + = =
Luego, comparando la esperanza de los dos result ados dado que ocurre
algn valor especfico de z obt enemos
)) | ( ) (( )) )( (( ) 0 | ( ) 1 | (
0 1 0 1 0 1 0 1 0 1
d d y y E d d E y y d d E z y E z y E = = = =
Como d
1
d
0
t iene t res posibles result ados: 1, 0 y - 1,
) 1 Pr( ) 1 | ( 1 ) 0 | ( ) 1 | (
0 1 0 1 0 1
= = = = = d d d d y y E z y E z y E
) 1 Pr( ) 1 | ( 1 ) 0 Pr( ) 0 | ( 0
0 1 0 1 0 1 0 1 0 1 0 1
= = = = + d d d d y y E d d d d y y E
45
Si asumimos que
0 1
d d , supuest o conocido como monot onicidad ,
ent onces 0 ) 1 Pr(
0 1
= = d d con lo cual se elimina el t ercer t rmino de la
lt ima ecuacin. Con ello la expresin se reduce a:
) 1 Pr( ) 1 | ( ) 0 | ( ) 1 | (
0 1 0 1 0 1
= = = = = d d d d y y E z y E z y E
Dados los t res valores mencionados de que puede t omar
0 1
d d , la
probabilidad se puede desmembrar de la siguient e forma:
) 0 | ( ) 1 | ( ) ( ) ( ) ( ) Pr(
0 1 0 1 0 1
= = = = = z d E z d E d E d E d d E d d
) 0 | 1 Pr( ) 1 | 1 Pr( = = = = = z d z d
Aqu es necesario hacer el supuest o que ) 0 | 1 Pr( ) 1 | 1 Pr( = = = = z d z d el
cual t iene sent ido si el inst rument o z afect a a d .
35
Reemplazando est a
lt ima ecuacin en la penlt ima y despej ando t enemos
d sobre z de Efecto
y sobre z de Efecto
) 0 | ( ) 1 | (
) 0 | ( ) 1 | (
) 1 | (
0 1 0 1
=
= =
= =
= =
z d E z d E
z y E z y E
d d y y E
Se puede comprobar
36
que
d
z d
z y
z d E z d E
z y E z y E
= =
= =
= =
) , cov(
) , cov(
) 0 | ( ) 1 | (
) 0 | ( ) 1 | (
en donde vemos que el rol de z ha sido de ident ificar el efect o de la
variacin de d sobre la variacin de y ( el parmet ro
d
) . Sin embargo,
est e valor solo mide la ganancia promedio de los cumplidores pues para
ellos 1
0 1
= d d . No se puede calcular el efect o de los siempre t omadores
pues no se observa variabilidad en su conduct a, ni el efect o de los nunca
t omadores. Debido a que solo se est ident ificando el efect o en un
35
Es la condicin de relevancia que debe cumplir el inst rument o.
36
Lee ( 2005) , pgina 37.
46
subgrupo de la poblacin, a est e impact o se le llama efect o t rat amient o
promedio local ( LATE)
37
.
El est imador de variables inst rument ales de
d
( t omando como
inst rument os a z y la const ant e de unos) es el anlogo muest ral de la
razn de covarianzas. Est e es,
=
i i i i
i i i i IV
d
z d z d n
z y z y n
Ot ro est imador de variables inst rument ales que es el anlogo muest ral de
la razn de diferencias de esperanzas condicionales ( t ambin conocido
como el est imador de Wald) que muest ran Angrist , I mbens y Rubin
( 1996) es,
0 1
0 1
1
) 1 (
) 1 (
) 1 (
) 1 (
d d
y y
z
z d
z
z d
z
z y
z
z y
i
i i
i
i i
i
i i
i
i i Wald
d
=
|
|
.
|
\
|
|
|
.
|
\
|
Donde el numerador de la expresin ant erior es el est imador int ent ion-
t o- t reat del efect o de z sobre y , y el denominador el est imador
int ent ion- t o- t reat del efect o de z sobre d . Tant o
IV
d
como
Wald
d
son
est imadores I V consist ent es de LATE, la diferencia promedio de los
cumplidores.
Exist en algunas aplicaciones int eresant es del mt odo de variables
inst rument ales en el anlisis de inferencia causal. Por ej emplo, Angrist y
Krueger ( 1991) analizan el efect o de los aos de educacin sobre los
ingresos en Est ados Unidos, en donde los aos de educacin son un
regresor endgeno. El inst rument o ut ilizado por est os aut ores es el
t rimest re de nacimient o, el cual predice bast ant e bien ( debido a los
reglament os y leyes en el sist ema educat ivo nort eamericano) la cant idad
de aos que un est udiant e finalment e est udiar.
37
Por Local Average Treat ment Effect en ingls
47
En el est udio mencionado sobre la regla de las Maimonides, Angrist y
Lavy ( 1999) encuent ran que el t amao de la clase no coincide
exact ament e con lo que predice la regla de los Maimonides debido a la
presencia de ciert a variabilidad en la det erminacin del nmero de
est udiant es por aula. Sin embargo, ut ilizando a la regla de los
Maimonides como un inst rument o obt iene est imadores consist ent es del
efect o del t amao de la clase sobre el rendimient o escolar en I srael.
En un ej emplo de la aplicacin de est a t cnica para t rat amient os binarios,
Shady y Arauj o ( 2008) est udian el impact o del programa Bono de
Desarrollo Humano de Ecuador el cual es un programa de
t ransferencias condicionadas de dinero sobre la asist encia a la escuela.
Si bien el programa se asign en forma aleat oria ent re la poblacin
obj et ivo debido a problemas presupuest arios, en la prct ica hubieron
problemas de cumplimient o de los est ablecido por el sort eo, exist iendo
aut oseleccin en el t rat amient o. Para superar est e problema, los aut ores
est iman el efect o del programa por variables inst rument ales,
considerando a la asignacin aleat oria como un inst rument o.
8. DI SEO DE REGRESI N DI SCONTI NUA DI FUSA
Volviendo al t rabaj o de Angrist y Lavy sobre la regla de las Maimonides,
los aut ores proponen que el impact o de la variacin abrupt a del t amao
de clase sobre el rendimient o escolar puede medirse localment e alrededor
de la discont inuidad. Sin embargo, en algunas escuelas la mat rcula en un
det erminado grado no det ermina exact ament e si las aulas sern part idas
o no, ni que las aulas divididas t engan el mismo nmero de alumnos,
exist iendo casos en donde no se llev a cabo la part icin o en donde la
part icin se realiz ant es de llegar a lo est ipulado por la regla. En ese
sent ido, el diseo de regresin discont inua aguda discut ido en la seccin
5 podra no funcionar.
48
Est a misma sit uacin podra repet irse en ot ros programas en donde la
asignacin del t rat amient o ( recibirlo o no) dependa del valor un indicador
cont inuo. La het erogeneidad en las respuest as de los individuos ant e la
asignacin del t rat amient o puede generar problemas de no cumplimient o
del mismo. Por ej emplo, en un programa de crdit o educat ivo para
alumnos que alcancen un rendimient o dado , habr algunos alumnos
con rendimient o superior al umbral que no solicit arn crdit o as como
habr individuos por rendimient o ligerament e por debaj o de que
podran solicit ar y recibir crdit o si su sit uacin familiar fuera muy crt ica.
Tambin podra ocurrir que el comit evaluador de crdit o podra ser
flexible en algunos casos baj o crit erios no cont rolados por el invest igador.
En t rminos ms generales y cont inuando con la discusin de la seccin
5, suele ocurrir en algunos casos que la variable asignadora X ( aquella
cuyos valores det erminarn la asignacin del beneficio del programa,
como la mat rcula por grado en el ej emplo mencionado) no det ermina
exact ament e la part icipacin o no en el programa aunque si podra alt erar
la probabilidad de que part icipe en el mismo. En est e caso diremos que la
part icipacin en el t rat amient o es endgena, en el sent ido que depende
de la decisin de los agent es part icipant es.
En casos como el descrit o ocurrir que
<
= =
c X si X
c X si X
X d
i i
i i
i i
) (
) (
) | 1 Pr(
0
1
donde ) ( ) (
0 1 i i
X X y ) ( ) (
0 1 i i
X X > . Con est o decimos que para los
individuos que est n a la derecha de c es ms probable que obt engan
t rat amient o que aquellos que est n a la izquierda de c.
Tomando los grficos que muest ran I mbens y Lemieux ( 2007) , en el
grfico 3 se muest ra la discont inuidad en la probabilidad de recibir
49
t rat amient o, y el efect o de est a diferencia sobre los result ados
observables pueden apreciarse en el grfico 4.
La consecuencia de est o en el modelo es que t endremos endogeneidad en
el t rat amient o
i
d , al ser est e no aleat orio sino dependient e de variables
no observables:
X
y
c
E(y
0
| X)
E(y
1
| X)
Grfico 4
X
P[d|X]
0
1
c
Grfico 3
50
i i i d i
u X g d y + + = ) (
en donde ahora
i
d est correlacionado con
i
u , mas no
i
X .
Baj o el supuest o que ) (
i
X g es cont inua y dado que 0 ) | ( lim =
X u E
c X
,
ent onces podemos t omar el lmit e por la derecha del esperado de la
expresin ant erior:
) | ( lim ) ( lim ) | ( lim ) | ( lim X u E X g X d E X y E
c X c X c X
d
c X
+ + =
mient ras que el lmit e por la izquierda es
) | ( lim ) ( lim ) | ( lim ) | ( lim X u E X g X d E X y E
c X c X c X
d
c X
+ + =
Luego,
( ) ) | ( lim ) | ( lim ) | ( lim ) | ( lim X d E X d E X y E X y E
c X c X
d
c X c X
=
despej ando,
) | ( lim ) | ( lim
) | ( lim ) | ( lim
X d E X d E
X y E X y E
c X c X
c X c X
d
=
el cual es el valor de ATE.
Siendo cuidadosos con lo que ident ifica est e est imador, analicemos con
cuidado lo que dice el denominador de la expresin ant erior. Nt ese que
) | ( X d E indica el t rat amient o esperado para cada valor de X .
Supongamos que t enemos individuos het erogneos en la poblacin, en
donde cada individuo t endr una respuest a dist int a de part icipacin en el
t rat amient o ant e un valor de su propio
i
X . Los grupos mencionados en la
seccin 7 se definen en el cont ext o act ual como:
51
Cumplidores: ( ) c X si d c X si d
i i i i
< = = 0 , 1 I ndividuos que acept an el
t rat amient o si su X
i
se ubica a la derecha de c, no lo t oman si X
i
est a la
izquierda de c.
Siempre t omadores: ( ) c X si d c X si d
i i i i
< = = 1 , 1 Siempre part icipan.
Nunca t omadores: ( ) c X si d c X si d
i i i i
< = = 0 , 0 Nunca part icipan.
En el caso de los siempre t omadores y los nunca t omadores, el
denominador es cero pues no hay variabilidad en d para X alrededor de
c. Por lo t ant o, el ATE mencionado arriba, al igual que el est imador de
variables inst rument ales, solo est ident ificado para los individuos
cumplidores alrededor del punt o c.
En la aplicacin prct ica del mt odo de regresin discont inua aguda o
difusa, hay varias cuest iones a t omar en cuent a. En primer lugar se
debera dist inguir a qu caso de regresin discont inua corresponde el
problema que est amos analizando. En est a et apa, un anlisis grfico de
los dat os suele ser de bast ant e ut ilidad. Algo muy import ant e que se
debe verificar ant es de empezar es que el salt o en la variable result ado y
se deba nicament e a los valores de X alrededor del umbral. Si X
provoca salt os en ot ros det erminant es de y , se dist orsionara el efect o
del t rat amient o. Algo que debe observarse t ambin es que la dist ribucin
de las observaciones de X a ambos lados de c deberan ser simt ricas. Si
se observa una discont inuidad o fuert es asimet ras, se podra pensar que
los individuos han manipulado sus valores de X con el fin de est ar a un
lado de c ( para recibir o no el t rat amient o) . Si est o ocurre, se invalidara
el supuest o de int ercambiabilidad de los individuos alrededor de c.
El mt odo t ambin present a algunas limit aciones import ant es. Una de
ellas t iene que ver con la validez ext erna. Tant o el diseo de regresin
discont inua aguda como difusa ident ifican al ATE nicament e alrededor
de X= c. I ncluso el diseo difuso se limit a a una subpoblacin an ms
pequea, los cumplidores. Cualquier ext rapolacin de est os result ados a
52
ot ras subpoblaciones debe hacerse con cuidado. Ot ra limit acin
import ant e es el nmero de observaciones con que se cuent a alrededor
del cort e. Se requiere de muchas observaciones para t ener est imadores
confiables y precisos.
9. EL MTODO DE DI FERENCI AS EN DI FERENCI AS
Como se mencion en la seccin 6, el principal problema del mt odo de
pareo en la est imacin del ATET es que no puede cont rolar las
caract erst icas no observables de los individuos, con lo cual exist e un
serio riesgo de sesgo en la est imacin de est e valor. Sin embargo,
veremos en est a seccin que podemos plant ear un mt odo que baj o
ciert os supuest os es capaz de remover aqul component e no
observable de los dat os con el fin de t ener est imaciones confiables. En
snt esis, apoyndonos en la exist encia de dat os de panel de los individuos
ant es y despus de recibir el t rat amient o y asumiendo que las
caract erst icas no observables son invariant es en el t iempo podemos
obt ener est imaciones confiables del efect o t rat amient o.
El t radicional mt odo de diferencias en diferencias es un refinamient o del
mt odo de diferencias de Rubin de la seccin 3. 1 considerndose no solo
la diferencia promedio de los result ados ent re los individuos de los grupos
B y C sino t ambin la diferencia de la variable result ado ant es y despus
del t rat amient o. La idea de est e procedimient o est en que se pret ende
eliminar cualquier component e sist emt ico y comn a ambos grupos que
vaya cambiando en el t iempo, el cual podra dist orsionar el efect o del
programa si se pret ende medirlo como la diferencia de los result ados pos-
t rat amient o. Asimismo, la diferencia t ambin puede eliminar cualquier
ot ro component e individual no observable de cada grupo. De est e modo
la diferencia en diferencia es una est rat egia ident ificadora del efect o
t rat amient o promedio como most ramos a cont inuacin.
53
Los result ados pot enciales en est e cont ext o dependern no solo del
individuo sino del t iempo,
jit
y , donde 1 , 0 = j muest ra la exposicin
pot encial o no al t rat amient o al igual que en la seccin 3- , 1 , 0 = t indica
el t iempo, donde 0 es el periodo ant es del t rat amient o y 1 despus del
t rat amient o, e i indica a la unidad i . Con el fin de evit ar una not acin
engorrosa, hacemos
j
t jit
y y = en donde se omit ir el subndice i . Nt ese
que el indicador del result ado pot encial se encuent ra ahora como un
superndice. Por su part e, el result ado observado es
t it
y y = . Para la
variable del t rat amient o se escribir
t it
d d = . Est a variable no solo indica la
recepcin del t rat amient o en cada periodo para la unidad i sino que
t ambin indica si est amos hablando del grupo beneficiario ( 1
1
= d ) o del
grupo no beneficiario ( 0
1
= d ) en cualquiera de los dos periodos.
El efect o t rat amient o promedio sobre los t rat ados se define como
) 1 | ( ) 1 | (
1
0
1 1
1
1
= = = = d y E d y E ATET
T
donde puede verse que el segundo t rmino ) 1 | (
1
0
1
= d y E no es observable
pues es el result ado promedio que hubieran obt enido los beneficiarios en
caso no hubieran recibido el t rat amient o.
Se podra pensar en el grupo no beneficiario como el cont rafact ual del
beneficiario. Sin embargo, en est e cont ext o la diferencia de medias de los
beneficiarios y no beneficiarios en el periodo 1 ( pos- t rat amient o) no
ident ifica al ATET. Veamos,
) 0 | ( ) 1 | ( ) 0 | ( ) 1 | (
1
0
1 1
1
1 1 1 1 1
= = = = = d y E d y E d y E d y E
Sumando y rest ando ) 1 | (
1
0
1
= d y E se obt iene
) 0 | ( ) 1 | ( ) 0 | ( ) 1 | (
1
0
1 1
0
1 1 1 1 1
= = + = = = d y E d y E d y E d y E
T
54
La expresin ) 0 | ( ) 1 | (
1
0
1 1
0
1
= = d y E d y E muest ra la diferencia en los
result ados pot enciales en ausencia de t rat amient o ent re los dos grupos
en el periodo 1. Si se mant iene el supuest o que el t rat amient o es
independient e en medias condicionales con
0
y , ent onces t al diferencia
sera igual a cero. Si no se cumple, ent onces la diferencia en medias
post - t rat amient o no ident ifica el ATE. Esa diferencia capt ura aquel
component e individual que no est balanceado ent re los dos grupos.
Anlogament e, la diferencia en medias en el periodo cero para los dos
grupos es
) 0 | ( ) 1 | ( ) 0 | ( ) 1 | (
1
0
0 1
0
0 1 0 1 0
= = = = = d y E d y E d y E d y E
la cual debera ser cero ant e aleat orizacin del t rat amient o o menos
rigurosament e cuando d y
0
. Cuando no se cumple est o, capt ura las
diferencias en el result ado pot encial 0 para ambos grupos en el periodo 0.
Si t ales diferencias ent re los beneficiarios y no beneficiarios se mant ienen
en 0 = t y 1 = t , ent onces ocurrir que
d d y E d y E d y E d y E = = = = = ) 0 | ( ) 1 | ( ) 0 | ( ) 1 | (
1
0
0 1
0
0 1
0
1 1
0
1
Luego la diferencia de la diferencia ident ifica al ATET.
| | | |
T
d y E d y E d y E d y E = = = = = ) 0 | ( ) 1 | ( ) 0 | ( ) 1 | (
1 0 1 0 1 1 1 1
Ot ra forma de obt ener el mismo result ado es la siguient e. La diferencia
en result ados observables ant es y despus del t rat amient o para el grupo
B ( 1
1
= d ) es,
) 1 | ( ) 1 | ( ) 1 | ( ) 1 | (
1
1
0 1
1
1 1 0 1 1
= = = = = d y E d y E d y E d y E
Sumando y rest ando ) 1 | (
1
0
1
= d y E se obt iene
) 1 | ( ) 1 | (
) 1 | ( ) 1 | ( ) 1 | ( ) 1 | (
1
0
0 1
0
1
1
1
0 1
0
1 1 0 1 1
= = + =
= = + = = =
d y E d y E
d y E d y E d y E d y E
T
T
55
En donde se ha t omado en cuent a que ant es del t rat amient o,
) | ( ) | (
1
0
0
0
d y E d y E = . La expresin ) 1 | ( ) 1 | (
1
0
0 1
0
1
= = d y E d y E capt ura el efect o
t emporal sobre
0
y para los beneficiarios. No hay ninguna razn para
asumir que t al efect o es cero, ni siquiera en experiment os aleat orios.
Para el grupo N ( ) 0
1
= d , la diferencia de medias ant es y despus es:
) 0 | ( ) 0 | ( ) 0 | ( ) 0 | (
1
0
0 1
0
1 1 1 1 1
= = = = = d y E d y E d y E d y E
donde est a diferencia muest ra el efect o del t iempo sobre
0
y para los no
beneficiarios. Nada garant iza que est e efect o t emporal sobre
0
y sea igual
a aqul de los beneficiarios. En est e punt o se requiere asumir que t ales
efect os t emporales son iguales para B y N ( ambos siguen la misma
t endencia)
t d y E d y E d y E d y E = = = = = ) 0 | ( ) 0 | ( ) 1 | ( ) 1 | (
1
0
0 1
0
1 1
0
0 1
0
1
Luego la diferencia de la diferencia ident ifica el ATET
| | | |
T
d y E d y E d y E d y E = = = = = ) 0 | ( ) 0 | ( ) 1 | ( ) 1 | (
1 0 1 1 1 0 1 1
Ut ilizando anlogos muest rales, un est imador consist ent e de ATET es
( ) ( )
0 , 1 , 0 , 1 ,
^
= = = =
=
t N i t N i t B i t B i
T y y y y
En el grfico 5 se puede apreciar el efect o de la doble diferenciacin. En
la figura se t oma como base al periodo 0 = t en donde se cuent a con
observaciones de y para ambos grupos, y se t iene informacin en el
periodo 1 = t despus de la aplicacin del t rat amient o, t ambin para
ambos grupos. Los punt os negros indican valores realizados mient ras que
el punt o blanco indica el result ado pot encial no observable.
56
Puede not arse que el supuest o acerca del mismo efect o t emporal en
0
y
se cumple al ser paralelas las rect as )] 0 | ( ), 0 | ( [
1
0
1 1
0
0
= = d y E d y E y la rect a
)] 1 | ( ), 1 | ( [
1
0
1 1
0
0
= = d y E d y E . Si t al paralelismo no se cumple, el est imador de
diferencias en diferencias sera un est imador incorrect o de de ATET.
El grfico ant erior muest ra clarament e que el est imador de diferencias en
diferencias es el ATET y no el ATE. Es decir el clculo no es vlido
ext ernament e para ot ros grupos dist int os a los beneficiarios.
En t rminos de regresiones, se puede obt ener el est imador de diferencias
en diferencias de la regresin
it t i it d it
d y + + + =
donde
it
y es el valor observado del result ado,
i
muest ra un efect o
individual ( efect o fij o) no observable que afect a a la variable result ado,
t
es un component e t emporal no observable que genera el efect o periodo
y
it
es un t rmino de error de media cero, varianza condicional
const ant e y no correlacionado con ninguna de las dems variables ni con
) 1 (
1
|
1
1
= d y E
) 1 (
1
|
0
1
= d y E
) 0 (
1
|
0
1
= d y E ) 1 (
1
|
0
0
= d y E
) 0 (
1
|
0
0
= d y E
Tiempo
y
t = 0 t = 1
T
t
d
Grfico 5
57
ningn ot ro error. Se puede comprobar sin mayor dificult ad que la
diferencia en diferencia
) 0 | ( ) 1 | (
0 0 1 1 0 1
= = d y y E d y y E
i i i i
es igual al parmet ro
d
, el cual es el efect o causal que se desea
est imar.
No hemos mencionado nada acerca del cont rol en variables x . Sin
embargo, se puede ext ender el anlisis condicionando a diferent es
valores de est as variables de cont rol. Baj o la exist encia en un soport e
comn en las caract erst icas x , y baj o el supuest o de iguales t endencias
de
0
it
y en los t rat ados y no t rat ados condicional a valores de x , se puede
emplear el mt odo de pareo para calcular el ATET. Una met odologa
usada en dat os observacionales en donde no se aprecie una clara
aleat orizacin del t rat amient o es el mt odo de pareo en diferencias en
diferencias condicional ( Heckman et al 1997) . Est e est imador es ( sin
omit ir el subndice i del individuo o unidad de anlisis) :
( ) ( )
|
|
.
|
\
|
=
CS B i CS A k
k k i i
B i
y y k i y y
n
T E AT
0
0
0
1
0
0
1
1
) , (
1
Donde
i
A es el grupo comparable a la unidad i que t iene las
caract erst icas comunes con los beneficiarios, y los ponderadores ) , ( k i
son los que se present aron en la seccin 0.
Exist en numerosas aplicaciones del mt odo de diferencias en diferencias
en est udios observacionales y t ambin en experiment ales
38
. Por ej emplo,
Chong y Galdo ( 2006) est udian el impact o del programa de capacit acin
38
Se puede comprobar que en el caso de est udios experiment ales exist e una ganancia en
eficiencia cuando se ut iliza el est imador de diferencias en diferencias, en comparacin
con la diferencia simple de los beneficiarios y el grupo de cont rol en el periodo post -
t rat amient o.
58
j uvenil PROJOVEN sobre los salarios ganados y ut ilizan el est imador de
pareo en diferencias en diferencias condicional, aunque los aut ores
aj ust an el est imador con el fin de analizar variaciones en la calidad del
programa.
En est udios que t rabaj an con modelos de regresin lineal con efect os
fij os, Di Tella y Schargrodsky ( 2004) calculan el impact o de la presencia
policial en la reduccin del crimen, t omando dat os de un experiment o
nat ural surgido de un at ent ado t errorist a en la ciudad de Buenos Aires.
Tras el at ent ado, se reforz la seguridad alrededor de los locales de 45
inst it uciones j udas y musulmanas en la ciudad. Aplicando el mt odo de
diferencias en diferencias a t ravs de regresiones con dat os de panel,
encuent ran un efect o significat ivo de una mayor presencia policial en el
nmero promedio de aut os robados en comparacin con vecindarios de
similares caract erst icas socioeconmicas pero que no cont aban con
presencia policial adicional. En ot ro document o, Galiani, Gert ler y
Schargrodsky ( 2005) est udian el impact o de la privat izacin en el
suminist ro de agua en Argent ina sobre la mort alidad infant il. Habiendo
verificado que la mort alidad infant il mant ena una misma t endencia ant es
de la aplicacin de la polt ica ( lo cual sust ent ara el supuest o de iguales
t endencias de los result ados pot enciales sin t rat amient o en los grupos
beneficiarios y no beneficiarios) , la regresin con efect os fij os encuent ra
que la mort alidad infant il se reduj o como consecuencia de la
privat izacin.
10. CONSI DERACI ONES FI NALES
El obj et ivo de est e document o ha sido most rar los mt odos ms
populares ut ilizados para ident ificar y est imar el efect o causal de una
polt ica con t rat amient o binario, sobre un result ado. El nfasis se ha
puest o en t rminos de la ident ificacin de dicho efect o, la cual depender
59
de una serie de supuest os que se aj ust an a los dat os que se t iene
disponible.
La eleccin final del mt odo debe basarse en la problemt ica de est udio,
pero debe en t odo moment o t enerse en cuent a los supuest os baj o los
cuales t al mt odo realment e ident ifica al efect o t rat amient o promedio
buscado.
60
BI BLI OGRAF A
Angrist , Joshua D.
( 1990) The effect of vet eran benefit s on vet erans educat ion and
earnings. Nat ional Bureau of Economic Research, Working
Paper N 3492.
Angrist , Joshua, Eric Bet t inger, Erik Bloom, Elizabet h King, Michael
Kremer.
( 2002) Vouchers for Privat e Schooling in Colombia: Evidence from a
Randomized Nat ural Experiment . The American Economic
Review, Vol. 92, No. 5, pp. 1535- 1558.
Angrist , Joshua, Guido W. I mbens y Donald B. Rubin.
( 1996) I dent ificat ion of causal effect s using inst rument al variables.
Journal of t he American St at ist ical Associat ion, Vol. 91, N 434
( Junio 1996) , pp. 444- 455.
Angrist , Joshua D. y Alan B. Krueger.
( 2001) I nst rument al variables and t he search for ident ificat ion: from
supply and demand t o nat ural experiment s. The Journal of
Economic Perspect ives, Vol. 15, No. 4 ( Aut umn, 2001) , pp. 69-
85.
Angrist , Joshua D. y Vict or Lavy.
( 1999) Using Maimonides rule t o est imat e t he effect of class size on
scholast ic achievement . The Quart erly Journal of Economics,
Vol. 114 N2 ( May, 1999) , pp. 533- 575.
( 2002) The effect of high school mat riculat ion awards: evidence from
randomized t rials . Nat ional Bureau of Economic Research
Working Paper N 9389. ht t p: / / www. nber. org/ papers/ w9389.
Banerj ee, Abhij it , Shawn Cole, Est her Duflo, and Leigh Linden.
( 2004) Remedying Educat ion: Evidence from t wo randomized
experiment s in I ndia. Mimeo, MI T
Barrera- Osorio, Felipe, Leigh L. Linden y Miguel Urquiola.
( 2007) The effect s of user fee reduct ions on enrollment : evidence
from a quasi- experiment . Mimeo, Columbia Universit y.
ht t p: / / www.col umbi a.edu/ ~ ll2240/ Grat ui dad%20Draft %202007- 01.pdf
Burga, Cybele.
( 2003) Re- evaluando PROJOVEN: propensit y score mat ching y una
evaluacin paramt rica. Consorcio de I nvest igacin Econmica
y Social ( CI ES) . www. cies. org. pe/ files/ act ive/ 0/ Pb0112. pdf.
61
Caliendo, Marco y Sabine Kopeinig.
( 2005) Some Pract ical Guidance for t he implement at ion of propensit y
score mat ching. I ZA Discussion Paper N 1588. The I nst it ut e
for t he St udy of Labor.
Campbell, Donald T.
( 1969) Reforms as experiment s. American Psychologist , 24: 409- 429.
Cochran, William G.
( 1965) The planning of observat ional st udies of human populat ions.
Journal of t he Royal St at ist ical Societ y. Series A ( general) ,
Vol. 128, N2, pp. 234- 255.
Cochran, William G. y Donald B. Rubin.
( 1973) Cont rolling bias in observat ional st udies: a review. Sankhya:
The I ndian Journal of St at ist ics. Series A, Vol. 35 N4, pp. 417-
446.
Chong, Albert o y Jos Galdo.
( 2006) Training qualit y and earnings: t he effect s of compet it ion on t he
provision of public- sponsored t raining programs. Banco
I nt eramericano de Desarrollo. Working Paper N. 555.
Dehej ia, Raj eev H. y Sadek Wahba.
( 1999) Causal effect s in nonexperiment al st udies: reevaluat ing t he
evaluat ion of t raining programs. Journal of t he American
St at ist ical Associat ion, Vol. 94, N 448, pp. 1053- 1062.
( 2002) Propensit y Score- Mat ching Met hods for Nonexperiment al
Causal St udies. The Review of Economics and St at ist ics, Vol.
84, No. 1 ( Feb. , 2002) , pp. 151- 161
Di Nardo, John y David S. Lee.
( 2002) The impact of unionizat ion on est ablishment closure: A
regression discont inuit y analysis of represent at ion elect ions.
Nat ional Bureau of Economic Research, Working Paper N 8993,
Junio 2002.
ht t p: / / www.nber. org/ papers/ w8993
Di Tella, Rafael y Ernest o Schargrodsky.
( 2004) Do police reduce crime? Est imat es using t he allocat ion of policy
forces aft er a t errorist at t ack. The American Economic Review,
Vol. 94. N1, pp. 115- 133.
Donner, Allan y Neil Klar.
( 2004) Pit falls of and cont roversies in clust er randomizat ion t rials .
American Journal of Public Healt h, 94, 3: 416- 422.
62
Donner, Allan, St ephen Brown y Penny Brasher.
( 1990) A met hodological review of non- t herapeut ic int ervent ion t rials
employing clust er randomizat ion, 1979- 1989 . I nt ernat ional
Journal of Epidemiology. Vol. 19, N4, pp. 795- 800.
Galiani, Sebast ian, Paul Gert ler and Ernest o Schargrodsky.
( 2005) Wat er for life: t he impact of t he privat izat ion of wat er services
on child mort alit y. The Journal of Polit ical Economy, Vol. 113,
No. 1 ( Feb. , 2005) , pp. 83- 120.
Gert ler, Paul.
( 2004) Do condit ional cash t ransfers improve child healt h? Evidence
from PROGRESAs cont rol randomized experiment , American
Economic Review: Papers and Proceedings, 94( 2) : 336- 34.
Goldberger, A.
( 1972) St ruct ural Equat ions Met hods in t he Social Sciences .
Economet rica Vol. 40, N 6 ( Noviembre) , pp. 979- 1002.
Haavelmo, Trygve.
( 1943) The st at ist ical implicat ions of a syst em of simult aneous
equat ions. Economet rica, Vol. 11, No. 1 ( Enero) , pp. 1- 12.
( 1944) The probabilit y approach in economet rics. Economet rica, Vol.
12, Supplement ( Julio) , pp. iii- 115.
Hahn, Todd y Van der Klaauw.
( 2001) I dent ificat ion and Est imat ion of t reat ment effect s wit h a
regression- discont inuit y design , Economet rica, Vol. 69, N1
( January, 2001) , 201- 209.
Heckman, James J. , Hidehiko I chimura y Pet ra E. Todd.
( 1997) Mat ching as an economet ric evaluat ion est imat or: evidence
from evaluat ing a j ob t raining programme. The Review of
Economic St udies, Vol. 64, No. 4, Special I ssue: Evaluat ion of
Training and Ot her Social Programmes ( Oct ubre) , pp. 605- 654.
( 1998) Mat ching as an economet ric evaluat ion est imat or. The Review
of Economic St udies, Vol. 65, No. 2 ( Abril) , pp. 261- 294.
Heckman, James, Hidehiko I chimura, Jeffrey Smit h y Pet ra E. Todd.
( 1997) Charact erizing select ion bias using experiment al dat a.
Economet rica, Vol. 66, No. 5 ( Sept iembre) , pp. 1017- 1098.
Hoddinot t , John y Emmanuel Skoufias.
( 2003) The impact of Progresa on food consumpt ion. FCNF Discussion
Paper N 150. Washingt on: I FPRI .
63
Holland, Paul W.
( 1985) St at ist ics and causal inference. Journal of t he American
St at ist ical Associat ion. Vol. 81, N 396, Theory and Met hods, pp.
945- 960.
I mbens, Guido.
( 2000) The role of t he propensit y score in est imat ing dose- response
funct ions. Biomet rika, Vol. 87, No. 3 ( Sep. , 2000) , pp. 706-
710.
I mbens, Guido y Joshua D. Angrist .
( 1994) I dent ificat ion and est imat ion of local average t reat ment
effect s. Economet rica, Vol. 62, N 2 ( Marzo 1994) , pp. 467-
475.
I mbens, Guido y Thomas Lemieux.
( 2007) Regression discont inuit y designs: a guide t o pract ice . Nat ional
Bureau of Economic Research, Working Paper N 13039,
ht t p: www.nber. org/ papers/ w13039.
Joffe, Marshall M. y Paul R. Rosenbaum.
( 1999) Propensit y scores. American Journal of Epidemiology. Vol. 150
N4, pp. 327- 333.
Lalonde, Robert J.
( 1986) Evaluat ing t he economet ric evaluat ions of t raining programs
wit h experiment al dat a. The American Economic Review, Vol.
76, No. 4 ( Sep) , pp. 604- 620.
Lechner, Michael.
( 2000) An evaluat ion of public- sect or- sponsored cont inuous vocat ional
t raining programs in East Germany. The Journal of Human
Resources, Vol. 35, No. 2 ( Spring, 2000) , pp. 347- 375
Lechner, Michael.
( 2002) Program het erogeneit y and propensit y score mat ching: an
applicat ion t o t he evaluat ion of act ive labor market policies.
The Review of Economics and St at ist ics, Vol. 84, No. 2 ( May,
2002) , pp. 205- 220.
Lee, Myoung- Jae.
( 2005) Micro- economet rics for policy, program, and t reat ment effect s.
Oxford: Oxford Universit y Press, 2005
Lee, David S. , Enrico Moret t i y Mat t hew J. But ler.
( 2004) The Quart erly Journal of Economics, Vol. 119, No. 3 ( Aug. ,
2004) , pp. 807- 859.
64
Neyman, Jerzy Splawa.
( 1990) On t he applicat ion of probabilit y t heory t o agricult ural
experiment s. Essay on principles. Sect ion 9. St at ist ical
Science, Vol. 5, N 4, 465- 480, 1990. Traduccin del original
publicado en Roczniki Nauk Rolniczych Tom X ( 1923) 1- 51
( Annals of Agricult ural Sciences) .
Pearl, Judea.
( 2000) Causalit y: Models, Reasoning and I nference. Cambridge:
Cambridge Universit y Press.
( 2009) Causal inference in st at ist ics: an overview. St at ist ics Surveys,
Vol. 3, pp. 96- 146.
Rosenbaum P. R. y Donald B. Rubin.
( 1983) The cent ral role of t he propensit y score in observat ional
st udies for causal effect s. Biomet rika, Vol. 70 N1, pp. 41- 55
Rubin, Donald B.
( 1973) Mat ching t o remove bias in observat ional st udies. Biomet rics,
29: 159- 183.
( 1974) Est imat ing causal effect s of t reat ment s in randomized and
nonrandomized experiment s , Journal of Educat ional Psychology
66, pp. 688- 701.
Shady, Norbert y Maria Claridad Arauj o.
( 2008) Cash t ransfers, condit ions, and school enrollment in Ecuador.
Economa ( Journal of t he Lat in American and Caribbean
Economic Associat ion) . Vol. N8, N 2 Spring.
St ock, James y Mark Wat son.
( 2003) I nt roduct ion t o Economet rics. Primera Edicin. Bost on: Addison
Wesley. 2003.
Thist let hwait e, Donald L. y Donald T. Campbell.
( 1960) Regression- Discont inuit y Analysis: An alt ernat ive t o t he ex
post fact o experiment . Journal of Educat ional Psychology 51
( 6) : 309317.
Vinha, Kat j a.
( 2006) A primer on propensit y score mat ching est imat ors.
Document o CEDE N 2006- 13. Universidad de los Andes.
Wooldridge, Jeffrey.
( 2001) Economet ric Analysis of Cross Sect ion and Panel Dat a. London:
The MI T Press, 2001.