Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Metodología para Evaluación de Impacto PDF
Metodología para Evaluación de Impacto PDF
Metodologas
DE EVALUACIN DE IMPACTO
I. Introduccin ....................................................................................................................................................... 6
Bibliografa ........................................................................................................................................................... 29
1. Ph.D. en Economa, Profesor de Economa de la Educacin, Universidad de Amsterdam, Blasiusstraat 34/2, 1091 CS Amsterdam, +31 (0)64254231.
3
4
RESUMEN EJECUTIVO
Las instituciones pblicas y, en especial, la Subsecretara de Seguimiento y Evaluacin de
SENPLADES requiere contar con herramientas que permitan realizar el seguimiento y la evaluacin
de programas y proyectos ejecutados por las diferentes instituciones que forman parte del Estado,
y determinar el cambio en el buen vivir de la poblacin que genera la inversin pblica.
En este contexto se presenta el siguiente documento que busca proporcionar una gua para realizar
evaluaciones de impacto. En el captulo 1 se hace una introduccin referente a la metodologa de
evaluacin de impacto. En el captulo 2, se plantea la formulacin de los problemas en la evaluacin
de impacto, de manera formal. El siguiente captulo responde a la pregunta: Cmo podemos
estimar los parmetros para medir el impacto? En el captulo 4, se describen los dos grupos de
mtodos que permiten disear el contrafctico: mtodos experimentales y cuasi - experimentales.
El captulo 5 brinda una descripcin de los elementos necesarios que se deben tomar en cuenta
para realizar una evaluacin de impacto. Finalmente, se presentan las conclusiones.
5
I. Introduccin
La evaluacin de proyectos, programas y/o polticas pblicas se aplica con la finalidad de valorar la
utilidad y los beneficios generados por la intervencin pblica mediante la aplicacin de una serie
de metodologas, que son aplicadas con objetivos distintos y permiten establecer conclusiones
que buscan mejorar el desempeo de las instituciones; mejorar la eficacia y eficiencia de las
intervenciones; que haya transparencia en la asignacin y uso de recursos; y determinar el impacto
en el buen vivir de la poblacin.
La evaluacin de impacto es una de estas metodologas. Tiene por debilidad el alto costo, debido
al levantamiento de la lnea base y, como principal cuestionamiento, el aspecto tico, por el
hecho de requerir un grupo de control, conformado por personas de similares caractersticas a
las atendidas por el proyecto, pero que no recibirn sus beneficios. Adems, llega a establecer el
impacto final de la intervencin pero no hace un anlisis de los factores que permitieron conseguir
tales impactos.
La principal fortaleza de la metodologa es, en cambio, la robustez con la que identifica los
impactos finales de una intervencin en las variables de inters, que constituyen el fin del proyecto,
programa o poltica. A continuacin, se describe la metodologa.
La evaluacin de impacto mide los cambios del buen vivir generados por una intervencin en un
grupo de beneficiarios; esto implica que se evala el grado al que se logran cumplir los objetivos
propuestos en la intervencin. Los impactos se expresan a travs de las variables de resultado de la
intervencin. Es decir, evala los resultados de un programa especfico sobre el grupo beneficiario,
con relacin a un grupo de personas de similares caractersticas que no reciben el beneficio
(contrafactual).
En trminos generales, se requiere cumplir con dos objetivos cruciales al momento de evaluar
un programa: el primero es lograr aislar el efecto de la intervencin, y el segundo es crear un
contrafactual que responde a la pregunta: Qu hubiera sucedido si no se intervena? Por lo tanto,
presenta la situacin sin intervencin del programa. De esta manera, se logra comparar entre el
grupo que recibe el tratamiento con el contrafctico o grupo de control. Existen dos momentos en
los cuales se puede evaluar:
La evaluacin ex post no significa que deba empezar despus de que el programa termine, o una
vez iniciado. Las evaluaciones ex - post que entregan mejores resultados son aquellas que fueron
diseadas ex ante, por lo general, simultneamente con el programa.
6
Por ejemplo, en el caso de un programa que entregue transferencias monetarias a las familias
ms pobres con la condicin de que estas lleven a sus nios y nias a las escuelas y a centros
de salud para controles peridicos (inversiones en recursos humanos), por ejemplo, el programa
PROGRESA en Mxico los indicadores relevantes seran el nivel de pobreza de esos hogares, la
escolaridad y el estado de salud de los nios y nias de los hogares beneficiados (indicadores que
interpretan el nivel de pobreza).
As mismo, se requiere algn mtodo que permita inferir el grupo de comparacin o contrafactual.
Esto es intrnsecamente no observable, ya que es fsicamente imposible observar a una misma
persona en dos estados de la naturaleza (por un lado, participando en el programa, y la misma
persona sin participar en el programa).
Aritmticas: A base de los datos recogidos en la lnea de base, se podran simular los cambios
esperados en las variables de inters, as como los efectos en la poblacin beneficiaria. Cabe
resaltar que, este mtodo no incluye modelos de comportamiento y no es muy confiable, pero
nos da una idea de los posibles efectos de la futura intervencin.
Estructurales: Permiten analizar los cambios en los comportamientos de los hogares, ya que
incluyen modelos y ecuaciones simultneas que simulan dichos comportamientos.
7
II. Formulacin de los problemas en la evaluacin2
Se asume que los trminos de error satisfacen E(i | Xi) = 0. Existen dos parmetros que se utilizan
ampliamente que son efecto promedio de tratamiento (average treatement effect (ATE)), E(Gi),
y efecto promedio de tratamiento en los tratados (average treatement effect on the treated
(ATET)), E(Gi | Di = 1). El ATE condicional es:
E(Gi|Xi) = Xi (T C) (1)
Como est claramente reconocido en la literatura, el problema esencial es que al estimar (1) y (2),
(0.1) y (0.2) no son estimables, ya que no es posible saber los resultados de un participante en el
contrafactual (YiC cuando Di=1) ni en el resultado contrafactual bajo tratamiento (YiT cuando
Di=0). Para tratar de resolver este problema, se supone que se estima (0.1) en una sub-muestra
para la cual Di=1 mientras que (0.2) se estima en el resto de la muestra. El modelo estimable es
entonces:
2. La mayor parte del texto fue tomado de Martin Ravallion Evaluating Anti-Poverty Programs
8
Se puede estimar una regresin simple (switching) para los resultados observables medidos en
una muestra colectiva.
Los impactos entonces van a estar reflejados en los coeficientes de Di en la ecuacin (4). Existe un
caso especial que es muy utilizado en la prctica; consiste en la especificacin del efecto comn,
en el que todos, excepto los interceptos y los vectores de los parmetros C y T, se asumen que
no varan con el tratamiento y por lo tanto se refieren a las ecuaciones (0.1) y (0.2). (Generalmente,
este supuesto es impuesto sin ninguna justificacin obvia, ms all del hecho de que uno puede
inmediatamente ver el impacto promedio del resultado de una regresin estndar). Entonces
la ecuacin (4) termina siendo una regresin de resultados de participacin y de las variables de
control:
Yi = (T C)Di + XiC + i (6)
El mtodo de mnimos cuadrados ordinarios (MCO) que se aplica a las ecuaciones (3.1) y (3.2),
da estimadores consistentes de los parmetros de impacto en la ecuacin (1) si no existe sesgo
de seleccin en X, es decir que E(iT iC| Xi, Di=1) = 0; o equivalentemente, que los resultados
de la media condicional no dependan del tratamiento, E(YiC|Xi,Di=1) = E(YiC|Xi,Di=0). Entonces
se dice que la ubicacin del programa la asignacin a las unidades de (3.1) y (3.2) es exgena.
Un requerimiento quizs ms estricto es que los resultados son independientes del tratamiento
condicional en X. A esto se denomina exogeneidad en la literatura. En este caso, el trmino
de error que se define en la ecuacin (5) desaparece en las expectativas dados los regresores,
asegurndose de que los MCO den estimadores consistentes bajo las condiciones estndares.
Tambin ATE y ATET se vuelven idnticos. El sesgo de una intervencin viene dado por la siguiente
diferencia: E(YiC|Xi,Di=1) E(YiC|Xi,Di=0), tal que la diferencia de la media de los resultados entre
los participantes y no participantes est dada por la siguiente identidad:
Una manera para asegurar exogeneidad es aleatorizar la entrega del beneficio, este mtodo se
denomina evaluacin experimental. En contraste, en una evaluacin no-experimental (tambin
llamada estudio de observacin o cuasi-experimental) el programa es colocado con un
propsito o fin (o sea, no aleatorio). Esto ocurre comnmente en estudios de pobreza, ya que se
lo coloca con relacin a las caractersticas observables, por ejemplo, el nmero de dependientes
en un hogar en reas pobres. Adems, puede existir una seleccin por parte de los participantes,
como el hecho que algunos deciden no participar a pesar de que son elegibles, de manera que el
proceso de tipo auto-orientado caracteriza a los programas antipobreza.
9
IV. Mtodos para construir el contrafctico
i) El sesgo por seleccin es separable y no vara en el tiempo, de tal manera que desaparece al
tomar las diferencias a travs del tiempo.
ii) Los resultados en el perodo inicial no son contaminados por las expectativas que se generan
por la futura implementacin del programa.
Bajo estos supuestos, el estimador de doble diferencia se lo puede conceptualizar como el impacto
de la diferencia simple del segundo perodo menos la diferencia simple de la lnea de base3 .
YT1 YT0 = YT
YC1 YC0 = YC
YT YC = Efecto
El diseo de diferencias en diferencias es muy til para solucionar posibles sesgos en un experimento
social donde existe algn tipo de cumplimiento selectivo u otra distorsin al momento de realizar
la asignacin aleatoria. Esta metodologa es la ms robusta, exacta, confiable y segura ya que no
presenta sesgo.
3. Existe un ejemplo interesante realizado en Indonesia por Dulfo (2001) que estima el impacto en la escolaridad y en el ingreso al construir escuelas.
10
Por otra parte, se suele considerar un problema tico el beneficiar a un grupo con una intervencin
y a otro no, ya que, muchas veces, sta afecta de forma determinante la calidad de vida, inclusive
la misma vida de las personas, como es el caso de los programas que ayudan a la disminucin o
erradicacin de la desnutricin infantil. Sin embargo, en algunos casos se puede acumular los
beneficios, y recibirlos juntos en momentos posteriores a la realizacin de la evaluacin de impacto;
esto es factible con programas que implican transferencias de dinero y no con programas como
el mencionado anteriormente. Adems, la metodologa descrita anteriormente puede tambin
traer problemas polticos. Este tipo de anlisis en muchos casos resulta muy costoso y, adems,
pueden darse casos de contaminacin por la posibilidad de movilizacin.
DDD=[E(G2|D2=1,D1=1)E(G2|D2=0.d1=1)]-[E(G1|D2=1,D1=1) E(G1|D2=0,D1=1)]
La primera parte es la ganancia neta de continuar participando en el programa, que est dada por
la diferencia entre la ganancia de participar en el periodo 2 y la ganancia de quienes dejaron el
programa. Si nicamente interesan las ganancias marginales de la participacin, se debe tomar en
cuenta la primera parte de la ecuacin; la seleccin para entrar al programa en el inicio no es un
problema. Se debe considerar que existen algunas ganancias para los que dejan el programa, ya
que E(G2|D2=0, D1=1) 0. Se puede pensar, por ejemplo, que quizs los participantes aprendieron
algo durante ese tiempo. La segunda parte del trmino se refiere al sesgo por seleccin que surge
del efecto de las ganancias en el perodo 1 y de la participacin en el perodo 2.
Un tercer cuestionario permite realizar una prueba de que estas dos condiciones se mantengan.
Existen dos tipos de problemas que confunden los esfuerzos para identificar un impacto. El primero
es el sesgo por seleccin, que puede surgir de variables observables o de variables no observables.
El segundo es la existencia de efectos que se desbordan hacia otras variables (efectos spillover),
que confunden los efectos que pueden atribuirse a los impactos del programa a sus participantes
directos.
4. El texto se tom principalmente del documento de Martin Ravallion: Evaluating Anti-Poverty Programs. Development Research Group, World Bank.
WPS3625, Junio 2005.
11
4.1.4 Seleccin de observables
Las ecuaciones (3) y (4) tratan con la seleccin de observables de una manera especial, en el sentido
de que los controles entran en una forma lineal con respecto a los parmetros. Este supuesto
ad hoc es difcilmente justificable por otro argumento, excepto conveniencia computacional. En
evaluaciones cuasi-experimentales de programas antipobreza, es difcil asegurar que las variables
observables estn balanceadas entre los dos sets de observaciones.
Para entender este problema, se puede suponer que la colocacin est determinada por proxy-
mean test, lo cual es comnmente usado en pases subdesarrollados para definir a quin dar
los beneficios del programa antipobreza. Esto asigna una calificacin a todos los potenciales
participantes en funcin de variables o caractersticas observables como, por ejemplo, el caso de
Ecuador, que utiliza el ndice Selben para definir a quien beneficiar. En ciertos casos, se determina a
los beneficiaros del programa solamente si se encuentran por debajo o por encima de estos ndices
o niveles crticos, determinados segn el presupuesto disponible. Con un 100% de aceptacin,
no existen intervalos de la calificacin para que se puedan observar tanto participantes como
no participantes en una muestra de cualquier tamao. Este ejemplo se conoce como fracaso en
apoyo comn en la literatura de evaluacin.
Se tendra que truncar la muestra de no participantes para asegurar la validez del grupo de
comparacin, mas all de la ineficiencia al recolectar la informacin innecesaria, esto en general
no es una preocupacin. Ms preocupante es que una submuestra no aleatoria de participantes
tendra que ser descartada por falta de suficiencia similar de los comparativos. Esto seala
un intercambio entre dos fuentes de sesgo. Por un lado, se tiene la necesidad de asegurar
comparabilidad en trminos de caractersticas iniciales. Y, por otro lado, se crea un posible sesgo
muestral por inferencias sobre el impacto, hasta el punto en que se tienen que descartar unidades
de tratamiento para obtener comparabilidad.
12
Por ejemplo, pensemos en el caso en el que se decida identificar los determinantes de participacin
en el mercado laboral con relacin al sueldo de mujeres que trabajan en el mercado laboral. Lo
que se quiere es interpretar o llegar a conclusiones sobre los determinantes de los salarios de
todas las mujeres. La diferencia entre trabajadores y no trabajadores determina si existe sesgo por
seleccin. Si se supone que se escoge una submuestra aleatoria de la poblacin, y la submuestra
tiene atributos similares a los del grupo de los que no trabajan, no existe ninguna razn para
suponer que hay un sesgo por seleccin al examinar nicamente las mujeres que estn trabajando.
Eso es porque al realizar una seleccin aleatoria, las caractersticas (tanto observables como no
observables) de la muestra de trabajadoras capturan un poco de todas las caractersticas de la
poblacin.
Suponiendo que no hubo una seleccin aleatoria y, en consecuencia, hay un potencial riesgo de
que sean distintas las caractersticas de las trabajadoras y no trabajadoras, el sesgo por seleccin de
la muestra ocurre cuando algn componente de la decisin de trabajar es relevante al proceso de
determinacin de salarios. En otras palabras, cuando alguno de los determinantes de la decisin
de trabajar esta influyendo tambin en el salario. Cuando la relacin entre la decisin de trabajar
y el sueldo es puramente a travs de variables observables, se puede controlar esto al incluir las
variables apropiadas en la ecuacin del salario. Por lo tanto, no surgir sesgo por seleccin en el
caso de que existan solo diferencias observables.
5. Para un mayor detalle de la seccin de sesgo por seleccin propuesta por James Heckman (1979) referirse al paper de Francis Vella: Estimating Mo-
dels with simple Selection Bias: A Survey. The Journal of Human Resources, Vol.33, No.1 (1998 de donde se tom parte del texto adems de Ravallion,
Martin en su paper, Evaluating Anti-Poverty Programs
13
casos especficos. En algunos estudios se han encontrado grandes sesgos en mtodos cuasi -
experimentales cuando se comparan a mtodos de evaluacin aleatorizados. No obstante, no se
pueden rechazar los mtodos cuasi - experimentales en algunas aplicaciones de ciertos estudios;
lo importante es mejorar los datos y la metodologa que se necesitan para conocer si los programas
sirven y cumplen sus objetivos. Sin embargo, algunos de los mtodos cuasi-experimentales
ms comunes como comparaciones de corte transversal de participantes y no participantes o
comparaciones reflexivas de los resultados de los participantes a lo largo del tiempo pueden dar
resultados severamente sesgados cuando la informacin disponible da controles inadecuados de
heterogeneidad.
Existen varias formas para corregir este problema, sin embargo, las metodologas ms comunes son
dos. La primera consiste en el mtodo de mxima verosimilitud por el supuesto de la distribucin
de los errores. La segunda se caracteriza por un procedimiento en dos etapas que elimina el
supuesto de que los errores no son cero. El uso de la metodologa de mxima verosimilitud es
poco comn, por lo que nicamente se define la estimacin en dos etapas en particular de un
modelo parametrizado.
i) Yi*=Xi+ i i=1.N
ii) di* = Zi + vi i=1,.N
iii) di=1 si di*>0 y di=0 si no lo es
iv) Yi = Yi* * di
donde Yi* es la variable latente endgena con su parte observable Yi; di* es la variable latente con
la funcin di. Las ecuaciones iii) y iv) reflejan si la variable dependiente principal es observable y si
las relaciones entre di y di* y Yi y Yi* respectivamente, Xi y Zi, son vectores exgenos de variables
de control.
v) Yi =Xi + i i=1.N
Se debe recordar que la estimacin de MCO da estimaciones sesgadas de porque E[i|Zi, di=1]0.
La estrategia entonces propuesta por Heckman (1976,1979) es tratar de corregir esto mediante
la inclusin de un trmino de correccin que toma en cuenta E[i|Zi, di=1]. Para emplear este
mtodo, se debe tomar la expectativa condicional de la ecuacin
E[i|Zi, di=1] = v
v2 { }
(Zi)
(Zi)
Es importante incluir variables adicionales en el vector Z en la primera etapa para identificar los
estimadores de la segunda etapa.
4.1.6 Desbordamientos (Spillovers) en no participantes6
Eliminar el sesgo por seleccin no asegura que los impactos se pueden identificar. La formulacin
clsica del problema de evaluacin asume que solamente el tratamiento en la unidad i puede
afectar los resultados en esa unidad. Luego se asume que se puede observar al grupo de no
participantes (control) y que estos no han sido afectados en ningn sentido por el programa en
cuestin. Esto se puede hacer una vez que el programa est operando (generando un diseo
de diferencia simple) o se puede hacer para los participantes antes del programa (dando una
comparacin reflexiva). Cuando se hacen ambas cosas, se est utilizando un mtodo de doble
diferencia. Bajo esas condiciones, se infieren impactos al comparar a aquellos que han dejado
el programa con quienes se han mantenido. Sin embargo, en todos estos casos se asume que se
puede observar el estado de los no participantes de una manera no contaminada por el programa.
Este supuesto puede ser problemtico al realizar evaluaciones de impacto de programas anti
pobreza. Por ejemplo, se evala un programa donde el Gobierno se compromete a dar trabajo
a quien desee trabajar, por un sueldo estipulado, de manera universal, es decir, se entrega el
beneficio a todo aquel que lo desee. Todos los participantes en el programa, obtienen como
beneficio el sueldo, el mismo que se considera bajo en un contexto especfico. La universalidad
de acceso significa que bajo este esquema se puede brindar un seguro efectivo para combatir
el riesgo. El que una persona requiera un trabajo cuya remuneracin es baja, podra pensarse
automticamente como un programa que est dirigido a las personas ms pobres.
Entonces, este tipo de programas dirigidos a ciertos grupos poblacionales tendran bien definidos
quines son los participantes y quines no. En un primer momento, puede parecer apropiado el
recolectar la informacin de los dos grupos y comparar los indicadores de resultado de estos como
una manera de identificar el impacto (posiblemente despus de corregir cualquier heterogeneidad
observada). Sin embargo, el diseo de evaluacin clsica puede dar un resultado severamente
sesgado. Las ganancias de dicho programa se esparcen en el mercado laboral privado e ignoran
el efecto de desbordamiento (spillover) que esto tiene y por lo tanto subestiman los beneficios.
Ciertamente, si la garanta de empleo es efectiva, entonces el esquema establecer un umbral ms
bajo para toda la distribucin de salarios, ya que ningn trabajador aceptar un empleo que no
sea el del programa a un sueldo menor que el del programa ya que siempre puede unirse a este.
Incluso si se escoge un grupo de comparacin perfecto de no participantes, se puede concluir
que el esquema no tiene impacto, ya que los salarios son los mismos para participantes y no
participantes, y esto no capturara las ventajas del programa en lo absoluto.
Los efectos de spillovers pueden surgir tambin por intervencin del gobierno. Generalmente, no
es muy claro si los recursos que se transfieren a los participantes realmente financian al proyecto
6. La mayor parte del texto fue tomado de Martin Ravallion Evaluating Anti-Poverty Programs en donde se encuentra una descripcin en mayor
detalle sobre spillovers en no participantes.
15
identificado. Hasta cierto grado, toda la ayuda externa puede ser intercambiable. Se puede verificar
mediante supervisin que el subproyecto propuesto fue en efecto completado, pero no se puede
descartar la posibilidad de que no lo fue. Participantes y lderes locales naturalmente trataran de
llevar a cabo la mejor opcin de desarrollo que consideren, a pesar de que sea algo que pensaban
hacer de todas maneras con los recursos disponibles. Entonces existe otro gasto que en realidad
esta siendo financiado por esta ayuda. De igual manera, no hay que descartar la posibilidad de que
localidades que no participen, sean beneficiadas por una reasignacin de gasto pblico realizada
por autoridades locales, de tal manera que disminuyan el impacto de participar en el programa.
Los efectos de los desbordamientos (spillovers) pueden subestimar los impactos reales del
programa. Sin embargo, el sesgo tambin puede orientarse en la otra direccin; por ejemplo,
si el Gobierno desea demostrar el impacto de un proyecto antipobreza y decide aadir mayores
recursos externos enfocados en localidades donde est el proyecto. La diferencia de resultados
de los participantes y del grupo de control estara sobredimensionando el impacto de la ayuda
externa.
Est claro que la informacin inadecuada e imperfecta yace en el centro del problema de la
evaluacin. Cuando se realiza una evaluacin de impacto, es importante conocer la mayor
cantidad de detalles tanto administrativos como institucionales sobre el programa; informacin
que proviene de la misma administracin del programa. Para evaluaciones no experimentales,
esta informacin es clave para disear un cuestionario que recolecte la informacin correcta para
controlar el proceso de seleccin. El conocimiento del contexto del programa y las caractersticas
del diseo pueden ayudar para manejar la seleccin en cuanto a las caractersticas no observables,
La elaboracin de evaluaciones cuasi experimentales para programas antipobreza pueden
demandar grandes requerimientos de informacin. Las fuentes de informacin utilizadas pueden
incluir tanto entrevistas formales como informales o no estructuradas con los participantes del
programa, al igual que informacin cuantitativa de muestras representativas. Sin embargo, es
extremadamente difcil realizar preguntas contrafactuales en entrevistas o grupos focales; por
ejemplo, tratar de preguntar a alguien que se encuentra participando en un programa social
lo siguiente: qu hara si no hubiese recibido ayuda del programa? Hablar con participantes
del programa puede ser muy valioso, pero es poco probable que provean informacin creble
por s solo. Se requiere adems informacin de indicadores de resultado y variables explicativas
relevantes.
7. La mayor parte del texto fue tomado de Martin Ravallio Evaluating Anti-Poverty Programs.
8. Para ver otras experiencias, referirse a anlisis realizados por P. Shultz (2004) sobre el programa PROGRESA de Mxico, que daba transferencias
monetarias a familias pobres. Las condiciones que deban cumplir eran: tener a hijos en escuelas, asistir a centros de salud y tomar suplementos
nutricionales. Este estudio realiz una colocacin aleatoria del programa para obtener un grupo de control o contrafctico. Otro ejemplo es el estudio
de Newman et al. (2002) de un programa del Banco Mundial para Bolivia.
16
4.1.8 Comparaciones de diferencias simples con asignacin aleatoria
Un experimento social busca aleatorizar la colocacin del programa, de tal manera que las unidades
(en un conjunto definido) tengan la misma oportunidad ex ante de recibir el programa. Todas
las caractersticas (observables y no observables) antes de la intervencin son idnticamente
distribuidas entre las unidades que reciben el programa y las que no lo reciben. Por implicacin,
las diferencias en las medias de los resultados ex post entre los dos grupos son atribuibles al
programa. La aleatorizacin garantiza que no existe sesgo por seleccin al estimar (3.1) y (3.2)
o equivalentemente la ecuacin del trmino de error (4) es ortogonal a los regresores. Los no
participantes son entonces un grupo vlido de control para identificar el contrafactual, y ATE es
estimado consistentemente (no paramtricamente) por las diferencias entre las medias muestrales
de YiT y YiC (incluyendo las submuestras con los valores dados de Xi).
Sin embargo, a pesar de que los diseos aleatorios seran ideales para identificar el impacto,
pueden surgir varios problemas en la prctica como mencionamos en la seccin de mtodos
experimentales: polticos, ticos, etc.
Esta metodologa intenta replicar el mtodo experimental. Existen varios tipos que se detallan a
continuacin.
No se puede asumir que al eliminar el sesgo por seleccin basado en observables, tambin se
reduce el sesgo agregado, eso solo se dar en el caso de que las dos fuentes de sesgo que se
asocian con las observables y que surgen por factores no observables van en la misma direccin,
lo que no puede ser refutado a priori. Una comparacin natural entre el MCO y el propensity score,
9. La mayor parte del texto fue tomado de Martin Ravallion Evaluating Anti-Poverty Programs.
17
se da cuando en este mtodo se introducen variables dicotmicas que definen la participacin en
el programa, lo que permite que las covariables observables entren como controles lineales. El
MCO requiere esencialmente el mismo supuesto de independencia condicional (exogeneidad) que
el mtodo de grupos emparejados (propensity score matching), pero adems impone supuestos
de la forma funcional arbitraria de los efectos del tratamiento y variables de control. En cambio,
el mtodo de grupos emparejados no requiere un modelo paramtrico que junte los resultados
de la participacin del programa. De tal manera que el mtodo de grupos emparejados permita
la estimacin de impactos sin los supuestos arbitrarios de la forma funcional y la distribucin del
trmino de error. Adems difieren con respecto a la muestra.
El Mtodo de Grupos Emparejados (MGE) da mayor atencin a las subuestras emparejadas, las
comparaciones que no estn emparejadas se eliminan, por lo tanto algunos participantes pueden
ser excluidos porque tienen un puntaje fuera del rango de los que se encuentran en la muestra
de participantes. Otra diferencia tiene que ver con la eleccin de variables de control X. En el
mtodo de regresin estndar se mira a los predictores para los resultados, y se da preferencia a
las variables que se pueden considerar exgenas al resultado. En el MGE, en cambio, se mira a las
covariables de participacin, posiblemente se incluye variables no significativas o variables que no
arrojen predicciones efectivas de los resultados. Ciertamente, resultados analticos y simulaciones
indican que las variables con poca habilidad de prediccin de los resultados pueden ayudar a
reducir el sesgo al estimar efectos causales cuando se utiliza el mtodo de grupos emparejados
(propensity score matching).
En resumen, el mtodo de grupos emparejados (MGE) es una importante herramienta que permite
analizar el impacto de un programa mediante la generacin de un contrafactual adecuado (bajo
el supuesto de que no existen variables no observables que influencien en la participacin). Lo
ms importante en ste mtodo es entender el mecanismo de asignacin los determinantes
observables de la colocacin del programa. Utilizar este mtodo es ms convincente que suponer
que la asignacin realizada en un programa especfico responde a los supuestos de un experimento
natural y que no existe sesgo por seleccin
La idea, en este caso es inferir los impactos que surgen de las diferencias entre un grupo de
tratamiento y control, pero de las unidades que estn cerca del punto de corte (que se utiliz para
definir quin es elegible y quien no). Para comprender este mtodo de mejor manera, es posible
pensar que Mi es el puntaje que la unidad i recibe como una prueba de medias proxy y m es el
punto de corte para la elegibilidad, de tal manera que Di=1 para Mi m y Di=0 en el caso contrario.
El impacto entonces se define como:
18
puede ser de gran ayuda para limpiar las diferencias en los resultados antes de la intervencin en
cualquiera de los lados de la discontinuidad, de tal manera que se estara combinando el diseo
de discontinuidad con el mtodo de dobles diferencias.
En este caso, se utiliza como grupo de comparacin a aquellos que han aplicado (es decir, son
elegibles) pero an no han recibido el programa, por lo tanto, la comparacin de lista de espera
es el grupo de control que se forma por un retraso en el programa. En muchos casos, este grupo
que se queda a la espera es elegido por una aleatorizacin, sin embargo, existen estudios que lo
utilizan en un diseo cuasi-experimental. Este mtodo en cierta manera trata con el problema
de heterogeneidad latente en los estimadores de diferencias simples, al igual que el mtodo de
grupos emparejados; los participantes exitosos, en general, suelen tener las mismas caractersticas
no observables, ya sea que hayan recibido el programa o todava no.
este modelo no tiene interpretacin a no ser que se incluya supuestos al trmino de error . De
otra manera se podra simplemente dejar que 1 y 2 tomen valores arbitrarios y suponer que
el trmino de error de la ecuacin (7) se mantiene para todas las observaciones. El mtodo ms
comn para interpretar esto describe las expectativas condicionadas o la mejor aproximacin
lineal de Yi dado X1i y X2i. Esto requiere que se impongan los siguientes supuestos:
10. La mayor parte del texto fue tomado de Verbeek, Marno. A guide to Modern Econometrics. John Wiley & Sons, Ltd. 2000 en donde adems se
detalla en mayor profundidad el concepto de endogeneidad y el mtodo generalizado de momentos.
19
E{iX1i} = 0 (8.1)
E{iX2i} = 0 (8.2)
Estas son las condiciones necesarias para la consistencia de los estimadores MCO. Al momento
en que se relaja cualquiera de estas condiciones, el modelo ya no corresponde a la expectativa
condicional de Yi dado X1i y X2i.
En la ecuacin del logaritmo del ingreso, i incluye todos los factores no observables que afectan
al salario de un individuo, tales como: habilidad innata o inteligencia. Se dice que el nmero de
horas que trabaja una persona dependen parcialmente de estas caractersticas no observables.
Si ste es el caso, los estimadores MCO estn consistentemente estimando el valor esperado
condicional del salario de una persona, entre otras cosas, el nmero de horas que trabaj el
individuo, pero no estn estimando consistentemente el efecto causal de las horas de trabajo.
Esto quiere decir que, el estimador de MCO 2 va a reflejar la diferencia en el salario esperado de
dos personas arbitrarias con las mismas caractersticas de X1i observables, pero que trabajan X2 y
X2+1 horas, respectivamente. Esto de ninguna manera mide la diferencia entre el sueldo de una
persona arbitraria (por alguna razn exgena) que decide incrementar sus horas de trabajo de X2
a X2+1. La razn es que en la primera interpretacin, los factores no observables que afectan el
salario de un individuo no son constantes en las dos personas, y en la segunda interpretacin, los
no observables se mantienen constantes. Puesto de otra manera, cuando se interpreta un modelo
como una esperanza condicionada, la condicin todo lo dems constante (Ceteris Paribus)"
nicamente se refiere a las variables incluidas, mientras que en la interpretacin causal tambin
incluye las variables omitidas, es decir, las no observables en el trmino de error.
Los coeficientes del modelo de regresin se interpretan como efectos causales. En estos casos
tiene sentido discutir sobre la validez de las condiciones (8.1) y (8.2). Si E{iX2i} 0. Se dice que X2i
es endgena (con respecto al efecto causal de 2). Para ecuaciones del salario de microeconoma,
usualmente se argumenta que muchas variables explicativas son potencialmente endgenas,
incluyendo variables como el nivel de educacin, estado civil, salud, industria. Por ejemplo, se
observa que en promedio los salarios son un 10% ms que para personas que estn casadas. Esto
no quiere decir y no refleja un efecto causal de estar casado, sino una consecuencia de la diferencia
de caractersticas no observables de gente que est casada y gente que no.
Cuando se estima el modelo por MCO, se imponen estas condiciones en el estimador, por medio
de los correspondientes momentos muestrales. Esto es, el estimador b=(b1,b2) por = (1, 2)
20
surgen de las siguientes ecuaciones:
De hecho, estas son las condiciones de primer orden para la minimizacin del criterio de
mnimos cuadrados. El nmero de condiciones es exactamente igual al nmero de parmetros
desconocidos, tal que b1 y b2 se puedan resolver de las ecuaciones (10.1) y (10.2). Sin embargo,
apenas se viola la ecuacin (8.2), la condicin (10.2) desaparece y a partir de ese momento ya no se
puede resolver el b1 y b2. Esto significa que el 1 y 2 ya no se pueden identificar.
Dado que esta condicin de momento no es una combinacin de otras variables (z2i no puede
ser una combinacin lineal de X1is), la introduccin del instrumento es suficiente para identificar
los K parmetros 1 y 2. El estimador de la variable instrumental IV, se puede resolver de la
siguiente manera:
1/N * (Yi - X1i 1IV X2i 2IV) * X1i = 0 (12.1)
1/N * (Yi - X1i 1IV X2i 2IV) * z1i = 0 (12.2)
donde Xi= (X1i, X2i) y zi = (X1i, z2i). Claramente, si z2i = X2i, esta expresin se reduce al estimado
MCO.
Bajo los supuestos (9.1) y (11) y algunas condiciones regulares, el estimador de las variables
instrumentales es consistente y asintticamente normal. Lo ms importante de estas condiciones
regulares es que la matriz K x K
es finita e invertible. Una condicin necesaria para esto es que el instrumento z2i est correlacionado
con S2i y no sea una combinacin lineal de los elementos en X1i. La covarianza asinttica de IV
depende de los supuestos que se hacen de la distribucin de i. En el caso estndar donde i es
IID(0, 2), independientemente de zi, se puede mostrar que:
Como en el caso de mnimos cuadrados, es posible ajustar por los grados de libertad y dividirlo
por N- K en lugar de N.
El problema que puede surgir es que la mayora de veces no es obvio determinar cul de las
variables puede utilizarse apropiadamente como instrumento. En el ejemplo mencionado se
necesita una variable que est correlacionada con las horas de trabajo X2i, pero no correlacionada
con los factores no observables de habilidad innata incluidos en el trmino de error. Se puede
argumentar que las variables relacionadas a la composicin de la familia pueden servir como
variables instrumentales.
El nico caso en el que las condiciones de momento pueden ser parcialmente comprobables es
cuando existen ms condiciones de las requeridas para la identificacin. En este caso, se pueden
comprobar las restricciones sobre-identificativas, sin necesariamente ser capaces de especificar
cal de las condiciones de momento corresponde a estas restricciones.
Yi = Xi + i (17)
En general, se asume que existen R instrumentos disponibles para el vector zi, los cuales pueden
superponerse con Xi. Las condiciones de momento relevantes estn dadas por las siguientes R
restricciones:
y se obtiene:
IV= ((ziXi)-1 ziYi
22
Si el modelo se escribe en forma matricial:
Y= X +
y la matriz Z es una matriz NxR de los valores de los instrumentos, este estimador de las variables
instrumentales puede ser escrito tambin de la siguiente manera:
Si R>K, existen ms instrumentos que regresores. En este caso no es posible resolver el estimado
reemplazando en la ecuacin (18) con su contraparte de la muestra. No es posible resolver el
sistema ya que existen ms ecuaciones que incgnitas. En lugar de quitar instrumentos (y perder
eficiencia) en general se escoge de tal manera que los R momentos de la muestra cumpla con
lo siguiente:
Donde WN es una matriz RxR positiva definida y simtrica. Esta es una matriz que otorga
diferentes ponderaciones a cada momento de la muestra. En general puede depender de un
tamao muestral N, porque por s solo puede ser un estimado. Para las propiedades asintticas
del estimador de resultado de , la probabilidad del lmite de WN, denotado por W = plim WN, es
importante. Esta matriz W debe ser simtrica y positiva definida. Usando notacin matricial por
conveniencia se puede reescribir la ecuacin (20) como:
-2XZWNZY + 2XZWNZX*IV = 0
lo que implica:
XZWNZY = XZWNZX*IV (22)
Si R=K, la matriz XZ es cuadrada (y por los supuestos) invertible. Esto puede escribirse de la
siguiente manera:
23
En lo que corresponde a la ecuacin (19), la matriz de ponderacin es irrelevante. En esta situacin
el nmero de condiciones de momento es exactamente igual al nmero de parmetros que estn
siendo estimados. Se puede pensar en una situacin en la que se identifica exactamente
porque se tiene justo la informacin necesaria (o sea las condiciones de momento necesarias) para
estimar . Una consecuencia inmediata de todo esto es que el mnimo de la ecuacin (21) es cero,
lo que implica que a todos los momentos de la muestra puede darse el valor de cero al escoger
apropiadamente. Eso es, QN (IV) es igual a cero. En este caso, IV no depende de WN y el mismo
estimador se obtiene independientemente de la matriz de ponderacin que se escoja.
1/N* izi
y dependen de los supuestos que se hacen tanto en i como en zi; si se asume que i es IID(0, 2)
e independiente de zi, la matriz de varianza asinttica de los momentos de la muestra est dado
por:
24
consecuentemente, una matriz de ponderaciones ptima se obtiene de:
Comparado con otros mtodos, al usar variables instrumentales no se requiere que se asuma
exogeneidad. En lugar de eso, se asume exogeneidad en la variable Zi, que Zi tiene relacin con la
colocacin y que Zi no es un elemento del vector de controles X, lo cual es comnmente conocido
como exclusin restriccin. Si estos supuestos se mantienen, entonces se puede decir que Zi
identifica el impacto del programa.
Es muy comn en experimentos sociales, que muchas de las unidades que han sido seleccionadas
aleatoriamente para el programa, no participen. En este caso se puede utilizar como variable
instrumental a la asignacin aleatoria. La exclusin restriccin en este caso se cumple ya que se
asign aleatoriamente quin debera participar en el programa, entonces solo afecta los resultados
por medio de su participacin actual.
El estimador de variables instrumentales es ahora una dicotmica para la asignacin del programa
(uno si fue asignado y cero para control). Esta variable, si bien est correlacionada con la variable
de tratamiento real, no tiene ninguna correlacin con el error por lo tanto es un buen instrumento.
Esto muchas veces ocurre en casos reales por lo cual es muy importante corregirlo de esta manera.
11. La mayor parte del texto fue tomado de Ravallion Martin Evluating Anti-Poverty Programs. World Bank Policy Research Working paper 3625, Junio
2005.
12. Atanasio, Vera y Hernndez (2004), en un estudio realizado en Colombia para medir el impacto de un programa nutricional en los nios menores
de 5 aos.
25
nada que ver con el hecho de recibir o no los alimentos. Se podra pensar que la distancia puede
ser endgena por la decisin del lugar donde vivir del hogar o de la comunidad. Sin embargo, en
el cuestionario, ninguno de los encuestados atribuye su decisin de mudarse con la ubicacin del
centro comunitario, por lo tanto consideran el instrumento como exgeno.
Las caractersticas polticas de ciertas reas geogrficas tambin han sido fuente de variables
instrumentales. Entender la economa polaca de la colocacin de un programa tambin puede
ayudar a identificar impactos. Un ejemplo de esto es el estudio de Besley y Case (2000) que utiliza
la presencia de mujeres en los parlamentos estatales en los Estados Unidos como una variable
instrumental del seguro de compensacin de los trabajadores al tratar de estimar los impactos
de la compensacin en los salarios y el desempleo. En su trabajo argumentan que las abogadas
mujeres implementan leyes que favorecen la compensacin de trabajadores, pero que esto es
poco probable que tenga un efecto independiente en el mercado laboral.
Otra posibilidad para encontrar variables instrumentales es el diseo discontinuo del programa,
ya que el ALTE es el vecindario donde est la lnea de corte de la elegibilidad del programa. Por
ejemplo, en el estudio realizado por Angrist y Lavy (1999) quienes miran el impacto de calificaciones
escolares del tamao de la clase en Israel, utilizan el hecho de que una profesora extra se asigna
cuando la clase aumenta sobre 40 estudiantes.
Estos ejemplos demuestran la justificacin de un estimador de variable instrumental que surge de
informacin externa a los confines del anlisis cuantitativo. Esas fuentes pueden ser argumentos
tericos, sentido comn, o argumentos empricos que se basan en distintos tipos de informacin,
que muchas veces se centran en entender cmo funciona y opera el programa en la prctica.
26
V. Elementos para tomar en cuenta en una evaluacin de impacto13
Hasta ahora, el principal enfoque en la literatura ha sido tratar de ver si el diseo de la evaluacin
permite obtener estimadores de impacto confiables en un contexto especfico. Sin embargo,
Deaton llama la atencin sobre otros temas importantes con respecto a lo que se puede aprender
de una evaluacin, para aplicar los resultados en otros ambientes e implementar polticas en el
futuro.
Muchas veces se trata de inferir desde una evaluacin de impacto si es posible ampliar el
programa. Este tipo de preocupaciones de validez externa incluye los estudios experimentales
y no experimentales. Un mismo programa puede funcionar y tener impactos importantes en
una comunidad, pero no tener el mismo impacto en otra, por lo tanto, es complicado realizar
generalizaciones en cuanto a ampliar las coberturas de un programa y replicar los resultados. Esto
quiere decir que el contexto institucional es sumamente importante para el impacto. Entonces,
las preocupaciones sobre la validez externa de las evaluaciones de impacto surgen cuando se
requiere que ciertas instituciones estn presentes para facilitar los experimentos.
Otra preocupacin respecto a la validez externa es que, a pesar de que supuestos de equilibrios
parciales pueden ser apropiados para un programa piloto, esto puede dejar de serlo cuando se
ampla la cobertura del mbito nacional, y los efectos de equilibrio general se vuelven importantes,
muchas veces, a esto se conoce en la literatura econmica como efectos feedback o macro.
Para entenderlo mejor se debe considerar que, por ejemplo, un estimador de impacto de la
escolaridad dado un subsidio de educacin basado en una prueba aleatoria puede ser engaoso
en el momento de ampliar la cobertura, dado que se alterar la estructura de los retornos de la
escolaridad. Consecuentemente, un anlisis de equilibrio parcial puede sobreestimar el impacto
del subsidio de educacin una vez que los salarios relativos se ajusten. De esta manera, los efectos
de una prueba pueden diferir sustancialmente de los efectos una vez ampliada la cobertura del
programa.
Los factores de contexto son cruciales para el desempeo del programa al existir el riesgo de
sobreestimar el impacto ya que en ciertos contextos todo parece funcionar perfectamente y en
otros, en cambio, nada funciona. Por lo tanto, es muy importante para el programa adaptarse
apropiadamente al contexto institucional y socioeconmico en el cual debe operar. Muchas
veces, la diferencia que se encuentra en el impacto de la prueba piloto comparada con el impacto
que se genera una vez ampliada la cobertura, es que la composicin socio econmica cambia
segn la escala. En este sentido, es importante entender qu determina el impacto. Se necesita
suplementar las herramientas de la evaluacin con otras fuentes de informacin que pueden
aclarar los procesos que influyen en los resultados medidos. Un mtodo es repetir la evaluacin
en distintos contextos, considerando las caractersticas de una localidad. El programa puede tener
mayor o menor efecto, por ejemplo, en comunidades con menor desigualdad de gnero, o con
menor tasa de criminalidad, etc.
Otra alternativa es tratar de explorar ms a fondo por qu el programa tiene mayores o menores
impactos en un contexto especifco, como una manera de inferir si ser til implementarlo en
distintos contextos. En este caso, se pueden utilizar indicadores intermedios.
En lugar de emplear nicamente los resultados finales de la evaluacin de impacto, se pueden mirar
con mayor detalle los diferentes efectos en un amplio nmero de indicadores de comportamiento.
13. La mayor parte del texto fue tomado de Deaton Angus" Instrument of development: Randomization in the topics, and the search for the elusive
keys to economic development".
27
Por ejemplo, saber cul es el comportamiento de la gente una vez que reciben la transferencia
de dinero. Una cosa sera nicamente mirar el efecto que esto tiene en la escolaridad y en la
salud, sin embargo, es importante analizar el cambio en el comportamiento de las personas, como
por ejemplo: qu tipos de inversin realizaron y por qu? Las respuestas de comportamiento en
cuanto a ahorro y consumo pueden proveer informacin para entender qu determina el impacto.
Adems, se pueden obtener otras fuentes de informacin externa para la evaluacin, por
ejemplo, fuentes que provienen de la investigacin cualitativa. La idea es realizar una prueba
de los supuestos que se hacen en la intervencin, lo que comnmente se llama theory-based
evaluation. Ver: quin particip; se capturaron ciertas partes de la comunidad? En la prctica, no
siempre se puede descomponer de esta manera el programa para realizar pruebas de cada nexo
de la cadena.
VI. Conclusiones
Es importante tener en cuenta que no existe una manera nica que permita evaluar el impacto
de un proyecto, programa o poltica pblica. Cada circunstancia y requerimiento de informacin
necesita de un anlisis especfico, de la utilizacin de una herramienta determinada que permita
generar informacin para tomar decisiones que corrijan el desempeo u orientaciones que no
conduzcan al logro de los objetivos propuestos
28
BIBLIOGRAFA
Angrist J, Lavy, 1999. Using MaimonidesRule to Estimate the Effect of Class Size on Scholastic
Achievement. Quarterly Journal of Economics, 114: 533-75.
Atanasio, Vera, et al, 2004. The short-term Impact of a Conditional Cash Subsidy on Child Health
and Nutrition in Colombia. [en lnea]. London: The Institute For Fiscal Studies.
Besley, Timothy; Case Anne, 2000. Unnatural Experiments: Estimating the Incidence of
Endogenous Policies. Economic Journal, 110, F672 F694.
Deaton, Angus, 2009. "Instruments of development: Randomization in the topics, and the
serach for the elusive keys to economic development". Princeton University; National Bureau of
Economic Research. NBER Working Paper No. w14690
Dulfo, Esther, 2001. Schooling and Labor Market Consequences of School Construction in
Indonesia: Evidence from an Unusual Policy Experiment. THE AMERICAN ECONOMIC REVIEW.
Indonesia.
Newman, John, et al, 2002. Pobreza y Desigualdad en Municipios de Bolivia. Banco Mundial,
Bolivia.
Ravallion Martin, 2005. Evaluating Anti-Poverty Programs. World Bank Policy Research Working
paper 3625.
Shultz, Paul, 2004. School subsidies for the poor: evaluating the Mexican Progresa poverty
program. Journal of Development Economics, Elsevier, vol. 74(1), pages 199-250, June
Vella Francis, 1998. Estimating Models with simple Selection Bias: A Survey. The Journal of
Human Resources, Vol.33, No.1.
Verbeek, Marno, 2000. A guide to Modern Econometrics. John Wiley & Sons, Ltd.
29
30
Metodologas
de evaluacin de impacto
SecretaraNacionaldePlanificacinyDesarrollo
SubsecretaradeSeguimientoyEvaluacin