Estimation of Average Treatment Effects Using Panel Data

3
12
Machine Translated by Google
Recibido: 16 Agosto 2018
ARTÍCULO DE INVESTIGACIÓN
efectos fijos no observados
Shosei Sakaguchi
Correspondencia
Shosei Sakaguchi, Departamento de
Revisado: 20 de diciembre de 2019
Estimación de los efectos promedio del tratamiento utilizando datos de
panel cuando la heterogeneidad del efecto del tratamiento depende de
Departamento de Economía, Universidad
Universidad de Londres, Gower Street, WC1E 6BT,
Londres, Reino Unido
Economía, University College London, Gower
Street, London WC1E 6BT, Reino Unido.
Correo electrónico: s.sakaguchi@ucl.ac.uk
1 INTRODUCCIÓN
Resumen
Este documento propone un nuevo enfoque de datos de panel para identificar y estimar
el efecto de tratamiento promedio variable en el tiempo (ATE). El enfoque permite la
heterogeneidad del efecto del tratamiento que depende de los efectos fijos no observados.
En presencia de este tipo de heterogeneidad, los enfoques de datos de panel existentes
identifican el ATE solo para subpoblaciones limitadas. Por el contrario, el enfoque
propuesto identifica y estima la ATE para toda la población. El enfoque se basa en la
especificación de efectos fijos lineales de ecuaciones de resultados potenciales y utiliza
variables exógenas que están correlacionadas con los efectos fijos. Aplico el enfoque
para estudiar el impacto del tabaquismo de una madre durante el embarazo en el peso al nacer de su h
Los datos de panel se usan popularmente en los estudios de evaluación de programas para controlar los efectos fijos no observados. Existen
muchos métodos de datos de panel que permiten hacerlo basándose en restricciones de forma funcional o restricciones en la distribución de
variables no observadas. Sin embargo, cuando los efectos del tratamiento son heterogéneos según los efectos fijos no observados, los métodos
de datos de panel existentes no pueden identificar y estimar de manera consistente el efecto promedio del tratamiento (ETA) para toda la población.
Este artículo propone un nuevo enfoque de datos de panel que puede identificar y estimar la ETA para toda la población, incluso cuando la
heterogeneidad del efecto del tratamiento depende de efectos fijos no observados.
En los estudios de evaluación de programas, los efectos del tratamiento suelen ser heterogéneos entre individuos con diferentes
características, y esta heterogeneidad a menudo depende de efectos fijos no observados. Por ejemplo, en las evaluaciones de capacitación
laboral, el efecto de la capacitación sobre los salarios puede ser heterogéneo entre individuos con diferentes niveles de habilidad no observada.
Cuando la heterogeneidad del efecto del tratamiento depende de efectos fijos no observados, los métodos de datos de panel existentes no
pueden identificar y estimar consistentemente la ETA para toda la población. El estimador de efectos fijos (FE) de uso frecuente, basado en un
supuesto de independencia condicional, está sesgado en este caso.1 El método de diferencias en diferencias (DID), basado en un supuesto de
tendencia común, puede identificar y estimar el ATE para los tratados (ATT), pero no para toda la población. En muchos casos, sin embargo,
estimar el ATE suele ser más deseable en términos de la validez externa de los resultados de la estimación, lo que ha captado una atención
cada vez mayor en los estudios empíricos (p. ej., Athey e Imbens, 2017). Por ejemplo, si consideramos expandir una intervención de política
existente de la subpoblación tratada actual a toda la población, el ATE debería ser el parámetro de interés.
Este documento propone un nuevo enfoque de datos de panel que puede identificar y estimar el ETA para toda la población, al tiempo que
permite la heterogeneidad del efecto del tratamiento que depende de los efectos fijos no observados. La identificación se basa en la
especificación de efectos fijos lineales de las ecuaciones de resultado potencial tratadas y no tratadas, en las que un efecto fijo escalar
1En el contexto de efectos fijos grupales, Gibbons et al. (2018) presentó una serie de ejemplos empíricos en los que el estimador FE está sesgado porque la heterogeneidad del
efecto del tratamiento depende de los efectos fijos del grupo.
J Appl Econ. 2020;35:315–327. wileyonlinelibrary.com/journal/jae © 2020 John Wiley & Sons, Ltd. 315

3
12 316
ingresa de forma aditiva las dos ecuaciones con diferentes coeficientes. Esta especificación permite que la heterogeneidad del efecto del tratamiento
dependa de efectos fijos no observados, aunque impone algunas restricciones paramétricas. El enfoque también permite que el ATE varíe en el
tiempo y puede identificar y estimar el ATE en cada período de tiempo. Tenga en cuenta, sin embargo, que no permite las estructuras dinámicas en
los efectos del tratamiento, a diferencia de Callaway y Sant'Anna (2018).
Bajo el modelo especificado, identificamos el ATE prediciendo el resultado potencial no observado para cada individuo tratado y no tratado
usando los siguientes tres pasos. Primero, identificamos los coeficientes de las covariables observadas en las funciones de regresión para los
posibles resultados tratados y no tratados aplicando la transformación intra a cada función de regresión para diferenciar los efectos fijos. Luego, al
observar los residuos del primer paso, identificamos la relación de los términos de efectos fijos entre las dos funciones de regresión. Para ello,
utilizamos cambios en el tiempo en los grupos de tratamiento y control, que se observan en la subpoblación de individuos denominados movedores2,
y variables exógenas que se correlacionan con los efectos fijos condicionados a la asignación del tratamiento. Como se analiza más adelante,
encontrar tales variables exógenas no suele ser difícil. Finalmente, identificamos el ATE mediante la combinación de datos observados con los
parámetros identificados para predecir resultados potenciales no observados para cada individuo tratado y no tratado. Sobre la base del resultado
de la identificación, el ATE se puede estimar mediante un estimador del método generalizado de momentos (GMM).
La limitación de este enfoque es que se basa en la especificación de efectos fijos escalares y aditivos para las funciones de regresión de los
resultados potenciales. Bajo modelos de datos de panel no separables, Chernozhukov et al. (2013) consideraron la identificación y estimación de
los efectos de tratamiento promedio y cuantil basados en la condición de homogeneidad temporal de los términos de perturbación específicos del
período. Con el mismo tipo de condición de homogeneidad temporal, Jun et al. (2016) derivaron los límites claramente identificados de las
distribuciones de resultados potenciales. Sakaguchi (2016) propuso un enfoque para identificar y estimar el ATE para toda la población como una
extensión del enfoque DID. Ese enfoque explota datos de panel estructurados de manera única, en los que la exposición al tratamiento se expande
de ningún individuo a todos los individuos a lo largo de períodos de tiempo. A diferencia de esos trabajos, aunque el enfoque propuesto en este
artículo se basa en la especificación de efectos fijos escalares y aditivos, no requiere la condición de homogeneidad temporal ni una estructura de
datos específica.
Este documento también se relaciona con la literatura sobre el modelo de datos de panel de coeficientes aleatorios correlacionados (CRC). El
modelo de datos de panel CRC captura la heterogeneidad del efecto del tratamiento que depende de los efectos fijos no observados, y el efecto
parcial promedio (APE) de la pendiente específica del individuo en el modelo generalmente corresponde al ATE.3 Un enfoque común utilizado para
identificar y estimar el APE en el modelo hay un enfoque generalizado dentro del grupo (p. ej., Chamberlain, 1992), que identifica y estima el APE
para una subpoblación de personas que se mudan. En contraste, en este artículo asumimos efectos fijos escalares; en cambio, identificamos y
estimamos todo el ATE. Otros trabajos que estudian el modelo de datos de panel CRC incluyen Wooldridge (2005), Arellano y Bonhomme (2012) y
Graham y Powell (2012).
Como aplicación empírica, aplico el enfoque para estudiar el impacto del tabaquismo de una madre durante el embarazo en el peso de su hijo al
nacer utilizando los datos de panel combinados construidos por Abrevaya (2006). Al aplicar el enfoque propuesto, podemos permitir que el efecto
del tabaquismo de las madres sea heterogéneo dependiendo de los efectos fijos no observados de la madre, y podemos estimar el efecto promedio
del tabaquismo en toda la población de madres. En la aplicación, encuentro que el tabaquismo de una madre tiene un efecto promedio negativo en
cada uno de los tres tiempos de nacimiento, y el efecto empeora con el tiempo de nacimiento adicional.
SAKAGUCHI
El resto de este trabajo se estructura de la siguiente manera. La Sección 2 describe el entorno, la especificación de los posibles resultados y los
supuestos necesarios para la identificación. La sección 3 describe el enfoque de identificación y el método de estimación.
La Sección 4 presenta los resultados de la simulación de Monte Carlo para mostrar el comportamiento de muestra finita del estimador. La Sección
5 describe la aplicación empírica. La sección 6 concluye este documento con algunas observaciones. Un apéndice en línea contiene todas las
pruebas y resultados de simulación adicionales.
2 CONFIGURACIÓN Y MODELO
Suponemos que {Yit, Dit, Xit, Zit} se observa para N individuos (i = 1, 2, ... , N) a lo largo de T períodos de tiempo (t = 1, ... , T), donde T ≥ 2.
Suponemos N es grande, mientras que T es pequeño. Yit es un resultado observado. Dit {0, 1} es un indicador de tratamiento binario, tal que Dit
= 1 si el individuo i es tratado en el período t y Dit = 0 en caso contrario. Suponemos que la asignación del tratamiento varía en el tiempo. Xit es un
vector K × 1 de covariables observadas variables en el tiempo que pueden incluir dummies temporales (o una tendencia temporal determinista),
variables de confusión observadas variables en el tiempo e interacciones entre ellas. Zit es un vector L×1 de variables exógenas que se correlacionan
con efectos fijos no observados condicionados a la asignación del tratamiento. Zit puede consistir en algunos
2Movers son personas que experimentan tanto tratamiento como no tratamiento a lo largo de períodos de tiempo observados.
3Esto se ilustra en Wooldridge (2010, p. 968).
3
12 SAKAGUCHI
o todas las variables incluidas en Xit, así como las variables externas. No se requieren restricciones en la dimensión de Zit. Discutiremos las
suposiciones sobre Zit y su uso más adelante. Finalmente, sean Yit(1) y Yit(0) los resultados potenciales para el individuo i en el período t con y sin
tratamiento, respectivamente. Entonces, Yit se expresa como Yit = DitYit(1)+(1 − Dit)Yit(0).
A lo largo de este trabajo, nos enfocamos en el ATE para toda la población en cada periodo t {1, … , T}:
Yit(0)]. En muchos casos, la ATE para toda la población, en lugar de una subpoblación limitada, es más interesante. Permitiremos que el ATE varíe en
el tiempo y consideraremos identificar y estimar el ATE en cada período. Tenga en cuenta, sin embargo, que el ATE variable en el tiempo considerado
aquí es diferente de los parámetros del efecto del tratamiento variables en el tiempo considerados por Lechner (2009) o Callaway y Sant'Anna (2018),
en que se define solo en relación con la asignación de tratamiento de el período correspondiente, y no captura la dinámica del efecto del tratamiento
considerado por ellos.
Sea Ci un efecto fijo escalar. A lo largo de este artículo suponemos que los posibles resultados Yit(1) y Yit(0) son
expresada como las siguientes formas lineales:
fuerte = 1, … , T, donde u1
1econstantes
efectos fijos lineales. Bajo
él
y tu0
dependa de las covariables observadas. ≠ Además, la
separable de los otros términos.
él
También restringimos ≠ 0, que 1se requiere para la identificación.
variación
no de h
solo poraria
constantes
Yt(1) =
él
Yt(0) =
hdeterogéneas,
artes
de le
Xtit
os provoca
érminos
dse
1
) + SALIR
observados, respectivamente. En particular, ≠ 1 permite que la heterogeneidad del efecto del
vino
+ X′
tpermite
ratamiento
ariación
efectos
también
él
+ X′
se definen como u1 = Yit(1)−E[Yit(1)|Xit, Ci] y u0
que
fhijos
oraria
de
(
él
dlependa
1
+
0
1
de efectos
a heterogeneidad
en pearte
permite
una l qAue
TE.
La
hlos
c + u1
+ Ci + u0
)+(
dfel
ijos
efecto
separabilidad
omogénea.
efectos
él,
él,
él
están separados de los términos de efectos fijos, en contraste con el modelo estándar de datos de panel de
sta especificación,
comió
comió
= (
en cada período t {1, … , T} se expresa de la siguiente manera:
1 − 0 ′ 1 − 0 1
− 1)E[Ci],
donde la expectativa no se toma a lo largo del tiempo y, por lo tanto, la variación de tiempo en Xit no se promedia. Como se ve en esta ecuación, el
ATE consta de tres partes: una parte constante y promedios de dos partes heterogéneas que dependen de covariables observadas y efectos fijos no
1
no observados. 1 0
del tratamiento
de los términos
del tratamiento
suponemos que todas las variables aleatorias definidas son independientes y están distribuidas de forma idéntica (iid) entre los individuos:
Supuesto 2.1. {{Yit(0), Yit(1), Dit, Xit, Zit}T t=1,
Ci} son iid a través de i.
consten
Aunque asumimos que Xit entra linealmente en (1) y (2), también podría usarse una función paramétrica no lineal de Xit siempre que sea completamente
En el resto de esta sección, describo cuatro suposiciones que se requieren para la identificación. En primer lugar, a lo largo de este artículo
comió
≡ E[Yit(1) −
= Yit(0)−E[Yit(0)|Xit, Ci], respectivamente.
Las ecuaciones son lineales separables en Xit, Ci y u a uno. él. Para la normalización de escala, establecemos el coeficiente de Ci en la ecuación (2)
En la especificación del modelo anterior, se permite que los coeficientes de Ci y Xit sean diferentes entre (1) y (2). Además, y 0 , los términos
(1)
(2)
317
Esta suposición no impone restricciones sobre la distribución de los datos a través de períodos de tiempo a diferencia, por ejemplo,
Chernozhukov et al. (2013) and Jun et al. (2016).
Luego, para formalizar la idea de confusión debido a la presencia de covariables observadas y efectos fijos no observados,
imponemos el siguiente supuesto.
Supuesto 2.2. E[Yit( )|Di1, ... , DiT, Xi1, ... , XiT, Ci] = E[Yit( )|Xit, Ci] para todos = 0, 1 y t = 1, ... , t
Esta suposición es la misma que la suposición fundamental para la estimación de FE. La suposición requiere que, en cada período de tiempo,
los resultados potenciales sean medios independientes de las asignaciones de tratamiento en todos los períodos condicionados a las covariables
observadas en el período dado y los efectos fijos no observados. Esta suposición también requiere que los resultados potenciales en cada período
de tiempo no dependan de las covariables observadas pasadas o futuras condicionadas a los efectos fijos no observados. Esto implica una
exogeneidad estricta de Xit condicionada a Ci.
También imponemos la siguiente suposición sobre la asignación del tratamiento.
3
12 318
Supuesto 2.3. P(Dit =
Llamamos a tales
t=1 individuos
existencia
“motores”,
de motores
,
tomando
en cada
0 < ∑T t=1 Dit < T) > 0 para todos = 0, 1 y t = 1, … , T.
Esta suposición requiere que los grupos tratados y no tratados en cada período de tiempo incluyan algunos individuos que han experimentado
tanto tratamiento como no tratamiento al menos una vez en los períodos de tiempo observados (es decir, individuos con {0 < ∑T Dit < T }).
prestada
uno de los
la tg
erminología
rupos tratados
introducida
esta suposición solo requiere que algunos individuos, no todos, se muevan.
y no tratados
por Chamberlain
en cada periodo
(1982).
de
Etiempo.
l supuesto
Tenga
2.3 egn
arantiza
cuenta lqa
El último supuesto requiere que, en la subpoblación de los que se mudan, las variables en Zit sean estrictamente exógenas y estén
correlacionadas con los efectos fijos no observados condicionados a la asignación del tratamiento. Zit satisface la siguiente suposición:
Además, debido a que tanto Xit como Ci deberían afectar la asignación del tratamiento, es probable que se correlacionen entre sí después de
ue
Supuesto 2.4. Para cualquier = 0, 1, k = 0, 1, s = 1, ... , T y t = 1, ... , T; (i) E [ Zituk is|Dit = , Dis = k, 0 < ∑T Dit < T ] = 0, (ii) rango (∑T t=1 E t=1
[( 1, Z′ Dit < T ]) = 2 . él )′ (1, Ci)|Dit =
Para motores, el Supuesto 2.4 (i) requiere que Zit sea ortogonal a uk
, 0 < ∑T t=1
es
condicionado a las asignaciones de tratamiento en
cualquier par de períodos s y t; El supuesto 2.4 (ii) requiere que Zit esté correlacionado con los efectos fijos condicionados a la asignación del
tratamiento en el período t.
En la práctica, encontrar Zit que satisfaga el Supuesto 2.4 no suele ser muy difícil. Es probable que algunas o todas las variables incluidas en Xit
satisfagan el Supuesto 2.4 y pueden incluirse en Zit. El supuesto 2.2 implica que las variables en Xit satisfacen la condición (i) del supuesto 2.4.4
condicionar la asignación del tratamiento, incluso si no lo están. incondicionalmente correlacionados entre sí.5 Un caso excepcional en el que Zit =
Xit no funciona es cuando Xit no está incondicionalmente correlacionado con Ci y, además, no afecta la asignación del tratamiento. En este caso, Xit
no está correlacionado con Ci ni siquiera condicionado a Dit (no cumple la condición (ii)).
También tenemos a menudo algunas variables que están incondicionalmente correlacionadas con Ci. Por ejemplo, si Ci es la capacidad no
observada del individuo, los años de educación deben correlacionarse con Ci y, por lo tanto, pueden incluirse en Zit. Finalmente, aunque Zit tiene el
subíndice t, las variables exógenas invariantes en el tiempo también se pueden incluir en Zit para cualquier t = 1, … , T.
Observación 2.1 (Relación con el modelo de datos del panel CRC). La regla de observación, Yit = DitYit(1)+(1− Dit)Yit(0), transforma el modelo
de resultado potencial (1) y (2) en el siguiente modelo de datos de panel CRC:
it( donde (Ci) = ( 1 0 ) +−( 1−1)Ci, C̃i = 0+Ci,
la correlación
Yit = TuYit(1)+(1 − Tu)Yit(0)
= X′
y uit = Daitu1
coeficiente
él
leatorio
0
+ (Ci)Dit + DitX′
it+(1−Dit)u0 (Ci) es el Parcial Mél.

− 0), identificando
comió
necesario identificar el ATE. Sin embargo, el enfoque dentro del grupo = E[ (Ci)]
+ E[Salir]
generalizado
′
1 − 0
) + C̃i + apagado,
edio en este modelo. Debido a que el ATE se
de uso c(omún
1 expresa
puede cidentificar
omo Efecto
el A
(APE)
PE solo
de D
para
subpoblación de motores; por lo tanto, este enfoque puede identificar la ATE solo para los motores. Bajo las especificaciones (1) y (2), el
enfoque propuesto en la siguiente sección puede identificar y estimar la ATE para toda la población.
it, El[ (Ci)],
a
Observación 2.2 (Relación con el modelo de datos del panel de efectos fijos lineales). El modelo de resultado potencial (1) y (2) anida el modelo
1
es
SAKAGUCHI
de datos de panel de efectos fijos lineales estándar. Cuando = 1, el resultado
observado se expresa de la siguiente manera:
0 −
Yit = X′ él + ( 1 − 0 ) + C̃i + apagado. (3)
0 ) It + ItX′ it ( 1
comió −
Esto corresponde al modelo estándar de datos del panel de efectos fijos lineales. La ATE es = ( 1 0 ) y no
0 )
depende
+E[Salir]
d′
e C i. E−n
( 1
este caso, podemos identificar el ATE por el enfoque habitual de efectos fijos o por el enfoque propuesto.
4Esto se debe a que el Supuesto 2.2 es equivalente a E [ u it|Di1, … , DiT, Xi1, … , XiT, Ci ] = 0 para todo = 0, 1 y t = 1, … , T, que es una condición suficiente
para condición (i) en el Supuesto 2.4 cuando Zit = Xit.
5Para ilustrar esta afirmación con un ejemplo, suponga que Dit denota participación en capacitación laboral, Ci es habilidad individual y Xit es edad individual. Supongamos además que
individuos de baja edad y poca habilidad tienden a participar en la capacitación. En este caso, después de condicionar la participación en la capacitación (Dit), la edad (Xit) se correlaciona
con la habilidad (Ci), porque es probable que los individuos que participan en la capacitación sean jóvenes y tengan poca habilidad.
y viceversa.
3
12 SAKAGUCHI
3 IDENTIFICACIÓN Y ESTIMACIÓN
Esta sección describe primero el enfoque de identificación. Posteriormente, en la Sección 3.2, se propone la estimación GMM de
los parámetros identificados.
3.1 Identificación
Esta sección describe la identificación de
describen los pasos del
Primer paso
i
procedimiento de identificación.
comió
En el primer paso identificamos
Vamos _
= ( 1∕ ∑T
función indicadora. 1 ( _
t=1 1{It = } ) ∑T
i i
1
cada uno = 0, 1 y el individuo i con ∑T los
Esta suposición requiere que E [∑T t=1
t=1
Suponemos aquí que se cumple la siguiente suposición.
él
t=1
períodos de tiempo observados), adoptamos la convención de que Ā
entre períodos tratados y no tratados.
′
él
comió ,con base en las ecuaciones de resultados potenciales (1) y (2) y los supuestos
descritos en la sección anterior y más adelante. El argumento de la identificación procede en tres pasos. En el primer paso, tenemos
1 y
identificamos
F0inalmente,
. Luego, identificamos
identificamos
la
crombinando
elación de tlérminos
os datos
doe
bservados
efectos fijos
con
+ ü
eso
entre
los plas
arámetros
dos funciones
él
identificados.
de regresión,
A continuación
i
es decir, s1e
.
y 0 basado en la idea del método de transformación interna utilizado en el enfoque FE.
1 {Dit = } Ait y Ä = Ait − à para cualquier variable Ait y = 0, 1, donde 1{∙} es el
0 ) es la media de Ait para el individuo i a lo largo de los períodos de tiempo en los que recibe tratamiento (no recibe tratamiento). Para
1{Dit = } = 0 (es decir, el individuo que siempre es tratado o nunca tratado a través de
= 0. Esta transformación es una especie de transformación interna
Supuesto 3.1. Para cada = 0, 1, rango ( E [∑T t=1 1{Dit = } ∙ it
1{It = } ∙ it
él
′
′
it ]) = K. it ]
es de rango completo para = 0, 1. Implícitamente asegura la presencia
de individuos que son tratados en al menos dos periodos de tiempo y de individuos que no son tratados en al menos dos
periodos de tiempo.6 Para cada uno de los individuos tratados y no tratados en el periodo t (los individuos con Dit = 1 y Dit = 0,
respectivamente) , tenemos el siguiente modelo transformado:
Ÿ = para = 0, 1 y t = 1, … , T,
donde el término de efectos fijos ha sido diferenciado por la transformación interna. Luego, a partir del modelo transformado
anterior y bajo los Supuestos 2.1, 2.2 y 3.1, podemos identificar ( = 0, 1) de la siguiente manera:
= mi [ ∑t=1
T
1{It = } ∙ it
′
es ]−1 mi [ ∑
T
t=1 1{Esto = } ∙ es eso]
Esta identificación es similar a la identificación en el modelo de datos de panel de efectos fijos lineales estándar
.
319
(4)
por la transformación interna. Tenga en cuenta que esta identificación se basa en la condición de ortogonalidad:
mi [∑T t=1 itu ′ él |Di1, … , DiT] = 0, que se deriva del Supuesto 2.2.
La siguiente proposición formaliza el resultado de la identificación en este paso.
Proposición 3.1. Bajo los Supuestos 2.1, 2.2 y 3.1, ( = 0, 1) se identifica como (4).
Se proporciona una prueba en el Apéndice en línea.
6La razón es la siguiente. Por la definición de 1 it, 1{Dit = 1} ∙ 1 = 0 y 1{Dit = 0} ∙ 0 = 0 se mantienen en cualquier período t para personas que han recibido

él él
tratamiento menos de dos veces y personas que han experimentado sin tratamiento menos de dos veces, respectivamente. Por lo tanto, la condición de rango en el
Supuesto 3.1 no se cumple si ningún individuo ha experimentado tratamiento o ningún tratamiento al menos dos veces.
3
12 320
Segundo paso
A continuación, identificamos la razón de los términos de efectos fijos escalares, 1, y los términos constantes transformados, ̃ 1 y ̃ 0, definidos
ecuaciones para motores:
1 Aquí, i 1 ( 1) (
donde ̃ 0 ≡
restringimos 1
0
0
yo
≠ 0.
yo
− 1
1
las siguientes condiciones de momento:
1
yo
(
1
1
) _
y ũ eso0 ≡ u0
Ahora consideramos identificar ̃ 1, ̃ 0, y en las
por lo tanto, están correlacionados con
∑
∑
1
yo
i
1 X 1′
i
es la razón por la que nos enfocamos en la subpoblación de motores en este paso.
él
−
1 =
1
1
(i) y está correlacionado con Ci bajo el Supuesto 2.4 (ii).9 1 y 0 ya están identificados,
los parámetros
por De
t=1
t=1
T
̃ 1d,
la ̃ 0 y 1a
iscusión snterior,
on identificado
dado que
mi [ ( 1, Z′ it)′ ( Yit(1) −
mi [ ( 1, Z′ it)′ ( Yit(0) −
1
cofre yo
1
+
Luego, en cada período t, dividimos la subpoblación de personas que se mudan en grupos tratados y no tratados:
{ It = 1, ∑T
{ It = 1, ∑T
donde ̃ 1 ≡
t=1
t=1
Dit ≠ T } y { Dit = 0, ∑T
Dit T } ,
1− 1 0 y ũ
motores en el grupo no tratado { Dit = 0, ∑T
función de regresión para Yit(0):
1
él
≡ u1 it−
Yt(0) =
t=1
Yt(1) =
1
t=1 Dit < T } ),
abajo. La identificación en este paso se basa en la subpoblación de personas que se mudan (es decir, individuos con { 0 < ∑T
cuya existencia está asegurada bajo el Supuesto 2.3. Una vez 1 y 0 se identifican en el paso anterior, tenemos lo siguiente
Ci + u 1
i
. Tenga en cuenta que si 1 = 0, 1∕
̃ 1
̃ 0
− X′
− X′
eso
él
y
( 0)) es igual a la suma del término constante ( 0), el 1término de efectos fijos 1Ci (Ci) y la perturbación ). Las dos
término ū (d 0 ecuaciones anteriores no son triviales solo para motores. Para los que no se mueven, uno de ellos degenera a cero.7 Esto
i i
él
funciones de regresión transformadas (5) y (6), pero una identificación ( 0) y ( 1)
aquí surge el problema. En (5) y (6), y, son endógenas porque incluyen términos de perturbación ūi0 y ūi1
0
1
it ii t,0 respectivamente. Para hacer frente a este problema de endogeneidad, utilizamos la vari exógena
1 y ũ
yo
ũables en Zit que satisfacen las condiciones del Supuesto 2.4. Bajo este supuesto, podemos usar Zit como un vector de variables
instrumentales bajo eyl Supuesto
( 0) 0
2.4
porque, en los supuestos subgrupos, Zit es exógeno a ũ 1 0 y ũ
( 1), 1
1 −
0 −
1 0
1
1
1
yo(
1
yo
(
yo
1
yo
0
0
1
(
(
0
) ) |It = 1, ∑
0′ ) ≡ 0 − X
Dit ≠ 0 } , respectivamente.8 Para los motores en el grupo tratado
podemos volver a expresar la función de regresión para Yit(1) de la siguiente manera:
̃ 1
1u 0 . Esta ecuación se obtiene reemplazando Ci con
i
t=1
+ X′
Dit ≠ 0 } , reemplazando Ci con
̃ 0
+ X′
él
1
0
+
+
1
1 0
yo(
0
) +
1
) +
) ) |It = 0, ∑
1
él,
0
él,
i
yo
1

i
0 =
en (6) no toma un valor finito. Esta es la razón
t=1
t=1
T
0
yo
Dit T ] = 0,
él
Es ≠ 0 ] = 0.
0
+ Ci + ū
él
0
yo _
SAKAGUCHI
( 0) en la ecuación (1). De manera
similar, para ( 1) en la ecuación (2), tenemos lo siguiente
(5)
(6)
(7)
(8)
Los primeros componentes de las condiciones de momento (7) y (8) se derivan de la condición de exogeneidad: ∑T E [ u it|Di1, … ,
DiT]
t=1 =condiciones
0, que se cumple
bajo el S
de momento, Zupuesto 2.2.
it funciona Los udn
como emás se
dde
vector erivan
de la condición
instrumentos oirtogonal
que son del Spupuesto
dentificados 2.4 (i). En dee
or las condiciones stas
momento
10 ̃ 1
(7) y (8), respectivamente, y A continuación se formaliza el resultado de la identificación en este paso. ( 0) y es ( 1). y ̃ 0 0 1
yo yo
1
identificado por ambos.
7La razón es la siguiente. Para el individuo i que nunca recibe tratamiento, ( 0) 1
( 1) degenera a cero porque 1 = 0 y X 1 = 0 por definición. Del mismo modo, para
yo i i
individuo i que siempre es tratado, degenera a cero.
0
yo
t=1 Eso ≤ T } = { Eso = 1, ∑T
8Observe que { Dit = 1, 0 ≤ ∑T t=1 Dit ≠ T } y { Dit = 0, 0 ≤ ∑T t=1 Eso ≤ T } = { Eso = 0, ∑T t=1 Este ≠ 0 } .
9ūi1 en ( 1) y ūi0 en
1
( 0) se puede ver como errores de medición para 1 + 1Ci y 0
0
+ Ci, respectivamente. En esta vista, las variables en Zit funcionan como
yo yo
instrumentos para hacer frente a los errores de medición.
10Podemos usar Zit que constan de algunas o todas las variables en Xit, aunque Xit ya se haya usado en el primer paso de la identificación, porque usamos diferentes subpoblaciones,
motores, en este paso.
3
12 SAKAGUCHI
Proposición 3.2. Supongamos
Tercer paso
comió
0 y
identificado por las condiciones de momento (7) y (8).
=E[Yit(1)] − E[Yit(0)]
=E [ Tu { Yit − ( ̃ 0
Proposición 3.3. Supongamos que y ̃ para = 0, 1 y para
comió
t = 1, … , T se identifica como (11).
( Se identifican los supuestos 2.1–2.4 y 3.1.
no incluir términos constantes, explique
son e1sto,
y 0,
1 , ... ,
1 ya están identificados. Entonces, bajo los Supuestos 2.12.4,
Finalmente podemos identificar E[Yit(1)] y E[Yit(0)], de la siguiente manera:
E [Yit(1)] = E [ DitYit + (1 − Dit) ( ̃ 1 + X′ él
E [Yit(0)] = E [ (1 − Tu) Yit + Tu ( ̃ 0
+ X′
El siguiente teorema resume el resultado de la identificación completa.
Teorema 3.1. Dejar ′
≡ 1′, 0′, ̃ 0, ̃ 1, 1, comió
él
0 +
La siguiente proposición formaliza el resultado de la identificación en este paso.
1
1
1
yo
Se omite una prueba ya que el resultado obviamente se sigue de las Proposiciones 3.1–3.3.
Las siguientes son algunas observaciones sobre el resultado de la identificación.
sruponga
espectivamente,
aquí que e
las
l pp
rocedimiento
osibles ecuaciones
( 1
+ X′
donde las ecuaciones se cumplen bajo el Supuesto 2.2. En la ecuación (9), predecimos Yit(1) para individuos que no son tratados en
t mediante la combinación de Xit y e( 0)
con los
l método parámetros
(ver,
yo
0
identificados.
por ejemplo, Esto
Wooldridge se bSasa
2010, en la
ección idea del
21.3.2). período
En de ajuste
la ecuación
mismo método a los individuos tratados en el período t, predecimos sus resultados potenciales no observados Yit(0).
En consecuencia, bajo el Supuesto 2.2, podemos identificar
comió ,
dae
(10),
) )} + (1 − Eso) {( ̃ 1
t ) .
comió
de identificación
Yit(1) = X′
Yit(0) = X′
1
él
la regresión
plicando
como sigue:
el
0 +
1
+
1
1 0
+ X′
yo
1
yo
él
(
(
0
1 +
) )],
) )] ,
ya están identificados. Entonces, bajo los Supuestos 2.1 y 2.2,
Supongamos el modelo de resultado potencial (1) y (2). Entonces, bajo
Observación 3.1 (Modelo de resultado potencial sin términos constantes). Cuando las ecuaciones de resultado potencial (1) y (2)
de resultado
no rsequiere
él
él
on las seiguientes:
1 +
0
1
l uso de Zit. Para
c + u1
+ Ci + u0 él,
él,
1 0
yo
( 0
1
y ̃ ( = 0, 1) son
) ) − Yit} ] .
(9)
(10)
(11)
321
donde u1 y tu0 se definen como en la Sección 2. Estas ecuaciones no tienen los términos constantes. Bajo este modelo y

él él
los supuestos mantenidos, ( = 0, 1) puede identificarse como (4), como en el primer paso del procedimiento de identificación.
Para el segundo paso, no necesitamos identificar los términos constantes transformados ̃ ( = 0, 1) en este caso, porque las
ecuaciones transformadas (5) y (6) en este caso no contienen estos términos. Por lo tanto, solo necesitamos identificar la razón
de los efectos fijos 1 en e ste pZaso.
usar Ela
it, de n saiguiente
usencia m
de
los términos constantes, se sigue para motores que se pueden
anera: identificar,
= 1Ci + sū in 1
( 1) 1
i
y ( 0) = Ci + ū
yo
0 0 . Entonces, 1
yo i
T T
i ( 1)|0 < ∑
y [ 1 t=1 Dit < T ] = 1E [ Ci|0 < ∑t=1 Dit < T ]
= 1 ,
T T
i ( 0)|0 < ∑
y [ 0 t=1 Dit < T ] Y [ Ci|0 < ∑t=1 Dit < T ]
3
12 322
donde la primera igualdad se sigue del Supuesto 2.2. La ATE se puede identificar de la misma forma que en el tercer paso.
Observación 3.2 (Efecto del tratamiento invariante en el tiempo). Cuando Xit no induce variación en el tiempo en el ATE, el ATE 1 y 0 se
3.2 Estimación
comió
donde Wi = ({ Yit, Dit, X′
=
1
T
T ∑ E [ Tu { Yit − ( ̃ 0
t=1
g1 (Wi, ) = ∑
g2(Wi, ) =∑
g3(Wi, ) = ∑
g4 (Wi, ) = ∑
t=1
T
t=1
T
t=1
t=1
+ X′él
esto ∙ 1 it ( Ÿ
1 { Eso = 1, ∑
1 { It = 0, ∑
g5(Wi, ) =Di1 { Yi1 − ( ̃ 0 ) )}
él, CON'
él1
− (1 − Di1) { ( ̃ 1 + X′i1
g4+T(Wi, ) =DiT { YiT − ( ˜
− (1 − DiT) {( ̃ 1 + X′él
0 +
(1 − Esto) ∙ 0 l( 0
o 0 ) ,
él
t=1
t=1
+ X′i1
vuelven invariantes
cuando E [Xit] es invariable en el tiempo o son equivalentes. En lugar de (11), el ATE invariable
1
1
él 1 ) ,
− 0′
él
1
yo
(
ecn
eidentificar
En este caso, se reducen los números de momentos y parámetros a estimar, lo que podría disminuir las varianzas
de los estimadores.
e
dl
n el tiempo,
omo tiempo. pEor
enotado
Dit ≠ T } ∙ ( 1, Z′ it)′ ( Yit −
Dit ≠ 0 } ∙ ( 1, Z′ it)′ ( Yit −
+ X′él 0 +
0
+
1 +
+
él t=1 )′ . g1(Wi, ) y g2(Wi, ) son las funciones de momento para estimar }T
1
1
1
1
1
yo
1 0
yo(
1 0
yo(
(
1
yo
(
sto
1 y 0, respectivamente,
que se derivan del primer paso del procedimiento de identificación. g3(Wi, ) y g4(Wi, ) son las funciones de momento para estimar
sucede
ate,
se puede
) )} + (1 − Eso) {( ̃ 1
Sobre la base del procedimiento de identificación, el vector de parámetros puede ser estimado por GMM. El estimador GMM de se
construye a partir del vector de funciones de momento de la siguiente manera:
− 1′
) ) − Este1 } −
̃ 1, ̃ 0 y 1, que son análogas a las condiciones de momento (7) y (8), respectivamente. Para cada t = 1, … , T, por la predicción,
) )}
) ) − YiT} −
̃ 1
̃ 0
+ X′él
− Xél′ 1 −
− Xél′ 0
comió 1 ,
comió
T ,
1
−
+
1 0
1 0
1
1
yo(
yo(
1
yo
(
0
0
) ) − Yit} ]
) ) ,
) ) ,
.
SAKAGUCHI
comió
momento para estimar funciones de momento que puede que se deriva
modificarse de la ecuación
fácilmente (11).
para los El anterior
casos g4+t(Wi, )
considerados en leas
s lO
a bservaciones
función de
3.1 y 3.2. = 1 o no. En nuestra especificación, esto es equivalente a una prueba de si la heterogeneidad del efecto del tratamiento
1
En el marco GMM, también podemos probar si depende de efectos fijos no observados. Podríamos aplicar pruebas
basadas en GMM para la hipótesis nula: = 1. Si la hipótesis nula es correcta, podemos usar el estimador de efectos fijos habitual
1
para estimar el ATE.
4 SIMULACIÓN DE MONTE CARLO
En esta sección, llevamos a cabo un experimento de Monte Carlo para estudiar el comportamiento de muestra finita del estimador propuesto.
En el Apéndice en línea se realizan algunos experimentos de Monte Carlo adicionales. Aquí consideramos dos tipos de procesos de
generación de datos (DGP), DGP1 y DGP2, que consisten en diferentes modelos de resultados y un mismo modelo de asignación de tratamiento.
3
12 SAKAGUCHI
con T = 2. Los modelos de resultados son los siguientes: Para t = 1, 2,
dónde 1
= 1 en DGP1 y 1
i1
tu0
i2
En 1
i2
exógena satisface las condiciones del Supuesto 2.4.
′
se
En ambos DGP, (Xi1,1, Xi2,1, Ci) desviación estándar 1, e
Yit = { 2 +1
y xtraen
H+it,1
covarianzas
extraen de las siguientes distribuciones normales multivariadas:
′
2 H−it,
de upna
or pd
, donde
variable de media cero. Además, establecemos una variable exógena Wit célomo
01.5Hit,2
,
+ 0.5 H+it,
istribución
ares

Wit (= UW

+ u, W
Ci i1
C2i
normal
0,3; (Xi1,2,
+
covarianza
i2u)′
W sve
+ 1uCi
0,5 1
ariable
extrae
0 + u1
m1ultivariante
Xi2,2) (1,
por cpon
dares
e d
con
.5) Los términos

uesviación
na
0.3.
mpedia
de
distribución
i1
afuera
él
él
(1, 1.5,
erturbación
′se extraen de una distribución normal multivariante con media
, desviación estándar 1 y covarianza por pares 0,3. Nótese aquí que Xit,1 está correlacionado con Ci mientras que Xit,2 no lo está. El

i1
u0
En 1

N 0
0
0
1 0,5 0,3 0,2 1
0,2 0,3 1

si Dit = 0 de
lo contrario ,
= 3 en DGP2. El modelo de asignación de tratamiento es Dti = 1 { −2 − Xit,1 + Xit,2 + Ci + uD para t = 1, 2él. ≥ 0 }
′
se 1) , Stan
, ( ud i2 ) N (( 0 0 ) ,
Esta evstándar
ariable
Se deben hacer dos comentarios sobre los DGP. Primero, la diferencia entre DGP1 y DGP2 está en los coeficientes para Ci en las
En esta simulación, comparamos el estimador GMM de dos pasos eficiente derivado del procedimiento de identificación propuesto con
normal
ecuaciones de resultado. Mientras que DGP1 tiene los mismos coeficientes para Ci en las ecuaciones de resultado tratadas y no tratadas,
1 y
DGP2 tiene diferentes coeficientes entre ellas. Por lo tanto, la heterogeneidad del efecto del tratamiento no depende de Ci en DGP1, pero
sí en DGP2. En segundo lugar, cada una de las tres variables Wit, Xit,1 y Xit,2 pueden usarse como una variable exógena en Zit, cuyo
papel se describe en la Sección 3, porque satisfacen las condiciones del Supuesto 2.4. Wit y Xit,1 están incondicionalmente correlacionados
con Ci, mientras que Xit,2 no lo está. Pero Xit,2 se correlaciona con Ci después del condicionamiento en Dit.
el estimador OLS y el estimador FE en DGP1 y DGP2. Los parámetros de interés son los ATE en los periodos 1 y 2. En DGP1, los valores
verdaderos de los ATE en los periodos 1 y 2 son 1 y 2, respectivamente; en el DGP 2, los valores reales de los ATE en los periodos 1 y 2
son 3 y 4, respectivamente. Para el estimador propuesto, usamos cinco conjuntos diferentes de Zit: {Wit}, {Xit,1}, {Xit,2}, {Xit,1, Xit,2} y {Wit,
Xit,1, Xit,2 }. El cuarto conjunto utiliza todas las variables exógenas que se incluyen en el modelo de resultado potencial; el último conjunto
utiliza todas las variables exógenas. En ambos DGP, las proporciones de personas que se mudan, personas siempre tratadas y personas
nunca tratadas son de aproximadamente 31,7 %, 13,5 % y 54,8 %, respectivamente.
( 1 0.3 1 ))
La Tabla 1 informa los resultados de 1000 simulaciones con tamaños de muestra N = 200, 500 y 800. Los paneles I y II de la Tabla 1 informan los
resultados de la simulación para DGP1 y DGP2, respectivamente. Vale la pena señalar varios hallazgos. Primero, el estimador OLS está severamente
sesgado tanto en DGP1 como en DGP2 debido a la presencia de efectos fijos no observados. En segundo lugar, el estimador FE no está sesgado en
DGP1, mientras que está sesgado en DGP2. Esto se debe a que la heterogeneidad del efecto del tratamiento depende de efectos fijos no observados
en DGP2. En tercer lugar, tanto en DGP1 como en DGP2, el estimador propuesto tiene poco sesgo, independientemente del tipo de Zit.
En cuarto lugar, incluso en DGP1, donde el estimador FE es consistente, el rendimiento del estimador propuesto es compatible con el del estimador FE
en términos de RMSE. En quinto lugar, al comparar los diferentes conjuntos de Zit, el estimador propuesto tiene RMSE más pequeños cuando Zit
consiste en Xit,1 y/o Xit,2 que cuando Zit consiste solo en Wit en ambos DGP. En el Apéndice en línea, se proporcionan resultados de simulación
adicionales, donde evaluamos el comportamiento de la muestra finita en tres casos: (i) la fracción de elementos móviles es pequeña, (ii) es cercana a
323
1
cero y (iii) T es grande .
5 APLICACIÓN EMPÍRICA
En esta sección, aplico el enfoque propuesto para estudiar el impacto del tabaquismo de una madre durante el embarazo en el peso al nacer de su hijo
y su heterogeneidad. Son muchos los trabajos que estudian el efecto del tabaquismo medio y su heterogeneidad bajo varios supuestos identificativos y
de forma funcional (p. ej., Abrevaya, 2006; Veiga & Wilder, 2008; Walker et al., 2009; Abrevaya et al., 2015; Lee et al. ., 2017). Walker et al. (2009)
examinan la diferencia en el efecto promedio de fumar entre madres adolescentes y madres adultas. Abrevaya et al. (2015) y Lee et al. (2017) examinan
la heterogeneidad del efecto del tabaquismo promedio en función de la edad de la madre en su aplicación.
El análisis utiliza el conjunto de datos de panel emparejado construido por Abrevaya (2006) a partir de los conjuntos de datos de natalidad de EE.
UU. para 1990–1998. Debido a que el conjunto de datos original no tiene identificadores únicos para las madres, comparó cuidadosamente las madres con
3
12 324
TABLA 1 Resultados de la simulación Monte Carlo
MCO
FE
Estimador propuesto (1)
(2) (3) (4) (5)
ATE para el 2do período
MCO
FE
(2) (3) (4) (5)
1
1
1
1
1
1
2
2
2
2
2
2
2
0.015 0.258
0,025 0,195
0,023 0,190
0.038 0.177
0,034 0,180
0,036 0,184
1.157
0,008 0,265
0.041
0.027 0.191
0.040 0.198
0.031
0.031
Panel II: Resultados de la simulación para DGP2
ATE para el 1er período
MCO
FE
(2) (3) (4) (5)
ATE para el 2do período
MCO
FE
(2) (3) (4) (5)
3
3
3
3
3
3
3
4
4
4
4
4
4
4
2.833 0.463
0.921
0,092 0,310
0.081
0,085 0,285
0.071
0,074 0,317
2.863 0.471
0,938 0,387
0,106 0,324
0,085 0,320
0.092 0.299
0,079 0,326
0,078 0,331
N=200
Valor verdadero Sesgo SD RMSE Sesgo SD RMSE Sesgo SD RMSE
Panel I: Resultados de la simulación para DGP1
ATE para el 1er período
1 1.147 0.257
0.255
0.203
0.194
0.196
0.378
0.287
0.295
1.175
0.258
0.196
0.192
0.181
0.183
0.187
1.184
0.265
0.207
0.193
0.201
0.196
0.198
2.881
0.996
0.323
0.298
0.297
0.304
0.326
2.901
1.015
0.341
0.331
0.313
0.335
0.339
1.173 0.166
0,008 0,167
0.034 0.130
0,030 0,126
0.042 0.117
0.037 0.118
0,035 0,123
1.169 0.160
0,004 0,169
0,044 0,132
0.032 0.131
0,048 0,122
0,037 0,125
0.036 0.129
2.881 0.300
0,953 0,247
0,076 0,203
0,077 0,192
0,077 0,182
0,072 0,197
0,068 0,215
2.882 0.290
0,949 0,232
0,082 0,214
0,076 0,212
0,083 0,195
0,069 0,212
0,070 0,223
N=500
1.184
0.167
0.134
0.129
0.124
0.123
0.128
1.180
0.169
0.140
0.134
0.131
0.130
0.134
2.897
0.984
0.217
0.207
0.197
0.210
0.225
2.897
0.977
0.229
0.225
0.211
0.223
0.234
1.162
0.004 0.134
0,255 0,107
0.021 0.099
0,037 0,092
0.028 0.093
0.025 0.098
1.162
0.002 0.132
0.041 0.111
0.025 0.100
0.045 0.097
0.029 0.098
0,028 0,102
2.882
0,954 0,186
0,061 0,169
0,062 0,155
0,069 0,146
0,065 0,153
0,061 0,174
2.881
0,953 0,189
0,071 0,176
0,066 0,171
0,075 0,159
0,069 0,167
0,064 0,181
N=800
0.130
0.131
0.229
0.221
SAKAGUCHI
1.170
0.134
0.110
0.101
0.099
0.097
0.101
1.169
0.132
0.118
0.103
0.107
0.102
0.106
2.891
0.972
0.180
0.167
0.161
0.166
0.184
2.890
0.972
0.190
0.183
0.176
0.181
0.192
Nota: El valor verdadero es el valor verdadero del ATE. El sesgo, SD y RMSE son el sesgo medio, la desviación estándar y el error cuadrático medio de
las estimaciones en las simulaciones, respectivamente. Para el estimador propuesto, las filas (1), (2), (3), (4) y (5) informan los resultados del estimador
propuesto cuando Zit es {Wit}, { Xit , 1}, {Xit, 2}, {Xit,1, Xit,2} y {Wit, Xit,1, Xit,2}, respectivamente.
niños basados principalmente en pares del estado de nacimiento del niño y el estado de nacimiento de la madre, que tienen un
pequeño número de observaciones, y luego construyeron el conjunto de datos de panel combinado. Selecciono “panel emparejado n.
° 3”, porque es el construido de manera más conservadora. El mismo conjunto de datos también es analizado por Arellano y
Bonhomme (2012) utilizando el modelo de datos de panel CRC, y por Jun et al. (2016) utilizando un modelo de datos de panel no
separable. Debido a que el número de nacimientos en el conjunto de datos original es diferente entre las madres, me enfoco en las
madres que tuvieron tres hijos durante el período observado. La muestra final contiene 12.360 madres. Entre ellas, 1.349 madres
fumaban durante su primer embarazo, 1.371 madres fumaban durante su segundo embarazo y 1.437 madres fumaban durante su
tercer embarazo. El ratio de móviles en la muestra es del 11,7%.
Usando esta muestra, estimo el efecto promedio del tabaquismo de una madre durante el embarazo en el peso de su hijo al nacer
en cada nacimiento usando el modelo de resultado potencial (1) y (2). En el modelo, Dit es un indicador del tabaquismo de una madre,
donde Dit = 1 indica que iésima madre fumó durante el embarazo para su tésimo nacimiento y Dit = 0 indica lo contrario.
Los posibles resultados Yit(1) y Yit(0) son el peso del niño al nacer para el enésimo nacimiento de la i ésima madre si fumaba y
3
12 SAKAGUCHI
Variables
Masculino
Edad
Edad2
Índice de Kessner = 2
Índice de Kessner = 3
Sin visita prenatal
Segundo hijo
tercer hijo
̃ 1
̃ 0
1
(14,82)
231,90
(2.18)
4.00
(0.07)
45.49
(27.62)
169.53
(41.72)
147.71
(61.03)
Primera visita prenatal en 2º trimestre 43,61 (28,92)
Primera visita prenatal en 3er trimestre 200.39 (52.00)
6.54
(15,73)
72,97
(17,16)
28,96
(16.92)
0.30
(0.05)
Nota: Los errores estándar robustos se presentan entre paréntesis.
Estimados
Ecuación (5) Ecuación (6) Diferencias ( 134.39 6.88
141.27
(4.64)
222.78
(1,68)
3,55
(0.06)
61.99
(9.80)
162.72
(24.45)
23.11
(47.86)
79.93
(11.84)
163.00
(30.18)
29.76
(6.06)
27.05
(10.28)
18.69
(17.77)
(15.50)
9.13
(2,78)
0,45
(0,09)
16,50
(29.22)
6.81
(48.67)
170.82
(78.04)
36.32
(31.40)
37.39
(60.21)
36.30
(16.89)
100.02
(20.08)
1
− 0)
las ecuaciones (5) y (6)
no fumar durante el embarazo, respectivamente. Xit incluye la edad de la madre en el momento del parto, el sexo del niño, variables ficticias
325
TABLA 2 Estimaciones de parámetros en
para tiempos de nacimiento, variables ficticias que indican la existencia de visitas prenatales y el valor del índice "Kessner" para la calidad de la
atención prenatal. (para más detalles, véase Abrevaya, 2006). Se supone que los efectos fijos no observados Ci representan el factor de estilo
de vida relacionado con la salud de la madre (Jun et al., 2016, p.307). Bajo el modelo de resultado potencial (1) y (2), permitimos que la
heterogeneidad del efecto de fumar dependa de las características observadas y no observadas. Tenga en cuenta, sin embargo, que nuestro
modelo todavía no puede tratar con algunos problemas de identificación señalados por Abrevaya (2006, Sección 5) (p. ej., efecto de
retroalimentación de un resultado de nacimiento anterior y cambios correlacionados en el comportamiento materno).
Para aplicar el estimador propuesto, queremos variables exógenas Zit que satisfagan las condiciones del Supuesto 2.4. Utilizo tres conjuntos
de variables exógenas para Zit: la edad de la madre en su enésimo nacimiento, los años de educación de la madre y ambos. La edad ya está
incluida en Xit, mientras que la educación no. Recuerda que podemos usar variables incluidas en Xit para Zit.
Es probable que ambas variables estén incondicionalmente correlacionadas con efectos fijos no observados, porque es probable que la decisión
de una mujer sobre el momento del parto dependa de sus factores de estilo de vida no observados y los factores de estilo de vida deberían estar
asociados con su edad y educación, respectivamente. Incluso si no están incondicionalmente correlacionados con los efectos fijos, deberían
correlacionarse después del condicionamiento sobre el indicador de tabaquismo. También suponemos que no están correlacionados con los
términos de error porque controlamos por un conjunto suficiente de observables y efectos fijos no observados.
La Tabla 2 presenta los resultados de la estimación de los parámetros de los coeficientes en las ecuaciones de resultado potencial
1
heterogeneidad y (6), así como las diferencias entre ellos para las ecuaciones (6) y (5) (es decir ,
d
transformadas
el efecto de fumar
(5) −
d0ependiendo
), que indican
de
la
las
covariables observadas. Aquí, apliqué el estimador GMM de dos pasos eficiente usando la edad y los años de educación como un conjunto de
Zit. El resultado no varía tanto cuando se usan diferentes Zit. El efecto de el tabaquismo es significativamente mayor para el segundo y tercer
parto y para las madres sin control prenatal, y cambia cuadráticamente con respecto a la edad Todas las variables, excepto sin control prenatal,
primera control en el tercer trimestre, segundo hijo y tercer hijo, tienen los mismos signos de las estimaciones de diferencia que los resultados de
Abrevaya (2006, Tabla VII). Nótese que Abrevaya (2006) no considera el efecto de interacción del tabaquismo con cada fecha de nacimiento. La
estimación significativa de indica la presencia de la heterogeneidad del efecto del tabaquismo que depende de efectos fijos no observados.
1
3
12 326
TABLA 3 Estimaciones del efecto promedio del
tabaquismo de la madre durante el embarazo
sobre el peso de su hijo al nacer Efecto promedio (primer nacimiento)
Efecto promedio (segundo nacimiento)
Efecto medio (tercer nacimiento)
FE Estimator
121.47
(15,56)
76,21
(17.11)
128.17
(15.93)
Efecto medio (invariante en el tiempo) 244,23
(11,12)
(2) 154,84 219,68
(17,18) (38,63)
216,96 300,42
(16,73) (49,56)
324,88 403,12
(15,92) (47,31)
216,14 217,87
(22.68) (18.22)
SAKAGUCHI
(3)
147,40
(16.27)
214.05
(15,83)
319,94
(15.42)
189.36
(11.77)
Nota: Los errores estándar robustos se presentan entre paréntesis. Para el Estimador Propuesto, las columnas
(1), (2) y (3) reportan los resultados del estimador propuesto utilizando la edad, la educación y ambas para Zit,
respectivamente.
La Tabla 3 presenta los resultados de la estimación del efecto del tabaquismo promedio utilizando el estimador propuesto y el estimador FE.
Para el estimador FE, utilizo un modelo de regresión de efectos fijos que incluye el indicador de tabaquismo, las covariables observadas Xit y
las interacciones entre el indicador de tabaquismo y Xit. Los estimadores propuestos son el estimador GMM de dos pasos que utiliza los tres
conjuntos de Zit. Las primeras tres filas de la Tabla 3 muestran los resultados de la estimación del efecto promedio variable en el tiempo
usando el modelo (1) y (2) para el estimador propuesto y usando el modelo (3) para el estimador FE. La última fila muestra los resultados de
1 =
e0n de
la estimación del efecto promedio invariante en el tiempo, donde imponemos la restricción el m
aodelo
mbos (e1)
stimadores
y (2) y el m
modelo
uestran
efectos relativamente más negativos del tabaquismo de una madre en comparación con los resultados de los trabajos anteriores.
6 CONCLUSIÓN
(3).
que
Los
el
Este documento propuso un nuevo enfoque de datos de panel para identificar y estimar el ATE variable en el tiempo. El enfoque puede
identificar y estimar consistentemente el ATE incluso cuando la heterogeneidad del efecto del tratamiento depende de efectos fijos no
resultados
tabaquismo de una madre tiene un efecto promedio negativo en el peso al nacer de su hijo en cada momento del nacimiento, y el efecto varía
con el tiempo. Aunque los resultados del estimador propuesto son algo variables dependiendo de la elección de Zit, muestran que el efecto del
tabaquismo promedio empeora con el tiempo de nacimiento adicional. Esto podría deberse a que las madres que fuman durante la última parte
del embarazo pueden ser fumadoras más intensas y/o porque los efectos negativos del tabaquismo se acumulan con el tiempo.11 El estimador
propuesto proporciona estimaciones más bajas en cada nacimiento que la estimación de FE.
Podríamos sospechar que las estimaciones de FE están sesgadas hacia arriba para los efectos promedio porque ignora la heterogeneidad del
efecto de fumar que depende de las características no observadas de la madre. Los resultados del estimador propuesto también muestran
observados. En tal caso, los enfoques de datos de panel existentes identifican el ATE solo para subpoblaciones limitadas. En contraste, el
enfoque propuesto puede identificar y estimar el ATE para toda la población. El enfoque depende de la especificación de efectos fijos lineales
para las ecuaciones de resultados potenciales, donde los efectos fijos escalares ingresan de manera aditiva a las dos ecuaciones de resultados
potenciales con diferentes coeficientes, y utiliza variables exógenas que están correlacionadas con efectos fijos condicionados a la asignación
del tratamiento. Recomiendo que los investigadores empíricos que usan datos de panel apliquen este enfoque cuando la heterogeneidad del
efecto del tratamiento parece depender de características individuales no observadas, y su interés está en el ETA para toda la población.
EXPRESIONES DE GRATITUD
Quisiera agradecer al coeditor Edward Vytlacil ya tres árbitros anónimos por sus sugerencias y comentarios constructivos. Este artículo se
basa en un capítulo de mi disertación en la Universidad de Kyoto. Agradezco a Yoshihiko Nishiyama, Ken Yamada, Ryo Okui y Keisuke Hirano
sus útiles comentarios y orientación. También me gustaría agradecer a Naoya Sueishi, Susumu Imai y a los participantes en los seminarios de
la Universidad de Kyoto y la Universidad Hitotsubashi, y a los que participaron en las sesiones de la Reunión asiática de la Sociedad
Econométrica de 2017 en Hong Kong y la Conferencia anual de la IAAE de 2017 en Sapporo por sus comentarios Una versión anterior de este
documento recibió el Premio para Estudiantes de la IAAE de 2017 en la Conferencia Anual de la IAAE de 2017. Reconozco el apoyo financiero
de JSPS KAKENHI Número de subvención JP16J01170.
11 Tenga en cuenta que el marco de este documento no puede capturar explícitamente el efecto acumulado del tabaquismo, a diferencia del marco de tratamiento
dinámico considerado, por ejemplo, por Lechner (2009).
3
12
SAKAGUCHI
INSIGNIAS DE INVESTIGACIÓN ABIERTA
REFERENCIAS
Abrevaya, J. (2006). Estimación del efecto del tabaquismo en los resultados del nacimiento utilizando un enfoque de datos de panel emparejados. Diario de Aplicado
Econometría, 21, 489–519.
Abrevaya, J., Hsu, YC y Lieli, RP (2015). Estimación de los efectos del tratamiento promedio condicional. Revista de Estadísticas Económicas y Empresariales, 33,
485–505.
Chernozhukov, V., FernándezVal, I., Hahn, J. y Newey, W. (2013). Efectos promedio y cuantiles en modelos de panel no separables. econométrica,
81, 535–580.
Gibbons, CE, Suárez Serrato, JC y Urbancic, MB (2018). Efectos rotos o fijos. Revista de Métodos Econométricos, 8.
Graham, BS y Powell, JL (2012). Identificación y Estimación de Efectos Parciales Promedio en Coeficiente Aleatorio Correlacionado “Irregular”
Modelos de datos de panel. Econométrica, 80, 2105–2152.
Jun, SJ, Lee, Y. y Shin, Y. (2016). Efectos del tratamiento con heterogeneidad no observada: un enfoque de identificación de conjuntos. Revista de Estadísticas Económicas y
Empresariales, 34, 302–311.
Lechner, M. (2009). Modelos Causales Secuenciales para la Evaluación de Programas de Mercado Laboral. Revista de Estadísticas Económicas y Empresariales, 27,
71–83.
Lee, S., Okui, R. y Whang, YJ (2017). Banda de confianza uniforme doblemente robusta para la función de efecto de tratamiento promedio condicional. Diario
de Econometría Aplicada, 32, 1–19.
327
Arellano, M. y Bonhomme, S. (2012). Identificación de características de distribución en modelos de datos de panel de coeficientes aleatorios. Revista de Estudios Económicos, 79,
987–1020.
Athey, S. e Imbens, GW (2017). El estado de la econometría aplicada: causalidad y evaluación de políticas. Revista de Perspectivas Económicas, 31,
3–32.
Callaway, B. y Sant'Anna, P. (2018). Diferencias en diferencias con múltiples períodos de tiempo. (Hoja de trabajo).
Chamberlain, G. (1982). Modelos de regresión multivariante para datos de panel. Revista de Econometría, 18, 5–46.
Chamberlain, G. (1992). Límites de eficiencia para la regresión semiparamétrica. Econometrica, 60, 567–596.
Sakaguchi, S. (2016). Estimación de los efectos de tratamiento promedio variables en el tiempo utilizando datos de panel cuando los efectos fijos no observados afectan el potencial
Resultados de manera diferente. Cartas económicas, 146, 82–84.
Veiga, PV y Wilder, RP (2008). Tabaquismo materno durante el embarazo y el peso al nacer: un enfoque de coincidencia de puntuación de propensión. Materno
y Child Health Journal, 12, 194–203.
Walker, MB, Tekin, E. y Wallace, S. (2009). Tabaquismo adolescente y resultados del parto. Revista Económica del Sur, 75, 892–907.
Wooldridge, JM (2005). Efectos fijos y estimadores relacionados para modelos de datos de panel de efectos de tratamiento y coeficientes aleatorios correlacionados.
Revista de Economía y Estadística, 87, 385–390.
Wooldridge, J. (2010). Análisis Econométrico de Sección Transversal y Datos de Panel (2ª edición). Cambridge, MA: MIT Press.
INFORMACIÓN DE SOPORTE
Se puede encontrar información de apoyo adicional en línea en la sección Información de apoyo al final del artículo.
Cómo citar este artículo: Sakaguchi S. Estimación de los efectos promedio del tratamiento utilizando datos de panel cuando la
heterogeneidad del efecto del tratamiento depende de efectos fijos no observados. J Appl Econ. 2020;35:315–327. https://doi.org/10.1002/jae.2752

Estimation of Average Treatment Effects Using Panel Data

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estimation of Average Treatment Effects Using Panel Data

Cargado por

Copyright:

Formatos disponibles

3

J Appl Econ. 2020;35:315–327. wileyonlinelibrary.com/journal/jae © 2020 John Wiley & Sons, Ltd. 315

it+(1−Dit)u0 (Ci) es el Parcial Mél.

t=1 1{Esto = } ∙ es eso]

6La razón es la siguiente. Por la definición de 1 it, 1{Dit = 1} ∙ 1 = 0 y 1{Dit = 0} ∙ 0 = 0 se mantienen en cualquier período t para personas que han recibido

donde u1 y tu0 se definen como en la Sección 2. Estas ecuaciones no tienen los términos constantes. Bajo este modelo y

, ( ud i2 ) N (( 0 0 ) ,

También podría gustarte