Está en la página 1de 13

3

12
Machine Translated by Google

Recibido:  16  Agosto  2018

ARTÍCULO  DE  INVESTIGACIÓN

efectos  fijos  no  observados

Shosei  Sakaguchi

Correspondencia  
Shosei  Sakaguchi,  Departamento  de  
Revisado:  20  de  diciembre  de  2019

Estimación  de  los  efectos  promedio  del  tratamiento  utilizando  datos  de  
panel  cuando  la  heterogeneidad  del  efecto  del  tratamiento  depende  de  

Departamento  de  Economía,  Universidad
Universidad  de  Londres,  Gower  Street,  WC1E  6BT,
Londres,  Reino  Unido

Economía,  University  College  London,  Gower  
Street,  London  WC1E  6BT,  Reino  Unido.

Correo  electrónico:  s.sakaguchi@ucl.ac.uk

1  INTRODUCCIÓN
Resumen

Este  documento  propone  un  nuevo  enfoque  de  datos  de  panel  para  identificar  y  estimar  
el  efecto  de  tratamiento  promedio  variable  en  el  tiempo  (ATE).  El  enfoque  permite  la  
heterogeneidad  del  efecto  del  tratamiento  que  depende  de  los  efectos  fijos  no  observados.  
En  presencia  de  este  tipo  de  heterogeneidad,  los  enfoques  de  datos  de  panel  existentes  
identifican  el  ATE  solo  para  subpoblaciones  limitadas.  Por  el  contrario,  el  enfoque  
propuesto  identifica  y  estima  la  ATE  para  toda  la  población.  El  enfoque  se  basa  en  la  
especificación  de  efectos  fijos  lineales  de  ecuaciones  de  resultados  potenciales  y  utiliza  
variables  exógenas  que  están  correlacionadas  con  los  efectos  fijos.  Aplico  el  enfoque  
para  estudiar  el  impacto  del  tabaquismo  de  una  madre  durante  el  embarazo  en  el  peso  al  nacer  de  su  h

Los  datos  de  panel  se  usan  popularmente  en  los  estudios  de  evaluación  de  programas  para  controlar  los  efectos  fijos  no  observados.  Existen  
muchos  métodos  de  datos  de  panel  que  permiten  hacerlo  basándose  en  restricciones  de  forma  funcional  o  restricciones  en  la  distribución  de  
variables  no  observadas.  Sin  embargo,  cuando  los  efectos  del  tratamiento  son  heterogéneos  según  los  efectos  fijos  no  observados,  los  métodos  
de  datos  de  panel  existentes  no  pueden  identificar  y  estimar  de  manera  consistente  el  efecto  promedio  del  tratamiento  (ETA)  para  toda  la  población.
Este  artículo  propone  un  nuevo  enfoque  de  datos  de  panel  que  puede  identificar  y  estimar  la  ETA  para  toda  la  población,  incluso  cuando  la  
heterogeneidad  del  efecto  del  tratamiento  depende  de  efectos  fijos  no  observados.
En  los  estudios  de  evaluación  de  programas,  los  efectos  del  tratamiento  suelen  ser  heterogéneos  entre  individuos  con  diferentes  
características,  y  esta  heterogeneidad  a  menudo  depende  de  efectos  fijos  no  observados.  Por  ejemplo,  en  las  evaluaciones  de  capacitación  
laboral,  el  efecto  de  la  capacitación  sobre  los  salarios  puede  ser  heterogéneo  entre  individuos  con  diferentes  niveles  de  habilidad  no  observada.  
Cuando  la  heterogeneidad  del  efecto  del  tratamiento  depende  de  efectos  fijos  no  observados,  los  métodos  de  datos  de  panel  existentes  no  
pueden  identificar  y  estimar  consistentemente  la  ETA  para  toda  la  población.  El  estimador  de  efectos  fijos  (FE)  de  uso  frecuente,  basado  en  un  
supuesto  de  independencia  condicional,  está  sesgado  en  este  caso.1  El  método  de  diferencias  en  diferencias  (DID),  basado  en  un  supuesto  de  
tendencia  común,  puede  identificar  y  estimar  el  ATE  para  los  tratados  (ATT),  pero  no  para  toda  la  población.  En  muchos  casos,  sin  embargo,  
estimar  el  ATE  suele  ser  más  deseable  en  términos  de  la  validez  externa  de  los  resultados  de  la  estimación,  lo  que  ha  captado  una  atención  
cada  vez  mayor  en  los  estudios  empíricos  (p.  ej.,  Athey  e  Imbens,  2017).  Por  ejemplo,  si  consideramos  expandir  una  intervención  de  política  
existente  de  la  subpoblación  tratada  actual  a  toda  la  población,  el  ATE  debería  ser  el  parámetro  de  interés.

Este  documento  propone  un  nuevo  enfoque  de  datos  de  panel  que  puede  identificar  y  estimar  el  ETA  para  toda  la  población,  al  tiempo  que  
permite  la  heterogeneidad  del  efecto  del  tratamiento  que  depende  de  los  efectos  fijos  no  observados.  La  identificación  se  basa  en  la  
especificación  de  efectos  fijos  lineales  de  las  ecuaciones  de  resultado  potencial  tratadas  y  no  tratadas,  en  las  que  un  efecto  fijo  escalar

1En  el  contexto  de  efectos  fijos  grupales,  Gibbons  et  al.  (2018)  presentó  una  serie  de  ejemplos  empíricos  en  los  que  el  estimador  FE  está  sesgado  porque  la  heterogeneidad  del  
efecto  del  tratamiento  depende  de  los  efectos  fijos  del  grupo.

J  Appl  Econ.  2020;35:315–327. wileyonlinelibrary.com/journal/jae ©  2020  John  Wiley  &  Sons,  Ltd. 315


Machine Translated by Google

3
12 316

ingresa  de  forma  aditiva  las  dos  ecuaciones  con  diferentes  coeficientes.  Esta  especificación  permite  que  la  heterogeneidad  del  efecto  del  tratamiento  
dependa  de  efectos  fijos  no  observados,  aunque  impone  algunas  restricciones  paramétricas.  El  enfoque  también  permite  que  el  ATE  varíe  en  el  
tiempo  y  puede  identificar  y  estimar  el  ATE  en  cada  período  de  tiempo.  Tenga  en  cuenta,  sin  embargo,  que  no  permite  las  estructuras  dinámicas  en  
los  efectos  del  tratamiento,  a  diferencia  de  Callaway  y  Sant'Anna  (2018).
Bajo  el  modelo  especificado,  identificamos  el  ATE  prediciendo  el  resultado  potencial  no  observado  para  cada  individuo  tratado  y  no  tratado  
usando  los  siguientes  tres  pasos.  Primero,  identificamos  los  coeficientes  de  las  covariables  observadas  en  las  funciones  de  regresión  para  los  
posibles  resultados  tratados  y  no  tratados  aplicando  la  transformación  intra  a  cada  función  de  regresión  para  diferenciar  los  efectos  fijos.  Luego,  al  
observar  los  residuos  del  primer  paso,  identificamos  la  relación  de  los  términos  de  efectos  fijos  entre  las  dos  funciones  de  regresión.  Para  ello,  
utilizamos  cambios  en  el  tiempo  en  los  grupos  de  tratamiento  y  control,  que  se  observan  en  la  subpoblación  de  individuos  denominados  movedores2,  
y  variables  exógenas  que  se  correlacionan  con  los  efectos  fijos  condicionados  a  la  asignación  del  tratamiento.  Como  se  analiza  más  adelante,  
encontrar  tales  variables  exógenas  no  suele  ser  difícil.  Finalmente,  identificamos  el  ATE  mediante  la  combinación  de  datos  observados  con  los  
parámetros  identificados  para  predecir  resultados  potenciales  no  observados  para  cada  individuo  tratado  y  no  tratado.  Sobre  la  base  del  resultado  
de  la  identificación,  el  ATE  se  puede  estimar  mediante  un  estimador  del  método  generalizado  de  momentos  (GMM).

La  limitación  de  este  enfoque  es  que  se  basa  en  la  especificación  de  efectos  fijos  escalares  y  aditivos  para  las  funciones  de  regresión  de  los  
resultados  potenciales.  Bajo  modelos  de  datos  de  panel  no  separables,  Chernozhukov  et  al.  (2013)  consideraron  la  identificación  y  estimación  de  
los  efectos  de  tratamiento  promedio  y  cuantil  basados  en  la  condición  de  homogeneidad  temporal  de  los  términos  de  perturbación  específicos  del  
período.  Con  el  mismo  tipo  de  condición  de  homogeneidad  temporal,  Jun  et  al.  (2016)  derivaron  los  límites  claramente  identificados  de  las  
distribuciones  de  resultados  potenciales.  Sakaguchi  (2016)  propuso  un  enfoque  para  identificar  y  estimar  el  ATE  para  toda  la  población  como  una  
extensión  del  enfoque  DID.  Ese  enfoque  explota  datos  de  panel  estructurados  de  manera  única,  en  los  que  la  exposición  al  tratamiento  se  expande  
de  ningún  individuo  a  todos  los  individuos  a  lo  largo  de  períodos  de  tiempo.  A  diferencia  de  esos  trabajos,  aunque  el  enfoque  propuesto  en  este  
artículo  se  basa  en  la  especificación  de  efectos  fijos  escalares  y  aditivos,  no  requiere  la  condición  de  homogeneidad  temporal  ni  una  estructura  de  
datos  específica.
Este  documento  también  se  relaciona  con  la  literatura  sobre  el  modelo  de  datos  de  panel  de  coeficientes  aleatorios  correlacionados  (CRC).  El  
modelo  de  datos  de  panel  CRC  captura  la  heterogeneidad  del  efecto  del  tratamiento  que  depende  de  los  efectos  fijos  no  observados,  y  el  efecto  
parcial  promedio  (APE)  de  la  pendiente  específica  del  individuo  en  el  modelo  generalmente  corresponde  al  ATE.3  Un  enfoque  común  utilizado  para  
identificar  y  estimar  el  APE  en  el  modelo  hay  un  enfoque  generalizado  dentro  del  grupo  (p.  ej.,  Chamberlain,  1992),  que  identifica  y  estima  el  APE  
para  una  subpoblación  de  personas  que  se  mudan.  En  contraste,  en  este  artículo  asumimos  efectos  fijos  escalares;  en  cambio,  identificamos  y  
estimamos  todo  el  ATE.  Otros  trabajos  que  estudian  el  modelo  de  datos  de  panel  CRC  incluyen  Wooldridge  (2005),  Arellano  y  Bonhomme  (2012)  y  
Graham  y  Powell  (2012).
Como  aplicación  empírica,  aplico  el  enfoque  para  estudiar  el  impacto  del  tabaquismo  de  una  madre  durante  el  embarazo  en  el  peso  de  su  hijo  al  
nacer  utilizando  los  datos  de  panel  combinados  construidos  por  Abrevaya  (2006).  Al  aplicar  el  enfoque  propuesto,  podemos  permitir  que  el  efecto  
del  tabaquismo  de  las  madres  sea  heterogéneo  dependiendo  de  los  efectos  fijos  no  observados  de  la  madre,  y  podemos  estimar  el  efecto  promedio  
del  tabaquismo  en  toda  la  población  de  madres.  En  la  aplicación,  encuentro  que  el  tabaquismo  de  una  madre  tiene  un  efecto  promedio  negativo  en  
cada  uno  de  los  tres  tiempos  de  nacimiento,  y  el  efecto  empeora  con  el  tiempo  de  nacimiento  adicional.
SAKAGUCHI

El  resto  de  este  trabajo  se  estructura  de  la  siguiente  manera.  La  Sección  2  describe  el  entorno,  la  especificación  de  los  posibles  resultados  y  los  
supuestos  necesarios  para  la  identificación.  La  sección  3  describe  el  enfoque  de  identificación  y  el  método  de  estimación.
La  Sección  4  presenta  los  resultados  de  la  simulación  de  Monte  Carlo  para  mostrar  el  comportamiento  de  muestra  finita  del  estimador.  La  Sección  
5  describe  la  aplicación  empírica.  La  sección  6  concluye  este  documento  con  algunas  observaciones.  Un  apéndice  en  línea  contiene  todas  las  
pruebas  y  resultados  de  simulación  adicionales.

2  CONFIGURACIÓN  Y  MODELO

Suponemos  que  {Yit,  Dit,  Xit,  Zit}  se  observa  para  N  individuos  (i  =  1,  2, ... ,  N)  a  lo  largo  de  T  períodos  de  tiempo  (t  =  1, ... ,  T),  donde  T  ≥  2.  
Suponemos  N  es  grande,  mientras  que  T  es  pequeño.  Yit  es  un  resultado  observado.  Dit     {0,  1}  es  un  indicador  de  tratamiento  binario,  tal  que  Dit  
=  1  si  el  individuo  i  es  tratado  en  el  período  t  y  Dit  =  0  en  caso  contrario.  Suponemos  que  la  asignación  del  tratamiento  varía  en  el  tiempo.  Xit  es  un  
vector  K  ×  1  de  covariables  observadas  variables  en  el  tiempo  que  pueden  incluir  dummies  temporales  (o  una  tendencia  temporal  determinista),  
variables  de  confusión  observadas  variables  en  el  tiempo  e  interacciones  entre  ellas.  Zit  es  un  vector  L×1  de  variables  exógenas  que  se  correlacionan  
con  efectos  fijos  no  observados  condicionados  a  la  asignación  del  tratamiento.  Zit  puede  consistir  en  algunos

2Movers  son  personas  que  experimentan  tanto  tratamiento  como  no  tratamiento  a  lo  largo  de  períodos  de  tiempo  observados.
3Esto  se  ilustra  en  Wooldridge  (2010,  p.  968).
Machine Translated by Google

3
12 SAKAGUCHI

o  todas  las  variables  incluidas  en  Xit,  así  como  las  variables  externas.  No  se  requieren  restricciones  en  la  dimensión  de  Zit.  Discutiremos  las  
suposiciones  sobre  Zit  y  su  uso  más  adelante.  Finalmente,  sean  Yit(1)  y  Yit(0)  los  resultados  potenciales  para  el  individuo  i  en  el  período  t  con  y  sin  
tratamiento,  respectivamente.  Entonces,  Yit  se  expresa  como  Yit  =  DitYit(1)+(1  −  Dit)Yit(0).
A  lo  largo  de  este  trabajo,  nos  enfocamos  en  el  ATE  para  toda  la  población  en  cada  periodo  t     {1,  … ,  T}:
Yit(0)].  En  muchos  casos,  la  ATE  para  toda  la  población,  en  lugar  de  una  subpoblación  limitada,  es  más  interesante.  Permitiremos  que  el  ATE  varíe  en  
el  tiempo  y  consideraremos  identificar  y  estimar  el  ATE  en  cada  período.  Tenga  en  cuenta,  sin  embargo,  que  el  ATE  variable  en  el  tiempo  considerado  
aquí  es  diferente  de  los  parámetros  del  efecto  del  tratamiento  variables  en  el  tiempo  considerados  por  Lechner  (2009)  o  Callaway  y  Sant'Anna  (2018),  
en  que  se  define  solo  en  relación  con  la  asignación  de  tratamiento  de  el  período  correspondiente,  y  no  captura  la  dinámica  del  efecto  del  tratamiento  
considerado  por  ellos.
Sea  Ci  un  efecto  fijo  escalar.  A  lo  largo  de  este  artículo  suponemos  que  los  posibles  resultados  Yit(1)  y  Yit(0)  son
expresada  como  las  siguientes  formas  lineales:

fuerte  =  1,  … ,  T,  donde  u1

1econstantes  
efectos  fijos  lineales.  Bajo  
él
y  tu0

dependa  de  las  covariables  observadas.  ≠  Además,  la  

separable  de  los  otros  términos.
él

También  restringimos  ≠  0,  que  1se  requiere  para  la  identificación.

variación  
no   de  h
solo   poraria  
constantes  
Yt(1)  =

él
Yt(0)  =

hdeterogéneas,  
artes  
de  le  
Xtit  
os   provoca  
érminos  
dse  
1

)  +  SALIR

observados,  respectivamente.  En  particular,  ≠  1  permite  que  la  heterogeneidad  del  efecto  del  
vino  
+  X′

tpermite  
ratamiento  
ariación  
efectos  
también  
él

+  X′

se  definen  como  u1 =  Yit(1)−E[Yit(1)|Xit,  Ci]  y  u0

que  
fhijos  
oraria  
de  
(
él

dlependa  
1
+

0
1

de  efectos  
a  heterogeneidad  
en  pearte  
permite  
una   l  qAue  
TE.  
La  
hlos  
c  +  u1

+  Ci  +  u0

)+(

dfel  
ijos  
efecto  
separabilidad  
omogénea.
efectos  
él,

él,

él

están  separados  de  los  términos  de  efectos  fijos,  en  contraste  con  el  modelo  estándar  de  datos  de  panel  de  
sta  especificación,
comió

comió
=  (
en  cada  período  t     {1,  … ,  T}  se  expresa  de  la  siguiente  manera:

1 − 0 ′ 1 − 0 1
−  1)E[Ci],

donde  la  expectativa  no  se  toma  a  lo  largo  del  tiempo  y,  por  lo  tanto,  la  variación  de  tiempo  en  Xit  no  se  promedia.  Como  se  ve  en  esta  ecuación,  el  
ATE  consta  de  tres  partes:  una  parte  constante  y  promedios  de  dos  partes  heterogéneas  que  dependen  de  covariables  observadas  y  efectos  fijos  no  
1
no  observados.  1  0  
del  tratamiento  
de  los  términos  
del  tratamiento  

suponemos  que  todas  las  variables  aleatorias  definidas  son  independientes  y  están  distribuidas  de  forma  idéntica  (iid)  entre  los  individuos:

Supuesto  2.1.  {{Yit(0),  Yit(1),  Dit,  Xit,  Zit}T t=1,
Ci}  son  iid  a  través  de  i.
consten  

Aunque  asumimos  que  Xit  entra  linealmente  en  (1)  y  (2),  también  podría  usarse  una  función  paramétrica  no  lineal  de  Xit  siempre  que  sea  completamente  

En  el  resto  de  esta  sección,  describo  cuatro  suposiciones  que  se  requieren  para  la  identificación.  En  primer  lugar,  a  lo  largo  de  este  artículo  
comió
≡  E[Yit(1)  −  

=  Yit(0)−E[Yit(0)|Xit,  Ci],  respectivamente.
Las  ecuaciones  son  lineales  separables  en  Xit,  Ci  y  u  a  uno.   él. Para  la  normalización  de  escala,  establecemos  el  coeficiente  de  Ci  en  la  ecuación  (2)

En  la  especificación  del  modelo  anterior,  se  permite  que  los  coeficientes  de  Ci  y  Xit  sean  diferentes  entre  (1)  y  (2).  Además,  y  0 ,  los  términos  
(1)

(2)
317

Esta  suposición  no  impone  restricciones  sobre  la  distribución  de  los  datos  a  través  de  períodos  de  tiempo  a  diferencia,  por  ejemplo,
Chernozhukov  et  al.  (2013)  and  Jun  et  al.  (2016).  
Luego,  para  formalizar  la  idea  de  confusión  debido  a  la  presencia  de  covariables  observadas  y  efectos  fijos  no  observados,
imponemos  el  siguiente  supuesto.

Supuesto  2.2.  E[Yit( )|Di1, ... ,  DiT,  Xi1, ... ,  XiT,  Ci]  =  E[Yit( )|Xit,  Ci]  para  todos  =  0,  1  y  t  =  1, ... ,  t

Esta  suposición  es  la  misma  que  la  suposición  fundamental  para  la  estimación  de  FE.  La  suposición  requiere  que,  en  cada  período  de  tiempo,  
los  resultados  potenciales  sean  medios  independientes  de  las  asignaciones  de  tratamiento  en  todos  los  períodos  condicionados  a  las  covariables  
observadas  en  el  período  dado  y  los  efectos  fijos  no  observados.  Esta  suposición  también  requiere  que  los  resultados  potenciales  en  cada  período  
de  tiempo  no  dependan  de  las  covariables  observadas  pasadas  o  futuras  condicionadas  a  los  efectos  fijos  no  observados.  Esto  implica  una  
exogeneidad  estricta  de  Xit  condicionada  a  Ci.
También  imponemos  la  siguiente  suposición  sobre  la  asignación  del  tratamiento.
Machine Translated by Google

3
12 318

Supuesto  2.3.  P(Dit  =

Llamamos  a  tales  
t=1 individuos  
existencia  
“motores”,  
de  motores  
,

tomando  
en  cada  
0  <  ∑T  t=1 Dit  <  T)  >  0  para  todos  =  0,  1  y  t  =  1,  … ,  T.
Esta  suposición  requiere  que  los  grupos  tratados  y  no  tratados  en  cada  período  de  tiempo  incluyan  algunos  individuos  que  han  experimentado  
tanto  tratamiento  como  no  tratamiento  al  menos  una  vez  en  los  períodos  de  tiempo  observados  (es  decir,  individuos  con  {0  <  ∑T  Dit  <  T }).  
prestada  
uno  de  los  
la  tg
erminología  
rupos  tratados  
introducida  
esta  suposición  solo  requiere  que  algunos  individuos,  no  todos,  se  muevan.
y  no  tratados  
por  Chamberlain  
en  cada  periodo  
(1982).  
de  
Etiempo.  
l  supuesto  
Tenga  
2.3  egn  
arantiza  
cuenta  lqa  

El  último  supuesto  requiere  que,  en  la  subpoblación  de  los  que  se  mudan,  las  variables  en  Zit  sean  estrictamente  exógenas  y  estén  
correlacionadas  con  los  efectos  fijos  no  observados  condicionados  a  la  asignación  del  tratamiento.  Zit  satisface  la  siguiente  suposición:

Además,  debido  a  que  tanto  Xit  como  Ci  deberían  afectar  la  asignación  del  tratamiento,  es  probable  que  se  correlacionen  entre  sí  después  de  
ue  

Supuesto  2.4.  Para  cualquier  =  0,  1,  k  =  0,  1,  s  =  1, ... ,  T  y  t  =  1, ... ,  T;  (i)  E  [ Zituk  is|Dit  = ,  Dis  =  k,  0  <  ∑T  Dit  <  T ]  =  0,  (ii)  rango  (∑T  t=1  E   t=1

[( 1,  Z′  Dit  <  T ])  =  2 . él )′  (1,  Ci)|Dit  =

Para  motores,  el  Supuesto  2.4  (i)  requiere  que  Zit  sea  ortogonal  a  uk
, 0  <  ∑T t=1

es
condicionado  a  las  asignaciones  de  tratamiento  en  
cualquier  par  de  períodos  s  y  t;  El  supuesto  2.4  (ii)  requiere  que  Zit  esté  correlacionado  con  los  efectos  fijos  condicionados  a  la  asignación  del  
tratamiento  en  el  período  t.

En  la  práctica,  encontrar  Zit  que  satisfaga  el  Supuesto  2.4  no  suele  ser  muy  difícil.  Es  probable  que  algunas  o  todas  las  variables  incluidas  en  Xit  
satisfagan  el  Supuesto  2.4  y  pueden  incluirse  en  Zit.  El  supuesto  2.2  implica  que  las  variables  en  Xit  satisfacen  la  condición  (i)  del  supuesto  2.4.4  

condicionar  la  asignación  del  tratamiento,  incluso  si  no  lo  están.  incondicionalmente  correlacionados  entre  sí.5  Un  caso  excepcional  en  el  que  Zit  =  
Xit  no  funciona  es  cuando  Xit  no  está  incondicionalmente  correlacionado  con  Ci  y,  además,  no  afecta  la  asignación  del  tratamiento.  En  este  caso,  Xit  
no  está  correlacionado  con  Ci  ni  siquiera  condicionado  a  Dit  (no  cumple  la  condición  (ii)).

También  tenemos  a  menudo  algunas  variables  que  están  incondicionalmente  correlacionadas  con  Ci.  Por  ejemplo,  si  Ci  es  la  capacidad  no  
observada  del  individuo,  los  años  de  educación  deben  correlacionarse  con  Ci  y,  por  lo  tanto,  pueden  incluirse  en  Zit.  Finalmente,  aunque  Zit  tiene  el  
subíndice  t,  las  variables  exógenas  invariantes  en  el  tiempo  también  se  pueden  incluir  en  Zit  para  cualquier  t  =  1,  … ,  T.

Observación  2.1  (Relación  con  el  modelo  de  datos  del  panel  CRC).  La  regla  de  observación,  Yit  =  DitYit(1)+(1−  Dit)Yit(0),  transforma  el  modelo  
de  resultado  potencial  (1)  y  (2)  en  el  siguiente  modelo  de  datos  de  panel  CRC:

it( donde  (Ci)  =  ( 1  0 )  +−( 1−1)Ci,  C̃i  =  0+Ci,  
la  correlación  
Yit  =  TuYit(1)+(1  −  Tu)Yit(0)
=  X′

y  uit  =  Daitu1  
coeficiente  
él

leatorio  
0
+  (Ci)Dit  +  DitX′  

it+(1−Dit)u0   (Ci)  es   el  Parcial  Mél.  


−  0),  identificando  
comió
necesario  identificar  el  ATE.  Sin  embargo,  el  enfoque  dentro  del  grupo   =  E[ (Ci)]  
+  E[Salir]
generalizado  

1 − 0
)  +  C̃i  +  apagado,

edio  en  este  modelo.  Debido  a  que  el  ATE  se  
de  uso  c(omún  
1 expresa  
puede  cidentificar  
omo  Efecto  
el  A
(APE)  
PE  solo  
de  D
para  
subpoblación  de  motores;  por  lo  tanto,  este  enfoque  puede  identificar  la  ATE  solo  para  los  motores.  Bajo  las  especificaciones  (1)  y  (2),  el  
enfoque  propuesto  en  la  siguiente  sección  puede  identificar  y  estimar  la  ATE  para  toda  la  población.
it,  El[ (Ci)],  
a  

Observación  2.2  (Relación  con  el  modelo  de  datos  del  panel  de  efectos  fijos  lineales).  El  modelo  de  resultado  potencial  (1)  y  (2)  anida  el  modelo  
1
es  
SAKAGUCHI

de  datos  de  panel  de  efectos  fijos  lineales  estándar.  Cuando  =  1,  el  resultado  
observado  se  expresa  de  la  siguiente  manera:

0 −
Yit  =  X′ él +  ( 1 − 0 )  +  C̃i  +  apagado. (3)
0 )  It  +  ItX′  it  ( 1

comió −
Esto  corresponde  al  modelo  estándar  de  datos  del  panel  de  efectos  fijos  lineales.  La  ATE  es =  ( 1  0 )  y  no  
0 )  
depende  
+E[Salir]  
d′  
e  C i.  E−n  
( 1
este  caso,  podemos  identificar  el  ATE  por  el  enfoque  habitual  de  efectos  fijos  o  por  el  enfoque  propuesto.

4Esto  se  debe  a  que  el  Supuesto  2.2  es  equivalente  a  E  [ u  it|Di1,  … ,  DiT,  Xi1,  … ,  XiT,  Ci ]  =  0  para  todo  =  0,  1  y  t  =  1,  … ,  T,  que  es  una  condición  suficiente  
para  condición  (i)  en  el  Supuesto  2.4  cuando  Zit  =  Xit.
5Para  ilustrar  esta  afirmación  con  un  ejemplo,  suponga  que  Dit  denota  participación  en  capacitación  laboral,  Ci  es  habilidad  individual  y  Xit  es  edad  individual.  Supongamos  además  que  
individuos  de  baja  edad  y  poca  habilidad  tienden  a  participar  en  la  capacitación.  En  este  caso,  después  de  condicionar  la  participación  en  la  capacitación  (Dit),  la  edad  (Xit)  se  correlaciona  
con  la  habilidad  (Ci),  porque  es  probable  que  los  individuos  que  participan  en  la  capacitación  sean  jóvenes  y  tengan  poca  habilidad.
y  viceversa.
Machine Translated by Google

3
12 SAKAGUCHI

3  IDENTIFICACIÓN  Y  ESTIMACIÓN

Esta  sección  describe  primero  el  enfoque  de  identificación.  Posteriormente,  en  la  Sección  3.2,  se  propone  la  estimación  GMM  de  
los  parámetros  identificados.

3.1  Identificación

Esta  sección  describe  la  identificación  de

describen  los  pasos  del  

Primer  paso

i
procedimiento  de  identificación.
comió

En  el  primer  paso  identificamos
Vamos  _
=  ( 1∕  ∑T
función  indicadora.  1  ( _
t=1 1{It  = } )  ∑T

i i
1

cada  uno  =  0,  1  y  el  individuo  i  con  ∑T  los  

Esta  suposición  requiere  que  E  [∑T  t=1
t=1

Suponemos  aquí  que  se  cumple  la  siguiente  suposición.

él
t=1
períodos  de  tiempo  observados),  adoptamos  la  convención  de  que  Ā  
entre  períodos  tratados  y  no  tratados.


él
comió ,con  base  en  las  ecuaciones  de  resultados  potenciales  (1)  y  (2)  y  los  supuestos  
descritos  en  la  sección  anterior  y  más  adelante.  El  argumento  de  la  identificación  procede  en  tres  pasos.  En  el  primer  paso,  tenemos  
1 y  
identificamos  
F0inalmente,  
.  Luego,  identificamos  
identificamos  
la  
crombinando  
elación  de  tlérminos  
os  datos  
doe  
bservados  
efectos  fijos  
con  

+  ü  
eso
entre  
los  plas  
arámetros  
dos  funciones  

él
identificados.  
de  regresión,  
A  continuación  

i
es  decir,  s1e  
.  

y  0  basado  en  la  idea  del  método  de  transformación  interna  utilizado  en  el  enfoque  FE.
1  {Dit  = }  Ait  y  Ä =  Ait  −  à para  cualquier  variable  Ait  y  =  0,  1,  donde  1{∙}  es  el
0 )  es  la  media  de  Ait  para  el  individuo  i  a  lo  largo  de  los  períodos  de  tiempo  en  los  que  recibe  tratamiento  (no  recibe  tratamiento).  Para

1{Dit  = }  =  0  (es  decir,  el  individuo  que  siempre  es  tratado  o  nunca  tratado  a  través  de  
=  0.  Esta  transformación  es  una  especie  de  transformación  interna

Supuesto  3.1.  Para  cada  =  0,  1,  rango  ( E  [∑T  t=1  1{Dit  = }  ∙     it

1{It  = }  ∙     it
él



it ])  =  K.  it ]  

es  de  rango  completo  para  =  0,  1.  Implícitamente  asegura  la  presencia
de  individuos  que  son  tratados  en  al  menos  dos  periodos  de  tiempo  y  de  individuos  que  no  son  tratados  en  al  menos  dos  
periodos  de  tiempo.6  Para  cada  uno  de  los  individuos  tratados  y  no  tratados  en  el  periodo  t  (los  individuos  con  Dit  =  1  y  Dit  =  0,  
respectivamente) ,  tenemos  el  siguiente  modelo  transformado:

Ÿ =   para  =  0,  1  y  t  =  1,  … ,  T,

donde  el  término  de  efectos  fijos  ha  sido  diferenciado  por  la  transformación  interna.  Luego,  a  partir  del  modelo  transformado  
anterior  y  bajo  los  Supuestos  2.1,  2.2  y  3.1,  podemos  identificar  ( =  0,  1)  de  la  siguiente  manera:

=  mi  [ ∑t=1
T

1{It  = }  ∙     it

es ]−1  mi  [ ∑
T

t=1 1{Esto  = }  ∙     es  eso]

Esta  identificación  es  similar  a  la  identificación  en  el  modelo  de  datos  de  panel  de  efectos  fijos  lineales  estándar  
.
319

(4)

por  la  transformación  interna.  Tenga  en  cuenta  que  esta  identificación  se  basa  en  la  condición  de  ortogonalidad:
mi  [∑T  t=1   itu ′ él |Di1,  … ,  DiT]  =  0,  que  se  deriva  del  Supuesto  2.2.

La  siguiente  proposición  formaliza  el  resultado  de  la  identificación  en  este  paso.

Proposición  3.1.  Bajo  los  Supuestos  2.1,  2.2  y  3.1,  ( =  0,  1)  se  identifica  como  (4).
Se  proporciona  una  prueba  en  el  Apéndice  en  línea.

6La  razón  es  la  siguiente.  Por  la  definición  de     1  it,  1{Dit  =  1}  ∙     1  =  0  y  1{Dit  =  0}  ∙     0  =  0  se  mantienen  en  cualquier  período  t  para  personas  que  han  recibido  


él él
tratamiento  menos  de  dos  veces  y  personas  que  han  experimentado  sin  tratamiento  menos  de  dos  veces,  respectivamente.  Por  lo  tanto,  la  condición  de  rango  en  el  
Supuesto  3.1  no  se  cumple  si  ningún  individuo  ha  experimentado  tratamiento  o  ningún  tratamiento  al  menos  dos  veces.
Machine Translated by Google

3
12 320

Segundo  paso
A  continuación,  identificamos  la  razón  de  los  términos  de  efectos  fijos  escalares,  1,  y  los  términos  constantes  transformados, ̃  1  y  ̃  0,  definidos

ecuaciones  para  motores:

1  Aquí,  i  1   ( 1)  (

donde  ̃  0 ≡
restringimos 1
0
0  

yo

≠  0.

yo
− 1
1

las  siguientes  condiciones  de  momento:
1  

yo
(

1
1
)  _

y  ũ  eso0 ≡  u0

Ahora  consideramos  identificar  ̃  1,  ̃  0,  y  en  las  

por  lo  tanto,  están  correlacionados  con  



1

yo
i
1 ­  X 1′
i

es  la  razón  por  la  que  nos  enfocamos  en  la  subpoblación  de  motores  en  este  paso.

él

1 =

1
1

(i)  y  está  correlacionado  con  Ci  bajo  el  Supuesto  2.4  (ii).9  1  y  0  ya  están  identificados,  
los  parámetros  
por  De  

t=1

t=1
T
̃   1d,  
la   ̃  0  y  1a
iscusión     snterior,  
on  identificado  
dado  que

mi  [ ( 1,  Z′  it)′  ( Yit(1)  −

mi  [ ( 1,  Z′  it)′  ( Yit(0)  −
1  
cofre  yo
1
+

Luego,  en  cada  período  t,  dividimos  la  subpoblación  de  personas  que  se  mudan  en  grupos  tratados  y  no  tratados:

{ It  =  1,  ∑T

{ It  =  1,  ∑T

donde  ̃  1 ≡
t=1

t=1
Dit  ≠  T }  y  { Dit  =  0,  ∑T

Dit  T } ,

1−  1  0  y  ũ

motores  en  el  grupo  no  tratado  { Dit  =  0,  ∑T
función  de  regresión  para  Yit(0):
1
él
≡  u1  it−

Yt(0)  =
t=1

Yt(1)  =
1
t=1 Dit  <  T } ),
abajo.  La  identificación  en  este  paso  se  basa  en  la  subpoblación  de  personas  que  se  mudan  (es  decir,  individuos  con  { 0  <  ∑T
cuya  existencia  está  asegurada  bajo  el  Supuesto  2.3.  Una  vez   1 y  0  se  identifican  en  el  paso  anterior,  tenemos  lo  siguiente

Ci  +  u 1
i

.  Tenga  en  cuenta  que  si  1  =  0,  1∕

̃  1

̃  0
−  X′  

−  X′
eso

él
y

( 0))  es  igual  a  la  suma  del  término  constante  ( 0),  el  1término  de  efectos  fijos  1Ci  (Ci)  y  la  perturbación ).  Las  dos  
término  ū   (d 0 ecuaciones  anteriores  no  son  triviales  solo  para  motores.  Para  los  que  no  se  mueven,  uno  de  ellos  degenera  a  cero.7  Esto
i i

él

funciones  de  regresión  transformadas  (5)  y  (6),  pero  una  identificación  ( 0)  y  ( 1)  
aquí  surge  el  problema.  En  (5)  y  (6),  y,   son  endógenas  porque  incluyen  términos  de  perturbación  ūi0  y  ūi1
0  
1  

it  ii  t,0   respectivamente.  Para  hacer  frente  a  este  problema  de  endogeneidad,  utilizamos  la  vari  exógena
1 y  ũ  
yo

ũables  en  Zit  que  satisfacen  las  condiciones  del  Supuesto  2.4.  Bajo  este  supuesto,  podemos  usar  Zit  como  un  vector  de  variables  
instrumentales  bajo   eyl  Supuesto  
( 0)   0  
2.4
porque,  en  los  supuestos  subgrupos,  Zit  es  exógeno  a  ũ   1 0  y  ũ
( 1),   1  

1 −

0 −
1  0  

1
1
1

yo(

1  

yo
(
yo

1  

yo

0
0  

1
(

(
0

) )  |It  =  1,  ∑
0′ )  ≡     0 −  X

Dit  ≠  0 } ,  respectivamente.8  Para  los  motores  en  el  grupo  tratado
podemos  volver  a  expresar  la  función  de  regresión  para  Yit(1)  de  la  siguiente  manera:

̃  1

1u  0 .  Esta  ecuación  se  obtiene  reemplazando  Ci  con
i

t=1
+  X′

Dit  ≠  0 } ,  reemplazando  Ci  con

̃  0
+  X′
él
1

0
+

+
1
1  0  
yo(
0
)  +

1
)  +

) )  |It  =  0,  ∑
1
él,

0
él,
i

yo
1  
  
i
0 =

en  (6)  no  toma  un  valor  finito.  Esta  es  la  razón

t=1

t=1
T
0  

yo

Dit  T ]  =  0,
él

Es  ≠  0 ]  =  0.
0
+  Ci  +  ū

él
0
yo  _
SAKAGUCHI

( 0)  en  la  ecuación  (1).  De  manera  

similar,  para  ( 1)  en  la  ecuación  (2),  tenemos  lo  siguiente
(5)

(6)

(7)

(8)

Los  primeros  componentes  de  las  condiciones  de  momento  (7)  y  (8)  se  derivan  de  la  condición  de  exogeneidad:  ∑T  E  [ u  it|Di1,  … ,  
DiT]  
t=1 =condiciones  
  0,  que  se  cumple  
bajo  el  S
de  momento,   Zupuesto   2.2.  
it  funciona   Los  udn  
como   emás  se  
dde  
vector   erivan  
de  la  condición  
instrumentos   oirtogonal  
que  son   del  Spupuesto  
dentificados   2.4  (i).  En  dee  
or  las  condiciones   stas  
momento  
10  ̃  1
(7)  y  (8),  respectivamente,  y  A  continuación  se  formaliza  el  resultado  de  la  identificación  en  este  paso. ( 0)  y  es   ( 1). y  ̃  0 0   1  

yo yo

1
identificado  por  ambos.

7La  razón  es  la  siguiente.  Para  el  individuo  i  que  nunca  recibe  tratamiento,  ( 0)   1  
( 1)  degenera  a  cero  porque     1  =  0  y  X   1  =  0  por  definición.  Del  mismo  modo,  para
yo i i
individuo  i  que  siempre  es  tratado, degenera  a  cero.
0  

yo

t=1 Eso  ≤  T }  =  { Eso  =  1,  ∑T
8Observe  que  { Dit  =  1,  0  ≤  ∑T t=1 Dit  ≠  T }  y  { Dit  =  0,  0  ≤  ∑T t=1 Eso  ≤  T }  =  { Eso  =  0,  ∑T t=1 Este  ≠  0 } .

9ūi1  en ( 1)  y  ūi0  en
1  
( 0)  se  puede  ver  como  errores  de  medición  para  1 +  1Ci  y  0
0  
+  Ci,  respectivamente.  En  esta  vista,  las  variables  en  Zit  funcionan  como
yo yo

instrumentos  para  hacer  frente  a  los  errores  de  medición.
10Podemos  usar  Zit  que  constan  de  algunas  o  todas  las  variables  en  Xit,  aunque  Xit  ya  se  haya  usado  en  el  primer  paso  de  la  identificación,  porque  usamos  diferentes  subpoblaciones,  
motores,  en  este  paso.
Machine Translated by Google

3
12 SAKAGUCHI

Proposición  3.2.  Supongamos  

Tercer  paso

comió
0  y
identificado  por  las  condiciones  de  momento  (7)  y  (8).

Se  proporciona  una  prueba  en  el  Apéndice  en  línea.

=E[Yit(1)]  −  E[Yit(0)]

=E  [ Tu  { Yit  −  ( ̃  0

Proposición  3.3.  Supongamos  que  y  ̃  para  =  0,  1  y  para  
comió
t  =  1,  … ,  T  se  identifica  como  (11).

Se  proporciona  una  prueba  en  el  Apéndice  en  línea.

( Se  identifican  los  supuestos  2.1–2.4  y  3.1.

no  incluir  términos  constantes,  explique  
son  e1sto,  
  y  0,  
1 , ... ,
1 ya  están  identificados.  Entonces,  bajo  los  Supuestos  2.1­2.4,

Finalmente  podemos  identificar  E[Yit(1)]  y  E[Yit(0)],  de  la  siguiente  manera:

E  [Yit(1)]  =  E  [ DitYit  +  (1  −  Dit)  ( ̃  1 +  X′ él

E  [Yit(0)]  =  E  [ (1  −  Tu)  Yit  +  Tu  ( ̃  0

+  X′

El  siguiente  teorema  resume  el  resultado  de  la  identificación  completa.
Teorema  3.1.  Dejar ′
≡   1′, 0′, ̃  0,  ̃  1,  1,  comió
él
0  +

La  siguiente  proposición  formaliza  el  resultado  de  la  identificación  en  este  paso.
1
1
1  

yo

Se  omite  una  prueba  ya  que  el  resultado  obviamente  se  sigue  de  las  Proposiciones  3.1–3.3.
Las  siguientes  son  algunas  observaciones  sobre  el  resultado  de  la  identificación.

sruponga  
espectivamente,  
aquí  que  e
las  
l  pp
rocedimiento  
osibles  ecuaciones  
( 1
+  X′

donde  las  ecuaciones  se  cumplen  bajo  el  Supuesto  2.2.  En  la  ecuación  (9),  predecimos  Yit(1)  para  individuos  que  no  son  tratados  en  
t  mediante  la  combinación  de  Xit  y  e( 0)  
con  los  
l  método   parámetros  
(ver,  
yo
0  
identificados.  
por  ejemplo,   Esto  
Wooldridge   se  bSasa  
2010,   en  la  
ección   idea  del  
21.3.2).   período  
En   de  ajuste  
la  ecuación  
mismo  método  a  los  individuos  tratados  en  el  período  t,  predecimos  sus  resultados  potenciales  no  observados  Yit(0).

En  consecuencia,  bajo  el  Supuesto  2.2,  podemos  identificar
comió ,
dae  
(10),  

) )}  +  (1  −  Eso)  {( ̃  1

t ) .  
comió

de  identificación  

Yit(1)  =  X′

Yit(0)  =  X′
1
él

la  regresión  
plicando  

como  sigue:
el  
0  +
1
+

1
1  0  

+  X′
yo

1  

yo

él
(

(
0

1  +
) )],

) )] ,

ya  están  identificados.  Entonces,  bajo  los  Supuestos  2.1  y  2.2,

Supongamos  el  modelo  de  resultado  potencial  (1)  y  (2).  Entonces,  bajo

Observación  3.1  (Modelo  de  resultado  potencial  sin  términos  constantes).  Cuando  las  ecuaciones  de  resultado  potencial  (1)  y  (2)  
de  resultado  
no  rsequiere  

él

él
on  las  seiguientes:

1  +
0
1
l  uso  de  Zit.  Para  

c  +  u1

+  Ci  +  u0 él,
él,
1  0  
yo
( 0
1
y  ̃  ( =  0,  1)  son

) )  −  Yit} ] .
(9)

(10)

(11)
321

donde  u1 y  tu0 se  definen  como  en  la  Sección  2.  Estas  ecuaciones  no  tienen  los  términos  constantes.  Bajo  este  modelo  y  


él él
los  supuestos  mantenidos,  ( =  0,  1)  puede  identificarse  como  (4),  como  en  el  primer  paso  del  procedimiento  de  identificación.
Para  el  segundo  paso,  no  necesitamos  identificar  los  términos  constantes  transformados  ̃  ( =  0,  1)  en  este  caso,  porque  las  
ecuaciones  transformadas  (5)  y  (6)  en  este  caso  no  contienen  estos  términos.  Por  lo  tanto,  solo  necesitamos  identificar  la  razón  
de  los  efectos  fijos  1  en  e ste  pZaso.  
usar   Ela  
it,  de  n  saiguiente  
usencia  m
de  
los  términos  constantes,  se  sigue  para  motores  que  se  pueden  
anera: identificar,  
=  1Ci  +  sū in  1
( 1)   1  

i
y ( 0)  =  Ci  +  ū
yo

0   0 .  Entonces, 1
yo i

T T

i ( 1)|0  <  ∑
y  [ 1 t=1 Dit  <  T ] = 1E  [ Ci|0  <  ∑t=1 Dit  <  T ]
= 1 ,
T T

i ( 0)|0  <  ∑
y  [ 0 t=1 Dit  <  T ] Y  [ Ci|0  <  ∑t=1 Dit  <  T ]
Machine Translated by Google

3
12 322

donde  la  primera  igualdad  se  sigue  del  Supuesto  2.2.  La  ATE  se  puede  identificar  de  la  misma  forma  que  en  el  tercer  paso.

Observación  3.2  (Efecto  del  tratamiento  invariante  en  el  tiempo).  Cuando  Xit  no  induce  variación  en  el  tiempo  en  el  ATE,  el  ATE  1  y  0  se  

3.2  Estimación
comió

donde  Wi  =  ({ Yit,  Dit,  X′
=
1
T

T ∑ E  [ Tu  { Yit  −  ( ̃  0
t=1

g1  (Wi, )  =  ∑

g2(Wi, )  =∑

g3(Wi, )  =  ∑

g4  (Wi, )  =  ∑
t=1
T

t=1
T

t=1

t=1
+  X′él

esto  ∙     1  it  ( Ÿ  

1  { Eso  =  1,  ∑

1  { It  =  0,  ∑

g5(Wi, )  =Di1  { Yi1  −  ( ̃  0 ) )}

él, CON'
él1

−  (1  −  Di1)  { ( ̃  1 +  X′i1

g4+T(Wi, )  =DiT  { YiT  −  ( ˜

−  (1  −  DiT)  {( ̃  1 +  X′él
0  +

(1  −  Esto)  ∙     0  l( 0  
o 0 ) ,
él

t=1

t=1

+  X′i1
vuelven  invariantes  
cuando  E  [Xit]  es  invariable  en  el  tiempo  o  son  equivalentes.  En  lugar  de  (11),  el  ATE  invariable  

1
1

él 1 ) ,

−     0′
él
1  

yo
(
ecn  
eidentificar  

En  este  caso,  se  reducen  los  números  de  momentos  y  parámetros  a  estimar,  lo  que  podría  disminuir  las  varianzas  
de  los  estimadores.
e
dl  
n  el  tiempo,  
omo tiempo.  pEor  
enotado  

Dit  ≠  T }  ∙  ( 1,  Z′  it)′  ( Yit  −

Dit  ≠  0 }  ∙  ( 1,  Z′  it)′  ( Yit  −  

+  X′él 0  +
0
+

1  +
+

él t=1 )′ .  g1(Wi, )  y  g2(Wi, )  son  las  funciones  de  momento  para  estimar }T
1
1

1
1
1  

yo

1  0  
yo(

1  0  
yo(
(

1  

yo
(
sto  

1  y  0,  respectivamente,  
que  se  derivan  del  primer  paso  del  procedimiento  de  identificación.  g3(Wi, )  y  g4(Wi, )  son  las  funciones  de  momento  para  estimar  
sucede  
ate,  
se  puede  

) )}  +  (1  −  Eso)  {( ̃  1

Sobre  la  base  del  procedimiento  de  identificación,  el  vector  de  parámetros  puede  ser  estimado  por  GMM.  El  estimador  GMM  de  se  
construye  a  partir  del  vector  de  funciones  de  momento  de  la  siguiente  manera:

−     1′  

) )  −  Este1 }  −

̃  1,  ̃  0  y  1,  que  son  análogas  a  las  condiciones  de  momento  (7)  y  (8),  respectivamente.  Para  cada  t  =  1,  … ,  T,  por  la  predicción,  
) )}

) )  −  YiT}  −
̃  1

̃  0
+  X′él

−  Xél′ 1 −

−  Xél′ 0

comió  1 ,

comió
T ,
1


+
1  0  

1  0  

1
1
yo(
yo(

1  

yo
(
0
0

) )  −  Yit} ]

) ) ,

) ) ,
.
SAKAGUCHI

comió
momento  para  estimar  funciones  de  momento  que  puede  que   se  deriva  
modificarse   de  la  ecuación  
fácilmente   (11).  
para  los   El  anterior  
casos   g4+t(Wi, )  
considerados   en  leas  
s  lO
a  bservaciones  
función  de  
3.1  y  3.2.  =  1  o  no.  En  nuestra  especificación,  esto  es  equivalente  a  una  prueba  de  si  la  heterogeneidad  del  efecto  del  tratamiento  
1
En  el  marco  GMM,  también  podemos  probar  si depende  de  efectos  fijos  no  observados.  Podríamos  aplicar  pruebas  
basadas  en  GMM  para  la  hipótesis  nula:  =  1.  Si  la  hipótesis  nula  es  correcta,  podemos  usar  el  estimador  de  efectos  fijos  habitual  
1
para  estimar  el  ATE.

4  SIMULACIÓN  DE  MONTE  CARLO

En  esta  sección,  llevamos  a  cabo  un  experimento  de  Monte  Carlo  para  estudiar  el  comportamiento  de  muestra  finita  del  estimador  propuesto.  
En  el  Apéndice  en  línea  se  realizan  algunos  experimentos  de  Monte  Carlo  adicionales.  Aquí  consideramos  dos  tipos  de  procesos  de  
generación  de  datos  (DGP),  DGP1  y  DGP2,  que  consisten  en  diferentes  modelos  de  resultados  y  un  mismo  modelo  de  asignación  de  tratamiento.
Machine Translated by Google

3
12 SAKAGUCHI

con  T  =  2.  Los  modelos  de  resultados  son  los  siguientes:  Para  t  =  1,  2,

dónde 1
=  1  en  DGP1  y 1

i1
tu0
i2
En  1
i2

exógena  satisface  las  condiciones  del  Supuesto  2.4.

se  
En  ambos  DGP,  (Xi1,1,  Xi2,1,  Ci)  desviación  estándar   1,  e
Yit  =  { 2  +1  

y  xtraen  
  H+it,1  

covarianzas  
extraen  de  las  siguientes  distribuciones  normales  multivariadas:

  2  H−it,  

de  upna  
or  pd

, donde  
variable  de  media  cero.  Además,  establecemos  una  variable  exógena  Wit  célomo  
  01.5Hit,2  

,
  +  0.5  H+it,  

istribución  
ares  

        

Wit  (= UW
  

  

  

+  u, W  
  Ci  i1
  C2i  

normal  
0,3;  (Xi1,2,  
  +

covarianza  
i2u)′  
W  sve  
+    1uCi  

0,5  1

ariable  
extrae  
0 +  u1

m1ultivariante  
Xi2,2)  (1,  

por  cpon  
dares  
e  d
con  
.5)  Los  términos  

     

     

     

uesviación  
na  
0.3.  
mpedia  
de  

distribución  
i1
afuera
él

él

(1,  1.5,  
erturbación  
′se  extraen  de  una  distribución  normal  multivariante  con  media

, desviación  estándar  1  y  covarianza  por  pares  0,3.  Nótese  aquí  que  Xit,1  está  correlacionado  con  Ci  mientras  que  Xit,2  no  lo  está.  El

  
i1
  u0        

En  1
                             

N           0        
0  
0  
      1  0,5  0,3  0,2  1  
0,2  0,3  1  
        
si  Dit  =  0  de  
lo  contrario ,

=  3  en  DGP2.  El  modelo  de  asignación  de  tratamiento  es  Dti  =  1  { −2  −  Xit,1  +  Xit,2  +  Ci  +  uD  para  t  =  1,  2él.   ≥  0 }

se  1) , Stan

,  ( ud i2 )     N  (( 0  0 ) ,  

Esta  evstándar  
ariable  

Se  deben  hacer  dos  comentarios  sobre  los  DGP.  Primero,  la  diferencia  entre  DGP1  y  DGP2  está  en  los  coeficientes  para  Ci  en  las  

En  esta  simulación,  comparamos  el  estimador  GMM  de  dos  pasos  eficiente  derivado  del  procedimiento  de  identificación  propuesto  con  
normal  

ecuaciones  de  resultado.  Mientras  que  DGP1  tiene  los  mismos  coeficientes  para  Ci  en  las  ecuaciones  de  resultado  tratadas  y  no  tratadas,  
1  y  

DGP2  tiene  diferentes  coeficientes  entre  ellas.  Por  lo  tanto,  la  heterogeneidad  del  efecto  del  tratamiento  no  depende  de  Ci  en  DGP1,  pero  
sí  en  DGP2.  En  segundo  lugar,  cada  una  de  las  tres  variables  Wit,  Xit,1  y  Xit,2  pueden  usarse  como  una  variable  exógena  en  Zit,  cuyo  
papel  se  describe  en  la  Sección  3,  porque  satisfacen  las  condiciones  del  Supuesto  2.4.  Wit  y  Xit,1  están  incondicionalmente  correlacionados  
con  Ci,  mientras  que  Xit,2  no  lo  está.  Pero  Xit,2  se  correlaciona  con  Ci  después  del  condicionamiento  en  Dit.

el  estimador  OLS  y  el  estimador  FE  en  DGP1  y  DGP2.  Los  parámetros  de  interés  son  los  ATE  en  los  periodos  1  y  2.  En  DGP1,  los  valores  
verdaderos  de  los  ATE  en  los  periodos  1  y  2  son  1  y  2,  respectivamente;  en  el  DGP  2,  los  valores  reales  de  los  ATE  en  los  periodos  1  y  2  
son  3  y  4,  respectivamente.  Para  el  estimador  propuesto,  usamos  cinco  conjuntos  diferentes  de  Zit:  {Wit},  {Xit,1},  {Xit,2},  {Xit,1,  Xit,2}  y  {Wit,  
Xit,1,  Xit,2 }.  El  cuarto  conjunto  utiliza  todas  las  variables  exógenas  que  se  incluyen  en  el  modelo  de  resultado  potencial;  el  último  conjunto  
utiliza  todas  las  variables  exógenas.  En  ambos  DGP,  las  proporciones  de  personas  que  se  mudan,  personas  siempre  tratadas  y  personas  
nunca  tratadas  son  de  aproximadamente  31,7  %,  13,5  %  y  54,8  %,  respectivamente.
( 1  0.3  1 ))

La  Tabla  1  informa  los  resultados  de  1000  simulaciones  con  tamaños  de  muestra  N  =  200,  500  y  800.  Los  paneles  I  y  II  de  la  Tabla  1  informan  los  
resultados  de  la  simulación  para  DGP1  y  DGP2,  respectivamente.  Vale  la  pena  señalar  varios  hallazgos.  Primero,  el  estimador  OLS  está  severamente  
sesgado  tanto  en  DGP1  como  en  DGP2  debido  a  la  presencia  de  efectos  fijos  no  observados.  En  segundo  lugar,  el  estimador  FE  no  está  sesgado  en  
DGP1,  mientras  que  está  sesgado  en  DGP2.  Esto  se  debe  a  que  la  heterogeneidad  del  efecto  del  tratamiento  depende  de  efectos  fijos  no  observados  
en  DGP2.  En  tercer  lugar,  tanto  en  DGP1  como  en  DGP2,  el  estimador  propuesto  tiene  poco  sesgo,  independientemente  del  tipo  de  Zit.
En  cuarto  lugar,  incluso  en  DGP1,  donde  el  estimador  FE  es  consistente,  el  rendimiento  del  estimador  propuesto  es  compatible  con  el  del  estimador  FE  
en  términos  de  RMSE.  En  quinto  lugar,  al  comparar  los  diferentes  conjuntos  de  Zit,  el  estimador  propuesto  tiene  RMSE  más  pequeños  cuando  Zit  
consiste  en  Xit,1  y/o  Xit,2  que  cuando  Zit  consiste  solo  en  Wit  en  ambos  DGP.  En  el  Apéndice  en  línea,  se  proporcionan  resultados  de  simulación  
adicionales,  donde  evaluamos  el  comportamiento  de  la  muestra  finita  en  tres  casos:  (i)  la  fracción  de  elementos  móviles  es  pequeña,  (ii)  es  cercana  a  
323

1
cero  y  (iii)  T  es  grande .

5  APLICACIÓN  EMPÍRICA

En  esta  sección,  aplico  el  enfoque  propuesto  para  estudiar  el  impacto  del  tabaquismo  de  una  madre  durante  el  embarazo  en  el  peso  al  nacer  de  su  hijo  
y  su  heterogeneidad.  Son  muchos  los  trabajos  que  estudian  el  efecto  del  tabaquismo  medio  y  su  heterogeneidad  bajo  varios  supuestos  identificativos  y  
de  forma  funcional  (p.  ej.,  Abrevaya,  2006;  Veiga  &  Wilder,  2008;  Walker  et  al.,  2009;  Abrevaya  et  al.,  2015;  Lee  et  al. .,  2017).  Walker  et  al.  (2009)  
examinan  la  diferencia  en  el  efecto  promedio  de  fumar  entre  madres  adolescentes  y  madres  adultas.  Abrevaya  et  al.  (2015)  y  Lee  et  al.  (2017)  examinan  
la  heterogeneidad  del  efecto  del  tabaquismo  promedio  en  función  de  la  edad  de  la  madre  en  su  aplicación.

El  análisis  utiliza  el  conjunto  de  datos  de  panel  emparejado  construido  por  Abrevaya  (2006)  a  partir  de  los  conjuntos  de  datos  de  natalidad  de  EE.  
UU.  para  1990–1998.  Debido  a  que  el  conjunto  de  datos  original  no  tiene  identificadores  únicos  para  las  madres,  comparó  cuidadosamente  las  madres  con
Machine Translated by Google

3
12 324

TABLA  1  Resultados  de  la  simulación  Monte  Carlo

MCO
FE

Estimador  propuesto  (1)  
(2)  (3)  (4)  (5)

ATE  para  el  2do  período
MCO
FE

Estimador  propuesto  (1)  
(2)  (3)  (4)  (5)
1

1
1
1
1
1

2
2

2
2
2
2
2
­0.015  0.258

0,025  0,195
0,023  0,190
0.038  0.177
0,034  0,180
0,036  0,184

1.157
­0,008  0,265

0.041
0.027  0.191
0.040  0.198
0.031
0.031
Panel  II:  Resultados  de  la  simulación  para  DGP2

ATE  para  el  1er  período
MCO
FE

Estimador  propuesto  (1)  
(2)  (3)  (4)  (5)

ATE  para  el  2do  período
MCO
FE

Estimador  propuesto  (1)  
(2)  (3)  (4)  (5)
3
3

3
3
3
3
3

4
4

4
4
4
4
4
2.833  0.463
0.921

0,092  0,310
0.081
0,085  0,285
0.071
0,074  0,317

2.863  0.471
0,938  0,387

0,106  0,324
0,085  0,320
0.092  0.299
0,079  0,326
0,078  0,331
N=200
Valor  verdadero  Sesgo  SD  RMSE  Sesgo  SD  RMSE  Sesgo  SD  RMSE

Panel  I:  Resultados  de  la  simulación  para  DGP1

ATE  para  el  1er  período
1 1.147 0.257

0.255

0.203

0.194
0.196

0.378

0.287

0.295
1.175
0.258

0.196
0.192
0.181
0.183
0.187

1.184
0.265

0.207
0.193
0.201
0.196
0.198

2.881
0.996

0.323
0.298
0.297
0.304
0.326

2.901
1.015

0.341
0.331
0.313
0.335
0.339
1.173  0.166
0,008  0,167

0.034  0.130
0,030  0,126
0.042  0.117
0.037  0.118
0,035  0,123

1.169  0.160
0,004  0,169

0,044  0,132
0.032  0.131
0,048  0,122
0,037  0,125
0.036  0.129

2.881  0.300
0,953  0,247

0,076  0,203
0,077  0,192
0,077  0,182
0,072  0,197
0,068  0,215

2.882  0.290
0,949  0,232

0,082  0,214
0,076  0,212
0,083  0,195
0,069  0,212
0,070  0,223
N=500

1.184
0.167

0.134
0.129
0.124
0.123
0.128

1.180
0.169

0.140
0.134
0.131
0.130
0.134

2.897
0.984

0.217
0.207
0.197
0.210
0.225

2.897
0.977

0.229
0.225
0.211
0.223
0.234
1.162
­0.004  0.134

0,255  0,107
0.021  0.099
0,037  0,092
0.028  0.093
0.025  0.098

1.162
­0.002  0.132

0.041  0.111
0.025  0.100
0.045  0.097
0.029  0.098
0,028  0,102

2.882
0,954  0,186

0,061  0,169
0,062  0,155
0,069  0,146
0,065  0,153
0,061  0,174

2.881
0,953  0,189

0,071  0,176
0,066  0,171
0,075  0,159
0,069  0,167
0,064  0,181
N=800

0.130

0.131

0.229

0.221
SAKAGUCHI

1.170
0.134

0.110
0.101
0.099
0.097
0.101

1.169
0.132

0.118
0.103
0.107
0.102
0.106

2.891
0.972

0.180
0.167
0.161
0.166
0.184

2.890
0.972

0.190
0.183
0.176
0.181
0.192

Nota:  El  valor  verdadero  es  el  valor  verdadero  del  ATE.  El  sesgo,  SD  y  RMSE  son  el  sesgo  medio,  la  desviación  estándar  y  el  error  cuadrático  medio  de  
las  estimaciones  en  las  simulaciones,  respectivamente.  Para  el  estimador  propuesto,  las  filas  (1),  (2),  (3),  (4)  y  (5)  informan  los  resultados  del  estimador  
propuesto  cuando  Zit  es  {Wit},  { Xit ,  1},  {Xit,  2},  {Xit,1,  Xit,2}  y  {Wit,  Xit,1,  Xit,2},  respectivamente.

niños  basados  principalmente  en  pares  del  estado  de  nacimiento  del  niño  y  el  estado  de  nacimiento  de  la  madre,  que  tienen  un  
pequeño  número  de  observaciones,  y  luego  construyeron  el  conjunto  de  datos  de  panel  combinado.  Selecciono  “panel  emparejado  n.
°  3”,  porque  es  el  construido  de  manera  más  conservadora.  El  mismo  conjunto  de  datos  también  es  analizado  por  Arellano  y  
Bonhomme  (2012)  utilizando  el  modelo  de  datos  de  panel  CRC,  y  por  Jun  et  al.  (2016)  utilizando  un  modelo  de  datos  de  panel  no  
separable.  Debido  a  que  el  número  de  nacimientos  en  el  conjunto  de  datos  original  es  diferente  entre  las  madres,  me  enfoco  en  las  
madres  que  tuvieron  tres  hijos  durante  el  período  observado.  La  muestra  final  contiene  12.360  madres.  Entre  ellas,  1.349  madres  
fumaban  durante  su  primer  embarazo,  1.371  madres  fumaban  durante  su  segundo  embarazo  y  1.437  madres  fumaban  durante  su  
tercer  embarazo.  El  ratio  de  móviles  en  la  muestra  es  del  11,7%.
Usando  esta  muestra,  estimo  el  efecto  promedio  del  tabaquismo  de  una  madre  durante  el  embarazo  en  el  peso  de  su  hijo  al  nacer  
en  cada  nacimiento  usando  el  modelo  de  resultado  potencial  (1)  y  (2).  En  el  modelo,  Dit  es  un  indicador  del  tabaquismo  de  una  madre,  
donde  Dit  =  1  indica  que  i­ésima  madre  fumó  durante  el  embarazo  para  su  t­ésimo  nacimiento  y  Dit  =  0  indica  lo  contrario.
Los  posibles  resultados  Yit(1)  y  Yit(0)  son  el  peso  del  niño  al  nacer  para  el  enésimo  nacimiento  de  la  i­  ésima  madre  si  fumaba  y
Machine Translated by Google

3
12 SAKAGUCHI

Variables
Masculino

Edad

Edad2

Índice  de  Kessner  =  2

Índice  de  Kessner  =  3

Sin  visita  prenatal

Segundo  hijo

tercer  hijo

̃  1

̃  0

1
(14,82)  
231,90

(2.18)  
­4.00

(0.07)  
­45.49

(27.62)  
­169.53

(41.72)
­147.71

(61.03)
Primera  visita  prenatal  en  2º  trimestre  43,61  (28,92)

Primera  visita  prenatal  en  3er  trimestre  200.39  (52.00)

­6.54

(15,73)  
­72,97

(17,16)  
­28,96

(16.92)

0.30

(0.05)

Nota:  Los  errores  estándar  robustos  se  presentan  entre  paréntesis.
Estimados

Ecuación  (5)  Ecuación  (6)  Diferencias  ( 134.39  ­6.88
141.27

(4.64)  
222.78

(1,68)  
­3,55

(0.06)  
­61.99

(9.80)  
­162.72

(24.45)
23.11

(47.86)
79.93

(11.84)
163.00

(30.18)
29.76

(6.06)
27.05

(10.28)

18.69

(17.77)
(15.50)  
9.13

(2,78)  
­0,45

(0,09)  
16,50

(29.22)  
­6.81

(48.67)
­170.82

(78.04)
­36.32

(31.40)
37.39

(60.21)
­36.30

(16.89)
­100.02

(20.08)
1
−  0)
las  ecuaciones  (5)  y  (6)

no  fumar  durante  el  embarazo,  respectivamente.  Xit  incluye  la  edad  de  la  madre  en  el  momento  del  parto,  el  sexo  del  niño,  variables  ficticias  
325

TABLA  2  Estimaciones  de  parámetros  en  

para  tiempos  de  nacimiento,  variables  ficticias  que  indican  la  existencia  de  visitas  prenatales  y  el  valor  del  índice  "Kessner"  para  la  calidad  de  la  
atención  prenatal.  (para  más  detalles,  véase  Abrevaya,  2006).  Se  supone  que  los  efectos  fijos  no  observados  Ci  representan  el  factor  de  estilo  
de  vida  relacionado  con  la  salud  de  la  madre  (Jun  et  al.,  2016,  p.307).  Bajo  el  modelo  de  resultado  potencial  (1)  y  (2),  permitimos  que  la  
heterogeneidad  del  efecto  de  fumar  dependa  de  las  características  observadas  y  no  observadas.  Tenga  en  cuenta,  sin  embargo,  que  nuestro  
modelo  todavía  no  puede  tratar  con  algunos  problemas  de  identificación  señalados  por  Abrevaya  (2006,  Sección  5)  (p.  ej.,  efecto  de  
retroalimentación  de  un  resultado  de  nacimiento  anterior  y  cambios  correlacionados  en  el  comportamiento  materno).
Para  aplicar  el  estimador  propuesto,  queremos  variables  exógenas  Zit  que  satisfagan  las  condiciones  del  Supuesto  2.4.  Utilizo  tres  conjuntos  
de  variables  exógenas  para  Zit:  la  edad  de  la  madre  en  su  enésimo  nacimiento,  los  años  de  educación  de  la  madre  y  ambos.  La  edad  ya  está  
incluida  en  Xit,  mientras  que  la  educación  no.  Recuerda  que  podemos  usar  variables  incluidas  en  Xit  para  Zit.
Es  probable  que  ambas  variables  estén  incondicionalmente  correlacionadas  con  efectos  fijos  no  observados,  porque  es  probable  que  la  decisión  
de  una  mujer  sobre  el  momento  del  parto  dependa  de  sus  factores  de  estilo  de  vida  no  observados  y  los  factores  de  estilo  de  vida  deberían  estar  
asociados  con  su  edad  y  educación,  respectivamente.  Incluso  si  no  están  incondicionalmente  correlacionados  con  los  efectos  fijos,  deberían  
correlacionarse  después  del  condicionamiento  sobre  el  indicador  de  tabaquismo.  También  suponemos  que  no  están  correlacionados  con  los  
términos  de  error  porque  controlamos  por  un  conjunto  suficiente  de  observables  y  efectos  fijos  no  observados.
La  Tabla  2  presenta  los  resultados  de  la  estimación  de  los  parámetros  de  los  coeficientes  en  las  ecuaciones  de  resultado  potencial  
1
heterogeneidad  y  (6),  así  como  las  diferencias  entre  ellos  para  las  ecuaciones  (6)  y  (5)  (es  decir ,  
d
transformadas  
el  efecto  de  fumar  
(5)  −  
d0ependiendo  
),  que  indican  
de  
la  
las  
covariables  observadas.  Aquí,  apliqué  el  estimador  GMM  de  dos  pasos  eficiente  usando  la  edad  y  los  años  de  educación  como  un  conjunto  de  
Zit.  El  resultado  no  varía  tanto  cuando  se  usan  diferentes  Zit.  El  efecto  de  el  tabaquismo  es  significativamente  mayor  para  el  segundo  y  tercer  
parto  y  para  las  madres  sin  control  prenatal,  y  cambia  cuadráticamente  con  respecto  a  la  edad  Todas  las  variables,  excepto  sin  control  prenatal,  
primera  control  en  el  tercer  trimestre,  segundo  hijo  y  tercer  hijo,  tienen  los  mismos  signos  de  las  estimaciones  de  diferencia  que  los  resultados  de  
Abrevaya  (2006,  Tabla  VII).  Nótese  que  Abrevaya  (2006)  no  considera  el  efecto  de  interacción  del  tabaquismo  con  cada  fecha  de  nacimiento.  La  
estimación  significativa  de  indica  la  presencia  de  la  heterogeneidad  del  efecto  del  tabaquismo  que  depende  de  efectos  fijos  no  observados.
1
Machine Translated by Google

3
12 326

TABLA  3  Estimaciones  del  efecto  promedio  del  
tabaquismo  de  la  madre  durante  el  embarazo  
sobre  el  peso  de  su  hijo  al  nacer Efecto  promedio  (primer  nacimiento)

Efecto  promedio  (segundo  nacimiento)

Efecto  medio  (tercer  nacimiento)
FE  Estimator   

­121.47
(15,56)  
­76,21
(17.11)  
­128.17
(15.93)
Efecto  medio  (invariante  en  el  tiempo)  ­244,23  
(11,12)
Estimador  propuesto  (1)  
(2)  ­154,84  ­219,68

(17,18)  (38,63)  
­216,96  ­300,42
(16,73)  (49,56)  
­324,88  ­403,12
(15,92)  (47,31)  
­216,14  ­217,87
(22.68)  (18.22)
SAKAGUCHI

(3)  
­147,40
(16.27)  
­214.05
(15,83)  
­319,94
(15.42)  
­189.36
(11.77)

Nota:  Los  errores  estándar  robustos  se  presentan  entre  paréntesis.  Para  el  Estimador  Propuesto,  las  columnas  
(1),  (2)  y  (3)  reportan  los  resultados  del  estimador  propuesto  utilizando  la  edad,  la  educación  y  ambas  para  Zit,  
respectivamente.

La  Tabla  3  presenta  los  resultados  de  la  estimación  del  efecto  del  tabaquismo  promedio  utilizando  el  estimador  propuesto  y  el  estimador  FE.
Para  el  estimador  FE,  utilizo  un  modelo  de  regresión  de  efectos  fijos  que  incluye  el  indicador  de  tabaquismo,  las  covariables  observadas  Xit  y  
las  interacciones  entre  el  indicador  de  tabaquismo  y  Xit.  Los  estimadores  propuestos  son  el  estimador  GMM  de  dos  pasos  que  utiliza  los  tres  
conjuntos  de  Zit.  Las  primeras  tres  filas  de  la  Tabla  3  muestran  los  resultados  de  la  estimación  del  efecto  promedio  variable  en  el  tiempo  
usando  el  modelo  (1)  y  (2)  para  el  estimador  propuesto  y  usando  el  modelo  (3)  para  el  estimador  FE.  La  última  fila  muestra  los  resultados  de  
1 =
e0n  de  
la  estimación  del  efecto  promedio  invariante  en  el  tiempo,  donde  imponemos  la  restricción   el  m
aodelo  
mbos  (e1)  
stimadores  
y  (2)  y  el  m
modelo  
uestran  

efectos  relativamente  más  negativos  del  tabaquismo  de  una  madre  en  comparación  con  los  resultados  de  los  trabajos  anteriores.

6  CONCLUSIÓN
(3).  
que  
Los  
el  

Este  documento  propuso  un  nuevo  enfoque  de  datos  de  panel  para  identificar  y  estimar  el  ATE  variable  en  el  tiempo.  El  enfoque  puede  
identificar  y  estimar  consistentemente  el  ATE  incluso  cuando  la  heterogeneidad  del  efecto  del  tratamiento  depende  de  efectos  fijos  no  
resultados  
tabaquismo  de  una  madre  tiene  un  efecto  promedio  negativo  en  el  peso  al  nacer  de  su  hijo  en  cada  momento  del  nacimiento,  y  el  efecto  varía  
con  el  tiempo.  Aunque  los  resultados  del  estimador  propuesto  son  algo  variables  dependiendo  de  la  elección  de  Zit,  muestran  que  el  efecto  del  
tabaquismo  promedio  empeora  con  el  tiempo  de  nacimiento  adicional.  Esto  podría  deberse  a  que  las  madres  que  fuman  durante  la  última  parte  
del  embarazo  pueden  ser  fumadoras  más  intensas  y/o  porque  los  efectos  negativos  del  tabaquismo  se  acumulan  con  el  tiempo.11  El  estimador  
propuesto  proporciona  estimaciones  más  bajas  en  cada  nacimiento  que  la  estimación  de  FE.
Podríamos  sospechar  que  las  estimaciones  de  FE  están  sesgadas  hacia  arriba  para  los  efectos  promedio  porque  ignora  la  heterogeneidad  del  
efecto  de  fumar  que  depende  de  las  características  no  observadas  de  la  madre.  Los  resultados  del  estimador  propuesto  también  muestran  

observados.  En  tal  caso,  los  enfoques  de  datos  de  panel  existentes  identifican  el  ATE  solo  para  subpoblaciones  limitadas.  En  contraste,  el  
enfoque  propuesto  puede  identificar  y  estimar  el  ATE  para  toda  la  población.  El  enfoque  depende  de  la  especificación  de  efectos  fijos  lineales  
para  las  ecuaciones  de  resultados  potenciales,  donde  los  efectos  fijos  escalares  ingresan  de  manera  aditiva  a  las  dos  ecuaciones  de  resultados  
potenciales  con  diferentes  coeficientes,  y  utiliza  variables  exógenas  que  están  correlacionadas  con  efectos  fijos  condicionados  a  la  asignación  
del  tratamiento.  Recomiendo  que  los  investigadores  empíricos  que  usan  datos  de  panel  apliquen  este  enfoque  cuando  la  heterogeneidad  del  
efecto  del  tratamiento  parece  depender  de  características  individuales  no  observadas,  y  su  interés  está  en  el  ETA  para  toda  la  población.

EXPRESIONES  DE  GRATITUD
Quisiera  agradecer  al  coeditor  Edward  Vytlacil  ya  tres  árbitros  anónimos  por  sus  sugerencias  y  comentarios  constructivos.  Este  artículo  se  
basa  en  un  capítulo  de  mi  disertación  en  la  Universidad  de  Kyoto.  Agradezco  a  Yoshihiko  Nishiyama,  Ken  Yamada,  Ryo  Okui  y  Keisuke  Hirano  
sus  útiles  comentarios  y  orientación.  También  me  gustaría  agradecer  a  Naoya  Sueishi,  Susumu  Imai  y  a  los  participantes  en  los  seminarios  de  
la  Universidad  de  Kyoto  y  la  Universidad  Hitotsubashi,  y  a  los  que  participaron  en  las  sesiones  de  la  Reunión  asiática  de  la  Sociedad  
Econométrica  de  2017  en  Hong  Kong  y  la  Conferencia  anual  de  la  IAAE  de  2017  en  Sapporo  por  sus  comentarios  Una  versión  anterior  de  este  
documento  recibió  el  Premio  para  Estudiantes  de  la  IAAE  de  2017  en  la  Conferencia  Anual  de  la  IAAE  de  2017.  Reconozco  el  apoyo  financiero  
de  JSPS  KAKENHI  Número  de  subvención  JP16J01170.

11  Tenga  en  cuenta  que  el  marco  de  este  documento  no  puede  capturar  explícitamente  el  efecto  acumulado  del  tabaquismo,  a  diferencia  del  marco  de  tratamiento  
dinámico  considerado,  por  ejemplo,  por  Lechner  (2009).
3
12
Machine Translated by Google
SAKAGUCHI

INSIGNIAS  DE  INVESTIGACIÓN  ABIERTA

REFERENCIAS

Abrevaya,  J.  (2006).  Estimación  del  efecto  del  tabaquismo  en  los  resultados  del  nacimiento  utilizando  un  enfoque  de  datos  de  panel  emparejados.  Diario  de  Aplicado
Econometría,  21,  489–519.
Abrevaya,  J.,  Hsu,  YC  y  Lieli,  RP  (2015).  Estimación  de  los  efectos  del  tratamiento  promedio  condicional.  Revista  de  Estadísticas  Económicas  y  Empresariales,  33,
485–505.

Chernozhukov,  V.,  Fernández­Val,  I.,  Hahn,  J.  y  Newey,  W.  (2013).  Efectos  promedio  y  cuantiles  en  modelos  de  panel  no  separables.  econométrica,
81,  535–580.
Gibbons,  CE,  Suárez  Serrato,  JC  y  Urbancic,  MB  (2018).  Efectos  rotos  o  fijos.  Revista  de  Métodos  Econométricos,  8.
Graham,  BS  y  Powell,  JL  (2012).  Identificación  y  Estimación  de  Efectos  Parciales  Promedio  en  Coeficiente  Aleatorio  Correlacionado  “Irregular”
Modelos  de  datos  de  panel.  Econométrica,  80,  2105–2152.
Jun,  SJ,  Lee,  Y.  y  Shin,  Y.  (2016).  Efectos  del  tratamiento  con  heterogeneidad  no  observada:  un  enfoque  de  identificación  de  conjuntos.  Revista  de  Estadísticas  Económicas  y  
Empresariales,  34,  302–311.
Lechner,  M.  (2009).  Modelos  Causales  Secuenciales  para  la  Evaluación  de  Programas  de  Mercado  Laboral.  Revista  de  Estadísticas  Económicas  y  Empresariales,  27,
71–83.

Lee,  S.,  Okui,  R.  y  Whang,  YJ  (2017).  Banda  de  confianza  uniforme  doblemente  robusta  para  la  función  de  efecto  de  tratamiento  promedio  condicional.  Diario
de  Econometría  Aplicada,  32,  1–19.
327

Arellano,  M.  y  Bonhomme,  S.  (2012).  Identificación  de  características  de  distribución  en  modelos  de  datos  de  panel  de  coeficientes  aleatorios.  Revista  de  Estudios  Económicos,  79,  
987–1020.
Athey,  S.  e  Imbens,  GW  (2017).  El  estado  de  la  econometría  aplicada:  causalidad  y  evaluación  de  políticas.  Revista  de  Perspectivas  Económicas,  31,
3–32.

Callaway,  B.  y  Sant'Anna,  P.  (2018).  Diferencias  en  diferencias  con  múltiples  períodos  de  tiempo.  (Hoja  de  trabajo).
Chamberlain,  G.  (1982).  Modelos  de  regresión  multivariante  para  datos  de  panel.  Revista  de  Econometría,  18,  5–46.
Chamberlain,  G.  (1992).  Límites  de  eficiencia  para  la  regresión  semiparamétrica.  Econometrica,  60,  567–596.

Sakaguchi,  S.  (2016).  Estimación  de  los  efectos  de  tratamiento  promedio  variables  en  el  tiempo  utilizando  datos  de  panel  cuando  los  efectos  fijos  no  observados  afectan  el  potencial
Resultados  de  manera  diferente.  Cartas  económicas,  146,  82–84.
Veiga,  PV  y  Wilder,  RP  (2008).  Tabaquismo  materno  durante  el  embarazo  y  el  peso  al  nacer:  un  enfoque  de  coincidencia  de  puntuación  de  propensión.  Materno
y  Child  Health  Journal,  12,  194–203.
Walker,  MB,  Tekin,  E.  y  Wallace,  S.  (2009).  Tabaquismo  adolescente  y  resultados  del  parto.  Revista  Económica  del  Sur,  75,  892–907.
Wooldridge,  JM  (2005).  Efectos  fijos  y  estimadores  relacionados  para  modelos  de  datos  de  panel  de  efectos  de  tratamiento  y  coeficientes  aleatorios  correlacionados.
Revista  de  Economía  y  Estadística,  87,  385–390.
Wooldridge,  J.  (2010).  Análisis  Econométrico  de  Sección  Transversal  y  Datos  de  Panel  (2ª  edición).  Cambridge,  MA:  MIT  Press.

INFORMACIÓN  DE  SOPORTE
Se  puede  encontrar  información  de  apoyo  adicional  en  línea  en  la  sección  Información  de  apoyo  al  final  del  artículo.

Cómo  citar  este  artículo:  Sakaguchi  S.  Estimación  de  los  efectos  promedio  del  tratamiento  utilizando  datos  de  panel  cuando  la  
heterogeneidad  del  efecto  del  tratamiento  depende  de  efectos  fijos  no  observados.  J  Appl  Econ.  2020;35:315–327.  https://doi.org/10.1002/jae.2752

También podría gustarte