Está en la página 1de 59

Ingeniera Comercial

para Profesionales
Causas y consecuencias de la
endogeneidad para el estimador de MCO:
variables omitidas y error en las variables
Estimacin con variables instrumentales
(VI). Seleccin de instrumentos.
Propiedades del estimador VI
Estimacin por Mnimos Cuadrados en Dos
Etapas (MC2E)
Contrastes de endogeneidad
Causas y consecuencias de la
endogeneidad para el estimador de MCO:
variables omitidas y error en las variables.
Estimacin con variables instrumentales
(VI). Seleccin de instrumentos.
Propiedades del estimador VI
Estimacin por Mnimos Cuadrados en Dos
Etapas (MC2E)
Contrastes de endogeneidad
Consideramos el modelo de regresin
lineal general
= 0 + 1 1 + 2 2 + + +

Cundo un regresor es endgeno


Decimos que un regresor es endgeno si ste est
correlacionado con el trmino de error, tal que
Cov , 0.

Ser entonces exgeno si Cov 1 , = 0.


El supuesto que aseguraba la exogeneidad de las
variables explicativas es el S4
Establece que la media condicionada del error en las variables
explicativas tiene que ser cero
E |1 , 2 , , = 0
Vale notar que esto slo se verifica si TODOS los regresores son
exgeneos.

Si al menos uno de ellos no lo es, el supuesto no se


cumple
Y ya vimos que las consecuencias del no cumplimiento
de este supuesto son serias: el estimador MCO no ser
consistente.
Por ahora nos focalizamos en dos causas de
endogeneidad.
Caso I: variables relevantes omitidas
Modelo verdadero
= 0 + 1 1 + 2 2 +
Pero estimamos el modelo que omite 2
= 0 + 1 1 +
Ya vimos que al menos que Cov 1 , 2 = 0, Cov 1 ,
0.
El supuesto S4 no se cumple en el modelo reducido y
entonces los estimadores MCO sern sesgados e
inconsistentes
Uno puede analizar el signo del sesgo
Caso II: error de medida en las variables
explicativas.
No se observa 1 sino que se observa una variable
medida con error (proxy)
1 = 1 + 1
Podemos notar que por definicin la variable 1 est
correlacionada con 1 .
1 cuyo efecto querramos estimar, pero 1 es la variable
que efectivamente observamos.
Dado este set-up, uno puede mostrar que la variable
medida con error est correlacionada con el error del
modelo.
Causas y consecuencias de la
endogeneidad para el estimador de MCO:
variables omitidas, errores de medida.
Estimacin con variables instrumentales
(VI). Seleccin de instrumentos.
Propiedades del estimador VI
Estimacin por Mnimos Cuadrados en Dos
Etapas (MC2E)
Contrastes de endogeneidad
Vamos a ver la intuicin que est detrs de proponer el
estimador de Variables Instrumentales (VI)
Comencemos con el modelo de regresin simple
= 0 + 1 +
Ya vimos que el estimador MCO no es consistente si la
variable est correlacionada con el trmino de error.
Vamos a buscar otra variable que est fuera del
modelo, que llamaremos instrumento ( ), tal que se
cumplan los supuestos:
VI.1. no puede estar correlacionada con el trmino de
error: Cov , = 0.
VI.2. debe estar altamente correlacionada con el regresor
que sospechamos es endgeno: Cov , 0.
En el contexto de variables omitidas,
podemos esquematizar nuestro problema
como:
X causa Y, pero W tambin
W (variable omitida) est correlacionada
con X.
Z (instrumento), slo est correlacionada
con X. => cualquier influencia que pudiera
tener sobre Y es a travs de X.
Dos supuestos, uno slo de ellos
verificable.
X tiene que estar correlacionada con Z => verificable
Uno puede evaluar qu tan correlacionada estn X y Z usando
un modelo de regresin.
Z no puede estar correlacionada con Y, salvo a travs de X
Supuesto de Cov , = 0 NO ES CONTRASTABLE

Error no se observa.

Uno justifica la validez del instrumento usando su teora


econmica.
Cmo nos va a ayudar un instrumento a estimar
consistentemente el efecto de X sobre Y?
En MCO usamos la variacin en X para estimar el efecto de
X sobre Y.
Pero parte de la variacin en X se debe a W (y es la parte
que hace que X est correlacionada con el trmino de
error).
Idea: no usar slo la variacin en X que es explicada por
Z (determinstica) para inferir el efecto de X sobre Y.
Escribamos = 0 + 1 + . Si estimamos este modelo
por MCO, obtenemos = 0 + 1 . Si una buena parte de
es explicada por Z, yo tengo varianza en que es
exgena al error de la ecuacin original (siempre y
cuando Cov , = 0
Modelo de salarios log = 0 + 1 +
Notamos que el trmino de error incluye habilidad:
individuos toman decisiones sobre cunta educacin
tomar segn su nivel de habilidad.
Un instrumento: IQ, o alguna medida de CI no es un
buen instrumento ya que es una variable que debe
estar en la ecuacin de salarios.
Educacin del padre o madre?
Si, podra serlo si es que podemos sostener que estas
variables no afectan los salarios actuales de los hijos, sino
que afectaron las decisiones de educacin de ellos.
No es un buen instrumento si uno cree que la habilidad de la
madre/padre es transmisible (genes)
Mes de nacimiento del nio
No correlacionado con la habilidad del nio
Pero podra estar correlacionado con terminar o no el nivel
medio si los individuos que nacen antes alcanzan la edad
obligatoria antes de completar el nivel y como y
abandonan
Pero la correlacin puede ser baja
No es trivial encontrar instrumentos vlidos.
Sea el modelo = 0 + 1 + , veamos cmo es la
mecnica de usar los instrumentos para estimar
consistentemente los parmetros 0 y 1 .
Recordemos que establecimos que Cov , = 0, entonces
Cov , 0 1 = 0
Desarrollando,
Cov , ) Cov( , 0 ) 1 Cov( , = 0
Notamos que Cov( , 0 )=0, y despejando
,
1 =
,
Para que este estimador sea factible, necesitamos que
, 0.
Cmo operacionalizamos este estimador?
Reemplazamos los momentos poblacionales por los
muestrales.
Numerador: covarianza entre Z e Y.
Denominador: covarianza entre Z y Z.

=1( )( )
,1 =
=1( )( )
e igualmente obtenemos la ordenada al origen como

,0 = ,1
Notemos que si = , esta formula coincide con el
estimador MCO
Si los supuestos VI.1 y VI.2 se cumplen
El estimador de VI es consistente.
El estimador de VI es asintticamente normal.

Pero el estimador de VI nunca es insesgado.


Necesito muestras grandes, ya que no
necesariamente las propiedades del estimador
de VI van a ser buenas en muestras pequeas.
Toda la inferencia se hace asinttica
Se puede estimar su varianza asinttica bajo
homoscedasticidad o robusta a la heteroscedasticidad.
Los errores estndares de los estimadores de VI
son siempre ms grandes que los errores
estndares del estimador MCO (cuando este es
consistente).
Pero esta comparacin slo tiene sentido si , = 0.
Notar que,
Mientras ms correlacionada est x y z, menores sern los
errores estndares.
Cuando , es baja, VI es muy ineficiente.
Necesitamos un error estndar para el
estimador VI
El estimador de la varianza de la regresin
se obtiene como
y
n n

u
2
2
i i 0 x
1 i

2 i 1
i 1
nk nk

Adems
2
1 =
2 ,
Ejemplo usando la data MROZ del libro
log = 0 + 1 +
Objeto: estimar el rendimiento de un ao de educacin

. reg lwage educ

Source | SS df MS Number of obs = 428


-------------+------------------------------ F( 1, 426) = 56.93
Model | 26.3264193 1 26.3264193 Prob > F = 0.0000
Residual | 197.001022 426 .462443713 R-squared = 0.1179
-------------+------------------------------ Adj R-squared = 0.1158
Total | 223.327441 427 .523015084 Root MSE = .68003

------------------------------------------------------------------------------
lwage | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educ | .1086487 .0143998 7.55 0.000 .0803451 .1369523
_cons | -.1851968 .1852259 -1.00 0.318 -.5492673 .1788736
------------------------------------------------------------------------------
Usamos la educacin del padre como instrumento. Cumple
el supuesto VI.2?

. reg educ fath if lwage!=.

Source | SS df MS Number of obs = 428


-------------+------------------------------ F( 1, 426) = 88.84
Model | 384.841983 1 384.841983 Prob > F = 0.0000
Residual | 1845.35428 426 4.33181756 R-squared = 0.1726
-------------+------------------------------ Adj R-squared = 0.1706
Total | 2230.19626 427 5.22294206 Root MSE = 2.0813

------------------------------------------------------------------------------
educ | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
fatheduc | .2694416 .0285863 9.43 0.000 .2132538 .3256295
_cons | 10.23705 .2759363 37.10 0.000 9.694685 10.77942
------------------------------------------------------------------------------

. predict educ_hat
(option xb assumed; fitted values)
Ejemplo usando la data MROZ del libro
. ivreg lwage (educ=fathe)

Instrumental variables (2SLS) regression

Source | SS df MS Number of obs = 428


-------------+------------------------------ F( 1, 426) = 2.84
Model | 20.8673606 1 20.8673606 Prob > F = 0.0929
Residual | 202.46008 426 .475258404 R-squared = 0.0934
-------------+------------------------------ Adj R-squared = 0.0913
Total | 223.327441 427 .523015084 Root MSE = .68939

------------------------------------------------------------------------------
lwage | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educ | .0591735 .0351418 1.68 0.093 -.0098994 .1282463
_cons | .4411034 .4461018 0.99 0.323 -.4357312 1.317938
------------------------------------------------------------------------------
Instrumented: educ
Instruments: fatheduc
------------------------------------------------------------------------------
Es consistente este hallazgo con nuestra teora
econmica?
Si, esperabamos que el estimador MCO tuviera un sesgo
positivo.
,1 = 0.108
,1 = 0.059
Si no se cumplen los supuestos VI.1 y VI.2 el
estimador VI no ser consistente.
log = 0 + 1 +

. reg lbwght packs

Source | SS df MS Number of obs = 1388


-------------+------------------------------ F( 1, 1386) = 27.98
Model | .997781141 1 .997781141 Prob > F = 0.0000
Residual | 49.4225525 1386 .035658407 R-squared = 0.0198
-------------+------------------------------ Adj R-squared = 0.0191
Total | 50.4203336 1387 .036352079 Root MSE = .18883

------------------------------------------------------------------------------
lbwght | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
packs | -.0898131 .0169786 -5.29 0.000 -.1231197 -.0565065
_cons | 4.769404 .0053694 888.26 0.000 4.758871 4.779937
------------------------------------------------------------------------------

Problema: hay un montn de no-observables que estn correlacionados con


el consumo de cigarrillos
Podra ser el precio de los cigarrillos un buen instrumento? Veamos
Primera etapa
. reg packs cigprice

Source | SS df MS Number of obs = 1388


-------------+------------------------------ F( 1, 1386) = 0.13
Model | .011648626 1 .011648626 Prob > F = 0.7179
Residual | 123.684481 1386 .089238442 R-squared = 0.0001
-------------+------------------------------ Adj R-squared = -0.0006
Total | 123.696129 1387 .089182501 Root MSE = .29873

------------------------------------------------------------------------------
packs | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
cigprice | .0002829 .000783 0.36 0.718 -.0012531 .0018188
_cons | .0674257 .1025384 0.66 0.511 -.1337215 .2685728
------------------------------------------------------------------------------

No se encuentra una alta correlacin entre el consumo de cigarrillos y


su precio. El precio del cigarrillo parece ser un mal instrumento, qu
sucede si lo usamos de todas maneras?
El estimador VI con un instrumento dbil
. ivreg lbwght (packs= cigprice)

Instrumental variables (2SLS) regression

Source | SS df MS Number of obs = 1388


-------------+------------------------------ F( 1, 1386) = 0.12
Model | -1171.28207 1 -1171.28207 Prob > F = 0.7312
Residual | 1221.70241 1386 .881459168 R-squared = .
-------------+------------------------------ Adj R-squared = .
Total | 50.4203336 1387 .036352079 Root MSE = .93886

------------------------------------------------------------------------------
lbwght | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
packs | 2.988676 8.698888 0.34 0.731 -14.07573 20.05309
_cons | 4.448136 .9081552 4.90 0.000 2.666629 6.229644
------------------------------------------------------------------------------
Instrumented: packs
Instruments: cigprice
------------------------------------------------------------------------------

R-cuadrado es negativo por eso no se presenta; no hay


significancia de los coeficientes
Nota: de todas maneras el R-cuadrado en este contexto pierde la
interpretacin usual, ya que SCT puede ser menor que SCE
Causas y consecuencias de la
endogeneidad para el estimador de MCO:
variables omitidas, errores de medida.
Estimacin con variables instrumentales
(VI). Seleccin de instrumentos.
Propiedades del estimador VI
Estimacin por Mnimos Cuadrados en Dos
Etapas (MC2E)
Contrastes de endogeneidad
Cuando estamos en el modelo de regresin mltiple,
podemos tener varias variables endgenas y varias
variables exgenas como explicativas.
Podemos escribir el modelo como
= 0 + 1 1 + 2 1 + 1
A esta ecuacin la denominamos forma estructural.
Noten que estoy usando una notacin para referirme a
las variables explicativas
Exgenas: 1
Endgenas: 1

28
El modelo podra ser log = 0 + 1 + 1 + ,
donde suponemos que = 1 y = 1 .
La variable educ est correlacionada con el trmino de
error, por la omisin de habilidad y otras variables que
determinan salario y educacin al mismo tiempo.
Volvamos a notar nuevamente que an cuando el
regresor endgeno sea educ, todos los estimadores
MCO sern inconsistentes.
Necesitamos un instrumento 2 , que debe estar
correlacionado con el regresor endgeno. Nuevamente
debemos evaluar este supuesto estimando el modelo
auxiliar (llamado primera etapa).
1 = 0 + 1 1 + 2 2 +

29
Tenemos que evaluar si 2 = 0, para comprobar
que an luego de controlar por 1 el instrumento
est correlacionado con 1 .
La variable 2 aporta informacin a la determinacin de 1 .
Este instrumento no puede ser una variable explicativa del
modelo.
El instrumento 2 debe cumplir con los supuestos.
VI.1. 2 no puede estar correlacionado con 1
(como 1 es variable explicativa, obvio que tampoco
puede estarlo)
VI.2. 2 debe estar correlacionado con el regresor
endgeno.

30
Podemos tener ms de un instrumento y ms de
una variable endgena en la ecuacin.
MC2E es una generalizacin del estimador de VI en
estos contextos.
Si tenemos un solo instrumento MC2E es el
estimador de variables instrumentales (coinciden
plenamente).
Si tenemos ms de un instrumento, el estimador
de MC2E es un estimador de variables
instrumentales donde el instrumento usado es
1 = 0 + 1 1 + 2 2 .

31
La mecnica de cmo obtener el estimador es sencilla.
1. Limpiamos a 1 de la influencia de todo lo relacionado con
el trmino de error Esto se hace, corriendo el modelo
1 = 0 + 1 1 + 2 2 + y obteniendo 1 = 0 + 1 1 +
2 2 . Esta parte de 1 no est correlacionada con el
trmino de error si 2 es exgena. Se llama primera etapa.
2. Luego estimamos por MCO el modelo = 0 + 1 1 +
2 1 + 1 , esto es reemplazamos la variable endgena por
su contraparte exgena 1 , que captura slo la variacin
de la variable original que es explicada por 1 y 2 .
Por esto se le llama al mtodo MC2E. Si hay un solo
instrumento, MC2E es el estimador de VI.
El comando ivregres 2sls hace esto esencialmente,
tambin les calcula los errores estndares (con varias
opciones).

32
Notemos que si tenemos ms de un instrumento o
ms de una variable endgena, el mtodo sirve
igual, los pasos se resumen a
1. Primera etapa: variables endgenas sobre todas
las variables exgenas del sistema (las incluidas
en la ecuacin y las excludas).
2. Segunda etapa: variables endgenas se
reemplazan con sus predicciones de la primer
etapa.
Importante: necesitamos al menos tantos
instrumentos como variables endgenas tenemos
en la ecuacin.

33
MC2E
Necesitamos al menos un instrumento por cada variable
endgena explicativa.
Deben cumplir ambos con los dos supuestos de VI.

Tendremos una primer etapa para cada variable endgena.


Esto es, si el modelo estructural es = 0 + 1 1 + 2 2 +
1 1 + 2 2 + 3 3 + 1 y los instrumentos son 4 y 5 , la
primer etapa para los regresores endgenos sern
1 = 10 + 11 1 + 12 2 + 13 3 + 14 4 + 15 5
2 = 20 + 21 1 + 22 2 + 23 3 + 4 24 + 25 5

Necesitamos que ambos instrumentos sean significativos en las


primeras etapas.

34
MC2E
La condicin de que haya al menos una variable exgena
externa por cada variable endgena se denomina
condicin de orden.
Es necesaria y no suficiente.
La condicin suficiente para identificacin se plantea en
trminos de matrices, pero intuitivamente tiene que ver
con el hecho de que tiene que haber suficiente poder
explicativo por separado para cada instrumento (que los
instrumentos no sean redundantes)

35
Algunas observaciones
Presentacin de resultados es similar a la de MCO.
Stata ofrece este procedimiento sin necesidad de hacer
dos etapas.
Si hacemos esto a mano (primera etapa y segunda etapa)
los errores estndares que obtenemos no son los
correctos.
R2 no es relevante en VI o MC2E, nada garantiza que est
entre cero y uno.
Problemas de multicolinealidad pueden ser problemticos
Si las variables exgenas estn altamente correlacionadas, los
errores estndares de MC2E pueden ser muy altos.

36
. reg lwage educ exper

Source SS df MS Number of obs = 428


F(2, 425) = 37.02
Model 33.1324581 2 16.566229 Prob > F = 0.0000
Residual 190.194983 425 .447517607 R-squared = 0.1484
Adj R-squared = 0.1444
Total 223.327441 427 .523015084 Root MSE = .66897

lwage Coef. Std. Err. t P>|t| [95% Conf. Interval]

educ .1094888 .0141672 7.73 0.000 .0816423 .1373353


exper .0156736 .0040191 3.90 0.000 .0077738 .0235733
_cons -.4001744 .1903682 -2.10 0.036 -.7743548 -.0259939

37
. ivregress 2sls lwage (educ=fatheduc motheduc) exper, robust

Instrumental variables (2SLS) regression Number of obs = 428


Wald chi2(2) = 17.51
Prob > chi2 = 0.0002
R-squared = 0.1298
Root MSE = .67384

Robust
lwage Coef. Std. Err. z P>|z| [95% Conf. Interval]

educ .0663893 .0334647 1.98 0.047 .0007996 .1319789


exper .0154877 .0041215 3.76 0.000 .0074098 .0235656
_cons .1478413 .4277165 0.35 0.730 -.6904676 .9861502

Instrumented: educ
Instruments: exper fatheduc motheduc

38
. reg educ exper motheduc fatheduc

Source SS df MS Number of obs = 753


F(3, 749) = 86.55
Model 1006.54298 3 335.514328 Prob > F = 0.0000
Residual 2903.49686 749 3.87649781 R-squared = 0.2574
Adj R-squared = 0.2545
Total 3910.03984 752 5.19952106 Root MSE = 1.9689

educ Coef. Std. Err. t P>|t| [95% Conf. Interval]

exper .0316688 .0089348 3.54 0.000 .0141287 .049209


motheduc .1874615 .0260437 7.20 0.000 .1363343 .2385888
fatheduc .1867954 .0245437 7.61 0.000 .1386128 .234978
_cons 8.570545 .251428 34.09 0.000 8.076957 9.064132

39
Causas y consecuencias de la
endogeneidad para el estimador de MCO:
variables omitidas, errores de medida.
Estimacin con variables instrumentales
(VI). Seleccin de instrumentos.
Propiedades del estimador VI
Estimacin por Mnimos Cuadrados en Dos
Etapas (MC2E)
Contrastes de endogeneidad
Noten que
Si tenemos variables explicativas endgenas, el
estimador MCO es inconsistente, pero el
estimador de VI es consistente.
Si no hay variables explicativas endgenas, ambos
estimadores, MCO y VI, son consistentes, pero el
estimador de MCO es de mnima varianza.
Bajo la hiptesis nula (no hay variables exgenas) no
deberamos encontrar diferencias sistemticas entre los
estimadores MCO y de VI.
Parece natural disear un test en base a esta observacin
H0: Todas las variables explicativas son exgenas
H1: alguna variable X es endgena
Test de Hausman
Se basa en comparar si hay diferencias
sistemticas entre el estimador MCO y el
estimador de VI.
Si son muy distintos => problemas con
MCO.
Cmo se implementa...
Si el modelo estructural es = 0 + 1 1 + 2 1 +
1 , en la primer etapa uno estima
1 = 0 + 1 1 + 2 2 +1
Y si 1 y 2 son efectivamente exgenas, entonces
1 no puede estar correlacionada con 1 .
Esto significa que la endogeneidad de 1 proviene
de que 1 est correlacionada con 1 .
Escribimos entonces 1 = 1 1 + , y entonces 1
no estar correlacionada con 1 slo si 1 = 0.
Sustitumos en el modelo original
= 0 + 1 1 + 2 1 + 1
= 0 + 1 1 + 2 1 + 1 1 +
1 no es observable, pero podemos estimarla de la
primer etapa para 1 = 0 + 1 1 + 2 2 +1 .
Entonces, estimamos el modelo
= 0 + 1 1 + 2 1 + 1 1 +
Y evaluamos 0 : 1 = 0, 1 : 1 0.
Bajo 0 , 1 es exgena. Bajo 1 , 1 es endgena.
Si sospechamos de heteroscedasticidad, el contraste puede
hacerse robusto.
Modelo estructural log = 0 + 1 + 1 + .
Instrumento para educ, educacin de madre y padre
Primera etapa
. reg educ exper motheduc fatheduc

Source SS df MS Number of obs = 753


F(3, 749) = 86.55
Model 1006.54298 3 335.514328 Prob > F = 0.0000
Residual 2903.49686 749 3.87649781 R-squared = 0.2574
Adj R-squared = 0.2545
Total 3910.03984 752 5.19952106 Root MSE = 1.9689

educ Coef. Std. Err. t P>|t| [95% Conf. Interval]

exper .0316688 .0089348 3.54 0.000 .0141287 .049209


motheduc .1874615 .0260437 7.20 0.000 .1363343 .2385888
fatheduc .1867954 .0245437 7.61 0.000 .1386128 .234978
_cons 8.570545 .251428 34.09 0.000 8.076957 9.064132
Predigo el residuo de esta regresin, con predict res, res
Para evaluar si divorcio es endgeno, corremos modelo
aumentado por esta variable
. predict res, res

. reg lwage educ exper res

Source SS df MS Number of obs = 428


F(3, 424) = 25.63
Model 34.2800885 3 11.4266962 Prob > F = 0.0000
Residual 189.047352 424 .445866397 R-squared = 0.1535
Adj R-squared = 0.1475
Total 223.327441 427 .523015084 Root MSE = .66773

lwage Coef. Std. Err. t P>|t| [95% Conf. Interval]

educ .0689671 .0289466 2.38 0.018 .0120704 .1258638


exper .0164092 .0040378 4.06 0.000 .0084727 .0243457
res .0521989 .0325359 1.60 0.109 -.0117528 .1161507
_cons .0921001 .3609096 0.26 0.799 -.6172946 .8014948
No podemos rechazar que el coeficiente del resdiduo es
cero => no podemos rechazar exogeneidad.
Notamos que los estimadores obtenidos en esta
regresin auxiliar son los mismos estimadores de VI.
. ivregress 2sls lwage (educ=fatheduc motheduc) exper, robust

Instrumental variables (2SLS) regression Number of obs = 428


Wald chi2(2) = 17.51
Prob > chi2 = 0.0002
R-squared = 0.1298
Root MSE = .67384

Robust
lwage Coef. Std. Err. z P>|z| [95% Conf. Interval]

educ .0663893 .0334647 1.98 0.047 .0007996 .1319789


exper .0154877 .0041215 3.76 0.000 .0074098 .0235656
_cons .1478413 .4277165 0.35 0.730 -.6904676 .9861502

Instrumented: educ
Instruments: exper fatheduc motheduc
Bedard y Deschenes (JHR, 2005) utilizan del Censo de
1980 en USA para estimar el efecto del divorcio sobre
la situacin econmica de la mujer. La muestra est
compuesta por mujeres blancas, nacidas en USA, entre
21 y 40 aos de edad, casadas por lo menos una vez y
con al menos un hijo.
Modelo = 0 + 1 + +
Variable dependiente: , varios outcomes; ingreso del hogar,
ingreso de la mujer, pobreza, horas de trabajo, etc.
Variable de inters: , dicotmica igual a 1 si hubo divorcio,
cero en cualquier otro caso.
, otros controles, como edad, edad, al momento de casarse,
edad al momento de tener el primer hijo, nivel educativo,
estado de, residencia y estado de nacimiento.

48
Por qu D es potencialmente endgena?
El divorcio es ms comn en grupos menos educados y
con mayor desventaja social-econmica
Mujeres, que ante una relacin desfavorable, se separan
pueden diferir de las que no se separan en diversos no-
observables.
Qu instrumento se propone?
Sexo del primer nio nacido en el matrimonio. Divorcios
ms frecuentes luego que nacen nias que cuando nacen
nios

49
(1) (2) (3) (4) (5) (6) (7)
VARIABLES std_hhinc poor inc_non inc_woman WORKED Weeks worked Hours
YR last year worked
last week

end_marr -1,717.6*** 0.143*** -10,338.5*** 3,946.2*** 0.152*** 8.883*** 7.712***


(17.539) (0.001) (40.734) (21.417) (0.002) (0.073) (0.065)

Observations 576,664 576,664 576,664 576,664 576,664 576,664 576,664


R-squared 0.167 0.082 0.218 0.125 0.066 0.068 0.083
Robust standard errors in parentheses
*** p<0.01, ** p<0.05, * p<0.1

50
(1) (2) (3) (4) (5) (6) (7)
VARIABLES Ingreso Pobre Ingreso Hogar Ingreso Trabaj el Semanas Horas
Familiar pc no aportado Mujer ao pasado trabajadas el trabajadas
por Mujer ao pasado la semana
pasada

D-OLS -1,717.6*** 0.143*** -10,338.5*** 3,946.2*** 0.152*** 8.883*** 7.712***


(17.539) (0.001) (40.734) (21.417) (0.002) (0.073) (0.065)

R2 0.167 0.082 0.218 0.125 0.066 0.068 0.083

D-IV 2,059.4 0.156 -3,108.8 6,164.8*** 0.556*** 28.330*** 20.041***


(1,801.404) (0.093) (4,066.368) (1,938.311) (0.177) (8.020) (6.541)

Observaciones 576,664 576,664 576,664 576,664 576,664 576,664 576,664

Robust standard errors in parentheses


*** p<0.01, ** p<0.05,

51
Primera etapa

(1)
VARIABLES end_marr

isGirl 0.0075***
(0.001)

Observations 576,664
R-squared 0.054
Robust standard errors in parentheses
*** p<0.01, ** p<0.05, * p<0.1

52
Card y Krueger (1993) utilizan la proximidad
geogrfica a una universidad en USA para estimar
los retornos a la educacin.
El modelo

Instrumento: si el individuo cuando joven tena


universidades con carreras de 4 aos (nearc4) y/o
centros de estudios superiores con carreras de dos
aos (nearc2).
Veamos cmo luce la primera etapa

53
Primera etapa, probamos ambos instrumentos,
juntos y por separado.
(1) (2) (3)
years of schooling years of schooling years of schooling
VARIABLES 1976 1976 1976

=1 if near 4 yr college, 1966 0.320*** 0.321***


(0.085) (0.085)
=1 if near 2 yr college, 1966 0.122 0.123
(0.078) (0.078)

Observations 3,010 3,010 3,010


R-squared 0.477 0.475 0.478
Robust standard errors in parentheses
*** p<0.01, ** p<0.05, * p<0.1

54
Estimador de variables instrumentales

(1) (2) (3) (4)


VARIABLES log(wage) log(wage) log(wage) log(wage)
OLS IV (Nearc4) IV (Nearc2) IV (Ambos)

years of schooling, 1976 0.075*** 0.132** 0.293 0.157***


(0.004) (0.054) (0.186) (0.052)

Observations 3,010 3,010 3,010 3,010

Robust standard errors in parentheses


*** p<0.01, ** p<0.05, * p<0.1

55
Charter schools en USA, son similares a nuestros
colegios municipales de administracin delegadas
Financiamiento pblico
Mayores grados de libertad
Datos de una escuela de Massachusetts (Angrist et
al., 2010).
Sobre-inscripcin: aleatorizacin
Quien asiste o no no es aleatorio, pero est altamente
correlacionado con la lotera o aleatorizacin.

56
Modelo:

= 0 + 1 + +

X: diversos controles
D: Asiste o no a charter schoo

First stage

= 0 + 1 + +

L: si gana la lotera o no

Forma Reducida:

= 0 + 1 + +

57
Modelo:

Columna (1):
Efectos heterogneos por etnia
Efectos similares por etnia

Columna (2):
Efectos heterogneos por score
en lnea base.
Programa beneficia a los nios
con desempeo ms bajo en la
LB.

58
Ingeniera Comercial