Está en la página 1de 5

|

Advanced Econometrics
AES910

Problem Set 10

Due: Wednesday, June 19th, 2019


Total Points: 10
1. Suppose you graduated from a mixed high school and your friend told you that girls who
attended girls only high schools do better in math than those who attended mixed high
schools. Suppose your professor of Advanced Econometrics (me) gives you a data set with
a random sample of senior high school girls from Distrito Metropolitano de Quito. This is
your opportunity to prove your friend hypothesis! In the data set you have the variable
score which is the score on the “ser bachiller” math test, you also have the variable
girlschool which is a dummy variable indicating whether a student attends a girls only high
school.
a) What other factors would you control for in the equation? (You should be able to
reasonably collect data on these factors.) 


Se deberia incluir: los ingresos de los padres, número de hermanos, los niveles de educaión
de la madre y el padre, puntaje de habilidad previos examen “ser bachiller”, la etnia, seria
relativamente sencillo recopilar datos de la cantidad de hermanos de los propios
estudiantes.Podría ser posible obtener puntajes de habilidad anteriores si fueran de los
archivos creados en los estudiantes cuando ingresaron a la escuela secundaria. Sería más
difícil recopilar datos sobre el ingreso de los padres y los niveles de educación sin preguntar
directamente a los padres.

b) Write an equation relating score to girlschool and the other factors you listed in part (i).

Score = 𝐵0 + 𝐵1 𝑔𝑖𝑟𝑙𝑠𝑐ℎ𝑜𝑜𝑙 + 𝐵2 𝑖𝑛𝑔𝑟𝑒𝑠𝑜 + 𝐵3 𝑛𝑢𝑚 ℎ𝑒𝑟𝑚𝑎𝑛𝑜𝑠 + 𝐵4 𝑒𝑑𝑢𝑐 𝑚𝑎𝑑𝑟𝑒 +


𝐵5 𝑒𝑑𝑢𝑐 𝑝𝑎𝑑𝑟𝑒 + 𝐵6 𝑒𝑥𝑎𝑚𝑒𝑛 + 𝑢

c) Suppose that parental support and motivation are unmeasured factors in the error

 term in part (ii). Are these likely to be correlated with girlschool? Explain. 


Es probable que estos estén relacionados con las niñas, ya que es probable que los padres
participen en la decisión sobre a qué escuela secundaria asistirá su hija. Si es probable que el
hecho de que su hija asista a una escuela solo para niñas ayude a su hija a tener un mejor
desempeño educativo, entonces los padres que quieren que su hija tenga un buen desempeño y
están dispuestos a apoyar, pueden hacer un mayor esfuerzo para que su hija ingrese a una
escuela solo para niñas en comparación con padres que brindan menos apoyo o están menos
motivados. Esto crearía problemas de sesgo para la estimación de OLS de β 1.

d) Discuss the assumptions needed for the number of girls’ high schools within a 
 20-mile
radius of a girl’s home to be a valid IV for girlschool. 


Si permitiéramos que los números denoten la cantidad de escuelas secundarias exclusivas


para niñas dentro de un radio de 20 millas de la casa de una niña se necesitaría
Relevante: cov(girlhs, numghs) ≠ 0
Exogena: E (u / numgs) = 0

Es muy probable que se satisfaga la relevancia: si una de las niñas de la muestra asiste o
no a una escuela solo para mujeres es probable que se vea afectada por su costo de viajar
a esa escuela o los costos en que incurren sus padres y la disponibilidad de lugares en
tales escuelas cerca de donde ella vive.

e) Suppose that, when you estimate the reduced form for girlschool, you find that
the
 coefficient on numghs (the number of girls’ high schools within a 20-mile radius)
is negative and statistically significant. Would you feel comfortable proceeding with IV
estimation where numghs is used as an IV for girlschool? Explain. 

Dado que el coeficiente es negativo y significativo podemos utilizar una variable
instrumento, que mida el número de asistencia a clases de las niñas en una escuela solo
para niñas, debido a que la variable instrumento es utilizada para corregir problemas de
homogeneidad presentados en el modelo planteado.

2. The dataset family includes, for women in Perú during 2009, information on family size and
education, religious and economic status variables.
a) Estimate the model


by OLS, and interpret the estimates. In particular, holding age fixed, what is the
estimated effect of another year of education on fertility? If 100 women receive another
year of education, how many fewer children are they expected to have? 


Estimate Std Error t value Pr(>l t l)


(Intercep ) -4.1383066 0.2405942 -17.2 <2e - 16
educ -0.0905755 0.0059207 -15.298 <2e - 16
age 0.3324486 0.0165495 20.088 <2e - 16
age2 -0.0026308 0.0002726 -9.651 <2e - 16

R- squared 0.5687 Adjusted R squared 0.5684

*El coeficiente educ es -0.0905755, lo que indica que un año adicional de educación con
la edad fijada reduciría el número de niños vivos en 0.0905755.

* Si 100 mujeres reciben otro año de educación, se espera que sean 9.75 niños menos

b) The variable fsixmoths is a dummy variable equal to one if the woman was born during
the first six months of the year. Assuming that fsixmoths is uncorrelated with the error
term from part (i), show that fsixmoths is a reasonable IV candidate for educ. (Hint: You
need to do a regression.) 


Estimate Std Error t value Pr(>l t l)


(Intercep ) 9.6928643 0.5980686 16.207 <2e-16
fsixmonths -0.8522854 0.1128296 -7.554 5.12e-14
age -0.1079504 0.0420402 -2.568 0.0103
age2 -0.0005056 0.0006929 -0.730 0.4657

R- squared 0.1077 Adjusted R squared 0.107

Fsixmonths es una gran determinante de la educación, incluso para controlar la edad, por lo que
tiene una fuerte correlación con ella, la razón es que todas las mujeres comienzan la escuela en
el mismo mes del año, después de haber alcanzado cierta edad, y la mayoría de ellas caen en un
cumpleaños específico además no se correlaciona con la parte de los niños que no está explicada
por la educación.

c) Estimate the model from part (i) by using fsixmoths as an IV for educ. Compare the
estimated effect of education with the OLS estimate from part (i). 


Estimate Std Error t value Pr(>l t l)


(Intercep ) -3.3878054 0.5481502 -6.180 6.98e-10
educ -0.1714989 0.0531796 -3.255 0.00127
age 0.3236052 0.0178596 18.119 <2e-16
age2 -0.0026723 0.0002797 -9.555 <2e-16

R- squared 0.5502 Adjusted R squared 0.5499

Ahora, mediante la variable instrumento, resulta que el efecto de la educación es casi tan
grande como el doble.
d) Add the binary variables electricity, television, and bcycle to the model and assume
these are exogenous. Estimate the equation by OLS and 2SLS and compare the
estimated coefficients on educ. Interpret the coefficient on television and explain why
television ownership has a negative effect on fertility. 


*OLS

Estimate Std Error t value Pr(>l t l)


(Intercep ) -4.3897837 0.2403173 -18.267 <2e-16
educ -0.0767093 0.0063526 -12.075 <2e-16
age 0.3402038 0.0164417 20.692 <2e-16
age2 -0.0027081 0.0002706 -10.010 <2e-16
Electricity -0.3027293 0.0761869 -3.974 7.20e-05
television -0.2531443 0.0914374 -2.768 0.00566
bcycle 0.3178950 0.0493661 6.440 1.33e-10

R- squared 0.5761 Adjusted R squared 0.5755

*2SLS

Estimate Std Error t value Pr(>l t l)


(Intercep ) -3.5913324 0.6450889 -5.567 2.74e-08
educ -0.1639814 0.0655269 -2.503 0.0124
age 0.3281451 0.0190587 17.218 <2e-16
age2 -0.0027222 0.0002766 -9.843 <2e-16
Electricity -0.1065314 0.1659650 -0.642 0.5210
television -0.0025550 0.2092301 -0.012 0.9903
bcycle 0.3320724 0.0515264 6.445 1.28e-10

R- squared 0.5502 Adjusted R squared 0.5499

Al incluir las variables binarias, el coeficiente educ OLS es -0.0767, lo que indica que un
año adicional de educación con la edad fijada reduciría el número de niños vivos en
0.0767, y mediante 2SLS el coeficiente educ es -0.1639, lo que indica que un año adicional
de educación con la edad fijada reduciría el número de niños vivos en 0.1639.
El coeficiente en la televisión por OLS es -0.2531 esto implica que, según otros factores,
las familias que poseen un televisor tendrán aproximadamente un niño menos que 0.2531
familias sin un televisor. La propiedad de la televisión puede ser un proxy para diferentes
cosas, incluidos los ingresos. Una interpretación causal es que la televisión proporciona
una forma alternativa de recreación por lo que afecta a la fertilidad, ya que se dedica más
horas a ver televisión y el efecto de la propiedad de la televisión es prácticamente
insignificante y estadísticamente significativo en la ecuación estimada por IV.

También podría gustarte