Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Trabajo Calificado
Trabajo Calificado
Trabajo Aplicado
Instrucciones
(1) Grupos de 3 o 4 personas.
(2) El lı́mite de entrega de este trabajo es hasta las 23:59pm del domingo 22 de mayo. No se aceptarán
trabajos fuera de esta fecha.
(3) Se debe subir al sistema PAIDEIA un documento de texto donde respondan las preguntas y adjuntar
toda programación utilizada. Esta programación debe presentarse de manera ordenada.
1 Heterocedasticidad
Considere la base de datos “base anemia.dta que se encuentra en PAIDEIA. Esta base de datos cuenta
con información sobre la anemia en el Perú, construido a partir de la Encuesta Nacional Demográfica de
Salud (ENDES). A partir de esta base de datos, se pide estimar el siguiente modelo:
donde:
1
Variables Valor
sexo sexo del niño
1: Mujer
0: Hombre
edadmeses Edad del niño en meses
pesoalnacer Peso del niño al nacer (kilos)
d anemia Presencia de Anemia en el niño
0: Niño no tiene anemia
1: Niño tiene anemia
anemia Categorı́a Anemia en el niño
1: No anémico
2: Leve
3: Moderada
4: Grave
edadmadre Edad de la madre en años
educmadre Nivel Educativo de la madre
0: Primaria o menos
1: Secundaria
2: Superior
lengmaterna Lengua materna de la madre
0: Lengua Indı́gena
1: Castellano
2: Lengua Extranjera
anemiamadre Presencia de Anemia en la madre
0: Madre no tiene anemia
1: Madre tiene anemia
area 1: Urbano
0: Rural
region 25 regiones
altitud Altitud en metros
1. Implementar paso a paso (programar) el test de White para detectar heterocedasticidad. (1 punto)
4. En una tabla resumen, muestre los resultados principales de cada test. De acuerdo a cada uno,
¿Existe heterocedasticidad en el modelo (1)? (1 punto)
2 Autocorrelación
Considere el siguiente modelo:
Yt = βXt + t
t = φt−1 + µt (2)
con |φ| < 1 y µt ∼ iid(0, σu2 )
2
2. Calcule la esperanza, la función de autocovarianza y la función de autocorrelación de las pertur-
baciones t . Luego, a partir de esta última calcule la matriz de varianzas y covarianzas de las
perturbaciones. (1 punto)
3. Responda: ¿t es homocedástico?, ¿t es autocorrelacionado? (0.5 puntos)
4. ¿Qué propiedades tienen los estimadores MCO en este modelo? (1 punto)
5. Explique cómo serı́a la aplicación de mı́nimos cuadrados generalizados (MCG). Explique los métodos
de estimación Cohcrane-Orcutt y el método Prais-Winsten. (1 punto)
6. Explique cómo se estimarı́a el modelo en el caso que φ fuese desconocido (MCGF). (1 punto)
El siguiente archivo de datos “grilic.dta”, contiene las siguientes variables: rns, rns80, mrt, mrt80, smsa,
smsa80, med, iq, kww, year, age, age80, s, s80, expr, expr80, tenure, tenure80, lw y lw80 (en este
orden) . La variable year es el año del primer punto en el tiempo. Las variables sin “80” son para el
primer punto, y las que tienen “80” son para 1980. La definición de las variables para el primer punto es:
Variable Descripción
rns dummy para residencia en los estados del sur.
mrt dummy para el estado marital (1 if married).
smsa dummy para residencia en áreas metropolitanas.
med educación de la madre en años
kww puntaje de la prueba “Knowledge of the World of Work”
iq puntaje IQ
age edad del individuo
expr experiencia en años
tenure permanencia en años
lw logaritmo del salario
Al momento de eliminar los individuos de raza negra, la muestra de Blackburn-Neumark tiene 815 ob-
servaciones. También se eliminan los casos en los que falta información sobre la educación de la madre,
lo que reduce el tamaño de la muestra a 758.
3
1. Considerar la ecuación salarial:
LW = βS + γIQ + δ 0 h +
donde LW es el logaritmo de salarios, S es escolaridad, y
0
h ≡ (expr, tenure, rns, smsa, year dummies)
(No es necesario incluir una constante porque es una combinación lineal de las dummies de año.
Pero si insiste en incluir la constante en su modelo, no se olvide de descartar una variable dummy
del año). Elabore y reporte una tabla similar a la tabla anterior. En su estimación 2SLS de la
ecuación salarial, el conjunto de instrumentos debe consistir en regresores predeterminados (S y h)
y variables predeterminadas excluidas (med, kww, mrt, age). ¿Es la magnitud relativa de las tres
estimaciones del coeficiente de escolaridad coherente con la predicción basada en la variable omitida
y los sesgos de error en la variable? (2 puntos)
2. Para la estimación 2SLS de la ecuación salarial de la pregunta 1, calcular el test J (Sargan-test) (el
estadı́stico debe ser 87.6555). ¿Cuales deberı́an ser los grados de libertad? Calcular el p − value (1
punto)
3. Obtenga la estimación 2SLS ejecutando dos regresiones. Verifique que los errores estándar propor-
cionados por la segunda regresión de estado sean diferentes de los que obtuvo en el ejercicio 1. (2
puntos)
4. Griliches menciona que escolaridad, también, debe ser endógena. ¿Cuál es su argumento? Estimar
por 2SLS la ecuación salarial, tratando tanto iq y s como endógena. ¿Qué pasa con el coeficiente de
escolaridad? ¿Cómo explicarı́a la diferencia entre el estimador 2SLS del coeficiente de escolaridad
estimado en esta pregunta y el estimador 2SLS de la pregunta 1? Calcular el estadı́stico J (debe
ser 13.268) y su p − value. (2 puntos)
5. Teniendo en cuenta la ecuación salarial que calculó en la pregunta 4 con escolaridad como endógena
por 2SLS, el valor grande del estadı́stico J es preocupante. Por lo tanto, considere eliminar tanto
las variables med como kww de la lista de instrumentos. ¿La condición de orden para identificación
aún se cumple? ¿Qué pasa con las estimaciones 2SLS? (El coeficiente de escolaridad será −529.3%).
¿Cuál cree que es el problema? (Pista: verifique la primera etapa) (1 punto)
4
4 Analizando Instrumentos
Suponga que est interesado en el impacto que puede generar tener una laptop en las calificaciones uni-
versitarias. El modelo es el siguiente:
grades=β0 + β1 computer +
donde computer es una variable binaria que indica si una persona es dueña de la laptop.