Está en la página 1de 5

Pontificia Universidad Católica del Perú, Escuela de Posgrado, Maestrı́a en Economı́a

ECO743: Econometrı́a Intermedia

Trabajo Aplicado

Profesor: Juan Palomino


May 3, 2022

Instrucciones
(1) Grupos de 3 o 4 personas.

(2) El lı́mite de entrega de este trabajo es hasta las 23:59pm del domingo 22 de mayo. No se aceptarán
trabajos fuera de esta fecha.

(3) Se debe subir al sistema PAIDEIA un documento de texto donde respondan las preguntas y adjuntar
toda programación utilizada. Esta programación debe presentarse de manera ordenada.

1 Heterocedasticidad
Considere la base de datos “base anemia.dta que se encuentra en PAIDEIA. Esta base de datos cuenta
con información sobre la anemia en el Perú, construido a partir de la Encuesta Nacional Demográfica de
Salud (ENDES). A partir de esta base de datos, se pide estimar el siguiente modelo:

hemoglobina = β0 + β1 sexo + β2 edadmeses + β3 pesoalnacer + β4 edadmadre + β5 educmadre


+ β6 lengmaterna + β7 anemiamadre + β8 area + β9 altitud +  (1)

donde:

1
Variables Valor
sexo sexo del niño
1: Mujer
0: Hombre
edadmeses Edad del niño en meses
pesoalnacer Peso del niño al nacer (kilos)
d anemia Presencia de Anemia en el niño
0: Niño no tiene anemia
1: Niño tiene anemia
anemia Categorı́a Anemia en el niño
1: No anémico
2: Leve
3: Moderada
4: Grave
edadmadre Edad de la madre en años
educmadre Nivel Educativo de la madre
0: Primaria o menos
1: Secundaria
2: Superior
lengmaterna Lengua materna de la madre
0: Lengua Indı́gena
1: Castellano
2: Lengua Extranjera
anemiamadre Presencia de Anemia en la madre
0: Madre no tiene anemia
1: Madre tiene anemia
area 1: Urbano
0: Rural
region 25 regiones
altitud Altitud en metros

Utilizando el software STATA o RStudio, se pide:

1. Implementar paso a paso (programar) el test de White para detectar heterocedasticidad. (1 punto)

2. Implementar paso a paso (programar) el test de Breusch-Pagan para detectar heterocedasticidad.


(1 punto)
3. Implementar paso a paso (programar) el test de Goldfeld y Quandt1 para detectar heterocedastici-
dad. (1 punto)

4. En una tabla resumen, muestre los resultados principales de cada test. De acuerdo a cada uno,
¿Existe heterocedasticidad en el modelo (1)? (1 punto)

2 Autocorrelación
Considere el siguiente modelo:

Yt = βXt + t
t = φt−1 + µt (2)
con |φ| < 1 y µt ∼ iid(0, σu2 )

1. ¿Qué tipo de proceso autoregresivo presenta las perturbaciones t ? (0.5 puntos)


1 Indique de manera explı́cita el percentil de observaciones que optará por eliminar

2
2. Calcule la esperanza, la función de autocovarianza y la función de autocorrelación de las pertur-
baciones t . Luego, a partir de esta última calcule la matriz de varianzas y covarianzas de las
perturbaciones. (1 punto)
3. Responda: ¿t es homocedástico?, ¿t es autocorrelacionado? (0.5 puntos)
4. ¿Qué propiedades tienen los estimadores MCO en este modelo? (1 punto)

5. Explique cómo serı́a la aplicación de mı́nimos cuadrados generalizados (MCG). Explique los métodos
de estimación Cohcrane-Orcutt y el método Prais-Winsten. (1 punto)
6. Explique cómo se estimarı́a el modelo en el caso que φ fuese desconocido (MCGF). (1 punto)

3 Aplicación de Variables Instrumentales


Leer Griliches (1976) antes de responder. El objetivo del trabajo es calcular la ecuación salarial esti-
mada por Griliches usando un extracto de la base de datos de NLS-Y de Blackburn y Neumark (1992)
y Card (1993). El NLS-Y es una base de datos de panel, el cual tiene al mismo conjunto de hombres
jóvenes encuestados en varios años en el tiempo (sin embargo, no aprovecharemos la funcionalidad del
panel en este ejercicio). La base de datos contiene información sobre esos individuos en dos puntos de
tiempo. Primero, el primer año en que los salarios y otras variables están disponibles, y segundo, en 1980.

El siguiente archivo de datos “grilic.dta”, contiene las siguientes variables: rns, rns80, mrt, mrt80, smsa,
smsa80, med, iq, kww, year, age, age80, s, s80, expr, expr80, tenure, tenure80, lw y lw80 (en este
orden) . La variable year es el año del primer punto en el tiempo. Las variables sin “80” son para el
primer punto, y las que tienen “80” son para 1980. La definición de las variables para el primer punto es:

Variable Descripción
rns dummy para residencia en los estados del sur.
mrt dummy para el estado marital (1 if married).
smsa dummy para residencia en áreas metropolitanas.
med educación de la madre en años
kww puntaje de la prueba “Knowledge of the World of Work”
iq puntaje IQ
age edad del individuo
expr experiencia en años
tenure permanencia en años
lw logaritmo del salario

Al momento de eliminar los individuos de raza negra, la muestra de Blackburn-Neumark tiene 815 ob-
servaciones. También se eliminan los casos en los que falta información sobre la educación de la madre,
lo que reduce el tamaño de la muestra a 758.

Pueden usar STATA o Rstudio para resolver el ejercicio.

3
1. Considerar la ecuación salarial:
LW = βS + γIQ + δ 0 h + 
donde LW es el logaritmo de salarios, S es escolaridad, y
0
h ≡ (expr, tenure, rns, smsa, year dummies)

(No es necesario incluir una constante porque es una combinación lineal de las dummies de año.
Pero si insiste en incluir la constante en su modelo, no se olvide de descartar una variable dummy
del año). Elabore y reporte una tabla similar a la tabla anterior. En su estimación 2SLS de la
ecuación salarial, el conjunto de instrumentos debe consistir en regresores predeterminados (S y h)
y variables predeterminadas excluidas (med, kww, mrt, age). ¿Es la magnitud relativa de las tres
estimaciones del coeficiente de escolaridad coherente con la predicción basada en la variable omitida
y los sesgos de error en la variable? (2 puntos)

2. Para la estimación 2SLS de la ecuación salarial de la pregunta 1, calcular el test J (Sargan-test) (el
estadı́stico debe ser 87.6555). ¿Cuales deberı́an ser los grados de libertad? Calcular el p − value (1
punto)
3. Obtenga la estimación 2SLS ejecutando dos regresiones. Verifique que los errores estándar propor-
cionados por la segunda regresión de estado sean diferentes de los que obtuvo en el ejercicio 1. (2
puntos)
4. Griliches menciona que escolaridad, también, debe ser endógena. ¿Cuál es su argumento? Estimar
por 2SLS la ecuación salarial, tratando tanto iq y s como endógena. ¿Qué pasa con el coeficiente de
escolaridad? ¿Cómo explicarı́a la diferencia entre el estimador 2SLS del coeficiente de escolaridad
estimado en esta pregunta y el estimador 2SLS de la pregunta 1? Calcular el estadı́stico J (debe
ser 13.268) y su p − value. (2 puntos)
5. Teniendo en cuenta la ecuación salarial que calculó en la pregunta 4 con escolaridad como endógena
por 2SLS, el valor grande del estadı́stico J es preocupante. Por lo tanto, considere eliminar tanto
las variables med como kww de la lista de instrumentos. ¿La condición de orden para identificación
aún se cumple? ¿Qué pasa con las estimaciones 2SLS? (El coeficiente de escolaridad será −529.3%).
¿Cuál cree que es el problema? (Pista: verifique la primera etapa) (1 punto)

4
4 Analizando Instrumentos
Suponga que est interesado en el impacto que puede generar tener una laptop en las calificaciones uni-
versitarias. El modelo es el siguiente:

grades=β0 + β1 computer +
donde computer es una variable binaria que indica si una persona es dueña de la laptop.

1. ¿Por qué computer podrı́a ser endógena? (0.5 puntos)


2. ¿Es el ingreso anual de los padres un buen instrumento para computer ? (0.5 puntos)
3. Supongamos que, hace cuatro aos, la universidad concedi becas para comprar ordenadores a aprox-
imadamente el 50% de los estudiantes entrantes, y los estudiantes que recibieron becas fueron
elegidos al azar. Explica cómo usaras esta informacin para construir una variable instrumental
para computer. (1 punto)
4. Escriba las condiciones de momento para el modelo anterior si usa beca como un instrumento. (1
punto)

También podría gustarte