Taller de Métodos Cuantitativos

Taller 2 – Métodos Cuantitativos
Alejandra Moreno Barrera

Adriana Rincón
1. Usar la base de datos WAGE2
a. Estimar el siguiente modelo y reportar la salida (pegar la tabla y la ecuación

estimada)
𝐥𝐨𝐠(𝒘𝒂𝒈𝒆) = 𝜷𝟎 + 𝜷𝟏 𝑬𝒅𝒖𝒄 + 𝜷𝟐 𝑬𝒙𝒑𝒆𝒓 + 𝜷𝟑 𝑻𝒆𝒏𝒖𝒓𝒆 + 𝜷𝟒 𝑴𝒂𝒓𝒓𝒊𝒆𝒅 + 𝜷𝟓 𝑺𝒐𝒖𝒕𝒉

+ 𝜷𝟕 𝑼𝒓𝒃𝒂𝒏 + 𝒖
Donde 𝒘𝒂𝒈𝒆 es el salario mensual, 𝑬𝒅𝒖𝒄 es la educación en años, 𝑬𝒙𝒑𝒆𝒓 es la

experiencia anual, 𝑻𝒆𝒏𝒖𝒓𝒆 es cuantos años el/ella han trabajado en el trabajo actual,
𝑴𝒂𝒓𝒓𝒊𝒆𝒅 toma 1 para los trabajadores que están casados, 𝑺𝒐𝒖𝒕𝒉 toma el valor de 1
si el trabajador vive en el sur, 𝑼𝒓𝒃𝒂𝒏 toma el valor de 1 si el trabajador vive en
región urbana.
𝐥𝐨𝐠(𝒘𝒂𝒈𝒆) = 𝟓. 𝟑 + 𝟎. 𝟎𝟕𝑬𝒅𝒖𝒄 + 𝟎. 𝟎𝟏𝟒𝑬𝒙𝒑𝒆𝒓 + 𝟎. 𝟎𝟏𝟐𝑻𝒆𝒏𝒖𝒓𝒆

+ 𝟎. 𝟐𝟏𝟏𝑴𝒂𝒓𝒓𝒊𝒆𝒅 − 𝟎. 𝟏𝟐𝟏𝑺𝒐𝒖𝒕𝒉 + 𝟎. 𝟏𝟔𝟗𝑼𝒓𝒃𝒂𝒏 + 𝒖
b. Manteniendo otros factores fijos, ¿cuál es la diferencia aproximada en salario

mensual entre trabajadores casados y no casados? ¿Es estadísticamente
significativa? (Escribir la hipótesis)
En la anterior regresión se muestra la relación de la variable married con el salario,
eliminando todas las demás variables, los coeficientes tienen una interpretación sencilla, el
intercepto es el salario promedio de los trabajadores no casados en la muestra (si married =
0), de manera que los trabajadores casados ganan, en promedio $178,6 como salario mensual
El coeficiente de married es la diferencia entre el salario promedio de los trabajadores

casados y no casados. Por tanto, en la muestra, el salario promedio de los trabajadores
casados es 798,4 – 178,6 = 619,8, es decir, $619,8 como salario mensual.
𝐻0 : 𝑁𝑜 𝑒𝑥𝑖𝑠𝑡𝑒 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎 𝑒𝑛𝑡𝑟𝑒 𝑒𝑙 𝑠𝑎𝑙𝑎𝑟𝑖𝑜 𝑑𝑒 𝑐𝑎𝑠𝑎𝑑𝑜𝑠 𝑦 𝑛𝑜 𝑐𝑎𝑠𝑎𝑑𝑜
𝐻1 : 𝐸𝑥𝑖𝑠𝑡𝑒 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎 𝑒𝑛𝑡𝑟𝑒 𝑒𝑙 𝑠𝑎𝑙𝑎𝑟𝑖𝑜 𝑑𝑒 𝑐𝑎𝑠𝑎𝑑𝑜𝑠 𝑦 𝑛𝑜 𝑐𝑎𝑠𝑎𝑑𝑜𝑠
El valor promedio de los salarios es estadísticamente significativo dado que se rechaza la

hipótesis nula de que el promedio del salario de los trabajadores casados es igual a cero bajo
un nivel de significancia del 5%, dado que la probabilidad asociada a la distribución t student
Pr (|T| < |t) = 0.0000 < 0.05.
c. Extender el modelo original para mostrar que los retornos para educación (es
decir, cuánto aumenta el salario a medida que aumentamos la educación en un
año) depende de si los trabajadores viven o no en ciudades urbanas y comprueban
si este es significativo o no.
Los retornos a la educación no dependen de si los trabajadores viven o no en ciudades

urbanas, dado que la interacción mediante la variable educación y urban no es
estadísticamente significativa dado que se rechaza la hipótesis nula bajo un nivel de
significancia del 5% pues el p- value es mayor (0.096>0.005).
Manteniendo constante las demás variables, las personas que viven en ciudades
Completar pag 234 wooldridge
2. Usar la base de datos HSEINV

La base de datos contiene las observaciones anuales sobre la inversión en vivienda y un índice
de precios de vivienda en Estados Unidos para los años 1947 a 1988. Sea el 𝒊𝒏𝒗𝒑𝒄 la
inversión real en vivienda per cápita (en miles de dólares) y sea 𝑝𝑟𝑖𝑐𝑒 el índice de precios de
vivienda (igual a 1 en 1982). La simple ecuación sería la siguiente:
𝐥𝐨𝐠(𝒊𝒏𝒗𝒑𝒄) = 𝜷𝟎 + 𝜷𝟏 𝐥𝐨𝐠(𝒑𝒓𝒊𝒄𝒆) + 𝒖 (*)
a. Estimar el modelo (*) mostrar el resultado y probar si el coeficiente de 𝛽1 es

estadísticamente significativo o no. Realizar la prueba a un nivel de 5% de
significancia. Interpretar el coeficiente 𝛽1
𝐥𝐨𝐠(𝒊𝒏𝒗𝒑𝒄) = −𝟎. 𝟓𝟓 + 𝟏. 𝟐𝟒 𝐥𝐨𝐠(𝒑𝒓𝒊𝒄𝒆) + 𝒖
 Test de significancia individual
𝐻0 : 𝛽1 = 0 , 𝑒𝑙 𝑝𝑎𝑟á𝑚𝑒𝑡𝑟𝑜 𝑛𝑜 𝑒𝑠 𝑒𝑠𝑡𝑎𝑑í𝑠𝑡𝑖𝑐𝑎𝑚𝑒𝑛𝑡𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑡𝑖𝑣𝑜
𝐻1 : 𝛽1 ≠ 0, 𝑒𝑙 𝑝𝑎𝑟á𝑚𝑒𝑡𝑟𝑜 𝑒𝑠 𝑒𝑠𝑡𝑎𝑑í𝑠𝑡𝑖𝑐𝑎𝑚𝑒𝑛𝑡𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑡𝑖𝑣𝑜
A partir de la regresión, se detalla que el p-value asociado a la distribución t student

corresponde a 0.002 que es menor al nivel de significancia de 0.05, por tanto, se rechaza la
hipotesis nula y se concluye que el coeficiente 𝛽1 es estadísticamente significativo.
Un aumento del 1% en el indice de precios de vivienda , genera un aumento en 124% en la

inversion real en vivienda en Estados Unidos.
b. Ahora agregue la variable de tendencia "t" a la ecuación y vuelva a estimar el

modelo y presente el resultado.
𝐥𝐨𝐠(𝒊𝒏𝒗𝒑𝒄) = −𝟎. 𝟗𝟏𝟑 − 𝟎. 𝟑𝟖 𝐥𝐨𝐠(𝒑𝒓𝒊𝒄𝒆) + 𝟎. 𝟎𝟎𝟗𝒕 + 𝒖
c. Pruebe individualmente si los coeficientes de log(𝑝𝑟𝑖𝑐𝑒) y la variable de

tendencia (t) son estadísticamente significativos o no. Realizar la prueba para un
nivel de significación del 5%.
 Test de significancia individual para log(price)

corresponde a 0.578 que es mayor al nivel de significancia de 0.05, por tanto, no se rechaza
la hipotesis nula y se concluye que el parámetro 𝛽1 asociado a log(price) no es
estadísticamente significativo.
 Test de significancia individual para t

corresponde a 0.008 que es menor al nivel de significancia de 0.05, por tanto, se acepta la
hipotesis nula y se concluye que el parámetro asociado a la tendencia es estadísticamente
significativo.
d. Explique en sus propias palabras la diferencia entre los modelos estimados en la
parte a y b
A partir de los modelos se detalla que el parámetro deja de ser estadisticamente significativo
dado que se agrega la variable tendencia a la regresión, lo que prodría indicar una relación
espuria entre la inversión en vivienda y el indice de precios, debido a que a partir de la
regresión del literal a las dos variable muestran una tendencia ascedente en el tiempo, y como
se muestra más adelante graficamente.
En algunos casos, la adición de una tendencia en el tiempo hace que una variable explicativa
clave resulte más significativa. Esto puede suceder si las variables dependiente e
independiente tienen tendencias distintas (por ejemplo, una hacia arriba y otra hacia abajo),
pero el movimiento en la variable independiente alrededor de su línea de tendencia provoca
un movimiento de la variable dependiente alejándose de su línea de tendencia. (Wooldridge,
2010)
e. Ahora pruebe una raiz unitaria en log(𝑖𝑛𝑣𝑝𝑐) incluyendo una tendencia líneal de
tiempo y dos rezagos ∆ log(𝑖𝑛𝑣𝑝𝑐) de a un nivel de significancia del 5%.
𝑯𝟎 : 𝐿𝑎 𝑠𝑒𝑟𝑖𝑒 𝑑𝑒 𝑙𝑎 𝑖𝑛𝑣𝑒𝑟𝑠𝑖ó𝑛 𝑟𝑒𝑎𝑙 𝑒𝑛 𝑣𝑖𝑣𝑖𝑒𝑛𝑑𝑎 𝑝𝑒𝑟 𝑐á𝑝𝑖𝑡𝑎 𝑝𝑟𝑒𝑠𝑒𝑛𝑡𝑎
𝑟𝑎í𝑧 𝑢𝑛𝑖𝑡𝑎𝑟𝑖𝑎 (𝐿𝑎 𝑠𝑒𝑟𝑖𝑒 𝑛𝑜 𝑒𝑠 𝑒𝑠𝑡𝑎𝑐𝑖𝑜𝑛𝑎𝑟𝑖𝑎)
𝑯𝟏 : 𝐿𝑎 𝑠𝑒𝑟𝑖𝑒 𝑑𝑒 𝑙𝑎 𝑖𝑛𝑣𝑒𝑟𝑠𝑖ó𝑛 𝑟𝑒𝑎𝑙 𝑒𝑛 𝑣𝑖𝑣𝑖𝑒𝑛𝑑𝑎 𝑝𝑒𝑟 𝑐á𝑝𝑖𝑡𝑎 𝑛𝑜 𝑝𝑟𝑒𝑠𝑒𝑛𝑡𝑎

𝑟𝑎í𝑧 𝑢𝑛𝑖𝑡𝑎𝑟𝑖𝑎 (𝐿𝑎 𝑠𝑒𝑟𝑖𝑒 𝑒𝑠 𝑒𝑠𝑡𝑎𝑐𝑖𝑜𝑛𝑎𝑟𝑖𝑎)
A partir de la prueba de Test Dickey Fuller aumentado, se detalla que el estadístico de prueba
es menor que el valor crítico del 5%, por tanto se acepta la hipotesis nula, entonces la variable
invpc presenta una raíz unitaria y la serie no es estacionaria.
f. Utilice el enfoque de la parte (e) para probar una raíz unitaria en log(𝑝𝑟𝑖𝑐𝑒).
𝑯𝟎 : 𝐿𝑎 𝑠𝑒𝑟𝑖𝑒 𝑑𝑒𝑙 𝑖𝑛𝑑𝑖𝑐𝑒 𝑑𝑒 𝑝𝑟𝑒𝑐𝑖𝑜𝑠 𝑑𝑒 𝑣𝑖𝑣𝑖𝑒𝑛𝑑𝑎 𝑝𝑟𝑒𝑠𝑒𝑛𝑡𝑎
𝑟𝑎í𝑧 𝑢𝑛𝑖𝑡𝑎𝑟𝑖𝑎 (𝐿𝑎 𝑠𝑒𝑟𝑖𝑒 𝑛𝑜 𝑒𝑠 𝑒𝑠𝑡𝑎𝑐𝑖𝑜𝑛𝑎𝑟𝑖𝑎)
𝑯𝟏 : 𝐿𝑎 𝑠𝑒𝑟𝑖𝑒 𝑑𝑒𝑙 𝑖𝑛𝑑𝑖𝑐𝑒 𝑑𝑒 𝑝𝑟𝑒𝑐𝑖𝑜𝑠 𝑑𝑒 𝑣𝑖𝑣𝑖𝑒𝑛𝑑𝑎 𝑛𝑜 𝑝𝑟𝑒𝑠𝑒𝑛𝑡𝑎
𝑟𝑎í𝑧 𝑢𝑛𝑖𝑡𝑎𝑟𝑖𝑎 (𝐿𝑎 𝑠𝑒𝑟𝑖𝑒 𝑒𝑠 𝑒𝑠𝑡𝑎𝑐𝑖𝑜𝑛𝑎𝑟𝑖𝑎)
A partir de la prueba de Test Dickey Fuller aumentado, se detalla que el estadístico de prueba
es mayor que el valor crítico del 5%, por tanto se rechaza la hipotesis nula, entonces la
variable log(price) no presenta una raíz unitaria y la serie es estacionaria.
g. Dados los resultados en las partes (e) y (f), ¿tiene sentido probar la cointegración
entre log(𝑖𝑛𝑣𝑝𝑐) y log(𝑝𝑟𝑖𝑐𝑒)? Temas de tendencias graficar quitar tendencia y
ver si eso incide
Comportamiento de la variable inversión real de vivienda per cápita 1947 – 1988 (Sin
tendencia)
Comportamiento del índice de precios de vivienda 1947 – 1988 (sin tendencia)
Con tendencia – comportamiento de la inversión real en vivienda

h. Utilizando el modelo de la parte (a) hasta 1983, calcule el error absoluto medio
de los errores de pronóstico de un paso adelante para los años 1984 a 1988.
Prónostico de la inversión en viviendas en Estados Unidos
Se utilizan los datos solo para el periodo de 1984 a 1983, para pronosticar inversión real en
vivienda per cápita en Estados Unidos para los años siguientes del 84 al 88, según wooldridge
se puede partir de dos modelos, el primero es un simple AR(1) para linvpc:
𝐥𝐨𝐠(𝒊𝒏𝒗𝒑𝒄) = −𝟎, 𝟑𝟑𝟓 + 𝟎, 𝟓 𝐥𝐨𝐠(𝒊𝒏𝒗𝒑𝒄)𝒕−𝟏 + 𝒖
(0,100) (0,139)
n = 36, Radj = 0,25,  = 0,129
O un segundo modelo dado por el índice de precios con rezago de un año:

𝐥𝐨𝐠(𝒊𝒏𝒗𝒑𝒄) = −𝟎, 𝟑𝟒𝟒 + 𝟎, 𝟓 𝟒𝟐𝐥𝐨𝐠(𝒊𝒏𝒗𝒑𝒄)𝒕−𝟏 + 𝟎, 𝟑𝟏𝟒 𝐥𝐨𝐠(𝒑𝒓𝒊𝒄𝒆)𝒕−𝟏 + 𝒖
(0,1011) (0,146) (0,386)

n = 36, Radj = 0,25,  = 0,305
En la segunda regresión se observa que el índice de precios rezagado no es significativo, el r

cuadrado de las dos es igual, lo que podría dar indicio de que la segunda regresión no sea un
buen pronóstico.
Para obtener el pronóstico de los siguientes años de 1984 a 1988, se necesita conocer los
valores del año 1983.
Por tanto, el prónostico de linvpc para el año 1984 de la primera ecuación está dado por:
𝐥𝐨𝐠(𝒊𝒏𝒗𝒑𝒄) = −𝟎, 𝟑𝟑𝟓 + 𝟎, 𝟓 𝐥𝐨𝐠(𝒊𝒏𝒗𝒑𝒄)𝒕−𝟏 + 𝒖
𝐥𝐨𝐠(𝒊𝒏𝒗𝒑𝒄) = −𝟎, 𝟑𝟑𝟓 + 𝟎, 𝟓(−𝟎, 𝟔𝟒𝟖)
𝐥𝐨𝐠(𝒊𝒏𝒗𝒑𝒄) = −𝟎, 𝟔𝟓𝟗
Para la segunda ecuación el prónostico del año 1984 sería:
𝐥𝐨𝐠(𝒊𝒏𝒗𝒑𝒄) = −𝟎, 𝟑𝟒𝟒 + 𝟎, 𝟓 𝟒𝟐𝐥𝐨𝐠(𝒊𝒏𝒗𝒑𝒄)𝒕−𝟏 + 𝟎, 𝟑𝟏𝟒 𝐥𝐨𝐠(𝒑𝒓𝒊𝒄𝒆)𝒕−𝟏 + 𝒖
𝐥𝐨𝐠(𝒊𝒏𝒗𝒑𝒄) = −𝟎, 𝟑𝟒𝟒 + 𝟎, 𝟓𝟒𝟐(−𝟎, 𝟔𝟒𝟖) + 𝟎, 𝟑𝟏𝟒(−𝟎, 𝟎𝟏𝟔)
𝐥𝐨𝐠(𝒊𝒏𝒗𝒑𝒄) = −𝟎, 𝟕𝟎𝟎𝟐𝟒
Según la base de datos el valor de la inversión para el año 1984 fue de -0,49 lo que quiere
decir que la primera ecuación es decir el AR(1) es el que más se acerca al pronóstico.
Preguntar como hallar el MAE, si se repite la regresión, la suma de los errores corresponde
a la diferencia entre el valor real y el del pronostico, la pagina es 653 en wooldridge.
3. Usar la base de datos EXPANDSHARE
Un método común para estimar curvas de Engel es modelar la participación total del gasto,
y posiblemente de las variables demográficas. Una especificación común tiene la forma
𝑠𝑔𝑜𝑜𝑑 = 𝛽0 + 𝛽1 𝑙𝑡𝑜𝑡𝑒𝑥𝑝𝑒𝑛𝑑 + 𝑑𝑒𝑚𝑜𝑔𝑟𝑎𝑝ℎ𝑖𝑐𝑠 + 𝑢
Donde 𝑠𝑔𝑜𝑜𝑑 es la fracción de gasto sobre un bien particular del gasto total, y 𝑙𝑡𝑜𝑡𝑒𝑥𝑝𝑒𝑛𝑑
es el logaritmo del total de gasto. El signo y la magnitud de 𝛽1 son de interés en varias
categorias de gasto.
La cuenta para la endogeneidad potencial de 𝑙𝑡𝑜𝑡𝑒𝑥𝑝𝑒𝑛𝑑 la cual puede ser vista como una
variable omitida o problema de ecuaciones simultaneas, o ambas, el logaritmo del ingreso
familiar 𝑙𝑖𝑛𝑐𝑜𝑚𝑒 es frecuentemente usada como una variable instrumental. Para el resto de
esta pregunta, use los datos en EXPANDSHARE.wf1 que proviene de Blundell, Duncan y
Pendakur (1998).
a. Estimar la ecuación mediante OLS usando heterocedasticidad de errores estandar

robustos. Mostrar e interpretar 𝛽𝑂𝐿𝑆,1
𝒔𝒇𝒐𝒐𝒅 = 𝜷𝟎 + 𝜷𝟏 𝒍𝒕𝒐𝒕𝒆𝒙𝒑𝒆𝒏𝒅 + 𝜷𝟐 𝒂𝒈𝒆 + 𝜷𝟑 𝒌𝒊𝒅𝒔 + 𝒖 (**)
𝒔𝒇𝒐𝒐𝒅 = 𝟎. 𝟖𝟗𝟓 − 𝟎. 𝟏𝟒𝟓 𝒍𝒕𝒐𝒕𝒆𝒙𝒑𝒆𝒏𝒅 + 𝟎. 𝟎𝟎𝟏𝒂𝒈𝒆 + 𝟎. 𝟎𝟑𝟒𝒌𝒊𝒅𝒔 + 𝒖
Interpretación de 𝜷’s
- 𝜷𝟎 : Cuando las demás variables son iguales a cero, la fracción del gasto sobre un bien
particular delgato del total aumenta 0.895
- 𝜷𝟏 ∶ Un cambio en el total del gasto implica una disminución de 14,59% en la
fracción de gasto sobre un bien particular del gasto total, manteniendo lo demás
constante.
- 𝜷𝟐 ∶ Un cambio en la edad implica un aumento en 0.0017 en la fracción de gasto
sobre un bien particular del gasto total,manteniendo lo demás constante.
- 𝜷𝟑 : Un cambio en la variable kids implica un aumento en 0.034 en la fracción de
gasto sobre un bien particular del gasto total,manteniendo lo demás constante
b. Usando 𝑙𝑖𝑛𝑐𝑜𝑚𝑒 como variable instrumental para 𝑙𝑡𝑜𝑡𝑒𝑥𝑝𝑒𝑛𝑑, estimar la forma

reducida de la ecuación para 𝑙𝑡𝑜𝑡𝑒𝑥𝑝𝑒𝑛𝑑, asegurarse de incluir la edad y niños.
Suponiendo 𝑙𝑖𝑛𝑐𝑜𝑚𝑒 es exógena en la ecuación ¿es válido la variable instrumental
𝑙𝑡𝑜𝑡𝑒𝑥𝑝𝑒𝑛𝑑?
Dado que la variable lincome es estadísticamente significativa dado que asociada a la

distribución de probabilidad t student el p-value es igual a 0.000 bajo el cuál es menor a un
nivel de significancia del 5% por tanto se rechaza la hipótesis nula de que el parámetro
asociado a la variable no es estadísticamente significativo. Por tanto, este resultado muestra
que la variable lincome el ingreso familiar puede ser un buen instrumento para ltotexpent el
total del gasto.
c. Ahora estimar (**) por variable instrumental, ¿cómo se compara 𝛽̂𝐼𝑉,1 con 𝛽𝑂𝐿𝑆,1 ?
¿Qué hay de los robustos intervalos de confianza del 95% para las estimaciones de
OLS y IV en comparación con 𝛽̂1 ?
Los intervalos de confianza para 𝛽̂1 en MCO están entre (0,43 y 0,52) y en IV entre (-0,18 y
-0,13) interpretar intevalos
d. Usar el test de Hausman(1980) (sección 15.5 de Wooldridge) para el test la hipotesis

nula que 𝑙𝑡𝑜𝑡𝑒𝑥𝑝𝑒𝑛𝑑 es exógena en (**). Asegurese de reportar e interpretar el p-
value. Hay alguna restricción sobreidentificada en el test?
Según el test, bajo la hipotesis nula de que existen variables exógenas, no se rechaza la
hipotesis dado que bajo un nivel de significancia del 5 % la probabilidad para el Test de
Hausman es mayor, 0.2240 > 0,05.
Prueba de endogeneidad de una sola variable explicativa (Wooldridge)
1) Se estima la forma reducida de y2 mediante su regresión sobre todas las variables

exógenas (incluidas las de la ecuación estructural y las VI adicionales). Se obtienen
los residuales, v2.
2) Se agrega v2 a la ecuación estructural (que incluye a y2) y se ejecuta una prueba de

la significancia de v2 mediante una regresión de MCO. Si el coeficiente de v2 es
estadísticamente diferente de cero, se concluye que y2 es en realidad endógena.
Preguntar como incluir a y2 en la regresion
En la regresión v2 es residuals, y no es estadisticamente significativo dado que se rechaza la
hipotesis de significancia individual pues el p -value es mayor a un nivel de significancia del
5%, lo que indica que existen varianles endogenas.
Prueba de restricciones de sobre identificación: (Wooldridge)
1) Se estima la ecuación estructural mediante MC2E y se obtienen los residuales de

MC2E
2) Se realiza la regresión de u sobre todas las variables exógenas. Se obtiene la R-

cuadrada digamos, R2 (1)
Según la regresión de los residuos con las variables exógenas el R cuadrado es cero y el R2
ajustados es -0.0020.
3) Con base en la hipótesis nula de que todas las VI no están correlacionadas con u, Si
n*R2 excede (por ejemplo) el valor crítico de 5% en la distribución se rechaza H0 y
se concluye que por lo menos algunas de las VI no son exógenas.
n*R2 = 1519 * 0 = 0, es decir que no se rechaza la hipótesis nula, lo que quiere decir que las
variables son exógenas.
4. Modelos Logit y Probit

Taller de Métodos Cuantitativos

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Taller de Métodos Cuantitativos

Cargado por

Copyright:

Formatos disponibles

Taller 2 – Métodos Cuantitativos

Alejandra Moreno Barrera

1. Usar la base de datos WAGE2

a. Estimar el siguiente modelo y reportar la salida (pegar la tabla y la ecuación

𝐥𝐨𝐠(𝒘𝒂𝒈𝒆) = 𝜷𝟎 + 𝜷𝟏 𝑬𝒅𝒖𝒄 + 𝜷𝟐 𝑬𝒙𝒑𝒆𝒓 + 𝜷𝟑 𝑻𝒆𝒏𝒖𝒓𝒆 + 𝜷𝟒 𝑴𝒂𝒓𝒓𝒊𝒆𝒅 + 𝜷𝟓 𝑺𝒐𝒖𝒕𝒉

Donde 𝒘𝒂𝒈𝒆 es el salario mensual, 𝑬𝒅𝒖𝒄 es la educación en años, 𝑬𝒙𝒑𝒆𝒓 es la

𝐥𝐨𝐠(𝒘𝒂𝒈𝒆) = 𝟓. 𝟑 + 𝟎. 𝟎𝟕𝑬𝒅𝒖𝒄 + 𝟎. 𝟎𝟏𝟒𝑬𝒙𝒑𝒆𝒓 + 𝟎. 𝟎𝟏𝟐𝑻𝒆𝒏𝒖𝒓𝒆

b. Manteniendo otros factores fijos, ¿cuál es la diferencia aproximada en salario

El coeficiente de married es la diferencia entre el salario promedio de los trabajadores

𝐻0 : 𝑁𝑜 𝑒𝑥𝑖𝑠𝑡𝑒 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎 𝑒𝑛𝑡𝑟𝑒 𝑒𝑙 𝑠𝑎𝑙𝑎𝑟𝑖𝑜 𝑑𝑒 𝑐𝑎𝑠𝑎𝑑𝑜𝑠 𝑦 𝑛𝑜 𝑐𝑎𝑠𝑎𝑑𝑜

𝐻1 : 𝐸𝑥𝑖𝑠𝑡𝑒 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎 𝑒𝑛𝑡𝑟𝑒 𝑒𝑙 𝑠𝑎𝑙𝑎𝑟𝑖𝑜 𝑑𝑒 𝑐𝑎𝑠𝑎𝑑𝑜𝑠 𝑦 𝑛𝑜 𝑐𝑎𝑠𝑎𝑑𝑜𝑠

El valor promedio de los salarios es estadísticamente significativo dado que se rechaza la

Los retornos a la educación no dependen de si los trabajadores viven o no en ciudades

2. Usar la base de datos HSEINV

𝐥𝐨𝐠(𝒊𝒏𝒗𝒑𝒄) = 𝜷𝟎 + 𝜷𝟏 𝐥𝐨𝐠(𝒑𝒓𝒊𝒄𝒆) + 𝒖 (*)

a. Estimar el modelo (*) mostrar el resultado y probar si el coeficiente de 𝛽1 es

 Test de significancia individual

𝐻0 : 𝛽1 = 0 , 𝑒𝑙 𝑝𝑎𝑟á𝑚𝑒𝑡𝑟𝑜 𝑛𝑜 𝑒𝑠 𝑒𝑠𝑡𝑎𝑑í𝑠𝑡𝑖𝑐𝑎𝑚𝑒𝑛𝑡𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑡𝑖𝑣𝑜

𝐻1 : 𝛽1 ≠ 0, 𝑒𝑙 𝑝𝑎𝑟á𝑚𝑒𝑡𝑟𝑜 𝑒𝑠 𝑒𝑠𝑡𝑎𝑑í𝑠𝑡𝑖𝑐𝑎𝑚𝑒𝑛𝑡𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑡𝑖𝑣𝑜

A partir de la regresión, se detalla que el p-value asociado a la distribución t student

Un aumento del 1% en el indice de precios de vivienda , genera un aumento en 124% en la

b. Ahora agregue la variable de tendencia "t" a la ecuación y vuelva a estimar el

c. Pruebe individualmente si los coeficientes de log(𝑝𝑟𝑖𝑐𝑒) y la variable de

 Test de significancia individual para log(price)

𝐻0 : 𝛽1 = 0 , 𝑒𝑙 𝑝𝑎𝑟á𝑚𝑒𝑡𝑟𝑜 𝑛𝑜 𝑒𝑠 𝑒𝑠𝑡𝑎𝑑í𝑠𝑡𝑖𝑐𝑎𝑚𝑒𝑛𝑡𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑡𝑖𝑣𝑜

𝐻1 : 𝛽1 ≠ 0, 𝑒𝑙 𝑝𝑎𝑟á𝑚𝑒𝑡𝑟𝑜 𝑒𝑠 𝑒𝑠𝑡𝑎𝑑í𝑠𝑡𝑖𝑐𝑎𝑚𝑒𝑛𝑡𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑡𝑖𝑣𝑜

A partir de la regresión, se detalla que el p-value asociado a la distribución t student

 Test de significancia individual para t

𝐻0 : 𝛽2 = 0 , 𝑒𝑙 𝑝𝑎𝑟á𝑚𝑒𝑡𝑟𝑜 𝑛𝑜 𝑒𝑠 𝑒𝑠𝑡𝑎𝑑í𝑠𝑡𝑖𝑐𝑎𝑚𝑒𝑛𝑡𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑡𝑖𝑣𝑜

𝐻1 : 𝛽2 ≠ 0, 𝑒𝑙 𝑝𝑎𝑟á𝑚𝑒𝑡𝑟𝑜 𝑒𝑠 𝑒𝑠𝑡𝑎𝑑í𝑠𝑡𝑖𝑐𝑎𝑚𝑒𝑛𝑡𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑡𝑖𝑣𝑜

A partir de la regresión, se detalla que el p-value asociado a la distribución t student

𝑯𝟎 : 𝐿𝑎 𝑠𝑒𝑟𝑖𝑒 𝑑𝑒 𝑙𝑎 𝑖𝑛𝑣𝑒𝑟𝑠𝑖ó𝑛 𝑟𝑒𝑎𝑙 𝑒𝑛 𝑣𝑖𝑣𝑖𝑒𝑛𝑑𝑎 𝑝𝑒𝑟 𝑐á𝑝𝑖𝑡𝑎 𝑝𝑟𝑒𝑠𝑒𝑛𝑡𝑎

𝑟𝑎í𝑧 𝑢𝑛𝑖𝑡𝑎𝑟𝑖𝑎 (𝐿𝑎 𝑠𝑒𝑟𝑖𝑒 𝑛𝑜 𝑒𝑠 𝑒𝑠𝑡𝑎𝑐𝑖𝑜𝑛𝑎𝑟𝑖𝑎)

𝑯𝟏 : 𝐿𝑎 𝑠𝑒𝑟𝑖𝑒 𝑑𝑒 𝑙𝑎 𝑖𝑛𝑣𝑒𝑟𝑠𝑖ó𝑛 𝑟𝑒𝑎𝑙 𝑒𝑛 𝑣𝑖𝑣𝑖𝑒𝑛𝑑𝑎 𝑝𝑒𝑟 𝑐á𝑝𝑖𝑡𝑎 𝑛𝑜 𝑝𝑟𝑒𝑠𝑒𝑛𝑡𝑎

𝑯𝟎 : 𝐿𝑎 𝑠𝑒𝑟𝑖𝑒 𝑑𝑒𝑙 𝑖𝑛𝑑𝑖𝑐𝑒 𝑑𝑒 𝑝𝑟𝑒𝑐𝑖𝑜𝑠 𝑑𝑒 𝑣𝑖𝑣𝑖𝑒𝑛𝑑𝑎 𝑝𝑟𝑒𝑠𝑒𝑛𝑡𝑎

𝑟𝑎í𝑧 𝑢𝑛𝑖𝑡𝑎𝑟𝑖𝑎 (𝐿𝑎 𝑠𝑒𝑟𝑖𝑒 𝑛𝑜 𝑒𝑠 𝑒𝑠𝑡𝑎𝑐𝑖𝑜𝑛𝑎𝑟𝑖𝑎)

𝑯𝟏 : 𝐿𝑎 𝑠𝑒𝑟𝑖𝑒 𝑑𝑒𝑙 𝑖𝑛𝑑𝑖𝑐𝑒 𝑑𝑒 𝑝𝑟𝑒𝑐𝑖𝑜𝑠 𝑑𝑒 𝑣𝑖𝑣𝑖𝑒𝑛𝑑𝑎 𝑛𝑜 𝑝𝑟𝑒𝑠𝑒𝑛𝑡𝑎

𝑟𝑎í𝑧 𝑢𝑛𝑖𝑡𝑎𝑟𝑖𝑎 (𝐿𝑎 𝑠𝑒𝑟𝑖𝑒 𝑒𝑠 𝑒𝑠𝑡𝑎𝑐𝑖𝑜𝑛𝑎𝑟𝑖𝑎)

Comportamiento del índice de precios de vivienda 1947 – 1988 (sin tendencia)

Con tendencia – comportamiento de la inversión real en vivienda

Prónostico de la inversión en viviendas en Estados Unidos

𝐥𝐨𝐠(𝒊𝒏𝒗𝒑𝒄) = −𝟎, 𝟑𝟑𝟓 + 𝟎, 𝟓 𝐥𝐨𝐠(𝒊𝒏𝒗𝒑𝒄)𝒕−𝟏 + 𝒖

O un segundo modelo dado por el índice de precios con rezago de un año:

(0,1011) (0,146) (0,386)

En la segunda regresión se observa que el índice de precios rezagado no es significativo, el r

𝐥𝐨𝐠(𝒊𝒏𝒗𝒑𝒄) = −𝟎, 𝟑𝟑𝟓 + 𝟎, 𝟓 𝐥𝐨𝐠(𝒊𝒏𝒗𝒑𝒄)𝒕−𝟏 + 𝒖

𝐥𝐨𝐠(𝒊𝒏𝒗𝒑𝒄) = −𝟎, 𝟑𝟑𝟓 + 𝟎, 𝟓(−𝟎, 𝟔𝟒𝟖)

𝐥𝐨𝐠(𝒊𝒏𝒗𝒑𝒄) = −𝟎, 𝟔𝟓𝟗

Para la segunda ecuación el prónostico del año 1984 sería:

𝐥𝐨𝐠(𝒊𝒏𝒗𝒑𝒄) = −𝟎, 𝟑𝟒𝟒 + 𝟎, 𝟓 𝟒𝟐𝐥𝐨𝐠(𝒊𝒏𝒗𝒑𝒄)𝒕−𝟏 + 𝟎, 𝟑𝟏𝟒 𝐥𝐨𝐠(𝒑𝒓𝒊𝒄𝒆)𝒕−𝟏 + 𝒖

𝐥𝐨𝐠(𝒊𝒏𝒗𝒑𝒄) = −𝟎, 𝟑𝟒𝟒 + 𝟎, 𝟓𝟒𝟐(−𝟎, 𝟔𝟒𝟖) + 𝟎, 𝟑𝟏𝟒(−𝟎, 𝟎𝟏𝟔)

𝐥𝐨𝐠(𝒊𝒏𝒗𝒑𝒄) = −𝟎, 𝟕𝟎𝟎𝟐𝟒

𝑠𝑔𝑜𝑜𝑑 = 𝛽0 + 𝛽1 𝑙𝑡𝑜𝑡𝑒𝑥𝑝𝑒𝑛𝑑 + 𝑑𝑒𝑚𝑜𝑔𝑟𝑎𝑝ℎ𝑖𝑐𝑠 + 𝑢

a. Estimar la ecuación mediante OLS usando heterocedasticidad de errores estandar

𝒔𝒇𝒐𝒐𝒅 = 𝜷𝟎 + 𝜷𝟏 𝒍𝒕𝒐𝒕𝒆𝒙𝒑𝒆𝒏𝒅 + 𝜷𝟐 𝒂𝒈𝒆 + 𝜷𝟑 𝒌𝒊𝒅𝒔 + 𝒖 (**)

𝒔𝒇𝒐𝒐𝒅 = 𝟎. 𝟖𝟗𝟓 − 𝟎. 𝟏𝟒𝟓 𝒍𝒕𝒐𝒕𝒆𝒙𝒑𝒆𝒏𝒅 + 𝟎. 𝟎𝟎𝟏𝒂𝒈𝒆 + 𝟎. 𝟎𝟑𝟒𝒌𝒊𝒅𝒔 + 𝒖

b. Usando 𝑙𝑖𝑛𝑐𝑜𝑚𝑒 como variable instrumental para 𝑙𝑡𝑜𝑡𝑒𝑥𝑝𝑒𝑛𝑑, estimar la forma

Dado que la variable lincome es estadísticamente significativa dado que asociada a la

d. Usar el test de Hausman(1980) (sección 15.5 de Wooldridge) para el test la hipotesis

1) Se estima la forma reducida de y2 mediante su regresión sobre todas las variables

2) Se agrega v2 a la ecuación estructural (que incluye a y2) y se ejecuta una prueba de

Prueba de restricciones de sobre identificación: (Wooldridge)

1) Se estima la ecuación estructural mediante MC2E y se obtienen los residuales de