Está en la página 1de 17

María Teresa González Valencia

Luis Alejandro Villacorta Devoto


• Supuesto del MRLG: Si no está bien especificado,
¿qué ocurre? ¿Cómo saber si lo está? ¿Cuáles son las
consecuencias?

• Especificación incorrecta (error o sesgo de


especificación): «cuando el modelo no explica de
manera correcta la relación entre la variable dependiente
y las variables explicativas observadas».

¿Qué debe cumplir el modelo para tener una correcta


especificación?
• Consistencia teórica: tener un sentido económico
pertinente (ejm. Hipótesis del ingreso permanente).

• Exogeneidad de las explicativas: No deben estar


correlacionadas con el error muestral.

• Constancia en los parámetros: Estabilidad


paramétrica.
• Coherencia en los residuos: Si el modelo de regresión
es el adecuado, los residuos se comportarán como
«ruido blanco».

• Datos adecuados: La base no debe tener ausentes ni


valores atípicos. Medición correcta.

• Inclusividad: El modelo debe contener la explicación


adecuada y otro modelo no debiera ya poder hacerlo.
• A) Omisión de variables relevantes

• Si el modelo correcto es
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋1𝑖 + 𝛽2 𝑋2𝑖 + 𝛽3 𝑋3𝑖 + 𝜇1𝑖

• Sin embargo, si se plantea


𝑌𝑖 = 𝛼0 + 𝛼1 𝑋1𝑖 + 𝛼2 𝑋2𝑖 + 𝜇2𝑖

• Está siendo omitida una explicativa relevante.


• B) Inclusión de variables irrelevantes

• Si se plantea más bien


𝑌𝑖 = 𝛽0 + 𝛽1 𝑋1𝑖 + 𝛽2 𝑋2𝑖 + 𝛽3 𝑋3𝑖 + 𝛽4 𝑋4 + 𝜇3𝑖

• La última variable en realidad no es necesaria. Es


redundante incluirla.
• C) Forma funcional incorrecta

• Al plantear
ln 𝛾𝑖 = 𝛾0 + 𝛾1 𝑋1𝑖 + 𝛾2 𝑋2𝑖 + 𝛾3 𝑋3𝑖 + 𝑢4𝑖

• Se están alterando los datos (forma log-lineal del


modelo).
• El modelo «base» de esta última especificación no es
lineal sino multiplicativa.
• D) Errores de medición

• Si el modelo se plantea según la forma:

𝑌𝑖∗ = 𝛽0∗ + 𝛽1∗ 𝑋1𝑖 + 𝛽2∗ 𝑋2𝑖 + 𝑢𝑖∗

• Donde
𝑌𝑖∗ = 𝑌𝑖 + 𝜀𝑖 𝑦 𝑋𝑖∗ = 𝑋𝑖 + 𝑤𝑖

• No es extraño que en los datos recopilados existan


elementos que distorsionen los verdaderos valores de las
observaciones.
• E) Errores de especificación de la perturbación

• Teniendo: 𝑌𝑖 = 𝛽𝑋𝑖 𝑢𝑖

• Si se regresiona
𝑌𝑖 = 𝛼𝑋𝑖 +𝑢𝑖

• ¿Qué ocurre con el estimador de ? ¿Es insesgado para


el parámetro ?
• F) Efectos multiplicativos de las independientes

• Con un modelo
ln 𝑊𝑖 = 𝛽0 + 𝛽1 𝐸𝑠𝑐𝑜𝑙𝑎𝑟𝑖𝑑𝑎𝑑𝑖 + 𝛽2 𝑆𝑒𝑥𝑜𝑖 + 𝛽3 𝐸𝑠𝑐𝑜𝑙𝑎𝑟𝑖𝑑𝑎𝑑 𝑆𝑒𝑥𝑜 + 𝑢

• El cambio en salarios respecto de la educación es


𝛿𝑙𝑛𝑊
= 𝛽1 + 𝛽2 𝑆𝑒𝑥𝑜
𝛿𝐸𝑠𝑐𝑜𝑙𝑎𝑟𝑖𝑑𝑎𝑑

• Similarmente, cambios en salario respecto del sexo del


individuo dependerán de la educación también.
• Subajuste del modelo (omisión de variables
relevantes)

• Modelo verdadero:
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋1𝑖 + 𝛽2 𝑋2𝑖 + 𝜇1𝑖

• Modelo estimado:
𝑌𝑖 = 𝛼0 + 𝛼1 𝑋1𝑖 + 𝑣𝑖
• Consecuencias de la omisión:

– Si X1 y X2 están correlacionados, el esperado del estimador de


0 no es 0. El esperado del estimador de 1 no es 1, y el
sesgo no desaparece al aumentar la muestra.
– Si X1 y X2 no están correlacionados, el esperado del estimador
de 0 es sesgado, mas no el de 1.
– La varianza de la perturbación no está correctamente estimada.
– El estimador de la varianza de 1 estimado está sesgado
respecto del verdadero estimador de la varianza de 1 estimado.
– Intervalos de confianza más amplios.
– Pronósticos no confiables.
• Sobreajuste del modelo (inclusión de variables
irrelevantes)

• Modelo verdadero:
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋1𝑖 + 𝜇𝑖

• Modelo estimado:

𝑌𝑖 = 𝛼0 + 𝛼1 𝑋1𝑖 + 𝛼2 𝑋2𝑖 + 𝑣𝑖
• Consecuencias de la inclusión:

– Los estimadores del modelo «incorrecto» son insesgados.


– La varianza de la perturbación está correctamente estimada.
– Pronósticos confiables.
– Intervalos de confianza más amplios.
– Ineficiencia : Los estimadores de los  tendrán varianzas más
grandes que las correspondientes a los estimadores de los .
• RESET: Error de especificación de la regresión de
Ramsey (1969). Prueba general para la forma funcional.

• Si el modelo lineal
y = 𝛽0 + 𝛽1 𝑋1 + 𝛽2 𝑋2 + ⋯ … + 𝜇

• Está correctamente especificado, ningún componente no


lineal de las x debiera ser significativo (x^2, x1*x2).

• Para hacer la prueba, incluir términos al cuadrado y


cruzados, pero se pierden grados de libertad.
• Propuesta: Utilizar la parte estimada elevada a una
potencia:
𝑦ො 2 , 𝑦ො 3

• Luego efectuar la prueba de significancia.

• El modelo queda así:


𝑦 = 𝛽0 + 𝛽1 𝑥1 + 𝛽2 𝑥2 + ⋯ 𝛽𝑘 𝑥𝑘 + 𝛿1 𝑦ො 2 + 𝛿2 𝑦ො 3 + 𝜇

• Si el modelo inicial es el correcto, la hipótesis nula de la


prueba RESET será:

𝐻𝑜 : 𝛿1 = 0 , 𝛿2 = 0
• Variables omitidas: Utilizar variables proxy,
correlacionadas a las variables omitidas, para «recoger»
su aporte e incorporarlo al modelo.
• Se está «aminorando» el problema del sesgo generado
por la ausencia de la variable omitida.
• Una variable omitida puede ser aquella que no es
medible.

• Variables redundantes: Se puede analizar prueba T, o


ir aumentando variables siempre que tengan
significancia, pero no es un método recomendado.

También podría gustarte