Está en la página 1de 12

8/6/22

EL PROBLEMA DE ENDOGENEIDAD

DEFINICIÓN
Uno de los supuestos necesarios para que funcione el modelo de regresión es el
de exogeneidad estricta de acuerdo con el cual no debe haber relación entre el
término de error y las variables explicativas. El problema de endogeneidad
implica el incumplimiento de este supuesto, de este modo podemos expresarlo
matemáticamente como sigue:

E(xi ui) ≠ 0

De este modo se puede deducir que:

cor(xi ui)≠ 0

Este problema es bastante común en los modelos de regresión en tanto las


variables económicas suelen tener interdependencia entre sí.

CAUSAS
La principal causa del problema de endogeneidad es la llamada simultaneidad o
causalidad bidireccional. Esto se da cuando sucede que no solo la variable
independiente influye sobre la dependiente si no que también la variable
dependiente influye sobre al menos una de las independientes. En otras palabras
se da causalidad bidireccional cuando “x” influye en “y”, e “y” influye en “x”.
Comúnmente diversas variables económicas presentaran este tipo de causalidad
simultánea por que hay efectos de retroalimentación entre diversas dinámicas de
la economía.
Ejemplo 1:

Función Keynesiana de consumo

Ecuación econométrica
Nótese que el coeficiente B0 corresponde al consumo autónomo y el coeficiente
B1 a la propensión marginal a consumir. Como se sabe por el efecto
multiplicador keynesiano hay una retroalimentación entre las variables consumo
e ingreso pues un aumento en el consumo hará aumentar la demanda agregada y
por tanto el ingreso total de la economía. De este modo se puede decir que el
consumo causa el ingreso y el ingreso causa el consumo. Por tanto podemos
decir que la ecuación keynesiana de consumo en su forma econometrica sufre
de endogeneidad.

Ejemplo 2:

En este modelo es claro que hay endogeneidad entendiendo que institutions


representa el índice de calidad institucional y corruption el índice de percepción
de la corrupción. Esto sucede porque una mayor corrupción reduce la calidad
institucional,y una mayor calidad institucional reduce la corrupción.

● Debe notarse que es común en las variables institucionales el influirse


mutuamente entre sí pues obedecen a factores comunes de orden histórico
o cultural que están interconectados.

El problema de endogeneidad es el más grave de los problemas econométricos


para un modelo de regresión lineal en corte transversal, pues implica que
quedan afectadas las propiedades de insesgadez y consistencia. sucede que en
los problemas de autocorrelación y heteroscedasticidad no se afecta la
insesgadez del modelo, pero si su eficiencia. De este modo, se tenían
estimadores imperfectos( al no tener mínima varianza) pero seguirian siendo
útiles( al conservar la propiedad de insesgadez). En cambio, bajo endogeneidad
se da que:

→ sesgadez

→inconsistencia
DETECCIÓN
Normalmente se puede identificar la existencia del problema de endogeneidad
por medio del análisis cualitativo examinando si es que hay razones de peso
para suponer que hay una causalidad bidireccional entre determinado grupo de
variables de nuestro modelo donde una sería la variable dependiente. Por
ejemplo en los dos casos vistos(el de la función keynesiana de consumo y el de
la relación de corrupción y calidad institucional) podemos reconocer que hay
causalidad bidireccional por medio del conocimiento de la teoría económica y la
realidad empírica. En virtud de ello no se hace imprescindible realizar una
prueba de hipótesis

TRATAMIENTO
El problema de endogeneidad se puede tratar aplicando variables instrumentales
por medio del método de mínimos cuadrados en dos etapas:
1. Variables instrumentales
Se llaman variables auxiliares a aquellas variables auxiliares que se crean
con el fin de utilizarla instrumentalmente para obtener estimadores
insesgados de los coeficientes beta. Para que un instrumento sea válido
deben cumplirse las siguientes dos condiciones:

I) Exogeneidad: La variable instrumental no debe tener correlación con


los términos de error. En otras palabras no debe estar ella misma sujeta a
problema de endogeneidad. Matemáticamente se puede expresar como

II) Relevancia: La variable instrumental debe estar altamente relacionada


con aquella de la cual es instrumento. Matemáticamente se puede
expresar como:
Baja la llamada condición de instrumentos débiles se puede permitir
incluso que el valor absoluto del coeficiente de correlación puede estar
entre 0.40 y 0.70.

● Suele ser relativamente sencillo que cumplan una de las dos


condiciones, pero al mismo tiempo difícil hallar unas que cumplan
ambas a la vez.

2. Mínimos cuadrados en dos etapas


Es un método que se aplica en dos pasos conforme lo siguiente:

La primera etapa regresiona la variable con problemas de endogeneidad


X con respecto al instrumento Z. La segunda etapa ejecuta la regresión
principal de interés pero utilizando los resultados de la primera etapa
Si es que los instrumentos utilizados son buenos cumpliendo las
condiciones, la estimación de la segunda etapa dará coeficientes
insesgados.
CLASE 10/06/22
Ejercicios de computadora capítulo 15

1)
a
El contexto general detrás de este problema es que se quiere estimar el retorno
de la educación, es decir el efecto de la educación sobre el salario. Sin embargo,
en esto habrá problema de endogeneidad pues no solo ocurre que la educación
influye sobre el salario, sino también que el salario influye sobre la educación
en tanto mayores niveles de salario permiten a los individuos financiarse más
años de educación. Dado esto la variable educación requerirá algun intrumento
para que se pueda estimar su efecto.En este caso se está evaluando la
posibilidad de usar la variable sibs como instrumento. Dado ello veremos qué
sucede si simplemente ponemos la variable sibs en vez de educ.

regress lwage sibs

Por teoria economica basica y por conocimiento de empirica sabes que el


retorno de la educacion es positivo , pero aqui estamos obteniendo un
coeficiente negativo de sibs. por lo tanto queda claro que no basta con
reemplazar una posible variable instrumental por aquella de la cual sera
instrumento

educ:años de educación
brthord: orden al nacer
De tal modo que el tercer hermano al nacer tendria un brthord mayor que el
primer hermano al nacer.

Se puede esperar una relacion negativa entre estas variables porque en la


medida en que uno nace despues queda menos presupuesto de los padres para
financiar años de educacion adicional para sus hijos

b
regress educ brthord
Como se ve la variable brthord tiene un efecto estadísticamente significativo
sobre educ de modo que podemos suponer que se cumple la condición de
relevancia

c
A continuación, usaremos brthord como variable instrumental para estimar el
efecto de la educación sobre el salario.

ivregress 2sls lwage (educ=brthord)

Nótese la estructura de este comando, primero se pone la indicación que


utilizará variables instrumentales(y de regress por medio del metodo de
minimos cuadrados en dos etapas(2sls); luego se pone la variable dependiente y
después las variables independientes siendo que aquellas que tengan problemas
de endogeneidad se pondrán entre paréntesis y se igualaran a la respectiva
variable instrumental
Asumiendo que la variable brthord es un buen instrumento para educ,
tendremos que el efecto insesgado de la educacion sobre el salario sera que si la
educacion aumenta en un año el salario aumentará en 13.06% .

d
El supuesto de identificación se refiere a verificar si la variable instrumental
cumple los respectivos requisitos para ser valida. Ejecutando la regresión de la
forma reducida de la ecuacion podemos testear si es que se cumple la condicion
de relevancia

regress educ sibs brthord

Como brthord tiene un efecto estadísticamente significativo sobre educ vemos


que se cumple la condición de relevancia y por tanto el supuesto de
identificacion.

e
Ahora ejecutaremos una regresion por minimos cuadrados en dos etapas donde
una variable tiene problema de endogeneidad y la otra no.

ivregress 2sls lwage sibs (educ=brthord)


En esta nueva regresión de variables instrumentales se obtiene que si la
educación aumenta en un año el salario aumentará en 13.7%

f
correlate educ sibs

Se obtiene un coeficiente de correlacion negativo de 0.24 lo cual muestra que la


relacion entre estas dos variables no es muy alta.

2)

a
Para que se cumpla la exogeneidad la variable instrumental nearc4 debe no estar
correlacionada con el término de error. Sin embargo puede efectivamente
suceder que dicha variable instrumental esté corelacionada con ciertos aspectos
que se incluyen en el término de error. Sucede que la variable nearc4 es una
dummy que vale 1 si es que el individuo vive cerca de una universidady esto
puede estar correlacionado con la habilidad intelectual pues en el contexto de
los Estados Unidos(pais de la muestra) las personas con becas que tiene alto
rendimiento academico viniendo incluso del extranjero

regress IQ nearc4
Se verifica que el vivir cerca a la universidad tiene un efecto positivo y
estadisticamente significativo sobre el coeficiente intelectual.

regress IQ nearc4 smsa66 reg662 reg663 reg664 reg665 reg666 reg667 reg668
reg669

Vemos que luego controlar los efectos de la variable dummy geográficas el


efecto de nearc4 sobre el coeficiente intelectual se vuelve no significativo.

8)

a
regress pira p401k inc incsq age agesq
En esta ecuación pira es una variable dummy que vale 1 si es que la persona
tiene una cuenta de ahorros para su jubilación.Por tanto el efecto de P401K se
deberá de interpretar como una probabilidad.

b
Al asociarse a diferentes planes de jubilación las variables pira y 401K se
influiran mutuamente, de modo que habría problema de endogeneidad y la
estimación por MCO daría estimadores sesgados.

c
Se requiere que se cumpla las siguientes dos condiciones
1. Relevancia: E401K debe estar altamente correlacionado con P401K
2. Exogeneidad: E401K no debe estar correlacionado con el termino de
error.

regress p401k e401k inc incsq age agesq, robust


correlate e401k p401k

Como podemos ver se obtiene un coeficiente de correlación mayor a 0.70 de


modo que se cumple la condición de relevancia.

e
ivregress 2sls pira (p401k=e401k) inc incsq age agesq, robust
En la estimación por MCO el coeficiente de p401k era 0.05 y en la estimación
por mínimos cuadrados en 2 etapas disminuye a 0.02. Asumiendo que p401k es
un buen instrumento podemos decir que este último coeficiente es insesgado.

También podría gustarte