Está en la página 1de 5

Modelo de Ecuaciones Simultáneas

Manuel Castellanos
abril 09, 2020

Otro tipo de Endogeneidad: Simultaneidad


Anteriormente hemos visto como resolver el problema de variable omitida: Variables Instrumen-
tales. Otro tipo de endogeneidad es la simultaneidad. Esta surge cuando una o más variables
explicativas se determinan conjuntamente con la variable dependiente. Normalmente esto sucede
porque hay un mecanismo de equilibrio detrás.
Si bien un análisis detallado de este tema rebasa el alcance de este curso, podemos introducir los
modelos sencillos más utilizados. El ejemplo clásico es el del modelo de oferta y demanda. El
ejemplo que vimos en clase fue el del mercado de trabajo:
→ Sea hs las horas anuales de mano de obra proporcionadas por campesinos.
→ Sea w el salario por hora promedio que se ofrece a tales trabajadores.
Una forma de expresar la función de oferta de este mercado sería:

hs = α1 w + β1 z1 + u1

La variable z1 es alguna otra variable observable que afecta la mano de obra, por ejemplo el salario
de mercado de esta demarcación. El término de error u1 contiene otros factores, tanto observables
como no observables. (Si son observables lo preferible es que se incluyeran en la ecuación).
Este tipo de ecuación se llama ecuación estructural. Provienen de la teoría económica y, por
tanto, tienen interpretación causal.
Para completar el mercado, necesitamos la respuesta de la demanda laboral, las firmas.
→ Sea hd las horas anuales de mano de obra demandadas por las industrias.
Una forma de expresar la función de demanda de este mercado sería:

hd = α2 w + β2 z2 + u2

Con lo que añadiéndole la condición de equilibrio de nuestro mercado, obtenemos nuestro modelo:

hi = α1 wi + β1 z1i + u1i
hi = α2 wi + β2 z2i + u2i
hi = hs = hd

Estas dos ecuaciones constituyen un modelo de ecuaciones simultáneas. Nuestro sistema


contiene 2 variables endógenas (se determinan dentro del modelo): hi y wi . Se debe asumir que
α1 6= α2 , pues esto permite la identificación de wi .

1
Prueba de identificación de wi
Igualando las primeras dos ecuaciones del sistema presentado anteriormente se obtiene:

α1 wi + β1 z1i + u1i = α2 wi + β2 z2i + u2i


A partir de esta expresión se puede identificar a wi con la siguiente expresión:

(β2 z2i −β1 z1i )+(u2i −u1i )


wi = α1 −α2

Como se puede apreciar claramente, α1 y α2 deben ser diferentes.


¿Qué sucede con z1i y z2i ? Debido a que se determinan fuera del modelo, se les llama variables
exógenas. Cumpliendo con la condicion de no estar correlacionadas con los errores de sus respectivas
ecuaciones.

Sesgo de Simultaneidad en MCO


En esta sección veremos como una variable explicativa que se determina simultáneamente con la
variable dependiente, en general, presenta correlación con el término de error, generando sesgo e
inconsistencia en los estimadores MCO. Consideremos el modelo general de 2 ecuaciones:

y1 = α1 y2 + β1 z1 + u1
y2 = α2 y1 + β2 z2 + u2

Demostración de la existencia de correlación entre y2 y u1


Primero, resolvemos por y2 . Sustituyendo la primera ecuación en la segunda obtenemos:

y2 = α2 (α1 y2 + β1 z1 + u1 ) + β2 z2 + u2
Separando por y2 obtenemos:

α2 β1 z1 +β2 z2 +u1 +u2


y2 = 1−α1 α2

Al llegar a este punto debemos de plantear un supuesto para poder tener una expresión cerrada
para y2 .

α1 α2 6= 1
Si este supuesto se mantiene, entonces, podemos seguir desarrollando y obtenemos lo siguiente:

α2 β1 β2
y2 = ( 1−α α
1 2
)z1 + ( 1−α1 α2
)z2 + ( α1−α
2 u1 +u2
1 α2
)
Y, por conveniencia de notación, reescribiremos esta ecuación de la siguiente forma:

y2 = π21 z1 + π22 z2 + ν2

2
Esto no es más que la ecuación en forma reducida para y2 . Se puede apreciar como π21 y π22
son funciones no lineales de los parámetros estructurales, α1 yα2 . Mientras que ν2 , el error de
la forma reducida, es una función lineal de los términos de error estructurales, u1 y u2 .
Dado que u1 y u2 no están correlacionados con z1 ni z2 , entonces ν2 tampoco está correlacionado
con z1 y z2 . Por tanto, se puede estimar π21 y π22 de manera consistente mediante
MCO.Dado que se requiere estimar la ecuación del principio, entonces se recurre a una estimación
por 2SLS. Este mismo procedimiento se puede realizar para obtener la forma reducida de y1 .
Ahora bien, se puede observar a simple vista como y2 y u1 están correlacionadas. Esto sucede
siempre y cuando ν2 y u1 estén correlacionados, ya que z1 y z2 son exógenos. ¡Pero ν2 es una
función lineal de u1 y u2 !
A esto se le llama sesgo de simultaneidad. El error de una ecuación afecta una variable endógena
del modelo, por lo que, la convergencia en valor esperado no se dará. Una prueba más rigurosa de
la existencia de este sesgo, es demostrar que la covarianza entre estas dos variables en cuestión es
no nula.

Prueba de existencia de covarianza entre y2 y u1


Para simplificar, eliminaremos a z1 y z2 y recordamos que Corr(u1 , u2 ) = 0. Por tanto y2 = ν2 .
Además, recordamos que u1 ∼ N(0, σ12 ).
Recordando la definición de covarianza: Cov(X, Y ) = E[XY ] − E[X] E[Y ]
Se tiene que:

Cov(y2 , u1 ) = Cov(ν2 , u1 )
Cov(ν2 , u1 ) = E[ν2 u1 ] − E[ν2 ] E[u1 ]
Sabemos que E[u1 ] = 0, por tanto el segundo término se anula. Sustituyendo, nos quedamos con:

Cov(ν2 , u1 ) = E[( α1−α


2 u1 +u2
1 α2
)u1 ]
1
Cov(ν2 , u1 ) = 1−α1 α2 E[α2 u21 + u1 u2 ]
1 2
Cov(ν2 , u1 ) = 1−α1 α2 {E[α2 u1 ] + E[u1 u2 ]}

A partir de aquí, la demostración se divide en dos partes. Primero, demostraremos que E[u1 u2 ] = 0,
esto nos simplificará el trabajo. Ya sabemos que ambas variables tienen correlación nula, como lo
estipulamos anteriormente. Si dos variables tiene correlación nula, entonces su covarianza también
es nula, por lo tanto:

Cov(u1 , u2 ) = E[u1 u2 ] − E[u1 ] E[u2 ]


0 = E[u1 u2 ] − E[u1 ] E[u2 ]
Sabemos que ambas variables tienen expectativa cero. Por tanto:

E[u1 u2 ] = 0

3
Volviendo a la parte anterior, entonces tenemos que:

1
Cov(ν2 , u1 ) = 1−α1 α2 E[α2 u21 ]
α2
Cov(ν2 , u1 ) = 1−α1 α2 E[u21 ]

Para la segunda parte, demostraremos que E[u21 ] = V ar(u21 ). Por definición, la varianza de este
término es:

V ar(u1 ) = E[u21 ] − (E[u1 ])2


Sabemos que el segundo término es 0. Por lo que queda demostrada nuestra proposición. Sustituyendo
en nuestra expresión para la covarianza:

α2
Cov(ν2 , u1 ) = 1−α1 α2 V ar(u1 )
α2 2
Cov(ν2 , u1 ) = 1−α1 α2 σ1 ; ∀α1 α2 6= 1

Dado que σ12 > 0, hemos hallado que existe una covarianza no nula entre y2 y u1 .

Identificación en un sistema de dos ecuaciones. Estimación por 2SLS.


Hasta ahora se ha visto como aplicar 2SLS para resolver problemas de endogeneidad por variables
omitidas. Aquí lo veremos para resolver problemas de simultaneidad. Ya vimos como MCO es
sesgado e inconsistente cuando se aplica a una ecuación estructural en un sistema. La diferencia
ahora es que deben de haber suficientes variables instrumentales para estimar cualquier ecuación. A
esto le llamaremos problema de identificación.
Tomemos el modelo general de dos ecuaciones:

y1 = β10 + α1 y2 + z>
1 B1 + u1
y2 = β20 + α2 y1 + z>
2 B2 + u2

Donde y1 y y2 son variables exógenas y u1 y u2 son términos de error estructurales. β10 y β20 son los
interceptos de ambas ecuaciones. La variable z1 representa un vector de dimensión k ∗ 1 donde k es la
cantidad de variables exógenas que aparecen en la primera ecuación, es decir, z1 = (z11 , z12 , ..., z1k ).
La misma dinámica ocurre para la variable z2 . En muchos casos,z1 y z2 se solaparán;es decir,
tendrán elementos iguales. Pero se necesita que por lo menos una sea unica para la ecuación. Esto
se llama restricción de exclusión.
La restricción de exclusión surge de la necesidad de distinguir entre las dos ecuaciones. Si ambas
tienen las mismas variables exógenas, entonces son la misma ecuación. Esto genera problemas con el
rango de la matriz en cuestión (Recordar de álgebra lineal). Esto nos lleva a enunciar la condición
de rango.
Condición de rango para la identificación de una ecuación estructural. Una ecuación en
un modelo de dos ecuaciones simultáneas se identifica si, y sólo si, la otra ecuación contiene al menos
una variable exógena (con un coeficiente diferente de cero) excluida de la primera.

4
Sistemas de más de dos ecuaciones
La identificación en modelos generales de 3 o más ecuaciones es tediosa y requiere cálculos de álgebra
lineal, lo cual sobrepasa el alcance de este curso. Sin embargo, bajo el marco de una simplificación
podemos apreciar las principales carácterísticas de la identificación en estos casos. Tomemos el
siguiente modelo sin interceptos:

y1 = α12 y2 + α13 y3 + β11 z1 + u1


y2 = α21 y1 + β21 z1 + β22 z2 + β23 z3 + u2
y3 = α32 y2 + β31 z1 + β32 z2 + β33 z3 + β34 z4 + u3

Donde las yi son variables endógenas y las zj son exógenas. Veamos cuales de estas ecuaciones se
pueden estimar.
Observando la tercera ecuación, vemos que todas las variables exógenas aparecen en esta ecuación.
Por lo tanto observamos que no se tiene ninguna variable instrumental para y2 , la variable endógena
de esta ecuación.
Vemos en la primera ecuación que z2 ,z3 y z4 se excluyen de la ecuación (como vimos en las
restricciones de exclusión). Aunque existen dos variables endógenas en esta ecuación, se tienen 3
potenciales variables instrumentales para y2 y y3 , que son z2 ,z3 y z4 . Por tanto, la primera ecuación
satisface la condición de rango.
Condición de orden para identificación. Una ecuación en un modelo de ecuaciones simultáneas
satisface la condición de orden para identificación si el número de variables exógenas excluidas de la
ecuación es al menos el mismo que el número de variables endógenas del lado derecho. Otra forma
de verlo es que esta condición se cumple cuando el número de variables exógenas no incluidas en
la ecuación es igual o mayor en cantidad que el número de variables endógenas independientes en
dicha ecuación.
Fíjense como si β34 = 0, z4 no aparece en ningún otro lugar del sistema. Si β34 = 0, entonces la
segunda ecuación no está identificada, pues z4 resulta una variable instrumental inútil para estimar
a y1 .

También podría gustarte