Está en la página 1de 28

Clase 23

Econometrı́a I

Tomás Rau
Binder

Problemas con
los datos
Multicolinealidad
Clase 23
Detección de
Multicolinealidad
Econometrı́a I
Error de
Medición

Tomás Rau Binder

17 de Junio
Contenidos

Clase 23
Econometrı́a I

Tomás Rau
Binder

Problemas con
los datos
Multicolinealidad 1 Problemas con los datos
Detección de
Multicolinealidad Multicolinealidad
Error de
Medición Detección de Multicolinealidad

2 Error de Medición
Problemas con los datos

Clase 23
Econometrı́a I

Tomás Rau
Binder
La Multicolinealidad aparece cuando las variables explicativas
en modelo econométrico están correlacionadas entre si, esto
Problemas con
los datos tiene efectos negativas cuando se quire estimar los parámetros
Multicolinealidad
Detección de
del modelo por MCO.
Multicolinealidad

Error de
Medición Existen diversas fuentes de la multicolinealidad:
El método de recolección de información empleado,
obtención de muestras en un intervalo limitado de valores
de los regresores en la población.
Restricción en el modelo o en la población objeto de
muestreo.
Especificación del modelo.
Problemas con los datos

Clase 23
Econometrı́a I consideremos el siguiente modelo:
Tomás Rau
Binder
yi = β1 + β2 x2i + ... + βk xki + ui
Problemas con
los datos
Multicolinealidad
Si X ′ X posee inversa, entonces sabemos que podemos
Detección de
Multicolinealidad encontrar
Error de
Medición
β̂ = (X ′ X )−1 X ′ Y
Var (β̂) = σ 2 (X ′ X )−1
Ahora bien, suponga que se tiene la siguiente relación entre los
regresores

xji = δ1 + δ2 x2i + ... + δj−1 xj−1,i + vi

Donde la regresión anterior posee un R 2 alto.


Multicolinealidad

Clase 23
Econometrı́a I

Tomás Rau
Binder

Problemas con
En estas condiciones la variable xji puede escribirse
los datos
Multicolinealidad
aproximadamente como una combinación lineal de un
Detección de
Multicolinealidad
grupo de otras variables del modelo.
Error de
Medición
Como consecuencia, una de las columnas de la matriz X
puede escribirse como una combinación aproximada de las
demás columnas de X y, de esta forma, X ′ X
será aproximadamente singular.
En la medida que X ′ X posea inversa, MCO sigue siendo
MELI pero se tienen las siguientes consecuencias
Multicolinealidad

Clase 23
Econometrı́a I

Tomás Rau La solución del sistema de ecuaciones normales está mal


Binder
definido: mientras la dependencia de xji con las otras
Problemas con
los datos
variables sea no exacta, X ′ X no será exactamente singular
Multicolinealidad y existirá un único estimador MCO β̂, pero habrán otros
Detección de
Multicolinealidad vectoresβ̃ que serán soluciones aproximadas de las
Error de
Medición ecuaciones normales X ′ X β̂ = X ′ Y
Pequeñas variaciones muestrales (al sacar o agregar datos)
pueden generar cambios importantes a la solución β̂ del
sistema de ecuaciones normales.
Al ser la matriz X ′ X casi singular, es muy pequeña. Como
consecuencia la matriz de varianzas y covarianzas de β̂
será muy grande, por lo que tanto el estimador MCO es
poco preciso en este caso.
Multicolinealidad

Clase 23
Econometrı́a I

Tomás Rau
Binder

Problemas con La presencia de Multicolinealidad en un modelo de regresión


los datos
Multicolinealidad lineal puede ser de dos formas:
Detección de
Multicolinealidad
Multicolinealidad Exacta: una de las variables explicativas
Error de
Medición es una combinación lineal determinı́stica de otras variables
del modelo
Multicolinealidad Aproximada: ocurre cuando una de las
variables es aproximadamente igual a una combinación
lineal de las restantes, como el ejemplo.
Multicolinealidad

Clase 23
Econometrı́a I

Tomás Rau
Binder

Problemas con
los datos Puesto que la multicolinealidad es un problema de
Multicolinealidad
Detección de
Multicolinealidad
naturaleza muestral, que surge principalmente por el
Error de carácter no experimental de la mayorı́a de la información
Medición
recopilada en las Ciencias Sociales, no tiene una manera
única de ser detectada.
Lo que se tiene son algunas reglas prácticas detalladas a
continuación:
Multicolinealidad

Clase 23
Econometrı́a I

Tomás Rau
Binder

Problemas con
los datos
Multicolinealidad
1 El R2 es alto, pero los parámetros no resultan ser
Detección de
Multicolinealidad individualmente significativos.
Error de
Medición
2 Pequeños cambios en los datos, produce importantes
variaciones en las estimaciones mı́nimo cuadráticas.
3 Los coeficientes pueden tener signos opuestos a los
esperados o una magnitud poco creı́ble.
Multicolinealidad

Clase 23
Econometrı́a I Por ejemplo: Considere los siguientes datos:
Tomás Rau
Binder
Tabla 1: Multicolinealidad
Problemas con Periodo yi x2i x3i x4i
los datos
Multicolinealidad
1 20 5 10 10
Detección de
Multicolinealidad 2 12 2 8 6
Error de 3 28 7 12 16
Medición
4 26 6 4 12
5 14 4 16 8
6 24 8 14 14
7 16 3 6 4

Las variables x3 y x4 tienen las mismas observaciones


numéricas solo que en distinto orden, de forma tal que la
correlación entre x2 y estas dos variables son: ρ23 = 0,32 y
ρ24 = 0,93, altamente diferentes entre sı́.
Multicolinealidad

Clase 23
Econometrı́a I

Tomás Rau
Binder

Problemas con
los datos
Multicolinealidad
Detección de
Multicolinealidad

Error de
Medición
Multicolinealidad

Clase 23
Econometrı́a I

Tomás Rau
Binder

Problemas con
los datos
Multicolinealidad
Detección de
Multicolinealidad

Error de
Medición
Multicolinealidad

Clase 23
Econometrı́a I

Tomás Rau
Binder

Problemas con
los datos
Ambas regresiones no incluyen las mismas variables
Multicolinealidad
Detección de
explicativas y por lo tanto, no son comparables.
Multicolinealidad

Error de
Sin embargo, en el segundo modelo donde el grado de
Medición correlación entre las variables explicativas es alto,
podemos apreciar que a pesar de que el R2 es alto, los
parámetros resultan ser insignificativos individualmente.
Veamos un método de detección sobre la base la
correlación de las variables
Multicolinealidad

Clase 23
Econometrı́a I

Tomás Rau Variance Inflation Factor (VIF)


Binder

Problemas con Se puede demostrar que la varianza de β̂j se puede escribir de


los datos
Multicolinealidad la siguiente forma:
Detección de
Multicolinealidad

Error de
Medición
σ2
Var (β̂j ) = (1)
STj (1 − Rj2 )

donde STj es la suma total de la regresión entre xj y X−j es


decir todas las otras x’s menos la j-ésima.

STj = ni=1 (xji − x j )2 y R2j es el coeficiente de determinación


P

de esta misma regresión.


Multicolinealidad

Clase 23
Econometrı́a I

Tomás Rau
La varianza de β̂j depende de tres cosas:
Binder
La varianza del término de error, que es independiente del
Problemas con
los datos
grado de correlación entre las x’s.
Multicolinealidad
Detección de
La suma total propia de la variable xj , la que depende solo
Multicolinealidad
de esta variable.
Error de
Medición
El coeficiente de determinación R2j , el que si depende del
grado del grado de correlación entre la variable xj y las
restantes, es decir, depende del grado de multicolinealidad.
La cota inferior para la varianza de β̂j , cuando R2j =0, es:

σu2
Var (β̂j0 ) =
STj
Multicolinealidad

Clase 23
Econometrı́a I

Tomás Rau Por lo que la relación entre las varianzas de la estimación de βj


Binder
en un caso de correlación entre variables explicativas y el caso
Problemas con de independencia lineal es:
los datos
Multicolinealidad
Detección de
Multicolinealidad Var (β̂j ) 1
VIF = =
Error de
Medición
Var (β̂j0 ) 1 − Rj2

corresponde al estadı́stico VIF: Variance Inflation Factor. Por


ejemplo, si VIF=9 para j, el error estándar es 3 veces mayor
que el caso con VIF=1. El test t queda dividido por 3 (mayor
prob de cometer error tipo II)

Algunos autores plantean que un VIF entre 5 y 10 indicarı́a


multicolinealidad.
Multicolinealidad

Clase 23
Econometrı́a I

Tomás Rau
Binder
Si inmediatamente después de escribir reg y x2 x3 escribimos
Problemas con
los datos
vif STATA nos entrega:
Multicolinealidad
Detección de
Multicolinealidad

Error de
Medición

No hay problemas de Multicolinealidad.


Multicolinealidad

Clase 23
Econometrı́a I

Tomás Rau
En cambio, después de estimar reg y x2 x4 obtenemos:
Binder

Problemas con
los datos
Multicolinealidad
Detección de
Multicolinealidad

Error de
Medición

Hay problemas de multicolinealidad.


De acuerdo con este análisis, los coeficientes de determinación
obtenidos en las regresiones de cada variable explicativa con el
resto son un buen indicador de una posible situación de
multicolinealidad.
Multicolinealidad

Clase 23
Econometrı́a I

Tomás Rau
Binder
Si tenemos un problema de Multicolinealidad, no hay una
Problemas con
los datos cura especı́fica
Multicolinealidad
Detección de
Multicolinealidad
Podemos omitir la variable que está generando el problema
Error de de acuerdo al VIF pero podemos perder información
Medición
Existen otros métodos como la Ridge Regression pero no
son muy usados:

β̂ridge = (X ′ X + λI )−1 X ′ Y
donde λ es una constante positiva y pequeña.
Error de Medición

Clase 23
Econometrı́a I

Tomás Rau
Binder Una dificultad en todo trabajo empı́rico en Economı́a es la
imposibilidad de disponer de las observaciones muestrales
Problemas con
los datos de las variables de interés.
Multicolinealidad
Detección de
Multicolinealidad
Por ejemplo, las variables de contabilidad nacional como el
Error de PIB, stock de capital o consumo, son sólo estimaciones de
Medición
conceptos teóricos que no se observan en la realidad.
En otros casos, como la Renta Permanente, inteligencia o
habilidad de un trabajador, no disponemos ni siquiera
estimaciones, y debemos utilizar variables Proxies, que
aproximan los conceptos que se quieren utilizar. Ası́ por
ejemplo se utilizan años de experiencia del trabajador para
aproximar su habilidad.
Error de Medición

Clase 23
Econometrı́a I

Tomás Rau
Binder

Problemas con
los datos Podemos adelantar que el error de medición o el uso de
Multicolinealidad
Detección de variables proxies generará sesgos en las estimaciones por MCO,
Multicolinealidad

Error de
el que será menor:
Medición
cuanto más se aproxime la verdadera variable que deberı́a
incluirse en el modelo con que que incluyo efectivamente.
cuanto más independiente sea el error de medida de las
restantes variables del modelo.
Error de Medición

Clase 23
Econometrı́a I

Tomás Rau
Consideremos el siguiente modelo lineal simple:
Binder

Problemas con
yi = βxi + ui i = 1, ..., n (2)
los datos
Multicolinealidad
Detección de en el que la variable dependiente yi está medida con error, es
Multicolinealidad

Error de
decir, solo observamos yi∗ donde:
Medición

yi∗ = yi + νi i = 1, ..., n (3)

donde asumimos que νi ∼ N(0, σν2 ) y es independiente de xi y


ui .
Reemplazando (1) en (2):

yi∗ = βxi + (ui + νi ) = βxi + εi (4)


Error de Medición

Clase 23
Econometrı́a I

Tomás Rau
Binder

Problemas con
Bajo los supuestos mencionados es fácil darse cuenta que
los datos
Multicolinealidad
el estimador de β será el mismo que si observáramos el
Detección de
Multicolinealidad
verdadero valor de yi .
Error de
Medición
En consecuencia, los errores de medida en la variable
endógena no producen ningún problema en la estimación
puntual de β.
No obstante, los errores estándar de las estimaciones serán
mayores en presencia de error de medida en la variable
dependiente porque σε2 > σu2 .
Error de Medición

Clase 23
Econometrı́a I

Tomás Rau
Ahora supongamos que la variable xi esta medida con error, es
Binder decir:
Problemas con
los datos
Multicolinealidad
yi = βxi + ui i = 1, ..., n (5)
Detección de
Multicolinealidad

Error de
pero sólo observamos xi∗ donde:
Medición

xi∗ = xi + ωi i = 1, ..., n (6)

y ωi ∼ N(0, σω2 ) es independiente de ui , xi y de yi .

El modelo en términos de las variables observables es:

yi = βxi∗ + (ui − βωi ) = βxi∗ + εi (7)


Error de Medición

Clase 23
Econometrı́a I

Tomás Rau
Binder contrario a lo que ocurrı́a en (3) en este caso tenemos dificultad
Problemas con al estimar por MCO, ya que el término de error εi esta
los datos
Multicolinealidad
relacionado con xi∗ , lo que va en contra del supuesto 6, veamos:
Detección de
Multicolinealidad

Error de Cov (εi , xi∗ ) = Cov (ui − βωi , xi + ωi )


Medición
= Cov (ui , xi ) − βCov (ωi , xi )
+ Cov (ui , ωi ) − βCov (ωi , ωi )
= 0 − β · 0 + 0 − βσω2

Esto hace que el estimador MCO de β en el modelo (6) sea


sesgado:
Error de Medición

Clase 23
Econometrı́a I PN ∗ 
i =1 xi yi 1/N
Tomás Rau β̂ = PN ∗2 ·
Binder
i =1 xi
1/N
Problemas con 1 P N ∗ 
los datos N i =1 xi yi
Multicolinealidad β̂ = 1 PN
plim
Detección de x ∗2
Multicolinealidad N i =1 i
plim N1 N
P ∗
i =1 xi yi
Error de
Medición
plimβ̂ =
plim N1 N
P ∗2
i =1 xi
plim N1 N
P
i =1 (xi + ωi )(βxi + ui )
plimβ̂ =
plim N1 N 2
P
i =1 (xi + ωi )
plim N1 N
P
i =1 (xi + ωi )(βxi + ui + βωi − βωi )
plimβ̂ =
plim N1 N 2
P
i =1 (xi + ωi )
Error de Medición

Clase 23
Econometrı́a I

Tomás Rau
Binder
PN
Problemas con plim N1 i =1 (xi + ωi )(ui − βωi )
los datos plimβ̂ = β +
plim N1 N 2
P
i =1 (xi + ωi )
Multicolinealidad
Detección de
Multicolinealidad

Error de
−βσω2
plimβ̂ = β +
Medición
Sx2 + σω2
β
plimβ̂ = 2
σω
1+ Sx2

donde Sx2 = plim n1 ni=1 xi2 , que supondremos existe.


P
El resultado en términos generales es que el estimador MCO en
presencia de error de medición estará sesgado hacia el origen.
Error de Medición

Clase 23
Econometrı́a I

Tomás Rau En el caso del modelo de regresión múltiple:


Binder

Problemas con y = Xβ + u
los datos

Multicolinealidad X = X +ω
Detección de
Multicolinealidad

Error de
Medición
donde todas las variables pueden estar medidas con error.
Extendiendo lo desarrollado anteriormente:

plim β̂MCO = β − [Σxx + Σωω ]−1 Σωω β (8)


X ′X ω′ ω
donde Σxx = plim n y Σωω = plim n .

Lo que implica que un sólo error basta para generar


inconsistencias en todos los coeficientes del modelo.

También podría gustarte