Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Multi Colinealidad
Multi Colinealidad
1 Planteamiento
Una de las hiptesis del modelo de regresin lineal mltiple establece
que no existe relacin lineal exacta entre los regresores, o, en otras palabras,
establece que no existe multicolinealidad perfecta en el modelo. Esta hiptesis
es necesaria para el clculo del vector de estimadores mnimo cuadrticos, ya
que en caso contrario la matriz X'X ser no singular. La multicolinealidad
perfecta no se suele presentar en la prctica, salvo que se disee mal el modelo
como veremos en el epgrafe siguiente. En cambio, s es frecuente que entre
los regresores exista una relacin aproximadamente lineal, en cuyo caso los
estimadores que se obtengan sern en general poco precisos, aunque siguen
conservando la propiedad de lineales, insesgados y ptimos. En otras palabras,
la relacin entre regresores hace que sea difcil cuantificar con precisin el
efecto que cada regresor ejerce sobre el regresando, lo que determina que las
varianzas de los estimadores sean elevadas. Cuando se presenta una relacin
aproximadamente lineal entre los regresores, se dice que existe
multicolinealidad no perfecta. Es importante sealar que el problema de
multicolinealidad, en mayor o menor grado, se plantea porque no existe
informacin suficiente para conseguir una estimacin precisa de los
parmetros del modelo.
El problema de la multicolinealidad hace referencia, en concreto, a la
existencia de relaciones aproximadamente lineales entre los regresores del
modelo, cuando los estimadores obtenidos y la precisin de stos se ven
seriamente afectados.
Para analizar este problema, vamos a examinar la varianza de un
estimador. En el modelo de regresin lineal mltiple, el estimador de la
varianza de un coeficiente cualquiera por ejemplo, de j - se puede formular
de la siguiente forma:
n
var( j ) =
2
T (1 R 2j ) S 2j
(1)
donde
R 2j es el coeficiente de determinacin obtenido al efectuar la regresin de Xj
III-1
2 grande
2 pequea
Yt
S j pequeo
Xt
S j grande
Xt
III-2
2 Deteccin
Como la multicolinealidad es un problema muestral, ya que va
asociada a la configuracin concreta de la matriz X, no existen contrastes
estadsticos, propiamente dichos, que sean aplicables para su deteccin. En
cambio, se han desarrollado numerosas reglas prcticas que tratan de
determinar en qu medida la multicolinealidad afecta gravemente a la
estimacin y contraste de un modelo. Estas reglas no son siempre fiables,
siendo en algunos casos muy discutibles. A continuacin se van a exponer dos
procedimientos (el factor de agrandamiento de la varianza y el nmero de
condicin) que son los que gozan de mayor soporte - especialmente el segundo
- en la literatura economtrica actual.
2
n
*j ) = 2
var(
TS j
(2)
1
1 R 2j
(3)
Nmero de condicin
Este procedimiento de deteccin de la multicolinealidad es el ms
adecuado entre los actualmente disponibles, segn afirman Judge et at. (1985)
III-3
(X ) =
max
min
(4)
max
i
(5)
El nmero de condicin mide la sensibilidad de las estimaciones mnimocuadrticas ante pequeos cambios en los datos. De acuerdo con los estudios
realizados por Belsley y otros (op. cit.), y Belsley (op. cit.), tanto con datos
observados como con datos simulados, el problema de la multicolinealidad es
grave cuando el nmero de condicin toma un valor entre 20 y 30.
Naturalmente, si este indicador superase el valor de 30, el problema sera ya
manifiestamente grave. Estos valores vienen generalmente referidos a
regresores medidos con escala de longitud unidad (es decir, con los regresores
divididos por la raz cuadrada de la suma de los valores de las observaciones),
pero no centrados. Parece que no es conveniente centrar los datos (es decir,
restarles sus correspondientes medias), ya que esta operacin oscurece
cualquier dependencia lineal que implique al trmino independiente.
Una informacin de inters para identificar el origen de la multicolinealidad es
la proporcin que tiene cada raz caracterstica en cada uno de los regresores,
segn veremos ms adelante.
III-4
Error tp.
14,4133
-0,0960
-0,0776
-0,0364
1,6030
0,0478
0,0672
0,0073
Coeficientes
estandarizados
Beta
-0,3453
-0,2098
-0,4661
Sig.
8,9913
-2,0060
-1,1544
-4,9658
0,0000
0,0510
0,2546
0,0000
Las dos primeras columnas del cuadro 1 se refieren a conceptos con los
que ya estamos familiarizados: coeficientes no estandarizados beta (es decir,
los obtenidos directamente al aplicar al modelo MC) y los correspondientes
errores tpicos (o desviaciones tpicas). La tercera columna presenta los
coeficientes estandarizados beta, cuyo significado vamos a examinar a
continuacin. Previamente sealaremos que la interpretacin de los
coeficientes no estandarizados es la misma que se dio al coeficiente de la
variable explicativa en la regresin lineal simple, aunque aqu al interpretar
cada coeficiente habra que aadir la expresin mantenindose constantes las
dems variables al tratarse de un modelo de regresin mltiple. Si a uno le
preguntaran cul es la variable explicativa que tiene mayor influencia (en
valor absoluto) sobre la variable endgena podra estar tentado de responder
que la EDAD, ya que su coeficiente (-0,0960) es el mayor en valor absoluto.
Sin embargo, hay que tener en cuenta que el valor que toman los coeficientes
viene condicionado por las escalas en que vienen medidas las variables del
modelo. Los coeficientes estandarizados beta no estn afectados por este
problema y se calculan segn la siguiente frmula:
jES = j
SX j
SY
(6)
FIV
0,2346
0,2104
0,7891
4,2634
4,7532
1,2673
(Constante)
EDAD
ANTIGUE
SALARIO
CUADRO 3. Diagnsticos de colinealidad
Dimensin
Autovalor
1
2
3
4
3,6529
0,2741
0,0578
0,0152
Indice de
condicin
Proporciones de la varianza
(Constante)
1,0000
3,6509
7,9492
15,4807
0,0026
0,0355
0,0957
0,8663
EDAD
0,0021
0,0009
0,1237
0,8734
ANTIGUE
SALARIO
0,0055
0,2019
0,0287
0,7639
3 Soluciones
En principio, el problema de la multicolinealidad est relacionado con
deficiencias en la informacin muestral. El diseo muestral no experimental
es, a menudo, el responsable de estas deficiencias. Sin embargo, la
aproximacin cuantitativa a los conceptos tericos puede ser inadecuada,
haciendo que en el trmino de perturbacin se absorban errores de
especificacin. Veamos a continuacin algunas de las soluciones propuestas
para resolver el problema de la multicolinealidad.
Eliminacin de variables
La multicolinealidad puede atenuarse si se eliminan los regresores que
son ms afectados por la multicolinealidad. El problema que plantea esta
III-6
0,0051
0,0296
0,7295
0,2358
solucin es que los estimadores del nuevo modelo sern sesgados en el caso de
que el modelo original fuera el correcto. Sobre esta cuestin conviene hacer la
siguiente reflexin.
El investigador est interesado en que un estimador sea preciso (es
decir, que no tenga sesgo o que este sea muy pequeo) y con una varianza
reducida. El error cuadrtico medio (ECM) recoge ambos tipos de factores.
As para el estimador j , el ECM se define de la siguiente manera:
2
(7)
III-7
III-8