NOTAS SOBRE COLINEALIDAD EN EL MODELO DE REGRESIN LINEAL DE TRES VARIABLES
Author(s): Fernando Corts C. and Rosa Ma. Rubalcava
Source: Demografa y economa, Vol. 17, No. 2 (1983), pp. 181-198 Published by: El Colegio De Mexico Stable URL: http://www.jstor.org/stable/40602348 . Accessed: 04/08/2014 18:28 Your use of the JSTOR archive indicates your acceptance of the Terms & Conditions of Use, available at . http://www.jstor.org/page/info/about/policies/terms.jsp . JSTOR is a not-for-profit service that helps scholars, researchers, and students discover, use, and build upon a wide range of content in a trusted digital archive. We use information technology and tools to increase productivity and facilitate new forms of scholarship. For more information about JSTOR, please contact support@jstor.org. . El Colegio De Mexico is collaborating with JSTOR to digitize, preserve and extend access to Demografa y economa. http://www.jstor.org This content downloaded from 146.155.94.33 on Mon, 4 Aug 2014 18:28:03 PM All use subject to JSTOR Terms and Conditions NOTAS SOBRE COLINEALIDAD EN EL MODELO DE REGRESIN LINEAL DE TRES VARIABLES Fernando Cortes G* Rosa Ma. Rubalcava El Colgio de Mxico INTRODUCCIN Este TRABAJO investiga las peculiaridades que caracterizai! la estimation de un modelo de regresin parcial del tipo: (1) 1^=01 +02*2,+03*3/ + >P, 0 = 1,2, ... ,*) en el que se ha constatado una estrecha relation lineal entre las variables explica- tivas. A modo de ejemplo, podria considerarse el ajuste de una ecuacin del nivel de precios en funcir de los salrios y la cantidad de dinero. Una situation tpica que tambin podria responder al caso esbozado seria la de la estimation de una funcin en donde una de las variables fuese el tamano o nmero de las unidades de observation. Tal seria el caso de una funcin consumo agregada en que X2i podria representar el nivel dei ingreso disponible, X3i Ia po- blacin y Yt el valor dei consumo personal. La existncia de un cierto grado de independncia entre las variables explicati- vas permite establecer que: ar _f Y _ Vale decir, el coeficiente de regresin j32 indicaria el efecto que tendra un cambio unitrio en X2 sobre la variable F, bajo el supuesto de que X3 se mantie- ne constante. Para j33 se puede realizar una interpretacin anloga. Pro si existiera una relation lineal entre X2 y X3 , la interpretacin de los coeficientes ya no seria tan directa. En efecto, si X2i = a + bX3i+Vt *Facultad Latinoamericana de Cincias Sociales, sede Mxico. (FLACSO-MEXICO); profesor en El Colgio de Mxico. 181 This content downloaded from 146.155.94.33 on Mon, 4 Aug 2014 18:28:03 PM All use subject to JSTOR Terms and Conditions 1 82 DEMOGRAFIA Y ECONOMIA XVII: 2, 1 983 y si la reemplazamos en (1), tendremos: (2) Yt = (A + h a) + 0?3 + h b)X3i + (& Vt + U,)(i=l, 2, ...,) y el impacto lineal de X3 sobre Y ser: 7' V Este resultado indica que, en la medida que haya una relacin lineal estrecha entre X2 y X3 , dificilmente podremos evaluar el efecto de una variable explica- tiva sobre Y, manteniendo la otra constante. Si la correlacin entre X2 y X3 se aproxima a la unidad, entonces toda variacin en X3 ser seguida por una en X2 y viceversa, por ello nos veremos incapacitados para alterar los valores de una de las variables manteniendo Ia otra constante. La derivada muestra que el coeficiente de regresin de X3 en la ecuacin (2) mezcla el impacto que tiene X3 sobre Y(3), con el que tiene X2 sobre 7 a tra- vs de X2 ,^ b). En mtodos no exprimentales (como Io es el subyacente ai modelo de regre- sin) el control de variables solo se puede realizar a travs de Ia consideracin explcita de ellas.2 En modelos de regresin es usual incluir una tercera variable al estudiar la relacin entre otras dos, ya sea a travs de su incorporation en un modelo parcial (tal como el de Ia ecuacin (1)) o bien, establecer uno donde Ias variables se definan como razones. Este ltimo procedimiento es de uso bastante frecuente cuando Ia tercera variable es Ia poblacin o el nvel de precios. As Ia ecuacin: (3) -4*
=61+2 l2i +Ui (i = l,2, ... ,*) 3 3 en que YJX2i es el consumo per capita y X2i/X3i es el ingreso per capita, estaria conformada por una variable explicada y una explicativa, definidas ambas como razones entre variables, Io que supuestamente permitiria controlar el efecto de Ia poblacin sobre el consumo y el ingreso. Pro, si nuestro pensamiento terico nos conduce a suponer que sobre el nivel de consumo actan tanto el crecimiento econmico como el demogrfico y que sus efectos son aditivos, entonces el modelo correctamente especificado ser el representado por Ia ecuacin (1). Sin embargo, es probable que ai intentar ajus- tar este modelo terico nos encontremos con una colinealidad estrecha entre el 1 Dado que b = ^ixvJ^* si no nay relacin lineal entre x2 y x3 {x2x3 - 0) en- y tonces ^~= 03, es decir el coeficiente de regresin que afecta a jc 3 en la ecuacin (2) mide 0x3 el impacto que tiene esta variable sobre y. En la medida que Ia relacin lineal sea mas estre- cha b se alejai ms de cero yjb_ recoger el efecto combinado de x2 y x3. a*3 2 Stinchcombe, Arthur. La construction de Teorias Sociales. Ediciones Nueva Vision, 1970,pg.49. This content downloaded from 146.155.94.33 on Mon, 4 Aug 2014 18:28:03 PM All use subject to JSTOR Terms and Conditions CORTS/RUBALCAVA: NOTAS SOBRE COLINEALIDAD 1 83 ingreso personal disponible y la poblacin, lo cual introduce una serie de compli- caciones en la estimacin. Ante la difcultad de medir el efecto de una variable explicativa manteniendo la otra constante - debido a la fuerte correlacin- se puede intentar controlar el efecto de la poblacin a travs de una transformation en las variables que permi- ta extraer la "contamination" inducida por ella. Esto se puede lograr dividiendo la iguadad (1) entre X3 . (4) 4*-=ft 3 . --+ 3 -^-++i. 3 -(=1,2,...,) 3 3 3 3 3 Al comparar (3) con (4) notamos trs diferencias importantes: a) La variable 1/X3 aparece en la ltima ecuacin y no en la primera. Esto quiere decir que si el modelo correctamente especificado es el que representa la igualdad (1), al ajustar (3) cometemos un error de especificacin lo que introdu- ce un sesgo en los estimadores. 3 b) Si el trmino estocstico de (1) es homocedstico,4 la division entre X3 llevaria a que Wt = /,/3/ fuese heterocedstico. Var Wt = (l/X^.Var /{.bajoelsupuesto que X3i no es una variable aleatria. Pero si Uf tuviese la forma heterocedstica: Ut =X3i V(, donde (V2 ) = 2 , entonces Wt seria homocedstica: VarH^ = (l/Jrl|) Var/=a2 c) La constante (/33) del modelo (4) permite estimar el efecto que tiene X3 sobre Y (la poblacin sobre el consumo). En resumen, el modelo parcial (1) permite estimar el efecto de la variable X2 , controlando el de X3 y viceversa, solo en caso de que haya una relativa indepen- dncia lineal entre ambas. Si por el contrario, hubiese una fuerte colinealidad entre las variables explicativas - lo cual implica que seria muy difcil, en una situation no experimental, separar el efecto de una variable manteniendo cons- tante Ia otra- se puede proceder a depurarias, para lo cual Ias expresamos como razn. Pero, Ia manera adecuada de hacerlo seria a travs de Ia ecuacin de ajuste (4) que corresponderia ai modelo terico expresado matematicamente por Ia igualdad (1). Ahora bien, si debemos emprender el proceso de estimacin en una situacin como Ia planteada, ^cmo sabemos que el procedimiento utilizado para eliminar o disminuir la contamination es realmente efectivo? En los trminos en que hemos presentado el problema, esta pregunta consti- tuye otra manera de interrogarse acerca dei efecto que tendra sobre Ia colineali- 3 Theil Henry. Principles of Econometrics. John Wiley. 1971, pgs. 548-551 y Prze- worski, Adam y Corts, Fernando. Comparing Partial and Ratio Regression Models. Political Methodology, 1977.
Nos parece poo til conservar a medias Ia grafia inglesa y escribir homoscedstico. Ms an tratndose de un neologismo, creemos que Ias variantes "homosedstico" y "homo- cedstico" dependern dei critrio dei autor, hasta que el uso acune definitivamente la pala- bra en nuestra lengua. This content downloaded from 146.155.94.33 on Mon, 4 Aug 2014 18:28:03 PM All use subject to JSTOR Terms and Conditions 1 84 DEMOGRAFIA Y ECONOMIA XVII : 2, 1 983 dad la transformation no lineal aplicada en (1), y a que si la correlation entre las variables l/X3 y X2IX3 de la igualdad (4) permanece igual o es mayor que la existente entre X2 y X3 , no habremos conseguido depurar las variables y los pro- blemas de estimation persistirn o se agravarn. Pro antes de abordar el estdio comparativo de Ias correlaciones entre esos pares de variables procederemos a resumir de manera muy sinttica las principales consecuencias que tiene en el proceso de estimation, la colinealidad estrecha. COLINEALIDAD Y ESTIMACION El caso limite de colinealidad es aquel en el que la relation entre las dos variables explicativas es perfectamente lineal (r23=
1). Esta situation conduce a que sea imposible realizar las estimaciones punto e intervalo del modelo. En efecto, si la correlation entre las variables explicativas es unitria, la matriz de observaciones X no tendra rango completo (su rango ser dos en lugar de trs) por Io cual (X'X) ser una matriz singular y por consecuencia ser imposible obtener.
= ('1
y VarZ? = a2 (X'X)~l La experincia sefiala que en el proceso de ajuste de modelos lineales es relati- vamente poo frecuente enfrentarse con una situation de colinealidad perfecta* Por esto nuestro inters es enfocar el caso en que la relation lineal entre Ias variables explicativas es estrecha pro no perfecta. Las consecuencias fundamentales de una correlation fuerte entre X2 y X3 se manifestan en una precision decreciente de Ias estimaciones: a) A mayor grado de colinealidad mayores sern Ias varianzas muestrales de los coeficientes de regresin. b) Lo cual Ueva, a travs de ia covariation entre los estimadores mni- mo cuadrticos ordinrios, a que si un estimador sobreestima su correspondiente parmetro el otro tender a subestimado.5 Las consecuencias de Ia colinealidad estrecha se manifestan en la signification estadstica de los coeficientes. En efecto una varianza grande (grande en relacin ai valor dei estimador) tender a disminuir el valor dei coeficiente t de Student calculado, lo que puede llevar a eliminar alguna variable del modelo aun cuando tenga un papel explicativo. Lo que acontece es que el modelo no puede captar su efecto debido ai conjunto de datos disponible. Al decidir, erroneamente, eli- minar una variable explicativa, cometemos un error de especificacin lo que implica introducir un sesgo en los estimadores. 5 Johnston J. Econometric Methods. MacGraw Hill, 1972, pg. 160. This content downloaded from 146.155.94.33 on Mon, 4 Aug 2014 18:28:03 PM All use subject to JSTOR Terms and Conditions CORTS/RUBALCAVA: NOTAS SOBRE COLINEALIDAD 185 Ahora bien, si encontrsemos una manera de estimar los parmetros del mo- delo de regresin parcial que implicara una cada en la correlacin entre los regresores, probablemente6 haramos bajar Ia varianza de los estimadores con Io cual ganaramos en la precision de los mismos, y disminuiramos el riesgo de cometer error de especifcacin. Justamente esta ser la idea que orientar Ia prxima seccin. Para finalizar este apartado, plantearemos de manera sinttica Ia naturaleza dei problema: a) En primer lugar suponemos que Ia especifcacin correcta de nuestro pensa- miento terico est dada por el modelo de regresin parcial (1): Yi = i +& *2/ + 03*3/ + ^/(=1,2, ...,) y adernas que entre X2 y X3 hay una correlacin lineal estrecha. b) Para evitar esta "contamination" - cuando una de las variables es el tamafo de Ias unidades de observacin- debera dividirse toda Ia ecuacin entre una de ellas (por ej. X3) generndose de este modo el modelo de ajuste (4) correspon- diente ai modelo terico (1): -^-=01.-
+fe-^-+fe+W,; (f=l,2,...,/i) X31 %3i X$ en que Wf - Ui/X3i. Las variables sern expresadas en trminos per capita si Ias unidades son personas, por establecimientos si son empresas, etcetera. c) Esta manera particular de "controlar" el efecto de una tercera variable ser exitosa si realmente logra disminuir el tamano de las varianzas de los estimadores. Ahora bien, entre los factores de los cuales dependen estas varianzas quere- mos destacar Ia naturaleza homo o heterocedstica dei trmino de error, y la correlacin entre los regresores. Lo que resta de este trabajo se dedicar principalmente ai estdio dei ltimo de estos aspectos. Tambin realizaremos algunas consideraciones sobre hetero- cedasticidad aun cuando solo tendrn calidad de acotaciones marginales. La correlacin entre los regresores Nuestro problema se reduce a encontrar una funcin que ligue Ia correlacin entre l/X3 yI2/I3 (que simbolizaremos por f) con la correlacin entre X2 yJ3 (simbolizada por r23). Para obtener tal funcin recurriremos a los desarrollos de Karl Pearson7 que establecen que si definimos una variable Z como una relacin entre otras dos 6 La palabra probablemente se utiliza para senalar que el efecto resultante no solo depende de Ia correlacin entre los regresores. 7 Pearson Karl. On a form of spurious correlation wich may arise when indices are used in the measurement of organs. Proceedings of the Royal Society of London, No. 60. This content downloaded from 146.155.94.33 on Mon, 4 Aug 2014 18:28:03 PM All use subject to JSTOR Terms and Conditions 1 86 DEMOGRAFIA Y ECONOMIA XVII : 2, 1 983 Xj su promedio y varianza sern aproximadamente : x i Var [Z]-f-[F* -2 Vk Vj rkj + Vf *j donde Xk y Xj representan los promedios de las variables k y / respectivamente. Vk y Vj simbolizan los coeficientes de variacin y rkj el coeficiente de correla- cin entre Xk y Xj. Estas frmulas corresponden a una aproximacin proveniente de un desarrollo en serie de funciones8 en que no se han tomado en cuenta todos los trminos de orden superior a dos, bajo Ia condicin de convergncia: (5) v ' ( Xji - Xj'2 (5) v ' ( - Zi^ L-J < 1 para todo/ y /, ' *i J Ia cual establece que cada valor de la variable que se us como denominador de debe ser estrictamente menor que el doble de Ia media de X,. Al aplicar suma sobre ambos lados de la desigualdad y despejar, Ia condicin de convergncia asume Ia forma: Vf < 1 vale decir, que el cuadrado dei coeficiente de variacin de Xj debe ser menor que uno. Esta restriccin, que asegura que Ia serie no diverja, es una condicin nece- saria pro no suficiente, ya que puede ser menor que uno aun cuando algn valor Xji de la variable sea mayor que dos veces la media aritmtica. El clculo del coeficiente de correlacin entre las variables de la ecuacin de ajuste (4) ( = /^/ y 2 =
2 il X d se puede realizar a travs de: nrSx S2=X (, - ,) (Z2 - Z2) donde r representa el coeficiente de correlacin y S{ y S2 Ias desviaciones tpi- cas de y Z2 , respectivamente. Despus de una serie de desarrollos9 se llega en definitiva a 8 Ver apndice 1 . 9 Ver apndice 1 . This content downloaded from 146.155.94.33 on Mon, 4 Aug 2014 18:28:03 PM All use subject to JSTOR Terms and Conditions CORTS/RUBALCAVA: NOTAS SOBRE COLINEALIDAD; 187 (6)
<y. - ' y,f V' - 2r23 V2Vs + V' donde V3 y V2 son los coeficientes de variation de X3 y X2 respectivamente y r23 su correspondiente coeficiente de correlation. Esta frmula solo constituye una aproximacin obtenida por mdio de un desarrollo en serie de funciones en la que el tamano del error que se cometa depender tanto del nmero de trminos considerados como de la condition de convergncia dada por Ia desigualdad.
X3i -X3 *' (
X3i _ -X3 < 1 (i=l,2,...,n) V ^3 _ / que solo es una especificacin de (5). En el caso de colinealidad perfecta entre las variables explicativas dei modelo (1) r|3 ser igual a 1 y, segn (6) r2 = (Vs - Vi? = ! V' -2V2 V3 + V' Es decir, la transformation ae las variables es inoperante, por cuanto no reduce el grado de relation entre los regresores dei modelo de ajuste representado por Ia ecuacin (4). Podemos preguntar a continuacin acerca del locus en que se cumple r^3 = r2 . Reemplazando esta ltima igualdad en la ecuacin (6) y despejando conveniente- mente se llega a 2 V2 2V2 si reemplazamos F3/2F2 por a, tendremos la ecuacin cbica r3 _ ar2 -r + =0 donde conocemos dos de Ias trs soluciones: ri = 1 y r2 - - 1. De aqui que resulte sencillo obtener Ia tercera solucin. 2V2 Sobre la base del conocimiento de estas caractersticas hemos procedido ai est- dio numrico de Ia igualdad (6). Los resultados alcanzados se encuentran en el This content downloaded from 146.155.94.33 on Mon, 4 Aug 2014 18:28:03 PM All use subject to JSTOR Terms and Conditions 188 DEMOGRAFIA Y ECONOMA XVII: 2, 1983 apndice 2 de los cuales hemos seleccionado algunos para exponerlos graficamen- te en el apndice 4. En la grfica debemos distinguir Ia zona formada por el tringulo OBC en que cualquier punto en ella se caracteriza por r2 < r2 , dei rea includa en el interior dei tringulo OBA donde r2 >r2 . Resulta evidente que solo podremos mitigar los efectos de Ia colinealida si ai aplicar Ia transformacin no lineal (1/X3) ai modelo (1) nos ubicamos en un punto que est dentro dei tringulo inferior. Las condiciones para que Ia correlacin entre las variables X2/^3 Y 1/^3 sea menor que Ia existente entre X2 y X3 han resultado ser: (0 a> a2 donde a2 = (- ^ Y (ii) El signo de r23 debe ser igual ai signo de V3/2V2. Adernas debemos agregar Ias restricciones provenientes dei desarrollo en serie de funciones: (iii) Condicin necesaria de convergncia V'< 1 (iv) Condicin necesaria y suficiente de convergncia:
= < ! 0 = 1- >) ' / Es decir si existe una relacin lineal estrecha entre las variables del modelo (1) no siempre se puede disminuir el grado de colinealidad a travs dei expedien- te de generar una ecuacin de ajuste dividiendo dicha igualdad entre una de las variables (por ejemplo X3). Este procedimiento ser efectivo para reb ajar las consecuencias de Ia colinealidad si se cumplen todas Ias condiciones que hemos establecido. En cualquier otro caso Ia estratgia conducira a intensificar Ia relacin. Un ejemplo* Sobre Ia base de datos trimestrales para el perodo 1970-1977 para Ia economia mexicana, se ha decidido estimar una ecuacin para el nivel de precios en funcin * Los resultados que se exponen en esta seccin han sido tomados de un trabajo presen- tado ai Curso de Econometria dei programa de maestria en Economia de El Colgio de M- This content downloaded from 146.155.94.33 on Mon, 4 Aug 2014 18:28:03 PM All use subject to JSTOR Terms and Conditions CORTS/RUBALCAVA: NOTAS SOBRE COLINEALIDAD 189 de los salrios y de la cantidad de dinero.10 Al realizar el ajuste mnimo cuadr- tico ordinrio se detecto autocorrelacin entre los resduos, Io que condujo a realizar una regresin en diferencias finitas de primer orden generalizadas, con los siguientes resultados: (7) 7f= 13.585 +0.156 X*x + 1.225 X*, (S =0.082) (Sh =0.186) ( =1.917) ( t =6.581) R2 = 0.9622 F= 343.967 y r23 = 0.9471 donde Y x = Yi - pYi - l, y Yi es el ndice de precios de los bienes no duraderos en el tiempo i. X2i -X2i- pX2 9i_i X2i es un ndice de salrio en el trimestre i X3i =X3i- pX3 f_2 X3i es Ia cantidad de circulante en /. Adernas, se define en la ecuacin et = pez_i + yh en que e. son ios resduos observados y , representa los errores carentes de autocorrelacin. Los resultados de este ajuste parecen ser consistentes en la medida que los coeficientes tendran el sentido que era de esperar desde el punto de vista terico. El valor dei coeficiente de determinacin pareceria estar fuertemente infludo por Ia intensa colinealidad existente entre los regresores.11 Adernas, esta misma relacin lineal estrecha podra ser Ia causa de que el efecto de los salrios sobre el nivel de precios sea estadsticamente igual a cero. Para intentar disminuir las consecuencias de la colinealidad podramos dividir toda Ia ecuacin entre X* ya que los datos muestran que ningn valor de X* es mayor que dos veces Ia media aritmtica con Io cual se cumple Ia condicin nece- saria y suficiente de convergncia. Ambos coeficientes de variacin son menores que uno. V2 =0.4643 y V3 = 0.4229 xico, por el estudiante Rodrigo Quintanilla. fen este artculo, no nos interesa discutir Ia naturaleza dei modelo ni sus resultados sustantivos, solo queremos mostrar la bondad del mtodo que estamos proponiendo. io Los detalles referidos a Ia informacin se encuentran en el apndice 3. li Ya que/?2 =rJ2 +;>13 ~ 2ri2 ri3 ^2i> This content downloaded from 146.155.94.33 on Mon, 4 Aug 2014 18:28:03 PM All use subject to JSTOR Terms and Conditions 1 90 DEMOGR AF A Y ECONOM A XVII: 2, 1 983 De donde resulta que: S-l"'f =0.2074 (2 V,)' Por Io tanto, r'3 > a* Cumplindose de esta manera la tercera condition. Por ltimo, tambin resulta que se satisface Ia condicin de signos iguales para a y r23 . De acuerdo con los desarrollos de Ia seccin anterior la division de Ia ecuacin (7) entre X3 , debera conducir a una disminucin de Ia colinealidad. Segn Ia frmula (6) el r2 -la correlation entre l/X* y X*/X* de la ecuacin transforma- da- debera ser aproximadamente igual a: 2 ^ [0.4229- (0.9471) (0.4643)]2 (0.4229)2 - 2 (0.9471) (0.4229) (0.4643) + (0.4643)2 r2 =0.0126 r =0.1122 El ajuste de Ia ecuacin transformada ha dado los siguientes resultados. ? / 1 ' / X* ' (8) l- =11.152 I
1+0.119 f-fM +1-291 Xti (5^=1.962) 'X*. j (5^=0.087) 'X*U ] (5^=0.199) ( t = 5.685) ( t = 1 .366) ( t = 6.555) R2 =0.5672 F= 17.692 y r23 = 0.060 12 La cada sustancial dei coeficiente de determination se explica basicamente por Ia disminucin en la correlation entre los regresores.13 Los coeficientes de las ecuaciones (7) y (8) no diferen esencialmente. Debe recordarse que el trmino libre de (8) es el coeficiente de X3 y que el coeficien- te de I/X3 es la constante de la ecuacin (7). 12 Si se quisiera lograr una mejor aproximacin entre el valor de r dado por (6) y la corre lacin entre los regresores del modelo de ajuste, debera incorporarse un nmero mayor de trminos en el desarrollo en serie de funciones. 13 Un buen estdio de los factores de que depende el coeficiente de determinacin y sus correspondientes interpretaciones se encuentra en: Duncan O. D., Partials, Partitions Paths, en Sociologycal Methodology 1970. Borgatta . F. y Bohrnstedt G. Eds. Jossey Bass, 970. This content downloaded from 146.155.94.33 on Mon, 4 Aug 2014 18:28:03 PM All use subject to JSTOR Terms and Conditions CORTS/RUBALCAVA: NOTAS SOBRE COLINEALIDAD 1 9 1 A pesar de haber reducido sustancialmente el grado de colinealidad entre los regresores, los errores estndares de los estimadores experimentaron tanto un alza absoluta como en relacin al valor de la estimation, lo que se refleja en que los coeficientes t de (8) son inferiores a los de la ecuacin (7). Esto nos muestra que la disminucin de la correlation entre los regresores no necesariamente se refleja en una mayor precision en las estimaciones. En consecuencia, la transformation no lineal aplicada sobre el modelo original disminuir el nivel de la colinealidad si se cumplen las condiciones que hemos estipulado, pero ello no siempre se traduce en una disminucin de los errores estndares de los estimadores, ya que ai dividir entre X3 se puede introducir heterocedasticidad en modelos homocedsticos. En la prxima seccin expondre- mos algunos muy breves alcances sobre esta temtica. A MODO DE CONCLUSION: MULTICOLINEALIDAD, HETEROCEDASTICIDAD Y VARIANZA DE LOS ESTIMADORES En los casos que aplicamos la division entre una de las variables explicativas y que efectivamente logramos disminuir el nivel de Ia colinealidad, Ia cada de Ia correlation entre los regresores tendr como efecto Ia disminucin en la varianza de los estimadores. Pero la transformation aplicada sobre el modelo tendr tam- bin un impacto sobre los errores de los estimadores dependiendo de Ia naturaleza dei trmino de error. En efecto, si el modelo adernas de presentar una relacin lineal estrecha entre las variables explicativas, tiene: (0 Errores homocedsticos. La division entre X3 introducir heterocedastici- dad, lo cual har aumentar Ia varianza de los estimadores. Que Ia varianza de los estimadores de Ia ecuacin transformada sea mayor o menor que Ia de los estimadores dei modelo original, ser Ia resultante de Ia dis- minucin operada por Ia cada en la colinealidad y el aumento causado por Ia heterocedasticidad. (//) Errores heterocedsticos dei tipo: Ui=X3iVi donde Vf = 2 para todo i. En este caso la division entre X3 transforma un modelo heterocedstico en homocedstico, con lo cual se debe producir un aumento en la precision de las estimaciones. Los efectos de disminucin del nivel de colinealidad y el hecho de pasar de un modelo hetero a uno homocedstico se refuerzan mutuamente para hacer bajar la varianza de los estimadores. (0 Errores heterocedsticos de cualquier tipo. En esta situation la precision de las estimaciones ser la resultante del aumento inducido por la menor correlacin entre los regresores y el efecto que se produz- ca sobre ellas via el alejamiento o cercania respecto a Ia homocedasticidad. This content downloaded from 146.155.94.33 on Mon, 4 Aug 2014 18:28:03 PM All use subject to JSTOR Terms and Conditions 192 DEMOGRAFA Y ECONOMIA XVII: 2, 1983 Estas consideraciones que han vinculado el tratamiento dei problema de Ia colinealidad con el de la heterocedasticidad, proveen un critrio para seleccionar la variable que se usar como divisor en el modelo; se debe elegir aquella variable que adernas de cumplir con las condiciones de convergncia de las series, sea la que introduce heterocedasticidad en el modelo. La generalizacin de este estdio al caso de modelos con ms de dos variables explicativas, se hace bastante compleja desde el punto de vista matemtico. Sin embargo, hemos aplicado el procedimiento descrito a modelos lineales de dicho tipo y en algunas ocasiones se ha logrado aumentar los niveles de precision en las estimaciones de los parmetros. This content downloaded from 146.155.94.33 on Mon, 4 Aug 2014 18:28:03 PM All use subject to JSTOR Terms and Conditions CORTS/RUB ALAVA: NOTAS SOBRE COLINEALIDAD 193 Apndice 1 Media aritmtica y varianza de razn de variables. Correlation de variables de razn. 1 . Media aritmtica Sea , = -^
/=1,2, ...
m -h?! -- Definamos xki = Xki - Xk y XH = Xji ~ Xj Por Io tanto Pero ' xi I x, x)
- Y La condition de convergncia de la serie es I - ^ - J < 1 . / x- Vv Xi ' Ahora bien, supongamos que
- -=^ 1 es Io suficientemente pequeno ' xi I como para no considerar las potncias may ores que dos. Reemplazando y desarro- llando se llega a M[Z]=^- [l-r^V.Vj + Vj] Xi This content downloaded from 146.155.94.33 on Mon, 4 Aug 2014 18:28:03 PM All use subject to JSTOR Terms and Conditions 194 DEMOGRAFA Y ECONOMA XVII: 2, 1983 2. La varianz a v[*]+|"[*]|a =4-E(jf-) =_L . -M-Hi + -4m_Vi +_^L_y / ^V + X* )' X> I Pero H^"-f- if-
/ _ y Con la condition de convergncia ( - -^- _ ) < 1 . Bajo el supuesto que esta ' , I ltima expresin es Io suficientemente pequena como para lograr una buena apro- ximacin aun cuando se eliminen las potncias mayores que dos. Despus de reemplazar y desarrollar se concluye que X2 Var[Z]- _k2 [Vl - 2rkj Vk Vj + Vf] Xi 3. El coeficiente de correlation Sea r el coeficiente de correlacin entre las variablez Zk y Zm y Sk y Sm sus desviaciones tpicas. nrSkSm =( - Zk) (Zmi - Zm) donde X X X; (Zki - Zk) (Zmi _ zm) C Xk'Xmi -nZkZm ^ A Xf H ** )' Xm)' * ) This content downloaded from 146.155.94.33 on Mon, 4 Aug 2014 18:28:03 PM All use subject to JSTOR Terms and Conditions CORTS/RUB ALAVA:" NOTAS SOBRE COLINEALIDAD 195 Pero (*- I - 2 V 1 Con la condi ci n de convergncia I - 2 1 < 1 y suponiendo que la tasa de V * I convergncia es rpida se pue den eliminar todas las potncias superiores a dos. Despus de reemplazar la serie y de operar algebraicamente se concluye en
Vkm Vk Vm - rki VkVf- rmj Vm V, + Vf'2 r2 [VI - 2rkj Vk Vj + Vfl [V2m - 2rmj Vm Vf + Vf' Donde Vk, Vm y Vj simbolizan los coeficientes de variacin de las variables Jf^, Xm y Xj, respectivamente. Ahora bien, a nosotros nos interesa el caso particular 7 - 7 - ~ '/ 7 - y - - 2'" ^ki - ~ ~ y '/ ^mi 7 - ~Z2 y - - ~ 3 3 Como Vk = V
- 0 ya que el numerador de ZY es una constante, desaparecen de r2 todos los trminos multiplicados por Vk r2 JL (V' - r23 V2 V3)2 V[V'-2ri3V2 V3 + V'] r* - (^3 - '23 V2)2 V' - 2r23 V2 V3 + V' Si reemplazamos a = ~ - zv2 Llegamos a: 2 (2a- r23)2 1 -4<zr23 +4j2 Con esta frmula se realizaron los clculos dei apndice 2 y Ia grfica dei apn- dice 4. This content downloaded from 146.155.94.33 on Mon, 4 Aug 2014 18:28:03 PM All use subject to JSTOR Terms and Conditions ) C - "
" 6 d ovovoON^-^r-OC-^mOinOOoooOOooOO^Omc^ 00 ^f- OOr-^'^"'-HrO^Or>-TtOfOTfOOOOOOO^tfOO'1^-r^ Q vq ON O' O' O' O' ON O' On 00 00 t^ 'O > h ih VO r 00 00 00 ^^5 CD ^^D ^^d ^^5 f|^^ ^^5 CD ^^5 ^ZD ^^^ ^^5 CD ^^^ ^^^ ^^^ ^^? ^^5 CD CD ^^5 CD CD CD ^^? ^^5 ^^^'^^^' ^ OS C^VOrOCNt-iONr^m^HNOO^-tONfNm^-ti-HW^NOs- * ^ Os On On On On oo oo oo oo i> t^ vo ^t ; en ' -*
-h en rt vo t*^ t**-# oo oo ^5 CD ^D d* ^D ^D CD ^D CD ^D ^D CD ^D ^D CD ^D ^D CD ^D ^D CD ^D ^D ^D ^D ^D v_ ^HfO^-OcOiNmOrl-tNOOOOONOONOOOOiSTi-Ov^ o ^ ONONONONOooooqoot^vovou^cor^pppr^fou^vovor^oooo ^^ C3 ^D CD ^D CD ^D ^D CD CD ^D ^D ^D ^D ^D CD ^D CD ^D ^D ^D CD ^D CD ^D C3 ^ttSCOVOUOOOTfOfOt^ONtOOC^COfOt^OU-iONt^rOOrrOO '0^0'''''-<<-'( o* <n on on oo [oo oc oc | r^
r^ vc j vo wt en | <n -j ^^ rs en ^ vo vo t- r^ oo ^t VO ((0^0^^^^0<0'( ^ ON ON 00 00 * r^ h; VO ^ ( ^h ^ M ^ < VO ^ Is- Is; 00 - 0(0'0'^'0(0'^ f**. - o^ i^<sn<NONvO'-H<or->r^mi-iON-4^^o'i-HU->r^r-n^HvoONrs
On On 00 oo h- r* VO ^ CO <N CO tJ- vo -^ - r- 00 OO^-^-vO'-it^'-HOOOcOCOOOOCOCOOOO'- ^- tVO^" CS ^ rJ--<coOC^<Nr>-0'-HOr^TfI^-0^"r-r-0'-<Ot^<Nr^OCO Q o on o' oo oo t^ ^ 'o 'o ^ ^ ri ^ q q q ^ ri ^t > vu 'o Is; r*; oo oo ^D <^i ^^ CD ^D ^^ <^> CD *^* ^D ^? ^D ^D ^D ^D CD ^D ^D ^D ^D ^D ^D ^D *^ ^D ^D ^r^t^^^'^t'-iOO'-^iNcoOOcoCSt-HOO'-HTfiOU-jr-tN ^h ^ Tto^oO'^tONCO'nmcoOoo^'-HOOOco^^coONTtoO'-HTt Q o ONONOor^t^vqvqu^^cocsopppc^co^^vovqt^r^oooo o A o HOOi-^f^OOOinoOGOOQOoo^OOONON-OONn
A o o ^OOvo^voONOONVOCOCOOcOCOVOONOONVO^voOtNU^ O . ONONOOt^t^VO>^U^COCSi-HOpP'--"CNCOV^>nvOt*^ts^OOOOOO ^^^ ^^^ ^^^ ^^^ ^^^ C^5 ^^^ CD CD C^ C^ CD CD CD ^^5 ^ ^^^ ^^^ CD CD ^^^ ^^^ CD CD CD ^ ^ COONOO^tONCO>nncOOOOr-iT-iOOOCOV>UOCOONTfOO-HrtVO 0
ONoor^t^vqvo^^cocspppoc^coTi-invqvqr^r^oooooo I ^^ ^D ^D CD ^5 CD CD ^D ^D CD G^ ^D ^D ^D ^D CD CD ^D ^D CD CD ^D CD ^D ^D C^ , _^ OO^H^-Hr^^HOOOcOCOOOOcOCOOOOt-iC^^HVOTl-t^-vo 01 , _^ X cooNr^nr^o^-HOc^Tt^-o-^-^-r^Ot-ior^c^i^ocomr- o ONoor^r^vqvo^^^^qqq'-HtN'tinvqvqr^t^oooooooo OOON'-iOIO'-H^HOvoO'-H'-iOvOO'-t'-HOiN^HONONCOCOON CO On ''^^'-^^-^^ P ^oo^r^vq^rtcoojppppoicoTt^vor^r^r^oqoooooo -- vo ONONCoONcoNOO^oinOOcseocNOeo^vocNeoONeo g 2!r ^H cooonocO"^-coOvo<^"0"^'voocO'^"coOnON(Nnr^ooo .5 o o" ONoor^i^vo^^co'^ppO'^coTf^vqr-'r^p^oooooooooN g m m <NcoOcoi^ONnor~cocor^onONr^co0^l-oou-)vocot^oo o-S _: CN ^'^'- iHOm^HHOWlONNmhONOH ^S
ONoot^vqvq^cocNj^op'^^co^vqvqr^r^oooooooooNON g '^ ^D ^D ^D ^D ^D ^D C^ ^D ^D ^D ^D ^D CD ^^ ^D ^D ^D CD CD CD ^D ^D CD CD ^D o. "ti vo vo 00OTrcSOOOO0NO0NOOOOCSTl-On<SC0OrtnTf -^o
X vo Tj-Ol^ON'-HOVOOmOlnOvoO'-HONnOcOVOOOO'-H<NrO % c$ : ONONr^vqvo^cocspppcscou^vovor^ooooooooONONONON - ..
_g ^ r- on ncNOOco^-OONOONONOONO^-cooo'novovooiinmcoO *a^
1
ON On r^ t^ vo ^ CO ^ O O #^ CO Tt vq C^ r^ 00 OO 00 00 ON On ON On On g
1 dciddd S 8 00 Ti- vo^HO^OOOOOOOOOOO^Oior-Ot^i-Hi-HONVotNvo ""* _ vo vocoOcOTfOOOOOOO^tcOOTfr-O^HCOTl-Tj-iovovo
1 -j On on oo r^ vq ^ en *-
; - < en vq r* oo oo oo On on On On On On on on m I 1 * * ' -' o* o* o* a II ^ ~ _h -^ONTf-O'-ioO'-HOO'-HOOf-tO^-ONCsooooNinomoO'-ico o/^ ^ ~ _h o OOmvo^HfSvoNmiONvoCS^HVOONCNcOinmvor^C^r-OOOO ^ J. O o Os on oo M ^ < en < r oo oo oo O' On On On On On On On On O' I
" " " o' o* o' o" o" o* o* 2 ~* - S _: -j _j - : _j <-n - -j - : - _j - ; - : - : - -j _: _j j ; - ; _: - : - : | u-> On oo r-> vq rt ; co es -
^h ^-J ^h h2 ? *V. I I I I I I I I I I I I - r. This content downloaded from 146.155.94.33 on Mon, 4 Aug 2014 18:28:03 PM All use subject to JSTOR Terms and Conditions CORTS/RUBALCAVA: NOTAS SOBRE COLINEALIDAD 197 Apndice 3 LOS DATOS. A5O Trimestre Indice de precios Indice de sa- Dinero al consumidor de larios2 (Miles de mill.)2 los bienes no du- raderos * 1970 1 100.0 100.0 44.47 2 100.4 101.0 45.55 3 102.0 103.1 46.40 4 102.6 110.3 49.44 1971 1 104.7 102.1 47.81 2 105.8 111.3 48.90 3 106.3 111.3 49.93 4 107.0 119.6 53.21 1972 1 108.0 112.4 53.47 2 109.4 114.4 55.45 3 111.2 118.6 57.77 4 112.6 127.8 61.15 1973 1 116.2 119.6 64.69 2 120.9 125.8 68.05 3 130.0 129.9 72.50 4 138.9 157.7 74.70 1974 1 154.8 151.5 77.99 2 160.1 156.7 82.65 3 165.5 169.1 85.86 4 173.9 203.1 89.65 1975 1 178.2 190.7 95.26 2 183.4 202.1 100.94 3 189.4 212.4 103.32 4 192.2 222.7 108.67 1976 1 198.0 220.6 112.00 2 202.2 238.1 117.79 3 208.0 254.6 130.14 4 236.1 322.7 140.04 1977 1 256.6 311.3 146.05 2 268.8 325.9 147.78
3 280.1 344.5 160.70 1 Indices Econmicos. Banco de Mexico. 2 Financial Statistics. Fondo Monetrio Internacional. This content downloaded from 146.155.94.33 on Mon, 4 Aug 2014 18:28:03 PM All use subject to JSTOR Terms and Conditions 198 DEMOGRAFIA Y ECONOMA XVII: 2, 1983 Apndice 4. Grfica de la relation entre r2 y r2 23 para trs valores particulares de a I 00 C
-^-"=;***3^I B 0 ,so.it! - """'''':'"""^' // ' .^'5:-:;;v/>-"""^<>"" 0 X 0.75 -V *^ .&'' f*^'^^X / V / '-^z / l /^^^^^/23<0;a = 0.6yr23^0
/ CONDICIONES / / :
V DESOLUCION: ' / *&/ (ii) signo de r ' / '-/ v3 ' / ^* / Igual al signo de
/'. ..&^^/ ()V2,3<I ooo JZ_ _^^
-=<-
, ^ r^ 0 0.25 0.50 0.75 I This content downloaded from 146.155.94.33 on Mon, 4 Aug 2014 18:28:03 PM All use subject to JSTOR Terms and Conditions