Está en la página 1de 5

11 ELENA MARTINEZ

28/3/05

18:00

Pgina 327

ERRORES FRECUENTES EN LA INTERPRETACIN DEL COEFICIENTE...

327

Ahora bien, el tamao muestral no es la nica magnitud que


influye en el valor de R2. El nmero de variables explicativas consideradas en el modelo tambin condiciona el valor de este coeficiente, ya que R2 es una funcin no decreciente del nmero de variables
exgenas o regresoras presentes en el modelo, de forma que a medida que aumenta el nmero de variables regresoras R2 aumenta. Su
justificacin es inmediata con tan slo recordar su definicin.
Segn esto, R2 mide la capacidad explicativa de la variable X
sobre la variable Y. Al introducir en el modelo otra variable regresora el nivel explicativo ser mayor entre las dos que slo con la primera o, en todo caso, no disminuir, pues la primera variable contina como explicativa.
As pues, en la interpretacin de R2 no slo es preciso considerar
el tamao de la muestra, sino tambin el nmero de variables explicativas incluidas en el modelo de regresin. En una palabra, hay que
tener en cuenta los grados de libertad del modelo, definidos como la
diferencia entre el nmero de datos y el nmero de coeficientes de la
ecuacin.
En la literatura economtrica podemos encontrar varias soluciones al problema del incremento artificial del valor de R2. Una de
ellas es proponer un coeficiente de determinacin corregido o ajustado, denotado por R2, y definido como

donde k es el nmero de parmetros en el modelo, incluyendo el trmino independiente.


Es fcil comprobar la relacin que mantienen R2 y R2

Observemos que para k > 1, R2< R2, lo cual implica que a medida
que el nmero de variables exgenas aumenta, R2 ajustado aumenta
menos que R2 no ajustado. Observemos que, en este caso, (k > 1), si

11 ELENA MARTINEZ

28/3/05

18:00

Pgina 328

328

ELENA MARTNEZ RODRGUEZ

R2 = 0 R2 puede ser negativa, a pesar de que R2 sea una magnitud no


negativa. Si esto ocurre R2, se interpreta como si su valor fuese 0.
Establecida esta relacin entre los dos coeficientes, podemos afirmar que R 2 corregido tiene la propiedad de ser neutral frente a la
introduccin de variables adicionales. En opinin de algunos autores 4, es mejor utilizar R2 en lugar de R2, porque R2 tiende a dar una
imagen demasiado optimista del ajuste de la regresin, particularmente cuando el nmero de variables explicativas no es muy
pequeo comparado con el nmero de observaciones, lo que podramos considerar como un grado de libertad del modelo inadecuado. No obstante, esta opinin no es compartida totalmente, ya
que se pueden proponer otras formas de corregir el aumento indeseado de R2, como, por ejemplo, el coeficiente modificado que
define Goldberg e r 5:

Ahora bien, debemos tener en cuenta que la utilizacin de cualquiera de los coeficientes alternativos propuestos, R2 ajustado o R2
corregido tiene problemas propios de interpretacin y no resuelve
siempre las deficiencias de R2.
V. MAXIMIZACIN DE R2
En ocasiones los investigadores tratan de maximizar R2, es decir,
escogen el modelo para el cual la R2 es ms elevada. Pero esto puede
ser peligroso por varios motivos. En primer lugar, en el anlisis de
regresin el objetivo no es obtener un valor elevado de R2, sino obtener estimadores precisos de los verdaderos coeficientes de regresin
poblacional. En el anlisis emprico no es raro encontrarnos con
valores altos de R2, pero tampoco que encontremos que alguno de los
coeficientes de regresin no son estadsticamente significativos o
muestran signos contrarios a los esperados a priori. El investigador
4. THEIL, H., Introduction to Econometrics, Prentice-Hall, Englewood Cliff s ,
New York 1978.
5. GOLDBERGER, A. S., A Course in Econometrics.Harvard , University Press,
Cambridge 1991.

11 ELENA MARTINEZ

28/3/05

18:00

Pgina 329

ERRORES FRECUENTES EN LA INTERPRETACIN DEL COEFICIENTE...

329

debe preocuparse por la relevancia lgica o terica que tienen las


variables explicativas para la variable endgena y por su significacin estadstica. Si en este proceso se obtiene un valor de R2 elevado,
muy bien, aunque ello no es evidencia a favor del modelo, y si este
valor es pequeo, esto no significa que el modelo sea necesariamente malo. Respecto a esta cuestin, sealar, sin entrar en ms detalles,
que la prctica de seleccionar un modelo con base en R2 ms elevada
puede tener como consecuencia la introduccin en el modelo de lo
que se conoce como sesgo preprueba, que puede destruir algunas de
las propiedades de los estimadores mnimos cuadrados del modelo
de regresin lineal.
En segundo lugar, es importante sealar, al comparar modelos de
regresin sobre la base del coeficiente de determinacin, el tamao
muestral, y la variable dependiente deben ser los mismos. Por ejemplo, para los modelos

los coeficientes R2 no son comparables. La razn la encontramos


en la propia definicin de R2, que mide la proporcin de variacin en
la variable dependiente explicada por las variables exgenas. En el
primer modelo considerado R2 mide la proporcin de la variacin en
Y explicada por X, mientras que en el segundo modelo mide la proporcin de la variacin de lnY.
Pero incluso cuando la variable endgena es la misma, podemos
encontrarnos con problemas al comparar los valores de R2 si, por
ejemplo, el nmero de regresores es distinto. Pude probarse que
cuando se aade una variable al modelo la suma residual siempre
disminuye. Por tanto, si uno de los dos modelos tiene las mismas
variables que el otro y alguna ms (modelos anidados), como, por
ejemplo, los modelos:

el modelo amplio tendr siempre un valor mayor de R2, siendo por


ello ms preferido. El problema se vuelve ms delicado en el caso en
el que los modelos no sean anidados, siendo necesario recurrir a

11 ELENA MARTINEZ

28/3/05

18:00

Pgina 330

330

ELENA MARTNEZ RODRGUEZ

otros criterios y extremar la precaucin en la interpretacin que


vamos a dar sobre cul de los modelos es, en este caso, preferido.
Como vemos, son muchos los aspectos que debemos considerar
cuando tratamos de comparar los valores de los coeficientes de
determinacin de distintos modelos: que traten de explicar la misma
variable endgena, que ambos tengan o no ordenada en el origen,
que el tamao muestral sea el mismo, que compartan el mismo
nmero de regresores, cuestiones que, en ocasiones, no son tenidas
en cuenta por el investigador, quien basndose exclusivamente en el
valor de R2 como nica medida del grado de bondad del ajuste realizado y, por tanto, en una interpretacin errnea de este coeficiente
decide trabajar con el modelo que proporciona un mximo valor de
R2. De nuevo un mal uso de este coeficiente puede conducir a conclusiones no acertadas.
V. CONCLUSIONES
A travs de ejemplos numricos sencillos y de las representaciones grficas de sus ajustes se ha tratado de transmitir la idea de que
R2 no es la medida mgica que resuelve, en todos los casos, el
problema de la medicin del grado de bondad del ajuste realizado.
La propia estructura de los datos, desconocida a priori, y unos grados de libertad del modelo inadecuados (nmero reducido de observaciones y/o un nmero elevado de variables exgenas en el modelo) son algunas de las situaciones que nos han permitido poner de
manifiesto las deficiencias y limitaciones mostradas por R2 en cuanto a medida de la bondad del ajuste, al tiempo que se evidencia la
necesidad de profundizar en el anlisis economtrico, proponiendo
medidas complementarias al coeficiente de determinacin, de forma
que su utilizacin conjunta garantice una mayor confianza en las
conclusiones obtenidas. De hecho, varios autores comparten la idea
de reducir el nfasis en el uso de R2 como medida de bondad del
ajuste al igual que su uso para comparar dos o ms valores de este
coeficiente con el objetivo de decidir qu modelo de regresin es
preferido.
Las consideraciones destacadas en los distintos apartados no
invalidan la utilizacin de R2 como medida de la bondad del ajuste,
si nos atenemos a interpretarlo de acuerdo con su definicin: medida

11 ELENA MARTINEZ

28/3/05

18:00

Pgina 331

ERRORES FRECUENTES EN LA INTERPRETACIN DEL COEFICIENTE...

331

que recoge cmo en trminos generales la recta de regresin ajustada resume o describe los datos.
Los problemas de interpretacin surgen cuando intentamos que el
coeficiente de determinacin avale la dependencia entre variables y,
a partir de ella, predecir o extrapolar, en el tiempo o en el espacio, la
recta de regresin. En este sentido, si R2 es alto se considera que el
ajuste es vlido y que la ecuacin obtenida representa adecuadamente la relacin cuantitativa entre las variables, pudiendo, por tanto,
aplicarse para determinar los valores de una de ellas, conocidas las
dems.
Este razonamiento es el que desvirta el uso y la interpretacin
del coeficiente de determinacin lineal. Medida que, a pesar de las
deficiencias que presenta, no debe ser desechada como medida de
evaluacin complementaria. Por otra parte, siempre que su interpretacin se ajuste a su definicin, su utilizacin ser correcta.
VI. BIBLIOGRAFA
ACHEN, C. H., Interpreting and Using Regression., Dage Publicaciones,
California 1982, pp. 56-67.
ASCOMBE, T. W., Graphs in Statistical Analisys, en The American Statis tician, 27 (1973) 17-21.
GOLDBERGER, A. S., A Course in Econometrics. Harvard, University Press,
Cambridge 1991.
GRANGER, C., y NEWBOLD, P., R2 and the Transformation of the Regression
Variables, en Journal of Econometrics, vol. 4 (1976) 205-210.
GUJARATI, D. N., Econometra, Mc Graw-Hill, Mxico 2003.
HERNNDEZ ALONSO, J., Uso y abuso del coeficiente de determinacin,
en ESIC Market, 79 (1993) 77-92.
LPEZ URQUA, J., y CASA ARUTA , E., Estadstica Intermedia, VicensVives, Madrid 1969.
NOVALES, A., Econometra, Mc Graw-Hill, Madrid 1998.
Estadstica y Econometra, Mc Graw-Hill. Madrid. 1996.
RAYMOND, J. L.; ANGULO, J., y REPILADO, A., Relaciones de causalidad en
economa y criterios estadsticos para detectar su existencia, Instituto
de Estudios Fiscales, 16 (1982).
THEIL, H., Introduction to Econometrics, Prentice-Hall, Englewood Cliffs,
New York 1978.