Está en la página 1de 4

Coeficiente de determinación R2

SCT (Suma de los cuadrados total)

SCT =∑ ( Y i−Y )2

SCE (Suma de cuadrados Explicada por la Regresión)

SCE =

SCR (Suma de cuadrados Residual o no explicada)

SCR = ∑ u 2

SCT = SCE + SCR


o también como

Pueden observarse dos propiedades de r 2:

Una cantidad estrechamente relacionada con r 2 pero conceptualmente muy


diferente es el coeficiente de correlación, el cual, como mencionamos en el
capítulo 1, es una medida del grado de asociación entre dos variables. Se
calcula a partir de

La tabla 3.3 presenta datos sobre el número de suscriptores de teléfonos celulares y el


número de computadoras personales (PC), ambos por cada 100 personas, y el ingreso
per cápita ajustado por el poder adquisitivo en dólares para una muestra de 34 países.
Por tanto, se trata de datos transversales. Estos datos corresponden a 2003 y se
obtuvieron del Statistical Abstract of
the United States, 2006.
Aunque los teléfonos celulares y las computadoras personales son muy comunes en
Estados Unidos, no ocurre lo mismo en muchos países. Para ver si el ingreso per cápita
es un factor que influye en el uso de teléfonos celulares y PC, se regresó cada uno de
estos medios de comunicación sobre el ingreso per cápita con la muestra de 34 países.
Los resultados son los siguientes:
R cuadrado ajustado (Coeficiente de
determinación ajustado)
El R cuadrado ajustado (o coeficiente de determinación
ajustado) se utiliza en la regresión múltiple para ver el grado
de intensidad o efectividad que tienen las variables
independientes en explicar la variable dependiente.

En palabras más simples, el R cuadrado ajustado nos dice qué


porcentaje de variación de la variable dependiente es explicado
colectivamente por todas las variables independientes.

El uso de este coeficiente se justifica en que a medida que


añadimos variables a una regresión, el coeficiente de
determinación sin ajustar tiende a aumentar. Incluso cuando la
contribución marginal de cada una de las nuevas variables
añadidas no tiene relevancia estadística.

Por lo tanto, al añadir variables al modelo, el coeficiente de


determinación podría aumentar y podríamos pensar, de manera
errónea, que el conjunto de variables elegido es capaz de explicar
una mayor parte de la variación de la variable independiente. A
este problema se le conoce comúnmente como “sobreestimación
del modelo”.

También podría gustarte