0 calificaciones0% encontró este documento útil (0 votos)
20 vistas4 páginas
Este documento explica el coeficiente de determinación R2 y cómo se utiliza para medir qué porcentaje de la variación de la variable dependiente es explicado por las variables independientes. También introduce el coeficiente de determinación ajustado, el cual se usa en la regresión múltiple para medir el efecto de las variables independientes en explicar la variable dependiente, controlando el sobreajuste del modelo que puede ocurrir al agregar más variables. Finalmente, brinda una definición sencilla de que el coeficiente de determinación ajustado mide el porcentaje de variación de la
Este documento explica el coeficiente de determinación R2 y cómo se utiliza para medir qué porcentaje de la variación de la variable dependiente es explicado por las variables independientes. También introduce el coeficiente de determinación ajustado, el cual se usa en la regresión múltiple para medir el efecto de las variables independientes en explicar la variable dependiente, controlando el sobreajuste del modelo que puede ocurrir al agregar más variables. Finalmente, brinda una definición sencilla de que el coeficiente de determinación ajustado mide el porcentaje de variación de la
Este documento explica el coeficiente de determinación R2 y cómo se utiliza para medir qué porcentaje de la variación de la variable dependiente es explicado por las variables independientes. También introduce el coeficiente de determinación ajustado, el cual se usa en la regresión múltiple para medir el efecto de las variables independientes en explicar la variable dependiente, controlando el sobreajuste del modelo que puede ocurrir al agregar más variables. Finalmente, brinda una definición sencilla de que el coeficiente de determinación ajustado mide el porcentaje de variación de la
SCE (Suma de cuadrados Explicada por la Regresión)
SCE =
SCR (Suma de cuadrados Residual o no explicada)
SCR = ∑ u 2
SCT = SCE + SCR
o también como
Pueden observarse dos propiedades de r 2:
Una cantidad estrechamente relacionada con r 2 pero conceptualmente muy
diferente es el coeficiente de correlación, el cual, como mencionamos en el capítulo 1, es una medida del grado de asociación entre dos variables. Se calcula a partir de
La tabla 3.3 presenta datos sobre el número de suscriptores de teléfonos celulares y el
número de computadoras personales (PC), ambos por cada 100 personas, y el ingreso per cápita ajustado por el poder adquisitivo en dólares para una muestra de 34 países. Por tanto, se trata de datos transversales. Estos datos corresponden a 2003 y se obtuvieron del Statistical Abstract of the United States, 2006. Aunque los teléfonos celulares y las computadoras personales son muy comunes en Estados Unidos, no ocurre lo mismo en muchos países. Para ver si el ingreso per cápita es un factor que influye en el uso de teléfonos celulares y PC, se regresó cada uno de estos medios de comunicación sobre el ingreso per cápita con la muestra de 34 países. Los resultados son los siguientes: R cuadrado ajustado (Coeficiente de determinación ajustado) El R cuadrado ajustado (o coeficiente de determinación ajustado) se utiliza en la regresión múltiple para ver el grado de intensidad o efectividad que tienen las variables independientes en explicar la variable dependiente.
En palabras más simples, el R cuadrado ajustado nos dice qué
porcentaje de variación de la variable dependiente es explicado colectivamente por todas las variables independientes.
El uso de este coeficiente se justifica en que a medida que
añadimos variables a una regresión, el coeficiente de determinación sin ajustar tiende a aumentar. Incluso cuando la contribución marginal de cada una de las nuevas variables añadidas no tiene relevancia estadística.
Por lo tanto, al añadir variables al modelo, el coeficiente de
determinación podría aumentar y podríamos pensar, de manera errónea, que el conjunto de variables elegido es capaz de explicar una mayor parte de la variación de la variable independiente. A este problema se le conoce comúnmente como “sobreestimación del modelo”.