Documentos de Académico
Documentos de Profesional
Documentos de Cultura
R² muestra qué tan bien los términos (puntos de datos) se ajustan a una curva o línea.
¿Cuándo utilizarla?
R 2 𝟐
´𝑹
DIAPOSITIVA 2
-El coeficiente de determinación tiene un objetivo, y la vamos a usar cuando queremos medir
como de bueno es un modelo.
-y de ahí comúnmente se conozca a esta medida como bondad del ajuste.
- un ajuste que puede ser lineal.
-o no y que además.
-puede tener distintas variables explicativas, también hay varias formas de expresar esta medida.
- pero quizá la mas sencilla sea esta.
-la que lo expresa como el cociente entre la varianza de los datos estimados por el modelo.
-y la varianza de los datos observados.
-o de forma equivalente como 1 menos el cociente.
- entre la varianza de los residuos.
- y la varianza de los datos observados.
- Es intuitivo ver que el r cuadrado representa la proporción de varianza explicada por el modelo
y esta medida se suele expresar.
- esta vez en tanto por ciento, asi cuanto mas cerca estemos de 100, mas varianza de la variable
dependiente conseguimos explicar con nuestro modelo y será en teoría un modelo mejor.
- Aquí el coeficiente de determinación tiene un pequeño handicap, y es que cuanto mas
variables explicativas, significativas o no, tenga nuestro modelo, mas alta va a ser la medida.
Concretando, el coeficiente de determinación o bondad del ajuste mide cuanta varianza explica un
modelo cualquiera( no necesariamente lineal, y no necesariamente con una variable explicativa)
DIAPOSITIVA 3
Sin embargo, el problema con R-cuadrado como mencioné anteriormente es
que permanecerá igual o aumentará con la adición de más variables, incluso si
no tienen ninguna relación con las variables de salida.
Teniendo en cuenta que 1- R2 es un número constante y que N es mayor que k, a medida que añadimos variables al
modelo, el cociente entre paréntesis se hace más grande. Consecuentemente. también el resultado de multiplicar este por
1- R2 . Con lo cual vemos que la fórmula está construida para ajustar y penalizar la inclusión de coeficientes en el modelo.
Además de la ventaja anterior, el ajuste empleado en la fórmula, nos permite también comparar modelos con distinto
número de variables independientes. De nuevo, la fórmula ajusta el número de variables entre un modelo y otro y nos
permite realizar una comparación homogénea.
En conclusión, podemos deducir que el coeficiente de determinación ajustado será siempre igual o menor(inferior) que el
coeficiente de determinación R2. Al contrario que el coeficiente de determinación que varía entre 0 y 1, el coeficiente de
determinación ajustado podría ser negativo por 2 motivos:
• Cuanto más se aproxime k a n.
• Cuanto menor sea el coeficiente de determinación.
DIAPOSITIVA 6
tanto R² como el R² ajustado le dan una idea de cuántos puntos de datos caen dentro de la línea de ecuación de
regresión . Sin embargo, R2 asume que cada variable individual explica la variación en la variable dependiente . El R²
ajustado le indica el porcentaje de variación explicado solo por las variables independientes que realmente afectan a
la variable dependiente.
En realidad, R² ajustado lo penalizará por agregar variables independientes (K en el ecuación) que no se ajustan al
modelo. ¿Por qué? En análisis de regresión puede ser tentador agregar más variables a los datos a medida que los
piense. Algunas de esas variables serán significativas, pero no puede estar seguro de que la importancia sea solo por
casualidad. El R² ajustado lo compensará con la penalización de esas variables adicionales.
TAMBIEN PODEMOS CONCLUIR CUALES SON LOS PROBLEMAS CON R² QUE SE CORRIGEN CON R² AJUSTADO:
1. R² aumenta con cada predictor agregado a un modelo . Como R² siempre aumenta y nunca disminuye, puede
parecer que se ajusta mejor con más términos que agregue al modelo. Esto puede ser completamente engañoso.
2. Del mismo modo, si su modelo tiene demasiados términos y demasiados polinomios de alto orden, puede tener
problemas para ajustar los datos. Cuando se ajusta demasiado a los datos, un valor R² engañosamente alto puede
conducir a proyecciones engañosas.