Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Regresión, Correlación y Determinación
Regresión, Correlación y Determinación
Recta de Regresión
La ecuación de la recta de regresión es la siguiente:
Ejemplo
Para un nuevo material se quiere conocer cuánto será la compresión (Y)
en el espesor cuando se lo somete a diferentes niveles de presión (X).
Y X
Compresión Presión
1 1 1,00 3,00 2,00 1,00 7,40 9 11,00
1 2 4,00 2,00
2 3 9,00 6,00
2 4 16,00 8,00 b a
4 5 25,00 20,00 0,700 -0,1
̅e𝒚
Siendo 𝒙 ̅ las “medias” (valores promedio) de ambas variables.
Coeficiente de Correlación
La covarianza es una medida de la variabilidad común de dos variables (crecimiento de ambas al
tiempo o crecimiento de una y decrecimiento de la otra), pero está afectada por las unidades en
las que cada variable se mide. Por lo tanto, es necesario definir una medida de la relación entre
dos variables, que no esté afectada por los cambios de unidad de medida. Una forma de conseguir
este objetivo es dividir la covarianza por el producto de las desviaciones típicas de cada variable,
ya que así se obtiene un coeficiente adimensional, "R", que se denomina coeficiente de
correlación lineal de Pearson.
Se calcula dividiendo la Covarianza de "x" e "y" (Sxy) por el producto del Desvío estándar de "x"
(Sx) y el Desvío estándar de "y" (Sy).
Coeficiente de Determinación
El coeficiente de determinación "R2" brinda información sobre la bondad del ajuste.
Para obtener el "R2" se divide la Suma de Cuadrados de la Regresión (SCR), que es la variación
explicada por el modelo de regresión, por la Suma de Cuadrados Total (SCT), que es la variación
explicada por el modelo de regresión más la variación no explicada debido al error aleatorio.
Ello significa que mide la proporción de la variación total que se puede explicar por el modelo de
regresión y se puede calcular aplicando la siguiente fórmula:
Alternativamente, se puede calcular con la siguiente fórmula, que es la que se utiliza más abajo
para obtener el coeficiente de determinación, “R cuadrado” para el ejemplo propuesto para la
recta de regresión:
“SCE” es la "Suma de Cuadrado de los Errores” que se utiliza para calcular el “error de estimación”
de la recta de regresión, haciendo:
Ejemplo
Utilizando los datos del ejemplo anterior (Niveles de compresión de un material a partir de ejercer
diferentes niveles de presión) se calcula primero la "Suma de Cuadrado de los Errores” para luego
reemplazar este valor en la fórmula de “R2” y obtener así el coeficiente de Determinación.
SCE
Y X R2
Compresión Presión
𝒚 ̅
𝒚
1 1 0,600 0,400 0,16 -1,00 1,00
1 2 1,300 -0,300 0,09 -1,00 1,00
2 3 2,000 - - - -
2 4 2,700 -0,700 0,49 - -
4 5 3,400 0,600 0,36 2,00 4,00
1,10 6,00 0,18 0,82
Siendo el coeficiente de Determinación (R2 = 0,82), podemos concluir que el 82% de los valores de
"y" (niveles de compresión) estarán explicados por los valores de "x" (cantidad de presión ejercida
sobre el material).
Si bien el más utilizado es el coeficiente de Determinación (R2), a partir de este valor podemos
obtener en coeficiente de Correlación calculando la raíz cuadrada de 0,82 llegando a un valor de
R = 0,90.