Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ingeniería Química
Probabilidad y estadística
La regresión lineal es una técnica de modelado estadístico que se emplea para describir una variable de respuesta continua
como una función de una o varias variables predictoras. Puede ayudar a comprender y predecir el comportamiento de
sistemas complejos o a analizar datos experimentales, financieros y biológicos.
Las técnicas de regresión lineal permiten crear un modelo lineal. Este modelo describe la relación entre una variable
dependiente (también conocida como la respuesta) como una función de una o varias variables
independientes (denominadas predictores). La ecuación general correspondiente a un modelo de regresión lineal es:
donde β representa las estimaciones de parámetros lineales que se deben calcular y ϵ representa los términos de error.
• La correlación de Pearson funciona bien con variables cuantitativas que tienen una distribución
normal. En el libro Handbook of Biological Statatistics se menciona que sigue siendo bastante
robusto a pesar de la falta de normalidad. Es más sensible a los valores extremos que las otras dos
alternativas.
• La correlación de Spearman se emplea cuando los datos son ordinales, de intervalo, o bien cuando
no se satisface la condición de normalidad para variables continuas y los datos se pueden
transformar a rangos. Es un método no paramétrico.
Descubrirá que la regresión lineal se utiliza en todo, desde las ciencias biológicas, conductuales,
ambientales y sociales hasta en los negocios. Los modelos de regresión lineal se han convertido en
una forma comprobada de predecir el futuro de forma científica y confiable. Como la regresión
lineal es un procedimiento estadístico establecido hace mucho tiempo, las propiedades de sus
modelos de regresión lineal se conocen bien y pueden enseñarse muy rápido.
Fórmulas utilizadas
• Modelo de regresión lineal simple:
• Ecuación de regresión lineal simple:
• Ecuación estimada de regresión simple:
Interpretación
El coeficiente de correlación de Pearson oscila entre –1 y +1:
Un valor menor que 0 indica que existe una correlación negativa, es decir, que las dos variables
están asociadas en sentido inverso. Cuánto más se acerca a -1, mayor es la fuerza de esa relación
invertida (cuando el valor en una sea muy alto, el valor en la otra será muy bajo). Cuando es
exactamente -1, eso significa que tienen una correlación negativa perfecta.
Un valor mayor que 0 indica que existe una correlación positiva. En este caso las variables estarían
asociadas en sentido directo. Cuanto más cerca de +1, más alta es su asociación. Un valor exacto de
+1 indicaría una relación lineal positiva perfecta.
Finalmente, una correlación de 0, o próxima a 0, indica que no hay relación lineal entre las dos
variables.
Correlación de Pearson
El coeficiente de correlación de Pearson es la covarianza estandarizada, y su ecuación difiere dependiendo
de si se aplica a una muestra, Coeficiente de Pearson muestral (r), o si se aplica la población Coeficiente
de Pearson poblacional (ρρ).
El coeficiente de correlación de Pearson es una prueba que mide la relación estadística entre dos
variables continuas. Si la asociación entre los elementos no es lineal, entonces el coeficiente no se
encuentra representado adecuadamente.
Para llevar a cabo la correlación de Pearson es necesario cumplir lo siguiente:
•La escala de medida debe ser una escala de intervaloo relación.
•Las variables deben estar distribuida de forma aproximada.
•La asociación debe ser lineal.
•No debe haber valores atípicos en los datos.
Correlación negativa muy
fuerte
Características
•Toma valores entre [-1, +1], siendo +1 una correlación lineal positiva perfecta y -1
una correlación lineal negativa perfecta.
•Es una medida independiente de las escalas en las que se midan las variables.
•No varía si se aplican transformaciones a las variables.
•No tiene en consideración que las variables sean dependientes o independientes.
•El coeficiente de correlación de Pearson no equivale a la pendiente de la recta de
regresión.
•Es sensible a outliers, por lo que se recomienda en caso de poder justificarlos,
excluirlos del análisis.
Fórmula
𝑟 𝑥𝑦 =∑ 𝑧 𝑥 𝑧 𝑦 / 𝑁
Dónde:
“x” es igual a la variable número uno, “y” pertenece a la variable número dos, “zx” es la
desviación estándar de la variable uno, “zy” es la desviación estándar de la variable dos y “N”
es número de datos.
N = Número de valores o elementos
Σxy = la suma de los productos de las puntuaciones emparejadas
Σx = la suma de puntuaciones x
Σy = la suma de puntuaciones y