Documentos de Académico
Documentos de Profesional
Documentos de Cultura
La regresión lineal es un método estadístico útil que podemos utilizar para comprender la
relación entre dos variables, xey. Sin embargo, antes de realizar una regresión lineal,
primero debemos asegurarnos de que se cumplan cuatro supuestos:
1. Relación lineal: existe una relación lineal entre la variable independiente, x, y la variable
dependiente, y.
Si se violan uno o más de estos supuestos, los resultados de nuestra regresión lineal
pueden ser poco fiables o incluso engañosos.
En esta publicación, proporcionamos una explicación para cada suposición, cómo
determinar si se cumple la suposición y qué hacer si se viola la suposición.
Por ejemplo, los puntos en la gráfica de abajo parece que caen aproximadamente en una
línea recta, lo que indica que existe una relación lineal entre xey:
Sin embargo, no parece haber una relación lineal entre xey en la siguiente gráfica:
Y en esta gráfica parece haber una relación clara entre xey, pero no una relación lineal :
2. Agregue otra variable independiente al modelo. Por ejemplo, si la gráfica de x vs. y tiene
una forma parabólica, entonces podría tener sentido agregar X 2 como una variable
independiente adicional en el modelo.
Supuesto 2: Independencia
Explicación
El siguiente supuesto de la regresión lineal es que los residuos son independientes. Esto es
más relevante cuando se trabaja con datos de series de tiempo. Idealmente, no queremos
que haya un patrón entre residuos consecutivos. Por ejemplo, los residuos no deberían
crecer constantemente a medida que pasa el tiempo.
Una vez que ajusta una línea de regresión a un conjunto de datos, puede crear un diagrama
de dispersión que muestre los valores ajustados del modelo frente a los residuos de esos
valores ajustados. La gráfica de dispersión a continuación muestra un valor ajustado típico
frente a una gráfica residual en la que está presente la heterocedasticidad.
Observe cómo los residuales se dispersan mucho más a medida que los valores ajustados
aumentan. Esta forma de «cono» es un signo clásico de heterocedasticidad:
Supuesto 4: Normalidad
Explicación
El siguiente supuesto de la regresión lineal es que los residuos se distribuyen normalmente.
Lin - Lin
Log - log