El análisis de regresión es una técnica que estudia la relación entre variables cuantitativas. Su uso más habitual es la predicción (aunque, como luego veremos, tiene más utilidades), de tal forma que a través del análisis de regresión es posible predecir una o varias variables a partir del conocimiento de otra u otras relacionadas. Las variables predictoras (o explicativas) son las independientes y las pronosticadas (o explicadas) son las dependientes. La situación más sencilla se da cuando sólo hay una variable Independiente y otra dependiente: entonces se llama Análisis de Regresión Simple; si son más variables independientes es el Análisis de Regresión Múltiple. Y sí, como vimos en el apartado anterior, la relación es lineal, tenemos una Análisis de regresión lineal (simple o múltiple). Veamos un poco la lógica del Análisis de Regresión. Si tenemos dos variables cuantitativas sobre una misma muestra, podemos representarlas gráficamente mediante un gráfico de dispersión.
Sí estas variables están relacionadas, la nube de puntos que se genera tendrá
una forma alargada. La recta que mejor se ajusta a esos puntos, que minimiza las distancias, es la llamada Recta de regresión. Dicha recta, como cualquier recta en el plano, puede escribirse algebraicamente como: en donde: y es la variable dependiente, a es el punto de corte con el eje y (o intercepto), b es la pendiente, y x es la variable independiente.
De esta forma, si sabemos la ecuación de regresión que determina la relación de
una variable con otra, es posible predecir una variable en función de la otra. Así, si la ecuación es "y=3+2x" y "x” es 3, "y" tomará el valor de 9. Como los puntos no se ajustan completamente a la recta, en realidad habrá que considerar ese elemento como el error. De esta forma, la ecuación de regresión se denota formalmente:
Con esta información, podemos hacer un trabajo práctico. e.5.5. Determina la
ecuación de regresión que ayude a predecir el Rendimiento en Matemáticas de los estudiantes (variable dependiente) a partir de su Rendimiento en Lengua Si un estudiante ha obtenido 50 puntos en Lengua, ¿qué rendimiento se predice que tendrá en Matemáticas? El procedimiento es análogo a lo visto: Analizar-> Regresión -> Lineales. E Incluimos Rendimiento en Matemáticas como variable dependiente, y Rendimiento en Lengua como Independiente. Los resultados son los siguientes: Análisis de regresión múltiple Una sola variable independiente hace una pobre predicción de la variable independiente, por lo que lo habitual es utilizar varias de ellas, es esta forma tenemos el Análisis de Regresión Múltiple. La esencia es la misma, la única diferencia es que la ecuación de regresión no es de una recta, sino de un hiperplano en un espacio de múltiples dimensiones. Matemáticamente se expresa así:
Donde cada β es la pendiente de cada variable x. Veámoslo con un ejemplo.
Estima la ecuación de regresión múltiple para Rendimiento en Matemáticas como variable dependiente y Nivel socio-económico de las familias, actitud hacia las Matemáticas y satisfacción con la escuela y género como independientes. Métodos de selección de variables El SPSS permite utilizar diferentes métodos para seleccionar qué variables independientes incluir en el modelo de regresión y en qué orden. Por defecto, utiliza el método introducir, pero hay más. No-colinealidad. No existencia de una relación lineal entre ninguna ni las variables independientes. Se estudia mediante la opción "Diagnóstico de colinealidad" en Regresión -> Lineal-> Estadísticos.