Documentos de Académico
Documentos de Profesional
Documentos de Cultura
En este Tema abordaremos el modelo de regresión lineal, que tiene lugar cuando la dependencia
es de tipo lineal, y daremos respuesta a dos cuestiones básicas: ¿Es significativo el efecto que una
variable X causa sobre otra Y? ¿Es significativa la dependencia lineal entre esas dos variables?
De ser así, utilizaremos el modelo de regresión lineal simple para explicar y predecir la variable
dependiente (Y) a partir de valores observados en la independiente (X).
Es así que el Modelo de Regresión Lineal Simple nos permite explicar Y en términos de X. Sea
Y = β0 + β1x + u, donde
β1: parámetro de pendiente. Mide la relación entre x e y, es decir, cómo cambia y cuando se
producen modificaciones en x.
Si todos los demás factores contenidos en u se mantienen constantes (∆u = 0), x tiene un efecto
lineal sobre y, es decir, ∆y = β1∆x si ∆u = 0.
Y= β0 + β1x + u.
calidad de la tierra.
lluvia.
Ecuación salarial simple: Si Y =salario y X=años de estudio, el término de error (u) recoge
factores no observables como:
experiencia laboral.
capacidad o habilidad.
antigüedad en la empresa.
Dentro del modelo de Regresión Lineal Simple se dan algunos supuestos tales como:
∆x = 1 =⇒ ∆y = β1, ∀x, ∆u = 0.
Media condicional cero: E(u|x) = 0 ∀x. Para cualquier valor de x, la media del término de error no
observable es siempre la misma e igual a cero.
E(u|x) = E(u) = 0.
El supuesto E(u|x) = E(u) = 0 nos lleva a E(y|x) = β0 + β1x. Esta expresión nos proporciona el
valor de la función de regresión poblacional. En este caso es lineal.
Nos indica cómo varía el valor medio de y ante cambios en x, es decir, ∂E(y|x)/∂x= β1
Ello supone aplicar un procedimiento de cálculo (método de estimación) que permita, a partir de los
datos disponibles, obtener los coeficientes de la ecuación de la línea recta que represente
óptimamente la distribución conjunta de las variables modeladas. Ahora bien, ¿cuál es la línea
recta que representa óptimamente a una nube de puntos?, en definitiva, ¿cuál es la que ofrece una
mayor bondad de ajuste?
Otra propuesta de índice de bondad de ajuste complementaria a la anterior, aunque mucho menos
utilizada en la práctica, es el conocido como coeficiente de alienación, el cual también oscila entre
0 y 1, si bien, en este caso valores próximos a 1 indican peor bondad de ajuste del modelo a los
datos.
En síntesis, el modelo de regresión lineal es el más utilizado a la hora de predecir los valores de
una variable cuantitativa a partir de los valores de otra variable explicativa también cuantitativa
(modelo de regresión lineal simple). Una generalización de este modelo, el de regresión lineal
múltiple, permite considerar más de una variable explicativa cuantitativa. Por otra parte, tal como se
verá en un tema posterior, es también posible incluir variables explicativas categóricas en un
modelo de regresión lineal si se sigue una determinada estrategia en la codificación de los datos
conocida como codificación ficticia.
En concreto, según el modelo de regresión lineal simple, las puntuaciones de los sujetos en 2
variables -una de ellas considerada como variable predictora (X) y la otra como variable de
respuesta (Y)- vienen representadas (modeladas) por la ecuación de una línea recta.
Cuando hay más de una variable explicativa (modelo de regresión lineal múltiple), se utiliza un
subíndice para cada una de ellas, por ejemplo, para el caso de dos variables explicativas:
Yˆ = β0 β1 + ⋅ X 1+ β2 X2