Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Regresión Lineal
Regresión Lineal
○ Debil
■ Cuando la nube de punto de los datos, se encuentra distante de una
recta hipotetica
● Correlación Directa
○ Se presenta cuando el aumento de una variable implica el aumento en la otra
○ 0-1
● Correlación Inversa
○ Se presenta cuando el aumento de una variable implica la disminución en la
otra
○ -1 - 0
● Sin Correlación
○ Se presenta cuando no hay ningun tipo de relacion, a nivel lineal, entre las
variables
Regresión Lineal Simple
● Cuando se piensa que una variable depende de la otra, se debe cuantificar la
relacion entre ellas
● Al hacer esto, podemos estimar el valor de una variable, si conocemos el valor de la
otra
● Cuando se estudian 2 variables
○ Regresion Lineal Simple
Ecuacion de Regresion
● Y = Bo+B2X1
Variables en Regresion
● Variables en Regresion Lineal Simple
○ Variable Independiente
■ Explicativa o de entrada X
○ Variable Dependiente
■ De respuesta o de Salida Y
● Asumiremos que si hay una relacion de causalidad de la variable X hacia la variable
Y. Ademas, se sabe que esa relacion es de tipo lineal
Linea de Regresión
● La linea que mejor traza los datos se le conoce como linea de regresión
● La distancia vertical entre los valores observados y los trazados en la recta es
conocida como residual. Llamamos a cada uno de los residuales ei
○ ei = yi - y^i
■ yi -> El observado en la muestra
■ y^i -> El estimado por la ecuacion lineal
Modelo En Regresion Lineal Simple
● En el modelo de regresión lineal simple, dado 2 variables
○ Y (Dependiente)
○ X (Independiente, explicativa o predictora)
○ Buscamos encontrar una funcoin de X muy simple (lineal) que nos permita
aproximar Y mediante
■ Y = B0 + B1X + E
● E son los errores que no se observan
■ Para interpretar el B0
● Se reemplaza X con 0
■ Para interpretar el B1
● Se reemplaza X con 1
Coeficiente de Determinación R2
● Es la proporción de la variabilidad explicada por el modelo
● Este valor R2 esta entre 0 y 1, si el valor es cercano a 1, una gran parte de la
variabilidad de Y es explicada por el modelo
● Si R2 esta cercano a 0 la variabilidad explicada por el modelo e poca
● El incoveniente de este coeficiente es que siempre aumenta cuando introducimos
nuevas variables, aun que estas no sirvan para explicar la respuesta
● Buen modelo si el R2 es mayor al 0,7 y se aproxima al 1 porque la variable Y esta
explicada en gran parte por la variable X