Está en la página 1de 24

REGRESIÓN LINEAL

La regresión es una de las herramientas estadísticas mas


poderosas y versátiles que se puede utilizar para solucionar
problemas comunes en las empresas. Muchos estudios se basan
en la creencia de que se puede identificar y cuantificar alguna
relación funcional entre dos o más variables. Se dice que una
variable depende de otra. Se puede decir que Y depende de X.
Determinación del modelo de regresión lineal o
simple

Y=b0 + b1X
Donde b0 es el intercepto con el eje y, b1 es la
pendiente
Relaciones entre variables
Positiva Negativa
Las relaciones entre variables son determinísticas o estocásticas.
Una relación determinística es cuando existe un a relación exacta y
no hay error.
Infortunadamente, muy pocas relaciones en el mundo de los
negocios son así de exactas. Con frecuencia se encuentra que al
utilizar una variable para explicar otra, existe una variación en la
relación. Por tanto se dice que en un modelo de esta naturaleza es
estocástico, por la presencia de la variación aleatoria y puede
expresarse como
Y=β0 + β1x + ε
Ŷ=b0 + b1X + ε
Método de mínimos cuadrados
El propósito del análisis de regresión es determinar una recta que se ajuste a los datos
muestrales mejor que cualquier otra recta que pueda dibujarse. Para ilustrarlo, se asume que
Vita+Plus, Inc. Recolecta datos sobre los gastos publicitarios y los ingresos por ventas de 5
meses, como se muestra en la tabla
Ejemplo:
La gerencia de Hop Scotch Airlines, la aerolínea transportadora
más pequeña del mundo, considera que existe una relación
directa entre los gastos publicitarios y el número de pasajeros
que escogen viajar por Hop Scotch. Para determinar si esta
relación existe, y si es así cuál podría ser la naturaleza exacta,
los estadísticos empleados por Hop Scotch decidieron utilizar
el procedimiento de MC para determinar el modelo de
regresión. Se recolectaron los valores mensuales por gastos de
publicidad y número de pasajeros para los n=15 meses más
recientes.
Recta de regresión para Hop Scotch Airlines
Supuestos del modelo de regresión lineal
Supuesto 1: El término de error ε es una variable aleatoria distribuida normalmente
Supuesto 2: Varianzas iguales de los valores Y (Homoscedasticidad) en todos los valores de X

Supuesto 3: Los términos de error son independientes uno del otro


Error estándar de la estimación
Es una medida de la dispersión de los valores de Y, alrededor de la
recta de regresión. Mide la variación de los puntos por encima y por
debajo de la recta de regresión. Refleja la tendencia a desviarse del
valor real de Y cuando se utiliza el modelo de regresión para fines
predictivos. En este sentido, es una medida del error típico.
Coeficiente de correlación (r)
Es la medida de la fuerza de la relación entre X y Y. Puede asumir valores entre -1 y 1.Para
comprender se deben desarrollar tres medidas de desviación. La desviación total de Y, que
es la cantidad p0or la cual los valores individuales de Y varian de su medida

La desviación explicada que es la diferencia entre lo que predice el modelo y el valor


promedio de Y

La desviación no explicada que se observa por el modelo de regresión


Coeficiente de determinación r^2
Proporciona una medida de bondad e ajuste porque revela que porcentaje del cambio en Y
se explica por un cambio en X.

Esto establece que el 94% del cambio en el número de


pasajeros se explica mediante un cambio en la publicidad
Prueba para β1
Los valores que no son cero para el coeficiente de regresión (pendiente) b1=1.08 y r= 0.968 indican
que a medida que los gastos publicitarios cambian, cambia el número de pasajeros. Sin embargo estos
resultados se basan en una muestra de 15 observaciones. Como siempre se pregunta si ¿existe alguna
relación a nivel poblacional?
Prueba para el coeficiente de correlación
Análisis de varianza en la regresión

También podría gustarte