Pregrado
SESIÓN 14: REGRESIÓN MÚLTIPLE
Docente: Mg. Carol J. Cárdenas del Castillo
.
Administración
INTRODUCCIÓN:
Satisfacción con
los restaurantes
Satisfacción con Satisfacción con
los precios un destino
Turístico
Nacionalidad del Variable
Dependiente
Turista
Variables
Independientes
Mg. Carol Cárdenas del Castillo
Administración
ANÁLISIS DE REGRESIÓN MÚLTIPLE
El análisis de regresión múltiple es una extensión del análisis de
regresión simple a aplicaciones que implican dos o más variables
independiente: X1, X2,…,Xk; que se relaciona con una variable
dependiente Y, mediante el modelo matemático:
Donde:
son los parámetros desconocidos.
, el error, es una variable aleatoria que se supone tiene distribución normal con
media 0 y varianza .
Mg. Carol Cárdenas del Castillo
Administración
El modelo estadístico de la regresión es equivalente al modelo matemático
de la regresión:
𝐸 ( 𝑌 )= 𝛽0 + 𝛽1 𝑋 1 +𝛽 2 𝑋 2 +...+𝛽 𝑘 𝑋 𝑘
Los coeficientes de regresión de indican el cambio promedio de Y
correspondiente a un incremento unitario en cuando las demás
permanecen constantes.
Nota: La lista de variables independientes puede incluir variables cualitativas
(o categóricas), como por ejemplo: género. En este caso, los valores de la
variable, llamada también variable indicadora, deben ser codificados. La
codificación de la variable género, por ejemplo, puede ser 0=mujer, 1 hombre
(o viceversa).
Mg. Carol Cárdenas del Castillo
Administración
Ejemplos:
Mg. Carol Cárdenas del Castillo
Administración
Ejercicio Aplicativo 01:
Se desea estimar los gastos en alimentación de una familia; en base a la
información que proporcionan las variables: X1 = “ingresos mensuales” y
X2 = “número de miembros de la familia”. Para ello se recoge una
muestra aleatoria simple de 15 familias, cuyos resultados son los
siguientes (los montos están dados en cientos de soles):
GASTO 43 31 32 46 125 44 52 29 35 35 78 43 47 38 129
INGRESO 21 11 9 16 62 23 18 10 89 24 12 47 35 29 14
N° FAMILI 3 4 5 4 4 3 6 5 3 2 4 3 2 3 4
a. Determine el grado de relación entre la variables e interprete.
b. Estime la ecuación de regresión e interprete cada uno de los parámetros
Mg. Carol Cárdenas del Castillo
Administración
a. Determine el grado de relación entre la variables e interprete.
Variable independiente: Gastos
Variable dependiente: Ingresos mensuales, n° de miembros familiares
Regression Statistics
Multiple R 0.22135725
R Square 0.04899903
Adjusted R Square -0.10950113
Standard Error 33.6834656
Observations 15
Observamos que el coeficiente de correlación es del 22.1%, lo cual indica
una relación positiva y débil entre los gastos y los ingresos mensuales,
miembros de la familia.
Mg. Carol Cárdenas del Castillo
Administración
b. Estime la ecuación de regresión e interprete cada uno de los parámetros
ANOVA
Significance
df SS MS F F
Regression 2 701.489753 350.744876 0.30914185 0.73975133
Residual 12 13614.9102 1134.57585
Total 14 14316.4
Standard
Coefficients Error t Stat P-value Lower 95% Upper 95% Lower 95.0% Upper 95.0%
Intercept 24.4936071 39.2791715 0.62357749 0.54457615 -61.0883557 110.07557 -61.0883557 110.07557
INGRESO 0.2706095 0.43331005 0.62451702 0.54397958 -0.673492 1.214711 -0.673492 1.214711
N° FAM 5.92618005 8.73756998 0.67824121 0.51048631 -13.1113495 24.9637096 -13.1113495 24.9637096
Mg. Carol Cárdenas del Castillo
Administración
La ecuación de regresión esta dada por:
Y= 24.4936 +0.2706 X1 +5.9262 X2
: En caso de que el ingreso mensual y el número de miembros de la
familia sean cero; el gasto mensual sería de 24.4936 soles.
: Por cada unidad adicional en el ingreso mensual, los gastos de
alimentación familiar aumenta en 0.2706 soles ; independientemente
del número de miembros de la familia,
: Por cada unidad adicional en el número de miembros de la familia, los
gastos de alimentación familiar aumenta en 5.9262 soles;
independientemente de su ingreso mensual.
Mg. Carol Cárdenas del Castillo
Administración
Ejercicio Aplicativo 02:
El gerente de ventas de la distribuidora “Delivery” realiza un estudio del
sistema de reparto de sus pedidos considerando las variables:
Y: Tiempo en minutos que demora la entrega del pedido.
X1: Peso en kilogramos de los pedidos.
X2: Distancia recorrida en kilómetros.
Tiempo 30 28 25 23 20 18 15 15 12 10
Peso 12 10 9 7 6 6 5 3 3 2
Distancia 7 7 6 6 5 5 4 4 3 3
a) Determine el grado de relación entre la variable dependiente con cada
una de las variables independientes.
b) A un nivel de significancia del 5%, diga si el modelo es válido.
c) Calcule la ecuación de regresión estimada, y estime el tiempo que
demoraría el reparto de un pedido de X 1=20 kilogramos para un
recorrido de X2=10 kilómetros.
Mg. Carol Cárdenas del Castillo
a) Determine el grado de relación entre la variables Administración
dependiente con cada una de las variables independientes.
Existe una relación positiva muy alta del 97.8% entre el Tiempo de reparto y el Peso del
pedido; así mismo existe una relación positiva y muy alta del 98.9% entre Tiempo de
reparto y la Distancia recorrida.
Mg. Carol Cárdenas del Castillo
Administración
b) A un nivel de significancia del 5%, diga si el modelo es
válido.
ANOVA
Significance
df SS MS F F
Regression 2 409.865823 204.932911 316.38163 1.3702E-07
Residual 7 4.53417722 0.6477396
Total 9 414.4
Standard
Coefficients Error t Stat P-value Lower 95% Upper 95% Lower 95.0% Upper 95.0%
Intercept 0.39620253 1.52341511 0.26007523 0.80228963 -3.20610178 3.99850685 -3.20610178 3.99850685
Peso 0.78481013 0.28634307 2.74080362 0.02888466 0.10771635 1.4619039 0.10771635 1.4619039
Distancia 2.85189873 0.6276729 4.54360663 0.00265625 1.36768818 4.33610929 1.36768818 4.33610929
Se concluye que existe relación lineal entre las variables las variables independiente (peso
y distancia) y Tiempo de demora en la entrega del pedido, es así que se concluye que el
modelo es válido, es decir, existe evidencia significativa que al menos una de las variables
independientes explica de manera significativa a la variable dependiente.
Mg. Carol Cárdenas del Castillo
Administración
c) Calcule la ecuación de regresión estimada, y estime el tiempo que
demoraría el reparto de un pedido de X 1=20 kilogramos para un recorrido
de X2=10 kilómetros.
La ecuación de regresión esta dada por:
Y= 0.396 + 0.785 X1 + 2.852 X2
Reemplazando los valores de X1 y X2
Y= 0.396 + 0.785 (20) + 2.852 (10)
Y= 44.616
Mg. Carol Cárdenas del Castillo