Está en la página 1de 4

REGRESIÓN LINEAL MÚLTIPLE

1. Un distribuidor de helado está estudiando el sistema de reparto de su producto.


Específicamente, el distribuidor está interesado en estimar el tiempo de servicio en
minutos, a un expendio al menudeo. El ingeniero industrial a cargo del estudio ha
sugerido que los dos factores más importantes que intervienen en el tiempo de
reparto son el número de cajas de helados que se entregan y la distancia en miles
de kilómetros, que debe recorrer el repartidor. El ingeniero recopiló una muestra de
15 servicios de reparto y obtuvo los siguientes resultados en minitab:

Regression Analysis: Tiempo versus N_cajas, Distancia

Análisis de varianza

Fuente DF SC CM Valor F Valor p


Regression 2 331.36 165.679 16.80 0.000
Error 12 118.37 9.865
Total 14 449.73

Resumen del modelo

S R-sq R-sq(adj) R-sq(pred)


3.14079 73.68% 69.29% 58.46%

Coeficientes

Precitor Coef SE Coef T-Value P-Value VIF


Constante 2.31 5.86 0.39 0.700
N_cajas 0.877 0.153 5.73 0.000 1.20
Distancia 0.456 0.147 3.11 0.009 1.20

Ecuación de regresión

Tiempo = 2.31 + 0.877 N_cajas + 0.456 Distancia

Durbin-Watson Statistic = 2.61928

Predicción para Tiempo

Ecuación de regresión

Tiempo = 2.31 + 0.877 N_cajas + 0.456 Distancia

Variable Setting
N_cajas 18
Distancia 35

Ajuste SE Ajuste 95% CI 95% PI


34.0581 1.30884 (31.2064, 36.9098) (26.6445, 41.4717)

a. Verifique los supuestos para un análisis de regresión lineal múltiple.


b. Indique el modelo de regresión lineal múltiple. Interprete cada uno de los
coeficientes de regresión. Interprete los coeficientes de la ecuación de regresión
estimada.
c. ¿Se puede afirmar que el modelo de regresión lineal con las dos variables es
válido? Use un α = 0.05.
d. Con un nivel de significancia de 5%, ¿se puede afirmar que las variables
independientes son significativas?
e. Estime el tiempo promedio de entrega del producto cuando se tienen que
entregar 18 cajas, para lo cual se tiene que recorrer una distancia de 35 km. Use
un nivel de confianza de 95%.
f. ¿Qué porcentaje de la variación total del tiempo de reparto no es explicada por
el modelo de regresión?

2. Se desea modelar la producción de los trabajadores de una fábrica en función de


una prueba de aptitud y los años de experiencia. Para realizar este estudio se
seleccionó una muestra de 10 colaboradores y se registró el número de unidades
que había producido por hora (Y), el puntaje que obtenido en una prueba de aptitud
(X1) y los años de experiencia del colaborador (X2).

Análisis de regresión: Y vs. X1; X2

Coeficiente
Término Coef SE Coef T P VIF
Constante -13.825 1.795 -7.70 0.004
X1 0.212 0.013 16.76 0.000 2.77
X2 2.000 0.146 13.73 0.000 2.16

Resumen del modelo

S R-cuad. R-cuad.(adj)
1.298 98.8% 98.4%

Análisis de varianza

Fuente GL SC CM F P
Regresión 2 962.71 481.36 285.80 0.000
Error residual 7 11.79 1.68
Total 9 974.50

Estadístico de Durbin - Watson: 1.218

a. Verifique la no multicolinealidad de las variables independientes y la no


autocorrelación en los residuales. Use un α = 0.05.
b. Indique el modelo de regresión lineal múltiple. Interprete el coeficiente de
regresión para la variable años de experiencia del colaborador.
c. Con un nivel de significancia de 0.05, ¿existe evidencia para afirmar que el
modelo con las dos variables es válido?
d. Con un nivel de significancia de 0.05, ¿existe evidencia para afirmar que las
variables independientes son significativas?
e. Determine e interprete el coeficiente de determinación correspondiente para este
análisis.

3. La compañía Aceros ha estado buscando los factores que influyen en la cantidad


de acero (en millones de toneladas) que es capaz de vender cada año. La
administración sospecha que los siguientes son los factores principales: La tasa
anual de inflación del país, el precio promedio por tonelada en dólares, mediante el
cual el acero importado acota los precios de la compañía y el número de
automóviles en millones que los fabricantes del país están planeando producir en
ese año. Se han recogido los datos correspondientes a los últimos siete años y se
analizó los datos con el MINITAB obteniéndose los siguientes resultados:

Análisis Regresión: Venta versus Inflación, Importación,


Producción

Análisis de varianza

Fuente Gl SC CM F P
Regression 3 1.6098 0.5366 12.93 0.003
Residual Error 3 0.1245 0.0415
Total 6 1.7343

Resumen del modelo

S = 0.2037 R-Sq = 92.82% R-Sq(adj) = 85.6%

Coeficientes

Término Coef. SE Coef. T P VIF


Constante -0.9146 0.8376 -1.09 0.159
Inflación -0.0873 0.0426 -2.05 0.087 1.89
Importación 0.0408 0.0827 0.49 0.598 2.34
Producción 0.8497 0.1421 5.98 0.001 1.12

Estadístico de Durbin Watson = 2.18071

a. Verifique los supuestos de no multicolinealidad de las variables independientes


y no autocorrelación en los errores. Use un α = 0.05.
b. Determine el modelo de regresión lineal múltiple. Interprete el coeficiente de
regresión para la variable tasa anual de inflación del país.
c. Con un nivel de significancia de 0.05, ¿al menos una de las variables es
significativa?
d. Con un nivel de significancia de 0.05, ¿qué variables deben quedarse en el
modelo?
e. Con lo obtenido en d), plantee el nuevo modelo de regresión lineal.
f. Determine e interprete el coeficiente de determinación ajustado.

4. Se desea estimar la variable Y en función a otras cuatro variables. Al tomar una


muestra de tamaño 10 se encontró los siguientes resultados con el MINITAB:

Análisis de Regresión: Y vs X1; X2; X3; X4

Análisis de Varianza

Fuente Gl SC CM F P
Regresión 4 963.52 240.88 109.79 0.000
Error 5 10.97 2.19
Total 9 974.49

Resumen del modelo

S = R-Sq. R-Sq(adj)
1.481 98.9% 98.0%
Coeficientes

Predictor Coef SE Coef T P


Constant -15.398 3.289 -4.68 0.003
X1 0.2185 0.0181 12.07 0.000
X2 2.0008 0.1739 11.51 0.000
X3 0.0136 0.0223 0.61 0.268
X4 0.0012 0.0346 0.03 0.158

a. Si se supone que no hay problemas de multicolinealidad, determine el modelo


de regresión lineal múltiple.
b. Con un 5% de significancia, ¿se puede afirmar que el modelo es significativo?
c. Con un nivel de significancia del 0.05, ¿existe evidencia estadística para afirmar
que las variables independientes son significativas? Utilizar un α = 0.05.
d. Asumiendo que todas las variables independiente se quedan en el modelo, ¿qué
porcentaje de la variabilidad de Y está explicada por el modelo de regresión
estimado?

También podría gustarte