Está en la página 1de 4

UNIVERSIDAD DEL VALLE DE GUATEMALA

Departamento de Matemática, Estadística 2, Ciclo 2-2018, MM2040


MA. Ing. Anibal Vargas,
HDT-2

Nombres: carné: Sección:

Problema 1. El ingeniero Julián Salguero considera que la


energía eléctrica consumida cada mes por una planta química
está relacionada a la temperatura promedio ambiente , el
número de días en el mes , la pureza promedio del
producto , y las toneladas de producto producidas .
Los datos históricos del año pasado están disponibles y se
presentan en la tabla siguiente:

a) Plantee el modelo de regresión lineal preliminar que considere


todos los regresores y las interacciones dobles (10 puntos)

Se hizo un análisis preliminar de RLM para el caso anterior y la información se presenta en las tablas siguientes.
Complete la tabla ANOVA y luego utilice la información proporcionada para responder las preguntas b) hasta d).

Estadísticas de la regresión
0.9231
0.8520
0.7675
Error típico 11.7866
Observaciones 12

b) Comente acerca de la bondad de ajuste del modelo. (10 puntos)

Debido a la gran diferencia entre y , el modelo planteado es susceptible a ser depurado.


c) Con un nivel de significancia , pruebe estadísticamente si hay significancia global en este modelo. (10
puntos)

d) ¿Cuál de los regresores en el modelo anterior debería ser depurado? ¿Por qué? Fundamente estadísticamente su
decisión. (10 puntos)

Debería depurarse el regresor , debido a su alto valor-p. Para ello se propone una prueba t.

e) A continuación se muestra la matriz de correlación de este estudio. Plantee un modelo preliminar que presente baja
multicolinealidad (establezca claramente su criterio). (10 puntos)

y x1 x2 x3 x4
y 1
x1 0.80253849 1
x2 0.82696299 0.66045595 1
x3 0.09285061 -0.2875664 0.11273901 1
x4 -0.1326605 -0.0235587 -0.0253278 0.07891362 1

Tomando como coeficiente de correlación máximo entre regresores el 0.30, se pueden plantear los modelos
preliminares siguiente:

a)

b)

f) Julián Salguero, en base a los coeficientes de determinación que observó de su análisis preliminar de RLM desea
utilizar el modelo para predicciones de consumo de energía eléctrica. ¿Qué le aconsejaría usted? Fundamente
estadísticamente su respuesta. (10 puntos)

No se puede utilizar el modelo debido a que no ha sido validado por un análisis completo de residuos. Aunque haya
significancia global y se hayan obtenido valores cercanos entre si y elevados de los coeficientes de determinación, sin
el análisis de los residuos se carece de base para las predicciones. Recuérdese que tanto la prueba F como la prueba t
dependen de los supuestos de normalidad.
Problema 2. Los siguientes datos reflejan información obtenida
en 17 hospitales de la marina estadounidense en varios sitios del
mundo. Los regresores son variables de la carga de trabajo, es
decir, conceptos que daban como resultado la necesidad de
personal en una instalación hospitalaria. A continuación se
presenta una descripción breve de las variables:

Salida de Excel para el análisis de RLM.

a) Escriba la ecuación ajustada que se deduce del análisis. (10 puntos)

b) Utilizando la ecuación del inciso anterior, determine los primeros 4 residuos. (10 puntos)

Observación Residuo
1 567 775 -209
2 697 741 -44
3 1033 1104 -71
4 1604 1240 363
c) A continuación se presentan 4 gráficos de residuos. ¿Qué supuestos pueden verificarse? Comente. (10 puntos).

I. En el gráfico de probabilidad normal


se puede ver que los residuos yacen
sobre una recta con pendiente unitaria.
Se acumulan al centro y se dispersan en
los extremos. Estos son indicios de
normalidad.

II. En el histograma se aprecia la forma


de la distribución de los residuos. Para
efectos del estudio, se puede considerar
que tiene una forma normal.

III. En el gráfico de residuos versus


valores ajustados (pronósticos) se puede
observar independencia pero no varianza
constante.

IV. En el gráfico de residuos versus


orden de la corrida, se puede observar
independencia pero no varianza
constante.

d) Con el propósito de depurar el modelo, el analista decidió eliminar los regresores x1, x3 y x4 del modelo. La nueva
salida de Excel se muestra a continuación. ¿Estadísticamente es apropiada la decisión? Justifique. (10 puntos)

Prácticamente se requiere de una prueba F parcial para ver si se autoriza la eliminación de los regresores bajo estudio.

También podría gustarte