Está en la página 1de 8

Estadística Aplicada II MA145

2019-01
Laboratorio de Análisis de Regresión lineal Múltiple

Logro: Obtener con el Minitab 18, los reportes que permitan seleccionar el mejor modelo de Regresión Lineal
Múltiple, para realizar pronósticos en el campo de su especialidad
Natur Confort S.A. es una de las empresas líder en la industria del descanso, confort y bienestar, cuenta con la
certificación internacional ISO 9001, que compromete a la empresa a mantener y mejorar de forma continua la
eficiencia y adecuación del proceso de producción.

Este año Natur confort invirtió en la compra de una máquina prensadora automática de alta tecnología modelo CR-
2500, para incrementar su productividad. Debido a la alta complejidad para poder manejar este equipo se necesita
contar con un operario calificado cuyo puntaje de desempeño sea óptimo. El desempeño es evaluado a través de un
puntaje que se calcula en base a la cantidad de tiempo invertido en una tarea específica y es considerado óptimo,
cuando logra superar los 116 puntos. Estudios realizados por otra empresa han determinado que este puntaje
depende de: (1) la experiencia del operador en máquinas prensadoras (años), (2) la calificación en la prueba de
aptitud mecánica y (3) su edad (años).

Para un trabajador con 9 años de experiencia, una calificación en actitud mecánica de 325 y 42 años de edad, ¿se
puede afirmar que presenta un desempeño óptimo?

La base de datos de una muestra aleatoria de 30 operarios se presenta a continuación.

Use un nivel de significación del 1% y un nivel de confianza del 99% (alfa a entrar 0.01 y alfa a retirar 0.01)

Desempeño en la Experiencia en Calificación en aptitud


Operario Edad
prensadora prensadora mecánica
1 111 5 310 40
2 125 11 365 55
3 110 6 325 38
4 115 8 330 46
5 114 5 324 39
6 114 7 318 50
7 125 9 352 48
8 119 8 327 46
9 121 10 336 48
10 117 6 318 41
11 118 5 332 48
12 120 8 330 55
13 118 10 328 49
14 121 11 335 52
15 120 7 330 45
16 105 2 310 35
17 125 13 348 50
18 125 9 349 48
19 119 8 327 36
20 121 10 336 38
21 117 6 318 41
22 118 5 332 48

1
23 120 9 330 55
24 115 8 345 46
25 118 5 324 39
26 127 13 350 50
27 125 9 359 48
28 118 5 332 48
29 120 7 330 55
30 115 8 321 46

Interpretación:

Determinar si un trabajador con 9 años de experiencia, con una calificación en aptitud mecánica de 325 y 42
años de edad presenta un desempeño promedio óptimo.

Representación:
Variable dependiente o respuesta: Desempeño en la prensadora
Variables independientes o predictoras:
X1: Experiencia en prensadora (años)
X2: Calificación de prueba de aptitud mecánica
X3: Edad del operario (años)
Técnica estadística: Análisis de regresión lineal múltiple.
Plan de análisis:
1. Estimación del modelo 1 mediante el método de mínimos cuadrados y se elaborará el diagrama de
dispersión para cada variable independiente.
2. Validación del modelo 1 (evaluación de requisitos): prueba global, prueba de los coeficientes,
evaluación de los supuestos y análisis de datos influyentes (también los atípicos).
3. Si el modelo 1, incumple alguno de sus requisitos, se estima el modelo 2 mediante el método paso a
paso.
4. Validación del modelo 2 (evaluación de requisitos): prueba global, prueba de los coeficientes,
evaluación de los supuestos y análisis de datos influyentes (también los atípicos). Si es modelo 2
pasa todas las pruebas, queda listo para la siguiente etapa.
5. Estimar el pronóstico solicitado.

Cálculo y análisis:
1. Estimación del modelo 1 mediante el método de mínimos cuadrados y se elaborará el diagrama de
dispersión para cada variable independiente.
Gráfica de dispersión de Y vs. X1, X2, X3
X1X2

125

120
115

110

36 912 320 340 360


Y

X3 105

125

120

115

110 3540455055

105
El desempeño de los operarios en la prensadora está relacionada linealmente con cada una de las variables
independientes. Gráficamente se puede observar que la variable edad del operario (X3) presenta una
menor correlación.

Correlaciones
Y X1 X2
X1 0.769
X2 0.815 0.691
X3 0.578 0.529 0.515

La variable calificación de prueba de aptitud mecánica (X2) presenta una mayor correlación con la variable
desempeño en la prensadora y la variable edad del operario (X3) presenta una menor correlación.

2. Validación del modelo 1 (evaluación de requisitos): prueba global, prueba de los coeficientes,
evaluación de los supuestos y análisis de datos influyentes (también los atípicos).

Estimación del modelo completo (Modelo 1):

Análisis de Varianza
Fuente GL SC Ajust. MC Ajust. Valor F Valor p
Regresión 3 534.421 178.140 27.08 0.000
X1 1 41.665 41.665 6.33 0.018
X2 1 88.184 88.184 13.40 0.001
X3 1 8.420 8.420 1.28 0.268
Error 26 171.046 6.579
Falta de ajuste 22 163.046 7.411 3.71 0.106
Error puro 4 8.000 2.000
Total 29 705.467

Resumen del modelo

R-cuad.
R-cuad.
S R-cuad. (ajustado (pred)
)
2.56489 75.75% 72.96% 68.24%

Coeficientes
EE del
Término Coef coef. Valor T Valor p FIV

Constante 46.5 15.0 3.10 0.005


X1 0.680 0.270 2.52 0.018 2.08
X2 0.1852 0.0506 3.66 0.001 2.04
X3 0.1127 0.0996 1.13 0.268 1.48
Modelo de regresión lineal múltiple estimada:
Y� = 46,5 + 0,68XH + 0,1852X2 + 0,1127X3
3. Validación del modelo 1 (evaluación de requisitos): prueba global, prueba de los coeficientes,
evaluación de los supuestos y análisis de datos influyentes (también los atípicos).

Validación conjunta:
H0: pH = p2 = p3 = 0
H1: Al menos uno de los betas es diferente de cero

Nivel de significación: α = 0.01


Estadístico de prueba: Fcal = 27,08
p – valor = 0.000
Decisión: Como el p-valor < α, se rechaza H0
Conclusión: Con un nivel de significación del 1%, Al menos uno de los betas es diferente de cero.

Validación de los coeficientes de regresión:


H0: pH = 0 H0: p2 = 0 H0: p3 = 0
H1: pH ≠ 0 H1: p2 ≠ 0 H1: p3 ≠ 0
Nivel de significación: α = 0.01
Estadístico de prueba: Tcal = 2.52 Tcal = 3.66 Tcal = 1.13
P-valor = 0.018 P-valor = 0.001 P-valor = 0.268
Decisión: Cuando el p-valor > α, no se rechaza H0
Conclusión: Con un nivel de significación del 1%, la experiencia del operador en máquinas prensadoras y la
edad del operador no influyen en la explicación del desempeño del operador en la prensadora. Por lo
tanto, el modelo 1 no es válido.

4. Si el modelo 1, incumple alguno de sus requisitos, se estima el modelo 2 mediante el método paso a
paso.

Análisis de regresión: Y vs. X1; X2; X3


Selección de términos escalonada
Términos candidatos: X1; X2; X3

-----Paso 1---- -----Paso 2----


Coef P Coef P

Constante 19.1 46.4


X2 0.2993 0.000 0.1992 0.000
X1 0.765 0.007

S 2.90782 2.57815

R-cuad. 66.44% 74.56%

R-cuad.(ajustado) 65.24% 72.68%


R-cuad. (pred) 60.05% 68.58%
Cp de Mallows 9.99 3.28
α a entrar = 0.01; α a retirar = 0.01

Análisis de Varianza
Fuente GL SC Ajust. MC Ajust. Valor F Valor p

Regresión 2 526.001 263.000 39.57 0.000


X1 1 57.285 57.285 8.62 0.007
X2 1 108.367 108.367 16.30 0.000

Error 27 179.466 6.647


Falta de ajuste 23 171.466 7.455 3.73 0.105

Error puro 4 8.000 2.000


Total 29 705.467

Resumen del modelo


R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)

2.57815 74.56% 72.68% 68.58%


Coeficientes
EE del
Término Coef coef. Valor T Valor p FIV

Constante 46.4 15.1 3.08 0.005


X1 0.765 0.261 2.94 0.007 1.92
X2 0.1992 0.0493 4.04 0.000 1.92
Ecuación de regresión
Y = 46.4 + 0.765 X1 + 0.1992 X2
Ajustes y diagnósticos para observaciones poco comunes
Resid
Obs Y Ajuste Resid est.

3 110.000 115.714 -5.714 -2.27 R


16 105.000 109.665 -4.665 -2.04 R
24 115.000 121.228 -6.228 -2.52 R
Residuo grande R

Estadístico de Durbin-Watson
Estadístico de Durbin-Watson = 1.75813

Ecuación de regresión lineal múltiple estimada:

Y� = 46,4 + 0,765XH + 0,1992X2

Validación conjunta:
H0: pH = p2 = 0
H1: Al menos uno de los betas es diferente de cero

Nivel de significación: α = 0.01


Estadístico de prueba: Fcal = 39,57
p – valor = 0.000
Decisión: Como el p-valor < α, se rechaza H0
Conclusión: Con un nivel de significación del 1%, Al menos uno de los betas es diferente de cero.
Validación de los coeficientes de regresión
H0: pH = 0 H0: p2 = 0
H1: pH ≠ 0 H1: p2 ≠ 0

Nivel de significación: α = 0.01


Estadístico de prueba: Tcal = 2.94 Tcal = 4.04
P - valor = 0.007 P - valor = 0.000
Decisión: Cuando el p-valor < α, se rechaza H0
Conclusión: Con un nivel de significación del 1%, la experiencia del operador en máquinas prensadoras y la
calificación en la prueba de aptitud mecánica influyen en la explicación del desempeño del operador en la
prensadora.

Interpretación de los coeficientes de regresión:

β- H = 0,765 : Si la experiencia del operario en prensadora se incrementa en un año, el


desempeño en prensadora se incrementará en 0.765 puntos, manteniendo constante la calificación en la
prueba de aptitud mecánica.
β- 2 = 0,1992 : Si la calificación en la prueba de aptitud mecánica se incrementa en un punto, el desempeño
en prensadora del operario se incrementará en 0.1992 puntos, manteniendo constante la experiencia del
operario en prensadora.

Validación de supuesto:

1. Normalidad de errores:
Gráfica de probabilidad de RESID
Normal
99
Media 7.105427E-15
Desv.Est.2.488
N30
95 AD0.941
90 Valor p0.015
80
70
60
50
Porcentaje

40
30
20

10
5

1
-7.5 -5.0 -2.50.0 2.5 5.0
RESID

H0: Los errores siguen una distribución normal


H1: Los errores no siguen una distribución normal

Nivel de significación: α = 0.01


Estadístico de prueba: AD = 0.941
P - valor =0.015
Decisión: Como el p-valor < α, se rechaza H0
Conclusión: Con un nivel de significación del 1%, Los errores siguen una distribución normal
2. Independencia y homocedasticidad:
D.W. = 1.75813 pertenece al intervalo [1.5; 2.5], entonces se puede concluir que se cumple con los
supuestos de independencia de los errores y homocedasticidad.

3. Supuesto de la linealidad:

vs. ajustes
(la respuesta es Y)
4

2
Residuo

-2

110 115 120 125 130


Valor ajustado

De gráfico de valores ajustados vs residuos, se desprende que la relación entre “Y” con cada una de las
-4

variables regresoras es lineal, porque los errores se distribuyen de manera aleatoria alrededor de la
línea central.-6

4. Promedio de los errores es cero:

Histograma
(la respuesta es Y)

6
Frecuencia

3
1

02
-6 -4 -2 0 2
Residuo

En base al histograma se puede concluir que se cumple con el supuesto del promedio de los errores es
cero.

5. Ausencia de colinealidad:

Como el FIV es menor que 10 (para ambas variables independientes es de 1.92), se puede concluir que
no hay problemas de multicolinealidad entre las variables X1 y X2.

6. Determinar si existen observaciones influyentes:

COOK
0.007895
0.138078
0.091309
0.021266
0.002482
0.006033
0.021336
0.004866
0.000004
0.030554
0.018888
0.006269
0.014242
0.002201
0.012583
0.371143
0.005889
0.028513
0.004866
0.000004
0.030554
0.018888
0.003286
0.195916
0.046654
0.012138
0.000868
0.018888
0.012583
0.011167

Se puede observar que no existe observaciones influyentes, todas las distancias de cook son menores que 1.
Por lo tanto, se cumplen todos los supuestos del modelo.

Finalmente, el modelo 2 queda listo para utilizarlo en el pronóstico

5. Estimar el pronóstico solicitado.

Intervalos de confianza

Para un trabajador con 9 años de experiencia, una calificación en actitud mecánica de 325 y 42 años de edad

Predicción
Ajuste EE de ajuste IC de 99% IP de 99%
118.010 0.786452 (115.831, 120.189) (110.542, 125.478)

I.C.(Y/X1=9,x2=325)=[110.542, 125.478]
Interpretación: Con un nivel de confianza del 99%, se estima que el desempeño en la prensadora, cuando
la experiencia del operario es de 9 años y su calificación de aptitud mecánica es de 325 puntos, se
encuentra contenido en el intervalo [115.831; 120.189]

Argumentación:
No se puede determinar que un trabajador con 9 años de experiencia, con una calificación en aptitud
mecánica de 325 y 42 años de edad presente un desempeño promedio óptimo.

También podría gustarte