Está en la página 1de 11

ESTADÍSTICA APLICADA II – MA145

Taller 3 – Semana 13
Temas: Análisis de regresión

1. El gerente de la empresa SISCOM S.A.C., desea estimar el ingreso mensual por las ventas de videocámaras del tipo Robótica
PTZ en todas las tiendas. Por ello, encarga a Inés, estimar un modelo matemático que explique el ingreso mensual (en
miles de soles) por la venta de videocámaras del tipo Robótica PTZ en función de las variables: salario mensual del
vendedor (en soles), antigüedad del vendedor (en años) y el precio de videocámaras del tipo Robótica PTZ (en dólares).

Si el pronóstico para el ingreso promedio mensual por la venta de videocámaras del tipo Robótica PTZ es inferior a 190 mil
soles, cuando el salario mensual de un vendedor es de 2500 soles, la antigüedad del vendedor es de 16 años y el precio de
las videocámaras de dicho tipo es de 950 dólares tomará la decisión de cambiar de proveedor del producto debido a su
alto costo, el gerente de la empresa tomará la decisión de cambiar de proveedor

Realice el análisis de regresión para fundamentar su respuesta. Use los reportes obtenidos con el software MINITAB que
fueron elaborados sobre los datos de 33 semanas de las variables del contexto presentado. La información se encuentra
en el Anexo Nro. 1.
Considere un nivel de significancia del 5% y un nivel de confianza del 98%.

Complete a partir de las dimensiones de razonamiento cuantitativo:

Interpretación Determinar si el gerente de la empresa SISCOM S.A.C. tomará la decisión de cambiar de proveedor
del producto.
Representación Y: Ingreso mensual por la venta de videocámaras del tipo Robótica PTZ (miles de soles)
X1: Salario mensual del vendedor (soles)
X2: Antigüedad del vendedor (años)
X3: Precio de la videocámara del tipo Robótica PTZ (dólares)
Técnica estadística: análisis de regresión lineal múltiple
Plan de análisis:
0. Análisis exploratorio
1. Análisis estadístico, estimación del modelo completo y medidas de bondad de ajuste
2. Análisis estadístico, validación del modelo y supuestos, presentación del mejor modelo e
interpretaciones
3. Pronósticos

Cálculo y Análisis exploratorio, sobre la relación de las variables


análisis En el diagrama de dispersión se puede observar que el ingreso mensual por la venta de
videocámaras está relacionada linealmente positiva con cada variable independiente.

De la matriz de correlaciones se puede observar que existe una fuerte relación lineal positiva del
ingreso mensual por la venta de videocámaras está relacionada linealmente con cada variable
independiente.
Análisis estadístico, estimación del modelo completo y medidas de bondad de ajuste
ŷ =-16.6 + 0.02842X1 + 1.029X2 + 0.1145X3
R = 91.79% → El 91.79% de la variabilidad del ingreso mensual por la venta de videocámaras es
2

explicada por el salario mensual del vendedor, la antigüedad del vendedor y el precio de la
videocámara.
Análisis estadístico:
Validación del modelo completo
Prueba conjunta
H0: β1 = β2 = β3 = 0
H1: Al menos un βi ≠ 0

Fcal = 120.31 Fcrítico = F (α = 0.05, p – 1 = 3, n – p = 29) = 2.9340 p – valor = 0.000

Decisión: Como el p – valor < α o Fcal > Fcrítico, se rechaza H0


Conclusión: Al 5% de nivel de significación, la información muestral es suficiente para afirmar que
existe un modelo que relacione el ingreso mensual por la venta de videocámaras con el salario
mensual del vendedor, la antigüedad del vendedor y el precio de la videocámara.

Prueba individual
H0: β1 = 0 H0: β2 = 0 H0: β3 = 0
H1: β1 ≠ 0 H1: β2 ≠ 0 H1: β3 ≠ 0
Tcal = 3.29 Tcal = 2.42 Tcal = 5.31
p – valor = 0.003 p – valor = 0.022 p – valor = 0.000
Decisión: Como p – valor < α, Decisión: Como p – valor < α, Decisión: Como p – valor < α,
se rechaza H0 se rechaza H0 se rechaza H0
Decisión: Al 5% de nivel de significación, la información muestral es suficiente para afirmar que
el salario mensual del vendedor, la antigüedad del vendedor y el precio de la videocámara
influyen en la explicación del ingreso mensual por la venta de videocámaras. Por lo tanto, se
puede afirmar que el modelo completo es válido.

Validación de supuestos y detección de puntos influyentes (del mejor modelo completo o reducido)

Normalidad de los errores


H0: Los errores se distribuyen normalmente
H1: Los errores no se distribuyen normalmente

AD = 0.150 p – valor = 0.959

Decisión: Como el p – valor > α, no se rechaza H0


Conclusión: Al 5% de nivel de significación, se asume que los errores se distribuyen normalmente.
Por lo tanto, se cumple el supuesto.

No autocorrelación de los errores y homocedasticidad


H0: Los errores no están autocorrelacionados
H1: Los errores están autocorrelacionados

Como el DW = 1.983829 está contenido en el intervalo [1.5, 2.5], se asume que los errores no están
autocorrelacionados, además se puede asumir que la varianza de los errores es constante
(homocedasticidad). Por lo tanto, se cumple con los supuestos.

No multicolinealidad entre variable independientes

Como los valores FIV son menor a 10, se puede concluir que no existe problemas de
multicolinealidad entre las variables independientes

Detección de puntos influyentes


Se puede observar que el valor máximo de las distancias de Cook es 0.21452, lo cual significa que no
existen distancias de Cook mayor a 1. Por lo tanto, no existen puntos influyentes.

El mejor modelo es: ŷ =-16.6 + 0.02842X1 + 1.029X2 + 0.1145X3

β̂ 1 = 0.0284 → Por cada sol en el salario mensual del vendedor, el ingreso mensual por la venta de
videocámaras incrementa en promedio 0.02842 miles de soles. Manteniendo constante la
antigüedad del vendedor y el precio de la videocámara.

β̂ 2 = 1.029 → Por cada año de antigüedad del vendedor, el ingreso mensual por la venta de
videocámaras incrementa en promedio 1.029 miles de soles. Manteniendo constante el salario
mensual del vendedor y el precio de la videocámara.

β̂ 3 = 0.1145 → Por cada dólar en el precio de la videocámara, el ingreso mensual por la venta de
videocámaras incrementa en promedio 0.1145 miles de soles. Manteniendo constante el salario
mensual del vendedor y la antigüedad del vendedor.
Pronósticos
Estimación puntual: ŷ =-16.6 + 0.02842(2500) + 1.029(16) + 0.1145(950) = 179.689 miles de soles
Estimación por intervalo:
IC (μY/ X1 = 2500, X2 = 16, X3 = 950) = [173.100, 186.273] miles de soles
Con un nivel de confianza del 98%, se estima que el ingreso promedio mensual por la venta de
videocámaras, cuando el salario mensual de un vendedor es de 2500 soles, la antigüedad del
vendedor es de 16 años y el precio de las videocámaras de dicho tipo es de 950 dólares, está
contenido en el intervalo [173.100, 186.273] miles de soles. Además, se observa que el ingreso
promedio mensual por la venta de videocámaras es menor a 190 mil soles.
Argumentación Bajo las evidencias recogidas, podemos determinar que el gerente de la empresa SISCOM S.A.C.
tomará la decisión de cambiar de proveedor del producto, porque el ingreso promedio mensual por
la venta de videocámaras es menor a 190 mil soles.

Análisis exploratorio: Relación entre variables


Correlaciones
Y X1 X2
X1 0.892
X2 0.765 0.656
X3 0.935 0.847 0.703

Análisis de regresión del modelo completo


Análisis de Varianza
Fuente GL SC Ajust. MC Ajust. Valor F Valor p
Regresión 3 8558.6 2852.86 120.31 0.000
X1 1 257.4 257.42 10.86 0.003
X2 1 138.6 138.64 5.85 0.022
X3 1 668.7 668.71 28.20 0.000
Error 29 687.7 23.71
Total 32 9246.2

Resumen del modelo


R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)
4.86951 92.56% 91.79% 90.63%
Coeficientes
EE del
Término Coef coef. Valor T Valor p FIV
Constante -16.6 10.8 -1.54 0.134
X1 0.02842 0.00863 3.29 0.003 3.62
X2 1.029 0.426 2.42 0.022 2.03
X3 0.1145 0.0216 5.31 0.000 4.09

Estadístico de Durbin-Watson
Estadístico de Durbin-Watson = 1.983829

Estadísticas
Conteo
Variable total Mínimo Máximo
COOK 33 0.00004 0.21452

Predicción
EE de
Ajuste ajuste IC de 98% IP de 98%
179.687 2.67526 (173.100; 186.273) (166.008; 193.366)

Anexo Nro. 1
Análisis de regresión del modelo reducido
Selección de términos escalonada
Términos candidatos: X1; X2; X3
-----Paso 1---- -----Paso 2----- -----Paso 3-----
Coef P Coef P Coef P
Constante -16.5 -26.6 -16.6
X3 0.1970 0.000 0.1338 0.000 0.1145 0.000
X1 0.03174 0.002 0.02842 0.003
X2 1.029 0.022

S 6.10570 5.24816 4.86951


R-cuad. 87.50% 91.06% 92.56%
R-cuad.(ajustado) 87.10% 90.47% 91.79%
Cp de Mallows 19.74 7.85 4.00
AICc 217.82 209.35 206.09
BIC 221.49 213.91 211.35

α a entrar = 0.05; α a retirar = 0.05

Análisis de Varianza
Fuente GL SC Ajust. MC Ajust. Valor F Valor p
Regresión 3 8558.6 2852.86 120.31 0.000
X1 1 257.4 257.42 10.86 0.003
X2 1 138.6 138.64 5.85 0.022
X3 1 668.7 668.71 28.20 0.000
Error 29 687.7 23.71
Total 32 9246.2

Resumen del modelo


R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)
4.86951 92.56% 91.79% 90.63%

Coeficientes
EE del
Término Coef coef. Valor T Valor p FIV
Constante -16.6 10.8 -1.54 0.134
X1 0.02842 0.00863 3.29 0.003 3.62
X2 1.029 0.426 2.42 0.022 2.03
X3 0.1145 0.0216 5.31 0.000 4.09

Estadístico de Durbin-Watson
Estadístico de Durbin-Watson = 1.983829

Estadísticas
Conteo
Variable total Mínimo Máximo
COOK 33 0.00004 0.21452

Predicción
EE de
Ajuste ajuste IC de 98% IP de 98%
179.687 2.67526 (173.100; 186.273) (166.008; 193.366)

2. El gerente de producción de MIHUALI S.A., desea encontrar el mejor modelo de regresión, que permita predecir el
tiempo (en horas) que tarda en fabricarse un artículo, desde que entra la materia prima a la cadena de producción.
Para lo cual, se recogió la información de la cantidad de artículos producidos y el tiempo de fabricación en una muestra
aleatoria de tamaño 10.

Estime el tiempo que tardará en fabricarse 250 artículos, si el tiempo estimado es menos de 175 horas el gerente
otorgará un bono equivalente al 10% del sueldo, a los trabadores del área. ¿Cuál será la decisión del gerente?

Use la información procesada por el software Minitab que se encuentra en el Anexo Nro. 2. Considere un nivel de
significancia del 5% y un nivel de confianza del 95%

Complete a partir de las dimensiones de razonamiento cuantitativo:


Interpretación Determinar si el gerente de producción otorgará a los trabajadores del área el bono equivalente al
10% de sus sueldos.
Representación Y: Tiempo de fabricación (horas)
X: Cantidad de artículos producidos
Técnica estadística: análisis de regresión simple
Plan de análisis:
1. Ranking de los modelos (estimación de los modelos y medida de bondad de ajuste)
2. Verificación de la validez y cumplimento de supuestos del mejor modelo
3. Pronósticos

Cálculo y
análisis 1. Ranking de los modelos (estimación de los modelos y medida de bondad de ajuste)

Modelo Ecuación del modelo R2 Ranking


Lineal ŷ = -207.0 + 1.404X 95.77% 4
Cuadrático ŷ = 63 - 0.374X + 0.00276X2 97.49% 2
Exponencial Ln(ŷ) = 3.4434 + 0.006053X 98.08% 1
Potencia Ln(ŷ) = - 5.296 + 1.861Ln(X) 97.02% 3

2. Verificación de la validez y cumplimento de supuestos del mejor modelo


Modelo exponencial

Prueba individual
H0: β1 = 0
H1: β1 ≠ 0

Tcal = 20.23 p – valor = 0.000

Decisión: Como el p – valor < α, se rechaza H0


Conclusión: Al 5% de nivel de significación, la información muestral es suficiente para afirmar
que el coeficiente de regresión es significativo. Por lo tanto, el modelo exponencial es válido.

Normalidad de los errores


H0: Los errores se distribuyen normalmente
H1: Los errores no se distribuyen normalmente

AD = 0.272 p – valor = 0.588

Decisión: Como el p – valor > α, no se rechaza H0


Conclusión: Al 5% de nivel de significación, se asume que los errores se distribuyen
normalmente. Por lo tanto, se cumple el supuesto.
No autocorrelación de los errores y homocedasticidad
H0: Los errores no están autocorrelacionados
H1: Los errores están autocorrelacionados

Como el DW = 1.57167 está contenido en el intervalo [1.5, 2.5], se asume que los errores no
están autocorrelacionados, además se puede asumir que la varianza de los errores es constante
(homocedasticidad). Por lo tanto, se cumple con los supuestos.

El mejor modelo válido es: ŷ = e3.4434 e0.006053X = 31.2932e0.006053X

3. Pronósticos

Estimación puntual: ŷ = 31.2932e0.006053(250) = 142.1170 horas

Estimación por intervalo: IC (Y/ X = 250) = [e4.77217, e5.14091] = [118.1754, 170.8712] horas

Con un nivel de confianza del 95%, cuando se deban producir 250 artículos, el tiempo estimado para
su fabricación está contenido en el intervalo [118.1754, 170.8712] horas. Se observa que el tiempo
para la fabricación de 250 artículos es menor a 175 horas.
Argumentación Bajo las evidencias recogidas, se puede determinar que el gerente de producción otorgará a los
trabajadores del área el bono equivalente al 10% de sus sueldos, porque el tiempo para la
fabricación de 250 artículos es menor a 175 horas.

Anexo Nro. 2
Análisis de regresión
Análisis de regresión: Y vs. X
Coeficientes
EE del
Término Coef coef. Valor T Valor p FIV

Constante -207.0 34.6 -5.98 0.000

X 1.404 0.104 13.45 0.000 1.00

Resumen del modelo


R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)

25.5907 95.77% 95.24% 93.40%

Análisis de Varianza
Fuente GL SC Ajust. MC Ajust. Valor F Valor p

Regresión 1 118538 118538 181.01 0.000

X 1 118538 118538 181.01 0.000

Error 8 5239 655

Total 9 123777

Estadístico de Durbin-Watson
Estadístico de Durbin-Watson = 1.943524

Predicción
EE de
Ajuste ajuste IC de 95% IP de 95%
143.977 11.0781 (118.431; 169.523) (79.6724; 208.281)

Análisis de regresión: Y vs. X; X^2


Coeficientes
EE del
Término Coef coef. Valor T Valor p FIV

Constante 63 127 0.50 0.633

X -0.374 0.816 -0.46 0.661 90.17

X^2 0.00276 0.00126 2.19 0.065 90.17

Resumen del modelo


R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)

21.0708 97.49% 96.77% 93.20%

Análisis de Varianza
Fuente GL SC Ajust. MC Ajust. Valor F Valor p

Regresión 2 120669 60334.6 135.90 0.000

X 1 93 93.1 0.21 0.661

X^2 1 2131 2131.2 4.80 0.065

Error 7 3108 444.0

Total 9 123777

Estadístico de Durbin-Watson
Estadístico de Durbin-Watson = 1.846830

Predicción
EE de
Ajuste ajuste IC de 95% IP de 95%
141.888 9.17109 (120.202; 163.574) (87.5484; 196.227)

Análisis de regresión: LN(Y) vs. X


Coeficientes
Término Coef EE del coef. Valor T Valor p FIV

Constante 3.4434 0.0992 34.70 0.000

X 0.006053 0.000299 20.23 0.000 1.00

Resumen del modelo


R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)

0.0733727 98.08% 97.84% 96.90%

Análisis de Varianza
Fuente GL SC Ajust. MC Ajust. Valor F Valor p

Regresión 1 2.20338 2.20338 409.28 0.000

X 1 2.20338 2.20338 409.28 0.000

Error 8 0.04307 0.00538

Total 9 2.24645

Estadístico de Durbin-Watson
Estadístico de Durbin-Watson = 1.57167

Predicción
Ajuste EE de ajuste IC de 95% IP de 95%
4.95654 0.0317626 (4.88330; 5.02979) (4.77217; 5.14091)

Análisis de regresión: LN(Y) vs. LN(X)


Coeficientes
EE del
Término Coef coef. Valor T Valor p FIV

Constante -5.296 0.663 -7.99 0.000

LN(X) 1.861 0.115 16.14 0.000 1.00

Resumen del modelo


R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)

0.0914588 97.02% 96.65% 95.12%

Análisis de Varianza
Fuente GL SC Ajust. MC Ajust. Valor F Valor p

Regresión 1 2.17953 2.17953 260.56 0.000

LN(X) 1 2.17953 2.17953 260.56 0.000

Error 8 0.06692 0.00836

Total 9 2.24645
Estadístico de Durbin-Watson
Estadístico de Durbin-Watson = 1.683793

Predicción
Ajuste EE de ajuste IC de 95% IP de 95%
4.97836 0.0387798 (4.88893; 5.06778) (4.74928; 5.20744)

También podría gustarte