Está en la página 1de 11

Caso 1

Interpretación

Determinar si la población de usuarios de internet del país se incrementa a 7 millones, la velocidad


promedio de internet en el país llega a 64 megabits por segundo, la proporción de población bancarizada
es de 85% y el precio promedio del internet en US$ baja a 14 dólares.

Representación

Variable dependiente o respuesta: VOLUMEN DE E-COMMERCE

Variables independientes o predictores:

X1: PROPORCION BANCARIZADA

X2: VELOCIDAD DE INTERNET

X3: USUARIOS DE INTERNET

X4: PRECIO INTERNET (EN US$)

Técnica estadística: Análisis de regresión lineal múltiple.

Cálculo

1) Estimación del modelo 1 mediante el método de mínimos cuadrados y se elaborará el diagrama


de dispersión para cada variable independiente.

ráfica de dispersión de VOLUMEN DE E vs. PROPORCION B, VELOCIDAD DE


PROPORCION BANCARIZADA X1 VELOCIDAD DE INTERNET X2
300

200
VOLUMEN DE E-COMMERCE Y

100

0
20 40 60 80 0 20 40 60 80
USUARIOS DE INTERNET X3 PRECIO INTERNET (EN US$) X4
300

200

100

0
2 4 6 8 10 20 30 40
El volumen de e-commerce está relacionado linealmente con cada una de las variables
independientes. Gráficamente se puede observar que las variables PROPORCION BANCARIZADA
(X1) y VELOCIDAD DE INTERNET (X2) presentan menor correlación.

Correlaciones
VOLUMEN DE E- PROPORCION VELOCIDAD DE USUARIOS DE
COM BANCA INT INTE

PROPORCION 0.744
BANCA
VELOCIDAD DE INT 0.795 0.894
USUARIOS DE INTE 0.849 0.803 0.785
PRECIO INTERNET -0.621 -0.346 -0.462 -0.557
Contenido de la celda
      Correlación de Pearson

La variable usuarios de internet (X3) presenta una mayor correlación con la variable volumen de
e-commerce y la variable precio internet (X4) presenta una menor correlación

2) Validación del modelo 1 (evaluación de requisitos): prueba global, prueba de los coeficientes,
evaluación de los supuestos y análisis de datos influyentes (también los atípicos).

Estimación del modelo completo (Modelo 1):

Análisis de Varianza
SC
Fuente GL Ajust. MC Ajust. Valor F Valor p

Regresión 4 146373 36593.1 33.25 0.000


  PROPORCION BANCARIZADA X1 1 3 2.6 0.00 0.961
  VELOCIDAD DE INTERNET X2 1 3454 3453.7 3.14 0.085
  USUARIOS DE INTERNET  X3 1 11614 11613.7 10.55 0.003
  PRECIO INTERNET (EN US$) X4 1 4534 4533.7 4.12 0.050
Error 35 38521 1100.6
  Falta de ajuste 28 38521 1375.8 * *
  Error puro 7 0 0.0
Total 39 184894

Resumen del modelo


R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)
33.175 79.17% 76.78% 70.97%
4

Coeficientes
EE del
Término Coef coef. Valor T Valor p FIV

Constante 60.1 39.5 1.52 0.137


PROPORCION BANCARIZADA -0.042 0.865 -0.05 0.961 6.48
X1
VELOCIDAD DE INTERNET X2 1.126 0.635 1.77 0.085 5.77
USUARIOS DE INTERNET  X3 15.30 4.71 3.25 0.003 3.77
PRECIO INTERNET (EN US$) X4 -2.51 1.23 -2.03 0.050 1.64

Modelo de regresión lineal múltiple estimada:

Y^ =60.1−0.042 X 1 +1.126 X 2 +15.30 X 3−2.51 X 4

3) Validación del modelo 1 (evaluación de requisitos): prueba global, prueba de los coeficientes, evaluación
de los supuestos y análisis de datos influyentes (también los atípicos).

Validación conjunta:
H 0 : β 1=β 2=β 3=β 4=0
H 1 : Al menosuno de losbetas es diferente de cero

Nivel de significación: α = 0.05


Estadístico de prueba: Fcal = 33.25
p --> valor = 0.000
Decisión: Como el p < α, se rechaza H0
Conclusión: Con un nivel de significación del 5%, Al menos uno de los betas es diferente de cero.

Validación de los coeficientes de regresión:


H 0 : β 1=0(No Influye) H 0 : β 2=0 H 1 : β3 =0 H 1 : β 4=0
H 1 : β1 ≠ 0(Sí Influye) H 1 : β2 ≠ 0 H 1 : β3 ≠ 0 H 1: β4≠ 0
Nivel de significación: α = 0.05
Estadístico de prueba: Tcal =-0.05 Tcal = 1.77 Tcal = 3.25 Tcal = -2.03
P --> valor = 0.961 P = 0.085 P = 0.003 P=0.050
p > α No se rechaza H0 p > α No se rechaza H0 p < α Se rechaza H0 p > α No se rechaza H0

Decisión: Cuando el p > α, no se rechaza H0

Conclusión: Con un nivel de significación del 5%, la proporción bancarizada, la velocidad de internet no y el
precio del internet no influyen en el volumen de e-commerce. Por lo tanto, el modelo 1 no es válido.
4) Si el modelo 1, incumple alguno de sus requisitos, se estima el modelo 2 mediante el método
paso a paso.

Selección de términos escalonada


Términos candidatos: PROPORCION BANCARIZADA X1, VELOCIDAD DE INTERNET X2, USUARIOS DE
     INTERNET  X3, PRECIO INTERNET (EN US$) X4

----Paso 1---- ----Paso 2---- ----Paso 3----


Coef P Coef P Coef P

Constante -34.7 -21.0 60.1


USUARIOS DE INTERNET  X3 26.67 0.000 18.42 0.000 15.20 0.001
VELOCIDAD DE INTERNET X2 1.148 0.014 1.103 0.013
PRECIO INTERNET (EN US$) -2.53 0.034
X4
S 36.8800 34.3811 32.7125
R-cuad. 72.05% 76.35% 79.16%
R-cuad.(ajustado) 71.31% 75.07% 77.43%
R-cuad. (pred) 67.48% 70.77% 73.08%
Cp de Mallows 10.96 5.74 3.00
α a entrar = 0.05, α a retirar = 0.05

Análisis de Varianza
Fuente GL SC Ajust. MC Ajust. Valor F Valor p

Regresión 3 146370 48790.0 45.59 0.000


  VELOCIDAD DE INTERNET X2 1 7325 7325.1 6.85 0.013
  USUARIOS DE INTERNET  X3 1 14515 14514.8 13.56 0.001
  PRECIO INTERNET (EN US$) 1 5212 5212.3 4.87 0.034
X4
Error 36 38524 1070.1
  Falta de ajuste 29 38524 1328.4 * *
  Error puro 7 0 0.0
Total 39 184894
Resumen del modelo
R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)

32.712 79.16% 77.43% 73.08%


5

Coeficientes
EE del Valor
Término Coef coef. T Valor p FIV

Constante 60.1 38.9 1.54 0.131


VELOCIDAD DE INTERNET X2 1.103 0.422 2.62 0.013 2.61
USUARIOS DE INTERNET  X3 15.20 4.13 3.68 0.001 2.98
PRECIO INTERNET (EN US$) -2.53 1.14 -2.21 0.034 1.45
X4

Ecuación de regresión
VOLUMEN DE E-COMMERCE = 60.1 + 1.103 VELOCIDAD DE INTERNET X2
Y + 15.20 USUARIOS DE INTERNET  X3
- 2.53 PRECIO INTERNET (EN US$) X4

Ajustes y diagnósticos para observaciones poco comunes


Ob VOLUMEN DE Resid
s E-COMMERCE Y Ajuste Resid est.

12 200.0 144.5 55.5 2.00 R


21 295.0 264.6 30.4 1.18 X
34 100.0 117.6 -17.6 -0.70 X
35 295.0 273.4 21.6 0.85 X
Residuo grande R
X  poco común X

Estadístico de Durbin-Watson
Estadístico de Durbin-Watson 2.40589
=

Ecuación de regresión lineal múltiple estimada:


Y^ =60.1+1.103 X 2+15.20 X 3−2.53 X 4

Validación conjunta:
H 0 : β 2=β 3=β 4=0
H 1 : Al menosuno de losbetas es diferente de cero

Nivel de significación: α = 0.05


Estadístico de prueba: Fcal = 45.59
p --> valor = 0.000
Decisión: Como el p < α, se rechaza H0
Conclusión: Con un nivel de significación del 5%, Al menos uno de los betas es diferente de cero.

Validación de los coeficientes de regresión:


H 0 : β 2=0(No Influye) H 0 : β 3=0 H 1 : β 4=0
H 1 : β2 ≠ 0(Sí Influye) H 1 : β3 ≠ 0 H 1: β4≠ 0
Nivel de significación: α = 0.05
Estadístico de prueba: Tcal =2.62 Tcal =3.68 Tcal = -2.21
P --> valor = 0.013 P = 0.001 P=0.034
p < α Se rechaza H0 p < α Se rechaza H0 p < α Se rechaza H0

Decisión: Cuando el p > α, no se rechaza H0

Conclusión: Con un nivel de significación del 5%, la velocidad de internet, los usuarios de internet
y el precio del internet sí influyen en el volumen de e-commerce.

Interpretación de los coeficientes de regresión:

β 2=1.103: Si la velocidad de internet(X2) incrementa por segundo, el volumen de e-commerce


(Y) se incrementará en 1.103 millones de dólares, manteniendo constante los usuarios de internet
y el precio del internet.
β 3=15.20 : Si los usuarios de internet(X3) incrementan, el volumen de e-commerce (Y) se
incrementará en 15.20 millones de dólares, manteniendo constante la velocidad de internet y el
precio del internet.
β 4 =−2.53: Si el precio del internet(X4) incrementa, el volumen de e-commerce (Y) se
incrementará en -2.53 millones de dólares, manteniendo constante velocidad de internet y los
usuarios de internet.

Validación de supuesto:

1. Normalidad de errores:
Gráfica de probabilidad de RESID
Normal
99
Media -5.32907E-16
Desv.Est. 31.43
95 N 40
KS 0.129
90
Valor p 0.093
80
70
Porcentaje 60
50
40
30
20

10
5

1
-80 -60 -40 -20 0 20 40 60 80
RESID

H 0 : Los errores siguen una distribución normal


H 1 : Los errores no siguen una distribución normal

Nivel de significación: α = 0.05


Estadístico de prueba: KS = 0.129
P - valor =0.093
Decisión: Como el p-valor > α, No se rechaza H0
Conclusión: Con un nivel de significación del 5%, Los errores no siguen una distribución
normal

2. Independencia y homocedasticidad:
D.W. = 2.40589 pertenece al intervalo [1.5; 2.5], entonces se puede concluir que se cumple
con los supuestos de independencia de los errores y homocedasticidad.

3. Supuesto de la linealidad:
s de residuos para VOLUMEN DE E-COMMERCE Y
probabilidad normal vs. ajustes

50

25
Residuo

-25

-50
0 40 80 0 100 200 300
Residuo Valor ajustado

Histograma vs. orden


50

25
Residuo

-25

-50
0 30 60 1 5 10 15 20 25 30 35 40
Gráfica de probabilidad normal vs. ajustes
99
50
90
De gráfico de valores ajustados vs residuos, se desprende25 que la relación entre “Y” con cada una

Porcentaje

Residuo
de las50variables regresoras es lineal, porque los errores0 se distribuyen de manera aleatoria
alrededor de la línea central. -25
10
-50
1
4. Promedio
-80 de-40los errores
0 es cero:
40 80 0 100 200 300
Residuo Valor ajustado

Histograma vs. orden


10.0
50

7.5 25
Frecuencia

Residuo
5.0 0

-25
2.5
-50
0.0
-60 -30 0 30 60 1 5 10 15 20 25 30 35 40
Residuo Orden de observación

En base al histograma se puede concluir que se cumple con el supuesto del promedio de los
errores es cero.

5. Ausencia de colinealidad:
Como el FIV es menor que 10 (para las variables independientes X2 es de 2.61, X3 es de 2.98 y
X4 es de 1.45), se puede concluir que no hay problemas de multicolinealidad entre las
variables X2, X3 y X4.

6. Determinar si existen observaciones influyentes:

COOK
0.000410
0.026974
0.041411
0.031411
0.018289
0.001760
0.001069
0.009562
0.000001
0.072898
0.041007
0.392529
0.003172
0.012353
0.007824
0.000291
0.019450
0.000008
0.002392
0.072916
0.217490
0.039141
0.031411
0.018289
0.016406
0.012353
0.007824
0.000899
0.017658
0.000644
0.041411
0.031411
0.004364
0.084486
0.123754
0.000410
0.011839
0.045774
0.000454
0.023561

Se puede observar que no existe observaciones influyentes, todas las distancias de cook son
menores que 1. Por lo tanto, se cumplen todos los supuestos del modelo.
Finalmente, el modelo 2 queda listo para utilizarlo en el pronóstico

5) Estimar el pronóstico solicitado.


Para la población de usuarios de internet del país se incrementa a 7 millones, la velocidad
promedio de internet en el país llega a 64 megabits por segundo, la proporción de población
bancarizada es de 85% y el precio promedio del internet en US$ baja a 14 dólares.

Predicción
EE de
Ajuste ajuste IC de 95% IP de 95%

201.733 16.279 (168.716, 234.750) (127.627, 275.839)


8

Interpretación: Con un nivel de confianza del 95%, se estima que el volumen de e-commerce,
cuando la población de usuarios de internet del país se incrementa a 7 millones, la velocidad
promedio de internet en el país llega a 64 megabits por segundo y el precio promedio del internet
en US$ baja a 14 dólares, se encuentra contenido en el intervalo [168.716; 234.750]

Argumentación: Se puede determinar que la población de usuarios de internet del país que se
incrementa a 7 millones, la velocidad promedio de internet en el país llega a 64 megabits por
segundo, la proporción de población bancarizada es de 85% y el precio promedio del internet en
US$ baja a 14 dólares presente un volumen de e-commerce óptimo.

CASO 2

Interpretación

Determinar si terminan el último trimestre del año 2019 con una cifra de volumen que supere los 300
millones de soles.

Representación

Identificar el tipo y los componentes de la serie; luego, indicar la técnica de predicción a usar.

Gráfica de la serie y correlograma:

Valores de YT
Q4/2014 Q4/2015 Q4/2016 Q4/2017
260000 253152
250148
242789
240000
220147
220000
205815
202985
200000
188602
178963
180000
Yt

164652
163293
160000 154987
142500
140000 129647
128111
119360
120000 110547
9821796586
100000 95248

Trimestre Q1 Q3 Q1 Q3 Q1 Q3 Q1 Q3 Q1 Q3
Año 2014 2015 2016 2017 2018

La serie no es estacionaria: Presenta tendencia creciente y se evidencia aumento en el IV trimestre.


Se puede evaluar un modelo multiplicativo.
Función de autocorrelación para Yt
(con límites de significancia de 5% para las autocorrelaciones)
1.0

0.8

0.6

0.4
Autocorrelaci ón 0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0
1 2 3 4 5 6 7 8
Desfase

Interpretamos: En el gráfico de la serie se observa tendencia, en el correlograma se observa que los tres
bastones iniciales decaen. Por lo tanto, existe tendencia.

Se observa un patrón que se repite cada año, en el correlograma se observa que el bastón 4 es más alto
que los bastones vecinos. Por lo tanto, existe estacionalidad.

La serie es no estacionaria – Se utilizará el modelo multiplicativo.

Cálculo:

Cálculo de los promedios móviles centrados

También podría gustarte