Está en la página 1de 17

DEFENSA DEL TRABAJO COLABORATIVO 3.

INES MUÑOZ-NATHALY PAREDES-EDUARDO SIZA-VALERYN


BELALCAZAR

2022-12-22
CASO 3-2 MR. TUX
John le pidió al programa que calculara las primeras diferencias de los datos. La figura 3-26
presenta la función de autocorrelación para los datos diferenciados. Los coeficientes de
autocorrelación para los retrasos de tiempo 12 y 24, r12 0.68 y r24 0.42, respectivamente, son
significativamente diferentes de cero.
Finalmente, John usa otro programa de cómputo para calcular el porcentaje de la varianza con los
datos originales, explicado por los componentes de tendencia, estacionales y aleatorios.
El programa calcula el porcentaje de la varianzaen los datos originales, explicado por los factores
en el análisis:
FACTOR EXPLICADO
Data 100
De tendencia 6
Estacional 45
Aleatoria 49
CARGAMOS LAS LIBRERIAS QUE VAMOS A OCUPAR
library(fpp2)
library(gridExtra)
library(ggplot2)
library(stats)
library(astsa)
library(forecast)
library(foreign)
library(tseries)
PREGUNTA 1
Configure los datos a una serie de tiempo con la función ts de R; considerando el año final como 2021 y luego, realice una exploración de características y componentes.
library(readxl)
Case3_2 <- read_excel("Case3-2.XLS")

#Configuracion de los datos a una serie de tiempo


ventas=ts(data = Case3_2$Sales, start = c(2014,1),frequency = 12);ventas
Jan Feb Mar Apr May Jun Jul Aug Sep Oct
2014 6028 5927 10515 32276 51920 31294 23573 36465 18959 13918
2015 16850 12753 26901 61494 147862 57990 51318 53599 23038 41396
2016 15395 30826 25589 103184 197608 68600 39909 91368 58781 59679
2017 27773 36653 51157 217509 206229 110081 102893 128857 104776 111036
2018 31416 48341 85651 242673 289554 164373 160608 176096 142363 114907
2019 51604 80366 208938 263830 252216 219566 149082 213888 178947 133650
2020 58843 82386 224803 354301 328263 313647 214561 337192 183482 144618
2021 71043 152930 250559 409567 394747 272874 230303 375402 195409 173518
Nov Dec
2014 17987 15294
2015 19330 22707
2016 33443 53719
2017 63701 82657
2018 113552 127042
2019 116946 164154
2020 139750 184546
2021 181702 258713
Exploracion de caracteristicas
#Exploracion de caracteristicas
autoplot(ventas)+
ggtitle("Ventas mensuales de Mr.
Tux.")+
ylab("Ventas")+
xlab("Periodo Ene2014-Dic2021")

Los datos presentan tendencia


creciente, estacionalidad y es
heterocedastica ya que su varianza no
es constante.
Exploracion de componentes

#Exploracion de componentes
compo=decompose(ventas,type =
"multiplicative")
plot(compo)

Vemos que tiene los componentes


de tendencia creciente, de
estacionalidad y aleatoriedad,
desconposicion de tipo multiplicativa
porque es heterosedastica.
PREGUNTA 2
Escriba las ecuaciones de los modelos ARIMA y derivados (AR, MA, ARMA, SARIMA), utilizando la función auto.arima() la
misma determina el “best model” de acuerdo a diferentes criterios como AIC, BIC, s2, entre otros.
Realizamos la prueba de adf.test para ver si la serie es estacionaria o no, si no es estacionaria combertirla en estacionaria.
Ho: ST es no estacionaria
H1: ST es estacionaria
adf.test(ventas)
Warning in adf.test(ventas): p-value smaller than printed p-value

Augmented Dickey-Fuller Test

data: ventas
Dickey-Fuller = -7.1753, Lag order = 4, p-value = 0.01
alternative hypothesis: stationary
p-value 0.01 < al nivel de significancia 0.05, por lo que no rechazo Ho, por lo tanto la ST es no estacionaria.
CALCULO DE DIFERENCIAS
La ST es no estacionaria por lo que procedemos a encontrar las diferencias para la
parte regular y la parte estacional.
# parte regular (p,d,q)
ndiffs(ventas)
[1] 1
#parte estacional(P,D,Q)
nsdiffs(ventas)
[1] 1
Conlusion: con los codigos “ndiffs” y “nsdiffs” tenemos cuantas diferencia para la parte
regular y la parte estacional necesitamos, para que la serie sea estacional, en este caso
necesitamos 1 diferencia tanto para la parte regular y la parte estacional.
MODELO ESTACIONAL
modelo_ofi=auto.arima(ventas,d=1, D=1,trace = T)

ARIMA(2,1,2)(1,1,1)[12] : 1970.974
ARIMA(0,1,0)(0,1,0)[12] : 2001.044
ARIMA(1,1,0)(1,1,0)[12] : 1987.814
ARIMA(0,1,1)(0,1,1)[12] : 1963.081
ARIMA(0,1,1)(0,1,0)[12] : 1961.509
ARIMA(0,1,1)(1,1,0)[12] : 1963.039
ARIMA(0,1,1)(1,1,1)[12] : 1965.239
ARIMA(1,1,1)(0,1,0)[12] : 1962.441
ARIMA(0,1,2)(0,1,0)[12] : 1962.417
ARIMA(1,1,0)(0,1,0)[12] : 1985.83
ARIMA(1,1,2)(0,1,0)[12] : 1964.464

Best model: ARIMA(0,1,1)(0,1,0)[12]


modelo_ofi
Series: ventas
ARIMA(0,1,1)(0,1,0)[12]

Coefficients:
ma1
-0.9642
s.e. 0.0432

sigma^2 = 1.002e+09: log likelihood = -978.68


AIC=1961.36 AICc=1961.51 BIC=1966.2
ECUACION

El mejor modelo de la serie ventas es: ARIMA(0,1,1)(0,1,0)[12].


ARIMA(0,1,1) indica la parte regular
p) 0 no hay un elemento auto regresivo.
q) 1 diferencia que se concidera para la parte regular
r) 1 patron de medias moviles.
ARIMA(0,1,0) Indica la estacionalidad o parte estacional.
P) 0 No hay elementos autoregresivos estacionales.
Q) 1 diferencia que se considera.
R) 0 no existen ruidos blancos estacionales.
PREGUNTA 3
Responda las preguntas planteadas en cada caso en el entorno computacional R.
a. Resuma los resultados del análisis de John en un párrafo que un gerente, no un pronosticador,
pueda entender.
En el estudio realizado, encontramos que las ventas van a seguir creciendo conforme el tiempo en
comparacion a los años anteriores, las ventas van a fluctuar considerablemente en comparacion a
los años anteriores; y tenemos que en el ultimo mes de cada año disminuira considerablemente
en comparacion a los meses de ese mismo año, lo cual abria que tener algun plan para aumentar
las ventas en este mes.
b. Describa los efectos de tendencia y estacionales que parecen estar presentes en los datos de
ventasde Mr. Tux.
Segun los datos que nos da John, nos dice que la tendencia es positiva es decir es cresiente ya que
el signo de esta es positivo entonces las ventas creseran atraves del tiemñpo; la estacionalidad nos
da un 49%.
PREGUNTAS
c. ¿Cómo explicaría usted la línea “Aleatoriedad,49%”?
Con los analisis que hemos hecho en los anteriores numerales podemos decir que los datos
no son tan aleatorios, y como bien nos da John el porcentaje de aleatoriedad, podemos
decir que los datos son aleatorios en un 49%.
d. Considere las autocorrelaciones significativas, r12 y r24, de los datos diferenciados.
¿Concluiría usted que las primeras ventas diferenciadas tienen un componente
estacional? Si es así, ¿cuáles son las implicaciones para el pronóstico, digamos, de los
cambios mensuales en ventas?
Estas autocorrelaciones ocurren cada 12 meses, es decir, que el ultimo mes de cada año las
ventas siempre disminuiran, y si se podria decir que es estacional ya que esto se repetiria
para cada año, las implicaciones para el pronostico es que en el ultimo mes de cada año se
considere hacer mas marketin para poder aumentar el numero de alquileres en este mes.
PREGUNTA 4

Determine los pronósticos con


intervalos de confianza del 96% para el
año 2022 utilizando la metodología
Box-Jenkins del best model. Se puede
determinar en R o GRETL.

Pasos de la metodología Box-Jenkins.

Paso 1. Identificación del modelo


AR(p), MA(q) y ARMA(p,q)
pacf(ts(ventas), lag.max = 48,) # para
determinar p=3
acf(ts(ventas), lag.max = 48) # para
determinar q=1

En base a los graficos podemos determinar


cuantos AR y MA para tener el modelo
alternativo que vamos a comparar si es mejor
que el que encontramos mas antes.
AR(3); MA(1); ARMA(3,1)
ARIMA(3,1,1)
Fase 2
Estimación de los parámetros del modelo seleccionado:
modelo1 <- arima(ventas, order = c(3,1,1), seasonal = list(order = c(0,1,0)))
modelo1

Call:
arima(x = ventas, order = c(3, 1, 1), seasonal = list(order = c(0, 1, 0)))

Coefficients:
ar1 ar2 ar3 ma1
0.1331 -0.0083 0.1250 -0.9849
s.e. 0.1134 0.1125 0.1116 0.0619

sigma^2 estimated as 957190144: log likelihood = -977.44, aic = 1964.88


Fase 3
Diagnóstico o verificación de los resultados de estimación.
modelo_ofi=auto.arima(ventas,d=1, D=1,trace = T)

ARIMA(2,1,2)(1,1,1)[12] : 1970.974
ARIMA(0,1,0)(0,1,0)[12] : 2001.044
ARIMA(1,1,0)(1,1,0)[12] : 1987.814
ARIMA(0,1,1)(0,1,1)[12] : 1963.081
ARIMA(0,1,1)(0,1,0)[12] : 1961.509
ARIMA(0,1,1)(1,1,0)[12] : 1963.039
ARIMA(0,1,1)(1,1,1)[12] : 1965.239
ARIMA(1,1,1)(0,1,0)[12] : 1962.441
ARIMA(0,1,2)(0,1,0)[12] : 1962.417
ARIMA(1,1,0)(0,1,0)[12] : 1985.83
ARIMA(1,1,2)(0,1,0)[12] : 1964.464

Best model: ARIMA(0,1,1)(0,1,0)[12]


modelo1 <- arima(ventas, order = c(3,1,1), seasonal = list(order = c(0,1,0)))
modelo2 <- arima(ventas, order = c(2,1,1), seasonal = list(order = c(0,1,0)))

#Comparamos estos modelos utilizando los criterios AIC y BIC


aic <- AIC(modelo_ofi, modelo1, modelo2)
bic <- BIC(modelo_ofi, modelo1, modelo2)
cia <- data.frame(aic,bic)
cia
df AIC df.1 BIC
modelo_ofi 2 1961.359 2 1966.196
modelo1 5 1964.885 5 1976.979
modelo2 4 1964.138 4 1973.813
El mejor modelo seria modelo_ofi sería ARIMA(0,1,1)(0,1,0)[12], ya que el AIC es el menor de los 3 modelos.
Fase 4

Predicción utilizando el modelo adecuado


par(mfrow=c(1,1))
prediccion1 <- forecast(modelo_ofi, level = c(96), h = 12)
# En este caso nos muestra posibles valores de las ventas para los
12 meses del siguiente año con IC(96%)
prediccion1
Point Forecast Lo 96 Hi 96
Jan 2022 105914.6 40910.97 170918.3
Feb 2022 187801.6 122756.41 252846.9
Mar 2022 285430.6 220343.88 350517.4
Apr 2022 444438.6 379310.37 509566.9
May 2022 429618.6 364448.89 494788.4
Jun 2022 307745.6 242534.44 372956.8
Jul 2022 265174.6 199922.02 330427.3
Aug 2022 410273.6 344979.62 475567.7
Sep 2022 230280.6 164945.24 295616.0
Oct 2022 208389.6 143012.90 273766.4
Nov 2022 216573.6 151155.58 281991.7
Dec 2022 293584.6 228125.28 359044.0
autoplot(prediccion1)

También podría gustarte