Práctica de Pronósticos Rmarkdown

PRÁCTICA DE PRONÓSTICOS
Castillo Benites, Cayllahua Ríos, Nicolás Olascuaga, Zamudio Limas y Zavaleta Cotrina
2023-01-09
#Instalamos los paquetes:
install.packages("readxl")
install.packages("tseries")
install.packages("astsa")
install.packages("forecast")
install.packages("tidyverse")
install.packages("lubridate")
install.packages("foreign")
install.packages("quantmod")
1
install.packages("readxl")
#Ejecutamos los paquetes
library(readxl)
library(tseries)
library(astsa)
library(forecast)
library(tidyverse)
library(lubridate)
library(foreign)
library(quantmod)
#EJERCICIO 1
#Cargamos la base de datos
venta = read_excel("práctica de pronóstico - excel.xlsx", sheet= "Base de datos - ejercicio 1")

venta
## # A tibble: 12 x 2
## Año ‘Venta de autos‘
## <dttm> <dbl>
## 1 2022-01-01 00:00:00 20
## 2 2022-02-01 00:00:00 21
## 3 2022-03-01 00:00:00 15
## 4 2022-04-01 00:00:00 14
## 5 2022-05-01 00:00:00 13
## 6 2022-06-01 00:00:00 16
## 7 2022-07-01 00:00:00 17
## 8 2022-08-01 00:00:00 18
## 9 2022-09-01 00:00:00 20
## 10 2022-10-01 00:00:00 20
## 11 2022-11-01 00:00:00 21
## 12 2022-12-01 00:00:00 23
# Programos para que sea una serie de tiempo

venta.ts=ts(venta[,2], start=c(2022,1), frequency=12)
venta.ts
## Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
## 2022 20 21 15 14 13 16 17 18 20 20 21 23
#Graficamos la serie
plot(venta.ts)
2
22
20
Venta de autos
18
16
14
2022.0 2022.2 2022.4 2022.6 2022.8
Time
#Comprobamos si la serie es estacionaria

adf.test(venta.ts,alternative = "stationary")
##
## Augmented Dickey-Fuller Test
##
## data: venta.ts
## Dickey-Fuller = -3.9126, Lag order = 2, p-value = 0.02767
## alternative hypothesis: stationary
#Dado que el valor p-value= 0.02 es menor que 0.05 el modelo es estacionario.
#Ahora determinaremos el número de media móviles para el modelo arima.

acf(venta.ts)
3
Venta de autos
1.0
0.5
ACF
0.0
−0.5
0.0 0.2 0.4 0.6 0.8
Lag
#Ahora determinaremos el número de autoregresiones para el modelo arima.

pacf(venta.ts)
4
Series venta.ts
0.6
0.4
0.2
Partial ACF
−0.2 0.0
−0.6
0.2 0.4 0.6 0.8
Lag
#Ahora programamos la coincidencia de rezago con la frecuencia :1

acf(ts(venta.ts,frequency = 1))
5
Venta de autos
1.0
0.5
ACF
0.0
−0.5
0 2 4 6 8 10
Lag
pacf(ts(venta.ts,frequency=1))
6
Series ts(venta.ts, frequency = 1)
0.6
0.4
0.2
Partial ACF
−0.2 0.0
−0.6
2 4 6 8 10
Lag
#Programos el modelo Arima

modelo1=arima(venta.ts, order=c(1,2,2))
modelo1
##
## Call:
## arima(x = venta.ts, order = c(1, 2, 2))
##
## Coefficients:
## ar1 ma1 ma2
## -0.8208 0.0892 -0.2046
## s.e. 0.3246 0.4717 0.4816
##
## sigma^2 estimated as 5.98: log likelihood = -23.5, aic = 55.01
tsdiag(modelo1)
7
−2.0
Standardized Residuals
2022.0 2022.2 2022.4 2022.6 2022.8
Time
ACF of Residuals
ACF
−0.5
0.0 0.2 0.4 0.6 0.8
Lag
p values for Ljung−Box statistic

1.0
p value
0.0
2 4 6 8 10
lag
#Verificamos el ajuste de los datos al modelo Arima

Box.test(residuals(modelo1), type = "Ljung-Box")
##
## Box-Ljung test
##
## data: residuals(modelo1)
## X-squared = 0.67132, df = 1, p-value = 0.4126
error=residuals(modelo1)
#Graficamos el error
plot(error)
8
4
2
0
error
−2
−4
2022.0 2022.2 2022.4 2022.6 2022.8
Time
#Realizamos el pronóstico con el paquete forecast:

pronostico = forecast ::forecast(modelo1, h=5, level=95)
pronostico
## Point Forecast Lo 95 Hi 95
## Jan 2023 24.35962 19.566826 29.15241
## Feb 2023 25.93181 18.190332 33.67329
## Mar 2023 27.32953 15.257545 39.40152
## Apr 2023 28.87045 12.612638 45.12827
## May 2023 30.29384 8.972661 51.61502
#Graficamos
plot(pronostico)
9
Forecasts from ARIMA(1,2,2)
50
40
30
20
10
2022.0 2022.2 2022.4 2022.6 2022.8 2023.0 2023.2
#Programos los nombres de los ejes y el título del gráfico.

plot(pronostico, main="venta de autos", sub= "mes", ylab= "ventas")
10
venta de autos
50
40
ventas
30
20
10
2022.0 2022.2 2022.4 2022.6 2022.8 2023.0 2023.2
mes
#EJERCICIO 2
Demanda = read_excel("práctica de pronóstico - excel.xlsx", sheet= "Base de datos - ejercicio 2")

Demanda
## # A tibble: 11 x 2
## Años DEMANDA
## <dbl> <dbl>
## 1 1 7
## 2 2 9
## 3 3 5
## 4 4 9
## 5 5 13
## 6 6 8
## 7 7 12
## 8 8 13
## 9 9 9
## 10 10 11
## 11 11 7

Demanda.ts=ts(Demanda [,2], start=c(1), frequency=1)
Demanda.ts
## Time Series:
11
## Start = 1
## End = 11
## Frequency = 1
## DEMANDA
## [1,] 7
## [2,] 9
## [3,] 5
## [4,] 9
## [5,] 13
## [6,] 8
## [7,] 12
## [8,] 13
## [9,] 9
## [10,] 11
## [11,] 7
plot(Demanda.ts)
12
DEMANDA
10
8
6
2 4 6 8 10
Time
#Comprobamos si la serie es estacional

adf.test(Demanda.ts,alternative = "stationary")
## Warning in adf.test(Demanda.ts, alternative = "stationary"): p-value greater than

## printed p-value
12
##
##
## data: Demanda.ts
## Dickey-Fuller = 1.4041, Lag order = 2, p-value = 0.99
#Dado que el valor p-value= 0.99 es mayor que 0.05 el modelo no es estacionario por lo tanto debemos di
Demanda1=diff(Demanda.ts)
Demanda1
## Time Series:
## Start = 2
## End = 11
## Frequency = 1
## DEMANDA
## [1,] 2
## [2,] -4
## [3,] 4
## [4,] 4
## [5,] -5
## [6,] 4
## [7,] 1
## [8,] -4
## [9,] 2
## [10,] -4
plot(Demanda1)
13
4
2
DEMANDA
0
−2
−4
2 4 6 8 10
Time
adf.test(Demanda1, alternative="stationary")
##
##
## data: Demanda1
demandas2=diff(Demanda1, differences=2)
demandas2
## Time Series:
## Start = 4
## End = 11
## Frequency = 1
## DEMANDA
## [1,] 14
## [2,] -8
## [3,] -9
## [4,] 18
## [5,] -12
## [6,] -2
## [7,] 11
## [8,] -12
14
plot(demandas2)
15
10
DEMANDA
5
0
−10 −5
4 5 6 7 8 9 10 11
Time
#Comprobamos si el modelo se volvió estacionario

adf.test(demandas2, alternative="stationary")
## Warning in adf.test(demandas2, alternative = "stationary"): p-value smaller than##

printed p-value
##
##
## data: demandas2
#Dado que tiene un valor menor a 0.05 se concluye que el modelo es estacionario.
acf(demandas2)
15
DEMANDA
1.0
0.5
ACF
0.0
−0.5
0 1 2 3 4 5 6 7
Lag

pacf(demandas2)
16
Series demandas2
0.6
0.2
Partial ACF
−0.2
−0.6
1 2 3 4 5 6 7
Lag

acf(ts(demandas2,frequency = 1))
17
DEMANDA
1.0
0.5
ACF
0.0
−0.5
0 1 2 3 4 5 6 7
Lag
pacf(ts(demandas2,frequency=1))
18
Series ts(demandas2, frequency = 1)
0.6
0.2
Partial ACF
−0.2
−0.6
1 2 3 4 5 6 7
Lag

modelo1=arima(Demanda.ts, order=c(1,2,1))
modelo1
##
## Call:
## arima(x = Demanda.ts, order = c(1, 2, 1))
##
## Coefficients:
## ar1 ma1
## -0.4668 -1.0000
## s.e. 0.2921 0.6135
##
tsdiag(modelo1)
19
−1.0
2 4 6 8 10
Time
ACF of Residuals
ACF
−0.5
0 2 4 6 8 10
Lag

1.0
p value
0.0
2 4 6 8 10
lag

##
## Box-Ljung test
##
plot(error)
20
4
2
error
0
−2
−4
2 4 6 8 10
Time

pronostico
## 12 8.966881 2.2985721 15.63519
## 13 8.148460 0.2945349 16.00239
## 14 8.630201 -1.2009881 18.46139
## 15 8.505034 -2.8145798 19.82465
## 16 8.663168 -4.2701752 21.59651
#Graficamos
plot(pronostico)
21
20
15
10
5
0
−5
5 10 15

plot(pronostico, main="Pronóstico de la demanda", sub= "año", ylab= "Demanda")
22
Pronóstico de la demanda
20
15
Demanda
10
5
0
−5
5 10 15
año
#EJERCICIO 3
Litros = read_excel("práctica de pronóstico - excel.xlsx", sheet= "Base de datos - ejercicio 3")

Litros
## # A tibble: 24 x 2
## Trimestre ‘Venta en miles de litros‘
## <dttm> <dbl>
## 1 2022-01-01 00:00:00 258
## 2 2022-04-01 00:00:00 370
## 3 2022-07-01 00:00:00 392
## 4 2022-10-01 00:00:00 303
## 5 2023-01-01 00:00:00 265
## 6 2023-04-01 00:00:00 382
## 7 2023-07-01 00:00:00 401
## 8 2023-10-01 00:00:00 312
## 9 2024-01-01 00:00:00 292
## 10 2024-04-01 00:00:00 387
## # ... with 14 more rows

Litros.ts=ts(Litros[,2], start=c(2022,1), frequency=4)
Litros.ts
## Qtr1 Qtr2 Qtr3 Qtr4
23
## 2022 258 370 392 303
## 2023 265 382 401 312
## 2024 292 387 424 325
## 2025 299 412 448 329
## 2026 304 419 463 351
## 2027 310 438 486 367
plot(Litros.ts)
450
Venta en miles de litros
400
350
300
250
2022 2023 2024 2025 2026 2027
Time

adf.test(Litros.ts,alternative = "stationary")
## Warning in adf.test(Litros.ts, alternative = "stationary"): p-value smaller than##

printed p-value
##
##
## data: Litros.ts
24

acf(Litros.ts)

1.0
0.5
ACF
0.0
−0.5
0.0 0.5 1.0 1.5 2.0 2.5 3.0
Lag

pacf(Litros.ts)
25
Series Litros.ts
0.6
0.4
0.2
Partial ACF
−0.2
−0.6
0.5 1.0 1.5 2.0 2.5 3.0
Lag

acf(ts(Litros.ts,frequency = 1))
26
1.0
0.5
ACF
0.0
−0.5
0 2 4 6 8 10 12
Lag
pacf(ts(Litros.ts,frequency=1))
27
Series ts(Litros.ts, frequency = 1)
0.6
0.4
0.2
Partial ACF
−0.2
−0.6
2 4 6 8 10 12
Lag

modelo1=arima(Litros.ts, order=c(3,2,6))
modelo1
##
## Call:
## arima(x = Litros.ts, order = c(3, 2, 6))
##
## Coefficients:
## ar1 ar2 ar3 ma1 ma2 ma3 ma4 ma5 ma6
## -0.8974 -0.9822 -0.9132 -1.5450 -0.1011 0.4950 -0.1536 1.0454 -0.7402
## s.e. 0.1628 0.0131 0.1615 2.1758 1.3130 1.5162 0.6069 0.8016 1.6263
##
tsdiag(modelo1)
28
−1.5
2022 2023 2024 2025 2026 2027
Time
ACF of Residuals
ACF
−0.4
0.0 0.5 1.0 1.5 2.0 2.5 3.0
Lag

1.0
p value
0.0
2 4 6 8 10
lag

##
## Box-Ljung test
##
plot(error)
29
5
error
0
−5
2022 2023 2024 2025 2026 2027
Time

pronostico
## 2028 Q1 320.5803 309.4697 331.6909
## 2028 Q2 442.7778 431.4601 454.0956
## 2028 Q3 501.5733 488.5049 514.6416
## 2028 Q4 385.9994 372.8009 399.1978
## 2029 Q1 333.4197 318.7532 348.0861
## 2029 Q2 453.6359 438.2861 468.9857
## 2029 Q3 516.1443 499.6613 532.6273
## 2029 Q4 403.2026 386.5847 419.8204
#Graficamos
plot(pronostico)
30
500
450
400
350
300
250
2022 2024 2026 2028 2030

plot(pronostico, main="venta en miles de litros por trimestre", sub= "trimestre", ylab= "ventas miles d
31
venta en miles de litros por trimestre
500
ventas miles de litros
450
400
350
300
250
2022 2024 2026 2028 2030
trimestre
#EJERCICIO 4
De = read_excel("práctica de pronóstico - excel.xlsx", sheet= "Base de datos - Ejercicio 4")

De
## # A tibble: 24 x 2
## Trimestre Demanda
## <dttm> <dbl>
## 1 2001-01-01 00:00:00 50
## 2 2001-04-01 00:00:00 45
## 3 2001-07-01 00:00:00 52
## 4 2001-10-01 00:00:00 56
## 5 2002-01-01 00:00:00 53
## 6 2002-04-01 00:00:00 48
## 7 2002-07-01 00:00:00 57
## 8 2002-10-01 00:00:00 62
## 9 2003-01-01 00:00:00 56
## 10 2003-04-01 00:00:00 50
## # ... with 14 more rows

De.ts=ts(De[,2], start=c(1), frequency=4)
De.ts
32
## 1 50 45 52 56
## 2 53 48 57 62
## 3 56 50 60 67
## 4 62 56 65 71
## 5 65 60 70 77
## 6 73 66 75 85
plot(De.ts)
80
70
Demanda
60
50
1 2 3 4 5 6
Time

adf.test(De.ts,alternative = "stationary")
##
##
## data: De.ts
#Dado que el valor p-value= 0.1123 es mayor que 0.05 el modelo no es estacionario por lo tanto debemos
Demanda1=diff(De.ts)
Demanda1
33
## 1 -5 7 4
## 2 -3 -5 9 5
## 3 -6 -6 10 7
## 4 -5 -6 9 6
## 5 -6 -5 10 7
## 6 -4 -7 9 10
plot(Demanda1)
10
5
Demanda
0
−5
2 3 4 5 6
Time
#Comprobamos si el modelo se volvió estacionario

adf.test(Demanda1, alternative="stationary")
## Warning in adf.test(Demanda1, alternative = "stationary"): p-value smaller than##

printed p-value
##
##
## data: Demanda1
#Dado que tiene un valor menor a 0.05 se concluye que el modelo es estacionario.
acf(Demanda1)
34
Demanda
1.0
0.5
ACF
0.0
−0.5
0.0 0.5 1.0 1.5 2.0 2.5 3.0
Lag

pacf(Demanda1)
35
Series Demanda1
0.0 0.2 0.4
Partial ACF
−0.4
−0.8
0.5 1.0 1.5 2.0 2.5 3.0
Lag

acf(ts(Demanda1,frequency = 1))
36
Demanda
1.0
0.5
ACF
0.0
−0.5
0 2 4 6 8 10 12
Lag
pacf(ts(Demanda1,frequency=1))
37
Series ts(Demanda1, frequency = 1)
0.0 0.2 0.4
Partial ACF
−0.4
−0.8
2 4 6 8 10 12
Lag

modelo1=arima(De.ts, order=c(2,2,4))
modelo1
##
## Call:
## arima(x = De.ts, order = c(2, 2, 4))
##
## Coefficients:
## ar1 ar2 ma1 ma2 ma3 ma4
## 0.0046 -0.9973 -1.5799 1.4249 -1.5799 1.0000
## s.e. 0.0180 0.0035 0.3036 0.3408 0.4579 0.3717
##
tsdiag(modelo1)
38
−1.5
1 2 3 4 5 6
Time
ACF of Residuals
ACF
−0.4
0.0 0.5 1.0 1.5 2.0 2.5 3.0
Lag

1.0
p value
0.0
2 4 6 8 10
lag

##
## Box-Ljung test
##
plot(error)
39
2
1
error
0
−1
1 2 3 4 5 6
Time

pronostico
## 7 Q1 78.54114 76.04850 81.03378
## 7 Q2 72.90181 70.12383 75.67980
## 7 Q3 81.21891 78.34879 84.08903
## 7 Q4 90.50915 87.62220 93.39611
## 8 Q1 85.88552 82.61137 89.15967
## 8 Q2 80.22771 76.13581 84.31961
## 8 Q3 88.44106 83.90694 92.97518
## 8 Q4 97.74926 92.93145 102.56707
#Graficamos
plot(pronostico)
40
100
90
80
70
60
50
2 4 6 8

plot(pronostico, main="Pronóstico de la demanda", sub= "trimestre", ylab= "Demanda")
41
Pronóstico de la demanda
100
90
Demanda
80
70
60
50
2 4 6 8
trimestre
#EJERCICIO 5
#Primero descargar y cargar la base de datos a la cuál le pondremos de nombre "Co" y acceder a variable
Co = read_excel("práctica de pronóstico - excel.xlsx", sheet= "Base de datos - Ejercicio 5")
Co
## # A tibble: 10 x 3
## AÑO ‘Cosecha (miles de bushells)‘ ‘Lluvia (pulgadas)‘
## <dbl> <dbl> <dbl>
## 1 1984 11 6.5
## 2 1985 12 7.2
## 3 1986 10.5 7.5
## 4 1987 11.5 9
## 5 1988 12.5 8.3
## 6 1989 7.5 2.2
## 7 1990 9.5 5
## 8 1991 11 6.6
## 9 1992 11 7.5
## 10 1993 12 8.1
attach(Co)
## The following objects are masked from Co (pos = 3):

##
## AÑO, Cosecha (miles de bushells), Lluvia (pulgadas)
42
#Seleccionamos las columnas con las variables que queremos ver su correlación.
pairs(Co[,1:3])
8 9 10 11 12
1992
1988
AÑO
1984
12
Cosecha (miles de bushells)

9 10
8
8
Lluvia (pulgadas)
6
4
2
1984 1986 1988 1990 1992 2 3 4 5 6 7 8 9
#Escribir el nombre de la base de datos para que nos aparezca en el script

Co
## # A tibble: 10 x 3
## AÑO ‘Cosecha (miles de bushells)‘ ‘Lluvia (pulgadas)‘
## <dbl> <dbl> <dbl>
## 1 1984 11 6.5
## 2 1985 12 7.2
## 3 1986 10.5 7.5
## 4 1987 11.5 9
## 5 1988 12.5 8.3
## 6 1989 7.5 2.2
## 7 1990 9.5 5
## 8 1991 11 6.6
## 9 1992 11 7.5
## 10 1993 12 8.1
#Seleccionar las variables de interés

cor(`Lluvia (pulgadas)`,`Cosecha (miles de bushells)`)
## [1] 0.9173603
43
#Programamos la regresión lineal entre las variables "Cosecha (miles de bushells" y "Lluvia (pulgadas)"
mylm=lm(`Cosecha (miles de bushells)`~`Lluvia (pulgadas)`)
plot(`Lluvia (pulgadas)`,`Cosecha (miles de bushells)`,xlab="lluvia (pulgadas",ylab="cosecha (miles de
abline(mylm,col="blue")
Cosecha (miles de bushells)

12
cosecha (miles de bushells)
11
10
9
8
2 3 4 5 6 7 8 9
lluvia (pulgadas
summary(mylm)
##
## Call:
## lm(formula = ‘Cosecha (miles de bushells)‘ ~ ‘Lluvia (pulgadas)‘)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.85663 -0.30573 0.06362 0.33066 0.87049
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 6.2210 0.7362 8.450 2.94e-05 ***
## ‘Lluvia (pulgadas)‘ 0.6817 0.1046 6.518 0.000185 ***
## ---
## Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’ 0.1 ’ ’ 1
##
## Residual standard error: 0.6139 on 8 degrees of freedom
## Multiple R-squared: 0.8415, Adjusted R-squared: 0.8217
## F-statistic: 42.49 on 1 and 8 DF, p-value: 0.0001845
44
#Hacemos la predicción del precio para una superficie de 2000
predict(mylm,data.frame(`Lluvia (pulgadas)`=10))
## Warning: ’newdata’ had 1 row but variables found have 10 rows
## 1 2 3 4 5 6 7 8
## 10.652298 11.129510 11.334030 12.356629 11.879416 7.720848 9.629699 10.720471
## 9 10
## 11.334030 11.743069
boxplot(`Lluvia (pulgadas)`)
9
8
7
6
5
4
3
2
#Programamos el nivel de confianza para la predicción

predict(mylm,data.frame(`Lluvia (pulgadas)`=10),level=0.95,interval = "prediction")
## Warning: ’newdata’ had 1 row but variables found have 10 rows
## fit lwr upr

## 1 10.652298 9.166015 12.138581
## 2 11.129510 9.641585 12.617436
## 3 11.334030 9.839551 12.828509
## 4 12.356629 10.779215 13.934043
## 5 11.879416 10.350766 13.408066
45
## 6 7.720848 5.868931 9.572765
## 7 9.629699 8.083570 11.175828
## 8 10.720471 9.235127 12.205814
## 9 11.334030 9.839551 12.828509
## 10 11.743069 10.225188 13.260951
#Programamos la data frame (lluvia-cosecha)
resultado=data.frame(`Lluvia (pulgadas)`,`Cosecha (miles de bushells)`,mylm$fitted.values,round(`Lluvia

names(resultado)= c("Lluvia (pulgadas)","Cosecha (miles de bushells)","estimatted","difference")
#Escribimos el nombre del archivo "Resultado"
resultado
## Lluvia (pulgadas) Cosecha (miles de bushells) estimatted difference

## 1 6.5 11.0 10.652298 -4
## 2 7.2 12.0 11.129510 -4
## 3 7.5 10.5 11.334030 -4
## 4 9.0 11.5 12.356629 -3
## 5 8.3 12.5 11.879416 -4
## 6 2.2 7.5 7.720848 -6
## 7 5.0 9.5 9.629699 -5
## 8 6.6 11.0 10.720471 -4
## 9 7.5 11.0 11.334030 -4
## 10 8.1 12.0 11.743069 -4
#EJERCICIO 6
y1= read_excel("práctica de pronóstico - excel.xlsx", sheet= "Base de datos - Ejercicio 6")

y1
## # A tibble: 7 x 2
## t Yt
## <dbl> <dbl>
## 1 1 120
## 2 2 110
## 3 3 100
## 4 4 96
## 5 5 94
## 6 6 92
## 7 7 88

y1.ts=ts(y1[,2], start=c(1), frequency=1)
y1.ts
## Time Series:
## Start = 1
## End = 7
## Frequency = 1
## Yt
## [1,] 120
46
## [2,] 110
## [3,] 100
## [4,] 96
## [5,] 94
## [6,] 92
## [7,] 88
plot(y1.ts)
120
110
Yt
95 100
90
1 2 3 4 5 6 7
Time

adf.test(y1.ts,alternative = "stationary")
## Warning in adf.test(y1.ts, alternative = "stationary"): p-value smaller than printed##

p-value
##
##
## data: y1.ts
47

acf(y1.ts)
Yt
1.0
0.5
ACF
0.0
−0.5
0 1 2 3 4 5 6
Lag

pacf(y1.ts)
48
Series y1.ts
0.5
Partial ACF
0.0
−0.5
1 2 3 4 5 6
Lag

acf(ts(y1.ts,frequency = 1))
49
Yt
1.0
0.5
ACF
0.0
−0.5
0 1 2 3 4 5 6
Lag
pacf(ts(y1.ts,frequency=1))
50
Series ts(y1.ts, frequency = 1)
0.5
Partial ACF
0.0
−0.5
1 2 3 4 5 6
Lag

modelo1=arima(y1.ts, order=c(1,2,4))
modelo1
##
## Call:
## arima(x = y1.ts, order = c(1, 2, 4))
##
## Coefficients:
## ar1 ma1 ma2 ma3 ma4
## -0.2669 0.5790 -0.0404 -1.0391 -0.4980
## s.e. 4.4526 4.0995 3.5463 3.2825 6.1623
##
tsdiag(modelo1)
51
0.0
1 2 3 4 5 6 7
Time
ACF of Residuals
ACF
−0.5
0 1 2 3 4 5 6
Lag

1.0
p value
0.0
2 4 6 8 10
lag

##
## Box-Ljung test
##
plot(error)
52
4
3
error
2
1
0
1 2 3 4 5 6 7
Time

pronostico
## 8 83.63599 79.10573 88.16624
## 9 79.03509 67.81861 90.25157
## 10 73.73890 54.57154 92.90626
## 11 68.35220 42.36673 94.33767
## 12 62.98966 30.99252 94.98680
#Graficamos
plot(pronostico)
53
120
100
80
60
40
2 4 6 8 10 12

plot(pronostico, main="Pronóstico Yt", sub= "t", ylab= "Yt")
54
Pronóstico Yt
120
100
80
Yt
60
40
2 4 6 8 10 12
#EJERCICIO 7
R1 = read_excel("práctica de pronóstico - excel.xlsx", sheet= "Base de datos - Ejercicio 7 ")

R1
## tiempo Yt
## <dbl> <dbl>
## 1 1 82
## 2 2 60
## 3 3 44
## 4 4 35
## 5 5 30
## 6 6 29
## 7 7 35

R1.ts=ts(R1[,2], start=c(1), frequency=1)
R1.ts
## Time Series:
## Start = 1
## End = 7
## Frequency = 1
55
## Yt
## [1,] 82
## [2,] 60
## [3,] 44
## [4,] 35
## [5,] 30
## [6,] 29
## [7,] 35
plot(R1.ts)
80
70
60
Yt
50
40
30
1 2 3 4 5 6 7
Time

adf.test(R1.ts,alternative = "stationary")
##
##
## data: R1.ts

acf(R1.ts)
56
Yt
1.0
0.5
ACF
0.0
−0.5
0 1 2 3 4 5 6
Lag

pacf(R1.ts)
57
Series R1.ts
0.5
Partial ACF
0.0
−0.5
1 2 3 4 5 6
Lag

acf(ts(R1.ts,frequency = 1))
58
Yt
1.0
0.5
ACF
0.0
−0.5
0 1 2 3 4 5 6
Lag
pacf(ts(R1.ts,frequency=1))
59
Series ts(R1.ts, frequency = 1)
0.5
Partial ACF
0.0
−0.5
1 2 3 4 5 6
Lag

modelo1=arima(R1.ts, order=c(0,2,1))
modelo1
##
## Call:
## arima(x = R1.ts, order = c(0, 2, 1))
##
## Coefficients:
## ma1
## 1.0000
## s.e. 0.5295
##
tsdiag(modelo1)
60
0.0
1 2 3 4 5 6 7
Time
ACF of Residuals
ACF
−0.5
0 1 2 3 4 5 6
Lag

1.0
p value
0.0
2 4 6 8 10
lag

##
## Box-Ljung test
##
plot(error)
61
4
3
error
2
1
0
1 2 3 4 5 6 7
Time

pronostico
## 8 44.83339 37.8226363 51.84415
## 9 54.66679 33.4682482 75.86533
## 10 64.50018 25.2864637 103.71390
## 11 74.33358 13.9084391 134.75872
## 12 84.16697 -0.2537389 168.58768
#Graficamos
plot(pronostico)
62
150
100
50
0
2 4 6 8 10 12

plot(pronostico, main="Pronóstico Yt", sub= "t", ylab= "Yt")
63
Pronóstico Yt
150
100
Yt
50
0
2 4 6 8 10 12
#EJERCICIO 8
Costo = read_excel("práctica de pronóstico - excel.xlsx", sheet= "Base de datos - Ejercicio 8")

Costo
## AÑO ‘Costo Unitario ($)‘
## <dbl> <dbl>
## 1 1 20
## 2 2 24.5
## 3 3 28.2
## 4 4 27.5
## 5 5 26.6
## 6 6 30
## 7 7 31
## 8 8 36

Costo.ts=ts(Costo[,2], start=c(1), frequency=1)
Costo.ts
## Time Series:
## Start = 1
## End = 8
64
## Frequency = 1
## Costo Unitario ($)
## [1,] 20.0
## [2,] 24.5
## [3,] 28.2
## [4,] 27.5
## [5,] 26.6
## [6,] 30.0
## [7,] 31.0
## [8,] 36.0
plot(Costo.ts)
35
Costo Unitario ($)
30
25
20
1 2 3 4 5 6 7 8
Time
adf.test(Costo.ts,alternative = "stationary")
##
##
## data: Costo.ts
65
acf(Costo.ts)
Costo Unitario ($)

1.0
0.5
ACF
0.0
−0.5
0 1 2 3 4 5 6 7
Lag

pacf(Costo.ts)
66
Series Costo.ts
0.6
0.2
Partial ACF
−0.2
−0.6
1 2 3 4 5 6 7
Lag

acf(ts(Costo.ts,frequency = 1))
67
Costo Unitario ($)
1.0
0.5
ACF
0.0
−0.5
0 1 2 3 4 5 6 7
Lag
pacf(ts(Costo.ts,frequency=1))
68
Series ts(Costo.ts, frequency = 1)
0.6
0.2
Partial ACF
−0.2
−0.6
1 2 3 4 5 6 7
Lag

modelo1=arima(Costo.ts, order=c(0,2,3))
modelo1
##
## Call:
## arima(x = Costo.ts, order = c(0, 2, 3))
##
## Coefficients:
## ma1 ma2 ma3
## -0.7398 -0.1544 -0.1058
## s.e. 0.7067 0.7437 0.8437
##
tsdiag(modelo1)
69
−1.5
1 2 3 4 5 6 7 8
Time
ACF of Residuals
ACF
−0.5
0 1 2 3 4 5 6 7
Lag

1.0
p value
0.0
2 4 6 8 10
lag

##
## Box-Ljung test
##
plot(error)
70
3
2
1
−4 −3 −2 −1 0
error
1 2 3 4 5 6 7 8
Time

pronostico
## 9 39.04712 33.82825 44.26599
## 10 41.85812 33.00452 50.71173
## 11 44.38028 32.19195 56.56862
## 12 46.90245 31.72287 62.08203
## 13 49.42461 31.42521 67.42401
#Graficamos
plot(pronostico)
71
60
50
40
30
20
2 4 6 8 10 12

plot(pronostico, main="Pronóstico (Costo Unitario $)", sub= "Año", ylab= "Costo unitario $")
72
Pronóstico (Costo Unitario $)
60
Costo unitario $
50
40
30
20
2 4 6 8 10 12
Año
73

Práctica de Pronósticos Rmarkdown

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Práctica de Pronósticos Rmarkdown

Cargado por

Copyright:

Formatos disponibles

PRÁCTICA DE PRONÓSTICOS

#Instalamos los paquetes:

#Ejecutamos los paquetes

venta = read_excel("práctica de pronóstico - excel.xlsx", sheet= "Base de datos - ejercicio 1")

# Programos para que sea una serie de tiempo

2022.0 2022.2 2022.4 2022.6 2022.8

#Comprobamos si la serie es estacionaria

#Ahora determinaremos el número de media móviles para el modelo arima.

0.0 0.2 0.4 0.6 0.8

#Ahora determinaremos el número de autoregresiones para el modelo arima.

0.2 0.4 0.6 0.8

#Ahora programamos la coincidencia de rezago con la frecuencia :1

#Programos el modelo Arima

2022.0 2022.2 2022.4 2022.6 2022.8

0.0 0.2 0.4 0.6 0.8

p values for Ljung−Box statistic

#Verificamos el ajuste de los datos al modelo Arima

2022.0 2022.2 2022.4 2022.6 2022.8

#Realizamos el pronóstico con el paquete forecast:

2022.0 2022.2 2022.4 2022.6 2022.8 2023.0 2023.2

#Programos los nombres de los ejes y el título del gráfico.

2022.0 2022.2 2022.4 2022.6 2022.8 2023.0 2023.2

Demanda = read_excel("práctica de pronóstico - excel.xlsx", sheet= "Base de datos - ejercicio 2")

# Programos para que sea una serie de tiempo

#Comprobamos si la serie es estacional

## Warning in adf.test(Demanda.ts, alternative = "stationary"): p-value greater than

#Comprobamos si el modelo se volvió estacionario

## Warning in adf.test(demandas2, alternative = "stationary"): p-value smaller than##

#Ahora determinaremos el número de autoregresiones para el modelo arima.

#Ahora programamos la coincidencia de rezago con la frecuencia :1

#Programos el modelo Arima

p values for Ljung−Box statistic

#Verificamos el ajuste de los datos al modelo Arima

#Realizamos el pronóstico con el paquete forecast:

#Programos los nombres de los ejes y el título del gráfico.

Litros = read_excel("práctica de pronóstico - excel.xlsx", sheet= "Base de datos - ejercicio 3")

# Programos para que sea una serie de tiempo

## Qtr1 Qtr2 Qtr3 Qtr4

2022 2023 2024 2025 2026 2027

#Comprobamos si la serie es estacionaria

## Warning in adf.test(Litros.ts, alternative = "stationary"): p-value smaller than##

#Ahora determinaremos el número de media móviles para el modelo arima.

Venta en miles de litros

0.0 0.5 1.0 1.5 2.0 2.5 3.0

#Ahora determinaremos el número de autoregresiones para el modelo arima.

0.5 1.0 1.5 2.0 2.5 3.0

#Ahora programamos la coincidencia de rezago con la frecuencia :1

#Programos el modelo Arima

2022 2023 2024 2025 2026 2027

0.0 0.5 1.0 1.5 2.0 2.5 3.0

p values for Ljung−Box statistic

#Verificamos el ajuste de los datos al modelo Arima

2022 2023 2024 2025 2026 2027

#Realizamos el pronóstico con el paquete forecast:

2022 2024 2026 2028 2030

#Programos los nombres de los ejes y el título del gráfico.

2022 2024 2026 2028 2030

De = read_excel("práctica de pronóstico - excel.xlsx", sheet= "Base de datos - Ejercicio 4")

# Programos para que sea una serie de tiempo

## Qtr1 Qtr2 Qtr3 Qtr4

#Comprobamos si la serie es estacionaria

## Qtr1 Qtr2 Qtr3 Qtr4

#Comprobamos si el modelo se volvió estacionario

## Warning in adf.test(Demanda1, alternative = "stationary"): p-value smaller than##