Infrome

Trabajo Final
None
2023-08-29
Para realizar el taller evaluativo requiere de la siguiente base de datos: DataSet
Librerias
library(tseries)
library(astsa)
library(forecast)
library(foreign)
1. (sheet: Borracho) Juanito se traslada a su casa luego de salir del

Bar, se han recopilado una serie de sus pasos sucesivos registrando
la distancia entre cada uno de sus pasos durante su traslado. Se
requiere:
library(readxl)
DataSet <- read_excel("DataSet.xlsx", sheet = "Borracho")
a. Realizar el gráfico de la serie temporal.
Gra_Temp<- ts(DataSet$Yt)
plot(Gra_Temp, main= "Translado a Casa",

col.main= "#008B00", col = "#76EEC6", lwd= 3,
xlab = "Pasos", ylab = "Distancia")
1
Translado a Casa
10
8
Distancia
6
4
2
0
0 10 20 30 40
Pasos
b. Realizar la identificación de patrones a través de la función de autocorrelación

o correlograma y realice los contrastes respectivos (Ljung-Box). ¿estacionar-
iedad? ¿aleatorios? ¿estacionales?.
Autocorrelacion o Correlograma
autocorrelation <- acf(Gra_Temp, plot = FALSE)

p_value <- adf.test(Gra_Temp)$p.value
print(autocorrelation)
Autocorrelations of series ’Gra_Temp’, by lag
0 1 2 3 4 5 6 7 8 9 10
1.000 -0.191 -0.006 -0.145 0.104 -0.254 0.029 0.169 -0.027 -0.033 0.022
11 12 13 14 15 16
-0.040 0.062 -0.205 -0.002 0.010 0.105
print(p_value)
[1] 0.0245862
Estacionariedad
2
1. PlanteamientodeHipotesis:
H0 = St yt esnoestacionaria
H1 = St yt esestacionaria
2. Nivelde Significancia
Se establaceunvalorde α= 0.05
3. Tamano de la muestra y calculos estadisticos
adf.test(Gra_Temp, alternative = "stationary")
Augmented Dickey-Fuller Test
data: Gra_Temp
Dickey-Fuller = -3.8766, Lag order = 3, p-value = 0.02459
alternative hypothesis: stationary
4. Especificacion de las regiones de rechazo y no rechazo
p -value> α y no se rechaza H0
5. Decision estadistica
Puesto que p-value=0.02 < 0.05 Se rechaza H0 portanto la St original es Estacionaria
acf(Gra_Temp, 40)
3
Series Gra_Temp
0.2 0.4 0.6 0.8 1.0
ACF
−0.2
0 10 20 30 40
Lag
ndiffs(Gra_Temp)
[1] 0
Aleatoridad
No se tienen que hacer diferencias en la parte regular.
c. Realice el modelamiento de la serie y seleccione el método más adecuado y

justifique su elección con los criterios de información y las pruebas sobre los
errores, según corresponda.
Uso de la funcion autoarima
auto.arima(Gra_Temp,trace = T )
ARIMA(2,0,2) with non-zero mean : Inf

ARIMA(0,0,0) with non-zero mean : 198.8697
ARIMA(0,0,0) with zero mean : 250.6535
Best model: ARIMA(0,0,0) with non-zero mean
4
Series: Gra_Temp
ARIMA(0,0,0) with non-zero mean
Coefficients:
mean
4.6548
s.e. 0.4354
sigma^2 = 7.776: log likelihood = -97.27

AIC=198.55 AICc=198.87 BIC=201.92
Para contrastar lo antes indicado vamos a probar con 3 modelos tentativos (tomando en cuenta el modelo
adecuado por el software R) y comprobar de esta manera cual es el mejor modelo, ARIMA (p, d, q).
p=0 por lo tanto el modelo AR(0)
d=0 por lo tanto no hay diferencias para la estacionariedad
q=1 por lo tanto el modelo MA(1)
Comparacion de otros modelos
m1 <- arima(Gra_Temp, order =c(0,0,1))

Para determinar el mejor modelo se calculan los criterios de informacion de Akaike y bayesiano: AIC y BIC
respectivamente.
AIC(m1,m2,m3)
df AIC
m1 3 198.8198
m2 1 225.7019
m3 4 199.2939
BIC(m1,m2,m3)
df BIC
m1 3 203.8864
m2 1 227.3655
m3 4 206.0494
Efectivamente mediante el analisis de los criterios (coeficientes de bondad) AIC y BIC se estima que el mejor
modelo son los valores mas pequenos por tanto es el modelo m1.
mod_2 <- arima(Gra_Temp, order =c(0,0,1));mod_2
Call:
arima(x = Gra_Temp, order = c(0, 0, 1))
5
Coefficients:
ma1 intercept
-0.2282 4.6789
s.e. 0.1736 0.3314
sigma^2 estimated as 7.252: log likelihood = -96.41, aic = 198.82
par(mar=c(2,3,3,2))
tsdiag(mod_2)
Standardized Residuals
2
1
−1 0
0 10 20 30 40
ACF of Residuals
Time
1.0
0.4
ACF
−0.2
0 5 10 15
p values for Ljung−Box

Lag statistic
0.8
p value
0.4
0.0
2 4 6 8 10
Observamos que es un modelo es adecuado ,por los residuos

lag estandarisados se puede decir que tiene aleato-
riedad y mediante la funcion de autocorrelacion los residuos entonces se concluye que es estacionario por lo
cual mi grafica valor-p for Ljung-Box static se comprueba que hay independencia.
Prueba de Ljung-Box
Metodo analitico para comprobar que existe ruido blanco
1. Planteamiento de Hipotesis:
H0 = El modelo estimado tiene un buen ajuste

H1 = El modelo estimado no tiene un buen ajuste
2. Nivel de Significancia
6
Se establace un valor de α = 0.05
Box.test(residuals(mod_2), type = "Ljung-Box")
Box-Ljung test
data: residuals(mod_2)
X-squared = 0.0044267, df = 1, p-value = 0.947
p - value < α = y se rechaza H0
Puesto que p-value = 0.004 > 0.05 No se rechaza H0 por tanto se dice que si existe ruido blanco y el modelo
se ajusta bien. Ademas hay varianza constante y los errores no estan serialmente correlacionados.
res<- residuals(mod_2)
plot(res,type = "o", lty = "dashed", col = "#00FFFF", main = "Grafica Ruido
Blanco", col.main="#B8860B", ylab= "")
Grafica Ruido
Blanco
6
4
2
0
−2
−4
0 10 20 30 40
Time
7
d. Realice el pronóstico de la serie con máximo 5 periodos extramuestrales.
pr <- forecast(mod_2, level = (95), h=5);pr
Point Forecast Lo 95 Hi 95
41 5.466643 0.1885400 10.74475
42 4.678864 -0.7348706 10.09260
43 4.678864 -0.7348706 10.09260
44 4.678864 -0.7348706 10.09260
45 4.678864 -0.7348706 10.09260
plot(pr, main = "Pronosticos de ARIMA(0,0,1)",col="orange")
Pronosticos de ARIMA(0,0,1)
10
8
6
4
2
0
0 10 20 30 40
Pronostico <- rwf(y = Gra_Temp,h = 5,drift = TRUE,level = 0.95)

plot(Pronostico,main = "Pronostico de las distancias")
8
Pronostico de las distancias
20
10
0
−10
−20
0 10 20 30 40
tsdiag(mod_2)
9
−1 2
0 10 20 30 40
Time
ACF of Residuals
ACF
−0.2
0 5 10 15
Lag
p values for Ljung−Box statistic

0.0 1.0
p value
2 4 6 8 10
lag
2. (sheet: Holcim) El gerente comercial de Holcim debe pronosticar

los ingresos para el año 2021. Se requiere:
DataSetH <- read_excel("DataSet.xlsx", sheet = "Holcim")
Gra_Temp<- ts(DataSetH$Ingresos,frequency = 1)
plot(Gra_Temp, main= "Ingresos",

xlab = "Año", ylab = "Ingreso")
10
Ingresos
50000
Ingreso
30000
10000
0 10 20 30 40 50
Año

0 1 2 3 4 5 6 7 8 9 10
1.000 0.962 0.920 0.873 0.812 0.751 0.689 0.623 0.550 0.468 0.382
11 12 13 14 15 16
0.300 0.215 0.138 0.066 -0.004 -0.062
print(p_value)
[1] 0.9789883
Estacionariedad
H0 = St Ingresos esnoestacionaria
H1 = St Ingresos esestacionaria
11
Se establace un valorde α= 0.05
ndiffs(Gra_Temp)
[1] 2
dif<- diff(Gra_Temp,2)
Gra_Temp<- dif
data: Gra_Temp
Puesto que p-value=0.5865 > 0.05 se rechaza H0 portanto la St original es Estacionaria
acf(Gra_Temp, 10)
12
Series Gra_Temp
0.2 0.4 0.6 0.8 1.0
ACF
−0.2
0 2 4 6 8 10
Lag
Aleatoridad

auto.arima(Gra_Temp )
Series: Gra_Temp
ARIMA(2,1,1)
Coefficients:
ar1 ar2 ma1
-0.7907 -0.5253 0.9279
s.e. 0.1241 0.1200 0.0770
sigma^2 = 15277465: log likelihood = -455.01

AIC=918.02 AICc=918.97 BIC=925.42
13
d=1 por lo tanto hay 1 diferencias para la estacionariedad

respectivamente.
AIC(m1,m2,m3)
df AIC
m1 5 942.5103
m2 4 918.0198
m3 4 941.6688
BIC(m1,m2,m3)
df BIC
m1 5 951.8663
m2 4 925.4204
m3 4 949.1536
Call:
Coefficients:
ar1 ar2 ma1
-0.7907 -0.5253 0.9279
s.e. 0.1241 0.1200 0.0770
sigma^2 estimated as 14302308: log likelihood = -455.01, aic = 918.02
par(mar=c(2,3,3,2))
tsdiag(mod_2)
14
2
0
−4 −2 Standardized Residuals
10 20 30 40 50
ACF of Residuals
Time
1.0
ACF
0.4
−0.2
0 5 10 15

Lag statistic
0.8
p value
0.4
0.0
2 4 6 8 10

Prueba de Ljung-Box

Box-Ljung test
15
Puesto que p-value = 0.6648 > 0.5 no se rechaza H0 por tanto se dice que existe ruido blanco y el modelo
Grafica Ruido
Blanco
5000
0
−5000
−15000
10 20 30 40 50
Time
51 -10785.16 -18197.86 -3372.4533
52 -11968.31 -23193.39 -743.2253
53 -11177.76 -23006.76 651.2495
54 -11181.25 -24881.54 2519.0402
55 -11593.80 -26917.94 3730.3423
16
10000
0
−20000
10 20 30 40 50

plot(Pronostico,main = "Pronostico de las Ganancias")
17
Pronostico de las Ganancias
10000
0
−10000
−30000
10 20 30 40 50
3. (sheet: Pajaros) Nat.Geo lleva registros de la cantidad de pájaros

que visitan la ciudad de Quito. Se requiere:
library(readxl)
DataSetN <- read_excel("DataSet.xlsx", sheet = "NatGeo")
Gra_Temp<- ts(DataSetN$Aves,frequency = 4)
plot(Gra_Temp, main= "Aves",

xlab = "Año", ylab = "Aves Quito")
18
Aves
450
350
Aves Quito
250
150
2 4 6 8 10 12 14
Año

0.00 0.25 0.50 0.75 1.00 1.25 1.50 1.75 2.00 2.25 2.50
1.000 0.393 0.154 0.293 0.743 0.150 -0.153 -0.047 0.346 -0.183 -0.435
2.75 3.00 3.25 3.50 3.75 4.00 4.25
-0.315 0.091 -0.352 -0.519 -0.374 0.042 -0.290
print(p_value)
[1] 0.9202153
Estacionariedad
19
data: Gra_Temp
ndiffs(Gra_Temp)
[1] 0
nsdiffs(Gra_Temp)
[1] 1
diff(Gra_Temp,lag=4)
Qtr1 Qtr2 Qtr3 Qtr4

2 -8 -30 -13 10
3 1 24 38 27
4 28 77 95 118
5 91 79 71 75
6 5 1 -53 -94
7 -32 -93 -101 -93
8 -27 -75 -25 -34
9 -12 29 7 57
10 -15 11 3 -29
11 12 -11 23 19
12 52 55 11 33
13 -10 -33 -39 -57
Puesto que p-value=0.1855 > 0.05 no e rechaza H0 portanto la St original es Estacionaria
20
acf(Gra_Temp, 10)
Series Gra_Temp
0.8
0.4
ACF
0.0
−0.4
0.0 0.5 1.0 1.5 2.0 2.5
Lag
Aleatoridad

Series: Gra_Temp
ARIMA(2,0,0)(0,1,0)[4]
Coefficients:
ar1 ar2
0.5694 0.2625
s.e. 0.1376 0.1385

AIC=472.57 AICc=473.12 BIC=478.19
21
Regular
Estacional
P= 0 por lo tanto el modelo
D=1 por lo tanto hay diferencias para la estacional
Q=0 por lo tanto el modelo
m1 <- arima(Gra_Temp, order =c(0,0,1),seasonal = c(1,0,0))

respectivamente.
AIC(m1,m2,m3)
df AIC
m1 4 540.0155
m2 3 472.5730
m3 3 474.0760
BIC(m1,m2,m3)
df BIC
m1 4 547.8205
m2 3 478.1866
m3 3 479.6896
mod_2 <- arima(Gra_Temp, order =c(2,0,0),seasonal = c(0,1,0));mod_2
Call:
arima(x = Gra_Temp, order = c(2, 0, 0), seasonal = c(0, 1, 0))
Coefficients:
ar1 ar2
0.5694 0.2625
s.e. 0.1376 0.1385
sigma^2 estimated as 953.9: log likelihood = -233.29, aic = 472.57
22
par(mar=c(2,3,3,2))
tsdiag(mod_2)
1
0
−2
2 4 6 8 10 12 14
ACF of Residuals
Time
0.8
ACF
0.2
−0.4
0 1 2 3 4

Lag statistic
0.8
p value
0.4
0.0
2 4 6 8 10

Prueba de Ljung-Box

23
Box-Ljung test
Grafica Ruido
Blanco
40
20
0
−20
−60
2 4 6 8 10 12 14
Time
24
14 Q1 190.3087 129.77535 250.8420
14 Q2 246.7305 177.07309 316.3880
14 Q3 257.4348 179.24681 335.6229
14 Q4 252.5809 169.09471 336.0671
15 Q1 164.7476 44.51631 284.9789
plot(pr, main = "Pronosticos de ARIMA(2,0,0)(0,1,0",col="orange")
Pronosticos de ARIMA(2,0,0)(0,1,0
400
300
200
100
2 4 6 8 10 12 14

plot(Pronostico,main = "Pronostico de las Avs")
25
Pronostico de las Avs
600
400
200
0
2 4 6 8 10 12 14
4. (sheet: Flores) Gaby’s Flowers lleva registros de sus ventas (en

miles) desde el año 2009. Se requiere:
library(readxl)
DataSetF <- read_excel("DataSet.xlsx", sheet = "Flores")
Gra_Temp<- ts(DataSetF$Flores,frequency = 12)
plot(Gra_Temp, main= "Ganancia",

xlab = "Año", ylab = "Flores")
26
Ganancia
200
Flores
150
100
2 4 6 8 10 12 14
Año

0.0000 0.0833 0.1667 0.2500 0.3333 0.4167 0.5000 0.5833 0.6667 0.7500 0.8333
1.000 0.818 0.754 0.763 0.760 0.750 0.730 0.714 0.687 0.653 0.604
0.9167 1.0000 1.0833 1.1667 1.2500 1.3333 1.4167 1.5000 1.5833 1.6667 1.7500
0.636 0.771 0.605 0.549 0.554 0.550 0.543 0.522 0.508 0.486 0.451
print(p_value)
[1] 0.01099335
Estacionariedad
27
data: Gra_Temp
ndiffs(Gra_Temp)
[1] 1
nsdiffs(Gra_Temp)
[1] 1
dife<- diff(Gra_Temp)
Gra_Temp<-dife
data: Gra_Temp
Puesto que p-value=0.1855 > 0.05 no e rechaza H0 portanto la St original es Estacionaria
acf(Gra_Temp, 10)
28
Series Gra_Temp
0.8
0.4
ACF
0.0
−0.4
0.0 0.2 0.4 0.6 0.8
Lag
Aleatoridad

Series: Gra_Temp
ARIMA(0,0,1)(0,1,2)[12]
Coefficients:
ma1 sma1 sma2
-0.7438 -0.366 -0.1052
s.e. 0.0529 0.084 0.0698

AIC=772.06 AICc=772.35 BIC=783.92
Regular
29
Estacional
P=0 por lo tanto el modelo
D=1 por lo tanto hay 1 diferencias para la estacional
Q=2 por lo tanto el modelo

respectivamente.
AIC(m1,m2,m3)
df AIC
m1 3 775.3317
m2 4 772.0649
m3 3 784.2032
BIC(m1,m2,m3)
df BIC
m1 3 784.2203
m2 4 783.9163
m3 3 793.0917
Call:
Coefficients:
ma1 intercept
-0.9491 0.6855
s.e. 0.0313 0.0643
30
par(mar=c(2,3,3,2))
tsdiag(mod_2)
2
0
−2
2 4 6 8 10 12 14
ACF of Residuals
Time
1.0
ACF
0.4
−0.2
0.0 0.5 1.0 1.5

Lag statistic
0.8
p value
0.4
0.0
2 4 6 8 10

Prueba de Ljung-Box

31
Box-Ljung test
Grafica Ruido
Blanco
40
20
0
−20
2 4 6 8 10 12 14
Time
32
Jan 14 -38.1823530 -63.35673 -13.00798
Feb 14 0.6855188 -34.02264 35.39368
Mar 14 0.6855188 -34.02264 35.39368
Apr 14 0.6855188 -34.02264 35.39368
May 14 0.6855188 -34.02264 35.39368
plot(pr, main = "Pronosticos de SARIMA)",col="orange")
Pronosticos de SARIMA)
40
20
0
−20
−40
−60
2 4 6 8 10 12 14

33
150
100
50
0
−50
2 4 6 8 10 12 14
5. Seleccione su propia serie temporal y realice un análisis completo

del modelamiento.
DataSetI <- read_excel("DataSet.xlsx", sheet = "Invento")
Gra_Temp<- ts(DataSetI$Zapatos,frequency = 1)
plot(Gra_Temp, main= "Ingresos",

xlab = "Año", ylab = "Ingreso")
34
Ingresos
200
180
160
Ingreso
140
120
100
5 10 15
Año

0 1 2 3 4 5 6 7 8 9 10
1.000 0.310 -0.204 0.121 0.191 -0.027 -0.042 0.007 -0.068 0.018 0.103
11 12
-0.065 -0.206
print(p_value)
[1] 0.4362701
Estacionariedad
35
ndiffs(Gra_Temp)
[1] 1
dif<- diff(Gra_Temp,1)
Gra_Temp<- dif
data: Gra_Temp
Puesto que p-value=0.5865 > 0.05 se rechaza H0 portanto la St original es Estacionaria
acf(Gra_Temp, 10)
36
Series Gra_Temp
1.0
0.5
ACF
0.0
−0.5
0 2 4 6 8 10
Lag
Aleatoridad

auto.arima(Gra_Temp,trace = T )

ARIMA(0,0,0) with zero mean : 166.1023
Best model: ARIMA(0,0,0) with zero mean
Series: Gra_Temp
ARIMA(0,0,0) with zero mean

AIC=165.84 AICc=166.1 BIC=166.67
37
d=0 por lo tanto hay 1 diferencias para la estacionariedad

respectivamente.
AIC(m1,m2,m3)
df AIC
m1 3 165.0643
m2 2 167.3667
m3 4 166.2634
BIC(m1,m2,m3)
df BIC
m1 3 167.5639
m2 2 169.0332
m3 4 169.5963
Call:
Coefficients:
intercept
4.9412
s.e. 7.1661
par(mar=c(2,3,3,2))
tsdiag(mod_2)
38
0 1 2 3
−2 Standardized Residuals
5 10 15
ACF of Residuals
Time
0.5 1.0
ACF
−0.5
0 2 4 6 8 10 12

Lag statistic
0.8
p value
0.4
0.0
2 4 6 8 10

Prueba de Ljung-Box

Box-Ljung test
39
Puesto que p-value = 0.6648 > 0.5 no se rechaza H0 por tanto se dice que existe ruido blanco y el modelo
Grafica Ruido
Blanco
50
0
−50
5 10 15
Time
19 4.941176 -52.96893 62.85128
20 4.941176 -52.96893 62.85128
21 4.941176 -52.96893 62.85128
22 4.941176 -52.96893 62.85128
23 4.941176 -52.96893 62.85128
40
100
50
0
−50
5 10 15 20

41
200
100
0
−200
5 10 15 20
42

Infrome

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Infrome

Cargado por

Copyright:

Formatos disponibles

Trabajo Final

Para realizar el taller evaluativo requiere de la siguiente base de datos: DataSet

1. (sheet: Borracho) Juanito se traslada a su casa luego de salir del

a. Realizar el gráfico de la serie temporal.

plot(Gra_Temp, main= "Translado a Casa",

b. Realizar la identificación de patrones a través de la función de autocorrelación

autocorrelation <- acf(Gra_Temp, plot = FALSE)

Autocorrelations of series ’Gra_Temp’, by lag

3. Tamano de la muestra y calculos estadisticos

adf.test(Gra_Temp, alternative = "stationary")

Augmented Dickey-Fuller Test

4. Especificacion de las regiones de rechazo y no rechazo

Puesto que p-value=0.02 < 0.05 Se rechaza H0 portanto la St original es Estacionaria

c. Realice el modelamiento de la serie y seleccione el método más adecuado y

Uso de la funcion autoarima

ARIMA(2,0,2) with non-zero mean : Inf

Best model: ARIMA(0,0,0) with non-zero mean

sigma^2 = 7.776: log likelihood = -97.27

Comparacion de otros modelos

m1 <- arima(Gra_Temp, order =c(0,0,1))

mod_2 <- arima(Gra_Temp, order =c(0,0,1));mod_2

sigma^2 estimated as 7.252: log likelihood = -96.41, aic = 198.82

p values for Ljung−Box

Observamos que es un modelo es adecuado ,por los residuos

Metodo analitico para comprobar que existe ruido blanco

H0 = El modelo estimado tiene un buen ajuste

3. Tamano de la muestra y calculos estadisticos

Box.test(residuals(mod_2), type = "Ljung-Box")

4. Especificacion de las regiones de rechazo y no rechazo

p - value < α = y se rechaza H0

pr <- forecast(mod_2, level = (95), h=5);pr

plot(pr, main = "Pronosticos de ARIMA(0,0,1)",col="orange")

Pronostico <- rwf(y = Gra_Temp,h = 5,drift = TRUE,level = 0.95)

p values for Ljung−Box statistic

2. (sheet: Holcim) El gerente comercial de Holcim debe pronosticar

DataSetH <- read_excel("DataSet.xlsx", sheet = "Holcim")

a. Realizar el gráfico de la serie temporal.

plot(Gra_Temp, main= "Ingresos",

autocorrelation <- acf(Gra_Temp, plot = FALSE)

Autocorrelations of series ’Gra_Temp’, by lag

Se establace un valorde α= 0.05

3. Tamano de la muestra y calculos estadisticos

Augmented Dickey-Fuller Test

4. Especificacion de las regiones de rechazo y no rechazo

Puesto que p-value=0.5865 > 0.05 se rechaza H0 portanto la St original es Estacionaria

c. Realice el modelamiento de la serie y seleccione el método más adecuado y

Uso de la funcion autoarima

sigma^2 = 15277465: log likelihood = -455.01

Comparacion de otros modelos

m1 <- arima(Gra_Temp, order =c(2,0,1))

mod_2 <- arima(Gra_Temp, order =c(2,1,1));mod_2

sigma^2 estimated as 14302308: log likelihood = -455.01, aic = 918.02

p values for Ljung−Box

Observamos que es un modelo es adecuado ,por los residuos

Metodo analitico para comprobar que existe ruido blanco

H0 = El modelo estimado tiene un buen ajuste

Se establace un valor de α = 0.05

3. Tamano de la muestra y calculos estadisticos

Box.test(residuals(mod_2), type = "Ljung-Box")

p - value < α = y se rechaza H0

d. Realice el pronóstico de la serie con máximo 5 periodos extramuestrales.

pr <- forecast(mod_2, level = (95), h=5);pr

Pronostico <- rwf(y = Gra_Temp,h = 5,drift = TRUE,level = 0.95)