Está en la página 1de 42

Trabajo Final

None

2023-08-29

Para realizar el taller evaluativo requiere de la siguiente base de datos: DataSet

Librerias

library(tseries)
library(astsa)
library(forecast)
library(foreign)

1. (sheet: Borracho) Juanito se traslada a su casa luego de salir del


Bar, se han recopilado una serie de sus pasos sucesivos registrando
la distancia entre cada uno de sus pasos durante su traslado. Se
requiere:

library(readxl)
DataSet <- read_excel("DataSet.xlsx", sheet = "Borracho")

a. Realizar el gráfico de la serie temporal.

Gra_Temp<- ts(DataSet$Yt)

plot(Gra_Temp, main= "Translado a Casa",


col.main= "#008B00", col = "#76EEC6", lwd= 3,
xlab = "Pasos", ylab = "Distancia")

1
Translado a Casa
10
8
Distancia

6
4
2
0

0 10 20 30 40

Pasos

b. Realizar la identificación de patrones a través de la función de autocorrelación


o correlograma y realice los contrastes respectivos (Ljung-Box). ¿estacionar-
iedad? ¿aleatorios? ¿estacionales?.

Autocorrelacion o Correlograma

autocorrelation <- acf(Gra_Temp, plot = FALSE)


p_value <- adf.test(Gra_Temp)$p.value

print(autocorrelation)

Autocorrelations of series ’Gra_Temp’, by lag

0 1 2 3 4 5 6 7 8 9 10
1.000 -0.191 -0.006 -0.145 0.104 -0.254 0.029 0.169 -0.027 -0.033 0.022
11 12 13 14 15 16
-0.040 0.062 -0.205 -0.002 0.010 0.105

print(p_value)

[1] 0.0245862

Estacionariedad

2
1. PlanteamientodeHipotesis:

H0 = St yt esnoestacionaria
H1 = St yt esestacionaria

2. Nivelde Significancia

Se establaceunvalorde α= 0.05

3. Tamano de la muestra y calculos estadisticos

adf.test(Gra_Temp, alternative = "stationary")

Augmented Dickey-Fuller Test

data: Gra_Temp
Dickey-Fuller = -3.8766, Lag order = 3, p-value = 0.02459
alternative hypothesis: stationary

4. Especificacion de las regiones de rechazo y no rechazo

p -value> α y no se rechaza H0

5. Decision estadistica

Puesto que p-value=0.02 < 0.05 Se rechaza H0 portanto la St original es Estacionaria

acf(Gra_Temp, 40)

3
Series Gra_Temp
0.2 0.4 0.6 0.8 1.0
ACF

−0.2

0 10 20 30 40

Lag

ndiffs(Gra_Temp)

[1] 0

Aleatoridad
No se tienen que hacer diferencias en la parte regular.

c. Realice el modelamiento de la serie y seleccione el método más adecuado y


justifique su elección con los criterios de información y las pruebas sobre los
errores, según corresponda.

Uso de la funcion autoarima

auto.arima(Gra_Temp,trace = T )

ARIMA(2,0,2) with non-zero mean : Inf


ARIMA(0,0,0) with non-zero mean : 198.8697
ARIMA(1,0,0) with non-zero mean : 199.6804
ARIMA(0,0,1) with non-zero mean : 199.4865
ARIMA(0,0,0) with zero mean : 250.6535
ARIMA(1,0,1) with non-zero mean : Inf

Best model: ARIMA(0,0,0) with non-zero mean

4
Series: Gra_Temp
ARIMA(0,0,0) with non-zero mean

Coefficients:
mean
4.6548
s.e. 0.4354

sigma^2 = 7.776: log likelihood = -97.27


AIC=198.55 AICc=198.87 BIC=201.92

Para contrastar lo antes indicado vamos a probar con 3 modelos tentativos (tomando en cuenta el modelo
adecuado por el software R) y comprobar de esta manera cual es el mejor modelo, ARIMA (p, d, q).
p=0 por lo tanto el modelo AR(0)
d=0 por lo tanto no hay diferencias para la estacionariedad
q=1 por lo tanto el modelo MA(1)

Comparacion de otros modelos

m1 <- arima(Gra_Temp, order =c(0,0,1))


m2 <- arima(Gra_Temp, order =c(0,1,0))
m3 <- arima(Gra_Temp, order =c(1,0,1))

Para determinar el mejor modelo se calculan los criterios de informacion de Akaike y bayesiano: AIC y BIC
respectivamente.

AIC(m1,m2,m3)

df AIC
m1 3 198.8198
m2 1 225.7019
m3 4 199.2939

BIC(m1,m2,m3)

df BIC
m1 3 203.8864
m2 1 227.3655
m3 4 206.0494

Efectivamente mediante el analisis de los criterios (coeficientes de bondad) AIC y BIC se estima que el mejor
modelo son los valores mas pequenos por tanto es el modelo m1.

mod_2 <- arima(Gra_Temp, order =c(0,0,1));mod_2

Call:
arima(x = Gra_Temp, order = c(0, 0, 1))

5
Coefficients:
ma1 intercept
-0.2282 4.6789
s.e. 0.1736 0.3314

sigma^2 estimated as 7.252: log likelihood = -96.41, aic = 198.82

par(mar=c(2,3,3,2))
tsdiag(mod_2)

Standardized Residuals
2
1
−1 0

0 10 20 30 40
ACF of Residuals
Time
1.0
0.4
ACF

−0.2

0 5 10 15

p values for Ljung−Box


Lag statistic
0.8
p value

0.4
0.0

2 4 6 8 10

Observamos que es un modelo es adecuado ,por los residuos


lag estandarisados se puede decir que tiene aleato-
riedad y mediante la funcion de autocorrelacion los residuos entonces se concluye que es estacionario por lo
cual mi grafica valor-p for Ljung-Box static se comprueba que hay independencia.

Prueba de Ljung-Box

Metodo analitico para comprobar que existe ruido blanco

1. Planteamiento de Hipotesis:

H0 = El modelo estimado tiene un buen ajuste


H1 = El modelo estimado no tiene un buen ajuste

2. Nivel de Significancia

6
Se establace un valor de α = 0.05

3. Tamano de la muestra y calculos estadisticos

Box.test(residuals(mod_2), type = "Ljung-Box")

Box-Ljung test

data: residuals(mod_2)
X-squared = 0.0044267, df = 1, p-value = 0.947

4. Especificacion de las regiones de rechazo y no rechazo

p - value < α = y se rechaza H0

5. Decision estadistica

Puesto que p-value = 0.004 > 0.05 No se rechaza H0 por tanto se dice que si existe ruido blanco y el modelo
se ajusta bien. Ademas hay varianza constante y los errores no estan serialmente correlacionados.

res<- residuals(mod_2)
plot(res,type = "o", lty = "dashed", col = "#00FFFF", main = "Grafica Ruido
Blanco", col.main="#B8860B", ylab= "")

Grafica Ruido
Blanco
6
4
2
0
−2
−4

0 10 20 30 40

Time

7
d. Realice el pronóstico de la serie con máximo 5 periodos extramuestrales.

pr <- forecast(mod_2, level = (95), h=5);pr

Point Forecast Lo 95 Hi 95
41 5.466643 0.1885400 10.74475
42 4.678864 -0.7348706 10.09260
43 4.678864 -0.7348706 10.09260
44 4.678864 -0.7348706 10.09260
45 4.678864 -0.7348706 10.09260

plot(pr, main = "Pronosticos de ARIMA(0,0,1)",col="orange")

Pronosticos de ARIMA(0,0,1)
10
8
6
4
2
0

0 10 20 30 40

Pronostico <- rwf(y = Gra_Temp,h = 5,drift = TRUE,level = 0.95)


plot(Pronostico,main = "Pronostico de las distancias")

8
Pronostico de las distancias
20
10
0
−10
−20

0 10 20 30 40

tsdiag(mod_2)

9
−1 2
Standardized Residuals

0 10 20 30 40

Time

ACF of Residuals
ACF

−0.2

0 5 10 15

Lag

p values for Ljung−Box statistic


0.0 1.0
p value

2 4 6 8 10

lag

2. (sheet: Holcim) El gerente comercial de Holcim debe pronosticar


los ingresos para el año 2021. Se requiere:

DataSetH <- read_excel("DataSet.xlsx", sheet = "Holcim")

a. Realizar el gráfico de la serie temporal.

Gra_Temp<- ts(DataSetH$Ingresos,frequency = 1)

plot(Gra_Temp, main= "Ingresos",


col.main= "#008B00", col = "#76EEC6", lwd= 3,
xlab = "Año", ylab = "Ingreso")

10
Ingresos
50000
Ingreso

30000
10000

0 10 20 30 40 50

Año

Autocorrelacion o Correlograma

autocorrelation <- acf(Gra_Temp, plot = FALSE)


p_value <- adf.test(Gra_Temp)$p.value

print(autocorrelation)

Autocorrelations of series ’Gra_Temp’, by lag

0 1 2 3 4 5 6 7 8 9 10
1.000 0.962 0.920 0.873 0.812 0.751 0.689 0.623 0.550 0.468 0.382
11 12 13 14 15 16
0.300 0.215 0.138 0.066 -0.004 -0.062

print(p_value)

[1] 0.9789883

Estacionariedad

1. PlanteamientodeHipotesis:

H0 = St Ingresos esnoestacionaria
H1 = St Ingresos esestacionaria

11
2. Nivelde Significancia

Se establace un valorde α= 0.05

3. Tamano de la muestra y calculos estadisticos

ndiffs(Gra_Temp)

[1] 2

dif<- diff(Gra_Temp,2)
Gra_Temp<- dif
adf.test(Gra_Temp, alternative = "stationary")

Augmented Dickey-Fuller Test

data: Gra_Temp
Dickey-Fuller = -1.969, Lag order = 3, p-value = 0.5865
alternative hypothesis: stationary

4. Especificacion de las regiones de rechazo y no rechazo

p -value> α y no se rechaza H0

5. Decision estadistica

Puesto que p-value=0.5865 > 0.05 se rechaza H0 portanto la St original es Estacionaria

acf(Gra_Temp, 10)

12
Series Gra_Temp
0.2 0.4 0.6 0.8 1.0
ACF

−0.2

0 2 4 6 8 10

Lag

Aleatoridad

c. Realice el modelamiento de la serie y seleccione el método más adecuado y


justifique su elección con los criterios de información y las pruebas sobre los
errores, según corresponda.

Uso de la funcion autoarima

auto.arima(Gra_Temp )

Series: Gra_Temp
ARIMA(2,1,1)

Coefficients:
ar1 ar2 ma1
-0.7907 -0.5253 0.9279
s.e. 0.1241 0.1200 0.0770

sigma^2 = 15277465: log likelihood = -455.01


AIC=918.02 AICc=918.97 BIC=925.42

Para contrastar lo antes indicado vamos a probar con 3 modelos tentativos (tomando en cuenta el modelo
adecuado por el software R) y comprobar de esta manera cual es el mejor modelo, ARIMA (p, d, q).
p=2 por lo tanto el modelo AR(1)

13
d=1 por lo tanto hay 1 diferencias para la estacionariedad
q=1 por lo tanto el modelo MA(1)

Comparacion de otros modelos

m1 <- arima(Gra_Temp, order =c(2,0,1))


m2 <- arima(Gra_Temp, order =c(2,1,1))
m3 <- arima(Gra_Temp, order =c(1,0,1))

Para determinar el mejor modelo se calculan los criterios de informacion de Akaike y bayesiano: AIC y BIC
respectivamente.

AIC(m1,m2,m3)

df AIC
m1 5 942.5103
m2 4 918.0198
m3 4 941.6688

BIC(m1,m2,m3)

df BIC
m1 5 951.8663
m2 4 925.4204
m3 4 949.1536

Efectivamente mediante el analisis de los criterios (coeficientes de bondad) AIC y BIC se estima que el mejor
modelo son los valores mas pequenos por tanto es el modelo m1.

mod_2 <- arima(Gra_Temp, order =c(2,1,1));mod_2

Call:
arima(x = Gra_Temp, order = c(2, 1, 1))

Coefficients:
ar1 ar2 ma1
-0.7907 -0.5253 0.9279
s.e. 0.1241 0.1200 0.0770

sigma^2 estimated as 14302308: log likelihood = -455.01, aic = 918.02

par(mar=c(2,3,3,2))
tsdiag(mod_2)

14
2
0
−4 −2 Standardized Residuals

10 20 30 40 50
ACF of Residuals
Time
1.0
ACF

0.4
−0.2

0 5 10 15

p values for Ljung−Box


Lag statistic
0.8
p value

0.4
0.0

2 4 6 8 10

Observamos que es un modelo es adecuado ,por los residuos


lag estandarisados se puede decir que tiene aleato-
riedad y mediante la funcion de autocorrelacion los residuos entonces se concluye que es estacionario por lo
cual mi grafica valor-p for Ljung-Box static se comprueba que hay independencia.

Prueba de Ljung-Box

Metodo analitico para comprobar que existe ruido blanco

1. Planteamiento de Hipotesis:

H0 = El modelo estimado tiene un buen ajuste


H1 = El modelo estimado no tiene un buen ajuste

2. Nivel de Significancia

Se establace un valor de α = 0.05

3. Tamano de la muestra y calculos estadisticos

Box.test(residuals(mod_2), type = "Ljung-Box")

Box-Ljung test

data: residuals(mod_2)
X-squared = 0.1877, df = 1, p-value = 0.6648

15
4. Especificacion de las regiones de rechazo y no rechazo

p - value < α = y se rechaza H0

5. Decision estadistica

Puesto que p-value = 0.6648 > 0.5 no se rechaza H0 por tanto se dice que existe ruido blanco y el modelo
se ajusta bien. Ademas hay varianza constante y los errores no estan serialmente correlacionados.

res<- residuals(mod_2)
plot(res,type = "o", lty = "dashed", col = "#00FFFF", main = "Grafica Ruido
Blanco", col.main="#B8860B", ylab= "")

Grafica Ruido
Blanco
5000
0
−5000
−15000

10 20 30 40 50

Time

d. Realice el pronóstico de la serie con máximo 5 periodos extramuestrales.

pr <- forecast(mod_2, level = (95), h=5);pr

Point Forecast Lo 95 Hi 95
51 -10785.16 -18197.86 -3372.4533
52 -11968.31 -23193.39 -743.2253
53 -11177.76 -23006.76 651.2495
54 -11181.25 -24881.54 2519.0402
55 -11593.80 -26917.94 3730.3423

16
plot(pr, main = "Pronosticos de ARIMA(2,1,1)",col="orange")

Pronosticos de ARIMA(2,1,1)
10000
0
−20000

10 20 30 40 50

Pronostico <- rwf(y = Gra_Temp,h = 5,drift = TRUE,level = 0.95)


plot(Pronostico,main = "Pronostico de las Ganancias")

17
Pronostico de las Ganancias
10000
0
−10000
−30000

10 20 30 40 50

3. (sheet: Pajaros) Nat.Geo lleva registros de la cantidad de pájaros


que visitan la ciudad de Quito. Se requiere:

library(readxl)
DataSetN <- read_excel("DataSet.xlsx", sheet = "NatGeo")

a. Realizar el gráfico de la serie temporal.

Gra_Temp<- ts(DataSetN$Aves,frequency = 4)

plot(Gra_Temp, main= "Aves",


col.main= "#008B00", col = "#76EEC6", lwd= 3,
xlab = "Año", ylab = "Aves Quito")

18
Aves
450
350
Aves Quito

250
150

2 4 6 8 10 12 14

Año

Autocorrelacion o Correlograma

autocorrelation <- acf(Gra_Temp, plot = FALSE)


p_value <- adf.test(Gra_Temp)$p.value

print(autocorrelation)

Autocorrelations of series ’Gra_Temp’, by lag

0.00 0.25 0.50 0.75 1.00 1.25 1.50 1.75 2.00 2.25 2.50
1.000 0.393 0.154 0.293 0.743 0.150 -0.153 -0.047 0.346 -0.183 -0.435
2.75 3.00 3.25 3.50 3.75 4.00 4.25
-0.315 0.091 -0.352 -0.519 -0.374 0.042 -0.290

print(p_value)

[1] 0.9202153

Estacionariedad

1. PlanteamientodeHipotesis:

H0 = St Ingresos esnoestacionaria
H1 = St Ingresos esestacionaria

19
2. Nivelde Significancia

Se establace un valorde α= 0.05

3. Tamano de la muestra y calculos estadisticos

adf.test(Gra_Temp, alternative = "stationary")

Augmented Dickey-Fuller Test

data: Gra_Temp
Dickey-Fuller = -1.0612, Lag order = 3, p-value = 0.9202
alternative hypothesis: stationary

ndiffs(Gra_Temp)

[1] 0

nsdiffs(Gra_Temp)

[1] 1

diff(Gra_Temp,lag=4)

Qtr1 Qtr2 Qtr3 Qtr4


2 -8 -30 -13 10
3 1 24 38 27
4 28 77 95 118
5 91 79 71 75
6 5 1 -53 -94
7 -32 -93 -101 -93
8 -27 -75 -25 -34
9 -12 29 7 57
10 -15 11 3 -29
11 12 -11 23 19
12 52 55 11 33
13 -10 -33 -39 -57

4. Especificacion de las regiones de rechazo y no rechazo

p -value> α y no se rechaza H0

5. Decision estadistica

Puesto que p-value=0.1855 > 0.05 no e rechaza H0 portanto la St original es Estacionaria

20
acf(Gra_Temp, 10)

Series Gra_Temp
0.8
0.4
ACF

0.0
−0.4

0.0 0.5 1.0 1.5 2.0 2.5

Lag

Aleatoridad

c. Realice el modelamiento de la serie y seleccione el método más adecuado y


justifique su elección con los criterios de información y las pruebas sobre los
errores, según corresponda.

Uso de la funcion autoarima

auto.arima(Gra_Temp )

Series: Gra_Temp
ARIMA(2,0,0)(0,1,0)[4]

Coefficients:
ar1 ar2
0.5694 0.2625
s.e. 0.1376 0.1385

sigma^2 = 995.4: log likelihood = -233.29


AIC=472.57 AICc=473.12 BIC=478.19

21
Para contrastar lo antes indicado vamos a probar con 3 modelos tentativos (tomando en cuenta el modelo
adecuado por el software R) y comprobar de esta manera cual es el mejor modelo, ARIMA (p, d, q).
Regular
p=2 por lo tanto el modelo AR(0)
d=0 por lo tanto no hay diferencias para la estacionariedad
q=0 por lo tanto el modelo MA(0)

Comparacion de otros modelos

Estacional
P= 0 por lo tanto el modelo
D=1 por lo tanto hay diferencias para la estacional
Q=0 por lo tanto el modelo

m1 <- arima(Gra_Temp, order =c(0,0,1),seasonal = c(1,0,0))


m2 <- arima(Gra_Temp, order =c(2,0,0),seasonal = c(0,1,0))
m3 <- arima(Gra_Temp, order =c(1,0,1),seasonal = c(0,1,0))

Para determinar el mejor modelo se calculan los criterios de informacion de Akaike y bayesiano: AIC y BIC
respectivamente.

AIC(m1,m2,m3)

df AIC
m1 4 540.0155
m2 3 472.5730
m3 3 474.0760

BIC(m1,m2,m3)

df BIC
m1 4 547.8205
m2 3 478.1866
m3 3 479.6896

Efectivamente mediante el analisis de los criterios (coeficientes de bondad) AIC y BIC se estima que el mejor
modelo son los valores mas pequenos por tanto es el modelo m1.

mod_2 <- arima(Gra_Temp, order =c(2,0,0),seasonal = c(0,1,0));mod_2

Call:
arima(x = Gra_Temp, order = c(2, 0, 0), seasonal = c(0, 1, 0))

Coefficients:
ar1 ar2
0.5694 0.2625
s.e. 0.1376 0.1385

sigma^2 estimated as 953.9: log likelihood = -233.29, aic = 472.57

22
par(mar=c(2,3,3,2))
tsdiag(mod_2)

Standardized Residuals
1
0
−2

2 4 6 8 10 12 14
ACF of Residuals
Time
0.8
ACF

0.2
−0.4

0 1 2 3 4

p values for Ljung−Box


Lag statistic
0.8
p value

0.4
0.0

2 4 6 8 10

Observamos que es un modelo es adecuado ,por los residuos


lag estandarisados se puede decir que tiene aleato-
riedad y mediante la funcion de autocorrelacion los residuos entonces se concluye que es estacionario por lo
cual mi grafica valor-p for Ljung-Box static se comprueba que hay independencia.

Prueba de Ljung-Box

Metodo analitico para comprobar que existe ruido blanco

1. Planteamiento de Hipotesis:

H0 = El modelo estimado tiene un buen ajuste


H1 = El modelo estimado no tiene un buen ajuste

2. Nivel de Significancia

Se establace un valor de α = 0.05

3. Tamano de la muestra y calculos estadisticos

23
Box.test(residuals(mod_2), type = "Ljung-Box")

Box-Ljung test

data: residuals(mod_2)
X-squared = 0.27269, df = 1, p-value = 0.6015

4. Especificacion de las regiones de rechazo y no rechazo

p - value < α = y se rechaza H0

5. Decision estadistica

Puesto que p-value = 0.004 > 0.05 No se rechaza H0 por tanto se dice que si existe ruido blanco y el modelo
se ajusta bien. Ademas hay varianza constante y los errores no estan serialmente correlacionados.

res<- residuals(mod_2)
plot(res,type = "o", lty = "dashed", col = "#00FFFF", main = "Grafica Ruido
Blanco", col.main="#B8860B", ylab= "")

Grafica Ruido
Blanco
40
20
0
−20
−60

2 4 6 8 10 12 14

Time

d. Realice el pronóstico de la serie con máximo 5 periodos extramuestrales.

24
pr <- forecast(mod_2, level = (95), h=5);pr

Point Forecast Lo 95 Hi 95
14 Q1 190.3087 129.77535 250.8420
14 Q2 246.7305 177.07309 316.3880
14 Q3 257.4348 179.24681 335.6229
14 Q4 252.5809 169.09471 336.0671
15 Q1 164.7476 44.51631 284.9789

plot(pr, main = "Pronosticos de ARIMA(2,0,0)(0,1,0",col="orange")

Pronosticos de ARIMA(2,0,0)(0,1,0
400
300
200
100

2 4 6 8 10 12 14

Pronostico <- rwf(y = Gra_Temp,h = 5,drift = TRUE,level = 0.95)


plot(Pronostico,main = "Pronostico de las Avs")

25
Pronostico de las Avs
600
400
200
0

2 4 6 8 10 12 14

4. (sheet: Flores) Gaby’s Flowers lleva registros de sus ventas (en


miles) desde el año 2009. Se requiere:

library(readxl)
DataSetF <- read_excel("DataSet.xlsx", sheet = "Flores")

a. Realizar el gráfico de la serie temporal.

Gra_Temp<- ts(DataSetF$Flores,frequency = 12)

plot(Gra_Temp, main= "Ganancia",


col.main= "#008B00", col = "#76EEC6", lwd= 3,
xlab = "Año", ylab = "Flores")

26
Ganancia
200
Flores

150
100

2 4 6 8 10 12 14

Año

Autocorrelacion o Correlograma

autocorrelation <- acf(Gra_Temp, plot = FALSE)


p_value <- adf.test(Gra_Temp)$p.value

print(autocorrelation)

Autocorrelations of series ’Gra_Temp’, by lag

0.0000 0.0833 0.1667 0.2500 0.3333 0.4167 0.5000 0.5833 0.6667 0.7500 0.8333
1.000 0.818 0.754 0.763 0.760 0.750 0.730 0.714 0.687 0.653 0.604
0.9167 1.0000 1.0833 1.1667 1.2500 1.3333 1.4167 1.5000 1.5833 1.6667 1.7500
0.636 0.771 0.605 0.549 0.554 0.550 0.543 0.522 0.508 0.486 0.451

print(p_value)

[1] 0.01099335

Estacionariedad

1. PlanteamientodeHipotesis:

H0 = St Ingresos esnoestacionaria
H1 = St Ingresos esestacionaria

27
2. Nivelde Significancia

Se establace un valorde α= 0.05

3. Tamano de la muestra y calculos estadisticos

adf.test(Gra_Temp, alternative = "stationary")

Augmented Dickey-Fuller Test

data: Gra_Temp
Dickey-Fuller = -4.0014, Lag order = 5, p-value = 0.01099
alternative hypothesis: stationary

ndiffs(Gra_Temp)

[1] 1

nsdiffs(Gra_Temp)

[1] 1

dife<- diff(Gra_Temp)
Gra_Temp<-dife
adf.test(Gra_Temp, alternative = "stationary")

Augmented Dickey-Fuller Test

data: Gra_Temp
Dickey-Fuller = -10.379, Lag order = 5, p-value = 0.01
alternative hypothesis: stationary

4. Especificacion de las regiones de rechazo y no rechazo

p -value> α y no se rechaza H0

5. Decision estadistica

Puesto que p-value=0.1855 > 0.05 no e rechaza H0 portanto la St original es Estacionaria

acf(Gra_Temp, 10)

28
Series Gra_Temp
0.8
0.4
ACF

0.0
−0.4

0.0 0.2 0.4 0.6 0.8

Lag

Aleatoridad

c. Realice el modelamiento de la serie y seleccione el método más adecuado y


justifique su elección con los criterios de información y las pruebas sobre los
errores, según corresponda.

Uso de la funcion autoarima

auto.arima(Gra_Temp )

Series: Gra_Temp
ARIMA(0,0,1)(0,1,2)[12]

Coefficients:
ma1 sma1 sma2
-0.7438 -0.366 -0.1052
s.e. 0.0529 0.084 0.0698

sigma^2 = 12.22: log likelihood = -382.03


AIC=772.06 AICc=772.35 BIC=783.92

Para contrastar lo antes indicado vamos a probar con 3 modelos tentativos (tomando en cuenta el modelo
adecuado por el software R) y comprobar de esta manera cual es el mejor modelo, ARIMA (p, d, q).
Regular

29
p=0 por lo tanto el modelo AR(0)
d=0 por lo tanto no hay diferencias para la estacionariedad
q=1 por lo tanto el modelo MA(1)
Estacional
P=0 por lo tanto el modelo
D=1 por lo tanto hay 1 diferencias para la estacional
Q=2 por lo tanto el modelo

Comparacion de otros modelos

m1 <- arima(Gra_Temp, order =c(0,0,1),seasonal = c(1,1,0))


m2 <- arima(Gra_Temp, order =c(0,0,1),seasonal = c(0,1,2))
m3 <- arima(Gra_Temp, order =c(1,0,1),seasonal = c(0,1,0))

Para determinar el mejor modelo se calculan los criterios de informacion de Akaike y bayesiano: AIC y BIC
respectivamente.

AIC(m1,m2,m3)

df AIC
m1 3 775.3317
m2 4 772.0649
m3 3 784.2032

BIC(m1,m2,m3)

df BIC
m1 3 784.2203
m2 4 783.9163
m3 3 793.0917

Efectivamente mediante el analisis de los criterios (coeficientes de bondad) AIC y BIC se estima que el mejor
modelo son los valores mas pequenos por tanto es el modelo m1.

mod_2 <- arima(Gra_Temp, order =c(0,0,1));mod_2

Call:
arima(x = Gra_Temp, order = c(0, 0, 1))

Coefficients:
ma1 intercept
-0.9491 0.6855
s.e. 0.0313 0.0643

sigma^2 estimated as 165: log likelihood = -616.79, aic = 1239.58

30
par(mar=c(2,3,3,2))
tsdiag(mod_2)

Standardized Residuals
2
0
−2

2 4 6 8 10 12 14
ACF of Residuals
Time
1.0
ACF

0.4
−0.2

0.0 0.5 1.0 1.5

p values for Ljung−Box


Lag statistic
0.8
p value

0.4
0.0

2 4 6 8 10

Observamos que es un modelo es adecuado ,por los residuos


lag estandarisados se puede decir que tiene aleato-
riedad y mediante la funcion de autocorrelacion los residuos entonces se concluye que es estacionario por lo
cual mi grafica valor-p for Ljung-Box static se comprueba que hay independencia.

Prueba de Ljung-Box

Metodo analitico para comprobar que existe ruido blanco

1. Planteamiento de Hipotesis:

H0 = El modelo estimado tiene un buen ajuste


H1 = El modelo estimado no tiene un buen ajuste

2. Nivel de Significancia

Se establace un valor de α = 0.05

3. Tamano de la muestra y calculos estadisticos

31
Box.test(residuals(mod_2), type = "Ljung-Box")

Box-Ljung test

data: residuals(mod_2)
X-squared = 0.044942, df = 1, p-value = 0.8321

4. Especificacion de las regiones de rechazo y no rechazo

p - value < α = y se rechaza H0

5. Decision estadistica

Puesto que p-value = 0.004 > 0.05 No se rechaza H0 por tanto se dice que si existe ruido blanco y el modelo
se ajusta bien. Ademas hay varianza constante y los errores no estan serialmente correlacionados.

res<- residuals(mod_2)
plot(res,type = "o", lty = "dashed", col = "#00FFFF", main = "Grafica Ruido
Blanco", col.main="#B8860B", ylab= "")

Grafica Ruido
Blanco
40
20
0
−20

2 4 6 8 10 12 14

Time

d. Realice el pronóstico de la serie con máximo 5 periodos extramuestrales.

32
pr <- forecast(mod_2, level = (95), h=5);pr

Point Forecast Lo 95 Hi 95
Jan 14 -38.1823530 -63.35673 -13.00798
Feb 14 0.6855188 -34.02264 35.39368
Mar 14 0.6855188 -34.02264 35.39368
Apr 14 0.6855188 -34.02264 35.39368
May 14 0.6855188 -34.02264 35.39368

plot(pr, main = "Pronosticos de SARIMA)",col="orange")

Pronosticos de SARIMA)
40
20
0
−20
−40
−60

2 4 6 8 10 12 14

Pronostico <- rwf(y = Gra_Temp,h = 5,drift = TRUE,level = 0.95)


plot(Pronostico,main = "Pronostico de las Ganancias")

33
Pronostico de las Ganancias
150
100
50
0
−50

2 4 6 8 10 12 14

5. Seleccione su propia serie temporal y realice un análisis completo


del modelamiento.

DataSetI <- read_excel("DataSet.xlsx", sheet = "Invento")

a. Realizar el gráfico de la serie temporal.

Gra_Temp<- ts(DataSetI$Zapatos,frequency = 1)

plot(Gra_Temp, main= "Ingresos",


col.main= "#008B00", col = "#76EEC6", lwd= 3,
xlab = "Año", ylab = "Ingreso")

34
Ingresos
200
180
160
Ingreso

140
120
100

5 10 15

Año

Autocorrelacion o Correlograma

autocorrelation <- acf(Gra_Temp, plot = FALSE)


p_value <- adf.test(Gra_Temp)$p.value

print(autocorrelation)

Autocorrelations of series ’Gra_Temp’, by lag

0 1 2 3 4 5 6 7 8 9 10
1.000 0.310 -0.204 0.121 0.191 -0.027 -0.042 0.007 -0.068 0.018 0.103
11 12
-0.065 -0.206

print(p_value)

[1] 0.4362701

Estacionariedad

1. PlanteamientodeHipotesis:

H0 = St Ingresos esnoestacionaria
H1 = St Ingresos esestacionaria

35
2. Nivelde Significancia

Se establace un valorde α= 0.05

3. Tamano de la muestra y calculos estadisticos

ndiffs(Gra_Temp)

[1] 1

dif<- diff(Gra_Temp,1)
Gra_Temp<- dif
adf.test(Gra_Temp, alternative = "stationary")

Augmented Dickey-Fuller Test

data: Gra_Temp
Dickey-Fuller = -3.0777, Lag order = 2, p-value = 0.1618
alternative hypothesis: stationary

4. Especificacion de las regiones de rechazo y no rechazo

p -value> α y no se rechaza H0

5. Decision estadistica

Puesto que p-value=0.5865 > 0.05 se rechaza H0 portanto la St original es Estacionaria

acf(Gra_Temp, 10)

36
Series Gra_Temp
1.0
0.5
ACF

0.0
−0.5

0 2 4 6 8 10

Lag

Aleatoridad

c. Realice el modelamiento de la serie y seleccione el método más adecuado y


justifique su elección con los criterios de información y las pruebas sobre los
errores, según corresponda.

Uso de la funcion autoarima

auto.arima(Gra_Temp,trace = T )

ARIMA(2,0,2) with non-zero mean : Inf


ARIMA(0,0,0) with non-zero mean : 168.2239
ARIMA(1,0,0) with non-zero mean : 170.4677
ARIMA(0,0,1) with non-zero mean : Inf
ARIMA(0,0,0) with zero mean : 166.1023
ARIMA(1,0,1) with non-zero mean : Inf

Best model: ARIMA(0,0,0) with zero mean

Series: Gra_Temp
ARIMA(0,0,0) with zero mean

sigma^2 = 897.4: log likelihood = -81.92


AIC=165.84 AICc=166.1 BIC=166.67

37
Para contrastar lo antes indicado vamos a probar con 3 modelos tentativos (tomando en cuenta el modelo
adecuado por el software R) y comprobar de esta manera cual es el mejor modelo, ARIMA (p, d, q).
p=0 por lo tanto el modelo AR(0)
d=0 por lo tanto hay 1 diferencias para la estacionariedad
q=0 por lo tanto el modelo MA(0)

Comparacion de otros modelos

m1 <- arima(Gra_Temp, order =c(0,0,1))


m2 <- arima(Gra_Temp, order =c(0,0,0))
m3 <- arima(Gra_Temp, order =c(1,0,1))

Para determinar el mejor modelo se calculan los criterios de informacion de Akaike y bayesiano: AIC y BIC
respectivamente.

AIC(m1,m2,m3)

df AIC
m1 3 165.0643
m2 2 167.3667
m3 4 166.2634

BIC(m1,m2,m3)

df BIC
m1 3 167.5639
m2 2 169.0332
m3 4 169.5963

Efectivamente mediante el analisis de los criterios (coeficientes de bondad) AIC y BIC se estima que el mejor
modelo son los valores mas pequenos por tanto es el modelo m1.

mod_2 <- arima(Gra_Temp, order =c(0,0,0));mod_2

Call:
arima(x = Gra_Temp, order = c(0, 0, 0))

Coefficients:
intercept
4.9412
s.e. 7.1661

sigma^2 estimated as 873: log likelihood = -81.68, aic = 167.37

par(mar=c(2,3,3,2))
tsdiag(mod_2)

38
0 1 2 3
−2 Standardized Residuals

5 10 15
ACF of Residuals
Time
0.5 1.0
ACF

−0.5

0 2 4 6 8 10 12

p values for Ljung−Box


Lag statistic
0.8
p value

0.4
0.0

2 4 6 8 10

Observamos que es un modelo es adecuado ,por los residuos


lag estandarisados se puede decir que tiene aleato-
riedad y mediante la funcion de autocorrelacion los residuos entonces se concluye que es estacionario por lo
cual mi grafica valor-p for Ljung-Box static se comprueba que hay independencia.

Prueba de Ljung-Box

Metodo analitico para comprobar que existe ruido blanco

1. Planteamiento de Hipotesis:

H0 = El modelo estimado tiene un buen ajuste


H1 = El modelo estimado no tiene un buen ajuste

2. Nivel de Significancia

Se establace un valor de α = 0.05

3. Tamano de la muestra y calculos estadisticos

Box.test(residuals(mod_2), type = "Ljung-Box")

Box-Ljung test

data: residuals(mod_2)
X-squared = 0.91143, df = 1, p-value = 0.3397

39
4. Especificacion de las regiones de rechazo y no rechazo

p - value < α = y se rechaza H0

5. Decision estadistica

Puesto que p-value = 0.6648 > 0.5 no se rechaza H0 por tanto se dice que existe ruido blanco y el modelo
se ajusta bien. Ademas hay varianza constante y los errores no estan serialmente correlacionados.

res<- residuals(mod_2)
plot(res,type = "o", lty = "dashed", col = "#00FFFF", main = "Grafica Ruido
Blanco", col.main="#B8860B", ylab= "")

Grafica Ruido
Blanco
50
0
−50

5 10 15

Time

d. Realice el pronóstico de la serie con máximo 5 periodos extramuestrales.

pr <- forecast(mod_2, level = (95), h=5);pr

Point Forecast Lo 95 Hi 95
19 4.941176 -52.96893 62.85128
20 4.941176 -52.96893 62.85128
21 4.941176 -52.96893 62.85128
22 4.941176 -52.96893 62.85128
23 4.941176 -52.96893 62.85128

40
plot(pr, main = "Pronosticos de ARIMA(0,0,0)",col="orange")

Pronosticos de ARIMA(0,0,0)
100
50
0
−50

5 10 15 20

Pronostico <- rwf(y = Gra_Temp,h = 5,drift = TRUE,level = 0.95)


plot(Pronostico,main = "Pronostico de las Ganancias")

41
Pronostico de las Ganancias
200
100
0
−200

5 10 15 20

42

También podría gustarte