Documentos de Académico
Documentos de Profesional
Documentos de Cultura
None
2023-08-29
Librerias
library(tseries)
library(astsa)
library(forecast)
library(foreign)
library(readxl)
DataSet <- read_excel("DataSet.xlsx", sheet = "Borracho")
Gra_Temp<- ts(DataSet$Yt)
1
Translado a Casa
10
8
Distancia
6
4
2
0
0 10 20 30 40
Pasos
Autocorrelacion o Correlograma
print(autocorrelation)
0 1 2 3 4 5 6 7 8 9 10
1.000 -0.191 -0.006 -0.145 0.104 -0.254 0.029 0.169 -0.027 -0.033 0.022
11 12 13 14 15 16
-0.040 0.062 -0.205 -0.002 0.010 0.105
print(p_value)
[1] 0.0245862
Estacionariedad
2
1. PlanteamientodeHipotesis:
H0 = St yt esnoestacionaria
H1 = St yt esestacionaria
2. Nivelde Significancia
Se establaceunvalorde α= 0.05
data: Gra_Temp
Dickey-Fuller = -3.8766, Lag order = 3, p-value = 0.02459
alternative hypothesis: stationary
p -value> α y no se rechaza H0
5. Decision estadistica
acf(Gra_Temp, 40)
3
Series Gra_Temp
0.2 0.4 0.6 0.8 1.0
ACF
−0.2
0 10 20 30 40
Lag
ndiffs(Gra_Temp)
[1] 0
Aleatoridad
No se tienen que hacer diferencias en la parte regular.
auto.arima(Gra_Temp,trace = T )
4
Series: Gra_Temp
ARIMA(0,0,0) with non-zero mean
Coefficients:
mean
4.6548
s.e. 0.4354
Para contrastar lo antes indicado vamos a probar con 3 modelos tentativos (tomando en cuenta el modelo
adecuado por el software R) y comprobar de esta manera cual es el mejor modelo, ARIMA (p, d, q).
p=0 por lo tanto el modelo AR(0)
d=0 por lo tanto no hay diferencias para la estacionariedad
q=1 por lo tanto el modelo MA(1)
Para determinar el mejor modelo se calculan los criterios de informacion de Akaike y bayesiano: AIC y BIC
respectivamente.
AIC(m1,m2,m3)
df AIC
m1 3 198.8198
m2 1 225.7019
m3 4 199.2939
BIC(m1,m2,m3)
df BIC
m1 3 203.8864
m2 1 227.3655
m3 4 206.0494
Efectivamente mediante el analisis de los criterios (coeficientes de bondad) AIC y BIC se estima que el mejor
modelo son los valores mas pequenos por tanto es el modelo m1.
Call:
arima(x = Gra_Temp, order = c(0, 0, 1))
5
Coefficients:
ma1 intercept
-0.2282 4.6789
s.e. 0.1736 0.3314
par(mar=c(2,3,3,2))
tsdiag(mod_2)
Standardized Residuals
2
1
−1 0
0 10 20 30 40
ACF of Residuals
Time
1.0
0.4
ACF
−0.2
0 5 10 15
0.4
0.0
2 4 6 8 10
Prueba de Ljung-Box
1. Planteamiento de Hipotesis:
2. Nivel de Significancia
6
Se establace un valor de α = 0.05
Box-Ljung test
data: residuals(mod_2)
X-squared = 0.0044267, df = 1, p-value = 0.947
5. Decision estadistica
Puesto que p-value = 0.004 > 0.05 No se rechaza H0 por tanto se dice que si existe ruido blanco y el modelo
se ajusta bien. Ademas hay varianza constante y los errores no estan serialmente correlacionados.
res<- residuals(mod_2)
plot(res,type = "o", lty = "dashed", col = "#00FFFF", main = "Grafica Ruido
Blanco", col.main="#B8860B", ylab= "")
Grafica Ruido
Blanco
6
4
2
0
−2
−4
0 10 20 30 40
Time
7
d. Realice el pronóstico de la serie con máximo 5 periodos extramuestrales.
Point Forecast Lo 95 Hi 95
41 5.466643 0.1885400 10.74475
42 4.678864 -0.7348706 10.09260
43 4.678864 -0.7348706 10.09260
44 4.678864 -0.7348706 10.09260
45 4.678864 -0.7348706 10.09260
Pronosticos de ARIMA(0,0,1)
10
8
6
4
2
0
0 10 20 30 40
8
Pronostico de las distancias
20
10
0
−10
−20
0 10 20 30 40
tsdiag(mod_2)
9
−1 2
Standardized Residuals
0 10 20 30 40
Time
ACF of Residuals
ACF
−0.2
0 5 10 15
Lag
2 4 6 8 10
lag
Gra_Temp<- ts(DataSetH$Ingresos,frequency = 1)
10
Ingresos
50000
Ingreso
30000
10000
0 10 20 30 40 50
Año
Autocorrelacion o Correlograma
print(autocorrelation)
0 1 2 3 4 5 6 7 8 9 10
1.000 0.962 0.920 0.873 0.812 0.751 0.689 0.623 0.550 0.468 0.382
11 12 13 14 15 16
0.300 0.215 0.138 0.066 -0.004 -0.062
print(p_value)
[1] 0.9789883
Estacionariedad
1. PlanteamientodeHipotesis:
H0 = St Ingresos esnoestacionaria
H1 = St Ingresos esestacionaria
11
2. Nivelde Significancia
ndiffs(Gra_Temp)
[1] 2
dif<- diff(Gra_Temp,2)
Gra_Temp<- dif
adf.test(Gra_Temp, alternative = "stationary")
data: Gra_Temp
Dickey-Fuller = -1.969, Lag order = 3, p-value = 0.5865
alternative hypothesis: stationary
p -value> α y no se rechaza H0
5. Decision estadistica
acf(Gra_Temp, 10)
12
Series Gra_Temp
0.2 0.4 0.6 0.8 1.0
ACF
−0.2
0 2 4 6 8 10
Lag
Aleatoridad
auto.arima(Gra_Temp )
Series: Gra_Temp
ARIMA(2,1,1)
Coefficients:
ar1 ar2 ma1
-0.7907 -0.5253 0.9279
s.e. 0.1241 0.1200 0.0770
Para contrastar lo antes indicado vamos a probar con 3 modelos tentativos (tomando en cuenta el modelo
adecuado por el software R) y comprobar de esta manera cual es el mejor modelo, ARIMA (p, d, q).
p=2 por lo tanto el modelo AR(1)
13
d=1 por lo tanto hay 1 diferencias para la estacionariedad
q=1 por lo tanto el modelo MA(1)
Para determinar el mejor modelo se calculan los criterios de informacion de Akaike y bayesiano: AIC y BIC
respectivamente.
AIC(m1,m2,m3)
df AIC
m1 5 942.5103
m2 4 918.0198
m3 4 941.6688
BIC(m1,m2,m3)
df BIC
m1 5 951.8663
m2 4 925.4204
m3 4 949.1536
Efectivamente mediante el analisis de los criterios (coeficientes de bondad) AIC y BIC se estima que el mejor
modelo son los valores mas pequenos por tanto es el modelo m1.
Call:
arima(x = Gra_Temp, order = c(2, 1, 1))
Coefficients:
ar1 ar2 ma1
-0.7907 -0.5253 0.9279
s.e. 0.1241 0.1200 0.0770
par(mar=c(2,3,3,2))
tsdiag(mod_2)
14
2
0
−4 −2 Standardized Residuals
10 20 30 40 50
ACF of Residuals
Time
1.0
ACF
0.4
−0.2
0 5 10 15
0.4
0.0
2 4 6 8 10
Prueba de Ljung-Box
1. Planteamiento de Hipotesis:
2. Nivel de Significancia
Box-Ljung test
data: residuals(mod_2)
X-squared = 0.1877, df = 1, p-value = 0.6648
15
4. Especificacion de las regiones de rechazo y no rechazo
5. Decision estadistica
Puesto que p-value = 0.6648 > 0.5 no se rechaza H0 por tanto se dice que existe ruido blanco y el modelo
se ajusta bien. Ademas hay varianza constante y los errores no estan serialmente correlacionados.
res<- residuals(mod_2)
plot(res,type = "o", lty = "dashed", col = "#00FFFF", main = "Grafica Ruido
Blanco", col.main="#B8860B", ylab= "")
Grafica Ruido
Blanco
5000
0
−5000
−15000
10 20 30 40 50
Time
Point Forecast Lo 95 Hi 95
51 -10785.16 -18197.86 -3372.4533
52 -11968.31 -23193.39 -743.2253
53 -11177.76 -23006.76 651.2495
54 -11181.25 -24881.54 2519.0402
55 -11593.80 -26917.94 3730.3423
16
plot(pr, main = "Pronosticos de ARIMA(2,1,1)",col="orange")
Pronosticos de ARIMA(2,1,1)
10000
0
−20000
10 20 30 40 50
17
Pronostico de las Ganancias
10000
0
−10000
−30000
10 20 30 40 50
library(readxl)
DataSetN <- read_excel("DataSet.xlsx", sheet = "NatGeo")
Gra_Temp<- ts(DataSetN$Aves,frequency = 4)
18
Aves
450
350
Aves Quito
250
150
2 4 6 8 10 12 14
Año
Autocorrelacion o Correlograma
print(autocorrelation)
0.00 0.25 0.50 0.75 1.00 1.25 1.50 1.75 2.00 2.25 2.50
1.000 0.393 0.154 0.293 0.743 0.150 -0.153 -0.047 0.346 -0.183 -0.435
2.75 3.00 3.25 3.50 3.75 4.00 4.25
-0.315 0.091 -0.352 -0.519 -0.374 0.042 -0.290
print(p_value)
[1] 0.9202153
Estacionariedad
1. PlanteamientodeHipotesis:
H0 = St Ingresos esnoestacionaria
H1 = St Ingresos esestacionaria
19
2. Nivelde Significancia
data: Gra_Temp
Dickey-Fuller = -1.0612, Lag order = 3, p-value = 0.9202
alternative hypothesis: stationary
ndiffs(Gra_Temp)
[1] 0
nsdiffs(Gra_Temp)
[1] 1
diff(Gra_Temp,lag=4)
p -value> α y no se rechaza H0
5. Decision estadistica
20
acf(Gra_Temp, 10)
Series Gra_Temp
0.8
0.4
ACF
0.0
−0.4
Lag
Aleatoridad
auto.arima(Gra_Temp )
Series: Gra_Temp
ARIMA(2,0,0)(0,1,0)[4]
Coefficients:
ar1 ar2
0.5694 0.2625
s.e. 0.1376 0.1385
21
Para contrastar lo antes indicado vamos a probar con 3 modelos tentativos (tomando en cuenta el modelo
adecuado por el software R) y comprobar de esta manera cual es el mejor modelo, ARIMA (p, d, q).
Regular
p=2 por lo tanto el modelo AR(0)
d=0 por lo tanto no hay diferencias para la estacionariedad
q=0 por lo tanto el modelo MA(0)
Estacional
P= 0 por lo tanto el modelo
D=1 por lo tanto hay diferencias para la estacional
Q=0 por lo tanto el modelo
Para determinar el mejor modelo se calculan los criterios de informacion de Akaike y bayesiano: AIC y BIC
respectivamente.
AIC(m1,m2,m3)
df AIC
m1 4 540.0155
m2 3 472.5730
m3 3 474.0760
BIC(m1,m2,m3)
df BIC
m1 4 547.8205
m2 3 478.1866
m3 3 479.6896
Efectivamente mediante el analisis de los criterios (coeficientes de bondad) AIC y BIC se estima que el mejor
modelo son los valores mas pequenos por tanto es el modelo m1.
Call:
arima(x = Gra_Temp, order = c(2, 0, 0), seasonal = c(0, 1, 0))
Coefficients:
ar1 ar2
0.5694 0.2625
s.e. 0.1376 0.1385
22
par(mar=c(2,3,3,2))
tsdiag(mod_2)
Standardized Residuals
1
0
−2
2 4 6 8 10 12 14
ACF of Residuals
Time
0.8
ACF
0.2
−0.4
0 1 2 3 4
0.4
0.0
2 4 6 8 10
Prueba de Ljung-Box
1. Planteamiento de Hipotesis:
2. Nivel de Significancia
23
Box.test(residuals(mod_2), type = "Ljung-Box")
Box-Ljung test
data: residuals(mod_2)
X-squared = 0.27269, df = 1, p-value = 0.6015
5. Decision estadistica
Puesto que p-value = 0.004 > 0.05 No se rechaza H0 por tanto se dice que si existe ruido blanco y el modelo
se ajusta bien. Ademas hay varianza constante y los errores no estan serialmente correlacionados.
res<- residuals(mod_2)
plot(res,type = "o", lty = "dashed", col = "#00FFFF", main = "Grafica Ruido
Blanco", col.main="#B8860B", ylab= "")
Grafica Ruido
Blanco
40
20
0
−20
−60
2 4 6 8 10 12 14
Time
24
pr <- forecast(mod_2, level = (95), h=5);pr
Point Forecast Lo 95 Hi 95
14 Q1 190.3087 129.77535 250.8420
14 Q2 246.7305 177.07309 316.3880
14 Q3 257.4348 179.24681 335.6229
14 Q4 252.5809 169.09471 336.0671
15 Q1 164.7476 44.51631 284.9789
Pronosticos de ARIMA(2,0,0)(0,1,0
400
300
200
100
2 4 6 8 10 12 14
25
Pronostico de las Avs
600
400
200
0
2 4 6 8 10 12 14
library(readxl)
DataSetF <- read_excel("DataSet.xlsx", sheet = "Flores")
26
Ganancia
200
Flores
150
100
2 4 6 8 10 12 14
Año
Autocorrelacion o Correlograma
print(autocorrelation)
0.0000 0.0833 0.1667 0.2500 0.3333 0.4167 0.5000 0.5833 0.6667 0.7500 0.8333
1.000 0.818 0.754 0.763 0.760 0.750 0.730 0.714 0.687 0.653 0.604
0.9167 1.0000 1.0833 1.1667 1.2500 1.3333 1.4167 1.5000 1.5833 1.6667 1.7500
0.636 0.771 0.605 0.549 0.554 0.550 0.543 0.522 0.508 0.486 0.451
print(p_value)
[1] 0.01099335
Estacionariedad
1. PlanteamientodeHipotesis:
H0 = St Ingresos esnoestacionaria
H1 = St Ingresos esestacionaria
27
2. Nivelde Significancia
data: Gra_Temp
Dickey-Fuller = -4.0014, Lag order = 5, p-value = 0.01099
alternative hypothesis: stationary
ndiffs(Gra_Temp)
[1] 1
nsdiffs(Gra_Temp)
[1] 1
dife<- diff(Gra_Temp)
Gra_Temp<-dife
adf.test(Gra_Temp, alternative = "stationary")
data: Gra_Temp
Dickey-Fuller = -10.379, Lag order = 5, p-value = 0.01
alternative hypothesis: stationary
p -value> α y no se rechaza H0
5. Decision estadistica
acf(Gra_Temp, 10)
28
Series Gra_Temp
0.8
0.4
ACF
0.0
−0.4
Lag
Aleatoridad
auto.arima(Gra_Temp )
Series: Gra_Temp
ARIMA(0,0,1)(0,1,2)[12]
Coefficients:
ma1 sma1 sma2
-0.7438 -0.366 -0.1052
s.e. 0.0529 0.084 0.0698
Para contrastar lo antes indicado vamos a probar con 3 modelos tentativos (tomando en cuenta el modelo
adecuado por el software R) y comprobar de esta manera cual es el mejor modelo, ARIMA (p, d, q).
Regular
29
p=0 por lo tanto el modelo AR(0)
d=0 por lo tanto no hay diferencias para la estacionariedad
q=1 por lo tanto el modelo MA(1)
Estacional
P=0 por lo tanto el modelo
D=1 por lo tanto hay 1 diferencias para la estacional
Q=2 por lo tanto el modelo
Para determinar el mejor modelo se calculan los criterios de informacion de Akaike y bayesiano: AIC y BIC
respectivamente.
AIC(m1,m2,m3)
df AIC
m1 3 775.3317
m2 4 772.0649
m3 3 784.2032
BIC(m1,m2,m3)
df BIC
m1 3 784.2203
m2 4 783.9163
m3 3 793.0917
Efectivamente mediante el analisis de los criterios (coeficientes de bondad) AIC y BIC se estima que el mejor
modelo son los valores mas pequenos por tanto es el modelo m1.
Call:
arima(x = Gra_Temp, order = c(0, 0, 1))
Coefficients:
ma1 intercept
-0.9491 0.6855
s.e. 0.0313 0.0643
30
par(mar=c(2,3,3,2))
tsdiag(mod_2)
Standardized Residuals
2
0
−2
2 4 6 8 10 12 14
ACF of Residuals
Time
1.0
ACF
0.4
−0.2
0.4
0.0
2 4 6 8 10
Prueba de Ljung-Box
1. Planteamiento de Hipotesis:
2. Nivel de Significancia
31
Box.test(residuals(mod_2), type = "Ljung-Box")
Box-Ljung test
data: residuals(mod_2)
X-squared = 0.044942, df = 1, p-value = 0.8321
5. Decision estadistica
Puesto que p-value = 0.004 > 0.05 No se rechaza H0 por tanto se dice que si existe ruido blanco y el modelo
se ajusta bien. Ademas hay varianza constante y los errores no estan serialmente correlacionados.
res<- residuals(mod_2)
plot(res,type = "o", lty = "dashed", col = "#00FFFF", main = "Grafica Ruido
Blanco", col.main="#B8860B", ylab= "")
Grafica Ruido
Blanco
40
20
0
−20
2 4 6 8 10 12 14
Time
32
pr <- forecast(mod_2, level = (95), h=5);pr
Point Forecast Lo 95 Hi 95
Jan 14 -38.1823530 -63.35673 -13.00798
Feb 14 0.6855188 -34.02264 35.39368
Mar 14 0.6855188 -34.02264 35.39368
Apr 14 0.6855188 -34.02264 35.39368
May 14 0.6855188 -34.02264 35.39368
Pronosticos de SARIMA)
40
20
0
−20
−40
−60
2 4 6 8 10 12 14
33
Pronostico de las Ganancias
150
100
50
0
−50
2 4 6 8 10 12 14
Gra_Temp<- ts(DataSetI$Zapatos,frequency = 1)
34
Ingresos
200
180
160
Ingreso
140
120
100
5 10 15
Año
Autocorrelacion o Correlograma
print(autocorrelation)
0 1 2 3 4 5 6 7 8 9 10
1.000 0.310 -0.204 0.121 0.191 -0.027 -0.042 0.007 -0.068 0.018 0.103
11 12
-0.065 -0.206
print(p_value)
[1] 0.4362701
Estacionariedad
1. PlanteamientodeHipotesis:
H0 = St Ingresos esnoestacionaria
H1 = St Ingresos esestacionaria
35
2. Nivelde Significancia
ndiffs(Gra_Temp)
[1] 1
dif<- diff(Gra_Temp,1)
Gra_Temp<- dif
adf.test(Gra_Temp, alternative = "stationary")
data: Gra_Temp
Dickey-Fuller = -3.0777, Lag order = 2, p-value = 0.1618
alternative hypothesis: stationary
p -value> α y no se rechaza H0
5. Decision estadistica
acf(Gra_Temp, 10)
36
Series Gra_Temp
1.0
0.5
ACF
0.0
−0.5
0 2 4 6 8 10
Lag
Aleatoridad
auto.arima(Gra_Temp,trace = T )
Series: Gra_Temp
ARIMA(0,0,0) with zero mean
37
Para contrastar lo antes indicado vamos a probar con 3 modelos tentativos (tomando en cuenta el modelo
adecuado por el software R) y comprobar de esta manera cual es el mejor modelo, ARIMA (p, d, q).
p=0 por lo tanto el modelo AR(0)
d=0 por lo tanto hay 1 diferencias para la estacionariedad
q=0 por lo tanto el modelo MA(0)
Para determinar el mejor modelo se calculan los criterios de informacion de Akaike y bayesiano: AIC y BIC
respectivamente.
AIC(m1,m2,m3)
df AIC
m1 3 165.0643
m2 2 167.3667
m3 4 166.2634
BIC(m1,m2,m3)
df BIC
m1 3 167.5639
m2 2 169.0332
m3 4 169.5963
Efectivamente mediante el analisis de los criterios (coeficientes de bondad) AIC y BIC se estima que el mejor
modelo son los valores mas pequenos por tanto es el modelo m1.
Call:
arima(x = Gra_Temp, order = c(0, 0, 0))
Coefficients:
intercept
4.9412
s.e. 7.1661
par(mar=c(2,3,3,2))
tsdiag(mod_2)
38
0 1 2 3
−2 Standardized Residuals
5 10 15
ACF of Residuals
Time
0.5 1.0
ACF
−0.5
0 2 4 6 8 10 12
0.4
0.0
2 4 6 8 10
Prueba de Ljung-Box
1. Planteamiento de Hipotesis:
2. Nivel de Significancia
Box-Ljung test
data: residuals(mod_2)
X-squared = 0.91143, df = 1, p-value = 0.3397
39
4. Especificacion de las regiones de rechazo y no rechazo
5. Decision estadistica
Puesto que p-value = 0.6648 > 0.5 no se rechaza H0 por tanto se dice que existe ruido blanco y el modelo
se ajusta bien. Ademas hay varianza constante y los errores no estan serialmente correlacionados.
res<- residuals(mod_2)
plot(res,type = "o", lty = "dashed", col = "#00FFFF", main = "Grafica Ruido
Blanco", col.main="#B8860B", ylab= "")
Grafica Ruido
Blanco
50
0
−50
5 10 15
Time
Point Forecast Lo 95 Hi 95
19 4.941176 -52.96893 62.85128
20 4.941176 -52.96893 62.85128
21 4.941176 -52.96893 62.85128
22 4.941176 -52.96893 62.85128
23 4.941176 -52.96893 62.85128
40
plot(pr, main = "Pronosticos de ARIMA(0,0,0)",col="orange")
Pronosticos de ARIMA(0,0,0)
100
50
0
−50
5 10 15 20
41
Pronostico de las Ganancias
200
100
0
−200
5 10 15 20
42