Está en la página 1de 38

PRODUCCION DE PAPA EN EL PERU Y MODELACION ARIMA

1
MARCO TEORICO

La papa (Solanum tuberosum) es originaria del altiplano de América del Sur, donde se
consume desde hace más de 8 mil años. Los exploradores españoles llevaron la planta a
Europa a fines del siglo XVI como una curiosidad botánica. Para el siglo XIX se había
expandido por todo el continente, proporcionando alimentación abundante y de bajo costo
a los trabajadores de la revolución industrial.

Actualmente, la papa es el cultivo alimenticio más importante del mundo, con una
producción anual cercana a los 300 millones de toneladas. Más de un tercio de la
producción global de papa proviene de los países en desarrollo. A comienzos de los 60s,
éstos producían apenas el 11 por ciento.

En el territorio peruano se encuentra la mayor cantidad de especies de papa conocidas en el


mundo. Actualmente en el Perú, es el principal cultivo del país en superficie sembrada y
representa el 25% del PBI agropecuario. Es la base de la alimentación de la zona andina y
es producido por 600 mil pequeñas unidades agrarias. La papa es un cultivo competitivo
del trigo y arroz en la dieta alimentaria. es un producto que contiene en 100 gramos; 78 gr.
de humedad; 18,5 gr. de almidón y es rico en Potasio (560mg) y vitamina C (20 mg).

La siembra en la sierra se concentra en los meses de agosto a diciembre mientras que en la


costa es en los meses de abril a julio. La cosecha en la sierra se efectúa entre los meses de
marzo a mayo y el costa de octubre a diciembre en la costa.

2
La producción mundial de papa ha crecido en los últimos 10 años. En el año 2000 fue de
308 millones de toneladas (anexo N°1), reflejando tendencias diferentes de la producción y
utilización de la papa en los países desarrollados y en desarrollo. La producción de papa
esta creciendo muy poco en los primeros, especialmente en Europa, mientras que en los
países en desarrollo esta aumentando y representa el 35% de la producción mundial.
Asia produce el 80% del volumen total de papa de los países en desarrollo. China,
representa el 20 % de la producción mundial. La expansión en estos países es tanto a nivel
de la oferta como de la demanda.

El procesamiento es el sector de la economía de la papa a nivel mundial que esta


experimentando el crecimiento mas acelerado. Mas de la mitad de la cosecha de EEUU se
procesa y esta creciendo rápidamente en muchos países en vías de desarrollo como
Argentina, Colombia, China, y Egipto.

La rápida urbanización en países en desarrollo, unida a la creciente importancia en


procesamiento, podría expandir el comercio mundial de papa estimulado por el crecimiento
de la demanda de comida rápida (papas fritas), bocadillos y aperitivos (papas crocantes) en
especial en Asia, Africa y América Latina por el cambio en los hábitos alimenticios.

Fuente:
Compendio Estadístico Agrario 1990 - 1993 OIA - MINAG Producción Agrícola 1994 - 1999 OIA - MINAG
Estadística Agrícola Trimestral 2000 - 2001 OIA - MINAG

3
En el año 2000 la producción de papa en el Perú, represento el 1% de la producción
mundial.

En los últimos 10 años 1990 - 2000, la producción nacional de papa ha tenido un


crecimiento sustancial pasando de 1,154,000 t. a 3,116,000 t., favorecido por los factores
climáticos a excepción de 1992, que disminuyo la producción debido a la sequía. El
aumento de la producción es explicado también por el incremento del área cosechada, que
paso de 146 435 ha en 1990 a 283 760 ha. en al año 2000.
Asimismo los rendimientos han aumentado de 7.88 a 10.98 t/ha en el mismo período. Este
nivel alcanzado es bajo comparado con los rendimientos de papa en Colombia (16 t/ha),
Brasil (15 t/ha), Chile (15 t/ha) y México (21 t/ha). Existen problemas tecnológicos,
especialmente ligados a la calidad de la semilla y la sanidad, que explican este bajo
desempeño .

Fuente:
Compendio Estadístico Agrario 1990 - 1993 OIA - MINAG
Producción Agrícola 1994 - 1999 OIA - MINAG
Estadística Agrícola Trimestral 2000 - 2001 OIA - MINAG

4
La exportación en el Perú de papa representó para el año 2000 un volumen aproximado de
3000 t y alrededor de 1 millón de dólares. El rubro que tiene mayor participación en el
volumen total exportado es la papa fresca, que representó el 95% del total en el año 2000.
Los derivados de la papa son exportados en volúmenes poco significativos.

Volumen
Productos
(t)
SubPartida
1996 1997 1998 1999 2000 2001
Total
1.063,6 2.111,1 67,1 68,1 2.971,3 3.646,9

0701900000 Papa fresca 910,3 2.049,0 42,4 3,7 2.850,6 3.590,0

Papa 74,3
0710100000 17,3 22,9 20,5 16,6 10,5
congelada
0712909000 Papas secas 27,6 26,5 -- -- 69,5 30,8
Harina de
1105100000 -- 0,6 0,2 0,1 0,3 ~
papa
Copos de
1105200000 41,5 4,6 0,4 2,1 4,7 1,6
papa
Fécula de
1108130000 4,8 4,7 1,2 34,9 29,5 14,0
papa
Papa
2005200000 preparada 5,1 8,4 -- 6,8 0,1 --
sin congelar

Valor FOB
Productos
(Miles de US$)
SubPartida
1996 1997 1998 1999 2000 2001
Total
226,7 270,4 36,6 90,6 789,1 1.096,7
0701900000 Papa fresca 63,4 151,8 6,9 6,2 619,9 1.024,4
Papa
0710100000 38,8 33,9 24,9 34,3 26,2 12,0
congelada
Papas
0712909000 46,8 45,4 -- -- 111,1 39,6
secas
Harina de
1105100000 -- 0,8 0,5 0,3 0,3 0,1
papa
Copos de
1105200000 57,9 10,5 1,5 0,7 3,3 2,7
papa
Fécula de
1108130000 8,2 11,1 2,7 27,1 28,2 17,9
papa
Papa
preparada
2005200000 11,6 16,9 -- 22,0 0,2 --
sin
congelar
Fuente: Superintendencia Nacional de Aduanas - ADUANAS

5
Las importaciones de papa son mas significativas que las exportaciones. En el año 2000 se
importaron aproximadamente 13000 toneladas de papa equivalentes a 6575 miles de
dólares. El principal rubro de importación en el periodo 1996 - 2001 lo representa la Fécula
de papa que fue equivalente al 70% del volumen total exportado para el año 2000.Sigue en
importancia la papa preparada congelada.

Productos Peso Bruto (t)


SubPartida 1996 1997 1998 1999 2000 2001
Total
9.102 10.507 12.131 14.60 12.601 3.431
0701900000 Papa fresca -- -- -- (d) 1 0 0,1
Papa
0710100000 66,1 85,6 76,9 (d) 2 18 93
congelada
Papas
0712909000 -- -- -- 1 -- --
secas
Harina de
1105100000 193,1 175 197 234 261 128
papa
Copos de
1105200000 6.944,3 7.194 7.678 10.350 8.808 2.149
papa
Fécula de
1108130000 1.536,8 2.727 3.556 3.035 3.336 859
papa
Papa
preparada
2005200000 362,0 325 624 980 178 202
sin
congelar

METODOLOGIA

4.1 Econometría de Series de Tiempo

Las series de tiempo han adquirido un uso tan frecuente e intensivo en la investigación
empírica, que los econometristas han empezado recientemente a prestar cuidadosa atención
a este tipo de información. En el curso de Econometría I, se hizo énfasis en un supuesto
implícito en el cual se basa el análisis de regresión que considera series de tiempo, esto es,
que dichas series son estacionarias.

6
Al efectuar la regresión de una variable de serie de tiempo sobre otra variable de serie de
tiempo, con frecuencia obtenemos un R2 muy elevado, aunque no haya una relación
significativa entre las dos. Esta situación ejemplifica el concepto de regresión espuria. Este
problema surge porque si las dos series de tiempo involucradas presentan tendencias
fuertes (movimientos sostenidos hacia arriba o hacia abajo), el alto R2 observado se debe a
la presencia de la tendencia y no a la verdadera relación entre las dos.

Pero surgen las siguientes preguntas. ¿Cómo se diseña un modelo para una serie de tiempo
estacionaria?, es decir, ¿qué clase de modelo de regresión se puede utilizar para describir
su comportamiento?, y ¿Cómo se utiliza el modelo estimado para fines de predicción,
sabiendo que la predicción es una parte importante del análisis econométrico?

En términos generales, hay cuatro enfoques para la predicción económica basados en series
de tiempo: (1) Los modelos de regresión uniecuacionales, (2) los modelos de regresión de
ecuaciones simultáneas, (3) los modelos autorregresivos integrados de media móvil
(ARIMA) y (4) los modelos de vectores autoregresivos (VAR).

La publicación de G. P.E. Box y G.M Jenkins sobre análisis de series de tiempo:


Predicción y Control (Time Series Analysis: Forecasting and Control) estableció una nueva
generación de herramientas de predicción. Popularmente conocida como metodología de
Box-Jenkins (BJ), pero técnicamente conocida como metodología ARIMA, el énfasis de
este nuevo método de predicción no está en la construcción de modelos uniecuacionales o
de ecuaciones simultáneas sino en el análisis de las propiedades probabilísticas, o
estocásticas, de las series de tiempo económicas por si mismas bajo la filosofía de
“permitir que la información hable por si misma”. En los modelos de series de tiempo del
tipo BJ, Y puede ser explicada por valores pasados o rezagados de sí misma, y por los
términos estocásticos de error. Por esta razón, los modelos ARIMA reciben algunas veces
el nombre de modelos a teóricos, porque no pueden ser derivados de teoría económica
alguna, y las teorías económicas a menudo son la base de los modelos de ecuaciones
simultáneas.

7
4.2 Proceso autoregresivo integrado de media móvil (ARIMA)

El modelo de serie de tiempo analizado está basado en el supuesto de que las series de
tiempo consideradas son débilmente estacionarias. En otras palabras, la media y la varianza
para una serie de tiempo débilmente estacionaria son constantes y su covarianza es
invariante en el tiempo. Pero se sabe que muchas series de tiempo económicas son no
estacionarias, es decir, son integradas.

Sabemos que si una serie de tiempo es integrada de orden 1, sus primeras diferencias son
I(0), es decir, estacionarias. En forma similar, si una serie de tiempo es I(2), su segunda
diferencia es I(0). En general, si una serie de tiempo es I(d), después de difeenciarla d
veces se obtiene una serie I(0).

Si se debe diferenciar una serie de tiempo d veces para hacerla estacionaria y luego aplicar
a ésta el modelo ARMA (p,q), se dice que la serie de tiempo orgiginal es ARIMA (p,d,q) ,
es decir, es una serie de tiempo autorregresiva integrada de media móvil, donde p denota el
número de términos autorregresivos, d el número de veces de que la serie debe ser
diferenciada para hacerse estacionaria y q el numero de términos de media móvil.

El punto importante de mencioanr es que para utilizar la metodología Box-Jenkins, se debe


tener una serie de tiempo estacionaria o una serie de tiempo que sea estacionaria después
de una o más diferenciaciones. La razón para suponer estacionariedad puede explicarse por
lo dicho por Michael Pokorny en An Introduction to Econometrics , New York, 1987: “
...el objetivo de BJ ón para suponer estacionariedad puede explicarse por lo dicho por
Michael Pokorny en An Introduction to Econometrics , New York, 1987: “ ...el objetivo de
BJ (Box-Jenkins) es identificar y estimar un modelo estadístico que pueda ser interpretado
como generador de la información muestral. Entonces, si este modelo estimado va a ser
utilizado para predicción, se debe suponer que sus caracteríticas son constantes a través del

8
tiempo y, particularmente, en períodos de tiempo futuro. Así la simple razón para requerir
información estacionaria es que cualquier modelo que sea inferido a partir de esta
información pueda ser interpretado como estacionario o estable, proporcionando, por
consiguiente, una base válida para predicción.
4.3 Metodología de Box-Jenkins (BJ)

El método considera cuatro pasos:


Paso 1. Identificación: es decir, encontrar los valore apropiados de p, d y q. El
correlograma y el correlograma parcial ayudan en esta labor.
Paso 2. Estimación: Habiendo identificado los valore apropiados de p, d y q, la
siguiente etapa es estimar los parámetros de los términos autorregresivos y
de media móvil incluidos en el modelo.

Paso 3. Verificación de diagnóstico: después de seleccionar un modelo ARIMA


particular y de estimar sus parámetros, se trata de ver luego si el modelo
seleccionado ajusta los datos en forma razonablemente buena, ya que es
posible que exita otro modelo ARIMA que también lo haga. Es por eso que
el disño de modelos ARIMA de BJ es un arte más que una ciencia; se
requiere gran habilidad para seleccionar el modelo ARIMA correcto. Una
simple prueba del modelo seleccionado es ver si los residuales estimados a
partir de este modelo son ruido blanco; si lo son, se puedde aceptar el ajuste
particular; si no lo son, se debe empezar nuevamente. Por tanto, la
metodología BJ es un proceso iterativo.

Paso 4. Predicción: una de las razones de la popularidad del proceso de modelación


ARIMA es su éxito en la predicción. En muchos casos las predicciones
obtenidas por este método son más confiables que aquellas obtenidas de la
elaboración tradicional de modelos para predicciones de corto plazo.

9
5. DATOS – SERIES ESTADÍSTICAS
Produccion de Papa en el Peru
(por Mes /en miles de toneladas metricas 1992-2004)
Fuente: Ministerio de Agricultura

Papa (En miles de toneladas métricas)


1992 Enero 68.5
Febrero 68.5
Marzo 84.1
Abril 143.7
Mayo 233
Junio 123.5
Julio 37.2
Agosto 21.9
Setiembre 50.1
Octubre 53.9
Noviembre 49.6
Diciembre 69.1

1993 Enero 59.4


Febrero 79.7
Marzo 105.1
Abril 220.3
Mayo 369.8
Junio 218
Julio 130.1
Agosto 51.4
Setiembre 58
Octubre 53.8
Noviembre 63.1
Diciembre 84

1994 Enero 65.08


Febrero 77.8
Marzo 157.88
Abril 313.61
Mayo 462.37
Junio 204.14
Julio 83.22
Agosto 53.41

10
Setiembre 61.03
Octubre 90.97
Noviembre 103.82
Diciembre 93.91
1995 Enero 126.61
Febrero 147.11
Marzo 177.15
Abril 372.35
Mayo 566.76
Junio 320.12
Julio 183.48
Agosto 90.31
Setiembre 88.78
Octubre 91.93
Noviembre 89.75
Diciembre 114.08

1996 Enero 74.72


Febrero 105.04
Marzo 179
Abril 407.44
Mayo 559.16
Junio 357.84
Julio 93.87
Agosto 70.6
Setiembre 75.78
Octubre 91.9
Noviembre 137.24
Diciembre 156.3

1997 Enero 84.01


Febrero 135.36
Marzo 201.66
Abril 442.25
Mayo 578
Junio 327.03
Julio 121.51
Agosto 72.59
Setiembre 79.85
Octubre 88.89
Noviembre 112.31
Diciembre 154.6

11
1998 Enero 121.22
Febrero 199.98
Marzo 318.66
Abril 610.64
Mayo 457.31
Junio 219.01
Julio 68.37
Agosto 54.66
Setiembre 77.76
Octubre 119.76
Noviembre 146.26
Diciembre 195.71

1999 Enero 148.4


Febrero 180.41
Marzo 307.55
Abril 516.52
Mayo 724.05
Junio 430.35
Julio 183.87
Agosto 102.04
Setiembre 95.91
Octubre 112.7
Noviembre 142.29
Diciembre 122.15

2000 Enero 151.9


Febrero 213.83
Marzo 384.51
Abril 657.74
Mayo 737.8
Junio 399.64
Julio 159.18
Agosto 66.07
Setiembre 80.42
Octubre 116.15
Noviembre 148.61
Diciembre 157.96

12
2001 Enero 98.48
Febrero 157.23
Marzo 246.06
Abril 460.84
Mayo 592.79
Junio 356.2
Julio 140.94
Agosto 110.21
Setiembre 90.41
Octubre 122.62
Noviembre 136.72
Diciembre 167.55

2002 Enero 178.72


Febrero 226.71
Marzo 321.82
Abril 608.83
Mayo 797.87
Junio 308.9
Julio 112.24
Agosto 91.14
Setiembre 119.43
Octubre 141.32
Noviembre 193.99
Diciembre 199.32

2003 Enero 167.23


Febrero 182.5
Marzo 305.19
Abril 644.61
Mayo 793.02
Junio 340.79
Julio 103.15
Agosto 85.59
Setiembre 111.35
Octubre 141.63
Noviembre 128.84
Diciembre 147.27

2004 Enero 213.73

13
Febrero 177.23
Marzo 286.61
Abril 520.62
Mayo 680.97
Junio 271.97
Julio 94.22
Agosto 101.1

14
6. APLICACIÓN: MODELO ARIMA PARA LA PRODUCCIÓN DE ARROZ EN EL
PERÚ: 1992-2004

6.1 Identificación y estimación

Dada la serie de producción de papa procedemos a identificar si es estacionaria en media y


varianza. A continuación, el gráfico del comportamiento de la serie original:

PRODUCCION DE PAPA 1992-2004


900
800

700

600
500

400
300
200
100

0
1992 1994 1996 1998 2000 2002 2004

PAPA

Es necesario comparar los resultados anteriores con los logaritmos de la serie original. A
continuación la serie logaritmica de la producción de papa:

15
PRODUCCION DE PAPA 1992-2204
Version Logaritmica
7

3
1994 1996 1998 2000 2002 2004

LPAPA

A primera vista podemos concluir que la estacionariedad en media y varianza se consigue


con la serie en primeras diferencias logarítmicas.

Para asegurarnos de esta conclusión, las series PAPA y LPAPA fueron evaluada con la
Prueba de Dickey-Fuller y el Filtro de Hodrick- Prescott:

Null Hypothesis: PAPA has a unit root


Exogenous: Constant
Lag Length: 12 (Automatic based on SIC, MAXLAG=13)
t-Statistic Prob.*
Augmented Dickey-Fuller test statistic -2.453654 0.1292
Test critical values: 1% level -3.477835
5% level -2.882279
10% level -2.577908
*MacKinnon (1996) one-sided p-values.

16
PAPA
Filtro Hodrick y Prescott
900
800
700

600
500

400
300
200
100
0
1992 1994 1996 1998 2000 2002 2004

PAPA HPTREND02

Los resultados del test estadístico de Dickey-Fuller nos muestran que la serie PAPA no es
estacionaria (raíz unitaria 2.453654 es menor a los valores arrojados al 99, 95 y 90% de
confianza) comprobando dicho resultado en el gráfico del filtro Hodrick-Prescott, que
muestra una tendencia no estable.

Null Hypothesis: LPAPA has a unit root


Exogenous: Constant
Lag Length: 12 (Automatic based on SIC, MAXLAG=13)
t-Statistic Prob.*
Augmented Dickey-Fuller test statistic -3.356215 0.0143
Test critical values: 1% level -3.477835
5% level -2.882279
10% level -2.577908
*MacKinnon (1996) one-sided p-values.

17
LPAPA
Filtro de Hodrick y Prescott
7

3
1994 1996 1998 2000 2002 2004

LPAPA HPTREND04

Los resultados del test estadístico de Dickey-Fuller nos muestran que la serie LPAPA
tampoco es estacionaria (raíz unitaria 3.356215 es menor a los valores arrojados al 99, 95 y
90% de confianza) comprobando dicho resultado en el gráfico del filtro Hodrick-Prescott,
que muestra una tendencia no estable.

Entonces, procederemos a la estimación de la primera diferencia de la serie LPAPA con el


fin de volverla estacionaria. A continuación el gráfico de la primera difeencia de la serie
LPAPA.

18
PRODUCCION DE LA PAPA 1992-2004
(D1LPAPA)
1.0

0.5

0.0

-0.5

-1.0

-1.5
1992 1994 1996 1998 2000 2002 2004

D1LPAPA

Para comprobar su estacionariedad, evaluamos D1LPAPA con las pruebas de Dickey-Fuller


y el Filtro de Hodrick-Prescott:

Null Hypothesis: D1LPAPA has a unit root


Exogenous: Constant
Lag Length: 11 (Automatic based on SIC, MAXLAG=13)
t-Statistic Prob.*
Augmented Dickey-Fuller test statistic -6.189278 0.0000
Test critical values: 1% level -3.477835
5% level -2.882279
10% level -2.577908
*MacKinnon (1996) one-sided p-values.

19
D1LPAPA
Filtro Holdrick y Prescott
1.0

0.5

0.0

-0.5

-1.0

-1.5
1992 1994 1996 1998 2000 2002 2004

D1LPAPA HPTREND01

Esta vez, las pruebas son concluyente. La raíz unitaria del test Dickey-Fuller muestra un
valor de 6.189278, siendo este mayor a los resultados que se muestran para el 99, 95 y 90%
de confianza , por lo tanto, la serie D1LPAPA es estacionaria. Graficamente podemos
comprobarlo con los resultados del filtro de Hodrick y Prescott presentado.

Sin embargo, dada la periodicidad mensual, debemos asegurarnos que la serie sea
estacionaria estacionalmente. Si observamos el gráfico para la serie original nos damos
cuenta que los meses de junio, julio, agosto y setiembre de todos loa años de la muestra se
producen descensos significativos.

Esto nos hace pensar que es probable que la serie no sea estacionaria estacionalmente. Si
evaluamos los resultados en la “fap” de la serie transformada D1LPAPA, observamos que
los retrados estacionales son significativos y disminuyen lentamente. Esto puede indicar
que la serie no es estacionaria estacionalmente por lo que decidimos transformar la serie
D1LPAPA tomando además una diferencia estacional.

20
Correlograma para la serie D1LPAPA

21
22
Para transformar la serie D1LPAPA con una diferencia estacional, generamos la serie
D1LPAPAZ. A continuación se presenta el gráfico correspondiente a esta nueva serie:

D1LPAPA CON UNA DIFERENCIA ESTACIONAL


D1LPAPAZ
.8

.6

.4

.2

.0

-.2

-.4

-.6

-.8
1992 1994 1996 1998 2000 2002 2004

D1LPAPAZ

Los valores obtenidos en la prueba Dickey-Fuller para la serie D1LPAPAZ verifican la


estacionariedad estacional de la nueva serie a utilizarse.

Null Hypothesis: D1LPAPAZ has a unit root


Exogenous: Constant
Lag Length: 11 (Automatic based on SIC, MAXLAG=13)
t-Statistic Prob.*
Augmented Dickey-Fuller test statistic -4.908317 0.0001
Test critical values: 1% level -3.482453
5% level -2.884291
10% level -2.578981
*MacKinnon (1996) one-sided p-values.

23
Esta estacionariedad conseguida en la serie D1LPAPAZ puede verificarse gráficamente con
el filtro de Hodrick y Prescott:

FILTRO HODRICK-PRESCOTT
D1LPAPAZ
.8

.6

.4

.2

.0

-.2

-.4

-.6

-.8
1992 1994 1996 1998 2000 2002 2004

D1LPAPAZ HPTREND01

24
Correlograma para la serie D1LPAPAZ

25
El valor del promedio móvil -MA(q)- se identifica a partir de los resultados de la columna
“Autocorrelation” del correlogramada de D1LPAPAZ presentado en la página anterior.
Según estos resultados observamos que la estacionalidad de la serie se repite cada 12
meses, donde los valores escapan a las bandas de confianza. Es por eso que se determina
que el valor q para la serie D1LPAPAZ es de q = 12.

Para poder identificar el valor p de la serie D1LPAPAZ, probaremos el modelo con valores
de AR de 4, 7 y 12. Esto debido a que para identificar p, debemos basarnos en los
resultados d e la columna “partial correlation”. Como observamos en el correlograma
anterior, es en los rezagos 4, 7 y 12, donde los valores se escapan de las bandas de
confianza. A estos rezagos se les sometera la prueba de t-student a fin de determinar su
representatividad en el modelo; asi también la prueba de Jarque-Bera para escoger el valor
correcto.

Como sabemos, el valor t-studen “ideal” debe ser igual o superior a dos (2); mientras que
el valor de Jarque-Bera debe ser menor a 5.99 al 95% de confianza.

26
AR (4) : Valor t-student de 0.519779, Jarque-Bera 2.395613. Se descarta esta opción.
Dependent Variable: D1LPAPAZ
Method: Least Squares
Date: 11/21/04 Time: 12:09
Sample(adjusted): 1993:06 2004:08
Included observations: 135 after adjusting endpoints
Convergence achieved after 6 iterations
Backcast: 1992:06 1993:05
Variable Coefficient Std. Error t-Statistic Prob.
C -0.001012 0.005528 -0.182986 0.8551
AR(4) -0.046005 0.088508 -0.519779 0.6041
MA(12) -0.874198 0.026835 -32.57708 0.0000
R-squared 0.463756 Mean dependent var -0.002188
Adjusted R-squared 0.455631 S.D. dependent var 0.285737
S.E. of regression 0.210821 Akaike info criterion -0.253646
Sum squared resid 5.866789 Schwarz criterion -0.189084
Log likelihood 20.12110 F-statistic 57.07832
Durbin-Watson stat 2.325918 Prob(F-statistic) 0.000000
Inverted AR Roots .33 -.33i .33 -.33i -.33+.33i -.33+.33i
Inverted MA Roots .99 .86+.49i .86 -.49i .49 -.86i
.49+.86i -.00 -.99i -.00+.99i -.49 -.86i
-.49+.86i -.86+.49i -.86 -.49i -.99

Analisis de los residuos AR(4)


20
Series: RESID
Sample 1993:06 2004:08
16 Observations 135

Mean -0.004017
12 Median 0.014686
Maximum 0.531621
Minimum -0.619186
8 Std. Dev. 0.209203
Skewness -0.265840
Kurtosis 3.378422
4
Jarque-Bera 2.395613
Probability 0.301856
0
-0.6 -0.4 -0.2 0.0 0.2 0.4

27
AR (7) : Valor t-student de 0.977198,. Jarque-Bera 2.286798. Se descarta esta opción.
Dependent Variable: D1LPAPAZ
Method: Least Squares
Date: 11/21/04 Time: 12:14
Sample(adjusted): 1993:09 2004:08
Included observations: 132 after adjusting endpoints
Convergence achieved after 7 iterations
Backcast: 1992:09 1993:08
Variable Coefficient Std. Error t-Statistic Prob.
C -0.000604 0.005248 -0.115110 0.9085
AR(7) -0.085223 0.087211 -0.977198 0.3303
MA(12) -0.890941 0.018979 -46.94366 0.0000
R-squared 0.482636 Mean dependent var -0.005202
Adjusted R-squared 0.474615 S.D. dependent var 0.280399
S.E. of regression 0.203243 Akaike info criterion -0.326363
Sum squared resid 5.328699 Schwarz criterion -0.260845
Log likelihood 24.53997 F-statistic 60.17051
Durbin-Watson stat 2.254576 Prob(F-statistic) 0.000000
Inverted AR Roots .63 -.31i .63+.31i .16 -.69i .16+.69i
-.44+.55i -.44 -.55i -.70
Inverted MA Roots .99 .86+.50i .86 -.50i .50 -.86i
.50+.86i .00 -.99i -.00+.99i -.50 -.86i
-.50+.86i -.86+.50i -.86 -.50i -.99

Analisis de los residuos AR(7)


20
Series: RESID
Sample 1993:06 2004:08
16 Observations 135

Mean -0.007963
12 Median 0.001611
Maximum 0.522770
Minimum -0.614603
8 Std. Dev. 0.208284
Skewness -0.270653
Kurtosis 3.336942
4
Jarque-Bera 2.286798
Probability 0.318734
0
-0.6 -0.4 -0.2 0.0 0.2 0.4

28
AR (12) : Valor t-student de 0.983700, Jarque-Bera 4.515518. Se descarta esta opción.

Dependent Variable: D1LPAPAZ


Method: Least Squares
Date: 11/21/04 Time: 12:15
Sample(adjusted): 1994:02 2004:08
Included observations: 127 after adjusting endpoints
Convergence achieved after 10 iterations
Backcast: 1993:02 1994:01
Variable Coefficient Std. Error t-Statistic Prob.
C -0.001762 0.005438 -0.323981 0.7465
AR(12) -0.091465 0.092980 -0.983700 0.3272
MA(12) -0.887954 0.019693 -45.09070 0.0000
R-squared 0.483599 Mean dependent var 0.000592
Adjusted R-squared 0.475270 S.D. dependent var 0.277604
S.E. of regression 0.201092 Akaike info criterion -0.346774
Sum squared resid 5.014292 Schwarz criterion -0.279588
Log likelihood 25.02013 F-statistic 58.06167
Durbin-Watson stat 2.323331 Prob(F-statistic) 0.000000
Inverted AR Roots .79 -.21i .79+.21i .58 -.58i .58+.58i
.21+.79i .21 -.79i -.21+.79i -.21 -.79i
-.58+.58i -.58 -.58i -.79 -.21i -.79+.21i
Inverted MA Roots .99 .86 -.50i .86+.50i .50 -.86i
.50+.86i .00+.99i -.00 -.99i -.50+.86i
-.50 -.86i -.86+.50i -.86 -.50i -.99

Analisis de los residuos con AR(12)


20
Series: RESID
Sample 1993:06 2004:08
16 Observations 135

Mean -0.002849
12 Median 0.006907
Maximum 0.512575
Minimum -0.617064
8 Std. Dev. 0.205699
Skewness -0.337532
Kurtosis 3.589107
4
Jarque-Bera 4.515518
Probability 0.104585
0
-0.6 -0.4 -0.2 0.0 0.2 0.4

29
Para poder conseguir, entonces, el valor p correcto, procedemos a realizar estimaciones,
con varios valores , siendo AR (1) la opción de mayor representatividad.

Dependent Variable: D1LPAPAZ


Method: Least Squares
Date: 11/21/04 Time: 12:30
Sample(adjusted): 1993:03 2004:08
Included observations: 138 after adjusting endpoints
Convergence achieved after 8 iterations
Backcast: 1992:03 1993:02
Variable Coefficient Std. Error t-Statistic Prob.
C -0.001531 0.004686 -0.326676 0.7444
AR(1) -0.178322 0.086400 -2.063917 0.0409
MA(12) -0.874834 0.026942 -32.47109 0.0000
R-squared 0.471140 Mean dependent var 0.000109
Adjusted R-squared 0.463305 S.D. dependent var 0.283220
S.E. of regression 0.207485 Akaike info criterion -0.286014
Sum squared resid 5.811768 Schwarz criterion -0.222378
Log likelihood 22.73493 F-statistic 60.13304
Durbin-Watson stat 1.998631 Prob(F-statistic) 0.000000
Inverted AR Roots -.18
Inverted MA Roots .99 .86+.49i .86 -.49i .49 -.86i
.49+.86i .00 -.99i -.00+.99i -.49 -.86i
-.49+.86i -.86+.49i -.86 -.49i -.99

Analisis de los residuos AR(1)


20
Series: RESID
Sample 1993:03 2004:08
16 Observations 138

Mean -5.63E-05
12 Median 0.016034
Maximum 0.529532
Minimum -0.645118
8 Std. Dev. 0.205965
Skewness -0.235590
Kurtosis 3.347772
4
Jarque-Bera 1.971998
Probability 0.373066
0
-0.6 -0.4 -0.2 0.0 0.2 0.4

Luego, dada la serie D1LPAPAZ queda identificada de la siguiente forma:

30
p = orden autoregresivo : AR(p)
En nuestro caso, p = 1

d = numero de diferenciaciones (orden de integración de la serie)


En nuestro caso, d = 1, pues se trabaja con la primera diferencia de LPAPA.

q = orden del promedio móvil: MA (q)


En nuestro caso, q = 2

ARIMA (1,1,2)

Es asi que el modelo más adecuado es un AR (1) x MA (12) para la serie en primeras
dierencias logaritmicas, con un R2 cercano al 50%, un Durbin-Watson de 1.998631 y un F-
estadistico de 60.13304. Ademas un valor t-student para AR(1) de 2.063917, un Jarque-
Bera de los residuos de 1.971998.

Para erificar que la serie en primeras diferencias es estacionaria, la evaluamos con la


prueba ADF. El valor de 4.88583 es mayor que los valores criticos.

Null Hypothesis: D1LPAPAZ has a unit root


Exogenous: Constant, Linear Trend
Lag Length: 11 (Automatic based on SIC, MAXLAG=13)
t-Statistic Prob.*
Augmented Dickey-Fuller test statistic -4.885083 0.0006
Test critical values: 1% level -4.031899
5% level -3.445590
10% level -3.147710
*MacKinnon (1996) one-sided p-values.

De la estimacion del modelo obtenemos los siguientes resultados:


AR(1) = -0.178322
MA (12) = -0.874834

Siendo la generalización del modelo:


D1LPAPAZ = -0.178322 D1LPAPAZt-1 +  t – 0.874834 t-12
6.2 Verificación de los coeficientes estimados: Prueba t

31
El t estadístico de AR(1) = -2.063917 y el t-student de tablas = 1.66
-2.0639417  > 1.66
El t estadístico de MA (12) = -32.47109 y el t-student de tablas = 1.66
-32.47109  > 1.66
Por ende ambos coeficientes son significativos.

6.3 Prueba de estacionariedad e invertibilidad

Los AR siempre son invertibles debemos verificar si son estacionarios.


AR(1)  < 1
-0.178322  < 1 AR(1) es estacionario

Los MA siempre son estacionarios debemos verificar si son invertibles.


MA(12)  < 1
-0.874834  < 1 MA (12) es invertible

6.4 Subidentificación y sobreidentificación

Los coeficientes tiene valores que no son cercanos ni a 0 ni a 1 por lo que no se presentan
problemas de subidenticación ni de sobreidentificación.

6.5 Multicolinealidad

Acudimos a la matriz de correlacion y obtenemos el siguiente resultado:


D1LPAPAZ D1LPAPAZ(-1)

D1LPAPAZ 1.000000 -0.097423


D1LPAPAZ(-1) -0.097423 1.000000

Como el valor de correlación es lejano a 1 no existe problema de multicolinealidad. Para


verigficar esta conclusión se halló también, el determinante de la matriz de correlacion,
siendo su valor de 0.990508759071, como este valor no es cercano a 0, no existe
multicolinealidad que afecte al modelo.

32
6.6 Análisis de los residuos: Distribución Normal

Analisis de los residuos AR(1)


20
Series: RESID
Sample 1993:03 2004:08
16 Observations 138

Mean -5.63E-05
12 Median 0.016034
Maximum 0.529532
Minimum -0.645118
8 Std. Dev. 0.205965
Skewness -0.235590
Kurtosis 3.347772
4
Jarque-Bera 1.971998
Probability 0.373066
0
-0.6 -0.4 -0.2 0.0 0.2 0.4

Observando el correlograma (página siguiente) de los residuos observamos una


distribución que sigue un ruido blanco. Apoyándonos en el histograma vemos que la media
tiende a 0 y la varianza tiene una valor constante. El estadístico de Jarque-Bera, muestra un
valor de 1.971998. Podemos concluir que los residuos siguen una distribución normal.

Correlograma para los residuos del modelo ARIMA (1,1,2) D1LPAPAZ

33
34
6.7 Prueba de incorrelación

Cuando se analiza una serie estacional, debe presentarse especial atención a los primeros
valores de las fas y fap, pero también a los rimeros valores de orden estacional. Así para
una serie mensual debemos observar los valores de los retardos 1 y 12.

Mediante la prueba de Qbox-Pierce  X2 con k-p-q, grados de libertad –(g.l).


Donde: k = número de rezagos, p = el orden autoregresivo y q = orden de promedio
móvil.
El arima que tenemos es de ARIMA(1,1,2)
p = 1 (AR)
d = 1 (orden de integración de la serie estacionaria estacionalmente)
q = 2 (MA)
k = número de rezagos

Del correlograma identificamos los valores Q de 1 y 12 (serie mensual) :


- El rezago 1 tienen un valor Q = 0.3995  X2 con k-p-q X2 (1-1-2) = 2 g.l.
2 g.l al 95% de confianza = 5.99147
Como Q = 0.3995 < 5.99147
y;
- El rezago 12 tienen un valor Q = 5.1953  X2 con k-p-q X2 (12-1-2) = 9 g.l.
9 g.l al 95% de confianza = 16.9190
Como Q = 5.1953 < 16.9190

Concluimos que los residuos no están correlacionados; por tanto, el modelo es adecuado.
Lo verificamos con el Test de Ramsey RESET. Este contraste tiene por finalidad analizar si
el modelo econométrico ha sido diseñado correctamente, para ello Ramsey (1969)
desarrollo una prueba que se basa en una distribución F con k-1 y n-k grados de libertad.
Probaremos la hipótesis de especificación mediante:

35
F RESET > Fk-1, n-k el modelo esta especificado erróneamente

Para nuestro modelo los resultados del test son los siguientes:

Ramsey RESET Test:


F-statistic 2.091007 Probability 0.150503
Log likelihood ratio 2.136796 Probability 0.143802

n = 151 n-k = 148


k=3 k-1 = 2
Con los grados de libertad apropiados tenemos: F3-1, 151-3 F2,148 el cual al 99 y 95% de
confianza son:
Al 99% de confianza F = 4.61 > 2.091007
Al 95 % de confianza F = 3.00 > 2.091007

De acuerdo a la prueba, nuestro modelo esta correctamente especificado pues se cumple


que F RESET es menor al Fk-1, n-k , por lo que no se necesita una reparametrización o
especificación alternativa.

36
Predicciones.-

LPAPA LPAPA2
4.631378 4.949698
4.634675 4.83356
4.635386 3.708956
4.635539 2.934852

Hallar et (1) = Yt - Y´t (1)


e04.09 -0.31832
e04.10 -0.198885
e04.11 1.700534
e04.12 1.700687

2004.09 4.949698 mas menos 1.96 -0.31832


´2004.10 4.83356 mas menos 1.96 -0.198885
2004.11 3.708956 mas menos 1.96 1.700534
2004.12 2.934852 mas menos 1.96 1.700687

Limtes superiores
2004.09 4.3257908 4.949698 5.5736052
´2004.10 4.4437454 4.83356 5.2233746
2004.11 7.04200264 3.708956 0.3759094
2004.12 6.26819852 2.934852 -0.3984945

Limites inferiores
2004.09 5.5736052
´2004.10 5.2233746
2004.11 0.37590936
-
2004.12 0.39849452

37

También podría gustarte