Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1
MARCO TEORICO
La papa (Solanum tuberosum) es originaria del altiplano de América del Sur, donde se
consume desde hace más de 8 mil años. Los exploradores españoles llevaron la planta a
Europa a fines del siglo XVI como una curiosidad botánica. Para el siglo XIX se había
expandido por todo el continente, proporcionando alimentación abundante y de bajo costo
a los trabajadores de la revolución industrial.
Actualmente, la papa es el cultivo alimenticio más importante del mundo, con una
producción anual cercana a los 300 millones de toneladas. Más de un tercio de la
producción global de papa proviene de los países en desarrollo. A comienzos de los 60s,
éstos producían apenas el 11 por ciento.
2
La producción mundial de papa ha crecido en los últimos 10 años. En el año 2000 fue de
308 millones de toneladas (anexo N°1), reflejando tendencias diferentes de la producción y
utilización de la papa en los países desarrollados y en desarrollo. La producción de papa
esta creciendo muy poco en los primeros, especialmente en Europa, mientras que en los
países en desarrollo esta aumentando y representa el 35% de la producción mundial.
Asia produce el 80% del volumen total de papa de los países en desarrollo. China,
representa el 20 % de la producción mundial. La expansión en estos países es tanto a nivel
de la oferta como de la demanda.
Fuente:
Compendio Estadístico Agrario 1990 - 1993 OIA - MINAG Producción Agrícola 1994 - 1999 OIA - MINAG
Estadística Agrícola Trimestral 2000 - 2001 OIA - MINAG
3
En el año 2000 la producción de papa en el Perú, represento el 1% de la producción
mundial.
Fuente:
Compendio Estadístico Agrario 1990 - 1993 OIA - MINAG
Producción Agrícola 1994 - 1999 OIA - MINAG
Estadística Agrícola Trimestral 2000 - 2001 OIA - MINAG
4
La exportación en el Perú de papa representó para el año 2000 un volumen aproximado de
3000 t y alrededor de 1 millón de dólares. El rubro que tiene mayor participación en el
volumen total exportado es la papa fresca, que representó el 95% del total en el año 2000.
Los derivados de la papa son exportados en volúmenes poco significativos.
Volumen
Productos
(t)
SubPartida
1996 1997 1998 1999 2000 2001
Total
1.063,6 2.111,1 67,1 68,1 2.971,3 3.646,9
Papa 74,3
0710100000 17,3 22,9 20,5 16,6 10,5
congelada
0712909000 Papas secas 27,6 26,5 -- -- 69,5 30,8
Harina de
1105100000 -- 0,6 0,2 0,1 0,3 ~
papa
Copos de
1105200000 41,5 4,6 0,4 2,1 4,7 1,6
papa
Fécula de
1108130000 4,8 4,7 1,2 34,9 29,5 14,0
papa
Papa
2005200000 preparada 5,1 8,4 -- 6,8 0,1 --
sin congelar
Valor FOB
Productos
(Miles de US$)
SubPartida
1996 1997 1998 1999 2000 2001
Total
226,7 270,4 36,6 90,6 789,1 1.096,7
0701900000 Papa fresca 63,4 151,8 6,9 6,2 619,9 1.024,4
Papa
0710100000 38,8 33,9 24,9 34,3 26,2 12,0
congelada
Papas
0712909000 46,8 45,4 -- -- 111,1 39,6
secas
Harina de
1105100000 -- 0,8 0,5 0,3 0,3 0,1
papa
Copos de
1105200000 57,9 10,5 1,5 0,7 3,3 2,7
papa
Fécula de
1108130000 8,2 11,1 2,7 27,1 28,2 17,9
papa
Papa
preparada
2005200000 11,6 16,9 -- 22,0 0,2 --
sin
congelar
Fuente: Superintendencia Nacional de Aduanas - ADUANAS
5
Las importaciones de papa son mas significativas que las exportaciones. En el año 2000 se
importaron aproximadamente 13000 toneladas de papa equivalentes a 6575 miles de
dólares. El principal rubro de importación en el periodo 1996 - 2001 lo representa la Fécula
de papa que fue equivalente al 70% del volumen total exportado para el año 2000.Sigue en
importancia la papa preparada congelada.
METODOLOGIA
Las series de tiempo han adquirido un uso tan frecuente e intensivo en la investigación
empírica, que los econometristas han empezado recientemente a prestar cuidadosa atención
a este tipo de información. En el curso de Econometría I, se hizo énfasis en un supuesto
implícito en el cual se basa el análisis de regresión que considera series de tiempo, esto es,
que dichas series son estacionarias.
6
Al efectuar la regresión de una variable de serie de tiempo sobre otra variable de serie de
tiempo, con frecuencia obtenemos un R2 muy elevado, aunque no haya una relación
significativa entre las dos. Esta situación ejemplifica el concepto de regresión espuria. Este
problema surge porque si las dos series de tiempo involucradas presentan tendencias
fuertes (movimientos sostenidos hacia arriba o hacia abajo), el alto R2 observado se debe a
la presencia de la tendencia y no a la verdadera relación entre las dos.
Pero surgen las siguientes preguntas. ¿Cómo se diseña un modelo para una serie de tiempo
estacionaria?, es decir, ¿qué clase de modelo de regresión se puede utilizar para describir
su comportamiento?, y ¿Cómo se utiliza el modelo estimado para fines de predicción,
sabiendo que la predicción es una parte importante del análisis econométrico?
En términos generales, hay cuatro enfoques para la predicción económica basados en series
de tiempo: (1) Los modelos de regresión uniecuacionales, (2) los modelos de regresión de
ecuaciones simultáneas, (3) los modelos autorregresivos integrados de media móvil
(ARIMA) y (4) los modelos de vectores autoregresivos (VAR).
7
4.2 Proceso autoregresivo integrado de media móvil (ARIMA)
El modelo de serie de tiempo analizado está basado en el supuesto de que las series de
tiempo consideradas son débilmente estacionarias. En otras palabras, la media y la varianza
para una serie de tiempo débilmente estacionaria son constantes y su covarianza es
invariante en el tiempo. Pero se sabe que muchas series de tiempo económicas son no
estacionarias, es decir, son integradas.
Sabemos que si una serie de tiempo es integrada de orden 1, sus primeras diferencias son
I(0), es decir, estacionarias. En forma similar, si una serie de tiempo es I(2), su segunda
diferencia es I(0). En general, si una serie de tiempo es I(d), después de difeenciarla d
veces se obtiene una serie I(0).
Si se debe diferenciar una serie de tiempo d veces para hacerla estacionaria y luego aplicar
a ésta el modelo ARMA (p,q), se dice que la serie de tiempo orgiginal es ARIMA (p,d,q) ,
es decir, es una serie de tiempo autorregresiva integrada de media móvil, donde p denota el
número de términos autorregresivos, d el número de veces de que la serie debe ser
diferenciada para hacerse estacionaria y q el numero de términos de media móvil.
8
tiempo y, particularmente, en períodos de tiempo futuro. Así la simple razón para requerir
información estacionaria es que cualquier modelo que sea inferido a partir de esta
información pueda ser interpretado como estacionario o estable, proporcionando, por
consiguiente, una base válida para predicción.
4.3 Metodología de Box-Jenkins (BJ)
9
5. DATOS – SERIES ESTADÍSTICAS
Produccion de Papa en el Peru
(por Mes /en miles de toneladas metricas 1992-2004)
Fuente: Ministerio de Agricultura
10
Setiembre 61.03
Octubre 90.97
Noviembre 103.82
Diciembre 93.91
1995 Enero 126.61
Febrero 147.11
Marzo 177.15
Abril 372.35
Mayo 566.76
Junio 320.12
Julio 183.48
Agosto 90.31
Setiembre 88.78
Octubre 91.93
Noviembre 89.75
Diciembre 114.08
11
1998 Enero 121.22
Febrero 199.98
Marzo 318.66
Abril 610.64
Mayo 457.31
Junio 219.01
Julio 68.37
Agosto 54.66
Setiembre 77.76
Octubre 119.76
Noviembre 146.26
Diciembre 195.71
12
2001 Enero 98.48
Febrero 157.23
Marzo 246.06
Abril 460.84
Mayo 592.79
Junio 356.2
Julio 140.94
Agosto 110.21
Setiembre 90.41
Octubre 122.62
Noviembre 136.72
Diciembre 167.55
13
Febrero 177.23
Marzo 286.61
Abril 520.62
Mayo 680.97
Junio 271.97
Julio 94.22
Agosto 101.1
14
6. APLICACIÓN: MODELO ARIMA PARA LA PRODUCCIÓN DE ARROZ EN EL
PERÚ: 1992-2004
700
600
500
400
300
200
100
0
1992 1994 1996 1998 2000 2002 2004
PAPA
Es necesario comparar los resultados anteriores con los logaritmos de la serie original. A
continuación la serie logaritmica de la producción de papa:
15
PRODUCCION DE PAPA 1992-2204
Version Logaritmica
7
3
1994 1996 1998 2000 2002 2004
LPAPA
Para asegurarnos de esta conclusión, las series PAPA y LPAPA fueron evaluada con la
Prueba de Dickey-Fuller y el Filtro de Hodrick- Prescott:
16
PAPA
Filtro Hodrick y Prescott
900
800
700
600
500
400
300
200
100
0
1992 1994 1996 1998 2000 2002 2004
PAPA HPTREND02
Los resultados del test estadístico de Dickey-Fuller nos muestran que la serie PAPA no es
estacionaria (raíz unitaria 2.453654 es menor a los valores arrojados al 99, 95 y 90% de
confianza) comprobando dicho resultado en el gráfico del filtro Hodrick-Prescott, que
muestra una tendencia no estable.
17
LPAPA
Filtro de Hodrick y Prescott
7
3
1994 1996 1998 2000 2002 2004
LPAPA HPTREND04
Los resultados del test estadístico de Dickey-Fuller nos muestran que la serie LPAPA
tampoco es estacionaria (raíz unitaria 3.356215 es menor a los valores arrojados al 99, 95 y
90% de confianza) comprobando dicho resultado en el gráfico del filtro Hodrick-Prescott,
que muestra una tendencia no estable.
18
PRODUCCION DE LA PAPA 1992-2004
(D1LPAPA)
1.0
0.5
0.0
-0.5
-1.0
-1.5
1992 1994 1996 1998 2000 2002 2004
D1LPAPA
19
D1LPAPA
Filtro Holdrick y Prescott
1.0
0.5
0.0
-0.5
-1.0
-1.5
1992 1994 1996 1998 2000 2002 2004
D1LPAPA HPTREND01
Esta vez, las pruebas son concluyente. La raíz unitaria del test Dickey-Fuller muestra un
valor de 6.189278, siendo este mayor a los resultados que se muestran para el 99, 95 y 90%
de confianza , por lo tanto, la serie D1LPAPA es estacionaria. Graficamente podemos
comprobarlo con los resultados del filtro de Hodrick y Prescott presentado.
Sin embargo, dada la periodicidad mensual, debemos asegurarnos que la serie sea
estacionaria estacionalmente. Si observamos el gráfico para la serie original nos damos
cuenta que los meses de junio, julio, agosto y setiembre de todos loa años de la muestra se
producen descensos significativos.
Esto nos hace pensar que es probable que la serie no sea estacionaria estacionalmente. Si
evaluamos los resultados en la “fap” de la serie transformada D1LPAPA, observamos que
los retrados estacionales son significativos y disminuyen lentamente. Esto puede indicar
que la serie no es estacionaria estacionalmente por lo que decidimos transformar la serie
D1LPAPA tomando además una diferencia estacional.
20
Correlograma para la serie D1LPAPA
21
22
Para transformar la serie D1LPAPA con una diferencia estacional, generamos la serie
D1LPAPAZ. A continuación se presenta el gráfico correspondiente a esta nueva serie:
.6
.4
.2
.0
-.2
-.4
-.6
-.8
1992 1994 1996 1998 2000 2002 2004
D1LPAPAZ
23
Esta estacionariedad conseguida en la serie D1LPAPAZ puede verificarse gráficamente con
el filtro de Hodrick y Prescott:
FILTRO HODRICK-PRESCOTT
D1LPAPAZ
.8
.6
.4
.2
.0
-.2
-.4
-.6
-.8
1992 1994 1996 1998 2000 2002 2004
D1LPAPAZ HPTREND01
24
Correlograma para la serie D1LPAPAZ
25
El valor del promedio móvil -MA(q)- se identifica a partir de los resultados de la columna
“Autocorrelation” del correlogramada de D1LPAPAZ presentado en la página anterior.
Según estos resultados observamos que la estacionalidad de la serie se repite cada 12
meses, donde los valores escapan a las bandas de confianza. Es por eso que se determina
que el valor q para la serie D1LPAPAZ es de q = 12.
Para poder identificar el valor p de la serie D1LPAPAZ, probaremos el modelo con valores
de AR de 4, 7 y 12. Esto debido a que para identificar p, debemos basarnos en los
resultados d e la columna “partial correlation”. Como observamos en el correlograma
anterior, es en los rezagos 4, 7 y 12, donde los valores se escapan de las bandas de
confianza. A estos rezagos se les sometera la prueba de t-student a fin de determinar su
representatividad en el modelo; asi también la prueba de Jarque-Bera para escoger el valor
correcto.
Como sabemos, el valor t-studen “ideal” debe ser igual o superior a dos (2); mientras que
el valor de Jarque-Bera debe ser menor a 5.99 al 95% de confianza.
26
AR (4) : Valor t-student de 0.519779, Jarque-Bera 2.395613. Se descarta esta opción.
Dependent Variable: D1LPAPAZ
Method: Least Squares
Date: 11/21/04 Time: 12:09
Sample(adjusted): 1993:06 2004:08
Included observations: 135 after adjusting endpoints
Convergence achieved after 6 iterations
Backcast: 1992:06 1993:05
Variable Coefficient Std. Error t-Statistic Prob.
C -0.001012 0.005528 -0.182986 0.8551
AR(4) -0.046005 0.088508 -0.519779 0.6041
MA(12) -0.874198 0.026835 -32.57708 0.0000
R-squared 0.463756 Mean dependent var -0.002188
Adjusted R-squared 0.455631 S.D. dependent var 0.285737
S.E. of regression 0.210821 Akaike info criterion -0.253646
Sum squared resid 5.866789 Schwarz criterion -0.189084
Log likelihood 20.12110 F-statistic 57.07832
Durbin-Watson stat 2.325918 Prob(F-statistic) 0.000000
Inverted AR Roots .33 -.33i .33 -.33i -.33+.33i -.33+.33i
Inverted MA Roots .99 .86+.49i .86 -.49i .49 -.86i
.49+.86i -.00 -.99i -.00+.99i -.49 -.86i
-.49+.86i -.86+.49i -.86 -.49i -.99
Mean -0.004017
12 Median 0.014686
Maximum 0.531621
Minimum -0.619186
8 Std. Dev. 0.209203
Skewness -0.265840
Kurtosis 3.378422
4
Jarque-Bera 2.395613
Probability 0.301856
0
-0.6 -0.4 -0.2 0.0 0.2 0.4
27
AR (7) : Valor t-student de 0.977198,. Jarque-Bera 2.286798. Se descarta esta opción.
Dependent Variable: D1LPAPAZ
Method: Least Squares
Date: 11/21/04 Time: 12:14
Sample(adjusted): 1993:09 2004:08
Included observations: 132 after adjusting endpoints
Convergence achieved after 7 iterations
Backcast: 1992:09 1993:08
Variable Coefficient Std. Error t-Statistic Prob.
C -0.000604 0.005248 -0.115110 0.9085
AR(7) -0.085223 0.087211 -0.977198 0.3303
MA(12) -0.890941 0.018979 -46.94366 0.0000
R-squared 0.482636 Mean dependent var -0.005202
Adjusted R-squared 0.474615 S.D. dependent var 0.280399
S.E. of regression 0.203243 Akaike info criterion -0.326363
Sum squared resid 5.328699 Schwarz criterion -0.260845
Log likelihood 24.53997 F-statistic 60.17051
Durbin-Watson stat 2.254576 Prob(F-statistic) 0.000000
Inverted AR Roots .63 -.31i .63+.31i .16 -.69i .16+.69i
-.44+.55i -.44 -.55i -.70
Inverted MA Roots .99 .86+.50i .86 -.50i .50 -.86i
.50+.86i .00 -.99i -.00+.99i -.50 -.86i
-.50+.86i -.86+.50i -.86 -.50i -.99
Mean -0.007963
12 Median 0.001611
Maximum 0.522770
Minimum -0.614603
8 Std. Dev. 0.208284
Skewness -0.270653
Kurtosis 3.336942
4
Jarque-Bera 2.286798
Probability 0.318734
0
-0.6 -0.4 -0.2 0.0 0.2 0.4
28
AR (12) : Valor t-student de 0.983700, Jarque-Bera 4.515518. Se descarta esta opción.
Mean -0.002849
12 Median 0.006907
Maximum 0.512575
Minimum -0.617064
8 Std. Dev. 0.205699
Skewness -0.337532
Kurtosis 3.589107
4
Jarque-Bera 4.515518
Probability 0.104585
0
-0.6 -0.4 -0.2 0.0 0.2 0.4
29
Para poder conseguir, entonces, el valor p correcto, procedemos a realizar estimaciones,
con varios valores , siendo AR (1) la opción de mayor representatividad.
Mean -5.63E-05
12 Median 0.016034
Maximum 0.529532
Minimum -0.645118
8 Std. Dev. 0.205965
Skewness -0.235590
Kurtosis 3.347772
4
Jarque-Bera 1.971998
Probability 0.373066
0
-0.6 -0.4 -0.2 0.0 0.2 0.4
30
p = orden autoregresivo : AR(p)
En nuestro caso, p = 1
ARIMA (1,1,2)
Es asi que el modelo más adecuado es un AR (1) x MA (12) para la serie en primeras
dierencias logaritmicas, con un R2 cercano al 50%, un Durbin-Watson de 1.998631 y un F-
estadistico de 60.13304. Ademas un valor t-student para AR(1) de 2.063917, un Jarque-
Bera de los residuos de 1.971998.
31
El t estadístico de AR(1) = -2.063917 y el t-student de tablas = 1.66
-2.0639417 > 1.66
El t estadístico de MA (12) = -32.47109 y el t-student de tablas = 1.66
-32.47109 > 1.66
Por ende ambos coeficientes son significativos.
Los coeficientes tiene valores que no son cercanos ni a 0 ni a 1 por lo que no se presentan
problemas de subidenticación ni de sobreidentificación.
6.5 Multicolinealidad
32
6.6 Análisis de los residuos: Distribución Normal
Mean -5.63E-05
12 Median 0.016034
Maximum 0.529532
Minimum -0.645118
8 Std. Dev. 0.205965
Skewness -0.235590
Kurtosis 3.347772
4
Jarque-Bera 1.971998
Probability 0.373066
0
-0.6 -0.4 -0.2 0.0 0.2 0.4
33
34
6.7 Prueba de incorrelación
Cuando se analiza una serie estacional, debe presentarse especial atención a los primeros
valores de las fas y fap, pero también a los rimeros valores de orden estacional. Así para
una serie mensual debemos observar los valores de los retardos 1 y 12.
Concluimos que los residuos no están correlacionados; por tanto, el modelo es adecuado.
Lo verificamos con el Test de Ramsey RESET. Este contraste tiene por finalidad analizar si
el modelo econométrico ha sido diseñado correctamente, para ello Ramsey (1969)
desarrollo una prueba que se basa en una distribución F con k-1 y n-k grados de libertad.
Probaremos la hipótesis de especificación mediante:
35
F RESET > Fk-1, n-k el modelo esta especificado erróneamente
Para nuestro modelo los resultados del test son los siguientes:
36
Predicciones.-
LPAPA LPAPA2
4.631378 4.949698
4.634675 4.83356
4.635386 3.708956
4.635539 2.934852
Limtes superiores
2004.09 4.3257908 4.949698 5.5736052
´2004.10 4.4437454 4.83356 5.2233746
2004.11 7.04200264 3.708956 0.3759094
2004.12 6.26819852 2.934852 -0.3984945
Limites inferiores
2004.09 5.5736052
´2004.10 5.2233746
2004.11 0.37590936
-
2004.12 0.39849452
37