Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ECUACIONES DE DIFERENCIA
INTRODUCCIÓN
La teoría de las ecuaciones de diferencias subyace a todos los métodos de series de
tiempo empleados en los capítulos posteriores de este texto. Es justo decir que la
econometría de series temporales se refiere a la estimación de ecuaciones de
diferencias que contienen componentes estocásticos. El uso tradicional del análisis
de series de tiempo fue predecir la trayectoria temporal de una variable. Descubrir
el camino dinámico de una serie mejora las previsiones ya que los componentes
predecibles de la serie pueden extrapolarse en el futuro. El creciente interés por la
dinámica económica ha dado un nuevo énfasis a la econometría de series de
tiempo. Las ecuaciones de diferencia estocástica surgen, naturalmente, de modelos
económicos dinámicos. Las ecuaciones apropiadamente estimadas pueden ser
utilizadas para la interpretación de datos económicos y para la prueba de hipótesis.
Este capítulo introductorio tiene tres objetivos:
1. Explicar cómo las ecuaciones de diferencia estocástica pueden usarse para
pronosticar e ilustrar cómo estas ecuaciones pueden surgir de modelos
económicos familiares. El capítulo no pretende ser un tratado sobre la teoría
de las ecuaciones de diferencias; sólo se presentan las técnicas esenciales
para la estimación apropiada de modelos de series de tiempo lineales . Este
capítulo se centra en modelos de ecuaciones simples; los modelos
multivariados se consideran en los Capítulos 5 y 6 .
2. Explique qué significa resolver una ecuación de diferencia. La solución
determinará si una variable tiene una trayectoria de tiempo estable o
explosiva. El conocimiento de las condiciones de estabilidad es esencial para
comprender las innovaciones recientes en la econometría de series de
tiempo. La literatura de series temporales contemporáneas presta especial
atención a la cuestión de las variables estacionarias versus no
estacionarias. Las condiciones de estabilidad subyacen a las condiciones de
estacionariedad.
3. Demostrar cómo encontrar la solución a una ecuación de diferencia
estocástica. Hay varias técnicas diferentes que se pueden utilizar; cada uno
tiene sus propios méritos relativos. Se presentan varios ejemplos para
ayudarle a entender los diferentes métodos. Trate de trabajar
cuidadosamente en cada ejemplo. Para practicar más, debes hacer los
ejercicios al final del capítulo.
De manera similar, se puede obtener una ecuación de forma reducida para el PIB
sustituyendo (1.2) y (1.4) por (1.1) :
donde el β i son constantes (algunos de los cuales puede ser igual a cero) y los
elementos individuales de la secuencia { έ t } no son funciones de las y t . En este
punto, es útil permitir que la secuencia { έ t } sea nada más que una secuencia de
variables exógenas no especificadas. Por ejemplo, sea { έ t } un término de error
aleatorio y establezca β 0 = 1 y β 1 = β 2 = ... = 0; en este caso, (1.10) se convierte en la
ecuación de autorregresión
Es fácil llevar a cabo el álgebra y verificar que (1.12) es una identidad. Este ejemplo
simple también ilustra que la solución a una ecuación de diferencia no necesita ser
única; hay una solución para cualquier valor arbitrario de c .
Otro ejemplo útil es proporcionado por el término irregular mostrado en la Figura
1.1 ; recuerde que la ecuación para esta expresión es I t = 0.7 I t -1 + έ t . Puede
verificar que la solución a esta ecuación de primer orden es
Dado que (1.13) se mantiene para todos los períodos de tiempo, el valor de la
componente irregular en t - 1 viene dado por
Los dos lados de (1.15) son idénticos; esto demuestra que (1.13) es una solución a la
ecuación estocástica de primer orden I t = 0.7 I t -1 + έ t . Sea consciente de la
distinción entre las ecuaciones de forma reducida y las soluciones. Como I t =
0.7 I t -1 + έ t para todos los valores de t , se deduce que I t -1 = 0.7 I t -2 + έ t -1 . La
combinación de estas dos ecuaciones produce
Puede verificar fácilmente que para todo t > 0, los rendimientos repetidos de
iteración
Usted debe tomar unos minutos para convencerse de que (1.21) es una solución a
la ecuación de la diferencia original (1.17) ; la sustitución de (1.21) en (1.17) produce
una identidad. Sin embargo, (1.21) no es una solución única. Para cualquier valor
arbitrario de A , una solución a (1.17) está dada por
Para verificar que (1.22) es una solución para cualquier valor arbitrario de A ,
substituya (1.22) en (1.17) para obtener
Dado que los dos lados son idénticos, (1.22) es necesariamente una solución
a (1.17) .
Puesto que y 0 está dado, podemos ver (1.23) como el valor de A que hace (1.22) una
solución a (1.17) dada la condición inicial. Por lo tanto, la presencia de la condición
inicial elimina la arbitrariedad de A . La sustitución de este valor
de A por (1.22) produce
La simplificación de (1.24) resulta en
SECUENCIAS NO CONVERGENTES
Dado que | a 1 | <1, (1.21) es el valor límite de (1.20) cuando m crece infinitamente
grande. ¿Qué sucede con la solución en otras circunstancias? Si | a 1 | > 1, no es
posible moverse de (1.20) a (1.21) porque la expresión crece infinitamente
grande cuando t + m se acerca al infinito. Sin embargo, si hay una condición
1
Como usted debe verificar por iteración de y t de nuevo a y 0 , una solución a esta
ecuación es 2
La Metodología de la Solución
Los resultados del caso de primer orden son directamente aplicables a la ecuación
de orden ndada por (1.10) . En este caso general, será más difícil encontrar la
solución particular y habrá n soluciones homogéneas distintas. Sin embargo, la
metodología de la solución siempre implicará los cuatro pasos siguientes:
PASO 1 : Formar la ecuación homogénea y encontrar todas las n soluciones
homogéneas;
PASO 2 : Encuentre una solución particular;
PASO 3 : Obtener la solución general como la suma de la solución particular y una
combinación lineal de todas las soluciones homogéneas;
PASO 4 : Elimine la (s) constante (s) arbitraria (s) imponiendo la (s) condición
(es) inicial (es) en la solución general.
Antes de abordar las diversas técnicas que pueden utilizarse para obtener
soluciones homogéneas y particulares, vale la pena ilustrar la metodología
empleando la ecuación
Llevando a cabo el álgebra, 0.25 - 0.45 + 0.2 es igual a cero de manera que (0.5) t es
una solución a (1.29) . De la misma manera, es fácil verificar que es una
solución ya que
Dividir por (0,4) t -2 para obtener (0,4) 2 - 0,9 (0,4) + 0,2 = 0,16 - 0,36 + 0,2 = 0.
El segundo paso es obtener una solución particular; puede confirmar fácilmente
que la solución particular = 10 resuelve (1,28) como: 10 = 0,9 (10) - 0,2 (10) + 3.
El tercer paso es combinar la solución particular y una combinación lineal de
ambas soluciones homogéneas para obtener
GENERALIZANDO EL MÉTODO
Para demostrar que este método es aplicable a ecuaciones de orden superior,
considere la parte homogénea de (1.10) :
Como se muestra en la Sección 6 , hay n soluciones homogéneas que
satisfacen (1.30) . Por ahora, es suficiente para demostrar la siguiente
proposición: Si es una solución homogénea de (1.30) , es también una
solución para cualquier A constante arbitraria . Por suposición, resuelve la
ecuación homogénea para que
5. EL MODELO COBWEB
Una manera interesante de ilustrar la metodología esbozada en la sección anterior
es considerar una versión estocástica del modelo tradicional de telaraña. Dado
que el modelo fue desarrollado originalmente para explicar la volatilidad de los
precios agrícolas, deje que el mercado de un producto -digamos trigo- sea
representado por
Para entender la dinámica del sistema, supongamos que los agricultores de t plan
para producir la cantidad de equilibrio s . Sin embargo, deje que haya un choque de
suministro negativo de tal manera que la cantidad real producida resulte
ser s t . Como se muestra en el punto 1 de la figura 1.3 , los consumidores están
dispuestos a pagar p t por la cantidad s t ; por lo tanto, el equilibrio del mercado
en t ocurre en el punto 1. Actualizar un período nos permite ver el resultado
principal del modelo de telaraña. Para simplificar, suponga que todos los valores
posteriores del choque de suministro son cero (es decir, έ t +1 = έ t +2= ... = 0). Al
principio del período t + 1, los agricultores esperan que el precio en el momento de
la cosecha sea el precio del período anterior; Por lo tanto, . En
consecuencia, producen la cantidad s t +1 (véase el punto 2 en la figura); los
consumidores, sin embargo, están dispuestos a comprar la cantidad s t +1 sólo si el
precio cae a la indicada por p t +1 (véase el punto 3 en la figura). El siguiente período
comienza con los agricultores que esperan estar en el punto 4. El proceso se repite
continuamente hasta alcanzar el punto de equilibrio E.
Como se muestra, la Figura 1.3 sugiere que el mercado siempre convergerá hacia el
punto de equilibrio a largo plazo. Este resultado no es válido para todas las curvas
de demanda y oferta. Para derivar formalmente la condición de estabilidad,
combine (1.35) a (1.38) para obtener
y después de n periodos:
Dados los hallazgos en el caso de primer orden, debe sospechar que la solución
homogénea tiene la forma . La sustitución de esta solución de prueba
en (1.45) produce
Como α 1 y α 2 resuelven cada uno (1.45) , ambos términos entre paréntesis deben
ser iguales a cero. Como tal, la solución homogénea completa en el caso de segundo
orden es
Sin conocer los valores específicos de a 1 y a 2 , no podemos encontrar las dos raíces
características α 1 y α 2 . Sin embargo, es posible caracterizar la naturaleza de la
solución; tres casos posibles dependen del valor del discriminante d .
CASO 1
Si , d es un número real y habrá dos raíces características reales distintas. Por
lo tanto, hay dos soluciones separadas a la ecuación homogénea denotada por y
. Ya sabemos que cualquier combinación lineal de los dos es también una solución. Por lo
tanto,
Debe quedar claro que si el valor absoluto de cualquiera de alfa 1 o alfa 2 excede la unidad,
la solución homogénea explotará. La Hoja de trabajo 1.1 examina dos ecuaciones de
segundo orden que muestran raíces características reales y distintas. En el primer
ejemplo, y t = 0,2 y t -1 + 0,35 y t -2 , las raíces características se muestran como α 1 = 0,7
y α 2 = -0,5. Por lo tanto, la solución homogénea completa es + A 2 (-
0,5) . Dado que ambas raíces son menores que la unidad en valor absoluto, la solución
t
donde .
Como se muestra en el Apéndice 1.1 , puede usar el teorema de Moivre para escribir la
solución homogénea como
Por lo tanto, las raíces son imaginarias. La solución homogénea tiene la forma
Dado cos ( θ ), utilice una tabla trigonométrica o una calculadora para encontrar θ :
CONDICIONES DE ESTABILIDAD
Las condiciones generales de estabilidad pueden resumirse usando el
triángulo ABC en la Figura 1.5 . Arco A 0 B es el límite entre los Casos 1 y 3 ; es el
lugar de los puntos donde d = . La región por encima
de A 0 B corresponde al caso 1 (puesto que d > 0), y la región por debajo
de A 0 B corresponde al caso 3 (ya que d <0).
En el caso 1 (en el cual las raíces son reales y distintas), la estabilidad requiere que
la raíz más grande sea menor que la unidad y la raíz más pequeña sea mayor que -
1. La raíz característica más grande , será menor que la unidad si
Dados los resultados de la sección 4 , debe sospechar que cada solución homogénea
tiene la forma en la que A es una constante arbitraria. Por lo tanto, para
encontrar el valor (s) de α , buscamos la solución para
2. Puesto que los valores de a i pueden ser positivos o negativos, una condición
suficiente para que todas las raíces características se encuentren dentro del
círculo unitario es
3. Al menos una raíz característica es igual a unidad si
Cualquier secuencia que contenga una o más raíces características que igualen la
unidad se denomina proceso raíz unitaria .
4. Para una ecuación de tercer orden, las condiciones de estabilidad se pueden
escribir como
Mientras que (1 - a 1 - a 2 - ... - a n ) no es igual a cero, el valor de c dado por (1.59) es una
solución a (1.58) . Por lo tanto, la solución particular a (1.58) está dada por = a 0 / (1 -
a 1 - a 2- ... - a n ).
Si 1 - a 1 - a 2 - ... - a n = 0, el valor de c en (1.59) es indefinido; es necesario probar alguna
otra forma para la solución. La clave es que { y t } es un proceso de raíz unitaria si Σ a i = 1.
Puesto que { y t } no es convergente, es lógico que la solución constante no funcione. En su
lugar, recuerde las ecuaciones (1.12) y (1.26) ; estas soluciones sugieren que una tendencia
lineal puede aparecer en la solución de un proceso de raíz unitaria. Como tal, pruebe la
solución . Para ct para ser una solución debe ser el caso que
Para tratar de obtener una sensación intuitiva para la forma de la solución, observe que
si b = 0, (1.60) es un caso especial de (1.58) . Por lo tanto, debe esperar una constante para
aparecer en la solución particular. Además, la expresión d rt crece a la tasa constante r . Por
lo tanto, puede esperar que la solución particular tenga la forma ,
donde c 0 y c 1 son constantes. Si esta ecuación es realmente una solución, debería ser capaz
de sustituirla de nuevo en (1.60) y obtener una identidad. Haciendo las sustituciones
apropiadas, obtenemos
Ahora seleccione los valores de c 0 y c 1 para forzar la ecuación (1.63) para ser una
identidad para todos los valores posibles de t . Si combinamos todos los términos
constantes y todos los términos que implican t , los valores requeridos de c 0 y c 1 son
Por lo tanto, la solución particular también contendrá una tendencia temporal lineal. No
deberías tener ninguna dificultad para prever la técnica de solución si a 1 + a 2 = 1. En esta
circunstancia -que es aplicable también a casos de orden superior- intenta multiplicar la
solución de desafío original por t .
La ecuación (1.65) debe mantenerse para todos los valores de t y todos los valores
posibles de la secuencia { έ t }. Por lo tanto, cada una de las siguientes condiciones
debe contener:
Comparar este resultado con (1.21) ; verá que es precisamente la misma solución
que se encuentra usando el método iterativo. La solución general es la suma de esta
solución particular más la solución homogénea . Por lo tanto, la solución
general es
Una vez más, la solución puede depender sólo de una constante, los elementos de la
{ έ t } de secuencia, y t plantearon a la primera potencia. Como en el ejemplo
anterior, t no necesita ser incluido en la solución de desafío si la raíz característica
difiere de la unidad. Para reforzar este punto, utilice la solución de desafío dada
por (1.64) . Sustituir esta solución tentativa por (1.67) para obtener
Si se da y 0 , se sigue que
Hay varias condiciones necesarias y suficientes para que los valores de los α i 's para
hacer la ecuación por encima de una identidad para todas las realizaciones posibles
de la secuencia { έ t }:
Obsérvese que para cualquier valor de j ≥ 2, los coeficientes resuelven la ecuación
de diferencia de segundo orden α j = a 1 α j -1 + a 2 α j -2 . Puesto que sabemos α 0 y α 1 ,
podemos resolver para todos los α j iterativamente. Las propiedades de los
coeficientes serán precisamente las discutidas cuando se consideran soluciones
homogéneas:
1. La convergencia requiere que | a 2 | <1, a 1 + a 2 <1, y que a 2 - a 1 < 1 .
Obsérvese que la convergencia implica que los valores pasados de
la sucesión { έ t } tienen en última instancia una influencia sucesivamente
menor en el valor actual de y t .
2. Si los coeficientes convergen, la convergencia será directa o oscilatoria
si , seguirá un patrón seno / coseno si ,y
"explotará" y luego convergerá si . Ajustando apropiadamente
el α i , nos quedamos con la expresión restante:
La ecuación (1.69) debe ser igual a cero para todos los valores de t . Primero,
considere el caso en el que a 1 + a 2 ≠ 1. Puesto que (1 - a 1 - a 2 ) no desaparece, es
necesario establecer el valor de b 2 igual a cero. Dado que b 2 = 0 y que el coeficiente
de t debe ser igual a cero, se deduce que b 1 también se debe establecer igual a
cero. Finalmente, dado que b 1 = b 2 = 0, debemos establecer b 0 = a 0/ (1 - a 1 -
a 2 ). En cambio, si a 1 + a 2 = 1, las soluciones para el b i dependen de los valores
específicos de a 0 , a 1 y a 2 . El punto clave es que la condición de estabilidad para
la ecuación homogénea es precisamente la condición para la convergencia de la
solución particular. Si cualquier raíz característica de la ecuación homogénea es
igual a la unidad, aparecerá una tendencia polinomial en la solución
particular. El orden del polinomio es el número de raíces características
unitarias. Este resultado se generaliza a las ecuaciones de orden superior.
Si usted es realmente inteligente, puede combinar la discusión de la última sección
con el método de coeficientes indeterminados. Encuentre la porción determinista
de la solución particular usando las técnicas discutidas en la última sección. A
continuación, utilice el método de coeficientes indeterminados para encontrar la
parte estocástica de la solución particular. En (1.67) , por ejemplo,
establezca έ t = έ t -1 = 0 y obtenga la solución a 0 / (1 - a 1). Ahora utilice el método
de coeficientes indeterminados para encontrar la solución particular de y t = a 1 y t -
1 + έt + β 1 έ t -1 . Añada los componentes determinísticos y estocásticos para obtener
UN PROBLEMA RESUELTO
Para ilustrar la metodología usando una ecuación de segundo orden,
aumente (1.28) con el término estocástico έ t para que
Ya se ha verificado que las dos soluciones homogéneas son A 1 (0.5) t y A 2 (0.4) t y
que la porción determinista de la solución particular es = 10. Para encontrar la
porción estocástica de la solución particular, formar la solución de desafío
Dado que (1.71) debe mantenerse para todas las realizaciones posibles de έ t , έ t -
1 , έ t -2 , ..., cada una de las siguientes condiciones debe contener:
Aunque el álgebra se desorden, (1.75) y (1.76) pueden ser sustituidos en (1.74) para
eliminar las constantes arbitrarias:
9. OPERADORES DE LAG
Si no es importante conocer los valores reales de los coeficientes que aparecen en la
solución particular, a menudo es más conveniente utilizar operadores de retardo
que el método de coeficientes indeterminados. El operador de retardo L se
define como un operador linealtal que para cualquier valor y t
Como segundo ejemplo, los operadores de retardo pueden usarse para expresar la
ecuación y t = a 0 + a 1 y t -1 + ... + a p y t-p + έ t + β 1 έ t -1 + ... + β q έ t-q como
o
A partir de nuestro análisis anterior (véase también el apéndice 1.2 ), sabemos que
la condición de estabilidad es tal que las raíces características de la ecuación α n -
a 1 α n -1 - ... - a n = 0 están todas dentro del círculo unitario. Obsérvese que los
valores de α que resuelven la ecuación característica son los recíprocos de los
valores de L que resuelven la ecuación 1 - a 1L ... - a n L n = 0. De hecho, la expresión
1 - a 1 L ... - a nL n se denomina a menudo la ecuación característica inversa . Por lo
tanto, en la literatura, a menudo se afirma que la condición de estabilidad es que
las raíces características de (1 - a 1 L ... - a n L n ) estén fuera del círculo unitario.
En principio, se podría utilizar los operadores de retraso para obtener realmente
los coeficientes de la solución particular. Para ilustrar usando el caso de segundo
orden, considere y t = ( a 0 + έ t ) / (1 - a 1 L - a 2 L 2 ). Si supiéramos que los factores
de la ecuación cuadrática eran tales que (1 - a 1 L - a 2 L 2 ) = (1 - b 1 L ) (1 - b 2 L ),
podríamos escribir
Si tanto b 1 como b 2 son menores que la unidad en valor absoluto, podemos aplicar
la propiedad 5 para obtener
Como sugiere (1.82) , hay una solución orientada hacia el futuro a cualquier
ecuación de diferencia lineal. Este texto no hará mucho uso de la solución
orientada hacia el futuro ya que las realizaciones futuras de las variables
estocásticas no son directamente observables. Algunos de los detalles de las
soluciones orientadas hacia el futuro se pueden encontrar en el Manual
Complementario de este texto disponible en www.cba.ua.edu/~wenders o de
Wiley.
10. RESUMEN
La econometría de series temporales se refiere a la estimación de ecuaciones de
diferencias que contienen componentes estocásticos. Originalmente, se utilizaron
modelos de series temporales para la predicción. Descubrir la trayectoria dinámica
de una serie mejora las previsiones porque los componentes predecibles de la serie
se pueden extrapolar en el futuro. El creciente interés por la dinámica económica
ha dado un nuevo énfasis a la econometría de series de tiempo. Las ecuaciones de
diferencia estocástica surgen, naturalmente, de modelos económicos
dinámicos. Las ecuaciones apropiadamente estimadas pueden ser utilizadas para la
interpretación de datos económicos y para la prueba de hipótesis.
Este capítulo introductorio se centró en los métodos de "resolver" ecuaciones de
diferencia estocástica. Aunque la iteración puede ser útil, no es práctico en muchas
circunstancias. La solución a una ecuación de diferencia lineal se puede dividir en
dos partes: una solución particular y una solución homogénea . Un factor que
complica es que la solución homogénea no es única. La solución general es una
combinación lineal de la solución particular y todas las soluciones
homogéneas. Imponiendo n condiciones iniciales en la solución general de
una ecuación de orden n , se obtiene una solución única.
La porción homogénea de una ecuación de diferencias es una medida
del desequilibrio en el (los) período (s) inicial (es). La ecuación homogénea es
especialmente importante en cuanto que produce las raíces
características; un n ecuación th-orden tiene n raíces tan característicos. Si todas
las raíces características se encuentran dentro del círculo unitario, la serie será
convergente. Como se verá en el capítulo 2 , existe una relación directa entre las
condiciones de estabilidad y la cuestión de si una variable económica es
estacionaria o no estacionaria.
El método de los coeficientes indeterminados y el uso de los operadores de lag son
herramientas poderosas para obtener la solución particular. La solución particular
será una función lineal de los valores actuales y pasados del proceso de
forzamiento. Además, esta solución puede contener un término de intercepción y
una función polinómica del tiempo. Las raíces unitarias y las raíces características
fuera del círculo unitario requieren la imposición de una condición inicial para que
la solución particular sea significativa. Algunos modelos económicos permiten
soluciones orientadas hacia el futuro; en tales circunstancias, los acontecimientos
futuros previstos tienen consecuencias para el período actual.
Las herramientas desarrolladas en este capítulo están dirigidas a allanar el camino
para el estudio de la econometría de series de tiempo. Es una buena idea trabajar
todos los ejercicios presentados a continuación. Las raíces características, el
método de los coeficientes indeterminados, y los operadores de lag serán
encontrados a lo largo del resto del texto.
PREGUNTAS Y EJERCICIOS
1. Considere la ecuación de diferencia y t = a 0 + a 1 y t -1 con la condición
inicial y 0 . Jill resolvió la ecuación de diferencias haciendo una iteración
hacia atrás:
NOTAS FINALES
1 .. Otra posibilidad es obtener la solución orientada hacia el futuro. Dado que estamos tratando con
ecuaciones de predicción, las soluciones orientadas hacia el futuro no son importantes para
nuestros propósitos. Algunos de los detalles relativos a las soluciones orientadas hacia el futuro
están incluidos en el Manual Complementariodisponible en mi sitio
web: www.cba.ua.edu/~wenders .
2 .. Alternativamente, puede sustituir (1.26) en (1.17) . Tenga en cuenta que cuando έ t es una
perturbación aleatoria pura, y t = a 0 + y t -1 + έ t se denomina una caminata aleatoria más el modelo
de deriva.
Desde (A1.4) ,
3. Algunas de las raíces son complejas. Las raíces complejas (que vienen
necesariamente en pares conjugados) tienen la forma α i ± iθ ,
donde α i y θ son números reales e i se define como . Para cualquier par
de este tipo, una solución a la ecuación homogénea
es: A 1 ( α 1 + iθ ) t + A 2 ( α 1 - iθ ) t donde A 1 y A 2son constantes
arbitrarias. Transformando en coordenadas polares, las dos soluciones
asociadas pueden escribirse en la forma: β 1 r t cos ( θt + β 2 ) con constantes
arbitrarias β 1 y β 2 . Aquí la estabilidad depende de la magnitud de r t ; si
| r | <1, el sistema converge. Sin embargo, incluso si hay convergencia, la
convergencia no es directa porque las funciones seno y coseno imparten
comportamiento oscilatorio a la trayectoria temporal de y t . Por ejemplo, si
hay tres raíces, dos de las cuales son complejas, la solución homogénea tiene
la forma
CAPÍTULO 2
supuesto, el error de medición puede evitar que sepamos el valor "verdadero" del
PIB).
Para las variables discretas, la distribución de probabilidad de y t viene dada por
una fórmula (o tabla) que especifica cada posible valor realizado de y t y la
probabilidad asociada con esa realización. Si las realizaciones están enlazadas a
través del tiempo, existe la distribución de probabilidad
conjunta p ( y 1 = r 1 , y 2 = r 2 , ..., y T = r T ) donde r i es el valor realizado de yen el
período i . Habiendo observado la primera trealizaciones, podemos formar el valor
esperado de y t +1 , y t +2 , ..., condicionado a los valores observados de y 1 a y t . Esta
media condicional, o valor esperado, de y t + i se denota por E t [ y t + i | y t , y t -1 ,
..., y 1 ], o E t y t + i .
Por supuesto, si y t se refiere al resultado de girar una ruleta justa, la distribución de
probabilidad se caracteriza fácilmente. En contraste, es posible que nunca podamos
describir completamente la distribución de probabilidad para el PIB. Sin embargo,
la tarea de los teóricos económicos es desarrollar modelos que capten la esencia del
verdadero proceso generador de datos. Las ecuaciones de diferencia estocástica son
una manera conveniente de modelar procesos económicos dinámicos. Para tomar
un ejemplo simple, supongamos que el objetivo de la Reserva Federal de dinero
crece 3 por ciento cada año. Por lo tanto,
2. MODELOS ARMA
Es posible combinar un proceso de media móvil con una ecuación de diferencia
lineal para obtener un modelo de media móvil autorregresivo. Considere
la ecuación de diferencias de orden p
Ahora vamos { x t } el proceso MA ( q ) dado por (2.3) , para que podamos escribir
3. ESTACIONARIDAD
Suponga que la división de control de calidad de una empresa de fabricación
muestrea cuatro máquinas cada hora. Cada hora, el control de calidad encuentra la
media de los niveles de salida de las máquinas. La gráfica de la salida horaria de
cada máquina se muestra en la Figura 2.1 . Si Y se representa la máquina y i 's de
salida en la hora t , los medios se calculan fácilmente como
Para las horas 5, 10 y 15, estos valores medios son 4,61, 5,14 y 5,03,
respectivamente.
La varianza de la muestra para cada hora puede construirse de manera
similar. Desafortunadamente, los econometristas aplicados no suelen tener el lujo
de ser capaces de obtener un conjunto (es decir, datos de series temporales
múltiples del mismo proceso durante el mismo período de tiempo). Normalmente,
observamos sólo un conjunto de realizaciones para cualquier serie en
particular. Afortunadamente, si { y t } es una serie estacionaria , la media, la
varianza y las autocorrelaciones pueden usualmente serbien aproximados
por promedios de tiempo suficientemente largos basados en el conjunto único
de realizaciones. Supongamos que sólo observó la salida de la máquina 1 durante
20 períodos. Si supiera que la salida era estacionaria, podría aproximar el nivel
medio de producción
Al usar esta aproximación, estaría asumiendo que la media era la misma para cada
período. Formalmente, un proceso estocástico que tiene una media y una varianza
finitas es covarianza-estacionaria si para todo t y t - s ,
Comparando (2.11) y (2.12) , está claro que ambos medios son dependientes del
tiempo. Puesto que Ey t no es igual a Ey t + s , la secuencia no puede ser
estacionaria. Sin embargo, si tes grande, podemos considerar el valor límite
de y t en (2.10) . Si | a 1 | <1, la expresión ( a 1 ) t y 0 converge a cero cuando t se hace
infinitamente grande y la suma a 0 [1 + a 1 + ( a 1 ) 2+ ( a 1 ) 3 + ...] converge a un 0 / (1
- a 1 ). Así, como t → ∞ y si | a 1 | <1,
Ahora tome las expectativas de (2.13) para que para valores suficientemente
grandes de t , Ey t = a 0 / (1 - a 1 ). Así, el valor medio de y t es finito e independiente
del tiempo de modo que Ey t = Ey t-s = a 0 / (1 - a 1 ) ≡ μ para todo t . Volviendo a la
varianza, encontramos
que también es finito y tiempo-independiente. Finalmente, se demuestra
fácilmente que los valores límite de todas las autocovariancias son finitos e
independientes del tiempo:
De la sección anterior, sabemos que la solución homogénea debe ser cero. Como
tal, sólo es necesario encontrar la solución particular. Usando el método de
coeficientes indeterminados, podemos escribir la solución de desafío como
Para (2.17) ser una solución de (2.16) , los diversos c i deben satisfacer
Para hacer coincidir los coeficientes con los términos que contienen έ t , έ t -1 , έ t -2 ,
..., es necesario establecer
Observe que los coeficientes siguen una ecuación de diferencias de segundo orden con
raíces imaginarias. Si usamos el teorema de Moivre, los coeficientes satisfarán
Puede utilizar una tabla de trigonometría para verificar que la solución para β 2 es -1.197 y
la solución para β 1 es 2.739. Por lo tanto, el c i debe satisfacer
Puede utilizar una hoja de cálculo para verificar que los valores de c 0 a c 10 son:
Por lo tanto, todos los elementos en la secuencia { x t } tienen la misma media finita
( μ = 0).
2. ¿Es la varianza finita y independiente del tiempo? Forma var ( x t ) como
Si las raíces características de (2.21) están todas dentro del círculo unitario,
la secuencia { c i } será convergente. Aunque (2.20) es un proceso de media móvil
de orden infinito, la convergencia de los coeficientes MA implica que es
finito. Así, podemos usar (2.20) para verificar las tres condiciones de
estacionariedad. Desde (2.20) ,
Debería recordar en el capítulo 1 que una condición necesaria para que todas las
raíces características se encuentren dentro del círculo unitario es 1 - Σ a i > 0. Por lo
tanto, la media de la secuencia es finita e invariable en el tiempo.
Con muy poco esfuerzo, puede convencerse de que la secuencia { y t } satisface las
tres condiciones de estacionariedad. Cada una de las expresiones en el lado derecho
de (2.23) es estacionaria siempre y cuando las raíces de 1 - Σ a i L i estén fuera del
círculo unitario. Dado que { x t } es estacionario, sólo las raíces de la porción
autorregresiva de (2.22) determinan si la secuencia { y t } es estacionaria.
5. LA FUNCIÓN DE AUTOCORRELACIÓN
Las autocovariancias y autocorrelaciones del tipo encontrado en (2.18) sirven como
herramientas útiles en el enfoque de Box-Jenkins (1976) para identificar y estimar
modelos de series de tiempo. Se ilustran cuatro ejemplos importantes: los modelos
AR (1), AR (2), MA (1) y ARMA (1, 1). Para el modelo AR (1), y t = a 0 + a 1 y t -
1 + έ t , (2.14) muestra
en el ACF. Para que el proceso de segundo orden sea estacionario, sabemos que es
necesario restringir las raíces de (1 - a 1 L - a 2 L 2 ) para que estén fuera del círculo
unitario. En la Sección 4, derivamos las autocovariancias de un proceso ARMA (2,
1) mediante el uso del método de coeficientes indeterminados. Ahora queremos
ilustrar una técnica alternativa usando las ecuaciones de Yule-
Walker . Multiplique la ecuación de diferencia de segundo orden por y t-s para s =
0, s= 1, s = 2, ... y tome las expectativas para formar
Por definición, las autocovariancias de una serie estacionaria son tales que Ey t y t-
s = Ey t-s y t = Ey t-k y t-k-s = γ s . Sabemos también que Eέ t y t = σ 2 y Eέ t y t-s = 0. Por lo
Por lo tanto, al dividir cada γ s por γ 0 , se puede ver inmediatamente que el ACF es
simplemente ρ 0 = 1, ρ 1 = β / (1 + β 2 ) y ρ s = 0 para todo s > 1. El el tercer gráfico en
el lado izquierdo de la Figura 2.2 muestra el ACF para el proceso MA (1) y t = έ t -
0.7 έ t -1 . Como ejercicio, debe demostrar que el ACF para un proceso MA (2) tiene
dos picos y luego los cortes a cero.
Por lo tanto,
y ρ s = a 1 ρ s -1 para todo s ≥ 2.
Por lo tanto, la ACF para un ARMA (1, 1) el proceso es tal que la magnitud
de ρ 1 depende tanto de un 1 y ß 1 . Comenzando con este valor de ρ 1 , el ACF de un
proceso ARMA (1, 1) se parece al del proceso AR (1). Si 0 < a 1 <1, la convergencia
será directa, y si -1 < a 1 <0, las autocorrelaciones oscilarán. El ACF para la
función y t = -0,7 y t -1 + έ t - 0,7 έ t -1 se muestra como el último gráfico en el lado
izquierdo deFigura 2.2 . La parte superior de la Hoja de Trabajo 2.2 deriva estas
autocorrelaciones.
Los dejamos con el ejercicio de derivar el correlograma del proceso ARMA (2, 1)
utilizado en la Hoja de Trabajo 2.1 . Usted debe ser capaz de reconocer el punto en
el que el correlograma puede revelar el patrón de los coeficientes
autorregresivos. Para un modelo ARMA ( p , q ) que comienza después del
retraso q , los valores de ρ i satisfarán
Los valores de p anteriores pueden ser tratados como condiciones iniciales que
satisfacen las ecuaciones de Yule-Walker. Para estos rezagos, la forma de la ACF
viene determinada por la ecuación característica.
Paso 2 : Calcular las dos primeras autocorrelaciones parciales usando (2.35) y (2.36) . Por
lo tanto,
Paso 3 : Calcule todas las s restantes iterativamente usando (2.37) . Para encontrar 33 ,
observe que 21 = 11 - 22 11= -1.204 y forma
Como tal, el PACF no saltará a cero puesto que y t será correlacionado con todos sus
propios retrasos. En cambio, los coeficientes PACF exhiben un patrón de
decaimiento geométrico. Si β <0, la desintegración es directa, y si β > 0, los
coeficientes PACF oscilan.
La Hoja de Trabajo 2.2 ilustra el procedimiento usado para construir el PACF para
el modelo ARMA (1, 1) mostrado en el quinto panel en el lado derecho de la Figura
2.2 :
Para los procesos estacionarios, los puntos clave a tener en cuenta son los
siguientes:
1. El ACF de un proceso ARMA ( p , q ) comenzará a decaer después del
retardo q . Después del retardo q , los coeficientes del ACF (es decir, el ρ i )
satisfarán la ecuación de diferencia ( ρ i = a 1 ρ i -1 + a 2 ρ i -2 + ... + a p ρ i-
p ). Puesto que las raíces características están dentro del círculo unitario, las
+ β q L q ).
Podemos ilustrar la utilidad de las funciones ACF y PACF usando el
modelo y t = a 0 + 0.7 y t-1 + έ t . Si comparamos los dos primeros gráficos de
la Figura 2.2 , el ACF muestra la desintegración monótona de las autocorrelaciones
mientras que el PACF muestra el pico simple en el retardo 1. Supongamos que un
investigador recogió datos de muestra y trazó las funciones ACF y PACF. Si los
patrones reales se comparan favorablemente con los patrones teóricos, el
investigador podría tratar de estimar los datos usando un modelo AR
(1). Correspondientemente, si la ACF exhibió una sola punta y la PACF exhibió un
decaimiento monotónico (véase el tercer gráfico para el modelo y t= έ t - 0.7 έ t -1 ), el
investigador podría intentar un modelo MA (1).
La Tabla 2.2 presenta los resultados de las dos estimaciones. El coeficiente del
modelo 1 satisface la condición de estabilidad | a 1 | <1 y tiene un error estándar
bajo (el estadístico tasociado para un nulo de cero es más de 12). Como una
comprobación diagnóstica útil, trazamos el correlograma de los residuos del
modelo ajustado en la Figura 2.4 . Las estadísticas Q para estos residuos indican
que cada una de las autocorrelaciones es menor que dos desviaciones estándar de
cero. El Ljung-Box Q -statistics de estos residuos indica que como un grupo,
retardos 1 a 8, 1 a 16 y 1 a 24 no son significativamente diferentes de cero. Esto es
una fuerte evidencia de que el modelo AR (1) "se ajusta" bien a los datos. Después
de todo, si las autocorrelaciones residuales fueran significativas, el modelo AR (1)
no utilizaría toda la información disponible relativa a los movimientos en
la secuencia { y t }. Por ejemplo, supongamos que queremos
pronosticar y t +1 condicionada a toda la información disponible hasta el
período t inclusive . Con el Modelo 1, el valor de y t +1 es y t +1 = a 1 y t + έ t +1. Por lo
tanto, el pronóstico del Modelo 1 es a 1 y t . Si las autocorrelaciones residuales
hubieran sido significativas, este pronóstico no captaría toda la información
disponible.
Al examinar los resultados del Modelo 2, observe que ambos modelos producen
estimaciones similares para el coeficiente autorregresivo de primer orden y el error
estándar asociado. Sin embargo, la estimación para β 12 es de mala calidad; el
insignificante valor de t sugiere que debe ser eliminado del modelo. Por otra parte,
la comparación de la AIC y los valores de la SBC de los dos modelos sugiere que
cualquier beneficio de una suma reducida de cuadrado residuos es abrumado por
los efectos perjudiciales de la estimación de un parámetro adicional. Todos estos
indicadores apuntan a la elección del Modelo 1.
Notas :
3Para la comparabilidad, los valores AIC y SBC son reportados para estimaciones
que usaron sólo las observaciones 3 a 100. Si el AR (1) es estimado usando 99
observaciones, el AIC y el SBC son 502.3 y 504.9, respectivamente. Si el ARMA (1,
1) se estima utilizando 99 observaciones, el AIC y el SBC son 476,6 y 481,1,
respectivamente.
Al examinar la Tabla 2.3 , observe que todos los valores estimados de a 1 son
altamente significativos; cada uno de los valores estimados es al menos ocho
desviaciones estándar de cero. Está claro que el modelo AR (1) es
inapropiado. Las estadísticas Q para el modelo 1 indican que hay una
autocorrelación significativa en los residuos. El modelo ARMA (1, 1) estimado no
sufre este problema. Además, tanto el AIC como el SBC seleccionan el Modelo 2
sobre el Modelo 1.
El mismo tipo de razonamiento indica que el Modelo 2 es preferido al Modelo 3.
Obsérvese que para cada modelo, los coeficientes estimados son altamente
significativos y las estimaciones puntuales implican convergencia. Aunque la Q-
estadística en 24 lags indica que estos dos modelos no sufren de residuos
correlacionados, la Q- estadística en 8 lags indica correlación en serie en los
residuos del modelo 3. Así, el modelo AR (2) no captura de corto- así como el
modelo ARMA (1, 1). Observe también que el AIC y el SBC seleccionan el Modelo 2.
En general, el modelo parece ser adecuado. Sin embargo, los dos coeficientes AR
(2) son incapaces de capturar las correlaciones a muy largos retrasos. Por ejemplo,
las autocorrelaciones parciales de los residuos para los retardo 14 y 17 son ambas
mayores que 0,2 en valor absoluto. La estadística de Ljung-Box calculada para 16
rezagos es 24.6248 (que es significativa en el nivel 0.038). En este punto, podría
ser tentador intentar modelar la correlación en el retraso 16 incluyendo el término
de promedio móvil β 16 έ t -16 . Esta estimación resulta en: 2
Todos los coeficientes estimados son significativos y las estadísti- cas de Ljung-
Box Q para los residuos son todas insignificantes a niveles convencionales. Junto
con el hecho de que tanto la AIC como la SBC seleccionan este segundo modelo, el
investigador que no conoce el verdadero proceso podría estar tentado a concluir
que el proceso generador de datos incluye un término medio móvil con un retraso
16.
Una comprobación de modelo útil es dividir la muestra en dos partes. Si un
coeficiente está presente en el proceso generador de datos, su influencia debe verse
en ambas submuestras. Si la serie simulada se divide en dos partes, el ACF y PACF
usando las observaciones 50 a 100 siguen:
PARSIMONIA
Una idea fundamental en el enfoque de Box-Jenkins es el principio
de parsimonia. La parsimonia (que significa escasez o avaricia) debe ser una
segunda naturaleza para los economistas. La incorporación de coeficientes
adicionales necesariamente aumentará el ajuste (por ejemplo, el valor de R
$ ₂ $aumentará) a un costo de reducir los grados de libertad. Box y Jenkins
argumentan que los modelos parsimoniosos producen mejores pronósticos que los
modelos sobreparamétricos. Un modelo parsimonioso se ajusta bien a los datos sin
incorporar ningún coeficiente innecesario. Ciertamente, los pronosticadores no
quieren proyectar coeficientes mal estimados en el futuro. El objetivo es aproximar
el verdadero proceso generador de datos pero no precisar el proceso exacto. El
objetivo de la parsimonia sugiere eliminar el coeficiente MA (12) en el modelo de
AR (1) simulado anterior.
Al seleccionar un modelo apropiado, el econometrista debe tener en cuenta que
varios modelos diferentes pueden tener propiedades similares. Como ejemplo
extremo, tenga en cuenta que el modelo AR (1) y t = 0.5 y t -1 + έ t tiene la
representación media móvil equivalente de y t = έ t + 0.5 έ t -1 + 0.25 έ t -2 + 0.125 έ t -
3 + 0.0625 έ t -4 + .... Enla mayoría de las muestras, aproximándose a este proceso
MA (∞) con un modelo MA (2) o MA (3) dará un muy buen ajuste. Sin embargo, el
modelo AR (1) es el modelo más parsimonioso y se prefiere. Como ejercicio, debe
mostrar que este modelo AR (1) tiene la representación equivalente de y t = 0.25 y t -
2 + 0.5 έ t -1 + έ t .
También, esté enterado del problema común del factor. Supongamos que
queremos ajustar el modelo ARMA (2, 3)
ESTACIONARIEDAD E INVERTIBILIDAD
La teoría de distribución que subyace al uso de la muestra ACF y PACF como
aproximaciones a las del verdadero proceso generador de datos supone que
la secuencia { y t } es estacionaria. Por otra parte, t -statistics y Q- estadística
también suponen que los datos son estacionarios. Los coeficientes autorregresivos
estimados deben ser consistentes con esta suposición subyacente. Por lo tanto,
debemos sospechar de un modelo AR (1) si el valor estimado de a 1es cercano a la
unidad. Para un modelo ARMA (2, q ), las raíces características del polinomio
estimado (1 - a 1 L - a 2 L 2) debe estar fuera del círculo de la unidad.
Como se describe con mayor detalle en el Apéndice 2.1 , el enfoque de Box-Jenkins
también requiere que el modelo sea invertible. Formalmente, { y t } es invertible
si puede ser representado por un proceso autoregresivo de orden finito o
convergente. La Invertibilidad es importante porque el uso de la ACF y PACF
asume implícitamente que la secuencia { y t } puede ser representada por un
modelo autorregresivo. Como demostración, considere el modelo MA (1) simple:
BONDAD DE AJUSTE
Un buen modelo se ajustará bien a los datos. Obviamente, R 2 y la media de la suma
residual de cuadrados son medidas comunes de bondad de ajuste en mínimos
cuadrados ordinarios. El problema con estas medidas es que el ajuste mejora
necesariamente a medida que se incluyen más parámetros en el modelo. Parsimony
sugiere utilizar el AIC y / o SBC como medidas más apropiadas del ajuste general
del modelo. También sea cauteloso de las estimaciones que no pueden converger
rápidamente. La mayoría de los paquetes de software calculan los parámetros de
un modelo ARMA utilizando un procedimiento de búsqueda no lineal. Si la
búsqueda no puede converger rápidamente, es posible que los parámetros
estimados sean inestables. En tales circunstancias, añadir una o dos observaciones
adicionales puede alterar en gran medida las estimaciones.
2 , ..., έ t , έ t -1 , ...).
y utilizando (2,47) ,
De (2.47) y (2.48) debe quedar claro que es posible obtener toda la secuencia
de previsiones j-step-ahead por iteración directa. Considerar:
Si seguimos asumiendo que (1) todos los coeficientes son conocidos; (2) todas las
variables subcritas t , t - 1, t - 2, ... son conocidas en el periodo t ; y (3) E t έ t + j = 0
para j > 0, la expectativa condicional de y t +1 es
La ecuación (2.52) es la previsión de un paso adelante de y t +1 . El error de
pronóstico de un paso adelante es la diferencia entre y t +1 y E t y t +1 de manera
que e t (1) = έ t +1 . Para encontrar el pronóstico de dos pasos adelante,
actualizar (2.51) por dos períodos:
La expectativa condicional de y t +2 es
Debe quedar claro que los pronósticos de cualquier proceso estacionario ARMA
( p , q ) eventualmente satisfarán la ecuación de diferencias de orden p
que comprende la porción homogénea del modelo. Como tal, los pronósticos multi-
paso adelante convergerán a la media a largo plazo de la serie.
EVALUACIÓN DE PRONÓSTICOS
Ahora que ha estimado una serie y ha pronosticado sus valores futuros, la pregunta
obvia es: "¿Qué tan buenos son mis pronósticos?" Normalmente, habrá varios
modelos plausibles que puede seleccionar para utilizarlos en sus pronósticos. No se
deje engañar al pensar que el que tiene mejor ajuste es el que pronosticará lo
mejor. Para hacer un punto simple, suponga que quería pronosticar los valores
futuros del proceso ARMA (2, 1) dado por (2.51) . Si pudiera pronosticar el valor
de y T +1 usando (2.52) , obtendría el error de pronóstico de un paso adelante
Dado que el error de pronóstico es la parte puramente imprevisible de y T +1 , ningún
otro modelo ARMA puede proporcionarle un rendimiento de pronóstico
superior. Como tal, parece que el modelo "verdadero" proporcionará pronósticos
superiores a los de cualquier otro modelo posible. En la práctica, no conocerá el
orden real del proceso ARMA o los valores reales de los coeficientes de ese
proceso. En su lugar, para crear previsiones fuera de la muestra, es necesario
utilizar los coeficientes estimados de lo que usted cree que es la forma más
apropiada de un modelo ARMA. Deje que un "sombrero" o caret (^) sobre un
parámetro denote el valor estimado de un parámetro, y deje denotan los
residuos del modelo estimado. Por lo tanto, si usa el modelo estimado, el
pronóstico de un paso adelante será
error.
¿Cómo saber cuál de varios modelos razonables tiene el mejor rendimiento de
pronóstico? Una forma de responder a esta pregunta es poner los modelos
alternativos a una prueba de cabeza a cabeza. Dado que los valores futuros de la
serie son desconocidos, puede contener una parte de las observaciones del proceso
de estimación. Como tal, puede estimar los modelos alternativos sobre el lapso de
datos acortado y utilizar estas estimaciones para pronosticar las observaciones del
período de retención. A continuación, puede comparar las propiedades de los
errores de pronóstico de los dos modelos. Para tomar un ejemplo simple,
supongamos que { y t } contiene un total de 150 observaciones y que no está seguro
de si un modelo AR (1) o un modelo MA (1) capta mejor el comportamiento de la
serie.
Una forma de proceder es usar las primeras 100 observaciones para estimar ambos
modelos y usar cada uno para pronosticar el valor de y 101 . Puesto que usted conoce
el valor real de y 101 , puede construir el error de pronóstico obtenido del AR (1) y
del MA (1). Estos dos errores de pronóstico son precisamente los que alguien
habría hecho si hubieran estado haciendo un pronóstico de un paso adelante en el
período 100. Ahora, reestima un AR (1) y un modelo MA (1) usando las primeras
101 observaciones. Aunque los coeficientes estimados cambiarán algo, son los que
alguien habría obtenido en el período 101. Utilice los dos modelos para pronosticar
el valor de y 102 . Dado que usted sabe el valor real de y 102, puede construir otros dos
errores de pronóstico. Puesto que conoce todos los valores de la secuencia { y t }
hasta el período 150, puede continuar este proceso para obtener dos series de
errores de pronóstico de un paso adelante, cada uno con 50 observaciones. Para
mantener la notación simple, vamos { f 1 i } y { f 2 i } denotar la secuencia de
pronósticos del AR (1) y del MA (1), respectivamente. Si se entiende la notación,
debe quedar claro que f 11 = E 100 y 101 es el primer pronóstico usando el AR (1)
y f 2,50 es el último pronóstico del MA (1).
Obviamente, es deseable que los errores de pronóstico tengan una media cercana a
cero y una pequeña varianza. Un método basado en regresión para evaluar las
previsiones es utilizar las 50 previsiones de la AR (1) para estimar una ecuación de
la forma
Una vez más, si usas una prueba F , no deberías poder rechazar la hipótesis
conjunta b 0 = 0 yb 1 = 1. Si los niveles de significación de las dos pruebas F son
similares,podría seleccionar el modelo con la menor varianza residual; es decir,
seleccione AR (1) si var ( v 1 ) <var ( v 2 ). 5
En términos más generales, es posible que desee tener un período de retención que
difiera de 50 observaciones. Si tiene una muestra grande, es posible contener hasta
el 50 por ciento del conjunto de datos. También, es posible que desee utilizar j-
estep-ahead previsiones en lugar de un paso adelante previsiones. Por ejemplo, si
tiene datos trimestrales y desea pronosticar un año en el futuro, puede realizar el
análisis utilizando pronósticos de cuatro pasos adelante. Una vez que tenga las dos
secuencias de errores de pronóstico, puede comparar sus propiedades. Con una
muestra muy pequeña, puede no ser posible contener muchas
observaciones. Pequeñas muestras son un problema ya que Ashley (2003) mostró
que las muestras muy grandes a menudo son necesarios para revelar una diferencia
significativa entre los resultados de predicción fuera de la muestra de modelos
similares. Necesita tener suficientes observaciones para tener coeficientes bien
estimados para el período de la muestra y suficientes previsiones fuera de la
muestra para que la prueba tenga una buena potencia.
En lugar de centrarse en el sesgo, muchos investigadores seleccionarían el modelo
con el menor error de predicción cuadrática media (MSPE). Supongamos que
construye Hprevisiones de un paso adelante a partir de dos modelos
diferentes. Nuevamente, sea f 1 i las previsiones del Modelo 1 y f 2 i las previsiones del
Modelo 2. Dado que estamos usando previsiones de un paso adelante, podemos
suprimir el subíndice j y denotar las dos series de errores de predicciones
como e 1 i y e 2 i . Como tal, el MSPE del Modelo 1 se puede calcular como
Debe quedar claro que los dos errores de pronóstico están correlacionados. En
particular,
Dado que las dos primeras suposiciones anteriores son válidas, bajo la hipótesis
nula de igual exactitud de pronóstico, x i y z i no deben estar correlacionadas:
Notas :
Para asegurar la comparabilidad, se estimó cada ecuación durante el período
1961Q4-2008Q1.
Los valores entre paréntesis son los estadísticos t para la hipótesis nula de
que el coeficiente estimado es igual a cero. SSR es la suma de los residuos
cuadrados. Q ( n ) son el Ljung-Box Q- estadística de las autocorrelaciones
residuales.
11. TEMPORADA
Muchos procesos económicos exhiben alguna forma de estacionalidad. Los sectores
agrícola, de la construcción y de los viajes tienen patrones estacionales obvios que
resultan de su dependencia del tiempo. Del mismo modo, la temporada de
vacaciones de Acción de Gracias a Navidad tiene una influencia pronunciada en el
comercio minorista. De hecho, la variación estacional de una serie puede explicar la
preponderancia de su varianza total. Las previsiones que ignoran los patrones
estacionales importantes tendrán una alta varianza.
Demasiadas personas caen en la trampa de ignorar la estacionalidad si están
trabajando con datos desestacionalizados o ajustados
estacionalmente . Supongamos que usted recoge un conjunto de datos que la
Oficina del Censo de los Estados Unidos ha "ajustado estacionalmente" usando su
método X-11 o X-12. 8En principio, los datos estacionalmente ajustados deberían
tener el patrón estacional eliminado. Sin embargo, la precaución es
necesaria. Aunque un procedimiento estandarizado puede ser necesario para un
organismo gubernamental que reporte cientos de series, el procedimiento podría
no ser el mejor para un individuo que quiera modelar una sola serie. Incluso si
utiliza datos desestacionalizados, puede que se mantenga un patrón
estacional. Esto es particularmente cierto si no utiliza toda la gama de datos; la
porción de los datos utilizados en su estudio puede mostrar más (o menos)
estacionalidad que la duración total. Hay otra razón importante para preocuparse
por la estacionalidad cuando se usan datos desestacionalizados. Implícito en
cualquier método de ajuste estacional es un procedimiento de dos pasos. En primer
lugar, se elimina la estacionalidad y, en segundo lugar, se calculan los coeficientes
autorregresivos y de media móvil utilizandoBox-Jenkins técnicas. Como se observó
en Bell y Hillmer (1984), a menudo los coeficientes estacionales y ARMA se
identifican mejor y se estiman conjuntamente. En tales circunstancias, es
aconsejable evitar el uso de datos desestacionalizados.
La ecuación (2.67) difiere de (2.66) en que permite que el término de media móvil
en el retraso 1 interactúe con el efecto de media móvil estacional en el retraso 4. De
la misma manera, (2.68) permite que el término autorregresivo en el retardo 1
interactúan con el efecto autorregresivo estacional al retraso 4. Muchos
investigadores prefieren la forma multiplicativa ya que un rico patrón de
interacción puede ser capturado con un pequeño número de
coeficientes. Reescribir (2.67) as
DIFERENCIA ESTACIONAL
La temporada de compras de Navidad se acompaña de un número inusualmente
grande de transacciones, y la Reserva Federal amplía la oferta de dinero para dar
cabida a la creciente demanda de dinero. Como muestra la línea discontinua en
la Figura 2.7 , la oferta monetaria de Estados Unidos, medida por M1, tiene una
tendencia decididamente ascendente. La serie, llamada M1NSA, está contenida en
el archivo QUARTERLY.XLS. Puede utilizar los datos para seguir junto con la
discusión a continuación. El cambio logarítmico, mostrado por la línea continua,
parece ser estacionario. Sin embargo, hay un patrón estacional claro en que el valor
del cuarto trimestre para cualquier año es sustancialmente más alto que el de los
trimestres adyacentes.
Esta combinación de fuerte estacionalidad y no estacionabilidad se encuentra a
menudo en datos económicos. La ACF para un proceso con fuerte estacionalidad es
similar a la de un proceso no estacional; la diferencia principal es que los picos a los
retrasos s , 2 s , 3 s , ... no presentan decaimiento rápido. Sabemos que es necesario
diferenciar (o tomar el cambio logarítmico de) un proceso no estacionario. De
manera similar, si las autocorrelacioneslos retrasos no se deterioran, es necesario
tomar la diferencia estacional para que las otras autocorrelaciones no sean
empequeñecidas por los efectos estacionales. El ACF y PACF para la tasa de
crecimiento de M1 se muestran en el Panel (a) de la Figura 2.8 . Por ahora, solo
enfóquese en las autocorrelaciones en los retrasos estacionales. Todas las
autocorrelaciones estacionales son grandes y no muestran tendencia a decaer. En
particular, ρ 4 = 0,65, ρ 8 = 0,53, ρ 12 = 0,43, ρ 16 = 0,41, ρ 20 = 0,46 y ρ 24= 0,49. Estas
grandes autocorrelaciones reflejan el hecho de que el cambio en M1 de una
temporada de Navidad a la siguiente no es tan pronunciado como el cambio entre
el cuarto trimestre y otros trimestres.
Las previsiones fuera de la muestra se muestran en la Figura 2.9 . Para crear los
pronósticos de uno a doce pasos, se estimó el Modelo 1 durante todo el período de
muestreo 1961 Q 3-2008 Q 2. El modelo estimado es
Dado que m 2008 Q 2 = 4.092 × 10 -4 = y el residual para 2007 Q 3 fue -0.01231 (es
decir, = -0.01231), la previsión de m 2008 Q 3 es -0.00951. Ahora, utilice esta
previsión y el valor de pronosticar m 2008 Q 4 . Puede continuar de esta manera
para obtener los pronósticos fuera de la muestra para la secuencia { m t }. A pesar
de que no tiene los residuos para períodos posteriores a 2008 Q 2, simplemente
puede utilizar sus valores pronosticados de cero. El truco para pronosticar valores
futuros de M1 desde la { m t} es sumar los cambios y los cambios estacionales para
obtener el logaritmo de los valores pronosticados de M1. Como m t = (1 - L ) (1 - L 4 )
ln (M1 t ), se deduce que el valor de ln (M1 t ) puede obtenerse de m t + ln (M1 t -1 ) +
ln t _ { 4} ) - ln (M _ {1} t _ { 5} ). Los primeros 12 de los valores pronosticados se
representan en la Figura 2.9 .
Los procedimientos ilustrados en este ejemplo con datos altamente estacionales
son típicos de muchas otras series. Con datos altamente estacionales es necesario
complementar el método Box-Jenkins:
1. En la etapa de identificación, por lo general es necesario hacer una
diferencia estacional de los datos y verificar la ACF de la serie resultante. A
menudo, los datos estacionalmente diferenciados no serán estacionarios. En
tales casos, los datos también pueden necesitar ser diferenciados primero.
2. Utilice el ACF y el PACF para identificar modelos potenciales. Trate de
estimar los modelos con bajo orden de los coeficientes no estacionales
ARMA. Consideremos la estacionalidad aditiva y multiplicativa. Permitir
que la forma apropiada de estacionalidad sea determinada por las diversas
estadísticas de diagnóstico.
Se ha desarrollado una notación compacta que permite la representación eficiente
de modelos intrincados. Como en secciones anteriores, la d ª diferencia de una
serie se denota por Δ d . Por lo tanto,
Aunque los coeficientes de los modelos parecen ser diferentes, podemos probar
formalmente la igualdad de coeficientes usando (2.70) . Respectivamente, la suma
de cuadrados de residuos para las dos ecuaciones son SSR 1 = 27.564 y SSR 2 =
21.414. La estimación del modelo durante todo el período de la muestra da como
resultado SSR = 49.692. Dado que hay 191 observaciones utilizables en la
muestra yn = 5 (el intercepto más los cuatro coeficientes estimados), (2.70)
se convierte en
ROTURAS ENDÓGENAS
La prueba de Chow pregunta si hay un comienzo de ruptura en alguna fecha de
ruptura particular conocida t m . Una ruptura que ocurre en una fecha no pre-
especificada por el investigador se denomina una ruptura endógena para
denotar el hecho de que no fue el resultado de una fecha de ruptura fija como el 11
de septiembre. Para determinar si hay una interrupción en cualquier parte de la
muestra, puede realizar una prueba de Chow para cada fecha de ruptura
potencial t m . No debe sorprender que la fecha de ruptura que resulta en el mayor
valor de la F-statistic proporciona una estimación consistente de la fecha de
descanso real, si la hay. Con el fin de garantizar un adecuado número de
observaciones en cada una de las dos submuestras, es necesario tener un “recorte”
de tal manera que la ruptura no podría ocurrir antes de la primera t 0 observaciones
o después del último t - t 0 observaciones. En la investigación aplicada, es común
usar un valor de recorte del 10 por ciento para que haya al menos un 10 por ciento
de las observaciones en cada una de las dos submuestras. En ella tasa de interés se
extendió ejemplo, hay 191 observaciones utilizables en el 1960 Q 1-2008 Qperiodo 1
(ya que los dos primeros se pierden cuando se estima el coeficiente de s t -2 ). Si ha
utilizado un recorte del 10 por ciento, se puede comprobar si hay una rotura en
todo el intervalo de 1.965 Q 1-2003 Q 2 (cada uno de aproximadamente 19
observaciones desde el principio y el final de los datos
utilizables). Desafortunadamente, la búsqueda de la fecha de ruptura más probable
significa que el F- estadístico para la hipótesis nula de ninguna ruptura se
infla. Después de todo, acaba de buscar la fecha que lleva al valor máximo, o
supremum, de la muestra F -statistic. Como tal, la distribuciónF -statistic no es
estándar y no se puede obtener de un F -table tradicional . Andrews (1993) y
Andrews y Ploberger (1994) contienen valores críticos asintóticos para este tipo de
pruebas. Como se analizó en el capítulo 7 , Hansen (1997) muestra cómo obtener
los valores críticos apropiados usando métodos de
bootstrapping. Afortunadamente, una serie de paquetes de software puede realizar
fácilmente estas pruebas. 10
PARÁMETRO INESTABILIDAD
Observe que la prueba de Chow y sus variantes requieren que el investigador
especifique una fecha de interrupción particular y asuma que la ruptura se
manifiesta completamente en esa fecha. El intercepto, por ejemplo, es un 0 (1)
hasta t m y es precisamente un 0 (2) a partir de t m +1. Sin embargo, la suposición de
que una ruptura se produce exactamente en un momento dado puede no siempre
ser apropiada. Como se mencionó anteriormente, no hay una fecha concreta en la
que podamos decir que se ha producido un cambio climático significativo. Del
mismo modo, no está claro cómo podemos proporcionar una fecha específica de
descanso para denotar el advenimiento "desregulación financiera" en los mercados
de activos o para asignar una fecha específica para el desarrollo del
microordenador. Estos son procesos que han ido evolucionando con el
tiempo. Incluso si pudiéramos fechar el inicio preciso de la desregulación
financiera o la revolución informática, los efectos completos de estos cambios no
ocurrirían instantáneamente. Como tal, no debería sorprender que se hayan
desarrollado una serie de procedimientos que verifiquen la estabilidad de
parámetros sin la necesidad de identificar una fecha de interrupción
particular. Probablemente el método más simple es estimar el modelo
recursivamente. Por ejemplo, si tiene 150 observaciones, puede estimar el modelo
utilizando sólo las primeras, digamos 10, observaciones. Trazar los coeficientes
individuales y luego reestimar el modelo utilizando las primeras 11
observaciones. Puede seguir repitiendo este proceso hasta que utilice las 150
observaciones. En general, las parcelas de los coeficientes no serán planas ya que
los valores preliminares se estiman usando un número muy pequeño de
observaciones. Sin embargo, después de un período de "quemado", las gráficas de
tiempo de los coeficientes individuales pueden proporcionar evidencia de
estabilidad del coeficiente. Si la magnitud de un coeficiente de repente comienza a
cambiar, usted debe sospechar un cambio estructural en ese punto. Un cambio
sostenido en un coeficiente podría indicar un modelo de especificación
errónea. Una modificación particularmente útil de este procedimiento es trazar
cada coeficiente junto con su banda de desviación estándar estimada de 2. Las
bandas representan intervalos de confianza para los coeficientes estimados. De esta
manera, se puede ver si los coeficientes son siempre estadísticamente significativos
y si los coeficientes en los primeros períodos parecen ser estadísticamente
diferentes de los de los últimos períodos.
En cada paso a lo largo del camino, también es posible crear el error de pronóstico
de un paso adelante. Sea e t (1) el error de pronóstico de un paso adelante realizado
con todas las observaciones a través de t . En otras palabras, e t (1) es la diferencia
entre y t +1 y su predicción condicional de y t +1 (es decir, E t y t +1 ). Si empiezas con las
primeras 10 observaciones, el valor dee 10 (1) será y 11 - E 10 y 11 y el valor de e 149 (1)
será y 150 - E 149 y 150 . [Nota: si entiende la notación, debe quedar claro que no puede
crear el valor e 150 (1) ya que no tiene el valor de y 151.] Si su modelo se ajusta bien a
los datos, las previsiones deben ser imparciales de modo que la suma de estos
errores de pronóstico no debe ser "demasiado lejos" de cero. De hecho, Brown,
Durbin y Evans (1975) calculan si la suma acumulada de los errores de predicción
es estadísticamente diferente de cero. Para ser un poco más formal, defina
donde n denota la fecha del primer error de pronóstico que construyó, T denota la
fecha de la última observación en el conjunto de datos, y σ e es la desviación
estándar estimada de los errores de pronóstico. Con 150 observaciones totales ( T =
150), si inicia el procedimiento usando las 10 primeras observaciones ( n = 10), se
pueden crear 140 errores de pronóstico ( T- n ). Tenga en cuenta que α e se crea
utilizando todos los errores de pronóstico T - n . Comenzando con N = n , para
crear CUSUM 10, utilice las tres primeras observaciones para crear e 10 (1)
/ σ e . Ahora vamos a N = 11 y creamos CUSUM 11 como [ e 10 (1) + e 11 (1)] / σ e . Del
mismo modo, CUSUM T -1 = [ e 10 (1) + ... - e T -1 (1)] / σ e . Si utiliza el nivel de
significación del 5 por ciento, el valor de trazado de cada valor de CUSUM N debe
estar dentro de una banda de aproximadamente ± 0,948 [( T - n ) 0,5 + 2N - n ) ( T -
n ) - 0,5 ].
Si tuviera fuertes razones para creer que la ruptura ocurrió en el período 101,
podría formar una variable ficticia D t = 0 de t = 1 a 100 y D t = 1 a partir de
entonces. Para comprobar si hay un intervalo de intercepción,
Dado que el coeficiente de D t es muy significativo, se puede concluir que hubo una
interrupción en el intercepto. Para comprobar una ruptura en el coeficiente de
intersección y pendiente, también forma la variable D t y t -1 y estima:
En este caso particular, las variables dummy indican que hay una ruptura pero no
miden muy bien el tamaño de la ruptura. (Nota: La ruptura real en la intercepción
es +1,5 y la ruptura real en el coeficiente AR (1) es 0,15). El coeficiente para la
rotura de intersección no es significativo mientras que la ruptura en el coeficiente
de pendiente es altamente significativa. El F- estadístico para la hipótesis conjunta
que los coeficientes de D t y D t y t -1son iguales a cero es 29.568. Con 2 grados de
libertad en el numerador y 145 en el denominador, este valor es significativo a
cualquier nivel convencional. El punto importante es que se puede concluir que el
simple modelo AR (1) está mal especificado debido a una ruptura estructural.
Si desea estimar el valor más probable para t m , puede repetir la estimación para
cada período de tiempo en el intervalo 15 < t m <135. La suma de los cuadrados de
los residuos es menor para t m = 100. Aunque esta estimación consistente de la
fecha de la rotura resulta ser exactamente correcta, usted debe esperar una
discrepancia al usar datos reales.Obsérvese también que el test F (y
la estadística t de los coeficientes individuales) para la hipótesis nula de ningún
cambio estructural pueden ser probados usando el método de arranque de Hansen
(1997) (véase el capítulo 7 ).
PREGUNTAS Y EJERCICIOS
1. En el ejemplo de cointossing de la Sección 1 , sus ganancias promedio en los
últimos cuatro lanzamientos ( w t ) pueden ser denotados por
0. Encontrar:
1. E t -2 y t
2. E t -1 y t
3. E t y t +2
4. cov ( y t , y t -1 )
5. cov ( y t , y t -2 )
6. las autocorrelaciones parciales 11 y 22
1. Encuentra la función de respuesta al impulso. Dado y t -2 , trace los efectos de
un choque έ t en la secuencia { y t }.
2. Determine la función de pronóstico: E t y t + s . El error de predicción e t ( s ) es
la diferencia entre y t + s y E t y t + s . Deducir el correlograma de
la secuencia { e t ( s )}. ( Sugerencia : Encuentre E t E t ( s ), var [ e t ( s )],
y E t [ e t ( s ) e t ( s- j )] para j = 0 a s.)
3. Dos bolas diferentes se dibujan a partir de un tarro que contiene tres bolas
numeradas 1, 2 y 4. Sea x el número en la primera bola dibujada y y denote
la suma de las dos bolas dibujadas.
0. Hallar la distribución de probabilidad conjunta para x e y ; es decir,
encontrar prob ( x= 1, y = 3), prob ( x = 1, y = 5), ..., prob ( x = 4, y = 6).
1. Encuentre cada uno de los siguientes: E ( x ), E ( y ), E ( y | x = 1), E ( x | y =
5), var ( x| y = 5) y E ( y 2 ).
2. Consideremos las dos funciones w 1 = 3 x 2 y w 2 = x -1 . Hallar E ( w 1 + w 2 )
y E ( w 1+ w 2 | y = 3).
3. ¿Cómo cambiarían sus respuestas si las bolas fueran dibujadas con
reemplazo?
4. Sustituya (2.10) en y t = a 0 + a 1 y t -1 + έ t . Demuestre que la ecuación
resultante es una identidad.
0. Encuentre la solución homogénea en y t = a 0 + a 1 y t -1 + έ t .
1. Encuentre la solución particular dado que | a 1 | <1.
2. Muestre cómo obtener (2.10) combinando las soluciones homogéneas y
particulares.
5. La solución general a un n ecuación de diferencia th-orden
requiere n constantes arbitrarias. Considere la ecuación de segundo
orden y t = a 0 + 0.75 y t -1 - 0.125 y t -2 + έ t.
0. Encuentre las soluciones homogéneas y particulares. Discuta la forma de la
función de respuesta al impulso.
1. Encuentre los valores de las condiciones iniciales que aseguran que
la secuencia { y t } es estacionaria.
2. Dada su respuesta a la parte (b), obtenga el correlograma de
la secuencia { y t }.
6. Consideremos la ecuación de diferencia estocástica de segundo orden: y t =
1,5 y t -1 - 0,5 y t -2 + έ t .
0. Encuentre las raíces características de la ecuación homogénea.
1. Demostrar que las raíces de 1 - 1,5 L + 0,5 L 2 son los recíprocos de su
respuesta en la parte a.
2. Condiciones iniciales dadas para y 0 y y 1 , encuentra la solución para y t en
términos de los valores actuales y pasados de la { έ t secuencia}.
3. Encontrar la función de pronóstico para y T + s (es decir, encontrar la solución
para todos los valores de y T + s dados los valores de y T y y T -1 ).
4. Hallar Ey t , Ey t +1 , var ( y t ), var ( y t +1 ), y cov ( y t +1 , y t ).
7. A menudo hay varias representaciones para el mismo proceso de series de
tiempo. En el texto, la ecuación estándar para un modelo AR (1) está dada
por y t = a 0 + a 1 y t -1 + έ t .
0. Demuestre que una representación equivalente es y t = a 0 / (1 - a 1 )
+ μ t donde μ t = a 1 μ t -1 + έ t .
1. En el Capítulo 1 , se consideraron varios modelos con una tendencia
temporal determinista. Por ejemplo, una versión modificada de la ecuación
(1.62) es y t = a 0 + a 1 y t -1 + a 2 t + έ t donde | a 1 | <1. Explique por qué
la secuencia y t no es estacionaria. También explique por qué la secuencia y t es
estacionaria sobre la línea de tendencia a 0 + a 2 t . ¿Qué significa decir que
ely t secuencia es tendencia-estacionaria?
2. Verifxy que el proceso generado por y t = 16.2 + 0.2 t + μ t donde μ t =
0.95 μ t -1 + έ tes idéntico al proceso generado por y t = 1 + 0.95 y t -1 + 0.01 t + έ t .
3. Demuestre que el proceso estacionario de tendencia de primer
orden y t = a 0 + a 1 y t-1 + a 2 t + έ t donde | a 1 | <1 se puede escribir en la
forma y t = c 0 + c 1 t + μ t donde μ t = c 2 μ t -1 + έ t . Además, utilice el método de
coeficientes indeterminados para encontrar los valores dec _ { 0} , c _ { 1} y c _ { 2} .
8. El archivo titulado SIM_2.XLS contiene los conjuntos de datos simulados
utilizados en este capítulo. La primera serie, denominada Y1, contiene los
100 valores del proceso de AR (1) simulado utilizado en la Sección 7 . Utilice
esta serie para realizar las siguientes tareas ( Nota : Debido a diferencias en
el manejo de datos y el redondeo, sus respuestas sólo necesitan
aproximaciones a las presentadas aquí):
0. Trace la secuencia contra el tiempo. ¿La serie parece estar estacionaria?
1. Utilice los datos para verificar los resultados dados en la Tabla 2.2 .
2. Calcule la serie como un proceso AR (2) sin una intercepción. Usted debe
obtener:
donde SSR = suma de los residuos cuadrados, ln ( L ) = valor maximizado del log de
la función de verosimilitud = - ( T / 2) ln (2 π ) - ( T / 2) ln ( σ 2 ) σ 2 ) ( SSR ), y σ 2 =
varianza de los residuos.
0. Jennifer estima dos modelos diferentes durante el mismo período de tiempo
y se evalúa su ajuste utilizando la fórmula AIC * = -2 ln ( L ) / T + 2 n / T . Denota
los dos valores AIC * (1) y AIC * (2) y encuentra que AIC * (1) <AIC * (2). Justin
estima los mismos dos modelos durante el mismo período de tiempo pero evalúa el
ajuste usando la fórmula AIC = T ln ( SSR ) + 2 n . Demuestre que los resultados de
Justin deben ser tales que AIC (1) <AIC (2). Sugerencia : Dado que AIC * (1) <AIC
* (2), debe ser el caso de que ln (2 π ) + ln ( σ 1 2 ) + T (1 / σ 1 2( SSR 1 ) + 2 n 1 / T <ln
(2 π ) + ln ( σ 2 2 ) + T (1 / σ 2 2 ) ( SSR 2 ) + 2 n 2 / T donde n i , SSR i , y σ i 2 son el
número de parámetros, la suma de los residuos cuadrados y la varianza residual del
modelo i . Recordemos que la estimación de σ 2 es SSR / T. Si simplifica la relación
de desigualdad, debe encontrar que es equivalente a T ln ( SSR 1 ) + 2 n 1 < T ln
( SSR 2 ) + 2 n 2 .
1. Demuestre que los tres métodos de cálculo de la SBC necesariamente
seleccionarán el mismo modelo.
2. Seleccione uno de los tres pares anteriores. Demuestre que el AIC nunca
seleccionará un modelo más parsimonioso que el SBC.
14. El archivo denominado Y_BREAK.XLS contiene las 150 observaciones de la
serie construida como y t = 1 + 0.5 y t -1 + (1 + 0.1 y t -1 ) D t + έ t donde D t es
una variable dummy igual a 0 para t <101 e igual a 1,5 para t ≥ 101.
0. Explique cómo esta representación del modelo permite que el intercepto
salte de 1 a 2,5 y el coeficiente AR (1) para saltar de 0,5 a 0,65.
1. Utilice los datos para verificar los resultados informados en el texto.
2. ¿Por qué crees que la intercepción estimada cae realmente comenzando con
el período 101?
3. Calcule la serie como un proceso AR (2). ¿En qué sentido el modelo AR (2)
tiene mejores resultados que el modelo AR (1) estimado en la parte a?
4. Realizar una estimación recursiva del modelo AR (2) y trazar
el CUSUM s. ¿Es adecuado el modelo AR (2)?
15. El archivo CUARTERLY.XLS contiene la fuente de dinero de los EE.UU.
medida por M1 (M1NSA) y medida por M2 (M2NSA). Las series son
promedios trimestrales durante el período 1960 Q 1 a 2008 Q 2.
0. Reproducir los resultados para M1 que se informan en la Sección 11 del
texto.
1. ¿Cómo se comparan los tres modelos de M1 en el texto con un modelo con
un término AR (1) estacional con un término MA (1) aditivo?
2. Obtenga el ACF para la tasa de crecimiento de la serie M2NSA. ¿Qué tipo de
modelo es sugerido por el ACF?
3. Llame a la tasa de crecimiento estacionalmente diferenciada m 2 t . Estima
un modelo de AR (1) con un término MA estacional durante el período Q2 de Q a 3
de 2008 a Q2 de 2008 . Usted debe obtener: m 2 t = 0.5708 m 2 t -1 + έ t - 0.8547έ t -
4 . Demuestre que este modelo es preferible a (i) un AR (1) con un término AR
NOTAS FINALES
1 .. A menudo, la varianza se estima como
2 .. Como se analiza en el Apéndice 2.1 , la estimación de los coeficientes de MA retardados no
implica la pérdida de ninguna observación utilizable. Por lo tanto, los dos modelos se estiman en el
mismo período de muestra.
3 .. La mayoría de los programas de software no serán capaces de estimar (2.43) ya que no hay un
conjunto único de valores de parámetro que minimice la función de verosimilitud.
7 .. En un modelo AR ( p ) puro , también se pierde una observación por cada retraso. Dado que el
conjunto de datos comienza en 1960 Q 1, la estimación del modelo AR (7) puede comenzar no antes
de 1961 Q 4. Para asegurar la comparabilidad, todos los modelos reportados en la Tabla 2.4 fueron
estimados durante el mismo período de muestra. Obsérvese que no se pierden observaciones
utilizables en la estimación de modelos MA ( q ). Algunos programas de software inicializan los
valores de έ 1 , ..., έ q para que sean cero de modo que no se pierdan observaciones utilizables
adicionales. Otros serán “backcast” los valores iniciales de έ 1 , ..., έ q .
8 .. Los detalles de los procedimientos X-11 y X-12 no son importantes para nuestros propósitos. Los
detalles técnicos junto con varias versiones del procedimiento de ajuste estacional X-12-ARIMA se
pueden descargar de la página web del Buró del Censo: www.census.gov/srd/www/x12a/ .
9 .. Tal como se ha formulado, la prueba también puede detectar una ruptura en la varianza del
proceso de error. La estimación de un modelo AR ( p ) suele implicar una pérdida del número de
observaciones utilizables. Por lo tanto, para estimar un modelo utilizando T observaciones
utilizables será necesario tener un total de ( T + P ) observaciones. Obsérvese también que el
procedimiento esbozado requiere que el segundo período de la submuestra incorpore los valores
rezagados t m , t m -1 , ... t m -p + 1 .
10 .. Una discusión más detallada del método de arranque utilizado para obtener los valores críticos
se encuentra en el Capítulo 7 .
11 .. Una variante de la prueba, a menudo llamada CUSUM (2), es formar el CUSUM s usando los
errores al cuadrado. El uso de los errores al cuadrado puede ayudar a detectar cambios en la
varianza.
Seleccione p para minimizar FPE. Podemos utilizar los registros y tenga en cuenta
que ln (1 + P / T ) se puede aproximar por P / T . Por lo tanto, es posible
seleccionar p para minimizar
LA AIC Y LA SBC
La AIC más general selecciona los parámetros (1 + p + q ) de un modelo ARMA
para maximizar la función de probabilidad de log incluyendo una penalización para
cada parámetro estimado: