Está en la página 1de 124

CAPÍTULO 1

ECUACIONES DE DIFERENCIA
INTRODUCCIÓN
La teoría de las ecuaciones de diferencias subyace a todos los métodos de series de
tiempo empleados en los capítulos posteriores de este texto. Es justo decir que la
econometría de series temporales se refiere a la estimación de ecuaciones de
diferencias que contienen componentes estocásticos. El uso tradicional del análisis
de series de tiempo fue predecir la trayectoria temporal de una variable. Descubrir
el camino dinámico de una serie mejora las previsiones ya que los componentes
predecibles de la serie pueden extrapolarse en el futuro. El creciente interés por la
dinámica económica ha dado un nuevo énfasis a la econometría de series de
tiempo. Las ecuaciones de diferencia estocástica surgen, naturalmente, de modelos
económicos dinámicos. Las ecuaciones apropiadamente estimadas pueden ser
utilizadas para la interpretación de datos económicos y para la prueba de hipótesis.
Este capítulo introductorio tiene tres objetivos:
1. Explicar cómo las ecuaciones de diferencia estocástica pueden usarse para
pronosticar e ilustrar cómo estas ecuaciones pueden surgir de modelos
económicos familiares. El capítulo no pretende ser un tratado sobre la teoría
de las ecuaciones de diferencias; sólo se presentan las técnicas esenciales
para la estimación apropiada de modelos de series de tiempo lineales . Este
capítulo se centra en modelos de ecuaciones simples; los modelos
multivariados se consideran en los Capítulos 5 y 6 .
2. Explique qué significa resolver una ecuación de diferencia. La solución
determinará si una variable tiene una trayectoria de tiempo estable o
explosiva. El conocimiento de las condiciones de estabilidad es esencial para
comprender las innovaciones recientes en la econometría de series de
tiempo. La literatura de series temporales contemporáneas presta especial
atención a la cuestión de las variables estacionarias versus no
estacionarias. Las condiciones de estabilidad subyacen a las condiciones de
estacionariedad.
3. Demostrar cómo encontrar la solución a una ecuación de diferencia
estocástica. Hay varias técnicas diferentes que se pueden utilizar; cada uno
tiene sus propios méritos relativos. Se presentan varios ejemplos para
ayudarle a entender los diferentes métodos. Trate de trabajar
cuidadosamente en cada ejemplo. Para practicar más, debes hacer los
ejercicios al final del capítulo.

1. MODELOS DE SERIE DE TIEMPO


La tarea que enfrenta el econometrista de la serie temporal moderna es desarrollar
modelos razonablemente simples capaces de pronosticar, interpretar y probar
hipótesis sobre datos económicos. El desafío ha crecido con el tiempo; el uso
original de la serie temporalel análisis fue principalmente como una ayuda a la
predicción. Como tal, se desarrolló una metodología para descomponer una serie
en una tendencia, un componente estacional, cíclico e irregular. El componente de
tendencia representaba el comportamiento a largo plazo de la serie y el
componente cíclico representaba los movimientos periódicos regulares. El
componente irregular fue estocástico y el objetivo del econometrista fue estimar y
pronosticar este componente.
Supongamos que observamos los 50 puntos de datos mostrados en la Figura 1.1y
están interesados en predecir los valores subsiguientes. Utilizando los métodos de
series de tiempo discutidos en los próximos capítulos, es posible descomponer esta
serie en los componentes tendenciales, estacionales e irregulares mostrados en el
panel inferior de la figura. Como puede ver, la tendencia cambia la media de la
serie, y el componente estacional imparte un patrón cíclico regular con picos que
ocurren cada 12 unidades de tiempo. En la práctica, la tendencia y los componentes
estacionales no serán las funciones determinísticas simplistas mostradas en esta
figura. La visión moderna sostiene que una serie contiene elementos estocásticos
en la tendencia, en la estacionalidad y en los componentes irregulares. Por el
momento, es aconsejable eludir estas complicaciones para que la proyección de la
tendencia y de los componentes estacionales en los períodos 51 y posteriores sea
directa.

FIGURA 1.1 Series de tiempo hipotéticas

Observe que el componente irregular, aunque carece de un patrón bien definido, es


algo predecible. Si examina la figura de cerca, verá que los valores positivos y
negativos se producen en las ejecuciones; la ocurrencia de un valor grande en
cualquier período tiende a ser seguido por otro gran valor. Las previsiones a corto
plazo harán uso de esta correlación positiva en el componente irregular. En todo el
tramo, sin embargo, el componente irregular exhibe una tendencia a volver a
cero. Como se muestra en la parte inferior, la proyección del componente irregular
después del periodo 50 se desintegra rápidamente hacia cero. La previsión general,
que se muestra en la parte superior de la figura, es la suma de cada componente
previsto.
La metodología general usada para hacer tales predicciones implica encontrar
la ecuación del movimiento que conduce un proceso estocástico y usar esa ecuación
para predecir resultados subsecuentes. Vamos y t denota el valor de un punto de
datos en tiempo t ; si usamos esta notación, el ejemplo de la figura 1.1 supone que
observamos y 1 a y 50 . Para t = 1 a 50, las ecuaciones de movimiento utilizadas para
construir componentes de las series y t son

donde : T t = valor de la componente de tendencia en el período t


S t = valor de la componente estacional en t
I t = el valor de la componente irregular en t
έ t = una perturbación aleatoria pura en t

Así, la perturbación irregular en t es 70 por ciento de la perturbación irregular del


período anterior más un término de perturbación aleatoria.
Cada una de estas tres ecuaciones es un tipo de ecuación de diferencia. En su
forma más general, una ecuación de diferencia expresa el valor de una variable
como una función de sus propios valores rezagados, tiempo y otras variables. La
tendencia y los términos estacionales son funciones del tiempo y el término
irregular es una función de su propio valor retrasado y de la variable
estocástica έ t . La razón para introducir este conjunto de ecuaciones es hacer el
punto que la econometría de series de tiempo se refiere a la estimación de
ecuaciones de diferencias que contienen componentes estocásticos. El
econometrista de la serie temporal puede estimar las propiedades de una sola serie
o un vector que contiene muchas series interdependientes. En el texto se presentan
métodos de pronóstico univariante y multivariado. El capítulo 2 muestra cómo
estimar la parte irregular de una serie. El capítulo 3considera la estimación de la
varianza cuando los datos muestran periodos de volatilidad y tranquilidad. La
estimación de la tendencia se considera en el capítulo 4 , que se centra en la
cuestión de si la tendencia es determinista o estocástica. El capítulo 5 discute las
propiedades de un vector de ecuaciones de diferencia estocástica, y el capítulo 6 se
refiere a la estimación de tendencias en un modelo multivariado. Capítulo
7 introduce el nuevo y creciente área de investigación que involucra modelos de
series de tiempo no lineales.
Aunque la predicción siempre ha sido el pilar del análisis de series de tiempo, la
creciente importancia de la dinámica económica ha generado nuevos usos para el
análisis de series de tiempo. Muchas teorías económicas tienen representaciones
naturales como ecuaciones de diferencia estocástica. Además, muchos de estos
modelos tienen implicaciones comprobablesrelativa a la trayectoria temporal de
una variable económica clave. Considere los siguientes cuatro ejemplos:
1. Hipótesis de Camino Aleatorio : En su forma más simple, el modelo de
caminata aleatoria sugiere que los cambios diarios en el precio de una acción
deben tener un valor medio de cero. Después de todo, si se sabe que una
ganancia de capital puede hacerse comprando una acción el día t y
vendiéndola para un beneficio esperado al día siguiente, la especulación
eficiente aumentará el precio actual. Del mismo modo, nadie querrá
mantener una acción si se espera que se deprecie. Formalmente, el modelo
afirma que el precio de una acción debería evolucionar de acuerdo con la
ecuación de diferencia estocástica

donde y t = el precio de una acción de stock en el día t , y έ t + 1 = un término de


perturbación aleatoria que tiene un valor esperado de cero.
Ahora consideremos la ecuación de diferencia estocástica más general

La hipótesis de la marcha aleatoria requiere la restricción comprobable: α 0 = α 1 = 0.


Rechazar esta restricción equivale a rechazar la teoría. Dada la información
disponible en el período t , la teoría también requiere que la media de έ t +1 sea igual
a cero; la evidencia de que έ t +1 es predecible invalida la hipótesis de caminata
aleatoria. Una vez más, la estimación apropiada de un único modelo de ecuación se
considera en los capítulos 2 a 4 .
2. Ecuaciones Estructurales y de Forma Reducida : A menudo es útil
colapsar un sistema de ecuaciones de diferencia en modelos separados de
una sola ecuación. Para ilustrar las cuestiones clave involucradas, considere
una versión estocástica del modelo clásico de Samuelson (1939):

donde y t , c t , e i t representan el PIB real, el consumo y la inversión en el


período t , respectivamente. En este modelo keynesiano, y t , c t , e i t son variables
endógenas. El PIB y el consumo del período anterior, y t -1 y c t -1 , se denominan
variables endógenas predeterminadas o retardadas. Los
términos varepsilon ct y varepsilon que son cero perturbaciones aleatorias de medias
para el consumo y la inversión, y los coeficientes alfay β son parámetros a estimar.
La primera ecuación equipara la producción agregada (PIB) con la suma del
consumo y el gasto de inversión. La segunda ecuación afirma que el gasto de
consumo es proporcional al PIB del período anterior más un término de
perturbación aleatoria. La tercera ecuación ilustra el aceleradorprincipio. El gasto de
inversión es proporcional al cambio en el consumo; la idea es que el crecimiento del
consumo requiere nuevos gastos de inversión. Los términos de
error varepsilon ct y varepsilon que representan las porciones del consumo y la
inversión no explicada por las ecuaciones de comportamiento del modelo.
La ecuación (1.3) es una ecuación estructural ya que expresa la variable
endógena i tcomo dependiente de la realización actual de otra variable
endógena, c t . Una ecuación de forma reducida es aquella que expresa el valor de
una variable en términos de sus propios rezagos, rezagos de otras variables
endógenas, valores actuales y pasados de variables exógenas y términos de
perturbación. Tal como está formulado, la función de consumo ya está en forma
reducida; el consumo de corriente sólo depende de los ingresos rezagados y del
valor actual del término de perturbación estocástica έ ct . La inversión no está en
forma reducida porque depende del consumo del período actual.
Para derivar una ecuación de forma reducida para la inversión, sustituir (1.2) en la
ecuación de inversión para obtener

Observe que la ecuación de forma reducida para la inversión no es única. Se puede


retrasar (1.2) un período para obtener: c t -1 = αy t -2 + έ ct -1 . Usando esta expresión, la
ecuación de inversión de forma reducida también puede escribirse como

De manera similar, se puede obtener una ecuación de forma reducida para el PIB
sustituyendo (1.2) y (1.4) por (1.1) :

La ecuación (1.5) es una ecuación univariada de forma reducida; y t se expresa


únicamente como una función de sus propios retardos y términos de
perturbación. Un modelo univariado es particularmente útil para la predicción, ya
que le permite predecir una serie basada únicamente en sus propias realizaciones
actuales y pasadas. Es posible estimar (1.5) utilizando las técnicas de series de
tiempo univariadas explicadas en los Capítulos 2 a 4 . Una vez que se han obtenido
estimaciones de α y β , es sencillo utilizar los valores observados de y 1 a y t para
predecir todos los valores futuros de la serie (es decir,y t +1 , y t + 2 , ...).
El capítulo 5 considera la estimación de modelos multivariados cuando todas las
variables son tratadas como conjuntamente endógenas. El capítulo también discute
las restricciones necesarias para recuperar (es decir, identificar) el modelo
estructural a partir del modelo estimado de forma reducida.
3. Corrección de errores: precios a plazo y al contado: ciertos productos
e instrumentos financieros se pueden comprar y vender en el mercado al
contado (para entrega inmediata) o para la entrega en una fecha futura
especificada. Por ejemplo,supongamos que el precio de una moneda
extranjera en particular en el mercado spot es s camisetas de dólares y que el
precio de la moneda para la entrega de un período en el futuro
es f t dólares. Ahora, considere un especulador que adquirido a plazo de
divisas al precio f t dólares por unidad. Al principio del periodo t + 1, el
especulador recibe la moneda y paga f t dólares por unidad recibida. Dado
que la divisa extranjera puede ser vendida en s t +1 , el especulador puede
obtener un beneficio (o pérdida) de s t +1 - f t por unidad transaccionada.
La hipótesis de la tasa de interés no bursátil (UFR) afirma que los beneficios
esperados de dicho comportamiento especulativo deberían ser cero. Formalmente, la
hipótesis plantea la siguiente relación entre los tipos de cambio a plazo y al contado:

donde έ t +1 tiene un valor medio de cero desde la perspectiva del período de


tiempo t .
En (1.6) , el tipo forward en t es una estimación no tendenciosa de la tasa spot en t +
1. Por lo tanto, supongamos que usted recopiló datos sobre las dos tasas y estimó la
regresión

Si pudiéramos concluir que α 0 = 0, α 1 = 1, y que los residuos de


regresión έ t +1 tienen un valor medio de cero desde la perspectiva del período t , se
podría mantener la hipótesis UFR.
Se dice que los mercados spot y forward están en equilibrio a largo
plazo cuando έ t +1 = 0. Siempre que s t +1 resulte diferir de f t , algún tipo de ajuste
debe ocurrir para restablecer el equilibrio en el período subsiguiente. Considere el
proceso de ajuste

donde έ st +2 y έ ft +1 tienen un valor medio de cero.


Las ecuaciones (1.7) y (1.8) ilustran el tipo de mecanismo de ajuste simultáneo
considerado en el capítulo 6 . Este modelo dinámico se denomina modelo
de corrección de errores porque el movimiento de las variables en cualquier
período se relaciona con la brecha del período anterior con respecto al equilibrio a
largo plazo. Si la tasa al contado s t +1 resulta ser igual a la tasa
forward f t , (1,7) y (1,8) indican que se espera que las tasas spot y forward no se
modifiquen. Si existe una brecha positiva entre las tasas spot y forward, de modo
que s t +1 - f t > 0,(1,7) y (1,8) conducen a la predicción de que la tasa spot disminuirá
y la tasa forward aumentará.
4. Dinámica no lineal : Todas las ecuaciones consideradas hasta ahora son
lineales (en el sentido de que cada variable se eleva a la primera potencia)
con coeficientes constantes. El capítulo 7 considera la estimación de
modelos que permiten estructuras dinámicas más complicadas. Recordemos
que la ecuación (1.3) supone que la inversión es siempre una proporción
constante del cambio en el consumo. Podría ser más realista suponer que la
inversión responda más aque a los cambios negativos en el
consumo. Después de todo, las empresas podrían querer aprovechar el
crecimiento del consumo positivo, pero simplemente dejar que el stock de
capital decaiga en respuesta a las caídas en el consumo. Este
comportamiento se puede capturar modificando (1.3) tal que el coeficiente
de ( c t - c t -1 ) no es constante. Considere la especificación
donde β 1 > β 2 > 0 y es una función de indicador tal que λ t = 1 si ( c t - c t -1 ) <0, de
lo contrario λ t = 0. Por lo tanto, si ( c t - c t -1 ) ≥ 0, λ t = 0, de modo que i t = β 1 ( c t -
c t -1 ) + e it y si ( c t - c t-1 ) <0, λ t = 1 de modo que i t = ( β 1 - β 2 ) ( c t - c t -1 )
+ e es . Si β 1 - β 2 > 0, la inversión es más sensible a cambios positivos que negativos
en el consumo.

2. ECUACIONES DE DIFERENCIAS Y SUS SOLUCIONES


Aunque muchas de las ideas de la sección anterior le eran probablemente
familiares, es necesario formalizar algunos de los conceptos utilizados. En esta
sección, examinaremos el tipo de ecuación de diferencias utilizada en el análisis
econométrico y explicitaremos lo que significa "resolver" dichas ecuaciones. Para
comenzar nuestro examen de ecuaciones de diferencia, considere la
función y = f ( t ). Si evaluamos la función cuando la variable independiente t toma
el valor específico t * , obtenemos un valor específico para la variable dependiente
llamada y t * . Formalmente, y t * = f ( t * ). Usando esta misma notación,y t * +
hrepresenta el valor de y cuando t toma el valor específico t * + h . La primera

diferencia de yse define como el valor de la función cuando se evalúa en t = t


* + h menos el valor de la función evaluada en t * :

El cálculo diferencial permite el cambio en la variable independiente (es decir, el


término h ) para acercarse a cero. Dado que la mayoría de los datos económicos se
recopilan durante períodos discretos, sin embargo, es más útil permitir que la
duración del período de tiempo sea mayor que cero. Usando ecuaciones de
diferencias, normalizamos unidades de modo que h representa un cambio unitario
en t (es decir, h = 1) y consideremos la secuencia de valores igualmente espaciados
de la variable independiente. Sin ninguna pérdida de generalidad, siempre
podemos dejar caer el asterisco en t * . Podemos entonces formar las primeras
diferencias :

A menudo será conveniente expresar la secuencia entera de valores {... y t -2 , y t -


1 , y t , y t +1 , y t +2 , ...} como { y t }. Podemos entonces referirnos a cualquier valor

particular en la secuencia como y t . A menos que se especifique, el índice t va de -∞


a + ∞. En modelos econométricos de series de tiempo, utilizamos t para representar
el "tiempo" y h para representar la longitud de un período de
tiempo. Así, y t y y t +1podrían representar las realizaciones de la secuencia { y t } en
el primer y segundo trimestres de 2009, respectivamente.
De la misma manera, podemos formar la segunda diferencia como el cambio en
la primera diferencia. Considerar
El n º diferencia (Δ n ) se define de forma análoga. En este punto, nos arriesgamos a
tomar la teoría de las ecuaciones de diferencia demasiado lejos. Como verá, la
necesidad de utilizar las segundas diferencias rara vez se plantea en el análisis de
series de tiempo. Es seguro decir que las diferencias de tercer y mayor orden nunca
se utilizan en el trabajo aplicado.
Dado que la mayor parte de este texto considera métodos de series de tiempo
lineales, es posible examinar sólo el caso especial de una ecuación de diferencia
lineal de orden n con coeficientes constantes. La forma para este tipo especial de
ecuación de diferencia está dada por

El orden de la ecuación de diferencias viene dado por el valor de n . La ecuación es


lineal porque todos los valores de la variable dependiente se elevan a la primera
potencia. La teoría económica puede dictar instancias en las cuales las
diversas a i son funciones de variables dentro de la economía. Sin embargo,
siempre que no dependan de ninguno de los valores de y t o x t , podemos
considerarlos como parámetros. El término x t se denomina proceso de
forzamiento. La forma del proceso de forzamiento puede ser muy
general; x tpuede ser cualquier función del tiempo, valores actuales y retardados de
otras variables, y / o perturbaciones estocásticas. A partir de una adecuada elección
del proceso de forzamiento, podemos obtener una amplia variedad de importantes
modelos macroeconómicos. Reexaminar la ecuación (1.5) , la ecuación de forma
reducida para el PIB real. Esta ecuación es una ecuación de diferencia de segundo
orden ya que y t depende de y t -2 . El proceso de forzamiento es la expresión (1
+ β ) έ ct + έ it - βέ ct -1 . Observará que (1.5) no tiene un término de intercepción
correspondiente a la expresión a 0en (1.10) .
Un caso especial importante para la secuencia { x t } es

donde el β i son constantes (algunos de los cuales puede ser igual a cero) y los
elementos individuales de la secuencia { έ t } no son funciones de las y t . En este
punto, es útil permitir que la secuencia { έ t } sea nada más que una secuencia de
variables exógenas no especificadas. Por ejemplo, sea { έ t } un término de error
aleatorio y establezca β 0 = 1 y β 1 = β 2 = ... = 0; en este caso, (1.10) se convierte en la
ecuación de autorregresión

Sea n = 1, a 0 = 0 y a 1 = 1 para obtener el modelo de caminata aleatoria. Obsérvese


que la ecuación (1.10) puede escribirse en términos del operador
diferencia (Δ). Restando y t -1de (1.10) , obtenemos

o definiendo γ = ( a 1 - 1), obtenemos


Claramente, la ecuación (1.11) es simplemente una versión modificada de (1.10) .
Una solución a una ecuación de diferencias expresa el valor de y t como una
función de los elementos de la sucesión { x t } y t (y posiblemente algunos valores
dados de la secuencia { y t} llamados condiciones
iniciales ). Examinar (1.11) deja claro que existe una fuerte analogía con el cálculo
integral, donde el problema es encontrar una función primitiva a partir de una
derivada dada. Buscamos encontrar la función primitiva f ( t ), dada una ecuación
expresada en la forma de (1.10) o (1.11). Observe que una solución es una función
en lugar de un número. La propiedad clave de una solución es que satisface la
ecuación de diferencia para todos los valores permisibles de t y { x t }. Por lo tanto,
la sustitución de una solución en la ecuación de diferencias debe dar lugar a una
identidad. Por ejemplo, considere la ecuación de diferencia simple Δ y t = 2
(o y t = y t -1 + 2). Puede verificarse fácilmente que una solución a esta ecuación de
diferencia es y t = 2 t + c , donde c es cualquier constante arbitraria. Por definición,
si 2 t + ces una solución, debe mantenerse para todos los valores permisibles
de t . Así, para el período t - 1, y t -1 = 2 ( t - 1) + c . Ahora substituya la solución en la
ecuación de diferencia para formar

Es fácil llevar a cabo el álgebra y verificar que (1.12) es una identidad. Este ejemplo
simple también ilustra que la solución a una ecuación de diferencia no necesita ser
única; hay una solución para cualquier valor arbitrario de c .
Otro ejemplo útil es proporcionado por el término irregular mostrado en la Figura
1.1 ; recuerde que la ecuación para esta expresión es I t = 0.7 I t -1 + έ t . Puede
verificar que la solución a esta ecuación de primer orden es

Dado que (1.13) se mantiene para todos los períodos de tiempo, el valor de la
componente irregular en t - 1 viene dado por

Ahora sustituye (1.13) y (1.14) en I t = 0.7 I t -1 + έ t para obtener

Los dos lados de (1.15) son idénticos; esto demuestra que (1.13) es una solución a la
ecuación estocástica de primer orden I t = 0.7 I t -1 + έ t . Sea consciente de la
distinción entre las ecuaciones de forma reducida y las soluciones. Como I t =
0.7 I t -1 + έ t para todos los valores de t , se deduce que I t -1 = 0.7 I t -2 + έ t -1 . La
combinación de estas dos ecuaciones produce

La ecuación (1.16) es una ecuación de forma reducida, ya que expresa I t en


términos de sus propios retardos y términos de perturbación. Sin
embargo, (1.16) no califica como una solución porque contiene el valor
"desconocido" de I t -2 . Para calificar como solución, (1.16)debe expresar I t en
términos de los elementos x t , t , y cualquier condición inicial dada.
3. SOLUCIÓN POR ITERACIÓN
La solución dada por (1.13) simplemente se postuló. Las partes restantes de este
capítulo desarrollan los métodos que puede utilizar para obtener tales
soluciones. Cada método tiene sus propios méritos; saber que el más apropiado
para usar en una circunstancia particular es una habilidad que sólo viene con la
práctica. Esta sección desarrolla el método de iteración. Aunque la iteración es el
método más engorroso y que requiere mucho tiempo, la mayoría de la gente lo
encuentra muy intuitivo.
Si se conoce el valor de y en algún período específico, un método directo de
solución es iterar hacia delante desde ese período para obtener la trayectoria
temporal posterior de toda la secuencia y . Refiérase a este valor conocido
de y como la condición inicial o el valor de y en el período de tiempo 0 (denotado
por y 0 ). Es más fácil ilustrar la técnica iterativa usando la ecuación de diferencias
de primer orden

Dado el valor de y 0 , se sigue que y 1 será dada por

De la misma manera, y 2 debe ser

Continuando el proceso para encontrar y 3 , obtenemos

Puede verificar fácilmente que para todo t > 0, los rendimientos repetidos de
iteración

La ecuación (1.18) es una solución a (1.17) ya que expresa y t en función de t , el


proceso forzante y el valor conocido de y 0 . Como ejercicio, es útil
demostrar que la iteración de y t a y 0 produce exactamente la fórmula dada
por (1.18) . Dado que y t = a 0 + a 1y t -1 + έ t , se deduce que

Continuando la iteración de regreso al periodo 0 se obtiene la ecuación (1.18) .

ITERACIÓN SIN CONDICIÓN INICIAL


Supongamos que no se le dio la condición inicial para y 0 . La solución dada
por (1.18) ya no sería apropiada porque el valor de y 0 es desconocido. No se pudo
seleccionar este valor inicial de y e iterar hacia adelante, ni se puede iterar hacia
atrás desde y t y simplemente optar por detenerse en t = t 0 . Por lo tanto,
supongamos que continuamos para iterar hacia atrás mediante la sustitución
de un 0 + un 1 y -1 + έ 0 para y 0 en (1.18) :
Continuando iterando hacia atrás otros m periodos, obtenemos

Ahora examine el patrón que emerge de (1.19) y (1.20) . Si | a 1 | <1, el término


se aproxima a cero cuando m se acerca al infinito. Además, la suma infinita
[1 + a 1 + + ...] converge a 1 / (1 - a 1 ). Así, si asumimos temporalmente que
| a 1 | <1, después de la sustitución continua, (1.20) se puede escribir como

Usted debe tomar unos minutos para convencerse de que (1.21) es una solución a
la ecuación de la diferencia original (1.17) ; la sustitución de (1.21) en (1.17) produce
una identidad. Sin embargo, (1.21) no es una solución única. Para cualquier valor
arbitrario de A , una solución a (1.17) está dada por

Para verificar que (1.22) es una solución para cualquier valor arbitrario de A ,
substituya (1.22) en (1.17) para obtener

Dado que los dos lados son idénticos, (1.22) es necesariamente una solución
a (1.17) .

CONCILIAR LOS DOS MÉTODOS ITERATIVOS


Dada la solución iterativa (1,22) , suponga que ahora se le da una condición inicial
en relación con el valor de y en el periodo arbitrario t 0 . Es fácil mostrar que
podemos imponer la condición inicial en (1.22) para obtener la misma solución
que(1,18) . Dado que (1.22) debe ser válido para todos los períodos (incluyendo t 0 ),
cuando t = 0, debe ser cierto que

Puesto que y 0 está dado, podemos ver (1.23) como el valor de A que hace (1.22) una
solución a (1.17) dada la condición inicial. Por lo tanto, la presencia de la condición
inicial elimina la arbitrariedad de A . La sustitución de este valor
de A por (1.22) produce
La simplificación de (1.24) resulta en

Es un ejercicio que vale la pena verificar que (1.25) es idéntico a (1.18) .

SECUENCIAS NO CONVERGENTES
Dado que | a 1 | <1, (1.21) es el valor límite de (1.20) cuando m crece infinitamente
grande. ¿Qué sucede con la solución en otras circunstancias? Si | a 1 | > 1, no es
posible moverse de (1.20) a (1.21) porque la expresión crece infinitamente
grande cuando t + m se acerca al infinito. Sin embargo, si hay una condición
1

inicial, no hay necesidad de obtener la suma infinita. Simplemente seleccione la


condición inicial y 0 e iterar hacia delante; el resultado será (1.18) :

Aunque los valores sucesivos de la secuencia { y t } serán progresivamente más


grandes en valor absoluto, todos los valores en la serie serán finitos.
Un caso muy interesante surge si a 1 = 1. Reescritura (1.17) como

Como usted debe verificar por iteración de y t de nuevo a y 0 , una solución a esta
ecuación es 2

Después de un momento de reflexión, la forma de la solución es bastante


intuitiva. En cada período t , el valor de y t cambia por un 0 + έ t unidades. Después
de t períodos, hay t tales cambios; Por lo tanto, el cambio total es ta 0 más
las camisetas valores de la { έ t secuencia}. Observe que la solución contiene la
suma de todas las perturbaciones de έ 1 a έ t . Así,cuando a 1 = 1, cada perturbación
tiene un efecto permanente de no detección en el valor de y t . Debe comparar este
resultado con la solución que se encuentra en (1.21) . Para el caso en el que
| a 1 | <1, | a 1 | t es una función decreciente de t para que los efectos de
perturbaciones pasadas se vuelvan sucesivamente más pequeños en el tiempo.
La importancia de la magnitud de un 1 se ilustra en la Figura 1.2 . Treinta números
aleatorios con un teórica media igual a cero se generaron por ordenador y denotado
por έ 1 a través de έ 30 . Entonces el valor de y 0 se estableció igual a la unidad y los
siguientes 25 valores de la secuencia { y t } se construyeron usando la fórmula y t =
0.9 y t +1 + έ t . El resultado se muestra por la delgada línea en el Panel (a) de
la Figura 1.2 . Si sustituye un 0 = 0 ya 1 = 0.9 en (1.18) , verá que la trayectoria de
tiempo de { y t } consta de dos partes. La primera parte, 0,9 t , se muestra por la
línea gruesa de decadencia lenta en el panel. Este término domina la solución para
valores relativamente pequeños de t . La influencia de la parte aleatoria se muestra
por la diferencia entre la línea delgada y la gruesa; puede ver que los primeros
valores de { έ t } son negativos. Obsérvese que a medida que t aumenta, la
influencia del valor inicial y 0 = 1 se hace menos pronunciada.

FIGURA 1.2 Secuencias convergentes y no convergentes

Utilizando los números aleatorios previamente dibujados, volvemos a


poner y 0 igual a unidad y se construye una segunda secuencia usando la
fórmula y t = 0.5 y t -1 + έ t . Esta segunda secuencia se muestra por la línea delgada
en el Panel (b) de la Figura 1.2 . La influencia de la expresión 0,5 t se muestra por la
línea gruesa de decaimiento rápido. De nuevo, a medida que t aumenta, la porción
aleatoria de la solución se vuelve más dominante en la trayectoria temporal de
{ y t }. Cuando comparamos los dos primeros paneles, está claro que la reducción
de la magnitud de | a 1| aumenta la tasa de convergencia. Además, las discrepancias
entre los valores simulados de y t y la línea gruesa son menos pronunciadas en el
segundo panel. Como se puede ver en (1.18) , cada valor de έ t - i entra en la solución
para y t con un coeficiente de ( a 1 ) i . El valor menor de a 1 significa que las
realizaciones pasadas de έ t - i tienen una influencia menor sobre el valor actual
de y t .
Simular una tercera secuencia con un 1 = -0,5 produce la línea delgada que se
muestra en el Panel (c). Las oscilaciones se deben al valor negativo de un 1 . La
expresión (-0.5) t , mostrada por la línea gruesa, es positiva cuando t es pareja y
negativa cuando t es impar. Desde | a 1 | <1, las oscilaciones están amortiguadas.
Los siguientes tres paneles de la Figura 1.2 muestran secuencias no con-
vergentes. Cada uno usa la condición inicial y 0 = 1 y los mismos treinta valores de
{ έ t } utilizados en las otras simulaciones. La línea en el Panel (d) muestra la
trayectoria del tiempo de y t = y t -1 + έ t . Dado que cada valor de έ t tiene un valor
esperado de cero, el Panel (d) ilustra un proceso de caminata aleatoria. Aquí
Δ y t = έ t para que el cambio en y t sea puramente aleatorio. La no convergencia se
demuestra por la tendencia de { yt } para deambular. En el Panel (e), la línea gruesa
que representa la expresión explosiva (1.2) t domina la porción aleatoria de
lasecuencia{ y t }. Observe también que la discrepancia entre lasecuenciasimulada
{ y t } y la línea gruesa se ensancha cuando t aumenta. La razón es que los valores
pasados de έ t - ientran en la solución para y t con el coeficiente (1.2) i . A medida
que i aumenta, la importancia de estas discrepancias previas se hace cada vez más
importante. Similarmente, establecer un 1= -1,2 resulta en las oscilaciones de
explosión mostradas en el panel inferior derecho de la figura. El valor (-1.2) t es
positivo para los valores pares de t y negativos para los valores impares de t .

4. UNA METODOLOGÍA DE SOLUCIÓN ALTERNATIVA


La solución por el método iterativo se descompone en ecuaciones de orden
superior. La complejidad algebraica rápidamente sobrepasa cualquier intento
razonable de encontrar una solución. Afortunadamente, existen varias técnicas de
solución alternativas que pueden ser útiles para resolver la ecuación de
orden n dada por (1.10) . Si utilizamos el principio de que debes aprender a
caminar antes de aprender a correr, lo mejor es pasar por la ecuación de primer
orden dada por (1.17) . A pesar de que va a cubrir un terreno familiar, el caso de
primer orden ilustra la metodología general muy bien. Para dividir el
procedimiento en sus partes componentes, considere solamente la porción
homogénea de (1.17) : 3

La solución a esta ecuación homogénea se llama solución homogénea; a veces


será útil denotar la solución homogénea por la expresión . Obviamente, la
solución trivial y t = y t -1= ... = 0 satisface (1.27) . Sin embargo, esta solución no es
única. Al establecer un 0 y todos los valores de { έ t } igual a cero, (1.18) se convierte
en . Por lo tanto, debe ser una solución a (1.27) . Sin embargo,
incluso esta solución no constituye el conjunto completo de soluciones. Es fácil
verificar que la expresión multiplicado por cualquier constante
arbitraria A satisface (1.27) . Simplemente sustituir y
en (1.27) para obtener

Puesto que , se sigue que también resuelve (1.27) . Con la ayuda


de las líneas gruesas en la figura 1.2 , podemos clasificar las propiedades de la
solución homogénea de la siguiente manera:
1. Si | a 1 | <1, la expresión converge a cero cuando t se aproxima al
infinito. La convergencia es directa si 0 < a 1 <1 y oscilatoria si -1 < a 1 <0.
2. Si | a 1 | > 1, la solución homogénea no es estable. Si a 1 > 1, la solución
homogénea se acerca al infinito a medida que t aumenta. Si a 1 <-1, la
solución homogénea oscila explosivamente.
3. Si a 1 = 1, cualquier constante arbitraria A satisface la ecuación
homogénea y t = y t -1 . Si a 1 = -1, el sistema es meta-estable : = 1 para
valores pares de t y -1 para valores impares de t .
Ahora consideremos (1.17) en su totalidad. En la última sección, confirmó
que (1.21) es una solución válida para (1.17) . La ecuación (1.21) se
denomina solución particular a la ecuación de diferencias; todas estas
soluciones particulares se denotarán con el término . El término "particular" se
deriva del hecho de que una solución a una ecuación de diferencia puede no ser
única; por lo tanto, (1.21) es sólo una solución particular de las muchas
posibilidades. La solución particular satisface la ecuación de diferencia original sin
imponer la restricción de que sea homogénea.
Al pasar a (1.22) verificó que la solución en particular no era única. La solución
homogénea más la solución particular dada por (1.21) constituyó la solución
completa a (1.17) . La solución general a una ecuación de diferencia se define
como una solución particular más todas las soluciones homogéneas. Una vez que se
obtiene la solución general, la constante arbitraria A puede ser eliminado mediante
la imposición de una condición inicial para y 0 .

La Metodología de la Solución
Los resultados del caso de primer orden son directamente aplicables a la ecuación
de orden ndada por (1.10) . En este caso general, será más difícil encontrar la
solución particular y habrá n soluciones homogéneas distintas. Sin embargo, la
metodología de la solución siempre implicará los cuatro pasos siguientes:
PASO 1 : Formar la ecuación homogénea y encontrar todas las n soluciones
homogéneas;
PASO 2 : Encuentre una solución particular;
PASO 3 : Obtener la solución general como la suma de la solución particular y una
combinación lineal de todas las soluciones homogéneas;
PASO 4 : Elimine la (s) constante (s) arbitraria (s) imponiendo la (s) condición
(es) inicial (es) en la solución general.
Antes de abordar las diversas técnicas que pueden utilizarse para obtener
soluciones homogéneas y particulares, vale la pena ilustrar la metodología
empleando la ecuación

Claramente, esta ecuación de segundo orden es en la forma de (1.10) con un 0 =


3, un 1 = 0,9, un 2 = -0,2, y x t = 0. A partir de la primera de las cuatro etapas,
formar el homogénea ecuación

En el caso de primer orden de (1.17) , la solución homogénea fue . La sección


6 le mostrará cómo encontrar el conjunto completo de soluciones homogéneas. Por
ahora, es suficiente afirmar que las dos soluciones homogéneas
son = (0.4) t . Para verificar la primera solución, tenga en cuenta
que y . Por lo tanto, es una solución si satisface

Si dividimos por (0.5) t -2 , la cuestión es si

Llevando a cabo el álgebra, 0.25 - 0.45 + 0.2 es igual a cero de manera que (0.5) t es
una solución a (1.29) . De la misma manera, es fácil verificar que es una
solución ya que

Dividir por (0,4) t -2 para obtener (0,4) 2 - 0,9 (0,4) + 0,2 = 0,16 - 0,36 + 0,2 = 0.
El segundo paso es obtener una solución particular; puede confirmar fácilmente
que la solución particular = 10 resuelve (1,28) como: 10 = 0,9 (10) - 0,2 (10) + 3.
El tercer paso es combinar la solución particular y una combinación lineal de
ambas soluciones homogéneas para obtener

donde A 1 y A 2 son constantes arbitrarias.


Para el cuarto paso, suponga que tiene dos condiciones iniciales para
la secuencia { y t }. Para que podamos mantener nuestros números razonablemente
redondos, supongamos que y 0 = 13 yy 1 = 11.3. Así, para los períodos cero y uno,
nuestra solución debe satisfacer

Resolviendo simultáneamente para A 1 y A 2 , debe encontrar A 1 = 1 y A 2 = 2. Por lo


tanto, la solución es

Puede sustituir y t = (0.5) t + 2 (0.4) t + 10 en (1.28) para verificar que la solución es


correcta.

GENERALIZANDO EL MÉTODO
Para demostrar que este método es aplicable a ecuaciones de orden superior,
considere la parte homogénea de (1.10) :
Como se muestra en la Sección 6 , hay n soluciones homogéneas que
satisfacen (1.30) . Por ahora, es suficiente para demostrar la siguiente
proposición: Si es una solución homogénea de (1.30) , es también una
solución para cualquier A constante arbitraria . Por suposición, resuelve la
ecuación homogénea para que

La expresión es también una solución si

Sabemos que (1.32) está satisfecho porque dividir cada término


por A produce (1.31) . Supongamos ahora que hay dos soluciones separadas a la
ecuación homogénea denotada por y . Es fácil demostrar que para cualquier
dos constantes A 1 y A 2 , la combinación lineal es también una solución
a la ecuación homogénea. Si + es una solución a (1.30) , debe satisfacer

Reagrupando términos, queremos saber si

Desde y son soluciones separadas a (1.30) , cada una de las expresiones


entre paréntesis es cero. Por lo tanto, la combinación lineal es necesariamente una
solución a la ecuación homogénea. Este resultado fácilmente generaliza a todas
las n soluciones homogéneas a una ecuación de orden n .
Por último, el uso de la Etapa 3 es apropiado ya que la suma de cualquier solución
particular y cualquier combinación lineal de todas las soluciones homogéneas es
también una solución. Para probar esta proposición, sustituir la suma de las
soluciones particulares y homogéneas en (1.10) para obtener

Recombinando los términos en (1.33) , queremos saber si

Como resuelve (1.10) , la expresión en el primer paréntesis de (1.34) es


cero. Puesto que resuelve la ecuación homogénea, la expresión en el segundo
paréntesis es cero. Así, (1.34) es una identidad; la suma de las soluciones
homogéneas y particulares resuelve (1.10) .

5. EL MODELO COBWEB
Una manera interesante de ilustrar la metodología esbozada en la sección anterior
es considerar una versión estocástica del modelo tradicional de telaraña. Dado
que el modelo fue desarrollado originalmente para explicar la volatilidad de los
precios agrícolas, deje que el mercado de un producto -digamos trigo- sea
representado por

donde : d t = demanda de trigo en el período t


s t = suministro de trigo en t
p t = precio de mercado del trigo en t

= precio que los agricultores esperan prevalecer en t


έ t = un choque de oferta estocástico medio cero

y los parámetros a , b , γ , y β son todos positivos de modo que a > b . 4


La naturaleza del modelo es tal que los consumidores compran tanto trigo como se
desee al precio de compensación del mercado p t . Al tiempo de la siembra, los
agricultores no conocen el precio que prevalece en la época de cosecha; basan su
decisión de oferta en el precio esperado ( p *). La cantidad real producida depende
de la cantidad planeada más un choque de suministro aleatorio έ t . Una vez
que el producto es cosechado, el equilibrio del mercado requiere que la cantidad
suministrada sea igual a la cantidad demandada. A diferencia del mercado actual
del trigo, el modelo no permite la posibilidad de almacenamiento. La esencia del
modelo de telaraña es que los agricultores forman sus expectativas de una manera
ingenua; que los agricultores usen el precio del año pasado como el precio de
mercado esperado

El punto E de la figura 1.3 representa la combinación de precios y cantidades de


equilibrio a largo plazo. Obsérvese que el concepto de equilibrio en este modelo
estocástico difiere del modelo tradicional de telaraña. Si el sistema es estable, los
precios sucesivas tienden a converger al punto E . Sin embargo, la naturaleza del
equilibrio estocástico es tal que los omnipresentes choques de oferta impiden que
el sistema queda en E . Sin embargo, es útil resolver para el precio a largo plazo. Si
fijamos todos los valores de la secuencia { έ t } igual a cero, establecemos p t = p t -1 =
... = p, y equiparar oferta y demanda, el precio de equilibrio a largo plazo viene
dado por p = ( a - b ) / ( γ + β ). De forma similar, la ( s ) cantidad ( s )
de equilibrio está dada por s = ( aβ + γb ) / ( γ + β ).
FIGURA 1.3 El modelo Cobweb

Para entender la dinámica del sistema, supongamos que los agricultores de t plan
para producir la cantidad de equilibrio s . Sin embargo, deje que haya un choque de
suministro negativo de tal manera que la cantidad real producida resulte
ser s t . Como se muestra en el punto 1 de la figura 1.3 , los consumidores están
dispuestos a pagar p t por la cantidad s t ; por lo tanto, el equilibrio del mercado
en t ocurre en el punto 1. Actualizar un período nos permite ver el resultado
principal del modelo de telaraña. Para simplificar, suponga que todos los valores
posteriores del choque de suministro son cero (es decir, έ t +1 = έ t +2= ... = 0). Al
principio del período t + 1, los agricultores esperan que el precio en el momento de
la cosecha sea el precio del período anterior; Por lo tanto, . En
consecuencia, producen la cantidad s t +1 (véase el punto 2 en la figura); los
consumidores, sin embargo, están dispuestos a comprar la cantidad s t +1 sólo si el
precio cae a la indicada por p t +1 (véase el punto 3 en la figura). El siguiente período
comienza con los agricultores que esperan estar en el punto 4. El proceso se repite
continuamente hasta alcanzar el punto de equilibrio E.
Como se muestra, la Figura 1.3 sugiere que el mercado siempre convergerá hacia el
punto de equilibrio a largo plazo. Este resultado no es válido para todas las curvas
de demanda y oferta. Para derivar formalmente la condición de estabilidad,
combine (1.35) a (1.38) para obtener

Claramente, (1.39) es una ecuación estocástica de diferencia lineal de primer orden


con coeficientes constantes. Para obtener la solución general, proceda utilizando
los cuatro pasos enumerados al final de la última sección:
1. Formar la ecuación homogénea p t = (- β / γ ) p t -1 . En la siguiente sección
aprenderá cómo encontrar la (s) solución (es) a una ecuación
homogénea. Por el momento, es suficiente verificar que la solución
homogénea es

donde A es una constante arbitraria.


2. Si la relación β / γ es menor que la unidad, puede iterar (1.39) hacia atrás
desde p t para verificar que la solución particular para el precio es

Si β / γ ≥ 1, la suma infinita en (1.40) no es convergente. Como se discutió en la


última sección, es necesario imponer una condición inicial en (1.40) si β / γ ≥ 1.
3. La solución general es la suma de las soluciones homogéneas y
particulares; combinando estas dos soluciones, la solución general es

4. En (1.41) , A es una constante arbitraria que se puede eliminar si conocemos


el precio en algún período inicial. Por conveniencia, deje que este período
inicial tenga un subíndice de tiempo de cero. Dado que la solución debe
mantenerse para cada período, incluido el período cero , debe ser

Dado que (- β / γ ) 0 = 1, el valor de A viene dado por

Sustituyendo esta solución por A de nuevo en (1.41) los rendimientos

y, tras la simplificación de las dos sumas,

Podemos interpretar (1.42) en términos de la figura 1.3 . Para enfocarse en la


estabilidad del sistema, asuma temporalmente que todos los valores de
la secuencia { έ t } son cero. Posteriormente, volveremos a considerar los efectos de
los shocks de oferta. Si el sistema comienza en equilibrio a largo plazo, la condición
inicial es tal que p 0 = ( a - b ) / ( γ + β ). En este caso, la inspección de la ecuación
(1.42) indica que p t = ( a - b ) / ( γ + β). Así, si comenzamos el proceso en el
punto E , el sistema permanece en equilibrio a largo plazo. En su lugar,
supongamos que el proceso comienza a un precio por debajo del equilibrio a largo
plazo: p 0 <( a - b ) / ( γ + β ). La ecuación (1.42) nos dice que p 1 es

Como p 0 <( a - b ) / ( γ + β ) y - β / γ <0, se sigue que p 1 estará por encima del


precio de equilibrio a largo plazo ( a - b ) / ( γ + β ). En el periodo 2,
Aunque p 0 <( a - b ) / ( γ + β ), (- β / γ ) 2 es positivo; por lo tanto, p 2 está por
debajo del equilibrio a largo plazo. Para los períodos subsiguientes, observe que (-
β / γ ) t será positivo para los valores pares de t y negativos para los valores
impares de t . Tal y como hemos encontrado gráficamente, los valores sucesivos de
la secuencia { p t } oscilarán por encima y por debajo del precio de equilibrio a largo
plazo. Puesto que ( β / γ ) t pasa a cero si β <γ y explota si β > γ , la magnitud de β /
γ determina si el precio converge en realidad hacia el equilibrio de largo plazo. Si β
/ γ <1, las oscilaciones disminuirán en magnitud, y si β / γ > 1, las oscilaciones
serán explosivas.
La interpretación económica de esta condición de estabilidad es sencilla. La
pendiente de la curva de alimentación (es decir, ∂ p t / ∂ s t ) es 1 / β y el valor
absoluto de la pendiente de la curva de demanda [es decir, - ∂ p t / ∂ d t ] es 1 / γ . Si
la curva de oferta es más pronunciada que la curva de demanda, 1 / β > 1 / γ o β /
γ <1 para que el sistema sea estable. Este es precisamente el caso ilustrado en
la Figura 1.3. Como ejercicio, debe dibujar un diagrama con la curva de demanda
más pronunciada que la curva de oferta y mostrar que el precio oscila y diverge del
equilibrio a largo plazo.
Ahora consideremos los efectos de los shocks de oferta. El efecto contemporáneo de
un choque de oferta sobre el precio del trigo es la derivada parcial de p t con
respecto a έ t ; de (1.42) :

La ecuación (1.44) se denomina multiplicador de impacto, ya que muestra el


efecto de impacto de un cambio en έ t sobre el precio en t . En términos de la figura
1.3 , un valor negativo de έ t implica un precio por encima del precio a largo
plazo p ; el precio en t aumenta en 1 / γ unidades por cada unidad de disminución
en la oferta de período actual. Por supuesto, esta terminología no es específica para
el modelo de telaraña; en términos de la nmodelo th-orden dado por (1.10) , el
multiplicador de impacto es la derivada parcial de y tcon respecto al cambio parcial
en el proceso de forzamiento. 5
Los efectos del choque de oferta en t persisten en períodos futuros. La
actualización (1.42) en un período produce el multiplicador de un período :

El punto 3 de la figura 1.3 ilustra cómo el precio en t + 1 se ve afectado por el


choque de oferta negativo en t . Es fácil deducir el resultado de que los efectos del
choque de suministro se deterioran con el tiempo. Como β / γ <1, el valor absoluto
de ∂p t / ∂έ t excede ∂p t +1 / ∂έ t . Todos los multiplicadores pueden derivarse de
manera análoga; actualizando (1.42) por dos períodos:

y después de n periodos:

La trayectoria de tiempo de todos estos multiplicadores se denomina función de


respuesta de impulso. Esta función tiene muchas aplicaciones importantes en el
análisis de series de tiempo porque muestra cómo la trayectoria de tiempo entera
de una variable es afectada por un choque estocástico. Aquí, la función de impulso
traza los efectos de un choque de oferta en el mercado del trigo. En otras
aplicaciones económicas, puede estar interesado en la trayectoria temporal de un
choque de oferta monetaria o un shock de productividad en el PIB real.
En realidad, la función puede derivarse sin actualizarse (1.42) porque siempre es el
caso que

Para encontrar la función de respuesta de impulso, basta con encontrar la derivada


parcial de (1.42) con respecto a los diversos έ t -j . Estas derivadas parciales no son
más que los coeficientes de la secuencia { έ t-j } en (1.42) .
Cada uno de los tres componentes de (1.42) tiene una interpretación económica
directa. La porción determinista de la solución particular ( a - b ) / ( γ + β ) es el
precio de equilibrio a largo plazo; si se cumple la condición de estabilidad,
la secuencia { p t } tiende a converger a este valor de largo plazo. El componente
estocástico de la solución particular capta los ajustes de precios a corto plazo
debidos a los shocks de oferta. La desintegración final de los coeficientes de la
función de respuesta de impulso garantiza que los efectos de los cambios en los
diversos έ t son de una duración de corto plazo. El tercer componente es la
expresión (- β / γ ) tA = (- β / γ ) t [ p 0 - ( a - b ) / ( γ + β )]. El valor de A es la
desviación inicial del precio del precio de su nivel de equilibrio a largo plazo. Dado
que β / γ <1, la importancia de esta desviación inicial disminuye con el tiempo.

6. SOLUCIÓN DE ECUACIONES DE DIFERENCIAS


HOMOGÉNEAS
Las ecuaciones de diferencias de orden superior surgen naturalmente en el análisis
económico. La ecuación (1.5) -la ecuación del PIB de forma reducida resultante del
modelo de Samuelson (1939) es un ejemplo de una ecuación de diferencias de
segundo orden. Además, en la econometría de series de tiempo es bastante típico
estimar ecuaciones de segundo y de orden superior. Para comenzar nuestro
examen de soluciones homogéneas, considere la ecuación de segundo orden

Dados los hallazgos en el caso de primer orden, debe sospechar que la solución
homogénea tiene la forma . La sustitución de esta solución de prueba
en (1.45) produce

Claramente, cualquier valor arbitrario de A es satisfactorio. Si se


divide (1.46) por , el problema es encontrar los valores de α que satisfacen

Resolviendo esta ecuación cuadrática -la ecuación característica- dos valores


de α , llamados raíces características. Usando la fórmula cuadrática,
encontramos que las dos raíces características son
donde d es el discriminante [( a 1 ) 2 + 4 a 2 ].
Cada una de estas dos raíces características proporciona una solución válida
para (1.45) . Nuevamente, estas soluciones no son únicas. De hecho, para cualquier
dos constantes arbitrarias A 1 y A 2 , laLa combinación lineal
también resuelve (1.45) . Como prueba, basta con sustituir y t =
en (1.45) para obtener

Ahora, reagrupar los términos de la siguiente manera:

Como α 1 y α 2 resuelven cada uno (1.45) , ambos términos entre paréntesis deben
ser iguales a cero. Como tal, la solución homogénea completa en el caso de segundo
orden es

Sin conocer los valores específicos de a 1 y a 2 , no podemos encontrar las dos raíces
características α 1 y α 2 . Sin embargo, es posible caracterizar la naturaleza de la
solución; tres casos posibles dependen del valor del discriminante d .
CASO 1
Si , d es un número real y habrá dos raíces características reales distintas. Por
lo tanto, hay dos soluciones separadas a la ecuación homogénea denotada por y
. Ya sabemos que cualquier combinación lineal de los dos es también una solución. Por lo
tanto,

Debe quedar claro que si el valor absoluto de cualquiera de alfa 1 o alfa 2 excede la unidad,
la solución homogénea explotará. La Hoja de trabajo 1.1 examina dos ecuaciones de
segundo orden que muestran raíces características reales y distintas. En el primer
ejemplo, y t = 0,2 y t -1 + 0,35 y t -2 , las raíces características se muestran como α 1 = 0,7
y α 2 = -0,5. Por lo tanto, la solución homogénea completa es + A 2 (-
0,5) . Dado que ambas raíces son menores que la unidad en valor absoluto, la solución
t

homogénea es convergente. Como se puede ver en el gráfico en la parte inferior izquierda


de la Hoja de Trabajo 1.1 , la convergencia no es monotónica debido a la influencia de la
expresión (-0.5) t .
En el segundo ejemplo, y t = 0.7 y t -1 + 0.35 y t -2 . La hoja de trabajo indica cómo obtener la
solución para las dos raíces características. Dado que una raíz característica es 1.037,
la secuencia { y t } explota. La influencia de la raíz negativa ( α 2 = -0.337) es responsable
de la nomonotonicidad de la trayectoria temporal. Puesto que (-0.337) t se aproxima
rápidamente a cero, la raíz dominante es el valor explosivo 1.037.
CASO 2
Si , se deduce que d = 0 y alpha 1 = α 2 = un 1 /2. Por lo tanto, una solución
homogénea es un 1 /2. Sin embargo, cuando d = 0, hay una segunda solución homogénea
dada por . Para demostrar que se trata de una solución homogénea,
sustituirla por (1.45) para determinar si

HOJA DE TRABAJO 1.1


ECUACIONES DE SEGUNDO ORDEN
Ejemplo 1 :
y t = 0,2 y t -1 + 0,35 y t -2 . Por lo tanto: a 1 = 0,2 y a 2 = 0,35
Formar la ecuación homogénea: y t - 0,2 y t -1 - 0,35 y t -2 = 0
Una comprobación del discriminante revela: de modo que d = 1,44. Dado
que d > 0, las raíces serán reales y distintas.
Deje que la solución de prueba tiene la forma: y t = α t . Sustituir la solución de prueba en la
ecuación homogénea para obtener:
Dividir por α t -2 para obtener la ecuación característica: α 2 - 0.2 α - 0.35 = 0 Calcular las dos
raíces características:

La solución homogénea es: A 1 (0,7) t + A 2 (-0,5) t . La primera gráfica muestra la


trayectoria temporal de esta solución para el caso en que las constantes arbitrarias son
iguales a la unidad y tva de 1 a 20.
Ejemplo 2 :
y t = 0,7 y t -1 + 0,35 y t -2 . Por lo tanto: a 1 = 0,7 y a 2 = 0,35
Formar la ecuación homogénea: y t - 0.7 y t -1 - 0.35 y t -2 = 0
Una comprobación del discriminante revela: de modo que d = 1.89. Dado
que d > 0, las raíces serán reales y distintas.
Formar la ecuación característica
Divide por α t -2 para obtener la ecuación característica: α 2 - 0.7 α - 0.35 = 0
Calcular las dos raíces características:

La solución homogénea es: A 1 (1,037) t + A 2 (-0,337) t . El segundo gráfico muestra la


trayectoria temporal de esta solución para el caso en que las constantes arbitrarias son
iguales a la unidad y t va de 1 a 20.
FIGURA 1.4 La Solución Homogénea de t ( a 1 ) t

Dividir por ( un 1 /2) t -2 y la forma


Puesto que estamos operando en la circunstancia donde , cada
expresión entre corchetes es cero; Por lo tanto, t ( un 1 /2) t resuelve (1,45) . De
nuevo, para constantes arbitrarias A 1 y A 2 , la solución homogénea completa es

Claramente, el sistema es explosivo si | a 1 | > 2. Si | a 1 | <2, el


término A 1 ( un 1 /2) tconverge, pero se podría pensar que el efecto del
término t ( un 1 /2) t es ambigua [ya que la disminución ( un 1 /2) t se multiplica
por t ]. Esta ambigüedad es correcta en el sentido limitado de que el
comportamiento de la solución homogénea no es monótono. Como se ilustra en la
figura 1.4 para un 1 como de largo / 2 = 0,95, 0,9, y -0,9, como | un1 | <2, lim
[ t ( un 1 /2) t ] es necesariamente cero como t → ∞; así, siempre hay
convergencia. Para 0 < a 1<2, la solución homogénea parece explotar antes de que
finaliceconvergiendo a cero. Para -2 < a 1 <0, el comportamiento es tremendamente
errático; la solución homogénea parece oscilar explosivamente antes de que las
oscilaciones amortiguen y finalmente converjan a cero.
CASO 3
Si , se sigue que d es negativo para que las raíces características sean
imaginarias. Puesto que , las raíces imaginarias pueden ocurrir solamente si a 2 <0.
Aunque esto pudiera ser difícil de interpretar directamente, si cambiamos a coordenadas
polares es posible transformar las raíces en funciones trigonométricas más fácilmente
entendidas. Los detalles técnicos se presentan en el Apéndice 1.1 . Por ahora, escriba las
dos raíces características como

donde .
Como se muestra en el Apéndice 1.1 , puede usar el teorema de Moivre para escribir la
solución homogénea como

donde β 1 y β 2 son constantes arbitrarias, r = (- a 2 ) 1/2 , y el valor de θ se elige para


satisfacer

Las funciones trigonométricas imparten un patrón ondulado a la trayectoria del tiempo de la


solución homogénea; tenga en cuenta que la frecuencia de las oscilaciones está determinada
por θ . Dado que cos ( θt ) = cos (2 π + θt ), la condición de estabilidad se determina
únicamente por la magnitud de r = (- a 2 ) 1/2 . Si | a 2 | = 1, las oscilaciones son de amplitud
invariable; la solución homogénea es periódica. Las oscilaciones se amortiguan si | a 2 | <1
y explotan si | a 2 | > 1.
Ejemplo : Vale la pena trabajar con un ejercicio usando una ecuación con raíces
imaginarias. El lado izquierdo de la Hoja de Trabajo 1.2 examina el comportamiento de la
ecuación y t = 1.6 y t-1 - 0.9 y t -2 . Una comprobación rápida muestra que el
discriminante d es negativo para que las raíces características sean imaginarias. Si nos
transformamos en coordenadas polares, el valor der está dado por (0.9) 1/2 =
0.949. De (1.50) , cos ( θ ) = 1.6 / (2 * 0.949) = 0.843. Puede usar una tabla de
trigonometría o una calculadora para mostrar que θ = 0.567 (es decir, si cos (\ theta ) =
0,843, \ theta = 0,567). Así, la solución homogénea es

El gráfico en el lado izquierdo de la Hoja de Trabajo 1.2 establece β 1 = 1 y β 2 = 0 y traza la


solución homogénea para t = 1, ..., 30. El caso 2 usa el mismo valor de a 2 (por lo tanto, r =
0.949 ) pero establece un 1 = -0,6. De nuevo, el valor de d es negativo; sin embargo, para
este conjunto de cálculos, cos ( θ ) = -0.316 de manera que θ es 1.89. Comparando los dos
gráficos, se puede ver que el aumento del valor de θ actúa para aumentar la frecuencia de
las oscilaciones.

HOJA DE TRABAJO 1.2


RAÍCES IMAGINARIOS

 (a) Compruebe el discriminante d = ( a 1 ) 2 + 4 a 2

Por lo tanto, las raíces son imaginarias. La solución homogénea tiene la forma

donde β 1 y β 2 son constantes arbitrarias.

 (b) Obtener el valor de r = (- a 2 ) 1/2

 (c) Obtener θ de cos ( θ ) = a 1 / [2 (- a 2 ) 1/2 ]

Dado cos ( θ ), utilice una tabla trigonométrica o una calculadora para encontrar θ :

 (d) Formar la solución homogénea :

Para β 1 = 1 y β 2 = 0, las trayectorias de tiempo de las soluciones homogéneas son:


FIGURA 1.5 Caracterización de las Condiciones de Estabilidad

CONDICIONES DE ESTABILIDAD
Las condiciones generales de estabilidad pueden resumirse usando el
triángulo ABC en la Figura 1.5 . Arco A 0 B es el límite entre los Casos 1 y 3 ; es el
lugar de los puntos donde d = . La región por encima
de A 0 B corresponde al caso 1 (puesto que d > 0), y la región por debajo
de A 0 B corresponde al caso 3 (ya que d <0).
En el caso 1 (en el cual las raíces son reales y distintas), la estabilidad requiere que
la raíz más grande sea menor que la unidad y la raíz más pequeña sea mayor que -
1. La raíz característica más grande , será menor que la unidad si

Cuadrado de cada lado para obtener la condición:

La raíz más pequeña,, será mayor que menos uno si


Cuadrado de cada lado para obtener la condición:

Por lo tanto, la región de estabilidad en el caso 1 consta de todos los puntos en la


región limitada por A 0 BC . Para cualquier punto en A 0 BC , las
condiciones (1.52) y (1.53) semantienen y d > 0.
En el caso 2 (raíces repetidas), . La condición de estabilidad es
| a 1 | <2. Así, la región de estabilidad en la caja 2 consta de todos los puntos de
arco A 0 B . En el caso 3 ( d<0), la condición de estabilidad es r = (- a 2 ) 1/2 <1. Por
lo tanto,

FIGURA 1.6 Raíces características y el círculo unitario

Por lo tanto, la región de estabilidad en el caso 3 se compone de todos los puntos en


la región A 0 B . Para cualquier punto de A 0 B , (1.54) se satisface y d <0.
Una manera sucinta de caracterizar las condiciones de estabilidad es afirmar que
las raíces características deben estar dentro del círculo unitario. Considere el
semicírculo dibujado en la Figura 1.6 . Los números reales se miden en el eje
horizontal y los números imaginarios se miden en el eje vertical. Si las raíces
características α 1 y α 2 son reales, se pueden representar en el eje horizontal. La
estabilidad requiere que se encuentren dentro de un círculo de radio uno. Las
raíces complejas estarán en algún lugar del plano complejo. Si un 1 > 0, las
raíces y pueden ser representados por los dos
puntos que se muestran en la Figura 1.6 . Por ejemplo, α $ ₁ $se dibuja
moviendo un 1 /2 unidades a lo largo del eje real y unidades a lo largo del eje
imaginario. Usando la fórmula de distancia, la longitud del radio r viene dada por
y, utilizando el hecho de que i 2 = -1, obtenemos

La condición de estabilidad requiere que r <1. Por lo tanto, cuando se trazan en el


plano complejo, las dos raíces α 1 y α 2 deben situarse dentro de un círculo de radio
igual a la unidad. En la literatura de series temporales se afirma simplemente que
la estabilidad requiere que todas las raíces características se encuentren dentro
del círculo unitario .

SISTEMAS DE ORDEN SUPERIOR


El mismo método se puede utilizar para encontrar la solución homogénea a
ecuaciones de diferencia de orden superior. La ecuación homogénea para (1.10) es

Dados los resultados de la sección 4 , debe sospechar que cada solución homogénea
tiene la forma en la que A es una constante arbitraria. Por lo tanto, para
encontrar el valor (s) de α , buscamos la solución para

o, dividiendo a través de α t-n , buscamos los valores de α que resuelven

Este n th-orden polinomio producirá n soluciones para α . Denotan estas n raíces


características por α 1 , α 2 , ..., α n . Como en la Sección 4 , la combinación
lineal es también una solución. Las constantes
arbitrarias A 1 a A npueden eliminarse imponiendo n condiciones iniciales sobre la
solución general. Los α ipueden ser números reales o complejos. La estabilidad
requiere que todos los valores reales α iser inferior a la unidad en valor
absoluto. Las raíces complejas vendrán necesariamente en parejas. La estabilidad
requiere que todas las raíces estén dentro del círculo unitario mostrado en la Figura
1.6 .
En la mayoría de las circunstancias hay poca necesidad de calcular directamente las
raíces características de los sistemas de orden superior. Muchos de los detalles
técnicos se incluyen en el Apéndice 1.2 de este capítulo. Sin embargo, existen
algunas reglas útiles para comprobar las condiciones de estabilidad en sistemas de
orden superior.
1. En una ecuación de orden n , una condición necesaria para que todas las
raíces características se encuentren dentro del círculo unitario es

2. Puesto que los valores de a i pueden ser positivos o negativos, una condición
suficiente para que todas las raíces características se encuentren dentro del
círculo unitario es
3. Al menos una raíz característica es igual a unidad si

Cualquier secuencia que contenga una o más raíces características que igualen la
unidad se denomina proceso raíz unitaria .
4. Para una ecuación de tercer orden, las condiciones de estabilidad se pueden
escribir como

Dado que se satisfacen las tres primeras desigualdades, se puede comprobar


cualquiera de las dos últimas. Una de las últimas condiciones es redundante, dado
que los otros tres se mantienen.

7. SOLUCIONES PARTICULARES PARA PROCESOS


DETERMINISTICOS
Encontrar la solución particular a una ecuación de diferencia es a menudo una
cuestión de ingenio y perseverancia. La técnica apropiada depende en gran medida
de la forma de la { x tproceso}. Comenzamos considerando aquellos procesos que
contienen sólo componentes deterministas. Por supuesto, en el análisis
econométrico, el proceso de forzamiento contendrá componentes determinísticos y
estocásticos.
CASO 1
x t = 0. Cuando todos los elementos del proceso { x t } son cero, la ecuación de diferencia se
convierte en

La intuición sugiere que un valor inmutable de y (es decir, y t = y t -1 = ... = c ) debería


resolver la ecuación. Sustituir la solución de ensayo y t = c en (1.58) para obtener que

así que eso

Mientras que (1 - a 1 - a 2 - ... - a n ) no es igual a cero, el valor de c dado por (1.59) es una
solución a (1.58) . Por lo tanto, la solución particular a (1.58) está dada por = a 0 / (1 -
a 1 - a 2- ... - a n ).
Si 1 - a 1 - a 2 - ... - a n = 0, el valor de c en (1.59) es indefinido; es necesario probar alguna
otra forma para la solución. La clave es que { y t } es un proceso de raíz unitaria si Σ a i = 1.
Puesto que { y t } no es convergente, es lógico que la solución constante no funcione. En su
lugar, recuerde las ecuaciones (1.12) y (1.26) ; estas soluciones sugieren que una tendencia
lineal puede aparecer en la solución de un proceso de raíz unitaria. Como tal, pruebe la
solución . Para ct para ser una solución debe ser el caso que

o, combinando términos similares,

Puesto que 1 - a 1 - a 2 - ... - a n = 0, seleccione el valor de c tal que

Por ejemplo, deje

Aquí, un 1 = 0,75 y un 2 = 0,25; { y t } es un proceso de raíz unitaria porque a 1 + a 2 = 1. La


solución particular tiene la forma ct , donde c = 2 / [0.75 + 2 (0.25)] = 1.6.En el caso de que
la solución ct falla, intente secuencialmente las soluciones , ..., ct n . Para
una ecuación de orden n , una de estas soluciones será siempre la solución particular.
CASO 2
El Caso Exponencial. Deje x t tener la exponencial forma b ( d ) rt , donde b, d , y r son
constantes. Puesto que r tiene la interpretación natural como una tasa de crecimiento,
esperamos encontrar este tipo de caso de proceso de forzamiento en un contexto de
crecimiento. Ilustramos el procedimiento de solución usando la ecuación de primer orden

Para tratar de obtener una sensación intuitiva para la forma de la solución, observe que
si b = 0, (1.60) es un caso especial de (1.58) . Por lo tanto, debe esperar una constante para
aparecer en la solución particular. Además, la expresión d rt crece a la tasa constante r . Por
lo tanto, puede esperar que la solución particular tenga la forma ,
donde c 0 y c 1 son constantes. Si esta ecuación es realmente una solución, debería ser capaz
de sustituirla de nuevo en (1.60) y obtener una identidad. Haciendo las sustituciones
apropiadas, obtenemos

Para que esta solución funcione, es necesario seleccionar c 0 y c 1 tal que

Así, una solución particular es

La naturaleza de la solución es que es igual a la constante a 0 / (1 - a 1 ) más una


expresión que crece a la tasa r . Tenga en cuenta que para | d r | <1, la solución particular
converge a un 0 / (1 - a 1 ).
Si bien un 1 = 1 o un 1 = d r , utilice el truco se sugiere en el caso 1 . Si a 1 = 1, pruebe la
solución c 0 = ct , y si a 1 = d r , pruebe la solución c 1 = tb . Utilizar exactamente la misma
metodología en sistemas de orden superior.
CASO 3
Tendencia del tiempo determinista. En este caso, sea la sucesión { x t } representada por
la relación x t = bt d donde b es una constante y d es un entero positivo. Por lo tanto,

Dado que y t depende de t d , se sigue que y t -1 depende de ( t -1) d , y t -2 depende de ( t -2) d ,


y así sucesivamente. Como tal, la solución particular tiene la forma
. Para encontrar los valores de c i , sustituya la solución
particular por (1.62) . A continuación, seleccione el valor de cada c i que da como resultado
una identidad. Aunque son posibles varios valores de d , en aplicaciones económicas es
común ver modelos que incorporan una tendencia lineal de tiempo ( d = 1). Para fines
ilustrativos, considere la ecuación de segundo orden y t = a 0 + a 1 y t -1 + a 2 y t -
2 + bt . Posicione la solución donde c0 y c 1 son coeficientes
indeterminados. La sustitución de esta "solución de desafío" en la ecuación de diferencia de
segundo orden produce

Ahora seleccione los valores de c 0 y c 1 para forzar la ecuación (1.63) para ser una
identidad para todos los valores posibles de t . Si combinamos todos los términos
constantes y todos los términos que implican t , los valores requeridos de c 0 y c 1 son

así que eso

Por lo tanto, la solución particular también contendrá una tendencia temporal lineal. No
deberías tener ninguna dificultad para prever la técnica de solución si a 1 + a 2 = 1. En esta
circunstancia -que es aplicable también a casos de orden superior- intenta multiplicar la
solución de desafío original por t .

8. EL MÉTODO DE LOS COEFICIENTES NO DETERMINADOS


En este punto, es apropiado introducir el primero de dos métodos útiles para
encontrar soluciones particulares cuando hay componentes estocásticos en el
proceso { y t }. La clave del método de los coeficientes indeterminados es
que las ecuaciones lineales tienen soluciones lineales. Por lo tanto, la solución
particular a una ecuación de diferencia lineal es necesariamente lineal. Además, la
solución sólo puede depender del tiempo, de una constante y de los elementos del
proceso de forzamiento { x t }. Por lo tanto, a menudo es posible conocer la forma
exacta de la solución a pesar de que los coeficientes de la solución son
desconocidos. La técnica consiste en plantear una solución llamada solución de
desafío, Que es una función lineal de todos los términos que se cree que aparecen
en la solución real. El problema se convierte en uno de encontrar el conjunto de
valores para aquellos coeficientes indeterminados que resuelven la ecuación de
diferencia.
La técnica real para encontrar los coeficientes es directa. Sustituir la solución de
desafío en la ecuación de diferencia original y resolver los valores de los
coeficientes indeterminados que producen una identidad para todos los valores
posibles de las variables incluidas. Si no es posible obtener una identidad, la forma
de la solución de desafío es incorrecta. Pruebe una nueva solución de prueba y
repita el proceso. De hecho, se utilizó el método de coeficientes indeterminados al
plantear las soluciones de desafío = c 0 + c 1 d rt y para los casos
2 y 3 en la sección 7 .
Para comenzar, reconsidere la ecuación simple de primer orden y t = a 0 + a 1 y t -
1 + έ t . Como se ha resuelto esta ecuación utilizando el método iterativo, la ecuación

es útil para ilustrar el método de coeficientes indeterminados. La naturaleza del


proceso { y t } es tal que la solución particular sólo puede depender de un término
constante, del tiempo y de los elementos individuales de la secuencia { έ t }. Puesto
que t no aparece explícitamente en el proceso de forzamiento, tpuede estar en la
solución particular sólo si la raíz característica es unidad. Dado que el objetivo es
ilustrar el método, plantear la solución de desafío:

donde b 0 , b 1 , y todos los α i son los coeficientes a determinar.


Sustituir (1.64) en la ecuación de la diferencia original para formar

Recogiendo términos similares, obtenemos

La ecuación (1.65) debe mantenerse para todos los valores de t y todos los valores
posibles de la secuencia { έ t }. Por lo tanto, cada una de las siguientes condiciones
debe contener:

Observe que el primer conjunto de condiciones puede resolverse para


el α i recursivamente. La solución de la primera condición implica establecer α 0 = 1.
Dada esta solución para α 0 , la siguiente ecuación requiere α 1 = a 1 . Bajando la
lista, α 2 = a 1 α 1 o α 2 = a 1 2 . Continuando el proceso recursivo,
encontramos α i = a 1 i. Ahora considere las dos últimas ecuaciones. Hay dos casos
posibles, dependiendo del valor de un 1 . Si a 1 ≠ 1, sigue inmediatamente que b 1 = 0
y b 0 = a 0 / (1 - a 1 ). Para este caso, la solución particular es

Comparar este resultado con (1.21) ; verá que es precisamente la misma solución
que se encuentra usando el método iterativo. La solución general es la suma de esta
solución particular más la solución homogénea . Por lo tanto, la solución
general es

Ahora, si hay una condición inicial para y 0 , se sigue que

Combinando estas dos ecuaciones para eliminar la constante arbitraria A ,


obtenemos

así que eso

Se puede verificar fácilmente que (1.66) es idéntico a (1.25) . En cambio, si a 1 =


1, b 0 puede ser cualquier constante arbitraria y b 1 = a 0 . La forma inadecuada de la
solución es

La forma de la solución es "impropia" porque la suma de la { έ t } secuencia no


puede ser finita. Por lo tanto, es necesario imponer una condición inicial. Si el
valor y 0 se da, se deduce que

Imponiendo la condición inicial en la forma inadecuada de la solución se


obtiene (1.26)

Para tomar un segundo ejemplo, considere la ecuación

Una vez más, la solución puede depender sólo de una constante, los elementos de la
{ έ t } de secuencia, y t plantearon a la primera potencia. Como en el ejemplo
anterior, t no necesita ser incluido en la solución de desafío si la raíz característica
difiere de la unidad. Para reforzar este punto, utilice la solución de desafío dada
por (1.64) . Sustituir esta solución tentativa por (1.67) para obtener

Coeficientes de coincidencia en todos los términos que contienen έ t , έ t -1 , έ t -2 , ...,


yields
Los coeficientes de coincidencia de términos de intercepto y coeficientes de
términos que contienen t , obtenemos

Una vez más, hay dos casos. Si a 1 ≠ 1, entonces b 1 = 0 y b 0 = a 0 / (1 - a 1 ). La


solución particular es

La solución general aumenta la solución particular con el término Aa 1 t . Se deja con


el ejercicio de imponer la condición inicial de y 0 sobre la solución
general. Consideremos ahora el caso en que a 1 = 1. Los coeficientes indeterminados
son tales que b 1 = a 0 y b 0 es una constante arbitraria. La forma inadecuada de la
solución es

Si se da y 0 , se sigue que

Por lo tanto, imponiendo la condición inicial, obtenemos

SISTEMAS DE ORDEN SUPERIOR


El procedimiento idéntico se utiliza para sistemas de orden superior. Como
ejemplo, hallemos la solución particular a la ecuación de segundo orden

Como tenemos una ecuación de segundo orden, utilizamos la solución de desafío

donde b 0 , b 1 , b 2 , y los α i son los coeficientes indeterminados.


La sustitución de la solución de desafío por (1.68) produce

Hay varias condiciones necesarias y suficientes para que los valores de los α i 's para
hacer la ecuación por encima de una identidad para todas las realizaciones posibles
de la secuencia { έ t }:
Obsérvese que para cualquier valor de j ≥ 2, los coeficientes resuelven la ecuación
de diferencia de segundo orden α j = a 1 α j -1 + a 2 α j -2 . Puesto que sabemos α 0 y α 1 ,
podemos resolver para todos los α j iterativamente. Las propiedades de los
coeficientes serán precisamente las discutidas cuando se consideran soluciones
homogéneas:
1. La convergencia requiere que | a 2 | <1, a 1 + a 2 <1, y que a 2 - a 1 < 1 .
Obsérvese que la convergencia implica que los valores pasados de
la sucesión { έ t } tienen en última instancia una influencia sucesivamente
menor en el valor actual de y t .
2. Si los coeficientes convergen, la convergencia será directa o oscilatoria
si , seguirá un patrón seno / coseno si ,y
"explotará" y luego convergerá si . Ajustando apropiadamente
el α i , nos quedamos con la expresión restante:

La ecuación (1.69) debe ser igual a cero para todos los valores de t . Primero,
considere el caso en el que a 1 + a 2 ≠ 1. Puesto que (1 - a 1 - a 2 ) no desaparece, es
necesario establecer el valor de b 2 igual a cero. Dado que b 2 = 0 y que el coeficiente
de t debe ser igual a cero, se deduce que b 1 también se debe establecer igual a
cero. Finalmente, dado que b 1 = b 2 = 0, debemos establecer b 0 = a 0/ (1 - a 1 -
a 2 ). En cambio, si a 1 + a 2 = 1, las soluciones para el b i dependen de los valores
específicos de a 0 , a 1 y a 2 . El punto clave es que la condición de estabilidad para
la ecuación homogénea es precisamente la condición para la convergencia de la
solución particular. Si cualquier raíz característica de la ecuación homogénea es
igual a la unidad, aparecerá una tendencia polinomial en la solución
particular. El orden del polinomio es el número de raíces características
unitarias. Este resultado se generaliza a las ecuaciones de orden superior.
Si usted es realmente inteligente, puede combinar la discusión de la última sección
con el método de coeficientes indeterminados. Encuentre la porción determinista
de la solución particular usando las técnicas discutidas en la última sección. A
continuación, utilice el método de coeficientes indeterminados para encontrar la
parte estocástica de la solución particular. En (1.67) , por ejemplo,
establezca έ t = έ t -1 = 0 y obtenga la solución a 0 / (1 - a 1). Ahora utilice el método
de coeficientes indeterminados para encontrar la solución particular de y t = a 1 y t -
1 + έt + β 1 έ t -1 . Añada los componentes determinísticos y estocásticos para obtener

todos los componentes de la solución particular.

UN PROBLEMA RESUELTO
Para ilustrar la metodología usando una ecuación de segundo orden,
aumente (1.28) con el término estocástico έ t para que
Ya se ha verificado que las dos soluciones homogéneas son A 1 (0.5) t y A 2 (0.4) t y
que la porción determinista de la solución particular es = 10. Para encontrar la
porción estocástica de la solución particular, formar la solución de desafío

En contraste con (1.64) , el término de intersección b 0 se excluye (puesto que ya


hemos encontrado la parte determinista de la solución particular) y la tendencia en
el tiempo b 1 t se excluye (ya que ambas raíces características son menor que la
unidad). Para que este desafío funcione, debe satisfacer

Dado que (1.71) debe mantenerse para todas las realizaciones posibles de έ t , έ t -
1 , έ t -2 , ..., cada una de las siguientes condiciones debe contener:

de manera que α 1 = 0,9, y para todo i ≥ 2,

Ahora, es posible resolver (1.72) iterativamente de manera que α 2 = 0.9 α 1 -


0.2 α 0 = 0.61, α 3 = 0.9 (0.61) - 0.2 (0.9) = 0.369, y así sucesivamente. Un método
de solución más elegante es ver (1.72) como una ecuación de diferencia de segundo
orden en la secuencia { α i } con condiciones iniciales α 0 = 1 y α 1 = 0.9. La solución
a (1.72) es

Para obtener (1.73) , observe que la solución


a (1.72) es: α i = A 3 (0.5) i + A 4 (0.4) i donde A 3y A 4 son constantes
arbitrarias. Imponiendo las condiciones α 0 = 1 y α 1 = 0.9 produce (1.73). Si
utilizamos (1.73) , se deduce que: α 0 = 5 (0.5) 0 - 4 (0.4) 0 = 1; \ alpha _ { 1 } = 5
(0,5) 1- 4 (0,4) 1 = 0,9; \ alpha _ { 2 } = 5 (0,5) 2 - 4 (0,4) 2 = 0,61; y así.
La solución general a (1.70) es la suma de las dos soluciones homogéneas y las
porciones deterministas y estocásticas de la solución particular:

donde los α i están dados por (1.73) .


Dadas las condiciones iniciales para y 0 y y 1 , se deduce que A 1 y A 2 deben
satisfacer

Aunque el álgebra se desorden, (1.75) y (1.76) pueden ser sustituidos en (1.74) para
eliminar las constantes arbitrarias:
9. OPERADORES DE LAG
Si no es importante conocer los valores reales de los coeficientes que aparecen en la
solución particular, a menudo es más conveniente utilizar operadores de retardo
que el método de coeficientes indeterminados. El operador de retardo L se
define como un operador linealtal que para cualquier valor y t

Así, L i precediendo y t significa simplemente retrasar y t por i períodos. Es útil


considerar las siguientes propiedades de los operadores de retardo:
1. El retraso de una constante es una constante: Lc = c .
2. La ley distributiva se aplica a los operadores de lag. Podemos establecer
( L i + L j ) y t = L iy t
3. La ley asociativa de la multiplicación se aplica a los operadores de
lag. Podemos establecer L i L j y t = L i ( L j y t ) = L i y t-j = y t-i-j . De manera
similar, podemos establecer L i L j y t= L i + j y t = y t-i-j . Obsérvese
que L 0 y t = y t .
4. L elevado a una potencia negativa es en realidad un operador principal : L-
i y t = y t + i . Para explicar, defina j = - i y forme L j y t = y t-j = y t + j .

5. Para | a | <1, la suma infinita (1 + aL + a 2 L 2 + a 3 L 3 + ...) y t = y t / (1 -


aL ). Esta propiedad de los operadores de lag puede no parecer intuitiva,
pero se sigue directamente de las propiedades 2 y 3 anteriores.
Prueba : Multiplique cada lado por (1 - aL ) para formar (1 - aL ) (1
+ aL + a 2 L 2 + a 3 L 3+ ...) y t = y t . Multiplique las dos expresiones para obtener (1 -
aL + aL - a 2 L 2 + a 2 L 2 - a 3 L 3 + ...) y t = y t . Dado que | un| <1, la
expresión a n L n y t converge a cero cuando n→ ∞. Así, los dos lados de la ecuación
son iguales.
6. Para | a | > 1, la suma infinita [1 + ( aL ) -1 + ( aL ) -2 + ( aL ) -3 + ...] y t = -
aLy t / (1 - aL ). Así,

Prueba : Multiplique por (1 - aL ) a la forma (1 - aL ) [1 + ( aL ) -1 + ( aL ) -2 +


( aL ) -3 + ...] y t = - aLy t . Realizar la multiplicación indicada para obtener [1 - aL +
( aL ) -1 -1 + ( aL ) -2 - ( aL ) -1 + ( aL ) -3 - ( aL ) -2 ...] y t = - aLyt . Dado que | a | > 1,
la expresión a -n L -n y tconverge a cero cuando n → ∞. Así, los dos lados de la
ecuación son iguales.
Los operadores de Lag proporcionan una notación concisa para escribir ecuaciones
de diferencia. Usando los operadores de lag, podemos escribir la ecuación del
orden p th y t = a 0+ a 1 y t -1 + ... + a p y t-p + έ t as

o, más compactamente, como


donde A ( L ) es el polinomio (1 - a 1 L - a 2 L 2 - ... - a p L p )
Dado que A ( L ) puede ser visto como un polinomio en el operador de retardo, la
notación A(1) se utiliza para denotar la suma de los coeficientes

Como segundo ejemplo, los operadores de retardo pueden usarse para expresar la
ecuación y t = a 0 + a 1 y t -1 + ... + a p y t-p + έ t + β 1 έ t -1 + ... + β q έ t-q como

donde A ( L ) y B ( L ) son polinomios de órdenes p y q , respectivamente.


Es fácil utilizar operadores de retraso para resolver ecuaciones de diferencia
lineal. Considere nuevamente la ecuación de primer orden y t = a 0 + a 1 y t -
1 + έ t donde | a 1 | <1. Utilice la definición de L para formar

Resolviendo para y t , obtenemos

De la propiedad 1, sabemos que La 0 = a 0 , de modo que a 0 / (1 - a 1 L )


= a 0 + a 1 a 0 + a 1 2+ a 0 + ... = a 0 / (1 - a 1 ). De la propiedad 5, sabemos que έ t / (1 -
a 1 L ) = έ t + a 1 έ t -1 + a 12έ t -2 + .... Combinando estas dos partes de la solución,
obtenemos la solución particular dada por (1.21) .
Para la práctica, podemos usar operadores de retraso para
resolver (1.67) : y t = a 0 + a 1 y t -1+ έ t + β 1 έ t -1 , donde | a 1 | <1. Utilice la propiedad
2 para formar (1 - a 1 L ) y t = a 0 + (1 + β 1 L ) έ t . Resolver los rendimientos de y t

así que eso

La ampliación de los dos últimos términos de (1.80) produce la misma solución


encontrada usando el método de coeficientes indeterminados.
Supongamos ahora que y t = a 0 + a 1 y t -1 + έ t pero | a 1 | > 1. La aplicación de la
propiedad 5 a (1.79) es inapropiada porque implica que y t es infinita. En su lugar,
expanda (1.79)utilizando la propiedad 6:

LAG OPERADORES EN SISTEMAS DE ORDEN SUPERIOR


También podemos utilizar los operadores de retardo para transformar el n th-fin
ecuación y t= un 0 + un 1 y t -1 + un 2 y t -2 + ... + a n y t-n + έ t en

o
A partir de nuestro análisis anterior (véase también el apéndice 1.2 ), sabemos que
la condición de estabilidad es tal que las raíces características de la ecuación α n -
a 1 α n -1 - ... - a n = 0 están todas dentro del círculo unitario. Obsérvese que los
valores de α que resuelven la ecuación característica son los recíprocos de los
valores de L que resuelven la ecuación 1 - a 1L ... - a n L n = 0. De hecho, la expresión
1 - a 1 L ... - a nL n se denomina a menudo la ecuación característica inversa . Por lo
tanto, en la literatura, a menudo se afirma que la condición de estabilidad es que
las raíces características de (1 - a 1 L ... - a n L n ) estén fuera del círculo unitario.
En principio, se podría utilizar los operadores de retraso para obtener realmente
los coeficientes de la solución particular. Para ilustrar usando el caso de segundo
orden, considere y t = ( a 0 + έ t ) / (1 - a 1 L - a 2 L 2 ). Si supiéramos que los factores
de la ecuación cuadrática eran tales que (1 - a 1 L - a 2 L 2 ) = (1 - b 1 L ) (1 - b 2 L ),
podríamos escribir

Si tanto b 1 como b 2 son menores que la unidad en valor absoluto, podemos aplicar
la propiedad 5 para obtener

Vuelva a aplicar la regla a un 0 / (1 - b 1 ) ya cada uno de los elementos de la suma


Σ b 1 i έ t-ipara obtener la solución particular. Si desea conocer los coeficientes
realesdel proceso, es preferible utilizar el método de coeficientes
indeterminados. La belleza de los operadores de lag es que se pueden utilizar para
denotar tales soluciones particulares sucintamente. El modelo general

tiene la solución particular

Como sugiere (1.82) , hay una solución orientada hacia el futuro a cualquier
ecuación de diferencia lineal. Este texto no hará mucho uso de la solución
orientada hacia el futuro ya que las realizaciones futuras de las variables
estocásticas no son directamente observables. Algunos de los detalles de las
soluciones orientadas hacia el futuro se pueden encontrar en el Manual
Complementario de este texto disponible en www.cba.ua.edu/~wenders o de
Wiley.

10. RESUMEN
La econometría de series temporales se refiere a la estimación de ecuaciones de
diferencias que contienen componentes estocásticos. Originalmente, se utilizaron
modelos de series temporales para la predicción. Descubrir la trayectoria dinámica
de una serie mejora las previsiones porque los componentes predecibles de la serie
se pueden extrapolar en el futuro. El creciente interés por la dinámica económica
ha dado un nuevo énfasis a la econometría de series de tiempo. Las ecuaciones de
diferencia estocástica surgen, naturalmente, de modelos económicos
dinámicos. Las ecuaciones apropiadamente estimadas pueden ser utilizadas para la
interpretación de datos económicos y para la prueba de hipótesis.
Este capítulo introductorio se centró en los métodos de "resolver" ecuaciones de
diferencia estocástica. Aunque la iteración puede ser útil, no es práctico en muchas
circunstancias. La solución a una ecuación de diferencia lineal se puede dividir en
dos partes: una solución particular y una solución homogénea . Un factor que
complica es que la solución homogénea no es única. La solución general es una
combinación lineal de la solución particular y todas las soluciones
homogéneas. Imponiendo n condiciones iniciales en la solución general de
una ecuación de orden n , se obtiene una solución única.
La porción homogénea de una ecuación de diferencias es una medida
del desequilibrio en el (los) período (s) inicial (es). La ecuación homogénea es
especialmente importante en cuanto que produce las raíces
características; un n ecuación th-orden tiene n raíces tan característicos. Si todas
las raíces características se encuentran dentro del círculo unitario, la serie será
convergente. Como se verá en el capítulo 2 , existe una relación directa entre las
condiciones de estabilidad y la cuestión de si una variable económica es
estacionaria o no estacionaria.
El método de los coeficientes indeterminados y el uso de los operadores de lag son
herramientas poderosas para obtener la solución particular. La solución particular
será una función lineal de los valores actuales y pasados del proceso de
forzamiento. Además, esta solución puede contener un término de intercepción y
una función polinómica del tiempo. Las raíces unitarias y las raíces características
fuera del círculo unitario requieren la imposición de una condición inicial para que
la solución particular sea significativa. Algunos modelos económicos permiten
soluciones orientadas hacia el futuro; en tales circunstancias, los acontecimientos
futuros previstos tienen consecuencias para el período actual.
Las herramientas desarrolladas en este capítulo están dirigidas a allanar el camino
para el estudio de la econometría de series de tiempo. Es una buena idea trabajar
todos los ejercicios presentados a continuación. Las raíces características, el
método de los coeficientes indeterminados, y los operadores de lag serán
encontrados a lo largo del resto del texto.

PREGUNTAS Y EJERCICIOS
1. Considere la ecuación de diferencia y t = a 0 + a 1 y t -1 con la condición
inicial y 0 . Jill resolvió la ecuación de diferencias haciendo una iteración
hacia atrás:

Bill agregó las soluciones homogéneas y particulares para obtener y t = a 0 / (1 - a 1 )


+ a 1t [ y 0 - a 0 / (1 - a 1 )].
1. Demuestre que las dos soluciones son idénticas para | a 1 | <1.
2. Demuestre que para un 1 = 1, la solución de Jill es equivalente
a y t = a 0 t + y 0 . ¿Cómo usaría el método de Bill para llegar a esta
misma conclusión en el caso de que a 1 = 1?
2. El modelo de telaraña en la Sección 5 supuso expectativas de
precios estáticas . Considere una formulación alternativa
llamada expectativas adaptativas . Sea el precio esperado en t (denotado
por ) una media ponderada del precio en t -1 y la expectativa de precio del
período anterior. Formalmente,

Claramente, cuando α = 1, los esquemas de expectativas estáticas y adaptativas son


equivalentes. Una característica interesante de este modelo es que puede ser vista
como una ecuación de diferencia que expresa el precio esperado en función de su
propio valor retardado y la variable forzante p t -1 .
0. Encuentre la solución homogénea para .
1. Use los operadores de retraso para encontrar la solución en
particular. Compruebe su respuesta sustituyendo su respuesta en la ecuación de
diferencia original.
3. Supongamos que el proceso de suministro de dinero tiene la
forma m t = m + ρm t -1 + έ t , donde m es una constante y 0 < ρ <1.
0. Demuestre que es posible expresar m t + n en función del valor conocido m t y
la sucesión { έ t +1 , έ t +2 , ..., έ t + n }.
1. Supongamos que todos los valores de έ t + i para i > 0 tienen un valor medio
de cero. Explique cómo podría utilizar su resultado en la parte a para predecir
los períodos de suministro de dinero n en el futuro.
4. Encuentre las soluciones particulares para cada uno de los siguientes:
0. y t = a 1 y t -1 + έ t + β 1 έ t -1
1. y t = un 1 y t -1 + έ 1 t + β 1 έ 2 t ( Indirecta : La forma de la solución es y t =
Σ c i έ 1 t-i + Σ d i varepsilon 2 t-i )
5. El problema de raíz unitaria en la econometría de series de tiempo se
refiere a las raíces características que son iguales a la unidad. Para obtener
una vista previa del problema:
0. Encuentre la solución homogénea a cada uno de los siguientes ( Sugerencia :
Cada uno tiene al menos una raíz unitaria):
1. y t = 1,5 y t -1 - 0,5 y t -2 + έ t
2. y t = y t -2 + έ t
3. y t = 2 y t -1 - y t -2 + έ t
4. y t = y t -1 + 0,25 y t -2 - 0,25 y t -3 + έ t
1. Demuestre que cada una de las soluciones de retroceso no es convergente.
2. Demuestre que la Ecuación i puede escribirse enteramente en las primeras
diferencias; esto es, Δ y t = 0.5 Δ y t -1 + έ t . Encuentre la solución particular para
Δ y t. ( Sugerencia : Encuentre la solución particular para la secuencia {Δ y t } en
términos de la secuencia { έ t }.)
3. De forma similar, transformar las otras ecuaciones en su forma de primera
diferencia. Encuentre la solución particular, si existe, para las ecuaciones
transformadas.
4. Escribir las ecuaciones i a iv usando operadores lag.
5. Dada una condición inicial y 0 , encuentre la solución para: y t = a 0 - y t -
1 + έ t .
6. Para cada uno de los siguientes, calcule las raíces características y el
discriminante d para describir el proceso de ajuste. Además, para cada uno
de ellos, y 1 = y 2 = 10. Utilice un programa de hoja de cálculo para calcular y
trazar las siguientes 25 realizaciones de la serie anterior.
0.y t = 0,75 y t -1 - 0,125 y t -2
1.y t = 1,5 y t -1 - 0,75 y t -2
2.y t = 1,8 y t -1 - 0,81 y t -2
3.y t = 1,5 y t -1 - 0,5625 y t -2
7. Un investigador estimó la siguiente relación para la tasa de inflación ( π t ):

0.Supongamos que en los períodos 0 y 1, la tasa de inflación fue de 10 por ciento y 11


por ciento, respectivamente. Encuentre las soluciones homogéneas, particulares y
generales para la tasa de inflación.
1.Discuta la forma de la función de respuesta al impulso. Dado que los Estados
Unidos no se dirigen a la inflación desbocada, ¿por qué creen que la ecuación del
investigador está mal estimada?
8. Considere el proceso estocástico y t = a 0 + a 2 y t -2 + έ t .
0.Encuentre la solución homogénea y determine la condición de estabilidad.
1.Encuentre la solución particular usando el método de coeficientes indeterminados.
2.Demuestre que los operadores de retraso producen la misma solución.
9. Para cada uno de los siguientes, verifique que la solución planteada satisface
la ecuación de diferencias. Los símbolos c , c 0 y a 0 indican las constantes.

10. Parte 1: Para cada uno de los siguientes, determine si { y t } representa un


proceso estable. Determine si las raíces características son reales o
imaginarias y si las partes reales son positivas o negativas.
0.y t - 1,2 y t -1 + 0,2 y t -2 = 0
1.y t - 1,2 y t -1 + 0,4 y t -2 = 0
2.y t - 1,2 y t -1 - 1,2 y t -2 = 0
3.y t + 1,2 y t -1 = 0
4.y t - 0,7 y t -1 - 0,25 y t -2 + 0,175y t -3 = 0
[ Sugerencia : ( x - 0,5) ( x + 0,5) ( x - 0,7) = x 3 - 0,7 x 2 - 0,25 x + 0,175.]
Parte 2: Escriba cada una de las ecuaciones anteriores utilizando operadores de
retraso. Determine las raíces características de la ecuación característica inversa.
11. Considere la ecuación de diferencia estocástica

0.Supongamos que las condiciones iniciales son tales que y 0 = 0 y έ 0 = έ -1 = 0.


Supongamos ahora que έ 1 = 1. Determine los valores y 1 a y 5 mediante iteración
hacia adelante.
1.Encuentre las soluciones homogéneas y particulares.
2.Imponer las condiciones iniciales para obtener la solución general.
3.Trace la trayectoria del tiempo de un choque έ t en toda la trayectoria temporal de
la secuencia { y t }.
12. En la ecuación (1.5) , determine las restricciones de α y β necesarias para
asegurar que el proceso { y t } sea estable.
13. Considere las siguientes dos ecuaciones de diferencia estocástica:
0.y t = 3 + 0,75 y t -1 - 0,125 y t -2 + έ t
1.y t = 3 + 0,25 y t -1 + 0,375 y t -2 + έ t
2.Utilice el método de coeficientes indeterminados para encontrar la solución
particular para cada ecuación.
3.Encuentre las soluciones homogéneas para cada ecuación.
4.Para cada proceso, supongamos que y 0 = y 1 = 8 y que todos los valores
de έ t para t = 1, 0, -1, -2, ... = 0. Utilice el método ilustrado por las ecuaciones
(1.75) y (1.76) para encontrar los valores de las constantes A 1 y A 2 .

NOTAS FINALES
1 .. Otra posibilidad es obtener la solución orientada hacia el futuro. Dado que estamos tratando con
ecuaciones de predicción, las soluciones orientadas hacia el futuro no son importantes para
nuestros propósitos. Algunos de los detalles relativos a las soluciones orientadas hacia el futuro
están incluidos en el Manual Complementariodisponible en mi sitio
web: www.cba.ua.edu/~wenders .

2 .. Alternativamente, puede sustituir (1.26) en (1.17) . Tenga en cuenta que cuando έ t es una
perturbación aleatoria pura, y t = a 0 + y t -1 + έ t se denomina una caminata aleatoria más el modelo
de deriva.

3 .. Cualquier ecuación lineal en las variables z 1 a z n es homogénea si tiene la forma a 1 z 1 + a 2 z 2 + ...


+ a n z n = 0. Para obtener la porción homogénea de (1.10) , simplemente coloque el interceptar el
término a 0 y el proceso de forzamiento x t igual a cero. Por lo tanto, la ecuación homogénea
para (1.10) es y t = a 1 y t -1 + a2 y t 2 + ... + a n y t-n.

4 .. Si b > a , las curvas de demanda y de oferta no se intersectan en el cuadrante positivo. La


hipótesis a > bgarantiza que el precio de equilibrio es positivo.

5 .. Por ejemplo, si el proceso de forzamiento es el multiplicador de impacto es la derivada parcial


de x t = έ t + β 1 έ t -1 + β 2 έ t -2 + ..., el multiplicador de impacto es la derivada parcial de y t con respecto
a varepsilon t .

APÉNDICE 1.1: RAÍCES IMAGINARIAS Y TEOREMA DE


MOIVRE
Considere una ecuación de diferencia de segundo orden y t = a 1 y t -1 + a 2 y t -2 tal que
el discriminante d es negativo [ie, d = a 1 2 + 4 a 2 <0]. De la sección 6 , sabemos que
la solución homogénea completa puede escribirse en la forma

donde las dos raíces características imaginarias son


El propósito de este apéndice es explicar cómo reescribir e interpretar (A1.1) en
términos de funciones trigonométricas estándar. Es posible que primero desee
actualizar su memoria con respecto a dos identidades trigonométricas útiles. Para
cualesquiera dos ángulos θ 1 y θ 2 ,

Si θ 1 = θ 2 , podemos eliminar subíndices y formar

La primera tarea es demostrar cómo expresar números imaginarios en el plano


complejo. Consideremos la figura A1.1 en la que el eje horizontal mide números
reales y el eje vertical mide números imaginarios. El número complejo a + bi puede
ser representado por el punto aunidades del origen a lo largo del eje horizontal
y b unidades del origen a lo largo del eje vertical. Es conveniente representar la
distancia desde el origen por la longitud del vector denotado por r . Considere el
ángulo en el triángulo 0 ab y observe que cos ( θ ) = a / r y sin ( θ ) = b/ R . Por lo
tanto, las longitudes a y b pueden medirse

En términos de (A1.2) , podemos definir un = un 1 /2 y . Por lo tanto, las


raíces características α 1 y α 2 pueden escribirse como:

El siguiente paso es considerar las expresiones α 1 t y α 2 t . Comience con la


expresión α 1 2 y recuerde que i 2 = -1:

FIGURA A1.1 Representación gráfica de números complejos

Desde (A1.4) ,

Si continuamos de esta manera, es fácil demostrar que


Puesto que es un número real y α 1 y α 2 son complejos, se deduce
que A 1 y A 2 deben ser complejos. Aunque A 1 y A 2 son números complejos
arbitrarios, deben tener la forma

donde B 1 y B 2 son números reales arbitrarios medidos en radianes.


Para calcular A 1 ( α 1 t ), utilice (A1.6) y (A1.7) para formar

Usando (A1.3) , obtenemos

Debe utilizar la misma técnica para convencerse de que

Dado que la solución homogénea y t h es la suma de (A1.8) y (A1.9) ,

Puesto que B 1 es arbitrario, la solución homogénea se puede escribir en términos


de las constantes arbitrarias B 2 y B 3

Ahora imagine un círculo con un radio de unidad superpuesto en la figura A1.1 . La


condición de estabilidad es que la distancia r = 0b sea menor que la unidad. Por lo
tanto, en la literatura se dice que la condición de estabilidad es que la raíz
característica (s) se encuentre dentro de este círculo unitario.

APÉNDICE 1.2: RAÍCES CARACTERÍSTICAS EN LAS


ECUACIONES DE ORDEN SUPERIOR
La ecuación característica a una ecuación de diferencias de orden n es

Como se indica en la Sección 6 , los n valores de α que resuelven esta ecuación


característica se llaman raíces características. Denotan las n soluciones
por α 1 , α 2 , ... α n . Dados los resultados de la sección 4 , la combinación
lineal es también una solución a (A1.12) .
A priori , las raíces características pueden asumir cualquier valor. No hay ninguna
restricción de que sean reales frente a complejos ni ninguna restricción sobre su
signo o magnitud. Considere las posibilidades:
1. Todos los α i son reales y distintos. Hay varios subcases
importantes. Primero supongamos que cada valor de α i es menor que la
unidad en valor absoluto. En este caso, la solución
homogénea (A1.12) converge ya que el límite de cada uno es igual a cero
cuando t se aproxima al infinito. Para un valor negativo de α i , la
expresión es positiva para valores pares de t y negativos para valores
impares de t . Por lo tanto, si alguno de los α i son negativos (pero menos de
uno en valor absoluto), la solución tenderá a presentar alguna oscilación. Si
cualquiera de los α ison mayores que la unidad en valor absoluto, la solución
divergirá.
2. Todos los α i son reales, pero m ≤ n de las raíces se repiten. Sea la
solución tal que α 1 = α 2 = ... = α m . Llame al único valor distinto de esta
raíz y deje que las otras raíces nm sean denotadas por α m +1 a través
de α n . En el caso de una ecuación de segundo orden con una raíz repetida,
usted vio que una solución era y la otra era . Con m raíces
repetidas, se verifica fácilmente que son también
soluciones a la ecuación homogénea. Conm raíces repetidas, la combinación
lineal de todas estas soluciones es

3. Algunas de las raíces son complejas. Las raíces complejas (que vienen
necesariamente en pares conjugados) tienen la forma α i ± iθ ,
donde α i y θ son números reales e i se define como . Para cualquier par
de este tipo, una solución a la ecuación homogénea
es: A 1 ( α 1 + iθ ) t + A 2 ( α 1 - iθ ) t donde A 1 y A 2son constantes
arbitrarias. Transformando en coordenadas polares, las dos soluciones
asociadas pueden escribirse en la forma: β 1 r t cos ( θt + β 2 ) con constantes
arbitrarias β 1 y β 2 . Aquí la estabilidad depende de la magnitud de r t ; si
| r | <1, el sistema converge. Sin embargo, incluso si hay convergencia, la
convergencia no es directa porque las funciones seno y coseno imparten
comportamiento oscilatorio a la trayectoria temporal de y t . Por ejemplo, si
hay tres raíces, dos de las cuales son complejas, la solución homogénea tiene
la forma

Estabilidad de los sistemas de orden superior : En la práctica, es difícil


encontrar los valores reales de las raíces características. A menos que la ecuación
característica sea fácilmente factorizada, es necesario utilizar métodos numéricos
para obtener las raíces características. Afortunadamente, paquetes de software
como Mathematica, Maple o Mathcad pueden obtener fácilmente las raíces
características de las ecuaciones de diferencia. En una época era popular utilizar
el Teorema de Schur para determinar si todas las raíces se encuentran dentro
del círculo unitario. En lugar de calcular todos estos determinantes, a menudo es
posible utilizar las reglas simples discutidas en la Sección 6 . Aquellos de ustedes
que estén familiarizados con álgebra matricial tal vez deseen consultar el Manual
Complementario a este texto disponible en mi sitio
Webwww.cba.ua.edu/~wenders o Samuelson (1941) para las condiciones
apropiadas.

CAPÍTULO 2

MODELOS ESTACIONARIOS DE SERIE DE TIEMPO


La teoría de las ecuaciones de las diferencias lineales puede ampliarse para
permitir que el proceso de forzado { x t } sea estocástico. Esta clase de ecuaciones de
diferencia estocástica lineal subyace en gran parte de la teoría de la econometría de
series de tiempo. Especialmente importante es la metodología de Box-Jenkins
(1976) para estimar modelos de series de tiempo de la forma

Estos modelos se llaman modelos de tiempo-serie de media móvil integrada


(ARIMA) autoregresivos. Este capítulo tiene tres objetivos:
1. Presentar la teoría de las ecuaciones de diferencia lineal estocástica y
considerar las propiedades de las series temporales de los modelos
estacionarios ARIMA. Un modelo ARIMA estacionario se denomina modelo
de media móvil autorregresiva (ARMA). Se muestra que las condiciones de
estabilidad descritas en el capítulo anterior son condiciones necesarias para
la estacionariedad.
2. Desarrollar las herramientas utilizadas en la estimación de modelos
ARMA. Especialmente útiles son las funciones de autocorrelación y
autocorrelación parcial. Se muestra cómo la metodología de Box-Jenkins se
basa en estas herramientas para estimar un modelo ARMA a partir de datos
de muestra.
3. Considere diversas estadísticas de prueba para comprobar la adecuación del
modelo. Se analizan en detalle varios ejemplos de modelos ARMA
estimados. Se muestra cómo se puede utilizar un modelo correctamente
estimado para la predicción.

1. MODELOS DE ECUACIÓN DE DIFERENCIAS


ESTOCÁSTICAS
En este capítulo seguimos trabajando con modelos de series de tiempo discretos ,
en lugar de continuos. Recuérdese de la discusión en el capítulo 1 que podemos
evaluar la función y = f ( t ) en t 0 y t 0 + h para formar

Como cuestión práctica, la mayoría de los datos económicos de la serie temporal se


recogen por períodos de tiempo discretos. Por lo tanto, consideramos solamente los
intervalos equidistantes t 0 , t 0 + h , t 0 - 2 h , t 0 + 3 h , ... y convenientemente h = 1.
No obstante, tenga cuidado de reconocer que una serie temporal discreta implica
que t , pero no necesariamente y t , es discreta. Por ejemplo, aunque la
precipitación anual de Escocia es una variable continua, la secuencia de los totales
anuales de lluvias para los años 1a través de t es una serie temporal discreta. En
muchas aplicaciones económicas, t se refiere a "tiempo" de modo que hrepresenta
el cambio en el tiempo. Sin embargo, t no necesita referirse al tipo de intervalo de
tiempo que se mide por un reloj o calendario. En lugar de permitir que nuestras
unidades de medida sean minutos, días, trimestres o años, t puede referirse a un
número de evento ordenado. Podríamos dejar que y t denote el resultado de
spin t en una ruleta; y t puede asumir cualquiera de los 38 valores 00, 0, 1, ..., 36.
Se dice que una variable discreta y es una variable aleatoria (es decir, estocástica)
si para cualquier número real r existe una probabilidad p ( y ≤ r ) que y tomará un
valor menor o igual que r . Esta definición es bastante general; en el uso común,
está típicamente implicado que hay al menos un valor de r para el cual 0
< p ( y = r ) <1. Si hay algo r para el cual p ( y = r ) = 1, y es determinista y no
aleatoria.
Es útil considerar los elementos de una serie temporal observada ( y 0 , y 1 , y 2 ,
..., y t } como realizaciones (es decir, resultados) de un proceso estocástico. Como
en el Capítulo 1 , seguimos permitiendo que la notación y t se refiera a un elemento
de toda la secuencia { y t }. En nuestro ejemplo de ruleta, y t denota el resultado de
spin t en una ruleta. Si observamos los giros 1 a T , podemos formar la
secuencia y 1 , y 2 , ..., yT o, más compactamente, { y t }. De la misma manera, el
término y t podría utilizarse para indicar el producto interno bruto (PIB) en el
período t . Puesto que no podemos pronosticar el PIB a la perfección, y t es una
variable aleatoria. Una vez que aprendemos el valor del PIB en el período t , y t
se convierte en uno de los valores realizados de un proceso estocástico. (Por

supuesto, el error de medición puede evitar que sepamos el valor "verdadero" del
PIB).
Para las variables discretas, la distribución de probabilidad de y t viene dada por
una fórmula (o tabla) que especifica cada posible valor realizado de y t y la
probabilidad asociada con esa realización. Si las realizaciones están enlazadas a
través del tiempo, existe la distribución de probabilidad
conjunta p ( y 1 = r 1 , y 2 = r 2 , ..., y T = r T ) donde r i es el valor realizado de yen el
período i . Habiendo observado la primera trealizaciones, podemos formar el valor
esperado de y t +1 , y t +2 , ..., condicionado a los valores observados de y 1 a y t . Esta
media condicional, o valor esperado, de y t + i se denota por E t [ y t + i | y t , y t -1 ,
..., y 1 ], o E t y t + i .
Por supuesto, si y t se refiere al resultado de girar una ruleta justa, la distribución de
probabilidad se caracteriza fácilmente. En contraste, es posible que nunca podamos
describir completamente la distribución de probabilidad para el PIB. Sin embargo,
la tarea de los teóricos económicos es desarrollar modelos que capten la esencia del
verdadero proceso generador de datos. Las ecuaciones de diferencia estocástica son
una manera conveniente de modelar procesos económicos dinámicos. Para tomar
un ejemplo simple, supongamos que el objetivo de la Reserva Federal de dinero
crece 3 por ciento cada año. Por lo tanto,

de modo que, dada la condición inicial, la solución particular es

donde : = el logaritmo del objetivo de oferta monetaria en el año t

= la condición inicial para la oferta monetaria objetivo en el período cero


Por supuesto, la oferta monetaria real ( m t ) y la meta no necesitan ser
iguales. Supongamos que al final del período t - 1, existen m t -1 de dólares pendientes
que se transfieren al período t. Por lo tanto, al principio de t hay m t -1 dólares para
que elbrecha entre el objetivo y la oferta monetaria real es . Supongamos
que la Fed no puede controlar perfectamente la oferta de dinero, pero intenta
cambiar la oferta de dinero por ρ % ( ρ <100%) de cualquier diferencia entre la
oferta monetaria deseada y la actual. Podemos modelar este comportamiento como
O, usando (2.1) , obtenemos

donde έ t es la parte incontrolable de la oferta monetaria.


Suponemos que la media de έ t es cero en todos los periodos de tiempo.
Aunque la teoría económica es demasiado simple, el modelo ilustra los puntos clave
discutidos anteriormente. Tenga en cuenta lo siguiente:
1. Aunque la oferta de dinero es una variable continua, (2.2) es una ecuación
de diferencia discreta. Dado que el proceso forzoso { έ t } es estocástico, la
oferta monetaria es estocástica; podemos llamar (2.2) una ecuación de
diferencia estocástica lineal.
2. Si supiéramos la distribución de { έ t }, podríamos calcular la distribución de
cada elemento en la secuencia { m t }. Dado que (2.2) muestra cómo las
realizaciones de la secuencia { m t } están enlazadas a través del tiempo,
podríamos calcular las diversas probabilidades conjuntas. Obsérvese que la
distribución de la secuencia de suministro de dinero está completamente
determinada por los parámetros de la ecuación de diferencia (2.2) y la
distribución de la secuencia { έ t }.
3. Después de observar las primeras observaciones t en la secuencia { m t },
podemos hacer pronósticos de m t +1 , m t +2 , .... Por ejemplo,
actualizando (2.2) por un período y tomando la expectativa condicional, el
pronóstico de m t +1 es E t m t +1 = .
Antes de avanzar demasiado lejos en estas líneas, volvamos al bloque básico de
modelos de series temporales estocásticas discretas: el proceso de ruido
blanco . Una secuencia { έ t } es un proceso de ruido blanco si cada valor en la
secuencia tiene una media de cero, tiene una varianza constante y no está
correlacionado con todas las otras realizaciones. Formalmente, si la notación E ( x )
denota el valor teórico medio de x , la secuencia { έ t } es un proceso de ruido blanco
si, para cada período de tiempo t ,

En el resto de este texto, { έ t } se referirá siempre a un proceso de ruido blanco y


σ 2 se referirá a la varianza de ese proceso. Cuando sea necesario hacer referencia a
dos o más procesos de ruido blanco , se utilizarán símbolos como { έ 1 t } y
{ έ 2 t }. Ahora, use un proceso de ruido blanco para construir las series temporales
más interesantes

Para cada período t , x t se construye tomando los valores έ t , έ t -1 , ..., έ t-q y


multiplicando cada uno por el valor asociado de β i . Una secuencia formada de esta
manera se denomina media móvil de orden q y se denomina MA ( q ). Para
ilustrar un proceso típico de media móvil, suponga que gana $ 1 si una moneda
justa muestra cabezas y pierde $ 1 si muestra colas. Denote el resultado en el
lanzamiento t por έ t (es decir, para el lanzamiento t , έ tes + $ 1 o - $ 1). Si desea
mantener un registro de sus rayas calientes, es posible que desee calcular sus
ganancias promedio en los últimos cuatro lanzamientos. Para cada tirada de la
moneda t , su recompensa promedio en los últimos cuatro lanzamientos es 1/4 έ t +
1/4 έ t -1 + 1/4 έ t -2 + 1/4 έ t -3 . En términos de (2.3) , esta secuencia es un proceso de
media móvil tal que β i = 0.25 para i ≤ 3 y 0 en otro caso.
Aunque la secuencia { έ t } es un proceso de ruido blanco, la secuencia construida
{ x t } noserá un proceso de ruido blanco si dos o más de los β i difieren de
cero. Para ilustrar utilizando un proceso de MA (1), establezca β 0 = 1, β 1 = 0.5 y
todos los demás β i = 0. En esta circunstancia, E ( x t ) = E ( έ t + 0.5 έ t -1 ) = 0 y var
( x t ) = var ( έ t + 0.5έ t -1 ) = 1,25 σ 2 . Puede convencerse fácilmente de que E ( x t )
= E ( x t-s ) y que var ( x t ) = var ( x t-s ) para todos los s . Por lo tanto, las dos
primeras condiciones para { x t } ser un proceso de ruido blanco se satisfacen. Sin
embargo, E ( x t x t -1 ) = E [( έ t - 0.5 έ t -1 ) ( έ t -1+ 0.5 έ t -2 )] = E ( έ tέ t -1 + 0.5 ( έ t -1 ) 2 +
0.5 έ t έ t -2 + 0.25 έ t -1 έ t -2 ) = 0.5 σ 2 . Dado que existe un valor de s ≠ 0 tal
que E ( x t x t-s ) ≠ 0, la secuencia { x t } no es un proceso de ruido blanco.
El ejercicio 1 al final de este capítulo le pide que encuentre la media, la varianza y la
covarianza de sus rayas calientes en el lanzamiento de monedas. Para la práctica,
debe realizar ese ejercicio antes de continuar. Si estás un poco "oxidado" en el
álgebra de encontrar medios, variaciones y covarianzas, también debes trabajar con
los Ejercicios 2 y 3 y consultar el Manual Complementario a este texto.

2. MODELOS ARMA
Es posible combinar un proceso de media móvil con una ecuación de diferencia
lineal para obtener un modelo de media móvil autorregresivo. Considere
la ecuación de diferencias de orden p

Ahora vamos { x t } el proceso MA ( q ) dado por (2.3) , para que podamos escribir

Seguimos la convención de normalizar las unidades de modo que β 0 es siempre


igual a la unidad. Si las raíces características de (2.5) están todas en el círculo
unitario, { y t } se llama modelo de media móvil autorregresiva (ARMA)
para y t . La parte autorregresiva del modelo es la ecuación diferencial dada por la
porción homogénea de (2.4) , y la parte media móvil es la secuencia { x t }. Si la
parte homogénea de la ecuación de diferencias contiene plags y el modelo
para x t contiene q, el modelo se denomina modelo ARMA ( p , q ). Si q = 0, el
proceso se denomina proceso autoregresivo puro denotado por AR ( p ), y si p = 0,
el proceso es un proceso puro de media móvil denotado por MA ( q ). En un modelo
ARMA, es perfectamente permisible que p y / o q sean infinitos. Eneste capítulo
consideramos solamente modelos en los cuales todas las raíces características
de (2.5) están dentro del círculo unitario. Sin embargo, si una o más raíces
características de (2.5) son mayores o iguales a la unidad, se dice que la
secuencia { y t } es un proceso integrado y (2.5) se llama un modelo de media
móvil integrada (ARIMA) autoregresivo.
El tratamiento (2.5) como una ecuación de diferencia sugiere que podemos
"resolver" para y ten términos de la secuencia { έ t }. La solución de
un modelo ARMA ( p , q ) que expresa y t en términos de la secuencia { έ t } es
la representación media móvil de y t . El procedimiento no es diferente de lo
discutido en el Capítulo 1 . Para el modelo AR (1) y t = a 0 + a 1 y t -1 + έ t, se demostró
que la representación del promedio móvil

Para el modelo general ARMA ( p , q ), reescribir (2.5) usando operadores de


retraso para que

Por lo tanto, la solución particular para y t es

Afortunadamente, no será necesario expandir (2.6) para obtener el coeficiente


específico para cada elemento en { έ t }. El punto importante a reconocer es que la
expansión producirá un proceso MA (∞). La cuestión es si tal expansión es
convergente de modo que la ecuación de diferencia estocástica dada por (2.6) sea
estable. Como se verá en la siguiente sección, la condición de estabilidad es que las
raíces del polinomio (1 - Σ a i L i ) deben estar fuera del círculo unitario. También se
muestra que si y t es una ecuación de diferencia estocástica lineal, la condición de
estabilidad es una condición necesaria para la serie temporal { yt } ser
estacionario.

3. ESTACIONARIDAD
Suponga que la división de control de calidad de una empresa de fabricación
muestrea cuatro máquinas cada hora. Cada hora, el control de calidad encuentra la
media de los niveles de salida de las máquinas. La gráfica de la salida horaria de
cada máquina se muestra en la Figura 2.1 . Si Y se representa la máquina y i 's de
salida en la hora t , los medios se calculan fácilmente como

Para las horas 5, 10 y 15, estos valores medios son 4,61, 5,14 y 5,03,
respectivamente.
La varianza de la muestra para cada hora puede construirse de manera
similar. Desafortunadamente, los econometristas aplicados no suelen tener el lujo
de ser capaces de obtener un conjunto (es decir, datos de series temporales
múltiples del mismo proceso durante el mismo período de tiempo). Normalmente,
observamos sólo un conjunto de realizaciones para cualquier serie en
particular. Afortunadamente, si { y t } es una serie estacionaria , la media, la
varianza y las autocorrelaciones pueden usualmente serbien aproximados
por promedios de tiempo suficientemente largos basados en el conjunto único
de realizaciones. Supongamos que sólo observó la salida de la máquina 1 durante
20 períodos. Si supiera que la salida era estacionaria, podría aproximar el nivel
medio de producción

FIGURA 2.1 Producción por hora de cuatro máquinas

Al usar esta aproximación, estaría asumiendo que la media era la misma para cada
período. Formalmente, un proceso estocástico que tiene una media y una varianza
finitas es covarianza-estacionaria si para todo t y t - s ,

donde mu , y gamma s son todos constantes.


En (2.9) , s = 0 significa que γ 0 es equivalente a la varianza de y t . En pocas
palabras, una serie de tiempo es covarianza-estacionaria si su media y todas las
autocovariancias no se ven afectadas por un cambio de origen temporal. En la
literatura, un proceso de covarianza-estacionario también se conoce como un
proceso estacionario débilmente estacionario, de segundo orden, estacionario o de
sentido amplio. (Tenga en cuenta que una fuerteel proceso estacionario no
necesita tener una media y / o varianza finita.) El texto considera sólo las series
covarianza-estacionarias de modo que no haya ambigüedad en el uso de los
términos estacionario y covarianza-estacionario intercambiablemente. Una palabra
más acerca de la terminología: En los modelos multivariados, el término
autocovariancia está reservado para la covarianza entre y t y sus propios
retrasos. La covarianza se refiere a la covarianza entre una serie y otra. En modelos
de series de tiempo univariados, no hay ambigüedad y los términos autocovariancia
y covarianza se utilizan indistintamente.
Para una serie de covarianza-estacionaria, podemos definir
la autocorrelación entre y t-scomo

donde γ 0 y γ s están definidos por (2.9) .


Como γ s y γ 0 son independientes del tiempo, los coeficientes de
autocorrelación ρ s son también independientes del tiempo. Aunque la
autocorrelación entre y t y y t -1 puede diferir de la autocorrelación entre y t y y t -2 , la
autocorrelación entre y t y y t -1 debe ser idéntica a la que existe entre y t-s y y t-s -
1 . Obviamente, ρ 0 = 1.

RESTRICCIONES DE ESTACIONARIEDAD PARA UN


PROCESO AR (1)
Para conveniencia de exposición, considere primero las condiciones necesarias y
suficientes para que un proceso AR (1) sea estacionario. Dejar

donde έ t = ruido blanco.


Supongamos que el proceso comenzó en el período cero, de modo que y 0 es una
condición inicial determinista. En la sección 3 del último capítulo, se demostró que
la solución a esta ecuación es (véase también la pregunta 4 al final de este capítulo):

Tomando el valor esperado de (2.10) , obtenemos

Actualizando por s períodos de rendimientos

Comparando (2.11) y (2.12) , está claro que ambos medios son dependientes del
tiempo. Puesto que Ey t no es igual a Ey t + s , la secuencia no puede ser
estacionaria. Sin embargo, si tes grande, podemos considerar el valor límite
de y t en (2.10) . Si | a 1 | <1, la expresión ( a 1 ) t y 0 converge a cero cuando t se hace
infinitamente grande y la suma a 0 [1 + a 1 + ( a 1 ) 2+ ( a 1 ) 3 + ...] converge a un 0 / (1
- a 1 ). Así, como t → ∞ y si | a 1 | <1,

Ahora tome las expectativas de (2.13) para que para valores suficientemente
grandes de t , Ey t = a 0 / (1 - a 1 ). Así, el valor medio de y t es finito e independiente
del tiempo de modo que Ey t = Ey t-s = a 0 / (1 - a 1 ) ≡ μ para todo t . Volviendo a la
varianza, encontramos
que también es finito y tiempo-independiente. Finalmente, se demuestra
fácilmente que los valores límite de todas las autocovariancias son finitos e
independientes del tiempo:

En resumen, si podemos usar el valor límite de (2.10) , la secuencia { y t } será


estacionaria. Para cualquier dado y 0 y | a 1 | <1, se deduce que t debe ser
suficientemente grande. Así, si una muestra es generada por un proceso que ha
comenzado recientemente, las realizaciones pueden no ser estacionarias. Es por
esta misma razón que muchos econometristas asumen que el proceso de
generación de datos ha estado ocurriendo durante un tiempo infinitamente
largo. En la práctica, el investigador debe tener cuidado con los datos generados a
partir de un "nuevo" proceso. Por ejemplo, { y t} podría representar el cambio
diario en el tipo de cambio dólar / marca que comenzó inmediatamente después de
la desaparición del sistema de tipo de cambio fijo de Bretton Woods. Tal serie
puede no ser estacionaria debido al hecho de que hubo condiciones iniciales
deterministas (los cambios en el tipo de cambio fueron esencialmente cero en la era
de Bretton Woods). El investigador cuidadoso que desee utilizar series
estacionarias podría considerar la exclusión de algunas de estas observaciones
anteriores del período de análisis.
Poco cambiaría si no nos dieran la condición inicial. Sin el valor inicial y 0 , la suma
de las soluciones homogéneas y particulares para y t es

donde A = una constante arbitraria.


Si tomamos la expectativa de (2.15) , está claro que la secuencia { y t } no puede ser
estacionaria a menos que la expresión A ( a 1 ) t sea igual a cero. La secuencia debe
haber comenzado infinitamente hace tiempo (de modo que a 1 t = 0) o la constante
arbitraria A debe ser cero. Recordemos que la constante arbitraria se interpreta
como una desviación del equilibrio a largo plazo. Las condiciones de estabilidad
pueden expresarse sucintamente:
1. La solución homogénea debe ser cero. O la secuencia debe haber comenzado
infinitamente lejos en el pasado o el proceso debe estar siempre en
equilibrio (de modo que la constante arbitraria sea cero).
2. La raíz característica a 1 debe ser menor que la unidad en valor absoluto.
Estas dos condiciones fácilmente generalizar a todos ARMA ( p , q )
procesos. Sabemos que la solución homogénea a (2.5) tiene la forma

o, si hay m raíces repetidas,


donde las A i son todas constantes arbitrarias, α es la raíz repetida, y las α i son las
raíces características distintas.
Si alguna parte de la ecuación homogénea está presente, la media, la varianza y
todas las covarianzas serán dependientes del tiempo. Por lo tanto, para
cualquier modelo ARMA ( p , q), la estacionariedad requiere que la solución
homogénea sea cero. La siguiente sección trata las restricciones de estacionariedad
para la solución particular.

4. RESTRICCIONES DE ESTACIONARIDAD PARA


UN MODELO ARMA ( p , q )
Como preludio a las condiciones de estacionariedad para el modelo general ARMA
( p , q ), considere primero las restricciones necesarias para asegurar que un
modelo ARMA (2, 1) sea estacionario. Dado que la magnitud del término de
interceptación no afecta a las condiciones de estabilidad (o estacionariedad),
establezca un 0 = 0 y escriba

De la sección anterior, sabemos que la solución homogénea debe ser cero. Como
tal, sólo es necesario encontrar la solución particular. Usando el método de
coeficientes indeterminados, podemos escribir la solución de desafío como

Para (2.17) ser una solución de (2.16) , los diversos c i deben satisfacer

Para hacer coincidir los coeficientes con los términos que contienen έ t , έ t -1 , έ t -2 ,
..., es necesario establecer

El punto clave es que para i ≥ 2, los coeficientes satisfacen la ecuación de


diferencia c i = a 1 c i-1 + a 2 c i -2 . Si las raíces características de (2.16) están dentro del
círculo unitario, el { c i } debe constituir una secuencia convergente. Por ejemplo,
reconsidere el caso en el que a 1 = 1,6 y a 2 = -0,9, y sea β 1 = 0,5. La Hoja de Trabajo
2.1 muestra que los coeficientes que satisfacen (2.17)son 1, 2,1, 2,46, 2,046, 1,06, -
0,146, ... (véase también la hoja de trabajo 1.2del capítulo anterior).
Para verificar que la secuencia { y t } generada por (2.17) es estacionaria, tome la
expectativa de (2.17) para formar Ey t = Ey t-i = 0 para todo t e i . Por lo tanto, la
media es finita y invariable en el tiempo. Dado que la secuencia { έ t } se supone que
es un proceso de ruido blanco, la varianza de y t es constante e independiente del
tiempo; es decir,
HOJA DE TRABAJO 2.1
COEFICIENTES DEL ARMA (2, 1) PROCESO :
y t = 1,6 y t -1 - 0,9 y t -2 + έ t - 0,5 t t -1
Si usamos el método de coeficientes indeterminados, el c i debe satisfacer

Observe que los coeficientes siguen una ecuación de diferencias de segundo orden con
raíces imaginarias. Si usamos el teorema de Moivre, los coeficientes satisfarán

Imponiendo las condiciones iniciales para los rendimientos de c 0 y c 1

Puesto que β 1 = 1 / cos ( β 2 ), buscamos la solución a

Puede utilizar una tabla de trigonometría para verificar que la solución para β 2 es -1.197 y
la solución para β 1 es 2.739. Por lo tanto, el c i debe satisfacer

Alternativamente, podemos usar los valores iniciales de c 0 y c 1 para encontrar el


otro c i por iteración. La secuencia del c i se muestra en el gráfico siguiente.

Puede utilizar una hoja de cálculo para verificar que los valores de c 0 a c 10 son:

Por lo tanto, var ( y t ) = var ( y t-s ) para todo t y s . Finalmente, la covarianza


entre y t y y t-ses
así que eso

Así, cov ( y t , y t-s ) es constante e independiente de t . Por el contrario, si las raíces


características de (2.16) no están dentro del círculo unitario,
la secuencia { c i } no será convergente. Como tal, la secuencia { y t } no puede ser
convergente.
No es demasiado difícil generalizar estos resultados a toda la clase
de modelos ARMA ( p , q ). Comience considerando las condiciones que aseguran la
estacionariedad de un proceso MA (∞) puro. Al restringir adecuadamente el β i ,
todos los procesos de orden finito MA ( q ) se pueden obtener como casos
especiales. Considerar

donde { έ t } = un proceso de ruido blanco con varianza σ 2 .


Ya hemos determinado que { x t } no es un proceso de ruido blanco; ahora la
cuestión es si { x t } es covarianza-estacionaria. Dadas las
condiciones (2.7) , (2.8) y (2.9) , pedimos lo siguiente:
1. ¿Es la media finita y independiente del tiempo? Tome el valor esperado
de x t y recuerde que la expectativa de una suma es la suma de las
expectativas individuales. Por lo tanto,

Repita el procedimiento con x t-s :

Por lo tanto, todos los elementos en la secuencia { x t } tienen la misma media finita
( μ = 0).
2. ¿Es la varianza finita y independiente del tiempo? Forma var ( x t ) como

Coloque el término entre paréntesis y tome las expectativas. Desde { έ t } es un


proceso de ruido blanco, todos los términos Eέ t έ t-s = 0 para s ≠ 0. Por lo tanto,

Mientras que es finito, se sigue que var ( x t ) es finito. Así, Σ ( β i ) 2 siendo


finito es una condición necesaria para que { x t } sea estacionario. Para determinar si
var ( x t ) = var ( x t-s ), forma
Así, var ( x t ) = var ( x t-s ) para todo t y t - s .
3. ¿Todas las autocovariancias son finitas e independientes del tiempo? La
primera forma E( x t x t-s ) como

Llevando a cabo la multiplicación y observando que E ( έ t έ t-s ) = 0 para s ≠ 0,


obtenemos

Restringir la suma β s + β 1 β s +1 + β 2 β s + 2 + ... ser finito significa que E ( x t x t-s ) es


finito. Dada esta segunda restricción, está claro que la covarianza entre x t y x t-s sólo
depende del número de períodos que separan las variables (es decir, el valor de s ),
pero no en el tiempo subíndice t .
En resumen, las condiciones necesarias y suficientes para cualquier proceso MA
sean covarianza estacionaria son para las sumas y
( beta s + ß 1 beta s +1 + β 2 beta s 2 + ...) para ser finito. Para un proceso de orden
infinito, estas condiciones deben ser válidas para todo s ≥ 0. Algunos de los detalles
relacionados con la estimación de máxima verosimilitud de los procesos de MA se
discuten en el Apéndice 2.1 de este capítulo.

RESTRICCIONES DE ESTACIONARIEDAD PARA LOS


COEFICIENTES AUTORREGRESIVOS
Ahora consideremos el modelo autorregresivo puro

Si las raíces características de la ecuación homogénea de (2.19) están todas dentro


del círculo unitario, es posible escribir la solución particular como

donde c i = coeficientes indeterminados.


Aunque es posible encontrar los coeficientes indeterminados { c i }, sabemos
que (2.20) es una secuencia convergente siempre y cuando las raíces características
de (2.19) estén dentro del círculo unitario. Para bosquejar la prueba, podemos usar
el método de coeficientes indeterminadospara escribir la solución particular en
forma de (2.20) . También sabemos que la secuencia { c i } resolverá eventualmente
la ecuación de diferencia

Si las raíces características de (2.21) están todas dentro del círculo unitario,
la secuencia { c i } será convergente. Aunque (2.20) es un proceso de media móvil
de orden infinito, la convergencia de los coeficientes MA implica que es
finito. Así, podemos usar (2.20) para verificar las tres condiciones de
estacionariedad. Desde (2.20) ,
Debería recordar en el capítulo 1 que una condición necesaria para que todas las
raíces características se encuentren dentro del círculo unitario es 1 - Σ a i > 0. Por lo
tanto, la media de la secuencia es finita e invariable en el tiempo.

Dado que es finito, la varianza es finita e independiente del tiempo.

Así, la covarianza entre y t y y t-s es constante e invariable en el tiempo para


todo t y t - s . Nada de sustancia se cambia combinando los modelos AR ( p ) y MA
( q ) en el modelo general ARMA ( p , q ):

Si las raíces de la ecuación característica inversa se encuentran fuera del círculo


unitario [es decir, si las raíces de la forma homogénea de (2.22) están dentro del
círculo unitario] y si la secuencia { x t } es estacionaria, la secuencia { y t } será
estacionario. Considerar:

Con muy poco esfuerzo, puede convencerse de que la secuencia { y t } satisface las
tres condiciones de estacionariedad. Cada una de las expresiones en el lado derecho
de (2.23) es estacionaria siempre y cuando las raíces de 1 - Σ a i L i estén fuera del
círculo unitario. Dado que { x t } es estacionario, sólo las raíces de la porción
autorregresiva de (2.22) determinan si la secuencia { y t } es estacionaria.

5. LA FUNCIÓN DE AUTOCORRELACIÓN
Las autocovariancias y autocorrelaciones del tipo encontrado en (2.18) sirven como
herramientas útiles en el enfoque de Box-Jenkins (1976) para identificar y estimar
modelos de series de tiempo. Se ilustran cuatro ejemplos importantes: los modelos
AR (1), AR (2), MA (1) y ARMA (1, 1). Para el modelo AR (1), y t = a 0 + a 1 y t -
1 + έ t , (2.14) muestra

La formación de las autocorrelaciones dividiendo cada γ s por gamma 0 ,


encontramos que ρ 0 = 1, ρ 1 = un 1 , ρ 2 = ( a 1 ) 2 , ..., ρ s = ( a 1 ) s . Para un proceso
AR (1), una condición necesaria para stationarity es | a 1 | <1. Así, el gráfico
de ρ s contra s-denominado la función de autocorrelación (ACF) o
el correlograma- debe converger a cero geométricamente si la serie es
estacionaria. Si a 1 es positiva, la convergencia será directa, y si a 1 es negativa, las
autocorrelaciones seguirán una trayectoria oscilante oscilante alrededor de
cero. Los primeros dos gráficos en la parte izquierda de la Figura 2.2 muestran las
funciones de autocorrelación teóricas para un 1 = 0,7 y un 1 = -0,7,
respectivamente. Aquí, ρ 0 no se muestra ya que su valor es necesariamente unidad.

LA FUNCIÓN DE AUTOCORRELACIÓN DE UN PROCESO


AR (2)
Ahora consideremos el proceso AR (2) más complicado y t = a 1 y t -1 + a 2 y t -
2 + έ t . Se omite un término de interceptación ( a 0 ) ya que no tiene ningún efecto

en el ACF. Para que el proceso de segundo orden sea estacionario, sabemos que es
necesario restringir las raíces de (1 - a 1 L - a 2 L 2 ) para que estén fuera del círculo
unitario. En la Sección 4, derivamos las autocovariancias de un proceso ARMA (2,
1) mediante el uso del método de coeficientes indeterminados. Ahora queremos
ilustrar una técnica alternativa usando las ecuaciones de Yule-
Walker . Multiplique la ecuación de diferencia de segundo orden por y t-s para s =
0, s= 1, s = 2, ... y tome las expectativas para formar

Por definición, las autocovariancias de una serie estacionaria son tales que Ey t y t-
s = Ey t-s y t = Ey t-k y t-k-s = γ s . Sabemos también que Eέ t y t = σ 2 y Eέ t y t-s = 0. Por lo

tanto, podemos usar las ecuaciones en (2.24) para formar


FIGURA 2.2 Patrones teóricos de ACF y PACF

La división (2.26) y (2.27) por los rendimientos de γ 0

Sabemos que ρ 0 = 1, así que de (2.28) , ρ 1 = a 1 / (1 - a 2 ). Por lo tanto, podemos


encontrar todos ρ s para s ≥ 2 resolviendo la ecuación de diferencia (2.29) . Por
ejemplo, para s = 2 y s = 3,

Aunque los valores de ρ s son difíciles de obtener, podemos caracterizar fácilmente


sus propiedades. Dadas las soluciones para ρ 0 y ρ 1 , el punto clave a tener en
cuenta es que ρ stodos satisfacen la ecuación de diferencia (2.29) . Como en el caso
de una ecuación de diferencias de segundo orden, la solución puede ser oscilatoria
o directa. Obsérvese que la condición de estacionariedad para y t hace necesario que
las raíces características de (2.29)estén dentro del círculo unitario. Por lo tanto,
la secuencia { ρ s } debe ser convergente. El correlograma para un proceso AR (2)
debe ser tal que ρ0 = 1 y que ρ 1 sea determinado por (2.28) . Estos dos valores
pueden ser vistos como valores iniciales para la ecuación dediferencia de segundo
orden (2.29) .
El cuarto panel en el lado izquierdo de la figura 2.2 muestra el ACF para el
proceso y t = 0.7 y t -1 - 0.49 y t -2 + έ t . Las propiedades de los diversos ρ s siguen
directamente de la ecuación homogénea y t - 0.7 y t -1 + 0.49 y t -2 = 0. Las raíces se
obtienen de la solución a

Dado que el discriminante d = (-0.7) 2 - 4 (0.49) es negativo, las raíces


características son imaginarias, de modo que la solución oscila. Sin embargo, ya
que a 2 = -0.49, la solución es convergente y la secuencia { y t } es estacionaria.
Finalmente, podríamos desear encontrar las autocovariancias en lugar de las
autocorrelaciones. Puesto que conocemos todas las autocorrelaciones, si podemos
encontrar la varianza de y t (es decir, γ 0 ), podemos encontrar todas las
otras γ s . Para encontrar γ 0 , utilice (2.25) y observe que ρ i = γ i / γ 0 de modo que

La sustitución para ρ 1 y ρ 2 produce

LA FUNCIÓN DE AUTOCORRELACIÓN DE UN PROCESO


MA (1)
Luego considere el proceso MA (1) y t = έ t + βέ t -1 . Una vez más, podemos obtener
las ecuaciones de Yule-Walker multiplicando y t por cada y t-s y tomando las
expectativas

Por lo tanto, al dividir cada γ s por γ 0 , se puede ver inmediatamente que el ACF es
simplemente ρ 0 = 1, ρ 1 = β / (1 + β 2 ) y ρ s = 0 para todo s > 1. El el tercer gráfico en
el lado izquierdo de la Figura 2.2 muestra el ACF para el proceso MA (1) y t = έ t -
0.7 έ t -1 . Como ejercicio, debe demostrar que el ACF para un proceso MA (2) tiene
dos picos y luego los cortes a cero.

LA FUNCIÓN DE AUTOCORRELACIÓN DE UN PROCESO


ARMA (1, 1)
Finalmente, deje que y t = a 1 y t -1 + έ t + β 1 έ t -1 . Usando el procedimiento ahora
familiar, encontramos las ecuaciones de Yule-Walker

La resolución (2.30) y (2.31) simultáneamente para los rendimientos de γ 0 y γ 1

Por lo tanto,

y ρ s = a 1 ρ s -1 para todo s ≥ 2.
Por lo tanto, la ACF para un ARMA (1, 1) el proceso es tal que la magnitud
de ρ 1 depende tanto de un 1 y ß 1 . Comenzando con este valor de ρ 1 , el ACF de un
proceso ARMA (1, 1) se parece al del proceso AR (1). Si 0 < a 1 <1, la convergencia
será directa, y si -1 < a 1 <0, las autocorrelaciones oscilarán. El ACF para la
función y t = -0,7 y t -1 + έ t - 0,7 έ t -1 se muestra como el último gráfico en el lado
izquierdo deFigura 2.2 . La parte superior de la Hoja de Trabajo 2.2 deriva estas
autocorrelaciones.
Los dejamos con el ejercicio de derivar el correlograma del proceso ARMA (2, 1)
utilizado en la Hoja de Trabajo 2.1 . Usted debe ser capaz de reconocer el punto en
el que el correlograma puede revelar el patrón de los coeficientes
autorregresivos. Para un modelo ARMA ( p , q ) que comienza después del
retraso q , los valores de ρ i satisfarán

Los valores de p anteriores pueden ser tratados como condiciones iniciales que
satisfacen las ecuaciones de Yule-Walker. Para estos rezagos, la forma de la ACF
viene determinada por la ecuación característica.

6. LA FUNCIÓN DE AUTOCORRELACIÓN PARCIAL


En un proceso AR (1), y t y y t -2 están correlacionados aunque y t -2 no aparezca
directamente en el modelo. La correlación entre y t y y t -2 (es decir, ρ 2 ) es igual a la
correlación entre y t y y t -1 (es decir, ρ 1 ) multiplicado por la correlación entre y t -
1 y y t -2 ( es decir, ρ 1 de nuevo) para que ρ2 = ( ρ 1 ) 2 . Es importante señalar que todas

estas correlaciones indirectas están presentes en el ACF de cualquier proceso


autorregresivo. Por el contrario, la autocorrelación parcial entre y t y y t-
s elimina los efectos de los valores intermedios y t -1 a través de y t-s +1 . Como tal, en un

proceso AR (1) la autocorrelación parcial entre y t y y t -2es igual a cero. La manera


más directa de encontrar la función de autocorrelación parcial es formar primero la
serie restando la media de la serie (es decir, μ ) de cada observación para
obtener . A continuación, forma la autorregresión de primer orden
HOJA DE TRABAJO 2.2
CÁLCULO DE LAS AUTOCORRELACIONES PARCIALES DE y t = - 0.7y t -1 + έ t -
0.7έ t -1
Paso 1 : Calcule las autocorrelaciones. Utilice (2.34) para calcular ρ 1 como

Las autocorrelaciones restantes se desintegran a la tasa ρ i = -0,7 ρ i -1 de manera que

Paso 2 : Calcular las dos primeras autocorrelaciones parciales usando (2.35) y (2.36) . Por
lo tanto,

Paso 3 : Calcule todas las s restantes iterativamente usando (2.37) . Para encontrar 33 ,
observe que 21 = 11 - 22 11= -1.204 y forma

Del mismo modo, para encontrar 44 uso

Como 3j = 2j - 33 2, 2 - j , se deduce que 31 = -1.315 y 32 = -0.74. Por lo tanto,

Si seguimos de esta manera, es posible demostrar que 55 = -0.117, 66 = -0.081, 77 =-


0.056 y 88 = -0.039.

donde e t es un término de error.


Aquí se utiliza el símbolo { e t }, ya que este proceso de error puede no ser ruido
blanco.
Puesto que no hay valores intermedios, 11 es tanto la autocorrelación como la
autocorrelación parcial entre y t y y t -1 . Ahora forma la ecuación de autorregresión
de segundo orden

Aquí 22 es el coeficiente de autocorrelación parcial entre y t y y t -2 . En otras


palabras, 22 es la correlación entre y t y y t -2 controlando (es decir, "compensando")
el efecto de y t -1 . La repetición de este proceso para todos los retrasos
adicionales s produce la función de autocorrelación parcial (PACF). En la práctica,
con el tamaño de muestra T , sólo se utilizan T/ 4 retrasos para obtener la muestra
PACF.
Dado que la mayoría de los paquetes informáticos estadísticos realizan estas
transformaciones, hay poca necesidad de elaborar el procedimiento
computacional. Sin embargo, debe señalarse que un método computacional simple
basándose en las ecuaciones de Yule-Walker está disponible. Se pueden formar las
autocorrelaciones parciales de las autocorrelaciones como

y para retrasos adicionales,

donde sj = s -1, j - ss s -1, s-j , j = 1, 2, 3, ..., s - 1.


Para un proceso AR ( p ), no hay correlación directa entre y t y y t-s para s > p . Por
lo tanto, para s > p , todos los valores de ss serán cero y el PACF para un proceso
puro de AR ( p ) debe reducir a cero para todos los retrasos mayores que p . Esta es
una característica útil del PACF que puede ayudar en la identificación de
un modelo AR ( p ). Por el contrario, considere el PACF para el proceso MA
(1): y t = έ t + βέ t -1 . Mientras b≠ -1, podemos escribir y t / (1 + βL ) = έ t , que
sabemos que tiene la representación autorregresiva de orden infinito

Como tal, el PACF no saltará a cero puesto que y t será correlacionado con todos sus
propios retrasos. En cambio, los coeficientes PACF exhiben un patrón de
decaimiento geométrico. Si β <0, la desintegración es directa, y si β > 0, los
coeficientes PACF oscilan.
La Hoja de Trabajo 2.2 ilustra el procedimiento usado para construir el PACF para
el modelo ARMA (1, 1) mostrado en el quinto panel en el lado derecho de la Figura
2.2 :

Primero, calcule las autocorrelaciones. Claramente, ρ 0 = 1; use la ecuación


(2.34) para calcular como ρ 1 = -0.8445. Después, los coeficientes de ACF se
descomponen a la tasa ρ i = (-0.7) ρ i -1 para i ≥ 2. Usando (2.35) y (2.36) ,
obtenemos 11 = -0.8445 y 22 = -0.4250. Todas las ss y sj posteriores pueden
calcularse a partir de (2.37) como en la Hoja de Trabajo 2.2 .
De forma más general, el PACF de un proceso estacionario ARMA ( p , q ) debe, en
última instancia, descomponerse hacia cero comenzando con el retardo p . El
patrón de decaimiento depende de los coeficientesdel polinomio (1 + β 1 L + β 2 L 2 +
... + β q L q ). La Tabla 2.1resume algunas de las propiedades de ACF y PACF para
varios procesos ARMA. Además, las gráficas en el lado derecho de la Figura
2.2 muestran las funciones de autocorrelación parcial de los cinco procesos
indicados.
Tabla 2.1 Propiedades de la ACF y PACF

Para los procesos estacionarios, los puntos clave a tener en cuenta son los
siguientes:
1. El ACF de un proceso ARMA ( p , q ) comenzará a decaer después del
retardo q . Después del retardo q , los coeficientes del ACF (es decir, el ρ i )
satisfarán la ecuación de diferencia ( ρ i = a 1 ρ i -1 + a 2 ρ i -2 + ... + a p ρ i-
p ). Puesto que las raíces características están dentro del círculo unitario, las

autocorrelaciones se descompondrán después del retardo q . Además, el


patrón de los coeficientes de autocorrelación imitará lo sugerido por las
raíces características.
2. El PACF de un proceso ARMA ( p , q ) comenzará a decaer después del
retraso p . Después del retardo p , los coeficientes del PACF (es decir, el
ss ) imitarán los coeficientes ACF del modelo y t / (1 + β 1 L + β 2 L 2 + ...

+ β q L q ).
Podemos ilustrar la utilidad de las funciones ACF y PACF usando el
modelo y t = a 0 + 0.7 y t-1 + έ t . Si comparamos los dos primeros gráficos de
la Figura 2.2 , el ACF muestra la desintegración monótona de las autocorrelaciones
mientras que el PACF muestra el pico simple en el retardo 1. Supongamos que un
investigador recogió datos de muestra y trazó las funciones ACF y PACF. Si los
patrones reales se comparan favorablemente con los patrones teóricos, el
investigador podría tratar de estimar los datos usando un modelo AR
(1). Correspondientemente, si la ACF exhibió una sola punta y la PACF exhibió un
decaimiento monotónico (véase el tercer gráfico para el modelo y t= έ t - 0.7 έ t -1 ), el
investigador podría intentar un modelo MA (1).

7. MUESTRA AUTOCORRELACIONES DE SERIES


ESTACIONARIAS
En la práctica, la media teórica, la varianza y las autocorrelaciones de una serie son
desconocidas para el investigador. Dado que una serie es estacionaria, podemos
utilizar la media de la muestra, la varianza y las autocorrelaciones para estimar los
parámetros del proceso real de generación de datos. Que no haya T observaciones
etiquetados y 1 a través y T. Podemos dejar y r s ser estimaciones de μ , σ 2 y ρ s ,
respectivamente, donde 1

y para cada valor de s = 1, 2, ...,

La función de autocorrelación de la muestra [es decir, la ACF derivada de (2.40) ] y


la muestra PACF pueden compararse con varias funciones teóricas para ayudar a
identificar la naturaleza real del proceso generador de datos. Box y Jenkins (1976)
discuten la distribución de los valores de muestra de r s bajo el nulo que y t es
estacionario con errores normalmente distribuidos. Al permitir que var ( r s )
denote la varianza de muestreo de r s , obtienen

si el verdadero valor de r s = 0 [es decir, si el verdadero proceso generador de datos


es un proceso MA ( s - 1)]. Además, en muestras grandes (es decir, para valores
grandes de T ), r sse distribuirá normalmente con una media igual a cero. Para los
coeficientes de FAP, bajo la hipótesis nula de un AR ( p modelo) (es decir, bajo la
hipótesis nula de que todos p + i, p + ison cero), la varianza de la es de
aproximadamente 1 / T .
En la práctica, podemos usar estos valores de muestra para formar la
autocorrelación de la muestra y las funciones de autocorrelación parcial y probar la
significación usando (2.41) . Por ejemplo, si usamos un intervalo de confianza del
95 por ciento (es decir, dos desviaciones estándar) y el valor calculado de r 1 excede
2 T -1/2 , es posible rechazar la hipótesis nula de que la autocorrelación de primer
orden no es estadísticamente diferente de cero. Rechazar esta hipótesis significa
rechazar un proceso MA ( s - 1) = MA (0) y aceptar la alternativa q > 0. A
continuación, intente s = 2; var ( r 2 ) es (1 + 2 r 1 2 ) /T . Si r 1 es 0,5 y T es 100, la
varianza de r 2 es 0,015 y la desviación estándar es aproximadamente 0,123. Así, si
lavalor calculado de r 2 excede 2 (0.123), es posible rechazar la hipótesis r 2 = 0.
Aquí, el rechazo de la hipótesis nula significa aceptar la alternativa que q > 1.
Repetir para los diferentes valores de s es útil en la identificación de la orden al
proceso. El número máximo de autocorrelaciones de muestras y autocorrelaciones
parciales que se utilizan es típicamente establecido igual a T / 4.
Dentro de cualquier grupo grande de autocorrelaciones, algunos superarán dos
desviaciones estándar como resultado de pura casualidad aunque los valores
verdaderos en el proceso generador de datos sean cero. El Q- estadístico se puede
utilizar para probar si un grupo de autocorrelaciones es significativamente
diferente de cero. Box y Pierce (1970) utilizaron las autocorrelaciones muestrales
para formar la estadística

Bajo la hipótesis nula de que todos los valores de r k = 0, Q es


asintóticamente χ 2 distribuido con s grados de libertad. La intuición detrás de la
utilización de la estadística es que autocorrelaciones de muestra altas conducen a
grandes valores de Q . Ciertamente, un proceso de ruido blanco (en el que todas las
autocorrelaciones deberían ser cero) tendría un valor Q de cero. Si el valor
calculado de Q excede el valor apropiado en una tabla χ 2 , podemos rechazar el
nulo sin autocorrelaciones significativas. Obsérvese que rechazar los medios nulos
acepta una alternativa de que al menos una autocorrelación no es cero.
Un problema con el Box-Pierce Q -statistic es que funciona mal incluso en muestras
moderadamente grandes. Ljung y Box (1978) informaron un rendimiento superior
de muestras pequeñas para la estadística Q modificada calculada como

Si el valor muestral de Q calculado a partir de (2.42) excede el valor crítico


de χ 2 con s grados de libertad, entonces al menos un valor de r k es
estadísticamente diferente de cero al nivel de significación
especificado. Las estadísticas Q de Box-Pierce y Ljung-Box también sirven como
una comprobación para ver si los residuos de un modelo ARMA ( p , q ) se
comportan como un proceso de ruido blanco. Sin embargo, cuando
las correlaciones s de un estimado ARMA ( p , q) se forman, los grados de libertad
se reducen por el número de coeficientes estimados. Por lo tanto, usando los
residuos de un modelo ARMA ( p , q ), Q tiene una χ 2 con s - p - qgrados de libertad
(si se incluye una constante, los grados de libertad son s - p - q - 1). Sin embargo,
una práctica común es simplemente informar los resultados utilizando los grados
de libertad.

CRITERIOS DE SELECCIÓN DEL MODELO


Una pregunta natural de cualquier modelo estimado es: ¿Qué tan bien encaja con
los datos? Agregar retrasos adicionales para py / o q reducirá necesariamente la
suma de cuadrados de los residuos estimados. Sin embargo, la adición de tales
retardos implica la estimación de coeficientes adicionales y una pérdida asociada
de grados de libertad. Además, la inclusión de coeficientes extraños reducirá el
rendimiento de previsión del modelo ajustado.Como se analiza con detalle en
el Apéndice 2.2 de este capítulo, existen varios criterios de selección de modelos
que compensan una reducción en la suma de cuadrados de los residuos para
un modelo más parsimonioso . Los dos criterios de selección de modelos más
utilizados son el Criterio de Información Akaike (AIC) y el Criterio Bayesiano
Schwartz (SBC). En el texto, usaremos las siguientes fórmulas:

donde : n = número de parámetros estimados ( p + q + término constante posible)


T = número de observaciones utilizables
Cuando se estima un modelo utilizando variables rezagadas, se pierden algunas
observaciones. Para comparar adecuadamente los modelos alternativos, T debe
mantenerse fijo. De lo contrario, se comparará el rendimiento de los modelos en
diferentes períodos de muestra. Además, la disminución de T tiene el efecto directo
de reducir el AIC y el SBC; el objetivo no es seleccionar un modelo porque tiene el
menor número de observaciones utilizables. Por ejemplo, con 100 puntos de datos,
estimar un AR (1) y un AR (2) utilizando sólo las últimas 98 observaciones en cada
estimación. Comparar los dos modelos usando T = 98.
Idealmente, el AIC y el SBC serán tan pequeños como sea posible (tenga en cuenta
que ambos pueden ser negativos). A medida que mejore el ajuste del modelo, el
AIC y el SBC se acercarán a -∞. Podemos utilizar estos criterios para ayudar a
seleccionar el modelo más apropiado; modelo A se dice que se ajuste mejor que el
modelo B si el AIC (o SBC) para A es más pequeño que para el modelo B . Al utilizar
los criterios para comparar modelos alternativos, debemos estimarlos durante el
mismo período de muestra para que sean comparables. Para cada uno, el aumento
del número de regresores aumenta npero debe tener el efecto de reducir la suma de
los residuos cuadrados. Por lo tanto, si un regresor no tiene poder explicativo,
sumarlo al modelo hará que tanto el AIC como el SBC aumente. Puesto que ln ( T )
será mayor que 2, el SBC seleccionará siempre un modelo más parsimonioso que el
AIC; el costo marginal de agregar regresores es mayor con el SBC que con el AIC.
Una característica especialmente útil de los criterios de selección del modelo es la
comparación de modelos nonnested. Por ejemplo, suponga que desea comparar un
modelo AR (2) con un modelo MA (3). Tampoco es una forma restringida del
otro. No se desea estimar un modelo ARMA (2, 3) y realizar pruebas F para
determinar si a 1 = a 2 = 0 o si β 1 = β 2 = β 3 = 0. Como se analiza en el Apéndice 2.1,
la estimación de los modelos ARMA requiere métodos de solución basados en
computadora. Si los modelos AR (2) y MA (3) son razonables, no es probable que
los algoritmos de búsqueda no lineales requeridos para estimar un modelo ARMA
(2, 3) converjan en una solución. Además, los valores de y t -1 y y t-2 están claramente
correlacionados con los valores de έ t -1 , έ t -2 y έ t -3 . Es muy posible que ambas
hipótesis puedan ser aceptadas (o rechazadas). Sin embargo, es fácil comparar los
modelos AR (2) y MA (3) estimados usando el AIC o el SBC.
De los dos criterios, el SBC tiene propiedades superiores de gran muestra. Dejemos
que el orden verdadero del proceso generador de datos sea ( p *, q *) y supongamos
que usamos el AIC y el SBC para estimar todos los modelos de orden ( p , q )
donde p ≥ p * y q ≥ q *. Tanto el AIC como el SBC seleccionarán modelos de
órdenes superiores o iguales a ( p *, q *) comoel tamaño de la muestra se aproxima
al infinito. Sin embargo, la SBC es asintóticamente coherente mientras que la AIC
está sesgada hacia la selección de un modelo superparamétrico. Sin embargo, en
muestras pequeñas, el AIC puede funcionar mejor que el SBC. Usted puede estar
bastante seguro de sus resultados si tanto el AIC y el SBC seleccionar el mismo
modelo. Si seleccionan diferentes modelos, debe proceder con cautela. Dado que
SBC selecciona el modelo más parsimonioso, debe comprobar para determinar si
los residuos parecen ser ruido blanco. Dado que la AIC puede seleccionar un
modelo sobreparamétrico, la estadística t de todos los coeficientes debería ser
significativa a niveles convencionales. Una serie de otros controles de diagnóstico
que pueden utilizarse para comparar modelos alternativos se presentan en
las secciones 8 y 9. Sin embargo, es sabio conservar un escepticismo saludable de
sus modelos estimados. La sección 10 ilustra la situación en la que no es posible
encontrar un modelo que domine claramente a todos los demás. No hay nada malo
en informar los resultados y los pronósticos usando estimaciones alternativas.
Antes de continuar, tenga en cuenta que se usan varias maneras diferentes para
reportar el AIC y el SBC. Por ejemplo, los paquetes de software EViews y SAS
reportan valores para AIC y SBC usando

donde n y T son como se definen anteriormente, y L = valor maximizado del log de


la función de verosimilitud.
Para una distribución normal, -2ln ( L ) = T ln (2π) + T ln ( σ 2 ) + (1 / σ 2) (suma de
los residuos cuadrados). La razón de la plétora de métodos de informes es que
muchos paquetes de software (como OX, RATS y GAUSS) no muestran ningún
criterio de selección de modelo, por lo que los usuarios deben calcular estos valores
por sí mismos. Los programadores encuentran rápidamente que codificar todos los
parámetros contenidos en las fórmulas es innecesario, y simplemente reportan las
versiones abreviadas. De hecho, no importa qué método utilice. Si trabaja a través
de la Pregunta 13 al final de este capítulo, debe quedar claro que el modelo con el
valor más pequeño para AIC siempre tendrá el AIC * más
pequeño. Específicamente, la Pregunta 13 le pide que anote la fórmula para ln ( L) y
muestran que la ecuación para AIC * es una transformación monótona de AIC. Por
lo tanto, si utiliza la fórmula para AIC o AIC *, siempre seleccionará el mismo
modelo que el seleccionado en el texto. La relación idéntica se da entre SBC * y
SBC; el modelo que arroje el valor más pequeño para SBC siempre tendrá el valor
más pequeño para SBC *.

ESTIMACIÓN DE UN MODELO AR (1)


Utilicemos un ejemplo específico para ver cómo la función de autocorrelación de la
muestra y la función de autocorrelación parcial se pueden utilizar como ayuda en la
identificación de un modelo ARMA. Se utilizó un programa informático para
dibujar 100 números aleatorios distribuidos normalmente con una varianza teórica
igual a la unidad. Llame a estas variantes aleatorias έ t , donde t va de 1 a 100. A
partir de t = 1, los valores de y t se generaron usando la fórmula y t = 0.7 y t -1 + έ t y
la condición inicial y 0= 0. Obsérvese que el problema de no estacionariedad se
evita ya que la condición inicial es consistente con el equilibrio a largo plazo. El
panel (a) de la figura 2.3 muestra el correlograma muestral y el panel (b) muestra la
muestra PACF. Túdebe tomar un minuto para comparar la ACF y PACF con los de
los procesos teóricos mostrados en la Figura 2.2 .
FIGURA 2.3 ACF y PACF para dos procesos simulados

En la práctica, nunca conocemos el verdadero proceso generador de datos. Como


ejercicio, supongamos que se nos presentaron con estos 100 valores de muestra y
se les pidió que descubrieran el verdadero proceso usando la metodología de Box-
Jenkins. El primer paso podría ser comparar la muestra ACF y PACF con los de los
diversos modelos teóricos. El patrón de decaimiento de la ACF y el único pico
grande en el retardo 1 en la muestra PACF sugieren un modelo AR (1). Las tres
primeras autocorrelaciones son r 1 = 0,74, r 2 = 0,58 y r 3= 0,47 [que son algo
mayores que los valores teóricos de 0,7, 0,49 (0,7 2= 0,49), y 0,343]. En el PACF,
hay un pico considerable de 0,74 con el retardo 1, y todas las demás
autocorrelaciones parciales (excepto el retardo 12) son muy pequeñas.
Bajo la hipótesis nula de un MA (0) del proceso, la desviación estándar de r 1 es T -
1/2 = 0,1. Dado que el valor muestral de r 1 = 0.74 es más de siete desviaciones

estándar desde cero, podemos rechazar la hipótesis nula de que r 1 es igual a 0. La


desviación estándar de r 2 se obtiene aplicando (2.41) a los datos de muestreo,
donde s = 2:

Puesto que (0.021) 1/2 = 0,1449, el valor de la muestra de r 2 es más de tres


desviaciones estándar de cero; a niveles convencionales de significación, podemos
rechazar la hipótesis nula de que r 2 es igual a cero. Podemos probar de manera
similar la significación de los otros valores de las autocorrelaciones.

Tabla 2.2 Estimaciones de un modelo AR (1)


Como se puede ver en el Panel (b) de la figura, aparte de 11 , todas las
autocorrelaciones parciales (excepto el retraso 12) son menores que 2 T -1/2 = 0,2. La
descomposición de la ACF y la punta única del PACF dan la fuerte impresión de un
modelo autorregresivo de primer orden. Sin embargo, si no conocemos el
verdadero proceso subyacente, y pasó a estar utilizando datos mensuales, que
podría estar preocupado con la autocorrelación parcial significativa en el retardo
12. Después de todo, con los datos mensuales se podría esperar alguna relación
directa entre y t e Y t - 12 .
Aunque sabemos que los datos fueron realmente generados a partir de un proceso
AR (1), es ilustrativo comparar las estimaciones de dos modelos
diferentes. Supongamos que estimamos un modelo de AR (1) y también tratamos
de capturar el pico en el retraso 12 con un coeficiente de MA. Así, podemos
considerar los dos modelos tentativos:

La Tabla 2.2 presenta los resultados de las dos estimaciones. El coeficiente del
modelo 1 satisface la condición de estabilidad | a 1 | <1 y tiene un error estándar
bajo (el estadístico tasociado para un nulo de cero es más de 12). Como una
comprobación diagnóstica útil, trazamos el correlograma de los residuos del
modelo ajustado en la Figura 2.4 . Las estadísticas Q para estos residuos indican
que cada una de las autocorrelaciones es menor que dos desviaciones estándar de
cero. El Ljung-Box Q -statistics de estos residuos indica que como un grupo,
retardos 1 a 8, 1 a 16 y 1 a 24 no son significativamente diferentes de cero. Esto es
una fuerte evidencia de que el modelo AR (1) "se ajusta" bien a los datos. Después
de todo, si las autocorrelaciones residuales fueran significativas, el modelo AR (1)
no utilizaría toda la información disponible relativa a los movimientos en
la secuencia { y t }. Por ejemplo, supongamos que queremos
pronosticar y t +1 condicionada a toda la información disponible hasta el
período t inclusive . Con el Modelo 1, el valor de y t +1 es y t +1 = a 1 y t + έ t +1. Por lo
tanto, el pronóstico del Modelo 1 es a 1 y t . Si las autocorrelaciones residuales
hubieran sido significativas, este pronóstico no captaría toda la información
disponible.
Al examinar los resultados del Modelo 2, observe que ambos modelos producen
estimaciones similares para el coeficiente autorregresivo de primer orden y el error
estándar asociado. Sin embargo, la estimación para β 12 es de mala calidad; el
insignificante valor de t sugiere que debe ser eliminado del modelo. Por otra parte,
la comparación de la AIC y los valores de la SBC de los dos modelos sugiere que
cualquier beneficio de una suma reducida de cuadrado residuos es abrumado por
los efectos perjudiciales de la estimación de un parámetro adicional. Todos estos
indicadores apuntan a la elección del Modelo 1.

FIGURA 2.4 ACF de los Residuales del Modelo 1

El ejercicio 8 al final de este capítulo incluye varias estimaciones usando esta


serie. La serie se denota por Y1 en el archivo SIM2.XLS. En este ejercicio se le
pedirá que muestre que el modelo AR (1) funciona mejor que algunas
especificaciones alternativas. Es importante que complete este ejercicio.

ESTIMACIÓN DE UN MODELO ARMA (1, 1)


Se construyó una segunda secuencia { y t } en el archivo SIM2.XLS para ilustrar la
estimación de un ARMA (1, 1). Dado 100 valores normalmente distribuidos de
{ έ t }, 100 valores de { y t} se generaron usando

donde y 0 y ∂ 0 fueron fijados igual a cero.


Tanto la muestra ACF como la PACF de los datos simulados (ver el segundo
conjunto de gráficos en la Figura 2.3 ) son aproximadamente equivalentes a las del
modelo teórico mostrado en la Figura 2.2 . Sin embargo, si el verdadero proceso de
generación de datos era desconocido, el investigador podría estar preocupado por
ciertas discrepancias. Un modelo AR (2) podría producir una muestra ACF y PACF
similar a los de la figura. La tabla 2.3presenta los resultados de la estimación de los
datos utilizando los tres modelos siguientes:
Tabla 2.3 Estimaciones de un modelo ARMA (1, 1)

Notas :

1 Errores estándar entre paréntesis.

2Ljung-Box Q-estadística de los residuos del modelo ajustado. Los niveles de


significación están entre paréntesis.

3Para la comparabilidad, los valores AIC y SBC son reportados para estimaciones
que usaron sólo las observaciones 3 a 100. Si el AR (1) es estimado usando 99
observaciones, el AIC y el SBC son 502.3 y 504.9, respectivamente. Si el ARMA (1,
1) se estima utilizando 99 observaciones, el AIC y el SBC son 476,6 y 481,1,
respectivamente.

Al examinar la Tabla 2.3 , observe que todos los valores estimados de a 1 son
altamente significativos; cada uno de los valores estimados es al menos ocho
desviaciones estándar de cero. Está claro que el modelo AR (1) es
inapropiado. Las estadísticas Q para el modelo 1 indican que hay una
autocorrelación significativa en los residuos. El modelo ARMA (1, 1) estimado no
sufre este problema. Además, tanto el AIC como el SBC seleccionan el Modelo 2
sobre el Modelo 1.
El mismo tipo de razonamiento indica que el Modelo 2 es preferido al Modelo 3.
Obsérvese que para cada modelo, los coeficientes estimados son altamente
significativos y las estimaciones puntuales implican convergencia. Aunque la Q-
estadística en 24 lags indica que estos dos modelos no sufren de residuos
correlacionados, la Q- estadística en 8 lags indica correlación en serie en los
residuos del modelo 3. Así, el modelo AR (2) no captura de corto- así como el
modelo ARMA (1, 1). Observe también que el AIC y el SBC seleccionan el Modelo 2.

ESTIMACIÓN DE UN MODELO AR (2)


Una tercera serie de datos fue simulada como

El ACF estimado y el PACF de la serie son:


Obsérvese la gran autocorrelación en el retardo 16 y las grandes autocorrelaciones
parciales en los retornos 14 y 17. Dada la forma en que se simuló el proceso, la
presencia de estas autocorrelaciones no se debe más que al azar. Sin embargo, un
econometrista que no conoce el proceso real de generación de datos podría estar
preocupado por estas autocorrelaciones. El modelo AR (2) estimado (con t-
estadística entre paréntesis) es

En general, el modelo parece ser adecuado. Sin embargo, los dos coeficientes AR
(2) son incapaces de capturar las correlaciones a muy largos retrasos. Por ejemplo,
las autocorrelaciones parciales de los residuos para los retardo 14 y 17 son ambas
mayores que 0,2 en valor absoluto. La estadística de Ljung-Box calculada para 16
rezagos es 24.6248 (que es significativa en el nivel 0.038). En este punto, podría
ser tentador intentar modelar la correlación en el retraso 16 incluyendo el término
de promedio móvil β 16 έ t -16 . Esta estimación resulta en: 2

Todos los coeficientes estimados son significativos y las estadísti- cas de Ljung-
Box Q para los residuos son todas insignificantes a niveles convencionales. Junto
con el hecho de que tanto la AIC como la SBC seleccionan este segundo modelo, el
investigador que no conoce el verdadero proceso podría estar tentado a concluir
que el proceso generador de datos incluye un término medio móvil con un retraso
16.
Una comprobación de modelo útil es dividir la muestra en dos partes. Si un
coeficiente está presente en el proceso generador de datos, su influencia debe verse
en ambas submuestras. Si la serie simulada se divide en dos partes, el ACF y PACF
usando las observaciones 50 a 100 siguen:

Como puede ver, el tamaño de las autocorrelaciones parciales en los retornos 14 y


17 es disminuido. Ahora, la estimación de un puro AR (2) modelo sobre esta
segunda parte de la muestra de rendimiento
Todos los coeficientes estimados son significativos, y las estadísticas de Ljung-
Box Q no indican autocorrelaciones significativas en los residuos. Los niveles de
significación de Q (8), Q (16) y Q (24) son 0,251, 0,317 y 0,249,
respectivamente. De hecho, este modelo captura el proceso real de generación de
datos bastante bien. En este ejemplo, las grandes autocorrelaciones espurias de los
retardos largos pueden eliminarse cambiando el periodo de muestreo. Por lo tanto,
es difícil mantener que la correlación en el retraso 16 es significativa. La mayoría de
los profesionales sofisticados advierten en contra de intentar adaptar cualquier
modelo a los largos rezagos.Como puede deducir de (2.41) , la varianza de r s puede
ser considerable cuando s es grande. Además, en pequeñas muestras, algunas
observaciones "inusuales" pueden crear la apariencia de autocorrelaciones
significativas a largos retrasos. Dado que la estimación econométrica implica
procesos de generación de datos desconocidos, el punto más general es que
siempre debemos tener cuidado con nuestro modelo estimado. Afortunadamente,
Box y Jenkins (1976) establecieron un conjunto de procedimientos que pueden
utilizarse para verificar la adecuación de un modelo.

8. SELECCIÓN DEL MODELO BOX-JENKINS


Las estimaciones de los modelos AR (1), ARMA (1, 1) y AR (2) de la sección anterior
ilustran la estrategia de Box-Jenkins (1976) para la selección apropiada de
modelos. Box y Jenkins popularizaron un método de tres etapas dirigido a
seleccionar un modelo apropiado con el propósito de estimar y pronosticar una
serie temporal univariada. En la etapa de identificación , el investigador
examina visualmente el gráfico de tiempo de la serie, la función de autocorrelación
y la función de correlación parcial. Trazando la trayectoria del tiempo de la { y t}
proporciona información útil sobre valores atípicos, valores faltantes y rupturas
estructurales en los datos. Las variables no estacionarias pueden tener una
tendencia pronunciada o parecer que serpentean sin una media o una varianza
constante a largo plazo. Los valores faltantes y valores extremos se pueden corregir
en este punto. Al mismo tiempo, la práctica estándar era la primera diferencia de
cualquier serie que se considerara no estacionaria. Actualmente, se está
desarrollando una gran cantidad de literatura que desarrolla procedimientos
formales para verificar la no estacionabilidad. Aplazamos esta discusión hasta
el Capítulo 4 y asumimos que estamos trabajando con datos estacionarios. Una
comparación de la muestra ACF y PACF a los de los diversos procesos teóricos
ARMA puede sugerir varios modelos plausibles. En la etapa de estimación, Cada
uno de los modelos tentativos está en forma y los diversos un i y β i se examinan
coeficientes. En esta segunda etapa, el objetivo es seleccionar un modelo
estacionario y parsimonioso que tenga un buen ajuste. La tercera etapa implica la
comprobación del diagnóstico para asegurar que los residuos del modelo
estimado imitan un proceso de ruido blanco.

PARSIMONIA
Una idea fundamental en el enfoque de Box-Jenkins es el principio
de parsimonia. La parsimonia (que significa escasez o avaricia) debe ser una
segunda naturaleza para los economistas. La incorporación de coeficientes
adicionales necesariamente aumentará el ajuste (por ejemplo, el valor de R
$ ₂ $aumentará) a un costo de reducir los grados de libertad. Box y Jenkins
argumentan que los modelos parsimoniosos producen mejores pronósticos que los
modelos sobreparamétricos. Un modelo parsimonioso se ajusta bien a los datos sin
incorporar ningún coeficiente innecesario. Ciertamente, los pronosticadores no
quieren proyectar coeficientes mal estimados en el futuro. El objetivo es aproximar
el verdadero proceso generador de datos pero no precisar el proceso exacto. El
objetivo de la parsimonia sugiere eliminar el coeficiente MA (12) en el modelo de
AR (1) simulado anterior.
Al seleccionar un modelo apropiado, el econometrista debe tener en cuenta que
varios modelos diferentes pueden tener propiedades similares. Como ejemplo
extremo, tenga en cuenta que el modelo AR (1) y t = 0.5 y t -1 + έ t tiene la
representación media móvil equivalente de y t = έ t + 0.5 έ t -1 + 0.25 έ t -2 + 0.125 έ t -
3 + 0.0625 έ t -4 + .... Enla mayoría de las muestras, aproximándose a este proceso

MA (∞) con un modelo MA (2) o MA (3) dará un muy buen ajuste. Sin embargo, el
modelo AR (1) es el modelo más parsimonioso y se prefiere. Como ejercicio, debe
mostrar que este modelo AR (1) tiene la representación equivalente de y t = 0.25 y t -
2 + 0.5 έ t -1 + έ t .

También, esté enterado del problema común del factor. Supongamos que
queremos ajustar el modelo ARMA (2, 3)

También supongamos que (1 - a 1 L - a 2 L 2 ) y (1 + β 1 L + β 2 L 2 + β 3 L 3 ) pueden ser


factorizadas como (1 + cL ) (1 + aL ) y ( 1 + cL ) (1 + b 1 L + b 2 L 2 ),
respectivamente. Dado que (1 + cL ) es un factor común a cada uno, (2.43) tiene la
forma equivalente, pero más parcimoniosa, 3

Si usted hizo correctamente el ejercicio sugerido anteriormente, sabe que (1 -


0.25 L 2 ) y t = (1 + 0.5 L ) έ t es equivalente a (1 + 0.5 L ) (1 - 0.5 L ) y t = (1 +
0.5 L ) έ t , de modo que y t = 0.5 y t -1 + έ t . En la práctica, los polinomios no se
factorizarán exactamente. Sin embargo, si los factores son similares, usted debe
intentar una forma más parsimonious.
Con el fin de asegurar que el modelo sea parsimonioso, los distintos a i y β i deben
tener estadística t de 2,0 o mayor (de manera que cada coeficiente es
significativamente diferente de cero en el nivel de 5 por ciento). Además, los
coeficientes no deben estar fuertemente correlacionados entre sí. Los coeficientes
altamente colineales son inestables; normalmente uno o más pueden eliminarse del
modelo sin reducir el rendimiento de la previsión.

ESTACIONARIEDAD E INVERTIBILIDAD
La teoría de distribución que subyace al uso de la muestra ACF y PACF como
aproximaciones a las del verdadero proceso generador de datos supone que
la secuencia { y t } es estacionaria. Por otra parte, t -statistics y Q- estadística
también suponen que los datos son estacionarios. Los coeficientes autorregresivos
estimados deben ser consistentes con esta suposición subyacente. Por lo tanto,
debemos sospechar de un modelo AR (1) si el valor estimado de a 1es cercano a la
unidad. Para un modelo ARMA (2, q ), las raíces características del polinomio
estimado (1 - a 1 L - a 2 L 2) debe estar fuera del círculo de la unidad.
Como se describe con mayor detalle en el Apéndice 2.1 , el enfoque de Box-Jenkins
también requiere que el modelo sea invertible. Formalmente, { y t } es invertible
si puede ser representado por un proceso autoregresivo de orden finito o
convergente. La Invertibilidad es importante porque el uso de la ACF y PACF
asume implícitamente que la secuencia { y t } puede ser representada por un
modelo autorregresivo. Como demostración, considere el modelo MA (1) simple:

de modo que si | β 1 | <1,

Si | β 1 | <1, (2.46) se puede estimar usando el método de Box-Jenkins. Sin


embargo, si | β 1 | ≥ 1, la secuencia { y t } no puede ser representada por un proceso
de orden finito AR; como tal, no es invertible. De manera más general, para que un
modelo ARMA tenga una representación AR convergente, las raíces del polinomio
(1 + β 1 L + β 2 L 2 + ... + β q L q ) deben estar fuera del círculo unitario. Tenga en
cuenta que no hay nada impropio sobre un modelo no
reversible. La secuencia { y t } implicada por y t= έ t - έ t -1 es estacionario, ya que
tiene una constante invariable en el tiempo [ Ey t = Ey t-s = 0], una varianza
constante invariable en el tiempo [var ( y t ) = var ( y t- s ) = σ 2 (1 + β 1 2 ) + 2 σ 2 ], y
las autocovariancias γ 1 = - β 1 σ 2 y todas las demás γ s = 0. El problema es que la
técnica no permite la estimación de modelos. Siβ 1 = 1, (2.46) se convierte en

Claramente, las autocorrelaciones y autocorrelaciones parciales entre y t y y t-


s nunca decaerán.

BONDAD DE AJUSTE
Un buen modelo se ajustará bien a los datos. Obviamente, R 2 y la media de la suma
residual de cuadrados son medidas comunes de bondad de ajuste en mínimos
cuadrados ordinarios. El problema con estas medidas es que el ajuste mejora
necesariamente a medida que se incluyen más parámetros en el modelo. Parsimony
sugiere utilizar el AIC y / o SBC como medidas más apropiadas del ajuste general
del modelo. También sea cauteloso de las estimaciones que no pueden converger
rápidamente. La mayoría de los paquetes de software calculan los parámetros de
un modelo ARMA utilizando un procedimiento de búsqueda no lineal. Si la
búsqueda no puede converger rápidamente, es posible que los parámetros
estimados sean inestables. En tales circunstancias, añadir una o dos observaciones
adicionales puede alterar en gran medida las estimaciones.

EVALUACIÓN POSTERIOR A LA EVALUACIÓN


La tercera etapa de la metodología de Box-Jenkins implica la comprobación
diagnóstica. La práctica estándar es trazar los residuos para buscar los valores
atípicos y para evidenciar los períodos en los que el modelo no se ajusta bien a los
datos. Una práctica común es crear los residuos estandarizados dividiendo cada
residuo, έ t , por su desviación estándar estimada, σ. Si los residuos son
normalmente distribuidos, la gráfica del έ t / σserie debe ser tal que no más de 5
por ciento se encuentran fuera de la banda de -2 a +2. Si los residuos
estandarizados parecen ser mucho más grandes en algunos períodos que en otros,
puede ser evidencia de un cambio estructural. Si todos los modelos plausibles de
ARMA muestran evidencia de un ajuste pobre durante una porción
razonablemente larga de la muestra, es aconsejable considerar el uso de análisis de
intervención, análisis de función de transferencia o cualquier otro de los métodos
de estimación multivariados discutidos en capítulos posteriores. Si la varianza de
los residuos está aumentando, una transformación logarítmica puede ser
apropiada. Alternativamente, es posible que desee modelar realmente cualquier
tendencia de la varianza a cambiar usando las técnicas de ARCH discutidas en
el Capítulo 3 .
Es particularmente importante que los residuos de un modelo estimado estén
correlacionados en serie. Cualquier evidencia de correlación serial implica un
movimiento sistemático en la secuencia { y t } que no está representada por los
coeficientes de ARMA incluidos en el modelo. Por lo tanto, cualquiera de los
modelos tentativos que producen residuos no aleatorios debe sereliminado de la
consideración. Para verificar la correlación en los residuos, construya el ACF y el
PACF de los residuos del modelo estimado. A continuación, puede
utilizar (2.41) y (2.42) para determinar si alguna o todas las autocorrelaciones
residuales o autocorrelaciones parciales son estadísticamente
significativas. 4 Aunque no hay un nivel de significación que se considere "lo más
apropiado", tenga cuidado con cualquier modelo que produzca (1) varias
correlaciones residuales que sean marginalmente significativas y (2)
una estadística Q que es apenas significativa al nivel del 10 por ciento. En tales
circunstancias, es usualmente posible formular un modelo de mejor desempeño.
Del mismo modo, un modelo se puede estimar sólo en una parte del conjunto de
datos. El modelo estimado puede usarse para pronosticar los valores conocidos de
la serie. La comparación de la suma de los errores de pronóstico al cuadrado es una
manera útil de evaluar la adecuación de modelos alternativos. Aquellos modelos
con malas previsiones fuera de la muestra deben ser eliminados. Algunos de los
detalles de la construcción de los pronósticos fuera de la muestra se analizan en la
siguiente sección.

9. PROPIEDADES DE LAS PRONÓSTICAS


Quizás el uso más importante de un modelo ARMA es predecir valores futuros de
la secuencia { y t }. Para simplificar la discusión, se supone que el proceso de
generación de datos real y las realizaciones actuales y pasadas de
las secuencias { έ t } y { y t } son conocidas por el investigador. Consideremos
primero las predicciones del modelo AR (1) y t = a 0 + a 1 y t -1 + έ t . Al actualizar un
período, obtenemos
Si conoce los coeficientes a 0 y a 1 , puede pronosticar y t +1 condicionada a la
información disponible en el período t como

donde E t y t + j es una forma abreviada de escribir la expectativa condicional de y t +


j dada la información disponible en t . Formalmente, E t y t + j = E ( y t + j | y t , y t -1 , y t -

2 , ..., έ t , έ t -1 , ...).

De la misma manera, ya que y t + 2 = a 0 + a 1 y t +1 + έ t +2 , la previsión


de y t +2 condicionada por la información disponible en el período t es

y utilizando (2,47) ,

Por lo tanto, el pronóstico de y t +1 se puede utilizar para pronosticar y t +2 . El punto


es que las previsiones pueden ser construidas usando iteración hacia adelante; la
previsión de y t + jpuede usarse para pronosticar y t + j +1 . Dado que y t + j +1 = a 0 + a 1 y t +
j + έ t + j +1 , sigue inmediatamente que

De (2.47) y (2.48) debe quedar claro que es posible obtener toda la secuencia
de previsiones j-step-ahead por iteración directa. Considerar:

Esta ecuación, denominada función de pronóstico , expresa


todas las previsiones j -step-ahead en función de la información establecida en el
período t . Desafortunadamente, la calidad de las previsiones disminuye a medida
que avanzamos hacia el futuro. Piense en (2.48) como una ecuación de diferencia
de primer orden en la secuencia { E t y t + j }. Desde | a 1 | <1, la ecuación de
diferencia es estable, y es fácil encontrar la solución particular a la ecuación de
diferencia. Si tomamos el límite de E t y t + j como j → ∞, encontramos que E ty t +
j → a 0 / (1 - a 1 ). Este resultado es realmente muy general: Para cualquier modelo

ARMA estacionario, la predicción condicional de y t + j converge a la media


incondicional como j → ∞.
Debido a que los pronósticos de un modelo ARMA no serán perfectamente exactos,
es importante considerar las propiedades de los errores de pronóstico. Previsiones
a partir del período de tiempo t , podemos definir el error de predicción j -step-
ahead, llamado e t ( j ), como la diferencia entre el valor realizado de y t + j y el valor
pronosticado:

Dado que el error de pronóstico de un paso adelante es equivalente a e t (1) = y t +1 -


E t y t +1 = έ t +1 , e t (1) es precisamente la porción "no previsible" de y t +1 dada la
información disponible en t .
Para encontrar el error de pronóstico de dos pasos adelante, necesitamos
formar e t (2) = y t + 2 - E t y t +2 . Dado que y t + 2 = a 0 + a 1 y t +1 + έ t +2 y E t y t +
2 = a 0 + a 1 E t y t +1 , se sigue que
Debería tomar unos momentos para demostrar que para el modelo AR (1), el error
de pronóstico j -step-ahead es dado por

Como la media de (2.49) es cero, las previsiones son estimaciones no sesgadas de


cada valor y t + j . La prueba es trivial. Desde E t έ t + j = E t έ t + j -1 = ... = E t έ t 1 = 0, la
expectativa condicional de (2.49) es E t e t ( j ) = 0. Dado que el valor esperado del
error de pronóstico es cero, las previsiones son imparciales.
Aunque no son imparciales, los pronósticos de un modelo ARMA son
necesariamente inexactos. Para encontrar la varianza del error de pronóstico,
seguir asumiendo que los elementos de la { έ t } secuencia son independientes, con
una varianza igual a sigma 2 . Por lo tanto, a partir de (2.49) , la varianza del error
de pronóstico es

Por lo tanto, la varianza de error de pronóstico de dos pasos adelante es σ 2 ,


la varianza de error de pronóstico de dos pasos adelante es σ 2 (1 + a 1 2 ), y así
sucesivamente. El punto esencial a observar es que la varianza del error de
pronóstico es una función creciente de j . Como tal, puede tener más confianza en
las previsiones a corto plazo que en las previsiones a largo plazo. En el límite
como j → ∞, la varianza del error de pronóstico converge a σ 2 / (1 - a 1 2 ); por lo
tanto, la varianza del error de pronóstico converge a la varianza incondicional de
la secuencia { y t }.
Además, suponiendo que la secuencia { έ t } se distribuye normalmente, puede
colocar intervalos de confianza alrededor de los pronósticos. La previsión de un
solo paso-por delante de y t 1 es un 0 + un 1 y t y el error de pronóstico es σ 2 . Como
tal, el intervalo de confianza del 95 por ciento para el pronóstico de un paso
adelante puede construirse como

Podemos construir un intervalo de confianza para el error de pronóstico de dos


pasos adelante de la misma manera. A partir de (2.48) , el pronóstico de dos pasos
adelante es , y (2.50) indica que var [ e t (2)] es σ 2 (1 + a 1 2 ). Así, el
intervalo de confianza del 95 por ciento para el pronóstico de dos

MODELOS DE ORDEN SUPERIOR


Para generalizar la discusión, es posible utilizar la técnica iterativa para derivar los
pronósticos para cualquier modelo ARMA ( p , q ). Para mantener el álgebra
simple, considere el modelo ARMA (2, 1)

Actualización de rendimientos de un período

Si seguimos asumiendo que (1) todos los coeficientes son conocidos; (2) todas las
variables subcritas t , t - 1, t - 2, ... son conocidas en el periodo t ; y (3) E t έ t + j = 0
para j > 0, la expectativa condicional de y t +1 es
La ecuación (2.52) es la previsión de un paso adelante de y t +1 . El error de
pronóstico de un paso adelante es la diferencia entre y t +1 y E t y t +1 de manera
que e t (1) = έ t +1 . Para encontrar el pronóstico de dos pasos adelante,
actualizar (2.51) por dos períodos:

La expectativa condicional de y t +2 es

La ecuación (2.53) expresa el pronóstico de dos pasos adelante en términos del


pronóstico de un paso adelante y el valor actual de y t . La combinación
de (2.52) y (2.53) rendimientos

Para encontrar el error de pronóstico de dos pasos adelante,


restar (2.53) de y t +2 . Así,

Puesto que y t +1 - E t y t +1 es el error de pronóstico de un paso adelante, podemos


escribir el error de pronóstico como

Finalmente, se pueden obtener todos los pronósticos j -step-ahead de

La ecuación (2.56) demuestra que las predicciones satisfarán una ecuación de


diferencias de segundo orden. Mientras las raíces características de (2.56) estén
dentro del círculo unitario, las predicciones convergerán a la media
incondicional: a 0 / (1 - a 1 - a 2 ). Podemos usar (2.56) para encontrar los errores de
pronóstico j -step-ahead. Dado que y t + j = a 0 + a 1 y t + j-1 + a 2 y t + j -2 + έ t + j + β1 έ t + j -1 ,
el error de pronóstico j -step-ahead es

Debe quedar claro que los pronósticos de cualquier proceso estacionario ARMA
( p , q ) eventualmente satisfarán la ecuación de diferencias de orden p
que comprende la porción homogénea del modelo. Como tal, los pronósticos multi-
paso adelante convergerán a la media a largo plazo de la serie.

EVALUACIÓN DE PRONÓSTICOS
Ahora que ha estimado una serie y ha pronosticado sus valores futuros, la pregunta
obvia es: "¿Qué tan buenos son mis pronósticos?" Normalmente, habrá varios
modelos plausibles que puede seleccionar para utilizarlos en sus pronósticos. No se
deje engañar al pensar que el que tiene mejor ajuste es el que pronosticará lo
mejor. Para hacer un punto simple, suponga que quería pronosticar los valores
futuros del proceso ARMA (2, 1) dado por (2.51) . Si pudiera pronosticar el valor
de y T +1 usando (2.52) , obtendría el error de pronóstico de un paso adelante
Dado que el error de pronóstico es la parte puramente imprevisible de y T +1 , ningún
otro modelo ARMA puede proporcionarle un rendimiento de pronóstico
superior. Como tal, parece que el modelo "verdadero" proporcionará pronósticos
superiores a los de cualquier otro modelo posible. En la práctica, no conocerá el
orden real del proceso ARMA o los valores reales de los coeficientes de ese
proceso. En su lugar, para crear previsiones fuera de la muestra, es necesario
utilizar los coeficientes estimados de lo que usted cree que es la forma más
apropiada de un modelo ARMA. Deje que un "sombrero" o caret (^) sobre un
parámetro denote el valor estimado de un parámetro, y deje denotan los
residuos del modelo estimado. Por lo tanto, si usa el modelo estimado, el
pronóstico de un paso adelante será

y el error de pronóstico de un paso adelante será

Claramente, este pronóstico no será idéntico al de (2.57) . Cuando se pronostica el


uso (2.58), los coeficientes (y los residuos) se estiman imprecisamente. Las
previsiones realizadas con el modelo estimado extrapolan este coeficiente de
incertidumbre en el futuro. Puesto que la incertidumbre del coeficiente aumenta a
medida que el modelo se vuelve más complejo, podría ser que un modelo estimado
de AR (1) pronostique el proceso dado por (2.51) mejor que un modelo ARMA (2, 1)
estimado. El punto general es que los modelos grandes suelen contenererrores de
estimación en la muestra que inducen errores de pronóstico. Como se muestra en
Clark y West (2007), Dimitrios y Guerard (2004), y Liu y Enders (2003), las
predicciones con modelos demasiado parsimoniosos con poca incertidumbre de
parámetros pueden proporcionar mejores predicciones que los modelos
compatibles con el proceso real de generación de datos. Además, es muy difícil
construir intervalos de confianza para este tipo de error de pronóstico. No sólo es
necesario incluir los efectos de la variación estocástica en los valores futuros de { y T
+ i }, también es necesario incorporar el hecho de que los coeficientes se estiman con

error.
¿Cómo saber cuál de varios modelos razonables tiene el mejor rendimiento de
pronóstico? Una forma de responder a esta pregunta es poner los modelos
alternativos a una prueba de cabeza a cabeza. Dado que los valores futuros de la
serie son desconocidos, puede contener una parte de las observaciones del proceso
de estimación. Como tal, puede estimar los modelos alternativos sobre el lapso de
datos acortado y utilizar estas estimaciones para pronosticar las observaciones del
período de retención. A continuación, puede comparar las propiedades de los
errores de pronóstico de los dos modelos. Para tomar un ejemplo simple,
supongamos que { y t } contiene un total de 150 observaciones y que no está seguro
de si un modelo AR (1) o un modelo MA (1) capta mejor el comportamiento de la
serie.
Una forma de proceder es usar las primeras 100 observaciones para estimar ambos
modelos y usar cada uno para pronosticar el valor de y 101 . Puesto que usted conoce
el valor real de y 101 , puede construir el error de pronóstico obtenido del AR (1) y
del MA (1). Estos dos errores de pronóstico son precisamente los que alguien
habría hecho si hubieran estado haciendo un pronóstico de un paso adelante en el
período 100. Ahora, reestima un AR (1) y un modelo MA (1) usando las primeras
101 observaciones. Aunque los coeficientes estimados cambiarán algo, son los que
alguien habría obtenido en el período 101. Utilice los dos modelos para pronosticar
el valor de y 102 . Dado que usted sabe el valor real de y 102, puede construir otros dos
errores de pronóstico. Puesto que conoce todos los valores de la secuencia { y t }
hasta el período 150, puede continuar este proceso para obtener dos series de
errores de pronóstico de un paso adelante, cada uno con 50 observaciones. Para
mantener la notación simple, vamos { f 1 i } y { f 2 i } denotar la secuencia de
pronósticos del AR (1) y del MA (1), respectivamente. Si se entiende la notación,
debe quedar claro que f 11 = E 100 y 101 es el primer pronóstico usando el AR (1)
y f 2,50 es el último pronóstico del MA (1).
Obviamente, es deseable que los errores de pronóstico tengan una media cercana a
cero y una pequeña varianza. Un método basado en regresión para evaluar las
previsiones es utilizar las 50 previsiones de la AR (1) para estimar una ecuación de
la forma

Si los pronósticos son imparciales, un test F debería permitirle imponer la


restricción a 0 = 0 y a 1 = 1. Similarmente, la serie residual { v 1 i } debería actuar
como un proceso de ruido blanco. Es una buena idea trazar { v 1 i } contra { y 100+ i }
para determinar si hay períodos en los que sus pronósticos son especialmente
pobres. Ahora repita el proceso con las previsiones de la MA (1). En particular,
utilice las 50 previsiones del MA (1) para estimar

Una vez más, si usas una prueba F , no deberías poder rechazar la hipótesis
conjunta b 0 = 0 yb 1 = 1. Si los niveles de significación de las dos pruebas F son
similares,podría seleccionar el modelo con la menor varianza residual; es decir,
seleccione AR (1) si var ( v 1 ) <var ( v 2 ). 5
En términos más generales, es posible que desee tener un período de retención que
difiera de 50 observaciones. Si tiene una muestra grande, es posible contener hasta
el 50 por ciento del conjunto de datos. También, es posible que desee utilizar j-
estep-ahead previsiones en lugar de un paso adelante previsiones. Por ejemplo, si
tiene datos trimestrales y desea pronosticar un año en el futuro, puede realizar el
análisis utilizando pronósticos de cuatro pasos adelante. Una vez que tenga las dos
secuencias de errores de pronóstico, puede comparar sus propiedades. Con una
muestra muy pequeña, puede no ser posible contener muchas
observaciones. Pequeñas muestras son un problema ya que Ashley (2003) mostró
que las muestras muy grandes a menudo son necesarios para revelar una diferencia
significativa entre los resultados de predicción fuera de la muestra de modelos
similares. Necesita tener suficientes observaciones para tener coeficientes bien
estimados para el período de la muestra y suficientes previsiones fuera de la
muestra para que la prueba tenga una buena potencia.
En lugar de centrarse en el sesgo, muchos investigadores seleccionarían el modelo
con el menor error de predicción cuadrática media (MSPE). Supongamos que
construye Hprevisiones de un paso adelante a partir de dos modelos
diferentes. Nuevamente, sea f 1 i las previsiones del Modelo 1 y f 2 i las previsiones del
Modelo 2. Dado que estamos usando previsiones de un paso adelante, podemos
suprimir el subíndice j y denotar las dos series de errores de predicciones
como e 1 i y e 2 i . Como tal, el MSPE del Modelo 1 se puede calcular como

Se han propuesto varios métodos para determinar si un MSPE es estadísticamente


diferente del otro. Si coloca el mayor de los dos MSPE en el numerador, una
recomendación estándar es utilizar el F- estadístico

La intuición es que el valor de F será igual a la unidad si los errores de predicción


de los dos modelos son idénticos. Un valor muy grande de F implica que los errores
de predicción del primer modelo son sustancialmente mayores que los del
segundo. Bajo la hipótesis nula de rendimiento de predicción igual, (2.59) tiene
una distribución estándar de F con ( H, H ) grados de libertad si las siguientes tres
suposiciones mantienen:
1. Los errores de pronóstico tienen media cero y se distribuyen normalmente.
2. Los errores de pronóstico no están correlacionados en serie.
3. Los errores de pronóstico no están correlacionados entre sí
simultáneamente.
Aunque es una práctica común suponer que la secuencia { έ t } se distribuye
normalmente, no es necesariamente el caso de que los errores de pronóstico se
distribuyan normalmente con un valor medio de cero. De forma similar, las
previsiones pueden estar correlacionadas en serie; esto es particularmente cierto si
usas pronósticos de varios pasos adelante. Por ejemplo, la ecuación (2.55) indicó
que el error de pronóstico de dos pasos adelante para y t +2es

y la actualización por un período produce el error de pronóstico de dos pasos


adelante para y t +3 :

Debe quedar claro que los dos errores de pronóstico están correlacionados. En
particular,

El punto es que predecir y t +2 desde la perspectiva del período t y


predecir y t +3 desde la perspectiva del período t + 1, ambos contienen un error
debido a la presencia de έ t +2 . Sin embargo, para i > 1, E [ e t (2) e t + i (2)] = 0 ya que
no hay proyecciones superpuestas. Por lo tanto, las autocorrelaciones de los errores
de pronóstico de dos pasos adelante se reducen a cero después del retardo 1. Usted
debería ser capaz de demostrar el resultado general de que los errores de
pronóstico j -step-ahead actúan como un MA ( j - 1) proceso.
Finalmente, los errores de predicción de los dos modelos alternativos estarán
generalmente altamente correlacionados entre sí. Por ejemplo, una realización
negativa de έ t +1 tiende a hacer que las previsiones de ambos modelos sean
demasiado altas. Desafortunadamente, la violación de cualquiera de estas
suposiciones significa que la proporción de los MSPE en (2.59) no tiene
una distribución F.
LA PRUEBA GRANGER-NEWBOLD Granger y Newbold (1976) mostraron
cómo superar el problema de errores de pronóstico correlacionados
contemporáneamente. Si tiene Herrores de pronóstico de un solo paso adelante de
cada modelo, use las dos secuencias de errores de pronóstico para formar

Dado que las dos primeras suposiciones anteriores son válidas, bajo la hipótesis
nula de igual exactitud de pronóstico, x i y z i no deben estar correlacionadas:

Si los modelos pronostican igualmente bien, se deduce que . El modelo 1


tiene un MSPE más grande si ρ xz es positivo y el modelo 2 tiene un MSPE más
grande si ρ xz es negativo. Sea r xz el coeficiente de correlación de la muestra entre
{ x i } y { z i }. Granger y Newbold (1976) mostraron que si los supuestos 1 y 2 se
mantienen,

tiene una distribución t con H - 1 grados de libertad. Por lo tanto, si r xz es


estadísticamente diferente de cero, el modelo 1 tiene un MSPE más grande si r xz es
positivo y el modelo 2 tiene un MSPE más grande si r xz es negativo.
LA PRUEBA DE DIEBOLD-MARIANO Hay un cuerpo de literatura muy
grande que intenta extender la prueba de Granger-Newbold para relajar las
suposiciones 1 y 2. Además, los econometristas aplicados podrían estar interesados
en medidas de desempeño de predicción distintas de la suma de errores
cuadráticos . De hecho, debe quedar claro que el uso de la suma de errores
cuadrados como criterio tiene sentido sólo si la pérdida de hacer un pronóstico
incorrecto es cuadrática. Sin embargo, hay muchas otras posibilidades. Por
ejemplo, si su pérdida depende del tamaño del error de pronóstico, debería
preocuparse por los valores absolutos de los errores de
pronóstico. Alternativamente, un operador de opciones recibe una recompensa de
cerosi el valor del activo subyacente está por debajo del precio de ejercicio pero
recibe una recompensa de un dólar por cada dólar, el precio del activo sube por
encima del precio de ejercicio. En tal circunstancia, el resultado de la pérdida es
asimétrico. Diebold y Mariano (1995) desarrollaron una prueba que relaja las
suposiciones 1 a 3 y permite una función objetiva que no es cuadrática.
Como antes, si consideramos sólo previsiones de un paso adelante, podemos
eliminar el subíndice j . Como tal, podemos dejar que la pérdida de un error de
pronóstico en el período isea denotada por g ( e i ). En el caso típico de errores
cuadráticos medios, la pérdida es . Sin embargo, para permitir que la función de
pérdida sea general, podemos escribir la pérdida diferencial en el período i de usar
el Modelo 1 versus el Modelo 2 como d i = g ( e 1 i ) - g ( e 2 i). La pérdida media se
puede obtener como
Bajo la hipótesis nula de exactitud de pronóstico igual, el valor de es cero. Puesto
que es la media de las pérdidas individuales, en condiciones bastante débiles el
teorema del límite central implica que debería tener una distribución normal. Por
lo tanto, no es necesario suponer que los errores de predicción individuales se
distribuyen normalmente. Así, si supiéramos var ( ), podríamos construir la
relación y probar la hipótesis nula de exactitud de pronóstico igual
usando una distribución normal estándar. En la práctica, la implementación de la
prueba se complica por el hecho de que necesitamos estimar var ( ).
Si la serie { d i } no está correlacionada en serie con una varianza muestral de γ 0 , la
estimación de var ( ) es simplemente γ 0 / ( H - 1). Dado que utilizamos el valor
estimado de la varianza, la expresión tiene
una distribución t con H - 1 grados de libertad.
Hay un cuerpo muy grande de literatura sobre la mejor manera de estimar la
desviación estándar de la presencia de correlación serial. Muchos de los detalles
técnicos no son apropiados aquí. Diebold y Mariano permiten γ i denota el i ésimo
autocovarianza de la d tsecuencia. Supongamos que los primeros q valores de γ i son
diferentes de cero. La varianza de puede ser aproximada por var ( ) = [ γ 0 +
2 γ 1 + ... + 2 γ q ] ( H - 1) -1; la desviación estándar es la raíz cuadrada. Como tal,
Harvey, Leybourne y Newbold (1998) recomendaron construir la estadística de
Diebold-Mariano (DM) como

Compare el valor muestral de (2.62) con un estadístico t con H - 1 grados de


libertad. Como una cuestión práctica, una manera simple de proceder es regresar
el d i en una constante y usar un t- test (con errores estándar robustos) para
determinar si la constante es estadísticamente diferente de cero. 6
También es posible utilizar el método para los pronósticos j -step-ahead e 1 i ( j )
y e 2 i ( j ). Construya cada d i = g ( e 1 i ( j )) - g ( e 2 i ) y construya la media . Si se
construyen H errores de pronóstico, la estadística DM es

Un ejemplo que muestra el uso apropiado de las pruebas de Granger-Newbold y


Diebold-Mariano se proporciona en la siguiente sección. Sin embargo, antes de
proceder, una fuerte advertencia está en orden. Clark y McCracken (2001)
mostraron que las pruebas de Granger-Newbold y Diebold-Mariano tienen
una distribución- t sólo cuando los modelos de predicción subyacentes no están
anidados. Por ejemplo, las pruebas podrían no funcionarbien al comparar los
pronósticos de un modelo AR (1) con los obtenidos de un modelo ARMA (2,
1). Claramente, la AR (1) se puede obtener de la ARMA (2, 1) especificación
mediante el establecimiento de un 2 = β 1 = 0. El problema con modelos anidados es
que de que bajo la hipótesis nula de igualdad de MSPE (de modo que los datos son
generados por el modelo pequeño), los dos modelos deberían predecir igualmente
bien. Sin embargo, el modelo grande siempre contendrá algún error adicional ya
que contiene parámetros innecesarios. Por lo tanto, si desea probar si los datos son
realmente generados a partir de los diferentes modelos, es necesario controlar la
incertidumbre del parámetro.
Clark y West (2007) desarrollaron un procedimiento simple para ajustar los errores
de pronóstico del modelo grande de modo que una variante simple de la estadística
de DM se puede utilizar con modelos anidados. Para continuar con la notación
desarrollada anteriormente, denote los pronósticos H del modelo 1 como f 1 i y los
errores de predicción como e 1 i . Del mismo modo, los pronósticos H y los errores
de predicción del Modelo 2 son f 2 i y e 2 i , respectivamente. Deje que el Modelo 1 se
anida dentro del Modelo 2. Dado que los modelos están anidados, la única razón
para cualquier discrepancia entre f 1 i y f2 i es error de estimación de parámetros. Si
este error de estimación se resta de e 2 i , los errores de pronóstico ajustados pueden
utilizarse como base para la prueba de DM modificada. Considere la z i serie
construido a partir de los cuadrados de estos errores como

Teniendo en cuenta la incertidumbre de parámetros, bajo la hipótesis nula de que


los dos modelos predicen igualmente bien, z i debería ser cero. Bajo la hipótesis
alternativa, los datos se generan a partir de modelos 2. Por lo tanto, para realizar la
prueba, regresión del z i serie sobre una constante. Dado que la prueba es
unilateral, si la estadística t para la constante excede 1.645, rechace la hipótesis
nula de exactitud de pronóstico igual al nivel de significación del 5 por ciento. Si
rechaza la hipótesis nula, puede concluir que los datos se generan a partir del
Modelo 2. De lo contrario, es más probable que los datos se generen a partir del
Modelo 1. Si la serie { z i } está correlacionada en serie, debe realizar la prueba con
un robusto t-estadística, como la de Newey y West (1987).

10. MODELO DE PROPAGACIÓN DE LA TASA DE INTERÉS


El término "ejemplo de libro de texto" se supone que connota una ilustración muy
clara. Si está buscando un ejemplo de la metodología Box-Jenkins, vuelva a
la Sección 7o pasar a la pregunta 11 al final de este capítulo. En la práctica, rara vez
encontramos una serie de datos que concuerde exactamente con un ACF o PACF
teórico. Esta sección pretende ilustrar algunas de las ambigüedades que se pueden
encontrar al usar la técnica de Box-Jenkins. Estas ambigüedades pueden llevar a
dos econometristas igualmente cualificados a estimar y pronosticar la misma serie
utilizando procesos ARMA muy diferentes. Muchos ven la necesidad de confiar en
el juicio y la experiencia del investigador como una seria debilidad de un
procedimiento que está diseñado para ser científico. Sin embargo, si hace
elecciones razonables, seleccionará modelos que vienen muy cerca de imitar el
proceso real de generación de datos. Como cuestión práctica, cuando encuentre
varios modelos plausibles, tiene sentido pronosticar ambos. En la literatura de
series de tiempo,
FIGURA 2.5 Tiempo de propagación de la tasa de interés

Es útil ilustrar el procedimiento de modelado de Box-Jenkins mediante la


estimación de un modelo trimestral del diferencial entre una tasa de interés a largo
plazo y una de corto plazo. Específicamente, el diferencial de tasas de interés ( s t )
puede formarse como la diferencia entre la tasa de interés de los bonos del
gobierno estadounidense a 10 años y la tasa de los bonos del Tesoro a tres
meses. Los datos utilizados en esta sección son las series denominadas R10 y
TBILL en el archivo QUARTERLY.XLS. El ejercicio 12 al final de este capítulo le
ayudará a reproducir los resultados que se indican a continuación.
Panel (a) de la figura 2.5 muestra la propagación en el período de 1960 Q 1-
2.008 Q 1. Aunque hay algunos casos en los que la propagación es negativo, la
diferencia entre a largo y tasas de corto plazo es generalmente positivo (la la media
de la muestra es 1,37). Observe que la serie muestra una buena cantidad de
persistencia en que las duraciones cuando la propagación es superior o inferior a la
media puede ser bastante largo. Por otra parte, no parece haber grandes rupturas
estructurales (como un salto permanente en la media o la varianza) en que la
naturaleza dinámica del proceso parece ser constante en el tiempo. Como tal, es
bastante razonable suponer que la secuencia { s t } es covarianza-
estacionaria. Encontraste, como se muestra en el Panel (b), la primera diferencia de
la propagación parece ser muy errática. Como comprobará en el ejercicio 12,
la serie Δ s t tiene poco contenido informativo que puede usarse para pronosticar
sus valores futuros. Como tal, parece razonable estimar un modelo de
la secuencia { s t } sin transformaciones adicionales. Sin embargo, debido a que hay
varios grandes saltos positivos y negativos en el valor de s t , algunos investigadores
podrían querer transformarlo para disminuir su volatilidad. Un número razonable
de tales choques podría indicar una desviación del supuesto de que los errores se
distribuyen normalmente. Aunque una transformación logarítmica o de raíz
cuadrada es imposible porque algunas realizaciones des t son negativos, se podría
amortiguar la serie usando y t = log ( s t + c ) usando un valor de c tal que s t + c sea
siempre positivo. El punto es que siempre debe mantener un escepticismo
saludable de la precisión de su modelo ya que el comportamiento del proceso
generador de datos puede no estar totalmente de acuerdo con los supuestos
subyacentes de la metodología.

FIGURA 2.6 ACF y PACF de la Propagación

Antes de leer, debe examinar las funciones de autocorrelación y autocorrelación


parcial de la secuencia { s t } mostrada en la Figura 2.6 . Trate de identificar los
modelos tentativos que desea estimar. Recuérdese que el ACF teórico de un proceso
MA puro ( q ) corta a cero al retraso q y el ACF teórico de un modelo AR (1) decae
geométricamente. El examen de la figura 2.6 sugiere que ninguna de estas
especificaciones describe perfectamente los datos de la muestra. Al seleccionar su
conjunto de modelos plausibles, también tenga en cuenta lo siguiente:
1. El ACF y el PACF convergen a cero rápidamente bastante que no tenemos
que preocuparnos de un medio variable del tiempo. Como se sugirió
anteriormente, no queremos sobrediferenciar los datos e intentar modelar
la secuencia {Δ s t }.
2. El ACF no corta a cero para que podamos descartar un proceso MA
( q ) puro .
3. El ACF no es realmente sugestivo de un puro AR (1) en el proceso de la
decadencia no parece ser geométrica. El valor de ρ 1 es 0,890 y los valores
de ρ 2 , ρ 3 y ρ 4 son 0,741, 0,616 y 0,481, respectivamente.
4. Los valores estimados del PACF son tales que 11 = 0,890 y 22 = -
0,245. Aunque 33 y 55 están cerca de cero, 44 = -0.184, 66 = -0.202 y 77 =
0.150. Recordemos que bajo la hipótesis nula de un AR puro ( p modelo), la
varianza de p + i, p + i es aproximadamente igual a 1 / T . Puesto que hay 193
observaciones totales, los valores de 22 , 44 , 66 y 77son más de dos
desviaciones estándar de cero. En un modelo AR ( p ) puro , el PACF corta a
cero después del retrasopág . Por lo tanto, si la s t serie sigue una pura AR
( p proceso), el valor de p puede ser tan alto como seis o siete.
5. Parece haber un patrón oscilante en el PACF en que los siete primeros
valores alternan en signo. El decaimiento oscilante del PACF es
característico de un coeficiente de MA positivo.
Debido al número de coeficientes pequeños y marginalmente significativos, el ACF
y el PACF del spread son probablemente más ambiguos que la mayoría de los que
se encontrarán. Por lo tanto, supongamos que usted no sabe por dónde empezar y
estimar las series s t usando un modelo AR ( p ) puro . Para ilustrar el punto, si
estima que toda la serie s t como un proceso AR (7) debe obtener las estimaciones
mostradas en la columna 2 de la Tabla 2.4 . Si usted examina la tabla, usted
encontrará que todo el t-estadísticas superiores a 1,96 en valor absoluto (lo que
indica que los coeficientes son significativos en el nivel del 5 por ciento). La suma
de los residuos cuadrados (SSR) es 48.745 y la AIC y la SBC son 738.906 y 764.712,
respectivamente. Los niveles de significación de los estadísticos Q para los retardos
4, 8 y 12 indican que no hay autocorrelación restante en los residuos.
Aunque el modelo AR (7) tiene algunos atributos deseables, otros modelos puros
AR ( p ) podrían funcionar tan bien como el AR (7). 7 Supongamos que probamos
un modelo muy parsimonioso y estimamos un AR (2). Como se puede ver en la
tercera columna de la tabla, la AIC selecciona el modelo AR (7), pero SBC
selecciona el modelo AR (2). Sin embargo, las autocorrelaciones residuales de la AR
(2) son problemáticas en que

Las estadísticas Q del modelo AR (2) indican una autocorrelación significativa en


los residuos. Si examinó cuidadosamente el AR (7), podría haber notado
que un 3 casi compensa un 4 y que un 5 casi compensa un 6 (ya que un 3 + un 4 ≈ 0
y un 5 + un 6 ≈ 0). Si reestimamos el modelo sin s t -3 , s t -4 , s t -5 , y s t- 6, debe obtener
los resultados mostrados en la columna 4 de la Tabla 2.4 . Dado que el coeficiente
para s t- 7 es ahora estadísticamente insignificante, puede parecer preferible usar el
AR (2) en lugar del modelo con los retornos 1, 2 y 7.
A pesar de que el modelo AR (7) funciona muy bien, no es necesariamente el mejor
modelo de pronóstico. Existen varias alternativas posibles, ya que los patrones de
la ACF y PACF no están inmediatamente claros. En las columnas 5, 6 y 7 de
la Tabla 2.4 se muestran los resultados de varios modelos con términos MA :
1. De la ACF en descomposición alguien podría tratar de estimar el modelo
ARMA (1, 1) reportado en la columna 5 de la tabla. El valor estimado
de a 1 (0.817) es estadísticamente diferente de cero y es casi cuatro
desviaciones estándar de la unidad. El valor estimado de β 1 (0,368) es
estadísticamente diferente de cero yimplica que el proceso es invertible. Sin
embargo, la especificación ARMA (1, 1) es inadecuada. El Ljung-Box Q -
statistic para 4 retrasos de los residuos es igual a 6.598. Como tal, no
podemos rechazar el nulo que Q (4) = 0 en cualquier nivel de significación
convencional. Sin embargo, las estadísticas Q (8) y Q (12) indican que los
residuos de este modelo presentan una autocorrelación seriada
sustancial. Como tal, debemos eliminar el modelo ARMA (1, 1) de la
consideración.

Cuadro 2.4 Estimaciones del diferencial de tasas de interés

Notas :
Para asegurar la comparabilidad, se estimó cada ecuación durante el período
1961Q4-2008Q1.

Los valores entre paréntesis son los estadísticos t para la hipótesis nula de
que el coeficiente estimado es igual a cero. SSR es la suma de los residuos
cuadrados. Q ( n ) son el Ljung-Box Q- estadística de las autocorrelaciones
residuales.

Para los modelos ARMA, muchos paquetes de software realmente no


informan el término de intercepción a 0 . En su lugar, theyreport la media
estimada del proceso de mu y junto con la t -estadística para la hipótesis nula
de que mu y = 0. La razón histórica de esta convención es que era más fácil
de degradar primero los datos y luego estimar los coeficientes ARMA que a
estimar todos los valores en un solo paso. Si su paquete de software informa
un término equivalente aproximadamente a 1,39, informa de la media
estimada.
2. Puesto que el ACF se desintegra y el PACF parece oscilar comenzando con el
retraso 2 ( 22 = -0.245), parece plausible estimar un modelo ARMA (2,
1). Como se muestra en la columna 6 de la tabla, el modelo es una mejora
respecto a la especificación ARMA (1, 1). Los coeficientes estimados ( a 1 =
0,444 y a 2 = 0,350) son cada uno significativamente diferentes de cero a
niveles convencionales e implican raíces características en el círculo
unitario. La AIC selecciona el modelo ARMA (2, 1) aunque el SBC selecciona
el modelo ARMA (1, 1). Los valores de Q (4) y Q (8) indican que las
autocorrelaciones de los residuos no son estadísticamente significativas al
nivel de 10 por ciento. Desde la Q(12) estadística es sólo significativa en el
nivel de 5 por ciento, hay cierta autocorrelación residual en los desfases más
largos. Considere el ACF de los residuos:

3. Con el fin de dar cuenta de la correlación en serie con el retraso 7, podría


parecer plausible agregar un término MA al modelo con el retraso 7.
Nuevamente, todos los coeficientes estimados son de alta calidad. Obsérvese
que el coeficiente de β 7 tiene una estadística t de -3,77. Los valores
estimados de a 1 y a 2 son similares a los del modelo ARMA (2, 1). Ahora,
el Q-estadísticas indican que las autocorrelaciones de los residuos no son
significativas a nivel convencional. La suma de los residuos cuadrados (SSR)
es menor que la de cualquiera de los otros modelos, excepto la AR
(7). Además, tanto la AIC como la SBC seleccionan la especificación ARMA
(2, (1, 7)) sobre cualquiera de los otros modelos. Puede verificar fácilmente
que el coeficiente de MA en el intervalo 7 proporciona un mejor ajuste que
un coeficiente de AR en el retraso 7.
Aunque el AR (7) y ARMA (2, (1, 7)) parecen ser adecuados, otros investigadores
podrían haber seleccionado un modelo decididamente diferente. Considere algunas
de las alternativas que se enumeran a continuación.
1. Parsimony versus Overfitting : En la sección 7 anterior, examinamos la
cuestión de ajustar un coeficiente de MA en el desfase 16 a un verdadero
proceso AR (2). Si se vuelve a examinar el ejemplo, se puede entender por
qué algunos investigadores se alejan de la estimación de un modelo con
largas longitudes de retraso que están desunidos de los de otros períodos. En
el ejemplo de la propagación, el problema con el modelo ARMA (2, 1) es que
había una pequeña cantidad de autocorrelación residual en el retraso 7 y
el estadístico Q (12) indicaba la posibilidad de correlación serial en los
retardos más largos. La adición del coeficiente de MA al retraso 7 remediado
produjo un modelo con un mejor ajuste y remedió el problema de
correlación serial. Sin embargo, ¿es realmente plausible que έ t -7tiene un
efecto directo sobre el valor actual del diferencial de tasas de interés,
mientras que los retrasos 3, 4, 5 y 6 no tienen efectos directos? En otras
palabras, ¿funcionan los mercados de valores de tal manera que lo que pasa
siete trimestres en el pasado tiene un efecto mayor en las tasas de interés de
hoy que en los acontecimientos ocurridos en el pasado más reciente? Por
otra parte, como se puede verificar mediante la estimación de la ARMA (2,
(1, 7)) modelo, la t -estadística para β 7 sobre el 1982 Q 1-2008 Q período de
1 es igual a 0.994 y no es estadísticamente significativa. Obsérvese que el
Panel (b) de la Figura 2.5 sugiere que la volatilidad de la propagación a fines
de los años setenta y principios de los ochenta no estípico de toda la
muestra. Podría ser el caso de que las realizaciones de este período son
anomalías que tienen grandes efectos sobre las estimaciones de los
coeficientes y sus errores estándar. Por lo tanto, aunque la AIC y la SBC
seleccionan el modelo ARMA (2, (1, 7)) sobre el modelo ARMA (2, 1),
algunos investigadores preferirían este último.
En términos más generales, la sobreequipación se refiere a una situación en la que
una ecuación se ajusta a algunas de las idiosincrasias presentes en una muestra
particular que no son realmente representativas del proceso generador de datos. En
trabajos aplicados, ningún conjunto de datos se corresponderá perfectamente con
cada supuesto requerido para la metodología Box-Jenkins. Puesto que no siempre
está claro qué características de la muestra están realmente presentes en el proceso
generador de datos, el intento de expandir un modelo para capturar todas las
características de los datos puede conducir a un sobreensado.
2. Volatilidad : Dada la volatilidad de la serie { s t } durante el final de los
años setenta y principios de los ochenta, la transformación del spread
mediante algún tipo de raíz cuadrada o transformación logarítmica podría
ser apropiada. Por otra parte, la s t serie tiene un número de saltos afilados
que indican que la hipótesis de la normalidad podría ser violado. Para una
constante c tal que s t + c es siempre positiva, transformaciones tales como
ln ( s t + c ) o ( s t + c ) 0,5 producen series con menos volatilidad que la s tserie
en sí. Alternativamente, es posible modelar la diferencia entre el logaritmo
de la tasa de 10 años y el logaritmo de la tasa de 3 meses.
Una clase general de transformaciones fue propuesta por Box y Cox
(1964). Supongamos que todos los valores de { y t } son positivos de manera que es
posible construir la secuencia transformada como
La práctica común es transformar los datos usando un valor preseleccionado
de λ . La selección de un valor para λ cercano a cero actúa para "suavizar" la
secuencia. Se puede ajustar un modelo ARMA a los datos transformados. Aunque
algunos programas de software tienen la capacidad de estimar simultáneamente
junto con los otros parámetros del modelo ARMA, este enfoque ha caído de
moda. En cambio, es posible modelar realmente la varianza usando los métodos
discutidos en el Capítulo 3 .
3. Tendencias : Supongamos que el lapso de los datos hubiera sido algo
diferente en que la primera observación fue para 1973 Q 1 y la última fue
para 2004 Q 4. Si usted examina el Panel (a) de la Figura 2.4 , puede ver que
alguien puede ser confundido y creen que los datos contenían una tendencia
al alza. Su mala interpretación de los datos podría ser reforzada por el hecho
de que la ACF converge a cero más bien lentamente. Como tal, podrían
haber estimado un modelo de la serie Δ s t . Otros podrían haber detrended
los datos usando una tendencia determinista del tiempo.

PREVISIONES FUERA DE MUESTRA


Podemos evaluar el rendimiento de predicción de los modelos AR (7) y ARMA (2,
(1, 7)) examinando sus errores de predicción de sesgo y cuadrado medio. Dado que
el conjunto de datos contiene un total de 186 observaciones utilizables, es posible
utilizar un período de retención de50 observaciones. De esta manera, hay al menos
136 observaciones en cada uno de los modelos estimados y un número adecuado de
pronósticos fuera de la muestra. En primer lugar, se estimaron los dos modelos
utilizando todas las observaciones disponibles hasta 1995 Q 3 y se obtuvieron los
dos pronósticos de un paso adelante. El valor real de s 1995Q 4 = 0,62333; el AR (7)
predijo un valor de 0,80667 y el modelo ARMA (2, (1, 7)) predijo un valor de
1,07524. Por lo tanto, la previsión de la ARMA (7) es superior a la de ARMA (2, (1,
7)) para este primer período. Se obtuvieron 49 pronósticos adicionales para los
períodos 1996 Q 1 a 2008 Q 1. Sea e 1 t los errores de predicción del modelo AR (7)
ye 2 t denotan los errores de predicción del modelo ARMA (2, (1, 7)). La media
de e 1 t es -0,017824, la media de e 2 t es -0,002352, y las varianzas estimadas son var
( e 1 ) = 0,212819 y var ( e 2 ) = 0,201455. Como tal, hay una ventaja en el
rendimiento de pronóstico del ARMA (2, (1, 7)) en que tiene el sesgo más pequeño
y MSPE.
Para verificar si estas diferencias son estadísticamente significativas, primero
verificamos el sesgo. Sea f 1 t los 50 pronósticos del modelo AR (7) yf 2 t los 50
pronósticos del modelo ARMA (2, (1, 7)). Comenzando con t = 1995 Q 4, podemos
estimar las dos ecuaciones de regresión:

Para el modelo AR (7), la estadística F para la restricción de que el intercepto es


igual a cero y la pendiente es igual a unidad es 0.060 con nivel de significación de
0.942. Es evidente que la restricción de las previsiones no sesgadas no parece
vinculante. Para el modelo ARMA (2, (1, 7)), el estadístico F es 0,021 con un nivel
de significancia de 0,979. Por lo tanto, hay una fuerte evidencia de que ambos
modelos tienen previsiones imparciales.
A continuación, considere la prueba de Granger-Newbold para los errores de
predicción cuadrática media iguales. Formar
las series x i y z i como x i = e 1 i + e 2 i y z i = e 1 i - e 2 i . El coeficiente de correlación
entre x i y z i es r xz = 0.117181. Dado que hay 50 observaciones en el período de
retención, forman la estadística Granger-Newbold

Con 49 grados de libertad, un valor de t = 0.82595 no es estadísticamente


significativo. Podemos concluir que el rendimiento de pronóstico del AR (7) no es
estadísticamente diferente del ARMA (2, (1, 7)).
Puesto que las series e 1 i y e 2 i contienen sólo una baja correlación serial, obtenemos
virtualmente la misma respuesta usando el estadístico DM. A menudo, los
meteorólogos están preocupados por el MSPE. Sin embargo, hay muchas otras
posibilidades. En el ejercicio 12 al final de este capítulo, se le pedirá que utilice el
error absoluto medio. Ahora, para ilustrar el uso de la prueba de DM, supongamos
que el costo de un error de pronóstico aumenta muy rápidamente en el tamaño del
error. En tales circunstancias, la función de pérdida podría ser mejor representada
por el error de predicción elevado a la cuarta potencia. Por lo tanto,

El valor medio de la secuencia { d i } de (2.63) (es decir, ) es 0.025196 y la


varianza estimada es 0.011913. Puesto que H = 50, podemos formar el estadístico
de DM

La hipótesis nula es que los modelos tienen exactitud de predicción igual y la


hipótesis alternativa es que los errores de pronóstico de la AR (2, (1, 7)) son más
pequeños. Con 49 grados de libertad, el valor t de 1.61592 es significativo al nivel de
5.637%. Por lo tanto, sólo hay evidencia leve a favor del modelo AR (2, (1, 7)). Si
hay correlación serial en la serie { d t }, necesitamos usar la especificación
en (2.63) . Con este fin, queremos seleccionar los valores estadísticamente
significativos de γ q . Las autocorrelaciones de d t son

Aunque ρ 5 es grande, muchos econometristas aplicados lo descartarían como


espurio. No parece plausible que las correlaciones para ρ 1 y ρ 2 sean realmente muy
cercanas a cero mientras que la correlación entre d t y d t -5 es muy grande. Además,
las estadísticas de Ljung-Box Q (4), Q (8) y Q (12) no indican que las
autocorrelaciones sean significativas. Respectivamente, los niveles de significación
son 0.869, 0.237 y 0.484. Sin embargo, si usted estima la variación a largo plazo
usando (2.63)con 5 retrasos, debe encontrar que DM = 1.18971 (para que los
MSPE no son estadísticamente diferentes unos de otros). El ejemplo subraya el
punto anterior que no hay una respuesta clara en cuanto a la mejor manera de
medir la variación a largo plazo de la presencia de correlación en serie. El
resultado más general es que los dos modelos no son sustancialmente diferentes el
uno del otro. Ambos deben proporcionar pronósticos razonables.

11. TEMPORADA
Muchos procesos económicos exhiben alguna forma de estacionalidad. Los sectores
agrícola, de la construcción y de los viajes tienen patrones estacionales obvios que
resultan de su dependencia del tiempo. Del mismo modo, la temporada de
vacaciones de Acción de Gracias a Navidad tiene una influencia pronunciada en el
comercio minorista. De hecho, la variación estacional de una serie puede explicar la
preponderancia de su varianza total. Las previsiones que ignoran los patrones
estacionales importantes tendrán una alta varianza.
Demasiadas personas caen en la trampa de ignorar la estacionalidad si están
trabajando con datos desestacionalizados o ajustados
estacionalmente . Supongamos que usted recoge un conjunto de datos que la
Oficina del Censo de los Estados Unidos ha "ajustado estacionalmente" usando su
método X-11 o X-12. 8En principio, los datos estacionalmente ajustados deberían
tener el patrón estacional eliminado. Sin embargo, la precaución es
necesaria. Aunque un procedimiento estandarizado puede ser necesario para un
organismo gubernamental que reporte cientos de series, el procedimiento podría
no ser el mejor para un individuo que quiera modelar una sola serie. Incluso si
utiliza datos desestacionalizados, puede que se mantenga un patrón
estacional. Esto es particularmente cierto si no utiliza toda la gama de datos; la
porción de los datos utilizados en su estudio puede mostrar más (o menos)
estacionalidad que la duración total. Hay otra razón importante para preocuparse
por la estacionalidad cuando se usan datos desestacionalizados. Implícito en
cualquier método de ajuste estacional es un procedimiento de dos pasos. En primer
lugar, se elimina la estacionalidad y, en segundo lugar, se calculan los coeficientes
autorregresivos y de media móvil utilizandoBox-Jenkins técnicas. Como se observó
en Bell y Hillmer (1984), a menudo los coeficientes estacionales y ARMA se
identifican mejor y se estiman conjuntamente. En tales circunstancias, es
aconsejable evitar el uso de datos desestacionalizados.

MODELOS DE DATOS ESTACIONALES


La técnica de Box-Jenkins para modelar datos estacionales es sólo un poco
diferente de la de datos no estacionales. El giro introducido por datos estacionales
de período s es que los coeficientes estacionales de la ACF y PACF aparecen en los
retardos s , 2 s , 3 s , ..., en lugar de en los retardos 1, 2, 3, .... Por ejemplo, dos
modelos puramente estacionales para los datos trimestrales podrían ser

Puede fácilmente convencerse de que el correlograma teórico de (2.64) es tal


que ρ i = ( a 4 ) i/ 4 si i / 4 es un entero y ρ i = 0 en caso contrario; por lo tanto, la ACF
presenta desintegración en los retornos 4, 8, 12, .... Para el modelo (2.65) , el ACF
exhibe una sola punta en el retardo 4 y todas las otras correlaciones son cero.
En la práctica, la identificación se complicará por el hecho de que el patrón
estacional interactuará con el patrón no estacional en los datos. El ACF y PACF
para un proceso combinado estacional / no estacional reflejarán ambos
elementos. Tenga en cuenta que con los datos trimestrales, un término MA
estacional puede tener la forma

Alternativamente, un coeficiente autorregresivo en el retraso 4 podría haber sido


utilizado para capturar la estacionalidad

Ambos métodos tratan aditivamente los coeficientes estacionales; se añade un AR o


un coeficiente MA en el período estacional. La estacionalidad
multiplicativa permite la interacción del ARMA y los efectos
estacionales. Consideremos las especificaciones multiplicativas

La ecuación (2.67) difiere de (2.66) en que permite que el término de media móvil
en el retraso 1 interactúe con el efecto de media móvil estacional en el retraso 4. De
la misma manera, (2.68) permite que el término autorregresivo en el retardo 1
interactúan con el efecto autorregresivo estacional al retraso 4. Muchos
investigadores prefieren la forma multiplicativa ya que un rico patrón de
interacción puede ser capturado con un pequeño número de
coeficientes. Reescribir (2.67) as

La estimación de sólo tres coeficientes (es decir, a 1 , β 1 y β 4 ) nos permite capturar


los efectos de un término autorregresivo y los efectos de términos de media móvil
en los retornos 1, 4,y 5. Por supuesto, usted realmente no consigue algo para
nada. Las estimaciones de los tres coeficientes de la media móvil están
interrelacionadas. Un investigador que estima el modelo no restringido y t = a 1 y t -
1 + έ t + β 1 έ t -1 + β 4 έ t -4 + β 5 έ t -5 obtendría necesariamente una suma residual menor

de cuadrados. Sin embargo, (2,67) es claramente el modelo más parsimonioso. Si el


valor sin restricción de β 5aproxima el producto β 1 β 4 , el modelo multiplicativo
será preferible. Por esta razón, la mayoría de los paquetes de software tienen
rutinas capaces de estimar modelos multiplicativos. De lo contrario, no hay
motivos teóricos que nos lleven a preferir una forma de estacionalidad sobre
otra. Como se ilustra en la última sección, las pruebas de experimentación y
diagnóstico son probablemente la mejor manera de obtener el modelo más
apropiado.

DIFERENCIA ESTACIONAL
La temporada de compras de Navidad se acompaña de un número inusualmente
grande de transacciones, y la Reserva Federal amplía la oferta de dinero para dar
cabida a la creciente demanda de dinero. Como muestra la línea discontinua en
la Figura 2.7 , la oferta monetaria de Estados Unidos, medida por M1, tiene una
tendencia decididamente ascendente. La serie, llamada M1NSA, está contenida en
el archivo QUARTERLY.XLS. Puede utilizar los datos para seguir junto con la
discusión a continuación. El cambio logarítmico, mostrado por la línea continua,
parece ser estacionario. Sin embargo, hay un patrón estacional claro en que el valor
del cuarto trimestre para cualquier año es sustancialmente más alto que el de los
trimestres adyacentes.
Esta combinación de fuerte estacionalidad y no estacionabilidad se encuentra a
menudo en datos económicos. La ACF para un proceso con fuerte estacionalidad es
similar a la de un proceso no estacional; la diferencia principal es que los picos a los
retrasos s , 2 s , 3 s , ... no presentan decaimiento rápido. Sabemos que es necesario
diferenciar (o tomar el cambio logarítmico de) un proceso no estacionario. De
manera similar, si las autocorrelacioneslos retrasos no se deterioran, es necesario
tomar la diferencia estacional para que las otras autocorrelaciones no sean
empequeñecidas por los efectos estacionales. El ACF y PACF para la tasa de
crecimiento de M1 se muestran en el Panel (a) de la Figura 2.8 . Por ahora, solo
enfóquese en las autocorrelaciones en los retrasos estacionales. Todas las
autocorrelaciones estacionales son grandes y no muestran tendencia a decaer. En
particular, ρ 4 = 0,65, ρ 8 = 0,53, ρ 12 = 0,43, ρ 16 = 0,41, ρ 20 = 0,46 y ρ 24= 0,49. Estas
grandes autocorrelaciones reflejan el hecho de que el cambio en M1 de una
temporada de Navidad a la siguiente no es tan pronunciado como el cambio entre
el cuarto trimestre y otros trimestres.

FIGURA 2.7 El nivel y la tasa de crecimiento de M1


FIGURA 2.8 ACF y PACF

El primer paso en el método Box-Jenkins es transformar los datos para hacerlo


estacionario. Como tal, una transformación logarítmica es útil porque puede
enderezar la tendencia no lineal en M1. Vamos y t denota el logaritmo de la
M1. Como se mencionó anteriormente, la primera diferencia de la secuencia { y t },
ilustrada por la línea continua de la figura 2.7 , parece ser estacionaria. Sin
embargo, para eliminar la fuerte persistencia estacional en los datos, necesitamos
tomar la diferencia estacional. Para los datos trimestrales, la diferencia estacional
es y t - y t +4 . Dado que el orden de diferenciación es irrelevante, podemos formar la
secuencia transformada

Así, utilizamos la diferencia estacional de la primera diferencia. El ACF y PACF


para la secuencia { m t } se muestran en el Panel (b) de la Figura 2.8 ; las
propiedades de esta serie son mucho más susceptibles a la metodología de Box-
Jenkins. La autocorrelación y autocorrelaciones parciales de los primeros retrasos
son muy sugerentes de un proceso AR (1) ( ρ 1 = 11 = 0,37, ρ 2 = 0,12 y 22 =
0,01). Recordemos que la ACFEl proceso AR (1) se decaerá y el PACF se reducirá a
cero después del retardo 1. Dado que ρ 4 = -0,34, ρ 5 = 0,01, 44 = -0,36, y 55 =
0,34, hay evidencia de estacionalidad restante en el { m t } secuencia. El término
estacional es más probable que esté en forma de un coeficiente de MA, ya que la
autocorrelación corta a cero, mientras que el PACF no. Sin embargo, lo mejor es
estimar varios modelos similares y luego seleccionar los mejores. Las estimaciones
de los tres modelos siguientes se presentan en la Tabla 2.5 :

Cuadro 2.5 Tres modelos de crecimiento monetario


Para asegurar la comparabilidad, los tres modelos se estiman durante el período
1962Q3-2008Q2. Las intercepciones estimadas no se informan ya que todas eran
insignificantemente diferentes de cero. Las cifras entre paréntesis que siguen las
estadísticas Q son niveles de significación.

Las estimaciones puntuales de los coeficientes implican la estacionariedad y la


invertibilidad. Además, a excepción de las intercepciones, todas son por lo menos
seis desviaciones estándar de cero. Sin embargo, las estadísticas de diagnóstico
sugieren que el Modelo 1 es el preferido. El modelo 1 tiene el mejor ajuste en que
tiene la suma más baja de los residuos cuadrados (SSR), AIC y SBC. Además,
los estadísticos Q para los retardos 4, 8 y 12 indican que las autocorrelaciones
residuales son insignificantes. Por el contrario, las correlaciones residuales para el
Modelo 2 son significativas a los largos retrasos [es decir, Q (8) y Q(12) son
significativos a los niveles 0,002 y 0,001]. Esto se debe a que el término
autorregresivo estacional multiplicativo (SAR) no captura adecuadamente el patrón
estacional. Un término SAR implica una desintegración autorregresiva desde el
período s al período s + 1. En el Panel (b) de la Figura 2.8 , el valor de ρ 4 es -0,34
pero ρ 5 es casi cero. Como tal, una media móvil estacional multiplicativa(SMA)
plazo podría ser más apropiado. El modelo 3 captura adecuadamente el patrón
estacional, pero el término MA (1) no captura la decaimiento autorregresivo
presente en los retrasos cortos. Otros métodos diagnósticos, incluyendo la división
de la muestra, sugieren que el Modelo 1 es apropiado.
FIGURA 2.9 Pronósticos de M1

Las previsiones fuera de la muestra se muestran en la Figura 2.9 . Para crear los
pronósticos de uno a doce pasos, se estimó el Modelo 1 durante todo el período de
muestreo 1961 Q 3-2008 Q 2. El modelo estimado es

Dado que m 2008 Q 2 = 4.092 × 10 -4 = y el residual para 2007 Q 3 fue -0.01231 (es
decir, = -0.01231), la previsión de m 2008 Q 3 es -0.00951. Ahora, utilice esta
previsión y el valor de pronosticar m 2008 Q 4 . Puede continuar de esta manera
para obtener los pronósticos fuera de la muestra para la secuencia { m t }. A pesar
de que no tiene los residuos para períodos posteriores a 2008 Q 2, simplemente
puede utilizar sus valores pronosticados de cero. El truco para pronosticar valores
futuros de M1 desde la { m t} es sumar los cambios y los cambios estacionales para
obtener el logaritmo de los valores pronosticados de M1. Como m t = (1 - L ) (1 - L 4 )
ln (M1 t ), se deduce que el valor de ln (M1 t ) puede obtenerse de m t + ln (M1 t -1 ) +
ln t _ { 4} ) - ln (M _ {1} t _ { 5} ). Los primeros 12 de los valores pronosticados se
representan en la Figura 2.9 .
Los procedimientos ilustrados en este ejemplo con datos altamente estacionales
son típicos de muchas otras series. Con datos altamente estacionales es necesario
complementar el método Box-Jenkins:
1. En la etapa de identificación, por lo general es necesario hacer una
diferencia estacional de los datos y verificar la ACF de la serie resultante. A
menudo, los datos estacionalmente diferenciados no serán estacionarios. En
tales casos, los datos también pueden necesitar ser diferenciados primero.
2. Utilice el ACF y el PACF para identificar modelos potenciales. Trate de
estimar los modelos con bajo orden de los coeficientes no estacionales
ARMA. Consideremos la estacionalidad aditiva y multiplicativa. Permitir
que la forma apropiada de estacionalidad sea determinada por las diversas
estadísticas de diagnóstico.
Se ha desarrollado una notación compacta que permite la representación eficiente
de modelos intrincados. Como en secciones anteriores, la d ª diferencia de una
serie se denota por Δ d . Por lo tanto,

Una diferencia estacional se denomina Δ s donde s es el período de los


datos. La D esta diferencia estacional es . Por ejemplo, si queremos la segunda
diferencia estacional de una serie mensual, podemos formar

Combinando los dos tipos de rendimientos de diferenciación Δ d . Los modelos


multiplicativos se escriben en la forma ARIMA ( p , d , q ) ( P , D , Q ) s
donde : p y q = los coeficientes ARMA no estacionales
d = número de diferencias no estacionales
P = número de coeficientes autorregresivos multiplicativos
D = número de diferencias estacionales
Q = número de coeficientes de media móvil multiplicativa
s = período estacional
Usando esta notación, podemos decir que la ecuación ajustada para m t = ΔΔ 4 ln
(M1 t ) es un modelo de ARIMA (1, 1, 0) (0, 1, 1) s . En trabajos aplicados, los
modelos ARIMA (1, 1, 0) (0, 1, 1) s y ARIMA (0, 1, 1) (0, 1, 1) s ocurren
rutinariamente; el último se llama el modelo de la línea aérea desde que Box y
Jenkins (1976) utilizaron este modelo para analizar datos del recorrido de la línea
aérea.

12. INSTABILIDAD DE LOS PARÁMETROS Y CAMBIO


ESTRUCTURAL
Un supuesto clave de la metodología de Box-Jenkins es que la estructura del
proceso generador de datos no cambia. Como tal, los valores de a i y β i deben ser
constantes de un período a otro. Sin embargo, en algunas circunstancias, puede
haber razones para sospechar una ruptura estructural en el proceso generador de
datos. Por ejemplo, en un modelo de crecimiento del PIB, parece natural
preguntarse si los choques de los precios del petróleo de 1973, los acontecimientos
que rodearon la tragedia del 11 de septiembre y / o la crisis financiera de 2008
tuvieron impactos significativos en los coeficientes. Por supuesto, la inestabilidad
de los parámetros no tiene que resultar de un solo evento discreto. La reciente
evidencia sobre el cambio climáticosugiere que las series sensibles al clima, tales
como los rendimientos de los cultivos, las precipitaciones y el número de días de
esquí en Snowmass, probablemente se verán afectados de manera sostenida, pero
gradual.
PRUEBAS DE CAMBIO ESTRUCTURAL
Si tiene motivos para sospechar una ruptura estructural en una fecha determinada,
es fácil usar una prueba de Chow. La esencia de la prueba Chow es ajustar el mismo
modelo ARMA a los datos de pre-ruptura ya los datos posteriores a la ruptura. Si
los dos modelos no son suficientemente diferentes, se puede concluir que no ha
habido ningún cambio estructural en el proceso generador de datos.
En general, supongamos que estimó un modelo ARMA ( p , q ) usando un tamaño
de muestra de las observaciones T. Denota la suma de los residuos cuadrados como
SSR. Suponga también que tiene razones para sospechar una ruptura estructural
inmediatamente después de la fecha t m . Puede realizar una prueba de Chow
dividiendo las observaciones T en dos submuestras con t m observaciones en la
primera y t n = T - t m observaciones en la segunda. Utilice cada submuestra para
estimar los dos modelos:

Sea la suma de los residuos cuadrados de cada modelo SSR 1 y SSR 2 ,


respectivamente. Para probar la restricción de que todos los coeficientes son
iguales [es decir, a 0 (1) = a 0 (2) y a 1(1) = a 1 (2) y ... a p (1) = a p (2) y β 1 (1) = β 1 (2)
y ... β q (1) = β q (2)], use una prueba F y la forma: 9

donde n = número de parámetros estimados ( n = p + q + 1 si se incluye un


intercepto y p + q de otro modo) y el número de grados de libertad ( n , T - 2 n ).
Intuitivamente, si la restricción no es vinculante (es decir, si los coeficientes son
iguales), la suma SSR 1 + SSR 2 debe ser igual a la suma de los cuadrados de los
residuos de toda la estimación de la muestra. Por lo tanto, F debe ser igual a
cero. Cuanto mayor sea el valor calculado de F , más restrictivo es el supuesto de
que los coeficientes son iguales.
Por supuesto, el método requiere que haya un número razonable de observaciones
en cada submuestra. Si t m o t n es muy pequeño, los coeficientes estimados tendrán
poca precisión. Un tipo alternativo de prueba de Chow es una variable dummy de
uso para detectar una ruptura en uno o más de los coeficientes. Por ejemplo, si se
sospecha una interrupción justo después del período t m , se puede crear una
variable ficticia, D t , tal que D t = 0 para todo t ≤ t m y D t = 1 para t > t m. Para
probar una ruptura en la intercepción de un modelo AR (1), por ejemplo,
compruebe la significación de D t en la regresión y t = a 0 + α 0 D t + a 1 y t -1 + έ t . Para
permitir una ruptura en ambos coeficientes, también crear la variable D t y t -1 y
estimar la ecuación de regresión y t = a 0 + α 0 D t + a 1 yt -1 + α 1 D t y t -1 + έ t . Puede
probar una ruptura examinando lasestadísti- cas t individualesde α 0 y α 1 y la F -
statistic para la hipótesis nula α 0 = α 1 = 0.
Vuelva al ejemplo del diferencial de tipos de interés examinado en la Sección
10 . Supongamos que hay razones para creer que se produjo una ruptura a fines de
1981 Q 4. Considere las estimaciones para los dos subperíodos:
y

Aunque los coeficientes de los modelos parecen ser diferentes, podemos probar
formalmente la igualdad de coeficientes usando (2.70) . Respectivamente, la suma
de cuadrados de residuos para las dos ecuaciones son SSR 1 = 27.564 y SSR 2 =
21.414. La estimación del modelo durante todo el período de la muestra da como
resultado SSR = 49.692. Dado que hay 191 observaciones utilizables en la
muestra yn = 5 (el intercepto más los cuatro coeficientes estimados), (2.70)
se convierte en

Con 5 grados de libertad en el numerador y 181 en el denominador, no podemos


rechazar el nulo de ningún cambio estructural en los coeficientes (es decir,
podemos aceptar la hipótesis de que no hay cambio estructural en los coeficientes).
Alternativamente, para probar sólo una ruptura en la intercepción, podemos crear
la variable ficticia D t igual a cero antes de 1982 Q 1 e igual a la unidad que
comienza en 1982 Q 1. Ahora, considere la ecuación para el spread estimado sobre
la totalidad 1960 Q 1-2008 Q 1 período:

Puesto que D t salta de 0 a 1 en 1982 Q 1, la estimación para la intercepción es 1,227


antes de 1982 Q 1 y 1,589 (= 1,277 + 0,312) a partir de 1982 Q 1. Sin embargo,
puesto que la estadística t para la hipótesis nula D t = 0 no puede ser rechazada, no
hay evidencia de una ruptura de intercepción significativa.

ROTURAS ENDÓGENAS
La prueba de Chow pregunta si hay un comienzo de ruptura en alguna fecha de
ruptura particular conocida t m . Una ruptura que ocurre en una fecha no pre-
especificada por el investigador se denomina una ruptura endógena para
denotar el hecho de que no fue el resultado de una fecha de ruptura fija como el 11
de septiembre. Para determinar si hay una interrupción en cualquier parte de la
muestra, puede realizar una prueba de Chow para cada fecha de ruptura
potencial t m . No debe sorprender que la fecha de ruptura que resulta en el mayor
valor de la F-statistic proporciona una estimación consistente de la fecha de
descanso real, si la hay. Con el fin de garantizar un adecuado número de
observaciones en cada una de las dos submuestras, es necesario tener un “recorte”
de tal manera que la ruptura no podría ocurrir antes de la primera t 0 observaciones
o después del último t - t 0 observaciones. En la investigación aplicada, es común
usar un valor de recorte del 10 por ciento para que haya al menos un 10 por ciento
de las observaciones en cada una de las dos submuestras. En ella tasa de interés se
extendió ejemplo, hay 191 observaciones utilizables en el 1960 Q 1-2008 Qperiodo 1
(ya que los dos primeros se pierden cuando se estima el coeficiente de s t -2 ). Si ha
utilizado un recorte del 10 por ciento, se puede comprobar si hay una rotura en
todo el intervalo de 1.965 Q 1-2003 Q 2 (cada uno de aproximadamente 19
observaciones desde el principio y el final de los datos
utilizables). Desafortunadamente, la búsqueda de la fecha de ruptura más probable
significa que el F- estadístico para la hipótesis nula de ninguna ruptura se
infla. Después de todo, acaba de buscar la fecha que lleva al valor máximo, o
supremum, de la muestra F -statistic. Como tal, la distribuciónF -statistic no es
estándar y no se puede obtener de un F -table tradicional . Andrews (1993) y
Andrews y Ploberger (1994) contienen valores críticos asintóticos para este tipo de
pruebas. Como se analizó en el capítulo 7 , Hansen (1997) muestra cómo obtener
los valores críticos apropiados usando métodos de
bootstrapping. Afortunadamente, una serie de paquetes de software puede realizar
fácilmente estas pruebas. 10

PARÁMETRO INESTABILIDAD
Observe que la prueba de Chow y sus variantes requieren que el investigador
especifique una fecha de interrupción particular y asuma que la ruptura se
manifiesta completamente en esa fecha. El intercepto, por ejemplo, es un 0 (1)
hasta t m y es precisamente un 0 (2) a partir de t m +1. Sin embargo, la suposición de
que una ruptura se produce exactamente en un momento dado puede no siempre
ser apropiada. Como se mencionó anteriormente, no hay una fecha concreta en la
que podamos decir que se ha producido un cambio climático significativo. Del
mismo modo, no está claro cómo podemos proporcionar una fecha específica de
descanso para denotar el advenimiento "desregulación financiera" en los mercados
de activos o para asignar una fecha específica para el desarrollo del
microordenador. Estos son procesos que han ido evolucionando con el
tiempo. Incluso si pudiéramos fechar el inicio preciso de la desregulación
financiera o la revolución informática, los efectos completos de estos cambios no
ocurrirían instantáneamente. Como tal, no debería sorprender que se hayan
desarrollado una serie de procedimientos que verifiquen la estabilidad de
parámetros sin la necesidad de identificar una fecha de interrupción
particular. Probablemente el método más simple es estimar el modelo
recursivamente. Por ejemplo, si tiene 150 observaciones, puede estimar el modelo
utilizando sólo las primeras, digamos 10, observaciones. Trazar los coeficientes
individuales y luego reestimar el modelo utilizando las primeras 11
observaciones. Puede seguir repitiendo este proceso hasta que utilice las 150
observaciones. En general, las parcelas de los coeficientes no serán planas ya que
los valores preliminares se estiman usando un número muy pequeño de
observaciones. Sin embargo, después de un período de "quemado", las gráficas de
tiempo de los coeficientes individuales pueden proporcionar evidencia de
estabilidad del coeficiente. Si la magnitud de un coeficiente de repente comienza a
cambiar, usted debe sospechar un cambio estructural en ese punto. Un cambio
sostenido en un coeficiente podría indicar un modelo de especificación
errónea. Una modificación particularmente útil de este procedimiento es trazar
cada coeficiente junto con su banda de desviación estándar estimada de 2. Las
bandas representan intervalos de confianza para los coeficientes estimados. De esta
manera, se puede ver si los coeficientes son siempre estadísticamente significativos
y si los coeficientes en los primeros períodos parecen ser estadísticamente
diferentes de los de los últimos períodos.
En cada paso a lo largo del camino, también es posible crear el error de pronóstico
de un paso adelante. Sea e t (1) el error de pronóstico de un paso adelante realizado
con todas las observaciones a través de t . En otras palabras, e t (1) es la diferencia
entre y t +1 y su predicción condicional de y t +1 (es decir, E t y t +1 ). Si empiezas con las
primeras 10 observaciones, el valor dee 10 (1) será y 11 - E 10 y 11 y el valor de e 149 (1)
será y 150 - E 149 y 150 . [Nota: si entiende la notación, debe quedar claro que no puede
crear el valor e 150 (1) ya que no tiene el valor de y 151.] Si su modelo se ajusta bien a
los datos, las previsiones deben ser imparciales de modo que la suma de estos
errores de pronóstico no debe ser "demasiado lejos" de cero. De hecho, Brown,
Durbin y Evans (1975) calculan si la suma acumulada de los errores de predicción
es estadísticamente diferente de cero. Para ser un poco más formal, defina

donde n denota la fecha del primer error de pronóstico que construyó, T denota la
fecha de la última observación en el conjunto de datos, y σ e es la desviación
estándar estimada de los errores de pronóstico. Con 150 observaciones totales ( T =
150), si inicia el procedimiento usando las 10 primeras observaciones ( n = 10), se
pueden crear 140 errores de pronóstico ( T- n ). Tenga en cuenta que α e se crea
utilizando todos los errores de pronóstico T - n . Comenzando con N = n , para
crear CUSUM 10, utilice las tres primeras observaciones para crear e 10 (1)
/ σ e . Ahora vamos a N = 11 y creamos CUSUM 11 como [ e 10 (1) + e 11 (1)] / σ e . Del
mismo modo, CUSUM T -1 = [ e 10 (1) + ... - e T -1 (1)] / σ e . Si utiliza el nivel de
significación del 5 por ciento, el valor de trazado de cada valor de CUSUM N debe
estar dentro de una banda de aproximadamente ± 0,948 [( T - n ) 0,5 + 2N - n ) ( T -
n ) - 0,5 ].

UN EJEMPLO DE UNA RUPTURA


Para ilustrar una serie de ruptura, el primer panel de la figura 2.10 de la página
siguiente muestra 150 observaciones de la serie simulada y t = 1 + 0.5 y t -
1 + έ t para t <101 yy t + 2.5 + 0.65 y t -1 - έ t para t ≥ 101. La serie está contenida en el

archivo Y-BREAK.XLS. Por supuesto, en el trabajo aplicado, la ruptura puede no


ser tan fácilmente evidente. Si ignora la ruptura y estima toda la serie como un
proceso AR (1), debe obtener:

Como se indica en los tres paneles restantes de la figura, el modelo estimado de AR


(1) está seriamente mal especificado. Respectivamente, los paneles (b) y (c)
muestran las estimaciones del término intercepto y el coeficiente AR (1) (junto con
sus (± 2 bandas de desviación estándar) resultantes de una estimación recursiva.
las primeras estimaciones usan un número muy pequeño de observaciones.Las
estimaciones parecen razonables hasta alrededor de t= 100. En este punto, las
estimaciones del intercepto disminuyen realmente mientras que las estimaciones
del coeficiente AR (1) aumentan (el inverso de lo que ocurre en el proceso
generador de datos). Nótese que las bandas de confianza para los últimos períodos
ni siquiera se superponen a las de los períodos medios. La sugerencia clara es que
ha habido un cambio estructural significativo. Los CUSUMs , mostrados en el Panel
(d), están claramente dentro del intervalo de confianza del 90 por ciento
para t <101. En este punto comienzan a desplazarse hacia arriba y se apartan de la
banda en t = 125. Como tal, la hipótesis del coeficiente estabilidad puede ser
rechazada.
Observe que los CUSUM s realmente no salen de la banda hasta tarde en la
muestra. Esto es indicativo del problema de que la prueba CUSUM puede no
detectar la inestabilidad de los coeficientes que ocurre tarde en el período de la
muestra. Además, la prueba puede no tener mucha potencia si hay múltiples
cambios con poco efecto general en el CUSUM . 11 Sin embargo, la prueba es una
herramienta de diagnóstico útil que no requiere el investigador para estipular la
naturaleza de especificación errónea del modelo. Es capaz de detectar modelos de
especificaciones erróneas de fuentes tan variadas, incluyendo rupturas
estructurales lisas, roturas múltiples, no linealidades descuidadas en el proceso
generador de datos o un modelo excesivamente parsimonioso.
FIGURA 2.10 Estimación recursiva del modelo

Si tuviera fuertes razones para creer que la ruptura ocurrió en el período 101,
podría formar una variable ficticia D t = 0 de t = 1 a 100 y D t = 1 a partir de
entonces. Para comprobar si hay un intervalo de intercepción,

Dado que el coeficiente de D t es muy significativo, se puede concluir que hubo una
interrupción en el intercepto. Para comprobar una ruptura en el coeficiente de
intersección y pendiente, también forma la variable D t y t -1 y estima:

En este caso particular, las variables dummy indican que hay una ruptura pero no
miden muy bien el tamaño de la ruptura. (Nota: La ruptura real en la intercepción
es +1,5 y la ruptura real en el coeficiente AR (1) es 0,15). El coeficiente para la
rotura de intersección no es significativo mientras que la ruptura en el coeficiente
de pendiente es altamente significativa. El F- estadístico para la hipótesis conjunta
que los coeficientes de D t y D t y t -1son iguales a cero es 29.568. Con 2 grados de
libertad en el numerador y 145 en el denominador, este valor es significativo a
cualquier nivel convencional. El punto importante es que se puede concluir que el
simple modelo AR (1) está mal especificado debido a una ruptura estructural.
Si desea estimar el valor más probable para t m , puede repetir la estimación para
cada período de tiempo en el intervalo 15 < t m <135. La suma de los cuadrados de
los residuos es menor para t m = 100. Aunque esta estimación consistente de la
fecha de la rotura resulta ser exactamente correcta, usted debe esperar una
discrepancia al usar datos reales.Obsérvese también que el test F (y
la estadística t de los coeficientes individuales) para la hipótesis nula de ningún
cambio estructural pueden ser probados usando el método de arranque de Hansen
(1997) (véase el capítulo 7 ).

13. RESUMEN Y CONCLUSIONES


El capítulo se centra en el enfoque de Box-Jenkins (1976) para la identificación,
estimación, verificación de diagnóstico y pronóstico de series de tiempo
univariadas. Los modelos ARMA pueden ser vistos como una clase especial de
ecuaciones de diferencia estocástica lineal. Por definición, un modelo ARMA es
covarianza-estacionario en el sentido de que tiene una media y covarianza finitas y
invariantes en el tiempo. Para que un modelo ARMA sea estacionario, las raíces
características de la ecuación de diferencias deben estar dentro del círculo
unitario. Además, el proceso debe haber comenzado infinitamente lejos en el
pasado o el proceso debe estar siempre en equilibrio.
En la etapa de identificación, se traza la serie y se examinan las autocorrelaciones
de la muestra y las correlaciones parciales. Una función de autocorrelación en
decadencia lenta sugiere un comportamiento no estacionario. En tales
circunstancias, Box y Jenkins recomiendan diferenciar los datos. Las pruebas
formales para la no estaciona- lidad se presentan en el Capítulo 4 . Una práctica
común es utilizar una transformación logarítmica o Box-Cox si la varianza no
parece ser constante. El capítulo 3 presenta algunas técnicas modernas que pueden
usarse para modelar la varianza.
Las autocorrelaciones de muestra y las correlaciones parciales de los datos
adecuadamente transformados se comparan con las de diversos procedimientos
ARMA teóricos. Todos los modelos plausibles son estimados y comparados usando
una batería de criterios diagnósticos. Un modelo bien estimado: (i) es
parsimonioso; (ii) tiene coeficientes que implican estacionariedad e
invertibilidad; (iii) se ajusta bien a los datos; (iv) tiene residuos que se aproximan a
un proceso de ruido blanco; (v) tiene coeficientes que no cambian durante el
período de muestreo; y (vi) tiene buenas previsiones fuera de la muestra.
Un cheque útil para la inestabilidad de coeficientes implica técnicas de estimación
recursiva. Un cambio repentino en las estimaciones recursivas de uno o más
coeficientes es indicativo de una ruptura estructural. La prueba de Chow puede
usarse para probar una ruptura en una fecha conocida y la prueba de Andrews y
Ploberger (1994) puede detectar una ruptura endógena. Bai y Perron (1998, 2003)
muestran cómo probar pausas endógenas múltiples. Se pueden detectar cambios
más graduales mediante estimación recursiva o mediante una prueba CUSUM .
Al utilizar la metodología de Box-Jenkins, usted se encontrará haciendo
muchas opciones aparentemente ad hoc . El modelo más parsimonioso puede no
tener el mejor ajuste, pero puede tener las mejores previsiones fuera de la
muestra. Usted se encontrará abordando los siguientes tipos de preguntas: ¿Cuál es
la transformación de datos más apropiada? ¿Es un modelo ARMA (2, 1) más
apropiado que una especificación ARMA (1, 2)? ¿Cómo se puede modelar mejor la
estacionalidad? ¿Qué se debe hacer con los coeficientes aparentemente
significativos con retrasos razonablemente largos? Dada esta latitud, muchos ven la
metodología Box-Jenkins como un arte más que como una ciencia. Sin embargo, la
técnica se aprende mejor a través de la experiencia. Los ejercicios al final de este
capítulo están diseñados para guiarle a través de los tipos de opciones que
encontrará en su propia investigación.

PREGUNTAS Y EJERCICIOS
1. En el ejemplo de cointossing de la Sección 1 , sus ganancias promedio en los
últimos cuatro lanzamientos ( w t ) pueden ser denotados por

1. Encuentra el valor esperado de sus ganancias. Encuentre el valor esperado


dado que έ t -3 = έ t -2 = 1.
2. Buscar var ( w t ). Encontrar var ( w t ) condicional en έ t -3 = έ t -2 = 1.
3. Encuentre cov ( w t , w t -1 ), cov ( w t , w t -2 ) y cov ( w t , w t -5 ).
2. Consideremos el proceso autorregresivo de segundo orden y t = a 0 + a 2 y t -
2 + έ t donde | a 2 | <1.

0. Encontrar:
1. E t -2 y t
2. E t -1 y t
3. E t y t +2
4. cov ( y t , y t -1 )
5. cov ( y t , y t -2 )
6. las autocorrelaciones parciales 11 y 22
1. Encuentra la función de respuesta al impulso. Dado y t -2 , trace los efectos de
un choque έ t en la secuencia { y t }.
2. Determine la función de pronóstico: E t y t + s . El error de predicción e t ( s ) es
la diferencia entre y t + s y E t y t + s . Deducir el correlograma de
la secuencia { e t ( s )}. ( Sugerencia : Encuentre E t E t ( s ), var [ e t ( s )],
y E t [ e t ( s ) e t ( s- j )] para j = 0 a s.)
3. Dos bolas diferentes se dibujan a partir de un tarro que contiene tres bolas
numeradas 1, 2 y 4. Sea x el número en la primera bola dibujada y y denote
la suma de las dos bolas dibujadas.
0. Hallar la distribución de probabilidad conjunta para x e y ; es decir,
encontrar prob ( x= 1, y = 3), prob ( x = 1, y = 5), ..., prob ( x = 4, y = 6).
1. Encuentre cada uno de los siguientes: E ( x ), E ( y ), E ( y | x = 1), E ( x | y =
5), var ( x| y = 5) y E ( y 2 ).
2. Consideremos las dos funciones w 1 = 3 x 2 y w 2 = x -1 . Hallar E ( w 1 + w 2 )
y E ( w 1+ w 2 | y = 3).
3. ¿Cómo cambiarían sus respuestas si las bolas fueran dibujadas con
reemplazo?
4. Sustituya (2.10) en y t = a 0 + a 1 y t -1 + έ t . Demuestre que la ecuación
resultante es una identidad.
0. Encuentre la solución homogénea en y t = a 0 + a 1 y t -1 + έ t .
1. Encuentre la solución particular dado que | a 1 | <1.
2. Muestre cómo obtener (2.10) combinando las soluciones homogéneas y
particulares.
5. La solución general a un n ecuación de diferencia th-orden
requiere n constantes arbitrarias. Considere la ecuación de segundo
orden y t = a 0 + 0.75 y t -1 - 0.125 y t -2 + έ t.
0. Encuentre las soluciones homogéneas y particulares. Discuta la forma de la
función de respuesta al impulso.
1. Encuentre los valores de las condiciones iniciales que aseguran que
la secuencia { y t } es estacionaria.
2. Dada su respuesta a la parte (b), obtenga el correlograma de
la secuencia { y t }.
6. Consideremos la ecuación de diferencia estocástica de segundo orden: y t =
1,5 y t -1 - 0,5 y t -2 + έ t .
0. Encuentre las raíces características de la ecuación homogénea.
1. Demostrar que las raíces de 1 - 1,5 L + 0,5 L 2 son los recíprocos de su
respuesta en la parte a.
2. Condiciones iniciales dadas para y 0 y y 1 , encuentra la solución para y t en
términos de los valores actuales y pasados de la { έ t secuencia}.
3. Encontrar la función de pronóstico para y T + s (es decir, encontrar la solución
para todos los valores de y T + s dados los valores de y T y y T -1 ).
4. Hallar Ey t , Ey t +1 , var ( y t ), var ( y t +1 ), y cov ( y t +1 , y t ).
7. A menudo hay varias representaciones para el mismo proceso de series de
tiempo. En el texto, la ecuación estándar para un modelo AR (1) está dada
por y t = a 0 + a 1 y t -1 + έ t .
0. Demuestre que una representación equivalente es y t = a 0 / (1 - a 1 )
+ μ t donde μ t = a 1 μ t -1 + έ t .
1. En el Capítulo 1 , se consideraron varios modelos con una tendencia
temporal determinista. Por ejemplo, una versión modificada de la ecuación
(1.62) es y t = a 0 + a 1 y t -1 + a 2 t + έ t donde | a 1 | <1. Explique por qué
la secuencia y t no es estacionaria. También explique por qué la secuencia y t es
estacionaria sobre la línea de tendencia a 0 + a 2 t . ¿Qué significa decir que
ely t secuencia es tendencia-estacionaria?
2. Verifxy que el proceso generado por y t = 16.2 + 0.2 t + μ t donde μ t =
0.95 μ t -1 + έ tes idéntico al proceso generado por y t = 1 + 0.95 y t -1 + 0.01 t + έ t .
3. Demuestre que el proceso estacionario de tendencia de primer
orden y t = a 0 + a 1 y t-1 + a 2 t + έ t donde | a 1 | <1 se puede escribir en la
forma y t = c 0 + c 1 t + μ t donde μ t = c 2 μ t -1 + έ t . Además, utilice el método de
coeficientes indeterminados para encontrar los valores dec _ { 0} , c _ { 1} y c _ { 2} .
8. El archivo titulado SIM_2.XLS contiene los conjuntos de datos simulados
utilizados en este capítulo. La primera serie, denominada Y1, contiene los
100 valores del proceso de AR (1) simulado utilizado en la Sección 7 . Utilice
esta serie para realizar las siguientes tareas ( Nota : Debido a diferencias en
el manejo de datos y el redondeo, sus respuestas sólo necesitan
aproximaciones a las presentadas aquí):
0. Trace la secuencia contra el tiempo. ¿La serie parece estar estacionaria?
1. Utilice los datos para verificar los resultados dados en la Tabla 2.2 .
2. Calcule la serie como un proceso AR (2) sin una intercepción. Usted debe
obtener:

Ljung-Box Q- Estadística: Q (8) = 5,13. Q (16) = 15,86. Q (24) = 21,02


3. Calcule la serie como un proceso ARMA (1, 1) sin una intercepción. Usted
debe obtener:
Verifique que el ACF y PACF de los residuos no indican ninguna
correlación serial.
9. La segunda columna del archivo SIM_2.XLS contiene los 100 valores del
proceso ARMA (1, 1) simulado utilizado en la Sección 7 . Esta serie se titula
Y2. Utilice esta serie para realizar las siguientes tareas ( Nota : Debido a
diferencias en el manejo de datos y el redondeo, sus respuestas sólo
necesitan aproximaciones a las presentadas aquí):
0. Trace la secuencia contra el tiempo. ¿La serie parece estar
estacionaria? Trazar el ACF.
1. Verifique los resultados en la Tabla 2.3 .
2. Estime el proceso usando un modelo MA puro (2). Usted debe obtener:

Compruebe que las estadísticas Q de Ljung-Box son Q (8) = 28,48, Q (16) =


37,47 y Q(24) = 38,84 con niveles de significación de 0,000, 0,000 y 0,015,
respectivamente.
3. Comparar el MA (2) con el ARMA (1, 1).
10. La tercera columna del archivo SIM_2.XLS contiene los 100 valores del
proceso AR (2) simulado utilizado en la Sección 7 . Esta serie se titula
Y3. Utilice esta serie para realizar las siguientes tareas ( Nota : Debido a
diferencias en el manejo de datos y el redondeo, sus respuestas sólo
necesitan aproximaciones a las presentadas aquí):
0. Trace la secuencia contra el tiempo. Verifique los coeficientes de ACF y
PACF reportados en la Sección 7 . Comparar la muestra ACF y PACF con las de un
proceso AR (2) teórico.
1. Calcule la serie como un proceso AR (1). Usted debe encontrar que el
estimado AR (1) y el coeficiente t -statistic son

Demuestre que los controles de diagnóstico estándar indican que este


modelo AR (1) es inadecuado. Asegúrese de realizar una estimación
recursiva del modelo AR (1) y de representar el CUSUM .
2. ¿Podría un proceso ARMA (1, 1) generar el tipo de muestra ACF y PACF que
se encuentra en la parte a? Calcule la serie como un proceso ARMA (1, 1). Usted
debe obtener:

Utilice las estadísticas de Ljung-Box Q para demostrar que el modelo


ARMA (1, 1) es inadecuado.
3. Estimar la serie como un proceso AR (2) para verificar los resultados
reportados en el texto.
11. El archivo CUARTERLY.XLS contiene una serie de series, incluyendo el
índice de producción industrial (indprod) de los Estados Unidos, la tasa de
desempleo (urate) y el índice de precios al productor de los productos
terminados (terminados). Todas las series se ejecutan a partir de 1960 Q 1 a
2008 Q 1.
0. Ejercicios con indprod.
0.Construir la tasa de crecimiento de la serie como y t = log (indprod t ) - log
(indprod t -1 ). Dado que las primeras autocorrelaciones sugieren un AR (1),
estimar y t = 0.0035 + 0.543 y t -1 + έ t (las estadísticas t son 3.50 y 9.02,
respectivamente).
1.Mostrar que la adición de un término MA en el retraso 8 mejora el ajuste y elimina
la correlación serial.
1. Ejercicios con urato.
0.Examine el ACF de la serie. Debe quedar claro que el ACF se desintegra lentamente
y que el PACF tiene un pico muy negativo al retraso 2.
1.Ignore temporalmente la necesidad de diferenciar la serie. Estima el urato como un
proceso AR (2) incluyendo una constante. Usted debe encontrar que a 1 + a 2 =
0.961.
2.Forme la diferencia como y t = urate t - urate t -1 . Demuestre que el
modelo y t = a 0 + a 1 y t -1 + β 4 έ t -4 + β 8 έ t -8 + έ t no muestra ninguna correlación
seriada restante y tiene un mejor ajuste que y t = a 0 + a 1 y t -1 + a 4 yt -4 + β 8 έ t -
8 + έ t o y t = a 0 + a 1 y t -1 + a 4 y t -4 + a 8 y t -8 + έ t .

2. Ejercicios con acabado.


0.Construir la tasa de crecimiento de la serie como y t = log (terminado t ) - log
(terminado t -1 ).
1.Demuestre que un modelo ARMA (1, 1) se ajusta bien a los datos, pero que la
correlación residual en el retraso 3 es problemática.
2.Demuestre que un ARMA ((1, 3), 1) no es apropiado. Demuestre que un ARMA (1,
(1, 3)) no muestra correlación residual residual.
3.Demuestre que un AR (3) tiene el mejor ajuste y no tiene correlación serial
restante.
12. El archivo CUARTERLY.XLS contiene los datos de las tasas de interés de los
Estados Unidos desde el primer trimestre de 2008 a 2008 Q 1. Como se
indica en la Sección 10 , forme el diferencial restando la tasa de T-bill de la
tasa de 10 años.
0. Utilice el período completo de la muestra para obtener estimaciones del
modelo AR (7) y del modelo ARMA (1, 1) presentado en la Sección 10 .
1. Estimación de los modelos AR (7) y ARMA (1, 1) durante el período 1960 Q 1
a 1994 Q3. Obtenga el pronóstico de un paso adelante y el error de pronóstico de un
paso adelante de cada uno. Como en la Sección 10 , continúe actualizando el
período de estimación para obtener los cincuenta errores de pronóstico de un paso
adelante de cada modelo. Sea { f 1 t } los pronósticos deel AR (7) y f 2 t denotan las
previsiones del ARMA (1, 1). Usted debe encontrar que las propiedades de las
previsiones son tales que

¿Los pronósticos son imparciales?


2. Construir la prueba de Diebold-Mariano utilizando el error absoluto
medio. ¿Cómo se comparan los resultados con los reportados en la Sección 10 ?
3. Utilice la prueba Granger-Newbold para comparar el modelo AR (7) con
ARMA (1, 1).
4. Construir el ACF y PACF de la primera diferencia de la propagación. ¿Qué
tipo de modelo se sugiere?
5. Demuestre que un modelo con 2 retrasos de AR y retardos de MA a 3, 5 y 8
tiene un mejor ajuste que cualquiera de los modelos reportados en el texto.
13. A medida que lea más de la literatura de series de tiempo, encontrará que
diferentes autores y diferentes paquetes de software informan de la AIC y la
SBC de varias maneras. El propósito de este ejercicio es mostrar que,
independientemente del método que use, siempre seleccionará el mismo
modelo. Los ejemplos en el texto utilizan AIC = T ln ( SSR) + 2 n y SBC
= T ln ( SSR ) + n ln ( T ) donde SSR = suma de los residuales al
cuadrado. Sin embargo, otras fórmulas comunes incluyen

donde SSR = suma de los residuos cuadrados, ln ( L ) = valor maximizado del log de
la función de verosimilitud = - ( T / 2) ln (2 π ) - ( T / 2) ln ( σ 2 ) σ 2 ) ( SSR ), y σ 2 =
varianza de los residuos.
0. Jennifer estima dos modelos diferentes durante el mismo período de tiempo
y se evalúa su ajuste utilizando la fórmula AIC * = -2 ln ( L ) / T + 2 n / T . Denota
los dos valores AIC * (1) y AIC * (2) y encuentra que AIC * (1) <AIC * (2). Justin
estima los mismos dos modelos durante el mismo período de tiempo pero evalúa el
ajuste usando la fórmula AIC = T ln ( SSR ) + 2 n . Demuestre que los resultados de
Justin deben ser tales que AIC (1) <AIC (2). Sugerencia : Dado que AIC * (1) <AIC
* (2), debe ser el caso de que ln (2 π ) + ln ( σ 1 2 ) + T (1 / σ 1 2( SSR 1 ) + 2 n 1 / T <ln
(2 π ) + ln ( σ 2 2 ) + T (1 / σ 2 2 ) ( SSR 2 ) + 2 n 2 / T donde n i , SSR i , y σ i 2 son el
número de parámetros, la suma de los residuos cuadrados y la varianza residual del
modelo i . Recordemos que la estimación de σ 2 es SSR / T. Si simplifica la relación
de desigualdad, debe encontrar que es equivalente a T ln ( SSR 1 ) + 2 n 1 < T ln
( SSR 2 ) + 2 n 2 .
1. Demuestre que los tres métodos de cálculo de la SBC necesariamente
seleccionarán el mismo modelo.
2. Seleccione uno de los tres pares anteriores. Demuestre que el AIC nunca
seleccionará un modelo más parsimonioso que el SBC.
14. El archivo denominado Y_BREAK.XLS contiene las 150 observaciones de la
serie construida como y t = 1 + 0.5 y t -1 + (1 + 0.1 y t -1 ) D t + έ t donde D t es
una variable dummy igual a 0 para t <101 e igual a 1,5 para t ≥ 101.
0. Explique cómo esta representación del modelo permite que el intercepto
salte de 1 a 2,5 y el coeficiente AR (1) para saltar de 0,5 a 0,65.
1. Utilice los datos para verificar los resultados informados en el texto.
2. ¿Por qué crees que la intercepción estimada cae realmente comenzando con
el período 101?
3. Calcule la serie como un proceso AR (2). ¿En qué sentido el modelo AR (2)
tiene mejores resultados que el modelo AR (1) estimado en la parte a?
4. Realizar una estimación recursiva del modelo AR (2) y trazar
el CUSUM s. ¿Es adecuado el modelo AR (2)?
15. El archivo CUARTERLY.XLS contiene la fuente de dinero de los EE.UU.
medida por M1 (M1NSA) y medida por M2 (M2NSA). Las series son
promedios trimestrales durante el período 1960 Q 1 a 2008 Q 2.
0. Reproducir los resultados para M1 que se informan en la Sección 11 del
texto.
1. ¿Cómo se comparan los tres modelos de M1 en el texto con un modelo con
un término AR (1) estacional con un término MA (1) aditivo?
2. Obtenga el ACF para la tasa de crecimiento de la serie M2NSA. ¿Qué tipo de
modelo es sugerido por el ACF?
3. Llame a la tasa de crecimiento estacionalmente diferenciada m 2 t . Estima
un modelo de AR (1) con un término MA estacional durante el período Q2 de Q a 3
de 2008 a Q2 de 2008 . Usted debe obtener: m 2 t = 0.5708 m 2 t -1 + έ t - 0.8547έ t -
4 . Demuestre que este modelo es preferible a (i) un AR (1) con un término AR

estacional, (ii) MA (1) con un término AR estacional, y (iii) un MA (1) con un


término MA estacional.
4. ¿Recomendaría incluir un término de MA en el retraso 2 para eliminar
cualquier correlación serial restante en los residuos?
16. El archivo CUARTERLY.XLS contiene los valores trimestrales del Índice de
Precios al Consumidor (excluyendo alimentos y combustibles) que no se han
ajustado estacionalmente (CPINSA). Formar la tasa de inflación, medida por
el IPC, como ln (CPINSA t / CPINSA t -1 ).
0. Trazar el IPC. ¿Parece haber un patrón estacional plausible en los
datos? Diferencia estacional del IPC utilizando: Δ 4 log (CPINSA t ) = log
(CPINSA) t - log (CPINSA) t -4 . Usted debe encontrar el ACF es tal que:

¿Por qué es difícil usar la metodología de Box-Jenkins en esta serie?


1. Por conveniencia, π t denote la serie (1 - L ) (1 - L 4 ) ln
(CPINSA t ). Encuentre el modelo más apropiado para la serie { π t }. En particular,
compare los siguientes cuatro modelos para la serie:

¿En qué sentido es el Modelo 4 el más apropiado?

NOTAS FINALES
1 .. A menudo, la varianza se estima como
2 .. Como se analiza en el Apéndice 2.1 , la estimación de los coeficientes de MA retardados no
implica la pérdida de ninguna observación utilizable. Por lo tanto, los dos modelos se estiman en el
mismo período de muestra.

3 .. La mayoría de los programas de software no serán capaces de estimar (2.43) ya que no hay un
conjunto único de valores de parámetro que minimice la función de verosimilitud.

4 .. Algunos programas informan la estadística de prueba de Durbin-Watson como una


comprobación para la correlación serial de primer orden. Esta estadística de prueba bien conocida
está sesgada hacia encontrar ninguna correlación serial en presencia de variables dependientes
rezagadas. Por lo tanto, no suele utilizarse en los modelos ARMA.

5 .. Algunos investigadores prefieren dejar la primera observación al agregar una observación


adicional. Como tal, el modelo siempre se estima utilizando un número fijo de observaciones. Una
ventaja potencial de este método de la "ventana de balanceo" es que el cambio estructural que
ocurre temprano en la muestra no afectará a todas las previsiones. Por supuesto, la desventaja es
que algunos de los datos no se utilizan al estimar el modelo.

6 .. Desafortunadamente, la construcción de (2.62) puede ser sensible a la elección de q y, si uno o


más de γ 1 <0, la varianza estimada puede ser negativa. En tales circunstancias, es preferible utilizar
errores estándar robustos, como los de Newey y West (1987). Todos los paquetes de software
profesionales le permiten obtener directamente el estimador Newey-West de la varianza. Los
detalles adicionales están incluidos en el Manual Complementariodisponible
en www.cba.ua.edu/~wenders .

7 .. En un modelo AR ( p ) puro , también se pierde una observación por cada retraso. Dado que el
conjunto de datos comienza en 1960 Q 1, la estimación del modelo AR (7) puede comenzar no antes
de 1961 Q 4. Para asegurar la comparabilidad, todos los modelos reportados en la Tabla 2.4 fueron
estimados durante el mismo período de muestra. Obsérvese que no se pierden observaciones
utilizables en la estimación de modelos MA ( q ). Algunos programas de software inicializan los
valores de έ 1 , ..., έ q para que sean cero de modo que no se pierdan observaciones utilizables
adicionales. Otros serán “backcast” los valores iniciales de έ 1 , ..., έ q .

8 .. Los detalles de los procedimientos X-11 y X-12 no son importantes para nuestros propósitos. Los
detalles técnicos junto con varias versiones del procedimiento de ajuste estacional X-12-ARIMA se
pueden descargar de la página web del Buró del Censo: www.census.gov/srd/www/x12a/ .

9 .. Tal como se ha formulado, la prueba también puede detectar una ruptura en la varianza del
proceso de error. La estimación de un modelo AR ( p ) suele implicar una pérdida del número de
observaciones utilizables. Por lo tanto, para estimar un modelo utilizando T observaciones
utilizables será necesario tener un total de ( T + P ) observaciones. Obsérvese también que el
procedimiento esbozado requiere que el segundo período de la submuestra incorpore los valores
rezagados t m , t m -1 , ... t m -p + 1 .

10 .. Una discusión más detallada del método de arranque utilizado para obtener los valores críticos
se encuentra en el Capítulo 7 .
11 .. Una variante de la prueba, a menudo llamada CUSUM (2), es formar el CUSUM s usando los
errores al cuadrado. El uso de los errores al cuadrado puede ayudar a detectar cambios en la
varianza.

APÉNDICE 2.1: ESTIMACIÓN DE UN PROCESO DE MA (1)


¿Cómo se estima un proceso de MA o ARMA? Cuando se estima una regresión
usando mínimos cuadrados ordinarios (OLS), se tiene una variable dependiente y
un conjunto de variables independientes. En un modelo de AR, la lista de
regresores es simplemente los valores rezagados de la serie { y t }. La estimación de
un proceso MA es diferente porque no se conocen los valores de
la secuencia { έ t }. Como no se puede estimar directamente una ecuación de
regresión, se usa la estimación de máxima verosimilitud. Supongamos que { έ t }
esuna secuencia de ruido blanco extraída de una distribución normal. La
probabilidad de cualquier realización έ t es

Puesto que los έ t son independientes, la probabilidad de las realizaciones


conjuntas έ 1 , έ 2 , ..., έ T es

Si se toma el registro de la probabilidad, se obtiene

Supongamos ahora que observamos los valores de T de la serie MA (1) y t = βέ t -


1 + έ t . El problema es construir la secuencia { έ t } a partir de los valores observados

de { y t }. Si conociéramos el verdadero valor de β y supiéramos que ∂ 0 = 0,


podríamos construir ∂ 1 , ..., τ T recursivamente. Dado que ∂ 0 = 0, se sigue que

En general, έ t = y t - βέ t -1 de manera que si L es el operador lag

Siempre y cuando | β | <1, los valores de έ t representarán un proceso


convergente. Esta es la justificación para el supuesto de que el proceso de MA es
invertible. Si | β | > 1, no podemos representar la serie { έ t } en términos de la serie
observada { y t }. Si ahora sustituimos la solución por έ t por la fórmula para la
probabilidad de log, obtenemos
Ahora que hemos expresado ln L en términos de lo observable { Y t series}, es
posible seleccionar los valores de β y σ 2 que maximizan el valor de ln L . A
diferencia de OLS, si usted toma realmente las derivadas parciales de ln L con
respecto a β y σ 2 no obtendrá un conjunto simple de condiciones de primer
orden. Además, la fórmula se vuelve mucho más complicada en los procesos MA
( q ) de orden superior . Sin embargo, los ordenadores pueden utilizar una serie de
algoritmos de búsqueda disponibles para encontrar los valores de β y σ 2 que
maximizan lnL . Tenga en cuenta que las rutinas numéricas de optimización no
pueden garantizar soluciones exactas para los coeficientes estimados. En lugar de
ello, diversos métodos de “bajada” se utilizan para encontrar los valores de los
parámetros que maximizan ln L . Si las derivadas parciales de la función de
verosimilitud son cercanas a cero (de modo que la función de verosimilitud es
plana), es posible que los algoritmos no puedan encontrar un máximo.

APÉNDICE 2.2: CRITERIOS DE SELECCIÓN DE MODELOS


Las pruebas de hipótesis no son particularmente adecuadas para probar modelos
nonnested. Por ejemplo, si desea elegir entre un AR (1) y un MA (2), puede estimar
ARMA (1, 2) y luego tratar de restringir los coeficientes de MA (2) a cero
igual. Alternativamente, podría intentar restringir el coeficiente AR (1) a igual
cero. Sin embargo, el método es insatisfactorio porque requiere estimar el modelo
ARMA (1, 2) sobreparametrizado. En su lugar, los criterios de selección de
modelos, como el AIC y el SBC, pueden utilizarse para elegir entre modelos
alternativos. Tales criterios de selección de modelos pueden considerarse como
medidas de bondad de ajuste que incluyen un costo o penalización para cada
parámetro estimado.
Una razón por la que no es deseable tener un modelo sobreparamétrico es que la
varianza de error de pronóstico aumenta como resultado de errores que surgen de
la estimación de parámetros. En otras palabras, los modelos pequeños tienden a
tener un mejor rendimiento fuera de la muestra que los modelos
grandes. Supongamos que el proceso real de generación de datos (DGP) es el
modelo AR (1)

Si a es conocido, el pronóstico de un paso adelante de y t +1 es E t y t +1 + ay t . Por lo


tanto, el error de pronóstico cuadrático medio es . Sin
embargo, cuando aes estimado a partir de los datos, el pronóstico de un paso
adelante de y t +1 es

donde es el valor estimado de a .


Por lo tanto, el pronóstico cuadrático medio, o predicción, es

Desde έ t 1 es independiente de y y t , se deduce que


Dado que es estrictamente positivo, la incertidumbre del parámetro
contribuye a la varianza del error de predicción en que el error de pronóstico
cuadrático medio supera σ 2 . El punto es que los errores en la estimación de
parámetros contribuyen a la varianza del error de pronóstico. Además, cuanto más
parámetros se estimen, mayor es la incertidumbre del parámetro. Es fácil
demostrar que el problema es particularmente agudo en muestras pequeñas. Dado
que var ( y t ) + σ 2 / (1 - a 2 ) y, en grandes
muestras , se sigue que

Por lo tanto, como T aumenta, el MSPE se acerca σ 2 .

EL CRITERIO DE ERROR DE PREDICCIÓN FINITA (FPE)


El criterio FPE busca minimizar el error de predicción cuadrático medio de un paso
adelante. Ahora considere el proceso AR ( p ):

Si utiliza el argumento en la sección anterior, se puede mostrar que el MSPE es


igual a

No sabemos la varianza verdadera σ 2 . Sin embargo, σ 2 puede ser reemplazado por


su estimación imparcial SSR / ( T - p ) para obtener

Seleccione p para minimizar FPE. Podemos utilizar los registros y tenga en cuenta
que ln (1 + P / T ) se puede aproximar por P / T . Por lo tanto, es posible
seleccionar p para minimizar

que es lo mismo que minimizar

Puesto que ln ( T - p ) ln T - p / T , el problema puede escribirse en términos de


seleccionar p para minimizar

que tiene la misma solución que minimizar

LA AIC Y LA SBC
La AIC más general selecciona los parámetros (1 + p + q ) de un modelo ARMA
para maximizar la función de probabilidad de log incluyendo una penalización para
cada parámetro estimado:

Para un valor dado de T , seleccionar los valores de p y q para minimizar AIC es


equivalente a seleccionar p y q para minimizar la suma:
Observe que si q = 0 y no hay intercepto, este es el resultado obtenido usando el
FPE. Minimizar el valor de la AIC implica que cada parámetro estimado implica un
beneficio y un costo. Claramente, un beneficio de agregar otro parámetro es que el
valor de SSR se reduce. El costo es que los grados de libertad se reducen y se agrega
incertidumbre de parámetros. Por lo tanto, la adición de parámetros adicionales
disminuirá ln ( SSR ), pero aumentará (1 + p + q ). La AIC le permite agregar
parámetros hasta que el costo marginal (es decir, el costo marginal sea 2 para cada
parámetro estimado) sea igual al beneficio marginal.El SBC incorpora la pena más
grande (1 + p + q ) ln T . Para usar el SBC, seleccione los valores de p y q para
minimizar

Para cualquier tamaño de muestra razonable, ln ( T )> 2 de manera que el costo


marginal de agregar parámetros usando el SBC excede el del AIC. Por lo tanto, el
SBC seleccionará un modelo más parsimonious que el AIC. Como se indica en el
texto, el SBC tiene grandes propiedades de muestra. Es posible probar que la SBC
es asintóticamente consistente mientras que la AIC está sesgada hacia la selección
de un modelo superparamétrico. Sin embargo, los estudios de Monte Carlo han
demostrado que en muestras pequeñas, el AIC puede funcionar mejor que el SBC.

También podría gustarte