Documentos de Académico
Documentos de Profesional
Documentos de Cultura
(a) Use un paquete informático para la regresión lineal múltiple para ajustar el
modelo
(b) Interprete el valor de R2 para este modelo, y comparar con los resultados
del Ejemplo 8.6.
(c) Haz un diagrama para los residuales de este modelo, similar a la Figura
8.18 en el texto. ¿Aparecen los residuos para formar una secuencia de ruido no
correlacionado estacionaria?
d) Iterar la ecuación del modelo de la parte (a) y estimar el índice CM1 en mayo
de 1990. Utilice la desviación estándar reportado para dar un intervalo de
predicción de 95%. Comparar con los resultados del Ejemplo 8.6. Es mucho
mejor este nuevo modelo?
SERIES DE TIEMPO
Una serie temporal es un proceso estocástico que varía con el tiempo, por lo
general observada a intervalos fijos. La temperatura diaria y precipitaciones, los
niveles mensuales de desempleo, y los ingresos anuales son algunos ejemplos
típicos de series de tiempo. La herramienta básica para la serie de tiempo de
modelado es la regresión lineal, introducido en la Sección 8.3. Por esa razón,
esta sección puede ser considerado como un seguimiento a la Sección 8.3, que
introduce algunas aplicaciones y métodos adicionales. De hecho, el ejemplo
consideramos siguiente es una extensión del problema ARM de esa sección.
En esta sección se requiere una aplicación numérica de regresión múltiple; es
decir, la regresión lineal con más de un predictor. Este está disponible en un
paquete estadístico (por ejemplo, Minitab, SAS, SPSS) o una hoja de cálculo
(por ejemplo, Excel). Dado que no es razonable realizar estos problemas a
mano, no se le dará un completo conjunto de fórmulas de cálculo
Ejemplo 8.6. Reconsiderar el problema ARM del Ejemplo 8.5 pero ahora
considerar la relación entre el índice de hipotecas en diferentes momentos.
Responde a la misma pregunta de antes: Estimar el valor del índice CM1 en
mayo de 1990 utilizando los datos proporcionados en los valores del índice
CM1 desde junio 1986 hasta junio 1989.
Una serie de tiempo es una secuencia de variables aleatorias {Xt} que varía en
el tiempo t = 0, 1, 2; ::: de acuerdo con algún patrón aleatorio. La clave para el
modelado de series de tiempo es reconocer el patrón. Un supuesto típico es
que el patrón implica una tendencia añadido a una serie de tiempo
estacionaria. La tendencia es una función no aleatoria que varía con el tiempo,
y representa el valor medio de la serie. Una vez que se elimina la tendencia,
nos quedamos con una serie de tiempo de media cero, y queremos modelar su
estructura de dependencia. El caso más simple es donde
para estimar los errores. Dado que nuestro objetivo es incluir suficientes
predictores en el modelo para capturar la estructura de dependencia, nos
gustaría que la secuencia Q resultado es una secuencia de ruido no
correlacionado. Podemos comprobar esto mediante el cálculo de la función de
autocorrelación de los residuales. La mayoría de los paquetes estadísticos se
calculará automáticamente los residuos y su función de autocorrelación, así
como los valores de p o barras de error para la función de autocorrelación? (H).
Las barras de error indican los valores probables de? (H) en el caso de una
secuencia de ruido, y los valores fuera de estos bares (también indican con un
p-valor bajo, por lo general menos de 0,05) indican una correlación
estadísticamente significativa. Dado que la función de autocorrelación asume
un proceso estacionario, también es aconsejable comprobar esto utilizando
representaciones gráficas de los residuales.
Xt valor del índice CM1 en el mes t = 48, que es mayo de 1990, junto con los
límites de error correspondientes.
La figura 8.14 muestra una gráfica de los residuos. Ellos fueron computados en
Minitab haciendo clic en el botón de almacenamiento en la ventana de
regresión y marcando la casilla etiquetada Residuales. El gráfico también se
preparó de Minitab utilizando el comando Graph> Diagrama de dispersión. Los
datos aparecen estacionario en el sentido de que la difusión de los
valores no parece aumentar o disminuir con t. Sin embargo, parece que
puede haber cierta dependencia de serie, sobre todo para t≥20 donde
parece que hay una tendencia al alza. Esto podría indicar muchas cosas,
incluyendo no estacionariedad, un cambio en la estructura de
dependencia de la serie, o alguna correlación.
Para investigar más a fondo, se calcula la función de autocorrelación de los
residuales. La figura 8.15 muestra los resultados de este cálculo con el
comando Stat Minitab> Series de Tiempo> Autocorrelación aplicados a los
residuos almacenados como parte del cálculo de regresión. Las barras
verticales indican la función de correlación (ro)(h) = corr ((epsilon)t;(epsilon) t +
h) como una función del desfase temporal h = 1; 2; 3;::?: Y la curva de puntos
representa las barras de error del 95% . La función de autocorrelación
representa aquí es, por supuesto, una estimación estadística del modelo
de autocorrelación, y las barras de error muestran el rango de variación
normal para esta estimación estadística para una secuencia de ruido no
correlacionado. Por lo tanto, un valor fuera de las barras indica una fuerte
evidencia estadística para una autocorrelación distinto de cero. En la figura
8.15, el primer valor (ro)(1) está bien fuera de las barras de error. Esta es una
indicación de correlación serial en los residuos (epsilon)t de nuestra regresión
simple, la evidencia que se necesita un modelo más complejo para obtener un
correlacionadas (blanco) secuencia de ruido simple. Este tipo de fuerte
correlación positiva puede causar un patrón que se parece a una tendencia,
como se ve en la Figura 8.14, ya que un valor positivo grande de (epsilon)t
hace que sea más probable que el siguiente valor es grande, y así
sucesivamente.
El ajustado R2= 93: 8% aquí es también superior a la cifra del 82,6% del
ejemplo 8.5, evidencia adicional de que el modelo autorregresivo es superior.
El análisis de las estadísticas de la varianza dar más detalles sobre el cálculo
de R2. Recordando la fórmula (8.39), vemos que R2 es el cociente de dos
sumas de cuadrados. La suma de cuadrados regresiones Σi (^yi-y^(-))^2 = 44:
676 y la suma de los cuadrados de la variación total es Σi (yi-y^(-))^2 = 47: 460.
La relación de estos dos es R2 = 44: 676/47: 460 = 0: 941. Las sumas
secuenciales de tabla de cuadrados indica que 40.924 y 44.676 de la suma
residual de cuadrados proviene de la primera predictor t, y un adicional de 3:
752 proviene de la adición de un segundo predictor Xt-1. Si hubiéramos
enumerado los dos predictores en el orden inverso, entonces estas dos cifras
se cambian, ya que los dos predictores ty Xt-1 no son completamente
independientes, pero ellos todavía añadir a 44.767. También observamos que
el valor de p para la constante a = 1: 5987 es 0.008, el valor de p para el
coeficiente b = 0: 03.299 del predictor t es 0.007, y el valor de p para el
coeficiente c1 = 0: 6977 de Xt-1 es 0.000. Esta es una evidencia adicional de
que todos estos coeficientes son estadísticamente significativamente diferente
de cero y deben ser incluidos en el modelo.
por lo que podemos predecir que el valor del índice de CM1 para mayo 1990
será de 10,28. Usando el modelo de Xt = 1:60 + 0: 033t + 0: 698Xt-1 +
(epsilon)t junto con el hecho de que la desviación estándar estimada de
(epsilon)t es 0: 290471, predecimos (con 95% de certeza) de que el valor de la
índice de CM1 en mayo 1990 será de entre 10: 28 ± 2 (0.29), o en otras
palabras, entre 9,7 y 10,9. Esta es una estimación más precisa que el Ejemplo
8.5 debido a que el modelo de regresión se ajusta más estrechamente, dando
una desviación de error estándar más pequeño. Gráficamente, la desviación
estándar es simplemente la variación vertical típica de los puntos de
datos de la línea de predicción, por lo que un ajuste más cerca da una
menor desviación estándar. Sin embargo, el resultado final es el mismo que
antes: Tasa de interés ARM del autor es probable que aumente de nuevo en
1990. De hecho, este modelo mejorado da una estimación ligeramente más
alto para el índice CM1 mayo de 1990.
Figura 8.17: Gráfico del índice de CM1 en función del tiempo t que muestra el
modelo autorregresivo equipada de la ecuación (8.45) con p = 1.
Figura 8.18: Gráfico de residuales CM1 (epsilon)t en función del tiempo para el
modelo autorregresivo de la ecuación (8.45) con p = 1.