Documentos de Académico
Documentos de Profesional
Documentos de Cultura
MÉTODOS AUTOPROYECTIVOS
DETERMINISTAS DE
PREDICCIÓN
Ts = (Xs2+Xs1+Xs+Xs+1+Xs+2)/5 s = 3, 4, …, T 2
Será necesario, una vez fijado a, dar un valor inicial a St' cuando t = 1. Este
valor se establece siguiendo algún criterio ajeno al método. Se puede hacer, por
ejemplo, S1' = X1. También se puede igualar S1' a un promedio de los primeros
valores de X. También habrá que dar un valor inicial a S1", que también puede ser X1.
También se toma at = 2 S’t - S’’t y bt = a(S’t - S’’t )/(1-a). Como valor fijado para a
se suele tomar un número entre 0,1 y 0,3.
N = Número de observaciones
xt = Observación t de la serie de tiempo en estudio
St = Observación t de la serie alisada
Ft(l) = Predicción en el instante t a horizonte l
bt = Valor del parámetro estimado del modelo en el instante t
a = Primera constante de alisado (relacionado con la componente aleatoria)
b = Segunda constante de alisado (relacionado con la tendencia)
CÉSAR PÉREZ LÓPEZ. UNIDAD DE ESTADÍSTICA. INSTITUTO DE ESTUDIOS FISCALES. 5
Figura 2-5
CÉSAR PÉREZ LÓPEZ. UNIDAD DE ESTADÍSTICA. INSTITUTO DE ESTUDIOS FISCALES. 7
Figura 2-6
Figura 2-7
Al hacer clic en Aceptar se obtienen los estadísticos de ajuste del modelo (Figura
2-16) entre los que destacan R2=0,5 y el p-valor del estadístico de Lunj Box lo
suficientemente alto como para asegurar la aleatoriedad residual. Finalmente se obtienen
las funciones de autocorrelación y autocorrelación parcial residuales (Figura 2-17) cuyos
valores no se salen de las bandas de confianza, lo que certifica una buena diagnosis
residual. Se obtiene también sobre la misma gráfica la serie original, la serie suavizada y
las predicciones obtenidas (Figura 2-18). Si observamos el conjunto de datos vemos que
al final se han añadido las series de predicciones, sus intervalos de confianza y la serie de
errores (Figura 2-19).
Figura 2-8
CÉSAR PÉREZ LÓPEZ. UNIDAD DE ESTADÍSTICA. INSTITUTO DE ESTUDIOS FISCALES. 9
Figura 2-9
Figura 2-10
10 SERIES TEMPORALES
Figura 2-11
Figura 2-12
CÉSAR PÉREZ LÓPEZ. UNIDAD DE ESTADÍSTICA. INSTITUTO DE ESTUDIOS FISCALES. 11
Figura 2-13
Figura 2-14
12 SERIES TEMPORALES
Figura 2-15
Figura 2-16
Figura 2-17
CÉSAR PÉREZ LÓPEZ. UNIDAD DE ESTADÍSTICA. INSTITUTO DE ESTUDIOS FISCALES. 13
Figura 2-18
Figura 2-19
14 SERIES TEMPORALES
Figura 2-33
Figura 2-34
CÉSAR PÉREZ LÓPEZ. UNIDAD DE ESTADÍSTICA. INSTITUTO DE ESTUDIOS FISCALES. 15
Figura 2-35
Comparación de Modelos
Variable de datos: ibm
Número de observaciones = 120
Indice Inicial = 1,0
Intervalo de Muestra = 1,0
Modelos
(A) Caminata aleatoria con drift = 1,10924
(B) Tendencia lineal = 448,776 + 1,07464 t
(C) Promedio móvil simple de 3 términos
(D) Suavización exponencial simple con alfa = 0,9999
(E) Suavización exp. De Brown con alfa = 0,5853
Periodo de Estimación
Modelo RMSE MAE MAPE ME MPE
(A) 5,23319 4,05395 0,787267 1,81517E-14 -0,0103603
(B) 16,8831 13,9372 2,73899 5,87382E-14 -0,0993993
(C) 7,41671 5,50712 1,05789 2,25926 0,423024
(D) 5,32803 4,05009 0,784242 1,10011 0,204948
(E) 5,86032 4,54833 0,88362 0,0448507 0,00883051
16 SERIES TEMPORALES
Clave:
RMSE = Root Mean Squared Error (Raíz del Cuadrado Medio del Error)
RUNS = Prueba corridas excesivas arriba y abajo
RUNM = Prueba corridas excesivas arriba y abajo de la mediana
AUTO = Prueba de Box-Pierce para autocorrelación excesiva
MEDIA = Prueba para diferencia en medias entre la 1ª mitad y la 2ª mitad
VAR = Prueba para diferencia en varianza entre la 1ª mitad y la 2ª mitad
OK = no significativo (p >= 0,05)
* = marginalmente significativo (0,01 < p <= 0,05)
** = significativo (0,001 < p <= 0,01)
*** = altamente significativo (p <= 0,001)
El StatAdvisor
Esta tabla compara los resultados de cinco diferentes modelos de pronósticos. Puede cambiar
cualquiera de los modelos pulsando el botón secundario del ratón y seleccionando Opciones de
Análisis. Viendo las estadísticas del error, el modelo con la menor raíz cuadrada del error cuadrado
medio (RMSE) durante el periodo de estimación del modelo es el modelo A. El modelo con el menor
error medio absoluto (MAE) es el modelo D. El modelo con el menor porcentaje del error medio
absoluto (MAPE) es el modelo D. Puede usar estos resultados para seleccionar el modelo más
apropiado para sus necesidades.
La tabla también resume los resultados de cinco pruebas para determinar si cada modelo es adecuado
para los datos. Un OK significa que el modelo pasa la prueba. Un * significa que no pasa la prueba al
nivel de confianza del 95%. Dos *'s significa que no pasa la prueba al nivel de confianza del 99%.
Tres *'s significa que no pasa la prueba al nivel de confianza del 99,9%. Note que el modelo
actualmente seleccionado, el modelo A, pasa 5 pruebas. Puesto que ninguna prueba es estadísticamente
significativa con un nivel de confianza del 95% o más, el modelo actual probablemente es adecuado
para los datos.
El apartado Modelos de la salida ordena de mejor a peor los posibles modelos
deterministas de ajuste para la serie (camino aleatorio, tendencia lineal, media móvil de
orden 3, suavizado exponencial simple y suavizado exponencial de Brown). Esta
ordenación la realiza según los resultados de los contrastes de ajuste que se presentan en
el apartado Periodo de estimación. Se presentan las distintas pruebas de diagnóstico para
el ajuste de los modelos (raíz del error cuadrático medio y pruebas de rachas de la
mediana y de Box-Pierce para la aleatoriedad de los residuos) y cuántas supera cada
modelo señaladas con OK. Se observa que también son modelos aceptables de ajuste el
suavizado exponencial simple y el suavizado exponencial de Brown. Para elegir
cualquier otro modelo de los aceptables para el ajuste, se hace clic con el botón derecho
del ratón sobre la salida anterior y se elige Opciones de análisis para obtener la pantalla
de Opciones de especificación del modelo (Figura 2-36) en la que elegiremos Suavizado
exponencial lineal de Brown. Al hacer clic en Aceptar se obtiene el ajuste gráfico de la
Figura 2-37 que incluye el suavizado y las prediciones.
CÉSAR PÉREZ LÓPEZ. UNIDAD DE ESTADÍSTICA. INSTITUTO DE ESTUDIOS FISCALES. 17
Figura 2-36
Figura 2-37
Si hacemos clic con el botón derecho del ratón sobre la salida de los pronósticos
se obtiene el menú emergente de la Figura 2-40, cuya opción Opciones de ventana
permite situar el nivel de confianza para la construcción de los intervalos de confianza de
las predicciones (Figura 2-41).
Tabla de Pronósticos para ibm
Modelo: Suavización exp. De Brown con alfa = 0,5893
Límite en 95,0% Límite en 95,0%
Periodo Pronóstico Inferior Superior
121,0 592,746 581,308 604,184
122,0 595,345 577,666 613,024
123,0 597,944 573,102 622,786
124,0 600,542 567,738 633,347
125,0 603,141 561,655 644,627
126,0 605,74 554,911 656,569
127,0 608,339 547,551 669,127
128,0 610,938 539,611 682,264
129,0 613,536 531,124 695,949
130,0 616,135 522,114 710,156
131,0 618,734 512,605 724,863
132,0 621,333 502,616 740,05
CÉSAR PÉREZ LÓPEZ. UNIDAD DE ESTADÍSTICA. INSTITUTO DE ESTUDIOS FISCALES. 19
Figura 2-40
Figura 2-41
El StatAdvisor
Se han corrido tres pruebas para determinar si los residuos forman, o no, una secuencia aleatoria de
números. Una secuencia de números aleatorios a menudo es llamada ruido blanco, puesto que contiene
iguales contribuciones a varias frecuencias. La primer prueba cuenta el número de veces que la
secuencia estuvo arriba o abajo de la mediana. El número de tales corridas es igual a 53, comparado
con un valor esperado de 61,0 si la secuencia fuera aleatoria. Puesto que el valor-P para esta prueba es
mayor o igual que 0,05, no se puede rechazar la hipótesis de que los residuos son aleatorios, con un
nivel de confianza del 95,0% o mayor. La segunda prueba cuenta el número de veces que la secuencia
ascendió o descendió. El número de tales corridas es igual a 70, comparado con un valor esperado de
79,6667 si la secuencia fuera aleatoria. Puesto que el valor-P para esta prueba es menor que 0,05, se
puede rechazar la hipótesis de que la serie es aleatoria, con un nivel de confianza del 95,0%. La tercera
prueba está basada en la suma de cuadrados de los primeros 24 coeficientes de autocorrelación. Puesto
que el valor-P para esta prueba es menor que 0,05, se puede rechazar la hipótesis de que la serie es
aleatoria, con un nivel de confianza del 95,0%. Puesto que las tres pruebas son sensibles a diferentes
tipos de desviacíon de una comportamiento aleatorio, una falla para pasar cualquiera sugiere que los
residuos no son completamente aleatorios, y que el modelo seleccionado no captura toda la estructura
en los datos.
La opción gráfica Gráfico de los residuos de la Figura 2-39 nos lleva a la Figura
2-42, que presenta la estructura gráfica residual. Se observa que se trata de una estructura
aleatoria sin lugar a dudas.
Figura 2-42
CÉSAR PÉREZ LÓPEZ. UNIDAD DE ESTADÍSTICA. INSTITUTO DE ESTUDIOS FISCALES. 21
Figura 2-43
Figura 2-44
22 SERIES TEMPORALES
Figura 2-45
La pantalla de entrada se presenta en la Figura 2-45. Previamente se carga en
memoria el fichero cap13.sf3 que contiene la variable ibm relativa a los precios de
los stocks de la compañía IBM. La finalidad de los campos de la figura ya los
conocemos, pues son similares a los de la pantalla de entrada del procedimiento
Predicción ya visto en este capítulo. Se observa que no está la casilla del número de
predicciones a obtener, ya que este procedimiento solamente suaviza la serie y no
obtiene predicciones (lo mismo que ocurría en STATGRAPHICS). Al pulsar Aceptar
se obtiene la salida de la Figura 2-46 en la que se contemplan las dos opciones
tabulares del procedimiento (Resumen de Análisis y Tabla de datos) y las dos
opciones gráficas (Gráfico de secuencia cronológica y Gráfico de los residuos). La
tabla de datos presenta los valores de la serie, los valores de la serie suavizada y los
errores cometidos en la suavización. El resumen de análisis para el suavizado de la
serie ibm imforma que se ha utilizado por defecto un suavizado por medias móviles
de orden cinco.
Para cambiar el criterio de suavizado se hace clic con el botón derecho del ratón
sobre la salida de la tabla datos y en el menú emergente resultante (Figura 2-47) se
elige Opciones de ventana. Se obtiene la Figura 2-48 que permite elegir hasta dos
tipos simultáneos diferentes de suavizado basados en diferentes tipos de medias
móviles.
CÉSAR PÉREZ LÓPEZ. UNIDAD DE ESTADÍSTICA. INSTITUTO DE ESTUDIOS FISCALES. 23
Figura 2-46
Figura 2-47
Figura 2-48
24 SERIES TEMPORALES
Figura 2-49
gráfico (Figura 1-92). La Figura 1-93 presenta la serie original y las series suavizadas
por medias móviles de orden 3 y suavizado exponencial simple. La Figura 1-94
grafica esas tres series sobre los mismos ejes.
Figura 1-92
CÉSAR PÉREZ LÓPEZ. UNIDAD DE ESTADÍSTICA. INSTITUTO DE ESTUDIOS FISCALES. 27
ALIGN= BEGINNING| BEG| B, ALPHA= n sitúa el tamaño de los AR= n especifica el máximo
MIDDLE|MID|M, o ENDING|END|E límites de confianza de las orden del modelo
controlan la alineación de fechas predicciones autorregresivo
ASTART= valor inicial para el término BSTART= valor inicial para la CSTART= valor inicial de
constante en alisado exponencial y de tendencia lineal en alisado tendencia cuadrática en alisado
Winters exponencial y de Winters exponencial y Winters
DATA= conjuntyo de datos de entrada INTERVAL= intervalo de INTPER= n incremento si
tiempo usado en la serie no se usa INTERVAL
LEAD= número de períodos a predecir METHOD= STEPAR | EXPO | NSTART= n especifica el
WINTERS | ADDWINTERS número de observaciones del
(paso a paso, exponencial, comienzo de la serie a usar
Winters y Winters estacional) para calcular valores iniciales
NSSTART= n especifica el OUT= Conjunto de datos de OUTACTUAL escribe los
número de observaciones del comienzo de salida valores actuales en el
la serie a usar para calcular valores iniciales conjunto de datos de salida
en métodos estacionales
OUTALL escribe una salida completa OUTEST= Conjunto de salida con OUTESTALL escribe
valores estimados y de ajuste estadísticos adicionales
OUTESTTHEIL escribe estadísticos de OUTFITSTATS escribe OUTFULL controla todas
Theil estadístico tipo R2 las opciones de prtedición
OUTLIMIT escribe límites de confianza OUTRESID escribe los residuos OUTSTD escribe los errores
para predicciones estándar de las predicciones
OUT1STEP escribe los valores un paso SEASONS= intervalo estacional SINGULAR= valor de
adelante (QTR, MONTH, DAY, o HOUR) control de singularidades
SINTPER= número de períodos a SLENTRY= valor de nivel de SLSTAY= valor de nivel de
combinar en una estación siginificación de parámetros AR siginificación de parámetros
entrantes AR salientes
START= n para usar las n primeras ZEROMISS para tratar los ceros
observaciones como serie y a partir de la al comienzo de la serie como
n+1 predicciones como valores desaparecidos
30 SERIES TEMPORALES
Una vez ejecutada la sintaxis anterior se obtienen las Figuras 2-69 y 2-70 que
representan la serie original y su periodograma.
Figura 2-69
CÉSAR PÉREZ LÓPEZ. UNIDAD DE ESTADÍSTICA. INSTITUTO DE ESTUDIOS FISCALES. 31
Figura 2-70
data a;
set ejemplos.out;
where _lead_ >= 1;
proc print;
run;
32 SERIES TEMPORALES
Figura 2-71
Figura 1-112
1 en el trimestre i
Dit i 1, ,4
0 en el resto
Se observa que en el modelo se omite la constante para evitar la colinealidad
perfecta. Para que el efecto estacional esté presente, los parámetros estimados del
modelo anterior han de ser significativamente distintos de cero individualmente. E
incluso los residuos estimados de la regresión anterior uˆt Yt Yˆt marcarán la
evolución de la serie desestacionalizada.
Figura 1-125
Una vez que sabemos a ciencia cierta que nuestra serie tiene estacionalidad
trimestral realizaremos su desestacionalización mediante el método de Holt_Winters.
Para ello elegimos Quick Series Statistics Exponential Smoothing (Figura 1-116) y
en el campo Series name introducimos el nombre de la serie que vamos a suavizar
(turistas). Al pulsar OK se obtiene la pantalla Exponential Smoothing (Figura 1-117) en
cuyo campo Smoothing method elegimos el tipo de suavizado (Holt-Winters
Multiplicativo en nuestro caso). Al pulsar OK se obtiene la serie suavizada por suavizado
exponencial simple de nombre TURISTSM y los parámetros del modelo de Holt-
Winters (Figura 1-118). La Figura 1-119 presenta la serie original y las serie suavizada.
Figura 1-140
Se observa que los mejores modelos de ajuste son una tendencia lineal de
ecuación turistas = 2,39 + 0,26 t y el suavizado exponencial de Holt-Winters, ya que
ambos presentan OK en todos los contrastes.
46 SERIES TEMPORALES
Al pulsar el botón derecho del ratón sobre la salida anterior y elegir Opciones de
Análisis en el menú emergente resultante se obtiene la Figura 1-142.
Figura 1-143
Si en opciones tabulares elegimos Tabla de Pronósticos y Contraste de
Aleatariedad de los Residuos (Figura 1-143) obtenemos en primer lugar la tabla de
predicciones siguiente que muestra los 4 valores predichos y sus intervalos de
confianza al 95%.
CÉSAR PÉREZ LÓPEZ. UNIDAD DE ESTADÍSTICA. INSTITUTO DE ESTUDIOS FISCALES. 47