Está en la página 1de 10

STATGRAPHICS – Rev.

4/25/2007

Series de Tiempo – Suavización

Resumen
El procedimiento de Suavización está diseñado para ayudar a ilustrar cualquier tendencia
y ciclos presentes en una serie de tiempo. Una serie de tiempo consiste en un conjunto de
datos numéricos tomados en intervalos igualmente espaciados, usualmente sobre un
período de tiempo o espacio. El procedimiento aplica uno o más suavizadores
seleccionados a los datos y grafica los resultados. Los suavizadores disponibles incluyen
promedios móviles clásicos y suavizadores no lineales que sean resistentes a valores
atípicos.

StatFolio de Muestra: tssmooth.sgp

Datos de Muestra:
El archivo baseball.sf6 contiene el promedio de los bateos líderes en la liga Mayor de
Béisbol de los Estados Unidos para cada año entre 1901 y 2004. Los promedios de las
bateos representa la proporción de veces que un jugador obtuvo un hit entre todos los
bateos que fueron ya sea un hit o en un out. La tabla de abajo muestra una lista parcial de
los datos de ese archivo. Los promedios de bateos están expresados como el número de
puntos de cada 1000, es decir que un jugador con 333 hubiera obtenido un hit un tercio
del tiempo.

Year Leading average


1901 422
1902 376
1903 355
1904 381
1905 377
1906 358
1907 350
1908 354
1909 377
1910 385
… …
2004 372

©2006 por StatPoint, Inc. Series de Tiempo – Suavización - 1


STATGRAPHICS – Rev. 4/25/2007

Captura de Datos
El cuadro de diálogo de captura requiere el nombre de la columna que contiene los datos
de la series de tiempo:

• Datos: columna numérica que contiene n observaciones igualmente espaciadas.

• Intervalo de Muestreo: define el intervalo entre sucesivas observaciones.

• Estacionalidad: la amplitud de la estacionalidad s, si la hay. Los datos son


estacionales si existe un patrón que se repita en un período de tiempo fijo. Por
ejemplo, los datos mensuales tienen una estacionalidad de s = 12. Los datos por hora
que se repiten todos los días tienen una estacionalidad de s = 24. Si no se introduce
nada se asume que los datos no tienen estacionalidad (s = 1).

• Ajuste por Jornadas Financieras: una variable numérica con n observaciones


usadas para normalizar las observaciones originales tales como el número de días
laborales en un mes. Las observaciones en la columna Datos serán divididas por esos
valores antes de ser graficadas o analizadas.

• Selección: selecciona el subconjunto.

©2006 por StatPoint, Inc. Series de Tiempo – Suavización - 2


STATGRAPHICS – Rev. 4/25/2007

Resumen del Análisis


El Resumen del Análisis despliega el número de observaciones en la serie de tiempo, la
amplitud de la estacionalidad (si la hay), cualquier ajuste hecho a los datos y selecciona
suavizadores.

Suavizado - Leading average


Datos/Variable: Leading average

Número de observaciones = 104


Indice Inicial = 1901
Intervalo de Muestra = 1.0 año(s)
Primer suavizado: suavizador resistente 3RSSH
Segundo suavizado: promedio móvil simple de 5 términos

Nota: una cantidad limitada de datos faltantes es permitida, siempre y cuando se muestre
que no hay demasiados valores faltantes cerca. Los valores faltantes son reemplazados
por interpolaciones de acuerdo con el método definido en la sección Cálculos de la
documentación Series de Tiempo- Métodos Descriptivos.

Opciones de Análisis
Opciones de Análisis permite que los datos sean transformados antes de ser graficados o
analizados:

• Matemática: transforma los datos al realizar la operación matemática indicada.

©2006 por StatPoint, Inc. Series de Tiempo – Suavización - 3


STATGRAPHICS – Rev. 4/25/2007

• Estacional: ajuste estacionalmente los datos usando el método indicado.

• Tendencia: remueve una tendencia ajustando y sustrayendo tipo de tendencia


indicada.

• Diferenciación: transforma los datos al tomar diferencias no estacionales de orden d


y/o diferencias estacionales de orden D.

• Inflación: ajusta los datos por la inflación usando la tasa de inflación especificada.

Si una o más transformaciones son requeridas, ellas son aplicadas en el siguiente orden:

1. ajuste de días hábiles


2. ajuste por inflación
3. ajuste matemático
4. ajuste estacional
5. ajuste de tendencia
6. diferenciación

Para una discusión detallada de las opciones de transformación, refiérase a la


documentación Series de Tiempo- Métodos Descriptivos.

Gráfica de Secuencia de Tiempo


La Gráfica de Secuencia del Tiempo despliega los datos de series de tiempo en orden
secuencial, junto con el resultado de aplicar uno o más suavizadores a los datos:

Gráfica de Serie de Tiempo Suavizada para Leading average

440
datos
420 suavizada
Leading average

400

380

360

340

320
1900 1920 1940 1960 1980 2000 2020

Los datos del béisbol muestran algunas interesantes características:

©2006 por StatPoint, Inc. Series de Tiempo – Suavización - 4


STATGRAPHICS – Rev. 4/25/2007

1. Una tendencia general ascendente durante 1966, y otra tendencia ascendente


tiempo después.
2. Oscilaciones alrededor de la línea de tendencia con un período que varía entre
alrededor de 10 años y 15 años.

Ventana de Opciones
Los suavizadores que se aplican a los datos son especificados con un click en la Gráfica
de Secuencia del Tiempo o en la Tabla de Datos y seleccionando Opciones de Ventana.
El primer suavizador debe ser especificado. El segundo es opcional.

• Suavizado 1: primer suavizador para aplicar a los datos.

• Suavizado 2: suavizador para aplicar a los valores suavizados que resultan del primer
suavizador, si los hay.

• Longitud del Promedio Móvil: el lapso k del promedio móvil cuando se usa
Promedio Móvil Simple o Promedio Móvil de Henderson. k debe ser mayor que o
igual a 2 para el Promedio Móvil Simple y mayor que o igual a 3 e impar para el
Promedio Móvil de Henderson. Mientras más grande sea el valor de k, el resultado
tendrá mayor suavización.

©2006 por StatPoint, Inc. Series de Tiempo – Suavización - 5


STATGRAPHICS – Rev. 4/25/2007

• Constante de Suavización EWMA: el parámetro de suavizamiento λ cuando se usa


EWMA. La constante de suavizamiento debe satisfacer 0 < λ < 1. Menores valores de
λ, arrojan un resultado más suavizado.
Los suavizadores disponibles son:

1. Promedio Móvil Simple: El valor suavizado en el tiempo t es el promedio de los k


valores de los datos centrados en el tiempo t. Si k es impar, entonces el valor
suavizado es
( k −1) / 2

∑y t+ j
j = − ( k −1) / 2
St = (1)
k

Si k es par, se usa un promedio móvil centrado definido por

k / 2 −1
0.5 y t − k / 2 + ∑y
j = − k / 2 +1
t+ j + 0.5 y t + k / 2
St = (2)
k

2. Promedios Móviles de 15 y 21 términos de Spencer: Promedios móviles


ponderados desarrollados para trabajo actuarial. El valor suavizado en el tiempo t
está dado por
m

∑w
j =− m
j yt + j
St = m
(3)
∑w
j =− m
j yt + j

Donde m = 7 para el promedio móvil de 15 términos y m = 10 para el promedio


móvil de 21 términos. Los pesos o cargas se muestran abajo:

j wj (PM de 15 términos) wj (PM de 15 términos)


-10 -5/1750
-9 -15/1750
-8 -25/1750
-7 -3/320 -25/1750
-6 -6/320 -10/1750
-5 -5/320 30/1750
-4 3/320 90/1750
-3 21/320 165/1750
-2 46/320 235/1750
-1 67/320 285/1750
0 74/320 300/1750
1 67/320 285/1750
2 46/320 235/1750
3 21/320 165/1750
4 3/320 90/1750

©2006 por StatPoint, Inc. Series de Tiempo – Suavización - 6


STATGRAPHICS – Rev. 4/25/2007

5 -5/320 30/1750
6 -6/320 -10/1750
7 -3/320 -25/1750
8 -25/1750
9 -15/1750
10 -5/1750

3. Promedio Móvil Ponderado de Henderson – un promedio móvil ponderado,


frecuentemente usado para suavizar datos de censos. El lapso k debe ser impar y
al menos 3, aunque de otra manera puede ser especificado por el usuario. Valores
comunes para k son 5, 9, 13, y 23. Las cargas están dadas por

wj =
[ ][ ][ ][
315 (m − 1) 2 − j 2 m 2 − j 2 (m + 1) 2 − j 2 (3m 2 − 16) − 11 j 2 ] (4)
8m(m 2 − 1)(4m 2 − 1)(4m 2 − 9)(4m 2 − 25)

donde m = (k+3) / 2.

4. PMCE – Promedio Móvil Ponderado Exponencialmente. Este suavizador incluye


todas las observaciones a partir e incluyendo yt, con cargas que disminuyen
exponencialmente con la distancia de t. Dada una constante de suavización λ, el
valor suavizado está dado por

t −1

∑ λ (1 − λ )
j
yt − j
j =0
St = t −1
(5)
∑ λ (1 − λ )
j

j =0

5. 3RSS, 3RSSH, 5RSS, 5RSSH, y 3RSR: suavizadores no lineales desarrollados


por John Tukey (1977). Estos suavizadores son adecuados para ignorar valores
atípicos y son frecuentemente aplicados como primer paso para reducir la
influencia de valores atípicos potenciales previo a la aplicación de un promedio
móvil. Cada símbolo en el nombre del suavizador indica una operación que es
aplicada a los datos:

“3”: Una ventana móvil de tamaño 3 pasa a través de los datos y la


mediana de los 3 valores en la ventana se mantiene como la suavización.

“5”: Una ventana móvil de tamaño 5 pasa a través de los datos y la


mediana de los 5 valores en la ventana se mantiene como la suavización.

“R”: Los datos suavizados son suavizados nuevamente aplicándoles una


operación previa al resultado suavizado. Esto se repite hasta que ningún
cambio adicional ocurre.

©2006 por StatPoint, Inc. Series de Tiempo – Suavización - 7


STATGRAPHICS – Rev. 4/25/2007

“S”: Desde que las medianas repetidas tienden a dejar planos y valles, esos
puntos planos se separan para tener un resultado más suavizado del que se
obtendría de si no se separaran. La operación de suavización principal se
realiza entonces nuevamente.

“H”: Los datos son suavizados usando un promedio ponderado de la forma

S t = 0.25 y t −1 + 0.5 y t + 0.25 y t +1 (6)

El cual se conoce como hanning por su autor Julius von Hann.

Para una discusión detallada de suavización no lineal, ver Velleman y Hoaglin


(1981).

Los datos del béisbol fueron suavizados usando dos suavizadores en secuencia: 3RSSH,
seguido de un promedio móvil simple de 5 términos. Esto significa que:

(i) Medianas repetidas de 3 fueron tomadas y repetidas hasta que no hubo algún
cambio adicional.
(ii) Superficies planas y valles fueron separados.
(iii) Medianas repetidas de 3 fueron tomadas y repetidas hasta que no hubo cambio
adicional.
(iv) Hanning fue realizado.
(v) Se tomó un promedio móvil simple de 5 términos.

El resultado es muy satisfactorio.

Tabla de Datos
La tabla de datos despliega las observaciones originales y el resultado suavizado:

Tabla de Datos para Leading average


Primer suavizado: suavizador resistente 3RSSH
Segundo suavizado: promedio móvil simple de 5 términos

Periodo Datos Suavizado Ásperezas


1901 422.0
1902 376.0
1903 355.0 373.6 -18.6
1904 381.0 370.4 10.6
1905 377.0 366.95 10.05
1906 358.0 364.6 -6.6
1907 350.0 364.9 -14.9
1908 354.0 369.0 -15.0
1909 377.0 376.4 0.6
1910 385.0 384.3 0.7
… … … …

©2006 por StatPoint, Inc. Series de Tiempo – Suavización - 8


STATGRAPHICS – Rev. 4/25/2007

La tabla incluye:

• Datos: las observaciones originales yt.

• Suavización: los valores de la suavización final St.

• Asperezas: los residuos que quedaron atrás definidos como Rt = yt – St.

Gráfica de residuos
La Gráfica de Residuos despliega las asperezas:

Gráfica de Serie de Tiempo en Áspero para Leading average

55

35
Áspero

15

-5

-25
1900 1920 1940 1960 1980 2000 2020

Puede ser usada para identificar valores atípicos u otras observaciones inusuales, tales
como logros sobresalientes en 1941 cuando Ted Williams hizo .406 hits y en 1980
cuando George Brett obtuvo .390.

Guardar Resultados
Los siguientes resultados pueden ser guardados en la hoja de base de datos:

1. Datos – los datos originales, incluyendo cualquier valor interpolado usado para
reemplazar observaciones que faltaban.

2. Datos ajustados – los datos después de aplicarles cualquier ajuste requerido.

3. Suavización – los valores suavizados St.

©2006 por StatPoint, Inc. Series de Tiempo – Suavización - 9


STATGRAPHICS – Rev. 4/25/2007

4. Aspero – los valores de los residuos Rt.

©2006 por StatPoint, Inc. Series de Tiempo – Suavización - 10

También podría gustarte