Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Series de Tiempo - Suavización
Series de Tiempo - Suavización
4/25/2007
Resumen
El procedimiento de Suavización está diseñado para ayudar a ilustrar cualquier tendencia
y ciclos presentes en una serie de tiempo. Una serie de tiempo consiste en un conjunto de
datos numéricos tomados en intervalos igualmente espaciados, usualmente sobre un
período de tiempo o espacio. El procedimiento aplica uno o más suavizadores
seleccionados a los datos y grafica los resultados. Los suavizadores disponibles incluyen
promedios móviles clásicos y suavizadores no lineales que sean resistentes a valores
atípicos.
Datos de Muestra:
El archivo baseball.sf6 contiene el promedio de los bateos líderes en la liga Mayor de
Béisbol de los Estados Unidos para cada año entre 1901 y 2004. Los promedios de las
bateos representa la proporción de veces que un jugador obtuvo un hit entre todos los
bateos que fueron ya sea un hit o en un out. La tabla de abajo muestra una lista parcial de
los datos de ese archivo. Los promedios de bateos están expresados como el número de
puntos de cada 1000, es decir que un jugador con 333 hubiera obtenido un hit un tercio
del tiempo.
Captura de Datos
El cuadro de diálogo de captura requiere el nombre de la columna que contiene los datos
de la series de tiempo:
Nota: una cantidad limitada de datos faltantes es permitida, siempre y cuando se muestre
que no hay demasiados valores faltantes cerca. Los valores faltantes son reemplazados
por interpolaciones de acuerdo con el método definido en la sección Cálculos de la
documentación Series de Tiempo- Métodos Descriptivos.
Opciones de Análisis
Opciones de Análisis permite que los datos sean transformados antes de ser graficados o
analizados:
• Inflación: ajusta los datos por la inflación usando la tasa de inflación especificada.
Si una o más transformaciones son requeridas, ellas son aplicadas en el siguiente orden:
440
datos
420 suavizada
Leading average
400
380
360
340
320
1900 1920 1940 1960 1980 2000 2020
Ventana de Opciones
Los suavizadores que se aplican a los datos son especificados con un click en la Gráfica
de Secuencia del Tiempo o en la Tabla de Datos y seleccionando Opciones de Ventana.
El primer suavizador debe ser especificado. El segundo es opcional.
• Suavizado 2: suavizador para aplicar a los valores suavizados que resultan del primer
suavizador, si los hay.
• Longitud del Promedio Móvil: el lapso k del promedio móvil cuando se usa
Promedio Móvil Simple o Promedio Móvil de Henderson. k debe ser mayor que o
igual a 2 para el Promedio Móvil Simple y mayor que o igual a 3 e impar para el
Promedio Móvil de Henderson. Mientras más grande sea el valor de k, el resultado
tendrá mayor suavización.
∑y t+ j
j = − ( k −1) / 2
St = (1)
k
k / 2 −1
0.5 y t − k / 2 + ∑y
j = − k / 2 +1
t+ j + 0.5 y t + k / 2
St = (2)
k
∑w
j =− m
j yt + j
St = m
(3)
∑w
j =− m
j yt + j
5 -5/320 30/1750
6 -6/320 -10/1750
7 -3/320 -25/1750
8 -25/1750
9 -15/1750
10 -5/1750
wj =
[ ][ ][ ][
315 (m − 1) 2 − j 2 m 2 − j 2 (m + 1) 2 − j 2 (3m 2 − 16) − 11 j 2 ] (4)
8m(m 2 − 1)(4m 2 − 1)(4m 2 − 9)(4m 2 − 25)
donde m = (k+3) / 2.
t −1
∑ λ (1 − λ )
j
yt − j
j =0
St = t −1
(5)
∑ λ (1 − λ )
j
j =0
“S”: Desde que las medianas repetidas tienden a dejar planos y valles, esos
puntos planos se separan para tener un resultado más suavizado del que se
obtendría de si no se separaran. La operación de suavización principal se
realiza entonces nuevamente.
Los datos del béisbol fueron suavizados usando dos suavizadores en secuencia: 3RSSH,
seguido de un promedio móvil simple de 5 términos. Esto significa que:
(i) Medianas repetidas de 3 fueron tomadas y repetidas hasta que no hubo algún
cambio adicional.
(ii) Superficies planas y valles fueron separados.
(iii) Medianas repetidas de 3 fueron tomadas y repetidas hasta que no hubo cambio
adicional.
(iv) Hanning fue realizado.
(v) Se tomó un promedio móvil simple de 5 términos.
Tabla de Datos
La tabla de datos despliega las observaciones originales y el resultado suavizado:
La tabla incluye:
Gráfica de residuos
La Gráfica de Residuos despliega las asperezas:
55
35
Áspero
15
-5
-25
1900 1920 1940 1960 1980 2000 2020
Puede ser usada para identificar valores atípicos u otras observaciones inusuales, tales
como logros sobresalientes en 1941 cuando Ted Williams hizo .406 hits y en 1980
cuando George Brett obtuvo .390.
Guardar Resultados
Los siguientes resultados pueden ser guardados en la hoja de base de datos:
1. Datos – los datos originales, incluyendo cualquier valor interpolado usado para
reemplazar observaciones que faltaban.