TEMA 3. Técnicas Elementales de Predicción Con Información Histórica

Técnicas de prospectiva
TEMA 3. TÉCNICAS ELEMENTALES DE PREDICCIÓN

CON INFORMACIÓN HISTÓRICA
1
Tema 3. Técnicas elementales de predicción con información histórica
1. Predicción según las relaciones entre las variables: técnicas econométricas.

 El problema del sobre-ajuste (overfitting)
 Un caso particular: Nowcasting.
2. Información histórica: componentes de una serie económica.
3. Predicción con series históricas con tendencia: Método de regresión
4. Medias móviles.
5. Alisado exponencial (el alisado simple, alisado con tendencia) y Método de
Holt
6. Predicción en series con componente estacional: Holt-Winters con
estacionalidad.
Bibliografía: Pulido y López (1999), cap. 3. Fox, E. and Guestrin, C. (2017)
2
1. Predicción según las relaciones entre las variables: técnicas

econométricas.
4. Medias móviles.
Holt
estacionalidad.
3
1. Predicción según las relaciones entre las variables: técnicas econométricas
 Se utilizan modelos econométricos/estadísticos para conocer la relación
entre la variable a predecir (y) y una serie de predictores (x).
 Existen dos enfoques:
 Enfoque económico o econométrico: es importante conocer la relación entras
las variables (x) y las variables (y).
 Se pueden diseñar medidas para influir en la relación entre las variables.
 Enfoque puramente estadístico: el objetivo es predecir, independientemente

cual sea la relación entre las variables.
 Lo único relevante es la capacidad predictiva del modelo.
 Este tipo de técnicas de predicción están siendo ahora muy relevantes:

 machine learning: técnicas de estimación novedosas
 y big data: grandes conjuntos de información con multitud de variables.
4
 De forma genérica la técnica se resume en:
1. Definir un modelo econométrico/estadístico:
 Y= f(x) + u
 Se determina, por tanto, qué variables explican la variable Y.
 Por ejemplo, se explica el precio de venta (Y) de las viviendas en función de los metros
cuadrados de superficie de la vivienda (X) -square feets (Sq.ft.)-.
2. Suponer una/varias/múltiples/infinitas formas funcionales para la función f(x).

 Price=w0+w1Sq.ft.+u
3. Estimar por la técnica más adecuada la función f(x): 𝑓 𝑥 .

 Los parámetros estimados permiten conocer la relación causal entre las variables (X) y la
variable a predecir (Y).
 Se obtienen los parámetros 𝑤𝑜 y 𝑤1.
4. Validez del modelo estimado:

 Enfoque tradicional: ajuste del modelo, significatividad de los parámetros, etc.
 Nuevo enfoque: se valora el modelo únicamente por su capacidad predictiva.
 Ajustes muy buenos pueden generar un problema de sobre-ajuste (over-fitting).
5. Obtener las estimaciones a partir del modelo estimado.

 𝑦=𝑓 𝑥 .
5
 Distintas formas funcionales Modelo lineal (modelo
estándard de econometría)
Relación cuadrática
Regresión polinómica
Alisado de datos
Regresión polinómica con

componentes trigonométricos
6
1. Predicción según las relaciones entre las variables: el problema del sobre-
ajuste
 En muchas aplicaciones de predicción en economía existen multitud de
variables a seleccionar para hacer predicciones.
 Por ejemplo, para hacer predicciones del PIB se puede utilizar el consumo de
electricidad, el consumo de cemento, el consumo de los hogares, los índices de
sentimiento económico, licencias de obras para construcción de viviendas, datos
de comercio exterior (importaciones y exportaciones), número de ocupados,
grado de utilización del capital, tipos de interés, evolución de los índices
bursátiles, etc.
 Del mismo modo, se pueden seleccionar modelos econométricos
suficientemente complejos como para que el ajuste sea “casi perfecto”.
 Aunque pueda parecer paradójico, estas dos cuestiones son problemáticas
para la predicción.
 Supongamos, de nuevo, el caso del precio de las viviendas (Y) explicado por
un conjunto de variables X (superficie de la misma) que generasen un ajuste
perfecto.
 Desde el punto de vista del la relación entre las variables esto sería bueno,
estaríamos explicando una proporción muy alta de la varianza de la (Y) con
nuestras variables explicativas (X).
7
ajuste
 Contamos con un conjunto de viviendas (puntos azules en los gráficos).
Podemos utilizar distintos modelos, de forma que el ajuste cada vez sería
mejor:
Modelo 1 Modelo 2 Modelo 3
 Sin embargo, la capacidad de predicción de los puntos

blancos los modelos no aumenta de la misma manera que
Modelo 4
el ajuste.
 Incluso, un ajuste perfecto podría significar que la
capacidad predictiva disminuyese.
 Generalmente, modelos más complejos (por forma
funcional o por más variables) generan menores errores
de ajuste, pero mayores errores de predicción.
 A este problema se le conoce como sobre-ajuste
(overfitting): Un ajuste excesivo genera malas
predicciones.
8
ajuste
 ¿Como solucionar el problema del sobre-ajuste?
1. Se divide la muestra de tamaño N de datos disponibles en dos grupos:
 Grupo de entrenamiento (todas las observaciones disponibles menos las del grupo
de contraste). i=1…n. Grupo de observaciones en el que se estima el modelo y con
ello la relación de causalidad.
 Grupo de contraste (5%-30%) de las observaciones, dependiendo del tamaño de la
muestra (tienen que quedar observaciones suficientes en el grupo de entrenamiento
para poder estimar el modelo). i=n+1… N. Grupo de observaciones de la X sobre el
que se realiza la predicción a partir del modelo estimado para el grupo de
entrenamiento.
 Dos opciones para seleccionarlas: aleatoriamente (si los datos son un corte transversal) o los
últimos años, si los datos son series temporales.
2. Se estiman los distintos modelos posibles para el grupo de entrenamiento.

3. Se calcula el error cuadrático medio de predicción (test error): error
cuadrático medio calculado para las observaciones del grupo de contraste (grupo
sobre el cual se realizan las predicciones).
Test error = ∑ 𝑦𝑖 𝑓 𝑥𝑖 2
4. Se selecciona el modelo con menor test error, aunque no sea el que mejor
ajuste presente.
9
ajuste
 Esta forma de solucionar el problema del sobre ajuste requiere tener una
muestra suficientemente grande para evitar:
 Estimar con pocos datos el modelo con el grupo de entrenamiento.
 Obtener predicciones extrañas debido a valores atípicos en el grupo de contraste.
 Esta aproximación es usada fundamentalmente cuando el objeto de
estudio es puramente la predicción y menos cuando el objeto de la
predicción es conocer cuál es la influencia de cada x sobre los valores futuros
de la variable y.
• Bondad del ajuste

• Relevancia del problema de
multicolinealidad perfecta
10
1. Predicción según las relaciones entre las variables: el Nowcasting
 Según Eurostat (Glossary on Rapid Estimates) Nowcasting es una
evaluación rápida realizada en el momento actual T (el presente) de una
variable económica observada en el mismo periodo de referencia T.
 Nowcasting utiliza la información en tiempo real disponible entre T y T-1.
 Por lo tanto, se predice el valor presente de una variable utilizando información
contemporánea.
 Nowcasting es distinto de predicción (proceso que estimación de valores
futuros de una variable todavía no observados).
Ejemplo
 El nowcasting significaría, hacer
estimaciones del PIB del cuarto
trimestre a lo largo de enero.
 En ese periodo existe multitud de
información contemporánea (entre
t y t-1) que puede ser utilizara
para realizar la estimación: del
mercado de trabajo, mercados
financieros, consumo de
electricidad, etc.
11
1. Predicción según las relaciones entre las variables: el Nowcasting
 En general se utilizan la técnica descrita anteriormente, pero presentan
problemas adicionales (Castle, Hendry, and Kitov, 2013; Bánbura, Giannone and Reichlin, 2011):
 No todas las variables explicativas contemporáneas son publicadas de forma
sincrónica, de forma que no siempre se tiene el mismo conjunto de predictores
(variables X) en el momento de realizar el nowcasting.
 La información utilizada para las estimaciones es revisada y actualizada
frecuentemente (dato provisional), por lo que hay asumir que controlar por los
errores de medida.
 Suelen haber más variables que observaciones.
 La información de base para las estimaciones tiene distinta frecuencia que la
de la variable a estimar.
De ahí su utilidad para estimar el dato provisional.
 Los procedimientos del nowcasting se adaptan en cada caso a las necesidades
de cada caso, superando estos problemas adicionales.
12

4. Medias móviles.
Holt
estacionalidad.
13

2,000
4,000
6,000
8,000
10,000
12,000
14,000
16,000
18,000
0
ene-87
sep-87
may-88
ene-89
sep-89
may-90
ene-91
sep-91
may-92
ene-93
sep-93
may-94
ene-95
sep-95
may-96
IBEX-35. Dic 1989=3000
ene-97
sep-97
may-98
ene-99
sep-99
may-00
ene-01
sep-01
may-02
ene-03
sep-03
may-04
ene-05
sep-05
may-06
ene-07
sep-07
may-08
ene-09
sep-09
may-10
ene-11
sep-11
may-12
ene-13
sep-13
may-14
ene-15
sep-15
2. Información histórica: componentes de una serie económica
may-16
ene-17
14
 Índice de producción industrial. 2005=100
160
140
120
100
80
60
40
20
0
1975M02
1975M12
1976M10
1977M08
1978M06
1979M04
1980M02
1980M12
1981M10
1982M08
1983M06
1984M04
1985M02
1985M12
1986M10
1987M08
1988M06
1989M04
1990M02
1990M12
1991M10
1992M08
1993M06
1994M04
1995M02
1995M12
1996M10
1997M08
1998M06
1999M04
2000M02
2000M12
2001M10
2002M08
2003M06
2004M04
2005M02
2005M12
2006M10
2007M08
2008M06
2009M04
2010M02
2010M12
2011M10
2012M08
2013M06
2014M04
2015M02
2015M12
2016M10
• La producción cae cada agosto. (Componente estacional).
• Los picos estacionales han sido más reducidos en los años de crisis
• Se observan claramente los periodos de expansión y recesión: años por
encima y por debajo de la tendencia (lineal).
• Se puede observar un cambio estructural en el comportamiento de la
serie debido al efecto de la crisis. 15
 SERIE TEMPORAL: Conjunto de observaciones de una variable,
normalmente a intervalos regulares de tiempo, ordenadas
cronológicamente.
 El esquema generador de una serie temporal se puede descomponer en

cinco componentes:
 Tendencia (Pt): Recoge la evolución a largo plazo de la serie (variaciones a

largo plazo).
 Ciclo (Ct): Oscilaciones o fluctuaciones por encima y por debajo de la

tendencia con periodicidad superior al año.
 Muchas veces es difícil separar el ciclo de la tendencia por lo que se habla de una
única componente que denominaríamos ciclo-tendencia.
16
 Estacionalidad (St): Variaciones o fluctuaciones con periodicidad inferior a
un año y que se repiten en años sucesivos (periodicidad fija).
 Solo puede existir con series temporales con periodicidad (frecuencia) inferior al
año.
 Surge por factores institucionales, climatológicos o técnicos.
 Ventas en campaña navideña, aumento de las pernoctaciones hoteleras en verano, caída de la
producción industrial en agosto.
 La regularidad del acontecimiento se produce cada s periodos, a lo que se denomina

orden de estacionalidad.
 s= 4 con datos trimestrales
 s= 12 con datos mensuales
 Componente irregular (It): Movimientos esporádicos con carácter residual

(No tiene un comportamiento regular), sin periodicidad en el tiempo
(catástrofes, Huelgas, pascua, outliers): observaciones anómalas, valores atípicos
en la serie, análisis de intervención…
 Perturbación aleatoria (ut): Variable aleatoria con esperanza matemática igual
a cero, varianza constante y covarianza nula.
17

20
40
60
80
100
120
140
160
0
1975M02
1975M08
1976M02
1976M08
1977M02
1977M08
1978M02
1978M08
1979M02
1979M08
1980M02
1980M08
1981M02
1981M08
1982M02
1982M08
1983M02
•
•
•
•
Tendencia
1983M08
1984M02
1984M08
Estacionalidad
1985M02
1985M08
1986M02
1986M08
1987M02
1987M08
1988M02
1988M08
1989M02
1989M08
1990M02
1990M08
1991M02
1991M08
1992M02
1992M08
1993M02
1993M08
1994M02
1994M08
1995M02
1995M08
1996M02
1996M08
1997M02
serie debido al efecto de la crisis.

1997M08
1998M02
1998M08
1999M02
1999M08
Índice de producción industrial. 2005=100
2000M02
2000M08
2001M02
encima y por debajo de la tendencia (lineal).

2001M08
2002M02
2002M08
2003M02
2003M08
2004M02
2004M08
2005M02
2005M08
2006M02
La producción cae cada agosto (Componente estacional).
2006M08
2007M02
2007M08
2008M02
industrial en
2008M08
diciembre de
la producción
2009M02
2009M08
2010M02
Los picos estacionales han sido más reducidos en los años de crisis
2008 por la crisis
Outlier: caída en
2010M08
Se puede observar un cambio estructural en el comportamiento de la
2011M02
2011M08
Se observan claramente los periodos de expansión y recesión: años por
2012M02
2012M08
2013M02
2013M08
2014M02
2014M08
2015M02
Ciclo
2015M08
2016M02
2016M08
2017M02
18
19
 Hemos visto, por tanto, que una serie temporal presenta diferentes componentes:
Yt = f(Tt, Ct, St, It,Ut,)
 Antes de continuar conviene hacer algunas precisiones respecto al tratamiento de los
componentes:
 El componente irregular (It) no va a ser tratado, dada la complicación metodológica que implica su
análisis.
 La tendencia y el ciclo se van a tratar de manera conjunta, considerando que Tt comprende la
variable ciclo-tendencia. De este modo, nos centraremos en tres componentes:
Yt = f(Tt, St, Ut): Ciclo-tendencia, estacionalidad y la perturbación aleatoria.
 Existen diversas formas de modelizar la relación de las tres componentes de una serie
temporal. Las más frecuentes son las siguientes:
 ADITIVA: Yt = Tt + St + Ut (La más usual)
 MULTIPLICATIVA: Yt = Ttꞏ Stꞏ Ut (Se reduce significativamente el componente estacional)
20
 Para hacer predicción se han de conocer todas estas características de las
series: Yt = f(Tt,St,Ut)
 En este tema se analiza cómo utilizar la tendencia y el componente cíclico
de las series para realizar predicción.
 También se estudia como hacer predicción en series sin tendencia
mediante técnicas elementales.
 Implícitamente estamos asumiendo que NO nos interesa la estacionalidad St,
sino sólo el ciclo tendencia (Tt) en el esquema.
 En el tema siguiente del curso (Tema 4) se analizan formas avanzadas de
predicción para series sin tendencia (o a las que se le ha eliminado la
tendencia).
21
COMPONENTE TENDENCIAL: TENDENCIA DETERMINISTA VS
ESTOCÁSTICA
 Una serie temporal (Yt) presenta tendencia determinista (es una serie no
estacionaria en media, o bien que presenta tendencia en media, pero
estacionaria en varianza) cuando la esperanza de la serie es función del
tiempo: E(Yt)=f(t).
 Una serie temporal (Yt) presenta tendencia estocástica (es una serie no
estacionaria en varianza o bien que presenta tendencia en varianza) cuando
la varianza de la serie es función del tiempo: Var(Yt)=f(t). La dispersión
de la serie no es constante a lo largo del tiempo.
 Ejemplos:
 Tendencia determinística (modelo A): Yt=1+2t+ut
 Tendencia estocástica (modelo B): Yt=Yt-1+ut
 En el modelo A, shocks aleatorios sólo tienen efectos transitorios, mientras que en el
modelo B tendrán efectos permanentes (se acumulan en el tiempo).
 Cuando una serie no tiene tendencia se dice que es ESTACIONARIA.

 Estacionaria en media: sino tiene tendencia determinística.
 Estacionaria en varianza: si no tiene tendencia estocástica.
22
2 Información histórica: componentes de una serie económica
 Si la serie es estacionaria en media (sin tendencia) oscilará en torno a su
media no alejándose permanente de ella: serie Y1 (ruido blanco) e Y5(serie
estacionaria).
 Si la serie es estacionaria en varianza su dispersión respecto a la media
será constante, enmarcándose en cierta manera en torno a una banda de
ajuste o amplitud constante (series Y1 y Y5).
Serie ruido blanco Serie estacionaria

9
1
1975 1980 1985 1990 1995 2000 2005
Y5
• No es estacionaria: ni en media, ni en varianza
• Oscila en torno a su media
• Su varianza respecto a la media es constante
23
 La serie Y2 presenta tendencia determinística, donde observamos que la
media de la serie tiende a crecer a lo largo del tiempo. La esperanza de la
serie es función del tiempo.
 La serie Y3 presenta tendencia estocástica (tendencia en varianza) la

dispersión de la serie no será constante a lo largo del tiempo. La varianza de
la serie es función del tiempo.
Tendencia estocástica
Tendencia determinista
900
800
700
600
500
400
300
200
100
0
1975 1980 1985 1990 1995 2000 2005
Y2
24
2. Componentes no observables de una serie temporal
Para saber si una serie tiene tendencia se utiliza:
 Gráfico de la serie
 Función de autocorrelación estimada (FACE)
 La función de autocorrelación se define (cuando el proceso es estacionario):
T
Cov Yt , Yt  k   Y  Y Y

t t k Y 
 k  rk   t  k 1
T
Var (Yt )Var (Yt  k )
 Y  Y 
2
t
t 1
 Por lo que los coeficientes de primer y segundo orden vendrán dados por:
T T
 (Yt  Y )(Yt 1  Y )  (Yt  Y )(Yt  2  Y )
̂1  r1  t 2
T ̂ 2  r2  t 3
T
 (Yt  Y )
2
 (Yt  Y )
2
t 1 t 1
 El correlograma muestral de una serie es la representación gráfica de los

coeficientes de autocorrelación estimados.
 ¿Son significativos? H0: k=0; H1: k≠0
 Bajo la hipótesis nula k ~ N(0,) con =1/ 𝑇
ˆ k
 Luego, k será igual a cero si Pr(1,96   1,96)  0,95 .

 ¿Cómo detectamos a través de la FACE la existencia de tendencia?
1. El primer coeficiente de autocorrelación suele estar cerca de 1 y es estadísticamente
significativo.
2. Los coeficientes de autocorrelación, siendo significativos, NO decrecen de forma
progresiva y rápidamente a medida que se aleja el desfase.
25
 Con el correlograma se comprueba que tanto la serie del IPI como del IBEX-
35 tienen tendencia
Función de autocorrelación
IBEX-35 IPI
26

4. Medias móviles.
Holt
estacionalidad.
27
3. Predicción con series con tendencia: Método de regresión
 ¿Cómo se puede hacer predicción con series temporales con tendencia?
 La primera forma es utilizando tendencias lineales, cuadráticas u otras
formas funcionales (práctica 1, ejercicio 2 y 3).
Recordemos: hemos
supuesto que
Tt comprende la variable
ciclo-tendencia.
28
3. Técnicas de alisado. Medias móviles
 En muchos casos las técnicas de estimación de tendencia NO aprovechan
de la mejor manera la información. Se pueden utilizar otras técnicas.
160
Dependent Variable: IPI
Method: Least Squares
140 Included observations: 510
120 Variable Coefficient Std. Error t‐Statistic Prob.
60 100
DATE 0.000132 1.12E‐06 118.0412 0
R‐squared 0.034243 Mean dependent var 96.01198

40 80 Adjusted R‐squared 0.034243 S.D. dependent var 18.70357
S.E. of regression 18.38054 Akaike info criterion 8.662421
20 60 Sum squared resid 171962.8 Schwarz criterion 8.670724
Log likelihood ‐2207.917 Hannan‐Quinn criter. 8.665677
Durbin‐Watson stat 0.75111
0 40
-20
-40
-60
1975 1980 1985 1990 1995 2000 2005 2010 2015
La tendencia lineal no aprovecha
toda la información de la serie: los
Residual Actual Fitted residuos no son ruido blanco. La
tendencia lineal se ajusta poco a
los datos reales (Actual).
29

4. Medias móviles.
Holt
estacionalidad.
30
FORMAS DE ELIMINAR LA TENDENCIA DE UNA SERIE
 EJEMPLO: IBEX-35
 ¿Cómo se puede eliminar la tendencia de una serie?
18,000
16,000
14,000
12,000
10,000
8,000
6,000
4,000
2,000
0
ene-87
may-88
ene-89
may-90
ene-91
may-92
ene-93
may-94
ene-95
may-96
ene-97
may-98
ene-99
may-00
ene-01
may-02
ene-03
may-04
ene-05
may-06
ene-07
may-08
ene-09
may-10
ene-11
may-12
ene-13
may-14
ene-15
may-16
ene-17
sep-87
sep-89
sep-91
sep-93
sep-95
sep-97
sep-99
sep-01
sep-03
sep-05
sep-07
sep-09
sep-11
sep-13
sep-15
• No es estacionaria: ni en media, ni en varianza.
• Para convertir la serie en estacionaria se suele proceder de dos maneras:
se calculan las primeras diferencias o se toman logaritmos.
31


-500
1,500
2,000
0
500
1,000
-2,500
-2,000
-1,500
-1,000

enero-87
octubre-87
julio-88
abril-89
enero-90
octubre-90
julio-91
abril-92
enero-93
octubre-93
julio-94
abril-95
enero-96
octubre-96
(para quitarle la tendencia)
julio-97
abril-98
enero-99
octubre-99
IBEX-35 en primeras diferencias:
julio-00
DIBEX35t = IBEX35t - IBEX35t-1
abril-01
enero-02
octubre-02
julio-03
abril-04
enero-05
octubre-05
julio-06
abril-07
enero-08
octubre-08
julio-09
abril-10
enero-11
octubre-11
julio-12
abril-13
enero-14
octubre-14
julio-15
abril-16
enero-17
Cálculo de primeras diferencias para hacer que la serie sea estacionaria
32


0.0
0.5
1.0
1.5
2.0
2.5
3.0
3.5
4.0
4.5

enero-87
octubre-87
julio-88
abril-89
enero-90
octubre-90
julio-91
abril-92
enero-93
octubre-93
julio-94
abril-95
IBEX-35 en logaritmos:
enero-96
octubre-96
julio-97
LnIBEX35t = ln(IBEX35t)
abril-98
enero-99
octubre-99
julio-00
abril-01
enero-02
octubre-02
julio-03
abril-04
enero-05
octubre-05
julio-06
abril-07
enero-08
octubre-08
julio-09
abril-10
enero-11
octubre-11
julio-12
abril-13
enero-14
octubre-14
También se suelen tomar logaritmos para desestacionalizar la serie:
julio-15
abril-16
enero-17
33
 Existen otras técnicas que permiten utilizar mejor la información, y
mejorar, por tanto, la predicción.
 Antes de explicar la media móvil se puede pensar en un MÉTODO
INGENUO (naïve) de predicción:
 La predicción de una variable y para el año t+1 (𝑦 ) se puede calcular de dos
formas:
 I: 𝑦 =yt El valor de la predicción es el del último año
 II: 𝑦 - yt= yt - yt-1 La predicción se obtiene suponiendo que el incremento

de será igual al del último año.
 A partir de esta técnica ingenua se describen las medias móviles.
Método
Medias móviles
ingenuo
34
1
 La media móvil de 3 periodos de una serie temporal es: M t3   yt  yt 1  yt 2 
3
 La media móvil de 4 periodos de una serie temporal es: M t4  1  yt  yt 1  yt 2  yt 3 
4
 De forma general, la media móvil de s periodos de una serie temporal es:
1 1 s 1
M   yt  yt 1  ...  yt  s 1    yt i
t
s
s s i 0
 s es el número de periodos de alisado, también llamado banda de alisado.
 Las medias móviles “alisan” la serie. Es una forma de calcular el efecto de
una tendencia no lineal que se ajusta mejor que simplemente una recta.
 Para predecir se puede utilizar la última media móvil calculada:

𝑦 =Mts
 Esta puede ser una buena aproximación para el caso de que no exista
tendencia.
 La media móvil se puede asignar al punto central, en lugar de al último
valor de la media: 1 1 s
M 
r
 y  y  ...  y  y  ...  y  
t
2r  1
t r t  r 1 t y
t 1 t r 
2r  1 i  0
t i
35
0
20
40
60
80
100
120
140
160
0
20
40
60
80
100
120
140
160
1975M01 1975M01
1976M05 1976M05
1977M09 1977M09
1979M01 1979M01
1980M05 1980M05
1981M09 1981M09
1983M01 1983M01
1984M05 1984M05
1985M09 1985M09
1987M01 1987M01
1988M05 1988M05
1989M09 1989M09
1991M01 1991M01
IPI
1992M05
IPI
1992M05
1993M09 1993M09
1995M01 1995M01
1996M05 1996M05
1997M09 1997M09
1999M01 1999M01
2000M05 2000M05
2001M09
IPI M3 2001M09
IPI M12
2003M01 2003M01
2004M05 2004M05
2005M09 2005M09
2007M01 2007M01
2008M05 2008M05
2009M09 2009M09
2011M01 2011M01
2012M05 2012M05
2013M09 2013M09
2015M01 2015M01
2016M05 2016M05
Media móvil 12 meses
0
20
40
60
80
100
120
140
160
0
20
40
60
80
100
120
140
160
1975M01 1975M01
1976M05 1976M05
1977M09 1977M09
1979M01 1979M01
1980M05 1980M05
1981M09 1981M09
1983M01 1983M01
1984M05 1984M05
1985M09 1985M09
1987M01 1987M01
1988M05 1988M05
1989M09 1989M09
1991M01 1991M01
IPI
1992M05
IPI
1992M05
1993M09 1993M09
1995M01 1995M01
1996M05 1996M05
1997M09 1997M09
1999M01 1999M01
2000M05 2000M05
2001M09 2001M09
IPI M6
IPI M24
2003M01 2003M01
2004M05 2004M05
2005M09 2005M09
2007M01 2007M01
2008M05 2008M05
2009M09 2009M09
2011M01 2011M01
2012M05 2012M05
2013M09 2013M09
2015M01 2015M01
2016M05 2016M05
36

4. Medias móviles.
5. Alisado exponencial (el alisado simple, alisado con tendencia) y Método
de Holt
estacionalidad.
37
Holt
MEDIA MÓVIL EXPONENCIAL o ALISADO EXPONENCIAL
 El concepto de media móvil se puede generalizar si se considera que los retardos
más antiguos pesan menos en la media móvil:
n
yt    yt  1    yt 1  1    yt  2  ...  1    yt  n     1    yt i 1
 2 n i
  (1)
i 0
donde  es el coeficiente de alisado, que puede tomar valores entre 0 y 1.

 Mayores valores de , menor alisado.


La suma de los coeficientes de alisado () siempre será 1, pues   1   
i
  1
i 0 1  1   
 A mayor valor de , menor número de sumandos a considerar
=1 → yts  yt
=0.95 → yts  0,95 yt  0,95 1  0,95  yt 1  0,95 1  0,95  yt  2  0,95 1  0,95  yt 3   0,95 yt  0, 048 yt 1  0, 0024 yt 2  0, 000119 yt 3
2 3
 
 Valores pequeños de  implican muchos valores pasados de la y que se

utilizan en la media, todos ellos con ponderaciones pequeñas.
=0,1 → yt  0,1yt  0, 09 yt 1  0, 081yt 2  0, 073 yt 3  0, 066 yt 4  
s
 En general, el número de sumandos de una media móvil será:

Sumandos = (2- )/
38
Holt
 La media móvil exponencial se puede expresar de la siguiente manera:
 Se desfasa un periodo la media móvil anterior
yt1    yt 1  1    yt  2  1    yt 3  ...  1    yt  n 
2 n
 
 Se multiplica por (1-)
1    yt1   1    yt 1  1    yt  2  1    yt 3  ...  1    yt  n 1 
2 3 n 1
 (2)
 Si se le resta la ecuación (2) a la (1), se obtiene: yt  1    yt1   yt Se supone que el
último sumando
Por lo que: yt   yt  1    yt 1
 
 (3) de la ecuación (2)
es cero
 Es decir, la media móvil exponencial se puede expresar como la media

(ponderada por el factor ) entre el valor actual de la variable y la media
móvil desfasada un periodo.
 Esta expresión facilita el cálculo de toda la media móvil exponencial.
 Simplemente hay que asignar un valor inicial a la serie. Suele ser el primer valor:
y1
39
Holt
 La media móvil exponencial se puede expresar de la siguiente manera:
= 0.1 Coeficiente de alisado
𝒚𝜶𝒕
IBEX35 Media móvil exponencial
2003 6,723 6,723 Valor orignal de la serie
2004 8,196 6,870 6,870=8,196*0.1+(1‐0.1)*6,723 yt   yt  1    yt1
2005 9,901 7,173 7,173=9,901*0.1+(1‐0.1)*6,870
2006 12,344 7,690 7,690=12,344*0.1+(1‐0.1)*7,173
2007 14,894 8,411 8,411=14,894*0.1+(1‐0.1)*7,690
2008 11,743 8,744 8,744=11,743*0.1+(1‐0.1)*8,411
2009 10,093 8,879 8,879=10,093*0.1+(1‐0.1)*8,744
2010 10,201 9,011 9,011=10,201*0.1+(1‐0.1)*8,879
2011 9,735 9,083 9,083=9,735*0.1+(1‐0.1)*9,011
2012 7,583 8,933 8,933=7,583*0.1+(1‐0.1)*9,083
2013 8,325 8,872 8,872=8,325*0.1+(1‐0.1)*8,933
16,000
14,000
12,000
10,000
8,000
6,000
4,000
2,000
0
2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013
IBEX35 Media móvil exponencial
40
Holt
 Para hacer la predicción, se utiliza la media exponencial que se inicia en
el último dato disponible:
yˆt 1  yt   yt  1    yt1
Al igual que antes, las medias móviles exponenciales son válidas cuando la serie
no tiene tendencia (o cuando se ha eliminado).
 ¿Qué parámetro  se selecciona? Depende del tamaño de las
oscilaciones
 Mayor valor alisa menos la serie.

 Si la serie tiene fuertes oscilaciones, conviene tener mayores valores de , pues así
se recogerán mejor las oscilaciones.
 Menor valor alisa más la serie.

 Con series con pequeñas oscilaciones es mejor utilizar valores reducidos de 
(entre 0,01 y 0,4), considerándose así más retardos de la variable.
 En general, los programas de ordenador suelen calcular automáticamente el

óptimo (el que proporciona una serie con menor error cuadrático medio con la
serie observada).
Oscilaciones  Alisado de la serie
41
Holt Media móvil exponencial =0,1
Media móvil exponencial =0,5
120 120
110
110
100
100
90
90
80
80
70
70
60
60
50
50
40
40
30
30 1975 1980 1985 1990 1995 2000 2005 2010
1975 1980 1985 1990 1995 2000 2005 2010
IPI IPI_01
IPI IPI_05
Media móvil exponencial óptima =0,1140

120
110
100
90
80
70
60
50
40
30
1975 1980 1985 1990 1995 2000 2005 2010
IPI IPISM
42
Holt
 La media móvil y el alisado exponencial son útiles cuando la serie no
tiene tendencia (cuando ha sido eliminada).
 Pero, si existe tendencia:
1) se puede utilizar la DOBLE media móvil o el DOBLE alisado (alisado con

1
tendencia) M ts , s   M ts  M ts1  ...  M ts s 1 
s n
yt    yt   1    yt 1   1    yt  2  ...   1    yt  n     1    yt i
2 n i
 Doble media móvil:   i 0
 Doble alisado: ó yt   yt  1    yt1
2) Utilizar un alisado que incluya un término de tendencia: Alisado de Holt
43
Holt
 Alisado de Holt (o alisado exponencial lineal con doble parámetro)
 Existe tendencia
 Se añade un nuevo parámetro de alisado: 
 Se modifica la definición de alisado exponencial (ecuación 3) incluyéndose un
término de tendencia: y    y  1     y   b 
t t t 1 t 1
 Donde bt    yt  yt1   1    bt 1

at  yt

 La predicción vendrá dada por: yˆ t  h  y t  bt h
 Los valores iniciales de los parámetros suele suponerse de la siguiente manera:
y1  y1

 b1=0
  y  suelen ser seleccionados por los programas informáticos de forma que se utiliza el
valor con menor Error Cuadrático Medio de la predicción.
 Si =0, entonces el método de Holt-Winters es equivalente al alisado exponencial

simple.
 El parámetro  mide la importancia que se le da al incremento de la variable
debido a la tendencia.
44

4. Medias móviles.
Holt
estacionalidad.
45
estacionalidad
 El método de Holt (o alisado exponencial lineal con doble parámetro) se
puede aplicar cuando existe estacionalidad: Holt-Winters. Existe tendencia y
estacionalidad
 La estacionalidad hace referencia a variaciones o fluctuaciones con

periodicidad inferior a un año y que se repiten en años sucesivos
(periodicidad fija).
 Supondremos que nuestros datos son mensuales.
 La estacionalidad puede modelizarse de forma aditiva (Y=T+S) o
multiplicativa (Y=T*S).
 S es el factor estacional. Las expresiones indican que a la tendencia (T) de la
serie (Y) hay que aplicarle cada mes un factor estacional S (sumarlo o
multiplicarlo) para obtener el valor observado.
 Ej. Alrededor de la tendencia, en agosto, la producción industrial disminuye un 70%).
La tendencia la multiplicaríamos por 0,7 para obtener el valor de la producción en
Agosto.
 El método del Holt-Winters con estacionalidad es similar al anterior pero

corrigiendo la serie por un factor estacional.
 Supone que el factor estacional es multiplicativo.
46
estacionalidad
 El método del Holt-Winters con estacionalidad o alisado exponencial con
triple parámetro:
 Si la serie es mensual*, el dato de 12 meses antes tiene el mismo componente
estacional.
t h 
yˆ  y   b h s t t  t 12  h
 Con estacionalidad, las variables son las siguientes:

yt
yt    1     yt1  bt 1 
st 12
bt    yt  yt1   1    bt 1
 El único cambio que ha habido ha sido el la última expresión en la que se

divide yt por el factor estacional st-12.
 El factor estacional es multiplicativo.
*Si en lugar de datos mensuales nuestros datos fuesen trimestrales, los factores
estacionales y subíndices serían 4 en lugar de 12.
47
estacionalidad
¿Cómo se calculan los factores estacionales?
Dos opciones aunque misma interpretación:
y
1. Media móvil. Factor estacional: st  t
M t 12
 yt / Mt-12 mide cuánto mayor es el valor de la variable en comparación con la
serie desestacionalizada.
 Se puede definir el coeficiente de variación estacional para un mes k (CVEk):
cuanto se desvía en promedio la serie yt en un mes k respecto a su valor
tendencial: T
CVE k   stk
t 1
2. Alisado exponencial: El factor estacional se calcula mediante un alisado

exponencial de los factores estacionales calculados en el punto 1.
 Para ello se necesita un tercer parámetro de alisado ():
yt
st    1    st 12
M t 12
Cuánto mayor es el valor de la variable en comparación a
la serie desestacionalizada
48

TEMA 3. Técnicas Elementales de Predicción Con Información Histórica

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

TEMA 3. Técnicas Elementales de Predicción Con Información Histórica

Cargado por

Copyright:

Formatos disponibles

Técnicas de prospectiva

TEMA 3. TÉCNICAS ELEMENTALES DE PREDICCIÓN

1. Predicción según las relaciones entre las variables: técnicas econométricas.

Bibliografía: Pulido y López (1999), cap. 3. Fox, E. and Guestrin, C. (2017)

1. Predicción según las relaciones entre las variables: técnicas

Bibliografía: Pulido y López (1999), cap. 3. Fox, E. and Guestrin, C. (2017)

 Enfoque puramente estadístico: el objetivo es predecir, independientemente

 Este tipo de técnicas de predicción están siendo ahora muy relevantes:

2. Suponer una/varias/múltiples/infinitas formas funcionales para la función f(x).

3. Estimar por la técnica más adecuada la función f(x): 𝑓 𝑥 .

4. Validez del modelo estimado:

5. Obtener las estimaciones a partir del modelo estimado.

Regresión polinómica con

Modelo 1 Modelo 2 Modelo 3

 Sin embargo, la capacidad de predicción de los puntos

2. Se estiman los distintos modelos posibles para el grupo de entrenamiento.

• Bondad del ajuste

1. Predicción según las relaciones entre las variables: técnicas econométricas.

Bibliografía: Pulido y López (1999), cap. 3. Fox, E. and Guestrin, C. (2017)

 El esquema generador de una serie temporal se puede descomponer en

 Tendencia (Pt): Recoge la evolución a largo plazo de la serie (variaciones a

 Ciclo (Ct): Oscilaciones o fluctuaciones por encima y por debajo de la

 La regularidad del acontecimiento se produce cada s periodos, a lo que se denomina

 s= 12 con datos mensuales

 Componente irregular (It): Movimientos esporádicos con carácter residual

serie debido al efecto de la crisis.

encima y por debajo de la tendencia (lineal).

 Cuando una serie no tiene tendencia se dice que es ESTACIONARIA.

Serie ruido blanco Serie estacionaria

 La serie Y3 presenta tendencia estocástica (tendencia en varianza) la

Cov Yt , Yt  k   Y  Y Y

 El correlograma muestral de una serie es la representación gráfica de los

1. Predicción según las relaciones entre las variables: técnicas econométricas.

Bibliografía: Pulido y López (1999), cap. 3. Fox, E. and Guestrin, C. (2017)

120 Variable Coefficient Std. Error t‐Statistic Prob.

R‐squared 0.034243 Mean dependent var 96.01198

1. Predicción según las relaciones entre las variables: técnicas econométricas.

Bibliografía: Pulido y López (1999), cap. 3. Fox, E. and Guestrin, C. (2017)

 II: 𝑦 - yt= yt - yt-1 La predicción se obtiene suponiendo que el incremento

 A partir de esta técnica ingenua se describen las medias móviles.

 Para predecir se puede utilizar la última media móvil calculada:

1. Predicción según las relaciones entre las variables: técnicas econométricas.

Bibliografía: Pulido y López (1999), cap. 3. Fox, E. and Guestrin, C. (2017)

donde  es el coeficiente de alisado, que puede tomar valores entre 0 y 1.

 Valores pequeños de  implican muchos valores pasados de la y que se

 En general, el número de sumandos de una media móvil será:

 Es decir, la media móvil exponencial se puede expresar como la media

 Mayor valor alisa menos la serie.

 Menor valor alisa más la serie.

 En general, los programas de ordenador suelen calcular automáticamente el

Oscilaciones  Alisado de la serie

Media móvil exponencial óptima =0,1140

1) se puede utilizar la DOBLE media móvil o el DOBLE alisado (alisado con

 Doble alisado: ó yt   yt  1    yt1

2) Utilizar un alisado que incluya un término de tendencia: Alisado de Holt

 Donde bt    yt  yt1   1    bt 1

 Si =0, entonces el método de Holt-Winters es equivalente al alisado exponencial

1. Predicción según las relaciones entre las variables: técnicas econométricas.

Bibliografía: Pulido y López (1999), cap. 3. Fox, E. and Guestrin, C. (2017)

 La estacionalidad hace referencia a variaciones o fluctuaciones con

 El método del Holt-Winters con estacionalidad es similar al anterior pero

 Con estacionalidad, las variables son las siguientes:

 El único cambio que ha habido ha sido el la última expresión en la que se

2. Alisado exponencial: El factor estacional se calcula mediante un alisado