Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1
Tema 3. Técnicas elementales de predicción con información histórica
2
Tema 3. Técnicas elementales de predicción con información histórica
3
1. Predicción según las relaciones entre las variables: técnicas econométricas
Se utilizan modelos econométricos/estadísticos para conocer la relación
entre la variable a predecir (y) y una serie de predictores (x).
Existen dos enfoques:
Enfoque económico o econométrico: es importante conocer la relación entras
las variables (x) y las variables (y).
Se pueden diseñar medidas para influir en la relación entre las variables.
4
1. Predicción según las relaciones entre las variables: técnicas econométricas
De forma genérica la técnica se resume en:
1. Definir un modelo econométrico/estadístico:
Y= f(x) + u
Se determina, por tanto, qué variables explican la variable Y.
Por ejemplo, se explica el precio de venta (Y) de las viviendas en función de los metros
cuadrados de superficie de la vivienda (X) -square feets (Sq.ft.)-.
Relación cuadrática
Regresión polinómica
Alisado de datos
6
1. Predicción según las relaciones entre las variables: el problema del sobre-
ajuste
En muchas aplicaciones de predicción en economía existen multitud de
variables a seleccionar para hacer predicciones.
Por ejemplo, para hacer predicciones del PIB se puede utilizar el consumo de
electricidad, el consumo de cemento, el consumo de los hogares, los índices de
sentimiento económico, licencias de obras para construcción de viviendas, datos
de comercio exterior (importaciones y exportaciones), número de ocupados,
grado de utilización del capital, tipos de interés, evolución de los índices
bursátiles, etc.
Del mismo modo, se pueden seleccionar modelos econométricos
suficientemente complejos como para que el ajuste sea “casi perfecto”.
Aunque pueda parecer paradójico, estas dos cuestiones son problemáticas
para la predicción.
Supongamos, de nuevo, el caso del precio de las viviendas (Y) explicado por
un conjunto de variables X (superficie de la misma) que generasen un ajuste
perfecto.
Desde el punto de vista del la relación entre las variables esto sería bueno,
estaríamos explicando una proporción muy alta de la varianza de la (Y) con
nuestras variables explicativas (X).
7
1. Predicción según las relaciones entre las variables: el problema del sobre-
ajuste
Contamos con un conjunto de viviendas (puntos azules en los gráficos).
Podemos utilizar distintos modelos, de forma que el ajuste cada vez sería
mejor:
4. Se selecciona el modelo con menor test error, aunque no sea el que mejor
ajuste presente.
9
1. Predicción según las relaciones entre las variables: el problema del sobre-
ajuste
Esta forma de solucionar el problema del sobre ajuste requiere tener una
muestra suficientemente grande para evitar:
Estimar con pocos datos el modelo con el grupo de entrenamiento.
Obtener predicciones extrañas debido a valores atípicos en el grupo de contraste.
Esta aproximación es usada fundamentalmente cuando el objeto de
estudio es puramente la predicción y menos cuando el objeto de la
predicción es conocer cuál es la influencia de cada x sobre los valores futuros
de la variable y.
10
1. Predicción según las relaciones entre las variables: el Nowcasting
Según Eurostat (Glossary on Rapid Estimates) Nowcasting es una
evaluación rápida realizada en el momento actual T (el presente) de una
variable económica observada en el mismo periodo de referencia T.
Nowcasting utiliza la información en tiempo real disponible entre T y T-1.
Por lo tanto, se predice el valor presente de una variable utilizando información
contemporánea.
Nowcasting es distinto de predicción (proceso que estimación de valores
futuros de una variable todavía no observados).
Ejemplo
El nowcasting significaría, hacer
estimaciones del PIB del cuarto
trimestre a lo largo de enero.
En ese periodo existe multitud de
información contemporánea (entre
t y t-1) que puede ser utilizara
para realizar la estimación: del
mercado de trabajo, mercados
financieros, consumo de
electricidad, etc.
11
1. Predicción según las relaciones entre las variables: el Nowcasting
En general se utilizan la técnica descrita anteriormente, pero presentan
problemas adicionales (Castle, Hendry, and Kitov, 2013; Bánbura, Giannone and Reichlin, 2011):
No todas las variables explicativas contemporáneas son publicadas de forma
sincrónica, de forma que no siempre se tiene el mismo conjunto de predictores
(variables X) en el momento de realizar el nowcasting.
La información utilizada para las estimaciones es revisada y actualizada
frecuentemente (dato provisional), por lo que hay asumir que controlar por los
errores de medida.
Suelen haber más variables que observaciones.
La información de base para las estimaciones tiene distinta frecuencia que la
de la variable a estimar.
De ahí su utilidad para estimar el dato provisional.
Los procedimientos del nowcasting se adaptan en cada caso a las necesidades
de cada caso, superando estos problemas adicionales.
12
Tema 3. Técnicas elementales de predicción con información histórica
13
2,000
4,000
6,000
8,000
10,000
12,000
14,000
16,000
18,000
0
ene-87
sep-87
may-88
ene-89
sep-89
may-90
ene-91
sep-91
may-92
ene-93
sep-93
may-94
ene-95
sep-95
may-96
IBEX-35. Dic 1989=3000
ene-97
sep-97
may-98
ene-99
sep-99
may-00
ene-01
sep-01
may-02
ene-03
sep-03
may-04
ene-05
sep-05
may-06
ene-07
sep-07
may-08
ene-09
sep-09
may-10
ene-11
sep-11
may-12
ene-13
sep-13
may-14
ene-15
sep-15
2. Información histórica: componentes de una serie económica
may-16
ene-17
14
2. Información histórica: componentes de una serie económica
Índice de producción industrial. 2005=100
160
140
120
100
80
60
40
20
0
1975M02
1975M12
1976M10
1977M08
1978M06
1979M04
1980M02
1980M12
1981M10
1982M08
1983M06
1984M04
1985M02
1985M12
1986M10
1987M08
1988M06
1989M04
1990M02
1990M12
1991M10
1992M08
1993M06
1994M04
1995M02
1995M12
1996M10
1997M08
1998M06
1999M04
2000M02
2000M12
2001M10
2002M08
2003M06
2004M04
2005M02
2005M12
2006M10
2007M08
2008M06
2009M04
2010M02
2010M12
2011M10
2012M08
2013M06
2014M04
2015M02
2015M12
2016M10
• La producción cae cada agosto. (Componente estacional).
• Los picos estacionales han sido más reducidos en los años de crisis
• Se observan claramente los periodos de expansión y recesión: años por
encima y por debajo de la tendencia (lineal).
• Se puede observar un cambio estructural en el comportamiento de la
serie debido al efecto de la crisis. 15
2. Información histórica: componentes de una serie económica
SERIE TEMPORAL: Conjunto de observaciones de una variable,
normalmente a intervalos regulares de tiempo, ordenadas
cronológicamente.
16
2. Información histórica: componentes de una serie económica
Estacionalidad (St): Variaciones o fluctuaciones con periodicidad inferior a
un año y que se repiten en años sucesivos (periodicidad fija).
Solo puede existir con series temporales con periodicidad (frecuencia) inferior al
año.
Surge por factores institucionales, climatológicos o técnicos.
Ventas en campaña navideña, aumento de las pernoctaciones hoteleras en verano, caída de la
producción industrial en agosto.
17
20
40
60
80
100
120
140
160
0
1975M02
1975M08
1976M02
1976M08
1977M02
1977M08
1978M02
1978M08
1979M02
1979M08
1980M02
1980M08
1981M02
1981M08
1982M02
1982M08
1983M02
•
•
•
•
Tendencia
1983M08
1984M02
1984M08
Estacionalidad
1985M02
1985M08
1986M02
1986M08
1987M02
1987M08
1988M02
1988M08
1989M02
1989M08
1990M02
1990M08
1991M02
1991M08
1992M02
1992M08
1993M02
1993M08
1994M02
1994M08
1995M02
1995M08
1996M02
1996M08
1997M02
2000M02
2000M08
2001M02
2006M08
2007M02
2007M08
2008M02
industrial en
2008M08
diciembre de
la producción
2009M02
2009M08
2010M02
Los picos estacionales han sido más reducidos en los años de crisis
2008 por la crisis
Outlier: caída en
2010M08
Se puede observar un cambio estructural en el comportamiento de la
2011M02
2011M08
Se observan claramente los periodos de expansión y recesión: años por
2012M02
2012M08
2013M02
2013M08
2014M02
2014M08
2015M02
Ciclo
2015M08
2. Información histórica: componentes de una serie económica
2016M02
2016M08
2017M02
18
2. Información histórica: componentes de una serie económica
19
2. Información histórica: componentes de una serie económica
Hemos visto, por tanto, que una serie temporal presenta diferentes componentes:
Yt = f(Tt, Ct, St, It,Ut,)
Antes de continuar conviene hacer algunas precisiones respecto al tratamiento de los
componentes:
El componente irregular (It) no va a ser tratado, dada la complicación metodológica que implica su
análisis.
La tendencia y el ciclo se van a tratar de manera conjunta, considerando que Tt comprende la
variable ciclo-tendencia. De este modo, nos centraremos en tres componentes:
Yt = f(Tt, St, Ut): Ciclo-tendencia, estacionalidad y la perturbación aleatoria.
Existen diversas formas de modelizar la relación de las tres componentes de una serie
temporal. Las más frecuentes son las siguientes:
ADITIVA: Yt = Tt + St + Ut (La más usual)
MULTIPLICATIVA: Yt = Ttꞏ Stꞏ Ut (Se reduce significativamente el componente estacional)
20
2. Información histórica: componentes de una serie económica
Para hacer predicción se han de conocer todas estas características de las
series: Yt = f(Tt,St,Ut)
En este tema se analiza cómo utilizar la tendencia y el componente cíclico
de las series para realizar predicción.
También se estudia como hacer predicción en series sin tendencia
mediante técnicas elementales.
Implícitamente estamos asumiendo que NO nos interesa la estacionalidad St,
sino sólo el ciclo tendencia (Tt) en el esquema.
En el tema siguiente del curso (Tema 4) se analizan formas avanzadas de
predicción para series sin tendencia (o a las que se le ha eliminado la
tendencia).
21
2. Información histórica: componentes de una serie económica
COMPONENTE TENDENCIAL: TENDENCIA DETERMINISTA VS
ESTOCÁSTICA
Una serie temporal (Yt) presenta tendencia determinista (es una serie no
estacionaria en media, o bien que presenta tendencia en media, pero
estacionaria en varianza) cuando la esperanza de la serie es función del
tiempo: E(Yt)=f(t).
Una serie temporal (Yt) presenta tendencia estocástica (es una serie no
estacionaria en varianza o bien que presenta tendencia en varianza) cuando
la varianza de la serie es función del tiempo: Var(Yt)=f(t). La dispersión
de la serie no es constante a lo largo del tiempo.
Ejemplos:
Tendencia determinística (modelo A): Yt=1+2t+ut
Tendencia estocástica (modelo B): Yt=Yt-1+ut
En el modelo A, shocks aleatorios sólo tienen efectos transitorios, mientras que en el
modelo B tendrán efectos permanentes (se acumulan en el tiempo).
1
1975 1980 1985 1990 1995 2000 2005
Y5
• No es estacionaria: ni en media, ni en varianza
• Oscila en torno a su media
• Su varianza respecto a la media es constante
23
2. Información histórica: componentes de una serie económica
La serie Y2 presenta tendencia determinística, donde observamos que la
media de la serie tiende a crecer a lo largo del tiempo. La esperanza de la
serie es función del tiempo.
Tendencia estocástica
Tendencia determinista
900
800
700
600
500
400
300
200
100
0
1975 1980 1985 1990 1995 2000 2005
Y2
24
2. Componentes no observables de una serie temporal
Para saber si una serie tiene tendencia se utiliza:
Gráfico de la serie
Función de autocorrelación estimada (FACE)
La función de autocorrelación se define (cuando el proceso es estacionario):
T
Por lo que los coeficientes de primer y segundo orden vendrán dados por:
T T
(Yt Y )(Yt 1 Y ) (Yt Y )(Yt 2 Y )
̂1 r1 t 2
T ̂ 2 r2 t 3
T
(Yt Y )
2
(Yt Y )
2
t 1 t 1
26
Tema 3. Técnicas elementales de predicción con información histórica
27
3. Predicción con series con tendencia: Método de regresión
¿Cómo se puede hacer predicción con series temporales con tendencia?
La primera forma es utilizando tendencias lineales, cuadráticas u otras
formas funcionales (práctica 1, ejercicio 2 y 3).
Recordemos: hemos
supuesto que
Tt comprende la variable
ciclo-tendencia.
28
3. Técnicas de alisado. Medias móviles
En muchos casos las técnicas de estimación de tendencia NO aprovechan
de la mejor manera la información. Se pueden utilizar otras técnicas.
160
Dependent Variable: IPI
Method: Least Squares
140 Included observations: 510
60 100
DATE 0.000132 1.12E‐06 118.0412 0
-20
-40
-60
1975 1980 1985 1990 1995 2000 2005 2010 2015
La tendencia lineal no aprovecha
toda la información de la serie: los
Residual Actual Fitted residuos no son ruido blanco. La
tendencia lineal se ajusta poco a
los datos reales (Actual).
29
Tema 3. Técnicas elementales de predicción con información histórica
30
3. Técnicas de alisado. Medias móviles
FORMAS DE ELIMINAR LA TENDENCIA DE UNA SERIE
EJEMPLO: IBEX-35
¿Cómo se puede eliminar la tendencia de una serie?
18,000
16,000
14,000
12,000
10,000
8,000
6,000
4,000
2,000
0
ene-87
may-88
ene-89
may-90
ene-91
may-92
ene-93
may-94
ene-95
may-96
ene-97
may-98
ene-99
may-00
ene-01
may-02
ene-03
may-04
ene-05
may-06
ene-07
may-08
ene-09
may-10
ene-11
may-12
ene-13
may-14
ene-15
may-16
ene-17
sep-87
sep-89
sep-91
sep-93
sep-95
sep-97
sep-99
sep-01
sep-03
sep-05
sep-07
sep-09
sep-11
sep-13
sep-15
• No es estacionaria: ni en media, ni en varianza.
• Para convertir la serie en estacionaria se suele proceder de dos maneras:
se calculan las primeras diferencias o se toman logaritmos.
31
-500
1,500
2,000
0
500
1,000
-2,500
-2,000
-1,500
-1,000
enero-87
octubre-87
julio-88
abril-89
enero-90
octubre-90
julio-91
abril-92
enero-93
octubre-93
julio-94
abril-95
enero-96
octubre-96
(para quitarle la tendencia)
julio-97
abril-98
enero-99
octubre-99
IBEX-35 en primeras diferencias:
julio-00
DIBEX35t = IBEX35t - IBEX35t-1
abril-01
enero-02
octubre-02
julio-03
3. Técnicas de alisado. Medias móviles
abril-04
enero-05
octubre-05
julio-06
abril-07
enero-08
octubre-08
julio-09
abril-10
enero-11
FORMAS DE ELIMINAR LA TENDENCIA DE UNA SERIE
octubre-11
julio-12
abril-13
enero-14
octubre-14
julio-15
abril-16
enero-17
Cálculo de primeras diferencias para hacer que la serie sea estacionaria
32
0.0
0.5
1.0
1.5
2.0
2.5
3.0
3.5
4.0
4.5
enero-87
octubre-87
julio-88
abril-89
enero-90
octubre-90
julio-91
abril-92
enero-93
octubre-93
julio-94
abril-95
IBEX-35 en logaritmos:
enero-96
octubre-96
julio-97
LnIBEX35t = ln(IBEX35t)
abril-98
enero-99
octubre-99
julio-00
abril-01
enero-02
octubre-02
julio-03
3. Técnicas de alisado. Medias móviles
abril-04
enero-05
octubre-05
julio-06
abril-07
enero-08
octubre-08
julio-09
abril-10
enero-11
FORMAS DE ELIMINAR LA TENDENCIA DE UNA SERIE
octubre-11
julio-12
abril-13
enero-14
octubre-14
También se suelen tomar logaritmos para desestacionalizar la serie:
julio-15
abril-16
enero-17
33
3. Técnicas de alisado. Medias móviles
Existen otras técnicas que permiten utilizar mejor la información, y
mejorar, por tanto, la predicción.
Antes de explicar la media móvil se puede pensar en un MÉTODO
INGENUO (naïve) de predicción:
La predicción de una variable y para el año t+1 (𝑦 ) se puede calcular de dos
formas:
I: 𝑦 =yt El valor de la predicción es el del último año
Método
Medias móviles
ingenuo
34
3. Técnicas de alisado. Medias móviles
1
La media móvil de 3 periodos de una serie temporal es: M t3 yt yt 1 yt 2
3
La media móvil de 4 periodos de una serie temporal es: M t4 1 yt yt 1 yt 2 yt 3
4
De forma general, la media móvil de s periodos de una serie temporal es:
1 1 s 1
M yt yt 1 ... yt s 1 yt i
t
s
s s i 0
s es el número de periodos de alisado, también llamado banda de alisado.
Las medias móviles “alisan” la serie. Es una forma de calcular el efecto de
una tendencia no lineal que se ajusta mejor que simplemente una recta.
35
0
20
40
60
80
100
120
140
160
0
20
40
60
80
100
120
140
160
1975M01 1975M01
1976M05 1976M05
1977M09 1977M09
1979M01 1979M01
1980M05 1980M05
1981M09 1981M09
1983M01 1983M01
1984M05 1984M05
1985M09 1985M09
1987M01 1987M01
1988M05 1988M05
1989M09 1989M09
1991M01 1991M01
IPI
1992M05
IPI
1992M05
1993M09 1993M09
1995M01 1995M01
1996M05 1996M05
1997M09 1997M09
1999M01 1999M01
2000M05 2000M05
2001M09
IPI M3 2001M09
IPI M12
2003M01 2003M01
2004M05 2004M05
2005M09 2005M09
2007M01 2007M01
2008M05 2008M05
2009M09 2009M09
2011M01 2011M01
2012M05 2012M05
2013M09 2013M09
2015M01 2015M01
2016M05 2016M05
Media móvil 12 meses
Media móvil 3 meses
0
20
40
60
80
100
120
140
160
0
20
40
60
80
100
120
140
160
1975M01 1975M01
3. Técnicas de alisado. Medias móviles
1976M05 1976M05
1977M09 1977M09
1979M01 1979M01
1980M05 1980M05
1981M09 1981M09
1983M01 1983M01
1984M05 1984M05
1985M09 1985M09
1987M01 1987M01
1988M05 1988M05
1989M09 1989M09
1991M01 1991M01
IPI
1992M05
IPI
1992M05
1993M09 1993M09
1995M01 1995M01
1996M05 1996M05
1997M09 1997M09
1999M01 1999M01
2000M05 2000M05
2001M09 2001M09
IPI M6
IPI M24
2003M01 2003M01
2004M05 2004M05
2005M09 2005M09
2007M01 2007M01
2008M05 2008M05
2009M09 2009M09
2011M01 2011M01
2012M05 2012M05
2013M09 2013M09
2015M01 2015M01
2016M05 2016M05
Media móvil 24 meses
Media móvil 6 meses
36
Tema 3. Técnicas elementales de predicción con información histórica
37
5. Alisado exponencial (el alisado simple, alisado con tendencia) y Método de
Holt
MEDIA MÓVIL EXPONENCIAL o ALISADO EXPONENCIAL
El concepto de media móvil se puede generalizar si se considera que los retardos
más antiguos pesan menos en la media móvil:
n
yt yt 1 yt 1 1 yt 2 ... 1 yt n 1 yt i 1
2 n i
(1)
i 0
=0.95 → yts 0,95 yt 0,95 1 0,95 yt 1 0,95 1 0,95 yt 2 0,95 1 0,95 yt 3 0,95 yt 0, 048 yt 1 0, 0024 yt 2 0, 000119 yt 3
2 3
39
5. Alisado exponencial (el alisado simple, alisado con tendencia) y Método de
Holt
La media móvil exponencial se puede expresar de la siguiente manera:
= 0.1 Coeficiente de alisado
𝒚𝜶𝒕
IBEX35 Media móvil exponencial
2003 6,723 6,723 Valor orignal de la serie
2004 8,196 6,870 6,870=8,196*0.1+(1‐0.1)*6,723 yt yt 1 yt1
2005 9,901 7,173 7,173=9,901*0.1+(1‐0.1)*6,870
2006 12,344 7,690 7,690=12,344*0.1+(1‐0.1)*7,173
2007 14,894 8,411 8,411=14,894*0.1+(1‐0.1)*7,690
2008 11,743 8,744 8,744=11,743*0.1+(1‐0.1)*8,411
2009 10,093 8,879 8,879=10,093*0.1+(1‐0.1)*8,744
2010 10,201 9,011 9,011=10,201*0.1+(1‐0.1)*8,879
2011 9,735 9,083 9,083=9,735*0.1+(1‐0.1)*9,011
2012 7,583 8,933 8,933=7,583*0.1+(1‐0.1)*9,083
2013 8,325 8,872 8,872=8,325*0.1+(1‐0.1)*8,933
16,000
14,000
12,000
10,000
8,000
6,000
4,000
2,000
0
2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013
IBEX35 Media móvil exponencial
40
5. Alisado exponencial (el alisado simple, alisado con tendencia) y Método de
Holt
Para hacer la predicción, se utiliza la media exponencial que se inicia en
el último dato disponible:
yˆt 1 yt yt 1 yt1
Al igual que antes, las medias móviles exponenciales son válidas cuando la serie
no tiene tendencia (o cuando se ha eliminado).
¿Qué parámetro se selecciona? Depende del tamaño de las
oscilaciones
41
5. Alisado exponencial (el alisado simple, alisado con tendencia) y Método de
Holt Media móvil exponencial =0,1
Media móvil exponencial =0,5
120 120
110
110
100
100
90
90
80
80
70
70
60
60
50
50
40
40
30
30 1975 1980 1985 1990 1995 2000 2005 2010
1975 1980 1985 1990 1995 2000 2005 2010
IPI IPI_01
IPI IPI_05
110
100
90
80
70
60
50
40
30
1975 1980 1985 1990 1995 2000 2005 2010
IPI IPISM
42
5. Alisado exponencial (el alisado simple, alisado con tendencia) y Método de
Holt
La media móvil y el alisado exponencial son útiles cuando la serie no
tiene tendencia (cuando ha sido eliminada).
Pero, si existe tendencia:
43
5. Alisado exponencial (el alisado simple, alisado con tendencia) y Método de
Holt
Alisado de Holt (o alisado exponencial lineal con doble parámetro)
Existe tendencia
Se añade un nuevo parámetro de alisado:
Se modifica la definición de alisado exponencial (ecuación 3) incluyéndose un
término de tendencia: y y 1 y b
t t t 1 t 1
b1=0
y suelen ser seleccionados por los programas informáticos de forma que se utiliza el
valor con menor Error Cuadrático Medio de la predicción.
44
Tema 3. Técnicas elementales de predicción con información histórica
45
6. Predicción en series con componente estacional: Holt-Winters con
estacionalidad
El método de Holt (o alisado exponencial lineal con doble parámetro) se
puede aplicar cuando existe estacionalidad: Holt-Winters. Existe tendencia y
estacionalidad
bt yt yt1 1 bt 1
*Si en lugar de datos mensuales nuestros datos fuesen trimestrales, los factores
estacionales y subíndices serían 4 en lugar de 12.
47
6. Predicción en series con componente estacional: Holt-Winters con
estacionalidad
¿Cómo se calculan los factores estacionales?
Dos opciones aunque misma interpretación:
y
1. Media móvil. Factor estacional: st t
M t 12
yt / Mt-12 mide cuánto mayor es el valor de la variable en comparación con la
serie desestacionalizada.
Se puede definir el coeficiente de variación estacional para un mes k (CVEk):
cuanto se desvía en promedio la serie yt en un mes k respecto a su valor
tendencial: T
CVE k stk
t 1
48