Documentos de Académico
Documentos de Profesional
Documentos de Cultura
diario de la acción de
SURAMINV.
Un modelo de redes neuronales*
Prediction of the daily share price
fluctuations of SURAMINV
A neural network model
Resumen
*
Artículo derivado del trabajo de investigación desarrollado por los autores en la línea "La política coyuntural de la empresa" en el
grupo de Estudios en Economía y Empresa, Universidad EAFIT.
**
Magíster en Finanzas, Economista, Universidad EAFIT. Jefe Mesa Derivados Valores Bancolombia. jarriet1@eafit.edu.co
***
Magíster en Finanzas, Universidad EAFIT. Especialista en Ingeniería Financiera, Universidad Nacional de Colombia. Economista
del Desarrollo, Universidad Pontificia Bolivariana. jtorres7@eafit.edu.co
****
Dr. Ciencias Matemáticas, Universidad Politécnica de Valencia. Magíster en Matemáticas Aplicadas, Universidad EAFIT.
Profesor de tiempo completo, Universidad EAFIT. evelas@eafit.edu.co
32
Abstract
33
Parisi y Guerrero (2003) han hecho predicciones modelos más flexibles y adaptables, se pueden
de los cambios de signo semanales de los índices considerar como una buena alternativa para la
bursátiles Bovespa (Brasil), CAC40 (Francia), predicción de series de tiempo, pero a su vez
Dow Jones Industrial (Estados Unidos), las consideran más como un complemento a las
FTSE100 (Reino Unido), GDAX (Alemania), técnicas tradicionales que como un reemplazo.
Hang Seng (Hong Kong), KLS (Malasia),
Nikkei225 (Tokio), STI (Tailandia) y S&P500 Jalil y Misas (2007) hacen una comparación en
(Estados Unidos), y han encontrado que esta la predicción del tipo de cambio a través del uso
técnica presenta mayor poder predictivo sobre de modelos de redes neuronales y de tipo lineal.
las series estudiadas frente a modelos Arima. Reflejan mejores resultados de predicción con
los primeros.
Por su lado, Álvarez y Álvarez (2003) utilizan
algoritmos genéticos y redes neuronales para Villada et al. (2008) proponen un modelo de
predecir los precios del yen y la libra esterlina. redes neuronales para el pronóstico del precio de
Adicionalmente, hacen una fusión de datos a la energía eléctrica colombiana. Las estructuras
través de la cual combinan los resultados de de redes a las que recurrieron tienen como
sendos métodos con el fin de mirar la existencia entradas las series de precios diarios y el nivel
de sinergias para mejorar las predicciones. Pese medio de los embalses. Hacen una comparación
a lo sofisticado de las herramientas, no se con un modelo tipo Garch, el cual muestra un
observa, frente a trabajos anteriores, una mejora mejor desempeño de pronóstico dentro de la
considerable en los resultados de predicción de muestra, pero se observa que fuera de la muestra
tipos de cambio las redes tienen mejor predicción.
AD-MINISTER Universidad EAFIT Medellín Número 15 jul - dic 2009
34
eficiencia de mercado en la negociación de naturaleza de la distribución de los datos, y
activos específicos. Concretamente, es de concluye que cumplen un mejor papel que los
gran relevancia evaluar la predictibilidad del modelos de series de tiempo y econométricos
comportamiento de la acción de Suramericana cuando se trata de encontrar relaciones no
de Inversiones S.A. (Suraminv), ya que esta lineales.
acción lideró las negociaciones en la Bolsa
de Valores de Colombia durante el periodo Aristizábal (2006) menciona que “la creciente
de estudio, fue la de mayor participación en popularidad de las RNA en el campo de la
el Índice General de la Bolsa de Colombia economía y las finanzas se debe a la necesidad
(IGBC) y la que tuvo el mayor volumen de de tratamientos econométricos distintos a los
transacciones. tradicionales, que sean capaces de capturar
adecuadamente las trayectorias no lineales” de
1. Redes Neuronales Artificiales (RNA)
las relaciones entre variables.
Como las técnicas de aproximación lineal y
Las redes feedforward son las más usadas en
polinomial, una red neuronal es un método
aplicaciones de economía y finanzas. Se carac-
que, por medio de un conjunto de algoritmos,
terizan porque los datos se transmiten de las
busca establecer la relación entre un conjunto
de variables de entrada, {xi}, i=1,..., n, con un neuronas de capas anteriores a las de capas
conjunto de una o más variables de salida, {yi}, posteriores: las diferentes neuronas de la
j=1,..., k,. La diferencia de la red con los otros red procesan un conjunto de información
métodos de aproximación consiste en que la de entrada para establecer la relación con la
35
Las capas ocultas se pueden interpretar como el Donde T(nk,t) es la función de activación tansig
procesamiento que realizan los agentes de toda para la neurona de entrada nk,t.
la información económica y financiera conocida,
con el fin de formar sus expectativas hacia el En este sistema hay i* variables de entrada {x] y
futuro. Este procesamiento en el cerebro de los k* neuronas. Una combinación lineal de estas
agentes, representado en las transformaciones variables de entrada, observadas en el momento
realizadas en las capas ocultas de la red, es el t, {xi,t}, i=1,...,i*, con el vector de coeficientes o
que conlleva a reacciones y a tomar decisiones conjuntos de pesos de entrada {wk,i}, i=1,...,i*, y
en los mercados donde se realizarán compras o con la constante wk,0. forma la variable nk,t. Esta
ventas. variable es comprimida por la función tansig y
se convierte en una neurona Nk,t en el momento
Las neuronas procesan los datos de entrada de de la observación t. El conjunto de k* neuronas
dos formas: primero, haciendo combinaciones en el momento t las combina en una forma
lineales de los datos de entrada y, luego, ejecu- lineal con el vector de coeficientes {yk}, k=1,...,k*,
tando esas combinaciones por medio de fun y con un término constante y0, para formar la
-ciones de activación o transferencia. Las fun- predicción , en el momento t.
ciones más comunes en economía y finanzas
son las no lineales compresoras, las cuales Por otra parte, para la capa de salida, la función
reportan salidas no proporcionales a las entra- de transferencia más usada es la lineal (purelin)
das y son, además, las que mejor representan por ser continua para todos los reales, pues
el comportamiento económico de los agentes. arroja como resultado exactamente el mismo
Por su parte, para la capa de salida, la función valor de la entrada neta que le llega; por tanto,
AD-MINISTER Universidad EAFIT Medellín Número 15 jul - dic 2009
de transferencia más usada es la lineal por ser esta operación es equivalente a no aplicar
continua en todos los reales. Arroja, como función de transferencia. La continuidad es
resultado, exactamente el mismo valor de una característica deseada para la función de
la entrada neta que le llega y, por tanto, es esta capa en el sentido que la red tendrá libertad
equivalente a no aplicar función de trans- para arrojar cualquier valor de salida.
ferencia.
En los problemas de predicción económica o
Una de las funciones de activación compre- financiera se utiliza normalmente el algoritmo
sora más usadas en este tipo de trabajos es de entrenamiento backpropagation1. Es un mé-
la tangente hiperbólica, también conocida todo de aprendizaje con un mecanismo de
como la función tansig o tanh. Esta comprime propagación-adaptación en dos fases: la primera
las combinaciones lineales de las entradas consiste en entrar un determinado patrón y
en el rango comprendido entre -1 y +1 y está propagarlo por todas las capas de la red hasta
representada matemáticamente por: llegar a una salida, comparada con la salida que
se desea obtener; así se determina un término de
(1) error. Con este se inicia la segunda fase, ya que
se convierte en una señal que se propaga hacia
N (2) atrás, actualizando todos los pesos de la red. La
explicación de su generalizada implementación
en problemas económicos y financieros radica
(3) en las virtudes que posee: es capaz de resolver
1
Autores como Wong (1995), y Yao, Li y Tan (1997) han
documentado la superioridad de este tipo de red en el
(4) campo de economía y finanzas.
36
problemas que no son linealmente separables, Aquí, e2 es el error en el proceso de aprendi-
reduce el tiempo de entrenamiento de la red por zaje en una iteración, después de haber
la utilización del procesamiento paralelo para ingresado los r patrones a la red.
encontrar la relación entre patrones dados y no
necesita la especificación de un algoritmo por El error determinado r en función de los pesos
anticipado para llegar al algoritmo correcto. genera un espacio de dimensiones, donde se
refiere al número de pesos de la red. Al tratar
Cuando se asume una red de una sola capa de minimizar dicho error en el proceso de
oculta, el proceso de entrenamiento parte de aprendizaje, se toma la dirección del gradiente
ingresar a la red un patrón de entrenamiento negativo del error en esta superficie, es decir,
de q componentes. Dicho proceso se puede aquella dirección en la que el error decrece;
ilustrar así: este es el criterio para la actualización de los
pesos:
(10)
(5) El gradiente negativo de ep2 se denota como
-ep2 y se calcula como la derivada del error
con respecto a los pesos de conexión de toda
la red.
La salida final, en función de la entrada neta
y de los pesos de la última capa, está dada, Se puede demostrar que los términos de error
entonces, por: para la capa de salida están dados por:
(13)
Donde ep2 es el error medio cuadrático para
cada patrón de entrada P; Gk es el error en la (14)
neurona k de la capa de salida con l neuronas.
Donde D es la tasa de aprendizaje que varía
El proceso que se acaba de describir debe entre 0 y +1.
repetirse para el número total de patrones de
entrenamiento (r). Luego se hace necesario Después de actualizar los pesos y ganancias
minimizar el error medio cuadrático total de la capa de salida se hace el mismo proceso
expresado por: con la capa oculta; así se termina el proceso de
actualización de pesos, con base en los errores
(9) en una red de tres capas:
37
(15) El paso siguiente en la organización de los datos
es la división de la muestra en dos subconjuntos:
(16)
uno para la estimación del modelo (in sample) y
otro que no interviene en el cálculo y que se
Las expresiones para generalizar este proceso
utiliza para la prueba (out of sample). Aunque
a una red de más capas se pueden deducir
normalmente se acostumbra realizar un ejer-
fácilmente de la ecuación (12).
cicio de partición, para el presente trabajo se
efectuaron dos divisiones diferentes, buscando
2. Series de datos
contar con herramientas para realizar un
análisis más robusto de los resultados:
Ahora bien, para la selección de las variables de
entradas, empleadas para el estudio, se tuvieron
• Inicialmente se usó el 68% para estimación in
en cuenta los fundamentales macroeconómicos
sample y se dejó el 32% final de los datos para
y las relaciones entre mercados financieros,
efectos de pruebas out of sample. Esta división
documentados ampliamente en diversos trabajos
corresponde al punto medio aproximado de la
como los de Chen, Firth y Rui (2002) o Phylaktis
caída más significativa de precios de la acción
y Ravazzolo (2005). También se consideraron
de Suraminv, presentada aproximadamente
como criterios la disponibilidad de los datos en
entre mayo y junio de 2006. Con esto se
la periodicidad requerida y el conocimiento de
buscaba probar si utilizando la primera
los investigadores sobre el funcionamiento del
parte de dicha caída para la estimación, los
mercado financiero colombiano.
modelos son capaces de predecir out of sample
la segunda parte.
El conjunto de datos (1493 en total) se presenta
AD-MINISTER Universidad EAFIT Medellín Número 15 jul - dic 2009
38
el tiempo computacional en el entrenamiento Tabla 1
de la red, y un tercero, de prueba, con el que Estadísticos de error de estimación
se validó la capacidad de generalización del de la red neuronal
modelo3.
Redes feedforward
3. Resultados de predicción 77 precios
R2 0,9988
Las redes neuronales exigen la optimización del MSE 53984,8926
In sample
error de estimación a través de la comprobación RMSE 232,3465
de diferentes estructuras, número de capas,
RMSPE 0,0324
número de neuronas por capa, tipo de funciones
MAE 148,9150
de transferencia, aprendizaje y entrenamiento.
MAPE 0,0217
La realización de este proceso implicó el entre-
R 2
0,8358
namiento de cientos de redes. Por este motivo,
Out of sample
tiene gran importancia la utilización de algo- MSE 307155,4567
ritmos que sean eficientes desde el punto de RMSE 554,2161
vista de los tiempos computacionales. RMSPE 0,0288
MAE 406,6969
El entrenamiento, a partir de las 77 series MAPE 0,0223
descritas, permitió obtener modelos con buen
Fuente: Elaboración propia
desempeño en términos de predicción. Los
PRSURAESTFO PRSURA
3
Esta metodología es ampliamente recomendada en la lite-
ratura de RNA. Para una mayor profundización, véase a
Yao, Li y Tan (1997). Fuente: Elaboración propia
39
La gráfica 4 es una extracción de la gráfica Hold (B&H), como comúnmente se le conoce. El
anterior; en ella solo se muestran la predicción ejercicio fue realizado con base en los siguientes
y los datos reales para la parte out of sample de supuestos:
los datos.
• Sólo se permiten posiciones largas5, lo cual
Gráfica 4 es acorde con la regulación del mercado
Extracción predicción out of sample red accionario colombiano para el periodo de
neuronal artificial estudio, en la medida en que legalmente no
22000 están permitidas las ventas en corto.
21000
40
• Los modelos se corren cinco minutos cada La estrategia de negociación, empleada y deno-
día antes del cierre del mercado, con la minada como Sistema, trabaja bajo las siguientes
posibilidad, incluso, de realizar operaciones condiciones:
al cierre del mismo día. Para efectos de
simplificación, en el ejercicio se supone que • No hay posición. Se evalúa si ante un
los precios existentes cinco minutos antes cumplimiento exacto de la predicción para
son proxies que responden exactamente a los la siguiente jornada, la serie de precios de
datos verdaderos de cierre. cierre cruza hacia arriba el promedio móvil
ponderado8 de tres días de dicha serie. En
Con base en lo anterior, es necesario resaltar caso de presentarse esta situación, se genera
que por la misma lógica que implica la una señal de compra al precio de cierre del
estrategia B&H, sus resultados, frente a sistemas día.
de negociación que puedan entrar y salir del
• Hay posición abierta. El cruce se presenta en
mercado, se ven fuertemente favorecidos en
sentido contrario y se genera, entonces, una
épocas de tendencia alcista, mientras que se
señal de venta.
pueden ver perjudicados altamente en movi-
mientos laterales o bajistas. Por esto, un buen El número de días del promedio móvil
sistema de negociación para mercados con ponderado es el resultado de un proceso de
fuertes tendencias debería seguir muy de cerca optimización en el que se buscaba maximizar
la estrategia B&H durante épocas alcistas los rendimientos del Sistema en la parte in
de precios y ganarle de forma importante en sample de los datos. La gráfica 5 presenta la
movimientos laterales o bajistas. evolución del valor de los portafolios para este
Gráfica 5
Valoración portafolio Sistema y B&H
$4.000.000
$3.500.000
$3.000.000
$2.500.000
$2.000.000
$1.500.000
$1.000.000
$500.000
$0
Jun/02 Jun/03 Jun/04 Jun/05 Jun/06 Jun/07
Sistema 2 B&H
8
Los promedios móviles ponderados son usados ampliamente como herramientas de análisis técnico de mercados. Se calculan
mediante una ponderación lineal de los precios, multiplicando el primero (más reciente) por n, el segundo por (n-1), el tercero
por (n-2) y así sucesivamente, donde n es la periodicidad del promedio móvil. El resultado final es dividido por la suma de las
ponderaciones.
41
El comportamiento observado es precisamente Tabla 2
el que se espera de un buen sistema de trading en Rendimientos anualizados
épocas de tendencia al alza, ya que solo perdió Sistema y estrategia B&H
partes relativamente pequeñas del movimiento.
Incluso, en 2005, año de fuerte tendencia Año Sistema B&H
positiva, el Sistema logró superar a la estrategia 2002 65,98% 118,35%
B&H. En términos agregados para todo el 2003 27,85% 87,14%
periodo de estudio, el sistema de negociación
2004 59,05% 86,17%
alcanzó un rendimiento anualizado de 78,27%
frente al 51,23% que obtuvo la estrategia B&H. 2005 176,68% 146,35%
2006 94,05% 4,17%
En el periodo comprendido entre principios 2007 3,77% -2,56%
de 2006 y marzo de 2008, caracterizado por 2008 50,99% -65,23%
movimientos a la baja y laterales, se observa que In Sample 96,82% 69,20%
el Sistema consiguió una ventaja muy importante
Out of Sample 2,80% -14,20%
frente a la estrategia B&H, consistente durante
todo este tiempo. jun. 2002 – mar. 2008 78,27% 51,23%
Sistema es muy superior a la estrategia B&H, en ción, si se tienen en cuenta las diferentes
la medida en que es capaz de mantener el valor tendencias del mercado, es superior al de la
del portafolio prácticamente constante en una estrategia B&H: en las épocas de subida tiene
época de movimientos laterales y bajistas del un comportamiento ligeramente inferior al de la
mercado. estrategia pasiva, pero en épocas de movimientos
laterales o bajista obtiene rendimientos muy
A esta altura, es conveniente detallar la evo- superiores. En la medida en que se involucren
lución del valor de portafolio en diferentes mayor historia de los precios de la acción y
subperiodos que permitan evaluar si la ventaja una mayor cantidad de movimientos alcistas,
que presenta el Sistema frente a la estrategia laterales y bajistas, se espera que la ventaja del
B&H se mantiene de forma consistente. En tal Sistema sea aun más marcada, ya que la muestra
sentido, la tabla 2 presenta un resumen de los del presente estudio estuvo caracterizada por
rendimientos anualizados para todo el periodo una fuerte tendencia al alza en la mayor parte
de estudio, detallando para cada uno de los del tiempo.
años que lo componen y para sendas partes, in
sample y out of sample, de los datos. Conclusiones
42
hipótesis defendida por la teoría mencionada, ciación en el largo plazo, rendimientos muy
sí es posible hacer predicciones confiables y superiores a los de la estrategia pasiva con
obtener rendimientos extraordinarios con un nivel alto de confianza. En tal sentido,
respecto a una estrategia Buy & Hold. El es importante hacer énfasis en que, en
trabajo fue más allá que muchos otros de su ciertos subperiodos de alta tendencia alcista
estilo, en el sentido de que además de lograr de los precios, la estrategia pasiva produce
un buen pronostico in sample, demostró que rendimientos superiores. Sin embargo, al cal-
es posible obtener buenas estimaciones del cular a nivel agregado las diferentes tenden-
comportamiento de la acción out of sample; cias que se presentaron durante el periodo de
por tanto, evalúa de manera más confiable estudio, el desempeño promedio del sistema de
la verdadera posibilidad de aprovechamiento negociación se evidenció como superior.
financiero de los resultados.
Bibliografía
A partir de 77 variables expresadas en tér-
minos de precios y tratando de controlar Acosta, M.; Salazar, H. y Zuluaga, C. (2000).
“Tutorial de redes neuronales”. Universidad
la posibilidad de data snooping, se ejecutó
Tecnológica de Pereira, Facultad de Ingeniería
una división de la muestra en dos grupos: el Eléctrica, http://ohm.utp.edu.co/neuronales/
primero, in sample, se usó para el ajuste de los (12/08/2009).
modelos, y el segundo, out of sample, que no
interviene en el entrenamiento, se empleó para Agudelo, D. (2009). “Costos de transacción y
evaluar la capacidad predictiva de los modelos. medidas de liquidez intradiaria en BVC”.
Después se valoraron diversas estructuras de Trabajo presentado en el VI Simposio Nacional
43
Taiwan stock index”, Computers and Operations Pantoja Rojas, M. (2000). "Comparative analysis of
Research, 30, pp. 901–923. time series forecasting with neuronal networks,
arima models and garch process for non-
Concepto tasa mínima de expansión, http://www. stationary time series". rev.ing. Disponible [en
banrep.gov.co/informes-economicos/ine_pre_ línea]. 2004, No. 20, pp. 108-113.
frec3.htm(12/08/2009).
Parisi F, Antonino & Parisi F, Franco & Guerrero C.,
Fama, E. F. (1970). “Efficient capital markets: a José Luis. (2003). "Modelos predictivos de redes
review of theory and empirical work”, Journal of neuronales en índices bursátiles," El Trimestre
Finance, 2(25). American Finance Association, Económico, Fondo de Cultura Económica, vol.
pp. 383-417. 0(280), pp. 721-744.
Fernández Rodríguez, F., González Martel, Ch. y Phylaktis, K. & F. Ravazzolo. (2005). “Stock market
Sosvilla Rivero, S. (2000). "On the profitability linkages in emerging markets: implications for
of technical trading rules based on artificial international portfolio diversification”, Journal of
neural networks: Evidence from the Madrid International Financial Markets, 2(15). Institutions
stock market". Economics Letters Vol. 69, pp. and Money, pp. 91-106.
89-94.
Roberts, H. (1967). “Statistical versus clinical
Franses, P.H. & van Dijk, D. (2000). Non-Linear predictions of the stock markets”. Unpublished
Time Series Models in Empirical Finance. manuscript, Center for research in Security
Primera Edición. United Kingdom: Cambridge Prices, University of Chicago.
university press.
Sallehuddin et al. (2007). “Forecasting time series
Gil Zapata, M & Pérez Ramírez F. (2005). Análisis y
data using hybrid grey relational artificial neural
AD-MINISTER Universidad EAFIT Medellín Número 15 jul - dic 2009
44
Apéndice 1
Series de datos de entrada para los modelos
Suramericana TRM
Acerías Paz del Rio Euro
Banco de Bogotá Yen
Bancolombia O Libra
Franco suizo
Bancolombia P
Real
ADR – Bancolombia
Peso mexicano
Colombiana de Inversiones
Peso chileno
Coltejer Monedas
Acciones Peso argentino
Chocolates Won surcoreano
Colombianas
Éxito Dólar Taiwán
Fabricato Rublo ruso
Grupo Aval Yuan chino
ISA Dólar canadiense
Tablemac Dólar australiano
Valorem Lira turca
Cemargos
Tasa de la FED
Inverargos
45
Apéndice 2
Estadísticos de error para evaluación de los modelos
• R-Cuadrado:
46