Analisis Tecnico Usando Inteligencia Artificial PDF

Análisis técnico de mercados financieros basado en
técnicas de inteligencia artificial
Ángel Pina Canelles
5 de septiembre de 2014
Índice general
0.1. Abstract . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1. El Problema 9
1.1. El Análisis de los Mercados Financieros . . . . . . . . . . . . . . . . . . . . 9
1.1.1. El Análisis Fundamental y el Análisis Técnico . . . . . . . . . . . . 9
1.1.2. Los Principios y Métodos del Análisis Técnico . . . . . . . . . . . . 10
1.1.3. Algunas Técnicas de Análisis Chartista . . . . . . . . . . . . . . . . 11
1.1.4. Algunas Técnicas del Análisis de Osciladores . . . . . . . . . . . . . 12
1.2. Traders Automáticos y Talentum . . . . . . . . . . . . . . . . . . . . . . . 14
1.3. Problema Propuesto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2. Desarrollo de la Solución 17
2.1. Solución Propuesta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.1.1. Visión General . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.1.2. Redes Neuronales como Predictores . . . . . . . . . . . . . . . . . . 18
2.1.3. El Procedimiento Completo . . . . . . . . . . . . . . . . . . . . . . 21
2.2. Etapas del Proceso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.2.1. Obtención y Tratamiento de los Datos . . . . . . . . . . . . . . . . 22
2.2.2. Entrenamiento de Redes Neuronales . . . . . . . . . . . . . . . . . . 24
2.2.3. Puesta en Marcha a Mercado Real . . . . . . . . . . . . . . . . . . 26
2.2.4. Monitorización y Fiabilidad . . . . . . . . . . . . . . . . . . . . . . 27
3. Aspectos Técnicos 29
3.1. Software Desarrollado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.1.1. Librerias Utilizadas . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.1.2. Módulos Desarrollados . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.1.3. Estructura General . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.1.4. Interfaz de Usuario . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.2. Detalles Técnicos del Entrenamiento de Redes . . . . . . . . . . . . . . . . 37
3.2.1. El Problema del Overfitting . . . . . . . . . . . . . . . . . . . . . . 37
3.2.2. El Proceso Completo de Entrenamiento . . . . . . . . . . . . . . . . 39
3.3. Análisis de Componentes Principales . . . . . . . . . . . . . . . . . . . . . 40
3.4. Tests Estadisticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.5. Medidas de Error y Fiabilidad . . . . . . . . . . . . . . . . . . . . . . . . . 44
3
4 ÍNDICE GENERAL
4. Resultados y Conclusiones 49
4.1. Resultados del Prototipo Inicial . . . . . . . . . . . . . . . . . . . . . . . . 49
4.2. Resultados Finales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
4.3. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
0.1. ABSTRACT 5
0.1. Abstract
The original goal of this work was to apply machine learning techniques to the study of
financial markets. We quickly discarded the problem of trying to predict the evolution of
the market itself, since this is a very well studied problem, and it is too complex for the
purposes of a final degree project. Instead, we were contacted by the company Talentum,
which proposed us to solve a problem they were currently facing.
Talentum is a startup company focused on automatic trading to operate on currency
exchange markets such as FOREX. They have a lot of automatic traders (that is, robots)
programmed using a wide variety of techniques, following the indications of experts from
different fields: mainly computer science, economy and mathematics, but also physics,
chemistry... etc. Since the Company’s foundation in February 2014, they have developed
and programmed more than a thousand robots, and so, as the number of available robots
scaled so quickly, their actual problem is deciding, at a given moment, which robots they
should use in their systems to operate in the market.
Their first approaches not being satisfactory, they proposed us the problem of designing
and implementing a system that could help them making that decision. That is, ideally,
the system should be able to predict the expected performance of every robot, and provide
metrics to an external agent developed by them, that will use this data to choose a subset
of robots to operate in a given situation. In order to achieve this goal, our software would
study the way that every robot had performed in the past, comparing the current market
situation with the one in which the robot operated previously (and concluding from the
result obtained then).
In order to solve the proposed problem, we have had to design, implement and combine
techniques from both computer-science and mathematics. The theoretical basis of most of
them are also included in this document. Particularly, the main techniques that we used
are:
Artificial Neural Networks. Artificial neural networks are computational models

inspired by the architecture of animals’ brain. It is a well known machine learning
technique, specially suited for problems related to pattern recognition. We use them
as the kernel of our system, using them for implementing predictors on the robots’
expected performance.
The Principal Component Analysis (PCA) is a statistical procedure that we

use for preprocessing the data extracted from the market, in order to reduce the
dimension of the data that models the market situation at a given moment. PCA uses
an orthogonal transformation to convert a possibly correlated set of observations into
a set of linearly uncorrelated ones.
Statistical hypothesis testing is a method of statistical inference to assess the

acceptance of a given hypothesis. We will use it as part of the process of choosing
the structure for each network.
Weighted least squares. The least squares problem consists on, given a set of
points in the plane, adjusting the line that minimizes the total error of calculating,
6 ÍNDICE GENERAL
using the line as a function of x, the y value for every point (x, y) in the set. We
will use a variation of that method, that allows us to assign different importances
to each point, as a method to fix the error made by our predictors.
The software that has been developed for this work has been programmed using the
Java programming language, along with some external libraries that implement some of
the more technical algorithms. For example, we have used Encog ([8]) for the algorithms
related to creation, training and execution of neural networks, and WEKA ([9]) for the
implementation of the Principal Component Analysis.
The document is structured as follows:

In the first chapter we make an introduction to financial market analysis, explaining
its two main branches: Fundamental analysis and technical analysis. On the one hand,
fundamental analysis is based on the belief that the price of shares doesn’t represent their
real value. Therefore, its goal is that of, using all possibly available information, knowing
the real value of the shares and therefore being able to buy or sell them efficiently.
On the other hand, technical analysis focuses on finding behavioral patterns in shares’
prices: Studying the behavior they had in the past, trying to predict their future changes.
After this introduction, we focus on technical analysis, which is the one directly related
to this work. We will present its principles and premises. We also introduce the two
main groups in which technical analysis techniques can be divided: Charts analysis and
bounders analysis, and give some sample techniques of both of them.
After this section, we make a brief introduction to the automatic trading, and to
Talentum, the company we have been working with. To end the chapter, we introduce in
more detail the problem we solved during this work.
In the second chapter we expose the solution we have developed, which can be summa-
rized as follows:
The kernel of our system, i.e. the predictors, are implemented using neural networks.
The problem the network tries to solve is that of, considering the situation of the financial
market at a given moment, predicting the balance (whether positive or negative) a robot
is going to have.
For the network being able to solve this problem, we use the available information
about how the robot performed in the past. This way, when a new case comes, the network
will make its prediction based on similar situations whose result we already know1 .
As modeling the state of the market can be very complex, and since we expect to have
a great deal of variables related to it, we have to apply some preprocessing to the data
before the neural network can use it efficiently. Firstly, we will reduce the dimensionality
of the data (that is, the number of variables) using the Principal Components Analysis.
Also, we will apply a normalization process before giving the data to the network. The
description and details of the whole process are given in the document.
1
The given explanation is a really general idea of how a neural network actually works, we will give
the detailed procedure in the correspondent sections of this document.
0.1. ABSTRACT 7
After this overall vision, we explain in detail the steps that are followed through the
software. Those steps are:
Obtaining and processing the data. In this step we get the operations records
of our robot, and our aim is to obtain a set of test cases for training the neural
network. We also apply the principal component analysis and normalization.
Training our neural networks. We use the set of test cases obtained in the
previous step to train a new network that will make predictions about the robot’s
performance.
Running the system in real-time market. In this step we run the neural net-
work just trained. We have to get the real time market information from Talentum
databases and apply to them the same preprocessing procedures as with the trai-
ning data. Next, we can execute our networks and send the predictions and related
information to the agent that will control the robots.
Monitoring the results. Once our system is running in the real-time market, we
monitor the operations that are being done. Every time a robot makes an operation,
we update the estimation of the error and reliability for the network that controls
it. We also implement the functionality to check the predictions being made by the
networks at any given moment, and getting the operations that have been done up
to date.
In the third chapter, we review all the technical aspects of our work, including the
theoretical base of the principal component analysis, technical details related to the neural
networks training (such as the overfitting problem), etc.
Also in this chapter, we explain the whole estructure of the software developed for the
processes described above, both from the programming point of view (libraries, modules,
classes diagrams...) and the user’s point of view (that is, we show the user interface and
explain how to use it).
Finally, in the fourth and last chapter we present the results obtained from our work. In
a first section we introduce the results obtained from a first prototype, which run during
the past month of June and didn’t include any measure of the networks estimated error,
yet. In a second section we include the results obtained by the final prototype, which
has been running during last August, and included all the techniques covered by this
document. We analyze the results from both experiments, and compare them with the
results that would have been obtained by the same robots without using our system.
Finally, we give our conclusions for the work, as well as propose several future ways
to improve the software and results.
8 ÍNDICE GENERAL
Capı́tulo 1
El Problema
1.1. El Análisis de los Mercados Financieros

1.1.1. El Análisis Fundamental y el Análisis Técnico
El análisis de los mercados financieros, o análisis bursátil, consiste en el estudio de los
activos del mercado financiero. Su objetivo consiste en obtener información anticipada
sobre la evolución de sus cotizaciones, de forma que se puedan realizas operaciones de
compra y venta en bolsa que arrojen beneficios. El contenido de esta sección está basado
principalmente en [1].
El análisis de los mercados se puede dividir en dos grandes ramas principales: El
análisis fundamental y el análisis técnico.
El análisis fundamental se basa en la creencia de que el mercado tiene una eficiencia

débil, es decir, que el precio de las acciones no es representativo de su valor. El analista
utiliza toda la información a su alcance sobre la empresa para realizar una estimación del
precio que considera correcto para las acciones de la misma, y realizar una compra o una
venta según piense que éstas están infravaloradas o sobrevaloradas. Realmente no hay una
forma completamente objetiva de valorar una acción, y por lo tanto varios analistas pueden
llegar a distintos resultados, concluyendo uno de ellos que la acción está infravalorada y
el otro que está sobrevalorada. Esto es lógico, por otra parte, ya que para que alguien
pueda comprar una acción otra persona debe querer venderla.
El análisis técnico, por el contrario, no plantea si las acciones están correctamente

valoradas, sino que busca patrones de comportamiento en la cotización de las acciones,
basándose en la historia de comportamientos de éstas, y trata con ellas de predecir mo-
vimientos futuros para obtener beneficios. El análisis técnico es un análisis más gráfico,
visual, y que se ayuda de unos indicadores u osciladores que proporcionan información
sobre tendencias.
Aunque se utilizan diversas herramientas, es especialmente común el uso de gráficos
que reflejen los movimientos de las cotizaciones. Al igual que ocurrı́a en el análisis funda-
mental, no se trata de una ciencia exacta, y ante los mismos datos dos analistas pueden
emitir opniniones contrarias.
9
10 CAPÍTULO 1. EL PROBLEMA
Podrı́a decirse que el análisis técnico es un análisis para el corto plazo mientras que
el análisis fundamental lo es para el largo plazo. Por ejemplo, aunque las previsiones de
una empresa sean buenos y ser esperable a largo plazo que su cotización suba, ésta puede
bajar a corto plazo debido a la toma de beneficios por parte de los inversores. Son patrones
como éstos de los que el análisis técnico trata de sacar partido.
De hecho, a menudo se combinan ambos análisis: El análisis fundamental indica qué tı́tu-
los hay que comprar y cuáles hay que vender, mientras que el análisis técnico muestra el
momento exacto para realizar dicha compra o venta.
1.1.2. Los Principios y Métodos del Análisis Técnico

El análisis técnico, que como hemos comentado se basa en tratar de encontrar patrones
o tendencias en las cotizaciones, se basa en tres premisas:
Todo lo que puede afectar al precio de cualquier valor está descontado.
Los precios se mueven por tendencias. Existen tres tendencias:
• La tendencia primaria que engloba periodos anuales.

• La secundaria, con periodos mensuales o semanales.
• La terciaria con periodos diarios.
El mercado tiene memoria.
La primera premisa niega el principio básico del análisis fundamental, y asume que las
acciones no están sobrevaloradas ni infravaloradas, sino que reflejan su valor exacto. La
segunda refleja que el mercado se mueve por tendencias más largas o más cortas, y la
tercera premisa establece que lo que ocurrió en el pasado tiende a repetirse, y que por
tanto podemos usar los datos de éste para predecir los futuros.
Los métodos del análisis técnico pueden dividirse en dos grandes grupos: El análisis
chartista y el análisis por osciladores. El chartismo es un sistema basado únicamente en
el estudio de los gráficos. Supone que los movimientos de los precios son debidos a una
combinación de expectativas y sentimientos de los inversores, y que éstos actuarán de la
misma manera en el futuro de lo que lo hicieron en el pasado, por lo que trata de descubrir
patrones en las figuras que forman las evoluciones de los precios.
El análisis de osciladores, por otro lado, utiliza ecuaciones matemáticas para deter-
minar señales de compra o venta en los gráficos, utilizando como variable principal las
cotizaciones de los precios.
En las siguientes dos secciones se establecen ejemplos de uno y otro tipo de análisis.
1.1. EL ANÁLISIS DE LOS MERCADOS FINANCIEROS 11
1.1.3. Algunas Técnicas de Análisis Chartista

Un ejemplo de análisis chartista es establecer que el mercado, respecto a un determi-
nado tı́tulo, puede encontrarse en una tendencia alcista o bajista. Ası́, basándonos en los
comportamientos de la cotización en el pasado para situaciones similares, podemos esta-
blecer que pasará determinadas fase prefijadas. Por ejemplo, en el caso de encontrarnos
con un tı́tulo con una tendencia alcista (Figura 1.1) podemos distinguir las siguientes tres
fases:
Fase de Acumulación. El análisis fundamental establece predicciones de bajada y

los inversores venden sus acciones al no ver una rentabilidad satisfactoria. Sin em-
bargo, los operadores de Bolsa con más información comienzan a comprar acciones
lentamente (a acumularlas) y el recorrido del precio es horizontal con una ligera
tendencia alcista.
Fase de Expansión. Se confirma la mejora de los datos, que llegan al público ge-
neral, y se produce la compra masiva de tı́tulos, por lo que se eleva rápidamente
su cotización y produciendo altas rentabilidades, que a su vez motiva de nuevo la
compra.
Fase de Distribución. El público general compra gran cantidad de tı́tulos hasta que
el mercado alcanza un punto en el que ya no crece. Algunos inversores venden para
recoger beneficios y otros compran estos tı́tulos animados precisamente por estas
rentabilidades obtenidas, lo que hace que el precio crezca y baje ligeramente.
Figura 1.1: Tendencia Alcista: IBEX-35 desde 1996 hasta mitad del año 1998. [1]
Y de la misma forma, una vez estabilizada su cotización, puede producirse a continua-

ción una tendencia bajista, que de nuevo podemos dividir en tres fases principales (Figura
1.2):
Fase de Distribución. Coincide con la última fase del mercado alcista. Se producen
algunas compras y ventas sin mucha rentabilidad, lo que hace que los inversores
comiencen a buscar alternativas en otros mercados.
Fase de Pánico. Cuando se percibe el efecto de las ventas, comienza un pánico
muchas veces no justificado por los datos fundamentales y los inversores comienzan
a querer vender, por lo que el precio cae abruptamente, y aunque puede haber ligeras
subidas la tendencia es bajista.
Fase de Consolidación. Finalmente la bajada comienza a atenuar y se vuelve a los
recorridos horizontales, hasta que acaba la tendencia bajista.
Figura 1.2: Tendencia Bajista: IBEX-35 durante el año 2000. [1]
De esta forma, asumiendo que el mercado se va a comportar de acuerdo a estos patrones

y fases, el conocedor de las técnicas de análisis chartista podrı́a decidir los momentos
adecuados para comprar y vender sus tı́tulos obteniendo altas rentabilidades.
1.1.4. Algunas Técnicas del Análisis de Osciladores

El ejemplo más sencillo de oscilador (y uno de los más utilizados) es la media móvil.
La media móvil de un periodo es el promedio de los precios de un determinado tı́tulo
1.1. EL ANÁLISIS DE LOS MERCADOS FINANCIEROS 13
durante ese periodo. Al suavizar la curva de precios, constituye una forma más sencilla
de observar las tendencias del mercado.
Además, una técnica para obtener señales de compra o de venta serı́a observar cuándo
la gráfica de la cotización del valor corta la gráfica formada por la media móvil, lo que
indicará que el mercado está sufriendo una tendencia bajista o alcista a corto plazo.
Por ejemplo, si una cotización ascendente corta la media móvil significa que el precio ha
ascendido de forma más rápida de lo normal, por lo que es de suponer que nos encontramos
ante una tendencia alcista y ésta seguirá subiendo, por lo que es conveniente comprar.
Podemos encontrar un ejemplo de este procedimiento en la figura 1.3. En ella, se muestran
las medias móviles de 14 dı́as (lı́nea continua) y de 150 dı́as (lı́nea discontinua). Ası́,
cuando la cotización corta la media que usemos como referencia, se producirá una orden
de compra (señaladas con un 1) o una orden de venta (señalada con un 2).
Figura 1.3: Medias Móviles: Cotización del BBVA durante el año 2000. Medias móviles de
14 dı́as (lı́nea continua) y de 150 dı́as (lı́nea discontinua). Se ha señalado con un 1 señales
de compra, y con un 2 señales de venta. [1]
Pese a la simplicidad de este método, existen varias modificaciones. Por una parte, tomar
medias móviles de periodos más largos o más pequeños varı́a el riesgo y la rentabilidad
esperada: Tomando medias móviles más largas las tendencias que detectemos serán más
seguras pero de menor rentabilidad que con medias móviles más cortas.
Existen por otra parte muchas variaciones y mejoras a este método, que van desde el
uso de varias medias móviles simultáneamente (para detectar por ejemplo los cortes entre
ellas en lugar de con la cotización) hasta otras formas de calcular estas medias, dando por
ejemplo más importancia a las cotizaciones más recientes.
Existen otras técnicas más complejas basadas en ideas matemáticas, como son por
ejemplo las Bandas de Bollinger, que utiliza la regla estadı́stica de las tres sigmas, que
establece que el 99 % de una distribución normal está comprendida entre la media menos
tres veces la desviación tı́pica y la media más tres veces la desviación tı́pica. Por tanto, la
técnica se basa en que si la cotización alcanza la cota dada por la media móvil más tres
veces su desviación tı́pica, es de esperar que su precio comience a caer y emitimos una
orden de venta, y si la cotización alcanza la media móvil menos tres veces su desviación
tı́pica emitimos una de compra. Un gráfico reflejando esta técnica podemos encontrarlo
en la figura 1.4. En ella, encontramos las bandas de Bollinger referidas a la media móvil
de 20 dı́as. Cuando la cotización alcanza la banda superior, se espera que posteriormente
caiga, por lo que nuestra acción será de venta, mientras que si la cotización alcanza la
banda inferior emitiremos una señal de compra.
Figura 1.4: Bandas de Bollinger: Cotización de la empresa Altadis durante el año 2000.
[1]
1.2. Traders Automáticos y Talentum

Los sistemas de trading automatizados, o traders automáticos permiten establecer una
serie de reglas automáticas que dictan cuándo realizar una operación y cuándo cerrarla,
de forma que ésta se ejecute de forma autónoma sin intervención humana posterior. Las
reglas que en éstos se programan pueden ser relativamente sencillas, como las medias
móviles que vimos anteriormente, o mucho más complejas.
1.3. PROBLEMA PROPUESTO 15
Los sistemas automáticos han ido tomando mucha fuerza los últimos años. Entre sus
ventajas se encuentra la rapidez a la que puede detectar y realizar las operaciones, la
facilidad de diversificación o el hecho de que evitar que las emociones del broker influyan
en las decisiones del sistema. Como desventajas, por otra parte, podrı́an citarse los posibles
fallos mecánicos o la necesidad de monitorización.
Talentum es una empresa dedicada precisamente a este campo. Fundada en Febrero del
2013, Talentum se dedica principalmente al estudio y desarrollo de sistemas automáticos
para invertir en bolsa. Cuenta con profesionales de distintas ramas, principalmente eco-
nomistas, informáticos, quı́micos y matemáticos, cuyas técnicas especı́ficas combinadas se
programan en los robots.
En la actualidad, Talentum cuenta con más de 1.000 robots programados y optimizados

con distintos parámetros para diferentes divisas. Por el momento, los robots de Talentum
operan únicamente en el mercado FOREX (cambio de divisas). Han comercializado por
separado varios de sus robots, como Ulysses o Helena. Sin embargo, su producto estrella
es Diana, un sistema de trading automático consistente en un conjunto de 5 robots que
rotan cada cierto tiempo dependiendo de las condiciones del mercado. [2]
1.3. Problema Propuesto

Como hemos comentado, Talentum posee más de 1.000 robots capaces de operar en
bolsa, basados en diferentes técnicas y algoritmos. En la mayorı́a de sus sistemas, como
Diana, no se utilizan de forma independiente, sino que se toma un subconjunto de robots
para que operen a la vez. De forma, se logra que las pérdidas se compensen entre ellos y se
diversifican las operaciones, lo que permite minimizar el riesgo. Además, su sistema Diana
cambia los robots que operan cada poco tiempo, de forma que es capaz de adaptarse a
los cambios que se produzcan en el mercado, y retirar los robots que no funcionen bien y
sustituirlos por otros que, presumiblemente, lo harán mejor.
En ese punto, la empresa se encontraba ante un problema que no habı́an logrado resolver
satisfactoriamente: La elección del subconjunto de robots para operar en cada momento.
La aproximación que habı́an realizado hasta entonces, consistente en simular los resultados
que hubieran tenido todos los robots la semana anterior, y elegir aquellos que lo hubieran
hecho mejor, no daba buenos resultados. Esto era debido a que la situación del mercado,
especialmente del de divisas y operando a corto plazo, es muy cambiante de una semana
a la siguiente.
Por tanto, el problema que se propuso para la realización de este trabajo fin de grado
fue dar a Talentum criterios para poder elegir con mayor efectividad qué robots elegir
para que operen en cada momento. Para ello, nuestra idea básica era utilizar los resultados
pasados de cada robot en situaciones del mercado similares para tratar de predecir cómo
se comportarán en la situación actual.
Ası́, debı́amos desarrollar unos “predictores” que nos proporcionen información sobre los
resultados que tendrá un robot concreto si operara en el momento actual. Esta información
serı́a entonces utilizada por un agente externo de Talentum, que con sus propios criterios
decidirı́a qué robots utilizar.
Además del sistema básico de realización de predicciones sobre el desempeño de un
robot, incorporamos otros mecanismos para estimar los errores que cometemos en las
mismas, de forma que diéramos al agente externo la mayor cantidad de información posible
para realizar sus decisiones.
Por tanto, nuestro objetivo final es implementar un sistema que nos proporcione predic-
ciones sobre el rendimiento de cada robot, junto con una medida de la fiabilidad de esta
predicción. Todo ello será interpretado por un agente externo que elegirá un determinado
conjunto de robots en para que operen en cada momento, en función del riesgo deseado.
Capı́tulo 2
Desarrollo de la Solución
2.1. Solución Propuesta

2.1.1. Visión General
Puesto que nuestro objetivo es lograr hacer predicciones sobre el resultado que tendrá un
robot puesto a operar sobre el mercado, el núcleo de nuestro sistema lo constituirán los
predictores. Un predictor es un elemento relativo a un robot concreto, que basándose en
su historial de operaciones realizará sus predicciones. Además, estableceremos otra capa
superior al predictor que nos proporcionará una medida de la fiabilidad de las predicciones
realizadas por éste en cada momento.
Toda esta información de cada robot será utilizada por un agente externo para ele-
gir qué robots dejar operar en bolsa y cuáles no. El esquema de esta estructura puede
encontrarse en la figura 2.1.
La principal decisión que marcarı́a gran parte del diseño posterior consistı́a en qué técni-
ca de inteligencia artificial utilizar para implementar los predictores. En nuestro caso, de-
cidimos utilizar redes neuronales porque, a pesar de ser suficientemente sencillas para la
profundidad de un trabajo fin de grado, esperábamos que fueran suficientemente flexibles
para resolver satisfactoriamente el problema para cada robot. Además, tienen la ventaja
de ser suficientemente eficientes en su ejecución para poder utilizarlas operando en tiempo
real.
Una red neuronal artificial es un modelo matemático no lineal, de naturaleza compu-

tacional, con una arquitectura inspirada en la organización neuronal biológica ([3]). Es
decir, puede verse como una estructura en red consistente en un número de neuronas
(nodos) conectadas por enlaces direccionales ([4]).
En ella, cada nodo es una unidad de procesamiento independiente, que calcula un valor
de salida a partir de una serie de valores de entrada. La forma en la que estos valores
de entrada se utilizan para dar lugar a la salida depende de una serie de parámetros
especı́ficos de cada nodo. Para que la red pueda resolver un determinado problema, se
modifican estos parámetros de acuerdo a ciertos algoritmos, denominados algoritmos de
entrenamiento. De esta forma, la red puede “aprender” para adaptarse a resolver un
17
18 CAPÍTULO 2. DESARROLLO DE LA SOLUCIÓN
Figura 2.1: Estructura básica general del sistema.
determinado problema. La figura 2.2 muestra un diagrama básico de la composición de

una red neuronal.
Ası́, el objetivo de nuestro software será conseguir obtener redes neuronales capaces de
predecir el comportamiento de cada robot, y utilizar éstas para obtener información sobre
su desempeño esperado, que proporcionaremos a un agente externo para que las controle.
2.1.2. Redes Neuronales como Predictores

Introducción y Conceptos Básicos
Las redes neuronales artificiales son especialmente útiles en problemas complejos o difi-
ciles de definir con precisión. En estos casos, el diseño de una función o método especı́fico
para resolver el problema resulta impracticable. También es una técnica muy común en
casos en los que la función es desconocida, pero contamos con bastantes casos en los que
conocemos de resolución correcta del problema.
Por ejemplo, las redes neuronales son muy comunes en problemas de reconocimiento de
patrones: Escritura a mano, reconocimiento facial, etc. En ellos, pese a que no podemos
diseñar o programar un conjunto de reglas o un software concreto para resolver cada
caso, en el caso de tener suficientes ejemplos del patron que queremos detectar, las redes
neuronales proporcionan muy buenos resultados en la detección de casos nuevos. Antes
de que una red neuronal pueda resolver un problema concreto, debemos someterla a un
proceso previo, conocido usualmente como aprendizaje o entrenamiento.
2.1. SOLUCIÓN PROPUESTA 19
Figura 2.2: Diagrama básico de red neuronal y neuronas.
El problema que estamos tratando de resolver es un problema de regresión. Es decir,

tenemos una función desconocida, que en nuestro caso recibe como entrada la información
del estado del mercado en un momento dado, y proporciona como salida la ganancia futura
del robot cuando se activa en ese estado del mercado. Lo que realiza la red neuronal es, a
partir de una serie de casos de ejemplo, crear un modelo de esa función desconocida. El
proceso de aprendizaje consiste en ajustar esta función que implementa la red neuronal
para reducir el error entre la salida obtenida y la deseada para el conjunto de ejemplos
en los que conocemos la resolución del problema. Si los datos que utilizamos para este
aprendizaje son representativos de todas las posibles entradas, y el modelo que implementa
la red se ajusta bien a esos datos conocidos, esperamos que lo haga también para los
desconocidos.
Hay distintos tipos de redes neuronales dependiendo del número y distribución de sus
neuronas y de los enlaces entre ellas, y a su estructura se le denomina usualmente to-
pologı́a de dicha red. Podemos distinguir en ella tres tipos de nodos o neuronas: De
entrada, que reciben la información del exterior, de salida, que proporcionan sus resulta-
dos al exterior, y ocultas, que reciben y envı́an sus variables a otros nodos de la propia
red.
Por otra parte, denominamos variables de entrada a aquellas que reciben las neuronas
de entrada del exterior de la red, y variables de salida a las que proporcionan al exterior
de la red las neuronas de salida. La forma de calcular la salida de cada neurona en función
de sus entradas queda determinada por variables denominadas pesos, relativos a cada uno
de sus enlaces.
Podemos ver gráficamente los distintos tipos de neuronas y variables, ası́ como su los
tipos de capas, en la figura 2.3.
Todas estas neuronas, a su vez, se distribuyen en capas. Decimos que un nodo está en
la capa n cuando el mı́nimo número de neuronas entre ésta y una neurona de entrada es
n. Dicho de otro modo, las neuronas de entrada se encuentran en la capa 0, las nneuronas
Figura 2.3: Tipos de neuronas y capas de una red neuronal.
a las que se conectan éstas estan en la capa 1, las que se conectan a estas otras estan en
la capa 2, etc. Si bien las redes neuronales pueden tener topologı́as muy diversas, las más
comunes tienen tres capas: una de entrada, una capa oculta y una de salida, y no tienen
ciclos.
Entrenamiento de una Red Neuronal

El proceso completo que se realiza para obtener una red neuronal para resolver un
problema en concreto, se divide en dos fases. En la primera, se deciden las caracterı́sticas de
la red que emplearemos: Variables de entrada, número de capas y de neuronas, distribución
de las mismas... etc., es decir, su topologı́a. En una segunda fase, se entrena una red con
la topologı́a elegida, que será la que obtendremos como resultado final del proceso.
El procedimiento de la primera fase consiste en partir de un conjunto de posibles topo-

logı́as, elegidas a priori, y tras un proceso de experimentación, elegir aquella que propor-
cione mejores resultados. Es decir, en primer lugar elegimos un conjunto de topologı́as,
definiendo las entradas que recibirá nuestra red, cubriendo un espectro que consideremos
suficiente.
A continuación realizamos una cierta cantidad de experimentos para cada posible to-
pologı́a que nos planteemos utilizar para nuestro problema. Estos experimentos consisten
en entrenar una red con esas caracterı́sticas y evaluarlas1 . Ası́, veremos los resultados que
obtenemos para una serie de redes entrenadas con una determinada configuración, calcu-
laremos su media, y ésta será la medida que emplearemos para comparar esta topologı́a
con las demás.
Sin embargo, es importante tener en cuenta que es usual que distintas topologı́as
1
En este capı́tulo pretendemos únicamente de dar una idea general de la solución propuesta en nuestro
trabajo, sin entrar en excesiva profundidad. Por ello, los detalles técnicos relativos al entrenamiento,
validación y test de las redes podemos encontrarlos en la sección 3.2
2.1. SOLUCIÓN PROPUESTA 21
den resultados similares, y corremos el riesgo de que la elección de una u otra se deba
únicamente a los resultados de ese conjunto concreto de experimentos realizados, y ésa
no sea la tendencia general. Para evitarlo, debemos no tener en cuenta únicamente que
la media de unos resultados sea mayor que otra, sino que debemos establecer que esta
diferencia sea estadı́sticamente significativa.
Que un resultado sea estadı́sticamente significativo significa que podemos asegurar
con una cierta probabilidad, normalmente el 95 % ó 99 %, que el resultado obtenido no es
producto del azar. Es decir, que realmente una topologı́a es mejor que la otra, y aunque
realizáramos más experimentos es de esperar que se mantenga ese resultado. En el caso
de que la diferencia entre el uso de dos topologı́as no sea estadı́sticamente significativa,
elegiremos aquella que sea más sencilla (menor número de neuronas, menor número de
variables de entrada...).
Para determinar si efectivamente existe significancia estadı́stica en la diferencia en-
tre las medias de las dos series de experimentos debemos realizar un test estadı́stico
adecuado. El procedimiento y la base teórica de los mismos se detallan en la sección 3.4.
Para terminar, una vez elegida la topologı́a que utilizaremos, se procede al entrena-
miento de una red con dicha configuración, que será nuestra red final.
Los detalles técnicos del procedimiento de ambas fases puede encontrarse más detalla-
damente en la sección 3.2, en la que también se recoge el proceso completo de experimen-
tación con las distintas topologı́as y entrenamiento de la red final, ası́ como el proceso de
test de las redes resultantes, cuyo objetivo es tener una estimación del comportamiento
que tendrá la red cuando opere con casos nuevos.
2.1.3. El Procedimiento Completo

Como hemos visto, para obtener una red neuronal que pueda actuar de predictor hace
falta tener una serie de casos conocidos con los que poder entrenarla. En nuestro caso,
puesto que nustro objetivo es utilizar la red para predecir cómo será el desempeño del robot
conociendo la situación del mercado actual, debemos tener una serie de casos pasados en
los que conozcamos el desempeño que tuvo y la situación del mercado en dicho momento.
Esta serie de casos la obtendremos a partir del histórico de operaciones del robot. Es
decir, cada vez que en el pasado el robot realizó una operación en el mercado, sabemos
qué resultado tuvo y conocemos la situación del mercado en ese momento, por lo que a
partir de este histórico podemos obtener casos para entrenar nuestra red.
No obstante, hay que tener en cuenta que modelizar la situación del mercado puede
ser bastante complejo. Existen gran cantidad de factores que podemos tener en cuenta:
Cotizaciones de la divisa en la que opera el robot, cotizaciones de otras divisas, otros
factores como el dı́a de la semana o la hora en las que se realizó la operación, etc., y nos
interesarı́a utilizar la mayor cantidad de ellos posible, siempre y cuando sean relevantes.
Para que el uso posterior de estos datos sea efectivo, se hace necesario establecer un
tratamiento previo de los datos que nos permita eliminar redundancias e información
no relevante, y reducir la dimensión de la información en la medida de lo posible, es
decir, reducir el número de variables de entrada. Esto, además, permitirá mejorar los
resultados de las redes, que sólo recibirán la información relevante, y por tanto podrán
dar mejores resultados con una estructura menos compleja. Para esta etapa previa de
reducción de la dimensión de la entrada utilizaremos el algoritmo del análisis principal
de componentes (PCA, por sus siglas en inglés), que se detalla en la sección 3.3.
Por otra parte, una vez tenemos nuestra red entrenada, podemos ponerla a operar
en el mercado real y monitorizar su rendimiento. Además, estableceremos medidas para
controlar la precisión esperada de la red en cada momento, permitiendo a quien utilice
sus predicciones controlar el riesgo. Este sistema de control de la fiabilidad de la red se
expone en la sección 3.5.
Por último, y como resumen de todo lo anteriormente expuesto, tenemos que podemos
dividir nuestro proceso en las siguientes etapas principales: Obtención y tratamiento
de los datos, elección de la topologı́a de la red y entrenamiento, puesta en
marcha en el mercado real y monitorización y fiabilidad.
Un diagrama de estas etapas, con los productos obtenidos en cada una de ellas y las
técnicas utilizadas en cada fase, puede encontrarse en la figura 2.4.
Figura 2.4: Diagrama general del sistema completo.
2.2. Etapas del Proceso

2.2.1. Obtención y Tratamiento de los Datos
En esta etapa partimos del histórico de operaciones del robot, y nuestro objetivo será ob-
tener una serie de casos de prueba para poder realizar el entrenamiento de la red neuronal
que proporcionará predicciones sobre él. Recordemos que un caso de prueba consiste en
una entrada para el problema cuya salida es conocida. En nuestro caso, la entrada consiste
en la situación del mercado en el momento de producirse la operación, y la salida consiste
en el resultado que tuvo ésta.
Ası́, debemos definir en un primer lugar cómo modelizaremos la situación del mercado
en momento concreto. Dado que cada robot puede operar en una divisa distinta, siguiendo
diferentes estrategias y utilizando distintos datos, debemos poder modelizar la situación
del mercado de manera diferente para cada uno de ellos. Por tanto, nuestro software nos
permitirá definir qué información de entrada queremos utilizar en cada caso para reflejar
2.2. ETAPAS DEL PROCESO 23
el estado del mercado, y realizar de esta forma una modelización del mercado diferente
para cada robot.
La información más básica que podemos utilizar para reflejar la situación del mercado,
que esperamos que sea relevante para nuestra predicción, son los datos relativos a la
divisa sobre la que opera el robot. Utilizaremos por tanto los datos sobre la cotización de
esta divisa en un intervalo de tiempo determinado anterior a la solicitud de apertura de
la operación. Éstos vienen agrupados según periodos de tiempo de distintas longitudes,
denominados velas. Es decir, una vela es la información agrupada de un determinado
periodo de tiempo de una divisa concreta, y tiene 4 atributos principales: El precio que
tenı́a la divisa al inicio del periodo, el que tenı́a al final del mismo, y el máximo y mı́nimo
precio alcanzado en éste.
Las velas pueden tener distintas longitudes, y en nuestro software utilizaremos princi-
palmente velas de 4 tipos: De 5 minutos, de 15 minutos, de 1 hora y de 1 dı́a.
Además de la información básica de las velas de la divisa en la que opera nuestro robot,
nuestro software permite añadir otra información adicional, como velas de otras divisas,
el dı́a de la semana o la hora a la que se realizó la operación, e incluso otros indicadores
macroeconómicos, como son el precio del petróleo o del oro.
Con estos últimos indicadores logramos que, pese a que el robot tiene una visión muy
local del mercado (opera con una divisa y utiliza únicamente las cotizaciones de ésta para
determinar su comportamiento), nuestro sistema lo controla utilizando información mucho
más global. De esta forma, podemos identificar tendencias a nivel mundial, modificando
el comportamiento final del robot en base a si ciertos indicadores del mercado global
presentan tendencias alcistas o bajistas, por ejemplo.
Por último, es importante resaltar que únicamente podremos utilizar información an-
terior al momento de apertura de la operación. Esto es ası́ debido a que las redes
se utilizarán finalmente para predecir el resultado de la operación antes de que se inicie,
por lo que evidentemente debemos utilizar únicamente información que vayamos a tener
disponible en ese momento.
A continuación, una vez elegida la información que queremos utilizar como entrada de
nuestro problema, podemos formar los casos de prueba a partir del histórico de operaciones
del robot, que nos servirán para entrenar la red.
Obtenemos ası́ un fichero con ejemplos de entrada y salida de nuestro problema, siendo
la entrada la modelización del mercado en el momento de apertura de una operación, y
la salida el resultado que tuvo ésta.
Aunque podrı́amos utilizar directamente este fichero para entrenar nuestras redes, en-
contramos que la entrada es demasiado compleja: Por una parte, hay una gran cantidad de
información, mucha de ella redundante o muy parecida, y por otra, como cada robot opera
en distintas situaciones, puede haber información que sea útil en unos robots y redundan-
te en otros, y no tenemos forma de saberlo a priori. Esta excesiva complejidad provoca
que la red tenga muchas más dificultades para aprender y generalizar correctamente el
problema, por lo que trataremos de reducirla.
Para ello, como comentamos en la sección anterior, emplearemos el algoritmo del Análi-
sis Principal de Componentes. Este algoritmo permite combinar las distintas variables
de entrada para mantener la información más importante, y descartar aquella que sea re-
dundante o poco significativa. Aplicando este proceso a nuestro conjunto de casos de
prueba anterior, logramos reducir en la mayorı́a de los casos de unas 150 ó 200 entradas, a
tan sólo 20 ó 25, lo que constituye una reducción de alrededor del 80 u 85 % en el número
de entradas.
Esto además permite que aunque añadamos información nueva que finalmente resulte
ser redundante, esto no repercutirá demasiado negativamente en los resultados finales,
puesto que será eliminada por este último procedimiento. Ası́, podemos añadir gran can-
tidad de información en un principio, y dejar que este paso la reduzca, eliminando la que
sea redundante o poco significativa.
Para finalizar el proceso aplicamos un proceso de normalización a los datos. Si bien en

la teorı́a esto no es necesario, debido a que las redes pueden reescalar cualquier transfor-
mación lineal realizada a los datos, en la práctica lo usual es realizar la normalización.
El motivo principal es que para la inicialización de las redes (los valores iniciales que se
dan a los pesos antes de comenzar el proceso de entrenamiento) deben estar escalados
de acuerdo a los rangos de valores de entrada, para facilitar la convergencia y reducir la
probabilidad de caer en mı́nimos locales. Por tanto, como en general se utilizan valores
aleatorios pequeños para los pesos, es conveniente normalizar la entrada a valores también
cercanos a 0. En nuestro caso, como se recomienda en general, utilizaremos como rango
de normalización el intervalo [−1, 1].[12]
El proceso de normalización consiste simplemente en un cambio de variable lineal, que
transforma una variable de entrada cuyos valores se encuentran en el intervalo [xmin , xmax ]
en otra que se encuentra entre los valores [−1, 1], según y = x2(x−x min )
max −xmin
− 1.
Con todo esto, obtenemos finalmente unos casos de prueba preprocesados adecuados
para el entrenamiento de las redes en la siguiente fase.
2.2.2. Entrenamiento de Redes Neuronales

Con los casos de prueba procesados en la fase anterior, nuestro objetivo en esta fase
será obtener una red entrenada capaz de predecir el desempeño de nuestro robot. Como
hemos comentado, esta fase se puede dividir a su vez en dos etapas: En una primera
elegimos la topologı́a de nuestra red, y en una segunda fase entrenamos la red final que
utilizaremos para controlar el robot.
El proceso básico empleado es el usual cuando se trabaja con redes neuronales, que
hemos expuesto anteriormente: En primer lugar se plantean diversas topologı́as posibles,
con distinto número y tipo de entradas, distinto número de neuronas y distribución, etc.
A continuación se realiza un determinado número de entrenamientos y experimentos para
cada posible configuración, y finalmente se elige aquella que arroja mejores resultados,
asegurándose de que la diferencia sea estadı́sticamente significativa. Por último, se entrena
una red final con dicha topologı́a2 .
2
De nuevo, recordamos que los detalles del proceso pueden encontrarse en la seccion 3.2
No obstante, debido a las caracterı́sticas de nuestro problema y situación, hay varios

factores que no son comunes al proceso usual de entrenamiento descrito.
El primero es debido a que Talentum optimiza los robots utilizando su histórico de
operaciones, es decir, utilizan para modificar el robot precisamente los mismos datos que
utilizaremos nosotros. Es decir, ajusta sus parámetros y comportamiento de forma que sus
resultados si hubiera operado en el pasado sean buenos, esperando que de esta forma sean
buenos también en el futuro. Esto implica que la situación que encontramos en el histórico
de operaciones es probable que no sea la misma que encontrará posteriormente el robot
cuando sea puesto en funcionamiento. Presumiblemente, los resultados que obtendrá el
robot en tiempo real serán peores que los que se reflejan en su histórico, puesto que éste
ha sido programado de forma que los resultados de su histórico sean buenos.
De hecho, si observamos el histórico de resultados de algún robot, solemos encontrar

que sus ganancias totales son muy altas, y hay muchas más operaciones que producen be-
neficios que que producen pérdidas. En el mercado real, por el contrario, esperamos que el
balance del robot sea mucho peor, y que encontremos aproximadamente el mismo número
de operaciones con ganancias que con pérdidas. Si utilizáramos como entrenamiento los
casos extraidos directamente del histórico de operaciones corremos el riesgo de que nues-
tra red sea demasiado permisiva, es decir, que se adapte para ajustar correctamente los
casos positivos (que son la mayorı́a), aunque se equivoque en bastantes casos negativos.
Para evitar esto, debemos modificar el conjunto de entrenamiento para que se ajuste
en lo posible a la situación que esperamos encontrar en realidad. Es decir, debemos modi-
ficarlo de manera que las ganancias se equiparen aproximadamente con las pérdidas, para
que nuestra red “aprenda” correctamente la misma situación para la que posteriormente
la utilizaremos. Para ello, nuestra solución ha sido replicar las operaciones que produjeron
pérdidas hasta que el balance total de pérdidas equipare al de ganancias. De esta forma,
tenemos una situación resultante en la que el balance total es aproximadamente 0, y la
importancia de las operaciones negativas está mucho más cerca de la importancia de las
operaciones positivas. Ası́, esperamos que nuestra red se adapte bien a ajustar ambos
casos.
La segunda modificación se refiere al criterio que utilizamos para elegir una u otra to-
pologı́a en la primera fase. Es común elegir criterios basados únicamente en la precisión
de la predicción, como la diferencia entre los valores predichos y los valores correctos, o
el error cuadrático medio (MSE). Sin embargo, debido al uso que se dará posteriormente
a las predicciones, ninguna de estas medidas resultaba adecuada. En concreto, estos mo-
delos de error penalizan de la misma forma un error entre haber predicho 15$ cuando en
realidad eran 20$, y haber predicho 3$ cuando en realidad eran -2$. Es de suponer que al
agente que vaya a realizar la decisión entre elegir una u otra red, la segunda diferencia le
resultará mucho más relevante.
Por ello, decidimos estudiar una medida de evaluación de la red neuronal alternativa
para esta fase, diseñando otra más parecida al uso que daremos posteriormente a las
predicciones. En ella, supondremos que el agente externo elegirá para que operen todos los
robots para los que nuestra predicción sea positiva, es decir, todos aquellos que predigamos
que van a obtener ganancias. Ası́, simularemos qué hubiera ocurrido si un determinado
conjunto de operaciones se hubieran realizado bajo la supervisión de nuestro sistema, y
cuál habrı́a sido el balance total del robot en ese periodo, comparándolo con aquel que
habrı́a obtenido sin nuestra intervención. Es decir, tomamos la suma del balance obtenido
en todas las operaciones para los que la predicción de nuestra red es positiva, y la diferencia
de ésta con la suma del balance total de las operaciones elegidas será nuestra medida de
error para esa red.
Tras realizar diversos experimentos con las redes obtenidas utilizando este método y los
anteriores, comparamos sus resultados. De esta forma obtuvimos que las redes entrenadas
con las topologı́as elegidas utilizando esta última medida de error daban resultados más
precisos cuando las utilizábamos con datos que no hubieran sido utilizados ni para el
entrenamiento ni para la optimización de los robots. Por ello, decidimos utilizar esta
última medida de error descrita para nuestro sistema.
Tras todo lo anterior, y una vez elegida la topologı́a de la red, procedemos a la segunda
fase. En ella, entrenamos una única red final con esta configuración elegida, que será la
red final que utilizaremos como predictor para ese robot en nuestro sistema.
2.2.3. Puesta en Marcha a Mercado Real

En esta sección describiremos el proceso de ejecución de las redes neuronales entrenadas,
y la comunicación con el agente externo para proporcionarle sus predicciones. Este agente
externo será un sistema de Talentum ya existente denominado Zeus.
Zeus es un software desarrollado para controlar la gestión del riesgo de los sistemas de
Talentum. Es capaz de controlar las operaciones realizadas por cualquier conjunto de ro-
bots, y de denegar o autorizar cualquiera de sus operaciones en el momento en que el robot
solicite realizarla. Nuestro software, por tanto, se comunicará con Zeus proporcionándole
información de las predicciones sobre cada robot. Además, cada vez que un robot quiera
realizar una operación, debe consultar a Zeus, que autoriza o deniega su entrada teniendo
en cuenta nuestras predicciones.
Las estrategias que implemente Zeus para controlar a los robots en base a nuestras
predicciones pueden ser muy diversas, dependiendo de las directrices de los expertos de
Talentum, e incluso de las preferencias de inversores concretos en cuanto a beneficio
deseado y niveles de riesgo admitidos. No obstante, para realizar las pruebas de nuestro
sistema y evaluar su rendimiento, hemos implementado dos estrategias básicas.
La primera, utilizada antes de la implementación de los sistemas de estimación de
errores, consiste simplemente en dejar operar aquellos robots para los cuales nuestra pre-
dicción sea positiva. Es decir, permitir todas aquellas operaciones que predigamos que van
a resultar en beneficios.
La segunda estrategia, también bastante sencilla, pero realizada una vez incorporamos
el sistema de control del error, consiste en dejar pasar aquellas operaciones que, aún
contando con el error que estimemos en la predicción, sigan superando un cierto umbral.
Este umbral, en nuestro caso, lo ajustamos utilizando los resultados que tuvimos durante
el periodo en que la utilizábamos sólo la primera estrategia recién descrite. Ası́, elegimos
el umbral que maximizaba las ganancias en el caso de que el sistema de fiabilidad y esta
segunda estrategia hubieran estado implementados en ese periodo. El umbral resultante

obtenido por este procedimiento fue en nuestro caso de 2$. Por tanta, nuestra estrategia
en este caso consistirá en permitir las operaciones cuya aproximación una vez tenida en
cuenta la corrección del error sea superior a este umbral.
Por otra parte, para realizar nuestras predicciones debemos obtener los datos del mer-
cado en tiempo real: Cotizaciones de todas las divisas en forma de velas, otros indicadores
como el precio del petróleo o el oro... etc. Nuestro software ha sido implementado para
obtener todos estos indicadores de bases de datos habilitadas por Talentum, en las que en
periodos de tiempo de 5 minutos se almacena información actualizada del mercado global.
La información se combina de forma que coincida con la modelización de la situación
del mercado que realizamos para cada robot en la fase de obtención de los casos de
entrenamiento. Además, le aplicamos los mismos pasos que realizamos para la obtención
de dichos casos, es decir, es análisis principal de componentes y la normalización.
Tras este preprocesamiento, podemos utilizar los datos resultantes como entrada de la
red asociada, que nos devolverá la predicción. Por último, obtenemos la fiabilidad asociada
en ese momento a esta red, y suministramos toda esta información a Zeus.
2.2.4. Monitorización y Fiabilidad

Una vez iniciada su ejecución, nuestro software obtiene información sobre la ejecución
de los robots en el mercado, es decir, sobre las operaciones que realicen en cada momento
y su resultado. Esta información la utilizaremos para actualizar la fiabilidad de las redes
en función de si sus prediciones fueron correctas o no.
Para que obtener esta información sea posible, los robots almacenan en una base de
datos durante su ejecución información sobre la apertura y cierre de cada operación que
realizan, ası́ como los resultados de las mismas. Además, nuestro sistema almacena tam-
bién las predicciones que cada red realizó en cada momento, por lo que podemos utilizar
ambas informaciones para actualizar la fiabilidad de la red que predijo cada resultado.
Sin embargo, si únicamente tuviéramos los robots operando en mercado real controlados
por nuestro sistema, sólo conocerı́amos los resultados de las operaciones que Zeus permi-
tiera realizar. No obstante, para actualizar las estimaciones de error de las redes debemos
conocer también los resultados finales que tendrı́an las operaciones cuya realización no se
permite.
Para ello, tendremos operando no sólo los robots con dinero real controlados por
nuestro sistema, sino también otra copia de cada uno de ellos operando en una cuenta
de simulación. Es decir, realizarán todas las operaciones que realizarı́an los robots reales,
pero sin invertir dinero real en ellas. Estos robots simulados también almacenarán los
resultados de sus operaciones en la misma base de datos que sus copias reales, pero con
otro identificador. De esta forma, nuestro sistema obtiene los resultados de todas las
operaciones que los robots podrı́an realizar, independientemente de si finalmente se llevan
a cabo o no.
Con todo ello, tenemos finalmente operando todos nuestros robots en tiempo real,
controlados por sus respectivas redes. Para ello, recibimos información en tanto de la
evolución del mercado como de las operaciones que los propios robots realizan, y utilizamos
un sistema adicional para detectar lo antes posible los periodos en los que las redes no
están funcionando bien y recortar las pérdidas.
Capı́tulo 3
Aspectos Técnicos
3.1. Software Desarrollado

Para la realización de este trabajo ha sido necesario el desarrollo de un nuevo software
especı́fico que realizara los procesos descritos anteriormente. Éste, desarrollado también
como parte de este trabajo, ha sido realizado en lenguaje Java con el soporte de determi-
nadas librerı́as especializadas.
En las siguientes subsecciones se detallan las librerı́as externas utilizadas, los módulos
desarrollados, la estructura del software y finalmente se muestra la interfaz de usuario y
funcionamiento.
3.1.1. Librerias Utilizadas

Para el desarrollo del software se han empleado una serie de librerı́as externas para
realizar las funcionalidades técnicas cuya implementación quedaba fuera de los objetivos
de este trabajo. Ası́, las implementaciones relacionados directamente con, por ejemplo,
las redes neuronales o el algoritmo del análisis principal de componentes, se han delegado
en librerı́as conocidas de aprendizaje computacional u otros ámbitos, que se detallan a
continuación.
Encog ([8]): Encog es una librerı́a especializada de aprendizaje computacional, que

implementa en el lenguaje Java la lógica y algoritmos de gran cantidad de técni-
cas de inteligencia artificial, como redes bayesianas o support vector machines. En
particular, nosotros utilizaremos su implementación de redes neuronales para nues-
tro software. Para éstas, incluye gran cantidad de algoritmos de entrenamiento, y
otras funcionalidades adicionales como el almacenamiento y recuperación de redes
ya entrenadas.
WEKA ([9]): WEKA es una aplicación muy conocida de aprendizaje computacio-
nal, principalmente utilizada para minerı́a de datos, también escrita en Java. Fue
desarrollada por la Universidad de Waikaito (Nueva Zelanda) y se distribuye bajo
licencia GNU General Public. Aunque el software en sı́ constituye una aplicación
completa con interfaz de usuario, nosotros utilizaremos directamente sus librerı́as,
que contienen los algoritmos del análisis principal de componentes, y delegaremos
también en ella algunas tareas menores como la normalización.
29
30 CAPÍTULO 3. ASPECTOS TÉCNICOS
Apache Commons Math ([10]): Es una librerı́a escrita en Java de matemáticas y

estadı́stica que incluye muchas funciones no disponibles directamente en el lenguaje
Java. En nuestro caso, utilizaremos de ella la implementación del ajuste por mı́nimos
cuadrados ponderado.
Jmathplot ([11]): Es una conocida librerı́a open source de uso de gráficos en Java.
Proporciona funcionalidad para mostrar gráficos de diversos tipos en 2D y 3D de
forma sencilla. En nuestro caso la utilizaremos para la visualización de gráficas y
resultados, especialmente para la funcionalidad de nuestro software relacionado que
la monitorización y obtención de estadı́sticas.
3.1.2. Módulos Desarrollados

Además, introducimos aquı́ los módulos que han sido desarrollados y pueden ser en-
tendidos de forma independiente, para facilitar la comprensión de la estructura global
presentada en la sección siguiente. Estos son:
Comunicación con bases de datos

Las bases de datos de Talentum se encuentran en un varios servidores propios, a los que
nos conectaremos utilizando JDBC (Java Database Connectivity, [14]), pudiendo escribir
nuestras consultas en SQL. Por tanto, necesitábamos conectarnos a diversas bases de
datos en distintos host para obtener gran cantidad de datos diferentes (históricos del
robot, datos del mercado y operaciones en tiempo real, etc.). Por ello, implementamos
una primera clase con la funcionalidad básica de comunicación con la base de datos, de
la que heredan otras clases especı́ficas que refinan su comportamiento para los datos que
utilizará.
Además, para algunas funcionalidades, en general aquellas que tienen que ver con la
persistencia de los datos de la propia aplicación se decidió no utilizar estas bases de datos.
En su lugar, se implementó una clase que utilizaba como medio para guardar datos un
fichero de texto de la que heredaron otras clases para datos especı́ficos: Información de los
ficheros y casos de pruebas introducidos, información de las redes entrenadas, estadı́sticas
de ejecución, almacenación y recuperación de las propias redes neuronales, etc. De esta
forma evitábamos sobrecargas las bases de datos de Talentum con más información, y a
la vez hacı́amos el programa mucho más portable, lo que nos resultaba útil por ser un
desarrollo experimental. También se han almacenado en ficheros (.csv) la información de
los históricos del mercado, de los que necesitamos gran cantidad de información, de forma
que su acceso fuera mucho más rápido.
Módulo de tratamiento de históricos y casos de prueba

Como la lógica de procesamiento del histórico de operaciones para obtener finalmente
los casos de prueba era demasiado compleja, decidimos extraerlo en un módulo aparte.
Ası́, en clases separadas se encuentra recogida la lógica de lectura de los históricos y
su combinación con la información del histórico del mercado, la aplicación del análisis
principal de componentes, y la normalización final.
3.1. SOFTWARE DESARROLLADO 31
Hay que tener en cuenta que este módulo no sólo debe permitir realizar el procesamiento
antes de entrenar la red, sino que además debe guardar la información que necesite para
aplicar el mismo procedimiento con los datos que queramos introducir en tiempo real
en esta misma red. Es decir, debe aplicarles a los datos nuevos el análisis principal y la
normalización con los mismos parámetros que utilizó para obtener los casos de prueba
con los que entrenamos la red.
Módulo de redes neuronales

Toda la lógica relacionada con las redes neuronales también fue encapsulada. En par-
ticular la lógica de creación de las mismas, su entrenamiento, ejecución y persistencia, se
encuentran en este módulo. Además, proporciona una fachada que encapsula las peculia-
ridades propias de la librerı́a que estamos utilizando para estas funciones, Encog.
Módulo de fiabilidad y control de errores

Para implementar la funcionalidad de fiabilidad y control de errores tenı́amos varias
estrategias disponibles, y es posible que unas funcionen mejor que otras en algunos casos,
por lo que era interesante tener disponibles varias. Por ello, toda la lógica relacionada
se encapsuló en otro módulo, que implementa principalmente el patrón Strategy. Este
proporciona una interfaz con las operaciones únicamente de inicialización, añadir un nuevo
resultado para actualizar el error y obtener el error esperado en base a una predicción.
3.1.3. Estructura General

El software se puede dividir en 4 partes, diferenciadas tanto a nivel de estructura de
clases como a nivel de interfaz y utilización. Las dos primeras coinciden en funcionalidad
con las dos primeras fases expuestas en la sección 2.2, la tercera corresponde a la tercera
y cuarta fase, y la cuarta parte corresponde a la obtención y visualización de estadı́sticas
de ejecución de las redes. Es decir, las cuatro partes son:
Procesamiento de los datos.
Entrenamiento de las Redes Neuronales.
Ejecución de las Redes y Monitorización.
Visualización de estadı́sticas.
Además, todo el software ha sido desarrollado siguiendo la arquitectura de Modelo-

Vista-Controlador (MVC), por lo que los elementos del modelo seguirán la ruta model.*,
los de la vista la ruta view.* y los del controlador la ruta controller.*. Aunque existe cierta
discusión al respecto, en nuestro caso consideraremos las clases relacionadas con las bases
de datos como parte del modelo.
La estructura del software de cada una de las secciones se detalla a continuación.

Procesamiento de Datos
Contiene toda la lógica y funciones relacionadas con el proceso seguido desde que el
usuario quiere introducir un nuevo robot en el sistema hasta que obtenemos un conjunto
de casos de prueba que nos permitan entrenar una red para el mismo. Ası́, implementa la
lectura de históricos de operaciones, la obtención de datos del histórico del mercado, la
aplicación del análisis principal de componentes, la normalización de los datos... etc.
Además, permite almacenar tanto los ficheros en cada una de las etapas como los casos
de prueba procesados, junto con toda su información relacionada (ı́ndice al que se refieren,
datos que se han utilizado para modelizar la situación del mercado, etc.) para su uso en
otras etapas, en la sesión actual o en otra posterior.
Recordemos que esta parte del software también debe permitir el procesamiento de
nuevos datos en tiempo real, para poder introducirlos en la red una vez puesta a funcionar.
En la figura 3.1 podemos encontrar un diagrama de clases de esta parte. El controlador

principal es DataController, y la clase principal de la vista es DataControllerViewer. La
clase DataFilesTable hereda de AbstractTable ([13]) para mostrar la información de todos
los ficheros de datos del sistema. De esta clase heredan también las clases de las tablas de
los otros apartados.
La clase BacktestFactory nos proporciona los históricos de operaciones de cualquier
robot, y la clase InputFileFactory encapsula la lógica de procesamiento de datos, dele-
ga la lógica de preparación de los casos de prueba sin preprocesar en FilePreparer, la
aplicación del análisis principal de componentes en FileReducer y la de normalización en
FileNormalizer.
El resultado de esta fase es un fichero de casos de prueba, cuyo estado de procesamiento
y otros atributos se modelan en DataFile. DataFilesDatabase es, por tanto, la clase que
implementa la lógica de persistencia de estos datos.
Entrenamiento de las Redes

Contiene toda la lógica y funciones relacionadas puramente con las redes neuronales. Es
decir, realiza el proceso principal desde el procesamiento de los casos de prueba hasta la
obtención de la nueva red neuronal. Además, contiene la lógica púramente de ejecución de
las redes en tiempo real (recibe la entrada y devolver la salida, no la controla ni interpreta).
Por tanto, esta parte engloba toda la lógica de creación de redes, entrenamiento,
ejecución, test y validación, y permite almacenarlas y recuperarlas en el mismo estado en
una sesión posterior.
Podemos encontrar un diagrama de clases de todo ello en la figura 3.2. En él, Network-
Controller es el controlador principal, y TrainNetworkControllerViewer es la clase princi-
pal de la vista. De nuevo, NetworkFilesTable es una tabla que muestra la información de
las redes en nuestro sistema, NetworkFile representa esta información, y NetworksData-
base almacena tanto la información como las propias redes.
Además, DividedSupervisedSets permite dividir los casos de prueba convenientemente
en entrenamiento, validación y test, y unas clases auxiliares, NetworkTrainingResult y
NetworkTestResult agrupan los datos de resultados de los procesos de entrenamiento y
test de las redes, respectivamente.
Figura 3.1: Diagrama de clases de Procesamiento de Datos.

Figura 3.2: Diagrama de clases de Entrenamiento de las Redes.
Ejecución de las Redes y Monitorización

Contiene las clases y lógica que permiten la ejecución del robot en tiempo real, y el
control de los mismos. Es decir, desde la obtención de la nueva red neuronal hasta el final
del proceso, con esta red funcionando y facilitando sus datos a Zeus. Para ello, contiene
la modelización de la red en ejecución, el acceso a las bases de datos para obtención de
información del mercado en tiempo real, la consulta de las operaciones realizadas por cada
robot en cada momento... etc. También contiene las clases relacionadas con la fiabilidad,
y la comunicación con Zeus. Esta comunicación se realiza a través de una base de datos
en la que nuestro sistema almacena sus predicciones sobre los robots en cada momento,
que el sistema Zeus leerá cuando necesite hacer uso de ella.
El diagrama de clases de esta sección se encuentra en la figura 3.3. De nuevo, Runnin-

gNetworkController es el controlador principal, y RunNetworksControllerViewer la clase
principal de la vista, con RunningNetworksTabla la tabla que muestra la información prin-
cipal. La modelización de la red en ejecución se realiza mediante la clase RunningNetwork,
que tiene asociada una red neuronal que es la que realmente realiza las operaciones y pro-
porciona los resultados, y una clase que contiene el control de la fiabilidad para esa red.
Por otra parte, SetsControlDatabase es la clase que almacena la información de nues-
tras predicciones y fiabilidad en la base de datos para ser usada por Zeus, y SignalsDa-
tabase recibe las operaciones realizadas por nuestros robots en tiempo real. Por último,
recordemos que necesitamos datos en tiempo real del mercado, para lo que delegamos en
DataController y su clase RealTimeMarketFacade.
Visualización de Estadı́sticas
Por último, esta parte implementa algunas funcionalidades de visualización de datos y
seguimiento en tiempo real de la ejecución de nuestro software. Permite obtener gráficas
con las predicciones de nuestras redes en un momento determinado, ası́ como ver, para
cada operación que hubieran realizado los robots sin nuestro sistema, si la hemos realizado
Figura 3.3: Diagrama de clases de Ejecución de las Redes.
o no, cuál era nuestra predicción y fiabilidad en ese momento, y el resultado final que ha
tenido.
Además, mantiene registro de todos estos datos para su posterior consulta en ficheros
de texto. Podemos encontrar este último diagrama de clases en la figura 3.4. Una vez
más, StatsController es el controlador principal y StatsViewer la clase principal de la
vista, mientras que OperationsTable es la tabla en la que se muestra toda la información
de las operaciones de los robots, que es obtenida de SignalsDatabase y de sus registros
internos de las predicciones realizadas. Por último, NetworkPlot permite mostrar la gráfica
de predicciones de una red concreta en un intervalo de tiempo determinado, información
que es guardada en StatFileResults. PlotUtils es una clase auxiliar que maneja la creación
de gráficas.
3.1.4. Interfaz de Usuario

La interfaz de usuario del software consta de un menú principal inicial, y 4 paneles de
control, cada uno de ellos correspondiente a una parte principal del software descrita en
la sección anterior.
Ası́, el menú inicial, que se muestra en la figura 3.5, permite abrir dichos paneles de
control. En ellos es en los que se realiza la lógica real de uso de la aplicación.
Manage Data
Si elegimos la opción “Manage Data”, se desplegará el panel de la figura 3.6 que permite
añadir nuevos robots con su histórico de operaciones y procesarlos hasta obtener los casos
de prueba. Ası́, este panel provee funciones para: añadir nuevos robots al sistema, elegir
las variables que utilizaremos para modelar la situación del mercado (que será la entrada
Figura 3.4: Diagrama de clases de Visualización de Estadı́sticas.
Figura 3.5: Menu Principal de la aplicación.
de nuestra red), procesar el histórico de acuerdo a estos datos, reducir su dimensionalidad

utilizando el análisis de componentes principales, y normalizarlos. Finalmente, tendremos
como resultado los casos de entrenamiento que utilizaremos para generar la red neuronal
asociada al robot.
Figura 3.6: Panel de Procesamiento de Datos.
Administrate Networks
Por otra parte, si en el menú principal elegimos “Administrate Networks” se desple-

gará el panel de entrenamiento de redes, que se encuentra en la figura 3.7. Éste utiliza
los ficheros de casos generados en la etapa anterior para obtener nuevas redes. Para ello,
permite las operaciones de crear una nueva red elegir su topologı́a manualmente o dar una
lista de posibles topologı́as, entrenarlas con distintos parámetros y evaluar el resultado.
Ası́, la tabla de este panel muestra toda la información elegida para la red, ası́ como un
resumen de sus resultados de entrenamiento y test.
3.2. DETALLES TÉCNICOS DEL ENTRENAMIENTO DE REDES 37
Figura 3.7: Panel de Entrenamiento de Redes.
Run Networks
El tercer panel, desplegado al elegir “Run Networks” permite poner las redes entrenadas
anteriormente en ejecución. Tras esto, automáticamente harán predicciones sobre su robot
asociado que estará ejecutándose en mercado real, y las almacenarán en una base de datos
para que puedan ser consultadas por un agente externo. Podemos encontrar una imagen
de este panel en la figura 3.8.
Como podemos ver, incluye una tabla en la que se muestran los robots en ejecución,
cons us últimas predicciones y su fiabilidad, e información sobre si su robot asociado
está operando. Además, permite activar y desactivar las redes en cualquier momento.
Figura 3.8: Panel de Ejecución de Redes.
View Stats
Por último, al pulsar “View Stats” se despliega el cuarto panel, que contiene varias
opciones de visualización de estadı́sticas. Por ejemplo, podemos consultar las operaciones
realizadas por los robots en un intervalo dado, o una gráfica con las predicciones de una
red concreta en un cierto periodo de tiempo. Un ejemplo de visualización de este panel
se encuentra en la figura 3.9
Ası́, incluye una tabla que muestra las últimas operaciones realizadas con información
como si nuestro sistema la realizó o no, y cuál era la predicción y fiabilidad en ese momento,
y opciones para el filtrado de éstas y la visualización de gráficas sobre las predicciones de
una red concreta.
3.2. Detalles Técnicos del Entrenamiento de Redes

3.2.1. El Problema del Overfitting
Como se expone en la sección 2.1.2, el proceso de entrenamiento consiste en ajustar
los parámetros de la red para que resuelva los casos de prueba conocidos, esperando que
ası́ sea capaz de generalizar aquellos que no lo son.
El problema que se plantea consiste en que la red puede dar las salidas correctas para
todos los casos de prueba, y dar salidas muy alejadas de las correctas para aquellos casos
Figura 3.9: Panel de Visualización de Estadı́sticas.
para los que no ha sido entrenada. Uno de los posibles motivos de que ocurra esto es que
la red ha quedado entrenada demasiado especı́ficamente para resolver los casos concretos
de entrenamiento, y por ello no es capaz de general los demás casos. A este problema se
le conoce como overfitting o sobreentrenamiento.
Los algoritmos de entrenamiento de redes ajustan en sucesivas etapas los parámetros

de las neuronas para reducir el error producido en la predicción de los casos. Cada una de
las iteraciones que se realizan utilizando una vez cada caso de entrenamiento se denomina
epoch.
Ası́, si ejecutamos el algoritmo de entrenamiento durante demasiados epochs, tendre-
mos que la red se ajustará bien a los casos que utilizamos para su entrenamiento, pero
fallará al generalizar el problema con casos nuevos. Sin embargo, si lo ejecutamos durante
demasiados pocos, la red no aprenderá el problema correctamente.
Para resolver este problema, y poder conocer cuándo debemos finalizar el entrenamien-
to, debemos saber cuándo la red empieza a dar peores resultados para los casos para
los que no la estamos entrenando. Para ello, inicialmente se divide el conjunto de casos
que tenemos destinados al entrenamiento en dos subconjuntos: El conjunto de casos de
training y el de validation. Ası́, el algoritmo que ajusta los pesos de las neuronas en ba-
se a ciertos casos utilizará únicamente los casos de training, y utilizaremos los casos de
validación para detectar cuándo debemos detectar el proceso. Normalmente la división
en los subconjuntos de training y validation se realiza utilizando un 10 ó 20 % de casos
aleatoriamente elegidos para validación, y los restantes para entrenamiento.
Al estar entrenando la red para esos casos, el error que cometemos ajustando los
casos de training decrecerá con el tiempo. Sin embargo, al no estar utilizando para el
entrenamiento los casos de validation, tenemos que la red se comportará con éstos de la
misma forma que lo hará para los casos cuya salida correcta no conocemos, que son los que
queremos resolver. Por tanto, esperamos que el error que cometa en estos últimos decrezca
inicialmente con cada epoch, mientras la red se ajusta correctamente al problema, y se
incremente conforme la red se ajusta demasiado especı́ficamente para los casos de training,
fallando al generalizar el problema. Puede verse un ejemplo de la evolución esperada de
3.2. DETALLES TÉCNICOS DEL ENTRENAMIENTO DE REDES 39
los errores de training1 y validation en la figura 3.10. Idealmente, detendremos el proceso

cuando la red ya haya aprendido el problema y comience a sobreajustarse a los casos de
entrenamiento, por lo que normalmente nuestro criterio de detención será el incremento
en el error de validación.
Figura 3.10: Ejemplo de Overfitting. En azul el error de training y en rojo el error de

validation.
3.2.2. El Proceso Completo de Entrenamiento

Aunque en otras secciones del trabajo se da una visión general bastante completa del
proceso de entrenamiento, en esta sección expondremos los detalles técnicos que no quedan
recogidos en dicha visión general. Recordemos que el proceso general se divide en dos fases:
En una primera hacemos experimentos con diversas redes entrenadas siguiendo diferentes
topologı́as, y elegimos aquella que consideramos mejor, y en una segunda fase entrenamos
una nueva red con estas caracterı́sticas.
Sin embargo, como hemos visto en la sección anterior, para evitar el problema del over-
fitting debemos tener un criterio de detención del entrenamiento efectivo. En la primera
fase utilizaremos el procedimiento descrito, consistente en dividir los casos disponibles
para el entrenamiento en dos subconjuntos, de training y de validation, y utilizar el pri-
mero para ajustar los parámetros y el segundo para detectar cuándo empieza a producirse
1
Para evitar ambigüedades y aunque pueda estar claro por el contexto, nos referiremos por conjunto
de entrenamiento al total de casos destinados a este proceso, y por conjunto de training (en inglés) al
subconjunto de éste que se utiliza para ajustar los parámetros de la red durante el proceso.
overfitting. Además, tenemos que debemos hacer varios experimentos para cada red, nor-
malmente 10 ó 20, y queremos que éstos cubran la mayor cantidad de situaciones posibles.
Para ello, en lugar de utilizar siempre la misma división en casos de training y validation,
la cambiaremos en cada experimento para asegurar que todos los casos se han utilizado
para training y para validation la misma cantidad de veces.
Para ello, utilizamos un procedimiento conocido como K-crossvalidation, que consiste
en dividir el conjunto de entrenamiento en K partes o pliegues, y utilizar en cada expe-
rimento uno de ellos para validación, y los K − 1 restantes para entrenamiento. Ası́, si
queremos realizar 10 experimentos para cada topologı́a y utilizamos 10-crossvalidation,
tenemos que utilizamos un 10 % de los datos para validación, y que todos los casos se
usan una única vez para este subconjunto, y 9 para el de entrenamiento.
Por otra parte, de la segunda fase obtendremos la red que utilizaremos posteriormente,
por lo que querrı́amos utilizar todos los casos posibles para su entrenamiento, pero en-
tonces tendrı́amos que emplear otro método de detención, puesto que ya no utilizarı́amos
conjunto de validation. Este nuevo criterio de detención consiste en calcular el número
medio de epochs que se produjeron hasta la detención del entrenamiento en los experi-
mentos realizados para esta topologı́a en la primera fase. Ası́, podemos utilizar todos los
datos disponibles para entrenamiento para ajustar los parámetros, sin tener que dividirlo
en los subconjuntos de training y validation.
Además, existe en realidad otra etapa, que en el resto del documento tan sólo se nombra
brevemente, denominada fase de test. El objetivo de esta etapa es obtener una estimación
de cómo funcionará la red recién entrenada con datos nuevos que no han sido usados ni
para el entrenamiento ni para la elección de la topologı́a. Para ello, de nuestro conjunto
total original de casos de prueba, se suelen reservar un 20 ó 30 % de los datos para esta
fase.
Ası́, podemos utilizar estos datos no vistos para ejecutar la red, y calcular medidas
del error para éste. Estos errores serán presumiblemente similares a los que tendremos
cuando ejecutemos la red para casos nuevos reales.
Para concluir, es relevante aclarar que para la implementación del software hemos uti-
lizado un tipo de redes neuronales conocidas como Multi Layer Perceptron (MLP). Por
último, como función de activación (una función empleada internamente en la red neuronal
en las conexiones entre neuronas) hemos utilizado la tangente hiperbólica.
3.3. Análisis de Componentes Principales

El Análisis de Componentes Principales es un algoritmo de reducción de datos que
transforma un conjunto de variables posiblemente correladas en otras linealmente inco-
rreladas. Para ello, aplica una transformación ortogonal, y las variables resultantes se
denominan componentes principales. Además, veremos que las componentes principales
resultantes quedan ordenadas según su varianza.
3.3. ANÁLISIS DE COMPONENTES PRINCIPALES 41
Antes de describir el algoritmo del análisis principal de componentes introducimos un

resultado previo, que constituye la parte central del mismo. Este resultado, bastante
conocido en matemáticas, es el cálculo del cociente de Rayleigh de una matriz simétrica.
En primer lugar, consideremos un conjunto de n puntos xj , j = 1, ..., n con xn ∈ Rm ,

representados como una matriz m × n X = [x1 , ..., xn ].
Definimos el problema de maximizar la varianza como el de encontrar una dirección
u ∈ Rm tal que la varianza de la muestra uT X = (uT x1 , ..., uT xn ) sea máxima.
Este problema puede ser visto también como encontrar el vector u tal que la varianza
de los puntos de la muestra proyectados sobre la recta que pasa por el origen y tiene
dirección u es máxima. Esto puede expresarse formalmente como:
n
1X
máx ((xj − x̄)T u)2
u:||u||2 =1 n
j=1
O equivalentemente:
máx uT Σu
u:||u||2 =1
Con Σ = n1 nj=1 (xj − x̄)(xj − x̄)T la matriz de covarianzas. Este problema, que como ya
P
hemos comentado consiste en el cálculo del cociente de Rayleigh de una matriz simétrica,
tiene solución conocidas. Para su resolución, basta diagonalizar la matriz de covarianzas
Σ y escoger como dirección u el vector propio correspondiente al mayor valor propio.
Como hemos adelantado, el algoritmo del análisis de componentes principales se basa

en la resolución del problema anterior. Su ejecución consiste simplemente en tomar la di-
rección para la muestra que maximiza la varianza (conforme acabamos de ver) y proyectar
la muestra sobre el subespacio ortogonal a esta dirección. De esta forma, todas las mues-
tras proyectadas sobre el subespacio ortogonal son evidentemente ortogonales a la que
acabamos de tomar, y por lo tanto son incorreladas. Iterando sucesivamente este método
obtenemos todas las componentes principales, cumpliendo además que están ordenadas
según su varianza.
Evidentemente, el número de componentes principales (no nulas) es siempre menor o

igual que el número original de variables. Además, podemos entender la varianza de las
componentes como la “cantidad de información que contienen”, y por tanto las tendrı́amos
ordenadas según ese criterio. Por ello, este método suele emplearse para reducir la dimen-
sionalidad de nuestros datos. Es decir, para descartar aquellas componentes que tienen
menos información para reducir nuestro número de variables de entrada. [5]
Más concretamente, utilizaremos que la varianza total de la muestra es la suma de las

varianzas de las componentes, y ésta es precisamente la traza de la matriz de covarianzas.
Por tanto, si Σ es la matriz de covarianzas y ∆ es esta misma matriz diagonalizada
(Σ = U ∆U T ), entonces la varianza total es precisamente:
T rΣ = T r(U ∆U T ) = T r(U T U ∆) = T r∆ = λ1 + ... + λn

Es decir, la suma de los valores propios de la matriz de covarianzas. Por tanto, si pro-
yectamos nuestra muestra sobre las direcciones dadas por los primeros k valores propios,
tenemos que la varianza total del subespacio es λ1 + ... + λk . Pero estas direcciones son,
precisamente, las primeras k componentes principales. [7]
Ası́, si queremos mantener, digamos, el 95 % de la varianza, bastarı́a con que la propor-

ción entre la varianza total original y la varianza de la muestra proyectada en el subespacio
fuera 0.95, es decir:
λ1 + ... + λk
>= 0,95
λ1 + ... + λn
Esta reducción es útil, por ejemplo, para aumentar el rendimiento de cálculo del software
que utilizará dichas entradas. Además, normalmente mejora incluso la capacidad de éste de
generalizar un problema dado, debido a que ya habremos eliminado parte de la información
redundante o no útil.
Normalmente, este método nos permite reducir sustancialmente el número de variables
de entrada a la vez que mantenemos el 95 ó incluso el 99 % de la varianza.
3.4. Tests Estadisticos

Los tests estadı́sticos de hipótesis son un método de Inferencia Estadı́stica para con-
trastar la fiabilidad de un resultado experimental. Cuando se realiza cualquier experi-
mentación siempre existe la posibilidad de que los resultados, favorables o no, hayan sido
debidos al azar, cuando en realidad el resultado con mayor probabilidad era el contrario.
Por ejemplo, si estamos comparando dos métodos y al realizar una cierta cantidad de expe-
rimentos, un método parece mejor que otro, es posible que esto sólo sea por los resultados
de ese conjunto de experimentos aleatorios concretos, cuando en realidad si pudiéramos
realizar suficientes experimentos el resultado serı́a el contrario. Los tests estadı́sticos nos
permiten controlar la probabilidad de equivocarnos haciendo estas consideraciones.
Antes de explicar los tipos de tests estadı́sticos e introducir con especial profundidad
aquellos que utilizaremos en este trabajo concreto, definimos algunos conceptos previos:
Definición 3.4.1. Definimos la hipótesis nula como aquella hipótesis que queremos con-
trastar, mientras que la hipótesis alternativa es aquella contra la que queremos contras-
tarla.
Definición 3.4.2. Sea X una variable aleatoria, se dice que el vector aleatorio de di-
mensión n, (X1 , ..., Xn ) es una muestra aleatoria simple (m.a.s.) de tamaño n de X, si
para cada variable Xj ésta sigue la misma distribución que X y las variables Xj son
independientes entre sı́. [6]
3.4. TESTS ESTADISTICOS 43
Es decir, tenemos que si X es la variable aleatoria que representa nuestro experimento,

una muestra aleatoria simple puede ser vista como una sucesión de experimentos de X,
que cumplen ser independientes entre sı́ (esto es, que el resultado de una de las repeticiones
del experimento no influye en el resto).
A continuación, como definiciones relativas directamente al contraste de hipótesis,
tenemos las siguientes:
Definición 3.4.3. Denominamos error de tipo I a la probabilidad de rechazar la hipótesis
nula cuando es verdadera, y error de tipo II a la probabilidad de aceptarla cuando es falsa.
Cuando queremos realizar un contraste de hipótesis, se debe fijar cuál es el mayor error
de tipo I que estamos dispuestos a cometer, y con éste fijo buscamos un contraste que
minimice el error de tipo II. A este primer error se le suele denominar α, y al segundo
β. Normalmente se diseñan los contrastes de forma que la probabilidad α (de rechazar la
hipótesis nula cuando es verdadera) sea el 5 % (0.05). A la variable α también se le conoce
como nivel de significación del test.
Veremos a continuación dos definiciones adicionales antes de pasar a estudiar el con-
traste que utilizaremos en nuestro trabajo:
Definición 3.4.4. Sea (X1 , ..., Xn ) una m.a.s. de X, llamaremos estadı́stico a cualquier
vector aleatorio (k-dimensional) h(X1 , ..., Xn ), donde h : Rn − > Rk es una función me-
dible Borel.
Definición 3.4.5. Sea X una variable aleatoria con distribución Fρ con parámetro ρ, y
sea X = (X1 , ..., Xn ) una m.a.s. de X, se dice que el intervalo (i(X), s(X)) es un intervalo
de confianza al nivel 1 − α, para el parámetro ρ si
P (i(X) ≤ ρ ≤ s(X)) ≥ 1 − α
Es decir, un intervalo de confianza es un intervalo obtenido a partir de la m.a.s. que

cumple que, si la variable aleatoria sigue una distribución determinada Fρ , la probabilidad
de que ρ se encuentre en ese intervalo es mayor que 1 − α.
Una vez introducidos estos conceptos y definiciones, expondremos el proceso general

de realización de un test estadı́stico y finalmente lo completaremos para explicar el test
concreto utilizado en este proceso, conocido como t-test.
El proceso general de realización de un test estadı́stico es el siguiente:
1. Se estudia el problema y se establecen las hipótesis nula y alternativa.
2. Establecemos las asunciones para la muestra estudiada. Por ejemplo, las distribu-
ciones de éstas o si son independientes.
3. Se decide el test a utilizar, y en consecuencia el estadı́stico T .
4. Se elige el nivel de significación α.
5. Se calculan las regiones crı́ticas correspondientes al estadı́stico y al nivel de signifi-

cación α.
6. Se calcula el valor tobs del estadı́stico T para los resultados observados de los expe-
rimentos.
7. Si el valor observado tobs se encuentra en la región crı́tica, rechazamos la hipótesis,

y la aceptamos en caso contrario.
El procedimiento concreto de realización del test depende principalmente, como hemos

comentado, de la hipótesis que queramos contrastar y de la distribución de los experi-
mentos. En nuestro caso, utilizaremos un test para comparar los resultados arrojados por
redes neuronales de distintas configuraciones, para elegir con cuál quedarnos. El objeti-
vo será decidir si entre dos redes distintas existe significancia estadı́stica de que una de
ellas proporciona mejores resultados que la otra. Es decir, lo que querremos saber será si
podemos asegurar que las medias de los resultados de una y otra son distintas.
Por tanto, nuestra hipótesis nula será que las medias son iguales, y la hipótesis alter-
nativa que son distintas. El procedimiento y estadı́sticos concretos constituyen resultados
bien conocidos, que pueden consultarse por ejemplo en [6] . Ası́, el estadı́stico que utili-
zaremos es el siguiente:
X̄1 − X̄2
t= q (3.1)
sX1 X2 · n2
donde X̄1 y X̄2 son las medias de las dos muestras experimentales, y
r
1 2
sX1 X2 = (s + s2X2 )
2 X1
Pn
siendo s2X1 y s2X2 son los estimadores de las varianzas de las muestras, es decir, s2X =
2
i=1 (xi −x̄)
n
Finalmente, tenemos que el intervalo de confianza, que también es un resultado cono-

cido, es:
(X̄1 − X̄2 − t1− α2 S, X̄1 − X̄2 + t1− α2 S) (3.2)
Ası́, nuestro procedimiento final consiste simplemente en calcular la observación del

estadı́stico t según 3.1, y comprobar si se encuentra en el intervalo dado por 3.2. Si es ası́,
aceptaremos la hipótesis nula, es decir, que no podemos distinguir sus medias, y en caso
contrario la diferencia entre ellas será estadı́sticamente significativa.
3.5. Medidas de Error y Fiabilidad

Tras la implementación del primer prototipo de nuestro sistema, que no incluı́a ningún
sistema de control de errores sino que únicamente emitı́a las predicciones, pusimos a
funcionar el software para evaluar sus resultados preliminares. Concluimos que las redes
eran capaces de predecir bastante bien los resultados de los robots en “las circunstancias
más normales”, esto es, la mayor parte del tiempo, pero que sin embargo habı́a semanas
en las que se encadenaban varias operaciones en las que las redes fallaban sus predicciones,
3.5. MEDIDAS DE ERROR Y FIABILIDAD 45
provocando pérdidas importantes y un empeoramiento sustancial de la eficacia de nuestro

sistema.
Por ello, procedimos a diseñar e implementar un elemento “externo” a las redes que
evaluara su eficacia a muy corto plazo. Estudiando los resultados, vimos que los periodos
en los que red pasaba de actuar razonablemente bien a actuar mal eran muy cortos, cam-
biando de una semana a la siguiente. Por ello, necesitábamos cambiar el error estimado de
forma muy rápida, basándonos sobre todo en las últimas predicciones. Es decir, utilizando
principalmente en los resultados de las últimas 3 ó 4 operaciones, tenı́amos que estimar
el grado de fiabilidad de la predicción que nos dé la red en el momento actual.
Cuando en un principio se planteó el desarrollo de un sistema de estimación de erro-
res, una de las soluciones que se planteó fue utilizar técnicas de Inferencia Estadı́stica,
empleando intervalos de confianza. Sin embargo, debido a la limitación de basarnos casi
únicamente en las últimas 3 ó 4 operaciones, esta aproximación era inviable. Necesitába-
mos otra aproximación que nos permitiera obtener conclusiones con muy pocos datos, y
no como un promedio a largo plazo.
Nuestro objetivo en esta sección es, por tanto, exponer el desarrollo que nos llevó al
sistema actual de estimación el error para las predicciones de beneficio de una red neu-
ronal, basándonos únicamente en sus resultados en las últimas 3 ó 4 operaciones. Esto
permitirá a quien utiliza esta predicción juzgar mejor su decisión de elegir unos u otros
robots en función del riesgo que esté dispuesto a correr. Por ejemplo, si la predicción
es que ganará poco y el error que esperamos es grande, es poco probable que se quiera
utilizar este robot, mientras que si la predicción es que ganará mucho y tenemos un error
esperado moderado, sı́ es probable que queramos dejarlo operar.
Para ello, se plantearon dos aproximaciones iniciales partiendo de dos ideas básicas
distintas, y tras cierta reflexión, resultaron ser de alguna forma similares a casos concretos
de una solución más general, que exponemos en último lugar.
Partimos de una variable R que refleja el valor real del beneficio que obtiene el robot al
realizar una cierta operación, y una variable P que nos da el valor predicho por nuestra
red. Evidentemente, el valor de R nos resulta desconocido, y lo que queremos es establecer
alguna relación entre ellos, que será nuestra medida del error cometido. Una primera
aproximación planteada consiste en expresar el error cometido como un sumando, es
decir, suponer que la función P aproxima a R salvo un determinado error que será la
diferencia entre ambas:
R=P +
con la función que queremos estimar, y despejando tenemos que = R − P . Dado
que queremos utilizar los últimos 3 ó 4 valores para estimar nuestro error, podrı́amos
simplemente tomar el promedio del valor absoluto de esta resta para esos valores, y uti-
lizarlo como
P4
estimación del error de la predicción siguiente. Es decir, podrı́amos definir
ei
err = i=1 4
y estimar que dada una nueva predicción P , el valor de R estará en el
intervalo [P − err, P + err], por lo que es probable que el resultado de la operación sera
R > P − err. Ası́, una posible estrategia serı́a elegir aquellos robots con mayor valor para
P − err, o aquellos tales que P − err > 0. Esta estrategia básica se puede mejorar estable-
ciendo este umbral de forma más adecuada. Para ello, podemos simular los resultados que
habrı́amos obtenido para un intervalo de tiempo pasado determinado en el caso de utilizar
esta estrategia con distintos umbrales, y finalmente quedarnos con aquel que proporcione
mejores resultados.
Además, también podemos mejorar la forma de calcular err, puesto que utilizando el
promedio de las 4 últimas operaciones, damos la misma importancia a la primera que a
la última operación que consideremos, y a partir de esa no tenemos en cuenta ninguna
otra. Parece más razonable que el peso de cada operación en la estimación final sea
proporcional a su antiguedad. Para ello, cada vez que recibamos una nueva operación a
tener en cuenta, disminuiremos el peso que tenı́an las anteriores y añadiremos esta última
con mayor importancia. Ası́, si errn es el error que tenı́amos en un momento dado y nos
llega otro resultado a tener en cuenta, el nuevo error errn+1 se calculará según:
0 = α · + (1 − α) · n
Con un 0 < α < 1 adecuado. Este α determina cómo se reparte el peso entre las ope-
raciones anteriores. Cuanto mayor sea, más importancia daremos al nuevo resultado que
acabamos de recibir, y que por tanto será el más reciente. Este α puede determinarse con
el mismo procedimiento que expusimos para elegir el umbral anterior: Basta seleccionar
varios posibles valores, simular qué hubiera ocurrido en un intervalo de tiempo pasado, y
elegir aquel valor de α que maximice nuestras ganancias.
Con la implementación de esta primera aproximación ya se producı́an mejoras significa-

tivas, aunque el segundo planteamiento expuesto a continuación daba resultados incluso
mejores. La idea consiste en utilizar un factor multiplicativo en lugar de uno aditivo, como
hacı́amos en el método anterior. De esta forma, suponemos que P determina R excepto
por un determinado factor f por el que viene multiplicado. Ası́, en este caso podemos
expresar R como:
R=P ·f
Y de igual forma que antes, podemos despejar f según f = PR , obteniendo un valor del
mismo para cada resultado que tengamos. A continuación, de forma análoga al método
anterior, podemos obtener un valor F que constituya un promedio ponderado de los fac-
tores f de los resultados pasados. Ası́, podemos utilizarlo para estimar el error esperado,
asumiendo que dada una predicción nueva P 0 , el resultado que esperamos será aproxima-
damente R0 = P 0 · F . Con ello, una estrategia básica podrı́a ser elegir aquellos robots para
los que nuestra predicción sea P · f > U con U un umbral adecuado.
Pero como hemos adelantado al principio, planteados de la manera adecuada, los dos
métodos anteriores son en realidad similares a casos particulares de un método más ge-
neral. La clave para ver la generalización consiste en imaginar los valores de P y R como
puntos (P, R) en el plano, y plantear el problema como el de aproximar estos puntos
mediante una recta.
3.5. MEDIDAS DE ERROR Y FIABILIDAD 47
De esta forma, el primer método, en el que tratábamos de ajustar R por P +, consiste
en realidad en un ajuste según una recta con pendiente 1 y ordenada en el origen . Por
otra parte, el segundo método, ajustar R por P · f consiste en realidad en ajustar los
puntos a una recta con pendiente f que pasa por el origen.
Por ello, el método general que resulta lógico plantearse a continuación es precisamente
el ajuste de mı́nimos cuadrados, en el que aproximamos una serie de puntos en el
plano por una recta. Esta recta será aquella que minimice la suma de los cuadrados de
las diferencias entre los valores de nuestro ajuste y los reales. Además, para continuar con
la idea de darle más importancia a las operaciones más recientes, emplearemos el método
algo más complejo del ajuste de mı́nimos cuadrados ponderado. Esta variación del
método permite ajustar el peso que tendrá cada punto en el cálculo del error que queremos
minimizar. Utilizaremos como peso para los puntos αn , con n el número de operaciones
entre la actual y aquella a la que se refiere el punto. Este α puede ajustarse de la misma
forma que en los métodos anteriores.
Finalmente, obtendremos una recta y = m · x + n que ajuste estos puntos, por lo que
podemos estimar que el valor real que obtendremos de una operación con predicción P
será R = P · m + n. Ası́, una posible estrategia serı́a elegir aquellos robots cuya predicción
cumpla que P · m + n > U para U un umbral ajustado.
Por último, es importante resaltar que cada red tiene su propia fiabilidad y ajuste del
error independiente, y que por tanto deben calcularse por separado. Esto es ası́ debido a
que hay situaciones en las que unas redes pueden funcionar muy bien y otras muy mal, y
en general ni las redes ni los robots tienen por qué estar relacionadas entre sı́.
Con estos métodos establecemos un nuevo filtro que controla a la propia red, que a
su vez supervisa los robots operando a mercado, y la mejora es realmente sustancial, en
especial con el segundo y tercer método. Los resultados del sistema tras la implementación
del método final anterior se exponen en la sección 4.2.
Capı́tulo 4
Resultados y Conclusiones
4.1. Resultados del Prototipo Inicial

Tras finalizar el desarrollo del prototipo de nuestro software sin las medidas de control
de errores y fiabilidad descritas en la sección 3.5, se puso en marcha con un conjunto de
23 robots durante un mes, desde el 02/06/2014 hasta el 30/06/2014.
Aunque nuestro sistema está pensado para proporcionar información a un agente ex-
terno que sea el que controle los robots, para poder obtener resultados sobre su eficacia
implementamos una estrategia sencilla para poder elegir los robots que dejaremos operar
en el mercado y poder evaluar sus resultados. Puesto que el sistema de fiabilidad aún no
estaba desarrollado, únicamente contábamos con la predicción de la red asociada a cada
robot. Ası́, nuestra estrategia consistió en elegir para operar en mercado a todos aquellos
robots cuya predicción de su red fuera positiva. Es decir, pondremos a operar todos los
robots que estimemos que van a obtener ganancias en sus operaciones, y los retiraremos
cuando predigamos que van a sufrir pérdidas.
En la tabla 4.1 se detallan nuestros balances totales de cada semana comparándolos

con los que habrı́an obtenido los robots sin ninguna supervisión, es decir, permitiendo a
todos los robots operar durante todo el tiempo. Por otra parte, en la tabla 4.2 aparecen
el número de operaciones positivas y negativas que realizan los robots, y el balance total
dividido en balance positivo y negativo.
Además, encontramos calculadas las proporciones entre todos estos factores comparan-
do los resultados obtenidos por nuestro sistema con los obtenidos sin ninguna supervisión.
Para interpretar estas proporciones, tenemos que las relativas a balance y operaciones po-
sitivas dan una medida de la precisión de nuestro sistema para detectar cuándo los robots
van a funcionar bien, y por tanto les permite operar. Por otra parte, las proporciones
de balance y operaciones negativas indican la precisión de nuestra sistema para detectar
cuándo los robots van a tener pérdidas, y evitar que se produzcan. Por tanto, idealmen-
te nuestro sistema tendrı́a proporciones de balance y operaciones positivas muy altos, y
proporciones de balance y operaciones negativas muy bajos.
Ası́, podemos ver que el balance total que habrı́an obtenido los robots hubiera sido
de -235.51$, mientras que los robots con nuestro sistema pierden 72.20$ menos, es decir,
49
50 CAPÍTULO 4. RESULTADOS Y CONCLUSIONES
Balance Final Original Balance Final Redes Diferencia

Semana 1 -24.12 9.01 33.13
Semana 2 -70.44 -19.3 51.14
Semana 3 -3.04 -22.07 -19.03
Semana 4 -137.91 -130.95 6.96
TOTAL -235.51 -163.31 72.20
Cuadro 4.1: Balance total de las 4 semanas y total. Software sin fiabilidad.
Balance Positivo Proporción Balance Negativo Proporción

Semana 1 49.34 / 69.65 0.71 -40.33 / -93.77 0.43
Semana 2 38.49 / 46.98 0.82 -57.79 / -117.42 0.49
Semana 3 78.06 / 150.07 0.52 -100.13 / -153.11 0.65
Semana 4 39.31 / 81.13 0.48 -170.26 / -219.04 0.78
TOTAL 205.2 / 347.83 0.59 -368.51 / -583.34 0.63
Ops. Positivas Proporción Ops. Negativas Proporción
Semana 1 13 / 18 0.72 7 / 18 0.39
Semana 2 13 / 18 0.72 9 / 22 0.41
Semana 3 15 / 25 0.6 11 / 27 0.41
Semana 4 9 / 12 0.75 17 / 27 0.63
TOTAL 50 / 73 0.68 44 / 83 0.53
Cuadro 4.2: Balance positivo y negativo y número de operaciones positivas y negativas de

cada semana y final. Software sin fiabilidad. Comparación entre Robots con Red / Robots
sin Red
4.1. RESULTADOS DEL PROTOTIPO INICIAL 51
-163.31$. Lo que es más, únicamente en una de las semanas los robots fuera de nuestro
sistema funcionaron mejor. Como debemos tener en cuenta que el hecho de que los robots
en sı́ funcionen mal en general, y pierdan dinero, está fuera de nuestro control y no es
nuestra responsabilidad, podrı́amos pensar que los resultados obtenidos son satisfactorios.
No obstante, un estudio algo más detallado muestra que no es ası́. Es importante
resaltar que, como puede verse en la tabla 4.2, todas las semanas la proporción de ope-
raciones positivas que nuestro sistema deja pasar es superior la proporción de operaciones
negativas, lo cual sı́ es sin duda un dato muy positivo.
Sin embargo, si observamos las columnas de proporción vemos que los resultados no son
buenos. Éste será el dato que nos indicará en realidad si nuestro sistema está funcionando
correctamente, ya que no depende de que los propios robots lo hagan bien o mal. Ası́,
podemos ver que nuestro sistema permite pasar el 59 % del balance positivo y el 63 %
del balance negativo. Es decir, el porcentaje de pérdidas producidas por los robots que se
realizan en nuestro sistema es superior al porcentaje de ganancias que se producen. Esto
significa que si construyéramos un sistema que dejara operar a mercado aleatoriamente el
60 % de las operaciones que los robots solicitaran, estadı́sticamente deberı́a mantener el
60 % de las ganancias (más que nuestro sistema) y como consecuencia tener únicamente
el 60 % de las pérdidas (menos que nuestro sistema). Ası́, en realidad, el hecho de que los
robots supervisados den mejores resultados que sin supervisar se debe a que en general
ha habido muchas más pérdidas que ganancias, por lo que cualquier sistema que evite que
una cierta cantidad de operaciones se realicen (incluso si las elige al azar) mejorarı́a los
resultados.
Sin embargo, sı́ podemos ver que hay semanas que nuestro sistema ha funcionado muy
bien (semanas 1 y 2) aunque haya otras que haya funcionado muy mal (3 y 4). Además,
tenemos que los resultados de las proporciones de operaciones positivas y negativas que
realiza nuestro sistema sı́ son buenos todas las semanas. Por tanto, nos planteamos
que si pudiéramos detectar a tiempo en qué momentos (o semanas) nuestro sistema y
nuestras redes están fallando en sus predicciones deberı́amos mejorar sustancialmente
nuestros resultados. Esto es precisamente lo que perseguimos con la implementación del
sistema de fiabilidad y control de errores que desarrollamos e implementamos como parte
del prototipo final.
Adicionalmente, añadimos también en las tablas 4.3 y 4.4 los balances totales de cada
robot las semanas 2 y 4, encontrandose en esta primera resultado muy buenos, y en la
segunda resultados muy malos. Hay que tener en cuenta en estos datos que hay ocasiones
en las que nuestro sistema permite operar a un robot algo de tiempo después de lo que lo
harı́a sin nuestra intervención, por lo que los resultados de una “misma operación” con y
sin la supervisión de nuestro software pueden ser distintas. Es por eso, por ejemplo, que
un robot que haya realizado una única operación con y sin nuestro sistema puede tener
balances ligeramente diferentes.
Balance Original Balance Redes Ops. Positivas Ops. Negativas

10062 1.11 2.12 1/1 0/0
10075 0 0 0/0 0/0
10208 0 0 0/0 0/0
10290 0 0 0/0 0/0
10309 0 0 0/0 0/0
10416 0 0 0/0 0/0
15009 0 0 0/0 0/0
20020 -3.2 -3.1 2/2 1/1
20023 -4.49 0 0/0 0/2
20030 -29.5 -33.6 1/1 3/3
25001 -13.7 1.6 1/4 0/5
25013 -24.1 -7.7 1/2 3/4
40003 -18.24 -3.3 0/0 1/4
50003 0 0 0/0 0/0
50011 0 0 0/0 0/0
50016 2.7 2.7 2/2 0/0
50030 0 0 0/0 0/0
50114 0 0 0/0 0/0
50177 4.4 0.3 1/2 0/0
50212 0 0 0/0 0/0
50242 6.95 6.95 3/3 1/1
61228 -7.1 0 0/0 0/2
10169 14.73 14.73 1/1 0/0
Cuadro 4.3: Balance total desglosado de la semana 2. Proporción de operaciones con Red
/ sin Red.
4.1. RESULTADOS DEL PROTOTIPO INICIAL 53

10062 -15.54 0 0/0 0/1
10075 0 0 0/0 0/0
10208 0 0 0/0 0/0
10290 0 0 0/0 0/0
10309 26.5 0 0/1 0/0
10416 -4.71 -4.71 2/2 3/3
15009 -1.8 -1.8 0/0 1/1
20020 10.3 10.2 2/2 1/1
20023 -26.38 -24.79 0/0 1/2
20030 -0.1 -0.1 0/0 1/1
25001 1.4 -5.5 0/2 1/3
25013 -6.1 -6.1 1/1 3/3
40003 -71.91 -63.17 1/1 3/3
50003 0 0 0/0 0/0
50011 0 0 0/0 0/0
50016 8.2 8.2 1/1 0/0
50030 0 0 0/0 0/0
50114 0 0 0/0 0/0
50177 -5.8 -6.1 0/0 1/1
50212 0 0 0/0 0/0
50242 -37.08 -37.08 2/2 3/3
61228 -21.4 0 0/0 0/3
10169 6.51 0 0/1 0/0
Cuadro 4.4: Balance total desglosado de la semana 4. Proporción de operaciones con Red
/ sin Red.
4.2. Resultados Finales

En esta sección se presentan los resultados finales de nuestro software, siendo la dife-
rencia más importantes respecto a los resultados de la sección anterior la incorporación
al sistema del método de control de errores y fiabilidad descrito en la sección 3.5. Para
obtener estos resultados, se añadieron 40 nuevos robots al sistema, se entrenaron redes
para ellos, y se pusieron a funcionar teniendo en cuenta la nueva información que nos pro-
porcionaba la fiabilidad de cada red. Como método de control de errores, hemos elegido el
método basando en la técnica de ajuste de mı́nimos cuadrados ponderado, que recordemos
que consistı́a en utilizar las predicciones de las últimas operaciones y sus resultados finales
reales para ajustar una recta que permita corregir la predicción nueva.
Además, pese a que de nuevo los datos de predicción y fiabilidad que obtenemos
en nuestro sistema están planteados para ser utilizados por un agente externo, imple-
mentamos una nueva estrategia básica que nos permita probar el sistema. En este caso
elegiremos para operar todos aquellos robots que, pese a tener en cuenta el error que
esperamos cometer en nuestra predicción, supere un cierto umbral U .
Además de este umbral, debemos elegir un valor del parámetro α utilizado en el método
elegido de fiabilidad para definir los pesos que asignamos a cada una de las operaciones
anteriores. Tanto este valor α como el valor del umbral U se ajustaron utilizando las
operaciones cuyos resultados se detallan en la sección anterior. Ası́, se eligieron aquellos
parámetros que hubieran dado mejores resultados en ese periodo de tiempo. Concreta-
mente, estos fueron los parámetros α = 0,3 y U = 2.
Los resultados del sistema tras 3 semanas de ejecución (del lunes 10/08/2014 al domingo
31/08/2014) son los que se detallan en esta sección. Al igual que en la sección anterior,
realizaremos la comparativa entre los resultados obtenidos con nuestro sistema y aquellos
que los robots habrı́an obtenido sin él.
Nos centraremos principalmente en las mismas métricas: El balance total de cada
semana y desglosado por robot, los balances positivo y negativo y número de operaciones
positivas y negativas. Además, volveremos a reflejar la proporción entre los balances y
número de operaciones que se realizan con nuestro sistema frente a los totales que se
producirı́an sin nuestra intervención. Esperamos que, si nuestro sistema funciona bien,
la proporción de balance y operaciones positivas que se realizan con nuestro sistema sea
siempre mayor que la proporción balance y operaciones negativas.
En la tabla 4.5 podemos encontrar los balances totales comparados de las 3 semanas,
y el balance final total. Además, en la tabla 4.6 podemos encontrar el balance positivo y
negativo que realizan los robots que nuestro sistema elige para operar en cada momento
frente al que realizarı́a la totalidad de los robots si operaran de forma independiente.
También encontramos en esta tabla, al igual que en la sección anterior, la proporción
entre los resultados de ambos tipos.
Por último, en la tabla 4.7 podemos encontrar los balances finales y número de opera-
ciones positivas y negativas que realiza cada uno de los robots utilizados. Como podemos
ver, todos los resultados en este caso son mucho más favorables que en la sección anterior,
en concreto, podemos citar los siguientes:
4.2. RESULTADOS FINALES 55
Balance Final Original Balance Final Redes Diferencia

Semana 1 -144.9 -6.22 138.68
Semana 2 -229.22 -102.65 126.57
Semana 3 -22.75 39.76 62.51
TOTAL -396.87 -69.11 327.76
Cuadro 4.5: Balance total de las 3 semanas y total. Software sin fiabilidad.
Balance Positivo Proporción Balance Negativo Proporción
Semana 1 138.63 / 154 0.90 -144.85 / -298.9 0.48
Semana 2 128.6 / 210.18 0.61 -231.25 / -439.4 0.53
Semana 3 155.66 / 265.12 0.59 -115.9 / -287.87 0.40
TOTAL 422.89 / 629.30 0.67 -492 / -1026.17 0.48
Ops. Positivas Proporción Ops. Negativas Proporción
Semana 1 16 / 23 0.70 11 / 22 0.5
Semana 2 19 / 29 0.66 15 / 26 0.57
Semana 3 23 / 38 0.61 6 / 30 0.2
TOTAL 58 / 90 0.64 32 / 78 0.41
Cuadro 4.6: Balance positivo y negativo y número de operaciones positivas y negativas

de cada semana y final. Software con fiabilidad. Comparación entre Robots con Red /
Robots sin Red
Todas las semanas los resultados de balance total de nuestro sistema son mejores
que los obtenidos sin su utilización.
Todas las semanas la proporción de operaciones positivas respecto del total ha sido
superior a la proporción de operaciones negativas.
Todas las semanas la proporción de balance positivo respecto del total ha sido
superior a la proporción de balance negativo.
De los 21 robots que han operado y muestran diferencias entre nuestros resultados
y los obtenidos operando independientemente, en 13 se ha producido una mejora
de los mismos, y sólo en 8 los resultados han empeorado. Lo que es más, la media
de mejora para esos 13 son 34$, mientras que la media de empeoramiento para los
otros 8 es de sólo 15$.
Además, como resultados finales obtenemos que a pesar de que los robots en general han
funcionado mal durante este periodo, y el balance total de éstos operando independien-
temente ha sido de -396.87$, el balance final total de nuestro sistema ha sido de 69.11$.
Lo que es más importante, nuestro sistema ha realizado 58 de 90 operaciones positivas (el
64 %) y tan sólo 32 de 78 operaciones negativas (el 41 %).
Además, la suma del balance de las operaciones positivas que ha dejado pasar ha sido
422.89$ de 629.30$ totales (67 %), y la suma del balance de las operaciones negativas
realizadas ha sido tan solo de -492$, frente a los -1026.17$ de balance negativo total
(48 %).

10062 6.63 13.77 3/3 0/1
10078 -32.5 -32.6 2/2 1/1
10208 6.82 6.82 1/1 0/0
10224 0 0 0/0 0/0
10387 0 0 0/0 0/0
15009 -31.5 -19.1 3/4 2/5
16052 -126.27 37.33 2/3 0/2
20042 0 0 0/0 0/0
20059 4.35 3.02 1/2 0/0
50016 -38.9 -39.7 0/0 1/1
50030 5.89 12.64 2/1 0/0
50082 0 0 0/0 0/0
50407 -110.91 -92.41 1/1 4/5
10169 1.86 1.86 2/2 1/1
10185 29.33 -1 0/3 1/3
10194 5.06 0 0/2 0/0
10225 0 0 0/0 0/0
10226 0 0 0/0 0/0
10290 8.4 8.4 1/1 0/0
50003 -3 0 0/0 0/1
50011 -19 -19 1/1 1/1
50114 0 0 0/0 0/0
10309 16.8 0 0/1 0/0
15036 -24.97 -17.99 6/8 4/6
16024 0 0 0/0 0/0
16080 -90 0 0/0 0/2
16104 9.1 9.1 2/2 0/0
20020 10 8.2 4/6 2/2
20030 -1.6 -6.1 1/7 1/2
20035 0 0 0/0 0/0
25013 -72.7 -6.8 1/2 3/8
30207 0 0 0/0 0/0
40003 21.82 -16.04 2/6 4/7
40005 -11.4 30.9 1/3 0 / 12
50006 0 0 0/0 0/0
50138 32.52 9.18 1/5 0/4
50177 -1 18.2 5/6 1/2
50212 -37.4 -22.69 1/1 1/3
50242 44.9 44.9 15 / 15 5/5
50450 0 0 0/0 0/0
Cuadro 4.7: Balance total desglosado de la semana 4.

4.3. CONCLUSIONES 57
Todo esto indica que, finalmente, hemos logrado que nuestro software realice las pre-
dicciones con suficiente precisión, y hemos podido utilizar esta información para manejar
los robots de forma conveniente, mejorando significativamente sus resultados.
4.3. Conclusiones
Recordemos que nuestro objetivo inicial era aplicar técnicas de inteligencia artificial
para resolver el problema real al que se enfrentaba la empresa Talentum. Ésta tenı́a miles
de robots programados y configurados, y su problema consistı́a en elegir cuáles de ellos
tener operando en cada momento. Para ello, planteamos que nuestro objetivo final serı́a
desarrollar un sistema que diera suficientes datos para tomar esta decisión.
La implementación del primer prototipo únicamente proporcionaba una predicción del

balance que obtendrá cada robot si lo pusiéramos a operar en el mercado. Para ello,
utilizamos redes neuronales como predictores, y otras técnicas para las distintas etapas del
proceso: análisis principal de componentes, tests estadı́sticos, etc. Una vez implementado
todo ello, pusimos nuestro sistema a funcionar durante un mes, y evaluamos los resultados.
Por desgracia, estos resultados fueron altamente insatisfactorios, aunque esperábamos que
mejoraran tras la adición de las medidas de control de errores al sistema.
Ası́, aplicando ideas de matemáticas y estadı́stica, desarrollamos e implementamos un
sistema nuevo que nos proporcionara, además de las predicciones, una cierta medida de
la fiabilidad de éstas. Ahora, utilizando estas dos informaciones, podı́amos mejorar las
decisiones que tomara nuestro agente externo a la hora de elegir los robots para operar.
Finalmente, en el prototipo inicial sı́ logramos obtener resultados satisfactorios. En

concreto, tras su ejecución durante 3 semanas más, logramos que el agente programado con
una estrategia básica consiguiera realizar operaciones que sumaron un 67 % del balance
positivo total, mientras que únicamente dejó pasar operaciones que sumaron un 48 %
del balance negativo total. Esto permitió pasar de unos resultados totales por parte de
los robots de pérdidas de -396.78$, a perder únicamente -69.11$, lo que constituye una
diferencia de 327.76$, que supone una mejora sustancial de los resultados.
Por otra parte, el sistema actual aún se puede mejorar. Como trabajo futuro propone-
mos:
El reentrenamiento automático de las redes cada cierto tiempo, para utilizar los
datos nuevos.
El entrenamiento de las redes asignando más peso a los casos obtenidos de opera-
ciones realizadas más recientemente.
Establecer las estrategias de fiabilidad a utilizar independientemente para cada red.
Actualmente se establece una estrategia de fiabilidad global, pero para cada red
puede funcionar mejor una que otra.
Establecer estrategias más complejas para el agente externo utilizando la informa-
ción proporcionada.
Ampliar la parte de visualización de estadı́sticas, y en general hacer la interfaz más

usable por un usuario menos técnico.
Probar otros métodos de entrenamiento de redes neuronales.
Utilizar otros factores de medida del rendimiento de un robot aparte del beneficio
total esperado en el caso de realizar una operación, como una estimación del beneficio
en función del tiempo que esté operando.
Utilizar otras técnicas de inteligencia artificial para implementar los predictores,

como sistemas clasificadores o support vector machines.
Mejorar el control de errores cometido por las redes. Podrı́a utilizarse para ello, por
ejemplo, en lugar del ajuste a un recta, otra red neuronal para intentar aproximar
la función de error.
Entrenar las redes penalizando menos las subestimaciones que las sobreestimaciones.
Bibliografı́a
[1] Bolsa, Mercados y Técnicas de Inversión, Francisco López Lubián, Pablo Garcı́a
Estévez.
[2] Talentum - Automatic Systems for your Trading, http://fxtalentum.com/
[3] Artificial neural networks. Opening the black box. Cancer. Dayhoff JE, DeLeo JM.
American Cancer Society, v. 91, p. 1615-1635, 2001.
[4] Neuro-Fuzzy and soft computing. A computational approach to learning and machine
intelligence. Jang J.-S.R., Sun C. –T., Mizutani E. (1997).
[5] Coursera - Machine Learning, Andrew Ng. Stanford University. https://www.

coursera.org/course/ml
[6] Apuntes de la asignatura Inferencia Estadı́stica, Félix Luis Belzunce Torregrosa, Jose
Marı́a Ruiz Gómez. Universidad de Murcia. http://aulavirtual.um.es
[7] Principal Components Analysis. http://inst.eecs.berkeley.edu/~ee127a/book/

login/l_sym_pca.html
[8] Encog Machine Learning Framework. Heaton Research. http://www.

heatonresearch.com/encog
[9] Weka 3: Data Mining Software in Java. Machine Learning Group at the University
of Waikato. http://www.cs.waikato.ac.nz/~ml/weka/
[10] Commons Math: The Apache Commons Mathematics Library. http://commons.

apache.org/proper/commons-math/index.html
[11] Jmathplot: Easy Java scientific plot for math engineering. http://code.google.
com/p/jmathplot/
[12] Neural-Networks FAQ, http://www.faqs.org/faqs/ai-faq/neural-nets/part2/
[13] AbstractTableModel (Java Platform SE 7). http://docs.oracle.com/javase/7/

docs/api/javax/swing/table/AbstractTableModel.html
[14] Java SE Technologies - Database - The Java Database Connectivity (JDBC), Oracle,
http://www.oracle.com/technetwork/java/javase/jdbc/index.html
59

Analisis Tecnico Usando Inteligencia Artificial PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Analisis Tecnico Usando Inteligencia Artificial PDF

Cargado por

Copyright:

Formatos disponibles

Análisis técnico de mercados financieros basado en

técnicas de inteligencia artificial

Ángel Pina Canelles

Artificial Neural Networks. Artificial neural networks are computational models

The Principal Component Analysis (PCA) is a statistical procedure that we

Statistical hypothesis testing is a method of statistical inference to assess the

The document is structured as follows:

1.1. El Análisis de los Mercados Financieros

El análisis fundamental se basa en la creencia de que el mercado tiene una eficiencia

El análisis técnico, por el contrario, no plantea si las acciones están correctamente

1.1.2. Los Principios y Métodos del Análisis Técnico

Todo lo que puede afectar al precio de cualquier valor está descontado.

Los precios se mueven por tendencias. Existen tres tendencias:

• La tendencia primaria que engloba periodos anuales.

El mercado tiene memoria.

1.1.3. Algunas Técnicas de Análisis Chartista

Fase de Acumulación. El análisis fundamental establece predicciones de bajada y

Y de la misma forma, una vez estabilizada su cotización, puede producirse a continua-

Figura 1.2: Tendencia Bajista: IBEX-35 durante el año 2000. [1]

De esta forma, asumiendo que el mercado se va a comportar de acuerdo a estos patrones

1.1.4. Algunas Técnicas del Análisis de Osciladores

1.2. Traders Automáticos y Talentum

En la actualidad, Talentum cuenta con más de 1.000 robots programados y optimizados

1.3. Problema Propuesto

2.1. Solución Propuesta

Una red neuronal artificial es un modelo matemático no lineal, de naturaleza compu-

Figura 2.1: Estructura básica general del sistema.

determinado problema. La figura 2.2 muestra un diagrama básico de la composición de

2.1.2. Redes Neuronales como Predictores

Figura 2.2: Diagrama básico de red neuronal y neuronas.

El problema que estamos tratando de resolver es un problema de regresión. Es decir,

Figura 2.3: Tipos de neuronas y capas de una red neuronal.

Entrenamiento de una Red Neuronal

El procedimiento de la primera fase consiste en partir de un conjunto de posibles topo-

2.1.3. El Procedimiento Completo

Figura 2.4: Diagrama general del sistema completo.

2.2. Etapas del Proceso

Para finalizar el proceso aplicamos un proceso de normalización a los datos. Si bien en

2.2.2. Entrenamiento de Redes Neuronales

No obstante, debido a las caracterı́sticas de nuestro problema y situación, hay varios

De hecho, si observamos el histórico de resultados de algún robot, solemos encontrar

2.2.3. Puesta en Marcha a Mercado Real

segunda estrategia hubieran estado implementados en ese periodo. El umbral resultante

2.2.4. Monitorización y Fiabilidad

3.1. Software Desarrollado

3.1.1. Librerias Utilizadas

Encog ([8]): Encog es una librerı́a especializada de aprendizaje computacional, que

Apache Commons Math ([10]): Es una librerı́a escrita en Java de matemáticas y

3.1.2. Módulos Desarrollados

Comunicación con bases de datos

Módulo de tratamiento de históricos y casos de prueba

Módulo de redes neuronales

Módulo de fiabilidad y control de errores

3.1.3. Estructura General

Procesamiento de los datos.

Entrenamiento de las Redes Neuronales.

Ejecución de las Redes y Monitorización.

Además, todo el software ha sido desarrollado siguiendo la arquitectura de Modelo-

La estructura del software de cada una de las secciones se detalla a continuación.

En la figura 3.1 podemos encontrar un diagrama de clases de esta parte. El controlador

Entrenamiento de las Redes

Figura 3.1: Diagrama de clases de Procesamiento de Datos.

Figura 3.2: Diagrama de clases de Entrenamiento de las Redes.