Documentos de Académico
Documentos de Profesional
Documentos de Cultura
LA IA EN EL SECTOR
BANCARIO
& CÓMO ABORDARLOS
www.dataiku.com
©2019 Dataiku, Inc. | www.dataiku.com | contact@dataiku.com | @dataiku 1
2 ©2019 Dataiku, Inc. | www.dataiku.com | contact@dataiku.com | @dataiku
INTRODUCCIÓN
Los datos siempre han sido los fundamentos del sector bancario. Lo que ha cambiado en los últimos
años es, obviamente, la cantidad de datos disponibles y la rapidez con la que se procesan, así como la
necesidad de responder rápidamente a la evolución del mercado. Las nuevas tecnologías ofrecen a los
bancos la posibilidad de recopilar, almacenar y analizar exponencialmente más información de lo que podía
imaginarse no hace mucho tiempo. Gracias a la tecnología financiera, los bancos ya saben que para tener
éxito en el ecosistema actual deben apoyarse en la riqueza de estos datos a escala masiva para innovar
constantemente.
Actualmente, la mayoría de los bancos están dando apenas sus primeros pasos en el mundo de la IA y ya
disponen fundamentalmente de una buena parte de las piezas del rompecabezas. Sin embargo, avanzar es
a menudo intimidante para las empresas porque la aparente complejidad de la IA las paraliza o porque les
atemoriza la (falsa) idea de que deben contratar nuevos equipos completos para alcanzar su objetivo.
En este libro blanco se presentan los cinco principales retos a los que deben hacer frente los bancos al
implementar la IA y sugerencias para superarlos o al menos abordarlos inteligentemente.
La buena noticia es que no se trata de un problema que se plantea a una sola empresa. En efecto, una encuesta
realizada entre las empresas del sector reveló2 que los encuestados clasifican las etapas básicas como la
limpieza y la preparación de los datos, así como la conexión a las fuentes de datos, entre los principales retos. Se trata de
una buena noticia porque es un problema que muchos ya han resuelto antes, lo que significa que los bancos no tendrán
que reinventar la rueda para encontrar soluciones rápidamente.
Por lo general, la respuesta son las herramientas — disponer de un espacio de trabajo central (aunque controlado), que
permita acceder a los datos y utilizarlos mediante una interfaz sencilla, es decir, que no esté destinada únicamente a los
científicos de datos, analistas cuantitativos u otros perfiles técnicos. Fundamentalmente, el sistema para acceder a los
datos y limpiarlos no debe depender de la arquitectura subyacente. Es decir, no importa en cuántos sitios diferentes se
almacenen los datos actualmente o se almacenarán en el futuro, pues el personal no tendrá que cambiar constantemente
sus procesos o herramientas de trabajo habituales para adaptarse.
dealmente, el acceso a los datos y la preparación no deben realizarse a través de una herramienta única de extracción,
transformación y carga (ETL pour sus siglas en inglés), sino integrarse en los sistemas de tal manera que, cuando sea
pertinente y apropiado, los equipos técnicos puedan realizar el trabajo de los analistas y aplicar fácilmente las técnicas de
predicción o de machine learning para generar más valor.
Y lo anterior sólo engloba las normativas relativas a cuestiones de ciberseguridad y privacidad. Cuando se suman a las
normas adicionales de protección contra los delitos financieros, las Normas del Financial Accounting Standards Board
(FASB), y muchas más, el panorama se vuelve aún más complejo
“Independientemente de los cambios definitivos que los legisladores y reguladores podrían realizar, las
entidades bancarias deberán seguir mejorando la eficacia y eficiencia gracias a sus programas de riesgo
y cumplimiento para respetar las leyes y normativas aplicables, y las expectativas de supervisión.”
Deloitte, 2019 Banking Regulatory Outlook3
Para más inri, los bancos no tienen la posibilidad de recurrir a los modelos black-box del machine learning (es decir,
modelos que generan simplemente una predicción o un resultado sin la más mínima visibilidad sobre cómo se tomó la
decisión). Los modelos que no se pueden explicar simplemente no tienen el nivel de reproducibilidad de los resultados que
exigen las normas.
Es importante subrayar que lo que hace que los modelos de machine learning sean precisos es también a menudo lo
que hace que las predicciones sean difíciles de entender pues son muy complejas. Pero no es imposible construir buenos
modelos de white-box. Por lo tanto, para cumplir la normativa, los bancos deberán casi siempre elaborar modelos
inherentemente interpretables
Sin lugar a dudas, las normativas sobre privacidad de los datos restringen extremadamente la posibilidad de trabajar
directamente con datos personales y trabajar con datos anonimizados –aunque es una opción interesante si resulta eficaz–
es increíblemente complicado (por no hablar de la cantidad de recursos que requiere), por lo que no permite realizar un
trabajo correcto. ¿Qué otras opciones existen entonces para que los bancos puedan trabajar con datos en un mundo cada
vez más regulado (y que seguirá siéndolo cada vez más)?
“Seudonimización” es el tratamiento de datos personales de manera tal que ya no pueden atribuirse a un interesado
sin utilizar información adicional. Si bien esto significa claramente que los datos seudonimizados siguen siendo datos
personales (ya que no están anonimizados), también ofrece cierto grado adicional de libertad a los bancos que pueden
trabajar con los datos de que disponen en proyectos específicos y definidos, con acceso controlado y una política clara de
conservación de los datos.
Con un poco de experiencia y educación del personal, procesos acertados de gobernanza y las herramientas adecuadas
(por ejemplo, elegir una plataforma de IA que permita interpretar totalmente el modelo), el reto normativo no es un
obstáculo imposible de superar.
LECTURA COMPLEMENTARIA
4 5
Ahora bien, en este campo todavía pueden realizarse mejoras y existen soluciones para hacer frente a este reto, como por
ejemplo integrar la coherencia y reproducibilidad en el proceso, desde la validación hasta las etapas finales de la producción.
Por ejemplo, ocurre con frecuencia que el/los equipo(s) de validación del riesgo de modelo tengan que analizar modelos
procedentes de diferentes organizaciones o grupos de toda la empresa, cada uno de los cuales tiene sus propios procesos y
entrega los modelos en diferentes formatos, con información diferente, etc., lo que significa que los miembros del equipo de
validación del riesgo de modelo perderán tiempo tratando de descifrar y entender lo que tienen a la vista para cada análisis.
Del mismo modo, sin un proceso o sistema coherente de entrega de los modelos, la etapa siguiente (despliegue en producción)
también será complicada y requerirá más tiempo.
En cambio, en los bancos capaces de llegar rápidamente a la etapa de validación del riesgo de modelo todos trabajan con
la misma herramienta, de tal manera que cuando deben validarse los modelos, el equipo de evaluación del riesgo sabe con
lo que está trabajando, dónde encontrar las fuentes de datos utilizadas para diseñar el modelo, tiene claro qué datos se
transformaron, etc. Por consiguiente, la herramienta utilizada para la entrega de los modelos y la validación es también la
herramienta ideal para el despliegue en producción.
Disponer de todos los modelos en la misma página y en la misma herramienta acelera el proceso de principio a fin y permite
generar modelos que podrán utilizarse en producción en cuestión de semanas (no meses o años, como puede ser el caso de
muchos bancos actualmente).
LECTURA COMPLEMENTARIA
6
www.dataiku.com
Esto se debe probablemente a que, en realidad, la contratación de expertos en datos y analistas de talento supone un
problema para la mayoría de las empresas, lo que no es sorprendente. Por lo general, para las pequeñas empresas la razón
es que no disponen del presupuesto para atraer a los mejores talentos, pero para las empresas más grandes suele ser
que no disponen de un comité de contratación que sepa qué tipo de científicos de datos están buscando o cuáles son los
objetivos y las necesidades de la organización respecto a la estrategia de datos.
En realidad, y más a menudo de lo que se piensa, las empresas deciden contratar a un científico de datos incluso antes
de tener en mente un proyecto o determinados objetivos. Esto no tiene sentido por varias razones, entre las cuales cabe
destacar que no existe un solo tipo de científico de datos7, por lo que contratar uno que tenga las competencias requeridas
depende en gran medida de cada caso.
Ahora bien, para los bancos la contratación es más que un reto ya que además de tener que hacer frente a los problemas
mencionados anteriores es difícil encontrar personal con las competencias más punteras en tecnologías de IA y que, a la
vez, tenga un profundo conocimiento del sector y de sus exigencias y restricciones normativas. En este contexto, ¿cómo
podría un banco encontrar un equipo completo de científicos de datos con las competencias requeridas y, aún más,
asegurarse de que puede conservarlos (sobre todo teniendo en cuenta que la tasa de rotación de los científicos de datos es
claramente alta8)?
La respuesta a este reto reside una vez más en la democratización de los datos. No tiene sentido (desde el punto de vista
financiero o del riesgo) buscar cientos de “unicornios”-científicos de datos9 y crear equipos desde cero. Los bancos de éxito
aprovechan actualmente más bien el talento de los cientos de miles de empleados que ya conocen la empresa. Como se
indicó anteriormente, muchos bancos ignoran que disponen de una multitud de talentos dentro de la organización y que el
reto no es tanto la contratación sino la formación y la educación.
El último reto al que los bancos deben hacer frente en materia de contratación es el considerable aumento del personal
encargado del cumplimiento, que se ha convertido en algo muy común debido a la necesidad de cumplir con la estricta
normativa. Muchos bancos han descubierto que esta situación simplemente no puede continuar, pues no es escalable,
y habrá cierto punto de inflexión en el que sin las herramientas adecuadas que optimicen la eficiencia, disponer de más
personal para velar por el cumplimiento de la normativa no significará un mayor cumplimiento. También en este caso, el
reto de la contratación no es tanto contratar más o mejor sino disponer de las herramientas adecuadas, formar y optimizar
la eficiencia del personal existente.
De hecho existe un temor muy real entre el público y probablemente entre los empleados de que sus puestos de
trabajo se automaticen a distancia y que los despidan. Pero eso no quiere decir que los bancos deben dar la espalda
a la introducción de nuevas herramientas y a la automatización que, como ya se ha indicado, son indispensables para
proteger la empresa contra el mayor riesgo, aunque no el último, es decir el error humano.
En cambio, sí significa aceptar y hacer frente a este reto mediante la educación. No sólo educar sobre la importancia de la
automatización, sino también poner de relieve cómo encajan los seres humanos en el proceso y cuál será su función en
el futuro.
1. Piensan que hay que “bajar a la IA” de su pedestal y traducirla más bien en algo que sea significativo para ellos (que
no siempre es una aplicación atractiva o un estilizado chatbot).
2.. Tienen consciencia de que la empresa AI es una larga experiencia, una serie de etapas y competencias progresivas
en las que habrá que trabajar durante los años siguientes. Una de esas etapas es la mejora gradual de los confusos
procesos internos para que equipos o divisiones enteras vayan integrando el uso de los datos y la IA en su trabajo eficaz
e inteligentemente, respetando la normativa.
3. Comienzan ya, porque esperar unos años más para hacerlo significaría dejar pasar más trenes antes de
transformarse en Empresa IA, mientras la competencia de otras empresas más ágiles sigue avanzando (ya sea las
Fintech, GAFA –Google, Apple, Facebook, Amazon– o los actores tradicionales).
4. Construyen sobre bases sólidas. Actualmente, muchos bancos se sienten intimidados por la IA pese a haber
trabajado en este campo –o por lo menos un poco– durante años (y en algunos casos, décadas). Analistas cuantitativos,
traders de algoritmos, analistas de riesgo, analistas de fraude, equipos de fijación de precios... estos equipos y personas
son los componentes básicos de la estrategia de una Empresa IA. Los bancos prósperos se apoyan en esta estructura,
que ya existe.
Más información sobre estos temas en el libro blanco AI in Banking: Challenges, Solutions, & Steps to Get Started Now
10
AI IN BANKING
CHALLENGES, SOLUTIONS,
& STEPS TO GET STARTED NOW
www.dataiku.com
©2019 Dataiku, Inc. | www.dataiku.com | contact@dataiku.com | @dataiku 1
Your Path to
Enterprise AI CLIENTES
Netezza
Teradata Train MLlib_Prediction
Oracle Vertica
HDFS_Avro Joined_Data
Amazon_S3 HDFS_Parquet
Cassandra
4. Despliegue
2. Construcción + Aplicación en producción
del Machine Learning
3. Minería
y Visualización
1 https://technology.ihs.com/612413/artificial-intelligence-in-banking-report-2019
2 https://pages.dataiku.com/top-challenges-data-professionals
3 https://www2.deloitte.com/us/en/pages/regulatory/articles/banking-regulatory-outlook.html
4 https://pages.dataiku.com/executing-data-privacy-compliant-data-projects
5 https://pages.dataiku.com/oreilly-introduction-to-machine-learning-interpretability
6 https://pages.dataiku.com/why-enterprises-need-ml-ai-platforms
7 https://medium.com/ai-musings/the-different-types-of-data-scientists-and-what-kind-you-should-hire-4475abee2bbd
8 https://medium.com/ai-musings/how-to-retain-data-scientists-28756af84628
9 https://blog.dataiku.com/how-to-hire-great-data-scientists-not-mythical-creatures-anymore
10 https://pages.dataiku.com/ai-in-banking