Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Introduccin
Considera el supuesto que se expone a continuacin. Los modelos analticos son fundamentales para las decisiones
empresariales importantes. Gracias a ellos, puedes identificar
Una organizacin cuenta con cientos de modelos nuevas oportunidades, forjar nuevas o mejores relaciones con
analticos integrados en produccin que respaldan la clientes y gestionar la incertidumbre y los riesgos. Por estos y
toma de decisiones en marketing, la fijacin de precios, otros muchos motivos, los modelos se deben crear y considerar
los riesgos de crdito, los riesgos operativos, el fraude y como activos organizativos de gran valor. Pero cmo?
la gestin financiera.
Los responsables de la toma de decisiones obtienen Uso de modelos para tomar decisiones de
resultados de los modelos, pero con requisitos y forma automtica
controles limitados. Adems, los resultados son inco
herentes debido al uso de variables y conjuntos de datos La toma de decisiones operativas es un
distintos en su creacin. Los procesos de validacin y las proceso muy repetitivo que, a menudo,
pruebas backtesting no son suficientes para asegurar el ocurre muchas veces al da. En la toma de
ajuste de los modelos.
decisiones, pueden participar personas, por
Las decisiones se adoptan en funcin de los resultados ejemplo, empleados de call centers que
obtenidos por los modelos, y todos esperamos lograr los realizan ventas incrementales o complemen-
mejores resultados tarias llamando por telfono a clientes, o
A muchas organizaciones les suena mucho este tipo de bien pueden ser decisiones completamente
problemas con sus modelos. En un entorno de modelizacin automatizadas, que simulan la lgica
variado y poco gestionado, a veces es muy difcil responder a humana, por ejemplo, si se rechaza una
preguntas muy importantes en relacin a los modelos predic-
compra con tarjeta de crdito. Sin embargo,
tivos. Entre estas cuestiones, podemos encontrar las siguientes:
una decisin operativa no tiene por qu
Quin cre los modelos y por qu?
afectar a un solo cliente, sino que puede
Qu variables de entrada se usan para hacer predicciones
hacer referencia al mejor grupo de clientes
y, en ltima instancia, tomar decisiones?
al que dirigir una determinada oferta. Este
Cmo se usan los modelos?
tipo de decisiones se meten en los sistemas
Cul es el rendimiento de estos modelos y cundo se
actualizaron por ltima vez?
de gestin de campaas cada semana o
Dnde se encuentra la documentacin complementaria?
mes. Cuando los modelos analticos predic-
Por qu se tarda tanto en poner en marcha modelos
tivos estn integrados en los sistemas de
nuevos o actualizados? produccin y cuando negocio usa los resul-
Las organizaciones que no pueden contestar con confianza tados para ofrecer respuestas al instante, has
a estas preguntas no pueden garantizar que sus modelos implementado eficazmente estos modelos
analticos verdaderamente ofrecen buenos resultados. analticos.
2
durante todo el ciclo de vida. Los equipos analticos y de TI Por ello, la capacidad de tomar rpidamente las decisiones
necesitan procesos eficaces y sistemticos, as como una arqui- operativas ms adecuadas, al mismo tiempo que se aprovechan
tectura fiable para gestionar datos y realizar el seguimiento de los crecientes volmenes de informacin, puede traducirse en
los modelos analticos predictivos durante el ciclo de que se produzca un fraude o no, es decir, en fracaso o xito
implementacin. empresarial.
}}
cionen la orientacin necesaria para tomar decisiones
basadas en datos reales
Las decisiones operacionales son 4. Un mtodo para gestionar y supervisar los modelos
analticos con el fin de garantizar que son eficaces y siguen
las que convierten tu estrategia de
ofreciendo las respuestas acertadas
negocio en una realidad y garantizan 5. Una arquitectura y unos procesos que pueden crecer para
que tu organizacin trabaje de satisfacer nuevas necesidades, como difundir datos y crear
modelos predictivos ms detallados de la forma ms rpida
manera eficaz. posible
Decisiones a gran escala en informacin til que permita tomar mejores decisiones de
forma automatizada. A continuacin, figuran algunos retos:
Cuntas decisiones que afectan a las operaciones se toman en
Retrasos: Debido a procesos que, a menudo, son manuales
tu organizacin cada da? Probablemente ms de lo que te
y ad hoc, la implementacin de un modelo en los sistemas
imaginas; por ejemplo, elegir una entidad financiera. Cuntas
de produccin puede tardar meses. Puesto que las fases
transacciones con tarjeta de crdito se procesan cada hora? (En
de desarrollo y prueba de los modelos lleva demasiado
Visa, la tasa puede alcanzar las 14 000 por segundo. Consulta la
tiempo, pueden quedarse obsoletos en el momento en el
pgina 3). Cada una de ellas representa una decisin en
que alcanzan la fase de produccin. O puede suceder que
materia de operaciones: permitir o prohibir que la transaccin
nunca lleguen a implementarse. Los problemas de
se procese teniendo en cuenta la valoracin de riesgo de
cumplimiento externo e interno pueden plantear an
fraude. Aunque cada transaccin o decisin de este tipo pueda
ms retos.
tener un riesgo individual bajo, el gran nmero de estas deci-
siones que se toman cada hora o cada da incrementa mucho el
riesgo asociado.
3
Ms informacin
4
Escasez de habilidades analticas: Aunque haya un nmero Sin embargo, son pocas las entidades que saben lidiar
creciente de cientficos de datos que entran en el mercado, plenamente con las complejidades que surgen en todo el ciclo
la escasez de habilidades analticas necesarias para la de vida del modelo analtico, ya que se trata de una tarea de
creacin e implementacin de modelos supone an un gran carcter polifactico.
reto para muchas organizaciones.
En SAS, hemos desarrollado un ciclo de vida analtico
sistemtico que te gua durante cada fase del proceso durante
SAS Analytical Life Cycle: el cual los datos se transforman en decisiones. Empezaremos
Mejores prcticas para diciendo que hay dos fases en el ciclo de vida analtico: detec-
cin e implementacin. A continuacin, describiremos las
mejorar los resultados de la tareas de cada fase y cmo interactan para crear un proceso
modelizacin predictiva sistemtico que puedas usar para producir resultados predic-
tivos, fiables y constantes.
Las organizaciones lderes reconocen que los modelos
analticos son activos empresariales fundamentales que La fase de exploracin del ciclo
generan respuestas que ayudan a mejorar las relaciones con los
de vida analtico
clientes y las operaciones, adems de aumentar los ingresos y
reducir los riesgos. Por lo tanto, es evidente que tratan de crear P
reguntas que se quieren responder: El proceso de Explo
los mejores modelos posibles. racin se rige por el planteamiento de cuestiones empresari-
ales que dan lugar a la innovacin. Por lo tanto, el primer
paso implica determinar lo que la empresa quiere averiguar.
Prepare Implement
Ask
lore
Discovery Deployment
Act
Exp
l Eva
M o de lu ate
A continuacin, esa pregunta se traduce en una represen clave para encontrar la respuesta ms fiable, y la creacin de
tacin matemtica del problema, que se puede solucionar modelos automatizados puede ayudar a minimizar el tiempo
con anlisis predictivos. Las reas de negocio tambin tienen en el que se obtienen resultados, as como impulsar la
que especificar las necesidades, el alcance, las condiciones productividad de los equipos analticos. Con las herra-
del mercado y los objetivos relacionados con la preguntas mientas de creacin manual de modelos los responsables
que estn tratando de responder, lo que ayuda a seleccionar de la minera de datos y los cientficos de datos solo podan
las tcnicas de modelizacin ms apropiadas. crear varios modelos en una semana o un mes. Las nuevas
P
reparacin de los datos: Las tecnologas, como Hadoop, y soluciones y los ordenadores ms rpidos han acelerado
los ordenadores cada vez ms rpidos y baratos permiten este proceso, de modo que, hoy en da, se pueden crear
almacenar y usar una cantidad y tipos de datos mayor que cientos o miles de modelos en el mismo plazo. Sin embargo,
nunca. No obstante, esto solo ha aumentado la necesidad con ello, ha surgido otro problema: cmo identificar de la
de combinar datos en diferentes formatos y de diferentes forma ms rpida y fiable el modelo (entre muchos) que
orgenes, as como de transformar datos en bruto, de modo mejor funciona? La comparacin entre modelos sirve para
que se puedan usar en la modelizacin predictiva. Debido a elegir el que ofrezca los mejores resultados para un conjunto
los nuevos tipos de datos que provienen de dispositivos de datos especfico. El hecho de que existan modelos
conectados, de sensores o los registros web de interac- machine-learning automatizados y mtricas claramente
ciones on line, la fase de preparacin de datos plantea an definidas se consigue el identificar el mejor modelo. Los
ms retos. Muchas organizaciones an declaran que analistas y cientficos de datos pueden dedicar tiempo a
emplean una cantidad de tiempo excesiva, a veces, hasta un centrarse en el anlisis y cuestiones ms estratgicas.
80 %, para lidiar con las tareas de preparacin de datos. La
mayor parte del tiempo durante la fase de exploracin se
debe emplear en estudiar los datos y crear modelos
idneos, en lugar de preparar los datos.
Exploracin de los datos: Las herramientas de visualizacin
self-service interactivas deben satisfacer las necesidades de
una amplia variedad de usuarios (desde los analistas de
negocio que no poseen conocimientos estadsticos hasta los
cientficos de datos que son expertos en anlisis), de modo
que puedan buscar fcilmente relaciones, tendencias y
patrones para comprender mejor los datos. Durante esta
fase, se pule tanto la pregunta como el enfoque que
surgieron en la fase inicial de planteamiento del proyecto.
Asimismo, se desarrollan y se ponen a prueba ideas sobre
cmo afrontar el reto de negocio desde una perspectiva
analtica. Durante la exploracin de los datos, es posible que
te des cuenta de que debes aadir, eliminar o combinar vari-
ables para crear modelos mucho ms concretos. Soluciones
giles e interactivas contribuyen a que este proceso sea
sistemtico, que es esencial para identificar las mejores
preguntas y respuestas.
Modelizacin de los datos: Durante esta fase, se aplican
numerosos algoritmos de modelizacin analtica y machine-
learning a los datos para encontrar la mejor representacin
de las relaciones entre ellos que ayudar a resolver la
pregunta de negocio. Las herramientas analticas buscan
una combinacin de tcnicas de modelizacin y datos que
pronostican el mejor resultado. Sin embargo, no existe un
solo algoritmo que valga para todo, sino que el ms
idneo para resolver las preguntas hechas se establece en
funcin de los datos. La experimentacin es un aspecto
6
desarrollo, adems de con otros adaptados a lneas de Para obtener los mejores resultados analticos, las orga-
productos y problemas empresariales especficos. De este nizaciones necesitan contratar personal con la cualificacin
modo, la organizacin puede llegar con facilidad a gestionar adecuada y facilitarles el trabajo colaborativo para realizar
miles de modelos. sus funciones.
El ciclo de vida analtico es sistemtico y colaborativo por natu- Preparacin y exploracin de los datos:
raleza. El personal, que posee distintos perfiles y habilidades, Un enfoque sistemtico
participo en varias etapas del proceso. Los responsables de
negocio tienen que detectar el problema o la pregunta que Preparacin de los datos: SAS Data Management te
quieran responder y, a continuacin, tomar la decisin apro- permite definir perfiles y limpiar los datos, as como crear
piada, adems de supervisar los ingresos obtenidos a partir de rutinas con procesos ELT (extraer, cargar y transformar) que
dicha decisin. Los analistas de negocios llevan a cabo la visual- generan los data marts analticos, en los que se utilizan solo
izacin y el estudio de los datos y trabajan para identificar vari- los datos necesarios. Los datos se almacenan en la base de
ables claves que influyan en los resultados. Los equipos de datos para que se carguen de forma rpida, y se les de una
gestin de datos y del departamento de TI facilitan la prepara- estructura que facilite la creacin de modelos y se simpli-
cin de los datos, adems de la implementacin y supervisin fican para crear variables derivadas. Estos procesos se
de los modelos. Los cientficos de datos o responsables de la pueden automatizar y planificar en lotes, o bien se pueden
extraccin de datos llevan a cabo tareas ms complejas de ejecutar en tiempo real y ad hoc, en funcin de la fase del
anlisis exploratorios segmentacin descriptiva y modelizacin ciclo de vida analtico. Las herramientas de manipulacin y
predictiva. preparacin de datos self-service, como SAS Data Loader
para Hadoop, ayudan a los analistas y a los cientficos de
datos a facilitar el acceso, combinando y limpiando datos sin
que suponga una carga para el departamento de TI. El proc-
esamiento secuencial de eventos de SAS implica que se
relacionados. Este paquete garantiza que se han adoptado I mplementacin flexible: La misma solucin no se ajusta a
las medidas apropiadas y que el modelo lanzado a produc- todas las necesidades si nos referimos a los distintos
cin es potente y adecuado. Tambin ayuda a las orga- sistemas operativos. Si no se tienen que implementar
nizaciones a estandarizar el proceso para crear, gestionar, cambios, los mismos modelos se pueden implementar en
implementar y supervisar modelos analticos. sistemas batch y de tiempo real. Por ello, los analistas se
G
overnance: La gestin del riesgo de los modelos incluye el desprenden de la pesada carga que supone adaptar cada
seguimiento de las mtricas, el control de las diferentes entorno con distintos parmetros, cdigos de scoring y
versiones y quin ha cambiado qu cuando el control pasa cdigos cifrados personalizados.
de un departamento a otro, entre otros aspectos. Un reposi- P
rocesos de scoring controlados mejores y ms rpidos:
torio centralizado de modelos, las plantillas de ciclos de vida Puesto que el modelo se califica directamente en la base de
y los controles de versin hacen que los procesos analticos datos, la tarea de ejecucin de los modelos aprovecha la
sean ms transparentes y garantizan que se pueden auditar velocidad de procesamiento y escalabilidad de la base de
para cumplir con las normativas externas y de control datos. Las tareas que solan durar das y horas se pueden
interno. finalizar en cuestin de minutos o segundos. El movimiento
R
epositorio de modelos: Los repositorios centrales sirven de datos se minimiza dado que el socring analtico puede
para almacenar documentacin completa sobre el modelo, llevarse a cabo donde se guardan los datos. Como los datos
su scoring y los metadatos relacionados. Los responsables no tienen que extraerse del entorno de datos sumamente
de la modelizacin pueden colaborar fcilmente y volver a controlado y seguro. Incluso en entornos muchos menos
usar el cdigo de los modelos, gracias a las actividades que gestionados, como Hadoop, si se elimina el movimiento y la
se quedan registradas a travs de la autenticacin de duplicacin de datos, las ventajas en el rendimiento pueden
usuarios o grupos, los controles de versin y los controles de ser considerables.
auditora.
C
alificacin: Despus de revisar un modelo, aprobarlo e Gestin y evaluacin de modelos:
informar de que est listo para produccin, este adquiere el Un proceso continuo
estado de mejor modelo. Con un solo clic, todo el flujo de Una vez que un modelo se encuentra en un entorno de
trabajo de tu modelo ganador se puede convertir en cdigo produccin y se ejecuta para ofrecer respuestas, el modelo
de scoring que se puede implementar en SAS, bases de ganador se supervisa de forma centralizada a travs de una
datos externas, Hadoop y servicios web. serie de informes basados en indicadores clave de rendimiento.
V
alidacin: Los criterios de calificacin se validan antes de Si el rendimiento del modelo empieza a disminuir por debajo
elaborar los modelos, utilizando una plantilla y un proceso del nivel de aceptacin, dicho modelo se puede sustituir
sistemticos que permiten registrar todas las pruebas que el rpidamente por uno nuevo o volver a ajustarlo.
motor de calificacin ha superado, para garantizar que los
Flujo de trabajo automatizado: Las consolas de flujo de
criterios integrados en el modelo ganador son adecuados.
trabajo basadas en web fomentan que el proceso de gestin
de modelos sea ms automatizado, sistemtico, colaborativo
En marcha! Pon en prctica los resultados de y controlado. Tanto la organizacin como los auditores
la modelizacin lo ms rpido posible pueden realizar el seguimiento de todas las fases de un
Gracias a SAS, puedes elegir entre varias opciones de imple- proyecto de modelizacin, desde el planteamiento del
mentacin para integrar los mejores modelos en los sistemas problema hasta las etapas de desarrollo, implementacin y
en produccin. SAS Scoring Accelerator permite una imple- retirada.
mentacin integrada y automatizada que puede impulsar el G
estin del ciclo de vida general: Todas las fases del ciclo
rendimiento de tus modelos de varias formas. de vida de un modelo se coordinan de manera integral
mediante plantillas prediseadas y personalizadas por el
I mplementacin ms rpida: Implementa informacin y
cliente que se ajustan a los procesos de negocio de la
procesos analticos con una infraestructura y un coste
organizacin.
mnimos. Todo el cdigo de scoring analtico se convierte de
forma automtica en servicios web ligeros o en lenguajes S
upervisin automatizada de los modelos: Las tareas de
nativos para realizar el procesamiento en bases de datos. Por control de rendimiento de los modelos se pueden planificar
ello, desaparecen los procesos manuales, tediosos y de forma peridica y los resultados se pueden supervisar de
propensos a errores con los que se traduce y se valida el manera regular, tanto en el caso de un modelo como en
cdigo de scoring de los modelos para distintos entornos. todo el inventario de modelos. Estos resultados se pueden
11
publicar en dashboards, y fijar los unbrales mnimos de que un modelo alcanzase el entorno de produccin baj
rendimiento. Si estos umbrales se incumplen, los analistas de los tres meses a cuestin de das. La preparacin de
reciben avisos sobre los modelos que requieren su atencin, datos se redujo un 40 % y, por otro lado, la productividad
ahorrando as dinero y tiempo. de los analistas aument un 50 %.
Gracias a un marco de trabajo formal de gestin de modelos, Orlando Magic: La magia al descubierto
los mejores modelos alcanzan la fase de produccin de forma
Gracias a SAS Analytics y SAS Data Management, Orlando
ms rpida para empezar a satisfacer las necesidades de la
Magic es uno de los equipos de la NBA que ms ingresos
empresa mucho antes. La compaa puede generar ms y
genera.
mejores modelos, con una amplia variedad de mtodos
analticos y con menos recursos. Los modelos analticos se
El equipo lo consigui analizando el mercado de reventa de
supervisan y se mejoran continuamente para que estn actual-
entradas y fijando menores precios, previendo el nmero de
izados y gocen de precisin. Todo el proceso de exploracin e
titulares de abonos de temporada con riesgo de cancelar su
implementacin se vuelve ms transparente y mejor contro-
suscripcin (y para recuperarles de nuevo) y analizando las
lado, por lo tanto, resulta sencillo explicar las decisiones
ventas de productos con el fin de asegurarse de que la orga-
basadas en los anlisis a las autoridades reguladoras y a los
nizacin pone a disposicin de los aficionados todo lo que ellos
responsables de negocio.
quieren cada vez que entran al estadio. El club ha utilizado SAS
incluso para ayudar a los entrenadores a reunir la mejor
Gracias a un enfoque de ciclo de vida analtico predictivo, el esce- Orlando Magic no tiene una bola de cristal, pero cuentan con
nario de despus y la forma de actuar cambia bastante, obteni- SAS Enterprise Miner, que les permiti entender mejor los
ndose una ventaja competitiva considerable. datos y desarrollar modelos analticos que pronostiquen las
renovaciones que llevarn a cabo los titulares de abonos de
Institucin financiera del Reino Unido: temporada. Gracias a las herramientas de minera de datos, el
equipo gener scorings ms precisos que contribuyeron a
Modernizando su ciclo de vida analtico
previsiones ms exactas sobre su mercado y marcaron una dife-
Una de las principales instituciones financieras del Reino rencia con respecto a la forma de abordar la retencin de
Unido se dio cuenta que la duracin del ciclo desde la clientes y el marketing.
iniciacin del modelo hasta su implementacin no
cumplira con las expectativas del siglo XXI. El proceso era
manual, propenso a errores y exiga numerosos recursos.
Visa: Mil millones de decisiones operacionales
Adems, contaba con poca o ninguna supervisin a la al ao mejoran la experiencia de los clientes y
hora de identificar el deterioro de los modelos. reducen el fraude
Visa, que es una marca reconocida a nivel mundial, facilita las
Al trabajar con SAS y Teradata, la organizacin dise una transferencias electrnicas de fondos a travs de productos de
plataforma de anlisis predictiva y flexible en la que marca de terceros comercializados por sus miles de entidades
integr funciones para gestionar datos, desarrollar e financieras asociadas. La empresa ha tramitado 64 900 millones
implementar modelos utilizando tecnologa en bases de de transacciones en 2014, y se realizaron compras con un valor
datos. Esta plataforma aprovecha la escalabilidad del de 4,7 billones de dlares por medio de tarjetas Visa durante
entorno de Teradata para calificar los modelos y utiliza la ese mismo ao.
potencia de SAS Analytics para crearlos.
Visa cuenta con una capacidad de clculo que es capaz de
Gracias a la nueva plataforma, ms de 55 millones de tramitar 56 000 mensajes de transaccin por segundo, que
registros se pueden calificar en Teradata muchas veces supera cuatro veces la tasa de transaccin mxima real hasta la
durante el da; un resultado que jams se habra logrado fecha. Visa no solo tramita y calcula, sino que realiza anlisis
con el proceso anterior. El tiempo necesario para facilitar constantemente para proporcionar informacin estratgica y
operativa a sus entidades asociadas y les ayuda a mejorar el
rendimiento.
12
Hace muy poco tiempo Visa hizo una prueba de concepto con
una solucin de alto rendimiento de SAS que inclua almace-
namiento en memoria para potenciar los algoritmos
estadsticos y de machine-learning para posteriormente
presentar dicha informacin de manera visual. Falkenborg
declara: El reto que se nos presenta, tal y como ocurre en cual-
quier empresa que pretende gestionar y usar grandes canti-
dades de datos, es cmo sacarle el mayor partido a todos esos
datos para que nos ayuden a solucionar nuestros retos de
negocio, ya sea mejorar los modelos de prevencin del fraude,
o bien ofrecer asistencia a nuestros clientes para comunicarse
de forma ms eficaz con sus propios clientes.
Ms informacin
Recursos adicionales
Para obtener ms informacin sobre la fase de deteccin del
ciclo de vida analtico, lea el informe tcnico La extraccin de
datos de principio a fin: Cmo conseguir informacin y generar
mejores oportunidades.
SAS and all other SAS Institute Inc. product or service names are registered trademarks or trademarks of
SAS Institute Inc. in the USA and other countries. indicates USA registration. Other brand and product
names are trademarks of their respective companies. Copyright 2016, SAS Institute Inc. All rights reserved.
S152614.0416