Documentos de Académico
Documentos de Profesional
Documentos de Cultura
reinventar su organización
Cree una estrategia de datos para la próxima ola de innovación en la nube
1
INTRODUCCIÓN
Bienvenido a la generación
de la reinvención
Para todas las organizaciones es difícil mantener el éxito por largos períodos. Para
continuar siendo relevantes, las organizaciones deben reinventarse de forma periódica.
La introducción de la nube dio lugar a una generación de reinvención. Ahora, la
próxima ola de reinvención estará impulsada por datos. Los líderes deben poder confiar
en los datos para tomar decisiones fundadas, anticiparse y tomar medidas pertinentes.
Para las organizaciones que quieran mantener su relevancia, tanto en el presente como
en el futuro, es indispensable el diseño de una estrategia de datos.
Los líderes con mentalidad de reinvención deben trabajar incesantemente para llegar
a la verdad. Eso significa contar con las herramientas necesarias para cambiar de
dirección cuando se necesite tomar medidas frente a las oportunidades y las amenazas.
Para hacer esto, es necesario convertirse en una organización impulsada por datos.
2
CÓMO CONVERTIRSE EN UNA ORGANIZACIÓN IMPULSADA POR DATOS
3
CÓMO CONVERTIRSE EN UNA ORGANIZACIÓN IMPULSADA POR DATOS
1
El primer desafío al que se enfrentan las organizaciones es comprender el
tamaño y la escala de los datos que manejan diariamente, y el crecimiento
exponencial que tiene lugar año tras año. De hecho, en los próximos 36
meses, habrá más datos que en los 30 años anteriores combinados.1 Las
viejas herramientas en las instalaciones y los antiguos almacenes de datos
de los últimos años no pueden satisfacer la demanda actual. Para abordar
la escala masiva y el gran crecimiento actual de los volúmenes de datos, las
organizaciones necesitan nuevos almacenes de datos que puedan escalarse
y crecer a la par de los cambios, ya sea a partir de los gigabytes y terabytes
con los que se trabaja en la actualidad, o de los petabytes y exabytes
previstos para el futuro.
2
El segundo desafío está asociado a la necesidad de las organizaciones de
acceder y analizar de forma sencilla tipos de datos más amplios, como
archivos de registro, datos de secuencias de clics, datos de voz y video,
entre otros. Esta amplia variedad de tipos de datos provienen de diferentes
fuentes y se almacenan en silos de múltiples almacenes de datos. Para
obtener información nueva y valiosa a partir de todos estos datos, las
organizaciones deben poder destruir de forma sencilla estos silos de datos
para que sus equipos puedan acceder y analizar todos los datos relevantes,
independientemente de su ubicación.
3
El tercer gran desafío que deben afrontar las organizaciones es la
adaptación más rápida a las preferencias cambiantes de los clientes y a la
dinámica del mercado. Para tomar decisiones más rápidas e inteligentes,
las organizaciones deben empoderar a sus empleados con un acceso
seguro a los datos y capacitarlos para que puedan realizar procesos de
análisis y machine learning con sus datos de una manera ágil y rentable. Las
organizaciones que trabajan con una infraestructura heredada de datos en
las instalaciones invierten demasiado tiempo en la instalación de hardware
Encuesta "Rethink Data" realizada por IDC a pedido de Seagate, enero de 2020
1 4
CÓMO CONVERTIRSE EN UNA ORGANIZACIÓN IMPULSADA POR DATOS
y software, la configuración de la infraestructura para su buen rendimiento Tendencias que afectan el modo en que se obtiene
y disponibilidad, y en la planificación de capacidad para escalar los sistemas. información de los datos
Todo este esfuerzo innecesario reduce la agilidad e impide tomar decisiones
con rapidez.
4
El cuarto reto es hacer que el machine learning funcione. Mientras que
el ML es una tecnología revolucionaria que impulsa la innovación, las
organizaciones están luchando para hacer un progreso significativo al
escalar el machine learning en sus empresas. Según un informe de Gartner,
las organizaciones con experiencia en IA pasaron a producción solo un
53 % de sus pruebas de concepto de IA en los últimos dos años. La falta de Se están generando más Los datos se almacenan
habilidades de ML, la inercia organizacional y la cantidad o calidad de los datos que nunca en silos en múltiples
datos para el entrenamiento son solo algunos de los problemas que frenan almacenes de datos
el progreso en esta área tan importante.
5
Por último, en un mundo que depende cada vez más de la seguridad y la
privacidad de los datos, y de las normas de conformidad, las organizaciones
deben ser capaces de definir, supervisar y administrar detenidamente
el acceso a datos específicos a través de controles comprobados de
gobernanza y seguridad de los datos. Deben hacerlo no solo para los datos
de sus silos independientes, sino para todos sus almacenes de datos, de una
Urgencia por parte de la La adopción del machine
manera integral y unificada.
empresa de utilizar los learning se ve dificultada
datos para tomar mejores por la falta de habilidades
y más rápidas decisiones y la inercia organizacional
La seguridad y la
privacidad de los datos,
así como las normas de
conformidad, son cada
vez más importantes
5
CÓMO CONVERTIRSE EN UNA ORGANIZACIÓN IMPULSADA POR DATOS
1 Modernizar
Su infraestructura de datos 2 Liberar
Ponga sus datos a trabajar 3 Innovar
Invente nuevas experiencias y
replantee los procesos anteriores
6
CÓMO CONVERTIRSE EN UNA ORGANIZACIÓN IMPULSADA POR DATOS
de licencia punitivas y crean dependencia del mantendrá seguras y en cumplimiento con un conjunto
7
CÓMO CONVERTIRSE EN UNA ORGANIZACIÓN IMPULSADA POR DATOS
8
CÓMO CONVERTIRSE EN UNA ORGANIZACIÓN IMPULSADA POR DATOS
9
HISTORIAS DE CLIENTES
Samsung migra 1100 millones de usuarios de Blackboard se moderniza para eliminar los costos de
tres continentes las licencias
Después de migrar 75 petabytes de datos a servicios de bases de datos de AWS Para Blackboard, educar a millones de personas en todo el mundo significaba
rentables, creados para un propósito específico y que ahorran tiempo, Samsung pagar precios altos de licencias. La empresa eliminó esa sobrecarga migrando su
desactivó su última base de datos de Oracle, modernizó su infraestructura de base de datos y modernizando su infraestructura con la base de datos de código
datos y aumentó el acceso, la congruencia y el rendimiento de los datos en abierto, PostgreSQL, en Amazon RDS. La migración implicó trasladar miles de
conjunto. En comparación con su anterior solución de Oracle, la empresa ahorró máquinas virtuales y varios petabytes de datos a AWS. Además, liberó los datos
un 44 % en costos operativos mensuales y otro 22 % en tarifas de mantenimiento transaccionales sin aumentar las cargas de trabajo informático, lo que permitió a
al utilizar Amazon Aurora. Blackboard cerrar más de 20 centros de datos y depender de solo nueve centros de
datos globales principales.
10
CÓMO CONVERTIRSE EN UNA ORGANIZACIÓN IMPULSADA POR DATOS
Para tomar decisiones con rapidez, las organizaciones o volver a formatear los datos para obtener valor.
deben almacenar cualquier cantidad de datos Esto es particularmente útil cuando se procesan
en formatos abiertos y destruir los silos de datos datos a escalas de petabytes y exabytes. Por ejemplo,
desconectados. Sus empleados deben estar Amazon Athena es un servicio de consultas interactivo
empoderados para ejecutar análisis o machine que les permite a las organizaciones analizar datos
learning utilizando sus herramientas o técnicas almacenados en S3 de manera inmediata con SQL
preferidas y administrar el acceso de los usuarios a estándar y sin tener que configurar o administrar
datos específicos con los controles de seguridad y servidores.
gobernanza de datos adecuados. AWS ayuda a que las
empresas logren todo esto mediante el enfoque de Además de utilizar un lago de datos, las organizaciones
“Lake House” (casa de lago), que combina lo mejor de también utilizan almacenes de datos creados para
ambos lagos de datos y almacenes de datos creados un propósito específico para obtener las mejores
Conforme cada vez más organizaciones almacenan sus datos en lagos de datos de Enfoque de “Lake House” (casa de lago) en AWS
S3 y también en almacenes de datos creados para un propósito específico, los datos
deben trasladarse, con frecuencia, desde y hacia sus lagos de datos, almacenes de
datos y almacenes creados para un propósito específico. Amazon Redshift y Amazon
Athena admiten consultas federadas y la capacidad de ejecutar consultas en datos
almacenados en bases de datos operativas, almacenes de datos y lagos de datos. Las
consultas federadas pueden proporcionar información a través de múltiples fuentes de
datos sin movimiento de datos y sin necesidad de configurar y mantener canalizaciones
Amazon
de extracción, transformación y carga (ETL) complejas. La exportación del lago de Aurora
datos de Amazon Redshift permite a las organizaciones descargar datos de sus
almacenes de datos a su lago de datos en formatos abiertos, listos para ser analizados.
Con el enfoque de “Lake House” (casa de lago), las organizaciones también pueden
Amazon n Lake Form Amazon
utilizar capacidades como AWS Glue Elastic Views para trasladar y sincronizar datos azo at
EMR m DynamoDB
io
cómodamente entre lagos de datos, almacenes de datos y almacenes creados para Amazon
n
Athena
un propósito específico. Esto les proporciona la escala y la flexibilidad de almacenar y
procesar sus datos en un lago de datos, con el rendimiento y la rentabilidad de utilizar
Amazon
almacenes de datos creados para un propósito específico. S3
Am
Por último, el enfoque de “Lake House” (casa de lago) permite a los desarrolladores, a zo n G lu e
analistas empresariales y científicos de datos destruir los silos y descubrir, recopilar
Amazon Amazon
y analizar los datos de forma segura y controlada. El enfoque proporciona a las Elasticsearch SageMaker
organizaciones capacidades como AWS Lake Formation, que incluye un catálogo de Service
datos que descubre, etiqueta y cataloga los datos automáticamente. Establece una
forma sencilla de definir y administrar de forma centralizada las políticas de seguridad,
gobernanza y auditoría, todo en un solo lugar. Esto les permite a las organizaciones Amazon
Redshift
brindar acceso pormenorizado a los datos al usuario correcto en el momento ideal,
lo que a su vez hace que se cumplan los requisitos de conformidad y gobernanza
normativa de manera eficaz.
12
BECOMING DATA-DRIVEN
HISTORIAS DE CLIENTES
La American Heart Association Moderna acelera el desarrollo de la Epic Games diseña su megaéxito
(Asociación Estadounidense del vacuna ARNm contra la COVID-19 Fortnite con base en el
Corazón) descubre información que comportamiento del jugador
Las capacidades informáticas escalables y de alto
salva vidas
rendimiento del almacenamiento de datos de Los diseñadores de Epic Games obtienen
La plataforma de medicina de precisión AWS permiten a Moderna Therapeutics ejecutar información más profunda sobre el comportamiento
desarrollada en la nube de AWS por la American su estudio de diseño de fármacos. Convierte de los jugadores gracias a los datos de fácil acceso
Heart Association les permite a los investigadores con éxito los hallazgos del análisis y el machine que se envían desde y hacia AWS a través de sus
descubrir información crítica de enfermedades learning en secuencias, y así se logra producir una experiencias de juego interactivas y muy populares,
cardiovasculares mediante datos que se almacenan de las primeras vacunas contra la COVID-19 en como el megaéxito Fortnite. Con el poder de la
de manera centralizada y son fáciles de buscar recibir aprobación. nube de AWS, los diseñadores de Fortnite puede
y acceder. crear circuitos de retroalimentación constantes que
ayudan a aumentar la satisfacción del cliente en
“Con la nube de AWS, la plataforma “Con AWS, nuestros investigadores tiempo real.
utilizará la capacidad de los big data tienen la capacidad de diseñar y
para revolucionar la manera en la que ejecutar rápidamente experimentos
se realiza investigación cardiovascular de investigación y de descubrir en
y agilizar la promesa de la medicina poco tiempo nuevos conocimientos
cardiovascular de precisión”. para poner en marcha tratamientos
Nancy Brown que podrían salvar vidas con mayor
directora ejecutiva, American Heart Association rapidez”.
Stéphane Bancel
director ejecutivo, Moderna
13
CÓMO CONVERTIRSE EN UNA ORGANIZACIÓN IMPULSADA POR DATOS
El machine learning es una de las tecnologías más la primera red de instancias de 400 Gbps en la nube.
revolucionarias de nuestra generación. Puede ayudar Las instancias P4d se implementan en clústeres a
a aumentar las oportunidades de ingresos, a tomar hiperescala (llamados EC2 UltraClusters) y ofrecen
decisiones mejores y más rápidas, y a mejorar la un rendimiento de tipo supercomputadora para los
eficiencia operativa. Con el tiempo, prácticamente trabajos de entrenamiento de ML más complejos. Para
todas las aplicaciones estarán basadas en el machine la inferencia, que representa el 90 por ciento de los
learning y la inteligencia artificial. AWS acompaña costos de ML, las instancias de Amazon EC2 Inf1 con
a los clientes dondequiera que se encuentren en su chips de AWS Inferentia son las más asequibles en la
proceso de ML e IA, y los ayuda a lograr resultados nube.
empresariales únicos. Desarrolladores de todos los
niveles de experiencia pueden acceder al conjunto más Para los científicos de datos y los desarrolladores
amplio y completo de servicios de ML e IA de AWS. de ML, AWS ofrece Amazon SageMaker, el servicio
administrado de machine learning más completo de
El objetivo final de convertirse en una empresa la industria. Fue creado desde cero para simplificar el
orientada a los datos es crear las capacidades proceso de machine learning con herramientas para
necesarias para reinventar el modo en que sus equipos cada paso del desarrollo de ML. Estas herramientas
ofrecen valor a los usuarios, a los clientes y al mundo automatizan las tareas de etiquetado, preparación
utilizando sus datos. Las innovaciones impulsadas por de datos, ingeniería de características, detección de
el ML y la IA son los componentes fundamentales de sesgos estadísticos, AutoML, entrenamiento, ajuste,
este tipo de transformación en todas las industrias y alojamiento, explicabilidad, monitoreo y flujos de
dentro de ellas. trabajo.
Para los profesionales expertos, AWS admite todos Mediante la estandarización en SageMaker, los equipos
los principales marcos de machine learning, incluidos pueden eliminar la complejidad de cada paso del
TensorFlow, MXNet, PyTorch, Caffe 2, entre otros. flujo de trabajo de ML para preparar, crear, entrenar e
AWS ofrece las instancias de mayor rendimiento implementar modelos de ML de alta calidad de forma
para el entrenamiento de ML en la nube con las más rápida y rentable. Los beneficios de la eficiencia
instancias Amazon EC2 P4d, impulsadas por las son potencialmente revolucionarios. Los científicos de
últimas GPU NVIDIA A100 Tensor Core y acopladas a datos equipados con SageMaker son hasta 10 veces
14
CÓMO CONVERTIRSE EN UNA ORGANIZACIÓN IMPULSADA POR DATOS
más productivos a la hora de preparar, entrenar e implementar modelos de machine servicios de IA específicos para las industrias, tanto para el sector industrial como para
learning de alta calidad. la industria de la atención médica.
Para desarrolladores y usuarios empresariales, AWS ofrece servicios de IA Para utilizar el machine learning de manera más amplia, es necesario acercarlo a los
preentrenados que proporcionan inteligencia preparada para las aplicaciones y los lagos de datos y a los almacenes de datos creados para un propósito específico, donde
flujos de trabajo. Mediante la tecnología de AutoML, estos servicios integrales se residen gran parte de los datos necesarios para el machine learning. Para hacerlo, AWS
crearon para solucionar las necesidades de las empresas desde el primer momento. ofrece la integración del machine learning en sus almacenes de datos creados para un
Abordan casos de uso comunes, como las recomendaciones personalizadas, la propósito específico y sus servicios de inteligencia empresarial (BI). Los desarrolladores
inteligencia de los centros de contacto, el procesamiento de documentos, la búsqueda pueden utilizar Amazon Aurora ML para ejecutar machine learning con una simple
inteligente, el análisis de estadísticas empresariales y mucho más. AWS también ofrece consulta SQL en datos transaccionales o utilizar Amazon Neptune ML para aplicar el
15
CÓMO CONVERTIRSE EN UNA ORGANIZACIÓN IMPULSADA POR DATOS
aprendizaje profundo a los datos de gráficos sin tener que crear y entrenar modelos de falta de habilidades necesarias y la complejidad general. La buena noticia es que
machine learning. Asimismo, los analistas de datos pueden utilizar Amazon Redshift las organizaciones pueden acelerar sus proyectos de machine learning con acceso
ML y Amazon Athena ML para ejecutar machine learning en sus datos en un almacén o a herramientas de aprendizaje divertidas y prácticas. Por ejemplo, DeepRacer es
lago de datos sin tener que seleccionar, crear o entrenar modelos de ML. Además, los un coche de carreras a escala 1/18 totalmente autónomo conducido a través del
analistas empresariales pueden utilizar Amazon QuickSight Q, que emplea machine aprendizaje mediante refuerzo. Los desarrolladores pueden competir en la DeepRacer
learning para generar, automáticamente, un modelo de datos que comprende el League para obtener y demostrar habilidades utilizables, y las empresas pueden
significado de los datos empresariales (y las relaciones entre ellos), formulando lanzar sus propias ligas para capacitar a los desarrolladores internos. Más de 150
preguntas a los datos mediante un lenguaje sencillo y recibiendo respuestas casi en organizaciones mundiales, como Capital One, Moody's, Accenture, DBS Bank, BMW
tiempo real. y Toyota, han capacitado a miles de desarrolladores con los eventos empresariales
de DeepRacer. AWS también ofrece a los expertos del Machine Learning Solution
Además de la tecnología, AWS ofrece varios servicios y características relacionadas Lab, un entrenamiento de ML amplio y personalizado, y una red de más de 70 socios
para ayudar a las organizaciones a dar sus primeros pasos. Estos servicios ayudan a los para ayudar a las organizaciones a dar sus primeros pasos en el proceso de machine
equipos a superar los desafíos que plantea la implementación de estas tecnologías, learning.
que a menudo giran en torno a la ambigüedad de los datos, los costos inciertos, la
16
HISTORIAS DE CLIENTES
El seguimiento de jugadores de la NFL entusiasma a una Fannie Mae introduce el machine learning en los
nueva generación de aficionados servicios financieros
AWS y Amazon SageMaker impulsan las innovaciones del fútbol profesional con Como todas las grandes empresas de servicios financieros, Fannie Mae absorbe
chips RFID. Estos chips se colocan en las hombreras de los jugadores de la NFL cantidades enormes de datos. Tan solo en el proceso de valuación de inmuebles,
para generar nueva información y predecir qué jugadas y contenidos cautivarán el líder financiero recibe cerca de 40 000 informes de avalúos y más de medio
al público. millón de imágenes diariamente. Fannie Mae almacena sus datos en la nube de
AWS y utiliza Amazon SageMaker para desarrollar, evaluar, ampliar y mejorar los
“He recibido muchos comentarios positivos de los aficionados que dicen: modelos que utiliza en todo, desde la evaluación de los préstamos que respalda
'Vaya, ¿cómo han completado ese pase?’ Hemos podido cuantificarlo y hasta el análisis de los valores de los inmuebles.
compararlo con otros pases, y eso ha sido un verdadero valor agregado
para los aficionados porque crea un contexto respecto de lo que sucede en “Estamos incorporando nuevas fuentes de datos cada semana, cada
el juego”. mes, para buscar información nueva. Aplicar esos datos para ayudar
Matt Swensson, Vice President of Emerging Products and Technology, NFL a los prestamistas a tomar las decisiones correctas requiere las
herramientas adecuadas”.
Scott Hallworth, vicepresidente sénior y director de datos, modelado y análisis, Fannie Mae
17
CULTURA IMPULSADA POR DATOS
• Todo el mundo tiene acceso a los datos, empezando por los directivos Paso 4
• Las capacidades organizativas respaldan la cultura impulsada por datos La importancia de la TI. La TI aporta una visión única del ciclo
integral de la empresa, de los flujos de trabajo interdepartamentales
• La experimentación genera mejoras organizativas
y de los sistemas transaccionales que contienen información valiosa.
• El análisis vuelve a transformarse con la IA y el ML
18
CULTURA IMPULSADA POR DATOS
Fundado en 2010, el motor de descubrimiento visual Pinterest admite 400 millones de debe hacer a continuación y cómo responden sus Pinners a los cambios y mejoras. Hace
usuarios cada mes. En Pinterest, los usuarios conocidos como "Pinners" registran más un seguimiento constante para saber cómo y dónde puede prestar un mejor servicio a
de 240 000 millones de puntos de información conocidos como "pins". Con todos esos sus usuarios. Y aunque el proveedor comenzó como un sitio web, ha evolucionado para
datos, la tecnología desempeña un papel integral al apoyar la misión de la empresa: ofrecer experiencias móviles al 70 % de los Pinners que se conectan a través de sus
proporcionar valor a todos los que utilizan Pinterest para poner pins en todo, desde dispositivos móviles.
recetas hasta ideas de manualidades, viajes y mucho más.
AWS apoya desde hace tiempo el notable crecimiento de Pinterest, proporcionando la
De hecho, casi todos los cambios en los productos de Pinterest se basan en datos escalabilidad y confiabilidad que debe tener para hacer funcionar su negocio. Según
y provienen de la investigación realizada sobre el comportamiento de los Pinners. Chaiken: “Como una empresa nacida en la nube”, las ambiciones de Pinterest “nunca
Mediante datos y ML, la empresa recopila y analiza, en cada milisegundo, las búsquedas se han limitado a las paredes de un centro de datos”. AWS ha ayudado a eliminar
que son tendencia y los intereses superpuestos en la comunidad para identificar ideas las restricciones de datos para Pinterest y otras miles de organizaciones que se han
que sean relevantes para cada persona. Pinterest se basa en los datos para analizar qué esforzado por construir sus funciones (y su futuro) en torno a los datos.
19
CONCLUSIÓN