Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Alejandro Flores
Arquitecto de Soluciones
AWS Mexico
SUMMIT © 2019, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Muy Importante: Generar valor a partir de los datos
Líderes Seguidores
*Aberdeen: Angling for Insight in Today’s Data Lake, Michael Lock, SVP Analytics and Business Intelligence
SUMMIT © 2019, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Los datos están cambiando -> Los analíticos se están
adaptando
Capture y almacene
Nuevos tipos nuevos datos en
de analíticos
escalas de PB-EB
Realice nuevos tipos de
análisis, a bajo costo
• Machine Learning
• Procesamiento de Big Data
• Análisis en Tiempo Real
• Búsquedas Full-text
SUMMIT © 2019, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Definición de un data lake
Un data lake es una arquitectura con un repositorio
de almacenamiento centralizado, virtualmente
ilimitado, capaz de categorizar, procesar, analizar y
poder consumir sets de datos de manera
heterogénea.
• Query in place
• Schema on read
SUMMIT © 2019, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Los data lakes permiten escalar eficientemente y a un bajo
costo Amazon
Amazon Athena
Amazon
Kinesis Amazon
Amazon
EMR Elasticsearch
Service
Almacenamiento en exabytes de datos
QuickSight
OLTP
IAM AWS KMS
AI Services
ERP
CRM
Amazon S3
Athena
LOB
Data
Catalog Amazon
Devices EMR
Sensors
S3 Amazon
Web Redshift
Kinesis
Social
SUMMIT © 2019, Amazon Web Services, Inc. or its affiliates. All rights reserved. Amazon
QuickSight
¿Porqué Amazon S3 para el data lake?
Escalable y Costeable
Simple Flexible
SUMMIT © 2019, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Amazon Kinesis—Tiempo Real
Almacena, procesa y analiza videos y datos en tiempo real
SQL
Kinesis Video Streams Kinesis Data Streams Kinesis Data Firehose Kinesis Data Analytics
SUMMIT © 2019, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Amazon Athena—Análisis Interactivo
Servicio de análisis interactivo de datos en S3 usando SQL
Cero instalación y administración de infraestructura, cero carga de datos
Soporta multiple formatos y definición de esquema bajo demanda.
SUMMIT © 2019, Amazon Web Services, Inc. or its affiliates. All rights reserved.
La preparación de los datos corresponde al 80% del
trabajo en un data lake
Mining de datos
Redefinición de algoritmos
Otros
SUMMIT © 2019, Amazon Web Services, Inc. or its affiliates. All rights reserved.
AWS Glue—Catalogación y ETL’s Serverless
Serverless
SUMMIT © 2019, Amazon Web Services, Inc. or its affiliates. All rights reserved.
AWS Lake Formation
Construye, protege y administra Data Lakes en días.
SUMMIT © 2019, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Tradicionalmente, los análisis eran de la siguiente manera:
• Escalas de TBs–PBs
SUMMIT © 2019, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Los data lakes extienden el enfoque tradicional
• Escalas de TBs–EBs
SUMMIT © 2019, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Data lake en AWS
Data lake
en AWS
Almacenamiento | Archiving | Catálogo de Datos
SUMMIT © 2019, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Portafolio de servicios para data lakes, Análisis y IoT
Machine learning Análisis
Amazon Athena
Amazon SageMaker
Amazon EMR
AWS Deep Learning AMI
Amazon Redshift
Amazon Rekognition
Amazon Elasticsearch Service
Amazon Lex
Amazon Kinesis
AWS DeepLens
Amazon QuickSight
Amazon Comprehend
Amazon Translate
Amazon Transcribe
Amazon Polly
Data lake
en AWS
Almacenamiento | Archiving | Catálogo de Datos
SUMMIT © 2019, Amazon Web Services, Inc. or its affiliates. All rights reserved.
¿Qué significa la modernización de data warehouses?
Cualquier escala de Rapidéz en
datos, cargas y generación de
usuarios insights
Escalación dinámica para Desempeño consistente
garantizar el desempeño ante crecimiento
uniforma ante demanda concurrente de consultas
impredecible o crecimiento de y/o usuarios
datos.
SUMMIT © 2019, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Amazon Redshift
Rápido, simple y costo eficiente Análisis en diferentes formatos
datawarehouse que puede extender los queries hacia Parquet, ORC, y JSON, usando SQL
el data lake
SUMMIT © 2019, Amazon Web Services, Inc. or its affiliates. All rights reserved.
SUMMIT © 2019, Amazon Web Services, Inc. or its affiliates. All rights reserved.
SUMMIT © 2019, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Gracias!
Alejandro Flores
falej@amazon.com
SUMMIT © 2019, Amazon Web Services, Inc. or its affiliates. All rights reserved.