Está en la página 1de 54

Taller a la medida

Google Digital Leader


02 Innovando con información (data) con Google Cloud

www.cognitus.com.mx
MÓDULO 2

Innovando con información (data)


con Google Cloud

www.cognitus.com.mx - 2
CONTENIDO
SUBMÓDULO 1
El valor de la información (data)

SUBMÓDULO 2
Consolidación de información (data) y análisis

MÓDULO 3
Innovación con Machine Learning

www.cognitus.com.mx - 3
SUBMÓDULO 1

El valor de la información (data)

www.cognitus.com.mx - 4
Información (data)
Es cualquier dato que le sea útil a una organización, pueden ser:
● Documentos
● Emails
● Archivos de audio
● Archivos de video
● Imágenes
● Ideas
Puede ser también:
● Interna (de la organización)
● Externa (de la industria o los usuarios)

www.cognitus.com.mx - 5
Retos para la captura y aprovechamiento de la Información
(data)
Capturar y aprovechar la información, es clave para el éxito de la transformación digital de una
organización, sin embargo, existen limitaciones comunes para lograrlo, tales como:
1. Procesamiento de grandes volúmenes o variedades de información
2. Encontrar soluciones con buen balance costo/beneficio
3. Escalado de recursos dinámico
4. Acceso a información histórica
5. Análisis de información nueva, e histórica

www.cognitus.com.mx - 6
Solución a retos de captura y aprovechamiento con Google
Cloud
Al utilizar Google Cloud, podemos hacer frente a los retos antes mencionados, mediante:
● Economías de escala
● Automatización
● Rápida elasticidad
● Acceso a información

www.cognitus.com.mx - 7
Administración y manejo de la información
Ya que sabemos cómo solucionar dichos retos con Google Cloud, ahora, debemos crear un
data map que nos permita navegar por toda la información que compone nuestros procesos
de negocioc

www.cognitus.com.mx - 8
Cómo formar un data map
La unidad mínima de un data map, es un data point.
Un data point puede ser:
● Una compra en una tienda
● Una reproducción de video
● La asistencia de un empleado
● El sueldo de una empleada
● La ubicación geográfica de la tienda de un competidor
● El número de seguidores en las cuentas de Twitter de tu compañía y su competencia

www.cognitus.com.mx - 9
Cómo formar un dataset
El conjunto de datapoints relevantes y coherentes entre sí, es un dataset. Por ejemplo. Si
creamos varios posts en un día, y cada like es un datapoint. El agregado de estos, es un
dataset. El dataset de likes, que relaciona el número de likes con sus respectivos posts.

www.cognitus.com.mx - 10
Cómo formar un data bucket
El conjunto de datasets relevantes y coherentes entre sí, es un data bucket.
Reorganicemos nuestros datasets en data buckets:
1. Databucket de posts
a. Número de posts por likes
b. Numero de comentarios por likes
2. Databucket corporativo
a. Asistencia de empleados
b. Rangos salariales de empleados
3. Databucket de la industria
a. Mapa geográfico de ubicaciones de tiendas
b. Presencia en redes sociales por número de seguidores

www.cognitus.com.mx - 11
La meta de organizar nuestra información (data)
Cuando organizamos coherentemente nuestra información histórica, y organizamos la
información nueva en cuanto llega, podemos hacer que la información sea accionable, es
decir, que nos revele el mejor camino de acción hacia el futuro

www.cognitus.com.mx - 12
Clasificación de información
En adición a un datamap, la información (data) puede ser clasificada en dos categorías muy
importantes
1. Información estructurada
2. Información no estructurada
3. Información semiestructurada

www.cognitus.com.mx - 13
Información estructurada
Es altamente organizada y tiende a ser cuantitativa. También se conoce como información
tabular, porque puede ser insertada y comprendida dentro de una tabla. Por lo tanto, es
fácilmente almacenada y administrada, en una base de datos

www.cognitus.com.mx - 14
Información no estructurada
Carece de organización aparente y tiende a ser cualitativa. Por ejemplo, documentos de word,
archivos de audio, video e imágenes

www.cognitus.com.mx - 15
Información no estructurada
Mucha de esta información, peude ser almacenada en formato BLOB: Binary Large OBject

www.cognitus.com.mx - 16
Información semi estructurada
Es importante, para cualquier análisis de información que contemple información no
estructurada, dotarle de al menos, un poco de estructura. Generalmente, esto se logra a
través de APIs integradas con fistintas plataformas, para volverla accionable

www.cognitus.com.mx - 17
Consideraciones sobre la captura y almacenamiento de
información
Al manejar grandes volúmenes y diversos tipos de información, debemos recordar lo
importante que es pensar en las consideraciones éticas y regulatorias que existen alrededor
de ella. Es decir, no toda la información que puede ser capturada, debe ser capturada.
Siempre debemos ser responsables sobre qué información es capturada, almacenada y
analizada

www.cognitus.com.mx - 18
Consideraciones sobre la captura y almacenamiento de
información
Si es necesario capturar información sensible o personal, debe ser encriptada desde el
momento de su captura y hasta su almacenamiento, así como protegida de amenazas
internas y externas

www.cognitus.com.mx - 19
Consideraciones sobre la captura y almacenamiento de
información
Además, debemos tener en cuenta, cualquier regulación regional sobre la captura y
almacenamiento de datos, así como tener especial cuidado cuando se trata de información
trabajada con Inteligencia artificial y Machine Learning

www.cognitus.com.mx - 20
Consideraciones sobre la captura y almacenamiento de
información
Cuando se trabaja con modelos de Machine Learning e Inteligencia Artificial, es importante
recordar, que aunque el trabajo lo haga una computadora, hubo humanos involucrados en la
captura de información, creación de data maps, datasets y data buckets, y que por lo tanto,
debemos incorporar estrategias para eliminar prejuicios conscientes o inconscientes. Con el
objetivo de evitar la discriminación a ciertos grupos de personas, y la exactitud de los modelos
predictivos que queremos obtener

www.cognitus.com.mx - 21
Almacenamiento de información
Si actualmente almacenas información “on-premises”, por lo general, es buena idea pensar en
migrarla a la nube, de la misma manera que si guardas dinero bajo el colchón, es buena idea
pensar en “migrarlo” al banco. Allí, estará más seguro y tendrá mejor retorno de inversión

www.cognitus.com.mx - 22
Almacenamiento de información
Cuando almacenas información on-premises, eres responsable de la infraestructura que
permite su captura, seguridad, análisis y proceso. Además, eres responsable del
mantenimiento y la expansión de la capacidad de dicha infraestructura

www.cognitus.com.mx - 23
Almacenamiento de información
Además, corres el riesgo de que exista downtime, situación que resulta en usuarios
frustrados, e insatisfechos

www.cognitus.com.mx - 24
Almacenamiento de información
En la nube, puedes “rentar” espacio con un proveedor de nube pública como Google Cloud, y
solucionar ambos problemas, ahora, tu información está segura y disponible en todo
momento, y el compute power es elástico, bajo demanda y con ingesta de datos en
tiempo real

www.cognitus.com.mx - 25
Cómo almacenar información: Bases de datos
Una forma muy común de almacenar información, es mediante una base de datos. Una base
de datos es:
Una colección organizada de datos, generalmente almacenados en tablas, cuyo acceso
ocurre de forma electrónica a través de un sistema de computadoras.

www.cognitus.com.mx - 26
Prioridades para el almacenamiento de información
Existen dos prioridades fundamentales para el correcto almacenamiento de información:
1. Integridad de datos
2. Escalabilidad

www.cognitus.com.mx - 27
Integridad de datos
La integridad de datos, o integridad transaccional, se refiere a la exactitud y consistencia de la
información almacenada en una base de datos.
Para lograrla, es importante implementar reglas de diseño al comienzo y chequeos de
validación rutinarios cuando la información es capturada

www.cognitus.com.mx - 28
Información a través de la historia
El uso de bases de datos, permite a las organizaciones mirar en el pasado, a estados previos
de la base de datos, e incluso revertir transacciones si es necesario

www.cognitus.com.mx - 29
Soluciones de Google para bases de datos
Existen, principalmente dos soluciones de bases de datos en Google Cloud
1. Cloud SQL
2. Cloud Spanner

www.cognitus.com.mx - 30
Cloud SQL
Es un servicio de administración de bases de datos relacionales (RDBMS - Relational
Database Manager System) que puede integrarse fácilmente con otros servicios de Google
Cloud como Google Kubernetes Engine (GKE) o BigQuery

www.cognitus.com.mx - 31
Cloud SQL
CloudSQL ofrece seguridad, disponibilidad, durabilidad y el almacenamiento puede
escalar de forma automática cuando esta opción se habilita.

www.cognitus.com.mx - 32
Cloud Spanner
Es otro servicio de bases de datos, diseñado con la escala global como prioridad. Así, la
información almacenada en Cloud Spanner, es automatica e instantáneamente replicada a
lo largo de distintas regiones, si alguna de ellas experimenta downtime, la información
puede ser consultada desde un datacenter en otra región

www.cognitus.com.mx - 33
Otros servicios de bases de datos en Google Cloud
Existen otros servicios de bases de datos que no deberían venir en el examen, pero es bueno concerlas y se listan a
continuación por cualquier eventualidad:
● Bare Metal para Oracle
Soluciones específicas para migrar Oracle on-premises
● PostgreSQL, SQL Server
Todo lo que diga SQL, puede asociarse a los mismos principios de CloudSQL
● Cloud BigTable
NoSQL para Data Science. Pensemos en enormes, pero enormes cantidades de datos para analizar
● Firestore
NoSQL para web o IoT
● Firebase Realtime Database
NoSQL, pero pensemos en logins, ads y chats
● Memorystore
Redis, acceso en menos de un milisegundo, noticias, caching y gaming
● MongoDB Atlas
MongoDB, CMS, aplicaciones de una sola vista y aplicaciones móviles

www.cognitus.com.mx - 34
Cómo analizar información: Data Warehouses
Así como las bases de datos están diseñadas para la rápida ingesta y almacenamiento de
información, las data warehouses ensamblan información proveniente de múltiples fuentes,
incluyendo bases de datos, y hacer rápido análisis de datasets multidimensionales.
Particularmente, las data warehouses nos permiten consolidar información estructurada
y semi-estructurada

www.cognitus.com.mx - 35
Cómo analizar información: Data Warehouses
Cuando se les combina con las herramientas adecuadas (connector tools), las data
warehouses, pueden transformar información no estructurada, en información
semi-estructurada que ya puede utilizarse para análisis

www.cognitus.com.mx - 36
Cómo analizar información con Google Cloud - Big Query
Big Query es el servicio de Data Warehouse de Google; BigQuery es serverless; es decir, a
diferencia de la mayoría de proveedores de Data Warehouses, el compute power es
provisionado automáticamente sólo cuando es necesario. Así, las organizaciones sólo
pagan por el compute power que en realidad utilizan cuando ejecutan una query

www.cognitus.com.mx - 37
Cómo analizar información con Google Cloud - Pub/Sub y
Data flow
Pub/Sub y Data Flow son servicios de Google que juntos, pueden transformar información
estructurada en información semi-estructurada (herramientas de conexión - connector
tools); esta información, puede ser enviada directamente desde DataFlow hacia BigQuery,
para su análisis inmediato

www.cognitus.com.mx - 38
Data lakes con Google Cloud: Cloud Storage
Cloud Storage es el servicio de Google que te permite almacenar y servir blobs. Puedes
almacenar una cantidad ilimitada de información, sin un mínimo requerido. Con baja
latencia y acceso desde cualquier parte del mundo, gracias a su soporte multiregional. O
accedida desde sólo ciertas regiones para su uso en análisis de datos o entrenamiento de
modelos de Machine Learning

www.cognitus.com.mx - 39
Data lakes con Google Cloud: Cloud Storage
Cloud Storage ofrece tres tipos de acceso:
1. Nearline
Para información que será accedida en promedio una vez al mes
2. Coldline
Para información que será accedida en promedio una vez cada trimestre
3. Archive
Para información que será accedida en promedio una vez cada año

www.cognitus.com.mx - 40
Cómo analizar información: Business Intelligence
Las herramientas de Business Intelligence (BI) sirven información en reportes y
dashboards de forma intuitiva y a gran escala
Existen múltiples herramientas de BI, pero algunas son muy complejas e inaccesibles para
personas que no pertenezcan a equipos de ingeniería y análisis de datos, o son más
abiertas, pero sólo permiten hacer análisis de información limitada; causando que muy
pocas personas, o realmente nadie, tenga acceso a un vistazo general de la información
de su organización

www.cognitus.com.mx - 41
Business Intelligence con Google Cloud: Looker
Looker es la solución de Business Intelligence de Google Cloud. Es una plataforma de
información colocada sobre cualquier base de datos de análisis que permite describir
de forma simple la información de tu organización y la fácil definición de métricas de
negocio

www.cognitus.com.mx - 42
SUBMÓDULO 3

Innovación con Machine Learning

www.cognitus.com.mx - 43
Información en ambas direcciones
Los dashboards y reportes de Looker, son ejemplos de backward-looking data. Es decir,
miran lo que ha sucedido en el pasado, pero para generar aún más valor agregado, es
necesario usar esa información para tomar decisiones en el futuro

www.cognitus.com.mx - 44
Inteligencia Artificial (AI)
La inteligencia artificial es un término amplio que describe cualquier máquina capaz de
actuar de forma autónoma

www.cognitus.com.mx - 45
Machine Learning (ML)
Es una rama de la inteligencia artificial. Se
refiere a aquellas computadoras que pueden
“aprender” con base en información, sin utilizar un
set demasiado complejo de reglas. Para fines de
este curso, nos enfocamos en aquella ML que
soluciona problemas numéricos o de
clasificación
Machine Learning es una manera de usar
algoritmos o modelos estándares para analizar
información y así, crear predicciones que
deriven en decisiones repetidas a escala

www.cognitus.com.mx - 46
Consideraciones para Machine Learning (ML)
Así como en la programación tradicional, un bug se refiere a un error humano que provoca
una salida equivocada en un programa, en la programación con machine learning, los bugs
suelen encontrarse en la información proveída para el aprendizaje del modelo.

www.cognitus.com.mx - 47
Coverage (Cobertura)
Consiste en entregar la información suficiente a un modelo de Machine Learning. Es
mucho más sencillo, que nuestro modelo tenga éxito, si tiene 100,000 ejemplos de entradas y
salidas, a si sólo tiene 100.

www.cognitus.com.mx - 48
Data Cleanliness (Información limpia)
También llamada “data consistency - consistencia de datos”
Anticoncepto:
La información sucia o inconsistente, es aquella que, de alguna manera, previene que el
modelo realice predicciones exactas o entienda correctamente el comportamiento de
los datos

www.cognitus.com.mx - 49
Data Completeness (Información completa)
Se refiere a la disponibilidad de suficiente información sobre el mundo, como para
sustituir el conocimiento humano
Decimos que existe información incompleta cuando falta mejor información para que un
modelo ejecute su trabajo correctamente
La información es el túnel a través del cuál el modelo ve el mundo, lo que no puede ver,
asume que no existe.

www.cognitus.com.mx - 50
Calidad de la información
Para resolver bugs en nuestra información, o saber si es correcta, debemos preguntarnos:
1. ¿Hace falta cobertura?

2. ¿Cómo puedo mejorar la limpieza de mi información?

3. ¿Cómo puedo hacer más completa mi información?

www.cognitus.com.mx - 51
Soluciones de Google para AI y ML
Google Cloud, democratiza la AI, al proveer distintas soluciones que permiten a negocios y
organizaciones, aprovechar sus beneficios sin los tradicionales costos y esfuerzos que esto
implica. Principalmente, mediante la Google Cloud AI Platform; una platforma unificada que
posibilita la fácil adopción de ML por desarrolladores y analistas, que incluye modelos
pre-entrenados personalizables para casos de uso específicos en el AI Hub, que pueden
utilizarse en conjunto con APIs de Google, o propias, en la nube, u on-premises.

www.cognitus.com.mx - 52
Los cuatro problemas fundamentales que resuelve ML
Existen 4 problemas fundamentales que el Machine Learning nos ayuda a resolver:
1. Reemplazar sistemas basados en reglas
Búsquedas basadas en condiciones

2. Automatización de procesos
Valuaciones de automóviles con información estructurada y no estructurada

3. Entendimiento de información no estructurada


Análisis del contenido de una obra literaria

4. Personalización de aplicaciones
Ads e interacciones dirigidas

www.cognitus.com.mx - 53
Cognitus IT Solutions, SA de CV
Cursos, Talleres, Diplomados y Certificaciones
t. 55-6820-2141
informes@cognitus.com.mx
www.cognitus.com.mx

También podría gustarte