Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Introduccion Big Data DONOSTIA PDF
Introduccion Big Data DONOSTIA PDF
www.consultec.es
Quiénes somos?
www.consultec.es
Índice
1. Introducción
2. ¿Qué no es Big Data?
3. ¿Qué es Big Data?
4. Utilidades
5. Ejemplo real: Walmart
6. Características Técnicas
7. Markets de Datos
8. Hadoop
9. Microsoft HDInsight
10. Demo
Introducción
“Big Data” es desde hacer un par de años una de las grandes
tendencias dentro del mundo de la tecnología y del marketing, uno
de esos “buzzwords” que en un momento dado empiezan a
propagarse y aparecer por todo internet, las grandes empresas se
interesan por ello, se crea una industria alrededor y, de repente, todo
el mundo sabe lo que es Big Data. O no …
BIG DATA
www.consultec.es
¿Qué no es Big Data?
Antes de empezar, lo primero es desengañarnos.
www.consultec.es
¿Qué es Big Data? - Situación actual
Información
generada
por
eMails
apps
móviles
GPS
Bases
de
Datos
Redes
Sociales
Relacionales
Archivos
Información
(XML,
generada
por
Logs,
…)
máquinas
RFID
Big
Data
ERP/CRM
APIs
Bases
de
Y
mucho
más.
Datos
Sensores
Y
lo
que
está
Analí+cas
(Data
por
venir
…
Warehouse)
Base
de
Datos
NoSQL
Internet
de
las
Cosas
www.consultec.es
¿Qué es Big Data? - Definiciones
Definiciones encontradas en internet
www.consultec.es
¿Qué es Big Data? - Las 3 Vs
www.consultec.es
¿Qué es Big Data? - Las 3 Vs
www.consultec.es
¿Qué es Big Data? - Las 3 Vs
www.consultec.es
¿Qué es Big Data? – Retos actuales
• Dar sentido al gran volumen de datos
• Debemos poder analizar datos tanto relacionales como no relacionales. Más del 85%
de los datos capturados son desestructurados.
www.consultec.es
¿Qué es Big Data? - Entendimiento: de los datos a la
sabiduría
Experiencia
Sabiduría
Contexto
Conocimiento
Información
Datos
www.consultec.es
Utilidades
Toma de decisiones
www.consultec.es
Utilidades
Transparencia
www.consultec.es
Utilidades
Experimentación
www.consultec.es
Utilidades
Innovación
Permite crear nuevos productos y servicios, mejorar los existentes e, incluso, crear
nuevos modelos de negocio.
www.consultec.es
Ejemplo real: Walmart
• Walmart es una multinacional
de grandes almacenes
www.consultec.es
Ejemplo real: Walmart
• Algunos datos:
• 10700 tiendas
• 27 países
• 2 millones de trabajadores
www.consultec.es
Ejemplo real: Walmart
Guardando todas las compras de todos los clientes se dieron cuenta que
en época de huracanes los Walmart de las zonas afectadas vendían más
cajas de Pop-Tarts que en otras épocas.
Se indicó a los gerentes de las tiendas que en esas épocas pusiesen los
Pop-Tarts en la entrada de las tiendas.
www.consultec.es
Ejemplo real: Walmart
Hanna twitea:
“I love Salt!”.
“Buenos días!
www.consultec.es
Ejemplo real: Walmart
Social Genome
www.consultec.es
Ejemplo real: Walmart
Social Genome
www.consultec.es
Ejemplo real: Walmart
Resumiendo
www.consultec.es
Características Técnicas
Arquitectura
• Alta escalabilidad
• Procesamiento paralelo
• Baja latencia
• NoSQL
• By-pass de datos
www.consultec.es
Características Técnicas
Key-Value Pair
www.consultec.es
Markets de Datos
Además de las fuentes de datos que tengamos en nuestra
organización: bases de datos, emails, logs, documentos, etc …
Podemos acceder a grandes volúmenes de datos (Data Sets) en los
markets.
www.consultec.es
Hadoop
Es una plataforma diseñada para almacenar y analizar grandes
volúmenes de datos de diferentes tipos. Basada en Google Map/
Reduce y Google Filesystem.
• Map/Reduce:
www.consultec.es
Hadoop
Otros proyectos alrededor de Hadoop
• …
www.consultec.es
Microsoft HDInsight
• Servicio basado en Hadoop.
• Dos versiones:
• Windows Azure HDInsight (on-demand)
• HDInsight Server (on-premise)
www.consultec.es
Microsoft HDInsight
• Acceso a todo tipo de usuarios, incluidos desarrolladores y
profesionales IT. Fácil instalación, administración y configuración.
www.consultec.es
DEMO
www.consultec.es
Gracias!
www.consultec.es
¿Dudas?
www.consultec.es