Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tecnología
(Dec. 2014) Volker
Markl Big Jeffrey Dean
Analytics:
Mahout, MLLib,
y Cronología Data …
Hadoop
2010 Spark 2008 Ecosystem
2001-2010
U Berckeley Hadoop
2010-2015 Aplicaciones
Apache Spark Yahoo!
Feb. 2014 Doug Cutting
Nuevas
Matei Zaharia
Tecnologías
• Volumen: Referido a la masividad de los datos
generados.
Datos Estructurados:
La gran mayoría de las fuentes de datos tradicionales son originadas por datos del tipo estructurados, datos con
formato o esquema fijo, que poseen campos fijos y bien definidos.
Datos no Estructurados:
Son las estructuras de datos más difíciles de manejar, podemos encontrar entre los datos no estructurados más
Característica
conocidos:
Audios y videos.
Correos electrónicos.
Ficheros multimedia de imagen.
Artículos y textos, entre otros
Son un híbrido entre los datos estructurados y los datos no estructurados, podríamos decir entonces de manera
sencilla, que no presentan una estructura perfectamente definida como los datos estructurados, pero sí presentan una
organización definida en sus metadatos donde describen los objetos y sus relaciones.
Web y redes Maquina a Generado por Grandes
Biométricos
sociales Maquina el hombre Transacciones.
• Textos del • Reconocimie • Señales de • Grabaciones • Teleco
Tipos de Big Twitter .
• Publicidad en
nto Facial.
• Genético.
Gps.
• Sensores
de voz de call
center.
municiones.
• Registro de
Data Facebook.
• Contenido
• Huella digital. digitales.
• Lectura de
• Email. impuestos.
Web. RFID.
1. Crear una estrategia: Debemos tener muy claro para qué fines queremos implantar Big Data
en la empresa. Además, también es importante conocer los recursos con los que contamos y los
que necesitaremos.
2. Escoger las fuentes de datos: Se están creando datos sin parar y debemos seleccionar bien las
que generen datos valiosos para la empresa. Entre ellas, tenemos: información proveniente de
¿Cómo sensores y dispositivos IoT, datos abiertos, información de webs y redes sociales, data lakes, etc
funciona Big 3. Almacenamiento y gestión de los datos: Aquí se encuentran acciones como el acceso fiable,
5. Toma de Decisiones: Por último, con todas estas conclusiones, los gestores y responsables
toman decisiones acertadas de gestión.
Los datos incrementaron Críticos y editores literarios
tremendamente las ventas La voz de Amazon (1995)
Ahora más de 1/3 de las ventas son
gracias a las recomendaciones
Casos de éxito Dilema: ¿Lo que
los clics decían o lo
que opinaban los
críticos?
Casos de éxito todas las potencialidades que el Big Data ofrece en su masividad de datos. Entre las
acciones que realiza, rastrea las calificaciones, el tiempo dedicado y las tendencias de cada
uno de sus usuarios para brindar una lista o sugerencia personalizada. Además, en base a
esos insight obtenidos planifica incluso su propia producción de contenido audiovisual.”
Casos de éxito
Ecosistemas y Frameworks
Casos de éxito “La biblioteca Hadoop, utiliza modelos de programación simples para el
almacenamiento y procesamiento distribuido, de grandes conjuntos de
datos en clusters, otorgando redundancia para no perder información y al
mismo tiempo, aprovechando muchos procesos a la vez”.
“Dentro de las bases de datos NoSQL, probablemente una de las
más famosas sea MongoDB, como característica distintiva es una
Casos de éxito base de datos orientada a documentos, es decir guarda los datos en
documentos y no en registros como las típicas bases de datos”.
1. Se debe dedicar un esfuerzo importante en conseguir resultados
centrados en el cliente.