Está en la página 1de 15

Grupo 6:

• Vasquez Ledesma, Leandro Enrique


• Puitiza Lucano, Dayanny Fiorela
• Remuzgo Tovar, Henry Willy
• Machaca Huanca, Eddy Ronald
 El término Big Data se refiere a grandes conjuntos de
datos, con un volumen tan grande que es necesario el uso
de técnicas y herramientas específicas para tratarlos. 
 Conjunto de técnicas y tecnologías para el tratamiento de
datos, en entornos de gran volumen, variedad de origines
y en los que la velocidad de repuesta es critica
2001
3V’s Gartner
Doug Laney
2009-2013 Flink 2010-2015:
2004
TU Berlin MapReduce
Big Data: Flink Apache Google Big Data

Tecnología
(Dec. 2014) Volker
Markl Big Jeffrey Dean
Analytics:
Mahout, MLLib,

y Cronología Data …

Hadoop
2010 Spark 2008 Ecosystem
2001-2010
U Berckeley Hadoop
2010-2015 Aplicaciones
Apache Spark Yahoo!
Feb. 2014 Doug Cutting
Nuevas
Matei Zaharia
Tecnologías
• Volumen: Referido a la masividad de los datos
generados.

• Variedad: Diversidad en las estructuras de los datos a


Característica integrar.
del Big Data
• Velocidad: Asociado con el tiempo de procesamiento de
los datos.
Volumen:
 “En el año 2000, se almacenaron en el mundo 800.000 petabytes.
Se espera que en el año 2020, se alcancen los 35 zettabytes (ZB).
Sólo Twitter genera más de 9 terabytes (TB) de datos cada día,
Facebook 10 TB y algunas empresas ya generan terabytes de
Característica datos cada hora de cada día del año”.

del Big Data Velocidad


 “Si analizamos la acción de poner un simple “me gusta” en una
foto, estamos entonces creando nuevos datos, cuando
empleamos el GPS también, cuando compramos un boleto de
avión, hasta cuando pedimos un turno al médico”.
Variedad:

Datos Estructurados:

 La gran mayoría de las fuentes de datos tradicionales son originadas por datos del tipo estructurados, datos con
formato o esquema fijo, que poseen campos fijos y bien definidos.

Datos no Estructurados:

 Son las estructuras de datos más difíciles de manejar, podemos encontrar entre los datos no estructurados más

Característica 
conocidos:

Documentos PDF o Word.

del Big Data 


Audios y videos.

Correos electrónicos.
 Ficheros multimedia de imagen.
 Artículos y textos, entre otros

Datos Semi - Estructurados:

 Son un híbrido entre los datos estructurados y los datos no estructurados, podríamos decir entonces de manera
sencilla, que no presentan una estructura perfectamente definida como los datos estructurados, pero sí presentan una
organización definida en sus metadatos donde describen los objetos y sus relaciones.
Web y redes Maquina a Generado por Grandes
Biométricos
sociales Maquina el hombre Transacciones.
• Textos del • Reconocimie • Señales de • Grabaciones • Teleco
Tipos de Big Twitter .
• Publicidad en
nto Facial.
• Genético.
Gps.
• Sensores
de voz de call
center.
municiones.
• Registro de

Data Facebook.
• Contenido
• Huella digital. digitales.
• Lectura de
• Email. impuestos.

Web. RFID.
1. Crear una estrategia: Debemos tener muy claro para qué fines queremos implantar Big Data
en la empresa. Además, también es importante conocer los recursos con los que contamos y los
que necesitaremos.

2. Escoger las fuentes de datos: Se están creando datos sin parar y debemos seleccionar bien las
que generen datos valiosos para la empresa. Entre ellas, tenemos: información proveniente de
¿Cómo sensores y dispositivos IoT, datos abiertos, información de webs y redes sociales, data lakes, etc

funciona Big  3. Almacenamiento y gestión de los datos: Aquí se encuentran acciones como el acceso fiable,

Data? los métodos de integración, el aseguramiento de la calidad de los datos, su control,


almacenamiento y preparación para análisis.

 4. Análisis de la información: Obtenemos valor de los datos, identificando patrones,


correlaciones y otras conclusiones útiles y alineadas con nuestra estrategia.

 5. Toma de Decisiones: Por último, con todas estas conclusiones, los gestores y responsables
toman decisiones acertadas de gestión.
Los datos incrementaron Críticos y editores literarios
tremendamente las ventas La voz de Amazon (1995)
Ahora más de 1/3 de las ventas son
gracias a las recomendaciones
Casos de éxito Dilema: ¿Lo que
los clics decían o lo
que opinaban los
críticos?

Greg Linde (1997) propuso un


sistema de recomendaciones,
filtrado colaborativo
“artículo a artículo”
Fuente: Big Data. La revolución de los datos masivos. Pag. 69. The power of habit, Charles Duhigg. Feb. 2012
“Sin dudas, Netflix también es una de las empresas que mejor ha sabido utilizar a su favor

Casos de éxito todas las potencialidades que el Big Data ofrece en su masividad de datos. Entre las
acciones que realiza, rastrea las calificaciones, el tiempo dedicado y las tendencias de cada
uno de sus usuarios para brindar una lista o sugerencia personalizada. Además, en base a
esos insight obtenidos planifica incluso su propia producción de contenido audiovisual.”

Casos de éxito
Ecosistemas y Frameworks

Casos de éxito “La biblioteca Hadoop, utiliza modelos de programación simples para el
almacenamiento y procesamiento distribuido, de grandes conjuntos de
datos en clusters, otorgando redundancia para no perder información y al
mismo tiempo, aprovechando muchos procesos a la vez”.
 “Dentro de las bases de datos NoSQL, probablemente una de las
más famosas sea MongoDB, como característica distintiva es una
Casos de éxito base de datos orientada a documentos, es decir guarda los datos en
documentos y no en registros como las típicas bases de datos”.
 1. Se debe dedicar un esfuerzo importante en conseguir resultados
centrados en el cliente.

 2. Desarrollar proyectos Big Data para toda la empresa.

 3. La forma más correcta de iniciar un proyecto Big Data, consiste


Recomendaciones de en plantearse objetivos a corto plazo.
Aplicación
 4. Desarrollar funcionalidades analíticas sobre las necesidades y
prioridades de negocio.

 5. Optimizar los sistemas de información del negocio.

 6. Crear un equipo especialista de data scientists.


 Entre las ventajas más importantes a mencionar, se encuentran:

• Mejora el proceso de toma de decisión.

• Seguridad en los datos.

Aplicaciones y • Obtener ventajas competitivas.


Casos reales • Mejora de la accesibilidad de la información dentro de la
empresa.

• Nuevas fuentes de ingresos


 A la hora de implementar un proyecto de Big Data tenemos que
tener en cuenta ciertas consideraciones asociadas con:

Consideraciones • La ciberseguridad y la seguridad informática.

• Políticas de protección de datos personales.

• Gestión y almacenamiento de grandes volúmenes de datos.

También podría gustarte