Documentos de Académico
Documentos de Profesional
Documentos de Cultura
PROFESOR:
TEMA:
“Big Data”
INTEGRANTES:
CICLO:
2018-1
Índice
1. Introducción....................................................................................................................... 3
2. Antecedentes..................................................................................................................... 4
3. Objetivos............................................................................................................................. 6
3.1 Objetivo General ....................................................................................................... 6
3.2 Objetivos Específicos ............................................................................................. 6
4. Alcance ............................................................................................................................... 6
5. Contenido ........................................................................................................................... 7
5.1 Big data ....................................................................................................................... 7
5.2 Tipo de datos ............................................................................................................. 8
5.3 Las 7 “V” de Big Data ............................................................................................ 10
5.4 Big data y la nube................................................................................................... 14
5.5 Seguridad en Big Data .......................................................................................... 17
5.6 Herramientas de Big Data .................................................................................... 17
6. Conclusiones................................................................................................................... 20
7. Recomendaciones.......................................................................................................... 20
8. Bibliografía ....................................................................................................................... 21
2
1. Introducción
3
Es importante entender que las bases de datos convencionales son una
parte importante y relevante para una solución analítica. De hecho, se vuelve
mucho más vital cuando se usa en conjunto con la plataforma de Big Data.
Pensemos en nuestras manos izquierda y derecha, cada una ofrece
fortalezas individuales para cada tarea en específico. Por ejemplo, un
beisbolista sabe que una de sus manos es mejor para lanzar la pelota y la
otra para atraparla; puede ser que cada mano intente hacer la actividad de
la otra, sin embargo, el resultado no será el óptimo.
2. Antecedentes
4
48 AC Los romanos invaden Alejandría y accidentalmente
destruyen su famosa biblioteca.
1663 John Graunt realiza el primer experimento de análisis de
datos estadísticos conocido.
1792 Se asocia el término a la colección y clasificación de datos.
1865 Aparece por primera vez el término business intelligence,
en la enciclopedia comercial de Richard Millar Devens.
1880 Herman Hollerith, empleado del censo estadounidense,
desarrolla su máquina tabuladora.
1926 Nikola Tesla predice la tecnología inalámbrica. El planeta
es un gran cerebro en el que todo está conectado.
1928 El ingeniero alemán Fritz Pfleumer patenta el primer
sistema magnético para almacenar datos.
1944 Primer intento de conocer la cantidad de información que
se crea.
1958 Hans Peter luhn, define la inteligencia del negocio.
1962 Supone el primer paso en el reconocimiento de voz, capas
de registrar palabras en inglés en formato digital.
1965 Se proyecta el primer data center en Estados Unidos
1970 IBM desarrolla el modelo relacional de base de datos
1976 Uso del MRP (software de gestión de materiales),
antecedentes de los ERP actuales
1989 Erik Larson habla por primera vez de Big Data en el sentido
que conocemos la expresión hoy en día
1991 Nace internet, a la postre, la gran revolución de la
recolección, almacenamiento y análisis de datos
1993 Se funda QlikTech, en la actualidad Qlik, que crea un
sistema revolucionario de business intelligence
1996 Los precios de los almacenamientos de datos empiezan a
ser accesibles lo que es una gran revolución en la historia
del Big Data
1997 Google lanza su sistema de búsqueda en internet, lo cual
dentro de años será el primer lugar de búsqueda en internet
1999 El término Big Data es analizado por primera vez en un
estudio académico
2001 Doug Laney, define las 3 V´s del Big Data (volumen,
velocidad y variedad)
2005 Se crea Hadoop, un entorno de trabajo Big Data de
software libre
2007 La revista Wired publica un artículo que lleva el concepto
de Big Data a las masas
2010 Los datos que se generan en 2 días equivalen a la cantidad
de datos generados desde el inicio de la civilización hasta
2003 (según google)
2013 El archivo de mensajes públicos de Twiter llega a 170
billones de mensajes, creciendo a ritmo de 500 millones al
día
2014 La conexión casi continua contribuye a generar muchos
más datos y mejora la conectividad con otros dispositivos
5
2016 El Big Data se convierte en la palabra de moda
2017 Los datos llegan a las masas
Futuro La computación cuántica está a la vuelta de la esquina y la
historia del Big Data sigue avanzando
3. Objetivos
4. Alcance
6
5. Contenido
Lo que hace que Big Data sea tan útil para muchas empresas es el hecho
de que proporciona respuestas a muchas preguntas que las empresas
ni siquiera sabían que tenían. En otras palabras, proporciona un punto
de referencia. Con una cantidad tan grande de información, los datos
pueden ser moldeados o probados de cualquier manera que la empresa
7
considere adecuada. Al hacerlo, las organizaciones son capaces de
identificar los problemas de una forma más comprensible.
8
b) Tipos de datos por categorías
Estructurados:
o Creados: datos generados por nuestros sistemas de una manera
predefinida (registros en tablas, ficheros XML asociados a un
esquema)
o Provocados: datos creados de manera indirecta a partir de una
acción previa (valoraciones de restaurantes, películas, empresas
(Yelp, TripAdvisor, …)
o Dirigido por transacciones: datos que resultan al finalizar una
acción previa de manera correcta (facturas autogeneradas al
realizar una compra, recibo de un cajero automático al realizar una
retirada de efectivo, …)
o Compilados: resúmenes de datos de empresa, servicios públicos
de interés grupal. Entre ellos nos encontramos con el censo
electoral, vehículos matriculados, viviendas públicas, …)
o Experimentales: datos generados como parte de pruebas o
simulaciones que permitirán validar si existe una oportunidad de
negocio.
9
No estructurados:
o Capturados: datos creados a partir del comportamiento de un
usuario (información biométrica de pulseras de movimiento,
aplicaciones de seguimiento de actividades (carrera, ciclismo,
natación, …), posición GPS)
o Generados por usuarios: datos que especifica un usuario
(publicaciones en redes sociales, vídeos reproducidos en
Youtube, búsquedas en Google, …)
Multi-estructurados o híbridos:
o Datos de mercados emergentes
o E-commerce
o Datos meteorológicos
a) Volumen de información
10
Cada vez estamos más conectados al mundo 2.0 por lo que generamos
más y más datos. Para algunas empresas, el estar en el mundo digital
es algo obligatorio, por lo que la cantidad de datos generados es aún
mayor. Por ejemplo, una empresa que vende sus productos únicamente
a través de un canal online, le convendría implantar tecnología Big Data
para procesar toda aquella información que recoge su página web
rastreando todas las acciones que lleva a cabo el cliente; conocer donde
cliquea más veces, cuántas veces ha pasado por el carrito de la compra,
cuáles son los productos más vistos, las páginas más visitadas, etc.
Para los procesos en los que el tiempo resulta fundamental, tales como
la detección de fraude en una transacción bancaria o la monitorización
de un evento en redes sociales, estos tipos de datos deben estudiarse
en tiempo real para que resulten útiles para el negocio y se consigan
conclusiones efectivas.
11
Estos últimos datos requieren de una herramienta específica, debido a
que el tratamiento de la información es totalmente diferente con respecto
a los datos estructurados. Para ello, las empresas necesitan integrar,
observar y procesar datos que son recogidos a través de múltiples
fuentes de información con herramientas cualificadas.
e) Viabilidad
12
resultados que más interesan a las empresas. El secreto del éxito es
descubrir las relaciones entre las variables ocultas.
13
5.4 Big data y la nube
14
SaaS.- Software como servicio son servicios en cloud en el que se
puede acceder a aplicaciones de software a través de internet.
modalidad es la de software como servicio Cloud, que te proporciona un
entorno para trabajar directamente con Big Data. Podemos hacer el
procesamiento y análisis de los datos de una manera transparente en
cuanto a detalles de infraestructura.
15
los que trabajamos, siendo necesario mantener la confidencialidad, la
privacidad y la integridad de los datos.
16
5.5 Seguridad en Big Data
17
Base de datos NoSQL.- Las bases de datos
NoSQL (MongoDB, Cassandra, Elasticsearch, Cloudant,
Neo4j, Redis…) no requieren estructuras fijas y se clasifican
según su forma de almacenar los datos en bases de datos
documentales, columnares o de grafos. Las bases de datos
NoSQL se caracterizan por ser mucho más heterogéneas. Son
todas aquellas que no siguen el estándar SQL y, por tanto, no
cumplen alguna de las propiedades ACID. Son más flexibles a
la hora de guardar datos de índole diversa o de almacenar
datos masivos que deben compartirse entre varias máquinas.
A cambio no garantizan que los datos siempre estén
disponibles en su versión más actualizada, y suelen estar
limitadas a consultas más simples que las que pueden hacerse
sobre bases de datos SQL.
18
Pero para aplicar técnicas Big Data al negocio dé como fruto los mejores
resultados posibles, además de una gran capacidad de computación
debemos saber combinar la capacidad de almacenamiento y la de
procesamiento con la de análisis. Hay 3 niveles de analítica de datos
distintos:
19
técnico. La mayoría cuenta con versiones de pago y versiones
gratuitas y ofrece gráficos optimizados para su uso en redes sociales.
Entre las más populares estarían Tableau, Weave, Datawrappper,
Gephi, Infogram, Many Eyes, Piktochart, NodeXL, Chartblocks, d3,
Thinglink, Axiis, QuickView y Google Fusion Tables.
6. Conclusiones
7. Recomendaciones
20
Machine-to-Machine (M2M): M2M se refiere a las tecnologías que
permiten conectarse a otros dispositivos. M2M utiliza dispositivos
como sensores o medidores que capturan algún evento en particular
(velocidad, temperatura, presión, variables meteorológicas, variables
químicas como la salinidad, etc.) los cuales transmiten a través de
redes alámbricas, inalámbricas o híbridas a otras aplicaciones que
traducen estos eventos en información significativa.
Big Transaction Data: Incluye registros de facturación, en
telecomunicaciones registros detallados de las llamadas (Call Detail
Records - CDR), etc. Estos datos transaccionales están disponibles
en formatos tanto semiestructurados como no estructurados.
Human Generated: Las personas generamos diversas cantidades de
datos como la información que guarda un call center al establecer una
llamada telefónica, notas de voz, correos electrónicos, documentos
electrónicos, estudios médicos, etc.
8. Bibliografía
Historia del Big Data: un largo viaje poco conocido. – Grupo IGN (02 may
2017), Artículo Web
https://ignsl.es/historia-del-big-data/
Análisis de las posibilidades de uso de Big Data en las organizaciones
(2013), Artículo Web
https://repositorio.unican.es/xmlui/bitstream/handle/10902/4528/TFM%2
0-%20David%20L%C3%B3pez%20Garc%C3%ADaS.pdf?sequence=1
Las 7 V del Big data: Características más importantes (2016), Articulo
Web
http://www.iic.uam.es/innovacion/big-data-caracteristicas-mas-
importantes-7-v/
https://www.bit.es/knowledge-center/tipos-de-datos-en-big-data/
http://www.iic.uam.es/innovacion/seguridad-big-data/
21
El Big Data y la nube: los servicios Cloud (2016), Articulo Web
http://www.iic.uam.es/innovacion/big-data-la-nube-servicios-cloud/
22