Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1 © SUMMA Universit y
Big Data
Índice
1 Introducción ............................................................................................................................................................ 3
2 ¿Qué es BIG DATA? Las 4 V’s ....................................................................................................................... 4
3 Tipo de Datos de BIG DATA ......................................................................................................................... 6
4 ¿Quién Utiliza BIG DATA y que Conexiones Tiene con los Sistemas Informáticos? ... 8
5 Big Data y la Cadena de Suministro ........................................................................................................ 9
6 Ejemplo Aplicado a la Logística ................................................................................................................ 11
7 Conclusiones ........................................................................................................................................................ 11
8 Referencias Bibliográficas ............................................................................................................................ 12
02 SUMMA University®
Not a Técnica preparada por SUMMA Universit y. Su dif usión, reproducción o uso t ot al o parcial
para cual quier ot ro propósit o queda prohibida. Todos l os derechos reservados.
Big Data
Objetivos
Objetivo 1: Entender el concepto de Big Data
1 Introducción
Con el uso intensivo de internet, la proliferación del uso de los sistemas de información y
redes sociales se considera que en los últimos 10 años se ha generado más información
que en toda la historia de la humanidad. Esto ha implicado que la capacidad tecnológica de
almacenamiento de datos se haya duplicado cada 40 meses desde los años 80,
evidenciándose un crecimiento exponencial en el manejo de información.
Con esta cantidad ingente de datos y la posibilidad de explotarlos, la dificultad surge para
encontrarlos, almacenarlos, analizarlos y poder extraer reportes y conclusiones de estos.
La cadena de suministro de una empresa genera ingente información, y no toda ella está
gestionada por los sistemas de información de la empresa. Así, por ejemplo, los algoritmos
de previsión de la demanda usan un histórico para hacer las previsiones, sin embargo, esto
no incluye las acciones de marketing para estimular la demanda y mucho menos los
resultados que están teniendo. Sin embargo, sería posible conocer la existencia de estas
campañas y también los datos sobre el resultado que están teniendo… tal vez en “tweeter”
escuchando a los consumidores sobre su impresión del producto o si ven problemas de
abastecimiento.
03 SUMMA University®
Not a Técnica preparada por SUMMA Universit y. Su dif usión, reproducción o uso t ot al o parcial
para cual quier ot ro propósit o queda prohibida. Todos l os derechos reservados.
Big Data
BIG DATA es por tanto un concepto y no una herramienta. Es la realidad de que existe
inmensa información y que es posible gestionarla, pero no con las herramientas
tradicionales:
La información se está generando (y creciendo de forma exponencial) desde cada vez más
fuentes y más dispositivos. Gran parte de la información que se genera no está estructurada,
ya que se genera en foros, social media, páginas de internet… La información por tanto no
está almacenada en “tablas” de bases de datos que serían fáciles de gestionar, sino que son
datos aislados con fotos, comentarios, textos, tablas de datos… en un formato propio cada
uno de ellos.
Con esta realidad, y con la gran velocidad con la que se genera la información, no es
posible tratarla con las herramientas tradicionales (bases de datos).
Se plantea por tanto el reto para las organizaciones de utilizar esta ingente masa de
información que es accesible para mejorar los procesos de valor internos, es decir, “trabajar
en BIG DATA” con enfoques a tecnologías nuevas e innovadoras para extraer esa
pequeñísima parte de la información que existe y que es útil a la compañía.
04 SUMMA University®
Not a Técnica preparada por SUMMA Universit y. Su dif usión, reproducción o uso t ot al o parcial
para cual quier ot ro propósit o queda prohibida. Todos l os derechos reservados.
Big Data
Los sistemas que trabajan BIG DATA lo que pretenden es solucionar problemas que con
sistemas tradicionales no podríamos. Y esto no es posible debido a lo que conocemos
como las 4 V’s:
Volumen Veracidad
Velocida Variedad
d
1ª V: Volumen
2ª V: Velocidad
3ª V: Variedad.
Hoy en día el tipo de los datos para tratar que nos encontramos es muy variado.
Tenemos datos geoespaciales, datos en tres dimensiones, audio, video, texto
desestructurado, datos que vienen de redes sociales de interacciones de usuarios…
05 SUMMA University®
Not a Técnica preparada por SUMMA Universit y. Su dif usión, reproducción o uso t ot al o parcial
para cual quier ot ro propósit o queda prohibida. Todos l os derechos reservados.
Big Data
4ª V: Veracidad
Los datos que se traten en un proyecto BIG DATA deben resultar significativos y
directamente relacionados con el tema que quieren tratar. Los datos deben por tanto
responder a la pregunta: ¿Son datos correctos y precisos para el uso previsto? Es
importante tener en cuenta la volatilidad de los datos. Se refiere el tiempo en que los
datos guardados son válidos y el tiempo que deben permanecer almacenados.
Hablaríamos como objetivo final de un proyecto BIG DATA de una 5ª V, el Valor: del gran
volumen de datos del que hemos partido, que se han generado con una velocidad enorme
y con una variedad de formatos muy grande, que además hemos sido capaces de extraer
los datos que nos han resultado relevantes y hemos sido capaces de mantener una
depuración de los mismos solucionando la volatilidad de estos, no sirve si no conseguimos
el objetivo de extraer VALOR del ellos. El dato en sí mismo no es valor:
“El valor se obtiene de datos que se transforman en información; ésta a su vez se transforma
en conocimiento y este en acción o decisión”
Existe una gran variedad de tipos de datos a analizar, como ya hemos visto en el punto
anterior en la definición de la 3ª V: Variedad.
Datos generados por las personas: En esta categoría entrarían los datos enviados a redes
sociales (Twitter, Facebook, Linkedin, Instagram…) así como la información de clicks sobre
vínculos y elementos de Internet, búsquedas (Google, etc) y datos escritos en páginas web
(páginas imágenes enlaces…).
Lecturas RFID
Sensores de temperatura, luz, altura, presión, sonido…
Posicionamiento GPS
Etc.
06 SUMMA University®
Not a Técnica preparada por SUMMA Universit y. Su dif usión, reproducción o uso t ot al o parcial
para cual quier ot ro propósit o queda prohibida. Todos l os derechos reservados.
Big Data
Biométrica: Son datos generados por lectores biométricos como escáneres de retina,
huellas digitales o lectores de cadenas ADN. Estos datos están custodiados por los
ministerios de defensa y departamentos de inteligencia y el propósito es proporcionar
mecanismos de seguridad
Fuente: http://www.bit.es/knowledge-center/tipos-de-datos-en-big-data/
Datos estructurados: Datos con formato definido que se almacenan en tablas. Son
datos estructurados las fechas, los números o cadenas de caracteres.
07 SUMMA University®
Not a Técnica preparada por SUMMA Universit y. Su dif usión, reproducción o uso t ot al o parcial
para cual quier ot ro propósit o queda prohibida. Todos l os derechos reservados.
Big Data
Fuente: http://www.bit.es/knowledge-center/tipos-de-datos-en-big-data/
En las empresas que utilizan BIG DATA existe una coexistencia de bases de datos
tradicionales y estrategias de utilización de datos en el concepto BIG DATA que hemos
definido. La estrategia de implementación pasa por el “cloud”, pero también lo la integración
de datos de los sistemas informáticos con los que está integrada la empresa.
La estructura es por tanto la de una coexistencia entre BIG DATA y Bases de Datos
Tradicionales:
08 SUMMA University®
Not a Técnica preparada por SUMMA Universit y. Su dif usión, reproducción o uso t ot al o parcial
para cual quier ot ro propósit o queda prohibida. Todos l os derechos reservados.
Big Data
Fuente: http://www.germanbacca.com/wp-content/uploads/2013/11/rra81.jpg
En este caso Hadoop es una plataforma de código abierto que se utiliza para almacenar,
procesar y analizar grandes volúmenes de datos.
Hemos comentado que BIG DATA es adecuada en la gestión de datos masivos, por
ejemplo, con origen de interacciones de clientes, para la toma de decisiones de la empresa.
Es cierto también que se puede usar en áreas de análisis más tradicionales (política de
precios, cadena de suministro, …); en este caso BIG DATA aporta los datos externos precisos
para mejorar el análisis con datos también con origen los sistemas de información de la
empresa.
La cadena de suministro de una empresa está gestionada por sistemas de información que
generan un volumen importante de información. Normalmente estos sistemas de
información tienen un alto grado de interconexión compartiendo información. Sin embargo,
existe un volumen ingente de datos que se generan en la cadena que permitirían una mejor
gestión de la misma y, por tanto, situarían a la compañía que los explote en clara ventaja
competitiva.
En la actualidad esta capacidad latente de las empresas está todavía por explotar, pero es
evidente que la utilización de BIG DATA va a reinventar el modelo de cadena de suministro.
09 SUMMA University®
Not a Técnica preparada por SUMMA Universit y. Su dif usión, reproducción o uso t ot al o parcial
para cual quier ot ro propósit o queda prohibida. Todos l os derechos reservados.
Big Data
Etc.
Hoy en día BIG DATA se puede considerar sólo una “tendencia” en la gestión de la cadena
de suministro de una empresa, sin embargo, aún hay un gran número de organizaciones
que gestionan su cadena no de forma agregada, y no utilizan la gran cantidad de datos que
existen en los diversos eslabones que afectan sin duda al resto de eslabones.
La utilización de BIG DATA cambia por tanto la gestión de la cadena hacia un modelo
predictivo, que optimiza las redes, mejora la agilidad y la capacidad de respuesta, por tanto,
tiene un enfoque a la mejora de servicio y reducción del coste de las operaciones en la
cadena de suministro.
AMAZON basándose en el histórico de compras de cada uno de sus clientes, así como
compras realizadas por usuarios de perfil similar, les hacen propuestas de productos
que les podrían interesar. En este proceso, AMAZON conoce el impacto de estas
campañas y hace una “predicción” de los hábitos de consumo de una determinada área
y realizaría envíos de producto a los centros de distribución de su red antes de que el
cliente lo compre. El resultado es que cuando el producto es comprado, sólo tardaría
unas pocas horas en ser servido, mejorando la experiencia de compra del cliente.
7 Conclusiones
Hay una tendencia en las compañías punteras de utilización de BIG DATA, entendido
este concepto como la ingente cantidad de datos que se generan en muy diversas
fuentes (internet de las cosas) y que es posible que, con un proceso adecuado de
análisis y selección de datos, esta información seleccionada aporte valor y sitúe a la
organización en una posición de ventaja competitiva.
8 Referencias Bibliográficas
http://thinking.netezza.com/blog/big-data-data-velocity-discussion
https://www.ibm.com/developerworks/ssa/local/im/que-es-big-data/