Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Big Data y
Gestión de la
Información
Te damos la bienvenida a esta lectura titulada: Introducción a Big Data Analytics, la cual
introducirá términos y conceptos necesarios para tu experiencia de aprendizaje en esta
sesión. Se recomienda leer con detenimiento este PDF, ya que será de vital importancia para
concluir de forma exitosa las evaluaciones de esta sesión.
¡Sigue avanzando!
Introducción a Big Data Analytics
El solo tratar de llevar el paso a este veloz avance en la generación de datos es cada vez
más complicado, sin embargo, es aún más desafiante analizar las grandes cantidades de
estos datos, cuando estos son generados en una diversidad de formatos y no solamente en
un formato estructurado en tablas, como usualmente se ha acostumbrado a manejarlos.
·2·
Introducción a Big Data Analytics
Otra definición según la empresa de tecnología Oracle, Big Data también podría defi-
nirse como: “conjuntos de datos más grandes y complejos, especialmente de nuevas
fuentes de datos. Estos conjuntos de datos son tan voluminosos que el software de
procesamiento de datos tradicional simplemente no puede administrarlos. Pero estos
enormes volúmenes de datos se pueden usar para abordar problemas comerciales que
antes no se hubieran podido abordar”.
Por ende, Big data realmente no vendría a ser una sola tecnología sino más bien una
conjunción de diversas tecnologías, que abarcan no solamente aquellas recientes
sino también incluyen algunas ya existentes y que han tomado mayor relevancia en la
actualidad.
En conclusión, para definir correctamente el término Big Data, sería necesario tener en
cuenta diversos factores como son la capacidad de manejar de manera óptima y con una
velocidad adecuada, grandes cantidades de datos de todo tipo, naturaleza o formato.
·3·
Introducción a Big Data Analytics
Variedad: que se refiere a los distintos tipos de formatos que pueden tener los
datos que se van a procesar.
Veracidad: que se refiere a si los datos pueden ser verificados en cuanto a la pre-
cisión como al contexto.
El analista de Gartner Doug Laney introdujo las primeras tres V en el año 2001. Estas tres
primeras V son la cuantificación de las características de Big Data. La cuarta V fue intro-
ducida posteriormente.
·4·
Introducción a Big Data Analytics
Entre los datos más variados que permiten generar conocimiento valioso, se podría citar
a los datos de sensores en puertas de ingreso o ascensores que permiten determinar, y
hasta incluso predecir, el tráfico de personas en inmuebles públicos o privados, los pos-
teos de Twitter ayudan a generar información sobre el estado de ánimo de un país, que
por ejemplo sube considerablemente el día posterior a una victoria del equipo nacional
de fútbol, o incluso datos no públicos como los generados a partir de cientos o miles de
correos electrónicos generados por el equipo de un proyecto empresarial, donde a tra-
vés de un análisis de sentimiento se puede obtener el estado de ánimo de los miembros
del equipo y el nivel de estrés a medida que va transcurriendo el proyecto.
La mayoría de estos datos han venido siendo generados por las empresas u organi-
zaciones pero no han sido aprovechados para generar valor a descubrimientos a partir
de ellos. Por tal motivo Gartner los denomina datos oscuros, pues no pueden generar
mayor conocimiento con la simple observación sino a través de un análisis mucho más
detallado, pero siempre han sido parte fundamental de estas empresas u organizacio-
nes, con la diferencia de que en la actualidad pueden realmente generar valor.
Por otro lado, entre la característica de Big Data que es más raramente implementada,
e incluso comprendida, se encuentra la velocidad, pues de manera común se confunde
únicamente con lograr el procesamiento de los datos en tiempo real, lo cual no es inco-
rrecto, sin embargo también abarca aspectos como el lograr qué conjuntos de datos
que posean distintas frecuencias de actualización logren ser relacionados de manera
adecuada, de tal manera que incluso se pueda automatizar su comunicación.
·5·
Introducción a Big Data Analytics
Si un conjunto de datos puede ser manejado con una computadora tradicional, enton-
ces definitivamente no cumple con con la característica de volumen relacionada a Big
Data, pues es justamente la necesidad de contar con medios no tradicionales, tales
como la nube, para su procesamiento lo que caracteriza a estos conjuntos de datos que
pueden considerarse Big Data.
·6·
Introducción a Big Data Analytics
Puede que el escenario implique manejar una gran cantidad de datos, es decir,
con características de volumen, pero todos en un formato altamente estructurado
que no necesariamente cumpla con el requisito de variedad, aunque sí podría
cumplirse el requisito de que estos sean analizados casi en tiempo real.
·7·
Introducción a Big Data Analytics
Bibliografía
Cielen, D., Meysman, Arno, & Ali, M. (2016). Introducing data science: Big data, machine
learning, and more, using Python tools. USA. Manning Publications.
Dietrich, D., Heller, B., & Yang, B. (2015). Data science & big data analytics: Discovering,
analyzing, visualizing and presenting data. Editorial Springer.
Hurwitz, J. (2013). Big data for dummies. USA. Editorial For Dummies.
Marr, B. (2017). Big data in practice: How 45 successful companies used big data ana-
lytics to deliver extraordinary results. USA. Wiley.
Ohlhorst, F. (2013). Big data analytics: Turning big data into big money. USA. Editorial
Wiley.
·8·
Big Data y Gestión
de la Información
Introducción a Big Data Analytics