Está en la página 1de 9

Introducción a Big Data Analytics

Big Data y
Gestión de la
Información

Introducción a Big Data Analytics


¡Hola!

Te damos la bienvenida a esta lectura titulada: Introducción a Big Data Analytics, la cual
introducirá términos y conceptos necesarios para tu experiencia de aprendizaje en esta
sesión. Se recomienda leer con detenimiento este PDF, ya que será de vital importancia para
concluir de forma exitosa las evaluaciones de esta sesión.

¡Sigue avanzando!
Introducción a Big Data Analytics

Introducción a Big Data Analytics

En la actualidad, los datos se vienen generando de manera permanente y a una veloci-


dad creciente. La tecnología, sea a través de dispositivos móviles más potentes como
teléfonos móviles, sitios web basados en datos como redes sociales, software de reco-
nocimiento de imágenes muy avanzados para diagnósticos médicos entre otros, gene-
ran nuevos datos que, para ser aprovechados, ya sea de manera operacional o estraté-
gica, necesitan ser almacenados en algún lugar.

Por otro lado, también ahora los objetos


con los que se suelen interactuar a diario
brindan capacidades de conectividad
a la Internet y pueden recolectar datos
de uso a través de sensores, datos que
en muchos casos son enviados a plata-
formas en la nube que permiten no sola-
mente almacenarlos sino procesarlos ya
sea de manera histórica o en tiempo real.

El solo tratar de llevar el paso a este veloz avance en la generación de datos es cada vez
más complicado, sin embargo, es aún más desafiante analizar las grandes cantidades de
estos datos, cuando estos son generados en una diversidad de formatos y no solamente en
un formato estructurado en tablas, como usualmente se ha acostumbrado a manejarlos.

Esto hace que la capacidad de identificar patrones significativos y extraer información


útil de estos datos, sea un poco más complicado que de costumbre pero con la tecnolo-
gía disponible actualmente, este reto cada vez se vuelve más manejable.

Según la consultora McKinsey & Co., en su reporte: Big Data: la


próxima frontera para la innovación, la competencia y producti-
vidad, se podría definir Big Data como “datos cuya escala, distri-
bución, diversidad y/o actualidad requieren el uso de nuevas
arquitecturas técnicas y análisis para permitir conocimientos
que desbloqueen nuevas fuentes de valor empresarial”.

·2·
Introducción a Big Data Analytics

Otra definición según la empresa de tecnología Oracle, Big Data también podría defi-
nirse como: “conjuntos de datos más grandes y complejos, especialmente de nuevas
fuentes de datos. Estos conjuntos de datos son tan voluminosos que el software de
procesamiento de datos tradicional simplemente no puede administrarlos. Pero estos
enormes volúmenes de datos se pueden usar para abordar problemas comerciales que
antes no se hubieran podido abordar”.

Por ende, Big data realmente no vendría a ser una sola tecnología sino más bien una
conjunción de diversas tecnologías, que abarcan no solamente aquellas recientes
sino también incluyen algunas ya existentes y que han tomado mayor relevancia en la
actualidad.

Otra definición relevante para el concepto


de Big data es la que brinda Tim Smith en su
extraordinario video TED sobre el tema: “Es
un concepto difícil de alcanzar. Representa
una cantidad de información digital que
es incómoda de almacenar, transportar
o analizar. El big data es tan voluminoso
que abruma las tecnologías del día y nos
desafía a crear la próxima generación
de herramientas y técnicas de almace-
namiento de datos”.

Puedes ver el video en el siguiente enlace: Tim Smith: Explora-


ción en la frontera de los grandes volúmenes de datos

En conclusión, para definir correctamente el término Big Data, sería necesario tener en
cuenta diversos factores como son la capacidad de manejar de manera óptima y con una
velocidad adecuada, grandes cantidades de datos de todo tipo, naturaleza o formato.

·3·
Introducción a Big Data Analytics

De manera adicional, es imprescindible mencionar algunas características relaciona-


das a Big Data, en este caso se podría iniciar mencionando cuatro de sus principales
características:

Volumen: que se refiere a la cantidad de datos que se van a manejar.

Velocidad: que se refiere a la velocidad que se puede alcanzar para el procesa-


miento de estos datos hasta llegar el tiempo real.

Variedad: que se refiere a los distintos tipos de formatos que pueden tener los
datos que se van a procesar.

Veracidad: que se refiere a si los datos pueden ser verificados en cuanto a la pre-
cisión como al contexto.

El analista de Gartner Doug Laney introdujo las primeras tres V en el año 2001. Estas tres
primeras V son la cuantificación de las características de Big Data. La cuarta V fue intro-
ducida posteriormente.

La característica más interesante de las pri-


meras 3V es definitivamente la variedad,
esto debido a que las empresas u organiza-
ciones están generando información a par-
tir de formatos tan variados como texto no
estructurado, conversaciones de voz, datos
de geolocalización, etc.

·4·
Introducción a Big Data Analytics

Entre los datos más variados que permiten generar conocimiento valioso, se podría citar
a los datos de sensores en puertas de ingreso o ascensores que permiten determinar, y
hasta incluso predecir, el tráfico de personas en inmuebles públicos o privados, los pos-
teos de Twitter ayudan a generar información sobre el estado de ánimo de un país, que
por ejemplo sube considerablemente el día posterior a una victoria del equipo nacional
de fútbol, o incluso datos no públicos como los generados a partir de cientos o miles de
correos electrónicos generados por el equipo de un proyecto empresarial, donde a tra-
vés de un análisis de sentimiento se puede obtener el estado de ánimo de los miembros
del equipo y el nivel de estrés a medida que va transcurriendo el proyecto.

La mayoría de estos datos han venido siendo generados por las empresas u organi-
zaciones pero no han sido aprovechados para generar valor a descubrimientos a partir
de ellos. Por tal motivo Gartner los denomina datos oscuros, pues no pueden generar
mayor conocimiento con la simple observación sino a través de un análisis mucho más
detallado, pero siempre han sido parte fundamental de estas empresas u organizacio-
nes, con la diferencia de que en la actualidad pueden realmente generar valor.

Por otro lado, entre la característica de Big Data que es más raramente implementada,
e incluso comprendida, se encuentra la velocidad, pues de manera común se confunde
únicamente con lograr el procesamiento de los datos en tiempo real, lo cual no es inco-
rrecto, sin embargo también abarca aspectos como el lograr qué conjuntos de datos
que posean distintas frecuencias de actualización logren ser relacionados de manera
adecuada, de tal manera que incluso se pueda automatizar su comunicación.

·5·
Introducción a Big Data Analytics

Adicionalmente, el volumen se refiere a la cantidad de datos que entrarán en el análisis


final, esto es importante pues una manera sencilla de entender si algo podría ser consi-
derado Big Data, resulta de la aplicación del siguiente test:

Si un conjunto de datos puede ser manejado con una computadora tradicional, enton-
ces definitivamente no cumple con con la característica de volumen relacionada a Big
Data, pues es justamente la necesidad de contar con medios no tradicionales, tales
como la nube, para su procesamiento lo que caracteriza a estos conjuntos de datos que
pueden considerarse Big Data.

Finalmente, la veracidad de los datos, característica de Big Data introducida posteriormente


a las tres V iniciales, ayuda a generar un indicador para determinar cuán preciso o veraz
puede ser un conjunto de datos. De manera específica, este aspecto es sumamente impor-
tante en algunos campos de negocio más que en otros, pues no trata únicamente acerca de
la calidad de los datos en cuanto a si estos están completos y correctos, sino también con
base en cuán confiable es la fuente de la cual provienen estos datos y cómo son obtenidos,
pues es posible toparse con factores como sesgos que pueden generar datos poco confia-
bles, puesto que en este punto es que entra a tallar la frase: “basura entra, basura sale”, que
se refiere principalmente a que si la calidad de datos recibida se considera como basura, la
información será considerada de la misma manera.

Por lo expuesto anteriormente, es vital eliminar facto-


res como sesgos, anomalías o inconsistencias, dupli-
cación y volatilidad, los cuales pueden llegar a impac-
tar en la precisión del conjunto de datos.

Si bien el mencionar estas características principales


sobre Big Data permite tener una mejor visión acerca
del tema, es importante entender que no necesaria-
mente sus características se limitan a las menciona-
das, pues para citar un ejemplo:

·6·
Introducción a Big Data Analytics

Puede que el escenario implique manejar una gran cantidad de datos, es decir,
con características de volumen, pero todos en un formato altamente estructurado
que no necesariamente cumpla con el requisito de variedad, aunque sí podría
cumplirse el requisito de que estos sean analizados casi en tiempo real.

Para poder alcanzar el máximo potencial en cuanto a resultados de negocio, se debe


tratar de cumplir todas las características señaladas anteriormente, sobre todo en
cuanto al aprovechamiento de todos los datos en el formato que se reciban, es decir ya
sea datos estructurados o datos no estructurados, que determinan el requisito de varie-
dad, característico de los conjuntos de datos de Big Data.

·7·
Introducción a Big Data Analytics

Bibliografía

Cielen, D., Meysman, Arno, & Ali, M. (2016). Introducing data science: Big data, machine
learning, and more, using Python tools. USA. Manning Publications.

Dietrich, D., Heller, B., & Yang, B. (2015). Data science & big data analytics: Discovering,
analyzing, visualizing and presenting data. Editorial Springer.

Hurwitz, J. (2013). Big data for dummies. USA. Editorial For Dummies.

Marr, B. (2017). Big data in practice: How 45 successful companies used big data ana-
lytics to deliver extraordinary results. USA. Wiley.

Ohlhorst, F. (2013). Big data analytics: Turning big data into big money. USA. Editorial
Wiley.

·8·
Big Data y Gestión
de la Información
Introducción a Big Data Analytics

Introducción a Big Data Analytics

También podría gustarte