Está en la página 1de 2

El Biga Data

Podemos decir que son conjuntos de datos de gran tamaño, complejidad y velocidad
de crecimiento, que hacen difícil su captura, gestión y procesamiento a través de
herramientas convencionales, como pueden ser las bases de datos relacionales.

Las cinco Vs del Big Data


 Volumen: Una de las características del Big Data es que nuevos datos se
generan constantemente. Además, como las fuentes son diversas, el
volumen de datos tiende a ser inmenso.
 Velocidad: No sólo se generan muchos datos y desde muchas fuentes, sino
que lo normal es que la velocidad a la que se generan estos datos sea muy
alta. Esto provoca un flujo de datos muy difícil de gestionar con software
tradicional.
 Variedad: Si en alguna ocasión has trabajado con una base de datos sabrás
que, en su mayoría, los datos que contiene son texto y números, a menudo
relacionados entre sí en una base de datos relacional.
En el caso del Big Data los datos son más variados, no se trabaja solo con
textos y números.
 Veracidad: El Big Data debe alimentarse con datos relevantes y verdaderos.
No podremos realizar analíticas útiles si muchos de los datos entrantes
provienen de fuentes falsas o con errores en su información.
 Valor: El valor de los datos a gran escala está unido a la ventaja que
podamos obtener de los datos, además del propio valor que los datos
poseen.
Sin embargo, el verdadero valor del Big Data se encuentra en la conversión
de los datos a información práctica a través de la analítica o del Big Data
analytics.

Así, si se usa adecuadamente esta tecnología, las empresas podrían:

 Optimizar procesos
 Conocer mejor a sus clientes
 Ofrecerles publicidad asociada a sus gustos.

En definitiva, mejora la competitividad.

Tipos de datos
 Datos estructurados: Son los datos que forman parte de una
estructura predefinida. Como ejemplos encontramos una hoja de
Excel o una base de datos SQL. Estos datos son fácilmente
catalogables, y pueden ser utilizados para posteriores análisis y
predicciones fiables.
 Datos no estructurados: Son aquellos datos que no tienen ni
forman parte de una estructura definida. Como ejemplos
encontramos el cuerpo de un email, una conversación por Skype,
datos escritos en un fichero Word, o incluso bases de datos
NoSQL. Estos datos contienen mucha información valiosa, pero al
no estar bien estructurada y catalogada, su uso resulta complicado
a la hora de crear informes y realizar análisis.
Procesado de los datos
Como ya se ha comentado previamente, el objetivo del Big Data es unificar el
almacenamiento y procesado de diferentes fuentes de datos con el objetivo de
realizar diversos análisis de datos con toda la información de la empresa.
Para un correcto procesado de los datos se debe pasar por 3 fases conocidas como:
Extracción (Esta fase consiste en la centralización de las capturas de datos
provenientes de diversas fuentes.),
Transformación: Esta fase trata de estandarizar los diferentes conjuntos de datos
con el objetivo de que a la salida tengan una estructura similar. Esta es una etapa
compleja que requerirá de código a medida en función de nuestros datos.

Load o Carga: El “Load” o “Carga” consiste en el almacenamiento de los datos en


un almacén de datos (Data Warehouse), para su posterior análisis.

como conclusión del Big Data no es una tecnología y una técnica del futuro, sino
que ya está aquí y ha venido para quedarse, puesto que hay diferentes empresas
que ya se han comenzado a beneficiar del análisis de la información que aportan
estas grandes cantidades de datos. Sin embargo, también es cierto que aún le
queda camino por andar para alcanzar un mayor potencial, algo de lo que
seremos testigos ahora que llegan el 5G y el Internet de las cosas.

PRESENTADO POR: LEYDI JOHANA BERRIO VELEZ – INGENIERIA


INFORMATICA

También podría gustarte