Está en la página 1de 2

En este mundo digital, todo el mundo deja un rastro.

 
Desde nuestros hábitos de viaje hasta nuestros entrenamientos y entretenimiento, el creciente
número de 
dispositivos conectados a Internet con los que interactuamos diariamente registra grandes
cantidades de datos 
sobre nosotros. 
Incluso hay un nombre para ello: Big Data. 
Ernst and Young ofrece la siguiente definición: «Big Data se refiere a los 
volúmenes dinámicos, grandes y dispares de datos que crean las personas, las herramientas y las
máquinas. 
Requiere tecnología nueva, innovadora y escalable para recopilar, alojar y 
procesar analíticamente la gran cantidad de datos recopilados con el fin de obtener información
empresarial en tiempo real 
relacionada con los consumidores, el riesgo, las ganancias, el rendimiento, la gestión de la
productividad y el 
valor de los accionistas mejorado». 
No existe una definición única de Big Data, pero hay ciertos elementos que son comunes 
en las diferentes definiciones, como velocidad, volumen, variedad, veracidad y valor. 
Estos son los V de Big Data. 
Velocidad es la velocidad a la que se acumulan los datos. 
Los datos se generan de forma extremadamente rápida, en un proceso que nunca se detiene. Las 
tecnologías locales y basadas en la nube, en streaming casi o en tiempo real pueden procesar la
información 
con mucha rapidez. 
Volumen es la escala de los datos, o el aumento en la cantidad de datos almacenados. 
Los impulsores del volumen son el aumento de las fuentes de datos, los sensores de mayor
resolución y la 
infraestructura escalable. 
La variedad es la diversidad de los datos. 
Los datos estructurados encajan perfectamente en filas y columnas, en bases de datos relacionales,
mientras que 
los datos no estructurados no están organizados de manera predefinida, como Tweets,
publicaciones de blog, imágenes, números 
y vídeo. 
Variety también refleja que los datos provienen de diferentes fuentes, máquinas, personas y
procesos, 
tanto internos como externos a las organizaciones. 
Los controladores son las tecnologías móviles, las redes sociales, las tecnologías portátiles, las
tecnologías geográficas, el vídeo 
y muchos, muchos más. La 
veracidad es la calidad y el origen de los datos, y su conformidad con los hechos y la exactitud. 
Los atributos incluyen consistencia, integridad, integridad y ambigüedad. 
Los conductores incluyen el costo y la necesidad de trazabilidad. 
Con la gran cantidad de datos disponibles, el debate se extiende sobre la exactitud de los datos 
en la era digital. 
¿ Es la información real, o es falsa? 
El valor es nuestra capacidad y necesidad de convertir los datos en valor. 
El valor no es solo beneficio. 
Puede tener beneficios médicos o sociales, así como satisfacción del cliente, empleado o personal. 
La razón principal por la que las personas invierten tiempo para entender Big Data es obtener valor
de 
él. 
Veamos algunos ejemplos de los V en acción. 
Velocidad: Cada 60 segundos, horas de metraje se suben a YouTube que está generando 
datos. 
Piense en la rapidez con que los datos se acumulan a lo largo de horas, días y años. 
Volumen: La población mundial es de aproximadamente siete mil millones de personas y la gran
mayoría 
utiliza ahora dispositivos digitales; teléfonos móviles, computadoras de escritorio 
y portátiles, dispositivos portátiles, etc. 
Todos estos dispositivos generan, capturan y almacenan datos, aproximadamente 2,5 quintillion de
bytes 
al día. 
Ese es el equivalente a 10 millones de DVD Blu-ray. 
Variedad: Pensemos en los diferentes tipos de datos; texto, imágenes, películas, sonido, 
datos de salud de dispositivos portátiles, y muchos tipos diferentes de datos de dispositivos
conectados a la 
Internet de las Cosas. 
Veracidad: el 80% de los datos se considera no estructurados y debemos idear formas de producir 
información fiable y precisa. 
Los datos deben categorizarse, analizarse y visualizarse. 
Los científicos de datos hoy obtienen conocimientos de Big Data y hacen frente a los desafíos que 
presentan estos conjuntos de datos masivos. 
La escala de los datos que se recopilan significa que no es factible utilizar 
herramientas convencionales de análisis de datos. 
Sin embargo, las herramientas alternativas que aprovechan la potencia informática distribuida
pueden superar este problema. 
Herramientas como Apache Spark, Hadoop y su ecosistema proporcionan formas de extraer,
cargar, analizar 
y procesar los datos a través de recursos informáticos distribuidos, proporcionando nuevos
conocimientos y conocimientos. 
Esto proporciona a las organizaciones más formas de conectarse con sus clientes y enriquecer los
servicios 
que ofrecen. 
Así que la próxima vez que pongas el reloj inteligente, 
desbloquees tu smartphone o realizas un seguimiento de tu entrenamiento, recuerda que tus datos
están comenzando un viaje que podría llevarlo por todo el mundo, 
a través del análisis de big data, y de vuelta a ti.

También podría gustarte