Está en la página 1de 5

Big Data

Los seres humanos estamos creando y almacenando informacin constantemente


y cada vez ms en cantidades astronmicas. Se podra decir que, si todos los bits
y bytes de datos del ltimo ao fueran guardados en CD's, se generara una gran
torre desde la Tierra hasta la Luna y de regreso.

Esta contribucin a la acumulacin masiva de datos la podemos encontrar en


diversas industrias, las compaas mantienen grandes cantidades de datos
transaccionales, reuniendo informacin acerca de sus clientes, proveedores,
operaciones, etc., de la misma manera sucede con el sector pblico.

Big Data es un trmino que describe el gran volumen de datos, tanto estructurados
como no estructurados, que inundan los negocios cada da. Pero no es la cantidad
de datos lo que es importante. Lo que importa con el Big Data es lo que las
organizaciones hacen con los datos. Big Data se puede analizar para obtener
ideas que conduzcan a mejores decisiones y movimientos de negocios estratgicos.

Qu es Big Data?

Cuando hablamos de Big Data nos referimos a conjuntos de datos o combinaciones


de conjuntos de datos cuyo tamao (volumen), complejidad (variabilidad) y
velocidad de crecimiento (velocidad) dificultan su captura, gestin, procesamiento o
anlisis mediante tecnologas y herramientas convencionales, tales como bases de
datos relacionales y estadsticas convencionales o paquetes de visualizacin,
dentro del tiempo necesario para que sean tiles.

Aunque el tamao utilizado para determinar si un conjunto de datos determinado se


considera Big Data no est firmemente definido y sigue cambiando con el tiempo, la
mayora de los analistas y profesionales actualmente se refieren a conjuntos de
datos que van desde 30-50 Terabytes a varios Petabytes.

Objetivo del Big Data

Extraer informacin de valor de los datos, de forma que pueda ser de ayuda para
las decisiones y procesos de negocio.

Cmo funciona?

El anlisis de soluciones de big data se fundamenta en tcnicas matemticas,


generalmente basadas en la estadstica, y que provienen de campos diversos como
la minera de datos, el aprendizaje automtico, el anlisis de series temporales o la
investigacin operacional.

Mediante estas tcnicas pueden explotarse datos de cualquier naturaleza: bases de


datos, registros numricos, texto libre, actividad en una red social, audios,
imgenes, vdeos Mediante los tratamientos adecuados, cualquier tipo de datos
es susceptible de ser analizado.

Por qu el Big Data es tan importante?

Lo que hace que Big Data sea tan til para muchas empresas es el hecho de que
proporciona respuestas a muchas preguntas que las empresas ni siquiera saban
que tenan. En otras palabras, proporciona un punto de referencia.

La recopilacin de grandes cantidades de datos y la bsqueda de tendencias dentro


de los datos permiten que las empresas se muevan mucho ms rpidamente, sin
problemas y de manera eficiente. Tambin les permite eliminar las reas
problemticas antes de que los problemas acaben con sus beneficios o su
reputacin.

El anlisis de Big Data ayuda a las organizaciones a aprovechar sus datos y


utilizarlos para identificar nuevas oportunidades. Eso, a su vez, conduce a
movimientos de negocios ms inteligentes, operaciones ms eficientes, mayores
ganancias y clientes ms felices. Las empresas con ms xito con Big Data
consiguen valor de las siguientes formas:

Reduccin de coste. Las grandes tecnologas de datos, como Hadoop y el


anlisis basado en la nube, aportan importantes ventajas en trminos de costes
cuando se trata de almacenar grandes cantidades de datos, adems de identificar
maneras ms eficientes de hacer negocios.
Ms rpido, mejor toma de decisiones. Con la velocidad de Hadoop y la
analtica en memoria, combinada con la capacidad de analizar nuevas fuentes de
datos, las empresas pueden analizar la informacin inmediatamente y tomar
decisiones basadas en lo que han aprendido.
Nuevos productos y servicios. Con la capacidad de medir las necesidades de
los clientes y la satisfaccin a travs de anlisis viene el poder de dar a los clientes
lo que quieren. Con la analtica de Big Data, ms empresas estn creando nuevos
productos para satisfacer las necesidades de los clientes.

Por ejemplo:

Turismo: El anlisis de Big data ofrece a estas empresas la capacidad de


recopilar datos de los clientes, aplicar anlisis e identificar inmediatamente
posibles problemas antes de que sea demasiado tarde.
Cuidado de la salud: El Big Data aparece en grandes cantidades en la industria
sanitaria. Al analizar grandes cantidades de informacin - tanto estructurada como
no estructurada - rpidamente, se pueden proporcionar diagnsticos u opciones
de tratamiento casi de inmediato.
Administracin: La tecnologa agiliza las operaciones mientras que da a la
administracin una visin ms holstica de la actividad.
Retail: El Big Data ayuda a los minoristas a satisfacer las demandas. Armados
con cantidades interminables de datos de programas de fidelizacin de clientes,
hbitos de compra y otras fuentes, los minoristas no slo tienen una comprensin
profunda de sus clientes, sino que tambin pueden predecir tendencias,
recomendar nuevos productos y aumentar la rentabilidad.
Empresas manufactureras: Estas despliegan sensores en sus productos para
recibir datos de telemetra. A veces esto se utiliza para ofrecer servicios de
comunicaciones, seguridad y navegacin. sta telemetra tambin revela
patrones de uso, tasas de fracaso y otras oportunidades de mejora de productos
que pueden reducir los costos de desarrollo y montaje.
Publicidad: La proliferacin de telfonos inteligentes y otros dispositivos GPS
ofrece a los anunciantes la oportunidad de dirigirse a los consumidores cuando
estn cerca de una tienda, una cafetera o un restaurante. Esto abre nuevos
ingresos para los proveedores de servicios y ofrece a muchas empresas la
oportunidad de conseguir nuevos prospectos.
Otros ejemplos del uso efectivo de Big Data existen en las siguientes reas:
o Uso de registros de logs de TI para mejorar la resolucin de problemas de TI,
as como la deteccin de infracciones de seguridad, velocidad, eficacia y
prevencin de sucesos futuros.
o Uso de la voluminosa informacin histrica de un Call Center de forma rpida,
con el fin de mejorar la interaccin con el cliente y aumentar su satisfaccin.
o Uso de contenido de medios sociales para mejorar y comprender ms
rpidamente el sentimiento del cliente y mejorar los productos, los servicios y la
interaccin con el cliente.
o Deteccin y prevencin de fraudes en cualquier industria que procese
transacciones financieras online, tales como compras, actividades bancarias,
inversiones, seguros y atencin mdica.
o Uso de informacin de transacciones de mercados financieros para evaluar
ms rpidamente el riesgo y tomar medidas correctivas.

Qu tipos de datos debo explorar?

Si bien sabemos que existe una amplia variedad de tipos de datos a analizar, una
buena clasificacin nos ayudara a entender mejor su representacin.

1.- Web and Social Media: Incluye contenido web e informacin que es obtenida
de las redes sociales.

2.- Machine-to-Machine (M2M): se refiere a las tecnologas que permiten


conectarse a otros dispositivos.

3.- Big Transaction Data: Incluye registros de facturacin, en telecomunicaciones


registros detallados de las llamadas (CDR), etc.
4.- Biometrics: Informacin biomtrica en la que se incluye huellas digitales,
escaneo de la retina, reconocimiento facial, gentica, etc.

5.- Human Generated: Las personas generamos diversas cantidades de datos


como la informacin que guarda un call center al establecer una llamada telefnica,
notas de voz, correos electrnicos, documentos electrnicos, estudios mdicos, etc.

Desafos de la calidad de datos en Big Data

Las especiales caractersticas del Big Data hacen que su calidad de datos se
enfrente a mltiples desafos. Se trata de las conocidas como 5 Vs: Volumen,
Velocidad, Variedad, Veracidad y Valor, que definen la problemtica del Big Data.

Estas 5 caractersticas del big data provocan que las empresas tengan problemas
para extraer datos reales y de alta calidad, de conjuntos de datos tan masivos,
cambiantes y complicados.

Algunos desafos a los que se enfrenta la calidad de datos de Big Data son:

1. Muchas fuentes y tipos de datos

Con tantas fuentes, tipos de datos y estructuras complejas, la dificultad de


integracin de datos aumenta.

2. Tremendo volumen de datos

Como ya hemos visto, el volumen de datos es enorme, y eso complica la ejecucin


de un proceso de calidad de datos dentro de un tiempo razonable.

Es difcil recolectar, limpiar, integrar y obtener datos de alta calidad de forma


rpida. Se necesita mucho tiempo para transformar los tipos no estructurados en
tipos estructurados y procesar esos datos.

3. Mucha volatilidad

Los datos cambian rpidamente y eso hace que tengan una validez muy corta. Para
solucionarlo necesitamos un poder de procesamiento muy alto.

Si no lo hacemos bien, el procesamiento y anlisis basado en estos datos puede


producir conclusiones errneas, que pueden llevar a cometer errores en la toma de
decisiones.
4. No existen estndares de calidad de datos unificados

En 1987 la Organizacin Internacional de Normalizacin (ISO) public las normas


ISO 9000 para garantizar la calidad de productos y servicios. Sin embargo, el
estudio de los estndares de calidad de los datos no comenz hasta los aos
noventa, y no fue hasta 2011 cuando ISO public las normas de calidad de datos
ISO 8000.

Estas normas necesitan madurar y perfeccionarse. Adems, la investigacin sobre


la calidad de datos de big data ha comenzado hace poco y no hay apenas
resultados.

La calidad de datos de big data es clave, no solo para poder obtener ventajas
competitivas sino tambin impedir que incurramos en graves errores estratgicos y
operacionales basndonos en datos errneos con consecuencias que pueden llegar
a ser muy graves.

Referencias

http://www.iic.uam.es/big-data/

https://www.ibm.com/developerworks/ssa/local/im/que-es-big-data/

http://www.powerdata.es/big-data

También podría gustarte