Está en la página 1de 19

Qu es Big Data?

Porqu debe importarm

Qu tipo de datos
debemos explorar?

1.-Web and Social Media: Incluye contenido web e


informacin que es obtenida de las redes sociales como
Facebook, Twitter, LinkedIn, etc, blogs.
2.-Machine-to-Machine (M2M): M2M se refiere a las
tecnologas que permiten conectarse a otros
dispositivos. M2M utiliza dispositivos como sensores o
medidores que capturan algn evento en particular.
3.-Big Transaction Data: Incluye registros de
facturacin, en telecomunicaciones registros detallados
de las llamadas (CDR), etc. Estos datos transaccionales
estn disponibles en formatos tanto semiestructurados
como no estructurados.

4.-Biometrics:Informacin biomtrica en la que se


incluye huellas digitales, escaneo de la retina,
reconocimiento facial, gentica, etc. En el rea de
seguridad e inteligencia, los datos biomtricos han
sido informacin importante para las agencias de
investigacin.
5.-Human Generated: Las personas generamos
diversas cantidades de datos como la informacin
que guarda un call center al establecer una llamada
telefnica, notas de voz, correos electrnicos,
documentos electrnicos, estudios mdicos, etc

Componentes de una
plataforma Big Data

Hadoop Distributed File System (HDFS)

Hadoop MapReduce

Hadoop Common

Hadoop Common Components son un


conjunto de libreras que soportan varios
subproyectos de Hadoop.

Otros proyectos
relacionados a
Hadoop

Big Data y el Campo


de Investigacin

Big Data y el Campo


de Investigacin

Con la capacidad de generar toda esta informacin valiosa de


diferentes sistemas, las empresas y los gobiernos estn
lidiando con el problema de analizar los datos para dos
propsitos importantes:
Ser capaces de detectar y responder a los acontecimientos
actuales de una manera oportuna, y para poder utilizar las
predicciones del aprendizaje histrico. Esta situacin requiere
del anlisis tanto de datos en movimiento (datos actuales)
como de datos en reposo (datos histricos), que son
representados a diferentes y enormes volmenes, variedades y
velocidades.

Conclusiones
La naturaleza de la informacin hoy es diferente a la
informacin en el pasado. Debido a la abundancia de sensores,
micrfonos, cmaras, escneres mdicos, imgenes, etc. en
nuestras vidas, los datos generados a partir de estos elementos
sern dentro de poco el segmento ms grande de toda la
informacin disponible.
Implementar una solucin alrededor de Big Data implica de la
integracin de diversos componentes y proyectos que en
conjunto forman el ecosistema necesario para analizar grandes
cantidades de datos.
Sin una plataforma de Big Data se necesitara que desarrollar
adicionalmente cdigo que permita administrar cada uno de
esos componentes como por ejemplo: manejo de eventos,
conectividad, alta disponibilidad, seguridad, optimizacin y
desempeo, depuracin, monitoreo, administracin de las
aplicaciones, SQL y scripts personalizados.

También podría gustarte