Está en la página 1de 4

Qu es Big Data?

Por: Nelson Hernndez


Haba 5 Exabytes de informacin creados entre el amanecer de la civilizacin hasta
2003, pero esta cantidad de informacin se crea ahora cada 2 das y el ritmo est
incrementndose
Debido al gran avance que existe da con da en las tecnologas de informacin, la sociedad
globalizada ha tenido que enfrentarse a nuevos desafos que les permita analizar, descubrir
y entender, ms all de lo que sus herramientas tradicionales reportan, sobre la manera de
informarse y comunicarse. En los ltimos 15 aos el gran crecimiento de las aplicaciones
disponibles en internet, y para dispositivos mviles (GPS, redes sociales, etc.) ha sido parte
importante en este cambio paradigmtico, dando lugar a la entropa de la informacin, la
cual se le ha denominado BIG DATA. La grafica a continuacin muestra la evolucin del
tipo de informacin y sus caractersticas, partiendo de la planificacin de recursos
empresariales (ERP; por sus siglas en ingles) hasta alcanzar el estadio de hoy.

La data que hoy contienen los diferentes dispositivos personales (PC, laptop, tabletas,
telfonos mviles, etc.) y no personales (computadores y servidores de organismos pblicos
y privados) se procesa bajo tres dimensiones: la velocidad de generacin y tiempo de
respuesta; el volumen medido en bytes y la variedad de la data (texto, video, audio,
clculos, etc.).

La primera inquietud que posiblemente llegue a su mente en este momento es:


Qu es Big Data y porqu se ha vuelto tan importante?
Pues bien, en trminos generales podramos referirnos como la tendencia en el avance de la
tecnologa que ha abierto las puertas hacia un nuevo enfoque de entendimiento y toma de
decisiones, la cual es utilizada para describir enormes cantidades de datos (estructurados,
no estructurados y semi estructurados) que tomara demasiado tiempo y sera muy costoso
cargarlos a una base de datos relacional para su anlisis. De tal manera que, el concepto de
Big Data aplica para toda aquella informacin que no puede ser procesada o analizada
utilizando procesos o herramientas tradicionales.
Una manera ms simple de entender, Big Data es una plataforma tecnolgica dinmica que
permite un manejo masivo de informacin en tiempo real y sin retardo cuando esta es
requerida. Esta plataforma est conformada por tres componentes: Sistema de
almacenamiento (hardware); Manejo de los datos (software) y Mtodos de anlisis
(software). Es bueno sealar que estos, interactan con la mnima intervencin del hombre.
Quizs esto, sin dimensionarlo, no nos dice mucho 1. El pasado mes de agosto el CEO de
Google, Eric Schmidt, seal: Haba 5 Exabytes2 de informacin creados entre el
amanecer de la civilizacin hasta 2003, pero esta cantidad de informacin se crea ahora
cada 2 das y el ritmo est incrementndose. Por otra parte, Segn Robert J. Moore, CEO
de RJMetrics, indica que: 23 Exabytes de informacin fueron grabados y duplicados en
2002. Ahora registramos y transmitimos esta informacin cada siete das.
De dnde provienen todos estos datos?
Los fabricamos los humanos de una forma directa e indirectamente segundo tras segundo.
Un iPhone hoy en da tiene ms capacidad de computacin que la que tenia la NASA
cuando el hombre lleg a la luna, por lo que la cantidad de datos generados por persona y
unidad de tiempo es inmensa. La procedencia de los datos se clasifica en las siguientes
categoras:

Generados por las personas: Enviar correos electrnicos o mensajes por


WhatsApp, Facebook, Tweeter, tomar y montar fotos o responder a una encuesta en
la calle son algunas acciones cotidianas que crean nuevos datos y metadatos que
pueden ser analizados. Se estima que cada minuto al da se envan ms de 200
millones de correos electrnicos, se comparten ms de 700.000 piezas de contenido
en Facebook, se realizan dos millones de bsquedas en Google o se editan 48 horas
de vdeo en YouTube. Por otro lado, las trazas de utilizacin en un sistema ERP,

La Biblia, por ejemplo, contiene unas 800.000 palabras. En promedio, cada palabra
equivale a 5,5 caracteres, la Biblia posee unos 4.400.000 caracteres. Si cada carcter
equivale a 1 byte, entonces un archivo que contuviera toda la Biblia slo ocupara 4,4 Mega
Bytes. Menos del 1 % del espacio que puede almacenar un CD.
2

Exabyte = 1018 = 1.000.000.000.000.000.000

incluir registros en una base de dato o introducir informacin en una hoja de clculo
son otras formas de generar estos datos.
Transacciones de datos: La facturacin, las llamadas telefonicas o las
transacciones entre cuentas generan informacin que tratada pueden ser datos
relevantes. Un ejemplo ms claro lo encontraremos en las transacciones bancarias:
lo que el usuario conoce como un ingreso de X dlares, la computacin lo
interpretar como una accin llevada a cabo en una fecha y momento determinado,
en un lugar concreto, entre unos usuarios registrados, generando ms metadatos.

E-marketing y web: Generamos una gran cantidad de datos cuando navegamos por
internet. Con la WEB 2.0 se ha roto el paradigma del webmaster, ya que los mismos
usuarios se convierten en creadores de contenido gracias a su interaccin con el sitio
WEB. Existen muchas herramientas de tracking (rastreo) utilizadas en su mayora
con fines de mercadeo y anlisis de negocio. Los movimientos de ratn (hardware)
quedan grabados en mapas de calor, y tambin queda registro de cuntas veces
visitamos un sitio WEB y cuando.

Maquina a Maquina (M2M): Son las tecnologas que comparten datos con
dispositivos: medidores, sensores de temperatura, de luz, de altura, de presin, de
sonido, etc., que transforman las magnitudes fsicas o qumicas y las convierten en
datos. Existen desde hace dcadas, pero la llegada de las comunicaciones
inalmbricas (WiFi, Bluetooth, etc.) ha revolucionado el mundo de los sensores.
Algunos ejemplos son los GPS en la automocin o los sensores de signos vitales en
la medicina. Otros son el pago peaje en autopistas, deteccin de movimientos y
ubicacin de aviones y barcos.

Biomtrica: Son el conjunto de datos que provienen de la seguridad, defensa y


servicios de inteligencia. Son cantidades de datos generados por lectores
biomtricos como escneres de retina, escneres de huellas digitales, o lectores de
cadenas de ADN. El propsito de estos datos es proporcionar mecanismos de
seguridad y suelen estar custodiadas por los ministerios de defensa y departamentos
de inteligencia. Un ejemplo de aplicacin es el cruce de ADN entre una muestra
obtenida en un crimen y una comparacin con la existente en base de datos.

Todo lo anterior conduce a que cada da dependamos ms de la BIG DATA, y nos vemos
obligados a permanecer ms tiempo frente a una pantalla. De las 26,1 horas mensuales que
navega un latinoamericano promedio, 10,32 se pasan en redes sociales, seguido por 4,5 en
portales web, 4,18 horas en servicios y 4,1 en entretenimiento.
A nivel de pases desarrollados la permanencia es mayor. En los Estados Unidos, la gente
utiliza 444 minutos diarios (7,4 horas). 147 minutos viendo TV, 103 frente a un
computador, 151 minutos usando telfonos inteligentes y 43 minutos en tabletas.
Finalmente, nos vanagloriamos de estar informados, lo cual es cierto. Sin embargo, solo
vemos o accesamos una parte infinitesimal (y cada da se hace ms infinitesimal) de la
informacin contenida en el BIG DATA.