Está en la página 1de 8

Introduccin a Big

Data
Introduccin a Big data

1.1 Qu es big data o datos


masivos
1.1.1 Introduccin a los datos masivos
Cuando hablamos de datos masivos, nos referimos a una gran cantidad de datos,
que a partir del ao 2012 se han venido consolidando en las empresas y que ya
han irrumpido en las organizaciones, especialmente movidos por las redes
sociales, el aumento del ancho de banda, el Internet de las cosas y la computacin
en la nube. Segn la consultora IDC (Recuperado el 22/04/2016 de
http://goo.gl/bMA1Ui) el Big data ha ido creciendo de modo espectacular.
Figura 1: La consultora IDC indica que en el ao 2015 se espera un crecimiento
7910 EXA Bytes, lo que significa 7,910 millones de gigabytes

Fuente: IDC.COM. http://goo.gl/bMA1Ui

Como ejemplo, podemos citar a Walmart, la gran cadena de almacenes


americanos. Esta tiene una capacidad de base de datos 2.5 petabytes y procesa
2

ms de 1 milln te transacciones cada hora (dezyre.com. 2015. Recuperado el


22/04/2016 de https://goo.gl/pDptZG).
Pero para entender exactamente de lo que estamos hablando, aqu tenemos un
pequeo ejemplo:

Tabla 1: Escala de medidas de almacenamientos de memoria


Nombre

Smbolo Antes de la
estandarizacin

Despus de la estandarizacin

bit

1 bit

1 bit

bit

1 bit

byte

1B

8 bit

8 bit

kilobyte

kB

1 kB

1024 B = Byte 1

kB

1000 Byte

megabyte

MB

1 MB

1024 kB

MB

1000 kB

gigabyte

GB

1 GB

1024 MB

GB

1000 MB

terabyte

TB

1 TB

1024 GB

TB

1000 GB

petabyte

PB

1 PB

1024 TB

PB

1000 TB

exabyte

EB

1 EB

1024 PB

EB

1000 PB

zettabyte

ZB

1 ZB

1024 EB

ZB

1000 EB

yottabyte

YB

1 YB

1024 ZB

YB

1000 ZB

Fuente: elaboracin propia

1 gigabyte = 8,934,592 bits


1 terabyte = 879,609,302,220,803 bits
La frase yo soy un buen alumno es igual a 168 bits.
Lo que equivale a 5,235,769,656,076.208 veces en 1 terabyte
En otras palabras, cuando hablamos de datos masivos, nos referimos realmente a
una gran cantidad de datos que implican una importante cantidad de
almacenamiento. No se trata de bases de datos aisladas, sino del conjunto de
3

grandes volmenes de datos que provienen de una gran diversidad de fuentes de


datos.
El objetivo de este curso es introducir al estudiante en conceptos bsicos de datos
masivos y, a travs de casos prcticos, entender el funcionamiento, la aplicacin y
el uso de estos datos masivos en la vida real y ms especficamente en la empresa.
La masividad en el uso de datos viene dada principalmente porque cada instancia
es almacenada en servidores; tal es el caso por ejemplo de las redes sociales:
Facebook almacena diariamente ms de 1 milln de datos por da entre fotos,
comentarios y videos.
En la era de la informacin y las comunicaciones, provocado principalmente por
Internet, estamos frente a millones de datos almacenados diariamente.
Antes no exista la capacidad de procesar tanta cantidad de datos. Gracias a
tecnologas que fueron desarrolladas primero en Google y luego a travs del
desarrollo libre Open Source como Hadoop, se ha permitido que el procesamiento
de datos masivos sea una realidad en cualquier empresa.
Segn un informe de Accenture, se puede afirmar lo siguiente:

El 92 % de los ejecutivos de empresas que utilizan datos masivos se


declaran satisfechos con los resultados, el 89 % considera que los
datos masivos son muy importantes o extremadamente
importantes para la transformacin de sus empresas y el 82 %
piensa que los datos masivos aportan un considerable valor a sus
organizaciones. (Snchez, 2014, https://goo.gl/6Gjis6).

Con respecto a este informe, el analista Narendra Mulani, comenta:

Las empresas han llegado un punto de transicin en el que en lugar


de hablar sobre los resultados que pueden conseguir con datos
masivos estn empezando a ver beneficios reales como aumento
de ingresos, una mayor fidelizacin de los clientes y operaciones
ms eficientes. (Snchez, 2014, https://goo.gl/6Gjis6).
El analista explica el caso de un proveedor de telecomunicaciones en Japn que
est utilizando las capacidades de los telfonos mviles y datos de geolocalizacin
4

geogrfica para ofrecer a las empresas el envo de publicidad en tiempo real a los
celulares de estos potenciales clientes. Otra empresa britnica de energa elctrica
que tiene instalados sensores a lo largo de toda la geografa del Reino Unido puede
prever aumentos en los consumos de energa elctrica en tiempo real o reaccionar
con ms rapidez si se llegan a producir condiciones meteorolgicas adversas que
puedan producir cadas en los servicios (Snchez, 2014, https://goo.gl/6Gjis6).
Internet de las cosas est provocando que se comunique una gran cantidad de
datos: esto es simplemente porque cada dispositivo elctrico o electrnico tiene
un microchip incorporado que permite procesar informacin bsica y, a travs de
sensores, se toman datos para enviarlos luego a alguna base de datos ms grande
o generar un proceso en donde el usuario a travs de algn display puede ver dicha
informacin. Ms adelante en este curso de big data vamos a crear un dispositivo
sensor utilizando un chip arduino.

1.1.2 Ejemplo de sensores arduino


Figura 2: Sistema de observacin de comportamiento de las abejas con sensor
arduino

Fuente: Recuperado de https://goo.gl/rYdl7I

"Las abejas en el patio trasero" es un proyecto de tecnologa de la ciencia


ciudadana para investigar el comportamiento de anidacin de las abejas Mason,

creado por Mike Teachman, entusiasta de la abeja, y Paul Perrault, ingeniero de


aplicaciones.
Figura 3: Funcionamiento del Sensor Arduino electrnica como sensor

Fuente: https://goo.gl/uBc8H5

Muchas empresas, aprovechando el bajo costo que tiene la adquisicin de


sensores, estn generando una recoleccin masiva de datos para la toma de
decisiones, ya sea como en el ejemplo de la empresa elctrica britnica, o tambin
la colocacin de sensores en los ros caudalosos para conocer con antelacin
informacin sobre crecidas y as evitar desastre naturales.
Tambin es el caso de la utilizacin de los dispositivos RFID, o dispositivos de
radiofrecuencia, que a travs de sensores permiten en tiempo real saber el
desplazamiento de mercadera o elementos en la tienda. Por ejemplo, en el
mercado minorista, muchas empresas utilizan estos dispositivos de
radiofrecuencia que se colocan en las prendas que venden para saber el flujo de
entrada y salida de insumos y conocer con exactitud qu se vende y qu queda en
almacn (y analizar por qu no se vende).

Figura 4: Dispositivo RFID para prendas de vestir.

Fuente: elaboracin propia

En una tienda sera muy sencillo de controlar, ya que el stock en un solo local es
fcil de gestionar. Sin embargo, si tuviramos 25 tiendas dispersas en un pas de
gran extensin geogrfica, la situacin es mucho ms compleja, ya que implica la
previsin de ventas, la previsin de compras, el gusto del usuario, la compra y el
stock remanente.
Existen muchos ejemplos en el uso de sensores para la acumulacin de datos para
luego, mediante el procesamiento con datos masivos, tomar decisiones o realizar
previsiones. Parte de este curso es aplicar estos conocimientos en la vida real y
entender mecanismos para generar esta acumulacin de datos para luego generar
el procesamiento de estos.

1.1.3 Caso prctico Walmart


Cmo el anlisis de datos ayud al aumento del volumen de negocios de
Walmart? Todo el caso prctico fue desarrollado e implementado en WALT MART
(USA) por la consultora Americana Dezyre. (dezyre.com. Recuperado el
22/04/2016 de https://goo.gl/y48Hev).
A continuacin, revisaremos algunos de los datos que este estudio gener. Con
ms de 245 millones de clientes que visitan las tiendas, 10,900 supermercados en
todo el mundo y 10 sitios webs activos a travs del mundo, Walmart es
definitivamente un nombre a tener en cuenta en el sector de retail.
Waltmart ha sido el retail mundial por excelencia, con compras online y tambin
en su tienda fsica. El anlisis de Global Customer Insights (dezyre.com, 2015,
7

https://goo.gl/y48Hev) calcula que Walmart tiene cerca de 300,000 menciones


todas las semanas. Con 2 millones de empleados y aproximadamente otro medio
milln de contratados cada ao, el nmero de empleados de Walmart es mayor
que algunos de los nmeros del mayor retail del mundo.
Este caso prctico se explica cmo se implement un sistema de decisin y anlisis
usando big data, para entender y tomar decisiones sobre los clientes, su actitud
de compra y su satisfaccin.

También podría gustarte