Está en la página 1de 17

BIG DATA

FRANCISCO NARANJO COBO


Qu es Big Data?

Volumen masivo de datos, tanto
estructurados como no-
estructurados, los cuales son
demasiado grandes y difciles de
procesar con las bases de datos y el
software tradicionales" (ONU, 2012)
Big Data
Qu es Big Data?
Big Data es un concepto que se aplica a toda aquella
informacin que no puede ser procesada o analizada usando
procesos o herramientas convencionales debido al enorme
volumen de datos sobre el cual hay que trabajar.
Big Data
Por qu usar Big Data?
Big data
Cmo se origina?
Por la explosin en la cantidad (velocidad y frecuencia) y diversidad de datos
digitales generados en tiempo real como resultado del rol cada vez mayor de la
tecnologa en las actividades diarias.
Para qu sirve?
Permite generar informacin y conocimiento con base en informacin completa
en tiempo real.
Tipos de datos
Compras y transacciones (incluyendo informacin de tarjetas de
crdito)
Datos de gestin empresarial
Bsqueda (consulta, trayectoria recorrida, historia)
Sociales (datos de identidad, informacin de amistades)
Intereses personales (que me gusta, tweets, recomendaciones, enlaces)
Ubicacin, sensores fsicos (GPS, patrones de trfico, Internet of
Things, etc.)
Contenido (SMS, llamadas, e-mails)

Informacin generada de fuentes tradicionales pero
particularmente por empresas e individuos en sus actividades
cotidianas
El teln de fondo a mediados de 2013
6800 millones de suscripciones a mvil-celular
2700 millones casi 40% de la poblacin mundial estn online
750 millones de hogares 41% del mundo conectados a Internet
Los precios de la banda ancha fija cayeron 82% entre 2008 y 2012
2100 millones de suscripciones a banda ancha mvil esperadas para fines
de 2013
Ms nmeros para 2013
Web indexada: ms de 37 mil millones de pginas en Google el 2 de agosto
Facebook: 1150 millones de usuarios activos en junio
YouTube: ms de 1000 millones de usuarios nicos por mes
Ms de 6 mil millones de horas video vistas por mes
100 horas video subidas a YouTube cada minuto
Twitter: 500 millones de tweets por da
Aun ms nmeros
Apple App Store: 900 mil apps
Ms de 50 mil millones de downloads
Android: 800 mil aplicaciones
Internet de las cosas: 24 mil millones
de dispositivos conectados en 2020; 14
mil millones de ellos, mviles
Conexiones mltiples
Dispositivos conectados a Internet por usuario
64%
56%
48%
42%
35%
31%
30%
35%
40%
43%
44%
45%
6%
9%
12%
16%
20%
24%
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
2010 2011 2012 2013 2014 2015
Menos de 5 Entre 5 y 10 Ms de 10
Fuente: Cisco Global Cloud Index, 2010-2015.
Big Data
Quin usa Big Data?
Algunas experiencias internacionales
a nivel gubernamental
Comisin Estadstica de Naciones Unidas: Seminario de Asuntos
Emergentes en la 44Sesin de la Comisin: Big Data para la
Poltica, el Desarrollo y las Estadsticas Oficiales
Estados Unidos: Iniciativa de I+D en Big Data (2012), propuesta de la
administracin Obama, dirigido por la Oficina para la Ciencia y la
Tecnologa de la Casa Blanca.
Japn: Dentro de la primera estrategia de crecimiento del Japn del
gobiernode Shinzo Abe (Desatar el poder del sector privado hasta su
mxima extensin), se encuentra un plan bsico para aprovechar Big Data
(Mayo 2012).
Corea del Sur: Plan Maestro de Big Data para la Implementacin de una
Nacin Inteligente (2013), del gobierno coreano.
Las tres V que en realidad son cuatro
Volumen : Cuntos datos
Velocidad: Cun rpido se procesan los datos
Variedad: Cuntos y cules tipos de datos
Veracidad: Cun correctos son los datos para
predecir en el universo en consideracin
(precisin y contexto)
Big data para la creacin de valor
1. Segmentacin de mercado y poblacin para personalizar
acciones
2. Innovacin en nuevos modelos de negocios, productos y
servicios
Mejora de productos existentes
Desarrollo de nuevos productos (masa y personalizacin)
Nuevos modelos de servicio a nivel empresarial y gubernamental
3. Apoyo a la toma de decisiones con software inteligente
4. Transparencia y eficiencia por compartir datos
5. Mejor y ms oportuno anlisis de desempeo de las
organizaciones y ajustes en accin.

Ejemplos de Big Data
12 Tb
da
21 Pb
Hadoop
cluster
7 Pb
mes
1 Tb
tweets/dia
75
Million
scores/day
14 Tb
Hadoop
cluster
4 Billion
Graph
edg/day
7 Tb
datos/dia
Un ejemplo ms detallado
(MIT, Harvard)

Eagle, Pentland y Lazer (2009) analizaron 330 mil horas de
datos sobre comportamiento en el uso de telfonos
mviles de 94 personas, y los compararon con datos de
relaciones directamente reportados por los individuos
Presentan un mtodo para medir conductas basado en
datos de proximidad y comunicacin, e identifican
caractersticas que les permiten predecir con 95% de
precisin las relaciones de amistad recprocas
Usando estas seales de conducta, pueden predecir
resultados individuales como satisfaccin en el trabajo
Observaciones sobre el uso de telfonos mviles proveen
indicaciones no solo sobre el comportamiento observable,
sino tambin sobre variables como amistad y satisfaccin
individual

También podría gustarte