Volumen masivo de datos, tanto estructurados como no- estructurados, los cuales son demasiado grandes y difciles de procesar con las bases de datos y el software tradicionales" (ONU, 2012) Big Data Qu es Big Data? Big Data es un concepto que se aplica a toda aquella informacin que no puede ser procesada o analizada usando procesos o herramientas convencionales debido al enorme volumen de datos sobre el cual hay que trabajar. Big Data Por qu usar Big Data? Big data Cmo se origina? Por la explosin en la cantidad (velocidad y frecuencia) y diversidad de datos digitales generados en tiempo real como resultado del rol cada vez mayor de la tecnologa en las actividades diarias. Para qu sirve? Permite generar informacin y conocimiento con base en informacin completa en tiempo real. Tipos de datos Compras y transacciones (incluyendo informacin de tarjetas de crdito) Datos de gestin empresarial Bsqueda (consulta, trayectoria recorrida, historia) Sociales (datos de identidad, informacin de amistades) Intereses personales (que me gusta, tweets, recomendaciones, enlaces) Ubicacin, sensores fsicos (GPS, patrones de trfico, Internet of Things, etc.) Contenido (SMS, llamadas, e-mails)
Informacin generada de fuentes tradicionales pero particularmente por empresas e individuos en sus actividades cotidianas El teln de fondo a mediados de 2013 6800 millones de suscripciones a mvil-celular 2700 millones casi 40% de la poblacin mundial estn online 750 millones de hogares 41% del mundo conectados a Internet Los precios de la banda ancha fija cayeron 82% entre 2008 y 2012 2100 millones de suscripciones a banda ancha mvil esperadas para fines de 2013 Ms nmeros para 2013 Web indexada: ms de 37 mil millones de pginas en Google el 2 de agosto Facebook: 1150 millones de usuarios activos en junio YouTube: ms de 1000 millones de usuarios nicos por mes Ms de 6 mil millones de horas video vistas por mes 100 horas video subidas a YouTube cada minuto Twitter: 500 millones de tweets por da Aun ms nmeros Apple App Store: 900 mil apps Ms de 50 mil millones de downloads Android: 800 mil aplicaciones Internet de las cosas: 24 mil millones de dispositivos conectados en 2020; 14 mil millones de ellos, mviles Conexiones mltiples Dispositivos conectados a Internet por usuario 64% 56% 48% 42% 35% 31% 30% 35% 40% 43% 44% 45% 6% 9% 12% 16% 20% 24% 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% 2010 2011 2012 2013 2014 2015 Menos de 5 Entre 5 y 10 Ms de 10 Fuente: Cisco Global Cloud Index, 2010-2015. Big Data Quin usa Big Data? Algunas experiencias internacionales a nivel gubernamental Comisin Estadstica de Naciones Unidas: Seminario de Asuntos Emergentes en la 44Sesin de la Comisin: Big Data para la Poltica, el Desarrollo y las Estadsticas Oficiales Estados Unidos: Iniciativa de I+D en Big Data (2012), propuesta de la administracin Obama, dirigido por la Oficina para la Ciencia y la Tecnologa de la Casa Blanca. Japn: Dentro de la primera estrategia de crecimiento del Japn del gobiernode Shinzo Abe (Desatar el poder del sector privado hasta su mxima extensin), se encuentra un plan bsico para aprovechar Big Data (Mayo 2012). Corea del Sur: Plan Maestro de Big Data para la Implementacin de una Nacin Inteligente (2013), del gobierno coreano. Las tres V que en realidad son cuatro Volumen : Cuntos datos Velocidad: Cun rpido se procesan los datos Variedad: Cuntos y cules tipos de datos Veracidad: Cun correctos son los datos para predecir en el universo en consideracin (precisin y contexto) Big data para la creacin de valor 1. Segmentacin de mercado y poblacin para personalizar acciones 2. Innovacin en nuevos modelos de negocios, productos y servicios Mejora de productos existentes Desarrollo de nuevos productos (masa y personalizacin) Nuevos modelos de servicio a nivel empresarial y gubernamental 3. Apoyo a la toma de decisiones con software inteligente 4. Transparencia y eficiencia por compartir datos 5. Mejor y ms oportuno anlisis de desempeo de las organizaciones y ajustes en accin.
Ejemplos de Big Data 12 Tb da 21 Pb Hadoop cluster 7 Pb mes 1 Tb tweets/dia 75 Million scores/day 14 Tb Hadoop cluster 4 Billion Graph edg/day 7 Tb datos/dia Un ejemplo ms detallado (MIT, Harvard)
Eagle, Pentland y Lazer (2009) analizaron 330 mil horas de datos sobre comportamiento en el uso de telfonos mviles de 94 personas, y los compararon con datos de relaciones directamente reportados por los individuos Presentan un mtodo para medir conductas basado en datos de proximidad y comunicacin, e identifican caractersticas que les permiten predecir con 95% de precisin las relaciones de amistad recprocas Usando estas seales de conducta, pueden predecir resultados individuales como satisfaccin en el trabajo Observaciones sobre el uso de telfonos mviles proveen indicaciones no solo sobre el comportamiento observable, sino tambin sobre variables como amistad y satisfaccin individual