Big Data es un término que describe el gran volumen de
datos, tanto estructurados como no estructurados, que inundan los negocios cada día. Big Data es la posibilidad de explotar comercialmente una gran cantidad de datos para crear nuevos servicios comerciales. En el mundo se acumulan cada vez más datos en formato digital pero el problema es que estos datos son en general poco estructurados y en cantidades ingentes. El Big Data fue definido por las Naciones Unidas en el 2012 como el volumen masivo de datos, tanto estructurados como no estructurados, que son demasiado grandes y difíciles de procesar con las bases de datos y el software tradicionales. TIPOS DE BIG DATA Las fuentes de datos de big data son muy amplias: Datos de internet y móviles. Datos de Internet de las Cosas. Datos sectoriales recopilados por empresas especializadas. Datos experimentales.
Y los tipos de datos también lo son:
Tipos de datos no estructurados: documentos, vídeos, audios, etc.
Tipos de datos semi-estructurados: software, hojas de cálculo, informes. Tipos de datos estructurados
Solo el 20% de información es estructurada y eso puede provocar muchos errores
si no acometemos un proyecto de calidad de datos. existen 5 grandes tipos: Los datos de grandes transacciones (Big Transacción Data). Son los registros de facturación, de las llamadas, telecomunicaciones, etc. Datos que podemos encontrar en formatos semiestructurado o no estructurado. Se incluyen los datos empresariales que se refieren a la información del cliente, la cual proviene de sistemas como el CRM; inventarios de ventas; datos transaccionales del ERP, etc. Redes sociales y páginas web. Se refiere a toda aquella información que se obtiene a través de las transacciones web, y el contenido que se adquieren de las redes sociales como LinkedIn, Facebook, Twitter, Instagram, etc. Biométricas. Es aquella información que incluye escaneo de la retina, huellas digitales, reconocimiento genético o facial, etc. Generados por los seres humanos. Se refiere a todos aquellos datos que generamos los humanos cuando llamamos a un call center, escribimos correos electrónicos, documentos electrónicos, notas de voz, telecomunicaciones, uso de tarjetas de crédito o débito, etc. Máquinas (Machine to Machine M2M). Es decir, aquellas tecnologías que se conectan a otros dispositivos, y los utiliza como sensores o medidores, los cuales generan un gran volumen de datos, que necesitan ser analizados. Por ejemplo, cuando las compañías de servicios públicos miden el consumo de agua, gas o electricidad a través de medidores inteligentes y se obtienen después unos datos que normalmente se monitorizan para conocer mejor ciertas características como la frecuencia o el voltaje. VIDEO DE APOYO