Está en la página 1de 7

¿Qué es big data?

Punto de vista de empresas

 Lo ven como una prioridad empresarial debido a “su capacidad


para influenciar en el comercio de una economía integrada a
escala global"
 Lo utilizan para obtener resultados centrados en el cliente
principalmente, así como también aprovechan los datos internos y
crean un mejor ecosistema de información.

“Big data es el término empleado para referirse a toda aquella cantidad


inteligente de datos que, debido a sus características, no pueden ser
siempre procesados por los sistemas informáticos actuales”

Desafío de las organizaciones empresariales

 encontrar nuevos medios que les permitan analizar, descubrir y


entender más allá de lo que sus herramientas tradicionales
reportan sobre su información

Es big data  petabytes y exabytes de datos.


Gigabyte = 1 000 000 000
Terabyte = 1 000 000 000 000
Petabyte = 1 000 000 000 000 000
Exabyte = 1 000 000 000 000 000 000

Características
 gran volumen de información
 gran variedad de datos que pueden ser representados de diversas
maneras en todo el mundo
 velocidad de respuesta posible para lograr obtener la información
correcta en el momento preciso

Bases de datos convencionales

Son una parte importante y relevante para una solución analítica, que
incluso se vuelve vital cuando se usa en conjunto con la plataforma
de big data.
Estadísticas de uso de datos

 Twitter son cerca de 12 Terabytes de tweets creados diariamente


 Facebook almacena alrededor de 100 Petabytes de fotos y videos
 Se generan alrededor de 2.5 quintillones de bytes diariamente en el
mundo

Las 3V de big data


 El gran volumen de información
 la variedad de datos, que pueden ser representados de diferentes
maneras en el mundo
 la velocidad con la cual estos datos se generan

Las nuevas 3V del big data


 Veracidad  La abundancia de información moviéndose a gran
velocidad no tiene valor si no es correcta. La veracidad cobra mayor
relevancia en los casos en que el análisis de datos genera toma de
decisiones automatizadas, es decir, en donde las personas no
intervienen.

 Visualizacion  se trata de lograr que extensas listas de variables sean


fáciles de leer y entender.
 Valor  Este valor está dado por el análisis de los datos y cómo estos se
convierten en información y, eventualmente, en conocimiento.

Principales tipos de datos


 Web and Social Media: Incluye contenido web e información que es obtenida
de las redes sociales como Facebook, Twitter, LinkedIn, blogs.

 Machine-to-Machine [máquina a máquina] (M2M): M2M se refiere a las


tecnologías que permiten conectarse a otros dispositivos. M2M utiliza
dispositivos como sensores o medidores que capturan algún evento en particular
(velocidad, temperatura, presión, variables meteorológicas, variables químicas
como la salinidad, etc.) los cuales transmiten a través de redes alámbricas,
inalámbricas o híbridas a otras aplicaciones que traducen estos eventos en
información significativa.
 3
 Big Transaction Data [grandes datos transaccionales]: Incluye registros de
facturación, en telecomunicaciones registros detallados de las llamadas (CDR),
etc. Estos datos transaccionales están disponibles en formatos tanto
semiestructurados como no estructurados.
 4
 Biometrics [datos biométricos]: Información biométrica en la que se incluye
huellas digitales, escaneo de la retina, reconocimiento facial, genética, etc. En el
área de seguridad e inteligencia, los datos biométricos han sido información
importante para las agencias de investigación.
 5
 Human Generated [datos generados por humanos]: Las personas generamos
diversas cantidades de datos como la información que guarda un call center al
establecer una llamada telefónica, notas de voz, correos electrónicos,
documentos electrónicos, estudios médicos, etc. [MG1] (Barranco Fragoso,
2012, https://ibm.co/3eQdfiD)

Ventajas que aporta el big data a la


empresa
Las empresas que desarrollen una adecuada estrategia de big
data obtendrán cinco ventajas competitivas:
 mejoras tecnológicas que posibilitan la adquisición de datos y permiten
descubrir las necesidades y puntos de mejora en la compañía.

 Inmersión de nuevas variables en la toma de decisiones a través de algoritmos


automatizados. Los análisis de los datos pueden mejorar la toma de decisiones
dentro de una compañía reduciendo los riegos.

 Innovación en la creación de productos y servicios. Hay que tener en cuenta


que el big data permite que las compañías evalúen sus productos

 Segmentación de los clientes para personalizar acciones.

 Mejora de la accesibilidad y la fluidez de la información dentro de la propia


empresa.

Las 5 aplicaciones principales del big


data

 La exploración de grandes datos


Las tres 'V' del Big Data (velocidad, volumen y variedad) reflejan el reto al
que se enfrentan las grandes compañías a la hora de dar a los datos un
valor para tomar mejores decisiones, mejorar las operaciones y reducir
los riesgos. Por lo tanto, es necesario poder navegar de forma fácil para
obtener la información tanto dentro de los sistemas de la compañía
como los datos que llegan desde afuera. 
El aumento del llamado “bruto de datos” o “ruido” plantea el dilema de
cómo contextualizar estos datos para alimentar un mejor análisis y una
mejor toma de decisiones. La exploración de datos, además de ofrecer
soluciones a estos problemas, también contribuye a disminuir el riesgo
de filtración de información confidencial gracias a sus mecanismos de
seguridad.

 360º de visión sobre el cliente


Para conseguir un conocimiento total del cliente, las compañías deben
obtener información de fuentes internas y externas para poder
asesorarle y entender cuál es la mejor manera de ayudarle. El objetivo es
comprender el comportamiento del cliente y predecir sus futuras
acciones.
Los empleados que trabajan directamente con los clientes deben poseer
la información suficiente y adecuada para crear una relación de
confianza y conseguir un compromiso o una fidelidad por parte del
consumidor. Para conseguirlo, el empleado debe poder disponer al
instante tanto de información interna (según el comportamiento del
cliente en otras experiencias con la propia compañía) como externa
(sobre sus gustos e intereses, obtenida de redes sociales, correo
electrónico, etc.).
Hay que aclarar que la palabra cliente es un nombre genérico, que
pasará a denominarse paciente en el sector de la salud, un sospechoso
en un caso policial, etc.

 Extensión de la seguridad/inteligencia
Mecanismos para localizar anomalías y prevenir ataques. Este tipo de
soluciones permite discernir entre cantidades masivas de datos (tanto
internos como externos) posibles relaciones ocultas, detectar patrones
de conducta y prevenir amenazas a la seguridad. También posibilita
descubrir un fraude mediante la comprobación en tiempo real del
historial de actividad de una cuenta, con lo que es factible
desenmascarar un comportamiento anormal de un usuario o una
transacción sospechosa.
También permite examinar nuevas fuentes y variedades de datos como
pruebas de una actividad criminal, por ejemplo, internet. 
Las tres aplicaciones principales son:
-Visión mejorada de inteligencia y vigilancia: análisis de datos en
movimiento y en reposo para encontrar asociaciones o descubrir patrones.
Esta información en tiempo real puede incluso salvar vidas

-Previsión y atenuación de ataques cibernéticos en tiempo real: analizando


el tráfico de la red, las compañías pueden descubrir amenazas nuevas y
prevenir ataques de hackers, intrusos, espionaje, fraude cibernético e
incluso ciberterrorismo.

-Predicción y prevención del crimen: la capacidad para analizar datos de la


red de telecomunicaciones y de redes sociales permite detectar amenazas y
adelantarse a los criminales antes de que actúen.

 Análisis de operaciones

Permite obtener visibilidad en tiempo real de las operaciones, la


experiencia del cliente, transacciones y comportamiento. Dinamiza el
plan para incrementar la eficiencia de las operaciones, identifica e
investiga las anomalías, y monitoriza la infraestructura end-to-end para
evitar de forma preventiva la degradación o apagones en el servicio.
Con un acelerador de datos permite ingerir y procesar grandes
volúmenes de datos para proporcionar un conocimiento detallado del
estado de la compañía. Los machine data pueden ser correlacionados
con otros datos de la empresa como información del cliente o del
producto, aunque el gran volumen de datos esté en formatos distintos
que, sin la solución, no son compatibles con los demás.
Esta combinación es de gran utilidad para los encargados de tomar las
decisiones operativas, a la vez que aumenta la inteligencia y la eficiencia
de las operaciones. Estos responsables de la toma de decisiones
pueden visualizar los datos a través de distintos sistemas para obtener
la visión más informada posible y poder reaccionar de forma rápida ante
cualquier imprevisto.

 Aumentar el almacén de datos o Data Warehouse


Se trata de ampliar una estructura de almacenamiento de datos ya existente
aplicando las ventajas de Big Data para incrementar su valor. El aumento del
Data Warehouse nace de dos necesidades básicas: sacar provecho de
diferentes tipos de datos para ganar nuevas perspectivas de negocio en tiempo
real, y para optimizar la estructura de almacenamiento de datos facilitando la
tarea y ahorrando costes

. Existen tres tipos de Data Warehouse:


 
 Pre-Processing Hub (núcleo de preprocesamiento): proporciona un área
de montaje o “zona de aterrizaje” de los datos antes de decidir cuáles se
incorporan al almacén de datos.
 Discovery/Analytics (descubrimiento-análisis): da la capacidad de
realizar análisis que deberían haberse hecho antes en el Data
Warehouse, para así optimizar el almacén de datos y posibilitar nuevos
tipos de análisis.
 Query-able Data Store (almacén de datos de consulta): descarga datos
que se consultan con poca frecuencia o de una antigüedad considerable
del data warehouse mediante software y herramientas de integración de
información, y los almacena en un espacio de almacenamiento de bajo
coste, pero manteniéndolos aún accesibles desde la solución

Perfiles profesionales del big data


 Chief Data Officer (CDO): es el responsable de asegurar que la organización es
data driven. Lidera la gestión de datos y analítica asociada por el negocio y, por
tanto, es responsable de los diferentes equipos especialidades en datos.

 Data Scientists (científico de los datos): son los miembros clave del equipo de
ciencia de datos. Permiten extraer conocimiento e información valiosa de los
datos. Tienen visión general del proceso de extremo a extremo y pueden resolver
problemas de ciencias datos, la construcción de modelos analíticos y algoritmos.
Combinan diversas habilidades relacionadas con las matemáticas, la estadística,
la programación y visualización, pero también deben tener habilidades
comunicativas, para explicar los resultados obtenidos en la organización.

 Citizen Data Scientist: es la persona dentro de la organización que típicamente


no está formada específicamente para ser Data Scientist, pero que puede extraer
valor, a través de su experiencia, explorando los datos, desde las unidades de
negocio. Pueden ejecutar una serie simple de tareas analíticas utilizando
herramientas de descubrimiento de datos.
 Data Engineer (ingeniero de datos): Se encarga de proporcionar los datos de
una manera accesible y apropiada a los usuarios y Deata scientists. Es un perfil
especializado en infraestructura big data. Desarrolla y explota técnicas, procesos,
herramientas y métodos que deben servir para el desarrollo de aplicaciones big
data. Tiene un gran conocimiento en gestión de bases de datos, arquitecturas de
clusters, lenguajes de programación y sistemas de procesamiento de datos.

 Data Steward (administrador de datos): es responsable de mantener la


calidad, disponibilidad y seguridad de los datos. Persigue mejorar el
almacenamiento y presentación de los datos en toda la empresa. Tiene
conocimientos de los procesos de negocio y de cómo los datos se utilizan dentro
de estos procesos.

 Business Data Analyst (analista de datos): participa en las iniciativas y


proyectos de análisis de datos. Es la persona que recoge las necesidades de los
usuarios de negocio para los Data Scientist y presenta resultados obtenidos.

 Data Artist: son expertos en Business Analytics y son los responsables de crear


los gráficos, infografías y otras herramientas visuales para ayudar a las
diferentes personas de la organización a comprender datos complejos
(https://bit.ly/2XXT1gv).  

Presente y futuro del big data

También podría gustarte