Muchas veces hemos escuchado la frase "Información es poder". Los datos son
el punto de partida. Tras acceder a las fuentes de datos, traemos de estas fuentes todos los datos necesarios, los analizamos, limpiamos y procesamos. A partir de este momento, estamos en condiciones de combinar nuestra experiencia de negocio y nuestras propias vivencias con los datos obtenidos, dando lugar a lo que se conoce como información. La obtención de conocimiento sería el tercer paso en este proceso, que radica en el análisis de la información que tenemos preparada y que nos da el poder para tomar decisiones. A lo largo de la última década, la tecnología nos ha dado la capacidad de generar, obtener y aprender de los datos más que nunca. Esta capacidad nos ha permitido gestionar los datos a escala empresarial, entendiendo por empresa a toda una organización o la infraestructura técnica de la organización. Debido a que cada una es diferente, no existe una única solución para implementar tecnologías Big Data en las áreas de nuestra organización. Esta capacidad, además, nos exige ser muy responsables, primeramente con el tratamiento de datos y luego con la información. Debemos velar por la seguridad de las cadenas de conexión y acceso a las fuentes de datos, velar por la protección y privacidad del dato en sí mismo y por último, controlar la forma y el ámbito en el que van a ser expuestos los datos en los informes. Hay que combinar la capacidad que nos ofrecen las tecnologías actuales para aprender de los datos con nuestra responsabilidad y buen gobierno de los mismos, ayudándonos, nuevamente, de lo que nos ofrecen las tecnologías actualmente.
Ciclo de vida de los datos
El ciclo de vida de los datos no siempre es lineal. No siempre creamos,
utilizamos y visualizamos datos. Muchas veces transformamos los datos; les damos un nuevo significado. Y, así, en esos casos, los datos son cíclicos porque, a veces, aunque ya se hayan transformado, no son suficientemente buenos para la toma de decisiones y hay que volverlos a transformar. Los datos tienen un ciclo de vida que puede ser bastante complejo. En el centro y como elemento permanente del ciclo, tenemos el gobierno de datos. Los datos provienen de todos los aspectos de la vida que nos rodea. Algunos son heredados, algunos los creamos, otros los compramos o extraemos. Y, así, partiendo de que en la vida real no hay una línea recta en este proceso de datos, veamos el ciclo simplificado, por lo que vamos a dividirlo en etapas. En primer lugar, la obtención y transformación de datos. En esta fase, entra la estrategia de obtención de datos propios y externos para implementar el gobierno de los datos, definir la administración de datos maestros, la arquitectura de datos empresariales y cómo podemos importarlos a nuestro modelo de datos empresariales. Existen roles asociados con las disciplinas en esta área: el CDO, siglas en inglés que identifican al Chief Data Officer o Director de Datos; los directores de gobierno de datos; los administradores de datos o los expertos en la materia. Los datos empresariales o, en ocasiones, los denominados arquitectos de la información y los modeladores de datos. En segundo lugar, la gestión y trabajo con datos, es decir, ingeniería y administración. En esta etapa, comenzamos a trabajar con los datos de varias formas para organizarlos, persistirlos, asegurarlos, perfilarlos, transformarlos en un modelo que nos permita analizarlos. En esta etapa, entran las tareas de definición del sistema de administración de datos, ya sea en bases de datos relacionales o no, y el lenguaje de consulta que, en cada caso, se utilice. Existen roles asociados a esta área, como son: administradores de base de datos, o DBA; desarrolladores de datos; desarrolladores de integración de datos o, a veces, desarrolladores de ETL. Como parte de esta etapa, hay que obtener y analizar el perfil de nuestros datos. Esta es una tarea de extraordinaria importancia cuando se trata de gestionar y garantizar la calidad de los datos. Y, finalmente, en tercer lugar, la obtención de valor a partir de los datos o, lo que es lo mismo, inteligencia empresarial, análisis y modelado predictivo para conocer mejor nuestros datos e intentar predecir los resultados de decisiones basadas en patrones de datos existentes. Los roles en esta área son los ingenieros de datos, ingenieros de big data, desarrolladores de inteligencia empresarial, analistas de modelado predictivo y los desarrolladores de visualización de datos.
Descubrir el modelo de datos
Modelamos para organizar y definir nuestros datos. Veamos un ejemplo
sencillo, simplificado al máximo. Tenemos un negocio que se dedica a la venta de un producto, un producto cualquiera, ese mismo, el que estás pensando. Necesitamos describir al producto que ofrecemos, describir al cliente que nos compra y especialmente describir la relación que existe entre ellos, la interacción que se produce en el proceso de venta. Por tanto, tenemos tres elementos, venta, producto y cliente. Cada uno de ellos se convierte en una entidad como parte del proceso de modelado de datos. Parece fácil. Pero la vida real va mucho más allá. ¿Qué entendemos por cliente? ¿Un cliente es una persona que aunque no compró se interesó por nuestro producto, pidió el catálogo y marchó prometiendo pensárselo? ¿Un cliente es aquella persona que compró el producto? ¿Y, si devolvió el producto, sigue siendo cliente o deja de serlo? ¿Un cliente es aquella persona que abonó el precio del producto en su totalidad y no aquella persona que está abonando a plazos y aún no ha terminado? Y así muchas otras preguntas que surgen ante la definición de entidades. Es posible que todos sean clientes, solo que distintos tipos de una misma entidad clientes. O quizás no se conviertan en clientes hasta el pago. En fin, pueden ser escenarios y modelos diferentes. En todos los casos, es importante definir qué es un cliente. La definición del diccionario de datos de cada entidad es una de las tareas del programa del gobierno de datos. Si tenemos implementada la gobernanza de datos, estaremos cubiertos. Una vez tomada la decisión en cuanto a la terminología y lógica a aplicar, definimos el cliente y el producto como nuestros datos maestro, y la entidad de ventas como contenedora de los datos transaccionales, los datos de las transacciones. En la definición de las transacciones también podemos encontrarnos diferencias en el proceso de negocio que provoque diferencias en las transacciones. Según el servicio que ofrezcamos, puede ser más o menos complejo. Si se trata de compra/venta, es sencillo. Pero en escenarios de gestión hotelera o procesos productivos la complejidad es muchísimo mayor. Todos estos aspectos han de ser tenidos en cuenta para definir mejor el modelo. Comienzan con un modelo conceptual que no suele incluir atributos y tipos sino que tiene una descripción general de los requisitos de datos, entonces el modelador de datos toma ese modelo conceptual y los resultados son el modelo de datos lógico. Un modelo de datos lógico se suele representar como un diagrama entidad-relación. El modelo lógico es más detallado que el modelo conceptual porque tiene los metadatos de la entidad. Los metadatos que son los datos que describen otros datos son los atributos y dominios de datos que son tipos de datos para una entidad, como una descripción, notas, valores predeterminados y más. Este es también el lugar donde corresponde identificar si esa pieza de datos está sujeta a reglas de negocio que tiene que cumplimentar, como valores máximos o mínimos admitidos, entre otras muchas. Es en el modelo lógico donde aplicamos nuestras técnicas de normalización. Una vez que el modelo lógico es aprobado por la empresa, se promueve al modelo físico. El modelo físico es la representación más cercana a la base de datos real. En el modelo físico las entidades se denominan tablas y los atributos se denominan columnas. Entonces, para resumir, modelamos datos para organizar y definir nuestros datos. Tenemos definiciones estándares comunes, documentamos procesos de negocios y generamos código para enviar ingeniería a una base de datos.
Desafíos para la organización
En el mundo de hoy, el manejo de tecnologías Big Data viene de la mano de los
desafíos de negocios con los que se enfrentan las empresas para sobrevivir. El principal desafío es el conocimiento del cliente. El cliente ha cambiado en su forma de ver el mundo, está mucho mejor informado, es más global. Tiene un enfoque diferente ante el producto o servicio que va a adquirir. Hay empresas que no estaban preparadas para este tipo de cliente tan globalizado. No se trata solo de que estamos abiertos al negocio con clientes que no conocemos de nada, que viven en cualquier lugar del mundo y que tienen comportamientos y costumbres que desconocemos del todo. El punto es que ese tipo de cliente puede ser alguien que tengas a tu lado, tu vecino o tu cliente de toda la vida, que hoy ya no es el mismo. El cliente ha cambiado, los datos se manejan de otra forma por parte del cliente, por lo que se deben manejar de otra forma por parte de la empresa. Los procesos de minería de datos sobre clientes se hacían en base a comportamientos históricos, últimos meses o años; no mucho más allá, porque no se almacenaban los datos, ya que era muy caro. Los datos maestros de los clientes, ahora se almacenan por mucho más tiempo. Porque el desafío, desde el punto de vista del tratamiento de datos, no es solo conocer al cliente, sino enfocarse en el cliente y activar todos los procesos necesarios para su retención. El cliente ya no sigue un proceso lineal de compras, por lo que los procesos de minería de datos tradicionales han de evolucionar. Otros desafíos vienen de la mano de la escalabilidad de los procesos y la flexibilidad. Es importante aprovechar que bajan los costes de almacenamiento y procesamiento de datos, para decir un cambio de actuación, y, por ejemplo, digitalizar toda la información que sea posible. Una empresa como Amazon es capaz de responder a una reclamación, casi en tiempo real, por su presencia en línea, 24 horas, siete días a la semana, contar con alto nivel de robotización en sus almacenes y, muy especialmente, contar con modelos de minería de datos muy robustos, que permiten predecir el comportamiento o necesidades de sus clientes. Otro de los desafíos con los que se tienen que enfrentar las empresas de hoy en día es con el conocimiento y seguimiento de los datos de la competencia. Hay que tener suficientes datos e información como para ver cómo se mueve nuestra empresa, cómo lo hace la competencia y, sobre todo, quién lo está haciendo mejor en el presente; y cuáles son los pronósticos y perspectivas de ambos en el futuro. Evidentemente, las empresas crean productos o servicios, y se requiere máxima eficiencia en la ejecución de los mismos. La automatización y robotización de procesos y tareas, la transformación digital y el uso de sensores que emiten datos constantemente para que puedan ser analizados por los modelos y algoritmos de minería de datos o análisis de distinto grado de profundidad son algunos de los desafíos con los que se están enfrentando las empresas. En resumen, se trata de obtener todos los datos que son necesarios para analizar la gestión empresarial propia, la del entorno competitivo y la del cliente. Luego habrá que poner todos esos datos en valor, convertir los datos en información y la información en conocimiento para poder tomar las decisiones más acertadas, y medir el impacto en el negocio. Para ser capaces de superar estos desafíos es necesario dotarse de procesos ágiles, soportados por sistemas de información robustos, eficaces y eficientes, que permitan hacer uso de la información inteligente en la toma de decisiones.