● Comprender su significado, uso e importancia en los
negocios.
Mucho se ha escrito sobre la relación entre los datos y la
información. Los datos han sido llamados "materia prima de la información" y la información ha sido llamada "datos en contexto". A menudo una pirámide dividida en capas se utiliza para describir la relación entre los datos (en la base), la información, el conocimiento y la sabiduría (en la cúspide). Si bien la pirámide puede ser útil para describir por qué los datos necesitan ser bien gestionados, esta representación presenta varios desafíos para la Gestión de Datos. Se basa en la suposición de que los datos simplemente existen. Pero los datos no existen simplemente. Los datos hay que crearlos. Al describir una secuencia lineal desde los datos hasta la sabiduría, se omite reconocer que se necesita conocimiento para crear datos en primer lugar. Implica que los datos y la información son cosas separadas, cuando en realidad, los dos conceptos están entrelazados y son dependientes entre sí. Los datos son una forma de información y la información es una forma de datos. Dentro de una organización, puede ser útil trazar una línea entre la información y los datos con el propósito de generar una comunicación clara sobre los requisitos y las expectativas de los diferentes usos por las diferentes partes interesadas. (“Aquí hay un informe de ventas para el último trimestre [información]. El mismo se basa en datos de nuestro DW (Data Warehouse – Almacén de Datos) [datos]. El próximo trimestre se utilizarán estos datos [datos] para generar nuestras medidas de desempeño por trimestre [información]”). El reconocer que los datos y la información deben prepararse para diferentes propósitos permite capitalizar un principio central de la Gestión de Datos.
● Entender las principales características de los datos
entendidos como activos.
Un activo es un recurso económico, que puede tener un
dueño o puede ser controlado, y que tiene o produce valor. Los activos pueden ser convertidos en dinero. Los datos se reconocen ampliamente como un activo empresarial, aunque la comprensión de lo que significa gestionar los datos como un activo aún está evolucionando. A principios de los años noventa, algunas organizaciones consideraron cuestionable si el valor de intangibles debía tener un valor monetario. Ahora bien, el "valor de intangibles (como el sobreprecio pagado de por una empresa)" aparece comúnmente como un elemento en el estado de pérdidas y ganancias (P&L). Del mismo modo, aunque no universalmente adoptada, la monetización de datos es cada vez más común. No pasará mucho tiempo antes de que veamos esto como una característica de P&Ls. Las organizaciones de hoy en día confían en sus activos de datos para tomar decisiones más efectivas y operar de manera más eficiente. Las empresas utilizan los datos para comprender a sus clientes, crear nuevos productos y servicios y mejorar la eficiencia operativa reduciendo los costos y controlando los riesgos. Las agencias gubernamentales, las instituciones educativas y las organizaciones sin fines de lucro también necesitan datos de alta calidad para guiar sus actividades operacionales, tácticas y estratégicas. A medida que las organizaciones dependen cada vez más de los datos, el valor de los activos de datos puede establecerse con mayor claridad. Muchas organizaciones se identifican como "basadas en datos" (data-driven). Las empresas que buscan mantenerse competitivas deben dejar de tomar decisiones basadas en corazonadas o instintos y, en su lugar, utilizar disparadores de eventos y aplicar analítica para obtener un punto de vista sobre el cual accionar. Ser basado en datos incluye el reconocimiento de que los datos deben ser gestionados eficientemente y con disciplina profesional, a través de una asociación entre el liderazgo empresarial y la experiencia técnica. Además, el ritmo de los negocios de hoy implica que el cambio ya no es opcional; la disrupción digital es la norma. Para reaccionar ante esto, los negocios deben crear soluciones de información con profesionales técnicos de los datos que trabajen en conjunto con sus contrapartes del negocio. Deben planear cómo obtener y gestionar aquellos datos que saben que necesitan para apoyar la estrategia empresarial. También deben posicionarse para tomar ventaja de las oportunidades de aprovechar los datos de nuevas formas.
● Conocer las distintas fases del ciclo de vida de los datos.
Conceptualmente, incluye los procesos que crean u obtienen
datos, los que los mueven, transforman y almacenan, y permiten que se mantengan y compartan, y los que los usan o aplican, así como los que los desechan. A lo largo de su ciclo de vida, los datos pueden ser limpiados, transformados, fusionados, mejorados o agregados. A medida que se utilizan o mejoran los datos, a menudo se crean nuevos datos, por lo que el ciclo de vida tiene iteraciones internas que no se muestran en el diagrama. Los datos raramente son estáticos. La Gestión de Datos implica un conjunto de procesos interconectados alineados con el ciclo de vida de los datos. Los detalles del ciclo de vida de los datos dentro de una organización dada pueden ser bastante complicados, porque los datos no sólo tienen un ciclo de vida, sino que también tienen linaje (por ejemplo, un camino a lo largo del cual se mueve desde su punto de origen hasta su punto de uso, algunas veces llamado cadena de datos). La comprensión del linaje de datos requiere documentar el origen de los conjuntos de datos, así como su movimiento y transformación a través de los sistemas desde donde se pueden acceder y ser usados. El ciclo de vida y el linaje se intersectan y pueden entenderse mediante la relación entre sí. Cuanto mejor una organización entienda el ciclo de vida y el linaje de sus datos, mejor será su gestión.
● Asimilar los marcos teóricos presentados en el DMBOK2
en cuanto al desarrollo de capacidades de gestión de datos.
La Gestión de Datos implica un conjunto de funciones
interdependientes, cada una con sus propias metas, actividades y responsabilidades. Los profesionales de la Gestión de Datos deben tener en cuenta los desafíos inherentes al intento de extraer valor de un activo empresarial abstracto, al tiempo que equilibran las metas estratégicas y operativas, los requisitos específicos comerciales y técnicos, las demandas de riesgo y cumplimiento y los conflictos de entendimiento de lo que los datos representan y de si son de alta calidad. Hay mucho que tomar en consideración y controlar, por lo que ayuda el tener un marco de referencia para entender la Gestión de Datos de manera exhaustiva y ver las relaciones entre sus componentes. Debido a que las funciones dependen unas de otras y necesitan ser alineadas, en cualquier organización, las personas responsables de los diferentes aspectos de la Gestión de Datos necesitan colaborar para que la organización obtenga valor de sus datos. Los marcos de referencia desarrollados en diferentes niveles de abstracción proporcionan una gama de perspectivas sobre cómo abordar la Gestión de Datos. Estas perspectivas proporcionan una visión que puede usarse para aclarar la estrategia, desarrollar hojas de ruta, organizar equipos y alinear las funciones. Las ideas y conceptos presentados en el DMBOK2 se aplicarán de manera diferente entre las organizaciones. El enfoque de una organización para la Gestión de Datos depende de factores clave tales como su industria, la variedad de datos que utiliza, su cultura, nivel de madurez, estrategia, visión y los desafíos específicos que está abordando. Los marcos descritos en esta sección proporcionan algunas perspectivas a través de las cuales ver la Gestión de Datos y aplicar los conceptos presentados en el DMBOK. - Los dos primeros, el Modelo de Alineación Estratégica y el Modelo de Información de Amsterdam muestran relaciones de alto nivel que influyen en cómo una organización gestiona los datos. - El marco de referencia DAMA DMBOK (Diagrama de Rueda - DAMA Wheel, Hexágono y Diagrama de Contexto) describe las Áreas de Conocimiento de la Gestión de Datos, según lo define DAMA, y explica su representación visual dentro del DMBOK. - Los dos últimos toman la Rueda DAMA como punto de partida y reordenan las piezas para comprender mejor y describir las relaciones entre ellas.
Modelo de Alineación Estratégica
El Modelo de Alineación Estratégica (Henderson y Venkatraman, 1999) abstrae los motivadores fundamentales para cualquier enfoque de la Gestión de Datos. En su centro está la relación entre datos e información. La información se asocia más a menudo con la estrategia empresarial y el uso operacional de los datos. Los datos están asociados con la tecnología de la información y los procesos que soportan la gestión física de los sistemas que hacen que los datos sean accesibles para su uso. En torno a este concepto están los cuatro dominios fundamentales de la elección estratégica: estrategia empresarial, estrategia de tecnologías de la información, infraestructura y procesos organizacionales, infraestructura y procesos de tecnologías de la información. El Modelo de Alineación Estratégica (SAM por sus siglas en inglés) totalmente articulado es más complejo de lo que se ilustra en la imagen siguiente.
Cada uno de los hexágonos de cada esquina tiene sus
propias dimensiones subyacentes. Por ejemplo, dentro de la estrategia de negocio y de TI, es necesario tener en cuenta el alcance, las competencias y la gobernanza. Las operaciones deben tener en cuenta la infraestructura, los procesos y las habilidades. Las relaciones entre las piezas ayudan a una organización a entender tanto el ajuste estratégico de los diferentes componentes como la integración funcional de las piezas. Incluso la representación de alto nivel del modelo es útil para comprender los factores organizacionales que influyen en las decisiones sobre los datos y la gestión de datos.
Modelo de Información Ámsterdam
El Modelo de Información de Ámsterdam (AIM por sus siglas en inglés), al igual que el Modelo de Alineación Estratégica, adopta una perspectiva estratégica sobre el negocio y la alineación de las Tecnologías de la Información (Abcouwer, Maes y Truijens, 1997). Conocido como el 9-celdas, reconoce una capa intermedia que se enfoca en estructura y tácticas, incluyendo planificación y arquitectura. Además, reconoce la necesidad de la comunicación de información (expresada como el pilar del gobierno de la información y la calidad de los datos en la imagen). Los creadores de los marcos de referencia SAM y AIM describen en detalle la relación entre los componentes, tanto desde una perspectiva horizontal (Negocio / Estrategia de TI) como vertical (Estrategia de Negocio / Operación del Negocio).
Estructura DAMA-DMBOK
El Marco de Referencia DAMA-DMBOK profundiza en las
Áreas de Conocimiento que conforman el alcance general de la Gestión de Datos. Tres imágenes representan el Marco de Referencia de Gestión de Datos de DAMA:
• La Rueda DAMA • El Hexágono de Factores Ambientales
• Diagrama de Contexto del Área de Conocimiento
La Rueda DAMA define las Áreas de Conocimiento de la
Gestión de Datos. Coloca el gobierno de datos en el centro de las actividades de Gestión de Datos, ya que se requiere gobierno para lograr consistencia interna y equilibrio entre las funciones. Las otras áreas de conocimiento (Arquitectura de Datos, Modelado de Datos, etc.) se equilibran alrededor de la Rueda. Son todas partes necesarias de una función madura de Gestión de Datos, pero pueden implementarse en diferentes momentos, dependiendo de los requisitos de la organización. El Hexágono de Factores Ambientales muestra la relación entre las personas, el proceso y la tecnología, y proporciona la clave para leer los diagramas de contexto DMBOK. Pone metas y principios en el centro, ya que éstos proporcionan orientación sobre cómo las personas deben ejecutar actividades y utilizar eficazmente las herramientas necesarias para una Gestión de Datos exitosa. Cada elemento del diagrama se aplicará de manera distinta en diferentes organizaciones. Las listas de roles de alto nivel incluyen sólo las funciones más importantes. Cada organización puede adaptar este patrón para satisfacer sus propias necesidades. Las piezas componentes del diagrama de contexto incluyen: 1. Definición: Esta sección define concisamente el área de conocimiento. 2. Las Metas describen el propósito del Área de Conocimiento y los principios fundamentales que guían el desempeño de las actividades dentro de cada Área de Conocimiento. 3. Las Actividades son las acciones y tareas requeridas para alcanzar los objetivos del Área de Conocimiento. Algunas actividades se describen en términos de subactividades, tareas y pasos. Las actividades se clasifican en cuatro categorías: Planificación, Desarrollo, Operación y Control. • (P) Las Actividades de Planificación establecen el curso estratégico y táctico para cumplir los objetivos de Gestión de Datos. Las actividades de planificación ocurren de manera recurrente. • (D) Las Actividades de Desarrollo se organizan en torno al ciclo de vida de desarrollo de software (SDLC) (análisis, diseño, construcción, prueba, preparación y despliegue). • (C) Las Actividades de Control garantizan la continuidad de la calidad de los datos y la integridad, fiabilidad y seguridad de los sistemas a través de los cuales se accesan y se utilizan los datos. • (O) Las Actividades de Operación apoyan el uso, mantenimiento y mejora de sistemas y procesos a través de los cuales los datos son accesados y utilizados. 4. Las Entradas son las cosas tangibles que cada Área de Conocimiento requiere para iniciar sus actividades. Muchas actividades requieren los mismos insumos. Por ejemplo, muchos requieren el conocimiento de la Estrategia de Negocio como entrada. 5. Las Salidas son los productos de las actividades dentro del área del conocimiento, las cosas tangibles que cada función es responsable de producir. Los productos pueden ser finales en sí mismos o insumos de otras actividades. Varios productos primarios son creados por múltiples funciones. 6. Roles y Responsabilidades describen cómo los individuos y los equipos contribuyen a las actividades dentro del área del conocimiento. Los roles se describen conceptualmente, con un enfoque en los grupos de roles requeridos por la mayoría de las organizaciones. Los roles para las personas se definen en términos de habilidades y requisitos de calificación. El Marco de Habilidades para la Era de la Información (SFIA) se utilizó para ayudar a alinear títulos de roles. Muchos roles serán interfuncionales. 7. Los Proveedores son las personas responsables de proporcionar o permitir el acceso a los insumos para las actividades. 8. Los Consumidores son aquellos que se benefician directamente de los productos primarios generados por las actividades de Gestión de Datos. 9. Los Participantes son las personas que realizan, administran el desempeño o aprueban las actividades en el Área de Conocimiento. 10. Las Herramientas son las aplicaciones y otras tecnologías que permiten las metas del Área de Conocimiento. 11. Las Técnicas son los métodos y procedimientos utilizados para realizar actividades y producir entregables dentro de un área de conocimiento. Las técnicas incluyen convenciones comunes, recomendaciones de mejores prácticas, estándares y protocolos y, cuando proceda, enfoques alternativos emergentes. 12. Las Métricas son normas para medir o evaluar el desempeño, el progreso, la calidad, la eficiencia u otro efecto. Las secciones de métricas identifican facetas medibles del trabajo que se realiza dentro de cada área de conocimiento. Las métricas también pueden medir características más abstractas, como la mejora o el valor. Mientras que la Rueda DAMA presenta el conjunto de las Áreas de Conocimiento a un nivel alto, el Hexágono reconoce componentes de la estructura de las Áreas de Conocimiento, y los Diagramas de Contexto presentan los detalles dentro de cada Área de Conocimiento. Ninguna de las partes del Marco de Referencia de Gestión de Datos DAMA existente describe la relación entre las diferentes Áreas de Conocimiento.
Pirámide DMBOK (Aiken)
Si se les pregunta, muchas organizaciones dirán que
quieren sacar el máximo provecho de sus datos, están luchando por esa pirámide dorada de prácticas avanzadas (minería de datos, análisis, etc.). Pero esa pirámide es sólo la parte superior de una estructura más grande, un pináculo sobre un cimiento. La mayoría de las organizaciones no tienen el lujo de definir una estrategia de Gestión de Datos antes de empezar a tener que gestionar los datos. En su lugar, construyen hacia esa capacidad, la mayoría de las veces bajo condiciones menos que óptimas. El Marco de Referencia de Peter Aiken utiliza las áreas funcionales del DMBOK para describir la situación en la que se encuentran muchas organizaciones. Una organización puede utilizarla para definir un camino hacia un estado donde tengan datos y procesos confiables para apoyar los objetivos estratégicos del negocio. Al tratar de alcanzar este objetivo, muchas organizaciones pasan por una progresión lógica de pasos similar.
1. Fase 1: La organización compra una aplicación que
incluye capacidades de base de datos. Esto significa que la organización tiene un punto de partida para el modelado / diseño de datos, el almacenamiento de datos y la seguridad de los datos (por ejemplo, mantener a algunas personas dentro y dejar otras afuera). Para mantener el sistema funcionando dentro de su entorno y con sus datos se requiere trabajar en integración e interoperabilidad. 2. Fase 2: Una vez que empiecen a usar la aplicación, encontrarán desafíos con la calidad de sus datos. Pero obtener datos de mayor calidad depende de Metadatos confiables y una Arquitectura de Datos consistente. Éstos proporcionan claridad acerca de cómo los datos de diversos sistemas trabajan juntos. 3. Fase 3: las prácticas disciplinadas para la gestión de la Calidad de los Datos, los Metadatos y la arquitectura requieren un Gobierno de Datos que provea apoyo estructural para las actividades de Gestión de Datos. El Gobierno de Datos también permite la ejecución de iniciativas estratégicas, tales como Gestión de Documentos y Contenidos, Gestión de Datos de Referencia, MDM (Master Data Management - Gestión de Datos Maestros), DW (DataWarehouse- Almacén de Datos) y BI (Business Intelligence - Inteligencia de Negocios), que habiliten enteramente las prácticas avanzadas dentro de la pirámide dorada. 4. Fase 4: La organización aprovecha los beneficios de los datos bien gestionados y avanza en sus capacidades analíticas.
La pirámide de Aiken se basa en la Rueda DAMA, pero
también le provee información al mostrar la relación entre las Áreas de Conocimiento. No son todas intercambiables; tienen varios tipos de interdependencias. El marco de referencia de la pirámide tiene dos motivadores. En primer lugar, la idea de construir sobre una base, utilizando componentes que necesitan estar en los lugares adecuados para apoyarse mutuamente. En segundo lugar, la idea algo contradictoria de que éstas pueden ser puestas en práctica en un orden arbitrario. Marco de Referencia DAMA para la Gestión de Datos Evolucionado
La pirámide de Aiken describe cómo las organizaciones
evolucionan hacia mejores prácticas de Gestión de Datos. Otra manera de mirar las Áreas de Conocimiento de DAMA es explorar las dependencias entre ellas. Desarrollada por Sue Geuens, el marco de referencia de la imagen siguiente reconoce que las funciones de BI y Analítica tienen dependencias de todas las demás funciones de Gestión de Datos. Dependen directamente de los datos maestros y de las soluciones de DW. Pero éstos, a su vez, dependen de los sistemas y aplicaciones que los alimentan de datos. La fiabilidad de la calidad de los datos, el diseño de los datos y las prácticas de interoperabilidad de los datos son fundamentales para tener sistemas y aplicaciones confiables. Además, el gobierno de datos, que dentro de este modelo incluye la gestión de Metadatos, la seguridad de datos, la Arquitectura de Datos y la Gestión de Datos de Referencia, proporciona una base en la que todas las demás funciones son dependientes. Una tercera alternativa a la Rueda DAMA, (siguiente imagen). Esto también se basa en conceptos arquitectónicos para proponer un conjunto de relaciones entre las Áreas de Conocimiento DAMA. Proporciona detalles adicionales sobre el contenido de algunas áreas de conocimiento con el fin de aclarar estas relaciones. El marco de referencia comienza con el propósito guía de la Gestión de Datos: Permitir a las organizaciones obtener valor de sus activos de datos como lo hacen con otros activos. La derivación del valor requiere una gestión del ciclo de vida, por lo que las funciones de Gestión de Datos relacionadas con el ciclo de vida de los datos se representan en el centro del diagrama. Estos incluyen planificación y diseño de datos confiables y de alta calidad; establecer procesos y funciones a través de los cuales los datos pueden ser habilitados para su uso y también puedan ser mantenidos; y, finalmente, utilizar los datos en varios tipos de análisis y a través de esos procesos, incrementar su valor. La sección de gestión del ciclo de vida describe el diseño de la Gestión de Datos y las funciones operativas (modelado, arquitectura, almacenamiento y operaciones, etc.) necesarias para soportar los usos tradicionales de los datos (BI, gestión de documentos y contenido). También reconoce las funciones emergentes de Gestión de Datos (almacenamiento de Big Data) que soportan usos emergentes de datos (Ciencia de Datos, análisis predictivo, etc.). En los casos en que los datos se gestionan realmente como un activo, las organizaciones pueden obtener un valor directo de sus datos vendiéndolos a otras organizaciones (monetización de datos). Las organizaciones que se centran sólo en funciones directas del ciclo de vida no obtendrán tanto valor de sus datos como aquellos que apoyan el ciclo de vida de los datos a través de actividades fundamentales y de supervisión. Las actividades fundamentales, como la gestión del riesgo de datos, Metadatos y gestión de la Calidad de los Datos abarcan el ciclo de vida de los datos. Permiten tomar mejores decisiones de diseño y facilitan el uso de los datos. Si son bien ejecutadas, el mantenimiento de los datos se vuelve menos costoso, los consumidores de datos tienen más confianza en ellos, y las oportunidades para utilizarlos se expanden. Para apoyar exitosamente a la producción y el uso de datos y para asegurar que las actividades fundamentales se ejecuten con disciplina, muchas organizaciones establecen la supervisión bajo la forma de gobierno de datos. Un programa de gobierno de datos permite que una organización sea impulsada por datos, estableciendo la estrategia y apoyando principios, políticas y prácticas de custodia que aseguren que la organización reconozca y actúe sobre las oportunidades para obtener valor de sus datos. Un programa de gobierno de datos también debe participar en actividades de gestión del cambio organizativo para educar a la organización y fomentar comportamientos que permitan el uso estratégico de los datos. Por lo tanto, la necesidad del cambio en la cultura abarca la amplitud de las responsabilidades de gobierno de datos, especialmente a medida que las prácticas de Gestión de Datos de una organización maduran.
El Marco de Referencia de Gestión de Datos de DAMA
también puede representarse como una evolución de la Rueda DAMA, con actividades centrales rodeadas de actividades de ciclo de vida y uso de datos, contenidas dentro de las constricciones de gobierno.
Las actividades principales, como la gestión de Metadatos, la
gestión de la Calidad de los Datos y la definición estructural de los datos (arquitectura), están en el centro del marco. Las actividades de gestión del ciclo de vida pueden definirse desde una perspectiva de planificación (gestión de riesgos, modelado, diseño de datos, Gestión de Datos de Referencia) y una perspectiva de habilitación (MDM, desarrollo de tecnologías de datos, integración e interoperabilidad de datos, DW, y almacenamiento y operaciones de datos). Los usos emergen de las actividades de gestión del ciclo de vida: uso de datos maestros, gestión de documentos y contenidos, BI, ciencia de datos, análisis predictivo, visualización de datos. Muchos de ellos crean más datos mejorando o desarrollando conocimientos sobre los datos existentes. Las oportunidades de monetización de datos pueden ser identificadas como usos de datos. Las actividades de Gestión de Datos proporcionan supervisión y contención, a través de estrategias, principios, políticas y custodia. Generan consistencia mediante la clasificación y valoración de los datos. La intención de presentar diferentes representaciones visuales del Marco de Referencia de Gestión de Datos DAMA es proveer una perspectiva adicional y abrir discusiones sobre cómo aplicar los conceptos presentados en el DMBOK. A medida que crece la importancia de la Gestión de Datos, estos marcos se convierten en útiles herramientas de comunicación tanto dentro de la comunidad de Gestión de Datos como entre la comunidad de Gestión de Datos y nuestros interesados.
● Comprender que es, su rol en la gestión de datos y
mecanismos de implementación
El Gobierno de Datos se define como el ejercicio de autoridad
y control (planificación, seguimiento y ejecución) sobre la gestión de los activos de datos. Todas las organizaciones toman decisiones sobre los datos, independientemente de si tienen una función formal de Gobierno de Datos. Aquellos que establecen un programa formal de Gobierno de Datos ejercen autoridad y control con mayor intencionalidad (Seiner, 2014). Estas organizaciones están en mejores condiciones de aumentar el valor que obtienen de sus activos de datos. La función de Gobierno de Datos guía todas las demás funciones de la gestión de datos. El propósito del Gobierno de Datos es asegurar que los datos se gestionen correctamente, de acuerdo con las políticas y las mejores prácticas (Ladley, 2012). Mientras que el propósito de la Gestión de Datos en general es asegurar que una organización obtenga valor de sus datos, el Gobierno de Datos se centra en cómo se toman las decisiones sobre los datos y cómo se espera que se comporten las personas y los procesos en relación con los datos. El alcance y el enfoque de un programa particular de Gobierno de Datos dependerá de las necesidades de la organización. La mayoría de los programas incluyen: • Estrategia: Definir, comunicar e impulsar la ejecución de la Estrategia de Datos y la Estrategia de Gobierno de Datos. • Política: Establecimiento y aplicación de políticas relacionadas con la gestión de datos y Metadatos, acceso, uso, seguridad y calidad. • Normas y calidad: Establecimiento y aplicación de estándares de calidad de datos y Arquitectura de Datos. • Supervisión: Proporcionar observación práctica, auditoría y corrección en áreas clave de calidad, políticas y gestión de datos (a menudo conocidas como custodia). • Cumplimiento: Garantizar que la organización pueda cumplir con los requerimientos regulatorios relacionados con los datos. • Gestión de problemas: Identificar, definir, escalar y resolver problemas relacionados con la seguridad de los datos, el acceso a los datos, la calidad de los datos, el cumplimiento de la regulación, la propiedad de los datos, las políticas, los estándares, la terminología o los procedimientos de gobierno de los datos. • Proyectos de gestión de datos: Patrocinar esfuerzos para mejorar las prácticas de gestión de datos. • Valoración de activos de datos: Establecimiento de estándares y procesos para definir consistentemente el valor comercial de los activos de datos. Para lograr estos objetivos, un programa de Gobierno de Datos desarrollará políticas y procedimientos, cultivará prácticas de custodia de datos en múltiples niveles dentro de la organización y participará en esfuerzos de gestión del cambio organizacional que comuniquen activamente a la organización los beneficios de un mejor Gobierno de Datos y las conductas necesarias para gestionar los datos como un activo de manera exitosa. Para la mayoría de las organizaciones, la adopción formal del Gobierno de Datos requiere del apoyo de la gestión del cambio organizaciona, así como el patrocinio de un ejecutivo de alto nivel como son el Oficial en Jefe de Riesgos, Oficial en Jefe de Finanzas, Oficial en Jefe de Datos. La capacidad de crear y compartir datos e información ha transformado nuestras interacciones personales y económicas. Las condiciones dinámicas del mercado y un mayor conocimiento de los datos como diferenciador competitivo están provocando que las organizaciones reajusten sus responsabilidades de gestión de datos. Este tipo de cambio es evidente en los sectores financiero, de comercio electrónico, gubernamental y minorista. Las organizaciones se esfuerzan cada vez más por ser más proactivas al considerar los requerimientos de datos como parte del desarrollo de estrategias, la planificación de programas y la implementación de tecnología. Sin embargo, hacerlo a menudo implica importantes retos culturales. Además, dado que la cultura puede hacer descarrilar cualquier estrategia, los esfuerzos de Gobierno de Datos deben incluir un componente de cambio cultural, una vez más, con el apoyo de un fuerte liderazgo. Para beneficiarse de los datos como un activo corporativo, la cultura organizacional debe aprender a valorar los datos y las actividades de gestión de datos. Incluso con la mejor estrategia de datos, los planes de gobierno y gestión de datos no tendrán éxito a menos que la organización acepte y gestione el cambio. Para muchas organizaciones, el cambio cultural es un reto importante. Uno de los principios fundamentales de la gestión del cambio es que el cambio organizacional requiere un cambio individual (Hiatt y Creasey, 2012). Cuando el gobierno y la gestión de datos exigen cambios de comportamiento significativos, se requiere una gestión formal del cambio para lograr el éxito. El Gobierno de Datos no es un fin en sí mismo. Necesita alinearse directamente con la estrategia de la organización. Cuanto más claramente ayude a resolver problemas organizacionales, más probable será que las personas cambien sus comportamientos y adopten prácticas de gobierno. Los motivadores del Gobierno de Datos se centran con mayor frecuencia en la reducción de riesgos o en la mejora de los procesos. • Reducción de riesgos • Gestión general de riesgos: Supervisión de los datos para control de riesgos financieros o de reputación, incluida la respuesta a cuestiones legales (E-Discovery) y reglamentarias. • Seguridad de los datos: Protección de los activos de datos mediante controles de disponibilidad, usabilidad, integridad, consistencia, auditoria y seguridad de los datos. • Privacidad: Control de información para la identificación personal (privada o confidencial) a través del monitoreo de políticas y cumplimiento. • Mejora de los procesos • Cumplimiento regulatorio: La capacidad de responder de forma eficaz y coherente a los requerimientos regulatorios. • Mejora de la calidad de los datos: la capacidad de contribuir a mejorar el rendimiento del negocio haciendo que los datos sean más confiables. • Gestión de Metadatos: Establecimiento de un diccionario de datos empresarial para definirlos y localizarlos en la organización; hay que asegurar que una amplia gama de otros Metadatos se gestiona y se ponen a disposición de la organización. • Eficiencia en proyectos de desarrollo: Las mejoras en el ciclo de vida del desarrollo de software para abordar los problemas y las oportunidades en la gestión de datos en toda la organización, incluida la especificación técnica de los datos mediante la gestión del ciclo de vida de los datos. • Gestión de proveedores: Control de contratos y acuerdos con respecto a los datos, tales como almacenamiento en nube, adquisición de datos externos, ventas de datos como producto y operaciones de externalización de datos. Es esencial aclarar los motivadores de negocio particulares para el Gobierno de Datos dentro de una organización y alinearlos con la estrategia general del negocio. Enfocar la "organización en el Gobierno de Datos" a menudo enajena a los líderes quienes perciben un sobre esfuerzo adicional sin beneficios aparentes. Sensibilizar la cultura organizacional es necesario para determinar el lenguaje correcto, el modelo operativo y los roles para el programa. Al momento de escribir el DMBOK2, el término organización está siendo reemplazado por términos como modelo o marco operativo. Si bien las personas a veces afirman que es difícil entender lo que es el Gobierno de los Datos, el gobierno en sí mismo es un concepto común. En lugar de inventar nuevos enfoques, los profesionales de la gestión de datos pueden aplicar los conceptos y principios de otros tipos de gobierno al Gobierno de los Datos. Una analogía común es equiparar el Gobierno de Datos con la auditoría y la contabilidad. Los auditores y contadores establecen las normas para la gestión de los activos financieros. Los profesionales del Gobierno de Datos establecen reglas para la gestión de los activos de datos. Otras áreas llevan a cabo estas reglas. El Gobierno de Datos no es algo que se hace una sola vez. La gobernabilidad de los datos requiere un programa continuo enfocado en asegurar que una organización obtenga valor de sus datos y reduzca el riesgo relacionado con los datos. Un equipo de Gobierno de Datos puede ser una organización virtual o una organización estructurada con responsabilidades específicas. Para que sean eficaces, es necesario que se comprendan bien las funciones y actividades de la gestión de datos. Deben construirse en torno a un marco operativo que funcione bien en la organización. Un programa de Gobierno de Datos debe tener en cuenta los problemas organizacionales y culturales, los desafíos y oportunidades específicas de la gestión de datos dentro de la organización. El Gobierno de Datos es independiente del gobierno de IT, el gobierno de IT toma decisiones sobre las inversiones en IT, el portafolio de aplicaciones de IT y el portafolio de proyectos de IT, es decir, sobre el hardware, el software y la arquitectura técnica general. El gobierno de IT alinea las estrategias e inversiones de IT con los objetivos y estrategias de la empresa. El marco COBIT (Control Objectives for Information and Related Technologies – Objetivos de Control para la Información y Tecnología Relacionada) proporciona estándares para el gobierno de TI, pero sólo una pequeña porción del marco COBIT se ocupa de la gestión de datos e información. Algunos temas críticos, como el cumplimiento de Sarbanes- Oxley (EE. UU.), abarcan la preocupación por el gobierno corporativo, el gobierno de TI y el Gobierno de Datos. Por el contrario, el Gobierno de Datos se centra exclusivamente en la gestión de los activos de datos y de los datos como activos. La meta del Gobierno de Datos es permitir que una organización gestione los datos como un activo. El Gobierno de Datos proporciona los principios, las políticas, los procesos, el marco, las métricas y la supervisión para gestionar los datos como un activo y para orientar las actividades de gestión de datos en todos los niveles. Para lograr este objetivo general, un programa de Gobierno de Datos debe ser: • Sustentable: El programa de Gobierno de Datos debe ser "pegajoso". El Gobierno de Datos no es un proyecto con un fin definido; es un proceso continuo que requiere un compromiso organizacional. El Gobierno de Datos necesita cambios en la forma en que se gestionan y utilizan los datos. Esto no siempre significa nuevos cambios organizacionales ni trastornos. Significa gestionar el cambio de una manera que sea sostenible más allá de la implementación inicial de cualquier componente de Gobierno de Datos. El Gobierno de Datos sostenible depende del liderazgo, el patrocinio y del sentido de propiedad. • Embebido: El Gobierno de Datos no es un proceso adicional. Las actividades del Gobierno de Datos deben incorporarse a los métodos de desarrollo de programas informáticos, al uso de datos para análisis, la gestión de Datos Maestros y a la gestión de riesgos. • Medido: Un Gobierno de Datos bien hecho tiene un impacto financiero positivo, pero para demostrar este impacto es necesario comprender el punto de partida y planificar una mejora medible. La implementación de un programa de Gobierno de Datos requiere un compromiso con el cambio. Los siguientes principios, desarrollados desde principios de la década de 2000, pueden ayudar a establecer una base sólida para el Gobierno de Datos.
• Liderazgo y estrategia: El éxito del Gobierno de Datos inicia
con un liderazgo visionario y comprometido. Las actividades de gestión de datos están guiadas por una estrategia de datos que es impulsada por la estrategia de negocio de la empresa. • Impulsado por el negocio: El Gobierno de Datos es un programa empresarial y, como tal, debe controlar las decisiones de TI relacionadas con los datos tanto como gobierna la interacción del negocio con los datos. • Responsabilidad compartida: En todas las Áreas de Conocimiento de la Gestión de Datos, Gobierno de Datos es una responsabilidad empresarial compartida entre los Data Stewards y los profesionales técnicos de Gestión de Datos. • Multi-capas: El Gobierno de Datos se produce tanto a nivel empresarial como local y, a menudo, en niveles intermedios. • Basado en un marco de referencia: Debido a que las actividades de Gobierno de Datos requieren coordinación entre áreas funcionales, el programa de Gobierno de Datos debe establecer un marco operativo que defina responsabilidades e interacciones. • Basado en principios: Los principios rectores son la base de las actividades de Gobierno de Datos, y especialmente de la política de Gobierno de Datos. Con frecuencia, las organizaciones desarrollan políticas sin principios formales – están intentando resolver problemas particulares. Los principios pueden ser a veces una ingeniería en reversa desde una política. Sin embargo, es mejor articular un conjunto básico de principios y mejores prácticas como parte del trabajo de políticas. La referencia a los principios puede mitigar la resistencia potencial. Con el tiempo, en una organización surgirán otros principios rectores. Publíquelos en un entorno interno compartido junto con otros artefactos de Gobierno de los Datos. Una organización centrada en los datos los valora y administra como un activo a través de todas las fases de su ciclo de vida, incluyendo el desarrollo de proyectos y las operaciones en curso. Para centrarse en los datos, una organización debe cambiar la forma en que traduce la estrategia en acción. Los datos ya no se tratan como un subproducto del proceso y las aplicaciones. Garantizar que los datos sean de alta calidad es un objetivo de los procesos de negocio. A medida que las organizaciones se esfuerzan por tomar decisiones basadas en la información obtenida a partir de la analítica, la gestión eficaz de datos se convierte en una prioridad muy alta. Las personas tienden a confundir datos y tecnología de la información. Para centrarse en los datos, las organizaciones necesitan pensar de manera diferente y reconocer que la Gestión de Datos es diferente de la Gestión de TI. Este cambio no es fácil. La cultura existente, con su política interna, la ambigüedad sobre la propiedad, la competencia presupuestaria, y los sistemas legados, pueden ser un gran obstáculo para establecer una visión empresarial de Gobierno de Datos y Gestión de Datos. Si bien cada organización necesita evolucionar sus propios principios, aquellos que buscan obtener más valor de sus datos probablemente compartan lo siguiente: • Los datos deben gestionarse como un activo corporativo. • Las mejores prácticas de Gestión de Datos deben incentivarse en toda la organización. • La estrategia de datos empresarial debe estar directamente alineada con la estrategia general de negocio. • Los procesos de Gestión de Datos deben mejorarse continuamente.
Gobierno de Datos puede entenderse en términos de
gobernanza política. Incluye funciones legislativas (definición de políticas, estándares y arquitectura de datos empresarial), funciones de tipo judicial (gestión de problemas y escalamiento), y funciones ejecutivas (protección y servicio, responsabilidades administrativas). Para gestionar mejor el riesgo, la mayoría de las organizaciones adoptan una forma representativa de Gobierno de Datos, para que todas las partes interesadas puedan ser escuchadas. Cada organización debe adoptar un modelo de gobierno que respalde su estrategia de negocio y es probable que tenga éxito dentro de su propio contexto cultural. Las organizaciones también deben estar preparadas para evolucionar ese modelo para enfrentar nuevos desafíos. Los modelos difieren con respecto a su estructura organizativa, nivel de formalidad y enfoque para la toma de decisiones. Algunos modelos están organizados de forma centralizada, mientras que otros son distribuidos. Las organizaciones de Gobierno de Datos también pueden tener múltiples capas para abordar las inquietudes en diferentes niveles dentro de una empresa – local, divisional y empresarial. El trabajo de Gobierno a menudo se divide entre múltiples comités, cada uno con un propósito y un nivel de supervisión diferentes de los demás. modelo genérico de Gobierno de Datos, con actividades en diferentes niveles dentro de la organización (eje vertical), así como la separación de las responsabilidades de gobierno dentro de las funciones de la organización y entre las áreas técnicas (IT) y negocio. Comités / Órganos Típicos de Gobierno de Datos.
Tipos de Modelos Operativos de Gobierno de Datos
En un modelo centralizado, una organización de Gobierno de
Datos supervisa las actividades en todas las áreas temáticas. En un modelo replicado, cada unidad de negocio adopta el mismo modelo operativo y estándares del Gobierno de Datos. En un modelo federado, una organización de Gobierno de Datos coordina con varias unidades de negocio para mantener definiciones y estándares coherentes. ● Conocer los distintos marcos operativos que pueden implementarse con sus fortalezas y debilidades. Construcciones Organizacionales de Gestión de Datos Un paso fundamental en el diseño de la Organización de Gestión de Datos es identificar el modelo operativo más adecuado para la organización. El modelo operativo es un marco de referencia que articula roles, responsabilidades y procesos de toma de decisiones. Éste describe cómo las personas y las funciones colaborarán. Un modelo operativo confiable ayuda a crear responsabilidad, garantizando que se representen las funciones correctas dentro de la organización. Facilita la comunicación y proporciona un proceso para resolver problemas. Si bien forma la base de la estructura organizacional, el modelo operativo no es un organigrama: no se trata de poner nombres en los cuadros, sino de describir la relación entre los componentes de la organización. Esta sección presentará una descripción general de alto nivel de los pros y los contras de los modelos operativos descentralizados, de red, híbridos, federados y centralizados. 1. Modelo Operativo Descentralizado En un modelo descentralizado, las responsabilidades de gestión de datos se distribuyen a través de diferentes líneas de negocios y IT. La colaboración está basada en comités; no hay un solo dueño. Muchos programas de Gestión de Datos comienzan como esfuerzos básicos para unificar las prácticas de gestión de datos en una organización y, por lo tanto, tienen una estructura descentralizada.
Los beneficios de este modelo incluyen su estructura
relativamente plana y su alineación de la gestión de datos con las líneas de Negocio o IT. Esta alineación generalmente significa que hay una comprensión clara de los requerimientos de datos. También es relativamente fácil de implementar o mejorar. Los inconvenientes incluyen el desafío de tener muchos participantes involucrados en los cuerpos de gobierno y en la toma de decisiones. En general, es más difícil implementar decisiones colaborativas que los edictos centralizados. Los modelos descentralizados generalmente son menos formales y, debido a esto, pueden ser más difíciles de sostener con el tiempo. Para tener éxito, deben tener formas de imponer la consistencia de las prácticas. Esto puede ser difícil de coordinar. También, a menudo es difícil definir la propiedad de los datos con un modelo descentralizado.
2. Modelo Operativo de Red
La informalidad descentralizada puede hacerse más formal a través de una serie documentada de conexiones y responsabilidades a través de una matriz RACI (Responsible, Accountable, Consulted, Informed - Responsable, A cargo, Consultado e Informado). Esto se denomina modelo de red porque funciona como una serie de conexiones conocidas entre personas y roles, y se puede diagramar como una "red".
Los beneficios de un modelo de red son similares a los de
un modelo descentralizado (estructura plana, alineación, configuración rápida). La adición de una matriz RACI ayuda a crear responsabilidad sin afectar los organigramas organizacionales. El inconveniente adicional es la necesidad de mantener y hacer cumplir las expectativas relacionadas con la matriz RACI. 3. Modelo Operativo Centralizado El modelo operativo de gestión de datos más formal y maduro es uno centralizado. Aquí todo es propiedad de la Organización de Gestión de Datos. Aquellos involucrados en gobernar y gestionar datos reportan directamente a un líder de gestión de datos, quien es responsable de Gobierno, Custodia, Gestión de Metadatos, Gestión de Calidad de Datos, Gestión de Datos Maestros y de Referencia, Arquitectura de Datos, Análisis de Negocio, etc.
El beneficio de un modelo centralizado es que este
establece un puesto ejecutivo formal para la gestión de datos o el gobierno de datos. Hay una persona en la cima. La toma de decisiones es más fácil porque la responsabilidad es clara. Dentro de la organización, los datos se pueden gestionar por tipo o por área temática. El inconveniente es que la implementación de un modelo centralizado generalmente requiere un cambio organizacional significativo. También existe el riesgo de que la separación formal del rol de gestión de datos lo aleje de los procesos centrales del negocio y pueda hacer que el conocimiento se pierda con el tiempo. Un modelo centralizado generalmente requiere una nueva organización. Surge la pregunta: ¿Dónde encaja la Organización de Gestión de Datos dentro de la empresa en general? ¿Quién lo dirige y a quién le reporta el líder? Cada vez se está volviendo más común para una organización de gestión de datos que no se le reporte al CIO debido al deseo de mantener una perspectiva de datos en el negocio, más que en TI. Estas organizaciones también son comúnmente parte de un equipo de operaciones o de servicios compartidos o parte de la organización del Director de Datos. 4. Modelo Operativo Híbrido Como su nombre lo indica, el modelo operativo híbrido abarca los beneficios de los modelos descentralizados y de los centralizados. En un modelo híbrido, un Centro de Excelencia de gestión de datos centralizado trabaja con grupos de unidades de negocio descentralizadas, generalmente a través de un comité directivo ejecutivo que representa las líneas clave de negocios y un conjunto de grupos de trabajo tácticos que abordan problemas específicos. En este modelo, algunos roles permanecen descentralizados. Por ejemplo, los Arquitectos de Datos pueden permanecer dentro de un grupo de Arquitectura Empresarial; las líneas de negocio pueden tener sus propios equipos de Calidad de Datos. Cuáles roles están centralizados y cuáles se mantienen descentralizados puede variar ampliamente, dependiendo en gran medida de la cultura organizacional. El principal beneficio de un modelo híbrido es que éste establece una dirección adecuada desde la parte superior de la organización. Hay un ejecutivo responsable de la gestión y/o gobierno de datos. Los equipos de las unidades de negocio tienen una amplia responsabilidad y pueden alinearse con las prioridades del negocio para proporcionar un mayor enfoque. Se benefician del apoyo de un Centro de Excelencia de gestión de datos dedicado, que puede ayudar a enfocarse hacia desafíos específicos. Los desafíos incluyen establecer la organización, ya que hacerlo generalmente requiere personal adicional para crear el staff de un Centro de Excelencia. Los equipos de las Unidades de Negocio pueden tener diferentes prioridades, y éstas deberán gestionarse desde una perspectiva empresarial. Además, a veces hay conflictos entre las prioridades de la organización central y aquellas prioridades de las organizaciones descentralizadas. 5. Modelo Operativo Federado Una variante del modelo operativo híbrido, el modelo federado, proporciona capas adicionales de centralización/descentralización, que a menudo se requieren en grandes empresas globales. Imagine una Organización Empresarial de Gestión de Datos con múltiples modelos híbridos de gestión de datos delineados según la división o la región. Un modelo federado proporciona una estrategia centralizada con ejecución descentralizada. Por lo tanto, para las grandes empresas, puede ser el único modelo que puede funcionar. Un ejecutivo de gestión de datos que rinde cuentas en toda la organización dirige el Centro de Excelencia empresarial. Por supuesto, diferentes líneas de negocios están facultadas para cumplir con los requerimientos en función de sus necesidades y prioridades. La federación permite a la organización priorizar en función de entidades de datos específicas, desafíos divisionales o prioridades regionales. El principal inconveniente es la complejidad. Hay muchas capas y es necesario que exista un equilibrio entre la autonomía de las líneas de negocio y las necesidades de la empresa. Este equilibrio puede afectar las prioridades de la empresa. Identificando el Mejor Modelo para una Organización El modelo operativo es un punto de partida para mejorar las prácticas de la gestión de datos y del gobierno de datos. Introducirlo requiere un entendimiento de cómo éste puede afectar la organización actual y cómo es probable que éste deba evolucionar con el tiempo. Dado que el modelo operativo servirá como la estructura a través de la cual se definirán, aprobarán y ejecutarán las políticas y los procesos, es crítico identificar la mejor opción para una organización. Evalúe si la estructura organizacional actual es centralizada, descentralizada o una combinación, jerárquica o relativamente plana. Caracterice cómo son las divisiones o regiones independientes. ¿Operan casi de manera autosuficiente? ¿Son sus requerimientos y objetivos muy diferentes el uno del otro? Lo que es más importante, trate de determinar cómo se toman las decisiones (por ejemplo, democráticamente o por decreto), y cómo se implementan. Las respuestas deberían dar un punto de partida para entender la ubicación de la organización en el espectro entre descentralizado y centralizado. Entender cuales son los principales órganos de Gobierno del dato, como se insertan en la organización y cual es su aporte a la gestión de datos.
Alternativas de DMO y Consideraciones de Diseño
La mayoría de las organizaciones comienzan con un modelo descentralizado antes de avanzar hacia una Organización de Gestión de Datos (DMO) formal. A medida que una organización ve el impacto de las mejoras en la calidad de los datos, puede comenzar a formalizar la responsabilidad a través de una matriz RACI de gestión de datos y evolucionar hacia un modelo de red. Con el tiempo, las sinergias entre los roles distribuidos se harán más obvias y se identificarán las economías de escala que llevarán algunos roles y personas hacia los grupos organizados. Eventualmente, esto puede transformarse en un modelo híbrido o federado. Algunas organizaciones no tienen el lujo de pasar por este proceso de madurez. Se ven obligados a madurar rápidamente en función de un impacto en el mercado o de nuevas regulaciones gubernamentales. En tal caso, es importante abordar de manera proactiva la incomodidad asociada con el cambio organizacional para que sea exitoso y sostenible. Cualquiera que sea el modelo elegido, recuerde que la simplicidad y la facilidad de uso son esenciales para la aceptación y la sostenibilidad. Si el modelo operativo se ajusta a la cultura de una empresa, entonces la gestión de datos y el gobierno adecuado pueden integrarse en las operaciones y alinearse con la estrategia. Tenga estos consejos en mente cuando construya un Modelo Operativo: • Determine el punto de partida evaluando el estado actual • Ate el modelo operativo a la estructura de la organización • Tenga en cuenta: • Complejidad de la organización + Madurez • Complejidad del Dominio + Madurez • Escalabilidad • Obtenga patrocinio ejecutivo - imprescindible para un modelo sustentable • Asegúrese de que cualquier foro de liderazgo (comité directivo, consejo asesor, consejo) sea un cuerpo de toma de decisiones • Considere programas piloto y etapas de implementación • Céntrese en dominios de datos de gran valor y alto impacto • Use lo que ya existe • Nunca tome un enfoque de “Talla Única para Todos” (One-Size-Fits-All) ● Conocer los principales roles de Gobierno del dato y sus actividades principales.
Roles de Gestión de Datos
Los roles de gestión de datos se pueden definir a nivel funcional o individual. Los nombres para los roles serán diferentes entre las organizaciones y algunas organizaciones tendrán mayor o menor necesidad de algunos de los roles. Todos los roles de IT se pueden asignar hacia puntos en el ciclo de vida de los datos, por lo que todos impactan la gestión de los datos, ya sea directamente (como con un arquitecto de datos que diseña un data warehouse) o indirectamente (como con un desarrollador web que programa un sitio web). Del mismo modo, muchos roles del negocio crean, acceden o manipulan datos. Algunos roles, tales como el Analista de Calidad de Datos, requieren una combinación de habilidades técnicas y conocimiento del negocio. Las funciones y roles que se describen a continuación se enfocan hacia la gestión de datos. Roles Individuales Los roles individuales se pueden definir bajo el negocio o IT. Algunos son roles híbridos que requieren conocimiento de los sistemas y de los procesos del negocio. ▪ Roles Ejecutivos Los ejecutivos de Gestión de Datos pueden estar en el negocio o del lado tecnológico de la casa. El Director de Información (CIO- Chief Information Officer) y el Director de Tecnología (CTO-Chief Technology Officer) son roles bien establecidos en TI. El concepto de Director de Datos (CDO- Chief Data Officer) del lado del negocio ha ganado mucha credibilidad en la última década y muchas organizaciones han contratado CDOs. ▪ Roles del Negocio Los roles del negocio se enfocan principalmente en las funciones de gobierno de datos, especialmente en la administración. Los data stewards generalmente son expertos en la materia, a quienes se les asigna la responsabilidad de los Metadatos y de la calidad de los datos de las entidades del negocio, las áreas temáticas o bases de datos. Los stewards juegan diferentes roles, dependiendo de las prioridades de la organización. El enfoque inicial de la custodia es a menudo la definición de términos de negocio y de valores válidos para sus áreas temáticas. En muchas organizaciones, los data stewards también definen y mantienen los requerimientos de calidad de datos y reglas de negocio para los atributos de datos asignados, ayudan a identificar y resolver problemas de datos, y proporcionan información sobre estándares de datos, políticas y procedimientos. Los stewards pueden funcionar en la empresa, en la unidad de negocio o a nivel funcional. Su rol puede ser formal (‘data steward’ es parte del título) o informal (custodian datos, pero tienen otro puesto). Además de los data stewards, los Analistas de Procesos de Negocio y los Arquitectos de Procesos contribuyen a garantizar que los modelos de procesos del negocio y los procesos reales que crean los datos sean sólidos y soporten los usos posteriores. Otros trabajadores del conocimiento basados en el negocio, tales como los analistas del negocio, consumidores de datos e información, que agregan valor a los datos para la organización, contribuyen a toda la gestión de datos. ▪ Roles de TI Los roles de TI incluyen diferentes tipos de arquitectos, desarrolladores a diferentes niveles, administradores de bases de datos y una amplia gama de funciones de soporte. - Arquitecto de datos: Un analista senior responsable de la arquitectura de datos y de la integración de datos. Los Arquitectos de Datos pueden trabajar a nivel empresarial o a nivel funcional. Los Arquitectos de Datos pueden especializarse en data warehousing, data marts y sus procesos de integración asociados. - Modelador de Datos: Responsable de capturar y modelar los requerimientos de datos, definiciones de datos, reglas de negocio, requerimientos de calidad de datos y modelos de datos físicos y lógicos. - Administrador del Modelo de Datos: Responsable del control de versiones y del control de cambios del modelo de datos. - Administrador de Bases de Datos: Responsable del diseño, implementación y soporte de activos de datos estructurados y del rendimiento de la tecnología que hace que los datos sean accesibles. - Administrador de Seguridad de Datos: Responsable de garantizar el acceso controlado a los datos que requieren diferentes niveles de protección. - Arquitecto de Integración de Datos: Un desarrollador senior de integración de datos, responsable de diseñar tecnología para integrar y mejorar la calidad de los activos de datos empresariales. - Especialista en Integración de Datos: Un diseñador de software o desarrollador responsable de implementar sistemas para integrar (replicar, extraer, transformar, cargar) activos de datos, en lotes o casi en tiempo real. - Desarrollador de Analítica/Reportes: Un desarrollador de software responsable de crear soluciones y aplicaciones analíticas. - Arquitecto de Aplicaciones: Desarrollador senior, responsable de integrar sistemas de aplicaciones. - Arquitecto Técnico: Ingeniero técnico senior, responsable de coordinar e integrar la infraestructura de IT y el portafolio tecnológico de IT. - Ingeniero Técnico: Analista técnico senior, responsable de investigar, implementar, gestionar y respaldar una parte de la infraestructura tecnológica de la información. - Administrador de la Mesa de Ayuda: Responsable de manejar, rastrear y resolver problemas relacionados con el uso de la información, los sistemas de información o la infraestructura de IT. - Auditor de IT: Auditor interno o externo de las responsabilidades de IT, incluida la calidad de los datos y la seguridad de los datos.
● Comprender los distintos modelos para designar dominios,
subdominios y quienes son sus responsables.
● Entender cuales son las actividades que desarrolla un
área de Gobierno del dato.
● Conocer las principales herramientas que ofrece el
mercado y sus capacidades. ● Comprender los conceptos generales del aseguramiento de la calidad a lo largo del ciclo de vida de los datos. La gestión efectiva de datos implica un conjunto de procesos complejos e interrelacionados que permiten a una organización utilizar sus datos para lograr objetivos estratégicos. La gestión de datos incluye la capacidad de diseñar datos para aplicaciones, almacenarlos y acceder a ellos de forma segura, compartirlos de manera adecuada, aprender de ellos y garantizar que satisfagan las necesidades del negocio. Un supuesto que subyace la certeza acerca del valor de los datos es que los datos en por sí solos son confiables y dignos de confianza. En otras palabras, que son de alta calidad. Sin embargo, muchos factores pueden socavar esa suposición al contribuir a la poca calidad de los datos: falta de comprensión sobre los efectos de los datos de baja calidad en el éxito de la organización, mala planificación, diseño de sistemas 'en silos', procesos de desarrollo inconsistentes, documentación incompleta, falta de estándares, o falta de gobierno. Muchas organizaciones no logran definir qué hace que los datos sean adecuados para su propósito. Todas las disciplinas de gestión de datos contribuyen a la calidad de los datos, y el objetivo de todas las disciplinas de gestión de datos debe ser la alta calidad de la información de manera que respalde a la organización. Debido a que las decisiones o acciones no informadas de cualquier persona que interactúa con los datos pueden dar como resultado datos de baja calidad, la producción de datos de alta calidad requiere compromiso y coordinación interfuncionales. Las organizaciones y los equipos deben ser conscientes de esto y deben planificar pensando en datos de alta calidad, ejecutando procesos y proyectos de manera que tengan en cuenta el riesgo relacionado con condiciones inesperadas o inaceptables en los datos. Debido a que ninguna organización tiene procesos comerciales perfectos, procesos técnicos perfectos o prácticas perfectas de gestión de datos, todas las organizaciones experimentan problemas relacionados con la calidad de sus datos. Las organizaciones que gestionan formalmente la calidad de los datos tienen menos problemas que las que dejan la calidad de los datos al azar. La gestión formal de la calidad de los datos es similar a la gestión continua de la calidad para otros productos. Incluye la gestión de datos a través de su ciclo de vida mediante el establecimiento de estándares, la creación de calidad en los procesos que crean, transforman y almacenan datos, y la medición de datos contra estándares de calidad. La gestión de datos a este nivel generalmente requiere un equipo de programa de calidad de datos. El equipo del programa de calidad de datos es responsable de involucrar a los profesionales de la gestión de datos del negocio y técnicos, con el trabajo de aplicar técnicas de gestión de calidad a los datos para garantizar que los datos sean aptos para el consumo de una vasta variedad de propósitos. Es probable que el equipo participe en una serie de proyectos a través de los cuales pueden establecer procesos y mejores prácticas, mientras abordan problemas de datos de alta prioridad. Debido a que gestionar la calidad de los datos implica el ciclo de vida de los datos, un programa de Calidad de los Datos también tendrá responsabilidades operativas relacionadas con el uso de los datos. Por ejemplo, informar sobre los niveles de calidad de los datos y participar en el análisis, cuantificación y priorización de los problemas de datos. El equipo también es responsable de trabajar con aquellos que necesitan datos para hacer su trabajo, garantizando que los datos satisfagan sus necesidades y trabajar con aquellos que crean, actualizan o eliminan datos en el curso de sus trabajos para asegurarse de que están manejando los datos adecuadamente. La calidad de los datos depende de todos los que interactúan con los datos, no solo de los profesionales de gestión de datos. Como es el caso con Gobierno de Datos y con la gestión de datos en su conjunto, la Gestión de la Calidad de los Datos es un programa, no un proyecto. Incluirá tanto proyectos, como trabajos de mantenimiento, junto con un compromiso a generar comunicaciones y capacitación. Lo más importante, el éxito a largo plazo del programa de mejora de la calidad de los datos depende de lograr que una organización cambie su cultura y adopte una mentalidad orientada a la calidad. Como se indica en el Manifiesto del Líder de Datos: el cambio fundamental y duradero requiere un liderazgo comprometido y la participación de personas de todos los niveles en una organización. Las personas que usan datos para hacer su trabajo, que en la mayoría de las organizaciones es un porcentaje muy alto de empleados, necesitan ser los que impulsan el cambio. Uno de los cambios más críticos para enfocarse es cómo sus organizaciones gestionan y mejoran la calidad de sus datos. Los programas de calidad de datos se centran en estas metas generales: • Desarrollar un enfoque de gobierno para hacer que los datos se ajusten a su propósito según los requerimientos de los consumidores de datos. • Definir estándares y especificaciones para controles de calidad de datos como parte del ciclo de vida de los datos • Definir e implementar procesos para medir, monitorear e informar sobre los niveles de calidad de los datos • Identificar y abogar por oportunidades para mejorar la calidad de los datos, a través de cambios en los procesos y sistemas, y participar en actividades que mejoren de manera considerable la calidad de los datos en función de los requerimientos de los consumidores de datos. Los programas de calidad de datos deben guiarse por los siguientes principios: • Criticidad: Un programa de calidad de datos debe centrarse en los datos más críticos para la empresa y sus clientes. Las prioridades de mejora deben basarse en la importancia crítica de los datos y en el nivel de riesgo si los datos no son correctos. • Gestión del ciclo de vida: La calidad de los datos debe gestionarse en todo el ciclo de vida de los datos, desde la creación o adquisición hasta la eliminación. Esto incluye la gestión de datos a medida que se mueven dentro y entre sistemas (por ejemplo, cada enlace en la cadena de datos debe garantizar que la salida de datos sea de alta calidad). • Prevención: El objetivo de un programa de calidad de datos debe ser prevenir los errores de datos y las condiciones que reducen la usabilidad de los datos; no debe enfocarse simplemente en corregir registros. • Remediación de la causa raíz: Mejorar la calidad de los datos va más allá de corregir los errores. Los problemas con la calidad de los datos deben entenderse y abordarse en sus causas principales, en lugar de solo sus síntomas. Debido a que estas causas a menudo están relacionadas con el diseño de procesos o sistemas, mejorar la calidad de los datos a menudo requiere cambios en los procesos y los sistemas que los respaldan. • Gobierno: Las actividades de gobierno de datos deben respaldar el desarrollo de datos de alta calidad y las actividades del programa de calidad de datos deben respaldar y mantener un entorno de datos gobernado. • Basado en estándares: Todos los interesados en el ciclo de vida de los datos tienen requerimientos de calidad de datos. En la medida de lo posible, estos requerimientos deben definirse en forma de estándares y expectativas medibles contra los cuales se pueda medir la calidad de los datos. • Medición objetiva y transparencia: Los niveles de calidad de los datos deben medirse de manera objetiva y coherente. Las mediciones y la metodología de medición deben compartirse con las partes interesadas, ya que son los árbitros de la calidad. • Integrado en procesos comerciales: Los propietarios de procesos comerciales son responsables de la calidad de los datos producidos a través de sus procesos. Deben hacer cumplir los estándares de calidad de datos en sus procesos. • Aplicación sistemática: Los propietarios de los sistemas deben hacer cumplir sistemáticamente los requerimientos de calidad de los datos. • Conectado a niveles de servicio: Los informes de calidad de datos y la gestión de problemas deben incorporarse en los Acuerdos de Nivel de Servicio (SLA).
● Entender qué son los datos críticos, métodos de evaluación
de datos críticos y curado. ● Entender el proceso y los roles involucrados en la gestión de la calidad de los datos ● Conocer arquitecturas estándar de despliegues de modelos de calidad, desde la medición al saneo. ● Comprender los métodos de saneo de datos y su importancia
● Conocer los principales métodos de valuación de activos.
● Conocer las principales herramientas que ofrece el mercado y sus capacidades.