Documentos de Académico
Documentos de Profesional
Documentos de Cultura
5M4BlWWq Y6qTviG V4dOjWpsRNMw2cjM Lectura 20 Fundamental 202
5M4BlWWq Y6qTviG V4dOjWpsRNMw2cjM Lectura 20 Fundamental 202
Lectura fundamental
Contenido
Palabras clave: arquitectura de datos, gobernanza de datos, gestión de datos maestros, bases de datos de
procesamiento de transacciones, ciclo de vida de datos.
1. Gobierno de datos y control de sistemas de información
El éxito en la gestión de la información no reside únicamente en la correcta configuración de un
sistema de información, ya que este depende también de los procesos encargados de gestionar los
datos que alimentan a dicho sistema y del recurso humano que lleva a cabo dichos procesos. Tal como
se definen los procesos operativos y misionales de la organización, debe existir de la misma forma
un conjunto de procesos que se encarguen del gobierno de datos a lo largo de su ciclo de vida. De
acuerdo con la Data Management Association International (DAMA), al momento de planear la
implementación de un sistema de información, toda organización debe tener en cuenta las siguientes
funciones de gestión de información:
• Arquitectura de datos: establecer las políticas y reglas para la gestión de datos, tanto en fuentes
estructuradas como no estructuradas, e integrar estas políticas con la estructura de la organización.
• Datos maestros y de referencia: gestionar los datos para reducir la redundancia y mejorar la
calidad de los datos.
• Calidad de datos: definir, monitorear y mantener la integridad de los datos y mejorar su calidad.
POLITÉCNICO GRANCOLOMBIANO 2
1.1. Arquitectura de datos
La arquitectura de datos se lleva a cabo al momento de planear la forma como los datos serán
almacenados y procesados. El diseño del flujo de datos, su interrelación y la forma cómo serán
protegidos a lo largo del sistema de información hacen parte de la arquitectura de datos.
Esta función se encarga de definir los requisitos estratégicos de los datos. Describe tanto la
estructura física y lógica de los datos, como su interrelación al interior de la organización.
• Arquitectura de información (datos): incluye los datos físicos y lógicos, su estructura y modelos
de gestión.
• Arquitectura tecnológica: está soportada por hardware, software y TIC que permiten el uso de
sistemas de información.
Para estructurar la arquitectura de datos de una organización, se proponen a continuación una serie
de pasos:
POLITÉCNICO GRANCOLOMBIANO 3
1. Seleccionar el tipo de base de datos a utilizar: de acuerdo con el propósito de la organización,
debe elegirse el tipo de base de datos por implementar. Mientras que las bases de datos de
procesamiento de transacciones (OLTP) tienen un diseño relacional y se diseñan para operar
las 24 horas del día durante los 365 días del año, las bases de datos de procesamiento analítico
(OLAP) se diseñan para realizar actividades de Inteligencia de Negocio durante el lapso en que
sean requeridas.
• Embebidas.
• NoSQL.
• De propósito general.
• Mixta: en el caso de los mercados de datos que se alimentan de una bodega de datos se
combinan los entornos distribuido (para manejar los datos de forma diferente en cada
departamento) y centralizado (en la bodega de datos con la que interactúa).
POLITÉCNICO GRANCOLOMBIANO 4
3. Seleccionar la infraestructura tecnológica: corresponde al conjunto de recursos de hardware,
software (aplicaciones, bases de datos, sistema gestor de la base de datos, sistema operativo)
y redes que dan soporte a la arquitectura de datos. Si ya se cuenta con una infraestructura
existente, debe evaluarse si las especificaciones técnicas con las que cuenta son apropiadas. En
caso de que no se cumplan las especificaciones que requiere la arquitectura de datos propuesta,
puede optarse por:
• Establecer una infraestructura paralela que comparta recursos con la infraestructura actual.
4. Implementar escenarios: en esta etapa, se prueban variantes de selección del diseño planteado
por la arquitectura inicial como prototipos para definir cuál escenario es el más conveniente para
la organización en términos económicos y de alcance de los objetivos propuestos.
5. Plantear una línea base de desarrollo: en esta etapa debe seleccionarse una metodología de
desarrollo de software que tenga en cuenta la coordinación de los elementos requeridos para el
desarrollo de la base de datos. Se recomienda que se tengan en cuenta las siguientes actividades:
• Modelado de datos.
• Configuración.
• Implementación.
POLITÉCNICO GRANCOLOMBIANO 5
1.2. Gobierno de datos
El gobierno de datos tiene como objetivo garantizar la validez y fiabilidad de los datos, su calidad y
los mecanismos de control para el acceso y manipulación de datos. Incluye los estándares, políticas y
procesos que impidan las inconsistencias, redundancias y desactualizaciones de datos que provengan
tanto de sistemas operacionales de la organización, como en fuentes externas.
Entre los aspectos más importantes por los cuales se justifica la existencia de la función de
gobernabilidad de datos se tienen las siguientes:
Adicional a estos aspectos, la accesibilidad de los datos mejora, se toman mejores decisiones basadas en
datos con mayor fiabilidad y se le da el estatus de activo de la compañía a los datos que esta maneja.
• Gestión de procesos.
• Metadatos.
POLITÉCNICO GRANCOLOMBIANO 6
• Calidad de datos.
En toda organización, se puede considerar que existe en mayor o menor medida un nivel de madurez
en el gobierno de datos. Este nivel de madurez puede asociarse con una de las siguientes etapas:
1. Etapa inicial: en este nivel de madurez, la organización no cuenta con la disciplina necesaria para
gobernar sus datos. Se tienen datos duplicados o con inconsistencias en un número considerable
de ocasiones y la agilidad para reaccionar a cambios del entorno o del negocio es baja. Existe una
alta dependencia de la tecnología para la toma de decisiones.
2. Etapa reactiva: se empieza a generar un proceso de mejora de la información, pero esto genera
redundancia de información. Aún no se tiene casi control sobre la información y esta se haya
alojada en aplicaciones independientes que generan un alto costo para su mantenimiento. Las
áreas específicas del negocio son ahora las que influyen en los procesos de selección de las
tecnologías a utilizar, pero aún no se alcanza un nivel de trabajo colaborativo.
3. Etapa proactiva: cuando una organización alcanza este nivel de madurez, se alinean los objetivos
del área de tecnología con los de los procesos esenciales de la organización. Es en este punto en
el que la organización empieza a tratar a los datos como un activo esencial de la misma.
4. Etapa de gobernanza de datos: aquí se implementan procesos para la gestión de los activos de
datos y los directivos de la organización cuentan con datos precisos para tomar decisiones. En
esta etapa avanzada de madurez del gobierno de datos, se tiene una metodología que permite
calcular los beneficios por la implementación de un programa de gobierno de datos. Aquí cada
decisión de tipo tecnológico está enlazada al modelo de negocio.Conforme se avanza en el
nivel de madurez de la gobernanza de datos, se incrementa el valor de la organización a la vez
que se reduce el riesgo asociado con pérdida de datos, redundancia y toma de decisiones con
información imprecisa.
POLITÉCNICO GRANCOLOMBIANO 7
Para implementar un sistema de gobernabilidad de datos, se recomienda aplicar las siguientes etapas:
5. Con base en las etapas 1 a 4, plantear cambios para los procesos administrativos.
Los datos maestros de una organización son todos aquellos datos críticos para la misma y que
intervienen en los procesos transaccionales de la organización. Suelen ser las listas de datos que se
comparten entre las distintas aplicaciones que componen al sistema de información. Por ejemplo, el
área de facturación y el área de servicio al cliente suelen manejar un mismo listado de clientes, lo que
se conoce como lista maestra de clientes.
Para dar claridad sobre la diferencia entre datos maestros y metadatos, se muestran a continuación
las categorías existentes de datos en torno a un sistema de información:
1. Datos transaccionales: son los datos asociados con las interacciones monetarias que tengan
lugar entre distintos clientes (internos o externos) y la organización.
2. Datos no estructurados: son aquellos que no están dentro del sistema de información, pero
deben ser tenidos en cuenta en la gestión de datos. Entre los diversos casos de datos no
estructurados tenemos correos electrónicos, documentos en pdf, información impresa o alojada
en el portal web de la compañía.
3. Datos jerárquicos: son todas las relaciones entre datos (maestros o no) y que se manejan a
través de tablas o descripciones de las relaciones entre los datos y el mundo real.
4. Datos maestros: son aquellos datos considerados como críticos para un negocio y suelen
pertenecer a una de las siguientes agrupaciones: personas, cosas, conceptos y lugares. Dentro
de cada una de estas agrupaciones hay unas áreas temáticas o de tipo de entidad que permiten
identificar tipos de datos maestros. El nivel de clasificación jerárquica dependerá de cuán
diferentes sean los tipos de datos críticos para la organización.
POLITÉCNICO GRANCOLOMBIANO 8
Metadata: los metadatos consisten en el conjunto de información sobre los datos de una organización
en los que se detalla su significado, reglas de negocio, servicios asociados y procesos relacionados. De
acuerdo con su naturaleza, pueden identificarse 3 tipos de metadatos:
• Metadatos técnicos: indican el nombre y tipo de datos que se están manejando, así como su fuente.
• Metadatos del proceso de negocio: describen una serie de nombres, definiciones y asociaciones
del dato con los procesos a los que afecta.
Una buena estrategia de gobierno de datos debe incluir el diseño de un glosario de términos
relacionados con los datos que intervienen en cada proceso, así como un proceso de cómo se llevará a
cabo la actualización de la metadata.
Una de las finalidades del MDM es la de relacionar los datos vitales de la organización en un único
archivo maestro, que sirva como punto de intercambio de datos entre las distintas áreas de la
organización. El manejo maestro de datos es, por lo tanto, el conjunto de procesos, herramientas
tecnológicas y métodos que permiten mantener actualizada la base de datos maestros, de manera que
no se presenten inconsistencias al interior de dicha base.
Finalmente, cabe resaltar que además de los aspectos de gobernanza de datos, administración de
datos maestros y calidad de datos descritos previamente, todo sistema de información debe controlar
los siguientes elementos:
Ciclo de vida de datos: también conocido como Database Lifecycle Management (DLM), la gestión
del ciclo de vida de los datos consiste en incorporar los procesos y herramientas necesarias para tratar
los datos al interior del sistema de información, desde que el dato se crea y se almacena por primera
vez, hasta el instante en el que se convierte en obsoleto y se decide eliminarlo.
POLITÉCNICO GRANCOLOMBIANO 9
Enmascaramiento de datos: es un proceso en el cual los datos originales son procesados y
transformados para mostrarse al usuario final, de manera que se protejan los datos originales a la vez
que se presentan de forma apropiada para tomar decisiones.
POLITÉCNICO GRANCOLOMBIANO 10
Referencias
Cupoli, P., Earley, S. y Henderson, D. (2014). The Data Management Association. DAMA- DMBOK2
Framework.
Filip, F. G. (2007). Management Information Systems: Managing the Digital Firm (Book Review).
International Journal of Computers Communications & Control, 2 (1), 103-105.
Guerrero, H. (2010). Excel Data Analysis, Modeling and Simulation. New York: Springer.
Heijden, H. (2009). Designing Management Information Systems. New York, USA: Oxford University
Press.
Lache, L., León, A., Bravo, E., Becerra, L. y Forero, D. (2016). Las tecnologías de información y
comunicación como prácticas de referencia en la gestión de conocimiento: una revisión sistemática de la
literatura. Revista UIS Ingenierías, 15 (1), 27-40.
Oz, E. (2009). Management Information Systems (6.a ed.). Pennsylvania, USA: Thomson Course
Technology.
POLITÉCNICO GRANCOLOMBIANO 11
INFORMACIÓN TÉCNICA
POLITÉCNICO GRANCOLOMBIANO 12