Está en la página 1de 36

Unidad 3 Paso 4 – Construir Un Paso De ETL

Presentado por:
Judi Pilar López Chilito

Grupo:
204031_27

TUTOR

Javier Hernán Jiménez

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA


ESCUELA DE CIENCIAS BASICAS, TECNOLOGIA E INGENIERIA
INTRODUCCION A
METADATOS CALI,
2023

1
Introducción

Los metadatos se definen como datos de los datos el cual suministran valiosa

información sobre los datos producidos entre ellos describen: las características de los datos

producidos, condiciones, historia, entre otros aspectos.

En este trabajo se construirá un proceso de extracción, transformación y carga de datos – ETL

de acuerdo con los requerimientos técnicos y organizacionales

3
Objetivos

 Construir un proceso de extracción, transformación y carga de datos de acuerdo con los

requerimientos técnicos y organizacionales

 Describir las principales características de algunas herramientas utilizadas para la

gestión y administración de metadatos.

 Mediante un ejemplo práctico extraer la metadata de un modelo de base de datos,

utilizando como herramienta Talend Open Studio.

 Convertir la información extraída a diferentes tipos de fuentes.

4
5
2. Objetivos

 Describir las principales características de algunas herramientas utilizadas para la

gestión y administración de metadatos.

 Mediante un ejemplo práctico extraer la metadata de un modelo de base de datos,

utilizando como herramienta Talend Open Studio.

 Convertir la información extraída a diferentes tipos de fuentes.

6
7
4. Problema planteado de la guía

El departamento de ventas de su organización está desarrollando una estrategia para

incentivar las ventas on-line. Para esto, junto con el departamento de marketing sugiere realizar

una fidelización de clientes, para lo cual marketing va a enviar por correo electrónico un cupón

de descuento que se podrá usar en una compra on-line. Si no cuentan con correo electrónico del

cliente, se hará una llamada (para solicitar el correo electrónico) y si no se cuenta con el número

telefónico, se hará un envío de correo físico con una carta que contiene un código de descuento

del 50% a los clientes que hayan realizado una compra en lo transcurrido del año, con el fin que

lo empleen en una única compra en la tienda on-line de la compañía, cuyo valor máximo

corresponderá a la compra de mayor valor realizada durante el año en curso.

Al revisar la información de clientes, el departamento de marketing y el departamento de

ventas tienen para algunos clientes diferentes direcciones, correos electrónicos y teléfonos, esta

información proviene del sistema de ventas y de un sistema donde se almacena la información de

los clientes que se llama e-client. Adicionalmente, para saber cuál es la venta de mayor valor, el

departamento de servicio al cliente sugiere que se debe contemplar, que si existió una devolución

del producto o una queja, esa compra no se debe contemplar como la compra de mayor valor, por

lo tanto al cruzar los datos del mayor valor según el departamento de ventas y servicio al cliente,

los datos son diferentes, también se detectó que en el reporte generado por el departamento de

quejas existen números de identificación duplicados para diferentes clientes. El departamento de

servicio al cliente tiene las quejas almacenadas en archivos Excel.

Ante esta situación, la empresa lo ha contactado a usted para que les ayude a implementar

una estrategia que les permita solucionar esos problemas de datos.

8
5. Estrategia desarrollada

Tabla 1

Estrategia desarrollada

Fases Orientaciones:
Oportunidades de mejora detectadas. Sin lugar a dudas el mayor problema de la empresa
es que no tienen una política de datos bien definida
ya que hay diferentes fuentes de información para el
mismo cliente y no existe algo que regule esa
variación.

Como primera oportunidad de mejora es establecer


un gobierno de datos que sea el que establezca
políticas y reglas para el manejo de la información
en el contexto del negocio donde se definan quienes
son los encargados del manejo de los datos, quien
custodia la seguridad informática, quienes se
encargan de las copias de seguridad, entre otros.
Para esto se debe disponer de al menos un comité
directivo de gobierno de datos quienes sean los
encargados de dictar dichas políticas.

Dentro de la organización se puede dilucidar que


existen tres fuentes de información sobre un mismo
cliente para igual número de departamentos
involucrados en el programa de incentivo online y
en una de ellas con datos duplicados.

La otra oportunidad de mejora es la creación o


adquisición de un sistema que aloje toda la
información del negocio y de esta forma centralizar
en una única fuente, todos los datos de la
organización incluida la de los clientes que es el
punto de interés de este ejercicio, de esta forma si
un cualquier departamento que requiere hacer una
consulta sobre un cliente, venta o quejas esta sea la
misma sin variación alguna para cada uno de ellos.

Es necesario tomar acciones para resolver las


oportunidades de mejoras identificadas
anteriormente, ya que, al no tener unas políticas
claras en el manejo de la información, pueden
seguirse presentando diversos tipos de variaciones

9
como por ejemplo: registros para un cliente con
diferentes valores, datos almacenados con formatos
inadecuados por ejemplo un valor de venta o
compra con formatos no acertados pueden generar
problemas serios de contabilidad y la entidad puede
verse avocada a desconocer su situación financiera
real.

Al no tenerse una fuente única de información, en el


caso de clientes, la organización puede enfrentarse a
una potencial perdidas de clientes y por lo tanto de
ingresos, ya que no existe una fuente fidedigna de
esos datos como dirección, teléfono o correo
electrónico ya que es posible el envío de
correspondencia o realizar llamadas o enviar
correos electrónicos a clientes que no corresponden
a esos datos.
Partes interesadas La estrategia de datos debe comenzar con establecer
un comité directivo de datos o algún organismo que
tenga las funciones de instaurar las políticas de
datos además de involucrar las partes interesadas en
el desarrollo del sistema de información, entre ellas
tenemos:

Departamento de sistemas: preferiblemente que


dentro de este equipo haya un administrador de
datos o un arquitecto de datos.

Gerente general: ya que las decisiones que se


tomen en cuanto al manejo de la información deben
hacer parte de las políticas de la empresa.

Los diferentes departamentos de la empresa, que


para el planteamiento del problema son:

Departamento de ventas: encargado de ingreso de


recursos a la empresa por medio de las ventas, son
quienes hacen los envíos a los clientes y deben
tener información clara sobre ellos.

Departamento de Marketing: realizan labores de


mercadeo, teniendo contacto con los clientes a
través de correo electrónico, llamadas telefónicas
y/o correspondencia a domicilio.

10
Departamento de Servicio al Cliente: Atiende
solicitudes de los clientes.

Departamento de quejas: atienden y dan tramite a


las quejas de los clientes.
Fuentes de metadatos Fuentes de metadatos tenemos:

Modelo de base de datos de la base ventas y de e-


client.

Campos de cada una de las tablas de las bases de


datos de ventas y de e-client.

Catalogo de la base de datos de ventas y de e-client.

Base de datos en Excel del departamento de quejas.

Reportes de ventas del Departamento de ventas.

Reporte de clientes del Departamento de marketing

Correos electrónicos que hace parte de los


metadatos de datos no estructurados

Diagrama de procesos de la empresa para tener


claridad de las interacciones y relaciones que tiene
cada uno de los departamentos.

Información de la empresa que hace parte de


metadatos del negocio como Nit, organigrama,
estructura de la empresa entre otros

Reportes de auditorías.
Estrategia de Metadatos Se deben hacer reuniones con directores de los
diferentes departamentos incluidos los gerenciales
encabezados por un administrador de datos o
arquitecto de datos con el fin de establecer reglas y
políticas en el manejo de la información. Después
de establecido el gobierno de datos se adquiere o se
crea un sistema de información que sea transversal
a toda la organización y de esta forma que los datos
almacenados sean únicos para cualquier
departamento.

Cuando: La arquitectura de los metadatos debe estar


lista para diciembre del 2022

11
Cómo: Se hace inicialmente por medio de reuniones
con los diferentes departamentos para tomar las
especificaciones y requerimientos de cada uno de
ellos y de esta forma atender sus necesidades en el
manejo de la información.

Responsables:

Lo hace el Departamento de Sistemas en lo posible


encabezado por un administrador de datos quien se
encargará de reunir a los gerentes de los diferentes
departamentos y conocer sus necesidades en el
manejo de la información

Financiada por los dueños y socios de la empresa.

Gestionada por el departamento de sistemas el cual


debe incluir un especialista de metadatos, además
del acompañamiento técnico y operativo de toda la
organización incluyendo todos los departamentos
del área de tecnología junto con los directivos de la
empresa.

6. Datos Maestros

Personas: clientes (customers), empleados (employees)

Cosas: Productos (products), Líneas de productos (productsLines)

Conceptos: Campania publicitaria, ordenes (Orders), ExcelQuejas

Lugares: Oficinas (Offices)

12
7. Metadatos técnicos

Tabla 2

Metadatos técnicos

Fuente de datos Metadato Detalles técnicos de los datos


customers Tabla
Tabla de clientes
customerNumber Llave primaria
Entero de 11 dígitos
Campo que hace referencia al
número identificativo del cliente
customerName VARCHAR de 50 caracteres.
No nulo
Identifica al nombre del cliente
contactLastName VARCHAR de 50 caracteres.
No nulo
Identifica apellido del contacto
contactFirstName VARCHAR de 50 caracteres.
No nulo
Identifica al nombre del contacto
Phone VARCHAR de 50 caracteres.
No nulo
Sistema de ventas Indica el teléfono del cliente
addressLine1 VARCHAR de 50 caracteres.
No nulo
Indica la dirección del cliente
addressLine2 VARCHAR de 50 caracteres.
Puede ser nulo
Indica segunda dirección del
cliente
city VARCHAR de 50 caracteres.
No nulo
Indica la ciudad de residencia
del cliente
State VARCHAR de 50 caracteres
Puede ser nulo
Estado o departamento donde
reside el cliente
postalCode VARCHAR de 15 caracteres
Puede ser nulo
Código postal donde reside el
cliente
country VARCHAR de 50 caracteres.
No nulo

13
Indica país de residencia del
cliente
salesRepEmployeeNumber Entero de 11 caracteres
Puede ser nulo
Número identificativo del
empleado que realizó la venta
creditLimit Número con 10 caracteres de los
cuales 2 son decimales
Puede ser nulo
Limite de crédito que tiene
permitido el cliente
Employees Tabla
Tabla de empleados
employeeNumber Llave primaria (PK)
Entero de 11 caracteres
Número identificado de
empleados
lastName VARCHAR de 50 caracteres.
No nulo
Apellido del empleado
FirstName VARCHAR de 50 caracteres.
No nulo
Nombre del empleado
extension VARCHAR de 10 caracteres.
No nulo
Extensión del empleado
email VARCHAR de 100 caracteres.
No nulo
Correo electrónico del empleado
officeCode Llave foránea
VARCHAR de 10 caracteres.
No nulo
Código de la oficina donde
labora el empleado
reportsTo Llave foránea (FK)
Entero de 11 caracteres
Puede ser nulo
Nombre o código de a quien le
presenta reportes
jobTitle VARCHAR de 50 caracteres.
No nulo
Cargo que desempeña el
empleado
payments Tabla
Tabla de pagos
customerNumber Llave primaria (PK)

14
Entero de 11 caracteres
Número identificativo del cliente
checkNumber Llave primaria
VARCHAR de 50 caracteres
Número de factura del pago
paymentDate Campo de tipo DATE.
No nulo
Fecha del pago
amount Número con 10 caracteres de los
cuales 2 son decimales
No nulo
Valor pagado
orderdetails Tabla
Tabla del detalle de la orden de
pedido
orderNumber Llave primaria (PK)
Entero de 11 caracteres
Indica el número de la orden
productKey Llave primaria
VARCHAR de 15 caracteres
Indica el número del producto
que se hace relación
quantityOrdered Entero de 11 caracteres.
No nulo
Indica la cantidad ordenada de
ese producto que se hace
referencia
priceEach Número con 10 caracteres de los
cuales 2 son decimales
No nulo
Indica el precio del producto por
unidad
orderLineNumber Entero de 6 caracteres.
No nulo
Indica el número de línea de
orden de producción
orders Tabla
Tabla de las ordenes solicitadas
orderNumber Llave primaria
Entero de 11 caracteres
Indica el número de la orden
orderDate Campo de tipo DATE.
No nulo
Indica la fecha de la orden de
pedido
requireDate Campo de tipo DATE.

15
No nulo
Indica la fecha del requerimiento
shippedDate Campo de tipo DATE.
Puede ser nulo
Indica la fecha del embarque
status VARCHAR de 15 caracteres.
No nulo
Indica el estado de la orden
comments Campo de tipo TEXT
Puede ser nulo
Almacena los comentarios o
solicitudes del cliente con
respecto a la orden
customerNumber Llave foránea
Entero de 11 caracteres
No nulo
Indica el número identificativo
del cliente.
office Tabla
officeCode Llave primaria
VARCHAR de 10 caracteres
Indica el código de la oficina
city VARCHAR de 50 caracteres.
No nulo
Almacena la ciudad donde está
ubicada la oficina
phone VARCHAR de 50 caracteres.
No nulo
Indica el teléfono de la oficina
addressLine1 VARCHAR de 50 caracteres.
No nulo
Almacena dirección de la oficina
addressLIne2 VARCHAR de 50 caracteres.
Puede ser nulo
Almacena segunda dirección de
la oficina
State VARCHAR de 50 caracteres.
Puede ser nulo
Almacena estado o
departamento de la oficina
country VARCHAR de 50 caracteres.
No nulo
Indica el país donde está ubicada
la oficina
postalCode VARCHAR de 15 caracteres.
No nulo

16
Almacena el código postal de la
oficina
territory VARCHAR de 10 caracteres.
No nulo
Indica el territorio o zona de la
oficina
products Tabla
productCode Llave primaria
VARCHAR de 15 caracteres
Almacena el código del producto
productName VARCHAR de 70 caracteres.
No nulo
Indica el nombre del producto
productLine Llave foránea
VARCHAR de 50 caracteres.
No nulo
Almacena la línea de producción
del producto
productVendor VARCHAR de 50 caracteres.
No nulo
Almacena el proveedor del
producto
productDescription Campo de tipo Text
No nulo
Almacena la descripción del
producto
quantityStock Entero pequeño de 6 caracteres
No nulo
Indica la cantidad del producto
que hay en inventario
buyPrice Número con 10 caracteres de los
cuales 2 son decimales
No nulo
Almacena el precio de compra
del producto
MSRP Número con 10 caracteres de los
cuales 2 son decimales
No nulo
productLines Tabla
productLine Llave primaria
VARCHAR de 50 caracteres
Almacena la línea del producto
textDescripton VARCHAR de 4000 caracteres.
Puede ser nulo
Indica la descripción de la línea
de producción

17
htmlDescription Campo de tipo MEDIUMTEXT
Puede ser nulo
Almacena el código html de la
descripción del producto
image Campo de tipo MEDIUMBLOB
Puede ser nulo
Almacena la imagen del
producto
Tablas_sistema_marketing Cliente Tabla
Tabla en el sistema de mercadeo
que almacena los clientes
Id_cliente Llave primaria
Número
Código del cliente
Nombres Texto largo
Nombres del cliente
Apellidos Texto largo
Apellidos del cliente
Telefono Número
Teléfono del cliente
Direccion Texto largo
Dirección donde reside el cliente
Ciudad Texto corto
Ciudad donde reside el cliente
Departamento Texto corto
Departamento donde reside el
cliente
Correo Texto corto
Correo electrónico del cliente
ClientexCampania Tabla
Tabla que almacena los clientes
de cada campaña
Id_clientexcampa Autonumeración
Código del cliente de esa
campaña
Id_campania Llave foránea
Número
Identificador de la campaña
Id_cliente Llave Foránea
Número
Identificador del cliente
CampaniaPublicitaria Tabla
Tabla de la campaña publicitaria
Id_campania Número
Identificador de la campaña
Descripcion Texto largo

18
Descripción de la campaña
Fecha_inicio Fecha/hora
Fecha y hora en que se inició la
campaña
Fecha_fin Fecha/hora
Fecha y hora en que finalizó la
campaña
ExcelQuejas ExcelQuejas Tabla
Tabla en Excel donde se
relaciona las quejas interpuestas
por los clientes
Fecha Fecha corta
Fecha en formato dd/mm/AAAA
que el cliente interpuso la queja
Cédula del cliente Texto
Cédula del cliente
Nombre del cliente Texto
Nombre del cliente
Telefono de contacto Número
Teléfono del cliente
Motivo de la queja Texto
Motivo por el que se está
quejando
Descripción de la queja Texto
Texto descriptivo y detallado de
la queja
Estado Texto
Estado de la queja
Descrición del producto Texto
Descripción de la queja.

8. Arquitectura de metadatos

Teniendo en cuenta que la empresa está en expansión y desea masificar sus ventas a

través de las ventas e-line o comercio electrónico, se espera que haya un volumen de

información de clientes alto, solicitando cotizaciones de productos, realizando ordenes de

pedido, sin ningún tipo de información duplicada y además con generación de reportes en tiempo

real, se presenta la siguiente arquitectura de metadatos.

19
Tabla 3

Fuente de metadatos

Fuentes de metadatos Repositorio Usuarios finales,


beneficiarios
Archivo Excel del Según lo planteado, la Departamento de
departamento de quejas propuesta es una Marketing, los cuales van a
(ExcelQuejas) arquitectura con un tener información fidedigna
repositorio centralizado, ya para llegar al cliente de forma
Imagen de las tablas y que presenta grandes acertada y de esta manera no
relaciones del sistema de ventajas como: perderlos.
Marketing.  Alta disponibilidad de la
información, e Departamento de ventas: No
Estructura de la base de independencia de las van a tener problemas con los
datos del sistema de ventas fuentes de información. despachos de pedidos.
(SistemaVentas).  Rápida recuperación de
los metadatos Departamento de quejas,
 Estructura de base de para poder responderle a los
datos resuelta clientes y dirigirse a ellos con
 Los metadatos extraídos sus datos precisos.
se pueden mejorar con
metadatos adicionales ya Departamento de servicio al
que no dependen de la cliente, van a tener
fuente de datos de información precisa de sus
origen. clientes.

Gerencia general, van a


disponer de información
precisa y acertada para la
toma de decisiones.

Departamento de sistemas,
ya que será mucho más
sencillo los mantenimientos,
la seguridad y realizar copias
de seguridad.

20
9. Grafica de la arquitectura

Figura 1

Grafica de la arquitectura

21
10. Herramientas de software para la gestión de metadatos

Las 3 herramientas que se citarán son Talend Open Studio for Data Integration (TDI),

Pentaho Data Integration (PDT) y

Talend Open Studio for Data Integration

Herramienta de código abierto ETL (extracción, transformación y carga de datos)

desarrollado en Java con capacidad para integrar grandes volúmenes de datos (Big Data), con

capacidad de gestionar datos maestros, calidad de datos e integrar aplicaciones empresariales de

software y servicios. Esta herramienta presenta en su estructura dos flujos: a) Main que marca un

inicio y un final donde devuelve la información y b) Iterate donde marca un inicio, manda un

registro y marca un final y se puede ejecutar varias veces.

Dentro de sus principales ventajas están:

 Interfaz gráfica muy intuitiva


 Herramienta multiusuario
 Permite extraer metadatos de diferentes fuentes como XML, EXCEL,
JSON, SQL, REGEX, LDIF
 Integra metadatos
 Transforma metadatos
 Valida datos y manipula errores
 Carga datos a múltiples formatos
 Genera script SQL

Pentaho Data Integration

22
Herramienta de código abierto desarrollado en Java, utiliza el componente “Spoon“ que

es el diseñador gráfico, los flujos de datos se definen mediante una transformación utilizando una

red de tareas lógicas llamadas pasos (steps)

Sus principales ventajas son:

 Conexión a múltiples bases de datos


 Extrae datos de múltiples fuentes
 Carga datos a múltiples formatos
 Integra datos provenientes de múltiples fuentes en un archivo deseado
 Puede manipular datos.
 Guarda el flujo de trabajo
 Válida datos y manipula errores
 Maneja grandes volúmenes de datos

Collibra

Es una plataforma de gobierno de datos, orientada a la gestión y administración de los

datos, permitiendo encontrar significado a los datos permitiendo entender y encontrar sentidos a

los datos de una organización de esta forma mejorar las decisiones derivadas de ellos. Esta

plataforma multiorganizacional ofrece: glosario empresarial, diccionario de datos, servicio de

ayuda de datos, gerente de política, dato de referencia, administración.

23
11. Modelo SistemaVentas.mwb

Figura 2

Modelo SistemaVentas.mwb

24
12. Importancia de las herramientas de gestión de metadatos en una organización.

La gestión de los metadatos hace parte fundamental en el gobierno de datos en cualquier

organización, que facilita información fidedigna que sirve de soporte para la toma de decisiones

y lograr eficiencia operativa. Las herramientas de gestión de metadatos ayudarán a la entrega de

datos seguros y confiables, además permite trazar el dato desde el destino (target) hasta las

fuentes (orígenes).

13. Sinopsis de la herramienta Talend Open Studio

Para trabajar con esta herramienta de gestión de metadatos y para este caso particular

donde se va a partir de un modelo de base de datos, inicialmente se procede a descargar el motor

de MySQL y el gestor de base de datos MySQL Workbench en la versión MySQL Community

Server 8.0.31 de la url https://dev.mysql.com/downloads/windows/installer/8.0.html.

También previa a la instalación de Talend Open Studio y dado que esta es una

herramienta desarrollada en Java, se hace necesario instalar el Java Development Kit (JDK) que

para el caso para este propósito funciona la JDK Versión 19.0.1.

Después se procede a instalar Talend Open Studio

Figura 3
Talend Open Studio

25
Esta herramienta nos ofrece una interfaz nos ofrece el nodo metadata que permite

gestionar las conexiones, las configuraciones y los esquemas, y de esta manera poder extraer

datos a partir de diferentes orígenes o fuentes, esto se produce para que sean utilizados en

múltiples componentes de uno varios Jobs (tareas) dentro de un proyecto.

La interfaz es bastante amigable de tipo Drag and Drop que funciona, además ahorra

tiempo y esfuerzo en el procesamiento y reutilización de las tareas descritas.

A continuación, se muestra una imagen de la interfaz de la herramienta Talend Open

Studio con sus diferentes componentes.

Figura 4

Componentes Talend Open Studio

26
14. Estructura de datos implementada con el modelo suministrado.

Figura 5

Tabla Customers

Figura 6

Tabla Employees

27
Figura 7

Tabla Offices

Figura 8

Tabla OrderDetails

28
Figura 9

Tabla Orders

Figura 10

Tabla Payments

29
Figura 11

Tabla productlines

Figura 12

Tabla products

30
15. Jobs en la Herramienta Talend Open Studio

Una vez listas la fuente de datos se debe instalar JDK y posteriormente Talend Open Studio for

or Data Integration y en esta herramienta crear:

15.1. Job para eliminar un campo en una tabla de la base de datos.

Figura 13

Job eliminación campo addressLine2

A la tabla customers que inicialmente tiene 13 columnas se le elimina el campo addressLine2


Figura 14

Campos antes de la eliminación

31
Después de eliminar el campo addressLine2, quedando 12 columnas
Figura 15

Campos resultantes después de la eliminación

15.2. Job para generar salida a dos tipos de archivos diferentes.

15.2.1. Job para salida en archivo de Excel

Figura 16

Job para salida en un archivo de Excel

32
Figura 17

Tabla resultante de la salida en Excel

15.2.2. Archivo csv delimitado por punto y

coma Figura 18

Job para un archivo csv delimitado por punto y coma (;)

Figura 19

Salida de archivo csv delimitado por punto y coma (;)

15.3. Job importado desde archivo Excel

Job para importar desde el archivo Excel, disponible para la descarga en el lugar donde encontró
esta guía (entorno de conocimiento) y lo exporte a un formato de datos diferente.

33
Se exporta a un archivo csv delimitado por punto y coma (;)
Figura 20

Job de archivo importado de Excel y salida a un csv

Figura 21

Salida de un archivo csv proveniente de un Excel

Ficheros

34
Figura 22

Ficheros obtenidos

35
16. Conclusiones

Los metadatos constituyen una parte de gran relevancia en el gobierno de datos, ya que

con base a ellos es posible tomar decisiones que pueden ser importantes para una organización,

para la gestión y administración de este tipo de información se tienen varias herramientas en el

mercado tanto de pago como de código abierto. Para el desarrollo de esta practica se trabajó con

Talend Open Studio como herramienta de código abierto, para la gestión de los metadatos

procedentes de un modelo de base de datos, encontrándose con una interfaz muy intuitiva, de

fácil manejo, que permite extraer metadata de diferentes fuentes como XML, Excel, JSON, SQL,

entre otros, además que también se pueden generar archivos de múltiples fuentes.

36
17. Referencias bibliográficas

Amórtegui, P. (08, 28,2020). Herramientas de gestión de los metadatos. [Archivo de video].


https://repository.unad.edu.co/handle/10596/36142

Gómez, M., Lora, J., Portilla, W., Vega, R., & Heredia, D. (2019). Análisis comparativo de
herramientas para la gestión de metadatos.
http://revistas.unisimon.edu.co/index.php/identic/article/view/3485

KeepCoding - Tech School. (2022). Interfaz de Usuario de Talend Open Studio.


https://www.youtube.com/watch?v=Jzofz1hbhJ4&ab_channel=KeepCoding-TechSchool

Muñoz-Reja, I. C. Gómez Carretero, A. I. y Gualo Cejudo, F. (2018). Calidad de datos. Páginas


156-166. RA-MA Editorial. https://search-ebscohost-
com.bibliotecavirtual.unad.edu.co/login.aspx?direct=true&db=nlebk&AN=2498292&lan
g=es&site=eds-live&scope=site

PowerData (2014, 20 de enero). La Gestión de metadatos. https://blog.powerdata.es/el-valor-de-


la-gestion-de-datos/bid/353207/la-gesti-n-de-metadatos

PowerData (2016, 10 de febrero). La importancia de los metadatos en el gobierno de datos.


https://blog.powerdata.es/el-valor-de-la-gestion-de-datos/la-importancia-de-los-
metadatos-en-el-gobierno-de- datos#:~:text=Los%20metadatos%20proporcionan%20el
%20contexto&text=Posteriorme nte%2C%20una%20adecuada%20gesti%C3%B3n
%20de,de%20que%20se%20impleme nten%20cambios.

Ruíz Borja, J. (2019). Comparación de herramientas ETL de código abierto.


https://repositorio.unal.edu.co/bitstream/handle/unal/69685/1128440307.2018.pdf?seque
nce=1&isAllowed=y

37

También podría gustarte