Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Presentado por:
Judi Pilar López Chilito
Grupo:
204031_27
TUTOR
1
Introducción
Los metadatos se definen como datos de los datos el cual suministran valiosa
información sobre los datos producidos entre ellos describen: las características de los datos
3
Objetivos
4
5
2. Objetivos
6
7
4. Problema planteado de la guía
incentivar las ventas on-line. Para esto, junto con el departamento de marketing sugiere realizar
una fidelización de clientes, para lo cual marketing va a enviar por correo electrónico un cupón
de descuento que se podrá usar en una compra on-line. Si no cuentan con correo electrónico del
cliente, se hará una llamada (para solicitar el correo electrónico) y si no se cuenta con el número
telefónico, se hará un envío de correo físico con una carta que contiene un código de descuento
del 50% a los clientes que hayan realizado una compra en lo transcurrido del año, con el fin que
lo empleen en una única compra en la tienda on-line de la compañía, cuyo valor máximo
ventas tienen para algunos clientes diferentes direcciones, correos electrónicos y teléfonos, esta
los clientes que se llama e-client. Adicionalmente, para saber cuál es la venta de mayor valor, el
departamento de servicio al cliente sugiere que se debe contemplar, que si existió una devolución
del producto o una queja, esa compra no se debe contemplar como la compra de mayor valor, por
lo tanto al cruzar los datos del mayor valor según el departamento de ventas y servicio al cliente,
los datos son diferentes, también se detectó que en el reporte generado por el departamento de
Ante esta situación, la empresa lo ha contactado a usted para que les ayude a implementar
8
5. Estrategia desarrollada
Tabla 1
Estrategia desarrollada
Fases Orientaciones:
Oportunidades de mejora detectadas. Sin lugar a dudas el mayor problema de la empresa
es que no tienen una política de datos bien definida
ya que hay diferentes fuentes de información para el
mismo cliente y no existe algo que regule esa
variación.
9
como por ejemplo: registros para un cliente con
diferentes valores, datos almacenados con formatos
inadecuados por ejemplo un valor de venta o
compra con formatos no acertados pueden generar
problemas serios de contabilidad y la entidad puede
verse avocada a desconocer su situación financiera
real.
10
Departamento de Servicio al Cliente: Atiende
solicitudes de los clientes.
Reportes de auditorías.
Estrategia de Metadatos Se deben hacer reuniones con directores de los
diferentes departamentos incluidos los gerenciales
encabezados por un administrador de datos o
arquitecto de datos con el fin de establecer reglas y
políticas en el manejo de la información. Después
de establecido el gobierno de datos se adquiere o se
crea un sistema de información que sea transversal
a toda la organización y de esta forma que los datos
almacenados sean únicos para cualquier
departamento.
11
Cómo: Se hace inicialmente por medio de reuniones
con los diferentes departamentos para tomar las
especificaciones y requerimientos de cada uno de
ellos y de esta forma atender sus necesidades en el
manejo de la información.
Responsables:
6. Datos Maestros
12
7. Metadatos técnicos
Tabla 2
Metadatos técnicos
13
Indica país de residencia del
cliente
salesRepEmployeeNumber Entero de 11 caracteres
Puede ser nulo
Número identificativo del
empleado que realizó la venta
creditLimit Número con 10 caracteres de los
cuales 2 son decimales
Puede ser nulo
Limite de crédito que tiene
permitido el cliente
Employees Tabla
Tabla de empleados
employeeNumber Llave primaria (PK)
Entero de 11 caracteres
Número identificado de
empleados
lastName VARCHAR de 50 caracteres.
No nulo
Apellido del empleado
FirstName VARCHAR de 50 caracteres.
No nulo
Nombre del empleado
extension VARCHAR de 10 caracteres.
No nulo
Extensión del empleado
email VARCHAR de 100 caracteres.
No nulo
Correo electrónico del empleado
officeCode Llave foránea
VARCHAR de 10 caracteres.
No nulo
Código de la oficina donde
labora el empleado
reportsTo Llave foránea (FK)
Entero de 11 caracteres
Puede ser nulo
Nombre o código de a quien le
presenta reportes
jobTitle VARCHAR de 50 caracteres.
No nulo
Cargo que desempeña el
empleado
payments Tabla
Tabla de pagos
customerNumber Llave primaria (PK)
14
Entero de 11 caracteres
Número identificativo del cliente
checkNumber Llave primaria
VARCHAR de 50 caracteres
Número de factura del pago
paymentDate Campo de tipo DATE.
No nulo
Fecha del pago
amount Número con 10 caracteres de los
cuales 2 son decimales
No nulo
Valor pagado
orderdetails Tabla
Tabla del detalle de la orden de
pedido
orderNumber Llave primaria (PK)
Entero de 11 caracteres
Indica el número de la orden
productKey Llave primaria
VARCHAR de 15 caracteres
Indica el número del producto
que se hace relación
quantityOrdered Entero de 11 caracteres.
No nulo
Indica la cantidad ordenada de
ese producto que se hace
referencia
priceEach Número con 10 caracteres de los
cuales 2 son decimales
No nulo
Indica el precio del producto por
unidad
orderLineNumber Entero de 6 caracteres.
No nulo
Indica el número de línea de
orden de producción
orders Tabla
Tabla de las ordenes solicitadas
orderNumber Llave primaria
Entero de 11 caracteres
Indica el número de la orden
orderDate Campo de tipo DATE.
No nulo
Indica la fecha de la orden de
pedido
requireDate Campo de tipo DATE.
15
No nulo
Indica la fecha del requerimiento
shippedDate Campo de tipo DATE.
Puede ser nulo
Indica la fecha del embarque
status VARCHAR de 15 caracteres.
No nulo
Indica el estado de la orden
comments Campo de tipo TEXT
Puede ser nulo
Almacena los comentarios o
solicitudes del cliente con
respecto a la orden
customerNumber Llave foránea
Entero de 11 caracteres
No nulo
Indica el número identificativo
del cliente.
office Tabla
officeCode Llave primaria
VARCHAR de 10 caracteres
Indica el código de la oficina
city VARCHAR de 50 caracteres.
No nulo
Almacena la ciudad donde está
ubicada la oficina
phone VARCHAR de 50 caracteres.
No nulo
Indica el teléfono de la oficina
addressLine1 VARCHAR de 50 caracteres.
No nulo
Almacena dirección de la oficina
addressLIne2 VARCHAR de 50 caracteres.
Puede ser nulo
Almacena segunda dirección de
la oficina
State VARCHAR de 50 caracteres.
Puede ser nulo
Almacena estado o
departamento de la oficina
country VARCHAR de 50 caracteres.
No nulo
Indica el país donde está ubicada
la oficina
postalCode VARCHAR de 15 caracteres.
No nulo
16
Almacena el código postal de la
oficina
territory VARCHAR de 10 caracteres.
No nulo
Indica el territorio o zona de la
oficina
products Tabla
productCode Llave primaria
VARCHAR de 15 caracteres
Almacena el código del producto
productName VARCHAR de 70 caracteres.
No nulo
Indica el nombre del producto
productLine Llave foránea
VARCHAR de 50 caracteres.
No nulo
Almacena la línea de producción
del producto
productVendor VARCHAR de 50 caracteres.
No nulo
Almacena el proveedor del
producto
productDescription Campo de tipo Text
No nulo
Almacena la descripción del
producto
quantityStock Entero pequeño de 6 caracteres
No nulo
Indica la cantidad del producto
que hay en inventario
buyPrice Número con 10 caracteres de los
cuales 2 son decimales
No nulo
Almacena el precio de compra
del producto
MSRP Número con 10 caracteres de los
cuales 2 son decimales
No nulo
productLines Tabla
productLine Llave primaria
VARCHAR de 50 caracteres
Almacena la línea del producto
textDescripton VARCHAR de 4000 caracteres.
Puede ser nulo
Indica la descripción de la línea
de producción
17
htmlDescription Campo de tipo MEDIUMTEXT
Puede ser nulo
Almacena el código html de la
descripción del producto
image Campo de tipo MEDIUMBLOB
Puede ser nulo
Almacena la imagen del
producto
Tablas_sistema_marketing Cliente Tabla
Tabla en el sistema de mercadeo
que almacena los clientes
Id_cliente Llave primaria
Número
Código del cliente
Nombres Texto largo
Nombres del cliente
Apellidos Texto largo
Apellidos del cliente
Telefono Número
Teléfono del cliente
Direccion Texto largo
Dirección donde reside el cliente
Ciudad Texto corto
Ciudad donde reside el cliente
Departamento Texto corto
Departamento donde reside el
cliente
Correo Texto corto
Correo electrónico del cliente
ClientexCampania Tabla
Tabla que almacena los clientes
de cada campaña
Id_clientexcampa Autonumeración
Código del cliente de esa
campaña
Id_campania Llave foránea
Número
Identificador de la campaña
Id_cliente Llave Foránea
Número
Identificador del cliente
CampaniaPublicitaria Tabla
Tabla de la campaña publicitaria
Id_campania Número
Identificador de la campaña
Descripcion Texto largo
18
Descripción de la campaña
Fecha_inicio Fecha/hora
Fecha y hora en que se inició la
campaña
Fecha_fin Fecha/hora
Fecha y hora en que finalizó la
campaña
ExcelQuejas ExcelQuejas Tabla
Tabla en Excel donde se
relaciona las quejas interpuestas
por los clientes
Fecha Fecha corta
Fecha en formato dd/mm/AAAA
que el cliente interpuso la queja
Cédula del cliente Texto
Cédula del cliente
Nombre del cliente Texto
Nombre del cliente
Telefono de contacto Número
Teléfono del cliente
Motivo de la queja Texto
Motivo por el que se está
quejando
Descripción de la queja Texto
Texto descriptivo y detallado de
la queja
Estado Texto
Estado de la queja
Descrición del producto Texto
Descripción de la queja.
8. Arquitectura de metadatos
Teniendo en cuenta que la empresa está en expansión y desea masificar sus ventas a
través de las ventas e-line o comercio electrónico, se espera que haya un volumen de
pedido, sin ningún tipo de información duplicada y además con generación de reportes en tiempo
19
Tabla 3
Fuente de metadatos
Departamento de sistemas,
ya que será mucho más
sencillo los mantenimientos,
la seguridad y realizar copias
de seguridad.
20
9. Grafica de la arquitectura
Figura 1
Grafica de la arquitectura
21
10. Herramientas de software para la gestión de metadatos
Las 3 herramientas que se citarán son Talend Open Studio for Data Integration (TDI),
desarrollado en Java con capacidad para integrar grandes volúmenes de datos (Big Data), con
software y servicios. Esta herramienta presenta en su estructura dos flujos: a) Main que marca un
inicio y un final donde devuelve la información y b) Iterate donde marca un inicio, manda un
22
Herramienta de código abierto desarrollado en Java, utiliza el componente “Spoon“ que
es el diseñador gráfico, los flujos de datos se definen mediante una transformación utilizando una
Collibra
datos, permitiendo encontrar significado a los datos permitiendo entender y encontrar sentidos a
los datos de una organización de esta forma mejorar las decisiones derivadas de ellos. Esta
23
11. Modelo SistemaVentas.mwb
Figura 2
Modelo SistemaVentas.mwb
24
12. Importancia de las herramientas de gestión de metadatos en una organización.
organización, que facilita información fidedigna que sirve de soporte para la toma de decisiones
datos seguros y confiables, además permite trazar el dato desde el destino (target) hasta las
fuentes (orígenes).
Para trabajar con esta herramienta de gestión de metadatos y para este caso particular
También previa a la instalación de Talend Open Studio y dado que esta es una
herramienta desarrollada en Java, se hace necesario instalar el Java Development Kit (JDK) que
Figura 3
Talend Open Studio
25
Esta herramienta nos ofrece una interfaz nos ofrece el nodo metadata que permite
gestionar las conexiones, las configuraciones y los esquemas, y de esta manera poder extraer
datos a partir de diferentes orígenes o fuentes, esto se produce para que sean utilizados en
La interfaz es bastante amigable de tipo Drag and Drop que funciona, además ahorra
Figura 4
26
14. Estructura de datos implementada con el modelo suministrado.
Figura 5
Tabla Customers
Figura 6
Tabla Employees
27
Figura 7
Tabla Offices
Figura 8
Tabla OrderDetails
28
Figura 9
Tabla Orders
Figura 10
Tabla Payments
29
Figura 11
Tabla productlines
Figura 12
Tabla products
30
15. Jobs en la Herramienta Talend Open Studio
Una vez listas la fuente de datos se debe instalar JDK y posteriormente Talend Open Studio for
Figura 13
31
Después de eliminar el campo addressLine2, quedando 12 columnas
Figura 15
Figura 16
32
Figura 17
coma Figura 18
Figura 19
Job para importar desde el archivo Excel, disponible para la descarga en el lugar donde encontró
esta guía (entorno de conocimiento) y lo exporte a un formato de datos diferente.
33
Se exporta a un archivo csv delimitado por punto y coma (;)
Figura 20
Figura 21
Ficheros
34
Figura 22
Ficheros obtenidos
35
16. Conclusiones
Los metadatos constituyen una parte de gran relevancia en el gobierno de datos, ya que
con base a ellos es posible tomar decisiones que pueden ser importantes para una organización,
mercado tanto de pago como de código abierto. Para el desarrollo de esta practica se trabajó con
Talend Open Studio como herramienta de código abierto, para la gestión de los metadatos
procedentes de un modelo de base de datos, encontrándose con una interfaz muy intuitiva, de
fácil manejo, que permite extraer metadata de diferentes fuentes como XML, Excel, JSON, SQL,
entre otros, además que también se pueden generar archivos de múltiples fuentes.
36
17. Referencias bibliográficas
Gómez, M., Lora, J., Portilla, W., Vega, R., & Heredia, D. (2019). Análisis comparativo de
herramientas para la gestión de metadatos.
http://revistas.unisimon.edu.co/index.php/identic/article/view/3485
37