Documentos de Académico
Documentos de Profesional
Documentos de Cultura
E s p e c i a l i z a c i ó n S e n a
Contenido
ALCALDIA DE SAN ANTONIO DEL SENA..........................................................................3
MIGRACIÓN: SECRETARÍA DE HACIENDA................................................................................3
TÉCNICAS EXISTENTES.............................................................................................................3
SINCRONIZACIÓN DE BASE DE DATOS.....................................................................................3
IMPORTACIÓN/EXPORTACIÓN DE ARCHIVOS (CSV) O XML A TRAVÉS DE COMANDOS DE
CONSOLA O INTERFAZ GRÁFICA.............................................................................................3
SENTENCIAS DML....................................................................................................................4
PROCEDIMIENTOS ETCL (EXTRACCIÓN, TRANSFORMACIÓN, LIMPIEZA Y CARGA)................5
QUÉ SE DEBE TENER EN CUENTA PARA LA ELECCIÓN DEL SOFTWARE DE ETL.......................6
HERRAMIENTAS ETCL..............................................................................................................7
APLICACIÓN SMBD SELECCIONADO SQL SERVER INTEGRATION SERVICES:...........................9
ORACLE WAREHOUSE BUILDER:...........................................................................................11
Enterprise ETL Option...........................................................................................................11
VENTAJAS, DESVENTAJAS, TIEMPOS Y COSTO DE LAS HERRAMIENTAS................................15
ALCALDIA DE SAN ANTONIO DEL SENA
TÉCNICAS EXISTENTES
Se logra mediante la copia de datos y metadatos de una base de datos origen a una
sincronización de los SMBD son configurados con las bases de datos origen y la base
seguridad.
Para las actividades de migración de datos es muy común utilizar archivos para el
movimiento de los datos. Se pueden utilizar diferentes tipos de archivos, pero los
formatos más usados son los archivos de texto, llamados archivos planos, que
o Latín-1 y Unicode.
Los archivos de texto pueden tener formato delimitado utilizando coma (,), punto y
coma (;) o Tabulaciones para delimitar los campos definiendo de esa forma columnas
y filas. También pueden tener formato de ancho fijo para los campos, que se utiliza
español Valores Separados por Coma), donde el delimitador usado es una coma. Muy
Language), que utiliza un metalenguaje extensible de etiquetas las cuales sirven como
SENTENCIAS DML
Una posibilidad de los SMBD es la utilización de sentencias DML para generar scripts
sesión y permisos.
datos.
Perfilado de datos: Permite explorar los propios datos, agregando a los de origen las
reglas necesarias. Esta técnica hace posible también el obtener resultados acerca de
Limpieza de datos: Puede llevarse a cabo empleando para ello una herramienta de
Data Quality que ayude a eliminar errores, incorrecciones o duplicidades, entre otras
inconsistencias; y que, al mismo tiempo, enriquezca y homologue los datos,
Conexión a distintas fuentes de datos: Técnica que precisa de una herramienta ad hoc
reducción del índice de errores, mayor agilidad y optimización del tiempo; ya que su
automatización evita los procesos manuales, algo que supone su principal beneficio.
Existen muchas herramientas de ETL diferentes, como también hay infinidad de bases de
seguridad, etc.
Capacidades SOA.
proyecto es decisiva. Una decisión correcta pasa por la automatización y en base a ella
quedan garantizados:
Mayor precisión.
Minimización de errores.
HERRAMIENTAS ETCL
APLICACIÓN DE USO LIBRE
Benetl: Es una herramienta ETL de uso libre, desarrollada entre los años 2007 – 2014, hecha
Esta herramienta se creó para facilitar el trabajo con archivos TXT, CSV o archivos de fuente
de datos XML. Para recuperar los datos que tendrán que definir un dato de tiempo y una
entidad, que está representado por datos a calcular o para mostrar. Todos los objetos útiles
serán creados por Benetl dentro de una base de datos MySQL o PostgreSQL. La aplicación
entidad.
Características Benetl
Tecnologías:
o Java 7 update 80
Requerimientos Técnicos:
Debe presionar enter para validar su nombre EtlTool, y luego se pueden guardar los
parámetros.
Los paquetes pueden funcionar en solitario o junto con otros paquetes para hacer frente a
datos de diversos orígenes como archivos de datos XML, archivos planos y orígenes de datos
administrar los paquetes. Las herramientas gráficas de Integration Services se pueden usar
para crear soluciones sin escribir una sola línea de código. También se puede programar el
El SSIS Import/Export Wizard permite mover datos de origen a destino sin modificar los datos
destino dentro de tablas de ETL. Se pueden importar datos de fuentes diferentes a SQL
Server.
Los paquetes, que son las unidades de almacenamiento de estas tareas de migración se
pueden guardar en archivos dtsx o en la base de datos en formato XML. Una vez
Características SSIS
Studio.
metadatos. Esta brinda características para asegurar la calidad de datos, que integran el
La opción empresarial ETL (Enterprise ETL Option) para Warehouse Builder es una opción
que puede ser adquirida con Oracle Warehouse Builder como parte de la edición empresarial
los recursos debido a las grandes cantidades de datos que participan en la carga.
Como parte de la Enterprise ETL Option, Warehouse Builder permite ejecutar cargas
de datos usando métodos rápidos y eficientes tales como el Oracle Data Pump y
movimiento de datos que se realiza por medio de conjuntos de datos controlados por
esta dimensión como cualquier otra. El siguiente paso es definir cómo efectuar los
Management) le permiten prever el efecto que puedan tener los cambios que se
hagan en cualquier lugar de los metadatos del sistema ETL antes de que estos puedan
afectarlo y deterióralo.
Por primera vez, tendrá la posibilidad de administrar los cambios de su sistema de
manera proactiva. Como un ejemplo (Figura 3), usted puede propagar los cambios a
desarrollo.
VENTAJAS, DESVENTAJAS, TIEMPOS Y COSTO DE LAS HERRAMIENTAS.
Técnica Descripción
Es una técnica muy utilizada en procesos de migración de datos, consiste en hacer que dos bases de
datos sean equivalentes en el mismo tiempo.
Se logra mediante la copia de datos y metadatos de una base de datos origen a una base de datos
Sincronización
destino mediante una herramienta tecnológica. Los asistentes de sincronización de los SMBD son
de
base de datos
configurados con las bases de datos origen y la base de datos destino, parametrizando la ubicación
de particiones y métodos de seguridad.
Requerimiento
SQL SERVER s Ventajas Desventajas Tiempo
Técnicos
Es un sistema de gestión de base Utiliza mucho la
de datos. memoria RAM para
Es útil para manejar y obtener las instalaciones y
datos de la red de redes. utilización de
Nos permite olvidarnos de los software.
ficheros que forman la base de No se puede utilizar
datos. como practicas
3 semanas.
Si trabajamos en una red social porque se prohíben
Semana 1:
nos permite agregar otros muchas cosas, tiene
Análisis de
servidores de SQL Server. Por restricciones en lo
datos
ejemplo, dos personas que particular.
Semana 2:
Sql server trabajan con SQL Server, uno de La relación, calidad y
Migración y
standar ellos se puede conectar al servidor el precio está muy
validación de
de su otro compañero y así se debajo comparado
información
puede ver las bases de datos del con oracle.
Semana 3:
otro compañero con SQL Server. Tiene muchos
Optimización
SQL permite administrar permisos bloqueos a nivel de
de proceso
a todo. También permite que página, un tamaño
alguien conecte su SQLO al de página fijo y
nuestro, pero sin embargo demasiado pequeño,
podemos decirle que no puede ver una pésima
esta base de datos, pero otro sí. implementación de
los tipos de datos
variables.
ORACLE Oracle Oracle es el motor de base de Las versiones más 3 semanas.
WAREHOUSE Estándar datos objeto relacional más usado recientes de Oracle Semana 1:
BUILDER a nivel mundial. son la 11g, 10g, 9g, Análisis de
Puede ejecutarse en todas las 8g, desde el datos
plataformas, desde una Pc hasta lanzamiento original Semana 2:
un supercomputador. de la 8 se sucedieron Migración y
Oracle soporta todas las funciones varias versiones con validación de
que se esperan de un servidor correcciones, hasta información
"serio": un lenguaje de diseño de alcanzar la estabilidad Semana 3:
bases de datos muy completo en la 8.0.3. El motivo
(PL/SQL) que permite implementar de tantos fallos fue, al
diseños "activos", con triggers y parecer, la
procedimientos almacenados, con remodelación del
una integridad referencial sistema de
declarativa bastante potente. almacenamiento por
Permite el uso de particiones para causa de la
la mejora de la eficiencia, de introducción de
replicación e incluso ciertas extensiones
versiones admiten la orientadas a objetos.
administración de bases de datos El mayor
distribuidas. inconveniente de
El software del servidor puede Oracle es quizás su
ejecutarse en multitud de sistemas precio. Incluso las
operativos. licencias de Personal
Existe incluso una versión personal Oracle son
para Windows 9x, lo cual es un excesivamente caras,
punto a favor para los en mi opinión. Otro
desarrolladores que se llevan problema es la
trabajo a casa. necesidad de ajustes.
Optimización
Oracle es la base de datos con más Un error frecuente
de
orientación hacía INTERNET. consiste en pensar
proceso
que basta instalar el
Oracle en un servidor
y enchufar
directamente las
aplicaciones clientes.
Un Oracle mal
configurado puede
ser
desesperantemente
lento.
También es elevado el
coste de la
información, y sólo
últimamente han
comenzado a
aparecer buenos
libros sobre asuntos
técnicos distintos de
la simple instalación y
administración.