Está en la página 1de 17

201

DISEÑO Y ADMINISTRACIÓN DE UNA BASE DE


DATOS PARA UNA ALCALDÍA.
9
AA5-1
Efectuar la migración de datos de acuerdo con los
requerimientos de la organización.

Kelvin Jimenez Manga

E s p e c i a l i z a c i ó n S e n a
Contenido
ALCALDIA DE SAN ANTONIO DEL SENA..........................................................................3
MIGRACIÓN: SECRETARÍA DE HACIENDA................................................................................3
TÉCNICAS EXISTENTES.............................................................................................................3
SINCRONIZACIÓN DE BASE DE DATOS.....................................................................................3
IMPORTACIÓN/EXPORTACIÓN DE ARCHIVOS (CSV) O XML A TRAVÉS DE COMANDOS DE
CONSOLA O INTERFAZ GRÁFICA.............................................................................................3
SENTENCIAS DML....................................................................................................................4
PROCEDIMIENTOS ETCL (EXTRACCIÓN, TRANSFORMACIÓN, LIMPIEZA Y CARGA)................5
QUÉ SE DEBE TENER EN CUENTA PARA LA ELECCIÓN DEL SOFTWARE DE ETL.......................6
HERRAMIENTAS ETCL..............................................................................................................7
APLICACIÓN SMBD SELECCIONADO SQL SERVER INTEGRATION SERVICES:...........................9
ORACLE WAREHOUSE BUILDER:...........................................................................................11
Enterprise ETL Option...........................................................................................................11
VENTAJAS, DESVENTAJAS, TIEMPOS Y COSTO DE LAS HERRAMIENTAS................................15
ALCALDIA DE SAN ANTONIO DEL SENA

MIGRACIÓN: SECRETARÍA DE HACIENDA

TÉCNICAS EXISTENTES

Existen varias técnicas relacionadas con los procesos de migración de datos, a

continuación, se relacionan las más utilizadas en los procesos actuales.

SINCRONIZACIÓN DE BASE DE DATOS

Es una técnica muy utilizada en procesos de migración de datos, consiste en hacer

que dos bases de datos sean equivalentes en el mismo tiempo.

Se logra mediante la copia de datos y metadatos de una base de datos origen a una

base de datos destino mediante una herramienta tecnológica. Los asistentes de

sincronización de los SMBD son configurados con las bases de datos origen y la base

de datos destino, parametrizando la ubicación de particiones y métodos de

seguridad.

IMPORTACIÓN/EXPORTACIÓN DE ARCHIVOS (CSV) O XML A TRAVÉS DE


COMANDOS DE CONSOLA O INTERFAZ GRÁFICA

Para las actividades de migración de datos es muy común utilizar archivos para el

movimiento de los datos. Se pueden utilizar diferentes tipos de archivos, pero los

formatos más usados son los archivos de texto, llamados archivos planos, que

guardan la información sin formato usando solo caracteres.


Los sistemas de codificación más comunes para estos archivos son: ASCII, ISO-8859-1

o Latín-1 y Unicode.

Los archivos de texto pueden tener formato delimitado utilizando coma (,), punto y

coma (;) o Tabulaciones para delimitar los campos definiendo de esa forma columnas

y filas. También pueden tener formato de ancho fijo para los campos, que se utiliza

para delimitar columnas y filas.

Un formato de archivo plano muy usado es el “.CSV” (Comma-Separated-Values, en

español Valores Separados por Coma), donde el delimitador usado es una coma. Muy

usado para movimientos de datos con hojas de cálculo.

Otro formato útil para la migración de datos es el “.XML” (eXtensible Marckup

Language), que utiliza un metalenguaje extensible de etiquetas las cuales sirven como

estándar para intercambio de información estructurada entre distintas plataformas.

SENTENCIAS DML

Una posibilidad de los SMBD es la utilización de sentencias DML para generar scripts

SQL que permiten realizar migraciones de bases de datos existentes.

En un script SQL se pueden realizar las siguientes tareas:

o Copia de seguridad para creación de todos los usuarios, grupos, inicios de

sesión y permisos.

o Creación o actualización de código para la implementación de una base de

datos.

o Creación de un entorno de pruebas.


Los procesos se orientan al uso de las sentencias DML, para realizar el paso de datos

de la base de datos de origen a la base de datos destino, a través de los entornos

administrativos de los SMBD.

PROCEDIMIENTOS ETCL (EXTRACCIÓN, TRANSFORMACIÓN, LIMPIEZA Y


CARGA)

Esta técnica se basa en el diseño y construcción de procedimientos técnicos para

realizar Extracción, Transformación, Limpieza y Cargue de Datos (ETCL).

Los procedimientos o pasos necesarios para el desarrollo de un proyecto de

migración de datos utilizando la metodología ETCL son:

En todo proceso de migración, se ha de proceder a integrar dos o más sistemas por lo

cual pueden usarse diferentes técnicas, siendo las más comunes:

Perfilado de datos: Permite explorar los propios datos, agregando a los de origen las

reglas necesarias. Esta técnica hace posible también el obtener resultados acerca de

duplicidades o errores en los datos.

Limpieza de datos: Puede llevarse a cabo empleando para ello una herramienta de

Data Quality que ayude a eliminar errores, incorrecciones o duplicidades, entre otras
inconsistencias; y que, al mismo tiempo, enriquezca y homologue los datos,

preparándolos para el sistema de destino.

Conexión a distintas fuentes de datos: Técnica que precisa de una herramienta ad hoc

que garantice el hacerlo en condiciones de simultaneidad. Las ventajas que

proporciona el usar estas tecnologías se traducen en un aumento de la precisión,

reducción del índice de errores, mayor agilidad y optimización del tiempo; ya que su

automatización evita los procesos manuales, algo que supone su principal beneficio.

QUÉ SE DEBE TENER EN CUENTA PARA LA ELECCIÓN DEL SOFTWARE DE


ETL

Existen muchas herramientas de ETL diferentes, como también hay infinidad de bases de

datos, sistemas y organizaciones distintas. En el momento de seleccionar la que liderará la

migración e integración de datos pueden tomarse en consideración las recomendaciones de

Gartner en cuanto a las cualidades que la herramienta ha de presentar:

Adaptabilidad a distintos sistemas operativos y plataformas hardware.

Capacidades de gestión de datos: en cuanto a minería, perfilado y calidad.

Habilidades para monitorizar, gestionar y controlar los procesos de integración de datos: en

lo relativo a gestión de errores, recolección de estadísticas de ejecución, controles de

seguridad, etc.

Capacidades SOA.

Capacidades de diseño y entorno de desarrollo: como soporte para test,

representaciones gráficas, modelos y flujos de datos y flujos de datos, etc.

Cualidades de arquitectura e integración referidas al grado de interoperabilidad,

compactación y consistencia de los diferentes componentes que la formen.


Aunque la elección de un software de ETL no es sencilla, su repercusión en el curso del

proyecto es decisiva. Una decisión correcta pasa por la automatización y en base a ella

quedan garantizados:

Un aumento en la velocidad de desarrollo del proyecto.

La descentralización del control de la ejecución y de todos los procesos.

Una mayor agilidad en el negocio.

Mayor precisión.

Minimización de errores.

HERRAMIENTAS ETCL
APLICACIÓN DE USO LIBRE

Benetl: Es una herramienta ETL de uso libre, desarrollada entre los años 2007 – 2014, hecha

en java y trabaja con base a lenguajes de base de datos PostgreSQL o MySQL.

Esta herramienta se creó para facilitar el trabajo con archivos TXT, CSV o archivos de fuente

de datos XML. Para recuperar los datos que tendrán que definir un dato de tiempo y una

entidad, que está representado por datos a calcular o para mostrar. Todos los objetos útiles

serán creados por Benetl dentro de una base de datos MySQL o PostgreSQL. La aplicación

también es capaz de recuperar automáticamente los datos mediante el uso de diversas

tareas planificadas de su sistema.

Mediante el uso de Benetl podrá se ha podido recuperar fácilmente la información de los

archivos de datos planos, la organización y el filtrado de acuerdo con su dato de tiempo y

entidad.

Características Benetl

Tecnologías:

o Java 7 update 80

o PostgreSQL 9.5.0 (con el apoyo plpgsql)

o MySQL 5.6 con función de OLD_PASSWORD de inicio de sesión de usuario

(para controlador suministrado)

o Con Windows (se utiliza "tareas programadas")


o Benetl 4.7 funciona en Linux.

Requerimientos Técnicos:

o ejecución de Java (JRE) 1.7

o base de datos PostgreSQL 9.5 con soporte plpgsql

o base de datos de MySQL 5.6 con OLD_PASSWORD la función de inicio de

sesión de usuario o el controlador oficial de MySQL (no incluido)

o Probado en sistemas de 64 bits

Ejemplo: Nombre EtlTool… Definir Nombre, Este nombre es también el nombre de la

tabla de PostgreSQL o tabla de MySQL donde se almacenan las líneas de datos.

Un archivo llamado "EtlTool.bat" se creará en la carpeta de origen de datos.

Debe presionar enter para validar su nombre EtlTool, y luego se pueden guardar los

parámetros.

APLICACIÓN SMBD SELECCIONADO SQL SERVER INTEGRATION SERVICES:

Microsoft Integration Services es una plataforma para la creación de soluciones

empresariales de transformaciones de datos e integración de datos. Integration Services

sirve para resolver complejos problemas empresariales mediante la copia o descarga de

archivos, el envío de mensajes de correo electrónico como respuesta a eventos, la


actualización de almacenamientos de datos, la limpieza y minería de datos, y la

administración de objetos y datos de SQL Server.

Los paquetes pueden funcionar en solitario o junto con otros paquetes para hacer frente a

las complejas necesidades de la empresa. Integration Services puede extraer y transformar

datos de diversos orígenes como archivos de datos XML, archivos planos y orígenes de datos

relacionales y, después, cargar los datos en uno o varios destinos.

Integration Services contiene un variado conjunto de tareas y transformaciones integradas,

herramientas para la creación de paquetes y el servicio Integration Services para ejecutar y

administrar los paquetes. Las herramientas gráficas de Integration Services se pueden usar

para crear soluciones sin escribir una sola línea de código. También se puede programar el

amplio modelo de objetos de Integration Services para crear paquetes mediante

programación y codificar tareas personalizadas y otros objetos de paquete.

El SSIS Import/Export Wizard permite mover datos de origen a destino sin modificar los datos

del origen y permitiendo hacer iteraciones y cambios de información antes de llegar al

destino dentro de tablas de ETL. Se pueden importar datos de fuentes diferentes a SQL

Server.

Con la herramienta Business Intelligence Development Studio, se pueden realizar tareas de

migración fácilmente usando tareas visuales. Si se desea crear nueva funcionalidad, se

pueden crear scripts en c# o VB.

Los paquetes, que son las unidades de almacenamiento de estas tareas de migración se

pueden guardar en archivos dtsx o en la base de datos en formato XML. Una vez

implementado el paquete puede ser depurado.

Características SSIS

o Ultima Version: SQL Server 2014 Integration Services


o Requerimientos Técnicos:

 Instalar en un equipo de 64 bits

 Instalar en un servidor dedicado para ETL

 Si requiere las características en tiempo de diseño de Integration

Services, también debe instalar Business Intelligence Development

Studio.

 Si necesita las versiones de 32 bits de las herramientas y del motor en

tiempo de ejecución de Integration Services para ejecutar ciertos

paquetes en modo de 32 bits, también debe instalar Business

Intelligence Development Studio

ORACLE WAREHOUSE BUILDER:

Es una complete herramienta para todos los aspectos de administración de datos y

metadatos. Esta brinda características para asegurar la calidad de datos, que integran el

modelado relacional y multidimensional y que permiten la administración de todo el ciclo de

vida de datos y metadatos

Enterprise ETL Option

La opción empresarial ETL (Enterprise ETL Option) para Warehouse Builder es una opción

que puede ser adquirida con Oracle Warehouse Builder como parte de la edición empresarial

del motor de base de datos (Oracle DB Enterprise Edition).


Opciones Avanzadas para Carga de Datos

En grandes implementaciones, más y más procesos se ejecutan en paralelo, agotando

los recursos debido a las grandes cantidades de datos que participan en la carga.

Como parte de la Enterprise ETL Option, Warehouse Builder permite ejecutar cargas

de datos usando métodos rápidos y eficientes tales como el Oracle Data Pump y

transportable tablespaces. Esta es una aproximación completamente diferente al

movimiento de datos que se realiza por medio de conjuntos de datos controlados por

el motor de base de datos. Los incrementos en velocidad de carga se deben entonces

a la omisión de las capas SQL tradicionales.

Soporte a Dimensiones Lentamente Cambiantes Integrado

En Warehouse Builder la lógica de dimensiones lentamente cambiantes es diseñada

en los metadatos de la dimensión. La dimensión captura toda la lógica que será

aplicada a los datos que se insertan dentro de la misma.


Una vez, los usuarios de negocio han decidido que atributos son importantes, el

modelador de datos diseña la dimensión. Con los pasos de ETL el desarrollador ve

esta dimensión como cualquier otra. El siguiente paso es definir cómo efectuar los

cambios y actualizaciones en la dimensión. Warehouse Builder automatiza esto

basado en la definición de la dimensión. La combinación entre estos pasos, el diseño

y la estandarización hacen que los procesos relacionados con dimensiones

lentamente cambiantes presente un alto desempeño en su ejecución.

Traza Lineal de Principio a Fin

Los servicios de administración de dependencias (Warehouse Builder Dependency

Management) le permiten prever el efecto que puedan tener los cambios que se

hagan en cualquier lugar de los metadatos del sistema ETL antes de que estos puedan

afectarlo y deterióralo.
Por primera vez, tendrá la posibilidad de administrar los cambios de su sistema de

manera proactiva. Como un ejemplo (Figura 3), usted puede propagar los cambios a

través de su sistema haciendo uso el Mapping Editor.

Administración de Configuraciones Avanzadas

Tener que mover sistemas o aplicaciones de un ambiente a otro (por ejemplo de

desarrollo a producción) es un problema frecuente.

Con la Enterprise ETL Option de Warehouse Builder, es posible generar un modelo

para configurar los ambientes de desarrollo, pruebas y producción a niveles

separados. Para mover los cambios desde el ambiente de desarrollo a producción, el

código generado en desarrollo es modificado en producción solo en áreas específicas.

Por ejemplo, la información sobre las conexiones es substituida por la definida en

desarrollo.
VENTAJAS, DESVENTAJAS, TIEMPOS Y COSTO DE LAS HERRAMIENTAS.

Técnica Descripción
Es una técnica muy utilizada en procesos de migración de datos, consiste en hacer que dos bases de
datos sean equivalentes en el mismo tiempo.
Se logra mediante la copia de datos y metadatos de una base de datos origen a una base de datos
Sincronización
destino mediante una herramienta tecnológica. Los asistentes de sincronización de los SMBD son
de
base de datos
configurados con las bases de datos origen y la base de datos destino, parametrizando la ubicación
de particiones y métodos de seguridad.

Requerimiento
SQL SERVER s Ventajas Desventajas Tiempo
Técnicos
Es un sistema de gestión de base Utiliza mucho la
de datos. memoria RAM para
Es útil para manejar y obtener las instalaciones y
datos de la red de redes. utilización de
Nos permite olvidarnos de los software.
ficheros que forman la base de No se puede utilizar
datos. como practicas
3 semanas.
Si trabajamos en una red social porque se prohíben
Semana 1:
nos permite agregar otros muchas cosas, tiene
Análisis de
servidores de SQL Server. Por restricciones en lo
datos
ejemplo, dos personas que particular.
Semana 2:
Sql server trabajan con SQL Server, uno de La relación, calidad y
Migración y
standar ellos se puede conectar al servidor el precio está muy
validación de
de su otro compañero y así se debajo comparado
información
puede ver las bases de datos del con oracle.
Semana 3:
otro compañero con SQL Server. Tiene muchos
Optimización
SQL permite administrar permisos bloqueos a nivel de
de proceso
a todo. También permite que página, un tamaño
alguien conecte su SQLO al de página fijo y
nuestro, pero sin embargo demasiado pequeño,
podemos decirle que no puede ver una pésima
esta base de datos, pero otro sí. implementación de
los tipos de datos
variables.
ORACLE Oracle Oracle es el motor de base de Las versiones más 3 semanas.
WAREHOUSE Estándar datos objeto relacional más usado recientes de Oracle Semana 1:
BUILDER a nivel mundial. son la 11g, 10g, 9g, Análisis de
Puede ejecutarse en todas las 8g, desde el datos
plataformas, desde una Pc hasta lanzamiento original Semana 2:
un supercomputador. de la 8 se sucedieron Migración y
Oracle soporta todas las funciones varias versiones con validación de
que se esperan de un servidor correcciones, hasta información
"serio": un lenguaje de diseño de alcanzar la estabilidad Semana 3:
bases de datos muy completo en la 8.0.3. El motivo
(PL/SQL) que permite implementar de tantos fallos fue, al
diseños "activos", con triggers y parecer, la
procedimientos almacenados, con remodelación del
una integridad referencial sistema de
declarativa bastante potente. almacenamiento por
Permite el uso de particiones para causa de la
la mejora de la eficiencia, de introducción de
replicación e incluso ciertas extensiones
versiones admiten la orientadas a objetos.
administración de bases de datos El mayor
distribuidas. inconveniente de
El software del servidor puede Oracle es quizás su
ejecutarse en multitud de sistemas precio. Incluso las
operativos. licencias de Personal
Existe incluso una versión personal Oracle son
para Windows 9x, lo cual es un excesivamente caras,
punto a favor para los en mi opinión. Otro
desarrolladores que se llevan problema es la
trabajo a casa. necesidad de ajustes.
Optimización
Oracle es la base de datos con más Un error frecuente
de
orientación hacía INTERNET. consiste en pensar
proceso
que basta instalar el
Oracle en un servidor
y enchufar
directamente las
aplicaciones clientes.
Un Oracle mal
configurado puede
ser
desesperantemente
lento.
También es elevado el
coste de la
información, y sólo
últimamente han
comenzado a
aparecer buenos
libros sobre asuntos
técnicos distintos de
la simple instalación y
administración.

También podría gustarte