Está en la página 1de 11

VALIDACIÓN DE TÉCNICAS DE MIGRACIÓN Y HERRAMIENTAS ETCL

JESSICA PIMENTEL CANTERO

PRESENTADO A:
JAVIER MAURICIO ALVAREZ VARGAS

SERVICIO NACIONAL DE APRENDIZAJE


GESTIÓN Y SEGURIDAD DE BASE DE DATOS
POPAYÁN
2019
Contenido
1. INTRODUCCIÓN ...................................................................................................................... 3
2. OBJETIVOS ............................................................................................................................... 3
2.1. OBJETIVO GENERAL ...................................................................................................... 3
2.2. OBETIVOS ESPECIFICOS ............................................................................................... 3
3. TÉCNICAS DE MIGRACIÓN ................................................................................................... 4
3.1. Sincronización de base de datos .......................................................................................... 4
3.2. Importación/Exportación de archivos (CSV) o XML ......................................................... 4
3.3. Sentencias DML .................................................................................................................. 6
4. HERRAMIENTAS ETCL........................................................................................................... 6
4.1. ETCL: Las siglas ETCL se refieren a la extracción, trasformación, limpieza y carga de
datos (DBA, 2017). ......................................................................................................................... 6
4.2. Herramientas ETCL ............................................................................................................ 7
4.2.1. SQL Server (Integration services): Es una plataforma que permite desarrollar ETCL
en ámbitos empresariales, soluciones de integración de datos de alto rendimiento (Microsoft,
2018). 7
4.2.2. Oracle Warehouse Builder: Es una herramienta basada en los aspectos de integración
de datos (Oracle, Guía del usuario de Warehouse Builder, 2019). ............................................. 8
4.2.3. Benetl: Es una herramienta ETL gratuita (Benetl is a free ETL tool, s.f.) .................. 9
4.2.4. Informatica powerCenter: Es una plataforma de integración basada en metadatos
(Powerdata, 2017). ...................................................................................................................... 9
5. COMPARACIÓN ..................................................................................................................... 10
6. BIBLIOGRAFÍA....................................................................................................................... 11
Tablas
Tabla 1 Cuadro comparativo de tipos de archivos .............................................................................. 5

Ilustraciones
Ilustración 1 Sincronización de base de datos ........................................................................ 4
Ilustración 2 Ejemplo CSV ..................................................................................................... 5
Ilustración 3 Ejemplo XML.................................................................................................... 5
Ilustración 4 ETL .................................................................................................................... 6
Ilustración 5 SQL Server Integration Services ....................................................................... 8
Ilustración 6 Oracle Warehouse Builder ................................................................................ 8
Ilustración 7 Benetl ................................................................................................................. 9
Ilustración 8 Informática PowerCenter................................................................................. 10
Ilustración 9 Herramientas ETCL......................................................................................... 10
1. INTRODUCCIÓN

En el siguiente trabajo se presentan los conceptos más importantes en la ejecución de una


migración de datos, se deben tener en cuenta aspectos como el motor de base de datos
seleccionado, el equipo hardware, la información más relevante, y la herramienta ETCL a
utilizar; por otro lado, cabe destacar que dentro de la migración existen diferentes técnicas
que se pueden utilizar para el desarrollo de la migración.

Se pretende conocer a fondo estas características para más adelante ejecutar un buen plan
de migración

2. OBJETIVOS
1.1. OBJETIVO GENERAL
 Conocer los conceptos necesarios para ejecutar la migración de una base de datos a
otra.

1.2. OBETIVOS ESPECIFICOS


 Dar a conocer las diferentes técnicas de migración existentes.
 Mostrar las herramientas ETCL disponibles en el mercado
 Analizar los conceptos sobre ETCL y migración de datos
3. TÉCNICAS DE MIGRACIÓN
A continuación, se presentan las técnicas existentes para ejecutar la migración de datos

3.1. Sincronización de base de datos

Ilustración 1 Sincronización de base de datos

Básicamente se basa en el proceso de replicación de toda la información de la base de datos


de origen a la base de datos de destino, con el fin de no perder ningún dato. (Sincronizar
bases de datos de Analysis Services, 2018)

3.2. Importación/Exportación de archivos (CSV) o XML


Esta técnica es muy importante ya que es la que permitirá trasladar la información, en este
caso en archivos planos; que significa que solo están compuestos por caracteres sin ningún
formato (Alegsa, 2018). A continuación, se presentan dos tipos de archivos planos:
TIPOS DE ARCHIVOS
CSV (Andrew, s.f.) XML (Manual de XML, s.f.)
Comma-separated-values eXtensible Markup Language (Lenguaje de marcado
(Valores separados por coma) extensible)
Delimita utilizando una coma Permite definir lenguaje de marcas
Es ampliamente compatible Diseñado para cualquier lenguaje y alfabeto. (encoding)

Ilustración 2 Ejemplo CSV Ilustración 3 Ejemplo XML

Se almacena como texto en archivo con extensión .csv Se almacena como texto en archivo con extensión .xml
Tabla 1 Cuadro comparativo de tipos de archivos
3.3. Sentencias DML
Es un lenguaje de manipulación de comandos, que permite realizar consultas o
modificaciones de los datos en este caso permitirán la migración de la base de datos. Las
siguientes son las consultas que se pueden realizar sobre una base de datos (Postgresql,
2017):

 SELECT, Realiza consultas sobre los datos.


 INSERT, Inserta los valores en una base de datos.
 UPDATE, Modifica los valores de uno o varios registros.
 DELETE, Elimina las finas de una tabla

Por otro lado, las siguientes son las consultas que se puede ejecutar en el momento de
realizar la migración de datos:

 Copia de seguridad
 Creación y actualización de código para la implementación de la base de datos
 Creación de entorno de pruebas

4. HERRAMIENTAS ETCL
4.1. ETCL: Las siglas ETCL se refieren a la extracción, trasformación, limpieza y
carga de datos (DBA, 2017).

Ilustración 4 ETL
 Extracción: Se basa en la extracción de los datos desde la base de datos de origen;
se debe tener en cuenta que la información se puede presentar en formatos, gestores,
versiones diferentes a la que se pretende utilizar.
 Transformación y limpieza: Cuando se hayan extraído los datos se comienza la
limpieza de ellos, normalizando la base de datos, tipos de datos etc. Y por
consiguiente cambiar el formato al deseado.
 Carga: Se comienza el proceso de traslado de los datos a la base de datos de destino,
una vez realizado esto se generan pruebas de eficiencia y se valida que la
información este correcta.

4.2. Herramientas ETCL


A continuación, se presenta diferentes herramientas para el ETCL

4.2.1. SQL Server (Integration services): Es una plataforma que permite desarrollar
ETCL en ámbitos empresariales, soluciones de integración de datos de alto
rendimiento (Microsoft, 2018).
Características:
 esta herramienta es capaz de extraer y transformar diferentes tipos de
archivos (XML, archivos planos, datos relacionales), y luego realizar la
carga en uno o varios destinos (SQL Server Integration Services, 2018).
 Incluye herramientas graficas
 Asistentes para crear y depurar paquetes
 Ejecución de sentencias SQL y envíos de correo electrónico
 Interfaces de aplicaciones
Ilustración 5 SQL Server Integration Services

4.2.2. Oracle Warehouse Builder: Es una herramienta basada en los aspectos de


integración de datos (Oracle, Guía del usuario de Warehouse Builder, 2019).
Características:
 Se basa en almacenamiento de datos, además de poseer una funcionalidad
avanzada para datos empresariales, calidad de datos y metadatos, permite
más fuentes de datos (Oracle, 2007).
 Capacidad para desarrollar ETCL
 Acceso a variadas fuentes de datos
 Implementaciones y planes de auditoria

Ilustración 6 Oracle Warehouse Builder


4.2.3. Benetl: Es una herramienta ETL gratuita (Benetl is a free ETL tool, s.f.)
Características:

 Funciona sobre MySQL y PostgreSQL


 Trabaja con archivos de origen de datos .csv o .txt o .xls
 También propone una forma automática de recuperar datos
 Puede recuperar fácilmente información de archivos de datos planos,
filtrarlos y organizarlos
 Los separadores para los campos deben ser ';' o pestaña.

Ilustración 7 Benetl

4.2.4. Informatica powerCenter: Es una plataforma de integración basada en metadatos


(Powerdata, 2017).
Características:

 Calidad de datos garantizada, análisis de datos


 Reutilización
 Autonomía
 Escalabilidad
 Innovación en prototipos
 Eficiencia en cuestión de tiempo
 Metadatos
 Perfilado de datos
Ilustración 8 Informática PowerCenter

5. COMPARACIÓN

Ilustración 9 Herramientas ETCL


6. BIBLIOGRAFÍA
Alegsa, L. (2018). Texto plano. Obtenido de http://www.alegsa.com.ar/Dic/texto_plano.php

Andrew, M. (s.f.). que es un archivo de extension csv. Obtenido de https://techlandia.com/archivo-


extension-csv-hechos_47208/

Benetl is a free ETL tool. (s.f.). Obtenido de https://www.benetl.net/

DBA. (2017). Extraccion, transformacion y carga de datos . Obtenido de http://dbadixit.com/etl-


extraccion-transformacion-carga-datos/

IBM. (s.f.). Obtenido de https://www.ibm.com/products/cognos-


analytics?lnk=STW_US_SHP_L1_BLK&lnk2=discount_CogAnalytics&psrc=none&pexp=def

Manual de XML. (s.f.). Obtenido de http://www.mundolinux.info/que-es-xml.htm

Microsoft. (2018). SSIS Cómo crear un paquete ETL. Obtenido de https://docs.microsoft.com/en-


us/sql/integration-services/ssis-how-to-create-an-etl-package?view=sql-server-2017

Oracle. (2007). Oracle Warehouse Builder 11g Versión 1. Obtenido de


https://www.oracle.com/technetwork/es/documentation/317502-esa.pdf

Oracle. (2019). Guía del usuario de Warehouse Builder. Obtenido de


https://docs.oracle.com/cd/B28359_01/owb.111/b31278/concept_overview.htm#BABJG
ACF

Postgresql. (2017). Lenguaje de manipulacion de datos. Obtenido de


https://todopostgresql.com/diferencias-entre-ddl-dml-y-dcl/

Powerdata. (2017). Informática PowerCenter ETL visto desde dentro. Obtenido de


https://blog.powerdata.es/el-valor-de-la-gestion-de-datos/informatica-powercenter-etl-
visto-desde-dentro

Sincronizar bases de datos de Analysis Services. (2018). Obtenido de


https://docs.microsoft.com/es-es/analysis-services/multidimensional-
models/synchronize-analysis-services-databases?view=sql-server-2017

SQL Server Integration Services. (2018). Obtenido de https://docs.microsoft.com/es-


es/sql/integration-services/sql-server-integration-services?view=sql-server-2017

También podría gustarte