Está en la página 1de 60

Reporte Práctica 11

MIGRACIÓN DE DATOS Y USO DE ETL’S

Carlos Rafael Barragán Palestino


Raquel Lizue Martínez Ramos
José Guadalupe Sánchez Carrera INSTITUTO
TECNOLÓGICO DE ORIZABA | EQUIPO 4 ADMINISTRACIÓN DE BASES DE DATOS
INTRODUCCIÓN
La migración de datos consiste en la transferencia de materiales digitales de un origen de datos a otro,
transformando la forma lógica del ente digital de modo que el objeto conceptual pueda ser restituido o
presentado por un nuevo equipo o programa informático. Se trata de una consideración clave para
cualquier implementación, actualización o consolidación de un sistema informático. Se distingue del
refresco, que se limita a mantener el flujo de datos transfiriéndolos simplemente de un soporte a otro.
Hay varias estrategias que pueden ser consideradas una forma de migración, que difieren en el
momento en que se produce la transformación y en los tipos de objetos transformados. El método de
migración más propuesto consiste en convertir de manera permanente un formato lógico en otro, de
manera que todos los objetos ”migrados” puedan ser presentados con una tecnología diferente.

En esta practica se mostrará como llevar a cabo conexiones, migraciones y transformaciones en


distintos gestores de BD utilizando la herramienta PDI (Pentahoo Data Integration) también conocida
como Spoon o Kettle.
DESARROLLO DE LA
PRÁCTICA
1.- Descargar e instalar Kettle

Una vez descargado PDI nos queda un winrar y lo descomprimimos:

Dentro ejecutamos el Spoon.bat


2.- Leer la documentación de kettle para aprender cómo hacer
transformaciones en kettle, la aplicación a ejecutar es spoon.bat, leer con
cuidado como debe estar configurada la máquina virtual de Java. No se
utilizará repositorio de datos

Para poder hacer transformaciones, se deben descargar los diferentes drivers


(.jar) para cada gestor de BD:
Se deben mover a la carpeta lib que es donde están las librerías de pdi,
situada en la carpeta data integration:

Bueno ahora si podemos proceder a ejecutar el software para llevar a cabo la


práctica, este es su entorno:
3.- Migrar los datos de la base de datos Sakilla bajo los siguientes términos:
Solo migrar las vistas
Las tablas que reciben los datos en PostgreSQL, podrán tener nombres
de datos distintos.

Lo primero que se debe hacer por obviedad es correr el servicio de mysql,


después ejecutamos mysql workbench, dentro de una concción, procedemos
a crea un nuevo esquema llamada sakila, el cual esta vacío:

Ahora por medio del cmd ejecutamos mysql, y migramos la base de datos sakila llena, a la base de
datos sakila vacía que creamos en workbench:
Despues de pasar el schema.sql, pasamos la data.sql:

Como podemos ver ya tenemos la BD sakila con el esquema y la data.


Vamos pentahoo, creamos un nuevo trabajo:

Y le damos en crear nueva conección de BD:


Le damos un nombre a la conexión, y definimos que es de tipo MySQL:

Ponemos el host el puerto y el nombre de la bd:


También el nombre de usuario, la contraseña no es necesaria en una conexión MySQL:

Lo probamos y vemos que no tenemos ningun problema:


Ahora creamos una BD llamada sakila, en postgresql, la cual estará vacía ya que migraremos todo con
spoon:

Verificamos que está vacia:


Después cremamos otra conexión de BD:

Esta vez de tipo postgres, y llenamos lo que se requiere:


Probamos, y no tenemos ningun problema:
Ahora en herramientas, le damos en copiar tablas:

Seleccionamos la BD sakila en mysql, y la migramos a postgres:


Seleccionamos todas la tablas para migrar:

Damos un nombre al trabajo, y una dirección para guardarlo:


La conexión fue creada con éxito:

Ahora procedemos a hacer la transformación:


Seleccionamos la tabla que migraremos:

Hacemos una prueba para verificar que no se encuentren errores:


Le damos ejecutar, y como se observa la migración se hizo con éxito:

Verificamos en pgadminIII, y efectivamente se migró toda la BD:


4.- Migrar los datos de la base de datos HR de Oracle a una hoja de cálculo
en Excel, archivos XM, a MySQL y a PostgreSQL.

Creamos un nuevo trabajo:

Y una nueva conexión de tipo Oracle:


Configuramos todo:
Probamos la conexión, y la creamos:

Ahora se crea otra conexión:


De tipo postgresSQL:

En pgadminIII creamos una BD nueva, y vacía llamada HR:


Verificamos que está vacía:

Regresamos a spoon, y probamos la conexión:


No hay problemas, y la creamos:

Ahora en herramientas, damos clic en copiar tablas:


Seleccionamos la conexión hr a migrar:

Seleccionamos todas la tablas:


Y se crea la conexión sin problemas:

Procedemos a hacer la transformación:


Seleccionamos la tabla a migrar:
Hacemos pruebas:
Ejecutamos la conexión y como se observa los datos han sido migrados de Oracle HR a Postgresql HR:
Verificamos en pgadminIII:
También los datos fueron migrados correctamente:
Ahora para migrar HR a MySQL, creamos en workbench una BD vacía llamada hr:
Creamos una nueva conexión en spoon:

De tipo MySQL:
La configuramos correctamente:
La probamos y creamos:

Ahora damos en copiar tablas:


Seleccionamos hr de Oracle para migrarla a hr de MySQL:

Seleccionamos todas las tablas:


Le asignamos nombre y dirección:

Y se creó la conexión correctamente:


Ahora hacemos la transformación:
Comenzamos a migrar tablas:
Hacemos pruebas:

Ejecutamos, y los datos se migraron correctamente:


Verificamos en workbench la migración:

Y los datos también se migraron correctamente:


Ahora para migrar datos a Excel, creamos una nueva transformación:

En nuestra barra de herramientas del lado izquierdo, en input selecionamos una tabla nueva, que será
la entrada de los datos, y la configuramos:
Hacemos una conexión en esa nueva tabla, de tipo Oracle:
Hacemos pruebas:

Ahora seleccionamos en Output, y seleccionamos Microsoft Excel Output, ahí es donde saldrán
nuestros datos, a donde los migraremos:
Le asignamos nombre y lo guardamos:
Ejecutamos y la migración se hizo correctamente:

Verificamos que la hoja de cálculo se creó:


La abrimos, y vemos que efectivamente se creó la primera tabla:

Ahora hacemos el mismo procedimiento para crear la siguiente tabla:


De la misma manera creamos una tabla de entrada (input) y una hoja de Excel de salida de datos
(output):

Elegimos la tabla:
Hacemos pruebas:
Ejecutamos:

Y efectivamente se llevo a cabo la migración de otra tabla:


Verificamos la hoja de calculo:

Bueno aquí no hay más que explicar, se hace el mismo paso idéntico para el resto de las tablas.
Ahora para migrar datos a un documento XML, hacemos el mismo como en la migración a Excel:

Hacemos las pruebas de la conexión con Oracle:


Dando doble clic sobre la tabla de entrada de datos (input) la configuramos y elegimos los datos:

Ahora como salida de datos (output) elegimos un XML Output en la barra de herramientas:
Lo creamos y guardamos en una dirección:

Le damos ejecutar, y se lleva a cabo la migración de los datos:


Verificamos la creación del archivo XML:

Lo abrimos:
Y efectivamente se creó la primera tabla de HR:

Para crear las demás tablas se hace exactamente el mismo paso.


CONCLUSIONES
Carlos Rafael Barragán Palestino

La migración es un tema muy importante en las BD, y muchas personas creen que es algo difícil y
hacer, incluso hay quien piensan que no se pueden migrar las BD de gestor a gestor, pero gracias a
esta herramienta la cual es Pentahoo (PDI), se pueden migrar datos de una manera muy fácil y
rápida en cuestión de solo clics, de un gestor a otro gestor. Claro que, como todo, debe conocerse
acerca de los gestores de BD y sus correctas configuraciones, no cualquier persona puede migrar
datos sin antes leer la documentación, que incluso la página de PDI nos proporciona. En muchas
empresas es muy utilizado la migración de datos por lo cual se vuelve a mencionar la importancia
de este tema, y de esta herramienta la cual incluso nos permite migrar las BD a hojas de cálculo y
otro tipo de documentos.

Raquel Lizue Martínez Ramos

Se denomina migración de datos, al proceso que tiene por objeto tanto la importación como la
exportación de una determinada información almacenada en un sistema de bases de datos, para
llevar a cabo su traspaso.

La migración de datos tiene su fundamento en la ampliación un sistema de gestión de base. En


este contexto, se trata de exportar los datos a un nuevo sistema con mayor capacidad o más
funciones adicionales. Estos cambios llevan consigo una adaptación de todos los datos de una base
de datos a otra. Por tanto, siempre que se producen cambios de un sistema de gestión a otro, se
habla inevitablemente de los procesos de migración de datos.

José Guadalupe Sánchez Carrera

Como parte de las practicas se trabajó con migración el cual es el paso de un tipo de base de datos
a otra con el cual se deben traspasar los datos sin que estos sean modificados , su utilizo una
herramienta la cual nos provee de manera sencilla y fácil este proceso el cual el cual debido a sus
herramientas y flexibilidad nos abarca unas cuantos modelos de tipos de bases de datos y el cómo
migrarlos hacia otro tipo de manera satisfactoria.

También podría gustarte