Está en la página 1de 13

ETL

Extract, Transform and Load (extraer, transformar y cargar, frecuentemente abreviado ETL) es
el proceso que permite a las organizaciones mover datos desde mltiples fuentes, reformatearlos y
limpiarlos, y cargarlos en otra base de datos, data mart, o data warehouse para analizar, o en otro
sistema operacional para apoyar un proceso de negocio.Los procesos ETL tambin se pueden
utilizar para la integracin con sistemas heredados.

Ejemplo de ETL: Integracin de Excel con SQL Server, subir la informacin que tenemos en un libro
de Excel a una tabla en la base de datos

Archivo Excel:


Base de Datos:
En SQL SERVER debemos tener creada una base de datos DATOSESTUDIANTE

Para este caso vamos a utilizar Integration Services de SQL Server


Creamos un nuevo proyecto


Seleccionamos el tipo de proyecto de Integration Services Project, y al nombre del proyecto lo
cambiamos por IntegrationEstudiantes y presionamos OK


En la siguiente pantalla podemos revisar que se encuentra creado el proyecto y procedemos a dar doble
clic sobre el Package




A la izquierda de la pantalla tenemos la barra de herramientas en la cual se procede a seleccionar la
tarea de flujo de datos y arrastramos a la pantalla en blanco




Data Flow Task
La tarea Flujo de datos encapsula el motor de flujo de datos que mueve datos entre orgenes y destinos, y
permite al usuario transformar, limpiar y modificar datos a medida que se mueve. La adicin de una tarea
de flujo de datos a un flujo de control del paquete hace posible que el paquete para extraer, transformar
y cargar datos.
Un flujo de datos se compone de al menos un componente de flujo de datos, pero normalmente es un
conjunto de componentes de flujo de datos conectados: fuentes que extraen datos; transformaciones que
modifican, de ruta, o resumen de datos; y destinos que cargan datos.
En tiempo de ejecucin, la tarea de flujo de datos construye un plan de ejecucin del flujo de datos, y el
motor de flujo de datos ejecuta el plan. Puede crear una tarea de flujo de datos que no tiene flujo de
datos, pero la tarea se ejecuta slo si incluye al menos un flujo de datos.

Una vez que tenemos la tarea de flujo de datos vamos a cambiar el nombre a Diagrama, cabe mencionar
que en esta tarea se van a configurar la integracin de entrada como de salida de datos, presionamos
doble clic


Se aparece la siguiente pantalla en la cual vamos a seleccionar las herramientas de Origen Data Flow
Sources: Excel Source y el Destino Data Flow Destination: Ole DB Source en las cuales se configurar las
conexiones de entrada y salida de la integracin de informacin

Ya con el Source Origen y Destino vamos a proceder a realizar la conexin de la Integracin, arrastramos
la conexin desde el Excel Source a OLE DB Source


Procedemos a realizar la configuracin del Excel Source dando doble clic sobre el mismo


En el Excel Source Editor, se procede a realizar la configuracin de la conexin por lo cual se procede a
dar clic en el botn New del OLE DB connection manager

En la pantalla del Excel Connection Manager se procede a buscar el archivo Excel con el que vamos a
trabajar, damos clic en Browser




Una vez seleccionado el archivo se carga el path y la versin del documento, de igual manera debemos
marcar y presionamos ok



Lo siguiente que debemos hacer es seleccionar la hoja en la que se encuentran los datos que vamos a
subir, por lo normal los libros de Excel traen


Una vez que tenemos lista la conexin del Excel Source podemos visualizar que en la parte inferior de la
pantalla ya nos aparece en Connection Manager: Excel Connection Manager



Lo siguiente que procederemos a realizar es la configuracin del destino, por lo tanto damos doble clic
en OLE DB Destination


Se presentar el Editor del OLE DB Destination en el cual se procederemos a crear una nueva conexin


Aparecer la pantalla de la conexin en la cual vamos a dar clic en New


A continuacin aparecer la siguiente pantalla en la cual procedemos a seleccionar el servidor, la forma
de autentificacin del usuario para la respectiva conexin, y por ltimo la base de datos que en este
caso en DATOSESTUDIANTE y presionamos ok


Regresamos al Editor en el que vamos a seleccionar la tabla en la que se va a guardar la informacin,
desplegamos para seleccionar la tabla pero como en este caso no tenemos dicha tabla procedemos a
crear una nueva tabla dando clic en New

La pantalla a continuacin se muestra las sentencias para la creacin de la tabla, en la cual lo nico que
hacemos es cambiar el nombre y presionamos ok



Regresamos al editor en el cual podemos ver una previa de la tabla creada


Aqu se puede revisar que todos los campos de la tabla estn ok y cerramos la pantalla








En el editor seleccionamos la opcin de Mapping para revisar que la integracin tenga los mismos datos
desde el origen hacia el destino


Ya una vez todo listo podemos revisar que se cre la conexin de destino





Ya listo procedemos a ejecutar


Podemos ver que la ejecucin fue correcta ya que el origen y el destino se encuentran de color verde y
adems aparece en la conexin 6 rows





Verificamos el SQL y revisamos que en nuestra base de datos tiene la tabla que creamos y se encuentra
los datos que integramos

También podría gustarte