Está en la página 1de 15

Captulo 1

Poblar el Datamart
Temas

Poblar el Datamart.
Herramientas de ETL- Integration Services
Crear Proyectos SSIS- BIDS
Creacin de Paquetes
Creacin de Datasources

Elementos Integration services


SSIS est constituido por varios elementos que permiten construir aplicaciones de ETL complejas y
flexibles. A continuacin se presentan los elementos bsicos de SSIS:

Data Sources: Definen conexiones hacia los orgenes de datos. SSIS es capaz de conectarse
con cualquier origen de datos accesible a travs de proveedores .Net y OLE DB.

Data Source Views: Son documentos que definen la estructura de determinados objetos en
el origen de datos. Los data source views permiten crear vistas parciales de la totalidad de los
objetos en un origen de datos.

Tasks: Una tarea (task) define una unidad de transformacin o procesamiento de datos. Un
tipo especial de tarea es el Data Flow Task (tarea de flujo de datos), que efecta
transferencias de registros entre varios tipos de orgenes de datos, que es el ms utilizado
para cargas de Inteligencia de Negocio

Control flow: Permiten definir secuencias lgicas de transferencia de informacin. Por


ejemplo, a travs de los flujos de control, se pueden definir bucles que repitan varias veces
una transferencia de datos.

Containers: Las tareas de transformacin se pueden agrupar en contenedores (containers).

Inteligencia de Negocios

Laboratorios: Integration Services

Package: Todas las tareas y contenedores estn contenidos dentro de un package (paquete)
de SSIS. Un proyecto SSIS puede contener varios paquetes.

La tarea Data Flow Task (Tarea de Flujo de datos) permite efectuar transferencias y
transformaciones de datos. SSIS implementa diversos tipos de transformaciones: conversiones de
tipos de datos, uso de tablas de lookup ( busquedas), agregaciones, etc.

Ejercicio 1.
En el siguiente ejercicio, se crear un proyecto SSIS que transferir datos de un Excel hacia un SQL
Server, hacia una tabla llamada Paciente, las fuentes en Excel estarn en C:\BI Para esto, se utilizar
la transformacin Data Flow Task.
1.
2.

En el men Inicio, seleccione All Programs > Microsoft SQL Server 2008 > SQL Server Business
Intelligence Development Studio. Se abrir el entorno de desarrollo de .Net.
En el men File, seleccione New y luego seleccione Project. Aparecern los distintos tipos de
proyecto que se pueden crear.

Seleccione la plantilla Integration Services Project. En la casilla Location, seleccione la ruta donde
desea crear el proyecto. En la casilla Name, escriba Laboratorio 1. La ventana debe quedar como
se muestra en la figura anterior. Presione el botn OK para crear el proyecto.

Inteligencia de Negocios

Laboratorios: Integration Services

3.

Aparecer el entorno de desarrollo de proyectos de Integration Services. En la ventana del


Solution Explorer, observe los elementos constituyentes del proyecto: Data Sources, Data
Source Views, SSIS Packages y Miscellaneous.

4.

El primer paso es la definicin de un Data Source. En el Solution Explorer, seleccione el nodo


Data Sources, d un clic derecho y seleccione New Data Source:

5.

Aparecer la pantalla de bienvenida del asistente para la definicin de orgenes de datos (Data
Source Wizard). Presione el botn Next. Aparecer la ventana de definicin de conexiones con
datos.
Para definir una nueva conexin con datos, presione el botn New. Aparecer la ventana del
Connection Manager. Seleccione el conector Native OLE DB\SQL Server Native Client 10.0, el
servidor local y la base de datos Laboratorio(*), como se muestra en la siguiente figura:

6.

(*) Previamente se tiene que haber creado la base de datos Laboratorio en el servidor disponible

Inteligencia de Negocios

Laboratorios: Integration Services

7.

Presione el botn OK. A continuacin, presione el botn Next. Aparecer la ventana final del
asistente.

8.

A continuacin se crear el primer paquete SSIS. Para esto, seleccione el nodo SSIS Packages
en el Solution Explorer, haga un clic derecho y seleccione la opcin New SSIS Package:

9.

Obsrvese que se ha creado un nuevo paquete llamado Package1.dtsx. Para renombrarlo, haga
un clic derecho sobre el paquete en el Solution Explorer y seleccione la opcin
Rename:CargarPaciente

10.

El siguiente paso es definir las tareas de transformacin. En Integration Services, estas tareas
estn representadas en los Tasks, cada uno de los cuales puede efectuar una labor especfica

Inteligencia de Negocios

Laboratorios: Integration Services

de procesamiento o transformacin de datos. Estas tareas pueden visualizarse a travs de la


caja de herramientas (Toolbox) del entorno de desarrollo. Para visualizar el Toolbox, expanda
el men View, y seleccione la opcin Toolbox:

11.

En el toolbox, seleccione la tarea Data Flow Task y arrstrela hacia la ventana de diseo del
paquete (en la parte central del entorno de desarrollo). Se crear una tarea llamada Data Flow
Task.

12.

A continuacin, se renombrar la tarea de transformacin. Para esto, seleccione la tarea Data


Flow Task en el diseador del paquete, y cambie su propiedad Name a Copiar Paciente en la
ventana de propiedades (para abrir la ventana de propiedades, expanda el men View y
seleccione la opcin Properties Window. La ventana de propiedades se abrir en la parte
inferior derecha, debajo del Solution Explorer).

Inteligencia de Negocios

Laboratorios: Integration Services

13.

Cada tarea de flujo de datos consiste en varias transferencias de informacin entre orgenes de
datos. A continuacin, se definirn los flujos de informacin al interior de la tarea Copiar
Paciente. Para esto, haga un doble clic sobre la tarea Copiar Paciente. Se abrir en el
entorno de desarrollo la pestaa Data Flow.

14.

En el Toolbox, expanda la pestaa Data Flow Sources, seleccione el tem Flat File Source y
arrstrelo sobre la ventana de diseo. Se crear un nuevo origen de registros llamado Data
Reader Source.

Inteligencia de Negocios

Laboratorios: Integration Services

15. Doble clik sobre el Flat File Connection Manager Editor, y luego hacer click en New

16.

Haga doble clic sobre Flat File conection. Se abrir la ventana Flat File Source Editor.
Seleccione New y en Conection manager name escriba Origen Paciente. La pantalla debe
quedar de la siguiente manera:

Inteligencia de Negocios

17.

18.

Laboratorios: Integration Services

Haga doble clic sobre el browser . Se abrir la ventana Abrir. Seleccione Paciente

Seleccione Column name in the firts data row. La pantalla debe quedar de la siguiente
manera:

Inteligencia de Negocios

Laboratorios: Integration Services

19.

Seleccione Column. La pantalla debe quedar de la siguiente manera:

20.

Seleccione Vista Previa. La pantalla debe quedar de la siguiente manera:

Inteligencia de Negocios

Laboratorios: Integration Services

21.

Seleccione Flat File Source. Clik derecho y seleccione rename escriba Origen Paciente. La
pantalla debe quedar de la siguiente manera:

22.

En el Toolbox, expanda la pestaa Data Flow Destinations. Seleccione el tem OLE DB


Destination y arrstrelo sobre la ventana de diseo. A continuacin, conecte Origen Paciente
con OLE DB Destination. La ventana del editor debe quedar como sigue:

23.

Haga doble click sobre el destino OLE DB Destination para abrir su ventana de propiedades.
Seleccione la opcin Connection Manager del lado izquierdo de la pantalla, y establezca los
siguientes valores para las propiedades:

Inteligencia de Negocios

Laboratorios: Integration Services

Opcin

Valor

OLE DB Connection Manager

Seleccione Laboratorio

24.

Haga doble Clik sobre Origen Paciente y seleccionar Error Ouput, seleccionar Truncamiento y
seleccione todos los campos y seleccione Ignore Failure

Inteligencia de Negocios

Laboratorios: Integration Services

25.

Pulse el botn OK para aceptar los cambios y finalizar la configuracin del destino de registros.

26.

Para depurar el paquete, pulse el botn


en la barra de herramientas del entorno de
desarrollo, o seleccione la opcin Start Debugging en el men Debug. Al finalizar la ejecucin,
el entorno de desarrollo mostrar la transferencia de datos en la siguiente forma:

Inteligencia de Negocios

Laboratorios: Integration Services

27.

Luego verifique los datos cargados en el SQL Server Management Studio, realice un select a la
tabla Carga Paciente

28.

Para depurar nuevamente el paquete, pulse el botn


en la barra de herramientas del
entorno de desarrollo, o seleccione la opcin Start Debugging en el men Debug. Al finalizar el
el resultado es 54 se est duplicando los registros. Entonces, hay que realizar una previa
limpieza antes de realizar la carga.

Inteligencia de Negocios

Laboratorios: Integration Services

29.

Regresas a la pestaa del Control Flow y en la barra de Toolbox seleccione un Secuence


Contener. Renombra el contenedor, colocar el Control Flow CargarPaciente dentro del
contenedor.

30.

En el Toolbox, seleccione el tem Execute SQL Task, y arrstrelo sobre la ventana de diseo. La
pantalla debe quedar de la siguiente manera:

31.

Renombrar el Execute SQL Task como Limpiar Paciente, En la ventana de diseo, seleccione
la tarea Limpiar Paciente. Seleccione la flecha verde que sale de esta tarea, y arrstrela sobre
la tarea Copiar Paciente. Esto define una precedencia en el flujo de control del paquete, que
establece que la tarea Limpiar Paciente debe ejecutarse antes de la tarea Copiar Paciente:

Inteligencia de Negocios

32.

Laboratorios: Integration Services

Para depurar nuevamente el paquete, pulse el botn


en la barra de herramientas del
entorno de desarrollo, o seleccione la opcin Start Debugging en el men Debug.

También podría gustarte