Está en la página 1de 8

Crear un paquete ETL sencillo

Microsoft SQL Server Integration Services (SSIS) es una plataforma que permite generar
soluciones de integración de datos de alto rendimiento, entre las que se incluyen paquetes de
extracción, transformación y carga de datos (ETL) para el almacenamiento de datos. SSIS incluye
herramientas gráficas y asistentes para generar y depurar paquetes; tareas para realizar funciones
de flujo de datos tales como operaciones de FTP; ejecución de instrucciones SQL y envío de
mensajes de correo electrónico; orígenes y destinos de datos para extraer y cargar datos;
transformaciones para limpiar, agregar, combinar y copiar datos; un servicio de administración, el
servicio Integration Services para administrar la ejecución y almacenamiento de paquetes; e
interfaces de programación de aplicaciones (API) para programar el modelo de objetos de
Integration Services.
En este tutorial, aprenderá a utilizar el Diseñador de SSIS para crear un paquete de Microsoft SQL
Server Integration Services sencillo. El paquete que cree toma los datos de un archivo plano,
formatea de nuevo los datos y luego inserta dichos datos en una tabla de hechos. En las lecciones
siguientes, el paquete se expande para mostrar la creación de bucles, configuraciones de paquete,
registro y flujo de errores.
Al instalar los datos de ejemplo utilizados por el tutorial, también se instalan las versiones
completadas de los paquetes que creará en cada lección del tutorial. Si utiliza los paquetes
completados, puede saltarse lecciones y empezar el tutorial en una lección posterior si lo desea.
Si es la primera vez que trabaja con paquetes o el nuevo entorno de desarrollo, se recomienda
empezar por la lección 1.

Lecciones de este tutorial


Lección 1: Crear un proyecto y un paquete básico con SSIS

En esta lección, creará un paquete ETL sencillo que extrae datos de un único archivo plano,
transforma los datos mediante transformaciones de búsqueda y, por último, carga los resultados
en un destino de tabla de hechos.

Tareas de la lección
Esta lección contiene las siguientes tareas:
Paso 1: Crear un nuevo proyecto de Integration Services

1. En el menú Inicio, elija Todos los programas, Microsoft SQL Server y, a continuación,
haga clic en SQL Server Data Tools.
2. En el menú Archivo, seleccione Nuevo y haga clic en Proyecto para crear un proyecto
de Integration Services.

3. En el cuadro de diálogo Nuevo proyecto, expanda el nodo Business


Intelligence bajo Plantillas instaladas y seleccione Proyecto de Integration
Services en el panel Plantillas.
4. En el cuadro Nombre, cambie el nombre predeterminado por SSIS Tutorial.
Opcionalmente, desactive la casilla Crear directorio para la solución.

5. Acepte la ubicación predeterminada o haga clic en Examinar para desplazarse a la


carpeta que desee utilizar. En el cuadro de diálogo Ubicación del proyecto, haga clic en
la carpeta y, a continuación, haga clic en Seleccionar carpeta.
6. Haga clic en Aceptar (OK).
De forma predeterminada, se creará un paquete vacío, denominado Package.dtsx, que
se agregará al proyecto bajo Paquetes SSIS.

7. En la barra de herramientas del Explorador de soluciones, haga clic con el botón


derecho en Package.dtsx, haga clic en Cambiar nombre y cambie el nombre del
paquete predeterminado por Lesson1.dtsx.
Paso 2: agregar y configurar un administrador de conexiones de archivos planos

En esta tarea, agregará un administrador de conexiones de archivos planos al paquete que acaba
de crear. Un administrador de conexiones de archivos planos permite a un paquete extraer datos
de un archivo plano. Mediante el administrador de conexiones de archivos planos puede
especificar el nombre y la ubicación del archivo, la configuración regional y la página de códigos,
y el formato del archivo, incluyendo los delimitadores de columna, que deben aplicarse cuando
el paquete extrae datos del archivo plano. Además, puede especificar de forma manual el tipo de
datos para columnas individuales, o usar el cuadro de diálogo Sugerir tipos de columna para
asignar de forma automática las columnas de datos extraídos a los tipos de datos de Integration
Services.
Debe crear un administrador de conexiones de archivos planos para cada formato de archivo que
utilice. En este tutorial se extraen datos de varios archivos planos que tienen exactamente el
mismo formato de datos, por lo que tendrá que agregar y configurar solamente un administrador
de conexiones de archivos planos para el paquete.
En este tutorial, configurará las propiedades siguientes en el administrador de conexiones de
archivos planos:
 Nombres de columna: El archivo plano no tiene nombres de columna, por lo que el
administrador de conexiones de archivos planos crea nombres de columna
predeterminados. Estos nombres predeterminados no son útiles para identificar qué
representa cada columna. Para que estos nombres predeterminados sean más útiles,
debe cambiar los nombres predeterminados por nombres que coincidan con la tabla de
hechos en la que deben cargarse los datos del archivo plano.
 Asignaciones de datos: Las asignaciones de tipo de datos que especifique para el
administrador de conexiones de archivos planos se usarán en todos los componentes de
origen de datos de archivo plano que hagan referencia al administrador de conexiones.
Puede asignar los tipos de datos de forma manual mediante el administrador de
conexiones de archivos planos o usar el cuadro de diálogo Sugerir tipos de columna. En
este tutorial, verá las asignaciones sugeridas en el cuadro de diálogo Sugerir tipos de
columna y luego realizará de forma manual las asignaciones necesarias en el cuadro de
diálogo Editor del administrador de conexiones de archivos planos.
El administrador de conexiones de archivos planos proporciona información de configuración
regional acerca del archivo de datos. Si no tiene configurado el equipo para usar la opción de
configuración regional Inglés (Estados Unidos), debe establecer propiedades adicionales en el
cuadro de diálogo Editor del administrador de conexiones de archivos planos.

Para agregar un administrador de conexiones de archivos planos al paquete


SSIS

1. Haga clic con el botón derecho en cualquier punto del área Administradores de
conexión y luego haga clic en Nueva conexión de archivos planos.

2. Seleccione el tipo .

3. Haga clic en Examinar.


4. En el cuadro de diálogo Abrir, busque el archivo
SampleCurrencyData.txt en el equipo.
Los datos de ejemplo se incluyen con los paquetes de lecciones de SSIS. Para descargar
los datos de ejemplo y los paquetes de lecciones, haga lo siguiente.
a. Navegue a los ejemplos del producto Integration Services
b. Haga clic en la pestaña DOWNLOADS .
c. Haga clic en el archivo
SQL2012.Integration_Services.Create_Simple_ETL_Tutorial.Sample.zip.
5. Borre los nombres de columna de la primera casilla de fila de datos.

Para establecer las propiedades dependientes de la configuración regional


1. En el cuadro de diálogo Editor del administrador de conexiones de archivos planos,
haga clic en General.
2. Establezca Configuración regional en Inglés (Estados Unidos) y Página de códigos en
1252.
Para cambiar el nombre de las columnas del administrador de conexiones
de archivos planos
1. En el cuadro de diálogo Editor del administrador de conexiones de archivos planos,
haga clic en Avanzadas.
2. En el panel de propiedades, realice los cambios siguientes:
o Cambie la propiedad de nombre Columna 0 por AverageRate.
o Cambie la propiedad de nombre Columna 1 por CurrencyID.
o Cambie la propiedad de nombre Columna 2 por CurrencyDate.
o Cambie la propiedad de nombre Columna 3 por EndOfDayRate.

Nota

De manera predeterminada, las cuatro columnas están inicialmente


establecidas en el tipo de datos de cadena [DT_STR] con
unOutputColumnWidth de 50.

Para volver a asignar tipos de datos de columna


1. En el cuadro de diálogo Editor del administrador de conexiones de archivos planos,
haga clic en Sugerir tipos.
Integration Services sugiere de forma automática los tipos de datos más adecuados en
función de las 200 primeras filas de datos. También puede cambiar estas opciones de
sugerencia para obtener más o menos datos de ejemplo, especificar el tipo de datos
predeterminado para datos enteros o booleanos, o agregar espacios como relleno para
las columnas de cadena.
De momento, no cambie las opciones del cuadro de diálogo Sugerir tipos de
columna y haga clic en Aceptar para que Integration Services sugiera los tipos de
datos para las columnas. Esto le devuelve al panel Avanzadas del cuadro de
diálogo Editor del administrador de conexiones de archivos planos, donde puede
ver los tipos de datos de columna sugeridos por Integration Services. (Si hace clic
en Cancelar, no se realizan sugerencias en los metadatos de columna y se usa el tipo de
datos predeterminado de cadena [DT_STR]).
En este tutorial, Integration Services sugiere los tipos de datos que se muestran en la
segunda columna de la siguiente tabla para los datos del archivo
SampleCurrencyData.txt. No obstante, los tipos de datos que se requieren para las
columnas en el destino, que se definirán en un paso posterior, se muestran en la última
columna de la tabla siguiente.

Columna de Tipo Tipo de


Columna de destino
archivo plano sugerido destino

AverageRate float FactCurrency.AverageRate float


[DT_R4]

CurrencyID string DimCurrency,CurrencyAlternateKey nchar(3)


[DT_STR]

CurrencyDate date DimDate.FullDateAlternateKey date


[DT_DATE]

EndOfDayRate float FactCurrency.EndOfDayRate float


[DT_R4]

El tipo de datos sugerido para la columna CurrencyID no es compatible con el tipo de


datos del campo de la tabla de destino. Puesto que el tipo de datos
de DimCurrency.CurrencyAlternateKey es nchar (3), CurrencyID debe
cambiarse de la cadena [DT_STR] a la cadena [DT_WSTR]. Adicionalmente, el
campo DimDate.FullDateAlternateKey está definido como tipo de datos de
fecha; por consiguiente,CurrencyDate debe cambiarse del tipo fecha [DT_Date] al tipo
fecha de base de datos [DT_DBDATE].
2. En la lista, seleccione la columna CurrencyID y, en el panel de propiedades, cambie el
tipo de datos de la columna CurrencyID de cadena [DT_STR] a cadena Unicode
[DT_WSTR].
3. En el panel de propiedades, cambie el tipo de datos de la columna CurrencyDate de
fecha [DT_DATE] a fecha de base de datos [DT_DBDATE].
4. Haga clic en Aceptar.
Paso 3: agregar y configurar un administrador de conexiones OLE DB
Paso 4: agregar una tarea de flujo de datos al paquete
Paso 5: Agregar y configurar el origen de archivo plano
Paso 6: Agregar y configurar transformaciones de búsqueda
Paso 7: agregar y configurar el destino de OLE DB
Paso 8: Facilitar la comprensión del paquete de la lección 1
Paso 9: Probar el paquete del tutorial de la lección 1
Lección 2: Agregar bucles con SSIS
En esta lección, expandirá el paquete que ha creado en la lección 1 para beneficiarse de las nuevas
características de bucles para extraer varios archivos planos en un único proceso de flujo de datos.

Lección 3: Agregar registro con SSIS


En esta lección, expandirá el paquete que creó en la lección 2 para beneficiarse de las nuevas
características de registro.

Lección 4: Agregar redirección de flujo de errores con SSIS


En esta lección, expandirá el paquete que creó en la lección 3 para beneficiarse de las nuevas
configuraciones de salida de error.

Lección 5: Agregar configuraciones de paquete para el modelo de implementación de paquetes


En esta lección, expandirá el paquete que creó en la lección 4 para beneficiarse de las nuevas
opciones de configuración del paquete.
Lección 6: Uso de parámetros con el modelo de implementación de proyectos en SSIS
En esta lección, expandirá el paquete que creó en la lección 5 para beneficiarse de usar los nuevos
parámetros con el modelo de implementación del proyecto.

También podría gustarte