Tarea 10 - Carga de Dimensiones

ESCUELA SUPERIOR POLITÉCNICA DE
CHIMBORAZO
FACULTAD DE INFORMÁTICA Y ELECTRÓNICA

CARRERA DE SOFTWARE
SISTEMAS DE INFORMACIÓN Y PROCESAMIENTO DE DATOS
INFORME DE TAREA No. 10
1. DATOS GENERALES:
TEMA: CARGA DE DATOS EN LAS DIMENSIONES DEL EDW
NOMBRE: CÓDIGO:
ARIEL HURTADO 6825
GRUPO No:
FECHA DE ENTREGA: 25/06/2022

2. OBJETIVO
Construir procesos de Extracción, Transformación y Carga (ETL) para integración de datos

en un DataWarehouse.
3. INSTRUCCIONES
Utilizando herramienta SQL Server Integration Services (SSIS) construir procesos ETL para
carga de datos en las dimensiones del EDW.
4. ACTIVIDADES DESARROLLADAS
1. Utilizar misma Solución /Proyecto en SSIS de la Tarea 9.

• Abrimos el Visual Studio y seleccionamos el proyecto creado anteriormente o lo
abrimos desde recientes o abrir un proyecto o solución y lo buscamos en donde lo
hayamos ubicado.
• En este momento ya tendremos abierto el proyecto creado con anterioridad con la
cargaDsa realizada y se procederá a realizar y describir las cargaDimensiones en los
siguientes apartados.
2. Crear un Conexión a data source con la herramienta.

• En el explorador de soluciones de nuestro proyecto, clic derecho sobre
administrador de conexiones y seleccionar nuevo administrador de
conexiones.
• Seleccionamos el tipo de administrador de conexiones que deseamos
agregar, en este caso, seleccionamos OLE DB.
• Seleccionamos una nueva conexión y en la ventana siguiente llenaremos los

datos requeridos y que sean correctos como el nombre del servidor, tipo de
autenticación y el nombre de la base de datos.
• Finalmente probamos conexión y aceptamos.
3. Crear Paquete para la carga de cada una de las dimensiones, en este caso, se
empieza por la carga EDW.D_PERIODO.
• Clic derecho sobre paquetes SSIS y nuevo paquete.

• Clic derecho sobre el paquete creado y cambiamos de nombre a
cargaDimensiones.
• Del cuadro de herramientas arrastramos y soltamos primero tarea ejecutar

sql (2 veces) y luego una tarea de flujo de datos (por el momento) y con clic
derecho elegimos cambiar nombre y le asignamos el nombre que deseemos
a cada tarea.
• Doble clic sobre las tareas sql para configurarlas con la conexión, las consulta sql a
realizar en esas tareas y aceptamos. La primera tarea será utilizada para pruebas
donde se truncarán las dimensiones hasta refinar los scripts sql que hacen posible
su carga, en esta tarea se escribirán los truncates necesarios. Cabe resaltar que las
dimensiones no se truncan, solo es hasta refinar los scripts.
• Configuraremos la segunda tarea sql con su conexión y consultas también.

• Luego enlazaremos desde la primera tarea sql hacia la segunda tarea sql,
esta segunda tarea será la encargada de insertar los dummies adecuados en
cada una de las dimensiones, acotamos que en general en las tareas se
podría observar una x roja de error significando que aún no han sido
configuradas correctamente.
• Enlazaremos desde la segunda tarea sql hacia la de flujo de datos que ya

será configurada en los siguientes apartados. Es normal que se nos
presente un símbolo de advertencia, aunque deberemos revisar de que se
trata la advertencia.
4. Construir el proceso(s) o flujos, en este caso, se empieza por el EDW.D_PERIODO.

• Doble clic en la tarea de flujo de datos y del cuadro de herramientas en
otros orígenes arrastraremos y soltamos el origen (en este caso origen OLE
DB) y como destino elegiremos de comunes la opción dimensión de
variación lenta.
• Primero doble clic sobre el origen para configurarlo adecuadamente, y

elegiremos nuestra conexión ya creada anteriormente y como método de
acceso a datos elegiremos comando sql e insertaremos la sentencias
necesarias y adecuadas.
• Para determinar que nuestras sentencias arrojan el resultado esperado,
realizamos una vista previa.
• Segundo, enlazaremos desde el origen hacia el destino, es decir, hacia la
dimension de variación lenta y doble clic sobre esta última para
configurarla adecuadamente, se nos presentará un asistente para aquello, al
cual daremos clic en siguiente.
• Aquí selecionaremos nuestra conexión , la tabla a donde se realizará la

carga, las columnas de entrada que vienen de nuestro origen que estarán
relacionadas con las columans de nuestro EDW y la clave de negocio o
denominada también empresarial elegida con base a los conocimientos
impartidos en clase para su eleccion y clic en siguiente.
• Definiremos el tipo de cambio para las columnas de la dimension, estas
puede ser fijas, variables e históricas. Para esta dimension de periodo se
han seleccionado las columnas correspondientes y como atributo variable
(esto previo a un análisis adecuado de las fuentes con los conocmientos
impartidos en clase, resaltando que para las demás dimensiones también se
debe realizar este análisis tanto en este punto como en el anterior para
elegir las claves empresariales), clic en siguiente.
• Activamos la opcion de atributos variables para realizar cambios en los
registros coincidentes, clic en siguiente.
• Inhabilitamos la opción de miembros deducidos ya que no la utilizaremos

en esta solución, clic en siguiente.
• Al finalizar el asistente de configuración de dimensión de variación lenta (y

si todo ha salido bien), observaremos la creación de nuevos flujos y la
conexión desde el destino hacia éstos automáticamente. Un flujo de insertar
destino como nueva salida y un comando de OLE DB como salida de
actualizaciones de atributos variables. Obteniendo como resultado el flujo
que se muestra en la segunda imagen.
5. Poblar el EDW con la ejecución de cada uno de los paquetes construidos.
• Nos dirigimos a la pestaña de flujo de control y elegiremos iniciar, esto para realizar
la ejecución del paquete y con esto poblar el EDW en nuestro SQL SERVER.
• Observamos que se ha ejecutado exitosamente y con esto ya habremos
poblado nuestra dimensión EDW en la base de datos. Cabe resaltar que se
ejecutan las dos tareas sql y el paquete que tiene el flujo de carga para la
dimensión (la una tarea sql para truncar la/las dimensiones hasta refinar
los scripts nada más, y la otra tarea sql para cargar el/los dummies
adecuados a la/las dimensiones).
• Verificamos la carga en nuestro EDW mediante un select sobre éste en

nuestro SQL SERVER.
5. RESULTADOS OBTENIDOS
Los puntos descritos anteriormente para cumplir con la carga de la dimensión, en este caso
de periodo, nos servirán para realizar las demás cargas de dimensiones de nuestra fuente
siendo este un proceso repetitivo en donde cambian las sentencias sql, claves
empresariales, definición de atributos, etc.
EDW.D_UBIACADEMICA
EDW.D_MATERIA
EDW.D_ESTUDIANTE
EDW.D_DPA
EDW.D_DOCENTE
EDW.D_TIEMPO
6. CONCLUSIONES
• El análisis previo de cada una de las fuentes con el conocimiento impartido en clase
es importante para determinar las claves empresariales y la definición de tipo de los
atributos.
• El lenguaje sql resulta importante ya que mediante este realizaremos las sentencias
necesarias que nos permitirán extraer los datos adecuados desde las dsa hacia
nuestras dimensiones.
• La tabla de equivalencias de la ubicación geográfica no permite extraer y colocar el
idDpa de cada estudiante siendo éste un campo esencial en esta dimensión.
7. RECOMENDACIONES
• Revisar la salida de errores para entender cualquier inconveniente sucedido en la

ejecución.
• Tener datos estandarizados en especial para la dimensión de estudiantes ya que
existió muchos problemas en los joins necesarios para asignarle el identificador de
Dpa.
• Verificar que las consultas funcionan correctamente para que no exista problemas
para siguientes prácticas.

Tarea 10 - Carga de Dimensiones

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Tarea 10 - Carga de Dimensiones

Cargado por

Copyright:

Formatos disponibles

ESCUELA SUPERIOR POLITÉCNICA DE

FACULTAD DE INFORMÁTICA Y ELECTRÓNICA

SISTEMAS DE INFORMACIÓN Y PROCESAMIENTO DE DATOS

INFORME DE TAREA No. 10

TEMA: CARGA DE DATOS EN LAS DIMENSIONES DEL EDW

ARIEL HURTADO 6825

FECHA DE ENTREGA: 25/06/2022

Construir procesos de Extracción, Transformación y Carga (ETL) para integración de datos

1. Utilizar misma Solución /Proyecto en SSIS de la Tarea 9.

2. Crear un Conexión a data source con la herramienta.

• Seleccionamos una nueva conexión y en la ventana siguiente llenaremos los

• Clic derecho sobre paquetes SSIS y nuevo paquete.

• Del cuadro de herramientas arrastramos y soltamos primero tarea ejecutar

• Configuraremos la segunda tarea sql con su conexión y consultas también.

• Enlazaremos desde la segunda tarea sql hacia la de flujo de datos que ya

4. Construir el proceso(s) o flujos, en este caso, se empieza por el EDW.D_PERIODO.

• Primero doble clic sobre el origen para configurarlo adecuadamente, y

• Aquí selecionaremos nuestra conexión , la tabla a donde se realizará la

• Inhabilitamos la opción de miembros deducidos ya que no la utilizaremos

• Al finalizar el asistente de configuración de dimensión de variación lenta (y

5. Poblar el EDW con la ejecución de cada uno de los paquetes construidos.

• Verificamos la carga en nuestro EDW mediante un select sobre éste en

• Revisar la salida de errores para entender cualquier inconveniente sucedido en la

También podría gustarte