Está en la página 1de 19

ESCUELA SUPERIOR POLITÉCNICA DE

CHIMBORAZO

FACULTAD DE INFORMÁTICA Y ELECTRÓNICA


CARRERA DE SOFTWARE

SISTEMAS DE INFORMACIÓN Y PROCESAMIENTO DE DATOS

INFORME DE TAREA No. 10

1. DATOS GENERALES:

TEMA: CARGA DE DATOS EN LAS DIMENSIONES DEL EDW

NOMBRE: CÓDIGO:

ARIEL HURTADO 6825

GRUPO No:

FECHA DE ENTREGA: 25/06/2022


2. OBJETIVO

Construir procesos de Extracción, Transformación y Carga (ETL) para integración de datos


en un DataWarehouse.

3. INSTRUCCIONES

Utilizando herramienta SQL Server Integration Services (SSIS) construir procesos ETL para
carga de datos en las dimensiones del EDW.

4. ACTIVIDADES DESARROLLADAS

1. Utilizar misma Solución /Proyecto en SSIS de la Tarea 9.


• Abrimos el Visual Studio y seleccionamos el proyecto creado anteriormente o lo
abrimos desde recientes o abrir un proyecto o solución y lo buscamos en donde lo
hayamos ubicado.
• En este momento ya tendremos abierto el proyecto creado con anterioridad con la
cargaDsa realizada y se procederá a realizar y describir las cargaDimensiones en los
siguientes apartados.

2. Crear un Conexión a data source con la herramienta.


• En el explorador de soluciones de nuestro proyecto, clic derecho sobre
administrador de conexiones y seleccionar nuevo administrador de
conexiones.
• Seleccionamos el tipo de administrador de conexiones que deseamos
agregar, en este caso, seleccionamos OLE DB.

• Seleccionamos una nueva conexión y en la ventana siguiente llenaremos los


datos requeridos y que sean correctos como el nombre del servidor, tipo de
autenticación y el nombre de la base de datos.
• Finalmente probamos conexión y aceptamos.

3. Crear Paquete para la carga de cada una de las dimensiones, en este caso, se
empieza por la carga EDW.D_PERIODO.

• Clic derecho sobre paquetes SSIS y nuevo paquete.


• Clic derecho sobre el paquete creado y cambiamos de nombre a
cargaDimensiones.

• Del cuadro de herramientas arrastramos y soltamos primero tarea ejecutar


sql (2 veces) y luego una tarea de flujo de datos (por el momento) y con clic
derecho elegimos cambiar nombre y le asignamos el nombre que deseemos
a cada tarea.
• Doble clic sobre las tareas sql para configurarlas con la conexión, las consulta sql a
realizar en esas tareas y aceptamos. La primera tarea será utilizada para pruebas
donde se truncarán las dimensiones hasta refinar los scripts sql que hacen posible
su carga, en esta tarea se escribirán los truncates necesarios. Cabe resaltar que las
dimensiones no se truncan, solo es hasta refinar los scripts.

• Configuraremos la segunda tarea sql con su conexión y consultas también.


• Luego enlazaremos desde la primera tarea sql hacia la segunda tarea sql,
esta segunda tarea será la encargada de insertar los dummies adecuados en
cada una de las dimensiones, acotamos que en general en las tareas se
podría observar una x roja de error significando que aún no han sido
configuradas correctamente.

• Enlazaremos desde la segunda tarea sql hacia la de flujo de datos que ya


será configurada en los siguientes apartados. Es normal que se nos
presente un símbolo de advertencia, aunque deberemos revisar de que se
trata la advertencia.

4. Construir el proceso(s) o flujos, en este caso, se empieza por el EDW.D_PERIODO.


• Doble clic en la tarea de flujo de datos y del cuadro de herramientas en
otros orígenes arrastraremos y soltamos el origen (en este caso origen OLE
DB) y como destino elegiremos de comunes la opción dimensión de
variación lenta.

• Primero doble clic sobre el origen para configurarlo adecuadamente, y


elegiremos nuestra conexión ya creada anteriormente y como método de
acceso a datos elegiremos comando sql e insertaremos la sentencias
necesarias y adecuadas.
• Para determinar que nuestras sentencias arrojan el resultado esperado,
realizamos una vista previa.
• Segundo, enlazaremos desde el origen hacia el destino, es decir, hacia la
dimension de variación lenta y doble clic sobre esta última para
configurarla adecuadamente, se nos presentará un asistente para aquello, al
cual daremos clic en siguiente.

• Aquí selecionaremos nuestra conexión , la tabla a donde se realizará la


carga, las columnas de entrada que vienen de nuestro origen que estarán
relacionadas con las columans de nuestro EDW y la clave de negocio o
denominada también empresarial elegida con base a los conocimientos
impartidos en clase para su eleccion y clic en siguiente.
• Definiremos el tipo de cambio para las columnas de la dimension, estas
puede ser fijas, variables e históricas. Para esta dimension de periodo se
han seleccionado las columnas correspondientes y como atributo variable
(esto previo a un análisis adecuado de las fuentes con los conocmientos
impartidos en clase, resaltando que para las demás dimensiones también se
debe realizar este análisis tanto en este punto como en el anterior para
elegir las claves empresariales), clic en siguiente.
• Activamos la opcion de atributos variables para realizar cambios en los
registros coincidentes, clic en siguiente.

• Inhabilitamos la opción de miembros deducidos ya que no la utilizaremos


en esta solución, clic en siguiente.

• Al finalizar el asistente de configuración de dimensión de variación lenta (y


si todo ha salido bien), observaremos la creación de nuevos flujos y la
conexión desde el destino hacia éstos automáticamente. Un flujo de insertar
destino como nueva salida y un comando de OLE DB como salida de
actualizaciones de atributos variables. Obteniendo como resultado el flujo
que se muestra en la segunda imagen.

5. Poblar el EDW con la ejecución de cada uno de los paquetes construidos.

• Nos dirigimos a la pestaña de flujo de control y elegiremos iniciar, esto para realizar
la ejecución del paquete y con esto poblar el EDW en nuestro SQL SERVER.
• Observamos que se ha ejecutado exitosamente y con esto ya habremos
poblado nuestra dimensión EDW en la base de datos. Cabe resaltar que se
ejecutan las dos tareas sql y el paquete que tiene el flujo de carga para la
dimensión (la una tarea sql para truncar la/las dimensiones hasta refinar
los scripts nada más, y la otra tarea sql para cargar el/los dummies
adecuados a la/las dimensiones).

• Verificamos la carga en nuestro EDW mediante un select sobre éste en


nuestro SQL SERVER.

5. RESULTADOS OBTENIDOS

Los puntos descritos anteriormente para cumplir con la carga de la dimensión, en este caso
de periodo, nos servirán para realizar las demás cargas de dimensiones de nuestra fuente
siendo este un proceso repetitivo en donde cambian las sentencias sql, claves
empresariales, definición de atributos, etc.
EDW.D_UBIACADEMICA

EDW.D_MATERIA

EDW.D_ESTUDIANTE
EDW.D_DPA

EDW.D_DOCENTE
EDW.D_TIEMPO

6. CONCLUSIONES

• El análisis previo de cada una de las fuentes con el conocimiento impartido en clase
es importante para determinar las claves empresariales y la definición de tipo de los
atributos.
• El lenguaje sql resulta importante ya que mediante este realizaremos las sentencias
necesarias que nos permitirán extraer los datos adecuados desde las dsa hacia
nuestras dimensiones.
• La tabla de equivalencias de la ubicación geográfica no permite extraer y colocar el
idDpa de cada estudiante siendo éste un campo esencial en esta dimensión.

7. RECOMENDACIONES

• Revisar la salida de errores para entender cualquier inconveniente sucedido en la


ejecución.
• Tener datos estandarizados en especial para la dimensión de estudiantes ya que
existió muchos problemas en los joins necesarios para asignarle el identificador de
Dpa.
• Verificar que las consultas funcionan correctamente para que no exista problemas
para siguientes prácticas.

También podría gustarte