Está en la página 1de 17

Curso:

Base de Datos con MS SQL Server 2019


Preguntas

• ¿Qué es una ETL? ¿Son importantes las ETL para Data Analytics?
Contenidos que veremos el día de hoy

SQL: SQL Server Básico

6. Consultas múltiples tablas y Agregación.


7. Procedimientos Almacenados.
8. ETL Configuración
9. ETL Pruebas de Carga
10. Exposición trabajo final
Descubrir qué son los procesos ETL y su
importancia en Data Analytics.

Nuestro objetivo
SQL: ETL
• Fundamentos
¿Qué es ETL?

Por sus siglas en inglés Extract, Transform y


Load, o Extraer, Transformar y Cargar es un
proceso diseñado para obtener datos de
diferentes fuentes (como bases de datos en SQL
SERVER, MySQL, ORACLE, entre otros; archivos
de textos plano, archivos XML, archivos EXCEL ),
manipularlos a través de conversiones de tipos
de datos, aplicar filtros, limpieza de datos, unión
de las diferentes fuentes de información, y
cargarlos en una base de datos en común.
¿Cómo funciona una ETL?

La extracción, transformación y carga (ETL) funciona moviendo datos del


sistema de origen al sistema de destino a intervalos periódicos. El proceso ETL
funciona en tres pasos:

1.Extracción de los datos relevantes de la base de datos de origen.


2.Transformación de los datos para que sean más adecuados para el análisis.
3.Carga de los datos en la base de datos de destino
Extracción

Las ETL extraen o copian datos en bruto de múltiples


fuentes y los almacenan el área de ensayo .
La frecuencia con la que el sistema envía datos desde el
origen de datos al almacenamiento de datos de destino
depende del mecanismo subyacente de captura de datos
modificados.

La extracción de datos comúnmente ocurre en una de las


tres formas siguientes.

- Notificación de actualización.
- Extracción progresiva
- Extracción completa
Transformación

Las ETL transforman y consolidan los datos en


bruto en el área de preparación para prepararlos
para el almacenamiento de datos de destino. La
fase de transformación de datos puede implicar
los siguientes tipos de cambios de datos.
Las transformaciones básicas mejoran la calidad
de los datos eliminando errores, vaciando campos
de datos o simplificando datos.
Carga

Las ETL mueven los datos


transformados desde el área de ensayo
al almacenamiento de datos de
destino.
- Carga completa
- Carga progresiva
SQL Integration Services (SSIS)

SQL Server Integration Services es una plataforma para la


creación de soluciones empresariales de transformaciones de
datos e integración de datos.
Use Integration Services para resolver complejos problemas
empresariales mediante la copia o descarga de archivos, la carga
de almacenamientos de datos, la limpieza y minería de datos y la
administración de datos y objetos de SQL Server.
Flujo de Control

Un paquete consta de un flujo de


control y, opcionalmente, uno o varios
flujos de datos. SQL Server Integration
Services proporciona tres tipos
diferentes de elementos de flujo de
control:
- Los contenedores
- Las tareas
- Las restricciones de precedencia
Flujo de Datos

Existen tres tipos diferentes de


componentes de flujo de datos:
orígenes, transformaciones y
destinos
Otros componentes

• Parámetros
• Variables
• Conexiones
• Expresiones
• Event Handlers
SQL: ETL
• Preparando el ambiente de trabajo
Actividad

Configurar las herramientas necesarias para trabajar con SQL Server


Integration Services (SSIS)

Requisitos:
✓ Tener instalado Microsoft SQL Server Developer Edition:
https://www.microsoft.com/es-es/sql-server/sql-server-downloads

✓ Tener instalado Visual Studio Community Edition:


https://visualstudio.microsoft.com/es/vs/community/

Instalar los siguientes componentes:


1. Instalar Integration Services haciendo uso del asistente para la instalación
de SQL Server.
2. Instalar extensión de proyectos SSIS en Visual Studio haciendo uso de la
administración de extensiones y buscar “SQL Server Integration Services
Projects”.

También podría gustarte