Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Los procesos ETL son una parte de la integración de datos, pero es un elemento
importante cuya función completa el resultado de todo el desarrollo de la cohesión de
aplicaciones y sistemas.
• Extraer: extract.
• Transformar: transform.
• Y Cargar: load.
Además, uno de las prevenciones más importantes que se deben tener en cuenta durante el
proceso de extracción sería el exigir siempre que esta tarea cause un impacto mínimo en
el sistema de origen.
Procesos ETL: fase de Transformación
● Declarativas.
● Independientes.
● Claras.
● Inteligibles.
● Con una finalidad útil para el negocio.
● Rolling: este proceso sería el más recomendable en los casos en que se busque mantener
varios niveles de granularidad. Para ello se almacena información resumida a distintos
niveles, correspondientes a distintas agrupaciones de la unidad de tiempo o diferentes
niveles jerárquicos en alguna o varias de las dimensiones de la magnitud almacenada (por
ejemplo, totales diarios, totales semanales, totales mensuales, etc.).
• Tareas de Bases de datos: que también se utilizan para consolidar, migrar y sincronizar
bases de datos operativas.
• Migración de datos entre diferentes aplicaciones por cambios de versión o cambio de
aplicativos.
• Sincronización entre diferentes sistemas operacionales (por ejemplo, entre nuestro
entorno ERP y la web de ventas).
• Consolidación de datos: sistemas con grandes volúmenes de datos que son
consolidados en sistemas paralelos, ya sea para mantener históricos o para llevar a cabo
procesos de borrado en los sistemas originales.
• Interfases de datos con sistemas externos: como el envío de información a clientes o
proveedores. También servirían para la recepción, proceso e integración de la información
recibida.
• Interfases con sistemas Frontoffice: serían interfases de subida/bajada con sistemas de
venta.
• Otros cometidos: como la actualización de usuarios a sistemas paralelos o la
preparación de procesos masivos (tipo mailings o newsletter).
¿Qué son los ETL en SQL Server?
ETL es un tipo de integración de datos que hace referencia a los tres pasos (extraer,
transformar, cargar) que se utilizan para mezclar datos de múltiples fuentes. Se utiliza a
menudo para construir un almacén de datos.
¿Qué es SQL Server Integration Service?
SQL Server Integration Service (en adelante SSIS) es un componente que permite generar
procesos de migración de grandes cantidades de datos de diferentes orígenes llamados ETL.
Los proyectos ETL de SSIS tienen sentido cuando se pueden ejecutar y automatizar sin la
necesidad de abrir el proyecto con Visual Studio, para ello, SSIS puede generar un paquete
que se podrá ejecutar desde el agente de programación SQL Server Agent o crear un
paquete ejecutable que y ejecutarlo desde línea de comandos.
SSIS es la evolución de los antiguos paquetes DTS y muchos DBA llaman a los nuevos
paquetes de SSIS paquetes DTSX ya que esta es su extensión.
Uno de los inconvenientes de SSIS es que los paquetes desarrollados con una versión actual
no se pueden ejecutar ni editar en versiones anteriores y paquetes diseñados con versiones
anteriores, por lo general, se pueden ejecutar en versiones de SQL Server posteriores pero
si el paquete falla en la ejecución, este debe editarse desde la versión correcta.
Pros:
Contra:
Pros:
Contra:
https://www.microsoft.com/es-es/sql-server/sql-server-downloads
https://datamanagement.es/2020/04/06/instalacion-de-sql-server-integration-services-ssis/
Las conexiones OLE DB en ArcGIS Pro se utilizan para realizar conexiones de solo lectura
a bases de datos para acceder a fuentes de datos tabulares desde cualquier base de datos
para la que tenga el controlador.
La conectividad abierta de bases de datos (ODBC) es un protocolo que puede usar para
conectar una base de datos de Microsoft Access con un origen de datos externos, como
Microsoft SQL Server.
ADO.NET proporciona acceso coherente a orígenes de datos como SQL Server y XML, así
como a orígenes de datos expuestos mediante OLE DB y ODBC. Las aplicaciones de
consumidor que comparten datos pueden utilizar ADO.NET para conectar a estos orígenes
de datos y recuperar, controlar y actualizar los datos contenidos.
El Lenguaje de Consulta Estructurada (SQL) es un lenguaje gestor para el manejo de la
información en las bases de datos relacionales. Este tipo de lenguaje de programación
permite comunicarse con la base de datos y realizar operaciones de acceso y manipulación
de la información almacenada.