Está en la página 1de 7

Ttulo:

Proceso ETL

Carrera: Ingeniera en Sistemas Computacionales e Informticos.

rea Acadmica: Bases de Datos

Lnea de Investigacin: Desarrollo de software

Ciclo Acadmico y Paralelo: Sptimo

Alumnos participantes: Manzano G. Rodrigo P.

2017
1. QU ES EL PROCESO DE ETL EN SQL SERVER 2012

Extract, Transform and Load (extraer, transformar y cargar, frecuentemente abreviado ETL)
es el proceso que permite a las organizaciones mover datos desde mltiples fuentes,
reformatearlos y limpiarlos, y cargarlos en otra base de datos, data mart, o data warehouse
para analizar, o en otro sistema operacional para apoyar un proceso de negocio.

Los procesos ETL tambin se pueden utilizar para la integracin con sistemas heredados. Se
convirtieron en un concepto popular en los aos 1970.

2. USO DEL SERVICIO DE INTEGRACIN

Extraer

La primera parte del proceso ETL consiste en extraer los datos desde los sistemas de origen.
La mayora de los proyectos de almacenamiento de datos fusionan datos provenientes de
diferentes sistemas de origen. Cada sistema separado puede usar una organizacin diferente
de los datos o formatos distintos. Los formatos de las fuentes normalmente se encuentran
en bases de datos relacionales o ficheros planos, pero pueden incluir bases de datos no
relacionales u otras estructuras diferentes. La extraccin convierte los datos a un formato
preparado para iniciar el proceso de transformacin.

Una parte intrnseca del proceso de extraccin es la de analizar los datos extrados, de lo que
resulta un chequeo que verifica si los datos cumplen la pauta o estructura que se esperaba.
De no ser as los datos son rechazados.

Un requerimiento importante que se debe exigir a la tarea de extraccin es que sta cause
un impacto mnimo en el sistema origen. Si los datos a extraer son muchos, el sistema de
origen se podra ralentizar e incluso colapsar, provocando que ste no pueda utilizarse con
normalidad para su uso cotidiano. Por esta razn, en sistemas grandes las operaciones de
extraccin suelen programarse en horarios o das donde este impacto sea nulo o mnimo.

Transformar
La fase de transformacin aplica una serie de reglas de negocio o funciones sobre los datos
extrados para convertirlos en datos que sern cargados. Algunas fuentes de datos requerirn
alguna pequea manipulacin de los datos. No obstante, en otros casos pueden ser
necesarias aplicar algunas de las siguientes transformaciones:

Seleccionar slo ciertas columnas para su carga (por ejemplo, que las columnas con valores
nulos no se carguen).
Traducir cdigos (por ejemplo, si la fuente almacena una "H" para Hombre y "M" para Mujer
pero el destino tiene que guardar "1" para Hombre y "2" para Mujer).
Codificar valores libres (por ejemplo, convertir "Hombre" en "H" o "Sr" en "1").
Obtener nuevos valores calculados (por ejemplo, total_venta = cantidad * precio, o Beneficio
= PVP - Coste).
Unir datos de mltiples fuentes (por ejemplo, bsquedas, combinaciones, etc.).
Calcular totales de mltiples filas de datos (por ejemplo, ventas totales de cada regin).
Generacin de campos clave en el destino.
Transponer o pivotar (girando mltiples columnas en filas o viceversa).
Dividir una columna en varias (por ejemplo, columna "Nombre: Garca Lpez, Miguel ngel";
pasar a dos columnas "Nombre: Miguel ngel", "Apellido1: Garca" y "Apellido2: Lpez").
La aplicacin de cualquier forma, simple o compleja, de validacin de datos, y la consiguiente
aplicacin de la accin que en cada caso se requiera:

Datos OK: Entregar datos a la siguiente etapa (Carga).


Datos errneos: Ejecutar polticas de tratamiento de excepciones (por ejemplo, rechazar el
registro completo, dar al campo errneo un valor nulo o un valor centinela).

Cargar

La fase de carga es el momento en el cual los datos de la fase anterior (transformacin) son
cargados en el sistema de destino. Dependiendo de los requerimientos de la organizacin,
este proceso puede abarcar una amplia variedad de acciones diferentes. En algunas bases de
datos se sobrescribe la informacin antigua con nuevos datos. Los data warehouse
mantienen un historial de los registros de manera que se pueda hacer una auditora de los
mismos y disponer de un rastro de toda la historia de un valor a lo largo del tiempo.

3. DESARROLLO DE EJEMPLO

La empresa solicita una estructura especfica que permita realizar un anlisis de los datos de
las ventas de la empresa.

Es por este motivo que el informtico genera una estructura de forma que haga posible el
anlisis de esos datos.

PROCESO
1. Base de Datos Relacional
Suppliers
Products SupplierID
ProductID CompanyName
ProductName ContactName
Order Details SupplierID ContactTitle
OrderID
CategoryID Address
ProductID
QuantityPerUnit City
UnitPrice
UnitPrice Region
Quantity
UnitsInStock PostalCode
Discount
UnitsOnOrder Country
ReorderLevel Phone
Discontinued Fax
HomePage

Categories
CategoryID
CategoryName
Description
Picture

Customers
CustomerID
CompanyName
Employees
ContactName
EmployeeID
ContactTitle
LastName
Address
FirstName
City
Title
Orders Region
TitleOfCourtesy
OrderID PostalCode
BirthDate
CustomerID Country
HireDate
EmployeeID Phone
Address
OrderDate Fax
City
RequiredDate
Region
ShippedDate
PostalCode
ShipVia
Territories Country
Freight
TerritoryID HomePhone
ShipName
TerritoryDescription Extension
ShipAddress
RegionID Photo
ShipCity CustomerCustomerDemo
Notes CustomerID
ShipRegion
ReportsTo CustomerTypeID
ShipPostalCode
PhotoPath
ShipCountry

Region
RegionID
RegionDescription
CustomerDemographics
CustomerTypeID
EmployeeTerritories Shippers
EmployeeID CustomerDesc
ShipperID
TerritoryID CompanyName
Phone

2. Creacin de la DW
Dim_Producto
ProductKey
ProductName
SupplierName
CategoryName

Fac_OrdenDetalle
ProductKey
CustomerKey Dim_Ordenes
Dim_Empleado
OrderKey
EmployeeKey EmployeeKey
OrderDate
FullName OrderKey
OrderDateKey
RequiredDate
HireDate
UnitPrice ShippedDate

Quantity

Dim_Clientes
CustomerKey
CompanyName
Address
City
Region
Country

3.- Aplicacin de ETL

Se realiza la extraccin los datos de las columnas necesarias requeridas de la tabla customers
a la Dimensin de la DW Clientes.

Los datos de las tablas Orders y Employees se exportan a las respectivas Dimensiones, en el
caso de Employees se realiza una transformacin de los datos ya que se requiere unir el
LastName con el FirstName del empleado en un campo FullName de la DW.
Dentro de la dimensin productos se unifican las tablas de Product, Suppliers y Categories
de la base de datos relacional cuyo destino es la dimensin Producto de la DW.
Ya que los datos provienen de diferentes tablas se realiza una transformacin previo a la
carga de datos en la Dimensin Producto de la DW
Estructura final

También podría gustarte