Está en la página 1de 14

PROCESOS DE ETL,

SISTEMAS PARA LA
TOMA DE DECISIONES
ETL
Extraer, transformar y cargar (ETL, Extract, Transform, Load) es el proceso de
compilación de datos a partir de un número ilimitado de fuentes, su posterior
organización y centralización en un único repositorio.
3

PASOS DEL ETL


EXTRAER TRANSFORMAR CARGAR
▫ Bases de datos ▫ Transformar los datos ▫ Cargar los datos a su
existentes ▫ Eliminar datos nuevo destino
▫ Cualquier fuente duplicados
existente ▫ Verificación
▫ Seleccionar datos a ▫ Clasificación
extraer
4

DSS (Decision Support System)


▫ Sistemas para el Apoyo a la Toma de Decisiones

▫ Característica Principal: BD de sólo lectura


▫ Otras características de una BD – DSS
- No interesa la integridad
- BD de gran tamaño
- BD muy indexada

▫ Consultas a la BD
- Complejidad en el WHERE
- Complejidad de funciones (operaciones estadísticas o matemáticas)
- Complejidad analítica (varias consultas para llegar a un resultado)
5

Diseño de BD en un DSS

1. Diseñar la BD
2. Preparación de los Datos
3. Datawarehouse y Datamarts
4. OLAP
5. Minería de Datos
6

Diseño de BD en un DSS
1. Diseño de la BD

▫ 1. Diseño Lógico
- Corrección del diseño Relacional
- Rol del especialista de Data warehouse y OLAP
- Características
- Combinación de Columnas (dirección, nombre)
- Restricciones de integridad
7
8

Diseño de BD en un DSS
▫ 2. Diseño Físico
- BD grandes y fuertemente indexadas
- Generación de vistas para usuarios específicos
- Enfoque en la Eficiencia y Rendimiento del
almacenamiento
- Particionamiento (Ejemplo partition)
- Indices (Ejemplo index)
9

Diseño de BD en un DSS
ERRORES

1. Filas Duplicadas (permitir duplicados)


2. Desnormalización
3. Nulos
4. Diseño de tablas resumen (puede confundir a los usuarios al momento
que quieran realizar alguna consulta sql)
5. Varias rutas de navegación
A JOIN (B JOIN C) y (A JOIN B) JOIN C
10

Diseño de BD en un DSS
2. Preparación de los datos
11

Diseño de BD en un DSS
3. Datawarehouse y Data Marts
▫ Datawarehouse
"un almacén de datos orientado a un tema, integrado, no volátil y variante en el
tiempo, que soporta decisiones de administración“
Detalle
▫ Datamart
"un almacén de datos especializado, orientado aun tema, integrado, volátil y
variante en el tiempo para apoyar un subconjunto específico de decisiones de
administración“
Resumen
12

Diseño de BD en un DSS
4. OLAP
"el proceso interactivo de crear, mantener, analizar y elaborar informes sobre
datos“
13

Diseño de BD en un DSS
4. Minería de Datos
▫ "análisis de datos exploratorio“
El propósito es buscar patrones interesantes en los datos,
patrones que pueden usarse para especificar la estrategia del
negocio o para identificar comportamientos fuera de lo común
(por ejemplo, un incremento súbito en la actividad de una
tarjeta de crédito puede indicar que la tarjeta ha sido robada).
14

LABORATORIO
Utilizando la base de datos entregada y el esquema Producción,
realizar lo siguiente:

1. Datawarehouse en donde podamos obtener la información de…


• Cantidad de Ordenes de Trabajo semanal por producto.
• Cantidad de Transacciones realizadas por mes y producto

2. Proceso ETL que cargue los datos al Datawarehouse


• 4 Tablas de Dimensiones
• 2 Tablas de Hechos

También podría gustarte