Documentos de Académico
Documentos de Profesional
Documentos de Cultura
la Decisión
Introducción a la Inteligencia de Negocios
Inteligencia de Negocios
2
BI
Herramientas Procesos de
de Explotación Extracción,
de Datos Transformación
y Carga
OLTP
5
Explosión de Extracts
21 Data Warehouse
Definición de Data Warehouse
22
Orientado a Integrado
un tema
Data
Warehouse
Variante en
Histórico
el tiempo
DW: Orientado a un tema
24
Acciones
Fondos
Seguros
Tarjetas
Cuentas
Tarjetas
Prestamos
Cliente
Data
Warehouse
DW: Histórico (no volátil)
27
Carga Inicial
Refresh
Refresh
Purga o
Refresh Archivo
Data Warehouse vs. OLTP
29
Aleatorio
Expectativas de los usuarios
36
Data Marts
Sistemas
Operacionales
Archivos Data
Datos Warehouse Marketing
Planos
Heredados
Datos Ventas
Marketing
Operaciones
Ventas
Finanzas
RRHH
Sistemas
Operacionales
Archivos
Datos Planos
Heredados
Ventas o
Marketing
Datos
Operaciones
Datos Datos
Externos Externos
Enfoques de desarrollo de un DW
41
Construir el DW
organizacional
Reportes en subconjuntos
o almacenados en un DM
Enfoque Top - Down
43
Múltiples iteraciones
Incremento 1
Implementaciones breves
Validación en cada fase Estrategia
Definición
Análisis
Diseño
Iterativo Construcción
Producción
Esquema de una solución BI
46
Heredados
Data
Warehouse
Externos
ODS
Metadata
Arquitectura de un Data Warehouse
47
Arquitectura: OLTP
48
Hojas de cálculos
Informes
Extracción:
Manipular los datos sin interrumpir ni paralizar el OLTP
ni el DW.
No depender de la disponibilidad del OLTP.
Transformación:
Codificación
Medidas de atributos
Arquitectura: Load
52
Transformación:
Convenciones de nombramiento
Fuentes múltiples
Arquitectura: Load
53
Es responsable por:
Transformar e integrar los datos fuentes y de
almacenamiento intermedio en un modelo adecuado
para la toma de decisiones.
Realizar todas las funciones de definición y
manipulación del DW, para poder soportar todos los
procesos de gestión del mismo.
Ejecutar y definir las políticas de particionamiento.
1990
Inmon publica “Building the Data Warehouse”
1996
Kimball publica “The Data Warehouse Toolkit”
2002
Inmon actualiza su libro y define la arquitectura para la
recolección de fuentes diversas de datos y establece el
envio desde una fuente centralizada a cada uno de los
data marts.
Top Down
Kimball define múltiples bases de datos llamadas Data
Marts que son organizadas por procesos de negocio, pero
que utilizan el bus de datos empresarial (dimensiones
conformadas).
Bottom Up
Definición
58
Inmon
Orientado al negocio, variante en el tiempo, no volátil
e integrado.
Kimball
Una copia de datos de las transacciones estructuradas,
especificamente para la consulta y análisis.
Qué están diciendo con esto?
59
Tres niveles
DER
Definir entidades, atributos y relaciones.
Modelado de nivel intermedio (DIS)
Conjunto de datos por items
Conjunto de datos por departamento
Cuatro construcciones:
Datos primarios agrupados
Datos secundarios agrupados
Conectores
Tipos de datos
Modelo físico
Desnormalizado para mejorar la performance
Data Warehouse: Inmon
65
Modelo de Kimball
66
Kimball
Comenzar con data marts
Enfoque en entregas rápidas al usuario
Inmon
Enfoque hacía una visión macro empresarial
Foco en la organización
Comparación
71
Inmon Kimball
Aproximación Top-Down Bottom-Up
Arquitectura Modelo empresarial, con Modela los procesos de negocios en data
bases por departamento marts, se alcanza la organización con las
dimensiones conformadas.
Complejidad Complejo Simple
Orientación Al sujeto o dato Al proceso
Herramientas DER y DIS Modelo dimensional
Acceso a Bajo Alto
usuarios
Plazo Continuo y discreto SCD
Método Timestamps Claves en dimensiones
Comparación
72
Inmon Kimball
Audiencia IT Usuarios finales
Plazos Parte integral del CIF Transformar y retener los datos
operacionales
Objetivo Basado en modelos Basado en métodos simples de
técnicos y tecnologías adquisición de datos al usuario final, con
altamente probadas alta predisposición en la mejora de
performance.
Cómo elegir?
73
Inmon Kimball
Naturaleza de los Estratégico Tácticos
requerimientos para la
toma de decisiones
Requerimientos de Integración empresarial Áreas de negocios individuales
integración de datos
Estructura de los datos Los tipos de datos que Métricas de negocios, medidas de
no son métricas pueden rendimiento y scorecard
ser aplicados para
múltiples necesidades
Escalabilidad El crecimiento y la Se pueden adaptar a los cambios
evolución de las rapidamente, siempre dentro de
necesidades son críticas un marco acotado
Persistencia de datos Cambio continuo en los Los origenes de datos son estables
origenes de datos
Recursos Gran cantidad de Equipos pequeños
especialistas
Cómo elegir?
74
Inmon Kimball
Tiempo de entrega Se requieren gran Cuando existen necesidades
cantidad de tiempo urgentes de información
para la entrega
Costo Alto costo inicial, con Costo bajo inicial, y por cada ciclo
pequeños agregados en siguiente puede haber
ciclos futuros optimización en los costos
Resumen
75