Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Sesion2 IntroduccionBI PDF
Sesion2 IntroduccionBI PDF
Introducción
Por
Elizabeth León Guzmán, Ph.D.
Profesora
Ingeniería de Sistemas
Grupo de Investigación MIDAS
Agenda
1.Introducción
2.Definición
3.ETL
4.Bodega de Datos
5.Data Mart
Introducción
No solo intuición para que el negocio
crezca
Inteligencia de Negocios
Toma de Decisiones
Conocimiento
Información
Datos
Inteligencia de Negocios
Definición
Servicios de Reporte
Creación, administración y visualización de
informes
Motor para alojar y procesar informes
Inteligencia de Negocios
Características
Inteligencia de negocios provee soluciones
a nivel empresarial que permiten a los
tomadores de decisiones transformar
información clave de su negocio en
acciones concretas traduciéndose en
beneficios tangibles:
Reducción de costos
Mayor rentabilidad
Mejores relaciones comerciales
La Inteligencia de Negocios
Características Deseables
Entrega de Información
Consultas y Reportes
Análisis Tablero instrumentos (dashboard)
Distribución información (autom.)
Reportes
Manejo de eventos
Consultas Integración con otras herramientas
de cálculo(Ej: excel)
Facilidades de Análisis
Análisis multidimensional (OLAP)
Dashboards Cálculos y Modelamiento (What-if)
Man. Eventos Análisis avanzado y Minería
Visualización avanzada
Minería de Datos Plataforma para Desarrollo e
Integración
ETL – DQ – Seguridad - Metadata
02/06/13 Introducción a la Mineria de Datos y 15
Aplicaciones
Fases de una solución de
Inteligencia de Negocios
.
ETL - Extraction, Transformation and
Load
Proceso que permite mover datos desde
múltiples fuentes, reformatearlos y
limpiarlos, y cargarlos en otra base de
datos, data mart, o data warehouse para
analizar.
Extracción y Transformación de los datos
desde las fuentes: Bases de datos, ERP,
excel, archivos texto, etc.
Carga de los datos transformados a la
bodega
Extracción
primera parte del proceso ETL
extraer los datos desde los sistemas de
origen
Diferente organización, formatos
deja los datos en formato especial para ser
transformados
Si existen muchos datos, peligro de
colapsar. Se programa en horarios en el que
el impacto sea mínimo
Transformación
Aplica reglas de negocio o funciones sobre
los datos extraídos para convertirlos en
datos que serán cargados
Ejemplos de transformaciones:
Seleccionar sólo ciertas columnas para su
carga (por ejemplo, que las columnas con
valores nulos no se carguen).
Traducir códigos (por ejemplo, si la fuente
almacena una "H" para Hombre y "M" para
Mujer pero el destino tiene que guardar "1"
para Hombre y "2" para Mujer).
Transformación
Codificar valores libres (por ejemplo, convertir
"Hombre" en "H“).
Obtener nuevos valores calculados (por
ejemplo, total_venta = cantidad * precio).
Unir datos de múltiples fuentes (por ejemplo,
búsquedas, combinaciones, etc.).
Calcular totales de múltiples filas de datos (por
ejemplo, ventas totales por cada producto).
Dividir una columna en varias (por ejemplo,
columna "Nombre: Diaz, Maria"; pasa a dos
columnas "Nombre: Maria" y "Apellido: Diaz").
Carga
Datos transformados son cargados en la
bodega
Interaccion directa con la bodega
Se aplicaran restricciones y triggers que
esten definidos:
valores únicos,
integridad referencial,
campos obligatorios,
rangos de valores
Ejemplo ETL
Bodegas de Datos
El objetivo de construir una bodega es centralizar
y resumir (agregación) la gran variedad de datos e
información.
Arquitectura particular para almacenar datos cuyo
diseño no está preparado para soportar el
proceso transaccional
Contiene información histórica de la empresa para
permitir análisis de su evolución
Estructurada para optimizar consultas, y las
actualizaciones se hacen fuera de línea
Fases de una solución de
Inteligencia de Negocios
.
Bodega de Datos
Definición
“Es un conjunto de datos integrados o
orientados a un objetivo específico, que
varían con el tiempo (datos históricos) y
que no son transitorios.
Soportan el proceso de toma de
decisiones de la administración y está
orientada al manejo de grandes
volúmenes de datos provenientes de
diversas fuentes o diversos tipos” [1]
Bodega de Datos
Definición
Una Bodega de Datos es una base de
datos que organiza y almacena una
colección de información derivada
directamente de los sistemas
operacionales y de algunos datos externos
[2].
Bodegas de datos
Información
Se apoyan en tres procesos de organización
de alto nivel:
Tomado de [1]
Data Mart
Bodegas de datos pequeñas específicas de
un departamento o dependencia de la
empresa
Utilizados para almacenar particularidades de
un sector o para optimizar las consultas
Implementación
Top-down
Bottom-up
Top-down
Bottom-up
Cubo
DM1
OLTP
DM2
Fuente de
datos 1
DM4
Fuente de
datos 3
Cliente
DM3
Diseño Lógico y Físico de la Bodega
Estos modelos permiten:
Planear la extracción y transformación
Estimar las necesidades de administración
del DBMS
Planear prototipos para las aplicaciones
finales
El diagrama dimensional del ciclo de vida del
negocio
Diseño Selección e
Técnico de la Instalación
arquitectura del producto
Especificaciones de Desarrollo
la de la
Aplicación de Aplicación de
Usuario final
Usuario final
Tomado de [5]
Planeación del Proyecto
1. Definición del proyecto
1. Asegurar la factibilidad del proyecto
2. Alcance preliminar del proyecto
3. Justificación de negocio
2. Planeación del proyecto
1. Establecer la identidad del proyecto
2. Recursos del proyecto
3. Plan del proyecto
3. Gerencia del proyecto
1. Reunión de lanzamiento (Kick-Off)
2. Monitorear el estado del proyecto
3. Actualización y documentación del Plan del Proyecto
4. Manejo del alcance
5. Plan de comunicaciones
ELEMENTOS BASICOS DE UNA BODEGA DE DATOS
Área de Área de
presentación Herramientas de acceso
Sistemas Área de almacenamiento “The Data Warehouse” Datos accesados por
Fuentes de datos Servidores el usuario final
(Herencia)
Herramientas específicas de
Storage: populate,
Data Mart #1: alimentar
consulta
Archivos planos; replicate,
OLAP (ROLAP and/or MOLAP)
RDBMS; Servicios de consulta;
recover
Other Dimensional
Informes escritos
extraer Orientado a tema de negocio alimentar