Está en la página 1de 29

Isis Lay 12003204

Carlos Escobar 12003202

CAPÍTULO 04:
COMPONENTES DE BI
Índice
 Introducción
 Componentes de BI
 Fuentes de Información
 Calidad de datos
 ETL
 DWH
 Data Marts
 Herramientas de BI
 OLAP
 Datamining
 Visualización
 Preguntas
 Conclusión
 Recomendación
 Bibliografía
Introducción
Actualmente, gran número de compañías requieren una
adecuada toma de decisiones, por lo que la información
que se quiere investigar sobre los diferentes elementos de
la organización se encuentran en bases de datos u otras
fuentes que posee la empresa. Es por ello que nace la
necesidad de un esquema de solución de BI.

¿Cuál es la información requerida para gestionar y tomar


decisiones?
¿Cuál debe ser el formato y composición de los datos a
utilizar?
¿De dónde proceden esos datos y cual es la
disponibilidad y periodicidad requerida?
Componentes de BI
Componentes de BI
Fuentes de información • Alimentan de información el DWH

• Extracción, transformación y carga de los


ETL datos en el DWH. Los datos se
transforman, limpian, filtran y redefinen

• Almacena los datos logrando su


DWH flexibilidad, facilidad de acceso y
administración

• Herramientas de visualización, análisis y


Herramientas
navegación

• Cálculos, consultas, planeamiento,


OLAP pronostico y análisis de escenarios en
big data
Fuentes de información

Departa-
Operacio mentales
-nales

Externas

ETL
Fuentes de información

Sistemas Sistemas
Fuentes externas
operacionales departamentales

Estudios de
ERP Previsiones mercado

Índices de la
CRM Presupuestos industria

Estadísticas y
Hojas de
SCM censos
cálculo

Otros WWW
Legacy
Calidad de los datos
Totalidad
Coherencia Validez
Integridad Disponibili-dad

Precisión Accesibili-dad

Calidad
Extracción, transformación y carga
(ETL)
•Recuperar los datos físicamente de las
Extracción fuentes de información. Datos en bruto

•Corregir errores, eliminar duplicados,


Limpieza completar vacíos.

•Estructurar y sumariar los datos en


Transformación modelos de análisis de las áreas.

•Validar la consistencia e integrar en


Integración distintos modelos de datos

Actualización •Añadir nuevos datos al DWH


Proceso de limpieza de datos
• Identifica y aísla elementos individuales:
Depurar • Separa nombre completo en nombre, primer
apellido, segundo apellido.

• Corrige valores individuales usando algoritmos


Corregir • Comprueba dirección y código postal
correspondiente

• Transforma valores en formatos definidos y


Estandarizar consistentes.

• Busca y relaciona los registros, corrigiéndolos y


Relacionar estandarizándolos.
• Elimina duplicados.

• Analiza e identifica relaciones entre registros


Consolidar relacionados y los consolida
Herramientas de ETL
Transforma-
Extracciónción Carga
Gestión de Servicios de
Metadata transporte
Administra-ción
Diseño gráfico
y operación

ETL
Datawarehouse (DWH)
Hugh J. Watson

• “Un Datawarehouse es una colección de información creada para


soportar las aplicaciones de toma de decisiones”

Bill Inmon

• “Es un conjunto no volátil de información que soporta la toma de


decisiones, Orientado sobre un área, integrado al tiempo.”

Ralph Kimbal

• “El Datawarehouse da acceso a la información de la corporación o área funcional.


El alcance del Datawarehouse puede ser bien un departamento o bien corporativo.”
Datawarehouse (DWH)

Hugh J. Watson

• “Datawarehousing es el proceso completo de extraer


información, transformarla y cargarla en un Datawarehouse y el
acceso a esta información por los usuarios finales y las
aplicaciones”

Sharon Sibigthroth

• “Descubres el valor real de un Datawarehouse cuando alguien


puede encontrar los detalles importantes en la información, y te
dice algo que puede generar la diferencia”.
Data Marts Dependientes
Fuentes de datos

Datawarehouse

Data Marts
Data Marts Independientes
Fuentes de datos

Data Marts
Estrategias de construcción de un DWH

W.H Inmon

• Definir un DWH corporativo y a partir de él ir construyendo los modelos de


análisis para los distintos niveles y departamentos de la organización; es
decir, una estrategia de arriba abajo, desde la estrategia a lo más operativo.

R. Kimball

• Construir distintos Data Marts que cubran las distintas necesidades


de la organización, sin la necesidad de construir un Datawarehouse.
Componentes y factores de DWH

Información de la información. Contiene el significado de los componentes que residen en el

Metadata
Datawarehouse (o Data Mart) y sus atributos. Es útil para tecnología y los usuarios funcionales.

Consolidan datos de distintas fuentes y sistemas no integrados y facilitan un acceso online integrado sobre esa información.

Operational Data Store (ODS)


Proporciona información integrada con el fin de facilitar la toma de decisiones en entornos operacionales. Sus datos son
volátiles (dos o tres meses) y se actualizan en tiempo real. Es una fuente de datos para el DWS.

1. Tamaño y volumen de datos del Datawarehouse 2. Complejidad de los esquemas de

Factores para implementar DHW


datos. 3. Número de usuarios concurrente. 4. Complejidad de las consultas

Los usuarios de negocio necesitan tomar decisiones por lo que debemos asegurar: 1. Alta disponibilidad.

Gestión del Datawarehouse


2. Rendimiento. 3. Copias de seguridad y recuperación. 4. Recuperación física en caliente.
Herramientas de BI
Herramienta Descripción
Generadores de Utilizadas por desarrolladores profesionales
informes para crear informes estándar para grupos,
departamentos o la organización.
Herramientas de Empleadas por usuarios finales para crear
usuario final de informes para ellos mismos o para otros; no
consultas e informes requieren programación.
Herramientas OLAP Permiten tratar la información de forma
multidimensional para explorarla desde
distintas perspectivas y periodos de tiempo.
Herramientas de Muestran información crítica de rendimiento
Dashboard y utilizando iconos gráficos pudiendo ver más
Scorecard detalle e informes.
Herramientas de BI
Herramienta Descripción
Herramientas de Permiten crear planes de negocio,
planificación, simulaciones, planificación, presupuestos,
modelización y previsiones, etc. Proveen a los dashboards y
consolidación Scorecard de objetivos y umbrales de las
métricas
Herramientas Permiten crear modelos estadísticos de las
Datamining actividades de los negocios. Descubren e
interpretan patrones desconocidos en la
información para resolver problemas de
negocio.
Procesamiento analítico en línea
(OLAP)

FAST

ANALYSIS

SHARED

MULTIDIMEN-
SIONAL
Tipos de OLAP
Tipo Descripción
Relational Acceden directamente a la base de datos relacional. No
OLAP tiene limitaciones en cuanto al tamaño, pero es más lento
(ROLAP) que MOLAP.
Multimensional Accede directamente a una base de datos
OLAP multidimensional. Es muy rápida en los tiempos de
(MOLAP) respuesta, pero si queremos cambiar las dimensiones,
debemos cargar de nuevo el cubo
Hybrid OLAP Accede a los datos de alto nivel en una base de datos
(HOLAP) multidimensional y a los atómicos directamente sobre la
base de datos relacional. Utiliza las ventajas del ROLAP y
del MOLAP.
Desktop OLAP Crea un cubo en la memoria del ordenador y cuando
(DOLAP) finaliza lo elimina de memoria. El usuario sólo recibe y
analiza las dimensiones en los que está interesado y
en forma local.
Datamining
Visualización
Usuarios de herramientas de BI
Preguntas capítulo 04
 ¿Que entendemos por proceso ETL?
 ¿Cuál es la utilidad de los
Datawarehouse o almacenes de datos?
 ¿Qué son los Data Mart?
 ¿En que consisten los cubos OLAP?
Conclusiones
 BI se compone de diversos elementos, como lo son:
• Fuentes de información
• Herramientas de ETL
• Data Warehouse y Data Mart
• Herramientas de BI
• Queries y reports
• OLAP
• Interfaz y visualización (Scorecards y Dashboards)
• Data Mining
 Gracias a BI, podemos identificar lo que está pasando,
entender por qué pasa, ayudar a predecir que va a pasar y
tomar las medidas necesarias.
Recomendaciones
 Adecuada planificación
 Contemplar elementos como la información que se
necesita
 Detallar el uso de la misma,
 Determinar a quien va dirigido
 Analizar minuciosamente los aspectos técnicos como
lo son
 tiempo de respuesta,
 integración,
 seguridad,
 navegación,
 entorno gráfico.
Bibliografía
 Cano, Josep. 2007. Business
Intelligence: Competir con Información.
España, Barcelona. Banesto, Fundación
Cultural.
Gracias!

También podría gustarte