Está en la página 1de 41

Ing.

Castillo Zumarn, Segundo Jos,


Captulo 1
Business Intelligence o Inteligencia de
Negocios, consiste en proceso de
transformacin de datos en informacin,
haciendo uso de tcnicas de Extraccin,
Transformacin y Carga(ETL), proporcionando
informacin validada para una adecuada toma
de decisiones y de manera oportuna.
Transformacin ascendente.
Asignacin de valor: Ley de oferta y demanda?

Preguntas claves:
Qu influencia la compra y la demanda?
Qu productos me generan ms ingresos?
En dnde hay oportunidades de negocio?
Cmo segmento mis clientes segn su
comportamiento comercial?
Qu es lo que mueve la calidad del producto y la demanda de los clientes?

Era de la Informacin, la informacin tiene un valor monetario.


Las empresas al querer contar con una mayor
automatizacin en sus procesos, implementan dentro
de su organizacin una gran infraestructura
tecnolgica.
Sistema de procesamiento de Datos(SPD)
Administracin de Recursos empresariales(ERP)
Sistemas de Informacin Ejecutiva(EIS).
Sistema de Soporte a Decisiones(DSS).
Manejo de Relaciones con Clientes(CRM).
a) Antiguamente:
Toma de decisiones =
INTUICIN , BASADA EN LA
EXPERIENCIA

b) Actualmente:
Ms personas toman
decisiones
Deben tener informacin
OPORTUNA Y DE CALIDAD
Estos requerimientos en la Pirmide Organizacional se
dividen en tres:

5-10% de los usuarios

15-25% de los usuarios

65-80% de los usuarios


El concepto de Data Warehouse
nace entre los aos 1992 y 1993
como base del desarrollo de
soluciones Business Intelligence.
repositorio

En 1996 el concepto de Business


Intelligence empez a difundirse
como una evolucin de los
Executive Information Systems
(EIS).
En la actualidad el trmino Business Intelligence se
extendi hacia otras herramientas como:

EIS (sistema de informacin ejecutiva)


DSS (sistema de soporte a las decisiones)
Balanced Scorecad (indicadores de gestin)
Dashboard (cuadros de mandos)
ER (reporteadores empresariales)
Data Marts, Data Mining, Herramientas OLAP
OLTP
OLAP
DataWarehouse
Datamart
Metadata
OLTP esta encargado de dar soporte a los procesos diarios de
ingreso y mantenimiento de datos en tiempo real.
Volatilidad de
los datos
Diseo orientado a la transaccin

Soporte muy
limitado a la
toma de
decisiones

Ejemplos :
Es un proceso en el que se usan
herramientas netamente
analticas, que facilitan el
anlisis de la informacin del
negocio.
Organizada en perspectivas
(dimensiones) y mtricas,
permitiendo ejecutar anlisis
complejos de datos.
Permite a los usuarios fcil y
amigable navegacin a nivel de
granularidad (detalle).
Genera clculos adicionales en
base a los datos existentes.
Los servicios OLAP proveen multiples niveles
de analisis entre los cuales podemos
mencionar, ademas de tener la capacidad de
realizar consultas complejas, el realizar
actividades intensivas de comparacion de
datos, analisis de tendencias, reportes, etc.
Orientada al objetivo
Histrica
Consolidada
Consistente
Solo lectura
No es atmica
Es consolidada. La data se agrupa desde todas
las areas de la organizacion y almacenada en un
repositorio central y unico.
Es Consistente. Todos los usuarios deben tener
la misma version de los datos
indeprendientemente de donde provengan o
cuando hallan sido procesados.
Es orientada al objetivo. Solo debe contener
informacion importante que permita la toma de
decisiones.
Caracteristicas

Es Historica. Toda la informacion de la


empresa es almacenada como fotografias en
el repositorio unico de datos.
Es de solo lectura. El sistema OLAP es
exclusivamente solo para consultas.
No es atomica. La data OLAP principalmente
contiene data sumarizada y resumida.
OLAP Relacional (ROLAP)
OLAP Multidimensional (MOLAP)
OLAP Hibrido (HOLAP)
OLAP de Escritorio (DOLAP)
OLAP Local (LOLAP)
OLAP Relacional (ROLAP)

Es un sistema en el cual los datos se encuentran almacenados en una


base de datos relacional.

Tpicamente, los datos son detallados, evitando las agregaciones y las


tablas se encuentran normalizadas.

Los esquemas ms comunes sobre los que se trabaja son estrella o


copo de nieve, aunque es posible trabajar sobre cualquier base de
datos relacional.

Est diseada para almacenar gran volumen de datos, debido a que


su almacenamiento es relacional. Por ejemplo :
Las empresas de telecomunicaciones
Banca, entre otros.
OLAP Relacional (ROLAP)

Est compuesta por un servidor de base de datos


Relacional y un motor OLAP en un servidor dedicado.
Los usuarios que requieren de un alto nivel de detalle
necesitarn de una arquitectura ROLAP
OLAP multidimensional (MOLAP)

Est compuesta por un motor OLAP en un servidor


dedicado.
Permitir mejoras enormes en la performance con respecto a
los tiempos de consulta logrando un anlisis ms fcil y
rpido.
Los usuarios que requieren de datos agregados y
sumarizados necesitarn de una arquitectura MOLAP .
OLAP Hbrido (HOLAP)

Mantiene los registros detallados en la BD relacional, mientras que


los datos resumidos o agregados se almacenan en una base de
datos multidimensional separada.

Este mtodo de almacenamiento es una combinacin de los dos


anteriores e intenta rescatar lo mejor de cada uno.

Es utilizada en DataMarts con grandes volmenes de datos como


por ejemplo :
Banca
Retail
Seguros
Entre otros.
OLAP Hbrido (HOLAP)

Est compuesta por un servidor de base de datos Relacional


y un motor OLAP en un servidor dedicado.
Permite que el espacio fsico, la performance de las
consultas y el procesamiento sea menor que MOLAP y
mayor que ROLAP.
Los analista que requieran ambos tipos de anlisis
necesitarn una arquitectura HOLAP
Desktop Online Analytical Processing (DOLAP) y
Local Online Analytical Processing (LOLAP)

Se almacena en la estacin de trabajo del cliente (que


puede ser una PC comn).

Este tipo de cubos de informacin envan al servidor


relacional instrucciones SQL desde una estacin de trabajo
y reciben los datos almacenndolos como micro cubos los
cuales son analizados de manera local.

Sus desventajas son que el cubo offline no puede ser muy


grande y al estar almacenado en la pc del cliente pueden
presentarse problemas de seguridad.
Difieren en arquitectura y uso.

Entre los numerosos puntos de diferencias se encuentran:

Los objetivos principales


La orientacin de los datos
La integracin
La historicidad
El acceso de datos y manipulacin
Los patrones de uso
La granularidad de los datos
El perfil de los usuarios
La metodologa de desarrollo, etc.
Diferencias OLTP OLAP

Los objetivos principales Estn orientados a dar soporte a las operaciones diarias del Se orientan a asistir en el anlisis del negocio
de construccin negocio. (consultas)

La integracin Los datos se encuentran dispersos, son calificados Los datos deben estar integrados, consolidados y
como datos base o datos operacionales. orientados a un tema o rea de anlisis
Estos datos son estructurados en forma aislada uno de
otros, pudiendo tener diferentes estructuras de llaves y
nombres.

La historicidad La informacin es cambiante en el tiempo Toda la informacin de la empresa es almacenada


como fotografas en el repositorio nico de datos.

El acceso de datos y Realizan operaciones con los datos fila por fila usando Tienen una carga y acceso masivo de datos,
manipulacin genaralmente sentencias inserts, updates y deletes. haciendo uso principalmente de sentencias select.
Adems requieren de rutinas de validacin como son el La estructura de la BD analtica es
commit y el rollback, los bloqueos de registros, etc. desnormalizada rompiendo los esquemas clsicos
operacionales para beneficiar el tiempo de
consulta y proceso.

Granularidad de Datos Se encuentran los datos a nivel atmico (transaccin por Tienen adicionalmente de data detallada, datos
transaccin). sumarizados y agregados.

Alineacin de dato Estn orientados a aplicaciones o sistemas los cuales Estn alineados por rea o tema y estn orientados a
poseen distintos tipos de datos y diferentes y estructurados la consulta del analista de negocio. Se orientan
para registrar las transacciones diarias del negocio. totalmente a las consultas.
Objetivos principales de construccin

Los OLTP estn orientados a dar soporte a las


operaciones diarias del negocio. Las aplicaciones
OLAP se orientan a asistir en el anlisis del negocio
(consultas).
Alineacin de datos

Los OLTP estn orientados a aplicaciones o sistemas


los cuales poseen distintos tipos de datos y diferentes
y estructurados para registrar las transancciones
diarias del negocio.

Los sistemas OLAP estn alineados por rea o tema y


estn orientados a la consulta del analista de negocio.
Se orientan totalmente a las consultas.
OLTP vs OLAP
OLTP OLAP

Por ejemplo :

En las financieras existen numerosas aplicaciones de cuentas y colocaciones a


nivel operacional mientras que en un Data Warehouse la informacin estara
organizada por cliente, funcionario, tipo de cuenta y tiempo.

En las comercializadoras existen aplicaciones sobre registro de ventas, registro


de compras, manejo de inventario o stock y presupuesto. En un Data
Warehousing hablaramos de productos, sucursales, proveedores, tiempo y las
diferentes mtricas propias de negocio (unidades vendidas, monto neto, etc)
OLTP vs OLAP
Integracin de datos

En los OLTP, los datos se encuentran dispersos, son


calificados como datos base o datos operacionales.
Estos datos son estructurados en forma aislada uno
de otros, pudiendo tener diferentes estructuras de
llaves y nombres.

En los ambientes OLAP, los datos deben estar


integrados, consolidados y orientados a un tema o
rea de anlisis.
OLTP vs OLAP
Acceso y manipulacin de los datos

Los sistemas operacionales realizan operaciones con los datos


fila por fila usando genaralmente sentencias inserts, updates y
deletes. Adems requieren de rutinas de validacin como son el
commit y el rollback, los bloqueos de registros, etc.

Los sistemas OLAP tienen una carga y acceso masivo de datos,


haciendo uso principalmente de sentencias select. Es por esta
razn que la estructura de la BD analtica es desnormalizada
rompiendo los esquemas clsicos operacionales para beneficiar
el tiempo de consulta y proceso.
OLTP vs OLAP
Granularidad de los datos

Los sistemas OLTP se encuentran los datos a nivel


atmico (transaccin por transaccin).

Los sistemas OLAP tienen adicionalmente de data


detallada, datos sumarizados y agregados.
OLTP vs OLAP
Ralph Kimball: un data warehouse es una copia de
los datos transaccionales especficamente
estructurados para consultas y anlisis.
g. Respaldo g. Respaldo

e. Auditoras

c. Consultas
a. Extraccin
Transformacin
Carga e ndices

b. Chequeo
de Calidad

f. Seguridad
d. Feedback
Un Datamart es un Data Warehouse mas pequeo.
Normalmente la informacin contenida en un datamart
es un subconjunto de un datawarehouse.
Caractersticas Beneficios Desventajas
Orientado a un Implementacin rpida y Inadvertidamente se
departamento dentro de sencilla puede usar datos no
la organizacin compatibles con otros
Menor costo de Datamarts que luego
Puede ser implementado implementacin alarguen el tiempo de
como una solucin para unificacin
problemas inmediatos Cubre necesidades
especificas del Negocio Si el Data Warehouse es
No es necesario para construido primero, se
construir un Data Respuestas rpidas por requiere de hardware
Warehouse el menor volumen de adicional para soportar
informacin Datamarts individuales.

Asegura la consistencia Datos descentralizados


de los datos debido a que cada
Datamart corresponde a
una base de datos
individual por tema o por
rea.
Actividad de negocio
Una solucin tctica
Porqu construir un Data Mart
Consultas ms rpidas menos usuarios
Tiempo de desarrollo ms rpido(3 meses)
Data Marts integrador
Asegurar la consistencia de datos
Requiere de una planeacin avanzada.
1. Es un componente muy valioso para el Data Warehouse; los
datos provenientes de la metadata se sita en una
dimensin diferente al de otros datos del data warehouse,
debido a que su contenido no es tomado directamente
desde el ambiente operacional.

1. La Metadata abarca todos los procesos de Data


Warehousing y contiene:
Nombres de campos y definiciones
Mapeo de los datos
Tablas
ndices
Cronogramas de extraccin y carga
Criterios de seleccin
Clculos de los datos derivados
Transformacin de los datos
Existen 3 tipos de Metadatos:

Metadata del Negocio: Contiene los modelos lgicos y las reglas


de negocio.

Metadata Tcnica: Contiene los nombres fsicos de las tablas,


ubicacin de almacenamiento, relaciones, llaves, etc.

Metadata Operacional: (jobs)Contiene la programacin de


cargas, fechas de actualizacin de datos, seguridad.