Está en la página 1de 27

BASES DE DATOS

MULTIDIMENSIONALES

Facultad de Ingeniera y Ciencias


Ingeniera en Sistemas de Computacin e Informtica

Conceptos de Datawarehousing
Ing. Jonathan Carrillo
Quito, Marzo 2015

Contenido:
1.
2.
3.
4.
5.

Introduccin a las bases de datos multidimensionales


Evolucin, beneficios y problemas de los Datawarehouse
Arquitectura de un Datawarehouse
Data Marts
Conclusin

Ing. Jonathan Carrillo - Marzo 2015

Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales

DataWarehouse

> Es una base de datos corporativa en la que se


integra informacin depurada de las diversas
fuentes que hay en la organizacin. Dicha
informacin debe ser homognea y fiable, se
almacena de forma que permita su anlisis desde
muy diversas perspectivas, [y con] tiempos de
respuesta ptimos.
Ramos, 2011

Ing.Jonathan
Ing. Jonathan
Carrillo
Carrillo
- Marzo
- Marzo
2015 2015

Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales

DataWarehouse

> Es un repositorio de datos que proporciona una


visin global, comn e integrada de los datos de
la organizacin independientemente de cmo se
vayan a utilizar posteriormente por los
consumidores o usuarios, con las propiedades
siguientes: estable, coherente, fiable y con
informacin histrica.
Curto, 2011

Ing.Jonathan
Ing. Jonathan
Carrillo
Carrillo
- Marzo
- Marzo
2015 2015

Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales

DataWarehouse

> El almacenamiento de datos (data warehousing)


y el procesamiento analtico en lnea (on - line
analytical processing ) OLAP, son elementos
esenciales en el soporte de decisiones, de las
bases de datos
Chandhuri, S.

Ing.Jonathan
Ing. Jonathan
Carrillo
Carrillo
- Marzo
- Marzo
2015 2015

Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales

DataWarehouse

> Por medio de los conceptos anteriores, podemos


decir entones que un dataWarehouse es:
Una Base de Datos
BDD: estable, coherente, fiable y con
informacin histrica
Almacena datos corporativos
Integra informacin depurada
Sirve como soporte para la toma de
decisiones y para el anlisis de tendencias.
Ing.Jonathan
Ing. Jonathan
Carrillo
Carrillo
- Marzo
- Marzo
2015 2015

Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales

Caractersticas de un DataWarehouse

> Bill Inmon fue uno de los primeros autores en


escribir sobre el tema de los DataWarehouse en
los siguientes trminos:
Un Data Warehouse o Almacn de Datos es
una coleccin de datos orientado a temas,
integrado, de tiempo variante y no voltil,
que se usa para el soporte del proceso de
toma de decisiones gerenciales.

Inmon, 1993

Ing.Jonathan
Ing. Jonathan
Carrillo
Carrillo
- Marzo
- Marzo
2015 2015

Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales
Caractersticas de un DataWarehouse

Orientado a temas: la informacin se clasifica en


base a los aspectos que son de inters para la
empresa (clientes, productos, ventas)
> Por ejemplo, para un fabricante, stos pueden ser
clientes, productos, proveedores y vendedores.
> Para una universidad pueden ser estudiantes,
clases y profesores.

> Para un hospital pueden ser pacientes, personal


mdico, medicamentos, etc.
Ing.Jonathan
Ing. Jonathan
Carrillo
Carrillo
- Marzo
- Marzo
2015 2015

Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales
Caractersticas de un DataWarehouse

Orientado a temas:

Ing.Jonathan
Ing. Jonathan
Carrillo
Carrillo
- Marzo
- Marzo
2015 2015

Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales
Caractersticas de un DataWarehouse

Integrado: La integracin de datos se muestra de


muchas maneras:
> en convenciones de nombres consistentes,
> en la medida uniforme de variables,
> en la codificacin de estructuras consistentes,
> en atributos fsicos de los datos consistentes,
> fuentes mltiples y otros.

Ing.Jonathan
Ing. Jonathan
Carrillo
Carrillo
- Marzo
- Marzo
2015 2015

Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales
Caractersticas de un DataWarehouse

Integrado:

DataWarehouse

Ing.Jonathan
Ing. Jonathan
Carrillo
Carrillo
- Marzo
- Marzo
2015 2015

Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales
Caractersticas de un DataWarehouse

Integrado:
> Para integrar, se debe tomar en cuenta las
convenciones (estandarizacin) utilizada por los
diseadores de las aplicaciones. stas se
diferencian en:
la codificacin,
en las estructuras claves,

en sus caractersticas fsicas,


en las convenciones de nombramiento y
otros.
Ing.Jonathan
Ing. Jonathan
Carrillo
Carrillo
- Marzo
- Marzo
2015 2015

Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales
Caractersticas de un DataWarehouse

Integrado:
> Codificacin. Los diseadores de aplicaciones
codifican el campo GENERO por ejemplo, en
varias formas.
> Un diseador representa GENERO como una
"M" y una "F", otros como un "1" y un "0", otros
como una "X" y una "Y" e inclusive, como
"masculino" y "femenino".
> Por lo que GENERO debe llegar al
DataWarehouse en un estado integrado uniforme.
Ing.Jonathan
Ing. Jonathan
Carrillo
Carrillo
- Marzo
- Marzo
2015 2015

Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales
Caractersticas de un DataWarehouse

Integrado:

Ejemplo de Codificacin

Ing.Jonathan
Ing. Jonathan
Carrillo
Carrillo
- Marzo
- Marzo
2015 2015

Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales
Caractersticas de un DataWarehouse

Integrado:

Ejemplo de Codificacin

Ing.Jonathan
Ing. Jonathan
Carrillo
Carrillo
- Marzo
- Marzo
2015 2015

Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales
Caractersticas de un DataWarehouse

Integrado:
> Caractersticas Fsicas. Formatos de los
atributos de medida de las fuentes de datos, por
ejemplo en centmetros, otros en pulgadas, otros
en millones de pies cbicos por segundo y otros
en yardas.
> Cualquiera que sea la fuente, cuando la
informacin
del
atributo
llegue
al
DataWarehouse necesitar ser una medida que
mantenga el formato de la misma manera.
Ing.Jonathan
Ing. Jonathan
Carrillo
Carrillo
- Marzo
- Marzo
2015 2015

Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales
Caractersticas de un DataWarehouse

Integrado:

Ejemplo de Caractersticas Fsicas

Ing.Jonathan
Ing. Jonathan
Carrillo
Carrillo
- Marzo
- Marzo
2015 2015

Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales
Caractersticas de un DataWarehouse

Integrado:
> Convenciones de Nombramiento: El mismo
elemento es frecuentemente referido por nombres
diferentes en las diversas aplicaciones.
> Por ejemplo, bases de datos que no mantengan un
estndar de nombramiento: NombEmple; con
otra
que
mantenga
una
convencin:
NombreEmpleado.

Ing.Jonathan
Ing. Jonathan
Carrillo
Carrillo
- Marzo
- Marzo
2015 2015

Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales
Caractersticas de un DataWarehouse

Integrado:
> Fuentes Mltiples: El mismo elemento puede
derivarse desde fuentes mltiples.
> En este caso, el proceso de transformacin debe
asegurar que la fuente apropiada sea usada,
documentada y movida al DW.

Ing.Jonathan
Ing. Jonathan
Carrillo
Carrillo
- Marzo
- Marzo
2015 2015

Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales
Caractersticas de un DataWarehouse

Integrado:

Ejemplo de Fuentes Mltiples

Ing.Jonathan
Ing. Jonathan
Carrillo
Carrillo
- Marzo
- Marzo
2015 2015

Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales
Caractersticas de un DataWarehouse

Integrado:

Ejemplo de Fuentes Mltiples

Ing.Jonathan
Ing. Jonathan
Carrillo
Carrillo
- Marzo
- Marzo
2015 2015

Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales
Caractersticas de un DataWarehouse

De tiempo variante:
> Toda la informacin del DataWarehouse es
requerida en algn momento, en contraste con la
informacin en el ambiente operacional.
> Como la informacin en el DataWarehouse es
solicitada en cualquier momento (es decir, no
"ahora mismo"), los datos encontrados en el DW
se llaman de "tiempo variante".

Ing.Jonathan
Ing. Jonathan
Carrillo
Carrillo
- Marzo
- Marzo
2015 2015

Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales
Caractersticas de un DataWarehouse

De tiempo variante: La informacin del DW debe


incluir los datos histricos para usarse en la
identificacin y evaluacin de tendencias.
La informacin del data warehouse es,
para todos los propsitos prcticos,
una serie larga de "snapshots" (vistas
instantneas).

Ing.Jonathan
Ing. Jonathan
Carrillo
Carrillo
- Marzo
- Marzo
2015 2015

Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales
Caractersticas de un DataWarehouse

No voltil:
> La informacin en el DW no se modifica ni se
elimina, una vez almacenado un dato, ste se
convierte en informacin de slo lectura, y se
mantiene para futuras consultas. Los datos
almacenados no son actualizados, slo son
incrementados.
> Las actualizaciones de la base de datos
operacional no ocurren en el entorno del
DataWarehouse, no se requieren mecanismos de
control de la concurrencia y recuperacin.
Ing.Jonathan
Ing. Jonathan
Carrillo
Carrillo
- Marzo
- Marzo
2015 2015

Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales
Caractersticas de un DataWarehouse

No voltil:
> En el DW se requieren dos operaciones nada
ms: Carga inicial de los datos y acceso a datos.

Ing.Jonathan
Ing. Jonathan
Carrillo
Carrillo
- Marzo
- Marzo
2015 2015

Conceptos de Datawarehousing
1. Introduccin a las bases de datos multidimensionales
Caractersticas de un DataWarehouse

No voltil:
> Operacional VS. DatawareHouse
Voltiles

No voltiles

DW

Ing.Jonathan
Ing. Jonathan
Carrillo
Carrillo
- Marzo
- Marzo
2015 2015

También podría gustarte