Está en la página 1de 17

rea Acadmica: Sistemas Computacionales

Tema: Arquitectura de un sistema de almacn de


datos
Profesor: Mtro Felipe de Jess Nez Crdenas
Periodo: Agosto Noviembre 2011
Keywords
Almacen de Datos, Datawarehouse, Arquitectura

Tema: Arquitectura

de un sistema de

almacn de datos
Abstract
The constrution of a datawarehouse involve
determining the dimensions that must have, as well
as the attributes that each will have, all within
multidimensional architecture
Keywords:
Almacen de Datos, Datawarehouse, Arquitectura

Arquitectura de un Almacn de Datos


La Arquitectura de un AD viene determinada por
su situacin central como fuente de informacin
para las herramientas de anlisis.
Fuentes
Internas

Herramientas
de consultas e
informes

Base de Datos
Transaccional
Herramientas
EIS

ETL
Fuente de
Datos 1
texto

Almacn
de Datos

Herramientas
OLAP

Fuente de
Datos 3
Copias de
Seguridad

HTML

Fuente de
Datos

Interfaz y
Operadores

Fuentes
Externas

Herramientas de
Minera de
Datos

Arquitectura de un Almacn de Datos


Componentes:
Sistema ETL (Extraction, Transformation, Load): realiza las
funciones de extraccin de las fuentes de datos (transaccionales o
externas), transformacin (limpieza, consolidacin, ...) y la carga del
AD, realizando:

extraccin de los datos.


filtrado de los datos: limpieza, consolidacin, etc.
carga inicial del almacn: ordenacin, agregaciones, etc.
refresco del almacn: operacin peridica que propaga los cambios de las
fuentes externas al almacn de datos

Repositorio Propio de Datos: informacin relevante, metadatos.


Interfaces y Gestores de Consulta: permiten acceder a los datos y
sobre ellos se conectan herramientas ms sofisticadas (OLAP, EIS,
minera de datos).
Sistemas de Integridad y Seguridad: se encargan de un
mantenimiento global, copias de seguridad, ...

Arquitectura de un Almacn de Datos


Organizacin (Externa) de Los Datos
Las herramientas de explotacin
de los almacenes de datos han
adoptado un modelo
multidimensional de datos.

Se ofrece al usuario una visin


multidimensional de los datos que son
objeto de anlisis.

Arquitectura de un Almacn de Datos


EJEMPLO
Organizacin: Cadena de supermercados.
Actividad objeto de anlisis: ventas de productos.
Informacin registrada sobre una venta: del
producto Tauritn 33cl se han vendido en el almacn
Almacn nro.1 el da 17/7/2003, 5 unidades por un
importe de 103,19 euros.
Para hacer el anlisis no interesa la venta
individual (ticket) realizada a un cliente sino las
ventas diarias de productos en los distintos
almacenes de la cadena.

Arquitectura de un Almacn de Datos


Marca
Descripcin

Semana

Categora
Departamento

Mes

Nro_producto

Trimestre

Da
Ao

Tipo

importe
unidades
Almacn
Ciudad
Tipo
Regin

Arquitectura de un Almacn de Datos


Dimensiones (puntos de
vista) desde los que se
puede analizar la actividad.
Marca
Semana

Descripcin
Categora

Mes

Departamento

Trimestre

Da

Nro_producto

Ao

Tipo

importe
unidades
Almacn

Actividad que es objeto de


anlisis con los indicadores
que interesa analizar

Ciudad

Tipo

Regin

Arquitectura de un Almacn de Datos


Modelo multidimensional:
en un esquema multidimensional se representa una
actividad que es objeto de anlisis (hecho) y las
dimensiones que caracterizan la actividad (dimensiones).
la informacin relevante sobre el hecho (actividad) se
representa por un conjunto de indicadores (medidas o
atributos de hecho).
la informacin descriptiva de cada dimensin se
representa por un conjunto de atributos (atributos de
dimensin).

Arquitectura de un Almacn de Datos


hecho

Marca
Descripcin

Semana

Categora
Departamento

Mes

Nro_producto

Trimestre

Da
Ao

Tipo

importe
unidades

dimensin

Almacn

medidas

Ciudad
Tipo

atributos

Regin

Arquitectura de un Almacn de Datos


Entre los atributos de una dimensin se definen jerarquas
Producto
nro. producto

categora

departamento

Almacn
ciudad

regin

almacn
tipo

Tiempo
da

trimestre

mes
semana

ao

Arquitectura de un Almacn de Datos


Este esquema multidimensional recibe varios nombres:
estrella: si la jerarqua de dimensiones es lineal
proyecto

tiempo

PERSONAL
equipo

estrella jerrquica o copo de nieve: si la jerarqua no es lineal.


tiempo
producto
lugar

VENTAS

Arquitectura de un Almacn de Datos


Se pueden obtener hechos a diferentes niveles de
agregacin:
obtencin de medidas sobre los hechos parametrizadas por
atributos de las dimensiones y restringidas por condiciones
impuestas sobre las dimensiones

HECHO: El primer
trimestre de 2004 la
empresa vendi en
Valencia por un
importe de 22.000
euros del producto
tauritn 33 cl.

LUGAR:
ciudad

Ventas en
miles de
Euros

Murcia
Alicante
Zaragoza
Madrid
Barcelona
Valencia

PRODUCTO:
artculo

Zumo Pia 1l.

17

Cola 33cl.

57

Jabn Salitre

93

Tauritn 33cl

22

Cerveza Kiel 20 cl

Leche Entera Cabra 1l

12

Jerarqua de dimensiones:
PRODUCTO

LUGAR

TIEMPO

Categora

Pas

Ao

Gama
\

Prov.

Ciudad

Artculo

Supermercado

2 3 4 1 2
2005
2004

TIEMPO: trimestre

Un nivel de agregacin para un conjunto de


dimensiones se denomina cubo.

Trimestre \
/

Mes Semana
\

/
Da
|
Hora

Arquitectura de un Almacn de Datos


Se puede recopilar toda la informacin necesaria en
un nico esquema estrella o copo de nieve?
NO : necesidad de varios esquemas.
Cada uno de estos esquemas se denomina
datamart.
producto

proveedor

producto

tiempo

VENTAS

lugar

PRODUCCIN

lugar

tiempo

tiempo

lugar
equipo

PERSONAL

proyecto
tiempo
producto

CAMPAA

Almacn
formado por
4 datamarts.

Arquitectura de un Almacn de Datos


El almacn de datos puede estar formado por varios
datamarts y, opcionalmente, por tablas adicionales.
Data mart

subconjunto de un almacn de
datos, generalmente en forma
de estrella o copo de nieve.

se definen para satisfacer las


necesidades de un departamento o
seccin de la organizacin.
contiene menos informacin de
detalle y ms informacin agregada.

Bibliografa
Hand, D.J.; Mannila, H. and Smyth, P. Principles of Data Mining,
The MIT Press, 2000.
Hernndez, J.; Ramrez, MJ.; Ferri, C. Introduccin a la Minera de
Datos Pearson Prentice Hall, 2004.
Kosala, R.; Blockeel, H. Web Mining Research: A Survey ACM
SIGKDD Explorations, Newsletter of the ACM SIG on Knowledge
Discovery and Data Mining, June 2000, Vol. 2, n1, pp. 1-15.
Mena, Jesus Data Mining Your Website, Digital Press, July 1999.
Mitchell, T.M. Machine Learning McGraw-Hill 1997.
Pyle, D. Data Preparation for Data Mining Morgan Kaufmann,
Harcourt Intl., 1999.
Thuraisingham, B. Data Mining. Technologies, Techniques, Tools, and
Trends, CRC Press, 1999.
Witten, I.H.; Frank, E. Tools for Data Mining, Morgan Kaufmann, 1999.
Wong, P. C. Visual Data Mining, Special Issue of IEEE Computer
Graphics and Applications, Sep/ Oct 1999, pp. 20- 46.
Material extrado del Anlisis y Extraccin de Conocimiento en
Sistemas de Informacin:Datawarehouse y Datamining de Jos
Hernndez Orallo, Universidad Politcnica de Valencia

También podría gustarte