Está en la página 1de 15

DATAWAREHOUSE

UNIVERSITARIO: JOSE TÓRREZ NAVA


DATA WAREHOUSE
Que es un Data Warehouse
 Un Data Warehouse es un repositorio de datos
corporativo que se caracteriza por integrar y depurar
información de una o más fuentes distintas, para luego
procesarla permitiendo su análisis desde infinidad de
perspectivas y con grandes velocidades de respuesta.
Un Data Warehouse proporciona información a
Sistemas de Soporte a Decisiones (DSS), Sistemas de
información ejecutiva (EIS) o herramientas para hacer
consultas o informes. Los usuarios finales pueden
hacer fácilmente consultas sin tocar o afectar la
operación del sistema.
Que NO es un Data Warehouse

 Un Producto: Un Data warehouse no es un sistema desarrollado en


masa. Un Lenguaje: Un Data warehouse no se codifica mediante un
lenguaje de programación, porque se basa en diferentes tecnologías
que pueden tener diferentes entornos. Una copia del sistema de
transacciones: Un error común es creer que duplicar la base de
datos transaccional es crear un Data warehouse.
Características

 Integrado: los datos almacenados deben integrarse en una


estructura consistente, por lo que las inconsistencias existentes
entre los diversos sistemas operacionales deben ser eliminadas.
Temático: Los datos se organizan por temas para facilitar su
acceso y entendimiento por parte de los usuarios finales.
Histórico: el tiempo es parte implícita de la información
contenida en un repositorio. la cual sirve, entre otras cosas, para
realizar análisis de tendencias. No volátil: la información existe
para ser leída y no para ser modificada. la actualización se
refleja con la incorporación de los últimos valores de las distintas
variables y sin ningún tipo de acción sobre lo que ya existía.
TABLA DE HECHOS
 En las bases de datos, y más concretamente en
un data warehouse, una tabla de hechos (o tabla
fact) es la tabla central de un esquema dimensional
(en estrella o en copo de nieve) y contiene los
valores de las medidas de negocio o dicho de otra
forma los indicadores de negocio. Cada medida se
toma mediante la intersección de las dimensiones
que la definen, dichas dimensiones estarán
reflejadas en sus correspondientes tablas de
dimensiones que rodearán la tabla de hechos y
estarán relacionadas con ella.
TABLA DE DIMENSIONES

 En la construcción de cubos OLAP,


las tablas de dimensiones son elementos
que contienen atributos (o campos) que se
utilizan para restringir y agrupar los datos
almacenados en una tabla de hechos
cuando se realizan consultas sobre dicho
datos en un entorno de almacén de
datos o data mart.
MODELO ESTRELLA
 En las bases de datos usadas para data
warehousing, un esquema en estrella es
un modelo de datos que tiene una tabla de
hechos (o tabla fact) que contiene los
datos para el análisis, rodeada de
las tablas de dimensiones. Este aspecto,
de tabla de hechos (o central) más grande
rodeada de radios o tablas más pequeñas
es lo que asemeja a una estrella, dándole
nombre a este tipo de construcciones.
MODELO COPO DE NIEVE
 En las bases de datos utilizadas en (data
warehousing), un esquema en copo de
nieve es una estructura algo más compleja
que el esquema en estrella. Se da cuando
alguna de las dimensiones se implementa con
más de una tabla de datos. La finalidad
es normalizar las tablas y así reducir el
espacio de almacenamiento al eliminar la
redundancia de datos; pero tiene la
contrapartida de generar peores
rendimientos al tener que crear más tablas
de dimensiones y más relaciones entre las
tablas (JOINS) lo que tiene un impacto
directo sobre el rendimiento.
MODELO ESTRELLA – COPO DE NIEVE
PROCESOS ETL

 Extract, Transform and Load («extraer, transformar y cargar»,


frecuentemente abreviado ETL) es el proceso que permite a las
organizaciones mover datos desde múltiples fuentes, reformatearlos y
limpiarlos, y cargarlos en otra base de datos, data mart, o data
warehouse para analizar, o en otro sistema operacional para apoyar
un proceso de negocio.
 Los procesos ETL también se pueden utilizar para la integración con sistemas
heredados. Se convirtieron en un concepto popular en los años 1970.1
Estructura
Data Marts

 Un Datamart es una base de datos departamental,


especializada en un área de negocio específica. Se
caracteriza por disponer la estructura óptima de datos
para analizar la información al detalle desde todas las
perspectivas que afecten a los procesos de dicho
departamento. Dpto Contable Data MartsDpto
VentasDpto RH
CUBOS
 Es una base de datos especial, en la cual el
almacenamiento físico de los datos se realiza en un vector
multidimensional.
VENTAJAS
 Proporciona información clave para la toma de
decisiones empresariales. Especialmente útil para el
medio y largo plazo. Son sistemas relativamente
sencillos de instalar si las fuentes de datos y los
objetivos están claros. Transforma los datos en
información y la información en conocimiento. Las
empresas obtienen un aumento de la productividad.
Proporciona una comunicación fiable entre todos los
departamentos de la empresa. Permite conocer qué
está pasando en el negocio, es decir, estar siempre
enterado de los buenos y malos resultados.
CONCLUSIONES

 El concepto de Data Warehouse abarca mucho más que


simplemente copiar datos operacionales a una base de
datos informacional distinta. El sistema deberá ofrecer
una solución completa para gestionar y controlar el flujo
de información desde bases de datos corporativas y
fuentes externas a sistemas de soporte de decisiones de
usuarios finales. Además, debe permitir a los usuarios
conocer qué información existe en el almacén de datos, y
cómo poder acceder a ella y manipularla

También podría gustarte