Está en la página 1de 5

Mauricio Quintua 6to C Ingeniera de Sistemas

1
Temario
1. Definicin.
2. Objetivo
3. Qu es un Data WareHouse?
4. Importancia
5. Procesos de un Data Warehouse
Mauricio Quintua 6to C Ingeniera de Sistemas
2
6. Desarrollo gradual
7. Beneficios de un Data WareHouse
8. Cmo justificar la inversin en un DataWarehouse?
9. Ventajas y desventajas del DataWarehouse?
10. Tipos de usuarios de un DataWarehouse
11. Las razones bsicas de porque una organizacin implementa Data Warehouse:
12. Los procesos bsicos del Data WareHouse (ETL)
13. Los elementos bsicos de un Data WareHouse:
14. El Data Mining y su relacin con el Data Warehouse.
15. Caractersticas clave del Data Warehouse
16. Arquitectura del Data Warehouse
17. ESTRUCTURA DEL DATA WAREHOUSE
DataWareHouse
Definicin
El Data Warehouse es una coleccin de datos orientados al tema, integrados, no voltiles e historiados,
organizados para el apoyo de un proceso de ayuda a la decisin.
Objetivo
El objetivo del DW se expresa en trminos puramente de negocio como mantener la fidelidad de la
clientela
Que es un Data Warehouse?
Un Data Warehouse es un almacenamiento separado y homogneo donde son cargados datos
transformados provenientes de diferentes bases de datos.
Importancia
Un sistema de Data Warehouse permite transformar datos o informacin bruta en informacin
con sentido y extremadamente til.
Uno de los valores ms importantes de una organizacin es la informacin. Estos valores
normalmente son guardados por la empresa de dos formas:
Los sistemas operacionales de registros (de donde el Data Warehouse obtiene los datos) y
nuestro almacn de datos.
Procesos de un Data Warehouse
a) Extraccin: obtencin de informacin de las distintas fuentes tanto internas como externas.
b) Elaboracin: filtrado, limpieza, depuracin, homogeneizacin y agrupacin de la informacin.
c) Carga: organizacin y actualizacin de los datos y los metadatos en la base de datos.
d) Explotacin: extraccin y anlisis de la informacin en los distintos niveles de agrupacin.
Desde el punto de vista del usuario, el nico proceso visible es la explotacin del almacn de datos,
aunque el xito del Data Warehouse radica en los tres procesos iniciales que alimentan la informacin del
mismo y suponen el mayor porcentaje de esfuerzo (en torno a un 80%) a la hora de desarrollar el almacn.
Desarrollo gradual
1) Una de las claves del xito en la construccin de un Data Warehouse es el desarrollo de forma
gradual, seleccionando a un departamento usuario como piloto y expandiendo progresivamente el
almacn de datos a los dems usuarios.
Mauricio Quintua 6to C Ingeniera de Sistemas
3
2) Por ello es importante elegir este usuario inicial o piloto, siendo importante que sea un
departamento con pocos usuarios, en el que la necesidad de este tipo de sistemas es muy alta y se
puedan obtener y medir resultados a corto plazo.
Beneficios de un Data WareHouse
a) Proporciona una herramienta para la toma de decisiones en cualquier rea funcional, basndose
en informacin integrada y global del negocio.
b) Facilita la aplicacin de tcnicas estadsticas de anlisis y modelizacin para encontrar relaciones
ocultas entre los datos del almacn; obteniendo un valor aadido para el negocio de dicha
informacin.
c) Proporciona la capacidad de aprender de los datos del pasado y de
predecir situaciones futuras en diversos escenarios.
d) Simplifica dentro de la empresa la implantacin de sistemas de gestin
integral de la relacin con el cliente.
e) Supone una optimizacin tecnolgica y econmica en entornos de
Centro de Informacin, estadstica o de generacin de informes con
retornos de la inversin espectaculares
Cmo justificar la inversin en un data warehouse?
- Estn las ventas de artculos deportivos sujetas a tendencias por temporada?
Qu artculos se ven afectados y cundo?
- Cuntos autos se vendieron el mes pasado? Cmo se compara esta cantidad con el mismo mes en los
ltimos cinco aos?
- Quines son los diez primeros vendedores o clientes en Latinoamrica? Qu porcentaje del ingreso
generan?
- Cules son los diez artculos de menor rentabilidad en el catlogo de ventas?
Ventajas - Data Warehouse
a) Datos de toda la compaa, organizados para facilitar las consultas ms analticas que
transaccionales.
b) Los procesos de transformacin han sido aplicados a los datos para permitir un tiempo de
respuesta mnimo a las consultas.
c) Modelo de datos multidimensional para hacer ms fcil la navegacin y explotacin de datos.
d) La administracin de la seguridad est centralizada para garantizar la necesidad de informacin
dependiendo del perfil de los usuarios.
Desventajas:
a) No es muy til para la toma de decisiones en tiempo real debido al largo tiempo de
procesamiento que puede requerir.
b) Requiere de continua limpieza, transformacin e integracin de datos.
c) En un proceso de implantacin puede encontrarse dificultades ante los diferentes objetivos que
pretende una organizacin.
d) Una vez implantado puede ser complicado aadir nuevas fuentes de datos.
Tipos de usuarios de un DW:
1) Turistas
Mauricio Quintua 6to C Ingeniera de Sistemas
4
2) Exploradores
3) Labradores.
Las razones bsicas de porque una organizacin implementa Data Warehouse:
a) Para realizar tareas en los servidores y discos, asociados a queries y reportes en servidores y
discos que no son utilizados por sistemas de proceso de transacciones.
b) Para utilizar modelos de datos o tecnologas de servidores que agilizan los queries y reportes, y que
no son apropiados para los procesos de transacciones.
c) Para proveer un ambiente donde relativamente una muy poca cantidad de conocimiento de los
aspectos tcnicos de tecnologa de bases de datos es requerida para escribir y mantener queries y
reportes.
d) Para proveer un almacn del sistema de proceso de transacciones limpio que puede ser reportado y
que no necesariamente requiere que se arregle el sistema de proceso de transacciones.
e) Para hacer los queries y reportes de datos bsicamente ms fcil de los mltiples procesos de
transacciones y de las fuentes externas y de los datos que deben ser almacenados solamente para el
propsito de hacer queries y reportes.
Los procesos bsicos del Data WareHouse (ETL):
a) Extraccin: este es el primer paso de obtener la informacin hacia el ambiente del Data
Warehouse.
b) Transformacin: una vez que la informacin es extrada hacia el rea de trafico de datos, hay
posibles paso de transformacin como; limpieza de la informacin, tirar la basura que no nos sirve,
seleccionar nicamente los campos necesarios para el Data Warehouse, combinar fuentes de datos,
hacindolas coincidir por los valores de las llaves, creando nuevas llaves para cada registro de una
dimensin.
c) Carga: al final del proceso de transformacin, los datos estn en forma para ser cargados.
Los elementos bsicos de un Data WareHouse:
a) Sistema fuente: sistemas operacionales de registros donde sus funciones son capturar las
transacciones del negocio. A los sistemas fuentes tambin se le conoce como Legacy System.
b) rea de trfico de datos: es un rea de almacenamiento y grupo de procesos, que limpian
transforman, combinan, remover los duplicados, guardan, archivan y preparan los datos fuente para
ser usados en el Data Warehouse.
c) Servidor de presentacin: la maquina fsica en donde los datos del Data Warehouse son
organizados y almacenados para Queries directos por los usuarios finales, reportes y otras
aplicaciones.
d) Modelo dimensional: una disciplina especifica para el modelado de datos que es una alternativa
para los modelos de entidad relacin.
e) Data Warehouse system.
f) OLAP: actividad general de bsquedas para presentacin de texto y nmeros del Data WareHouse,
tambin un estilo dimensional especifico de bsquedas y presentacin de informacin.
g) ROLAP: un grupo de interfaces de usuarios y aplicaciones que le dan a la base de datos relacional
un estilo dimensional.
h) MOLAP: un grupo de interfaces de usuarios, aplicaciones y propietarios de tecnologa de bases
de datos que tienen un fuerte estilo dimensional.
i) Aplicaciones para usuarios finales: una coleccin de herramientas que hacen los queries, analizan
y presentan la informacin objetivo para el soporte de las necesidades del negocio.
Mauricio Quintua 6to C Ingeniera de Sistemas
5
El Data Mining y su relacin con el Data Warehouse.
Un sistema Data Mining es una tecnologa de soporte para usuario final cuyo objetivo es extraer
conocimiento til y utilizable a partir de la informacin contenida en las bases de datos de las
empresas.
Las herramientas de Data Mining sirven para predecir tendencias y comportamientos, de esta manera
permiten a las organizaciones tomar decisiones proactivas para adaptarse rpidamente a los cambios
del mercado obteniendo as ventajas heterogneas Bases de Datos relacionales, ficheros planos y
registros de transacciones en lnea.
El Data Warehouse dota a las organizaciones de memoria, y el Data Mining de inteligencia.
Cuatro caractersticas clave del Data Warehouse
1) Las evoluciones tecnolgicas
2) La vinculacin implcita con la estrategia de la empresa
3) Una lgica de mejora continua
4) Un nivel de madurez diferente segn las empresas
Arquitectura Data Warehouse
Base de datos operacional / Nivel de base de datos externo
Nivel de acceso a la informacin
Nivel de acceso a los datos
Nivel de directorio de datos (Metadata)
Nivel de gestin de proceso
Nivel de mensaje de la aplicacin
Nivel de data warehouse
Nivel de organizacin de datos
Estructura del data warehouse
a) Datos antiguos: La data antigua es aquella que se almacena sobre alguna forma de
almacenamiento masivo. No es frecuentemente accesada y se almacena a un nivel de detalle,
consistente con los datos detallados actuales.
b) Datos Actuales: Refleja las ocurrencias ms recientes, las cuales son de gran inters
c) Datos ligeramente resumidos: La data ligeramente resumida es aquella que proviene desde
un bajo nivel de detalle encontrado al nivel de detalle actual. Este nivel de la data warehouse
casi siempre se almacena en disco. Los puntos en los que se basa el diseador para
construirlo son:
d) Datos completamente resumidos: El siguiente nivel de datos encontrado en el data
warehouse es el de los datos completamente resumidos. Estos datos son compactos y
fcilmente accesibles.

También podría gustarte