Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Vctor Jurez Cabrera Josu Ramrez Dvila Anael Humberto Fierros Caldern Eric Mendoza Olalde
13 de abril de 2011
Contenido
Introduccin. ................................................................................................................................. 3 Concepto. ...................................................................................................................................... 3 Funcin. ......................................................................................................................................... 4 Estructura. ..................................................................................................................................... 4 Elementos constituyentes de una Arquitectura Data Warehouse ................................................... 7 Base de datos operacional / Nivel de base de datos externo ...................................................... 7 Nivel de acceso a la informacin ................................................................................................ 8 Nivel de Directorio de Datos (Metadata) .................................................................................... 9 Nivel de Gestin de Procesos ..................................................................................................... 9 Nivel de Mensaje de la Aplicacin .............................................................................................. 9 Nivel Data Warehouse (Fsico) .................................................................................................... 9 Nivel de Organizacin de Datos ................................................................................................ 10 Operaciones en un Data Warehouse ............................................................................................ 10 a) Sistemas Operacionales........................................................................................................ 10 b) Extraccin, Transformacin y Carga de los Datos .................................................................. 10 c) Metadata ............................................................................................................................. 11 d) Acceso de usuario final......................................................................................................... 11 e) Plataforma del data warehouse............................................................................................ 11 f) Datos Externos ...................................................................................................................... 12 Conclusin. .................................................................................................................................. 13
Data Wareouse
Pgina 2
Introduccin.
En el presente documento se dar a conocer los beneficios que atrae el Almacn de datos, as como lo es su concepto de este, otro punto muy importante ser la arquitectura la cual se enfoca al almacn de datos. Tambin se darn a conocer los diferentes sistemas de almacn de datos como lo es el Esquema de estrella, copo de nueve y la constelacin. Es conveniente aclara que solo se dar una definicin muy abstracta ya que este tema es muy extenso, solo se darn los puntos ms importantes para que el lector tenga una idea de lo que se trata.
Concepto.
Almacn de datos (Data Warehouse).
Orientada al mbito informtico se enfoca a las empresas y a las organizaciones entre otros mbitos, no es voltil. Otro de los puntos ms importantes es que ayuda a la toma de decisiones en la entidad en la que se est utilizando. Se trata, sobre todo, de un expediente completo de una organizacin, ms all de la informacin transaccional y operacional, almacenado en una base de datos diseada para favorecer el anlisis y la divulgacin eficiente de datos (especialmente OLAP, procesamiento analtico en lnea).
La mayor diferencia entre la arquitectura de un almacn de datos y una base de datos OLTP estndar, conteniendo datos de los sistemas del planeamiento del recurso de la Data Wareouse Pgina 3
empresa (como SAP, CRM) es que en una estructura de bodega de datos las tablas estn de normalizadas entre variables y dimensiones. OLTP.- es la sigla en ingls de Procesamiento de Transacciones En Lnea (OnLine Transaction Processing) es un tipo de sistemas que facilitan y administran aplicaciones transaccionales, usualmente para entrada de datos y recuperacin y procesamiento de transacciones (gestor transaccional). Los paquetes de software para OLTP se basan en la arquitectura cliente-servidor ya que suelen ser utilizados por empresas con una red informtica distribuida.
Funcin.
Esta tecnologa lo que requiere es que los datos son muy necesario en una empresa y que estn almacenado en un repositorio de datos se conviertan en informacin til para el usuario final. Estos datos tienen que tener una buena consistencia y deben de estar disponibles en el momento en que sern utilizados. Con esta informacin se podrn crear consultas e informes sern de gran ayuda para los usuarios. Los datos estn distribuidos en una base de datos distribuida y peridicamente se importan al almacn de datos de distintos sistemas de planteamiento.
Estructura.
Data Wareouse Pgina 4
Data warehouse tiene una estructura muy particular y muy bien distribuida que se divide en niveles. Estos niveles son los siguientes: Nivel Detalle de actuales Detalle de antiguos Descripcin datos En gran parte, el inters ms importante radica en el detalle de los datos actuales. datos La data antigua es aquella que se almacena sobre alguna forma de almacenamiento masivo. No es frecuentemente acezada y se almacena a un nivel de detalle, consistente con los datos detallados actuales Datos ligeramente La data ligeramente resumida es aquella que proviene desde un bajo resumidos nivel de detalle encontrado al nivel de detalle actual. Este nivel del data warehouse casi siempre se almacena en disco. Datos El siguiente nivel de datos encontrado en el data warehouse es el de los completamente datos completamente resumidos. Estos datos son compactos y resumidos fcilmente accesibles. Metadata Se sita en una dimensin diferente al de otros datos del data warehouse, debido a que su contenido no es tomado directamente desde el ambiente operacional.
Data Wareouse
Pgina 5
Data Wareouse
Pgina 6
Data Wareouse
Pgina 7
Data Wareouse
Pgina 8
El nivel de acceso a los datos entonces es responsable de la interfaces entre las herramientas de acceso a la informacin y las bases de datos operacionales. En algunos casos, esto es todo lo que un usuario final necesita. Sin embargo, en general, las organizaciones desarrollan un plan mucho ms sofisticado para el soporte del data warehousing.
una vista lgica o virtual de datos. En muchos ejemplos, el data warehouse puede no involucrar almacenamiento de datos. En un data warehouse fsico, copias, en algunos casos, muchas copias de datos operacionales y/o externos, son almacenados realmente en una forma que es fcil de acceder y es altamente flexible. Cada vez ms, los data warehouses son almacenados sobre plataformas cliente/servidor, pero por lo general se almacenan sobre mainframes.
Data Wareouse
Pgina 10
Los mismos elementos de datos, si son usados por aplicaciones diferentes o administrados por diferentes software DBMS, pueden definirse al usar nombres de elementos inconsistentes, que tienen formatos inconsistentes y/o ser codificados de manera diferente. Todas estas inconsistencias deben resolverse antes que los elementos de datos sean almacenados en el data warehouse.
c) Metadata
Otro paso necesario es crear la metadata. La metadata (es decir, datos acerca de datos) describe los contenidos del data warehouse. La metadata consiste de definiciones de los elementos de datos en el depsito, sistema(s) del (os) elemento(s) fuente. Como la data, se integra y transforma antes de ser almacenada en informacin similar.
Data Wareouse
Pgina 11
El sistema de depsito ejecuta las consultas que se pasa a los datos por el software de acceso a los datos del usuario. Aunque un usuario visualiza las consultas desde el punto de vista de un GUI, las consultas tpicamente se formulan como pedidos SQL, porque SQL es un lenguaje universal y el estndar de hecho para el acceso a datos.
f) Datos Externos
Dependiendo de la aplicacin, el alcance del data warehouse puede extenderse por la capacidad de acceder a la data externa. Por ejemplo, los datos accesibles por medio de servicios de computadora en lnea (tales como CompuServe y America On Line) y/o va Internet, pueden estar disponibles a los usuarios del data warehouse. Evolucin del Depsito Construir un data warehouse es una tarea grande. No es recomendable emprender el desarrollo del data warehouse de la empresa como un proyecto cualquiera. Ms bien, se recomienda que los requerimientos de una serie de fases se desarrollen e implementen en modelos consecutivos que permitan un proceso de implementacin ms gradual e iterativo. No existe ninguna organizacin que haya triunfado en el desarrollo del data warehouse de la empresa, en un slo paso. Muchas, sin embargo, lo han logrado luego de un desarrollo paso a paso. Los pasos previos evolucionan conjuntamente con la materia que est siendo agregada. Los datos en el data warehouse no son voltiles y es un repositorio de datos de slo lectura (en general). Sin embargo, pueden aadirse nuevos elementos sobre una base regular para que el contenido siga la evolucin de los datos en la base de datos fuente, tanto en los contenidos como en el tiempo. Uno de los desafos de mantener un data warehouse, es idear mtodos para identificar datos nuevos o modificados en las bases de datos operacionales. Algunas maneras para identificar estos datos incluyen insertar fecha/tiempo en los registros de base de datos y entonces crear copias de registros actualizados y copiar informacin de los registros de transaccin y/o base de datos diarias. Estos elementos de datos nuevos y/o modificados son extrados, integrados, transformados y agregados al data warehouse en pasos peridicos programados. Como se aaden las nuevas ocurrencias de datos, los datos antiguos son eliminados. Por ejemplo, si los detalles de un sujeto particular se mantienen por 5 aos, como se agreg la ltima semana, la semana anterior es eliminada.
Data Wareouse
Pgina 12
Conclusin.
Vctor Jurez Cabrera. La verdad este tema me pareci muy interesante, mas por que se relaciona con las bases de datos. Me hubiera gustado que este tema lo u viramos profundizado mas y poder hacer un ejemplo real. Ojala que en un futuro lo podamos emplear en alguna situacin que se nos cruce. Por lo que vi es un tema muy extenso y creo que es muy competido. En lo personal creo que fue una buena experiencia. Josu Ramrez Dvila Con la realizacin de esta investigacin me he dado cuenta la amplia gama de tecnologas que existen ahora en da para una mejor administracin de las bases de datos distribuidas, ya que los datos se encuentran ms seguros. El concepto de DWH est teniendo una gran aplicacin en la actualidad para el desarrollo de las empresas, como almacn de datos. Sus objetivos incluyen la reduccin de los costes de almacenamiento y una mayor velocidad de respuesta frente a las consultas de los usuarios. Estos pueden ahora analizar y realizar preguntas sobre aos, ms que sobre meses de informacin.
Data Wareouse
Pgina 13