Está en la página 1de 7

Captulo I Modelado Dimensional

En este primer captulo sentamos las bases para los estudios de casos que siguen. Comenzaremos dando un paso atrs para considerar el almacenamiento de datos de un macro perPrimerperspectiva. Algunos lectores pueden estar decepcionados al saber que no tiene que ver con herramientas y tcnicas-en primer lugar, el almacn de datos debe considerar las necesidades de la empresa. Iremos estacas en la tierra en relacin con los objetivos del almacn de datos, mientras que la observacin de las similitudes extraas entre las responsabilidades de un jefe de almacn de datos y los de un editor. Con este punto de vista el panorama general, vamos a explorar los principales componentes del entorno de almacenamiento, incluido el papel de los modelos normalizados. Por ltimo, vamos a cerrar mediante el establecimiento de vocabulario fundamental para el modelado tridimensional. Por Al final de este captulo, espero que usted tendr una apreciacin de la necesidad ser un medio DBA (administrador de base de datos) y la mitad MBA (analista de negocios) como a hacer frente a su almacn de datos. Captulo 1 se describen los siguientes conceptos: Negocios impulsados de un almacn de datos. Almacn publicacin de datos. Los componentes principales del almacn de datos global. Importancia de modelado tridimensional de los datos. rea de presentacin almacn. Realidad y terminologa tabla de dimensiones. Los mitos que rodean el modelado dimensional. Trampas de almacenamiento de datos comn para evitar.

Different Worlds Informacin


Uno de los activos ms importantes de cualquier organizacin es su informacin. Este bien casi siempre se mantuvo por una organizacin en dos formas: los operativos sistemas de registro y el almacenamiento de datos. Hablando crudamente, la operativa sistemas son donde se pone los datos en, y el almacn de datos es donde obtenemos la salida de datos. Los usuarios de un sistema operativo a su vez que las ruedas de la organizacin. Ellos tomar pedidos, registrar nuevos clientes y registrar las denuncias. Los usuarios de un sistema operativo casi siempre frente a un registro a la vez. Una y otra vez realizar las mismas tareas operativas y otra vez. Los usuarios de un almacn de datos, por otro lado, ver las ruedas de la organizacin a su vez. Cuentan los nuevos pedidos y los comparan con los de la semana pasada rdenes y preguntar por qu los nuevos clientes se inscribieron y lo que los clientes

quejado. Los usuarios de un almacn de datos casi nunca se ocupan de una fila a la vez. Ms bien, sus preguntas a menudo requieren que cientos o miles de filas se buscaron y se comprimen en un conjunto de respuestas. Para complicar an ms las cosas, los usuarios de un almacn de datos cambian continuamente el tipo de preguntas que piden. En la primera edicin de la Gua de almacenamiento de datos (Wiley 1996), Ralph Kimball dedica todo un captulo a describir la dicotoma entre el mundo de la procesamiento de operaciones y almacenamiento de datos. En este momento, es ampliamente reconocido que el almacn de datos tiene profundamente diferentes necesidades, clientes, estructuras y ritmos que los sistemas operativos de registro. Desafortunadamente, seguir encontrando supuestos almacenes de datos que son meras copias de los sistemas operativos de registro almacenado en una plataforma de hardware independiente. Mientras esto puede responder a la necesidad de aislar los entornos operativos y almacn por razones de rendimiento, no hace nada para abordar la otra inherente las diferencias entre estos dos tipos de sistemas. Los usuarios empresariales estn decepcionados por la facilidad de uso y el rendimiento que proporcionan estos datos pseudo-almacenes. Estos impostores hacen un flaco favor al almacenamiento de datos ya No reconocen que los usuarios de almacn tienen diversos requerimientos que los usuarios del sistema de operacin.

Objetivos de un almacn de datos


Antes de profundizar en los detalles de modelado y aplicacin, es til para centrarse en los objetivos fundamentales del almacn de datos. Los objetivos pueden ser desarrollados por caminar por los pasillos de cualquier organizacin y escuchar gestin empresarial. Inevitablemente, surgen estos temas recurrentes: "Tenemos montaas de datos en la empresa, pero no podemos acceder a l." "Tenemos que examinar minuciosamente los datos de todas las maneras." "Hay que hacer ms fcil para la gente de negocios para llegar a los datos directamente." "Slo quiero ver lo que es importante." "Me vuelve loco que dos personas presentan los mismos parmetros de negocio en una reunin, pero con diferentes nmeros. "Queremos que las personas usan la informacin para apoyar la toma de decisiones ms basada en los hechos hacer. Basndonos en nuestra experiencia, estas preocupaciones son tan universales que conducen a los requisitos lecho de roca para el almacn de datos. Vamos a convertir estas citas de gestin empresarial en los requisitos de almacenamiento de datos.

El almacn de datos debe hacer que la informacin de una organizacin de fcil acceso. El contenido del almacn de datos se debe ser comprensibles. Los datos deben ser intuitivo y obvio para el usuario de negocios, no solamente el desarrollador. Comprensibilidad implica la legibilidad, el contenido de los datos depsito necesita ser etiquetado significativa. Los usuarios de negocios quieren separar y combinar los datos en el almacn en combinaciones sin fin, un proceso comnmente referido como cortar y rebanar. Las herramientas que acceden al almacn de datos se deben ser simple y fcil de usar. Tambin deben volver resultados de la consulta al usuario con tiempos de espera mnimos. El almacn de datos debe presentar la informacin de la organizacin de forma coherente. Los datos en el almacn deben ser crebles. Los datos deben ser cuidadosamente ensamblado a partir de una variedad de fuentes de todo el organismo, limpios, calidad garantizada, y puesto en libertad slo cuando es apta para el consumo del usuario. Informacin de un proceso de negocio debe coincidir con la informacin de otro. Si dos medidas de desempeo tienen el mismo nombre, entonces debe significar la misma cosa. A la inversa, si dos medidas no significan lo mismo, entonces debe ser distinta. Informacin coherente medios de informacin de alta calidad. Esto significa que todos los datos se representaron y completa. La coherencia tambin implica que las definiciones comunes para el contenido del almacn de datos estn disponibles para los usuarios. El almacn de datos debe ser adaptable y flexible a los cambios. Simplemente no se puede evitar el cambio. Necesidades de los usuarios, las condiciones de negocio, datos y tecnologa. Todos estamos sujetos a las arenas movedizas del tiempo. El almacn de datos debe ser diseado para manejar este cambio inevitable. Los cambios en el almacn de datos deben ser elegante, lo que significa que no invalidan los datos existentes o aplicaciones. Los datos y las aplicaciones existentes no deben ser cambiados o interrumpido cuando la comunidad empresarial genera nuevas preguntas o nuevos datos se aade al almacn. Si los datos descriptivos en el almacn se modifican, hay que dar cuenta de los cambios adecuadamente. El almacn de datos debe ser un bastin seguro que protege nuestra informacin activos. Joyas de la corona de informacin de una organizacin se almacenan en los datos almacn. Como mnimo, el almacn probable es que contenga informacin acerca de lo que estamos vendiendo a quien ya qu precio-potencialmente daino detalles en las manos de la gente equivocada. El almacn de datos debe controlar efectivamente el acceso a la informacin confidencial de la organizacin.

El almacn de datos debe servir como base para una mejor toma decisiones. El almacn de datos debe tener los datos correctos para apoyar la toma de decisiones. Slo hay una salida verdadera de un almacn de datos: las decisiones que se toman despus de que el almacn de datos ha presentado su evidencia. Estas decisiones entregan el impacto en el negocio y el valor atribuido al almacn. La etiqueta original que precede al almacn de datos sigue siendo la mejor descripcin de lo que estamos diseando: un sistema de apoyo a las decisiones. La comunidad empresarial debe aceptar el almacn de datos si es que se considera exitosa. No importa que nosotros hemos construido una solucin elegante utilizando los mejores productos de su clase y plataformas. Si la comunidad empresarial tiene No abrazado el almacn de datos y seguido utilizando de forma activa seis meses despus de la capacitacin, entonces hemos fallado en la prueba de aceptacin. A diferencia de una reescritura del sistema operativo, los usuarios de negocios no tienen ms remedio que utilizar el nuevo sistema, el uso de almacn de datos es a veces opcional. Negocios aceptacin de los usuarios tiene ms que ver con la simplicidad que cualquier otra cosa. Como esta lista muestra, almacenamiento de datos exitosa exige mucho ms que ser un DBA estelar o tcnico. Con una iniciativa de almacenamiento de datos, tenemos un pie en nuestra tecnologa de la informacin (IT) zona de confort, mientras que nuestro otro pie est en el terreno desconocido de los usuarios de negocios. Debemos horcajadas sobre los dos, modificando algunos de nuestros juzgados y verdaderas habilidades para adaptarse a las demandas nicas de los datos almacenamiento. Est claro que tenemos que traer a un grupo de habilidades para el partido que se comporten como si furamos un DBA hbrido / MBA.

La metfora Publishing
Con los objetivos del almacn de datos como teln de fondo, vamos a comparar nuestras responsabilidades como administradores de los almacenes de datos con las de un redactor editorial inchief. Como editor de una revista de alta calidad, se le dara amplia libertad para administrar el contenido de la revista, el estilo y la entrega. Cualquier persona con este puesto de trabajo probablemente abordara las siguientes actividades: Identifique sus lectores demogrficamente. Averige lo que los lectores quieren en este tipo de revistas. Identificar las "mejores" los lectores que renueven sus suscripciones y compras productos de los anunciantes de la revista. Tambin podemos identificar los elementos que deben ser nongoals para el editor de la revista-inchief. Estos incluyen cosas tales como la construccin de la revista en todo el la tecnologa de la imprenta en particular, poniendo la energa de la gestin en

eficiencia operativa exclusivamente, imponiendo un estilo de redaccin tcnica que lectores no entienden fcilmente, o la creacin de un diseo intrincado y lleno de gente eso es difcil de leer y leer. Con la construccin de la industria editorial en una base de servicio de los lectores efectivamente, es probable que tenga xito su revista. Por el contrario, pasar por la lista e imaginar lo que sucede si se omite un artculo unitario, en ltima instancia, su revista tendra serios problemas. El punto de esta metfora, por supuesto, es dibujar el paralelo entre ser un editor convencional y de ser un jefe de almacn de datos. Estamos convencidos de que la descripcin del trabajo correcto para un jefe de almacn de datos es el editor de los datos correctos. Impulsados por las necesidades del negocio, almacenamiento de datos gerentes son responsables de la publicacin de datos que han sido recopilados a partir de una variedad de fuentes y editado por la calidad y consistencia. Su principal responsabilidad como jefe de almacn de datos es servir a sus lectores, tambin conocido como los usuarios de negocios. La metfora de la publicacin pone de relieve la necesidad de enfocar hacia el exterior a sus clientes en lugar de centrarse nicamente hacia el interior sobre los productos y procesos. Si va a utilizar la tecnologa para ofrecer su almacn de datos, el La tecnologa es, en el mejor medio para alcanzar un fin. Como tal, la tecnologa y las tcnicas que utiliza para construir sus almacenes de datos no deben aparecer directamente en sus responsabilidades principales de trabajo. Vamos refundicin responsabilidades de la revista de la editorial como responsabilidades gerente de almacn de datos: Entender sus usuarios por reas de negocio, las responsabilidades del trabajo y la tolerancia ordenador. Determinar las decisiones de los usuarios de negocio quieren hacer con la ayuda de el almacn de datos. Identificar las "mejores" que los usuarios toman decisiones eficaces y de alto impacto utilizando el almacn de datos. Encontrar nuevos usuarios potenciales y que sean conscientes del almacn de datos. Elija el, subgrupo procesable ms eficaz de los datos para presentar en el almacenamiento de datos, extrados de la gran universo de datos posibles en su organizacin. Hacer las interfaces de usuario y aplicaciones simples y basado en plantillas, a juego explcitamente a los perfiles de procesamiento cognitivo de los usuarios. Asegrese de que los datos sean exactos y se puede confiar, etiquetado de manera consistente en toda la empresa. monitorear continuamente la precisin de los datos y el contenido de la entregado informes. Bsqueda de nuevas fuentes de datos, y adaptar continuamente el almacn de datos

a la evolucin de los perfiles de datos, los requisitos de presentacin de informes, y las prioridades del negocio. Tomar una parte del crdito por las decisiones de negocios realizado con los datos almacn, y el uso de estos xitos para justificar la dotacin de personal, software y gastos de hardware. Publicar los datos en una base regular. Mantener la confianza de los usuarios de negocios. Mantenga sus usuarios de negocio, patrocinadores ejecutivos, y el jefe feliz. Si usted hace un buen trabajo con todas estas responsabilidades, que ser un gran de datos jefe de almacn! Por el contrario, desciende por la lista y imaginar lo que que pasa si se omite cualquier elemento individual. En ltima instancia, el almacn de datos sera tener problemas graves. Le instamos a contrastar esta visin de un almacn de datos El trabajo de director con su propia descripcin del trabajo. Es probable que la lista anterior se mucho ms orientado a temas de negocios y usuarios y puede que ni siquiera sonar como un trabajo en TI. En nuestra opinin, esto es lo que hace que el almacenamiento de datos interesantes.

Componentes de un Data Warehouse


Ahora que entendemos los objetivos de un almacn de datos, vamos a investigar los componentes que conforman un entorno de almacenamiento completo. Es de gran ayuda para entender las piezas cuidadosamente antes de comenzar la combinacin de ellos para crear un almacn de datos. Cada componente de almacn tiene una funcin especfica. Nosotros necesitan aprender la importancia estratgica de cada componente y cmo manejarla eficaz para ganar el juego de almacenamiento de datos. Una de las mayores amenazas a la xito data warehousing es confuso roles y funciones de los componentes. Como se ilustra en la Figura 1.1, hay cuatro componentes separados y distintos a considerar a medida que exploramos el almacn de datos entorno operativo sistemas de cdigo, datos, rea de presentacin de datos y herramientas de acceso a datos de parada.

Sistemas Operativos Fuente


Estos son los sistemas operativos de registro que captan las transacciones de la negocio. Los sistemas de origen deben ser considerados como fuera del almacn de datos, ya que supuestamente tenemos poco o ningn control sobre el contenido y formato de los datos en estos sistemas operativos antiguos. Las principales prioridades de los sistemas de origen estn procesando el rendimiento y la disponibilidad. Las consultas en sistemas de origen son estrechas, las consultas de un registroen-uno-tiempo que son parte del flujo de transacciones normales y rigurosamente

restringidos en sus demandas en el sistema operativo. Hacemos la fuerte presuncin de que los sistemas de origen no son consultados en los caminos anchos e inesperados que los almacenes de datos son tpicamente consultados. Los sistemas de origen mantienen pocos datos histricos, y si usted tiene un buen almacn de datos, los sistemas de cdigo se pueden aliviar gran parte de la responsabilidad de representar el pasado. Cada sistema de origen es a menudo una persona fsica aplicacin de copa, donde se ha hecho poca inversin para el intercambio de datos comunes, como producto, cliente, geografa, o el calendario con otros sistemas operativos en la organizacin. Sera muy bueno si sus sistemas de origen estaban siendo rediseado con una visin coherente. Tal aplicacin empresarial integracin de esfuerzo (EAI) har que la tarea de diseo de almacn de datos mucho ms fcil.

Figura 1.1

Elementos bsicos del almacenamiento de datos.

También podría gustarte