Documentos de Académico
Documentos de Profesional
Documentos de Cultura
En este primer captulo sentamos las bases para los estudios de casos que siguen. Comenzaremos dando un paso atrs para considerar el almacenamiento de datos de un macro perPrimerperspectiva. Algunos lectores pueden estar decepcionados al saber que no tiene que ver con herramientas y tcnicas-en primer lugar, el almacn de datos debe considerar las necesidades de la empresa. Iremos estacas en la tierra en relacin con los objetivos del almacn de datos, mientras que la observacin de las similitudes extraas entre las responsabilidades de un jefe de almacn de datos y los de un editor. Con este punto de vista el panorama general, vamos a explorar los principales componentes del entorno de almacenamiento, incluido el papel de los modelos normalizados. Por ltimo, vamos a cerrar mediante el establecimiento de vocabulario fundamental para el modelado tridimensional. Por Al final de este captulo, espero que usted tendr una apreciacin de la necesidad ser un medio DBA (administrador de base de datos) y la mitad MBA (analista de negocios) como a hacer frente a su almacn de datos. Captulo 1 se describen los siguientes conceptos: Negocios impulsados de un almacn de datos. Almacn publicacin de datos. Los componentes principales del almacn de datos global. Importancia de modelado tridimensional de los datos. rea de presentacin almacn. Realidad y terminologa tabla de dimensiones. Los mitos que rodean el modelado dimensional. Trampas de almacenamiento de datos comn para evitar.
quejado. Los usuarios de un almacn de datos casi nunca se ocupan de una fila a la vez. Ms bien, sus preguntas a menudo requieren que cientos o miles de filas se buscaron y se comprimen en un conjunto de respuestas. Para complicar an ms las cosas, los usuarios de un almacn de datos cambian continuamente el tipo de preguntas que piden. En la primera edicin de la Gua de almacenamiento de datos (Wiley 1996), Ralph Kimball dedica todo un captulo a describir la dicotoma entre el mundo de la procesamiento de operaciones y almacenamiento de datos. En este momento, es ampliamente reconocido que el almacn de datos tiene profundamente diferentes necesidades, clientes, estructuras y ritmos que los sistemas operativos de registro. Desafortunadamente, seguir encontrando supuestos almacenes de datos que son meras copias de los sistemas operativos de registro almacenado en una plataforma de hardware independiente. Mientras esto puede responder a la necesidad de aislar los entornos operativos y almacn por razones de rendimiento, no hace nada para abordar la otra inherente las diferencias entre estos dos tipos de sistemas. Los usuarios empresariales estn decepcionados por la facilidad de uso y el rendimiento que proporcionan estos datos pseudo-almacenes. Estos impostores hacen un flaco favor al almacenamiento de datos ya No reconocen que los usuarios de almacn tienen diversos requerimientos que los usuarios del sistema de operacin.
El almacn de datos debe hacer que la informacin de una organizacin de fcil acceso. El contenido del almacn de datos se debe ser comprensibles. Los datos deben ser intuitivo y obvio para el usuario de negocios, no solamente el desarrollador. Comprensibilidad implica la legibilidad, el contenido de los datos depsito necesita ser etiquetado significativa. Los usuarios de negocios quieren separar y combinar los datos en el almacn en combinaciones sin fin, un proceso comnmente referido como cortar y rebanar. Las herramientas que acceden al almacn de datos se deben ser simple y fcil de usar. Tambin deben volver resultados de la consulta al usuario con tiempos de espera mnimos. El almacn de datos debe presentar la informacin de la organizacin de forma coherente. Los datos en el almacn deben ser crebles. Los datos deben ser cuidadosamente ensamblado a partir de una variedad de fuentes de todo el organismo, limpios, calidad garantizada, y puesto en libertad slo cuando es apta para el consumo del usuario. Informacin de un proceso de negocio debe coincidir con la informacin de otro. Si dos medidas de desempeo tienen el mismo nombre, entonces debe significar la misma cosa. A la inversa, si dos medidas no significan lo mismo, entonces debe ser distinta. Informacin coherente medios de informacin de alta calidad. Esto significa que todos los datos se representaron y completa. La coherencia tambin implica que las definiciones comunes para el contenido del almacn de datos estn disponibles para los usuarios. El almacn de datos debe ser adaptable y flexible a los cambios. Simplemente no se puede evitar el cambio. Necesidades de los usuarios, las condiciones de negocio, datos y tecnologa. Todos estamos sujetos a las arenas movedizas del tiempo. El almacn de datos debe ser diseado para manejar este cambio inevitable. Los cambios en el almacn de datos deben ser elegante, lo que significa que no invalidan los datos existentes o aplicaciones. Los datos y las aplicaciones existentes no deben ser cambiados o interrumpido cuando la comunidad empresarial genera nuevas preguntas o nuevos datos se aade al almacn. Si los datos descriptivos en el almacn se modifican, hay que dar cuenta de los cambios adecuadamente. El almacn de datos debe ser un bastin seguro que protege nuestra informacin activos. Joyas de la corona de informacin de una organizacin se almacenan en los datos almacn. Como mnimo, el almacn probable es que contenga informacin acerca de lo que estamos vendiendo a quien ya qu precio-potencialmente daino detalles en las manos de la gente equivocada. El almacn de datos debe controlar efectivamente el acceso a la informacin confidencial de la organizacin.
El almacn de datos debe servir como base para una mejor toma decisiones. El almacn de datos debe tener los datos correctos para apoyar la toma de decisiones. Slo hay una salida verdadera de un almacn de datos: las decisiones que se toman despus de que el almacn de datos ha presentado su evidencia. Estas decisiones entregan el impacto en el negocio y el valor atribuido al almacn. La etiqueta original que precede al almacn de datos sigue siendo la mejor descripcin de lo que estamos diseando: un sistema de apoyo a las decisiones. La comunidad empresarial debe aceptar el almacn de datos si es que se considera exitosa. No importa que nosotros hemos construido una solucin elegante utilizando los mejores productos de su clase y plataformas. Si la comunidad empresarial tiene No abrazado el almacn de datos y seguido utilizando de forma activa seis meses despus de la capacitacin, entonces hemos fallado en la prueba de aceptacin. A diferencia de una reescritura del sistema operativo, los usuarios de negocios no tienen ms remedio que utilizar el nuevo sistema, el uso de almacn de datos es a veces opcional. Negocios aceptacin de los usuarios tiene ms que ver con la simplicidad que cualquier otra cosa. Como esta lista muestra, almacenamiento de datos exitosa exige mucho ms que ser un DBA estelar o tcnico. Con una iniciativa de almacenamiento de datos, tenemos un pie en nuestra tecnologa de la informacin (IT) zona de confort, mientras que nuestro otro pie est en el terreno desconocido de los usuarios de negocios. Debemos horcajadas sobre los dos, modificando algunos de nuestros juzgados y verdaderas habilidades para adaptarse a las demandas nicas de los datos almacenamiento. Est claro que tenemos que traer a un grupo de habilidades para el partido que se comporten como si furamos un DBA hbrido / MBA.
La metfora Publishing
Con los objetivos del almacn de datos como teln de fondo, vamos a comparar nuestras responsabilidades como administradores de los almacenes de datos con las de un redactor editorial inchief. Como editor de una revista de alta calidad, se le dara amplia libertad para administrar el contenido de la revista, el estilo y la entrega. Cualquier persona con este puesto de trabajo probablemente abordara las siguientes actividades: Identifique sus lectores demogrficamente. Averige lo que los lectores quieren en este tipo de revistas. Identificar las "mejores" los lectores que renueven sus suscripciones y compras productos de los anunciantes de la revista. Tambin podemos identificar los elementos que deben ser nongoals para el editor de la revista-inchief. Estos incluyen cosas tales como la construccin de la revista en todo el la tecnologa de la imprenta en particular, poniendo la energa de la gestin en
eficiencia operativa exclusivamente, imponiendo un estilo de redaccin tcnica que lectores no entienden fcilmente, o la creacin de un diseo intrincado y lleno de gente eso es difcil de leer y leer. Con la construccin de la industria editorial en una base de servicio de los lectores efectivamente, es probable que tenga xito su revista. Por el contrario, pasar por la lista e imaginar lo que sucede si se omite un artculo unitario, en ltima instancia, su revista tendra serios problemas. El punto de esta metfora, por supuesto, es dibujar el paralelo entre ser un editor convencional y de ser un jefe de almacn de datos. Estamos convencidos de que la descripcin del trabajo correcto para un jefe de almacn de datos es el editor de los datos correctos. Impulsados por las necesidades del negocio, almacenamiento de datos gerentes son responsables de la publicacin de datos que han sido recopilados a partir de una variedad de fuentes y editado por la calidad y consistencia. Su principal responsabilidad como jefe de almacn de datos es servir a sus lectores, tambin conocido como los usuarios de negocios. La metfora de la publicacin pone de relieve la necesidad de enfocar hacia el exterior a sus clientes en lugar de centrarse nicamente hacia el interior sobre los productos y procesos. Si va a utilizar la tecnologa para ofrecer su almacn de datos, el La tecnologa es, en el mejor medio para alcanzar un fin. Como tal, la tecnologa y las tcnicas que utiliza para construir sus almacenes de datos no deben aparecer directamente en sus responsabilidades principales de trabajo. Vamos refundicin responsabilidades de la revista de la editorial como responsabilidades gerente de almacn de datos: Entender sus usuarios por reas de negocio, las responsabilidades del trabajo y la tolerancia ordenador. Determinar las decisiones de los usuarios de negocio quieren hacer con la ayuda de el almacn de datos. Identificar las "mejores" que los usuarios toman decisiones eficaces y de alto impacto utilizando el almacn de datos. Encontrar nuevos usuarios potenciales y que sean conscientes del almacn de datos. Elija el, subgrupo procesable ms eficaz de los datos para presentar en el almacenamiento de datos, extrados de la gran universo de datos posibles en su organizacin. Hacer las interfaces de usuario y aplicaciones simples y basado en plantillas, a juego explcitamente a los perfiles de procesamiento cognitivo de los usuarios. Asegrese de que los datos sean exactos y se puede confiar, etiquetado de manera consistente en toda la empresa. monitorear continuamente la precisin de los datos y el contenido de la entregado informes. Bsqueda de nuevas fuentes de datos, y adaptar continuamente el almacn de datos
a la evolucin de los perfiles de datos, los requisitos de presentacin de informes, y las prioridades del negocio. Tomar una parte del crdito por las decisiones de negocios realizado con los datos almacn, y el uso de estos xitos para justificar la dotacin de personal, software y gastos de hardware. Publicar los datos en una base regular. Mantener la confianza de los usuarios de negocios. Mantenga sus usuarios de negocio, patrocinadores ejecutivos, y el jefe feliz. Si usted hace un buen trabajo con todas estas responsabilidades, que ser un gran de datos jefe de almacn! Por el contrario, desciende por la lista y imaginar lo que que pasa si se omite cualquier elemento individual. En ltima instancia, el almacn de datos sera tener problemas graves. Le instamos a contrastar esta visin de un almacn de datos El trabajo de director con su propia descripcin del trabajo. Es probable que la lista anterior se mucho ms orientado a temas de negocios y usuarios y puede que ni siquiera sonar como un trabajo en TI. En nuestra opinin, esto es lo que hace que el almacenamiento de datos interesantes.
restringidos en sus demandas en el sistema operativo. Hacemos la fuerte presuncin de que los sistemas de origen no son consultados en los caminos anchos e inesperados que los almacenes de datos son tpicamente consultados. Los sistemas de origen mantienen pocos datos histricos, y si usted tiene un buen almacn de datos, los sistemas de cdigo se pueden aliviar gran parte de la responsabilidad de representar el pasado. Cada sistema de origen es a menudo una persona fsica aplicacin de copa, donde se ha hecho poca inversin para el intercambio de datos comunes, como producto, cliente, geografa, o el calendario con otros sistemas operativos en la organizacin. Sera muy bueno si sus sistemas de origen estaban siendo rediseado con una visin coherente. Tal aplicacin empresarial integracin de esfuerzo (EAI) har que la tarea de diseo de almacn de datos mucho ms fcil.
Figura 1.1