Está en la página 1de 13

UNIVERSIDAD ALAS PERUANAS

ESCUELA PROFESIONAL DE INGENIERA DE SISTEMAS E INFORMTICA

FACULTAD DE INGENIERAS Y ARQUITECTURA

TPICOS ESPECIALES DE INGENIERA DE SISTEMAS E INFORMTICA METODOLOGA RALPH KIMBAL


PRESENTADO POR: JOSU C. FLORES MAMANI AXEL N. GONZALES FIGUEROA ELVIS CARPIO JULCA MIGUEL PAY MAMANI DOCENTE: JOSE MIGUEL POCCO JILAPA AREQUIPA PER 2013

METODOLOGA RALPH KIMBAL METODOLOGA RALPH KIMBAL La metodologa se basa en lo que Kimball denomina Ciclo de Vida Dimensional del Negocio (Business Dimensional Lifecycle). Este ciclo de vida del proyecto de DW, est basado en cuatro principios bsicos: 1. Centrarse en el negocio: Hay que concentrarse en la identificacin de los requerimientos del negocio y su valor asociado, y usar estos esfuerzos para desarrollar relaciones slidas con el negocio, agudizando el anlisis del mismo y la competencia consultiva de los implementadores. 2. Construir una infraestructura de informacin adecuada: Disear una base de informacin nica, integrada, fcil de usar, de alto rendimiento donde se reflejar la amplia gama de requerimientos de negocio identificados en la empresa. 3. Realizar entregas en incrementos significativos: crear el almacn de datos (DW) en incrementos entregables en plazos de 6 a 12 meses. Hay que usa el valor de negocio de cada elemento identificado para determinar el orden de aplicacin de los incrementos. En esto la metodologa se parece a las metodologas giles de construccin de software. 4. Ofrecer la solucin completa: proporcionar todos los elementos necesarios para entregar valor a los usuarios de negocios. Para comenzar, esto significa tener un almacn de datos slido, bien diseado, con calidad probada, y accesible. Tambin se deber entregar herramientas de consulta ad hoc, aplicaciones para informes y anlisis avanzado, capacitacin, soporte, sitio web y documentacin. La construccin de una solucin de DW/BI (Datawarehouse/Business Intelligence) es compleja, y Kimball nos propone una metodologa que nos ayuda a simplificar esa complejidad. Las tareas de esta metodologa (ciclo de vida) se muestran en la figura.

TPICOS ESPECIALES DE ING. DE SIST. E INFORM.

METODOLOGA RALPH KIMBAL Primero, hay que resaltar el rol central de la tarea de definicin de requerimientos. Los requerimientos del negocio son el soporte inicial de las tareas subsiguientes. Tambin tiene influencia en el plan de proyecto (ntese la doble fecha entre la caja de definicin de requerimientos y la de planificacin). En segundo lugar podemos ver tres rutas o caminos que se enfocan en tres diferentes reas: Tecnologa (Camino Superior). Implica tareas relacionadas con software especfico, por ejemplo, Microsoft SQL Analysis Services. Datos (Camino del medio). En la misma disearemos e implementaremos el modelo dimensional, y desarrollaremos el subsistema de Extraccin, Transformacin y Carga (Extract, Transformation, and Load - ETL) para cargar el DW. Aplicaciones de Inteligencia de Negocios (Camino Inferior). En esta ruta se encuentran tareas en las que diseamos y desarrollamos las aplicaciones de negocios para los usuarios finales. Estas rutas se combinan cuando se instala finalmente el sistema. En la parte de debajo de la figura se muestra la actividad general de administracin del proyecto. FASES RALPH KIMBALL (para el desarrollo de un proyecto)

FASE METODOLOGA RALPH KIMBALL Planeacin del Proyecto. Requerimientos de Negocio Inciales. Diseo de Arquitectura Tcnica. Especificacin Aplicaciones Analticas. Seleccin e Instalacin del Producto. Modelamiento Dimensional. Diseo Fsico. Desarrollo de las Aplicaciones Analticas. Diseo de ETLs Despliegue. Mantenimiento y Crecimiento.

FASE DEL PROYECTO FASE I: Diagnostico de la situacin actual. FASE II: Diseo de la arquitectura tcnica.

FASE III: Diseo de Modelamiento dimensional. FASE IV: Definicin de estrategia de mantenimiento y crecimiento.

1. PLANIFICACIN DEL PROYECTO. En este proceso se determina el propsito del proyecto de DW/BI, sus objetivos especficos y el alcance del mismo, los principales riesgos y una aproximacin inicial a las necesidades de informacin. En la visin de programas y proyectos de Kimball, Proyecto, se refiere a una iteracin simple del KLC (Kimball Life Cycle), desde el lanzamiento hasta el despliegue. Esta tarea incluye las siguientes acciones tpicas de un plan de proyecto: Definir el alcance (entender los requerimientos del negocio). Identificar las tareas. Programar las tareas.
TPICOS ESPECIALES DE ING. DE SIST. E INFORM. 2

METODOLOGA RALPH KIMBAL Planificar el uso de los recursos. Asignar la carga de trabajo a los recursos. Elaboracin de un documento final que representa un plan del proyecto. Adems en esta parte definimos cmo realizar la administracin o gestin de esta subfase que es todo un proyecto en s mismo, con las siguientes actividades: Monitoreo del estado de los procesos y actividades. Rastreo de problemas. Desarrollo de un plan de comunicacin comprensiva que direccione la empresa y las reas de TI. 2. DEFINICIN DE REQUERIMIENTOS DEL NEGOCIO. La definicin de los requerimientos es en gran medida un proceso de entrevistar al personal de negocio y tcnico, pero siempre conviene tener un poco de preparacin previa. Se debe aprender tanto como se pueda sobre el negocio, los competidores, la industria y los clientes del mismo. Hay que leer todos los informes posibles de la organizacin; rastrear los documentos de estrategia interna; entrevistar a los empleados, analizar lo que se dice en la prensa acerca de la organizacin, la competencia y la industria. Se deben conocer los trminos y la terminologa del negocio. Parte del proceso de preparacin es averiguar a quin se debe realmente entrevistar. Esto normalmente implica examinar cuidadosamente el organigrama de la organizacin. Hay bsicamente cuatro grupos de personas con las que hablar desde el principio: el directivo responsable de tomar las decisiones estratgicas; los administradores intermedios y de negocio responsables de explorar alternativas estratgicas y aplicar decisiones; personal de sistemas, si existen, la gente que realmente sabe qu tipos de problemas informticos y de datos existen; y por ltimo, la gente que se necesita entrevistar por razones polticas. A partir de las entrevistas, podemos identificar temas analticos y procesos de negocio. Los temas analticos agrupan requerimientos comunes en un tema comn.

Tema Analtico

Anlisis o requerimiento inferido o pedido Anlisis histrico de ordenes de revendedores

Proceso de negocio de soporte Ordenes de compras

Comentarios Por cliente, por pas, por regin de ventas La proyeccin es un proceso de negocio que usa las rdenes como entradas

Planificacin de ventas Proyeccin de ventas

Ordenes de compras

TPICOS ESPECIALES DE ING. DE SIST. E INFORM.

METODOLOGA RALPH KIMBAL Por otra parte, a partir del anlisis se puede construir una herramienta de la metodologa denominada matriz de procesos/dimensiones (Bus Matrix en ingls). Una dimensin es una forma o vista o criterio por medio de cual se pueden sumariar, cruzar o cortar datos numricos a analizar, datos que se denominan medidas (measures en ingls). Las dimensiones pueden definir una amplia variedad de caractersticas, por ejemplo algunos de los atributos ms comunes definidos por tablas de dimensiones: Tablas de dimensin de tiempo describen el tiempo en el nivel ms bajo de granularidad de tiempo para que los eventos que son registrados en el esquema en estrella Tablas de dimensiones de geografa describen los datos de localizacin, como pas, estado o ciudad Tablas de dimensiones del producto, describir los productos Tablas de dimensin de empleados describen empleados, tales como vendedores Tablas de dimensiones estndar describen rangos de valores de tipo de moneda, u otras cantidades mensurables para simplificar los informes Las tablas de dimensiones generalmente se les asignan una clave sustituta primaria , por lo general una sola columna de tipo de datos entero, asigna a la combinacin de atributos de dimensin que forman la clave natural. Esta matriz tiene en sus filas los procesos del negocio identificados, y en las columnas, las dimensiones identificadas. Un ejemplo de esta matriz se puede observar en la tabla. Cada X en la interseccin de las filas y columnas significa que en el proceso de negocio de la fila seleccionada se identifican las dimensiones propuestas.

DIMENSIONES Proceso de Negocio Proyeccin de ventas Compras Control de Llamadas Tiempo X X X Producto X X X Empleados X X X Clientes (Revendedores) X X X Geografia de Ventas X X X Importes X X

TPICOS ESPECIALES DE ING. DE SIST. E INFORM.

METODOLOGA RALPH KIMBAL

Finalmente se busca priorizar los requerimientos o procesos de negocios ms crticos.

3. MODELADO DIMENSIONAL. La creacin de un modelo dimensional es un proceso dinmico y altamente iterativo. El proceso de diseo comienza con un modelo dimensional de alto nivel obtenido a partir de los procesos priorizados de la matriz descrita en el punto anterior. El proceso iterativo consiste en cuatro pasos: 1. Elegir el proceso de negocio. 2. Establecer el nivel de granularidad. 3. Elegir las dimensiones. 4. Identificar medidas y las tablas de hechos. 3.1. ELEGIR EL PROCESO DE NEGOCIO. El primer paso es elegir el rea a modelizar. Esta es una decisin de la direccin, y depende fundamentalmente del anlisis de requerimientos y de los temas analticos anotados en la etapa anterior. 3.2. ESTABLECER EL NIVEL DE GRANULARIDAD. La granularidad significa especificar el nivel de detalle. La eleccin de la granularidad depende de los requerimientos del negocio y lo que es posible a partir de los datos actuales. La sugerencia general es comenzar a disear el DW al mayor nivel de detalle posible, ya que se podra luego realizar agrupamientos al nivel deseado. En caso contrario no sera posible abrir (drill-down) las sumarizaciones en caso de que el nivel de detalle no lo permita.
TPICOS ESPECIALES DE ING. DE SIST. E INFORM. 5

METODOLOGA RALPH KIMBAL 3.3. ELEGIR LAS DIMENSIONES. Las dimensiones surgen naturalmente de las discusiones del equipo, y facilitadas por la eleccin del nivel de granularidad y de la matriz de procesos/dimensiones. Las tablas de dimensiones tienen un conjunto de atributos (generalmente textuales) que brindan una perspectiva o forma de anlisis sobre una medida en una tabla hechos. Una forma de identificar las tablas de dimensiones es que sus atributos son posibles candidatos para ser encabezado en los informes, tablas pivot, cubos, o cualquier forma de visualizacin, unidimensional o multidimensional. 3.4. IDENTIFICAR LAS TABLAS DE HECHOS Y MEDIDAS. El ltimo paso consiste en identificar las medidas que surgen de los procesos de negocios. Una medida es un atributo (campo) de una tabla que se desea analizar, sumarizando o agrupando sus datos, usando los criterios de corte conocidos como dimensiones. Las medidas habitualmente se vinculan con el nivel de granularidad del punto 2 y se encuentran en tablas que denominamos tablas de hechos (fact en ingls). Cada tabla de hechos tiene como atributos una o ms medidas de un proceso organizacional, de acuerdo a los requerimientos. Un registro contiene una medida expresada en nmeros, como ser cantidad, tiempo, dinero, etc., sobre la cual se desea realizar una operacin de agregacin (promedio, conteo, suma, etc.) en funcin de una o ms dimensiones. La granularidad es el nivel de detalle que posee cada registro de una tabla de hechos. Existen dos modelos dimensionales que predominan en las soluciones de bodegas de datos: A. MODELO ESTRELLA.

TPICOS ESPECIALES DE ING. DE SIST. E INFORM.

METODOLOGA RALPH KIMBAL B. MODELO COPO DE NIEVE.

MODELO GRFICO DE ALTO NIVEL.

4. DISEO FSICO. En el diseo fsico se deben incluir los nombres de columna fsicos, los tipos de los datos, las declaraciones de clave (si procede) y la posibilidad de incluir valores nulos. Contrariamente a la creencia general, aadir ms hardware no es la nica manera, ni la ms eficaz, de ajustar el rendimiento. La creacin de ndices y tablas agregadas son alternativas mucho ms rentables. En la figura se pueden observar las diferencias entre los modelos lgico y fsico.

TPICOS ESPECIALES DE ING. DE SIST. E INFORM.

METODOLOGA RALPH KIMBAL

Mientras que en el modelo lgico se definen los objetos o entidades, sus atributos, sus claves primarias y las relaciones entre dichas entidades atendiendo a consideraciones lgicas, en el modelo fsico se implementan estas estructuras de la manera ms eficiente desde el punto de vista de la mquina. Durante el proceso de diseo fsico se trasladan los esquemas lgicos previstos a las estructuras reales. En este momento hay que transformar las entidades en tablas, crear las relaciones entre las dimensiones y la tabla de hechos mediante claves ajenas, transformar atributos en columnas y transformar los identificadores nicos primarios y alternativos en claves primarias y alternativas. Ejemplo. Diseo fsico de la Dimensin Fecha.

5. DISEO E IMPLEMENTACIN DEL SUBSISTEMA ETL. Este el proceso en el cual se extrae y se alimenta el almacn de datos de la herramienta BI. Este proceso consume entre el 60% y 80% del tiempo de un proyecto Business Intelligence, por lo que es un proceso clave en la vida de todo proyecto. Cuando el nmero de fuentes de informacin que se utilizan para alimentar el almacn de datos de la herramienta es muy grande, se puede tornar complejo el proceso de extraccin de la informacin. El acceder a diferentes tipos de bases de datos implica manejar distintas habilidades y conocimientos en SQL, y puede complejizar la extraccin de datos si no se conoce el significado de cada uno de los elementos de la base de datos. Extraccin: Accin de obtener la informacin deseada a partir de los datos almacenados en fuentes externas. Se analizan los datos extrados para verificar si los datos cumplen la pauta o estructura que se esperaba, sino los datos son rechazados. Transformacin: La fase de transformacin aplica una serie de reglas de negocio o funciones sobre los datos extrados para convertirlos en datos que sern cargados. Algunas fuentes de datos requerirn alguna pequea manipulacin de los datos. La transformacin se encarga de las inconsistencias en los formatos de datos y la codificacin. Carga: Consiste en almacenar los datos en la base de datos final cuando los datos han sido transformados y validados.
TPICOS ESPECIALES DE ING. DE SIST. E INFORM. 8

METODOLOGA RALPH KIMBAL

6. DISEO DE LA ARQUITECTURA TCNICA. El plan de la arquitectura tcnica sirve como marco de organizacin para apoyar la integracin de las tecnologas. La arquitectura permite detectar los problemas a priori y trata de minimizar al comienzo del proyecto las sorpresas que pudieran surgir. Bases de la estructura de la arquitectura

Ejemplo. Arquitectura de proyecto de DM de seguimiento acadmico de alumnos universitarios

TPICOS ESPECIALES DE ING. DE SIST. E INFORM.

METODOLOGA RALPH KIMBAL 7. SELECCIN DE PRODUCTOS E IMPLEMENTACIN. Es bsicamente la instalacin del producto sobre el que se implementar el desarrollo que viene condicionada por el coste que el producto supone a la empresa. Compatibilidad de Base de Datos con Sistemas Operativos:
BBDD\SO DB2 MS SQL SERVER ORACLE Informix-Metacube WINDOWS SI SI SI SI MAC OS X SI NO SI SI LINUX SI NO SI SI UNIX SI NO SI SI

Propiedades DW de las herramientas:


CRITERIO \ HERRAMIENTA Soporte de BD/DW. Soporte a ETL. Soporte a OLAP. Soporte a Data Mining. Soporte Access a datos. Soporte a Reporting. Facilidad de Uso. Facilidad de Aprendizaje. Facilidad de integracin con otras herramientas. Coste de la Herramienta. Adaptabilidad a Proyectos. Facilidad de Administracin y Mantenimiento. MS SQL SERVER 7.0 ALTO ALTO ALTO NULO BAJO NULO ALTO ALTO ORACLE ALTO ALTO ALTO ALTO ALTO MEDIO BAJO BAJO DB2 ALTO MEDIO MEDIO ALTO BAJO NULO ALTO MEDIO InformixMetacube ALTO MEDIO ALTO ALTO ALTO MEDIO ALTO MEDIO

ALTO

ALTO

ALTO

ALTO

BAJO ALTO ALTO

ALTO ALTO BAJO

MEDIO ALTO ALTO

BAJO ALTO ALTO

TPICOS ESPECIALES DE ING. DE SIST. E INFORM.

10

METODOLOGA RALPH KIMBAL 8. ESPECIFICACIN Y DESARROLLO DE APLICACIONES BI. Una parte fundamental de todo proyecto de DW/BI est en proporcionarles a una gran comunidad de usuarios una forma ms estructurada y por lo tanto, ms fcil, de acceder al almacn de datos. Proporcionamos este acceso estructurado a travs de lo que llamamos aplicaciones de inteligencia de negocios (Business Intelligence Aplications). Las aplicaciones de BI son la cara visible de la inteligencia de negocios: los informes y aplicaciones de anlisis proporcionan informacin til a los usuarios. Las aplicaciones de BI incluyen un amplio espectro de tipos de informes y herramientas de anlisis, que van desde informes simples de formato fijo a sofisticadas aplicaciones analticas que usan complejos algoritmos e informacin del dominio. Kimball divide a estas aplicaciones en dos categoras basadas en el nivel de sofisticacin, y les llama informes estndar y aplicaciones analticas. A. INFORMES ESTNDAR. Son informes que los usuarios usan da a da. La mayor parte de lo que piden las personas durante el proceso de definicin de requisitos se clasificara como informes estndar. Por eso es conveniente desarrollar un conjunto de informes estndar en el ciclo de vida del proyecto. Algunos informes estndares tpicos podran ser: Ventas del ao actual frente a previsin de ventas por vendedor. Tasa de renovacin mensual por plan de servicio. Tasa quinquenal de desercin por unidad acadmica. Tasas de respuestas de correo electrnico por promocin por producto (marketing). Recuento de audiencia y porcentaje de la audiencia total por la red de televisin por da de la semana y hora del da (Sistema de marketing televisivo). Reclamos del ao actual hasta la fecha frente a previsin, por tipo de vehculo. Volumen de llamadas por producto como un porcentaje del total de ventas. B. APLICACIONES ANALTICAS. Las aplicaciones analticas son ms complejas que los informes estndar. Normalmente se centran en un proceso de negocio especfico y resumen cierta experiencia acerca de cmo analizar e interpretar ese proceso de negocio. Estas aplicaciones pueden ser muy avanzadas e incluir algoritmos y modelos de minera de datos, que ayudan a identificar oportunidades o cuestiones subyacentes en los datos. Otra caracterstica avanzada en algunas aplicaciones analticas es que el usuario puede pedir cambios en los sistemas transaccionales basndose en los conocimientos obtenidos del uso de la aplicacin de BI. En el otro extremo del espectro, algunas aplicaciones analticas se venden como soluciones cerradas o enlatados, y
TPICOS ESPECIALES DE ING. DE SIST. E INFORM. 11

METODOLOGA RALPH KIMBAL son independientes de las aplicaciones particulares de la empresa. Algunas aplicaciones analticas comunes incluyen: Anlisis de la eficacia de la promociones. Anlisis de rutas de acceso en un sitio Web. Anlisis de afinidad de programas. Planificacin del espacio en espacios comerciales. Deteccin de fraudes. Administracin y manejo de categoras de productos. 9. IMPLEMENTACIN. La implementacin representa la convergencia de la tecnologa, los datos y las aplicaciones de usuarios finales accesibles para el usuario del negocio. Hay varios factores extras que aseguran el correcto funcionamiento de todos estos elementos, entre ellos se encuentran la capacitacin, el soporte tcnico, la comunicacin y las estrategias de feedback. Todas estas tareas deben tenerse en cuenta antes de que cualquier usuario pueda tener acceso al DWH. 10. CRECIMIENTO Y MANTENIMIENTO. Como se remarca siempre, la creacin de un DWH es un proceso (de etapas bien definidas, con comienzo y fin, pero de naturaleza espiral) que acompaa a la evolucin de la organizacin durante toda su historia. Se necesita continuar con las actualizaciones de forma constante para poder seguir la evolucin de las metas por conseguir. Al contrario de los sistemas tradicionales, los cambios en el desarrollo deben ser vistos como signos de xito. Es importante establecer las prioridades para poder manejar los nuevos requerimientos de los usuarios y de esa forma poder evolucionar y crecer. Una vez que se ha construido e implantado el DWH no hay tiempo para el descanso, rpidamente debemos estar preparados para administrar el mantenimiento y crecimiento del mismo. Si bien las tareas pueden llegar a parecer similares a las tratadas en otras etapas del ciclo de vida, existe una diferencia clave: los usuarios estn ahora accediendo al DWH.

TPICOS ESPECIALES DE ING. DE SIST. E INFORM.

12

También podría gustarte