Está en la página 1de 16

Captulo I: Fundamento Terico Corporacin Lindley S.A.

Sistemas de Informacin Estratgicos


1.1. Inteligencia de Negocios El trmino inteligencia de negocios se refiere al uso de datos en una empresa para facilitar la toma de decisiones. Abarca la comprensin del funcionamiento actual de la empresa, bien como la anticipacin de acontecimientos futuros, con el objetivo de ofrecer conocimientos para respaldar las decisiones empresariales. Las herramientas de inteligencia se basan en la utilizacin de un sistema de informacin de inteligencia que se forma con distintos datos extrados de los datos de produccin, con informacin relacionada con la empresa o sus mbitos y con datos econmicos. Mediante las herramientas y tcnicas ELT (extraer, cargar y transformar), o actualmente ETL (extraer, transformar y cargar) se extraen los datos de distintas fuentes, se depuran y preparan (homogeneizacin de los datos) para luego cargarlos en un almacn de datos. La vida o el periodo de xito de un software de inteligencia de negocios depender nicamente del nivel de xito del cual haga en beneficio de la empresa que lo usa, si esta empresa es capaz de incrementar su nivel financiero, administrativo y sus decisiones mejoran el accionar de la empresa, la inteligencia de negocios usada estar presente por mucho tiempo, de lo contrario ser sustituido por otro que aporte mejores resultados y ms precisos. Por ltimo, las herramientas de inteligencia analtica posibilitan el modelado de las representaciones con base en consultas para crear un cuadro de mando integral que sirve de base para la presentacin de informes. 1.2. Qu es Inteligencia de Negocios (Business Intelligence - BI)? La Inteligencia de Negocios o se puede definir como el proceso de analizar los bienes o datos acumulados en una empresa y extraer una cierta inteligencia o conocimiento de ellos. 1.2.1.- Propsito de la Inteligencia de Negocios BI apoya a los tomadores de decisiones con la informacin correcta, en el momento y lugar correcto, lo que les permite tomar mejores decisiones de negocios. La informacin adecuada en el lugar y momento adecuado incrementa efectividad de cualquier empresa. 1.2.2.- Componentes De Business Intelligence 1.2.2.1.- Multidimensionalidad. 1.2.2.2. - Data Mining. 1.2.2.3. - Agentes. 1.2.3.4. - Data Warehouse. 1.2.2.1- Multidimensionalidad. La informacin multidimensional se puede encontrar en hojas de clculo, bases de datos, etc. 1.2.2.2.- Data Mining. Las empresas suelen generar grandes cantidades de Informacin sobre sus procesos productivos, desempeo operacional, mercados y clientes. Las aplicaciones de data Mining pueden identificar tendencias y comportamientos, no slo para extraer informacin, sino tambin para descubrir las relaciones en bases de datos que pueden identificar comportamientos que no son muy evidentes.

Captulo I: Fundamento Terico Corporacin Lindley S.A. Sistemas de Informacin Estratgicos


1.2.2.3.- Agentes. Los agentes son programas que piensan. Ellos pueden realizar tareas a un nivel muy bsico sin necesidad de intervencin humana. 1.2.2.4.- Data Warehouse. Es la respuesta de la tecnologa de informacin a la descentralizacin en la toma de decisiones. Repositorio de datos organizacional.

1.2.3.-

Metodologa Para la Implementacin del Data Mart

1.2.3.1.- Metodologa Ralph Kimball. La metodologa de Ralph Kimball se enfoca principalmente en el diseo de la base de datos que almacenar la informacin para la toma de decisiones. El diseo se basa en la creacin de tablas de hechos, es decir, tablas que contengan la informacin numrica de los indicadores a analizar, o sea la informacin cuantitativa de la informacin para la toma de decisiones. Las tablas anteriores se relacionan con tablas de dimensiones, las cuales contienen la informacin cualitativa, de los indicadores, es decir, toda aquella informacin que clasifique la informacin requerida. A este modelo de datos se le conoce como diseo estrella, existen variaciones de ste llamados copo de nieve y diseo "flat". Todos estos diseos tienen la caracterstica de preparar la informacin de acuerdo a la necesidad de tomar decisiones y no a los argumentos tcnicos de espacio de almacenamiento.

1.2.3.2.- Fases Metodologa Ralph Kimball.

Captulo I: Fundamento Terico Corporacin Lindley S.A. Sistemas de Informacin Estratgicos

1. Planificacin del Proyecto La planificacin busca identificar la definicin y el alcance del proyecto de DWH, incluyendo las justificaciones del negocio y las evaluaciones de factibilidad. Esta etapa se concentra sobre la definicin del proyecto. Segn sentencia Kimball: Antes de comenzar un proyecto de data warehouse o data mart, hay que estar seguro si existe la demanda y de dnde proviene. Si no se tiene un usuario slido, posponga el proyecto. Como metodologa, en esta etapa propone identificar el alcance preliminar basndose en los requerimientos del negocio y no en fechas lmites, construyendo la justificacin del proyecto en trminos del negocio. A nivel de planificacin del proyecto se establece la identidad del mismo, el personal (los usuarios, gerentes del proyecto, equipo del proyecto), desarrollo del plan del proyecto, el seguimiento y la monitorizacin. 2. Definicin de los Requerimientos del Negocio Un factor determinante en el xito de un proceso de DWH es la interpretacin correcta de los diferentes niveles de requerimientos expresados por los distintos grupos de usuarios. La tcnica utilizada para revelar los requerimientos de los analistas del negocio difiere de los enfoques tradicionales guiados por los datos. Los diseadores de los DWH deben entender los factores claves que guan el negocio para determinar efectivamente los requerimientos y traducirlos en consideraciones de diseo apropiadas. Los usuarios finales y sus requerimientos impactan siempre en la implementacin de un DWH. Segn la perspectiva de Kimball, los requerimientos del negocio se posicionan en el centro del universo del Data Warehouse. Como destaca siempre el autor, los requerimientos del negocio deben determinar el alcance del DWH (qu datos debe contener, cmo deben estar organizados, cada cunto tiempo debe actualizarse, quines y desde dnde accedern, etc.). 3. Modelado Dimensional

Captulo I: Fundamento Terico Corporacin Lindley S.A. Sistemas de Informacin Estratgicos


La definicin de los requerimientos del negocio determina los datos necesarios para cumplir los requerimientos analticos de los usuarios. Disear los modelos de datos para soportar estos anlisis requiere un enfoque diferente al usado en los sistemas operacionales. Bsicamente, se comienza con una matriz donde se determina la dimensionalidad de cada indicador y luego se especifican los diferentes grados de detalle dentro de cada concepto del negocio, as como la granularidad de cada indicador y las diferentes jerarquas que dan forma al modelo dimensional del negocio (MDN) o mapa dimensional. 4. Diseo Fsico El diseo fsico de la base de datos se focaliza sobre la seleccin de las estructuras necesarias para soportar el diseo lgico. Un elemento principal de este proceso es la definicin de estndares del entorno de la base de datos. La indexacin y las estrategias de particionamiento se determinan tambin en esta etapa. En la estrategia de particionamiento o agregacin, el DWH tiene, y debe tener, todo el detalle de informacin en su nivel atmico. As, por poner algn ejemplo, en los sectores de telecomunicaciones o banca es habitual encontrarse con DWH con miles de millones de registros. Sin embargo, la mayora de consultas no necesitan acceder a un nivel de detalle demasiado profundo. Un jefe de producto puede estar interesado en los totales de venta de sus productos mes a mes, mientras que el jefe de rea consulta habitualmente la evolucin de ventas de sus zonas. Incluso con el uso de ndices, la compresin de las tablas, o con una inversin millonaria en hardware, estas consultas habituales deberan leer, agrupar y sumar decenas de millones de registros, lo que repercutira directamente en el tiempo de respuesta y en el descontento de los usuarios. Por tanto, muchas veces lo ms complicado ser realizar la correcta eleccin de las tablas agregadas necesarias. De nada sirve crear muchos agregados si estos no se utilizan, por lo que es necesario conocer las consultas habituales de los usuarios para hacer la seleccin de las tablas agregadas. La solucin ante estas situaciones pasa siempre por la preparacin de tablas agregadas. Estas tablas deben ser versiones reducidas de las dimensiones asociadas con la granularidad de la tabla de hechos y aaden los indicadores de las tablas de detalle aun nivel superior. Por ejemplo, las ventas podran pre calcularse a nivel mensual, o por cliente, o por producto. De esta manera, las consultas tpicas del jefe de producto o del jefe de rea podran ejecutarse en pocos segundos, sin necesidad de acceder a la tabla de ventas detalladas. La existencia de estas tablas agregadas debe ser completamente transparente para el usuario de negocio. Es decir, tanto el jefe de rea como el jefe de producto trabajarn con el indicador "Ventas", y la herramienta de BI har el resto. Por otro lado, en la estrategia de indexacin los ndices son estructuras opcionales optimizadas y orientadas a conjuntos de operaciones. Segn Ralph Kimball, las tablas de dimensin deben tener un nico ndice sobre las claves primarias y sera recomendable que el ndice estuviera compuesto de un nico atributo. Adems recomienda el uso de ndices de tipo rbol-B en atributos de alta cardinalidad y aplicarlos ndices de mapas de bits en atributos de cardinalidad media o baja. La clave principal de la tabla de hechos es casi siempre un subconjunto de las claves externas, de manera que se elegir un ndice concatenado de las principales dimensiones de la tabla de hechos y dado que muchas consultas tienen relacin con la dimensin fecha, sta debera liderar el ndice definido. Adems, el atributo fecha en la primera posicin permitir aumentar la velocidad de los procesos de carga de datos que se agrupan por fecha y, dado que la mayora de los optimizadores de consulta de los sistemas de gestin de bases de datos permiten que se utilice ms de un ndice a la hora de resolver una consulta, es posible construir diferentes ndices en las dems claves ajenas de la tabla de hechos. 5. Diseo y Desarrollo de la Presentacin de Datos

Captulo I: Fundamento Terico Corporacin Lindley S.A. Sistemas de Informacin Estratgicos


Esta etapa es tpicamente la ms subestimada de las tareas en un proyecto de DWH. Las principales actividades de esta fase del ciclo de vida son: la extraccin, la transformacin y la carga (ETL process). Se definen como procesos de extraccin aquellos requeridos para obtener los datos que permitirn efectuar la carga del Modelo Fsico diseado. As mismo, se definen como procesos de transformacin los procesos para convertir o recodificar los datos fuente a fin de poder efectuar la carga efectiva del Modelo Fsico. Por otra parte, los procesos de carga de datos son los procesos requeridos para poblar el DWH. Todas estas tareas son altamente crticas pues tienen que ver con la materia prima del DWH: los datos. La desconfianza y prdida de credibilidad del DWH provocar efectos inmediatos e inevitables si el usuario se encuentra con informacin inconsistente. Es por ello que la calidad de los datos es un factor determinante en el xito de un proyecto de DWH. Es en esta etapa donde deben sanearse todos los inconvenientes relacionados con la calidad de los datos fuente. Para cumplir con estas premisas es necesario tener en cuenta ciertos parmetros a la hora de desarrollar las tablas de dimensin y la tabla de hechos. 6. Diseo de la Arquitectura Tcnica Los entornos de DWH requieren la integracin de numerosas tecnologas. Se deben tener en cuenta tres factores: los requerimientos del negocio, los actuales entornos tcnicos y las directrices tcnicas y estratgicas futuras planificadas por la compaa para poder establecer el diseo de la arquitectura tcnica del entorno de DWH. Algunos equipos de trabajo no entienden las ventajas de una arquitectura y tienen la sensacin de que las tareas son demasiado opacas, por lo que entienden su diseo como una distraccin y un obstculo para el progreso del DWH, as que optan por omitir el diseo de la arquitectura. Sin embargo, hay otros equipos de trabajo que dedican un tiempo demasiado grande para el diseo arquitectnico. El autor Ralph Kimball recomienda no irse a ninguno de los dos extremos para hacerlo de una manera intermedia. Para ello propone un proceso de 8 pasos para asegurar un correcto diseo arquitectnico sin extenderse demasiado en el tiempo. Establecer un Grupo de Trabajo de Arquitectura: Es muy til disponer de un pequeo grupo de trabajo de dos a tres personas que se centren en el diseo de la arquitectura. Por lo general, es el arquitecto tcnico, trabajando con los datos de diseo, el que estar al frente de este grupo de trabajo. Este grupo necesita establecer sus estatutos y la lnea de prestaciones en el tiempo. Tambin es necesario educar al resto del equipo sobre la importancia de una arquitectura. Requisitos relacionados con la arquitectura La arquitectura se crea para apoyar las necesidades del negocio, la intencin no es comprar ms productos. En consecuencia, el elemento fundamental para el proceso de diseo de la arquitectura proviene de los requerimientos de negocio obtenidos en esa fase de definicin. El enfoque principal es descubrir las implicaciones arquitectnicas asociadas a las necesidades crticas del negocio, por lo que adems de aprovechar la definicin de los requisitos del proceso de negocio, tambin se llevan a cabo entrevistas adicionales dentro de la organizacin para comprender la normativa vigente dentro del marco tecnolgico, instrucciones tcnicas previstas y los lmites no negociables. Documento de requisitos arquitectnicos Una vez definidos los requerimientos de negocio y llevado a cabo las entrevistas suplementarias es momento de documentar las conclusiones. La forma de hacerlo ha de

Captulo I: Fundamento Terico Corporacin Lindley S.A. Sistemas de Informacin Estratgicos


ser sencilla pues el objetivo es tener una lista con cada requisito de negocio que tiene impacto en la arquitectura. Desarrollo de un modelo arquitectnico de alto nivel Una vez que los requisitos de la arquitectura se han documentado es hora de empezar a formular modelos para apoyar las necesidades identificadas. Para ello se dividen los equipos de trabajo segn los componentes principales, como el acceso a datos, metadatos y la infraestructura. A partir de aqu, los equipos definen y refinan el modelo arquitectnico de alto nivel. Diseo y especificacin de los subsistemas Una vez llegados a este punto es momento de hacer un diseo detallado de los subsistemas. Para cada componente, el grupo de trabajo disea una lista con las capacidades necesarias de dicho componente. Por otro lado se tienen en cuenta las necesidades de seguridad, as como la infraestructura fsica y las necesidades de configuracin. En algunos casos, las opciones de infraestructura, tales como el hardware del servidor y el software de base de datos, estn predeterminados por la propia empresa. El tamao, escalabilidad, rendimiento y flexibilidad son factores clave a considerar al determinar el papel de los cubos OLAP en el conjunto de la arquitectura tcnica. Determinar las fases de aplicacin de la Arquitectura Es probable que no se puedan poner en prctica todos los aspectos de la arquitectura tcnica a la vez. Algunos no son negociables, mientras que otros se pueden aplazar a una fecha posterior; stos, son los requisitos de negocios para establecer las prioridades de la arquitectura. Documento de la Arquitectura Tcnica Se debe de documentar la arquitectura tcnica, incluyendo las fases de la implementacin prevista. El documento de arquitectura incluir informacin adecuada de manera que los profesionales cualificados puedan proceder con la construccin del sistema. Revisar y finalizar la Arquitectura Tcnica El plan de la arquitectura se debe comunicar con diferentes niveles de detalle: equipo de proyecto, sponsor y director del proyecto. Tras la revisin, la documentacin debe ser actualizada y utilizada inmediatamente en el proceso de seleccin del producto.

7. Seleccin de Productos e Instalacin Utilizando el diseo de arquitectura tcnica como marco es necesario evaluar y seleccionar los componentes especficos de la arquitectura, como la plataforma de hardware, el motor de base de datos, la herramienta de ETL, las herramientas de acceso, etc. Una vez evaluados y seleccionados los componentes determinados se procede con la instalacin y prueba de los mismos en un ambiente integrado de DWH. Para ello es necesario tener en cuenta una serie de premisas que recomienda el autor de esta metodologa:

Captulo I: Fundamento Terico Corporacin Lindley S.A. Sistemas de Informacin Estratgicos


Comprender el proceso de compras corporativas. El primer paso antes de seleccionar nuevos productos es entender el hardware y el software interno, as como los procesos de aprobacin de compras por parte de la empresa. Los gastos deben ser aprobados por el departamento correspondiente de la empresa. Elaborar una matriz de evaluacin del producto. Con el plan de la arquitectura como punto de partida se desarrolla una matriz de evaluacin empleando, por ejemplo, hojas de clculo en donde se identificarn los criterios de evaluacin, junto con factores de ponderacin para indicar su importancia. Cuanto ms especfico sea el criterio, mejor. Estos criterios podran incluir la funcionalidad, arquitectura tcnica, caractersticas del software, impacto en las infraestructuras y viabilidad de los proveedores. Realizar investigacin de mercados. Los compradores deben estar informados cuando van a seleccionar los productos. Esto significa realizar una amplia investigacin del mercado para entender mejor a los vendedores y sus ofertas. La solicitud de informacin es una herramienta clsica de evaluacin de productos. Filtrar opciones y realizar evaluaciones ms detalladas. A pesar de la gran cantidad de productos disponibles en el mercado, slo un pequeo nmero de los proveedores pueden satisfacer tanto nuestras necesidad es tcnicas como de funcionalidad. Mediante la comparacin de resultados preliminares de la matriz de evaluacin, debemos agrupar en una lista los proveedores sobre los que tomaremos la decisin. Con la lista de proveedores seleccionados se debe realizar un proceso de evaluacin detallada, incluyendo si son posibles otras instalaciones de tamao similar sobre las que poder comparar a la hora de tomar una decisin. Manejo de un prototipo. Despus de realizar la evaluacin detallada, a veces hay un software ganador, a menudo basado en experiencias previas o relaciones con personal que provee el software. En muchas ocasiones, tambin puede surgir un producto debido a compromisos existentes con alguna de las empresas que oferta van. En cualquier caso, cuando un candidato nico aparece como la mejor opcin, podemos evitar el uso de un prototipo con el consiguiente ahorro de tiempo y dinero. Si, por el contrario no existe una eleccin clara una vez que se llega a este momento, se debera llevar a cabo un prototipo con no ms de dos productos, solicitando a los proveedores de software que proporcionen una solucin con un pequeo conjunto de datos de muestra. Seleccin del producto, instalacin y negociacin. A la hora de seleccionar un producto en lugar de firmar inmediatamente con el proveedor, es necesario un periodo perodo de prueba en el que se ha de tener la oportunidad de utilizar el producto en su entorno real. A medida que la prueba llega a su fin se tiene la oportunidad de negociar una compra beneficiosa para todas las partes implicadas. 8. Especificacin de Aplicaciones para Usuarios Finales

Captulo I: Fundamento Terico Corporacin Lindley S.A. Sistemas de Informacin Estratgicos


No todos los usuarios del DWH necesitan el mismo nivel de anlisis. Es por ello que en esta etapa se identifican los roles o perfiles de usuarios para los diferentes tipos de aplicaciones necesarias en base al alcance de los perfiles detectados (gerencial, analista del negocio, vendedor, etc.) 9. Desarrollo de Aplicaciones para Usuarios Finales A continuacin de la especificacin de las aplicaciones para usuarios finales, el desarrollo de las aplicaciones de los usuarios finales involucra configuraciones de los metadatos y construccin de reportes especficos. Los usuarios acceden al DWH por medio de herramientas de productividad basadas en GUI (Graphical User Interface). De hecho existen multitud de estas herramientas con las que proveer a los usuarios. Las herramientas pueden incluir software de consultas, generadores de reportes, procesamiento analtico en lnea o herramientas de Datamining dependiendo de los tipos de usuarios y sus requerimientos particulares. Sin embargo, una sola herramienta puede no satisfacer todos los requerimientos, por lo que quizs sea necesario la integracin de herramientas hechas bajo peticin expresa de los usuarios para satisfacer sus necesidades de consulta sobre el DWH. 10. Implementacin La implementacin representa la convergencia de la tecnologa, los datos y las aplicaciones de usuarios finales accesibles para el usuario del negocio. Hay varios factores extras que aseguran el correcto funcionamiento de todos estos elementos, entre ellos se encuentran la capacitacin, el soporte tcnico, la comunicacin y las estrategias de feedback. Todas estas tareas deben tenerse en cuenta antes de que cualquier usuario pueda tener acceso al DWH. 11. Mantenimiento y crecimiento Como se remarca siempre, la creacin de un DWH es un proceso (de etapas bien definidas, con comienzo y fin, pero de naturaleza espiral) que acompaa a la evolucin de la organizacin durante toda su historia. Se necesita continuar con las actualizaciones de forma constante para poder seguir la evolucin de las metas por conseguir. Al contrario de los sistemas tradicionales, los cambios en el desarrollo deben ser vistos como signos de xito. Es importante establecer las prioridades para poder manejar los nuevos requerimientos de los usuarios y de esa forma poder evolucionar y crecer. Una vez que se ha construido e implantado el DWH no hay tiempo para el descanso, rpidamente debemos estar preparados para administrar el mantenimiento y crecimiento del mismo. Si bien las tareas pueden llegar a parecer similares a las tratadas en otras etapas del ciclo de vida, existe una diferencia clave: Los usuarios estn ahora accediendo al DWH. 12. Gestin del Proyecto La gestin del proyecto asegura que las actividades del ciclo de vida se lleven a cabo de manera sincronizada. Como se indica en la figura 5, la gestin del proyecto acompaa todo el ciclo de vida. Entre sus actividades principales se encuentra la monitorizacin del estado del proyecto y el acoplamiento entre los requerimientos del negocio y las restricciones de los sistemas de informacin para poder manejar correctamente las expectativas en ambos sentidos.

Captulo I: Fundamento Terico Corporacin Lindley S.A. Sistemas de Informacin Estratgicos


1.3.- Herramientas 1.3.1.- Pentaho BI Pentaho BI Suite es un conjunto de programas libres para generar inteligencia empresarial (Business Intelligence). Incluye herramientas integradas para generar informes, minera de datos, ETL, etc. Estas soluciones al igual que su ambiente de implantacin estn basados en JAVA, hacindolo flexible en cubrir amplias necesidades empresariales. Las soluciones que Pentaho pretende ofrecer se componen fundamentalmente de una infraestructura de herramientas de anlisis e informes integrados con un motor de workflow de procesos de negocio. La plataforma ser capaz de ejecutar las reglas de negocio necesarias, expresadas en forma de procesos y actividades y de presentar y entregar la informacin adecuada en el momento adecuado. En su web presenta una organizacin por productos: Reporting, Anlisis, Dahsboards y Data Mining, acompaado por dos introducciones: a la plataforma y a los productos. En dichas introducciones se hace mencin especfica al workflow como una de las capacidades BI claves de la plataforma. Reporting Un mdulo de los informes ofrece la solucin adecuada a las necesidades de los usuarios. Pentaho Reporting es una solucin basada en el proyecto JFreeReport y permite generar informes gil y de gran capacidad. Pentaho Reporting permite la distribucin de los resultados del anlisis en mltiples formatos - todos los informes incluyen la opcin de imprimir o exportar a formato PDF, XLS, HTML y texto. Los reportes Pentaho permiten tambin programacin de tareas y ejecucin automtica de informes con una determinada periodicidad. Anlisis Pentaho Anlisis suministra a los usuarios un sistema avanzado de anlisis de informacin. Con uso de las tablas dinmicas (pivot tables, crosstabs), generadas por Mondrian y JPivot, el usuario puede navegar por los datos, ajustando la visin de los datos, los filtros de visualizacin, aadiendo o quitando los campos de agregacin. Los datos pueden ser representados en una forma de SVG o Flash, los dashboards widgets, o tambin integrados con los sistemas de minera de datos y los portales web (portlets). Adems, con el Microsoft Excel Analysis Services, se puede analizar los datos dinmicos en Microsoft Excel (usando la conexin a OLAP server Mondrian). Integracin de Datos Se realiza con una herramienta ETL (Pentaho Data Integration) que permite implementar los procesos ETL. ltimamente Pentaho lanz una nueva versin - PDI 3.0 que marc un gran paso adelante en OSBI ETL y que hizo Pentaho Data Integration una alternativa interesante para las herramientas comerciales. 1.3.2.- Schema Mondrian Workbench. La Mesa de trabajo de Mondrian del esquema es una interfaz de diseo que le permite crear y probar esquemas de cubo OLAP Mondrian visualmente. El motor de Mondrian procesa las solicitudes de MDX con los ROLAP (Relational OLAP) esquemas. Estos archivos de esquema XML de metadatos son los modelos que se crean en una estructura especfica utilizada por el motor de Mondrian. Estos modelos XML puede ser considerado

Captulo I: Fundamento Terico Corporacin Lindley S.A. Sistemas de Informacin Estratgicos


como el cubo de las estructuras que utilizan HECHO existente y tablas de dimensiones que se encuentran en su RDBMS. No se requiere que un cubo de fsica real se construye o mantiene, slo que el modelo de metadatos se crea. Como en todas las herramientas de Pentaho, en primer lugar hemos de definir las conexiones a base de datos como paso previo a la configuracin de los esquemas. Adems, hemos de colocar el driver jdbc en el directorio drivers que cuelga de la instalacin de PSW. En nuestro caso, hemos configurado la conexin con Oracle de la siguiente manera:

En primer lugar, procederemos a crear el Esquema. Un esquema es un contenedor de cubos (tendr un nico fichero XML), donde podremos crear tantos cubos como deseemos. Las propiedades que se pueden indicar al crear un esquema son un nombre, la descripcin, un nombre para la dimensin que agrupara a las medidas y un rol por defecto para utilizar en las conexiones de base de datos. Como ayuda en este momento y en la creacin del resto de elementos, podemos poner el ratn en el nombre del atributo a definir, y nos aparecer un texto explicativo de este (tal y como veis en la imagen siguiente).

Una vez creado el esquema, procederemos a la creacin de los Cubos, aunque previamente hemos de hacer una consideracin. En cada cubo, podemos definir la

10

Captulo I: Fundamento Terico Corporacin Lindley S.A. Sistemas de Informacin Estratgicos


estructura de tabla de hechos, medidas, miembros calculados y dimensiones. La dimensiones y sus jerarquas podemos definirlas dentro de cada cubo, o crearlas de una forma general dentro del esquema, y luego utilizarlas en los cubos que nos interesen. Esto nos evita tener que definir varias veces lo mismo para cada uno de los cubos, as como reutilizar elementos ya definidos que se tratan en varios cubos. Esta ser mi eleccin de diseo. Por tanto, antes de crear los cubos vamos a crear las dimensiones compartidas con sus correspondientes jerarquas. Creacin de dimensiones compartidas. Para aadir las dimensiones, seleccionaremos el esquema y pulsaremos la opcin Add Dimension. Le daremos un nombre significativo a la dimensin, y seleccionaremos su tipo (TimeDimension en este caso) y una descripcin.

A continuacin, iremos creando las diferentes jerarquas que tenga la dimensin. Por ejemplo, en nuestra dimensin tiempo tenemos la jerarquas: Ao Mes Da, Semana Da, Ao Trimestre Mes Da, etc. Como veis, podemos tener tantas jerarquas como deseemos. Las jerarquas son los niveles de anlisis y detalle de la informacin de nuestro modelo dimensional, que luego nos permitirn realizar el anlisis y la navegacin por los datos utilizando Mondrian. En cada jerarqua, indicaremos una serie de parmetros (importantes el hasAll, si queremos que haya un agrupador de todos los valores de la jerarqua, y su descripcin en el caso de que este marcado (allMemberName)). Igualmente importante la clave de la jerarqua y una descripcin que luego nos aparecer al configurar la ejecucin del cubo.

11

Captulo I: Fundamento Terico Corporacin Lindley S.A. Sistemas de Informacin Estratgicos

Para cada jerarqua, indicaremos una tabla de la dimensin, y a continuacin iremos creando los diferentes Niveles (levels) que componen la jerarqua. Para cada nivel, iremos indicando la columna de la base de datos que la describe, el tipo de datos, el tipo de nivel, la columna que contiene la descripcin, etc. Esto lo realizaremos para cada uno de los niveles de la jerarqua. El orden con el que vamos crendolos determina la estructura de la jerarqua.

Podemos tener tantas jerarquas como sea necesario dentro de la dimensin. Luego podremos utilizar la que deseemos a la hora de realizar los anlisis (la primera ser la jerarqua por defecto). Una vez concluido el diseo de todas las dimensiones con sus correspondientes jerarquas, ya podemos proceder a la creacin de los cubos. Creacin de Cubos.

12

Captulo I: Fundamento Terico Corporacin Lindley S.A. Sistemas de Informacin Estratgicos


Al crear el Cubo, le indicaremos un nombre y una descripcin, pudiendo marcar adems las opciones cache (para que Mondrian trabaje con cache en este cubo) y la opcin enabled (para que el cubo sea visible. Sino est marcado este flag, el cubo no aparecer). A

continuacin, seleccionaremos la Tabla de Hechos del cubo (a partir de la cual podremos calcular las medidas o indicadores). Antes de proceder a crear las medidas, seleccionaremos las dimensiones que queremos incluir en el cubo, con la opcin Add Dimension Usage. Incluiremos todas las dimensiones necesarias (de las compartidas que hemos creado antes). El cubo hereda todas las caractersticas que hayamos incluido en la dimensin, incluyendo todas las jerarquas y sus correspondientes atributos. Como ltimo paso en la creacin del cubo, nos tocar definir las Medidas, que van a ser los valores de anlisis. Tenemos aquellas que se calculan directamente con campos de la base de datos, y los Miembros Calculados, que son formulas en las que utilizamos otras medidas. Los atributos que podemos indicar para las Medidas son su nombre, descripcin, funcin de agregacin (suma, media, valor mximo, valor mnimo, contador, etc.), la columna que genera la medida, si es visible o no (puede interesar que campos intermedios que se utilizan para otras medidas no se vean), tipo de datos, formato y caption (nombre que aparecer cuando lo utilicemos).

13

Captulo I: Fundamento Terico Corporacin Lindley S.A. Sistemas de Informacin Estratgicos

1.3.3.- MySql MySql es una base de datos muy rpida en la lectura cuando utiliza el motor no transaccional Misan, pero puede provocar problemas de integridad en entornos de alta concurrencia en la modificacin. En aplicaciones web hay baja concurrencia en la modificacin de datos y en cambio el entorno es intensivo en lectura de datos, lo que hace a MySql ideal para este tipo de aplicaciones. Sea cual sea el entorno en el que va a utilizar MySql, es importante monitorizar de antemano el rendimiento para detectar y corregir errores tanto de SQL como de programacin. Misal funciona sobre mltiples plataformas, incluyendo: AIX, BSD, Fresad, HP-UX, Kurisu O, GNU/Linux, Mac OS X, NetBSD, Novell Netware, OpenBSD, OS/2 Warp, QNX, SGI IRIX, Solaris, SunOS, SCO OpenServer, SCO UnixWare, Tru64, eBD, Windows 95, Windows 98, Windows NT, Windows 2000, Windows XP, Windows Vista, Windows 7 y Windows Server (2000, 2003 y 2008), OpenVMS10.

14

Captulo I: Fundamento Terico Corporacin Lindley S.A. Sistemas de Informacin Estratgicos


Caractersticas Inicialmente, MySQL careca de elementos considerados esenciales en las bases de datos relacionales, tales como integridad referencial y transacciones. A pesar de ello, atrajo a los desarrolladores de pginas web con contenido dinmico, justamente por su simplicidad. Poco a poco los elementos de los que careca MySQL estn siendo incorporados tanto por desarrollos internos, como por desarrolladores de software libre. Entre las caractersticas disponibles en las ltimas versiones se puede destacar: Amplio subconjunto del lenguaje SQL. Algunas extensiones son incluidas igualmente. Disponibilidad en gran cantidad de plataformas y sistemas. Posibilidad de seleccin de mecanismos de almacenamiento que ofrecen diferente velocidad de operacin, soporte fsico, capacidad, distribucin geogrfica, transacciones... Transacciones y claves forneas. Conectividad segura. Replicacin. Bsqueda e indexacin de campos de texto. MySQL es un sistema de administracin de bases de datos. Una base de datos es una coleccin estructurada de tablas que contienen datos. Esta puede ser desde una simple lista de compras a una galera de pinturas o el vasto volumen de informacin en una red corporativa. Para agregar, acceder a y procesar datos guardados en un computador, usted necesita un administrador como MySQL Server. Dado que los computadores son muy buenos manejando grandes cantidades de informacin, los administradores de bases de datos juegan un papel central en computacin, como aplicaciones independientes o como parte de otras aplicaciones. MySQL es un sistema de administracin relacional de bases de datos. Una base de datos relacional archiva datos en tablas separadas en vez de colocar todos los datos en un gran archivo. Esto permite velocidad y flexibilidad. Las tablas estn conectadas por relaciones definidas que hacen posible combinar datos de diferentes tablas sobre pedido. MySQL es software de fuente abierta. Fuente abierta significa que es posible para cualquier persona usarlo y modificarlo. Cualquier persona puede bajar el cdigo fuente de MySQL y usarlo sin pagar. Cualquier interesado puede estudiar el cdigo fuente y ajustarlo a sus necesidades. MySQL usa el GPL (GNU General Public License) para definir qu puede hacer y que no puede hacer con el software en diferentes situaciones. Si usted no se ajusta al GPL o requiere introducir cdigo MySQL en aplicaciones comerciales, usted puede comprar una versin comercial licenciada 1.3.4.- QlikView QlikTech es el proveedor de QlikView, una solucin de inteligencia de negocios que ofrece la empresa de anlisis y bsqueda. Su tecnologa de bsqueda asociativa realiza clculos en tiempo real, permitiendo a los profesionales de negocios, ganar la penetracin a travs de exploraciones intuitivas de datos. QlikView pueden ser desplegadas en las instalaciones, en la nube, o en un ordenador porttil o dispositivo mvil de un usuario nico hasta una empresa global de gran tamao. QlikView le permite entender a fondo su negocio de una manera completamente nueva:

15

Captulo I: Fundamento Terico Corporacin Lindley S.A. Sistemas de Informacin Estratgicos


Consolidando datos tiles procedentes de mltiples fuentes en una sola aplicacin Explorando las asociaciones entre los datos Permitiendo una toma de decisiones social a travs de una colaboracin segura y en tiempo real Visualizando los datos con unos grficos atractivos y tecnolgicamente avanzados Buscando en la totalidad de datos, de forma directa e indirecta Interactuando con aplicaciones, cuadros de mando y anlisis interactivos Accediendo, analizando y capturando datos de dispositivos mviles

16

También podría gustarte