Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1.2.3.-
1.2.3.1.- Metodologa Ralph Kimball. La metodologa de Ralph Kimball se enfoca principalmente en el diseo de la base de datos que almacenar la informacin para la toma de decisiones. El diseo se basa en la creacin de tablas de hechos, es decir, tablas que contengan la informacin numrica de los indicadores a analizar, o sea la informacin cuantitativa de la informacin para la toma de decisiones. Las tablas anteriores se relacionan con tablas de dimensiones, las cuales contienen la informacin cualitativa, de los indicadores, es decir, toda aquella informacin que clasifique la informacin requerida. A este modelo de datos se le conoce como diseo estrella, existen variaciones de ste llamados copo de nieve y diseo "flat". Todos estos diseos tienen la caracterstica de preparar la informacin de acuerdo a la necesidad de tomar decisiones y no a los argumentos tcnicos de espacio de almacenamiento.
1. Planificacin del Proyecto La planificacin busca identificar la definicin y el alcance del proyecto de DWH, incluyendo las justificaciones del negocio y las evaluaciones de factibilidad. Esta etapa se concentra sobre la definicin del proyecto. Segn sentencia Kimball: Antes de comenzar un proyecto de data warehouse o data mart, hay que estar seguro si existe la demanda y de dnde proviene. Si no se tiene un usuario slido, posponga el proyecto. Como metodologa, en esta etapa propone identificar el alcance preliminar basndose en los requerimientos del negocio y no en fechas lmites, construyendo la justificacin del proyecto en trminos del negocio. A nivel de planificacin del proyecto se establece la identidad del mismo, el personal (los usuarios, gerentes del proyecto, equipo del proyecto), desarrollo del plan del proyecto, el seguimiento y la monitorizacin. 2. Definicin de los Requerimientos del Negocio Un factor determinante en el xito de un proceso de DWH es la interpretacin correcta de los diferentes niveles de requerimientos expresados por los distintos grupos de usuarios. La tcnica utilizada para revelar los requerimientos de los analistas del negocio difiere de los enfoques tradicionales guiados por los datos. Los diseadores de los DWH deben entender los factores claves que guan el negocio para determinar efectivamente los requerimientos y traducirlos en consideraciones de diseo apropiadas. Los usuarios finales y sus requerimientos impactan siempre en la implementacin de un DWH. Segn la perspectiva de Kimball, los requerimientos del negocio se posicionan en el centro del universo del Data Warehouse. Como destaca siempre el autor, los requerimientos del negocio deben determinar el alcance del DWH (qu datos debe contener, cmo deben estar organizados, cada cunto tiempo debe actualizarse, quines y desde dnde accedern, etc.). 3. Modelado Dimensional
7. Seleccin de Productos e Instalacin Utilizando el diseo de arquitectura tcnica como marco es necesario evaluar y seleccionar los componentes especficos de la arquitectura, como la plataforma de hardware, el motor de base de datos, la herramienta de ETL, las herramientas de acceso, etc. Una vez evaluados y seleccionados los componentes determinados se procede con la instalacin y prueba de los mismos en un ambiente integrado de DWH. Para ello es necesario tener en cuenta una serie de premisas que recomienda el autor de esta metodologa:
En primer lugar, procederemos a crear el Esquema. Un esquema es un contenedor de cubos (tendr un nico fichero XML), donde podremos crear tantos cubos como deseemos. Las propiedades que se pueden indicar al crear un esquema son un nombre, la descripcin, un nombre para la dimensin que agrupara a las medidas y un rol por defecto para utilizar en las conexiones de base de datos. Como ayuda en este momento y en la creacin del resto de elementos, podemos poner el ratn en el nombre del atributo a definir, y nos aparecer un texto explicativo de este (tal y como veis en la imagen siguiente).
Una vez creado el esquema, procederemos a la creacin de los Cubos, aunque previamente hemos de hacer una consideracin. En cada cubo, podemos definir la
10
A continuacin, iremos creando las diferentes jerarquas que tenga la dimensin. Por ejemplo, en nuestra dimensin tiempo tenemos la jerarquas: Ao Mes Da, Semana Da, Ao Trimestre Mes Da, etc. Como veis, podemos tener tantas jerarquas como deseemos. Las jerarquas son los niveles de anlisis y detalle de la informacin de nuestro modelo dimensional, que luego nos permitirn realizar el anlisis y la navegacin por los datos utilizando Mondrian. En cada jerarqua, indicaremos una serie de parmetros (importantes el hasAll, si queremos que haya un agrupador de todos los valores de la jerarqua, y su descripcin en el caso de que este marcado (allMemberName)). Igualmente importante la clave de la jerarqua y una descripcin que luego nos aparecer al configurar la ejecucin del cubo.
11
Para cada jerarqua, indicaremos una tabla de la dimensin, y a continuacin iremos creando los diferentes Niveles (levels) que componen la jerarqua. Para cada nivel, iremos indicando la columna de la base de datos que la describe, el tipo de datos, el tipo de nivel, la columna que contiene la descripcin, etc. Esto lo realizaremos para cada uno de los niveles de la jerarqua. El orden con el que vamos crendolos determina la estructura de la jerarqua.
Podemos tener tantas jerarquas como sea necesario dentro de la dimensin. Luego podremos utilizar la que deseemos a la hora de realizar los anlisis (la primera ser la jerarqua por defecto). Una vez concluido el diseo de todas las dimensiones con sus correspondientes jerarquas, ya podemos proceder a la creacin de los cubos. Creacin de Cubos.
12
continuacin, seleccionaremos la Tabla de Hechos del cubo (a partir de la cual podremos calcular las medidas o indicadores). Antes de proceder a crear las medidas, seleccionaremos las dimensiones que queremos incluir en el cubo, con la opcin Add Dimension Usage. Incluiremos todas las dimensiones necesarias (de las compartidas que hemos creado antes). El cubo hereda todas las caractersticas que hayamos incluido en la dimensin, incluyendo todas las jerarquas y sus correspondientes atributos. Como ltimo paso en la creacin del cubo, nos tocar definir las Medidas, que van a ser los valores de anlisis. Tenemos aquellas que se calculan directamente con campos de la base de datos, y los Miembros Calculados, que son formulas en las que utilizamos otras medidas. Los atributos que podemos indicar para las Medidas son su nombre, descripcin, funcin de agregacin (suma, media, valor mximo, valor mnimo, contador, etc.), la columna que genera la medida, si es visible o no (puede interesar que campos intermedios que se utilizan para otras medidas no se vean), tipo de datos, formato y caption (nombre que aparecer cuando lo utilicemos).
13
1.3.3.- MySql MySql es una base de datos muy rpida en la lectura cuando utiliza el motor no transaccional Misan, pero puede provocar problemas de integridad en entornos de alta concurrencia en la modificacin. En aplicaciones web hay baja concurrencia en la modificacin de datos y en cambio el entorno es intensivo en lectura de datos, lo que hace a MySql ideal para este tipo de aplicaciones. Sea cual sea el entorno en el que va a utilizar MySql, es importante monitorizar de antemano el rendimiento para detectar y corregir errores tanto de SQL como de programacin. Misal funciona sobre mltiples plataformas, incluyendo: AIX, BSD, Fresad, HP-UX, Kurisu O, GNU/Linux, Mac OS X, NetBSD, Novell Netware, OpenBSD, OS/2 Warp, QNX, SGI IRIX, Solaris, SunOS, SCO OpenServer, SCO UnixWare, Tru64, eBD, Windows 95, Windows 98, Windows NT, Windows 2000, Windows XP, Windows Vista, Windows 7 y Windows Server (2000, 2003 y 2008), OpenVMS10.
14
15
16