Está en la página 1de 12

Curso a Distancia

Utilizando SAIKU de
Pentaho

Módulo 1 – Conceptos Básicos

Clase 2: Data Warehouse

SIU-WICHI 1 de 12
Modulo 1 – Clase 2 – Data Warehouse
MODULO 1 – CLASE 2 – DATA WAREHOUSE 2
1- QUE ES UN DATA WAREHOUSE 2
2- OBJETIVOS DEL DATA WAREHOUSE 3
3- ARQUITECTURA DE UN SISTEMA DE TOMA DE DECISIONES BASADO EN UN DW 4
3.1- FUENTES DE DATOS 5
3.2- LIMPIEZA Y TRANSFORMACIÓN DE LOS DATOS 5
3.3- EL PROCESO DE EXTRACCIÓN, TRANSFORMACIÓN Y CARGA DE DATOS 6
3.4- ALMACENAMIENTO Y PRESENTACIÓN DE LOS DATOS 7
3.5 ANÁLISIS DE INFORMACIÓN 8
4- CONCEPTOS BÁSICOS: CUBO, DIMENSIÓN; MEDIDA 9
5- ¿CÓMO SE VISUALIZA LA INFORMACIÓN DE UN CUBO? 9
5.1- VER LA INFORMACIÓN DE UN CUBO EN FORMATO DE TABLA 9
5.2- VER LA INFORMACIÓN DE UN CUBO EN FORMATO DE GRÁFICO 11
6- PAUTAS Y BENEFICIOS 12

1- Que es un Data Warehouse


En forma sencilla se puede decir que un DW es una colección de datos, obtenidos a partir de los
datos transaccionales y específicamente estructurados para realizar consultas y analizar la
información [Kim1992]. Comúnmente se dice que los DW son fuentes secundarias de información
pues no generan datos por sí mismos, sino que son alimentados desde sistemas existentes
internamente en la organización o desde datos externos. Típicamente los usuarios del DW tienen
sólo permisos de lectura sobre este repositorio de datos.

Los DW o bases de datos para procesamiento analítico (OLAP) están específicamente


estructurados o diseñados para cumplir con un conjunto de metas bien diferentes a los objetivos
de un sistema operacional OLTP. Por ejemplo, una meta de los OLTP es maximizar la
concurrencia de actualizaciones; dicho objetivo no es pertinente en el diseño de DW donde las
consultas son sólo de lectura [Mst2005]. En contrapartida, las metas de un diseñador de DW
deben focalizarse en entregar un análisis multidimensional y capacidades de reportes ad hoc
[Mst2005] y brindarlos de manera eficiente.

La definición más tradicional del término DW fue especificada por Bill Inmon a principios de la
década de los „90, quién lo definió como una colección de datos “orientados al sujeto”,
“integrados”, “variables en el tiempo” y “no volátiles” para ayudar al proceso de toma de decisiones
gerenciales [Inm2002] [Mst2005], donde:

 Orientados al Sujeto: datos que brindan información sobre un “sujeto” o asunto del negocio
en particular, en lugar de concentrarse en la dinámica de las transacciones de la
organización. Se dice que un DW está orientado a los sujetos de una organización y no a
sus operaciones o procesos. En el ambiente universitario se puede pensar en alumnos,
carreras, egresados, en lugar de inscripciones, registro de actas de exámenes, gestión de
títulos, etc.

 Integrados: los datos con los que se nutre el DW provienen de diferentes fuentes y son
integrados para dar una visión global coherente. Cuando se integran datos de diferentes
fuentes hay que contemplar cuestiones como la estandarización de codificaciones
(ejemplo: sexo como F y M, o 1 y 2, o V y M), formatos de campos (por ejemplo de

SIU-WICHI 2 de 12
fechas), nomenclaturas (datos que significan lo mismo con nombres distintos, y datos
diferentes con el mismo nombre) y diferentes formas de medir algunos atributos.

 Variables en el Tiempo: todos los datos en el DW están asociados con un período de


tiempo específico. En los sistemas operacionales se lleva tanto información asociada a
algún período de tiempo, por ejemplo el año académico en que el alumno ingresa a la
carrera, o fecha en que rinde un examen; así como también se lleva información corriente,
ligada al momento actual, por ejemplo condición de regularidad de los alumnos. Cuando
se extraen datos de los sistemas fuentes para pasar al DW estos quedan asociados
siempre a un período de tiempo en el que esa información es válida. Se puede decir que
es el tiempo que corresponde al momento en que se toma la “foto” del sistema.

El DW puede concebirse entonces como una serie de fotos tomadas en algún momento de
tiempo. El elemento de tiempo puede tomar diferentes formas, desde una estampilla de
tiempo en cada registro del DW hasta una estampilla de tiempo de la base de datos
completa. Este último es el caso de los ejemplos utilizados para este curso.

 No volátiles: los datos son estables en el DW. Se pueden agregar más datos, pero los
datos existentes no son removidos. Cuando un dato ingresa al DW se carga como una
foto, estática. Si ocurren cambios se cargan fotos nuevas y se mantiene la historia.

Obviamente que esta definición, ya clásica, se debe tomar como la definición pura sobre DW. Sin
embargo, con los años, algunos términos han sido modificados según las necesidades y
capacidades del mercado, dando origen a otros conceptos como el de Data Marts (para referirse a
DW sobre áreas específicas en lugar del Warehouse corporativo) y otras variantes de DW donde
por ejemplo es válido actualizar datos ya existentes

2- Objetivos del Data Warehouse


Una de la las cosas más valiosas de una organización es su información. Esta es generalmente
mantenida en dos formas: el sistema operacional de registros y el DW. En forma simplificada, el
sistema operacional es donde los datos ingresan y el DW es donde se realiza análisis y se extrae
información.

El DW vendría a cumplir el rol de ser la fuente donde los usuarios pueden acceder a sus datos.
Los objetivos fundamentales de un DW particular se van a desprender de las inquietudes que
tengan los directivos de una organización. En [Kim1998] se establecen como requerimientos las
siguientes consideraciones de calidad:

 El DW debe proveer acceso fácil a la información de una organización. Información


accesible significa que administradores y analistas de una organización deben poder
conectarse al DW desde sus computadoras personales. La conexión debe ser inmediata,
a demanda y de alta velocidad. No es aceptable que el acceso sea a través de otra
persona, sea inseguro o lento.

El DW no es sólo los datos, sino también un conjunto de herramientas para consultar,


analizar y presentar la información. Las herramientas de acceso deben ser simples y
fáciles de usar.

Los contenidos del DW deben ser entendibles y navegables. Esto quiere decir que deben
estar correctamente etiquetados y que los datos pueden ser separados y combinados por
el significado de toda posible medida del negocio.

 Los datos del DW deben ser consistentes y de buena calidad. La información del DW debe
ser creíble. Consistencia implica resolver las correspondencias entre la información de
diferentes partes de la organización. Si dos medidas de una organización tienen el mismo
nombre deben tener el mismo significado. Inversamente si dos medidas difieren en

SIU-WICHI 3 de 12
significado deben etiquetarse de manera distinta. Información consistente y de alta calidad
significa que toda la información debiera ser tenida en cuenta y que es completa. También
implica que deben estar disponibles para los usuarios las definiciones comunes
(diccionario de datos) de los contenidos del DW.

Los datos que se publican en el DW deben ser útiles. Como los datos provienen de
diferentes fuentes de información, deben ser combinados cuidadosamente, atravesar una
etapa de limpieza que debe asegurar la calidad antes de pasar a ser parte del DW.

La calidad de los datos del DW debe ser una conductora para la reingeniería del negocio.
El DW no puede arreglar la pobre calidad de los datos. Si los datos son opcionales y no
están completos no hay nada que el DW pueda hacer. La única forma de mejorar la
calidad afecta a las personas que ingresan datos al sistema y a los administradores y
consiste en volver al origen del dato con mejores sistemas, mejores administraciones y
mejor visibilidad del valor de buen dato.

Muchas veces al publicar los datos incompletos la gente ve lo valioso que sería contar con
datos de mejor calidad. De esta forma el DW puede jugar un rol clave en los esfuerzos de
reingeniería del negocio de una organización.

 Debe ser una fuente de información adaptable y flexible a los cambios. El DW debe estar
diseñado para manejar los cambios continuos de las necesidades de los usuarios, las
condiciones del negocio, los datos y las tecnologías. Los datos y aplicaciones existentes
en el DW no deben sufrir modificaciones cuando se agregan nuevos datos y/o nuevas
preguntas a realizar.

 El DW debe ser un lugar seguro donde la información se encuentre protegida. El DW


contiene información muy valiosa para la organización. Es necesario que existan controles
de acceso efectivo a los datos. También se debe permitir a sus dueños visualizar los usos
y abusos de los datos, incluso luego de haber abandonado el DW.

 Debe ser la base para la toma de decisiones. El DW debe contener los datos correctos
para soportar la toma de decisiones. Hay sólo una verdadera salida del DW: las
decisiones que son tomadas a partir de él. El DW tendrá más valor cuanto más impacte en
las decisiones del negocio. Recordar que el DW surge para constituirse como la parte
central de un sistema para la toma de decisiones que es lo que finalmente se está
tratando de construir.

 Debe ser aceptado por la comunidad usuaria para considerarse exitoso. No importa si la
solución construida es elegante y usa los mejores productos y plataformas si el DW no se
utiliza para el propósito que fue concebido. Su uso muchas veces es opcional, a diferencia
de los sistemas operacionales donde los usuarios están obligados a utilizarlos. La
aceptación de los usuarios de estas herramientas pasa por la simplicidad sobre todas las
cosas.

Si la comunidad del negocio no adopta al DW y continua usándolo activamente seis meses


después del entrenamiento, entonces habrá fallado el test de aceptación.

De esta lista es fácil ver que para poder implementar exitosamente un DW se requiere mucho más
que un buen equipo técnico. Es necesario conocer las reglas del negocio, involucrar a los usuarios
y contar con datos de buena calidad. Se requiere conformar un equipo de trabajo con diferentes
perfiles para lograr éxito en el proyecto.

3- Arquitectura de un sistema de toma de decisiones


basado en un DW

SIU-WICHI 4 de 12
La figura 1.8 presenta un esquema con los principales componentes que definen el marco para un
DW. El DW es el núcleo de toda la arquitectura de un Sistema para la toma de decisiones
(DSS_Decision Support System).

Generación y Acceso al DW

Figura 1.8 – Arquitectura de un Sistema de Toma de decisiones basado en un DW

Como se observa en la figura 1.8 para llegar al CONOCIMIENTO es decir información. El proceso
comienza con la captura de los datos en los sistemas transaccionales (ver punto 3.1), luego se
hace un proceso de transformación o adecuación de los datos (ver punto 3.2 y 3.3) donde los
datos ya se transforman en información y se los incorpora al almacén de datos para que queden
disponible para ser consultados por los usuarios (ver punto 3.4)

3.1- Fuentes de datos

Los sistemas operacionales son las fuentes de datos principales donde se registra toda la gestión
de la organización. Son los sistemas centrales que soportan las operaciones diarias del negocio.

Se acceden a través de las interfaces de las aplicaciones (APIs). Los datos que recopilan estos
sistemas son la principal fuente de información del DW. También se los conoce como sistemas
transaccionales o sistemas heredados.

El éxito o fracaso de toda la solución de DW depende fuertemente de que los sistemas


operacionales provean los datos necesarios para entender el negocio y la historia necesaria para
evaluar su evolución. La calidad de los datos de estos sistemas es fundamental.

Otras fuentes pueden ser datos externos a la organización (información demográfica, crediticia,
financiera, etc. por ejemplo la cotización de alguna moneda), planillas de cálculos, etc.

3.2- Limpieza y transformación de los datos

Se utiliza el término “data staging area” para referirse al área de almacenamiento y al conjunto de
procesos que limpian, transforman, combinan, estandarizan, archivan y preparan los datos de

SIU-WICHI 5 de 12
origen para ser usados en el DW. Es donde se realiza el proceso de transformación de datos. Las
tareas principales de esta área son el ordenamiento y procesamiento secuencial de datos.

Este componente no provee ningún servicio de consulta ni presentación de información,


simplemente porque esta área no está pensada ni preparada para brindar la seguridad y tiempo de
respuesta propios del área de almacenamiento o presentación de datos. La forma de
almacenamiento utilizada es en general la de archivos planos.

Una tarea dentro de esta área es el aseguramiento de la calidad de los datos. Es para ello que se
testea la consistencia, completitud e idoneidad de los datos a ser publicados a la comunidad
usuaria. La creación de índices es otra tarea que también puede considerarse parte de esta etapa
de gestión de datos.

3.3- El proceso de Extracción, Transformación y Carga de datos

El término popular ETL corresponde a la sigla en inglés de “Extract-Transform-Load” y significa


extraer, transformar y cargar. El proceso ETL implica las tareas de capturar, integrar, transformar,
limpiar, reestructurar, validar, filtrar, analizar la calidad y cargar datos en el DW. Este proceso
organiza el flujo de los datos entre los diferentes sistemas operacionales principales de una
organización y el área de almacenamiento y presentación de datos. Aporta los métodos y
herramientas necesarias para mover datos desde múltiples fuentes, limpiarlos, reformatearlos y
cargarlos en un DW o Data Mart. En ese momento los datos quedan disponibles para ser
analizados por los usuarios. Otros nombres que recibe este proceso son “gestión de los datos”,
“adquisición de datos” y en inglés “data staging” o “data cleansing”.

Cabe destacar que la integración y transformación de datos es uno de los procesos más
importantes de todo el entorno del DW. Tiene la tarea crítica de convertir el caos de datos del
mundo operacional en un mundo ordenado de información. Este proceso asimila datos
procedentes de tecnologías heterogéneas dentro de un entorno integrado y consistente, apto para
ser consumido por los procesos de soporte de decisiones.

Uno de los mayores desafíos se produce cuando los datos recibidos provienen de fuentes que los
han organizado alrededor de claves diferentes. Por ejemplo en el SIU-Guaraní una persona se
identifica por el número de inscripción dentro de una unidad académica. En el SIU-Pampa la
identificación de la persona se hace por su número de legajo. Estas fuentes necesitan ser
integradas para dar una visión única de persona. Este proceso puede involucrar sofisticadas
reglas de mapeo de elementos, normalizaciones y estandarización de nombres, direcciones y
otros datos comunes a las fuentes para determinar cuáles son los datos válidos.

El nivel de esfuerzo necesario para integrar y transformar datos está fundamentalmente afectado
por el nivel de conocimiento que se tenga sobre estos. Cuanto más familiar resulten los datos
operacionales y los procesos que los producen más fácil resultarán estas tareas. El proceso ETL
en general tiende a ser subestimado, sin embargo es altamente demandante y puede abarcar la
mayor parte del tiempo de desarrollo de un DW, ocupando hasta el 80% del tiempo en un proyecto
de gran magnitud. A continuación se detallan las tareas que incluye:

 Limpieza de datos. Consiste en la corrección de errores de tipeo, resolución de dominios


conflictivos (por ejemplo una ciudad que es incompatible con el código postal), manejo de
datos perdidos (nulos o vacíos, referencias a datos que no existen), conversión a formatos
estandarizados, y resolución de inconsistencias.

 Selección de atributos que son útiles para el DW. Por ejemplo, si lo que se quiere analizar
es el rendimiento académico de los alumnos interesará saber, entre otras cosas, cuántas
materias aprueba por año. Puede resultar útil saber cuáles son esas materias y las notas
obtenidas; pero no interesará saber el número de acta y folio donde se registró esta
información ni el día en que el dato fue ingresado al sistema.

SIU-WICHI 6 de 12
 Combinación de fuentes de datos. Las fuentes se pueden combinar por medio de los
valores claves o realizando mapeos difusos (“fuzzy matches”) sobre atributos que no son
claves.

Este ejemplo surgió en el ámbito del SIU al integrar bases de datos del SIU-Guaraní de
diferentes unidades académicas de una Universidad. La información de colegios
secundarios era mantenida en forma independiente y no sincronizada en las diferentes
implementaciones. Cada unidad académica generaba sus propios códigos y nombres. Al
integrar los datos se hallaron casos como los mostrados en la figura siguiente.

Ejemplo de Problemas de Datos

Unidad Código Colegio Descripción Ejemplo


académica de Corresp. utilizada
colegio

Facu1 Cod1 Cole1 Desc1Cole1 Escuela Normal Superior


N°1

Facu2 Cod1 Cole2 Desc1Cole2 Esc Sup de Comercio

Facu2 Cod2 Cole1 Desc2Cole1 Esc Normal Sup Nro 1

Facu1 Cod3 Cole1 Desc3Cole1 Normal Nro 1

Figura 1.9 – Ejemplo de problemas de datos

 Crear claves. Asociar un nuevo identificador a cada registro de dimensión y evitar la


dependencia de las claves definidas en las fuentes. El proceso de generación de nuevas
claves sustitutas (o subrogadas) impone la integridad referencial entre las tablas de
dimensiones y las tablas de hechos. Lo recomendable para las claves de dimensión es
que sean numéricas y secuenciales y totalmente independientes de las claves de los
sistemas operacionales.

El costo de todas las tareas descriptas depende en gran medida de la calidad de los datos en los
sistemas fuentes y apuntan a garantizar la calidad de los datos en el DW. La calidad debe ser una
línea conductora en todo el proceso de análisis de información y toma de decisiones. El DW será
actualizado con cierta frecuencia sobre la base de una carga controlada de datos correctos. La
carga de datos al DW recibe también el nombre de “carga en masa”.

La creación de agregados, esto es información agrupada que se guarda en el DW, así como
también la creación de índices pueden considerarse como parte del proceso de carga de datos al
DW. Estas tareas apuntan exclusivamente a resolver posibles problemas de performance.

3.4- Almacenamiento y presentación de los datos

El área de almacenamiento y presentación de datos, también denominada servidor de


presentación es el lugar donde se ubican el DW y los Data Marts. En esta área los datos se

SIU-WICHI 7 de 12
organizan y guardan para ser consultados en forma directa por los usuarios, generadores de
reportes y otras aplicaciones. Los datos deben ser presentados y almacenados en un formato
dimensional.

Como se anticipó la definición clásica ha dado origen a otros conceptos para adaptarse a las
diferentes realidades. El término más resonante es el de Data Mart. Un Data Mart es un
subconjunto lógico del DW. Contiene datos personalizados y/o sumarizados derivados del DW,
confeccionados para soportar los requerimientos analíticos de un determinado sector o función del
negocio. Cada Data Mart utiliza una visión empresarial común de los datos estratégicos y provee
sectorizaciones más flexibles. Entre las características de los Data Marts se destacan:

 Los Data Marts pueden o no localizarse físicamente en la misma máquina que el DW. Esto
permite a los consumidores de la información elegir la mejor tecnología que soporte el
estilo de análisis que necesiten.

 Los Data Marts deben ser implementados como una extensión del DW, no como una
alternativa. La estrategia a largo plazo dicta que es necesario contar con la infraestructura
completa para tener un DSS saludable.

 La construcción de Data Marts para soporte de decisiones es ideal. Sin embargo hay que
tener en cuenta que la simplicidad de su diseño puede conducir a tener mucha cantidad
de ellos implicando así un alto costo para administrarlos.

Kimball define a un Data Mart como “una porción de la torta completa que representaría el DW”.
Así mismo este autor presenta una metodología bottom-up comenzando por el desarrollo de Data
Marts para construir luego un DW como unión de estos. Generalmente se ve al Data Mart como
una restricción del DW a un simple proceso del negocio o a un grupo de procesos del negocio
relacionados dirigidos hacia un grupo particular de usuarios.

3.5 Análisis de información

En la figura 1.8 se ejemplifican diferentes estilos de análisis de información. Estos estilos se


implementan con diferentes herramientas y aplicaciones. Todo esto forma parte del área de
análisis de información. Listados en texto plano y planillas de cálculo usadas para la toma de
decisiones también pueden incluirse dentro de esta área. A continuación se proveen las
definiciones de las herramientas más usadas para el análisis de información:

 Reportes: Es la forma típica de presentación de la información y consiste en informes ya


predeterminados.

 Alertas: Permiten enviar avisos a los usuarios cuando se dan determinadas condiciones.
Algunas plataformas realizan el aviso por mail o vía mensaje de texto.

 Scoreboards y Dashboards: Conjunto de indicadores que conforman un tablero y permiten


mostrar la situación varias variables o indicadores. Los indicadores muestran la relación
entre dos variables o también para comparaciones con metas preestablecidas.
Normalmente se utiliza en la representación semáforos u amperímetros o velocímetros
que muestran la situación de cada indicador.

 Interfaz OLAP: Análisis dinámico de los datos. Pudiendo el usuario final generar las
combinaciones de datos que le resulten más útiles.

 Minería de datos. Son un tipo de consultas indirectas que buscan encontrar patrones
ocultos en los datos. Los resultados más valiosos son agrupamientos, clasificaciones,
estimaciones, predicciones, y asociaciones de cosas que ocurren juntas. Hay muchos
tipos de herramientas para minería de datos. Las principales incluyen árboles de decisión,

SIU-WICHI 8 de 12
redes neuronales, razonamiento basado en casos o reglas de asociación, herramientas de
visualización, algoritmos genéticos, lógica difusa, y estadística clásica.

4- Conceptos Básicos: Cubo, Dimensión; Medida


Cubo: es una base de datos que responde a un modelo multidimensional y busca colaborar en el
análisis de una determinada temática o problema. Es un Data Mart con una implementación física
determinada.

Cubo, Dimensiones, Medidas

Medida
Materia

Dimensiones
(Lados)
Nota

Fecha

Cada lado corresponde a


una dimensión

Figura 1.10 – Concepto de Cubo

El cubo se compone de:

Dimensiones: variables por las que se puede filtrar y realizar cruces. Ejemplos: Unidad Académica,
Cohorte, Departamentos, Carreras, Fecha, Localidad de procedencia, Dependencia
presupuestaria, Fuente de financiamiento, etc.

Medidas: variables a contar. Ejemplo: cantidad de alumnos, ingresantes, legajos, cargos, crédito,
recaudación, etc.

5- ¿Cómo se visualiza la información de un cubo?


Para poder analizar la información como ya lo hemos explicado en la clase anterior se utilizan las
denominadas herramientas de análisis que es el software que accede a los datos almacenados en
los cubos y que permite visualizar y analizar la información disponible. En el caso de la suite
Pentaho esa herramienta se denomina JPivot y permite ver la información en formato de tabla y/o
de gráficos.

5.1- Ver la información de un cubo en formato de Tabla

SIU-WICHI 9 de 12
A continuación en la figura 1.11 podemos observar el resultado de una consulta donde el usuario
está trabajando sobre un cubo del sistema de alumnos SIU GUARANI y seleccionó la variable año
académico y la variable unidad académica y la medida egresados. El objetivo de esta consulta es
saber la evolución de los egresados discriminados por unidad académica, veamos entonces el
resultado en la figura 1.11:

Figura 1.11 – Evolución de Alumnos Egresados

En la figura 1.11 podemos ver entonces básicamente 2 sectores que indican:

Año académico: Esta segunda columna está referida a una variable que indica tiempo como es el
caso del año. Pero bien podría ser meses, trimestres, cuatrimestres, días o cualquier otra variable
que indique un momento de tiempo. En este caso son los años académicos de los cuales se
cuenta información en el cubo analizado.

Unidad Académica: En este caso la variable unidad académica se desagrega en tantas columnas
como unidades académicas existen en el conjunto de datos que se están analizando. Debajo de la
unidad académica figura la medida utilizada.

La medida es lo que se está contando en la intersección de filas y columnas. En este caso cuenta
la cantidad de Egresados para cada unidad académica y año que se visualiza.

Veamos entonces que cosas podemos observar o analizar en la información que se nos muestra
en la figura 1.11

Analizar que paso en un año determinado con cada una de las unidades académicas

Figura 1.12 – Egresados de cada unidad académica para el año 2002

En la figura 1.12 podemos observar el valor 0 que corresponde a los egresados de la Unidad
Académica Ciencias Económicas, 15 para el caso de Cs Humanas y 13 para Ingeniería.

Otro análisis que podemos realizar es la evolución de los distintos años solo para una determinada
unidad académica (esto es mediante la aplicación de filtros), como podemos observar en la
siguiente figura:

SIU-WICHI 10 de 12
Figura 1.13 – Evolución Anual de Egresados Unidad Académica Ciencias Económicas

En la figura 1.13 podemos observar como fue la evolución de egresados para la unidad académica
Ciencias Económicas desde el año 2000 al año 2010. Aquí podemos observar que desde el año
2000 al año 2005 no hay datos. Esto puede significar que o durante ese período no hubo
egresados porque la unidad académica estaba iniciando sus actividades o que no existe
información sistematizada y procesada de dichos años. La diferencia de visualización entre la
figura 1.11 y la 1.13 está dada porque en este último caso se aplicó un filtro sobre la información
que permite solo visualizar la información relativa a la facultad de Ciencias Económicas.

5.2- Ver la información de un cubo en formato de Gráfico

Si no se desea ver en formato de Tabla se podría ver la información en formato gráfico, como se
muestra en la figura 1.14

Figura 1.14 – Gráfico Evolución de Egresados

En la figura 1.14 se observa de manera gráfica la misma información que en la figura 1.11 . Lo que
permite un gráfico es analizar rápidamente de manera visual una evolución y detectar
comportamientos que no sean los esperados.

SIU-WICHI 11 de 12
La información gráfica es útil cuando no hay muchos datos o variables a analizar o comparar caso
contrario se recomienda el uso del formato de tabla para realizar el análisis.

6- Pautas y Beneficios
Lo que se necesita básicamente para llevar adelante un proyecto de DW son los siguientes
elementos y factores:

 Herramientas de desarrollo que habitualmente están compuestas por tres componentes: la


base de datos, las herramientas que permiten la extracción de datos, transformación y
carga de los datos que alimentarán el DW y las herramientas de visualización para el
usuario.

 Datos confiables, disponibles y completos, que puedan ser utilizados.

 Mucho conocimiento de las reglas de la institución a analizar, experiencia y tiempo.

 Reflexionar sobre los datos que se necesitan, cómo los debemos organizar y como los
tenemos que presentar para contestar las diversas preguntas que puedan surgir de los
distintos destinatarios.

 Recursos humanos, especialistas que puedan mantenerlo y hacerlo evolucionar.

 Autoridad que empuje internamente el proyecto DW en la Universidad: designación de un


equipo.

 Apoyo técnico del área de sistemas y Hardware necesario.

Los beneficios que trae la aplicación de una herramienta de este tipo son:

 Facilita una visión global de la institución.

 Permite realizar una proyección a futuro y redefinir estrategias.

 Suministra información consolidada.

 Ofrece imágenes integradas de los datos, simplificando los procesos de toma de


decisiones.

 Está diseñado para consolidar y manejar distintos formatos de datos.

 Facilita el proceso de comparación entre datos.

 Permite construir indicadores y evaluar tendencias.

 Acceso a los datos fácil, rápido y en el lenguaje del usuario final.

 Permiten a los usuarios hacer sus propias consultas.

SIU-WICHI 12 de 12

También podría gustarte