Documentos de Académico
Documentos de Profesional
Documentos de Cultura
01-Gestion de La Informacion
01-Gestion de La Informacion
BASE DE DATOS
SEMANA 8
[ BASE DE DATOS ]
CONTENIDO
Presentación
1. DESARROLLO TEMÁTICO
• Sistemas de Soporte a la Toma de Decisiones DSS
• Bodega de Datos
• Procesamiento Analítico de Datos (OLAP)
Conclusiones
1.1. BIBLIOGRAFÍA
2 [ POLITÉCNICO GANCOLOMBIANO EN ALIANZA CON WHITNEY INTERNATIONAL SYSTEM ]
PRESENTACIÓN
Actualmente, las empresas se enfrentan a dos fenómenos paralelos y contradictorios en
nuestro campo: la evolución de las Tecnologías de la Información y, al mismo tiempo, los
serios problemas en los procesos de toma de decisiones por parte de los directivos. El
problema radica en la diferencia existente entre información y conocimiento, conceptos que
suelen confundirse con excesiva frecuencia propiciando incertidumbre en las organizaciones.
Una adecuada gestión del conocimiento corporativo garantizará el éxito de las
organizaciones dentro de un mercado tan competitivo como el actual.
Esta lectura explora los principales conceptos y componentes de una bodega de datos,
y examina las herramientas que hacen que la utilización de la información de la bodega
de datos sea más útil, eficaz y sirva como apoyo a la toma de decisiones de las
organizaciones.
1. DESARROLLO TEMÁTICO
Los nuevos ambiente de negocios son cada vez más dinámicos, la toma de decisiones
operativas, tácticas y estratégicas requiere que los funcionarios tengan un acceso eficiente y
preciso a la información. El análisis de datos se utiliza para obtener e interpretar información
a partir de los datos (gestionar información). Por consiguiente, el análisis de datos
desempeña un papel crucial de soporte en la toma de decisiones exitosa. Dada la
importancia del análisis de datos muchas empresas han organizado a sus análisis de datos en
grupos formales de soporte a la toma de decisiones.
Sistemas de Soporte a la Toma de Decisiones DSS
El soporte de decisiones se refiere a una metodología (o una serie de metodologías)
diseñada para obtener información de los datos y utilizarla como base para la toma de
decisiones. Un Sistema de Soporte a la Toma de Decisiones (DSS) e un conjunto de
herramientas tecnológicas utilizadas para favorecer la toma de decisiones gerenciales dentro
de una organización. Un DSS está conformado por cuatro componentes principales de alto
nivel: un nivel de base de datos, un componente de extracción, transformación y carga (ETL,
por sus siglas en inglés), una herramienta de multidimensionamiento datos (bodega de
datos) y consulta de usuario y una herramienta de presentación de usuario (cubos OLAP). El
DSS se utiliza a niveles estratégicos y prácticos dentro de las empresas, aunque su utilidad
depende directamente de la calidad de los datos obtenidos a nivel operativo. Los datos
operativos no son los más adecuados para el soporte a la toma de decisiones (ver Figura 1.
Sistema de Soporte para la Toma de Decisiones). Desde el punto de vista del usuario, los
datos de DSS difieren de los operativos en tres áreas principales: lapso, granularidad y
dimensionalidad.
[ BASE DE DATOS ] 3
Figura 1. Sistema de Soporte para la Toma de Decisionesi
Bodega de Datos
La bodega de datos es una base de datos integrada, orientada a sujetos, variable con el
tiempo, no volátil para la toma de decisiones. La bodega de datos por regla general es una
base de datos históricos de sólo lectura optimizada para el análisis de datos y procesamiento
de consultas. Los analistas acceden a la bodega mediante software de aplicación de usuario
para extraer los datos en forma útil. Un Data Mart es un subconjunto de bodega de datos de
un solo sujeto que proporciona soporte de decisiones para un pequeño grupo de personas.
Complementando, un Data Mart es un pequeño Data Warehouse (bodega de datos),
para un determinado número de usuarios, para un área funcional, específica de una
compañía. También se puede definir que un Data Mart es un subconjunto de una
bodega de datos para un propósito específico. Su función es apoyar a otros sistemas
para la toma de decisiones.
4 [ POLITÉCNICO GANCOLOMBIANO EN ALIANZA CON WHITNEY INTERNATIONAL SYSTEM ]
Un Data Mart (ver figura 2. Ejemplo de un Data Mart) puede ser diseñado a través de un
esquema en estrella, que es una técnica de modelado de datos utilizada para proyectar datos
multidimensionales de soporte de decisiones de una base de datos relacional con el
propósito de realizar análisis avanzado. Los esquemas en estrella proporcionan un modelo
de análisis de datos multidimensionales fáciles de entender. El esquema en estrella básico
consta de cuatro componentes: hechos, dimensiones, atributos y jerarquías de atributos. Los
hechos son medidas numéricas o valores que representan un aspecto o actividad específica
del negocio (como por ejemplo Ventas). Las dimensiones son categorías generales
calificadoras que representan un aspecto a actividad específica del negocio (como por
ejemplo: tiempo, precio, calidad, entre otros). Cada tabla de dimensión se compone de
atributos que con frecuencia se utilizan para buscar, filtrar o clasificar hechos (como por
ejemplo: fecha, ciudad, edad, estado civil, etc.). Conceptualmente, el modelo de datos de
datos multidimensional se representa mejor mediante un cubo tridimensional. Los atributos
pueden ordenarse en jerarquías de atributos bien definidos. La jerarquía de atributos
proporciona una organización descendente que se utiliza para dos propósitos principales:
permitir agregación y para proporcionar análisis de datos a bajo y alto nivel de agregación.
[ BASE DE DATOS ] 5
Figura 2. Ejemplo de un Data Martii
Los hechos y las dimensiones normalmente se representan con tablas físicas en la base
de datos de la bodega de datos. La tabla de hechos está relacionada con cada tabla
dimensional en una relación muchos a uno. La llave primaria de la tabla de hechos se
forma combinando las llaves foráneas de cada tabla dimensional con la cual está
relacionada. En general se utilizan cuatro técnicas para optimizar el diseño de la bodega
de datos: normalización de tablas dimensionales, tablas de hecho múltiples que
representan diferentes niveles de agregación, desnormalización de tablas de hechos y
partición y replicación de tablas.
Procesamiento Analítico de Datos (OLAP)
En una base de datos los datos se encuentran almacenados unidimensionalmente, las
empresas requieren multidimensional los datos para obtener información útil para la toma
de decisiones. OLAP se refiere a un ambiente de análisis de datos que soporta toma de
decisiones, modelado de negocios y actividades de investigación de operaciones.
Los sistemas OLAP poseen cuatro características principales: uso de técnicas de análisis
multidimensionales, soporte de base de datos avanzada, interfaces de usuario fáciles de utilizar
y arquitectura cliente/servidor.
Los sistemas OLAP están basados en tecnología cliente/servidor y disponen de tres módulos
principales: interface de usuario gráfica OLAP (GUI), lógica de procesamiento analítico OLAP y
lógica de procesamiento de datos OLAP. El procesamiento analítico en línea relacional ROLAP
proporciona funcionalidad OLAP mediante el uso de bases de datos y herramientas de consulta
relacionales utilizadas para guardar y analizar datos multidimensionales. Este método está
basado en tecnologías relacionales y representa una extensión natural de ellas para
organizaciones que ya utilizan sistemas de administración de bases de datos relacionales. El
procesamiento analítico en línea multidimensional MOLAP proporciona funcionalidad OLAP
mediante el uso de bases de datos multidimensionales (MSGBD) para guardar y analizar
datos también multidimensionales. Los sistemas de bases de datos multidimensionales
utilizan técnicas para guardar datos en arreglos matriciales de n dimensiones.
6 [ POLITÉCNICO GANCOLOMBIANO EN ALIANZA CON WHITNEY INTERNATIONAL SYSTEM ]
La herramienta OLAP:
Permite el análisis de datos cuantificables según el punto de vista deseado.
Permite comprender datos y operar con ellos fácilmente gracias a su formato
matricial similar a una hoja de cálculo.
La información que presenta está sujeta en todo momento a cambios dinámicos
como la introducción de variables o la modificación del punto de vista.
Posibilita la clasificación de la información obteniendo rankings u ordenaciones.
Proporciona fácil e instantáneamente resultados porcentuales de los datos obtenidos.
Permite la navegación y análisis multidimensional (jerárquico) y relacional (horizontal).
La bodega de datos es la ubicación principal de almacenamiento de datos de soporte de
decisiones y promueve la integración con dos nuevos componentes de soporte de
decisiones: los sistemas de procesamiento analítico en línea y los sistemas de descubrimiento
de conocimiento. Las herramientas OLAP acceden a la bodega de datos para proporcionar
capacidad de análisis de datos multidimensionales avanzada.
CONCLUSIONES
• Nuestra capacidad para almacenar datos ha crecido en los últimos años a velocidades
exponenciales. Sin embargo, nuestra capacidad para procesarlos y utilizarlos no ha
ido a la par. Resulta interesante y necesario gestionar la información para poder
explorar nuevos horizontes.
• Ante la gran cantidad de herramientas informáticas utilizadas para analizar
información, es necesaria una obligada transferencia de tecnologías por parte de las
instituciones propietarias para lograr adecuarnos a los tiempos actuales. No existe
una cultura de transferencia de tecnología entre nuestras organizaciones lo que
impide un mejor análisis de la información para la toma de decisiones.
• Es necesario apropiarse de las metodologías para la gestión de la información con el
objeto de procesar datos, generar información y adquirir conocimiento pertinente
para la toma de decisiones.
[ BASE DE DATOS ] 7
1.1. BIBLIOGRAFÍA
• C.J. Date, Introducción a los Sistemas de Bases de Datos, 5. ª edición, Adison Wesley
Iberoamericana, 1993.
• Korth y A. Siulberschatz, Fundamentos de Bases de Datos, 4. ª edición, McGraw‐Hill,
Madrid, 2002.
• Elmasri, R. & Navathe, S.B. “Fundamentals Of Database Systems” Third Edition.
Addison‐ Wesley Pubs. 2000.
• Rob, Peter.; Coronel, Carlos. “Sistemas de Bases de Datos: diseño, implementación y
administración”, Quinta Edición, THOMSON, 2002.
i
Sistema de Soporte para la Toma de Decisiones´, consulta sobre conceptos de sistemas de soporte para la
toma de decisiones. [Recurso en Internet] http://www.gestiopolis.com/canales2/gerencia/1/ddsirw1.gif. Último
acceso: 15 de enero de 2011.
ii
Ejemplo de un Data Mart, consulta sobre Data Mart. [Recurso en Internet]
http://www.databaseanswers.org/tutorial4_integrated_performance_reporting/images/16_data_model_for_da
ta_mart.gif. Último acceso: 15 de enero de 2011.
8 [ POLITÉCNICO GANCOLOMBIANO EN ALIANZA CON WHITNEY INTERNATIONAL SYSTEM ]