Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Inteligencia de Negocios
Inteligencia de Negocios
Las bases de datos multidimensionales son una variacin del modelo relacional que
utiliza cubos OLAP para organizar los datos y expresar las relaciones entre ellos. Las
principales ventajas de este tipo de bases de datos son la versatilidad para cruzar
informacin y la alta velocidad de respuesta. Esto las convierte en herramientas bsicas
para soluciones de Business Intelligence o de Big Data, donde el anlisis de los datos
resulta crucial.
Este tipo de base de datos se aplica sobre el sistema OLAP tambin llamado cubo
multidimensional o hipervnculo. Se compone de hechos numricos llamados medidas
que se clasifican por dimensiones. El cubo de metadatos es creado tpicamente apartar
de un esquema en estrella o copo de nieve y utilizando tablas de una base de datos
relacional.
Las medidas se obtienen de los registros de una tabla de hechos y las dimensiones de
cuadros.
Una base de datos multidimensional, es aquella que almacena sus datos con varias
dimensiones, es decir que en vez de un valor, encontramos varios dependiendo de los
"ejes" definidos o una base de datos de estructura basada en dimensiones orientada a
consultas complejas y alto rendimiento. Puede utilizar un SGBDR en estrella (Base de
datos Multidimensional a nivel lgico) o SGBDM (Base de datos Multidimensional a
niveles lgico y fsico o Base de datos Multidimensional Pura).
Los sistemas OLAP son bases de datos orientadas al procesamiento analtico. Este
anlisis suele implicar, generalmente, la lectura de grandes cantidades de datos para
llegar a extraer algn tipo de informacin til: tendencias de ventas, patrones de
comportamiento de los consumidores, elaboracin de informes complejos etc.
Dimensiones: son las caractersticas por las que se pueden filtrar y cruzar los
indicadores. Por ejemplo: tiempo (fijando un determinado da, mes o ao), geografa
(fijando un determinado pas, regin o ciudad), proveedor, cliente, modo de pago etc.
As como los sistemas OLTP son tpicos para bases de datos convencionales y data
warehouses, los sistemas OLAP son propios de los datamarts.
TIPOS DE OLAP
La arquitectura ROLAP excede a los datos relacionados para proporcionar los anlisis
OLAP. La primicia de los sistemas ROLAP es que las capacidades OLAP se ejecutan
mejor contra las bases de datos relacionales
Utiliza una arquitectura de tres niveles:
Nivel Base De Datos: Usa base de datos relacionales para el manejo, acceso y
obtencin de datos.
Nivel de Aplicacin: Ejecuta las consultas multidimensionales de los usuarios
Motor Rolap: Se integra con niveles de presentacin atreves de los cuales los
usuarios realizan un anlisis OLAP.
MOLAP
Esta almacena los datos de una base de datos multidimensional. Para utilizar los
tiempos de respuesta, hacer resmenes de informacin calculados por adelantado y un
sinfn de operaciones utilizadas de forma multidimensional para proporcionar el anlisis
su principal premisa es que OLAP esta mejor implantado almacenando los datos
multidimensionales.
El sistema MOLAP utiliza una arquitectura de 2 niveles, la base de datos
multidimensional y el motor analtico.
MOLAP VS ROLAP
Los ROLAP soportan anlisis OLAP contra grandes volmenes de datos mientras que
los MOLAP se comportan relacionalmente en volmenes ms reducidos (-5gb).
BIBLIOGRAFIA:
http://topicos-1.wikispaces.com/1.2+Bases+de+datos+multidimensionales+
(BDM).
http://www.buenastareas.com/ensayos/Base-De-Datos-
Multidimensionales/190823.html
http://blog.classora.com/2013/06/25/bases-de-datos-multidimensionales-olap-vs-
oltp/
2.1.1 DATAWAREHOUSE
Tras las dificultades de los sistemas tradicionales en satisfacer las necesidades
informacionales, surge el concepto de Data Warehouse, como solucin a las
necesidades informacionales globales de la empresa. Este trmino acuado por Bill
Inmon, se traduce literalmente como Almacn de Datos. No obstante si el Data
Warehouse fuese exclusivamente un almacn de datos, los problemas seguiran siendo
los mismos que en los Centros de Informacin.
Las diferencias de un Data Warehouse con un sistema tradicional las podramos resumir
en el siguiente esquema:
Una de las claves del xito en la construccin de un Data Warehouse es el desarrollo de
forma gradual, seleccionando a un departamento usuario como piloto y expandiendo
progresivamente el almacn de datos a los dems usuarios. Por ello es importante elegir
este usuario inicial o piloto, siendo importante que sea un departamento con pocos
usuarios, en el que la necesidad de este tipo de sistemas es muy alta y se pueda
obtener y medir resultados a corto plazo.
Fuente de informacin:
http://es.wikipedia.org/wiki/Data_mart
Fuente de informacin:
http://www.sinnexus.com/business_intelligence/olap_vs_oltp.aspx
Fuente de informacin:
http://www.sinnexus.com/business_intelligence/olap_vs_oltp.aspx
Fuente de informacin:
http://www.adictosaltrabajo.com/tutoriales/tutoriales.php?pagina=datawarehouse3
Para funcionar, las aplicaciones OLAP utilizan un tipo de base de datos que posee la
peculiaridad de ser multidimensional, denominada comnmente Cubo OLAP.
Bsicamente, el Cubo OLAP, es una base de datos que posee diversas dimensiones,
ampliando las posibilidades que hasta el momento ofrecan las conocidas hojas de
clculo.
Cada una de las dimensiones que posee la base de datos incorpora un campo
determinado para un tipo de dato especfico, que luego podr ser comparado con la
informacin contenida en el resto de dimensiones, para hacer posible la evaluacin y
posteriores informes de la informacin realmente relevante para una compaa.
Una base de datos multidimensional puede contener varios cubos o vectores que
extendern las posibilidades del sistema OLAP con el cual se trabaja.
Por ello, si bien en general los sistemas OLAP suelen estar compuestos por tres
dimensiones, lo cierto es que existe la posibilidad de que el sistema OLAP albergue ms
de tres dimensiones mediante la utilizacin de estos Cubos OLAP.
Para tener una idea ms simple de la funcin de los Cubos OLAP dentro de una base de
datos multidimensional, cabe destacar que cada una de las dimensiones o escalas del
cubo corresponde bsicamente a una jerarqua de datos.
Caractersticas
En este modelo los datos son vistos como cubos los cuales consisten
en categora descriptivas (dimensiones) y valores cuantitativos (medidas).
Es un modelo multidimensional de datos, que simplifica a los usuarios
realizar consultas complejas, arreglar datos en un reporte, cambiar de datos
resumidos a datos detallados, etc.
Los Cubos OLAP son vectores en los cuales se dispone la informacin, y gracias
a esta ordenada jerarqua es posible llevar a cabo un anlisis rpido de los datos.
ROLAP: son sistemas en los cuales los datos se encuentran almacenados en una base
de datos relacional (OLAP Relacional)
BIBLIOGRAFIA:
http://www.ecured.cu/index.php/Cubos_OLAP
Implementacin de OLAP.
Fuente de informacin:
http://tallerbd.wikispaces.com/OLAP
2.2 SISTEMAS DE GESTIN DEL CONOCIMIETO
Se define como herramientas para llevar a cabo la gestin del conocimiento.
La gestin del conocimiento: Es el proceso que continuamente asegura el
desarrollo y la aplicacin de todo tipo de conocimientos pertinentes de una
empresa con objeto de mejorar su capacidad de resolucin de problemas y as
contribuir a la sostenibilidad de sus ventajas competitivas
Estn manifestados en una variedad de implementaciones (por ejemplo):
Repositorios de documentos
Bases de datos de experticia
Listas de discusin
Sistemas de recuperacin especficos del contexto
Objetivos:
EN GENERAL
Apoyar los procesos de creacin, almacenamiento, recuperacin,
transferencia y aplicacin del conocimiento.
EN LA ORGANIZACIN
Hacer visible el conocimiento y mostrar a las personas el rol del
conocimiento en la organizacin usando herramientas tales como
mapas de conocimiento, pginas amarillas e hipertextos.
Desarrollar una cultura intensiva en conocimiento, fomentando
conductas que propicien el compartirlo y sean proactivas a pedirlo y
ofrecerlo.
Construir una infraestructura de conocimiento. No solo un sistema
tcnico, sino toda una red de conexiones entre personas, facilitndoles
espacio, tiempo y herramientas para que interacten y colaboren.
BIBLIOGRAFIA:
http://es.slideshare.net/difagram/sistemas-de-gestion-del-conocimiento
Fuente de informacin
http://sci2s.ugr.es/docencia/in/pdf/Tema05-PreparacionDeDatos-v2.pdf
CUESTIONARIO
1. El propsito fundamental de la preparacin de los datos es?
La manipulacin y transformacin de los datos
2. La preparacin de datos puede generar un conjunto de?
Datos ms pequeo que el original, lo cual puede mejorar la eficiencia del
de calidad se puede?
Recuperar informacin incompleta.
Eliminar outliers
Resolver conflictos.
De forma general, los datos son la materia prima bruta. En el momento que el usuario
les atribuye algn significado especial pasan a convertirse en informacin. Cuando los
especialistas elaboran o encuentran un modelo, haciendo que la interpretacin que
surge entre la informacin y ese modelo represente un valor agregado, entonces nos
referimos al conocimiento. Vea ms diferencias entre datos, informacin y conocimiento.
Aunque en datamining cada caso concreto puede ser radicalmente distinto al anterior, el
proceso comn a todos ellos se suele componer de cuatro etapas principales:
La relacin entre todas estas fases slo es lineal sobre el papel. En realidad, es mucho
ms compleja y esconde toda una jerarqua de subfases. A travs de la experiencia
acumulada en proyectos de minera de datos se han ido desarrollando metodologas que
permiten gestionar esta complejidad de una manera ms o menos uniforme.
BIBLIOGRAFIA:
http://www.sinnexus.com/business_intelligence/datamining.aspx
http://es.wikipedia.org/wiki/Miner%C3%ADa_de_datos
2.2.3 PATRONES
La tarea de minera de datos real es el anlisis automtico o semi-automtico de
grandes cantidades de datos para extraer patrones interesantes hasta ahora
desconocidos, como los grupos de registros de datos (anlisis cluster), registros
poco usuales (la deteccin de anomalas) y dependencias (minera por reglas de
asociacin). Esto generalmente implica el uso de tcnicas de bases de datos
como los ndices espaciales. Estos patrones pueden entonces ser vistos como
una especie de resumen de los datos de entrada, y pueden ser utilizados en el
anlisis adicional o, por ejemplo, en la mquina de aprendizaje y anlisis
predictivo. Por ejemplo, el paso de minera de datos podra identificar varios
grupos en los datos, que luego pueden ser utilizados para obtener resultados
ms precisos de prediccin por un sistema de soporte de decisiones. Ni la
recoleccin de datos, preparacin de datos, ni la interpretacin de los resultados
y la informacin son parte de la etapa de minera de datos, pero que pertenecen
a todo el proceso KDD como pasos adicionales.
Patrones de fuga
Cuestionario