Está en la página 1de 12

MODELOS AVANZADOS DE BASE DE DATOS

1 BASES DE DATOS XML En la actualidad, existen diferentes soluciones para el almacenamiento de documentos XML que segn WESTERMAN Y KLAS (2003), se pueden clasificar en dos conjuntos: las bases de datos nativas como Tamino (SOFTWARE AG, 2001) o ToX (BARBOSA, 2001); y extensiones XML a las bases de datos, que permiten el almacenamiento de documentos XML en SGBD convencionales, normalmente relacionales u objeto-relacionales.

1.1

Bases de datos XML nativas

Las bases de datos XML surgen por la necesidad de una gestin eficiente de grandes cantidades de documentos XML, argumentando que los documentos XML no se pueden almacenar en SGBD convencionales debido a su naturaleza jerrquica y semi estructurada. Los productos de bases de datos XML nativas, estn centrados en el almacenamiento y gestin de documentos XML. Este tipo de gestores tienen las siguientes caractersticas: Definen un modelo para estructura de los documentos XML (por ejemplo un DTD). Corresponde al modelo relacional de las BD clsicas. Almacenan y recuperan documentos de acuerdo a ese modelo. Los documentos XML son, por tanto, la unidad de almacenamiento. Corresponden a las tuplas del modelo relacional. Para el almacenamiento final, el gestor puede tener su propio modelo de almacenamiento, es decir, no se requiere un modelo subyacente concreto (puede ser una base de datos relacional, OO o jerrquica; o un formato de almacenamiento propietario).

1.2

Extensiones XML a las bases de datos

Las extensiones XML a las bases de datos permiten el almacenamiento y la gestin de documentos XML en SGBD convencionales, habitualmente relacionales u objeto-relaciones (OR). Existen diferentes aproximaciones para el almacenamiento: Almacenamiento no estructurado: los documentos XML se almacenan directamente en formato de texto en un atributo de tipo fichero, como por ejemplo, CLOB (Carcter Large Object). Almacenamiento estructurado: se usa un metamodelo de documentos XML capaz de representar rboles de nodos de documentos XML, que se construye utilizando primitivas de modelado del SGBD convencional que hay por debajo. La estructura de los documentos XML se convierte en el esquema de base de datos. El contenido de los documentos XML se puede consultar utilizando las facilidades proporcionadas por el SGBD. Las bases de datos XML estn orientadas a definir un estndar de consulta para integrar informacin de varias aplicaciones. Las bases de datos XML utilizan un lenguaje de marcado comn a todas las aplicaciones que operan con ellas. Las bases de datos XML utilizan un sistema persistente ms parecido a las bases de datos tradicionales, cualquier modificacin sobre los datos sobreescriben los anteriores si no se tiene cuidado.

XML no es en s un lenguaje de base de datos, debido a la alta redundancia que presenta, al tener que repetir etiquetas para todas las ocurrencias de un mismo campo. Las bases de datos XML estn muy ligadas a un entorno web.

1.3

EJEMPLO

Una gran parte de usos necesita encontrar documentos enteros. Por ejemplo, un portal Web podra permitir a usuarios buscar todos los documentos sobre una empresa particular y un sistema de direccin podra permitir a usuarios encontrar todos los documentos que se relacionen con una cierta parte. El modo menos complejo de buscar documentos es con bsquedas texto completas. En bases de datos natales XML, estos son XML-aware. Es decir esto distingue entre el contenido (que es buscado) y el margen (que no es).

2. BASE DE DATOS ACTIVAS


El paradigma de bases de datos activas planteado por Morgenstern en 1983, describe la nocin de una base de datos activa, como una metfora de su comportamiento, el cual se concentra en la dinmica de la interaccin con los usuarios unido a la inteligencia de la base de datos . Una base de datos activa, son aquellas bases de datos capaz de detectar situaciones de inters y de actuar en consecuencia. (Mota Noviembre 2005). El mecanismo que se utiliza se parece a las reglas de produccin utilizadas en el rea de inteligencia artificial.

2.1 REPRESENTACIN DE UNA BASE DE DATOS ACTIVA


El poder especificar reglas con una serie de acciones que se ejecutan automticamente cuando se producen ciertos eventos, es una de las mejoras de los sistemas de gestin de bases de datos que se consideran de gran importancia desde hace algn tiempo. Mediante estas reglas se puede hacer respetar reglas de integridad, generar datos derivados, controlar la seguridad o implementar reglas de negocio. De hecho, la mayora de los sistemas relacionales comerciales disponen de disparadores (triggers). Se han realizado mucha investigacin sobre lo que debera ser un modelo general de bases de datos activas desde que empezaron a aparecer los primeros disparadores. El modelo que se viene utilizando para especificar bases de datos activas es el modelo eventocondicinaccin (ECA). 2.2 VENTAJAS * Mayor productividad. * Mejor rendimiento. * Reutilizacin del cdigo. * Reduccin de trfico de datos. * Posibilidad de optimizacin. * Facilitar el acceso de la BD a usuarios finales.

2.3 CARACTERISTICAS
* Un SGBDA es un SGBD.

* Un SGBDA tiene un modelo de reglas ECA. * Un SGBDA debe so portar la gestin de reglas y la evolucin de la base de reglas 2.4 CARACTERISTICAS DE LA EJECUCION DE LAS REGLAS * Un SGBDA no tiene un modelo de ejecucin. * un SGBDA debe ofrecer diferente modelos de acoplamiento. * un SGBDA debe implementar modos de consumo. * un SGBDA debe gestionar la historia de eventos. * un SGBDA debe implementar la resolucin de conflictos.

2.5 REGLAS ACTIVAS las reglas que siguen el modelo ECA: Cada regla reacciona ante un determinado evento, evala una condicin y, si esta es cierta se ejecuta una accin. Se encarga de detectar los eventos que vas sucediendo y de planificar las reglas que se ejecuten. 2.6 TRIGGER Un trigger (Disparador) es un procedimiento que el SGBD invoca automticamente en respuesta a cambios concretos de la BD. Generalmente un Trigger es invocado por el DBA(Administrador la Base de Datos). Las BD que tienen un conjunto de triggers asociados se denominan Base de Datos Activas. Un Trigger est compuesto por tres partes: Evento: Una modificacin en la BD que activa el trigger. Las operaciones que pueden activar un trigger son: DELETE, UPDATE, INSERT, etc. Condicin: una consulta o prueba se ejecuta cuando se activa un trigger. Accin: un procedimiento que se ejecuta cuando se activa el trigger y su condicon es verdadera.

3. BASE DE DATOS DEDUCTIVAS Un Sistema de Bases de Datos que tenga la capacidad de definir reglas con las cuales deducir o inferir informacin adicional a partir de los hechos almacenados en las bases de datos se llama Sistema de Bases de Datos Deductivas. Puesto que parte de los fundamentos tericos de algunos sistemas de sta especie es la lgica matemtica, a menudo se les denomina Bases de Datos Lgicas. Una base de datos deductiva es, en esencia, un programa lgico; mapeo de relaciones base hacia hechos, y reglas que son usadas para definir nuevas relaciones en trminos de las relaciones base y el procesamiento de consultas.

Un sistema de base de datos deductiva, es un sistema de base de datos pero con la diferencia de que permite hacer deducciones a travs de inferencias. Se basa principalmente en reglas y hechos que son almacenados en la base de datos. Las bases de datos deductivas son tambin llamadas bases de datos lgicas, a raz de que se basa en lgica matemtica. Este tipo de base de datos surge debido a las limitaciones de la Base de Datos Relacional de responder a consultas recursivas y de deducir relaciones indirectas de los datos almacenados en la base de datos.

3.1 Lenguaje
Utiliza un subconjunto del lenguaje Prolog llamado Datalog el cual es declarativo y permite al ordenador hacer deducciones para contestar a consultas basndose en los hechos y reglas almacenados.

3.2 Ventajas
Uso de reglas lgicas para expresar las consultas. Permite responder consultas recursivas. Cuenta con negaciones estratificadas Capacidad de obtener nueva informacin a travs de la ya almacenada en la base de datos mediante inferencia. Uso de algoritmos de optimizacin de consultas. Soporta objetos y conjuntos complejos.

3.3 Desventajas
Crear procedimientos eficaces de deduccin para evitar caer en bucles infinitos. Encontrar criterios que decidan la utilizacin de una ley como regla de deduccin. Replantear las convenciones habituales de la base de datos.

3.4 Fases
Fase de Interrogacin: se encarga de buscar en la base de datos informaciones deducibles implcitas. Las reglas de esta fase se denominan reglas de derivacin. Fase de Modificacin: se encarga de aadir a la base de datos nuevas informaciones deducibles. Las reglas de esta fase se denominan reglas de generacin.

3.5 Interpretacin
Encontramos dos teoras de interpretacin de las bases de datos deductiva consideramos las reglas y los hechos como axiomas. Los hechos son axiomas base que se consideran como verdaderos y no contienen variables. Las reglas son axiomas deductivos ya que se utilizan para deducir nuevos hechos. Teora de Modelos: una interpretacin es llamada modelo cuando para un conjunto especfico de reglas, stas se cumplen siempre para esa interpretacin. Consiste en asignar a un predicado todas las combinaciones de valores y argumentos de un dominio de valores constantes dado. A continuacin se debe verificar si ese predicado es verdadero o falso.

3.6 ]Mecanismos
Existen dos mecanismos de inferencia:

Ascendente: donde se parte de los hechos y se obtiene nuevos aplicando reglas de inferencia. Descendente: donde se parte del predicado (objetivo de la consulta realizada) e intenta encontrar similitudes entre las variables que nos lleven a hechos correctos almacenados en la base de datos.

4. BASE DE DATOS DIFUSAS Las bases de datos difusas nacen de unir la teora de base de datos ,principalmente con el modelo relacional con la teora de conjuntos difusos para permitir: el almacenamiento de infromacion difusa, y el tratamiento y consulta de esta informacin de forma difusa o flexible.

4.1 Modelos de Implementacin


El problema de la implementacin de los sistemas gestores de bases de datos difusas ha sido tratado en dos vertientes principales: Iniciar con un sistema gestor de bases de datos relacionales (SGBDR) con informacin precisa y desarrollar una sintaxis que permita formular consultas imprecisas, lo cual da origen a extensiones SQL, como Fuzzy SQL, con capacidades de manejar la imprecisin. Construir un gestor de bases de datos relacionales difusas (SGBDRD) prototipo que implemente un modelo concreto de base de datos relacional difusa en el que la informacin imprecisa pueda ser almacenada. Dentro de esta vertiente existen dos grandes ramas: Los modelos a travs de unificacin por relaciones de similitud y los modelos relacionales basados en distribuciones de probabilidades.

Particularmente me enfocar a los trabajos desarrollados en la Universidad de Granada, Espaa por un grupo de investigadores que se encuentran trabajando en esta rama actualmente. Los elementos relacionados con la manipulacin de informacin difusa pueden tener representaciones diferentes. Por ejemplo, una distribucin normalizada de probabilidades puede ser representada por diferentes tipos de funciones (trapezoidal, triangular, intervalar, etc.). Lo ms usual, es que se usen funciones de tipo trapezoidal. Lo mismo puede decirse de la forma en la que se modelan los operadores relacionales difusos as como los dems elementos difusos que aparezcan en el sistema. El criterio empleado para seleccionar la forma de representacin de los mltiples elementos difusos del sistema manejador de base de datos, puede afectar de manera determinante la funcionalidad y desempeo de la base de datos, por lo que debera ser uno de los puntos centrales en los que el experto ajuste la arquitectura del FRDBMS al problema especfico a tratar mediante el mismo. Puede decirse entonces que este criterio de seleccin y ajuste constituye un paso entre la formulacin de una base de datos relacional difusa y la implementacin de un sistema basado en la misma. Datos Precisos: Manejados usualmente mediante la representacin provista por la base de datos relaci onal husped.

Datos Imprecisos Los modelos usualmente consideran dos tipos de representacin para los datos imprec isos. adems de la informacin desconocida o indeterminada que se maneja mediante lo ti pos unknown, undefined y null:

4.2 Manejo de las BDRD Para el manejo de las bases de datos relacionales difusas (BDRD) se utiliza el lenguaje Fu zzy SQL (FSQL) que es un lenguaje que deriva de SQL, incorporando las siguientes novedades. Etiquetas Lingsticas:En las sentencias FSQL las etiquetas van precedidasdel smbolo $, para poder distinguirlas fcilmente. Comparadores Difusos:Permiten comparar dos atributos o un atributo con una const ante. Conectivas Lgicas:Pueden usarse NOT, AND y OR, para enlazar condiciones difus as simples. Umbral de Cumplimiento (threshold) :Tras cada condicin simple puede imponerse un umbral de cumplimiento mnimo (por defecto es 1), con el siguiente formato: <condicin_simple> THOLD La palabra reservada THOLD es opcional y puede sustituirse por un compa rador tradicional (=, <, <=...) modificando el sentido de la consulta. Por defecto es equival ente al comparador >=. Constantes Difusas: Pueden usarse en el SELECT todas las constantes difusas ya definidas: UNKNO WN,UNDEFINED y NULL, $[a,b,c,d] (Distrib. de posibilidad Trapezoidal ), $label (Etiquetas), [n,m] (Intervalo) y #n (valores aproximados). Funcin CDEG(<atributo>):

Usada en la lista de seleccin, la funcin CDEG calcula, para cada tupla, el grado de cumplimiento del atributo del argumento en la condicin de la clusula WHERE. Funcin CDEG(*):

Calcula el grado de cumplimiento de cada tupla en la condicin de forma global, para todos sus atributos y no slo para uno de ellos en particular La funcin CDEG usa, por defecto, los operadores tpicos para la negacin (1x), conjuncin (t-norma del mnimo) y disyuncin (s-norma del mximo), pero pueden usarse otros (si se definen). Carcter Comodn %:

Similar al carcter comodn * de SQL, pero este incluye adems la funcinCDEG aplicada a todos los atributos de la condicin. No incluye CDEG(*). Condicin con IS:

Tambin admite condiciones del tipo: <atributo_difuso> IS [NOT] {UNKNOWN | UNDEFINED | NULL}

Cuantificadores Difusos:

Tiene dos modalidades que se aplican como condicin en la clusula HAVING que sigue a una clusula GROUP BY: o Q elementos de X cumplen A: $Cuantificador FUZZY[r] (condicin_difusa) THOLD Ejemplos Dame todas las personas cuya edad es aproximadamente 20 aos: (con grado mnimo 0.6): SELECT * FROM Personas WHERE Edad FEQ #20 THOLD 0.6; Dame todas las personas ms o menos Rubias (con grado mnimo 0.5) cuya edad es posiblemente superior a Joven (con grado mnimo 0.8):

SELECT * FROM Personas WHERE Pelo FEQ $Rubio THOLD 0.5 AND Edad FGT $Joven THOLD 0.8; Equipos que tienen muchos ms de 3 (con grado mnimo 0.5) jugadores Altos (con grado mnimo 0.75): SELECT Equipo, CDEG(*) FROM Personas GROUP BY Equipo HAVING $Muchos_Mas_Que[3] (Altura FEQ $Alto 0.75) 0.5;

5. BASE DE DATOS DISTRIBUIDAS 6. BASE DE DATOS FEDERADAS 7. BASE DE DATOS MOVILES

Base de Datos Mviles.


1.1. Introduccin. La computacin mvil introduce el concepto de base de datos mvil. Una base de dato mvil es una base de datos portable, fsicamente independiente del servidor corporativo de base de datos y capaz de comunicarse con ese servidor desde sitios remotos para compartir datos corporativos. Utilizando bases de datos mviles, los trabajadores pueden acceder a los datos corporativos desde cualquier dispositivo que disponga de conexin a Internet. 1.2. Arquitectura. La arquitectura general de una plataforma mvil es un modelo distribuido formado por computadores fijos, estaciones base y unidades mviles. Los computadores fijos son computadores de uso general que no disponen de medios para comunicarse con los unidades

mviles. Las estaciones base disponen de enlaces inalmbricos para conectar con las unidades mviles; son mquinas que actan de intermediarios entre las unidades mviles y los computadores fijos. Los computadores fijos y las estaciones base estn interconectados por medio de una red fija (cableada) de alta velocidad. Las unidades mviles se conectan a las estaciones base mediante enlaces inalmbricos; los enlaces ms comunes son el estndar 802.11 (Wi-Fi), el servicio GPRS y la tecnologa Bluetooth.

A rquitectu ra gener al de un a platafo rma mv il (Dunh am y Hel al, 1995)

Las uni dades mviles se pue den mo ver libr emente por un espacio conocido como dominio de movilidad geogrfica, cuyo alcance est determinado por la cobertura de los enlaces inalmbricos. Este dominio se divide en dominios ms pequeos llamados celdas. Cada celda es controlada por una estacin base. El movimiento de las unidades mviles dentro del dominio de movilidad geogrfica no debe estar restringido, es decir, se debe garantizar el acceso a la informacin aunque las unidades mviles se muevan entre las celdas. 1.3. Sistemas Gestores de Bases de Datos mviles.

Estos SGBD mviles estn adaptados a los recursos limitados de las unidades mviles y proporcionan una serie de funcionalidades adicionales: Comunicacin con el servidor centralizado de base de datos mediante tcnicas de comunicacin inalmbrica. Replicacin de datos en el servidor centralizado de base de datos y en el dispositivo mvil. Sincronizacin de datos entre el servidor centralizado de base de datos y el dispositivo mvil. Gestin de datos en el dispositivo mvil. Anlisis de los datos almacenados en el dispositivo mvil

1.4. Aplicaciones mviles y tipos de datos. Las aplicaciones mviles se clasifican en las dos siguientes categoras: aplicaciones verticales y aplicaciones horizontales En las aplicacionesverticales, los usuarios acceden a los dato s en una celda especfica; fuera de la celda los datos noestn disponibles. Un ejemplo de aplicacin v ertical es la obtencin de informacin sobre lasplazas libres de un determinado parking. En las aplicaciones horizontales, los datos estndistribuidos por todo el sistema, y los usuarios pueden acc eder a ellos desde cualquier celda. Laaplicacin horizontal ms comn es el acceso al correo electrni co. Los datos se clasifican en tres categoras: Datos privados: pertenecen a un usuario y slo l puede acceder a ellos y manejarlos. Por ejemplo, los datos del perfil de un usuario de cualquier aplicacin que gestione datos personales. Datos pblicos: pueden ser consultados por cualquier usuario, pero slo pueden ser modificados por una nica fuente. Por ejemplo, los datos de las cotizaciones de la bolsa. Datos compartidos: pueden ser accedidos por un grupo determinado de usuarios, quienes tienen permisos para leerlos y para escribirlos. Por ejemplo,

Ejemplos de bases de datos mviles. iAnywhere Solutions, empresa filial de Sybase, lidera el ranking del mercado de bases de datos mviles gracias a SQL Anywhere. Este paquete proporciona bases de datos que pueden utilizarse tanto a nivel de servidor (soporta mquinas de hasta 64bits) como a nivel de dispositivo mvil. SQL Anywhere se compone de las siguientes tecnologas: SQL Anywhere Server: sistema gestor de bases de datos relacionales para los sistemas de bases de datos mviles. Ultralite: sistema gestor de bases de datos que puede embeberse en dispositivos mviles. Mobilink: tecnologa de sincronizacin para el intercambio de datos entre bases de datos relacionales y bases de datos no relacionales. QAnywhere: facilita el desarrollo de aplicaciones mviles robustas y seguras.

SQL Remote: permite a los usuarios de dispositivos mviles sincronizar sus datos con otras bases de datos SQL Anywhere.

DB2 Everyplace de IBM ,esta base de datos puede integrarse en dispositivos como PDAs y telfonos mviles. Microsoft tambin incluye Tablet PCs, Pocket PCs, Smart Phones y equipos de escritorio. Oracle Database Lite 10g es la solucin de Oracle para desarrollar aplicaciones en entornos mviles. Proporciona un cliente que permite la realizacin de consultas SQL para acceder a los datos locales del dispositivo y un servidor para gestionar los datos de forma centralizada. Caso de estudio: Oracle Database Lite 10g. Oracle Database Lite 10g es una solucin integrada para el desarrollo de aplicaciones en entornos mviles. Para evitar que los dispositivos mviles estn continuamente conectados al servidor, Oracle Database Lite 10g proporciona una pequea base de datos para gestionar los datos empesariales de forma local en el dispositivo mvi

Arquitectura de las aplicaciones Oracle Database Lite 10g

La figura anterior muestra la arquitectura de las aplicaciones Oracle Database Lite 10g. Esta arquitectura contiene los siguientes componentes: Mobile Sync Module: aplicacin instalada en el dispositivo mvil que permite la sincronizacin de datos con el servidor empresarial. Oracle Lite RDBMS: sistema gestor de bases de datos relacionales creado especficamente para dispositivos mviles. Proporciona interfaces ODBC, JDBC, SODA y ADO para permitir la utilizacin de aplicaciones desarrolladas en lenguajes como Java, C/C++ y Visual Basic.

Oracle Lite database: base de datos instalada en el dispositivo mvil. Mobile Server: servidor intermedio entre los dispositivos mviles y el servidor empresarial. Permite la instalacin y actualizacin de aplicaciones en los dispositivos mviles y se comunica con el mdulo Mobile Sync para sincronizar los datos entre el dispositivo mvil y el servidor empresarial. Message Generator and Processor (MGP): mdulo utilizado en la sincronizacin de datos para detectar y solucionar cualquier conflicto que pueda

producirse en la actualizacin de los datos del servidor. Mobile Server Repository: repositorio que contiene informacin necesaria para que el Mobile Server pueda ejecutarse. Esta informacin se almacena junto a los datos del negocio, en la misma base de datos.

8. BASE DE DATOS GRID 9. BASE DE DATOS PARALELAS 10. BASE DE DATOS MULTIMEDIA

11. BADE DE DATOS WEB 12. BASE DE DATOS ORIENTADO A OBJETOS

13. BASE DE DATOS OBJETOS-RELACIONALES