Está en la página 1de 4

Un breve panorama sobre las Bases de Datos

Semánticas
Pedro Shiguihara Juárez
Escuela de Informática
Universidad Nacional de Trujillo
Trujillo, Perú

Abstract— El presente documento trata de dar una vista Base de Datos Relacional, además agregaba componentes tales
general a las Bases de Datos Semánticas, tratando de identificar como Knowledge Base 2 —podrı́a traducirse como base del
sus orı́genes y la motivación que ha provocado en los investi- conocimiento—.
gadores, su modelamiento de datos, arquitectura del sistema y la
integridad semántica. Explica además sus beneficios y aspectos En este documento se presenta la sección del problema la
a tomarse en consideración debido a los problemas que se cual motiva el surgimiento e implementación de la Base
deberá afrontar al momento de modelamiento semántico de los de Datos Semántica, en la sección 3 se explica el manejo
datos. conceptual donde actúa el Modelamiento de Datos Semántica,
seguidamente en la sección 4 las ventajas del modelamiento
PALABRAS CLAVES
semántico, en la sección 5 las consideraciones de un modelado
Knowledge base de datos semántico que puede dañar la integridad semántica
I. I NTRODUCCI ÓN [7][8][9] y finalmente la sección 6 de conslusiones acerca de
esto.
[1] En 1970, el Modelo Relacional revolucionó el campo
de las Bases de Datos, debido al logro de la separación de la II. P ROBLEMA : A SMILAR EL MUNDO REAL
representación lógica del dato de la implementación fı́sicia, Hammer[2] ejemplifica la iteracción con la base de datos,
lo que produjo en adelante el desarrollo de lenguajes de y asevera que ésta es más que una colección de valores, tiene
consultas. transiciones en cada punto de la lı́nea del tiempo, por ello
La historia del modelamiento semántica, también data hacia experimenta cambios en su contenido. En esta ejemplificación
esas fechas. Los modelos semánticos fueron introducidos co- cada punto puede verse como una instantánea que representa
mo herramientas de diseño de esquemas 1 . El motivo principal el estado del sistema de aplicación de la Base de Datos.
de su uso radicaba en la exactitud del modelo de datos, Por tanto esto refleja una secuencia de eventos a través del
como muchos autores aseveran, el modelado semántico, no tiempo, ocurrentes en el ambiente de aplicación. Los autores
es mas, que una representación del mundo real [3][4][2][1], relacionados a este tema definen el Modelado Semántico de
estas propiedades no las tenı́an las aplicaciones de bases de una Base de Datos como el Modelo del Sistema del Mundo
datos tı́picas. Real, es decir un espejo de la estructura del sistema que
[1] El primer modelo semántico publicado apareció en 1974, el modelo —una empresa por ejemplo—.
área maduró con el desarrollo de muchos modelos importantes
—como Semantic Data Model [2], General Semantic Data III. M ANEJO C ONCEPTUAL
Model [2][9], Iris Data Model, Sem-Object Data Model [3][4], Todo esto enfoca la necesidad de establecer una interacción
IFO [6]—. Hoy en dı́a se ha tratado de estandarizar ello, con el usuario de una manera más fácil, tratando de algu-
con la llegada del estándar SQL3 —año 1999—, que no na manera brindar la propiedad de transparencia al usuario
es mas que una extensión del modelo relacional. [2][6] En mediante un modelo conceptual en vez de lógico, ya que le
décadas anteriores entre 1970 y 1980 se planteaba una división resultarı́a al usuario más familiar.
entre el modelo conceptual —modelado semántico— y el Un esquema lógico está expresado de una particular clase de
modelo lógico —modelado relacional—, para 1990 Rishe estructura de datos llamado Modelo de Datos. Los modelos de
[3][4] planteaba un modelo que sugerı́a colocar el nombre estos datos son de bajo nivel y orientado a la máquina, todo
de Semantic-SQL, que pueda ser una estándar en lenguajes ello requiere que se expresa a nivel de representación lógica
de consultas semánticas y planteaba una arquitectura del que en términos de significancia. En el modelo relacional la
sistema —ver figura en apéndice— donde el modelo relacional información semántica está implı́cita —tanto ası́ que no se
actuaba de forma independiente al modelo semántico, este podrı́a extraer en casi todos los casos— y se pierden en el
último actuaba de manera directa con el usuario y traducı́a modelo [3]. Por ello Hammer explica que la semántica deberı́a
la consulta a un modelo lógico entendible por el Sistema de estar separada, Rishe también lo plantea, y aplicada por el
1 Un esquema podı́a ser diseñado en un alto nivel de modelado semántico 2 KB también está presente en los fundamentos de la Web Semántica,
y traducido en un medio tradicional para la implementación explı́citamente en Resource Description Framework (RDF)
usuario directamente. IV-C. Abstracción de datos
El modelo en el nivel conceptual se trata de no perder la Esto permnite proveer de datos derivados —Knowledge
significancia de la información que provean las relaciones, base—, que están relacionados más a la noción que tiene el
entre entidades y brinde la facilidad para hacer consultas sobre usuario acerca de las Bases de Datos. Estos datos no están
ello [4]. incorporados al esquema, es decir es un nuevo tipo de dato
—puede tomarse como una entidad nueva en una relación ISA
por ejemplo—.

V. C ONSIDERACIONES DE UN MODELADO SEM ÁNTICO


En esta sección explicamos dos consideracione importantes,
la primera es la forma en que será implementada una Base
de Datos Semántica y la segunda está relacionada con la
integridad semántica y la ambigüedad.

V-A. Implementación y representación fı́sica


Hammer [2] explica que si bien hay beneficio por la
facilidad de comprensión y manejo de la Base de Datos,
también existen grandes consideraciones de, ¿Cómo será la
Fig. 1. Interacción directa entre BD Semántica y usuario implementación? y ¿Cómo será la representación fı́sica?, esto
trae consigo por supuesto una complejidad superior a la de una
Base de Datos con el Modelo Relacional. Esto se puede ver
IV. V ENTAJAS DEL MODELADO SEM ÁNTICO en Sistema de arquitectura de la figura en el apéndice.
En esta sección se tratará tres ventajas, las más resaltantes V-B. Ambigüedad del lenguaje natural e Integridad semánti-
acerca de la implementación de una Base de Datos Semántica. ca
Las bases de datos semántica se tratan de expresar como
IV-A. Separación de componentes conceptuales y lógicos
un lenguaje natural —a nivel conceptual— para las consultas
Los usuarios cuando realizan una consulta en una Base realizadas por el usuario.Esto como se menciona en [7] libera
de Datos Relacional, navegan a través de ella por medio de al usuario de una tarea de comprensión de la base de datos
un esquema con tablas de registros, logran obtener los datos —como explicamos en las ventajas—. Pero resalta un nuevo
requeridos mediante operaciones asociadas como juntura y problema, la previsión de capacidades de actualización.
proyección que son las más comunes. Acá se presenta un Por el mismo hecho de usarse un lenguaje casi natural,
ejemplo extrañido de [1], donde se plante el caso: Mary es un tiende a la ambigüedad, este nuevo problema no se ve en
agente de viajes, y se desea conocer la ciudad del empleador las consultas tradicionales. Esto es, debido a que el usuario
de Mary.. Para obtener esto en un lenguaje SQL se tendrı́a está fraseando sus peticiones con respecto a su punto de vista
que tener explı́citamente el conocimiento de las tablas donde de la Base de Datos, lo cual puede ser una simplificación o
se encuentra la información del negocio y lugar donde vive el una transformación de la estructura acutal de la base de datos,
empleador. La sentencia SQL queda como sigue: entendiéndose que el usuario no está ı́ntimamente ligado
con la estructura interna de la base de datos como serı́a su
SELECT city
diseñador.
FROM BUSINESS
Las solicitudes de actualización —insertar, eliminar,
WHERE BNAME in
modificar—, podrı́a resultar en diferentes efectos, no
SELECT EMPLOYER
esperados por el usuario. Incluso el usuario podrı́a hacer
FROM BUSTRAV
peticiones que sean imposibles —el problema de devolución
WHERE PNAME=’Mary’
null—. El trato que se da a la ambigüedad es seleccionar
Es decir obtiene primero el nombre del empleador de Mary entre todos los estados posibles, el que involucra menos
por selección y luego la ciudad de donde pertenece el negocio modificaciones a lo largo de la base de datos, para ello se
donde trabaja el empleador. siguen ciertas consideraciones que se explican en docuemtnso
asociados a esta bibliografı́a [9][7][8][5]. Shin [5] plantea
IV-B. Sobrecarga semántica una clasificación de posibles caminos que puede tomar una
consulta y en la bibliografı́a [10] se plantea el estándar SQL3
Una relación es usada normalemente en el Modelo Rela-
que trata el problema. Para Shin toma el siguiente camino:
cional, muchos tipos diferentes de información, la existencia
de entidades implı́citas, propiedades, estructura y asociaciones CC: Linguı́sticamente Completo;
entre ellos. El Modelo Semántico de Datos provee una sepa- Datos semánticamente Completos
ración de esta información, mediante la abstracción de datos. IC: Linguı́sticamente Incompleto;
Datos semánticamente Completos
CI: Linguı́sticamente Completo;
Datos semánticamente Incompletos
II: Linguı́sticamente Incompleto;
Datos semánticamente Incompletos

Fig. 2. taxonomı́a dada por Shin [5] Fig. 3. Ejemplos extraı́dos de [10]

Los IC tienen que ver con errores de tipografı́a, gramátical-


mente incorrecta, referencias indefinidas. CI tiene que ver R EFERENCES
con términos desconocidos o ambigüos, términos vagos o [1] HULL, RICHARD y ROGER KING, Semantic Database Modeling: Sur-
vey, Applications, and Research Issues, Computer Science Department,
información faltante, parámetros inconsistentes y semántica- University of Southern California, ACM Press, September 1987.
mente sin sentido; estos son los errores más comunes que [2] HAMMER, MICHAEL y DENNIS MCLEOD, The Semantics Data Mod-
puede llevarse a cabo. Los II son errores sintácticamente y el: A Modelling Mechanism for Data Base Applications, MIT Laboratory
for Computer Science, Cambridge, ACM Press, 1978.
semánticamente sin sentido. En la bibliografı́a [5] se explica [3] RISHE NAPHTALI D., Semantic SQL: A Semantic Wrapper for Re-
de manera detallada el problema, aquı́ se presenta la taxonomı́a lational Databases, School of Computer Science, Florida International
dada por Shin. University, Miami, 2003.
[4] RISHE N., SHU-CHING C., ALEXANDER V., JUN Y., XIAOL-
ING L., ARTYOM S., RUKSHAM A., XIAOBIN M., DMIT-
VI. C ONCLUSIONES RY V., Semantic Access for Querying Databases, School of
Computer Science, Floritda International University, Miami. URL:
El modelado semántico resume la complejidad lógica http://www.cs.fiu.edu/c̃hens/PDF/VLD800.pdf
representativa de la Base de Datos, esto permite mayor [5] SHIN, D. G., Semantics Modeling Issues for Processing Natural Lan-
guage Database Queries, Computer Science and Engineering Department,
usabilidad por parte de más usuarios, se extiende el University of Connecticut, ACM Press, January 1990.
amplio dominio para la redes de comunicaciones donde [6] ABITEBAW, SERGE Y RICHARD HULL, IFO: A Format Semantic
los usuarios no son conscientes de la estructura lógica de Database Model, Institut National de Recherche en Informatique et en
Automatique, ACM Press, November 1987.
una base de datos remota. [7] DAVIDSON, JAMES y JERROLD KAPLAN, Natural Language Access
La abstracción de datos y la separación de componente to Data Bases: Interpreting Update Requests, Computer Science Depart-
lógicos y conceptuales son propiedades importantes en ment, Stanford University, California, ACM Press. April 1983.
[8] CHEN A. y RICHARD HULL, An Execution Model for Limited Ambi-
las Bases de Datos Semántica por tanto permiten la guity Rules and Its Application to Derived Data Update, ACM Press,
representación de la realidad a modo de espejo. December 1995.
También trae consigo mayor complejidad lógica y prob- [9] HAMMER, M. y DENNIS MCLEOD, A Framework for Data Base
Semantic Integrity, MIT Laboratories for Computer Science, ACM Press,
lemas de interpretación de las consultas, debido a su 1976.
acercamiento al lenguaje natural, produce ambigüedades. [10] TÜRKER, CAN y MICHAEL GERTZ, Semantic integrity support
La base de datos Semántica permite la adaptación de in SQL:1999 and commercial (object-)relational database management
systems, Swiss Federal Institute of Technology, Zurich, Switzerland, ACM
datos derivados, no existentes en la base de datos pero Press, 2001.
que para el usuario es obvia su existencia.
El nuevo estándar trata de minimizar el problema de
ambigüedad en la base de datos.
VII. A P ÉNDICE

Fig. 4. Arquitectura de una Base de Datos Semántica [4]

También podría gustarte