Está en la página 1de 4

Un breve panorama sobre las Bases de Datos Sem anticas

Pedro Shiguihara Ju arez


Escuela de Inform atica Universidad Nacional de Trujillo Trujillo, Per u

Abstract El presente documento trata de dar una vista general a las Bases de Datos Sem anticas, tratando de identicar sus or genes y la motivaci on que ha provocado en los investigadores, su modelamiento de datos, arquitectura del sistema y la integridad sem antica. Explica adem as sus benecios y aspectos a tomarse en consideraci on debido a los problemas que se deber a afrontar al momento de modelamiento sem antico de los datos.

PALABRAS CLAVES Knowledge base I. I NTRODUCCI ON

el campo [1] En 1970, el Modelo Relacional revoluciono n de la de las Bases de Datos, debido al logro de la separacio representaci on l ogica del dato de la implementaci on f sicia, lo que produjo en adelante el desarrollo de lenguajes de consultas. La historia del modelamiento sem antica, tambi en data hacia esas fechas. Los modelos sem anticos fueron introducidos como herramientas de dise no de esquemas 1 . El motivo principal de su uso radicaba en la exactitud del modelo de datos, como muchos autores aseveran, el modelado sem antico, no es mas, que una representaci on del mundo real [3][4][2][1], estas propiedades no las ten an las aplicaciones de bases de datos t picas. [1] El primer modelo sem antico publicado apareci o en 1974, el rea madur a o con el desarrollo de muchos modelos importantes como Semantic Data Model [2], General Semantic Data Model [2][9], Iris Data Model, Sem-Object Data Model [3][4], IFO [6]. Hoy en d a se ha tratado de estandarizar ello, con la llegada del est andar SQL3 a no 1999, que no es mas que una extensi on del modelo relacional. [2][6] En n d ecadas anteriores entre 1970 y 1980 se planteaba una divisio entre el modelo conceptual modelado sem antico y el modelo l ogico modelado relacional, para 1990 Rishe [3][4] planteaba un modelo que suger a colocar el nombre de Semantic-SQL, que pueda ser una est andar en lenguajes de consultas sem anticas y planteaba una arquitectura del sistema ver gura en ap endice donde el modelo relacional actuaba de forma independiente al modelo sem antico, este ltimo actuaba de manera directa con el usuario y traduc u a la consulta a un modelo l ogico entendible por el Sistema de
1 Un esquema pod a ser dise nado en un alto nivel de modelado sem antico n y traducido en un medio tradicional para la implementacio

Base de Datos Relacional, adem as agregaba componentes tales como Knowledge Base 2 podr a traducirse como base del conocimiento. En este documento se presenta la secci on del problema la n de la Base cual motiva el surgimiento e implementacio de Datos Sem antica, en la secci on 3 se explica el manejo conceptual donde act ua el Modelamiento de Datos Sem antica, seguidamente en la secci on 4 las ventajas del modelamiento sem antico, en la secci on 5 las consideraciones de un modelado de datos sem antico que puede da nar la integridad sem antica [7][8][9] y nalmente la secci on 6 de conslusiones acerca de esto. II. P ROBLEMA : A SMILAR EL MUNDO REAL Hammer[2] ejemplica la iteracci on con la base de datos, sta es m y asevera que e as que una colecci on de valores, tiene transiciones en cada punto de la l nea del tiempo, por ello n experimenta cambios en su contenido. En esta ejemplicacio cada punto puede verse como una instant anea que representa el estado del sistema de aplicaci on de la Base de Datos. Por tanto esto reeja una secuencia de eventos a trav es del n. Los autores tiempo, ocurrentes en el ambiente de aplicacio relacionados a este tema denen el Modelado Sem antico de una Base de Datos como el Modelo del Sistema del Mundo Real, es decir un espejo de la estructura del sistema que modelo una empresa por ejemplo. III. M ANEJO C ONCEPTUAL n Todo esto enfoca la necesidad de establecer una interaccio con el usuario de una manera m as f acil, tratando de alguna manera brindar la propiedad de transparencia al usuario gico, ya que le mediante un modelo conceptual en vez de lo resultar a al usuario m as familiar. Un esquema l ogico est a expresado de una particular clase de estructura de datos llamado Modelo de Datos. Los modelos de estos datos son de bajo nivel y orientado a la m aquina, todo n l ello requiere que se expresa a nivel de representacio ogica que en t erminos de signicancia. En el modelo relacional la informaci on sem antica est a impl cita tanto as que no se podr a extraer en casi todos los casos y se pierden en el modelo [3]. Por ello Hammer explica que la sem antica deber a estar separada, Rishe tambi en lo plantea, y aplicada por el
2 KB tambi en est a presente en los fundamentos de la Web Sem antica, expl citamente en Resource Description Framework (RDF)

usuario directamente. El modelo en el nivel conceptual se trata de no perder la signicancia de la informaci on que provean las relaciones, entre entidades y brinde la facilidad para hacer consultas sobre ello [4].

IV-C. Abstracci on de datos Esto permnite proveer de datos derivados Knowledge base, que est an relacionados m as a la noci on que tiene el usuario acerca de las Bases de Datos. Estos datos no est an incorporados al esquema, es decir es un nuevo tipo de dato n ISA puede tomarse como una entidad nueva en una relacio por ejemplo. V. C ONSIDERACIONES DE UN MODELADO SEM ANTICO

En esta secci on explicamos dos consideracione importantes, la primera es la forma en que ser a implementada una Base de Datos Sem antica y la segunda est a relacionada con la integridad sem antica y la ambig uedad. V-A. Implementaci on y representaci on f sica

Fig. 1. Interacci on directa entre BD Sem antica y usuario

IV.

V ENTAJAS DEL MODELADO SEM ANTICO

Hammer [2] explica que si bien hay benecio por la facilidad de comprensi on y manejo de la Base de Datos, tambi en existen grandes consideraciones de, C omo ser a la implementaci on? y C omo ser a la representaci on f sica?, esto trae consigo por supuesto una complejidad superior a la de una Base de Datos con el Modelo Relacional. Esto se puede ver en Sistema de arquitectura de la gura en el ap endice. V-B. ca Ambig uedad del lenguaje natural e Integridad sem anti-

En esta secci on se tratar a tres ventajas, las m as resaltantes acerca de la implementaci on de una Base de Datos Sem antica. IV-A. Separaci on de componentes conceptuales y l ogicos

Los usuarios cuando realizan una consulta en una Base de Datos Relacional, navegan a trav es de ella por medio de un esquema con tablas de registros, logran obtener los datos requeridos mediante operaciones asociadas como juntura y proyecci on que son las m as comunes. Ac a se presenta un ejemplo extra nido de [1], donde se plante el caso: Mary es un agente de viajes, y se desea conocer la ciudad del empleador de Mary.. Para obtener esto en un lenguaje SQL se tendr a que tener expl citamente el conocimiento de las tablas donde se encuentra la informaci on del negocio y lugar donde vive el empleador. La sentencia SQL queda como sigue: SELECT city FROM BUSINESS WHERE BNAME in SELECT EMPLOYER FROM BUSTRAV WHERE PNAME=Mary Es decir obtiene primero el nombre del empleador de Mary por selecci on y luego la ciudad de donde pertenece el negocio donde trabaja el empleador. IV-B. Sobrecarga sem antica

Una relaci on es usada normalemente en el Modelo Rela n, la existencia cional, muchos tipos diferentes de informacio de entidades impl citas, propiedades, estructura y asociaciones entre ellos. El Modelo Sem antico de Datos provee una separaci on de esta informaci on, mediante la abstracci on de datos.

Las bases de datos sem antica se tratan de expresar como un lenguaje natural a nivel conceptual para las consultas realizadas por el usuario.Esto como se menciona en [7] libera al usuario de una tarea de comprensi on de la base de datos como explicamos en las ventajas. Pero resalta un nuevo problema, la previsi on de capacidades de actualizaci on. Por el mismo hecho de usarse un lenguaje casi natural, tiende a la ambig uedad, este nuevo problema no se ve en las consultas tradicionales. Esto es, debido a que el usuario est a fraseando sus peticiones con respecto a su punto de vista n o de la Base de Datos, lo cual puede ser una simplicacio una transformaci on de la estructura acutal de la base de datos, entendi endose que el usuario no est a ntimamente ligado con la estructura interna de la base de datos como ser a su dise nador. Las solicitudes de actualizaci on insertar, eliminar, modicar, podr a resultar en diferentes efectos, no esperados por el usuario. Incluso el usuario podr a hacer n peticiones que sean imposibles el problema de devolucio null. El trato que se da a la ambig uedad es seleccionar entre todos los estados posibles, el que involucra menos modicaciones a lo largo de la base de datos, para ello se siguen ciertas consideraciones que se explican en docuemtnso asociados a esta bibliograf a [9][7][8][5]. Shin [5] plantea una clasicaci on de posibles caminos que puede tomar una consulta y en la bibliograf a [10] se plantea el est andar SQL3 que trata el problema. Para Shin toma el siguiente camino: CC: Lingu sticamente Completo; Datos sem anticamente Completos IC: Lingu sticamente Incompleto;

Datos sem anticamente Completos CI: Lingu sticamente Completo; Datos sem anticamente Incompletos II: Lingu sticamente Incompleto; Datos sem anticamente Incompletos

Fig. 2. taxonom a dada por Shin [5]

Fig. 3. Ejemplos extra dos de [10]

Los IC tienen que ver con errores de tipograf a, gram aticalmente incorrecta, referencias indenidas. CI tiene que ver con t erminos desconocidos o ambig uos, t erminos vagos o informaci on faltante, par ametros inconsistentes y sem anticamente sin sentido; estos son los errores m as comunes que puede llevarse a cabo. Los II son errores sint acticamente y sem anticamente sin sentido. En la bibliograf a [5] se explica de manera detallada el problema, aqu se presenta la taxonom a dada por Shin. VI. C ONCLUSIONES

R EFERENCES
[1] HULL, RICHARD y ROGER KING, Semantic Database Modeling: Survey, Applications, and Research Issues, Computer Science Department, University of Southern California, ACM Press, September 1987. [2] HAMMER, MICHAEL y DENNIS MCLEOD, The Semantics Data Model: A Modelling Mechanism for Data Base Applications, MIT Laboratory for Computer Science, Cambridge, ACM Press, 1978. [3] RISHE NAPHTALI D., Semantic SQL: A Semantic Wrapper for Relational Databases, School of Computer Science, Florida International University, Miami, 2003. [4] RISHE N., SHU-CHING C., ALEXANDER V., JUN Y., XIAOLING L., ARTYOM S., RUKSHAM A., XIAOBIN M., DMITRY V., Semantic Access for Querying Databases, School of Computer Science, Floritda International University, Miami. URL: http://www.cs.u.edu/ chens/PDF/VLD800.pdf [5] SHIN, D. G., Semantics Modeling Issues for Processing Natural Language Database Queries, Computer Science and Engineering Department, University of Connecticut, ACM Press, January 1990. [6] ABITEBAW, SERGE Y RICHARD HULL, IFO: A Format Semantic Database Model, Institut National de Recherche en Informatique et en Automatique, ACM Press, November 1987. [7] DAVIDSON, JAMES y JERROLD KAPLAN, Natural Language Access to Data Bases: Interpreting Update Requests, Computer Science Department, Stanford University, California, ACM Press. April 1983. [8] CHEN A. y RICHARD HULL, An Execution Model for Limited Ambiguity Rules and Its Application to Derived Data Update, ACM Press, December 1995. [9] HAMMER, M. y DENNIS MCLEOD, A Framework for Data Base Semantic Integrity, MIT Laboratories for Computer Science, ACM Press, 1976. [10] TURKER, CAN y MICHAEL GERTZ, Semantic integrity support in SQL:1999 and commercial (object-)relational database management systems, Swiss Federal Institute of Technology, Zurich, Switzerland, ACM Press, 2001.

El modelado sem antico resume la complejidad l ogica representativa de la Base de Datos, esto permite mayor usabilidad por parte de m as usuarios, se extiende el amplio dominio para la redes de comunicaciones donde gica de los usuarios no son conscientes de la estructura lo una base de datos remota. La abstracci on de datos y la separaci on de componente l ogicos y conceptuales son propiedades importantes en las Bases de Datos Sem antica por tanto permiten la representaci on de la realidad a modo de espejo. Tambi en trae consigo mayor complejidad l ogica y problemas de interpretaci on de las consultas, debido a su edades. acercamiento al lenguaje natural, produce ambigu La base de datos Sem antica permite la adaptaci on de datos derivados, no existentes en la base de datos pero que para el usuario es obvia su existencia. El nuevo est andar trata de minimizar el problema de ambig uedad en la base de datos.

VII.

NDICE APE

Fig. 4. Arquitectura de una Base de Datos Sem antica [4]

También podría gustarte