Está en la página 1de 4

I Jornadas de Ingeniera Web01

Ontologas en la Web Semntica


Adolfo Lozano Tello 1

rea de Lenguajes y Sistemas Informticos. Departamento de Informtica. Escuela


Politcnica. Avda de la Universidad s/n, 10071 Cceres. Universidad de Extremadura. Espaa.
Tfno: +34 927257195. alozano@unex.es

Resumen
La enorme revolucin que supuso el uso generalizado de Internet
impuls el intercambio de informacin personal, acadmica y comercial. La Web est a
punto de sufrir un nuevo cambio: la informacin que aparece en Internet va a poder
interpretarse por los ordenadores sin necesidad de intervencin humana, es la denominada
Web Semntica. Para que esto ocurra, es necesario que la informacin de las pginas web
se codifique mediante ontologas. Las ontologas representarn el conocimiento de
Internet, definiendo formalmente los conceptos de los diferentes dominios y sus
relaciones, con capacidad para realizar deducciones con este conocimiento.

1. Introduccin
Actualmente, la Web es un
espacio preparado para el intercambio de
informacin diseado para el consumo
humano. Las pginas web son creadas
por personas para ser entendidas por
personas. No existe un formato comn
para mostrar la informacin, por lo cual,
los desarrolladores de pginas web crean
sus pginas dependiendo de los
potenciales usuarios que van a visitarlas.
Los actuales browsers de web realizan
la bsqueda de informacin, con ms o
menos fortuna, mediante palabras clave
que aparecern en el cdigo HTML de
las pginas web dispersas en Internet. En
los ltimos aos, algunas empresas estn
realizando
anotaciones
de
datos
introducidas dentro de este cdigo
HTML, siguiendo algn esquema de
anotacin comn, normalmente basado
en XML.
Otra carencia de la situacin
actual es que, con los estndares web del
momento, no se puede diferenciar entre
informacin
personal,
acadmica,
comercial, etc. Es decir, cuando un
buscador web realiza una consulta con
algunas palabras clave, normalmente
aparece informacin que no es til

porque no corresponde a lo que estamos


buscando. Adems no todas las pginas
proporcionan
igual
cantidad
de
informacin, debido precisamente a que
no existe un formato o convenio que nos
diga qu contenido debemos aadir a las
pginas web.
Por otro lado, los agentes de
bsqueda actuales no se disean para
comprender la informacin que reside
en la web, precisamente porque es
prcticamente imposible conocer la
representacin de los datos ubicados en
las diferentes pginas.
Si, por ejemplo, queremos buscar
en la red a un dentista, que pertenezca a
mi compaa de seguro mdico
Segurn, y que se encuentre en mi
ciudad Cceres, una forma podra ser
indicarle al buscador tres palabras clave:
dentista,
Segurn,
Cceres.
La
informacin que puede encontrar el
buscador puede estar relacionada con la
prensa,
demandas
judiciales,
informacin que rena compaas de
seguros, ... Normalmente gastamos
mucho tiempo en seleccionar la
informacin que nos puede ser til, y
navegando por las referencias URL
hasta encontrar, con suerte, lo que
estamos buscando. En el ejemplo, no es

Pgina 1

I Jornadas de Ingeniera Web01


seguro que los dentistas tengan pginas
personales de su consulta, o que la
compaa del seguro tenga un directorio
de sus dentistas, y que la informacin de
los dentistas est relacionada con la
ciudad que estoy buscando. Si por
casualidad encontrsemos varias pginas
personales de dentistas que tuvieran en
su anotacin HTML esas palabras clave,
es bastante improbable que la
informacin que nos proporcionen sea
similar; algunos pueden tener datos
informativos,
otros
publicaciones,
especialidades, horarios, ...
Es indudable que las ventajas que
ofrece Internet son enormes a la hora de
buscar informacin, pero adolece de una
manera de encontrar informacin de
forma precisa y de poder realizar
deducciones
con
la
informacin
existente. En la seccin 2, mostraremos
la visin de la web semntica para
solucionar estos problemas indicados y
veremos qu ventajas puede aportar a la
situacin actual. En la seccin 3 se
explicar el concepto de ontologa, pieza
fundamental
para
soportar
la
representacin del conocimiento que
necesita la web semntica. Y en la
seccin 4 se ver una perspectiva de los
pasos necesarios que se deben abordar
para hacer efectivo este adelanto en la
comunicacin del conocimiento.
2. El Intercambio de Conocimientos
en la Web Semntica
En los ltimos aos, muchos
investigadores estn diseando modelos
para transformar la red desde un espacio
de informacin a un espacio de
conocimientos. Recientemente, Tim
Berners-Lee, uno de los inventores de la
Web, defiende el desarrollo de la Web
con
conocimientos
[Ber01],
y
organizaciones como SematicWeb 1 se
encargan de estandarizar lenguajes y
herramientas para hacer efectiva la web
semntica. Pero, qu se puede hacer en
la web semntica?

www.semanticweb.org

La idea es que los datos puedan


ser utilizados y comprendidos por las
ordenadores
sin
necesidad
de
supervisin humana, de forma que los
agentes web puedan ser diseados para
tratar la informacin situada en las
pginas web de manera semiautomtica.
Se trata de convertir la informacin en
conocimiento,
referenciando
datos
dentro de las pginas web a metadatos
con un esquema comn consensuado
sobre algn dominio. Los metadatos no
slo especificarn el esquema de datos
que debe aparecer en cada instancia,
sino que adems podrn tener
informacin adicional de cmo hacer
deducciones con ellos, es decir, axiomas
que podrn aplicarse en los diferentes
dominios que trate el conocimiento
almacenado.
Con ello, se mejorar la bsqueda
de informacin y se potenciar el
desarrollo de aplicaciones de comercio
electrnico, ya que las anotaciones de
informacin seguirn un esquema
comn, y los buscadores web
compartirn con las anotaciones web los
mismos esquemas. Empresas que traten
con clientes y proveedores, podrn
intercambiar sus datos de productos
siguiendo estos esquemas comunes
consensuados.
Los agentes web no slo
encontrarn la informacin de forma
precisa, si no que podrn realizar
inferencias automticamente buscando
informacin relacionada con la que se
encuentra situada en las pginas, y con
los requerimientos de la consulta
indicada por el usuario.
3. Las Ontologas como Soporte de
la Web Semntica
Para que esto pueda llevarse a
cabo, se necesita que el conocimiento de
la web est representado de forma que
sea legible por los ordenadores, est
consensuado, y sea reutilizable. Las
ontologas proporcionan la va para
representar este conocimiento.
El trmino ontologa proviene de
la filosofa; pero en IA, tiene diferentes

Pgina 2

I Jornadas de Ingeniera Web01


connotaciones. La definicin declarativa
ms consolidada es la propuesta por
Gruber [Gru93a] y extendida por Studer
y colegas [Stu98] que la describe como
una especificacin explcita y formal
sobre
una
conceptualizacin
compartida. La interpretacin de esta
definicin es que las ontologas definen
conceptos y relaciones de algn
dominio, de forma compartida y
consensuada;
y
que
esta
conceptualizacin debe ser representada
de una manera formal, legible y
utilizable por los ordenadores.
Las
ontologas
tienen
los
siguientes componentes que servirn
para representar el conocimiento de
algn dominio [Gru93b]:
?? Conceptos: son las ideas bsicas
que se intentan formalizar. Los
conceptos pueden ser clases de
objetos,
mtodos,
planes,
estrategias,
procesos
de
razonamiento, etc.
?? Relaciones:
representan
la
interaccin y enlace entre los
conceptos del dominio. Suelen
formar la taxonoma del dominio.
Por ejemplo: subclase-de, parte-de,
parte-exhaustiva-de, conectado-a,
etc.
?? Funciones: son un tipo concreto de
relacin donde se identifica un
elemento mediante el clculo de una
funcin que considera varios
elementos de la ontologa. Por
ejemplo, pueden aparecer funciones
como categorizar-clase, asignarfecha, etc.
?? Instancias:
se
utilizan
para
representar objetos determinados de
un concepto.
?? Axiomas: son teoremas que se
declaran sobre relaciones que deben
cumplir los elementos de la
ontologa. Por ejemplo: Si A y B
son de la clase C, entonces A no es
subclase de B, Para todo A que
cumpla la condicin C1, A es B,
etc.

Estos ltimos componentes, los


axiomas, permiten junto con la herencia
de conceptos, inferir conocimiento que
no est indicado explcitamente en la
taxonoma de conceptos.
Por ejemplo, con el conocimiento
anotado en las pginas web mediante
ontologas, podremos utilizar un agente
web al que podamos preguntar sobre los
dentistas que se encuentren a una cierta
distancia de mi casa. Una de las posibles
respuestas que me podra ofrecer el
agente sera:
* Dra. Macas Dentista - ortodoncia
-

Consulta Particular
c/Rosa 4 - a 2 km

(85)-

- Hospital Clnico La Pazc/Principal 17 - a 5 km.


Incluso si la pgina web de la Dra.
Macas no tuviera especificada la
direccin del hospital, el agente web de
bsqueda poda utilizar un atributo de
los dentistas (Trabaja_en_Hospital), y
con el valor de este atributo encontrar el
atributo Direccin del concepto Hospital
y mostrar esta informacin del hospital
concreto de esa instancia de Dentista.
Adems
de
utilizar
estas
propiedades de relaciones y herencia de
los conceptos especificados, mediante
los axiomas se tendra mayor capacidad
expresiva del dominio almacenado. Por
ejemplo, si en este dominio tenemos
declarado el axioma:
Si el mdico trabaja en un hospital de
mi seguro no tendr que pagar minuta.
El agente podra, utilizando el
conocimiento representado en los
conceptos, sus relaciones y utilizando el
axioma, aconsejarnos sobre los dentistas
que cumplieran este requisito.
4. Cmo Alcanzar la Web Semntica
Para poder explotar la web
semntica, se necesitan lenguajes de
marcado apropiados que representen el
conocimiento
de
las
ontologas.
Actualmente, mediante anotaciones

Pgina 3

I Jornadas de Ingeniera Web01


RDF-RDF
Schema
se
pueden
representar algunas facetas sobre
conceptos de un dominio y permite,
mediante relaciones taxonmicas, crear
una jerarqua de conceptos. Pero se
necesitan lenguajes de marcado (basados
en RDF) con mayor expresividad y
capacidad de razonamiento para
representar los conocimientos que
contienen las ontologas [Cor00]. De
esta forma, existen ya disponibles
herramientas como Protg 2, OntoEdit
3
, o WebOnto 4 para realizar anotaciones
en pginas web con lenguajes de
marcado propios. El lenguaje con gran
capacidad
expresiva
que
est
emergiendo como un estndar para
realizar anotaciones de ontologas en
web es DAML 5, aunque en este
momento no tiene sus formatos
totalmente definidos.
Por otro lado, se necesitan agentes
y aplicaciones web que exploten este
conocimiento anotado en las pginas
web. Estos agentes de conocimientos
web sern capaces de interpretar los
esquemas ontolgicos y axiomas de
diferentes dominios, mantendrn la
consistencia de las instancias que se
inserten en las pginas web siguiendo
los esquemas ontolgicos definidos,
realizarn una bsqueda con inferencias
utilizando los axiomas situados en los
esquemas, y podrn realizar ligaduras de
los rboles taxonmicos de varias
ontologas.
Para potenciar el uso de
ontologas en la web, se necesitan
aplicaciones especficas de bsqueda de
ontologas, como (Onto)2Agent 6
[Arp00], que indiquen a los usuarios las
ontologas
existentes
y
sus
caractersticas para poder utilizarlas en
su sistema.

5. Conclusiones
La Web Semntica proporcionar
un salto cualitativo sobre el potencial de
la Web. Las principales ventajas de esta
nueva revolucin en Internet sern el
desarrollo de aplicaciones con esquemas
de datos comunes, fomento de las
transacciones entre empresas por
comercio electrnico y bsqueda de
informacin con inferencias.
Para poder lograr estos objetivos
se necesita unificar los contenidos
semnticos por medio de ontologas que
formalicen este conocimiento de forma
consensuada y reutilizable.
Se necesita un lenguaje comn
basado en web, con suficiente capacidad
expresiva y de razonamiento para
representar la semntica de las
ontologas; este hecho parece que lo
veremos en muy poco tiempo. Los
futuros agentes se disearn para
explotar el conocimiento de la web.
Referencias
[Arp00] Arpirez J., Gmez-Prez A.,
Lozano Tello A. and Pinto S. Reference
Ontology and (Onto)2Agent: The Ontology
Yellow Pages, Knowledge and Information
Systems, An International Journal, SpringerVerlag, 2 (2000) 4, 387-412. Mar. 2000.
[Ber01] Berners-Lee T., Hendler J. and
Lassila O, The Semantic Web, Scientific
American, Volume 284, Number 5 (May,
2001), pages 34-43.
[Cor00] Corcho O., Gmez-Prez A. A
Roadmap to Ontology Specification
Languages. EKAW 2000 pp. 80-96
[Gru93a] Gruber T. ,Toward Principles for
the Design of Ontologies Used for
Knowledge Sharing Technical Report KSL93-04, Knowledge Systems Laboratory,
Stanford University, CA, 1993.
[Gru93b] Gruber T., A Translation
Approach
to
Portable
Ontology
Specifications, Knowledge Acquisition, 5
(2), 199-220, 1993b.

http://protege.semanticweb.org
http://ontoserver.aifb.unikarlsruhe.de/ontoedit/
4
http://kmi.open.ac.uk/projects/webonto/
5
http://www.daml.org
6
http://delicias.dia.fi.upm.es/OntoAgent
3

[Stu98] Studer S, Benjamins R., and Fensel


D., Knowledge Engineering: Principles and
Methods,
Data
and
Knowledge
Engineering, 25, 161-197, 1998.

Pgina 4

También podría gustarte