Documentos de Académico
Documentos de Profesional
Documentos de Cultura
EN INTERNET
HACIA LA WEB SEMÁNTICA
ERNESTO JÍMENEZ RUIZ (erjimenez@udec.cl)
1
EVOLUCIÓN DE LA WEB (I)
Búsqueda de Información en la Web:
Utilización de motores de búsqueda basados en
palabras clave (búsqueda sintáctica).
Problemas típicos
Precisión en resultados baja
No siempre se extraen documentos relevantes
Mucha dependencia de la terminología usada
2
EVOLUCIÓN DE LA WEB (III)
Una máquina puede reconocer las distintas partes de
una página web y tratarlas, sin embargo las
posibilidades de procesamiento son muy limitadas
Alternativas:
Utilización de técnicas de Extracción de Información:
Procesamiento Lenguaje Natural + IA
Representar los contenidos de la Web para poder ser
procesados* por las máquinas: Web Semántica
3
LA WEB SEMÁNTICA (II)
Tecnologías para la Web Semántica
Metadatos
Ontologías
Lógica
Agentes
Lenguajes de Comunicación
4
LA WEB SEMÁNTICA (IV)
Tecnologías para la Web Semántica: Metadatos (II)
Los metadatos permiten incorporar información sobre los datos (p.e.
sobre la estructura) facilitando el procesamiento automático
<book>
<title>Nonmonotonic Reasoning: Context-Dependent Reasoning</title>
<author>V. Marek</author>
<author>M. Truszczynski</author>
<publisher>Springer</publisher>
<year>1993</year>
<ISBN>0387976892</ISBN>
</book>
5
LA WEB SEMÁNTICA (VI)
Tecnologías para La Web Semántica: Lógica (I)
La lógica es la disciplina que estudia los principios del
razonamiento. En general una lógica proporciona:
Un lenguaje formal para describir conocimiento
Una semántica formal que define el significado de las sentencias
que se pueden describir
Métodos de razonamiento automáticos para inferir conclusiones
(implícitas) a partir del conocimiento descrito (de forma
explícita).
6
LA WEB SEMÁNTICA (VIII)
Tecnologías para La Web Semántica: Agentes (I)
Los agentes son programas software que realizan tareas de manera
autónoma y proactiva
Autónoma: Capaz de operar sin intervención humana y de un cierto
control sobre las propias acciones
Proactiva: Capaz de exhibir un comportamiento dirigido por objetivos.
7
LA WEB SEMÁNTICA (X)
Web semántica versus inteligencia artificial
La mayor parte de las tecnologías para la web
semántica se basan en resultados de investigación
(más o menos maduros) del campo de la Inteligencia
Artificial (IA)
Las falsas expectativas de la IA en el pasado no
deben influir en la credibilidad de la web semántica
porque no se pretende replicar la inteligencia
humana.
8
ONTOLOGÍAS (I)
Definición (I)
El sentido filosófico del término ontología hace
referencia a la esencia misma del ser, a su
existencia (onto=ser).
ONTOLOGÍAS (II)
Definición (II)
Una ontología es una descripción formal y
explícita de los conceptos de un dominio, y las
relaciones entre ellos.
9
26/10/2005 Nuevas Tendencias en Internet: Hacia la Web Semántica 19
ONTOLOGÍAS (III)
¿Qué es una Ontología y que no?
10
ONTOLOGÍAS (IV)
¿Qué es una Ontología y que no?
Tesauros: listas de términos que incorporan
relaciones como p.e. sinonimia, homonimia, más
amplio que, más restringido que
Interpretación ambigua debido al uso del lenguaje
natural, aunque las relaciones inducen algo
parecido a una jerarquía.
ONTOLOGÍAS (V)
¿Qué es una Ontología y que no?
Marcos (frames): sistemas de clases con información de
propiedades/atributos y con herencia (Relaciones is-a).
(Protégé 2000)
Restricciones Lógicas: Otro punto de vista en el que el
conocimiento esta distribuido en axiomas (OWL)
Lógica de descripciones: expresiones lógicas que definen
conceptos
Lógica de primer orden (lógica de predicados): expresiones
lógicas que describen conceptos, propiedades y relaciones.
11
ONTOLOGÍAS (VI)
Lenguajes de Representación de Ontologías (I)
La arquitectura de Niveles de T. Berners Lee
ONTOLOGÍAS (VII)
Lenguajes de Representación de Ontologías (II)
La arquitectura de Niveles de T. Berners Lee
XML permite estructurar documentos según vocabularios
definidos por el usuario
RDF proporciona un modelo para describir aserciones sobre
recursos Web.
RDF Schema proporciona primitivas para organizar objetos en
jerarquías (ontologías simples)
Ontology vocabulary permite expresar relaciones más complejas
entre objetos (ontologías complejas): OWL
12
ONTOLOGÍAS (VIII)
Lenguajes de Representación de Ontologías (III)
La arquitectura de Niveles de T. Berners Lee
Logic permitirá describir conocimiento declarativo a nivel de
aplicación
Proof se ocupará de los procesos de inferencia y de la
representación de pruebas en lenguajes de niveles inferiores
Trust se apoyará en la utilización de firmas digitales y otros
recursos para garantizar las operaciones realizadas
ONTOLOGÍAS (IX)
Lenguajes de Representación de Ontologías (IV)
XML y XML Schema / DTD
XML es un metalenguaje de marcado que proporciona un
marco uniforme y una serie de herramientas para el intercambio
de datos y metadatos.
<book>
<title>Nonmonotonic Reasoning: Context-Dependent
Reasoning</title>
<author>V. Marek</author>
<publisher>Springer</publisher>
<year>1993</year>
<ISBN>0387976892</ISBN>
</book>
26/10/2005 Nuevas Tendencias en Internet: Hacia la Web Semántica 26
13
ONTOLOGÍAS (IX)
Lenguajes de Representación de Ontologías (V)
RDF/RDFS: Resource Description Framework (Schema).
Basado en XML.
XML no proporciona herramientas para expresar la semántica
(significado) de los datos, p.e. no existe una interpretación
estándar del anidamiento de elementos
RDF(S) proporciona primitivas para organizar vocabularios en
jerarquías tipadas: relaciones subclase y subpropiedad,
restricciones de dominio y rango, e instancias de clases
XMLS VS RDFS
XMLS define la estructura del documento XML.
RDFS: define la jerarquía de un dominio, las relaciones entre los
conceptos
ONTOLOGÍAS (X)
Lenguajes de Representación de Ontologías (VI)
OWL (Ontology Web Language)
Limitaciones de RDF(S)
Definir propiedades de ámbito local: no podemos
especificar restricciones de rango aplicables sólo a
determinadas clases, p.e. que las vacas sólo comen plantas y
que otros animales comen carne también
Expresar la disyunción de clases, p.e. no podemos
especificar que hombre y mujer son clases disjuntas
14
ONTOLOGÍAS (XI)
Lenguajes de Representación de Ontologías (VII)
OWL (Ontology Web Language)
Limitaciones de RDF(S)
Definir clases como combinación de otras (unión
intersección o complemento), p.e. no podemos especificar
que la clase persona es la unión de hombre y mujer
Expresar restricciones sobre la cardinalidad de
propiedades, p.e. no podemos especificar que una
asignatura debe tener al menos un profesor
Describir propiedades específicas de las propiedades, p.e.
no podemos expresar que una propiedad es una función
(valor único), que es transitiva o que es la inversa de otra
ONTOLOGÍAS (XII)
Lenguajes de Representación de
Ontologías (VIII)
OWL (Ontology Web Language).
Requerimientos (Extensión de RDF(S)):
Una sintaxis bien definida
Una semántica formal
Suficiente poder expresivo
Conveniencia de la expresión
Un método de razonamiento eficiente
15
ONTOLOGÍAS (XIII)
Lenguajes de Representación de Ontologías (IX)
OWL (Ontology Web Language).
Tipos de OWL
OWL Full Permite utilizar todas las primitivas de OWL y
combinarlas de manera arbitraria con RDF(S), incluso
modificando las primitivas de RDF y OWL.
Ventajas: todo documento RDF(S) válido es válido en OWL Full,
y toda conclusión en RDF(S) lo es también en OWL Full.
Inconvenientes: el lenguaje no es decidible
ONTOLOGÍAS (XIV)
Lenguajes de Representación de Ontologías (X)
OWL (Ontology Web Language).
Tipos de OWL
OWL DL Sublenguaje de OWL Full que no permite la
aplicación de las primitivas de OWL entre sí, para asegurar la
correspondencia con una lógica de descripciones.
Ventajas: es posible un método de razonamiento eficiente.
Inconvenientes: para ser válido en OWL DL, un documento RDF
tendrá que ser extendido en ciertos aspectos y restringido en otros
16
ONTOLOGÍAS (XV)
Lenguajes de Representación de Ontologías (XI)
OWL (Ontology Web Language).
Tipos de OWL
OWL Lite Restricción de OWL DL que excluye
primitivas como clasesenumeradas y cardinalidades
arbitrarias.
Ventajas: simplicidad del lenguaje y eficiencia del método
de razonamiento.
Inconvenientes: poder expresivo limitado
ONTOLOGÍAS (XVI)
Aplicación de la Ontologías
Las ontologías facilitan la comunicación entre seres
humanos o entre sistemas informáticos
Proporcionan ventajas para la ingeniería de sistemas
informáticos:
Reutilización: una ontología, como codificación de un dominio,
puede ser reutilizada y/o compartida
Búsqueda: los términos de la ontología pueden usarse como
meta-datos para indexar documentos
Adquisición del conocimiento: un sistema basado en el
conocimiento se construye de forma más fiable partiendo de una
ontología
17
PROTÉGÉ 2000 (I)
Es un entorno para el desarrollo de ontologías
Código abierto
Desarrollado por el grupo Stanford Medical
Informatics en la Stanford University School
of Medicine
Versión Actual: 3.1.1
Página Web: http://protege.stanford.edu
18
PROTÉGÉ 2000 (III)
Propiedades (Slots)
Nombre
Tipo de valor: Cualquiera, Booleano, Clase,
Número (Entero o Real), Instancia, Cadena o
Símbolo (Lista de valores)
Documentación
Cardinalidad: Requerido (al menos 1), múltiple
(más de 1)
Propiedad inversa
26/10/2005 Nuevas Tendencias en Internet: Hacia la Web Semántica 37
19
PROTÉGÉ 2000 (V)
Creación de unas Ontología Sencilla
20
FIN SESIÓN
Página Web Personal:
http://ejimenez.taponcitos.com
21