Está en la página 1de 28

Tecnologas XML y

Web Semntica

Departamento de Informtica
Universidad de Oviedo

Fundamentos de la Web Semntica


Justificacin
Esquema General
Principales Vocabularios

Departamento de Informtica
Universidad de Oviedo

Reflexiones sobre la WWW


Web actual = mayor almacn de informacin recopilado
por personas humanas
Grandes cantidades de informacin sobre cualquier
asunto
Acceso casi instantneo desde cualquier lugar con
conexin a Internet
Sistema no centralizado Cualquier persona puede
aadir ms informacin

Reflexiones sobre la Web


Ahora estamos en la Web Sintctica

recurso
href
recurso
href

href

href

href
recurso

href

recurso

recurso

href

recurso

recurso
href
recurso

href
recurso

href

La Web Sintctica
Caractersticas actuales de la Web sintctica
Biblioteca Digital con hipertexto
Enorme biblioteca con documentos (llamados pginas Web)
conectados entre s mediante enlaces
Una base de datos (o plataforma comn de aplicaciones)
Un portal comn de aplicaciones accesibles a travs de pginas Web
y que muestran sus resultados como pginas Web
Una plataforma para multimedia
Una nueva forma de transmimtir programas de radio, TV y vdeos
Un esquema de nombres
Identidad nica para los documentos
Los ordenadores realizan la presentacin visual (tarea fcil) y
las personas navegan e interpretan el contenido (tarea difcil)
Sera posible que los ordenadores hiciesen algo ms?

Tareas difciles en la Web sintctica


Buscar fotos del profesor de este curso (Labra)

Buscar fotos del Director del Depto. donde


trabaja el profesor de este curso....

Tareas difciles en la Web Sintctica


Buscar informacin sobre la Universidad de Beihang en China...

Hacer un viaje de la Universidad de Beihang a la Universidad de Hainan?

Tareas difciles en la Web Sintctica


Buscar un ave que utilice el odo para orientarse y que no sea un murcilago

y si os digo que en ingls es barn owl ?

Tareas difciles en la Web Sintctica


Bsquedas complejas
Localizar informacin en almacenes de datos
Bsqueda de viajes
Comparar Precios de productos

Encontrar y utilizar servicios web


Delegar tareas complejas a agentes de la Web
Organizar un viaje en algn lugar con playa no
demasiado caro en el que hablen ingls
Buscar y comparar noticias que hablen de las
ltimas elecciones
Encargar una comida en el restaurante que no
tenga demasiadas caloras

El problema de la Web Sintctica


Las marcas de HTML
incluyen informacin
sobre la visualizacin
(tipo de letra, color, etc.)

<html><head><title>Pizzeria Al Capone</title></head>
<body bgcolor="blue" text="yellow">
<h1>Pizzas del Restaurante Al Capone</h1>
<table>
<caption>Tipos de Pizzas</caption>
<tr>
<td>Barbacoa</td><td>Salsa barbacoa, mozzarella, Pollo
Bacon, Ternera </td><td>8&euro;</td>
</tr>
...
</body>
</html>

El significado es
accesible a las
personas pero
no es
(fcilmente)
accesible a los
ordenadores

El problema de la Web Sintctica


La informacin que vemos nosotros...

Pizzas del Restaurante Al Capone


Tipos de Pizzas
Barbacoa
Salsa barbacoa, mozzarella, Pollo, Bacon,
Ternera 8
Lo que ve la mquina...

...

WWW2002
The eleventh international world
wide web conference
Sheraton waikiki hotel
Honolulu, hawaii, USA
7-11 may 2002
1 location 5 days learn interact
Registered participants coming
from
australia, can

XML como posible solucin?


Incluir etiquetas con un significado determinado...
<ttulo>Pizzas del Restaurante Al Capone</ttulo>
<pizza>
<nombre>Barbacoa</nombre><ingredientes>Salsa barbacoa,
mozzarella, Pollo, Bacon, Ternera
</ingredientes><precio>8 </precio></pizza>
...

La mquina vera...
<ttulo>Registered fdsja gts </ttulo>
<pizza><nombre> participants
</nombre><ingredientes> Salsa barbacoa,
mozzarella, Pollo, Bacon,
Ternera</ingredientes>
<precio>ic</precio></pizza>
...

XML como posible solucin?


Pero si vamos a otro contexto
<ave><nombreComn>Lechuza Comn</nombreComn>
<nombre>Tyto alba</nombre>
<clasificacin>Orden Estrigiformes, familia Titnidos.
</clasificacin>
<caractersticas>33-39 cm. 300-380 g. </caractersticas
...

La mquina vera...
<ave><nombreComn>Lechuza
Comn</nombreComn>
<famili>Tyto
alba</familia></ave>
<clasificacin>Orden
Estrigiformes, familia
Titnidos. </clasific

El problema es que las etiquetas no tienen un significado compartido

Ontologas
Posibilidad: Acuerdo global sobre el significado de las
anotaciones
Ejemplo: Dublin Core
Especifica etiquetas globales de anotacin de recursos. Por
ejemplo: dc:creator

Problemas:
Inflexibilidad
Limita el nmero de cosas que pueden expresarse

Otra posibilidad: Utilizacin de Ontologas


Definen el significado de las anotaciones
Los trminos nuevos pueden formarse a partir de otros
anteriores
El significado se define formalmente
Pueden especificarse relaciones entre trminos de varias
ontologas...

Web Semntica
La Web semntica (Tim Berners-Lee) pretende
desarrollar lenguajes que faciliten la inclusin en la
Web de contenido legible por las mquinas
Caractersticas de la Web que deben tenerse en
cuenta...
No centralizada: problemas para garantizar integridad de la
informacin)
Informacin Dinmica: puede cambiar la informacin e
incluso el conocimiento sobre esa informacin
Mucha informacin: El sistema no puede pretender acaparar
toda la informacin
Es abierta: Muchos sistemas anteriores usaban la Closed
World Assumption

Web Semntica
Antecedentes
Sistemas de representacin del conocimiento

rbol de la naturaleza y de la lgica


Ramn Llull (1235-1316)

Web Semntica
Antecedentes
Sistemas de representacin del conocimiento
Redes semnticas (R. Quillian, 1968)
Redes de conceptos enlazados entre s.
is-a = pertenece
ako (a kind of) = incluido

canario
isa
Pioln

ako
animal

Web Semntica
Antecedentes
Lgica = Estudio de los razonamientos
Lenguaje de la lgica permite representar conocimiento e
inferencias
Niveles:
Lgica proposicional
Lgica de predicados de primer orden
rdenes superiores

x(canario(x) animal(x) )
canario(pioln)
animal(pioln)

Sistemas de inferencia:
Consistencia: Todo lo que se deduce es correcto
Completud: Todo lo que es correcto es deducible
Decidibilidad: El algoritmo de deduccin finaliza
Tratabilidad: El algoritmo termina en un tiempo razonable
Problema P - NP

Web Semntica
Antecedentes
Diagramas entidad-relacin
Utilizados en la modelizacin de Bases de Datos

Pizza

nombre

contiene
tiempo

ingrediente

caloras

Otras notaciones de modelado en Ingeniera del Software


Ejemplo: UML

Web Semntica
Antecedentes
Mapas de tpicos
(http://www.topicmaps.org/)
Estndar de definicin de ndices
XTM es un vocabulario para mapas
de tpicos basado en XML
<topic id="pizzas"/> ...
<occurrence>
<instanceOf>
<topicRef xlink:href="#barbacoa"/>
</instanceOf>
<scope>
<topicRef xlink:href="#pizza"/>
</scope>
<resourceRef xlink:href="barbacoa.jpg"/>
</occurrence>
...
</topic>

Web Semntica
Confianza

Reglas
Datos
Lgica
Datos
Docum.
autodescrito

Ontologas
RDF + RDF Schema
XML + Namespaces + XML Schema
Unicode

URI

Firmas digitales

Demostracin

RDF
RDF (Resource Description Framework)
Origen: PICS (Platform for Internet Content Selection)
Descripcin de contenidos en Internet (meta-informacin)

RDF define un modelo basado en tripletas


Dicho modelo tiene una sintaxis XML asociada
Las tripletas son de la forma:
Sujeto --- Predicado --- Objeto
tieneColor

Amarillo

Incluye algunas propiedades predefinidas (type)


Mecanismos de reificacin

RDF Schema
Permite definir:
Clases y propiedades
Ej. "juan" es un individuo
"profesores" es una clase
"daClaseDe" es una propiedad

Jerarquas de clases y herencia


Ej. La clase "profesores" est incluida en "personas"

Jerarquas de propiedades
Ej. "esPadre" es una subpropiedad de "esProgenitor"

OWL
OWL (Web Ontology Language)
Permite definir Ontologas
Se basa en lgica descriptiva (description logics)
Aumenta la expresividad de RDF(S)
Comprimiso entre expresividad/computabilidad (3 niveles)
Se pueden indicar:
Restricciones de rango (las vacas slo comen hierba)
Clases disjuntas (ej. hombres y mujeres)
Combinaciones booleanas (unin, interseccin, etc.)
Personas=Hombres Mujeres

Restricciones de Cardinalidad (una persona tiene 2 progenitores)


Caractersticas de propiedades (transitividad, unicidad, inversa, ...)

Lgica y Demostracin
Orgenes = Representacin del conocimiento
Lgica = Fundamento de Representacin del Conocimiento
Existen tcnicas de prueba para subconjuntos de lgica de
primer orden
Propiedades: Consistencia, Completud, tratabilidad

RDF(S) y OWL son subconjuntos de lgica descriptiva


Otros formalismos: Clusulas Horn
Lenguajes de reglas en desarrollo. Ej. RuleML

Propiedades:
Reglas Montonas vs. No montonas
Mundo cerrado vs. Abierto

Ejercicio para maana

Plantear una posible aplicacin para la Web Semntica


Se puede consultar...

http://challenge.semanticweb.org/
Premio: 1000 para viaje y 250 para libros...

Seleccin de Enlaces
Pgina del consorcio: http://www.w3c.org/RDF
SemanticWeb: http://www.semanticweb.org
Directorio de Ontologas: http://www.schemaweb.info
Ontologas: http://www.ontology.org
Dublin Core: http://www.dcmi.org
Darpa Markup Language: http://www.daml.org
Open Directory Project: http://www.dmoz.org
OntoWeb:
http://www.ontoweb.org
Topic Maps: http://easytopicmaps.com

Fin de la Presentacin

También podría gustarte