WEB SEMNTICA: Uso de Protg para el Diseo de Ontologas
Cecibel Chamba (1)
Universidad Nacional de Loja Jenny Saraguro (2) Universidad Nacional de Loja En este articulo se dar una breve explicacin de lo que es Web Semntica y el uso del Software Protg para el desarrollo de ontologas. Esto se lo realizar mediante un ejemplo prctico del Area de la Energa de la Universidad Nacional de Loja. Adems, esta archivo owl se lo utilizar en una aplicacin desarrollada en JAVA que nos permitir leer el contenido de dicho archivo. Web Semntica Introduccin Hoy en da el uso de herramientas que permitan obtener resultados especcos y concretos respecto a lo que real- mente desea el usuario es uno de los objetivos que todas las empresas buscan conseguir. Es por ello que se ha desrrollado la web semantica cuyo objetivo se centra en: crear un medio universal que permita el intercambio de datos y brindar un mayor signicado a la informacin para que puedan ser interpretadas por las mquinas(Prez, 2007), logrando obtener como resultado de las busqueda informacin mas conable y acorde a lo que realmente se necesita. Es por ello que se dar un breve explicacin de lo que es web semntica, ontologas y el uso de software Protg para el desarrollo de un ontologa. Conceptos Bsicos Ante de dar la expliccin del ejemplo que se utiliz para el desarrollo de la ontologa es necesario conocer de conceptos bsicos los cuales nos permitirn una mejor comprensin. Que es Web Semntica? En la actualidad, la web semntica est en pleno desarrollo y, desde un punto de vista tcnico, los pilares fundamentales en que se basa son dos: las ontologas y las etiquetas.(INTEF, 2014) La Web Semntica es una web extendida, la misma est dotada de un mayor signicado. Se desarrolla con lenguajes universales que permitirn a los usuarios encontrar respuestas a sus preguntas de una forma ms rpida y sencilla gracias a la mejor estructuracin de la informacin. La web semntica est surgiendo como una evolucin de la Web Actual a la que se le agrega una estructura para captar el signicado de los contenidos de las pginas y proporcionar un ambiente donde las aplicaciones puedan procesar y relacionar contenidos provenientes de distintas fuentes. En el ao 2001 se escucha el concepto de web semntica impulsado por Tim Berners-Lee, inventor de la WWW, URIs, HTTP y HTML. Existe un equipo en el World Wide Web Con- sortium (W3C) los cuales se dedican a mejorar, extender y estandarizar el sistema y muchos lenguajes, publicaciones y herramientas han sido ya desarrollados. (Prez, 2007) Componentes de la Web Semntica? La W3C utiliza la siguiente gura para mostrar cuales son los componentes estructurales bsicos que forman parte de la Web Semntica: Figura 1. Componentes de la Web Semntica Las funciones que aportan los distintos componentes de la Web Semntica son(Anomino, 2008): Unicode.- el alfabeto, es un estndar cuyo objetivo es proporcionar que cualquier texto e idioma sea codifcado para el uso informtico. El mismo nos permite mostrar informacin en cualquier idioma y Cecibel Chamba-Jenny Saraguro Tutor: Ing Henry Paz con la certeza de que no aparezcan smbolos extraos. URI.- las referencias. URI es el acrnimo de Uniform Resource Identier, Identicador Uniforme de Recur- sos; se trata del URL (descripcin de la ubicacin) ms el URN (descripcin del espacio de nombre). Son cadenas que permiten acceder a cualquier recurso de la Web. En la Web Semntica las URIs son las encargadas de identicar objetos. Todos los objetos pueden ser identicados mediante una URI. Si dos objetos cuentan con la misma URI pueden existir colisiones. XML + NS + XMLSchema.- Esta es la capa ms tcnica de la Web Semntica. En ella se encuentran agrupadas las diferentes tecnologas que posibilitan la comunicacin entre agentes. XML: ofrece un formato comn para el intercambio de documentos. NS (namespace): proporciona un mtodo para cua- licar elementos y atributos de nombres usados en documentos XML asociandolos con espacios de nombre identicados por referencias URIs. XMLSchema: es un lenguaje que permite describir la estructura y restringir el contenido de documentos XML. RDF + RDFSchema.- Est basada en la capa anterior, dene el lenguaje universal con el que podemos expresar diferentes ideas en la Web Semntica. RDF es un lenguaje que dene un modelo de datos para describir recursos mediante tripetas sujeto-predicado- objeto. sujeto: el recurso al que nos referimos. predicado: el recurso que indica que es lo que estamos deniendo. objeto: puede ser el recurso o un literal que podra considerarse el valor de lo que acabamos de denir. RDFSchema: provee un vocabulario denido sobre RDF que permite el modelo de objetos con una semntica claramente denida. Esta capa no slo ofrece descripcin de los datos, sino tambin cierta informacin semntica. Tanto esta capa como la ante- rior corresponden a las anotaciones de la informacin (metadatos). Vocabularios de Ontologas.- Nos permite clasicar la informacin. Esta capa permite extender la funcio- nalidad de la Web Semntica agregando nuevas clases y propiedades para describir los recursos. El uso de ontologas permite describir objetos y sus relaciones con otros objetos, ya que una ontologa es la especicacin formal de una conceptualizacin de un dominio concreto del conocimiento. Lgica.- dene las reglas lgicas y mecanismos para hacer inferencia. Interpretacin comn de las operaciones realizadas a nivel ontolgico. Pruebas.- Se intercambiarn pruebas escritas en el lenguaje unicador de la Web Semntica. Este lenguaje posibilita las inferencias lgicas realizadas a travs del uso de reglas de inferencia. Conanza.- Hasta que no se haya comprobado de forma exhaustiva las fuentes de informacin, los agentes deberan ser muy esctipcos acerca de lo que leen en la Web Semntica. Firma Digital.- Utilizada por los ordenadores y agentes para vericar que la informacin ha sido ofrecida por una fuente de conanza. Ontologas Una ontologa es una descripcin de un dominio. Las ontologas se pueden escribir en varios formatos y pueden ser utilizados por las computadoras para razonar sobre el dominio que describen. Tambin son tiles como un formato comn que permita el intercambio de conocimiento a travs de aplicaciones / plataformas. Las ontologas estaremos trabajando estn escritas en OWL 2. OWL 2 es un lenguaje de ontologas que dene los conceptos que puede utilizar para escribir una ontologa. El conocimiento en ontologas se formaliza principal- mente usando seis tipos de componentes: clases, atributos, relaciones, funciones, axiomas e instancias(Garcia, 2008): Una clase puede ser alo sobre lo que se dice algo, como por ejemplo un tipo de objeto, la descripcin de una tarea, las clases en una ontologa se suelen organizar en taxonomas. UNIVERSIDAD NACIONAL DE LOJA ycchambaj@unl.edu.ec, jlsaragurop@unl.edu.ec 2 Cecibel Chamba-Jenny Saraguro Tutor: Ing Henry Paz los atributos representan la estructura interna de los conceptos. Atendiendo su origen, los atributos se clasicn en especcos y heredados. Los atributos especcos son aquellos que son propios del concepto al que pertenecen , mientrs que los heredados vienen dos por ls relaciones taxonmicas en las que el concepto desempea el rol de hijo y , po lo tanto, hereda los atributos del padre. Los atributos vienen cracterizdos por el dominio en el cual pueden tomar valor. las relaciones representan un tipo de interaccin entrelos conceptos del dominio. Se dinen formal- mente como cualquier subcojunto de un producto de n conjuntos, esto es: R : C 1 C 2 ... C n . Entre los distintos tipos de relaciones posibles, se encuentran las relciones taxonmicas (es_un) y las mereolgics o partonmicas (parte_de) como relaciones binarias ms destacadas. las funciones son un tipo especial de relciones en las que el nsimo elemento de la relacin es nico para los n 1 precedentes. Formalmente, denimos ls funciones (F) como: F : C 1 C 2 ... C n1 . los axiomas son expresiones que son siempre ciertas. Pueden ser incluids en una ontologa com muchos propsitos, tles como denir el signicado de los componentes ontolgicos, denir restricciones com- plejas sobre los valores de los atributos, argumentos de relaciones,etc, vericando la correcin de la informacin especicada en la ontologa o deduciendo nueva informacin. las instancias son ls ocurrencias en el mundo real de los conceptos. En una instancia todos los atributos del concepto tienen asignado un valor concreto. Tipos de Ontologas. Existen diferentes clsicaciones detipos de ontologas. Se siguen principalmente dos criterios para estas clasicaciones: el tipo de conocimiento que con- tienen y la motivacin de la ontologa. Clasicacin por el conocimiento que contienen: Gertjan Vn Heijst y sus colegas propusieron los siguientes tres tipo de ontologas atendiendo al conocimiento que contienen Ontologas terminolgicas: especican los trminos para representar conocimiento en un dominio determi- nado. Ontologas de informacin: especican la estructur de los registro de la base de datos. Los esquemas de bases de datos son un ejemplo. Ontologas para modelar conocimiento: especican conceptualizaciones de conocimiento. Estetipo de ontologas tiene una estructura interna nucho ms rica que los anteriores y son las que interesan a los desarrolladores de sistemas basados en conocimiento. Clasicacin por motivacin: esta clsicacin de hace dependiendo del motivo por el que se elabora la ontologa. Ontologas para la representacin de conocimiento: permiten especicar las conceptualizaciones que subyacen a los formalismos de representacin del conocimiento, por lo que tambin se denominan meta-ontologas(meta-level o top-level ontologies). Ontologas genricas: dinen conceptos generales y fundacionales del conocimiento como las estructuras parte/todo, la cuanticacin, los procesos o los tipos de objetos. Estas ontologas son reutilizables en diferentes dominios. Ontologas del dominio: permiten representar el conocimiento especializado pertinente de un dominio o subdominio, como la medicina, las aplicaciones militares, la cardiologa, etc. Ontologas de aplicacin: estn ligadas al desarrollo de una aplicacin concreta. Tales ontologas cubren los aspectos relacionados con aplicaciones particula- res. Tipicamente estas ontologas toman conceptos de ontologas del dominio y genricas, asi como mtodos especcos para realizar la tarea, por lo que frecuente- menteno pueden ser reutilizadas. Protg Descripcin General: Es un ditor de cdigo aberto sado para construir Ontologas y un marco general para representar el conocimiento. Est escrito en Java que es un lenguaje de programacin orientado a objetos.(Valenzuela, 2012) Se usa para construir aplicaciones para la Web Semntica, para hacer una descripcin semntica de la informacin. Sus UNIVERSIDAD NACIONAL DE LOJA ycchambaj@unl.edu.ec, jlsaragurop@unl.edu.ec 3 Cecibel Chamba-Jenny Saraguro Tutor: Ing Henry Paz archivos se hacen en el lenguaje OWL. (Valenzuela, 2012) Entre sus principales caracteristicas tenemos(Chesani, 2010): Desarrollado en Stanford (EE.UU.) Open Source, basado en Java, extendible Arquitectura de plug-in, cantidad de plug-ins disponi- bles Exportaciones de ontologa en muchos formatos (rdfs, owl) Para el desarrollo de un ontologa Protg disponemos de las siguientes secciones: Active Ontology: Esta cha se describe la informa- cin acerca de la propia ontologa, como informacin sobre la versin y la informacin sobre el contenido de la ontologa. Esta informacin se conoce como la meta-informacin. Entities: Esta cha tiene la funcionalidad de los prxi- mos cuatro pestaas combinadas (clases, propiedades de objetos, propiedades de los datos, y los individuos). Classes: Aqu es donde usted puede editar las clases de la ontologa. Vamos a estar cubriendo esta cha en detalle. Esta cha muestra las clases de la ontologa que se han denido. Clases de Ontologa son muy si- milares a las clases en un programa orientado a obje- tos. Al igual que en las clases orientadas a objetos de programacin en ontologas forman una jerarqua. Figura 2. Clases: Universidad Nacional de Loja Clases equivalentes Esta seccin describe otras clases o grupos que son equivalentes a la clase seleccionada. Superclases son la clase principal (es) de la clase se- leccionada (recuerda-ya que puede tener mltiples cla- ses tambin puede tener varias superclases). Miembros Esto muestra los miembros de esta clase. Clases disjuntas Esto le permite seleccionar de forma explcita las clases que los miembros de la clase selec- cionada no pueden tambin pertenecer. Object Properties: Esta cha le permite editar las posibles relaciones entre dos objetos. Vamos a estar cubriendo esta cha en detalle. Tambin se llaman predicados. La sintaxis es objeto1 OBJECTPROPERTY object2 por ejemplo Estudian- te_m5 recibe Materia_m5 Funcional Una propiedad funcional Funcional e In- verse slo puede tener un miembro en la gama para cualquier miembro del dominio. Transitiva Esto signica que x aProperty y y z aProperty y implica z aProperty x. Un ejemplo sen- cillo sera la propiedad tieneHermano. Symmetric Esto signica que x aProperty y implica y aProperty x. Asimtrica Esto signica que si x aProperty y luego y aProperty x no puede ser cierto tambin. Reexivo Esto signica que x aProperty x es siem- pre cierto. Por ejemplo si estuviera modelando redes de amigos es posible que desee un isKnownBy propie- dad. Esta propiedad podra ser reexiva, ya que todos conocen a s mismos. Irreexiva Esto signica que x aProperty x nunca es verdad. En los ejemplos que signica que una persona no puede ser su propio hermano. Figura 3. ObjectProperty: Universidad Nacional de Loja Data Properties: Esta cha le permite editar qu da- tos (cadenas, enteros, de fecha y hora, etc) puede que aadido a las clases. Individuals: Aqu es donde usted puede editar las ins- tancias de clases, llamados individuos. Vamos a estar cubriendo esta cha en detalle. Son todas las instancias dentro de su ontologa. OWL Viz: Esta pestaa tiene herramientas que le per- miten visualizar partes de la ontologa. DL Query: Esta pestaa tiene herramientas para la consulta de informacin en la ontologa. UNIVERSIDAD NACIONAL DE LOJA ycchambaj@unl.edu.ec, jlsaragurop@unl.edu.ec 4 Cecibel Chamba-Jenny Saraguro Tutor: Ing Henry Paz Figura 4. Individuos: Universidad Nacional de Loja Caso Prctico Para el caso prctico se ha realizado La estructura de la universidad nacional de loja constituda en : UNL (Universidad Nacional de Loja) reas Carreras Docentes y mdulos Dentro de docentes se encuentran los docentes agrega- dos como individuos. Dentro de mdulos se encuentran las mallas disponi- bles , Entre las que se cuenta con 2 mallas Malla 1: que es la vigente en mdulo 1 y 2, en las que es po- sible que los estudiantes del mdulo 2 puedan recibir materias del mdulo 1. Malla 2: que es en la que a cada mdulo (Mdulo 3,4,5,6,7,8,9,y 10) tiene sus correspondientes materias sin poder recibir las de otros mdulos. Dentro de cada malla los mdulos respectivos: como subclase de cada mdulo se encuentran Materia y Es- tudiante. Finalmente los individuos correspondientes a Materias y estudiante En la grca siguiente se muestran las relaciones entre obje- tos: Estudiante m 1RecibesoloMateria m 1. Estudiante m 2RecibesoloMateria m 2. Estudiante m 2RecibealgunaMateria m 1. Estudiante m 3RecibesoloMateria m 3. Estudiante m 4RecibesoloMateria m 4. Estudiante m 5RecibesoloMateria m 5. Estudiante m 6RecibesoloMateria m 6. Estudiante m 7RecibesoloMateria m 7. Estudiante m 8RecibesoloMateria m 8. Estudiante m 9RecibesoloMateria m 9. Estudiante m 10RecibesoloMateria m 10. y su inversa: Materia m 1es r ecibida p orsoloEstudiante m 1. Materia m 2es r ecibida p orsoloEstudiante m 2. Materia m 1es r ecibida p oralgunosEstudiante m 2. Materia m 3es r ecibida p orsoloEstudiante m 3. Materia m 4es r ecibida p orsoloEstudiante m 4. Materia m 5es r ecibida p orsoloEstudiante m 5. Materia m 6es r ecibida p orsoloEstudiante m 6. Materia m 7es r ecibida p orsoloEstudiante m 7. Materia m 8es r ecibida p orsoloEstudiante m 8. Materia m 9es r ecibida p orsoloEstudiante m 9. Materia m 10es r ecibida p orsoloEstudiante m 10. Docentes imparte Materia (cada clase materia correspon- diente a cada mdulo/ciclo) Materia (cada clase materia correspondiente a cada mdu- lo/ciclo) Es i mpartida p orDocentes Cada individuo dentro de las clases correspondientes a materia y estudiantes tamben cuentan con las respectivas re- laciones asignadas. Figura 5. Ontologa: UNL en Protege Tambin se ha tomado en cuenta las relaciones existentes tanto entre clases como son las propiedades y restricciones de objeto, como las propiedades asignadas a cada individuo. Con la herramienta protege exportamos el archivo (.owl) pa- ra obtener los datos desde java como el ejemplo presentado a continuacin. En esta gura se muestra la lectura del archivo .owl que contiene la ontologa. UNIVERSIDAD NACIONAL DE LOJA ycchambaj@unl.edu.ec, jlsaragurop@unl.edu.ec 5 Cecibel Chamba-Jenny Saraguro Tutor: Ing Henry Paz Figura 6. Datos obtenidos del archivo owl Luego se obtienen los siguientes datos: Figura 7. Datos obtenidos del archivo owl Conclusiones: La web semntica es un gran paso hacia la optimiza- cin de la organizacin y bsqueda de la informacin de forma mejorada para navegar y encontrar informa- cin deseada entre la innidad de informacin encon- tramos en internet. La herramienta protege es muy til ya que permite op- timizar tiempo y eciencia en el desarrollo de las onto- logas ya que se pueden realizar de manera simplica- da y nos permite obtener directamente el archivo xml, con la ontologa realizada. Referencias Anomino. (2008). Web semntica. Descargado de http://luisf.wikispot.org/Web_Semantica Chesani, F. (2010). Introduction to prot- g. Descargado de http://www.lia.deis. unibo.it/phd/materials/courses/Introduction %20to %20Knowledge %20Representation %20and %20the %20Semantic %20Web/IntroProtege.pdf Garcia, R. (2008). Tcf: Xml y web semntica. es- tudio del impacto de las aplicaciones comerciales basa- das en tecnologas de web semntica. Descargado de http://openaccess.uoc.edu/webapps/o2/bitstream /10609/1861/1/42897.pdf INTEF. (2014). Web semntica: un mun- do de posibilidades. Descargado de http://blog.educalab.es/intef/2014/02/11/ web-semantica-un-mundo-de-posibilidades/ Prez, D. (2007). Web semntica y sus principales caractersticas. Descargado de http://www.maestrosdelweb.com/editorial/web-semantica- y-sus-principales-caracteristicas/ Valenzuela, M. (2012). Herramienta prot- g para la web semntica. Descargado de http://www.slideshare.net/Mvalenzuelasosa/ UNIVERSIDAD NACIONAL DE LOJA ycchambaj@unl.edu.ec, jlsaragurop@unl.edu.ec 6