Está en la página 1de 18

WEB SEMNTICA, MARCADORES DISCURSIVOS Y METARREPRESENTACIN

Sebastin Bonilla
Universidad Pompeu Fabra
RESUMEN: El proyecto de implementacin de inteligencia en la futura Web Semntica dibuja un
nuevo escenario tecnolgico ideal(izado) en el que la informacin, organizada ontolgicamente y
recorrida por agentes inteligentes, comunicativos, ejecutivos, autnomos y adaptativos, deviene
conocimiento.
El problema esencial de este planteamiento radica en que el acceso al significado no
es un fenmeno representacional (lingstico-gramatical), sino metarrepresentacional (cognitivopragmtico).
En este trabajo, se propone el diseo de un agente metarrepresentacional que localice
la informacin relevante guiado por los marcadores discursivos que acotan zonas metadiscursivas
de reformulacin y de conclusin en los textos. La ventaja que ofrece esta lnea de investigacin es
que permite operar no con la informacin descontextualizada inscrita en el cdigo del recurso
(como se plantea en la propuesta semntica), sino con la informacin contextualizada y, por ello
enriquecida, contenida en el propio discurso.
PALABRAS CLAVE: Web Semntica. Metarrepresentacin. Marcadores Discursivos.
ABSTRACT: The project of intelligence implementation in the future Semantic Web draws a new
ideal(ized) technological scene in which information happens knowledge, through the onthological
organization of information, and by means of the design of communicative, executive, autonomous,
and adaptive intelligent agents.
The essential problem of this exposition is that access to meaning is not a
representacional phenomenon (grammar-linguistic), but metarrepresentacional one (pragmaticcognitive).
In this work, we propose the design of a metarrepresentacional agent to locate
relevant information guided by discourse markers that limits metadiscoursives zones of
reformulation and conclusion in texts. The advantage that offers this way of investigation is that it
allows to operate not with the descontextualized information insert in the resource code (as
considers in the semantic proposal), but the contextualized information and, for that reason
enriched, contained in the own discourse.
KEYWORDS: Semantic Web. Metarepresentation. Discourse Markers.

1. WEB SEMNTICA, ONTOLOGAS Y AGENTES INTELIGENTES.

Como cualquier usuario de Internet habr advertido por su propia experiencia personal
diaria, la web actual est construida con una cantidad ingente de recursos poco estructurados y
pobremente definidos. El precio que se paga por ello es la emergencia de una cantidad
desproporcionada de informacin irrelevante.
Recibido el 01-12-2006
RL 5 (2006): 155-172
ISSN 1885-9089

155

Una de las causas formales infraestructurales que explican esta situacin es que la web
actual se basa en el lenguaje HTML. La insatisfaccin creciente con respecto a este lenguaje
de programacin de usuario, que permite codificar hipertextualmente textos, imgenes,
sonidos y multimedia, podra sintetizarse en la opinin generalizada entre los especialistas de
que el HTML es, simplemente, un lenguaje estructural de maquetacin.
En 1999, Tim Berners-Lee, el creador de la World Wide Web, escribi por primera
vez acerca de los requisitos hipotticos que debera de cumplir una futura Web Semntica que
facilitase la implementacin del significado, de la inteligencia en la red (W3C, 1999). En el
discurso acadmico generado recientemente en torno a Internet, se retoma este planteamiento
y empieza a detectarse un cierto consenso en torno a la idea de que el futuro de la web se est
gestando en la investigacin en formas de inteleccin artificiales cualitativas similares a la
humana (Berners-Lee, 2001).
El primer paso importante hacia esa web de naturaleza semntica que conoceremos en
el futuro se basa en la adopcin generalizada del lenguaje XML (Cover, 1998), incluido desde
hace varios aos ya en los programas de usuario de creacin de pginas web, y que aade a
las propiedades acreditadas del HTML la posibilidad de inclusin en el nivel de cdigo de una
infraestructura de metadatos que aporte una descripcin ontolgica explcita de la informacin
contenida en el recurso.
En el contexto de este nuevo planteamiento de una web en la que se haya codificado
semnticamente el significado de la informacin, ser posible disear robots de bsqueda,
gestores de contenidos y agentes autnomos que entiendan los documentos y realicen
procesos inteligentes de bsqueda, extraccin y tratamiento de la informacin relevante
para el usuario. En palabras de Berners-Lee, no se est hablando de una inteligencia artificial
mgica que permita a los ordenadores entender las palabras de los usuarios, sino nicamente

Recibido el 01-12-2006
RL 5 (2006): 155-172
ISSN 1885-9089

156

de la habilidad de una mquina para resolver problemas bien definidos, a travs de


operaciones bien definidas que se llevarn a cabo sobre datos bien definidos (W3C, 1999).
La Web Semntica aspira a mejorar sustancialmente la interaccin entre los sistemas
informticos y los seres humanos, dotando a los primeros de una mayor inteligencia y
autonoma, y a los segundos de un nuevo infouniverso conceptual ergonomizado
intelectivamente que satisfaga la necesidad de convertir la informacin en conocimiento (para
una profundizacin en este planteamiento, vase Codina y Rovira, 2006).
Para entender el cambio que supondr la creacin de la Web Semntica, puede servir
como ejemplo de qu manera ayudar a resolver uno de los problemas fundamentales de los
actuales buscadores de Internet. En este momento, estos ingenios basan su operatividad casi
exclusivamente en las palabras clave contenidas en el cdigo del recurso. Los futuros
buscadores semnticos, en cambio, centrarn su eficacia en la informacin ontolgica. Una
ontologa es una definicin formal explcita, y estructurada en taxonomas, de un cuerpo de
conocimiento (Gruber, 1993). La hiptesis que subyace en esta nueva estrategia de
investigacin es que una ontologa diseada para ser procesada automticamente permitir, en
teora, simular que un ordenador manipula la informacin de manera funcionalmente parecida
a como un humano entiende el lenguaje. Bien es verdad que una mquina no puede
comprender la informacin que procesa en ningn sentido profundo de la expresin; no
obstante, la Inteligencia Artificial podra acercarse un paso ms a la humana si los datos que
procesa estn estipulados semnticamente mediante ontologas. En una Web Semntica
estructurada ontolgicamente, los buscadores de Internet dejarn de arrojar millones de
resultados indiscriminados, la mayor parte de ellos irrelevantes, y ofrecern algo similar a la
informacin cualitativa que podra haber seleccionado un especialista humano en la materia.
En esta lnea de trabajo, se inscribe el proyecto OntoTag (Aguado et alii, 2002), un
modelo de anotacin semntica de textos que (a) cumple con las recomendaciones EAGLES
Recibido el 01-12-2006
157
RL 5 (2006): 155-172
ISSN 1885-9089

(1999), fijadas por la Unin Europea, en su iniciativa Corpus Encoding Standard, (b) aplica
los principios descriptivos del modelo abstracto del mundo (u ontologa) de la Semntica
Ontolgica (Niremburg & Raskin, 2001) (para un estado de la cuestin sobre esta disciplina,
vase OntoWeb, 2002), y (c) implementa los lenguajes de marcado de ltima generacin
RDF(S)/XML.
OntoTag, al igual que otros proyectos de investigacin similares (Benjamins et alii
(1999), se plantea como objetivo la anotacin semntica de documentos web que pueda
ayudar a las computadoras a comprender la informacin textual en el contexto del proyecto de
creacin de la Web Semntica. La peculiaridad de OntoTag es que aplica la metodologa de la
Lingstica de Corpus, entendido corpus en el sentido de Leech (1997) como un conjunto
de material lingstico que existe en forma electrnica y que puede ser procesado por un
ordenador con distintos fines, como la investigacin lingstica y la ingeniera del lenguaje.
En el proyecto, tambin se aplican las dos modalidades de anotacin semntica previstas por
McEney & Wilson (2001): (a) las relaciones semnticas entre elementos del texto (agentes,
pacientes y participantes en la accin), y (b) las caractersticas semnticas de cada una de las
palabras que componen el texto.
No obstante, los responsables del modelo OntoTag reconocen que no hay un acuerdo
universal en el mbito de la semntica sobre qu caractersticas de las palabras se deben
anotar y que todava falta por determinar de manera exhaustiva el conjunto de categoras
semntico-cognitivas bsicas, y reconocen, como principal inconveniente para su proyecto,
las limitaciones impuestas por el estadio actual de la tecnologa: el proceso de obtener
automticamente pginas compactas, legibles y verificables es una tarea de muy difcil
delimitacin y especificacin en toda su magnitud; por otro lado, la inclusin del nivel de
anotacin semntica en un documento web conlleva un evidente (aunque no exagerado)
aumento del tiempo de descarga del documento desde la red.
Recibido el 01-12-2006
158
RL 5 (2006): 155-172
ISSN 1885-9089

A estos inconvenientes sealados por los propios responsables del proyecto OntoTag,
podran aadirse dos reflexiones crticas de ms profundo calado. La primera es el peligro de
obsolescencia que sufre la tecnologa de anotacin, marcaje y etiquetaje de corpus, a causa de
la continua evolucin de los estndares. La segunda es que la tarea de anotar semnticamente
la totalidad de la Web, de convertirla en un corpus marcado y etiquetado ontolgicamente,
dada su magnitud y mutabilidad, parece un empeo inasequible (Bonilla, en preparacin a).
Dejando a un lado las dificultades actuales que plantea la construccin de una web
enriquecida ontolgicamente, el paso siguiente del proceso que culminara en la Web
Semntica sera hacer factible el diseo de productos informticos como los agentes
inteligentes, que gestionarn las necesidades de los usuarios humanos de manera ejecutiva,
autnoma y adaptativa.
El agente inteligente ideal (Hendler, 1999), autntico reto para los investigadores en
Ciencias de la Computacin, en primer lugar, ser comunicativo, es decir, interactuar de una
manera fluida con los objetivos y las preferencias personales del usuario. En segundo trmino,
ser ejecutivo, estar capacitado para tomar decisiones y no nicamente para presentarle al
usuario varias opciones para que ste elija una. Tercero, ser autnomo, capaz de actuar sin
que el usuario tenga que controlarlo exhaustiva y continuamente. Y en ltima instancia, ser
adaptativo, podr aprender de su propia experiencia de funcionamiento y de las preferencias
idiosincrsicas de su usuario.
Formulado en otros trminos, los agentes inteligentes se harn cargo de una manera
competente del trabajo ms rutinario y, en ocasiones, fsicamente inabarcable, que en la
actualidad se ven obligados a realizar manualmente los usuarios que navegan e interactan
con la web. Hendler (1999) enuncia as el optimismo de los especialistas al respecto: En
pocas palabras, si en estos momentos no est usted utilizando tecnologa basada en agentes
inteligentes, no se preocupe, porque muy pronto lo har.
Recibido el 01-12-2006
159
RL 5 (2006): 155-172
ISSN 1885-9089

La Web Semntica dibuja un nuevo escenario tecnolgico ideal(izado) en el que la


informacin, organizada ontolgicamente y recorrida por agentes inteligentes, comunicativos,
ejecutivos, autnomos y adaptativos, deviene conocimiento.

2. SEMNTICA Y SIGNIFICADO: ALGUNOS PROBLEMAS DE IMPLEMENTACIN


COMPUTACIONAL.

En el diseo de programas para representar y recuperar informacin, los expertos en


Computacin orientada hacia la web estn exprimiendo y llevando casi al lmite la capacidad
de aplicacin de los modelos lingsticos actuales basados en reglas formales en el campo de
la Morfologa y de la Sintaxis. La tendencia ms reciente de investigacin, en la que se cifra
la esperanza de dar un salto cualitativo en la disciplina, gira en torno a la Semntica.
Desde la perspectiva que ofrece el desarrollo reciente de la Lingstica, el punto de
vista semntico, aplicado en el campo interdisciplinario de la web, quizs est creando unas
expectativas excesivamente entusiastas, sin duda alentadas por la capacidad de fascinacin
que ejerce las palabras semntica y significado, sin duda a causa de que est emplendose la
expresin Web Semntica no en un sentido estrictamente tcnico, sino como una metfora
afortunada, como un hallazgo terminolgico, como si fuera un meme (Dawkins, 1976).
No parece ocioso, por lo tanto, revisar crticamente de manera breve qu es la
Semntica, en qu consiste el significado y en qu medida pueden aplicarse ambos conceptos
en el desarrollo futuro de la web.
Como sealan Leech (1974) y Lyons (1977) en sus manuales clsicos de la disciplina,
la teora semntica cubre un amplsimo espectro de cuestiones relacionadas con el significado,
Recibido el 01-12-2006
160
RL 5 (2006): 155-172
ISSN 1885-9089

la interpretacin y la comprensin del lenguaje; pero si ambos especialistas tuvieran que


consensuar una definicin general minimalista, sta sera aproximadamente: la Semntica
estudia las mltiples relaciones de significacin que establecen los signos con sus referentes.
En cualquier caso, y aqu est la clave que quizs haya deslumbrado a la vanguardia de
la Inteligencia Artificial aplicada en la web, la idea central de la Semntica (que requiere ser
revisada crticamente) es que las palabras codifican significados.
En la lgica en que se basa el proyecto de una Web Semntica, si pudiera reconstruirse
la ontologa de una palabra, entonces se habra conseguido formalizar su significado y,
mediante un protocolo de implementacin computacional, este significado podra
programarse en el cdigo del recurso, para integrarlo luego operativamente en la web. Desde
este punto de vista un tanto optimista, la Inteligencia Artificial habra encontrado en las
ontologas una posible va de acceso eficaz hacia la simulacin de la comprensin humana del
lenguaje.
Desde nuestro punto de vista, el problema esencial de este planteamiento radica en que
el significado, como se argumentar ms adelante, no est en las palabras, sino en la mente de
quien las procesa. Una de las tesis bsicas de este artculo es que el significado no es un
fenmeno representacional (lingstico-gramatical), sino que posee una naturaleza
metarrepresentacional (cognitivo-pragmtica).
Los diccionarios y las enciclopedias, autnticas proezas culturales que sintetizan
lingsticamente buena parte del saber humano, generan la ilusin de que el significado est
en las palabras, de que el significado consiste, en ltima instancia, en un conjunto
estructurado (es decir, en una ontologa) de unas palabras que sirven para definir a otras
palabras.
Advirtase que la implementacin de la Semntica en la web creara un bucle
autorreferencial irresoluble (Hofstadter, 1979): palabras que remiten a su vez a otras palabras
Recibido el 01-12-2006
161
RL 5 (2006): 155-172
ISSN 1885-9089

que remiten a su vez a otras palabras Si el significado de una palabra est en otras palabras:
dnde est el significado de esas otras palabras y as ad infinitum?
A

la

propuesta

semntico-computacional,

puede

oponrsele

tambin

una

contraargumentacin biolgica: una lesin cerebral localizada en una determinada regin


neuronal puede impedir que una persona acceda al significado del lenguaje. Las palabras
estarn fsicamente disponibles en la voz que las pronuncia o en las letras impresas de los
libros, pero el lesionado no podr comprenderlas por s mismas, en s mismas, en modo
alguno. El significado no est en las palabras, se genera en la mente y tiene un soporte
biolgico.
La singularidad de la cognicin humana se explica por el funcionamiento del cerebro,
capaz de procesar informacin mediante trillones de sinapsis tridimensionales. Desde una
perspectiva estrictamente funcionalista, los expertos ms optimistas en Inteligencia Artificial
consideran que esta ingente capacidad de procesamiento complejo estara en el origen de la
autoconciencia, de la intencionalidad, de la comprensin, etc. Desde este punto de vista,
bastara con que se fuese cumpliendo la ley de Moore de multiplicacin progresiva de la
potencia de cmputo de los procesadores sintticos, y cuando se acerquen o igualen la
capacidad humana de procesamiento, simplemente la Inteligencia Artificial dar el salto a la
autoconciencia, a la intencionalidad, a la comprensin: no se dio este salto a la humanidad
desde la biologa de la animalidad? por qu no podra suceder lo mismo desde el mundo de
lo artificial?
En oposicin a estas ideas todava especulativas, parece slidamente establecido que el
significado es un fenmeno mental que remite a una capacidad cognitiva humana, adquirida
genticamente por nuestra especie a lo largo de millones de aos de seleccin evolutiva. Por
lo tanto, la semntica y el acceso al significado tienen una base biolgica ligada a la actividad
intelectiva de un organismo vivo.
Recibido el 01-12-2006
RL 5 (2006): 155-172
ISSN 1885-9089

162

No puede olvidarse que el proyecto de Web Semntica es telemtico, y no puede ser


de otra manera, es decir, su funcionamiento requiere la interaccin entre mentes asistidas por
ordenadores interconectados en red. Por lo tanto, el significado se procesa en la mente, no en
la red misma, y, en consecuencia, no hay posibilidad alguna actualmente de que la web
desarrolle una inteligencia autnoma, basada en la gestin del significado, independiente de
sus gestores y usuarios humanos.
No obstante, en el horizonte de la investigacin futura, uno de los objetivos
prioritarios es replicar computacionalmente la comprensin humana del lenguaje; pero quien
esto escribe es pesimista con respecto a que las soluciones procedan nicamente de la
semntica (vase la propuesta explorativa de naturaleza metarrepresentacional que se presenta
en el apartado siguiente).
En estos momentos de la investigacin, el problema irresoluble (el acceso
computacional a la comprensin) que plantea la implementacin del significado en una
hipottica Web Semntica puede emplearse como confirmacin de las palabras de Searle
(2001): el trmino Inteligencia Artificial ha sido siempre un error. Es mejor hablar de
simulacin cognitiva. Formulado en otros trminos, la complejidad casi insalvable de la
aplicacin de la Semntica en las disciplinas computacionales hace evidente el hecho de que
Inteligencia Artificial es un meme, una expresin metafrica afortunada que estimula la
imaginacin proyectiva de los investigadores, pero que dista de ser una realidad emprica. Es
la semntica, el significado, lo que realmente necesita la Inteligencia Artificial para dar un
salto cualitativo que la acerque a una menor distancia de la humana?

3. METARREPRESENTACIN Y MARCADORES DISCURSIVOS. UNA PROPUESTA


DE IMPLEMENTACIN EN LA WEB SEMNTICA.
Recibido el 01-12-2006
163
RL 5 (2006): 155-172
ISSN 1885-9089

Pensemos el problema computacional de la implementacin del significado en la web


desde una perspectiva especulativa diferente de la semntica.
El antroplogo cultural y pragmatista Sperber (2000) propone la hiptesis de que los
seres humanos poseemos un mecanismo cognitivo, fruto de nuestra evolucin biolgica, que
nos

permite

metarrepresentar

mentalmente

las

representaciones

lingsticas.

Una

metarrepresentacin es una representacin intelectiva de alto nivel del contenido de una


representacin lingstica. Como ventaja evolutiva crucial, nuestra especie con habilidades
metarrepresentacionales puede vivir e interactuar en un mundo donde no slo hay hechos
fsicos, sino tambin hechos mentales.
En una formalizacin previa de este planteamiento, Wilson y Sperber (1990) sugieren
la coexistencia en el lenguaje humano de dos tipos complementarios de informacin; por un
lado, el discurso contiene informacin conceptual (de naturaleza semntica), y por otro,
transporta informacin computacional (de naturaleza pragmtica y metadiscursiva), es decir,
informacin metarrepresentacional sobre cmo ha de procesarse el contenido semnticoconceptual del discurso; o dicho con otras palabras, instrucciones computacionales de
interpretacin lingstica (para una profundizacin en este planteamiento, vase Wilson, 2000
y No, 2000; para una aplicacin en el espaol, vase Escandell, 1989 y Portols, 2005).
Ms en concreto, Wilson y Sperber analizan el funcionamiento de determinados
elementos lingsticos con caractersticas computacionales que influyen directamente en la
manera en que se procesa y se interpreta la informacin discursiva, mostrando un inters
especial en los marcadores discursivos, ya que, en primer lugar, funcionan a modo de
estmulo ostensivo (es decir, como un elemento focalizador utilizado de manera intencionada
por el comunicador para controlar la atencin de su interlocutor), y en segundo lugar, guan el

Recibido el 01-12-2006
RL 5 (2006): 155-172
ISSN 1885-9089

164

proceso de interpretacin discursiva, influyendo de manera positiva en la minimizacin del


esfuerzo cognitivo que ha de invertir el receptor en la comprensin del significado.
El inters en el funcionamiento de esta clase de elementos en concreto, y, en general,
de la informacin pragmtica de tipo computacional que contiene el discurso, desborda el
campo especializado de la Lingstica y se extiende a otras reas de la Inteligencia Artificial.
Sirva como ilustracin el ejemplo siguiente.
Existe una demanda creciente de programas informticos que simulen la inteligencia
de un ser humano competente en la realizacin de resmenes y que sean capaces de generar
mapas conceptuales jerarquizados de la informacin relevante contenida en un cuerpo de
conocimiento determinado.
Los programas disponibles en el mercado que sumarizan textos de manera automtica
suelen operar aplicando ndices de frecuencias estadsticas de aparicin de palabras (que, por
otra parte, es la tarea que, hoy por hoy, los ordenadores realizan ms rpidamente y mejor).
Para que la computadora arroje datos significativos en este nivel de funcionamiento, los
programas excluyen del recuento las palabras vacas, invariables y sin contenido
proposicional inventariable lxico-semnticamente (artculos, pronombres, conjunciones,
preposiciones, marcadores, conectores, etc.), ya que, se supone (en nuestro planteamiento,
creemos que errneamente) que no aportan informacin demasiado interesante al texto.
Cuando se pone en marcha, el programa as diseado identifica las cadenas de caracteres que
ms se repiten como las palabras claves, como las ideas principales del texto.
Si bien se trata de un planteamiento en apariencia sensato y basado en el sentido
comn, semejante diseo condena al programa a un funcionamiento en muchas ocasiones
extravagante: sabido es que los textos bien construidos poseen un elevado grado de variacin
estilstica, sinonimia y elisin, y un bajo nivel de repeticin. Estas caractersticas lingsticas

Recibido el 01-12-2006
RL 5 (2006): 155-172
ISSN 1885-9089

165

elusivas del tratamiento estadstico provocan que el programa desatine continuamente sus
decisiones de sumarizacin.
Ahora bien, si siguiese el planteamiento metarrepresentacional, bastara con que el
programa de resumen automtico tuviese en cuenta los marcadores discursivos reformulativos
o conclusivos (del tipo en resumen, por lo tanto, etc.), inscritos en la superficie lingstica por
el propio productor del texto para facilitar y controlar la trayectoria interpretativa del receptor,
para que, sin duda alguna, su nivel de eficacia traspasase con creces el umbral de lo aceptable.
La idea de que el lenguaje humano posee no nicamente informacin de naturaleza
conceptual, sino tambin computacional y metarrepresentacional puede ser muy fructfera en
la creacin de programas que simulen artificialmente la inteligencia.
La mente procesa la informacin lingstica en tiempo real, por lo tanto, no puede
detenerse en el procesamiento morosamente detallado de todos y cada uno de los niveles
(fontico, fonolgico, morfolgico, sintctico, lxico y semntico) que propone la Lingstica
Computacional clsica en sus exhaustivos anlisis. Las ltimas teoras sobre la inteligencia
humana (Hawkins & Blakeslee, 2004) sugieren que la mente no funciona mediante complejos
sistemas formales de reglas, sino a travs de patrones de memoria y de estrategias eficaces de
procesamiento. Guiada por su capacidad innata metarrepresentativa, la mente coge el atajo
pragmtico-computacional hacia la comprensin (Bonilla, en preparacin b).
Ha llegado el momento de realizar nuestro esbozo de propuesta explorativa de
naturaleza metarrepresentacional. Imaginemos un ejemplo de aplicacin con cierta
exigencia- en la futura Web. Un usuario lanza contra la red una pregunta de investigacin,
verbigracia, El estado actual de los estudios en Teora de Supercuerdas. Lo que esperara
obtener un usuario exigente cuando realiza su consulta, ms que una lista inacabable de
pginas web cuyo nico nexo en comn, en ocasiones, es contener la palabra clave
supercuerda, es un texto con una estructura informativa clara y que responda de una manera
Recibido el 01-12-2006
166
RL 5 (2006): 155-172
ISSN 1885-9089

competente a la cuestin planteada; es decir, lo mismo que esperara si realizase la consulta a


un especialista humano en la materia.
Un agente metarrepresentacional, no basado en la informacin semntica ontolgica,
que busque estratgicamente la informacin relevante para la resolucin de la pregunta de
investigacin, desestimar todos los recursos de informacin publicados en una fecha anterior
a cinco aos. No obstante, explorar, en la zona de referencias de la bibliografa desestimada,
aquellas obras y autores ms citados, para establecer cules son los trabajos clsicos en los
que se asienta la materia, as como las citas literales que ms se repiten en la bibliografa ms
reciente. De esta manera, se obtendra un estado de la cuestin sinttico, que podra encabezar
la respuesta a la pregunta inicial de investigacin.
En paralelo, el agente metarrepresentacional localizar los marcadores discursivos
reformulativos, para documentar en los textos seleccionados cules son los conceptos
fundamentales que reciben una atencin privilegiada. De esta suerte, habr encontrado las
zonas de mxima relevancia en las que el texto habla de s mismo, se hace explcito, se
metarrepresenta. La ventaja que tiene este procedimiento, frente a la consideracin de las
palabras clave del lenguaje HTML, o de los metadatos en el lenguaje XML que aparecen en el
cdigo del recurso, es que los conceptos aparecen en su contexto discursivo, con lo que se
enriquece enormemente su aportacin a la resolucin del problema. En este sentido, se
habran identificado y contextualizado los conceptos fundamentales que protagonizan la
respuesta temtica a la pregunta inicial de investigacin.
Tambin en paralelo, el agente metarrepresentacional localizar en los textos
seleccionados los marcadores conclusivos que contienen la sntesis de la informacin ms
relevante, zonas discursivas, no se olvide, etiquetadas por el propio productor textual. La
ventaja que tiene este procedimiento con respecto a la consideracin de los sumarios inscritos
en el cdigo del recurso (prototpicos del lenguaje XML), de nuevo es su contextualizacin
Recibido el 01-12-2006
167
RL 5 (2006): 155-172
ISSN 1885-9089

discursiva, que sin duda aumentar la sensacin de que estamos operando con discurso
inteligente y formulado lingsticamente de una manera impecable.
Con todo este material, el agente metarrepresentacional construir un texto coherente
que entregar en pantalla al usuario. Este documento tendr la estructura siguiente:
1. Ttulo: La pregunta inicial de investigacin.
2. Sntesis del estado de la cuestin: Qu discurso y quines lo han enunciado,
asentando las bases de la materia. Procedimiento operativo: Bsqueda de coincidencias en la
zona de relevancia discursiva etiquetada como referencias bibliogrficas y sus variantes
estilsticas.
3. Propuesta temtica: Identificacin de los conceptos clave contextualizados
discursivamente. Procedimiento operativo: Bsqueda de los marcadores reformulativos que
maximizan la relevancia de las zonas metadiscursivas en que el discurso se explica a s
mismo.
4. Conclusiones: Localizacin de las zonas discursivas en que se establecen las
conclusiones de investigacin. Procedimiento operativo: Bsqueda de los marcadores
conclusivos que acotan las zonas de sntesis en que el autor ha metarrepresentado su propio
texto.

4. CONCLUSIONES

El proyecto de implementacin de inteligencia en la futura Web Semntica dibuja un


nuevo escenario tecnolgico ideal(izado) en el que la informacin, organizada
ontolgicamente y recorrida por agentes inteligentes, comunicativos, ejecutivos, autnomos y
adaptativos, deviene conocimiento.
Recibido el 01-12-2006
RL 5 (2006): 155-172
ISSN 1885-9089

168

Desde nuestro punto de vista, el problema esencial de este planteamiento radica en que
el significado no es un fenmeno representacional (lingstico-gramatical), sino
metarrepresentacional (cognitivo-pragmtico): el significado es un fenmeno mental que
remite a una capacidad cognitiva humana, adquirida genticamente por nuestra especie a lo
largo de millones de aos de evolucin selectiva darwiniana. Por lo tanto, la semntica y el
acceso al significado tienen una base biolgica ligada a la actividad intelectiva de un
organismo vivo.
Si se piensa en la resolucin del problema computacional de la implementacin del
significado (de la inteligencia) en la web desde una perspectiva especulativa diferente de la
semntica, la idea de que el lenguaje humano posee informacin de naturaleza
metarrepresentacional puede ser muy fructfera en la creacin de programas que simulen
artificialmente la inteligencia.
En este sentido, podra disearse un agente metarrepresentacional que localizara
estratgicamente la informacin relevante guiado por los marcadores discursivos que acotan
zonas metadiscursivas de reformulacin y de conclusin. La ventaja que ofrece esta lnea de
investigacin es que permite operar no con la informacin descontextualizada inscrita en el
cdigo del recurso (como se plantea en la propuesta semntica), sino la informacin
contextualizada y, por ello enriquecida, contenida en el propio discurso.

NOTA
Este trabajo se enmarca en el proyecto de investigacin Web Semntica y Sistemas de Informacin
Documental (HUM2004-03162/FILO), dirigido por el Dr. Llus Codina, y financiado por el Ministerio de
Ciencia y Tecnologa (Programa nacional de Tecnologas de la Informacin y de las Comunicaciones).

Recibido el 01-12-2006
RL 5 (2006): 155-172
ISSN 1885-9089

169

REFERENCIAS

Aguado, G. et alii. 2002. A Semantic Web Page Linguistic Annotation Model. Semantic
Web Meets Language Resources. Technical Report WS-02-16. American Association
for Artificial Intelligence. California: AAAI Press.
Benjamins, V.R., et alii. 1999. Building Ontologies for the Internet: A Mid Term Report.
International Journal of Human Computer Studies 51: 687712.
Berners-Lee, T. 2001. The Semantic Web, Scientific American.
Bonilla, S. (en preparacin a). Marcaje de corpus y Metarrepresentacin.
Bonilla, S. (en preparacin b). Metarrepresentacin.
Codina, Ll. y C. Rovira. 2006. La Web Semntica. En Tramullas, J. coord. Tendencias en
documentacin digital. 9-54. Gijn: Trea.
Cover, R. 1998. XML and Semantic Transparency
http://xml.coverpages.org/xmlAndSemantics.html
Dawkins, R. 1976. El gen egosta. Barcelona: Salvat.
EAGLES. 1999. EAGLES LE3-4244: Preliminary Recommendations on Semantic Encoding,
Final Report.
http://www.ilc.pi.cnr.it/EAGLES/ EAGLESLE.PDF
Escandell, V. 1998. Metapropositions as metarepresentations. Paper delivered to the
Relevance Theory Workshop. Luton.
Gruber, T.R. 1993. A translation Approach to Portable Ontology Specifications. Knowledge
Acquisition 5.2: 199-220.
Hawkins, J. & S. Blakeslee. 2004. On Intelligence. New York: Times Book.
Hendler, J. 1999. Is there an Intelligent Agent in Your Future?
http://www.nature.com/webmatters/agents/agents.html].
Recibido el 01-12-2006
170
RL 5 (2006): 155-172
ISSN 1885-9089

Hofstadter, D. 1987 (1979). Gdel, Escher, bach. Un Eterno y Grcil Bucle. Barcelona:
Tusquets.
Leech, G. 1974. Semantics. London: Penguin.
Leech, G. 1997. Introducing corpus annotation. In Garside R., Leech, G. y McEnery, A. M.
eds. Corpus Annotation: Linguistic Information from Computer Text Corpora.
London: Longman.
Lyons, J. 1977. Semantics. Cambridge: Cambrigde University Press.
McEnery, A. M. y Wilson, A. 2001. Corpus Linguistics: An Introduction. Edinburgh:
Edinburgh University Press.
Nirenburg, S. & Raskin, V. 2001. Ontological Semantics.
http://crl.nmsu.edu/Staff.pages/Technical/sergei/book/index-book.html
No, E.J. 2000. Metarepresentation. A Relevance-Theory Approach. Amsterdam: John
Benjamins.
OntoWeb. 2002.
http://ontoweb.aifb.uni-karlsruhe.de/About/Deliverables/D13_v1-0.zip
Portols, J. 2005. Marcadores del discurso y metarrepresentacin. En Casado, M. et alii.
eds. Estudios sobre lo metalingstico (en espaol). 25-46. Berlin: Peter Lang.
Searle, J. 2001. Rationality in Action. Massachusetts: MIT Press.
Sperber, D. 2000. Metarepresentations in an evolutionary perspective. In D. Sperber. ed.
Metarepresentations: A Multidisciplinary Perspective. 117-137. Oxford: Oxford
University Press.
http://perso.club-internet.fr/sperber/metarep.htm
W3C. 1999
http://www.w3c.org/2001/sw

Recibido el 01-12-2006
RL 5 (2006): 155-172
ISSN 1885-9089

171

Wilson, D. 2000. Metarepresentation in linguistic communication. In D. Sperber. ed.


Metarepresentations. Oxford: Oxford University Press.
http://www.phon.ucl.ac.uk/home/robyn/workshop/papers/wilson.htm
Wilson, D. & D. Sperber. 1990. "Linguistic Form and Relevance". UCL Working Papers in
Linguistics 2: 95-112.

Recibido el 01-12-2006
RL 5 (2006): 155-172
ISSN 1885-9089

172

También podría gustarte