Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Esta entrada es una traducción del artículo de R. Davis, H. Shrobe, and P. Szolovits. What is a Knowledge
Aunque la Representación del Conocimiento es uno de los conceptos centrales y, de alguna manera, más conocidos
en Inteligencia Artificial, la pregunta más fundamental "¿qué es?" rara vez se ha contestado directamente. En esta
entrada volvemos a lo básico para abordar la cuestión directamente. Creemos que la respuesta se puede entender mejor
en función de los cinco roles importantes, y claramente diferentes, que desempeña una representación, cada uno de los
cuales plantea necesidades diferentes, y a veces contradictorias, a las propiedades que debe tener una
representación. Sostenemos que el hecho de tener en cuenta estas cinco funciones proporciona una perspectiva útil y
amplia que arroja luz sobre algunas controversias de larga duración y puede estimular tanto la investigación como la
práctica en el campo.
Introducción
¿Qué es una Representación del Conocimiento? Esta noción se puede entender mejor en términos de los cinco
posibles roles que desempeña, todos ellos cruciales para el objetivo de comprender qué es una representación del
utilizado para permitir a una entidad determinar consecuencias pensando en lugar de actuar, es decir,
Es un conjunto de compromisos ontológicos, es decir, una respuesta a la pregunta: ¿en qué términos debo
Es una teoría parcial del razonamiento inteligente, expresada en términos de tres componentes:
realiza el pensamiento. Una contribución a esta eficiencia pragmática es la que aporta la orientación que
proporciona una representación para organizar la información a fin de facilitar la realización de las inferencias
recomendadas.
Es un medio de expresión humana, es decir, una lengua en la que decimos cosas sobre el mundo.
a un conjunto interesante y diferente de propiedades que queremos que tenga una representación.
2. En segundo lugar, creemos que los roles proporcionan un marco útil para caracterizar una amplia variedad de
representaciones. Sugerimos que la "mentalidad" fundamental de una representación puede ser capturada al
entender cómo ve cada uno de los roles, y que al hacerlo revela similitudes y diferencias esenciales.
3. En tercer lugar, creemos que algunos desacuerdos previos sobre la representación se disuelven
provechosamente cuando los cinco roles reciben la consideración apropiada. Demostramos esto revisando y
4. Por último, creemos que ver las representaciones de esta manera tiene consecuencias tanto para la
investigación como para la práctica. Para la investigación, este punto de vista proporciona una respuesta
directa a una pregunta de importancia fundamental en el campo. También sugiere adoptar una perspectiva
amplia sobre lo que es importante en una representación, y argumenta que una parte significativa de la
representación - capturar y representar la riqueza del mundo natural - está recibiendo atención insuficiente.
Creemos que esta visión también puede mejorar la práctica recordando a los especialistas las inspiraciones
Terminología y perspectiva
1. Primero, usamos el término inferencia en un sentido genérico, para referirnos a cualquier forma de obtener
nuevas expresiones a partir de expresiones anteriores. Sólo en raras ocasiones estamos hablando de
2. En segundo lugar, y para darles un nombre colectivo único y diferencia del uso general anterior, nos referimos
al conocido conjunto de herramientas básicas de representación como la lógica, reglas, marcos, redes
También resultará útil considerar explícitamente la práctica común de construir representaciones del conocimiento en
múltiples niveles de lenguajes, normalmente con una de las tecnologías de representación del conocimiento en el nivel
inferior. La ontología de líquidos de Hayes[12], por ejemplo, es a un nivel una representación compuesta de conceptos
como piezas del espacio, que tienen portales, caras, lados, etc. El lenguaje en el siguiente nivel más primitivo (y como
resultado, inferior) es la lógica de primer orden, donde, por ejemplo, In(s1, s2) es una relación que expresa que el
tecnologías RC. Al igual que el nivel de representación primitiva en los fundamentos de los lenguajes RC, se encuentran
con todos los temas centrales para la representación del conocimiento de cualquier variedad. También son ejemplos
útiles porque son ampliamente conocidos en el campo y hay un considerable conjunto de experiencias que se pueden
aprovechar.
Tal vez la pregunta más fundamental sobre el concepto de representación del conocimiento sea: ¿Qué es?
Detallemos la respuesta en términos de los cinco roles fundamentales que se han anotado previamente:
Cualquier entidad inteligente que desee razonar sobre su mundo se encuentra con un hecho importante e ineludible:
el razonamiento es un proceso que transcurre internamente, mientras que la mayoría de las cosas sobre las que se
desea razonar sólo existen externamente. Un programa (o persona) dedicado a planificar el montaje de una bicicleta, por
ejemplo, puede tener que razonar sobre entidades como ruedas, cadenas, piñones, manillares, etc., pero tales cosas
Esta inevitable dicotomía es una justificación y un rol fundamental para una representación: funciona como sustituto
dentro del razonador, como sustituto de las cosas que existen en el mundo. Las operaciones sobre, y con,
representaciones sustituyen a las operaciones sobre, y con, lo real, es decir, sustituyen a la interacción directa con el
mundo. Desde este punto de vista, el razonamiento mismo es en parte un sustituto de la acción en el mundo, cuando no
Considerar las representaciones como sustitutos conduce naturalmente a dos preguntas importantes. La primera
pregunta acerca de cualquier sustituto es su propia identidad: ¿para qué sirve? Debe haber alguna forma de
La segunda pregunta es la fidelidad: ¿cuán cerca está el sustituto de lo real? ¿Qué atributos del original captura y
explicita, y cuáles omite? La fidelidad perfecta es en general imposible, tanto en la práctica como por principio. Es
imposible por principio, porque cualquier otra cosa que no sea la cosa en sí misma es necesariamente diferente de la
cosa misma (ya sea en la ubicación si no hay otra razón). Dicho de otro modo, la única representación completamente
exacta de un objeto es el objeto mismo. Todas las demás representaciones son inexactas; inevitablemente contienen
Dos pequeñas elaboraciones amplían esta visión de las representaciones como sustitutos. En primer lugar, parece
servir tanto para los objetos intangibles como para los materiales como las ruedas dentadas: las representaciones
funcionan como sustitutos de nociones abstractas como acciones, procesos, creencias, causalidad, categorías, etc.,
permitiendo describirlas dentro de una entidad para que se pueda razonar sobre ellas. En segundo lugar, los objetos
formales pueden existir dentro de la máquina con una fidelidad perfecta: las entidades matemáticas, por ejemplo, pueden
ser capturadas con exactitud, precisamente porque son objetos formales. Puesto que casi cualquier tarea de
razonamiento encontrará la necesidad de tratar con objetos naturales (es decir, aquellos encontrados en el mundo real)
así como con objetos formales, los sustitutos imperfectos son pragmáticamente inevitables.
Dos consecuencias importantes se derivan de la inevitabilidad de sustitutos imperfectos. Una consecuencia es que al
describir el mundo natural, debemos inevitablemente mentir, al menos por omisión. Como mínimo, debemos prescindir
de la complejidad efectivamente ilimitada del mundo natural; nuestras descripciones pueden además introducir artefactos
La segunda y más importante consecuencia es que todos los razonamientos suficientemente amplios sobre el mundo
natural deben llegar a conclusiones incorrectas, independientemente del proceso de razonamiento utilizado e
mundo es de alguna manera equivocado (y debe serlo) algunas conclusiones serán incorrectas, no importa lo
cuidadosamente extraídas que sean. Una mejor representación no puede salvarnos: todas las representaciones son
El significado del error puede, por supuesto, variar; de hecho, gran parte del arte de seleccionar una buena
representación consiste en encontrar una que minimice (o quizás incluso elimine) el error para la tarea específica en
cuestión. Pero la inevitable imperfección de los sustitutos significa que podemos proporcionar al menos una garantía para
cualquier entidad razonando de cualquier manera sobre el mundo natural: si razona lo suficiente y ampliamente, está
Por lo tanto, extraer sólo inferencias correctas no libera al razonamiento del error; sólo puede garantizar que la
inferencia no es la fuente de ese error. Dado que el razonamiento de base general inevitablemente será incorrecto, el
paso de una inferencia correcta a otros modelos de inferencia no es, por lo tanto, un movimiento desde la exactitud total
hacia el error, sino una cuestión de equilibrar la posibilidad de una fuente más de error con las ganancias (por ejemplo, la
inevitabilidad del error, incluso con razonamiento correcto, tiene sentido evaluar pragmáticamente los costes y beneficios
Si, como hemos argumentado, todas las representaciones son aproximaciones imperfectas a la realidad, cada
aproximación atendiendo a unas cosas e ignorando otras, al seleccionar cualquier representación estamos en el mismo
acto tomando inevitablemente un conjunto de decisiones sobre cómo y qué ver en el mundo. Es decir, seleccionar una
representación significa asumir un conjunto de compromisos ontológicos (ver nota 2). Los compromisos son como un par
de gafas fuertes que determinan lo que podemos ver, haciendo que alguna parte del mundo se centre en el punto de
Estos compromisos, y su efecto de enfoque/difuminado, no son un efecto secundario incidental de una elección de
representación; son esenciales: un RC es un conjunto de compromisos ontológicos. Es inevitable que así sea debido a
las imperfecciones de las representaciones. Resulta útil porque una selección sensata de los compromisos ofrece la
El efecto de enfoque es una parte esencial de lo que ofrece una representación, porque la complejidad del mundo
natural es abrumadora. Nosotros (y nuestras máquinas de razonamiento) necesitamos una guía para decidir qué es lo
que hay que atender y qué ignorar en el mundo. Las gafas suministradas por una representación pueden proporcionar
esa orientación: al decirnos qué y cómo ver, nos permiten hacer frente a lo que de otro modo sería una complejidad y un
detalle insostenibles. De ahí que el compromiso ontológico de una representación pueda ser uno de los aportes más
Hay una larga historia de trabajo que intenta construir buenas ontologías para una variedad de dominios de tareas,
incluyendo el trabajo inicial sobre una ontología para líquidos [12], el modelo de elementos agrupados ampliamente
utilizado en la representación de circuitos electrónicos (por ejemplo,[3]), así como ontologías para el tiempo, la creencia e
incluso la programación en sí misma. Cada uno de ellos ofrece una manera de ver alguna parte del mundo.
El modelo de elementos agrupados, por ejemplo, sugiere que pensemos en circuitos en términos de componentes
con conexiones entre ellos, con señales que fluyen instantáneamente a lo largo de las conexiones. Esta es una vista útil,
pero no la única posible. Una ontología diferente se presenta si necesitamos ocuparnos de la electrodinámica en el
dispositivo: aquí las señales se propagan a velocidad finita y un objeto (como una resistencia) que antes se veía como un
componente único con un comportamiento de E/S puede que ahora deba pensarse como un medio extendido a través
Las ontologías pueden, por supuesto, ser escritas en una amplia variedad de lenguajes y notaciones (por ejemplo, la
lógica, LISP, etc.); la información esencial no es la forma de ese lenguaje sino el contenido, es decir, el conjunto de
conceptos ofrecidos como una forma de pensar sobre el mundo. En pocas palabras, la parte importante son las nociones
como conexiones y componentes, no si optamos por escribirlas como predicados o estructuras de LISP.
El compromiso que asumimos al seleccionar una u otra ontología puede dar lugar a una visión muy distinta de la
tarea que nos ocupa. Por ejemplo, el diagnóstico médico visto en términos de reglas (por ejemplo, con el sistema
MYCIN) parece sustancialmente diferente de la misma tarea vista en términos de marcos (por ejemplo, con el sistema
INTERNIST). Mientras que MYCIN considera que el mundo de la medicina está compuesto por asociaciones empíricas
que conectan el síntoma con la enfermedad, INTERNIST considera que un conjunto de prototipos, en particular las
El ejemplo de INTERNIST también demuestra que existe un compromiso ontológico significativo e inevitable, incluso
a nivel de las tecnologías de representación habituales. Lógica, reglas, marcos, etc., cada uno encarna un punto de vista
sobre el tipo de cosas que son importantes en el mundo. La lógica, por ejemplo, implica un compromiso (muy mínimo) de
ver el mundo en términos de entidades individuales y relaciones entre ellas. Los sistemas basados en reglas ven el
mundo en términos de triples atributo-objeto-valor y las reglas de inferencia plausible que los conectan, mientras que los
Cada uno de ellos aporta así su propia visión de lo que es importante atender, y cada uno sugiere, a la inversa, que
cualquier cosa que no sea fácilmente reconocible en esos términos puede ser ignorada. Por supuesto, no se garantiza
que esto sea correcto, ya que todo lo ignorado puede resultar pertinente más adelante. Pero la tarea es
desesperanzadora en principio -cada representación ignora algo sobre el mundo- de ahí que lo mejor que podemos
hacer es empezar con una buena suposición. Las tecnologías de representación existentes proporcionan un conjunto de
conjeturas sobre qué atender y qué ignorar. La selección de cualquiera de ellos implica un grado de compromiso
ontológico: la selección tendrá un impacto significativo en nuestra percepción y enfoque de la tarea, así como en nuestra
El compromiso ontológico de una representación comienza por lo tanto al nivel de las tecnologías de representación
y se construye desde allí. A medida que ponemos la tecnología a trabajar, se establecen nuevos niveles de compromiso.
El uso de estructuras enmarcadas en INTERNIST ofrece un ejemplo ilustrativo. En el nivel más fundamental, la decisión
de ver el diagnóstico en términos de marcos sugiere pensar en términos de prototipos, defectos y una jerarquía
Una descripción temprana del sistema [21] muestra cómo estas preguntas fueron respondidas en la tarea que nos
organizadas principalmente en torno al concepto de sistemas de órganos, teniendo en el nivel superior categorías tales
Los prototipos, en consecuencia, están destinados a captar enfermedades prototípicas (por ejemplo, un "caso
clásico" de una enfermedad) y se organizarán en una taxonomía indexada en torno a los sistemas de órganos. Se trata
de un conjunto de opciones razonable e intuitivo, pero claramente no es la única forma de aplicar marcos a la tarea; por
En la tercera (y en este caso última) capa, este conjunto de opciones es instanciado: ¿qué enfermedades serán
incluidas y en qué ramas de la jerarquía aparecerán? Las cuestiones ontológicas que surgen incluso en este nivel
pueden ser fundamentales. Consideremos, por ejemplo, la determinación de cuáles de los siguientes factores se
consideran enfermedades (es decir, estados anormales que requieren curación): alcoholismo, homosexualidad, y
síndrome de fatiga crónica. El compromiso ontológico aquí es suficientemente obvio e importante como para que a
automatizados.
Hay que tomar decisiones similares con todas las tecnologías de representación, porque cada una de ellas sólo
proporciona un primer orden de aproximación sobre cómo ver el mundo: ofrecen una forma de ver pero no indican cómo
instanciar esa visión. Como los marcos sugieren prototipos y taxonomías, pero no nos dicen qué cosas seleccionar como
prototipos, las reglas sugieren pensar en términos de inferencias plausibles, pero no nos dicen qué inferencias plausibles
hay que atender. Del mismo modo, la lógica nos dice que debemos ver el mundo en términos de individuos y relaciones,
El compromiso con una visión particular del mundo comienza con la elección de una tecnología de representación, y
se acumula a medida que se van tomando decisiones sobre cómo ver el mundo en esos términos.
Hay que tener en cuenta que en cada capa, incluso en la primera (por ejemplo, seleccionar reglas o marcos), las
opciones que se toman son sobre la representación, no sobre las estructuras de datos. Parte de lo que hace que un
lenguaje sea representativo es que tiene sentido [13], es decir, existe una correspondencia entre sus construcciones y las
Una red semántica, por ejemplo, es una representación, mientras que un grafo es una estructura de datos. Son
entidades de diversa índole, aunque una invariablemente se utiliza para implementar la otra, precisamente porque la red
tiene (debe tener) una semántica. Esa semántica se manifestará en parte porque limita la topología de la red: una red
que pretende describir las afiliaciones familiares tal como las conocemos no puede tener un ciclo en sus vínculos padre,
mientras que los grafos (es decir, las estructuras de datos) no están por supuesto bajo ninguna restricción y pueden tener
ciclos arbitrarios.
Mientras que cada representación debe ser implementada en la máquina por alguna estructura de datos, la
propiedad representacional está en la correspondencia con algo en el mundo y en la restricción que la correspondencia
impone.
El tercer rol de una representación es como teoría parcial del razonamiento inteligente. Este papel se debe a que la
concepción inicial de una representación está motivada normalmente por alguna perspicacia que indica cómo la gente
razona inteligentemente, o por alguna creencia sobre lo que significa razonar inteligentemente en realidad.
1. la representación normalmente incorpora sólo una parte de la percepción o creencia que la motivó, y
2. esa percepción o creencia es a su vez sólo una parte del fenómeno complejo y multifacético del razonamiento
inteligente.
La teoría del razonamiento inteligente de una representación es a menudo implícita, pero puede hacerse más
Mientras que las inferencias establecidas indican lo que puede inferirse, las inferencias recomendadas se refieren a
lo que debe inferirse. (Se necesitan directrices porque el conjunto de inferencias establecidas suele ser demasiado
grande para ser utilizado indiscriminadamente). Mientras que la ontología que examinamos antes nos dice cómo ver, las
Estos componentes también pueden ser vistos como las respuestas de la representación a las tres cuestiones
fundamentales correspondientes:
Las respuestas a estas preguntas están en el corazón del espíritu y la mentalidad de una representación; conocer su
Comenzamos con el primero de estos componentes, examinando dos de las diversas concepciones
fundamentalmente diferentes del razonamiento inteligente que se han explorado en la IA. Esas concepciones y sus
supuestos subyacentes demuestran la amplia gama de opiniones sobre la cuestión y establecen un contexto importante
Como consecuencia de la relativa juventud de la IA como disciplina, las percepciones sobre la naturaleza del
razonamiento inteligente a menudo han provenido del trabajo en otros campos. Cinco campos --lógica matemática,
psicología, biología, estadística y economía-- han inspirado cinco nociones distinguibles de lo que constituye el
Una visión, históricamente derivada de la lógica matemática, hace suponer que el razonamiento inteligente es una
variedad de cálculos formales, típicamente deducibles; los ejemplos modernos de esta visión en AI son los logistas. Una
característico y ha dado lugar tanto al extenso trabajo sobre la resolución de problemas humanos como a la gran
Un tercer enfoque, poco arraigado en la biología, opina que la clave del razonamiento es la arquitectura de la
maquinaria que lo realiza, por lo que el razonamiento es un comportamiento de estímulo/respuesta característico que
surge de la interconexión paralela de una gran colección de procesadores muy simples. Los investigadores que trabajan
en varias variedades de conexionismo son los descendientes actuales de esta línea de trabajo. Un cuarto enfoque,
derivado de la teoría de la probabilidad, añade a la lógica la noción de incertidumbre, dando lugar a una visión en la que
razonar inteligentemente significa obedecer a los axiomas de la teoría de la probabilidad. Una quinta visión, desde la
economía, añade el ingrediente adicional de los valores y preferencias, conduciendo a una visión del razonamiento
Explorar brevemente el desarrollo histórico de los dos primeros puntos de vista ilustrará las diferentes concepciones
que tienen de la naturaleza fundamental del razonamiento inteligente y demostrará las profundas diferencias de fondo
Consideremos primero la tradición que rodea a la lógica matemática como una visión del razonamiento inteligente.
Esta visión tiene sus orígenes históricos en los esfuerzos de Aristóteles por acumular y catalogar los silogismos, en un
intento por determinar lo que se debe tomar como argumento convincente. (3) La línea continúa con Descartes, cuya
geometría analítica muestra que la obra de Euclides, aparentemente preocupada por el material del pensamiento puro
(líneas de ancho cero, círculos perfectos del tipo que sólo los dioses podían hacer), podía de hecho conectarse con el
álgebra, una forma de cálculo, algo que los simples mortales podían hacer.
En tiempos de Leibnitz la agenda es bastante específica y contundente: no buscó nada menos que un "cálculo del
pensamiento" que permitiera resolver todos los desacuerdos humanos con la simple invocación "Calculemos". Para
entonces existe una creencia clara y concreta de que, al igual que la geometría de Euclides, que alguna vez fue una
geometría divina e inalcanzable, podía ser capturada con el álgebra, alguna (o quizás cualquiera) variedad de esa
materia efímera llamada pensamiento podría ser capturada en el cálculo, específicamente la deducción lógica.
En el siglo XIX, Boole proporcionó las bases para el cálculo proposicional en sus "Leyes del Pensamiento"; el trabajo
posterior de Frege y Peano proporcionó una base adicional para la forma moderna del cálculo de predicados. El trabajo
de Davis, Putnam y Robinson en el siglo XX proporcionó los últimos pasos en la mecanización de la deducción lo
La descendencia moderna de esta línea de desarrollo intelectual incluye los muchos esfuerzos que utilizan la lógica
de primer orden como representación y alguna variedad de deducción como motor del razonamiento, así como el amplio
cuerpo de trabajo con la agenda explícita de hacer computacional el razonamiento lógico, ejemplificado por PROLOG.
Esta línea de desarrollo ilustra claramente cómo los enfoques de la representación se basan en la naturaleza del
razonamiento inteligente y la forma en que éste se fundamenta. Por ejemplo, se encuentra aquí el desarrollo histórico de
la premisa subyacente de que razonar inteligentemente significa razonar lógicamente; cualquier otra cosa es un error o
una aberración. Junto a esto, está la creencia de que "lógicamente" a su vez significa lógica de primer orden, por lo
general con deducción correcta. Por simple transitividad, estos dos se contraen en una parte clave de la lógica
subyacente del razonamiento inteligente: razonar inteligentemente significa razonar de la manera definida por la lógica de
primer orden.
Una segunda parte importante de esta visión es la creencia asociada de que el razonamiento inteligente es un
proceso que puede ser capturado en una descripción formal, particularmente una descripción formal que es precisa y
concisa.
Pero también son posibles puntos de vista muy diferentes sobre la naturaleza del razonamiento inteligente. Una
visión claramente diferente se encuentra en la parte de la IA influenciada por la tradición psicológica. Esa tradición,
arraigada en el trabajo de Hebb, Bruner, Miller, y Newell & Simon, rompió con la visión de estímulo/respuesta exigida por
el conductismo y sugirió en su lugar que el comportamiento de resolver problemas humanos podía ser visto en términos
de metas, planes y otras estructuras mentales complejas. Las manifestaciones modernas incluyen el trabajo sobre SOAR
como un mecanismo general para producir razonamientos inteligentes y sistemas basados en el conocimiento como un
Comparar estas dos tradiciones revela diferencias significativas e ilustra las consecuencias de adoptar una u otra
visión del razonamiento inteligente. En la tradición logicista, el razonamiento inteligente se toma como una forma de
cálculo, por lo general la deducción en la lógica de primer orden, mientras que la tradición basada en la psicología toma
como característica definitoria del razonamiento inteligente que es una variedad particular de la conducta humana. En la
visión logicista, el objeto de interés es por lo tanto un constructo definible en términos formales a través de las
matemáticas, mientras que para los influenciados por la tradición psicológica es un fenómeno empírico del mundo
natural. Por lo tanto, existen dos supuestos muy diferentes sobre la naturaleza esencial del fenómeno fundamental que
se debe captar.
Una segunda diferencia surge al considerar el carácter de las respuestas que cada uno busca. El punto de vista
caracterizaciones encontradas en las matemáticas (y a veces en la física). La tradición psicológica, por el contrario,
sugiere que la inteligencia no es sólo un fenómeno natural, sino que es un fenómeno natural intrínsecamente complejo:
como la anatomía y la fisiología humanas son sistemas intrínsecamente complejos que resultan de un largo proceso de
evolución, tal vez lo sea la inteligencia. Como tal, la inteligencia puede ser una colección amplia y fundamentalmente ad
hoc de mecanismos y fenómenos, para la cual puede no ser posible realizar descripciones completas y concisas.
Son varias las consecuencias útiles que se derivan de la comprensión de las diferentes posiciones adoptadas por
cada tradición sobre esta cuestión fundamental. En primer lugar, demuestra que seleccionar cualquiera de los
descendientes modernos de esas tradiciones -es decir, cualquiera de las tecnologías de representación mostradas al
final de la tabla- significa elegir más que una representación: en el mismo acto también estamos seleccionando una
En segundo lugar, esas concepciones difieren de manera importante: hay diferencias fundamentales en la
concepción del fenómeno que intentamos captar. Las diferentes concepciones a su vez significan que existen profundas
diferencias de fondo en el carácter y las metas de los diversos esfuerzos de investigación que intentan crear programas
inteligentes. En pocas palabras: diferentes concepciones de la naturaleza del razonamiento inteligente conducen a
Por último, esas diferencias rara vez se expresan. Esto a su vez conduce a argumentos que pueden ser expresados
en términos de temas como la elección de la representación (por ejemplo, las virtudes del razonamiento sólido en FOPC
vs. la dificultad de caracterizar inferencias producidas por sistemas basados en marcos), cuando los temas reales son,
creemos, las diferentes concepciones de la naturaleza fundamental de la inteligencia. Comprender las diferentes
inferencias autorizadas, es decir, un conjunto seleccionado de inferencias que se consideran conclusiones apropiadas
para extraer de la información disponible. La definición clásica viene dada por la lógica formal tradicional, donde las
únicas inferencias autorizadas son las inferencias correctas (es decir, aquellas comprendidas por la vinculación lógica, en
las que cada modelo para el conjunto de axiomas es también un modelo para la conclusión). Esta respuesta tiene una
serie de importantes beneficios, incluyendo la satisfacción intuitiva (un argumento válido nunca introducirá error), explícito
(ya que sabemos exactamente de qué estamos hablando), lo suficientemente preciso como para que pueda ser objeto de
pruebas formales, y lo suficientemente antiguo como para que hayamos acumulado una experiencia significativa sobre
él.
La lógica también ha explorado diversas formas de inferencia poco sólidas, incluyendo la circunscripción y el
secuestro. Esta exploración se ha guiado normalmente por el requisito de que haya "una justificación teórica del modelo
bien motivada"[19], como por ejemplo el criterio de modelo mínimo de circunscripción. Este requisito mantiene un
componente fundamental del enfoque logicista: si bien está dispuesto a llegar a conclusiones que son verdaderas en
algún subconjunto de los modelos (y no en cada modelo) el conjunto de inferencias sancionadas sigue siendo concebido
Otras representaciones han explorado otras definiciones: los sistemas de razonamiento probabilista (por ejemplo,
[20]) permiten las inferencias especificadas mediante la teoría de la probabilidad, mientras que el trabajo sobre los
Entre las tecnologías de representación de conocimiento común, los sistemas basados en reglas capturan conjeturas
del tipo que hace el experto humano, conjeturas que no son necesariamente ni sólidas ni verdaderas en ningún modelo.
Una representación basada en marcos anima a saltar a conclusiones posiblemente incorrectas basadas en buenos
inferencias autorizadas con referencia al comportamiento del experto humano, más que a un modelo formal abstracto.
maneras que difieren tanto en el contenido como en la forma. Mientras que la especificación de la lógica, por ejemplo, se
respuestas expresadas en otros términos, a menudo con una precisión considerablemente menor. La teoría de los
marcos, por ejemplo, ofrece una definición expresada en términos de comportamiento humano y se especifica sólo
aproximadamente.
Las diferencias de contenido y estilo, a su vez, tienen su origen en las diferentes concepciones de razonamiento
inteligente exploradas anteriormente. La definición en términos de comportamiento humano es apropiada para los
marcos porque la teoría concibe el razonamiento inteligente como una forma característica del comportamiento humano.
Al tratar de describir ese comportamiento, la teoría se enfrenta a la tarea de caracterizar un fenómeno empírico complejo
que sólo puede ser captado en forma aproximada en este momento, y que puede que nunca sea especificable con
Para la teoría de los marcos, por tanto, la especificación de inferencias sancionadas es tanto informal como empírica,
como una consecuencia inevitable de su concepción de la inteligencia. Sin embargo, el trabajo (y otros trabajos como
éste) no es descuidado ni carece de precisión causal; la concepción subyacente del razonamiento inteligente dicta un
enfoque diferente de la tarea, un conjunto de términos diferentes en los que expresar la respuesta y un enfoque diferente
para la respuesta.
El objetivo general es reconocer la legitimidad de una variedad de enfoques para especificar inferencias aceptadas:
la teoría de modelos puede ser familiar y poderosa, pero incluso para los sistemas formales no es el único lenguaje
posible. En términos más generales, las definiciones formales no son los únicos términos en los que se puede especificar
la respuesta. La elección del vocabulario apropiado y el grado de formalidad dependen a su vez de la concepción básica
Mientras que las inferencias autorizadas nos dicen qué conclusiones podemos sacar, ese conjunto es
invariablemente muy grande y por lo tanto nos proporciona una restricción insuficiente. Cualquier sistema automatizado
que intente razonar, guiado sólo por el conocimiento de las inferencias autorizadas, pronto se verá abrumado por las
elecciones. De ahí que necesitemos algo más que una indicación de qué inferencias podemos hacer legalmente, también
necesitamos alguna indicación de qué inferencias son las apropiadas para hacer, es decir, inteligentes. Esta indicación
Obsérvese que la necesidad de una especificación de inferencias recomendadas significa que al especificar una
representación también necesitamos decir algo sobre cómo razonar inteligentemente. La representación y el
razonamiento están inextricablemente entrelazados, y son útiles: una representación del conocimiento es una teoría del
razonamiento inteligente.
Razonablemente a menudo esa teoría ha sido proporcionada por la observación del comportamiento humano. La
exposición original de Minsky de la teoría del marco, por ejemplo, ofrece un ejemplo claro de un conjunto de inferencias
Esta es una teoría parcial del pensamiento..... Cada vez que uno se encuentra con una nueva situación (o
hace un cambio sustancial en su punto de vista), selecciona de la memoria una estructura llamada marco; un
esquema recordado para adaptarse a la realidad cambiando los detalles según sea necesario.
Un marco...[representa] una situación estereotipada, como estar en una cierta clase de salón o ir a una fiesta de
cumpleaños de un niño.
La primera frase ilustra la interrelación entre razonamiento y representación: se trata de un documento sobre la
representación del conocimiento, pero anuncia desde el principio que también es una teoría del pensamiento. Esa teoría,
a su vez, surgió de una percepción del razonamiento inteligente humano, es decir, de cómo la gente podía llegar a hacer
el tipo de inferencias sencillas de sentido común que parecen difíciles de captar en los programas. La teoría señala un
conjunto particular de inferencias para recomendar, a saber, el razonamiento en el estilo de la concordancia anticipada.
Se pueden dar caracterizaciones similares de inferencias recomendadas para la mayoría de las otras tecnologías de
representación. Las redes semánticas en su forma original, por ejemplo, recomiendan la propagación bidireccional a
través de la red, inspirada en el carácter interconectado de las definiciones de las palabras y la parte de la inteligencia
humana manifestada en la habilidad de las personas para encontrar conexiones entre conceptos aparentemente
dispares. Las reglas de los sistemas basados en el conocimiento recomiendan inferencias plausibles, inspiradas en la
La lógica, por el contrario, ha adoptado tradicionalmente una postura minimalista al respecto. La representación en sí
misma sólo ofrece una teoría de inferencias autorizadas, buscando permanecer en silencio sobre la cuestión de qué
inferencias recomendar.
El silencio sobre este tema está motivado por el deseo de generalidad en la maquinaria de inferencia y una forma
declarativa (es decir, independiente del uso) para el lenguaje, ambos objetivos fundamentales del enfoque logicista:"...
los logicistas se esfuerzan por hacer que el proceso de inferencia sea lo más uniforme y el dominio lo más independiente
posible y por representar todo el conocimiento (incluso el conocimiento sobre cómo usar el conocimiento) de forma
declarativa". [19]
Pero una representación con estos objetivos no puede destacar ningún conjunto particular de inferencias que se
puedan recomendar, por dos razones. En primer lugar, si el proceso de inferencia ha de ser general y uniforme (es decir,
trabajar sobre todos los problemas, y trabajar de la misma manera), debe ser neutral en cuanto a qué inferencias
recomendar: cualquier subconjunto particular de inferencias que se intente destacar podría ser apropiado en una
situación pero fatalmente malo en otra, ya que ninguna estrategia de inferencia (preferencias unitarias, conjunto de
apoyo, etc.) es universalmente apropiada. En segundo lugar, si las declaraciones en el lenguaje han de ser declarativas,
deben expresar un hecho sin ninguna indicación de cómo razonar con él (la expresión libre de uso es una característica
definitoria de una representación declarativa). Por lo tanto, el motor de inferencia no puede recomendar inferencias (o
pierde su generalidad y uniformidad) y las afirmaciones de hecho en el lenguaje no pueden recomendar inferencias (ya
El deseo de generalidad y de expresión libre de uso impide así que la representación misma pueda elegir inferencias
para recomendar. Pero si la representación en sí no puede hacer la recomendación, el usuario debe hacerlo, ya que la
Esto es en parte una virtud deliberada del enfoque logicista: impedir que la representación seleccione inferencias y,
por lo tanto, exigir al usuario que lo haga, ofrece la oportunidad de que esa información se represente explícitamente, en
lugar de estar implícitamente incrustada en la maquinaria de la representación (como, por ejemplo, en los sistemas
Una dificultad con este objetivo admirable surge al tratar de proporcionar al usuario las herramientas para expresar
las estrategias y guiar el sistema. Se utilizan comúnmente tres enfoques: hacer que el usuario le diga al sistema qué
hacer, que el usuario lo guíe para que haga lo correcto y que construya estrategias de inferencia para propósitos
especiales. Al "decirle al sistema lo que debe hacer" queremos decir que el usuario recomiende un conjunto de
inferencias escribiendo declaraciones en el mismo lenguaje (declarativo) utilizado para expresar hechos sobre el mundo
(por ejemplo, MRS[9]). Al "guiar al sistema a hacer lo correcto" nos referimos a que el usuario seleccione
cuidadosamente los axiomas, teoremas y lemas que se le suministrarán al sistema. La presencia de un lema, por
ejemplo, no es simplemente un hecho que el sistema deba conocer, sino que también proporciona una manera de
abreviar una larga cadena de deducciones en un solo paso, permitiendo que el sistema dé un "gran" paso en una cierta
dirección (a saber, la dirección en la que el lema nos lleva). Con una cuidadosa selección de hechos y lemas el usuario
puede recomendar indirectamente un conjunto particular de inferencias. Por "estrategias de inferencia de propósito
especial" nos referimos a construir estrategias de control específicas directamente en el demostrador de teoremas. Esto
puede ofrecer una aceleración significativa y un nivel pragmáticamente útil de eficiencia computacional.
Cada uno de estos enfoques tiene tanto beneficios como inconvenientes. Expresar las estrategias de razonamiento
en la lógica de primer orden está en consonancia con el espíritu del enfoque logicista, es decir, la representación explícita
del conocimiento en una representación uniforme y declarativa. Pero esto es a menudo problemático en la práctica: un
lenguaje diseñado para expresar los hechos declarativamente no es necesariamente bueno para expresar la información
La selección cuidadosa de los lemas es, en el mejor de los casos, una codificación indirecta de la información
orientativa que debe facilitarse. Por último, los mecanismos de deducción para fines especiales son potentes, pero
incrustan la estrategia de razonamiento tanto invisible como procedimentalmente, anulando los objetivos originales de
La buena noticia aquí es que al permanecer deliberadamente en silencio sobre el tema de las inferencias
recomendadas, la lógica ofrece tanto un grado de generalidad como la posibilidad de hacer que la información sobre las
inferencias recomendadas sea explícita y esté disponible para ser razonada a su vez. La noticia menos positiva es que la
tarea de guiar el sistema se ha dejado al usuario sin asistencia conceptual, y las prácticas que a veces provocan
Desde un punto de vista puramente mecanicista, el razonamiento en las máquinas (y algo más debatible, en las
personas) es un proceso computacional. En pocas palabras, para usar una representación debemos calcular con ella.
Como resultado, las preguntas acerca de la eficiencia computacional son inevitablemente centrales en la noción de
representación.
Esto ha sido reconocido desde hace mucho tiempo, al menos implícitamente, por los diseñadores de
representaciones: junto con su especificación de un conjunto de inferencias recomendadas, las representaciones ofrecen
habitualmente un conjunto de ideas sobre cómo organizar la información de forma que se facilite hacer esas inferencias.
Una parte importante de la noción original de marcos, por ejemplo, se refiere a este tipo de sugerencias, como ilustra la
Un marco...[representa] una situación estereotipada, como estar en una cierta clase de salón o ir a una fiesta
de cumpleaños de un niño.
A cada marco se le añaden varios tipos de información. Parte de esta información se refiere a cómo utilizar el marco.
Algunos hablan de lo que uno puede esperar que suceda a continuación. Algunos se refieren a qué hacer si estas
expectativas no se confirman.
La noción de desencadenantes y el agregado de procedimientos en los marcos no es tanto una declaración sobre
qué procedimientos escribir (sobre esto la teoría es bastante vaga), como una descripción de una manera útil de
organizar la información: por ejemplo, (paráfrasis de arriba) adjuntar a cada marco información sobre cómo usar el
marco, qué hacer si no se confirman las expectativas, etc. Del mismo modo, la organización de los marcos en jerarquías
taxonómicas permite el razonamiento taxonómico y facilita su ejecución (como en las redes estructuradas de herencia).
Otras representaciones ofrecen orientaciones similares. Las redes semánticas tradicionales facilitan la propagación
bidireccional por el simple hecho de proporcionar un conjunto apropiado de enlaces, mientras que los sistemas basados
en reglas facilitan inferencias plausibles al proporcionar indicadores desde objetivos a reglas cuya conclusión coincide
(para encadenamientos hacia atrás) y desde hechos a reglas cuya premisa coincide (para encadenamientos hacia
adelante).
Si bien la cuestión del uso eficiente de las representaciones ha sido abordada por los diseñadores de las
representaciones, en el sentido más amplio del término, el campo parece haber sido históricamente ambivalente en su
reacción. El reconocimiento temprano de la noción de adecuación heurística[16] demuestra que los investigadores
apreciaron desde el principio la importancia de las propiedades computacionales de una representación, pero el tono de
gran parte del trabajo posterior en la lógica (por ejemplo,[13]) sugirió que la epistemología (contenido de conocimiento)
por sí sola importaba, y dejaba fuera de la agenda la eficiencia computacional. La epistemología sí importa, por supuesto,
y puede resultar útil estudiarla sin la posibilidad de que distraiga la atención sobre la velocidad. Pero al final debemos
calcular con nuestras representaciones, por lo que la eficiencia debe ser parte de la agenda.
El péndulo más tarde se balanceó bruscamente, a lo que podríamos llamar la vista imperativa computacional.
Algunos trabajos en este sentido (por ejemplo,[15]) ofrecían lenguajes de representación cuyo diseño estaba fuertemente
impulsado por el deseo de proporcionar no sólo eficiencia, sino también eficacia garantizada. El resultado parece ser un
Cualquiera de los dos extremos de este espectro parece problemático: ignoramos las consideraciones
computacionales a nuestro riesgo, pero también podemos preocuparnos demasiado por ellas, produciendo
Finalmente, las representaciones del conocimiento son también el medio por el que expresamos cosas sobre el
mundo, el medio de expresión y comunicación en el que le contamos a la máquina (y quizás entre nosotros) sobre el
mundo. Este rol de las representaciones es inevitable siempre y cuando necesitemos decirle a la máquina (u otras
personas) sobre el mundo, y siempre y cuando lo hagamos creando y comunicando representaciones. (5) La quinta
función de las representaciones del conocimiento es, pues, como medio de expresión y comunicación para nosotros.
A su vez, esto plantea dos grupos importantes de preguntas. Un grupo es conocido: ¿Qué tan bien funciona la
representación como medio de expresión? ¿Qué tan general es? ¿Qué tan preciso? ¿Proporciona una adecuación
expresiva? etc.
Una pregunta importante que se discute con menos frecuencia es: ¿Qué tan bien funciona como medio de
comunicación? Es decir, ¿qué tan fácil es para nosotros "hablar" o pensar en ese idioma? ¿Qué tipo de cosas se dicen
fácilmente en el lenguaje y qué tipo de cosas son tan difíciles como para ser pragmáticamente imposibles?
Observe que las preguntas aquí son de la forma "¿qué tan fácil es?" en lugar de "¿podemos?" Este es un lenguaje
que debemos utilizar, por lo que las cosas que son posibles en principio son útiles pero insuficientes; la verdadera
cuestión es de utilidad pragmática. Si la representación hace que las cosas sean posibles pero no fáciles, entonces como
usuarios reales nunca sabremos si hemos malinterpretado la representación y no sabemos cómo usarla, o si realmente
no puede expresar algunas cosas que nos gustaría decir. Una representación es el lenguaje en el que nos comunicamos,
Creemos que esta visión de la representación del conocimiento puede influir de manera útil en la práctica y puede
ayudar a informar el debate en torno a varias cuestiones de la investigación sobre la representación. Para la práctica
ofrece un marco que ayuda a hacer explícitos los puntos de vista importantes y el "espíritu" de una representación, e
ilustra la diferencia en el diseño que resulta de satisfacer en vez de violar ese espíritu.
Las consecuencias del punto de vista para la investigación incluyen (i) una concepción más amplia de la
representación, instando a que se tengan en cuenta todas las funciones al crear lenguajes de representación, (ii) el
reconocimiento de que una representación engloba una teoría del razonamiento inteligente, (iii) la capacidad de usar la
visión más amplia de la representación para guiar la combinación de representaciones, (iv) la capacidad de usar la visión
más amplia para diseccionar algunos de los argumentos sobre la equivalencia formal de las representaciones; y (v) la
Las limitaciones de espacio requieren que esbocemos brevemente estas consecuencias aquí; una discusión
Los roles enumerados arriba ayudan a caracterizar y hacer explícito el "espíritu" de una representación, el importante
conjunto de ideas e inspiraciones que se esconden detrás (y, significativamente, son a menudo menos obvias que) de la
maquinaria concreta utilizada para implementar la representación. El espíritu es a menudo difícil de describir con
precisión, pero creemos que está bien caracterizado por los últimos cuatro roles enumerados anteriormente (todas las
representaciones son sustitutos, por lo tanto hay poca diferencia entre ellos en el primer rol). La postura que una
representación adopta sobre cada uno de estos temas, junto con su justificación para esa postura, indica lo que la
representación está tratando de decir sobre cómo ver y razonar acerca del mundo.
La idea de los marcos, por ejemplo, está en su encarnación original[17] principalmente un compromiso ontológico y
una teoría del razonamiento inteligente basada en las percepciones sobre la cognición humana y la organización del
conocimiento en la memoria.
El mayor compromiso ontológico, por supuesto, es observar el mundo en términos de descripciones estereotipadas,
es decir, conceptos descritos en términos de lo que suele ser verdad sobre ellos. Esto es particularmente adecuado para
conceptos en el mundo natural, donde las categorías rara vez tienen especificaciones precisas en términos de
condiciones necesarias y suficientes, y donde abundan las excepciones. Existe un compromiso ontológico adicional en la
vinculación de los marcos con los sistemas para capturar los cambios de perspectiva; esto nos anima a buscar estos
reconocimiento, en particular comparando los estereotipos con las instancias individuales. Las sugerencias relativas a la
organización del conocimiento se basan en la creencia de que la información en la memoria humana está rica y
explícitamente interconectada, más que estructurada como un conjunto de hechos independientes o sólo conectados
implícitamente.
La teoría de los marcos recomienda inferencias producidas por la concordancia de estereotipos e instanciamiento, y
facilita esas inferencias por la propia estructura del marco, así como la posterior organización de los marcos en sistemas
de marcos.
La teoría permite inferencias que son poco sólidas, como en el razonamiento analógico y por defecto que se hace al
emparejar marcos. También se sancionan inferencias que implican desajustes relativamente grandes, con el fin de
La teoría proporciona un medio para el cálculo potencialmente eficiente, al considerar la comprensión como
igualación en lugar de deducción. Por último, ofrece un medio de expresión particularmente útil para describir conceptos
en el mundo natural, donde a menudo se necesita alguna forma de indicar qué propiedades tiene un objeto normalmente,
Dos consecuencias útiles resultan de caracterizar una representación en estos términos, haciendo explícita y
comprensible su posición sobre los roles. En primer lugar, permite una especie de teoría explícitamente invocada del uso
de la representación de Whorfian. Mientras que la representación que seleccionemos tendrá consecuencias inevitables
para nuestra forma de ver y razonar sobre el mundo, al menos podemos seleccionarla consciente y cuidadosamente,
intentando encontrar un par de gafas apropiadas para la tarea que nos ocupa. Los pasos en esta dirección incluirían que
los diseñadores de representación caracterizaran cuidadosamente la naturaleza de los vidrios que están suministrando
(por ejemplo, haciendo explícitos los compromisos ontológicos, las inferencias recomendadas, etc.) y haciendo que el
campo desarrolle principios para hacer coincidir las representaciones con las tareas.
En segundo lugar, esas caracterizaciones facilitarían el uso apropiado de una representación. Por apropiado
queremos decir usarlo en su espíritu, es decir, usado para lo que estaba destinado a hacer, no para lo que se puede
hacer. Sin embargo, con una regularidad sorprendente, el espíritu original de una representación se ve como un
oponente a vencer. Con una regularidad sorprendente, el espíritu se olvida, reemplazado por una visión mucho más
mecanicista que ve una estructura de datos en lugar de una representación, computación más que inferencia. Los
trabajos escritos con esta mentalidad suelen contener afirmaciones de cómo el autor fue capaz, a través de un acto
creativo, heroico y a menudo oscuro, de conseguir una representación para hacer algo que normalmente no hubiéramos
programación: la tarea se convierte en hacer lo que ya sabemos que queremos hacer, pero nos vemos obligados a
hacerlo usando sólo los constructos disponibles en la representación, no importa cuán buenos o malos sean los ajustes.
En ese caso, el trabajo creativo es a menudo la superación de la representación, viendo cómo podemos conseguir
que se comporte como otra cosa (6). El resultado son representaciones del conocimiento aplicadas de un modo que no
está basado en las inspiraciones y percepciones que llevaron a su invención y que son la fuente de su capacidad. Los
sistemas construidos con este espíritu a menudo funcionan a pesar de sus representaciones, no por ellas; funcionan
porque los autores, aunque con gran esfuerzo, lograron superar la representación.
En varias ocasiones en el desarrollo del campo, se ha sugerido que deberíamos considerar la representación del
conocimiento en términos puramente epistemológicos, es decir, asumir el papel singular de la representación para
transmitir el contenido del conocimiento (por ejemplo,[13]). Como hemos señalado anteriormente, la epistemología
importa, pero no es todo lo que importa. La representación y el razonamiento están inextricablemente entrelazados: no
podemos hablar de uno sin también, inevitablemente, discutir el otro. Argumentamos también que el intento de tratar la
representación como contenido del conocimiento por sí solo conduce a una concepción incompleta de la tarea de
Cada una de estas afirmaciones se fundamenta en una observación hecha anteriormente. Observamos primero que
cada representación encierra en su núcleo una concepción de lo que constituye el razonamiento inteligente (por ejemplo,
la Tabla I). De ahí que toda discusión sobre la representación lleve inevitablemente consigo una visión (quizás implícita)
También observamos que, al construir un razonador inteligente no basta con indicar qué inferencias son legales, sino
que también necesitamos saber cuáles son las apropiadas (es decir, las recomendadas). Un ejemplo familiar de la lógica
muestra muy bien este punto: de AA podemos inferir A∧AA∧A, A∧A∧AA∧A∧A, etc. Todas estas son inferencias legales,
De ahí nuestra afirmación de que una teoría de inferencia legal es por lo tanto insuficiente; para construir un
razonador inteligente también necesitamos una teoría de inferencia inteligente. De hecho, puede haber múltiples teorías
Recordemos que una representación es, entre otras cosas, una teoría del razonamiento inteligente y un conjunto de
mecanismos para implementar esa teoría. Creemos que la atención apropiada a ambos aspectos, en el orden apropiado,
los dos mecanismos trabajen juntos, con una atención insuficiente (y a veces nula) a lo que consideramos la tarea mucho
más importante: determinar cómo las dos teorías del razonamiento inteligente podrían trabajar juntas. Centrarse en los
mecanismos significa determinar cómo, por ejemplo, las reglas, los procedimientos y los objetos pueden invocarse
mutuamente. Centrarse en las teorías del razonamiento inteligente significa prestar atención a qué tipo de razonamiento
está dentro del espíritu de cada representación y cómo esas variedades de razonamiento podrían combinarse
sensatamente.
Dos esfuerzos por combinar las representaciones ilustran las diferentes concepciones de la tarea que resulta de
centrarse en el mecanismo y en el razonamiento. Como primer ejemplo, consideremos esta descripción del sistema
de reglas es un objeto, las reglas son objetos, y también lo son los conjuntos de reglas. Los métodos en las
clases pueden ser funciones LISP o conjuntos de reglas. Los procedimientos en valores activos pueden ser
funciones LISP, conjuntos de reglas o métodos de llamada. El anillo en el logo LOOPS refleja el hecho de que
LOOPS no sólo contiene los diferentes paradigmas, sino que los integra. Los paradigmas están diseñados no
sólo para complementarse entre sí, sino también para ser usados juntos en combinación.
Comparemos la mentalidad y el enfoque de arriba con esta visión de una empresa similar, también dirigida a
Las reglas y marcos son dos esquemas opuestos para representar diferentes tipos de conocimiento. Las
reglas son apropiadas para representar implicaciones lógicas, o para asociar acciones a las condiciones bajo las
cuales se deben tomar las acciones. ... Los marcos (o redes semánticas) son apropiados para definir términos y
describir objetos y las relaciones taxonómicas de clase/miembro entre ellos. Una importante capacidad de
razonamiento de los sistemas de marcos con semántica bien definida es que pueden inferir las relaciones de
Dado que las fortalezas y debilidades de las reglas y marcos son complementarias entre sí, un sistema que integre
ambos se beneficiará de las ventajas de ambas técnicas. Este artículo describe una arquitectura híbrida llamada
programación basada en la clasificación que amplía la arquitectura del sistema de producción utilizando capacidades de
clasificación automática dentro de las representaciones de marcos. Al hacerlo, el sistema realza el poder de un patrón de
concordancia en un sistema de producción, desde la concordancia simbólica a la semántica, organiza reglas en clases
de reglas basadas en sus funcionalidades, e infiere las diversas relaciones entre reglas que facilitan la representación
Obsérvese en particular cómo el primero de estos esfuerzos se centra en los mecanismos computacionales, mientras
que el segundo se refiere a la representación y al razonamiento. El primero busca permitir que varias estructuras de
programación -entre ellas reglas y objetos estructurados- trabajen juntas, mientras que el segundo intenta permitir que
dos representaciones -reglas y objetos estructurados- trabajen juntas. El primero busca permitir mecanismos para
invocarse unos a otros, mientras que el segundo considera las diferentes variedades de inferencia naturales a dos
representaciones y sugiere cómo esas dos clases de razonamiento podrían trabajar sinérgicamente: las reglas deben ser
usadas para el tipo de razonamiento que captan mejor --las implicaciones lógicas no restringidas-- y los marcos deben
ser usados por su fortaleza, es decir, el razonamiento taxonómico. El primer trabajo propone una arquitectura
Ambas son empresas importantes, pero creemos que donde el objetivo es combinar representaciones, la tarea debe
ser concebida en términos centrales para una representación: su teoría del razonamiento inteligente. Para ello, debemos
considerar qué tipo de razonamiento esperamos de cada representación, debemos proponer un diseño para la forma en
que esos esquemas de razonamiento trabajarán juntos, y debemos tener una justificación para creer que esta será una
combinación efectiva. Lo primero y más importante que requerimos en esta tarea es una arquitectura de representación,
a partir de la cual se va a seguir la arquitectura computacional adecuada. Creemos que los esfuerzos que sólo se centran
en el segundo de estos dos aspectos están comenzando en el lugar equivocado y no llegarán a ser ni mucho menos una
Existe un patrón familiar en la investigación de la representación del conocimiento en el que la descripción de una
nueva tecnología de representación del conocimiento es seguida por afirmaciones de que las nuevas ideas son en
menudo en términos de equivalencia con la lógica. Las redes semánticas, por ejemplo, se han descrito en estos términos
(por ejemplo,[11],[18], mientras que el desarrollo de marcos condujo a una secuencia de tales reivindicaciones, incluida la
sugerencia de que "La mayoría de los `marcos' es sólo una nueva sintaxis para la lógica de primer orden" ([13]).
Que los marcos también pueden ser una sintaxis alternativa parece claro; que son sencilla o simplemente eso parece
considerablemente menos claro. El hecho de que los marcos no sean totalmente distintos de la lógica parece claro; que
toda la idea pueda verse como lógica parece mucho menos clara.
Creemos que afirmaciones como las anteriores son sustanciales sólo en el contexto de una noción de interpretación
estricta de lo que es una representación del conocimiento. Hayes[13] es explícito sobre parte de su postura al
respecto:"Se puede caracterizar un lenguaje representacional como uno que tiene (o se le puede dar) una teoría
semántica" y también sobre las estrechas líneas trazadas alrededor del argumento:"Aunque a veces se entienden los
marcos a nivel metafísico y a veces a nivel computacional, los discutiré como una propuesta representacional", es decir,
como un lenguaje con una teoría semántica, y nada más. Tanto la metafísica como la computación han sido
consideradas al margen. Y otra vez:"Nada de esta discusión[sobre los marcos como un "dispositivo computacional" para
organizar el acceso e inferencia de la memoria] involucra cuestiones de representación". Aquí se hace evidente que la
afirmación se refiere menos a marcos y más a una definición de lo que se considerará como "cuestiones de
representación".
decir,"qué entidades se supone que existen en el mundo", y las propiedades computacionales que la representación
proporciona. A pesar de las afirmaciones en sentido contrario, argumentaríamos que la ontología de los marcos (y otras
representaciones) y las preguntas computacionales no sólo involucran cuestiones de representación, sino que son
cuestiones de representación. Estas y otras propiedades son cruciales para la representación del conocimiento tanto en
Si bien las representaciones a menudo se diseñan prestando considerable atención a uno u otro de los temas
enumerados en nuestras cinco funciones, creemos que todas las funciones tienen una importancia considerable y que
ignorar cualquiera de ellas puede dar lugar a insuficiencias importantes. Mientras que los diseñadores rara vez pasan por
alto el papel de la representación como sustituto y como definición de inferencias autorizadas, no es raro que haya una
orientación insuficiente sobre los otros roles, y las consecuencias son importantes.
Como hemos argumentado anteriormente, por ejemplo, el compromiso ontológico es importante: la orientación que
proporciona al dar sentido a la profusión de detalles en el mundo es una de las cosas más importantes que ofrece una
representación. Sin embargo, algunas representaciones, en una búsqueda de la generalidad, ofrecen poco apoyo en esta
dimensión.
Un argumento similar se aplica a la teoría del razonamiento inteligente: una representación puede guiar y facilitar el
razonamiento si tiene en su corazón una teoría de lo que el razonamiento debe hacer. Una orientación insuficiente aquí
La computación pragmáticamente eficiente es importante porque la mayor parte del uso de una representación es
(por definición) en el caso promedio. El interés en producir representaciones más débiles para garantizar un mejor
rendimiento en el peor de los casos puede ser erróneo, exigiendo mucho más de lo necesario y pagando un alto precio
por ello. (7) El uso de una representación como medio de expresión y comunicación, importa porque debemos ser
capaces de hablar el lenguaje para utilizarlo. Si no podemos determinar cómo decir lo que estamos pensando, no
Por supuesto, intentar diseñar representaciones para acomodar los cinco roles es un reto, pero creemos que la
El objetivo de la investigación en RC
Creemos que la preocupación principal del campo de la representación del conocimiento debe ser comprender y
describir la riqueza del mundo. Sin embargo, en la práctica, la investigación que se describe a sí misma como un trabajo
de representación del conocimiento fundamental ha concentrado casi todos sus esfuerzos en un canal mucho más
estrecho, la mayor parte de ellos centrados en el razonamiento taxonómico y por defecto (por ejemplo,[2],[15],[8]).
Creemos que no es un accidente que la visión útil para encontrar un buen conjunto de abstracciones temporales
provenga del examen minucioso de una tarea realista establecida en un dominio del mundo real. Subraya nuestra
convicción (compartida por otros; ver[14]) de que intentar describir la riqueza del mundo natural es la función apropiada
para el trabajo de RC
Nuestro argumento aquí se refiere tanto al etiquetado como a la metodología: (i) trabajos como[10] y[14] deben ser
reconocidos por la comunidad RC como de importancia central para la investigación RC, no categorizados como
diagnósticos o física cualitativa y vistos como no relacionados, y (ii) las percepciones obtenidas en[10] y[14] provienen
del estudio del mundo, no de los lenguajes. Sostenemos que aquellos que optan por identificarse como investigadores de
KR deberían estar desarrollando teoría y tecnología que facilite proyectos como estos; y, en cambio, aquellos que están
construyendo proyectos como estos se dedican a una importante variedad de investigación de RC.
Si bien las herramientas y las técnicas son importantes, el campo es y debe ser mucho más rico que eso,
principalmente porque el mundo es mucho más rico que eso. Creemos que entender y describir esa riqueza debe ser la
Resumen
Hemos argumentado que una representación del conocimiento desempeña cinco roles distintos, cada uno importante
para la naturaleza de la representación y sus tareas básicas. Esos roles crean demandas múltiples, a veces en
competencia, que requieren un equilibrio selectivo e inteligente entre las características deseadas. Esas cinco funciones
también ayudan a caracterizar claramente el espíritu de las representaciones y tecnologías de representación que se han
desarrollado.
Esta visión tiene consecuencias tanto para la investigación como para la práctica en el campo. En el ámbito de la
investigación, aboga por una concepción de la representación más amplia que la que se utiliza habitualmente, instando a
que los cinco aspectos son cuestiones esenciales de representación. Sostiene que el compromiso ontológico que aporta
una representación es una de sus contribuciones más significativas; por lo tanto, el compromiso debe ser sustancial y
cuidadosamente escogido. También sugiere que la tarea fundamental de la representación es describir el mundo natural
y afirma que el campo avanzaría más lejos tomando esto como su preocupación central.
Para la práctica del trabajo de RC, la perspectiva sugiere que la combinación de representaciones es una tarea que
debe ser impulsada por visiones sobre cómo combinar sus teorías de razonamiento inteligente, no sus mecanismos de
implementación. La opinión también insta a que se comprenda y se conceda indulgencia al espíritu fundamental de las
representaciones. Sugerimos que las tecnologías de representación no deben ser consideradas como oponentes a
vencer, forzadas a comportarse de una manera particular, sino que deben ser entendidas en sus propios términos y
utilizadas de maneras que se basan en las ideas que fueron su inspiración original y su fuente de poder.
Notas
1. Por el contrario, la acción puede sustituir al razonamiento. Este dualismo ofrece una manera de entender la
relación entre las representaciones simbólicas tradicionales y el enfoque de la acción, que argumenta que la
acción puede vincularse directamente a la percepción, sin necesidad de intermediar las representaciones
simbólicas.
2. La frase "compromiso ontológico" no es tal vez precisamente correcta para lo que tenemos en mente aquí, pero
es la aproximación más cercana disponible. Mientras que la ontología, en sentido estricto, se ocupa de lo que
existe en el mundo, hemos redactado esta sección cuidadosamente en términos de cómo ver el mundo,
esquivando intencionalmente muchas cuestiones filosóficas espinosas comunes que rodean las afirmaciones
de lo que existe. Una segunda forma de abordar el tema es observar que el "mundo" que nos interesa
capturar es el mundo dentro de la mente de algún observador humano inteligente (por ejemplo, un médico,
ingeniero, etc.), en cuyo caso se puede argumentar plausiblemente que en ese mundo existen reglas,
3. Obsérvese que incluso al principio hay un indicio de la idea de que la forma deseada de razonamiento podría
4. Las consecuencias de este enfoque son evidentes incluso en el uso de la forma normal disyuntiva como
transformación. La primera forma podría ser leída como sugiriendo que X1X1, X2X2 y X3X3 tienen algo en
común, a saber, que deben ser consideradas como las precondiciones necesarias para establecer X4X4. Esto
puede ser una pista útil sobre cómo razonar en el problema, pero si es así, se pierde en la transformación a
FND. Considere en cambio lenguajes como microPLANNER y PROLOG, que hacen uso explícito de la forma
5. Probablemente seguirá siendo útil aunque las máquinas inventen sus propias representaciones de
incomprensibles para nosotros, las máquinas no podrán ni decirnos lo que saben o explicar sus conclusiones.
6. Por supuesto, es útil establecer la equivalencia de dos representaciones mostrando cómo se puede hacer que
una persona se comporte como otra. Pero este es un ejercicio que sólo se debe hacer una vez, y se hace por
7. Como hemos argumentado en otras partes[4], un "acantilado computacional" (es decir, un comportamiento
inaceptable en el peor de los casos) es un problema sólo si no se puede interrumpir toda inferencia, una vez
que se pone en marcha. El simple hecho de que el cálculo limitado en recursos evita cualquier inferencia de
atrapar permanentemente al programa en una tarea que requiere cantidades de tiempo irrazonables.