Está en la página 1de 26

Representación del Conocimiento

Última modificación: 21 de Septiembre de 2019, y ha tenido 20157 vistas


Etiquetas utilizadas: inteligencia artificial || minsky || modelado

Esta entrada es una traducción del artículo de R. Davis, H. Shrobe, and P. Szolovits. What is a Knowledge

Representation? AI Magazine, 14(1):17-33, 1993

Aunque la Representación del Conocimiento es uno de los conceptos centrales y, de alguna manera, más conocidos

en Inteligencia Artificial, la pregunta más fundamental "¿qué es?" rara vez se ha contestado directamente. En esta

entrada volvemos a lo básico para abordar la cuestión directamente. Creemos que la respuesta se puede entender mejor

en función de los cinco roles importantes, y claramente diferentes, que desempeña una representación, cada uno de los

cuales plantea necesidades diferentes, y a veces contradictorias, a las propiedades que debe tener una

representación. Sostenemos que el hecho de tener en cuenta estas cinco funciones proporciona una perspectiva útil y

amplia que arroja luz sobre algunas controversias de larga duración y puede estimular tanto la investigación como la

práctica en el campo.

Introducción

¿Qué es una Representación del Conocimiento? Esta noción se puede entender mejor en términos de los cinco

posibles roles que desempeña, todos ellos cruciales para el objetivo de comprender qué es una representación del

conocimiento (RC, a partir de ahora):

 Una representación del conocimiento es fundamentalmente un sustituto, un reemplazo de la cosa misma,

utilizado para permitir a una entidad determinar consecuencias pensando en lugar de actuar, es decir,

razonando sobre el mundo en lugar de actuando en él.

 Es un conjunto de compromisos ontológicos, es decir, una respuesta a la pregunta: ¿en qué términos debo

pensar sobre el mundo?

 Es una teoría parcial del razonamiento inteligente, expresada en términos de tres componentes:

1. la concepción fundamental de la representación del razonamiento inteligente;

2. el conjunto de inferencias que la representación establece; y

3. el conjunto de inferencias que recomienda.

 Es un medio para la computación pragmáticamente eficiente, es decir, el entorno computacional en el que se

realiza el pensamiento. Una contribución a esta eficiencia pragmática es la que aporta la orientación que

proporciona una representación para organizar la información a fin de facilitar la realización de las inferencias

recomendadas.

 Es un medio de expresión humana, es decir, una lengua en la que decimos cosas sobre el mundo.

Comprender los roles y reconocer su diversidad tiene varias consecuencias útiles:


1. En primer lugar, cada rol requiere algo ligeramente diferente de una representación; cada uno de ellos conduce

a un conjunto interesante y diferente de propiedades que queremos que tenga una representación.

2. En segundo lugar, creemos que los roles proporcionan un marco útil para caracterizar una amplia variedad de

representaciones. Sugerimos que la "mentalidad" fundamental de una representación puede ser capturada al

entender cómo ve cada uno de los roles, y que al hacerlo revela similitudes y diferencias esenciales.

3. En tercer lugar, creemos que algunos desacuerdos previos sobre la representación se disuelven

provechosamente cuando los cinco roles reciben la consideración apropiada. Demostramos esto revisando y

diseccionando los primeros argumentos sobre marcos y lógica.

4. Por último, creemos que ver las representaciones de esta manera tiene consecuencias tanto para la

investigación como para la práctica. Para la investigación, este punto de vista proporciona una respuesta

directa a una pregunta de importancia fundamental en el campo. También sugiere adoptar una perspectiva

amplia sobre lo que es importante en una representación, y argumenta que una parte significativa de la

representación - capturar y representar la riqueza del mundo natural - está recibiendo atención insuficiente.

Creemos que esta visión también puede mejorar la práctica recordando a los especialistas las inspiraciones

que son fuentes significativas para una variedad de representaciones.

Terminología y perspectiva

Dos elementos de la terminología ayudarán en nuestra presentación.

1. Primero, usamos el término inferencia en un sentido genérico, para referirnos a cualquier forma de obtener

nuevas expresiones a partir de expresiones anteriores. Sólo en raras ocasiones estamos hablando de

inferencias lógicas sólidas y al hacerlo nos referimos explícitamente a eso.

2. En segundo lugar, y para darles un nombre colectivo único y diferencia del uso general anterior, nos referimos

al conocido conjunto de herramientas básicas de representación como la lógica, reglas, marcos, redes

semánticas, etc., como tecnologías de representación del conocimiento.

También resultará útil considerar explícitamente la práctica común de construir representaciones del conocimiento en

múltiples niveles de lenguajes, normalmente con una de las tecnologías de representación del conocimiento en el nivel

inferior. La ontología de líquidos de Hayes[12], por ejemplo, es a un nivel una representación compuesta de conceptos

como piezas del espacio, que tienen portales, caras, lados, etc. El lenguaje en el siguiente nivel más primitivo (y como

resultado, inferior) es la lógica de primer orden, donde, por ejemplo, In(s1, s2) es una relación que expresa que el

espacio s1 está contenido en s2.


Esta visión es útil en parte porque permite que nuestro análisis y discusión se concentre en gran medida en las

tecnologías RC. Al igual que el nivel de representación primitiva en los fundamentos de los lenguajes RC, se encuentran

con todos los temas centrales para la representación del conocimiento de cualquier variedad. También son ejemplos

útiles porque son ampliamente conocidos en el campo y hay un considerable conjunto de experiencias que se pueden

aprovechar.

¿Qué es una Representación de Conocimiento?

Tal vez la pregunta más fundamental sobre el concepto de representación del conocimiento sea: ¿Qué es?

Detallemos la respuesta en términos de los cinco roles fundamentales que se han anotado previamente:

Rol I: Una RC es un sustituto

Cualquier entidad inteligente que desee razonar sobre su mundo se encuentra con un hecho importante e ineludible:

el razonamiento es un proceso que transcurre internamente, mientras que la mayoría de las cosas sobre las que se

desea razonar sólo existen externamente. Un programa (o persona) dedicado a planificar el montaje de una bicicleta, por

ejemplo, puede tener que razonar sobre entidades como ruedas, cadenas, piñones, manillares, etc., pero tales cosas

existen sólo en el mundo exterior.

Esta inevitable dicotomía es una justificación y un rol fundamental para una representación: funciona como sustituto

dentro del razonador, como sustituto de las cosas que existen en el mundo. Las operaciones sobre, y con,

representaciones sustituyen a las operaciones sobre, y con, lo real, es decir, sustituyen a la interacción directa con el

mundo. Desde este punto de vista, el razonamiento mismo es en parte un sustituto de la acción en el mundo, cuando no

podemos o no queremos (todavía) tomar esa acción. (Ver Nota 1)

Considerar las representaciones como sustitutos conduce naturalmente a dos preguntas importantes. La primera

pregunta acerca de cualquier sustituto es su propia identidad: ¿para qué sirve? Debe haber alguna forma de

correspondencia especificada entre el sustituto y su pretendido referente en el mundo; la correspondencia es la

semántica para la representación.

La segunda pregunta es la fidelidad: ¿cuán cerca está el sustituto de lo real? ¿Qué atributos del original captura y

explicita, y cuáles omite? La fidelidad perfecta es en general imposible, tanto en la práctica como por principio. Es
imposible por principio, porque cualquier otra cosa que no sea la cosa en sí misma es necesariamente diferente de la

cosa misma (ya sea en la ubicación si no hay otra razón). Dicho de otro modo, la única representación completamente

exacta de un objeto es el objeto mismo. Todas las demás representaciones son inexactas; inevitablemente contienen

suposiciones simplificadoras y posiblemente artefactos.

Dos pequeñas elaboraciones amplían esta visión de las representaciones como sustitutos. En primer lugar, parece

servir tanto para los objetos intangibles como para los materiales como las ruedas dentadas: las representaciones

funcionan como sustitutos de nociones abstractas como acciones, procesos, creencias, causalidad, categorías, etc.,

permitiendo describirlas dentro de una entidad para que se pueda razonar sobre ellas. En segundo lugar, los objetos

formales pueden existir dentro de la máquina con una fidelidad perfecta: las entidades matemáticas, por ejemplo, pueden

ser capturadas con exactitud, precisamente porque son objetos formales. Puesto que casi cualquier tarea de

razonamiento encontrará la necesidad de tratar con objetos naturales (es decir, aquellos encontrados en el mundo real)

así como con objetos formales, los sustitutos imperfectos son pragmáticamente inevitables.

Los sustitutos imperfectos implican inferencias incorrectas inevitables.

Dos consecuencias importantes se derivan de la inevitabilidad de sustitutos imperfectos. Una consecuencia es que al

describir el mundo natural, debemos inevitablemente mentir, al menos por omisión. Como mínimo, debemos prescindir

de la complejidad efectivamente ilimitada del mundo natural; nuestras descripciones pueden además introducir artefactos

que no están presentes en el mundo.

La segunda y más importante consecuencia es que todos los razonamientos suficientemente amplios sobre el mundo

natural deben llegar a conclusiones incorrectas, independientemente del proceso de razonamiento utilizado e

independientemente de la representación empleada. El razonamiento correcto no puede salvarnos: si el modelo del

mundo es de alguna manera equivocado (y debe serlo) algunas conclusiones serán incorrectas, no importa lo

cuidadosamente extraídas que sean. Una mejor representación no puede salvarnos: todas las representaciones son

imperfectas y cualquier imperfección puede ser fuente de error.

El significado del error puede, por supuesto, variar; de hecho, gran parte del arte de seleccionar una buena

representación consiste en encontrar una que minimice (o quizás incluso elimine) el error para la tarea específica en

cuestión. Pero la inevitable imperfección de los sustitutos significa que podemos proporcionar al menos una garantía para

cualquier entidad razonando de cualquier manera sobre el mundo natural: si razona lo suficiente y ampliamente, está

garantizado que se equivoca.

Por lo tanto, extraer sólo inferencias correctas no libera al razonamiento del error; sólo puede garantizar que la

inferencia no es la fuente de ese error. Dado que el razonamiento de base general inevitablemente será incorrecto, el

paso de una inferencia correcta a otros modelos de inferencia no es, por lo tanto, un movimiento desde la exactitud total

hacia el error, sino una cuestión de equilibrar la posibilidad de una fuente más de error con las ganancias (por ejemplo, la

eficiencia) que puede ofrecer.


No sugerimos que el razonamiento poco riguroso deba ser aceptado casualmente, pero afirmamos que, dada la

inevitabilidad del error, incluso con razonamiento correcto, tiene sentido evaluar pragmáticamente los costes y beneficios

relativos derivados del uso de métodos de razonamiento rigurosos y poco rigurosos.

Rol II: Una RC es un conjunto de compromisos ontológicos

Si, como hemos argumentado, todas las representaciones son aproximaciones imperfectas a la realidad, cada

aproximación atendiendo a unas cosas e ignorando otras, al seleccionar cualquier representación estamos en el mismo

acto tomando inevitablemente un conjunto de decisiones sobre cómo y qué ver en el mundo. Es decir, seleccionar una

representación significa asumir un conjunto de compromisos ontológicos (ver nota 2). Los compromisos son como un par

de gafas fuertes que determinan lo que podemos ver, haciendo que alguna parte del mundo se centre en el punto de

mira, a expensas de desdibujar otras partes.

Estos compromisos, y su efecto de enfoque/difuminado, no son un efecto secundario incidental de una elección de

representación; son esenciales: un RC es un conjunto de compromisos ontológicos. Es inevitable que así sea debido a

las imperfecciones de las representaciones. Resulta útil porque una selección sensata de los compromisos ofrece la

oportunidad de centrar la atención en aspectos del mundo que consideramos pertinentes.

El efecto de enfoque es una parte esencial de lo que ofrece una representación, porque la complejidad del mundo

natural es abrumadora. Nosotros (y nuestras máquinas de razonamiento) necesitamos una guía para decidir qué es lo

que hay que atender y qué ignorar en el mundo. Las gafas suministradas por una representación pueden proporcionar

esa orientación: al decirnos qué y cómo ver, nos permiten hacer frente a lo que de otro modo sería una complejidad y un

detalle insostenibles. De ahí que el compromiso ontológico de una representación pueda ser uno de los aportes más

importantes que ofrece.

Hay una larga historia de trabajo que intenta construir buenas ontologías para una variedad de dominios de tareas,

incluyendo el trabajo inicial sobre una ontología para líquidos [12], el modelo de elementos agrupados ampliamente

utilizado en la representación de circuitos electrónicos (por ejemplo,[3]), así como ontologías para el tiempo, la creencia e

incluso la programación en sí misma. Cada uno de ellos ofrece una manera de ver alguna parte del mundo.

El modelo de elementos agrupados, por ejemplo, sugiere que pensemos en circuitos en términos de componentes

con conexiones entre ellos, con señales que fluyen instantáneamente a lo largo de las conexiones. Esta es una vista útil,

pero no la única posible. Una ontología diferente se presenta si necesitamos ocuparnos de la electrodinámica en el

dispositivo: aquí las señales se propagan a velocidad finita y un objeto (como una resistencia) que antes se veía como un

componente único con un comportamiento de E/S puede que ahora deba pensarse como un medio extendido a través

del cual fluye una onda electromagnética.

Las ontologías pueden, por supuesto, ser escritas en una amplia variedad de lenguajes y notaciones (por ejemplo, la

lógica, LISP, etc.); la información esencial no es la forma de ese lenguaje sino el contenido, es decir, el conjunto de
conceptos ofrecidos como una forma de pensar sobre el mundo. En pocas palabras, la parte importante son las nociones

como conexiones y componentes, no si optamos por escribirlas como predicados o estructuras de LISP.

El compromiso que asumimos al seleccionar una u otra ontología puede dar lugar a una visión muy distinta de la

tarea que nos ocupa. Por ejemplo, el diagnóstico médico visto en términos de reglas (por ejemplo, con el sistema

MYCIN) parece sustancialmente diferente de la misma tarea vista en términos de marcos (por ejemplo, con el sistema

INTERNIST). Mientras que MYCIN considera que el mundo de la medicina está compuesto por asociaciones empíricas

que conectan el síntoma con la enfermedad, INTERNIST considera que un conjunto de prototipos, en particular las

enfermedades prototípicas, deben ser cotejados con el caso concreto.

El compromiso comienza con las primeras elecciones

El ejemplo de INTERNIST también demuestra que existe un compromiso ontológico significativo e inevitable, incluso

a nivel de las tecnologías de representación habituales. Lógica, reglas, marcos, etc., cada uno encarna un punto de vista

sobre el tipo de cosas que son importantes en el mundo. La lógica, por ejemplo, implica un compromiso (muy mínimo) de

ver el mundo en términos de entidades individuales y relaciones entre ellas. Los sistemas basados en reglas ven el

mundo en términos de triples atributo-objeto-valor y las reglas de inferencia plausible que los conectan, mientras que los

marcos nos hacen pensar en términos de objetos prototípicos.

Cada uno de ellos aporta así su propia visión de lo que es importante atender, y cada uno sugiere, a la inversa, que

cualquier cosa que no sea fácilmente reconocible en esos términos puede ser ignorada. Por supuesto, no se garantiza

que esto sea correcto, ya que todo lo ignorado puede resultar pertinente más adelante. Pero la tarea es

desesperanzadora en principio -cada representación ignora algo sobre el mundo- de ahí que lo mejor que podemos

hacer es empezar con una buena suposición. Las tecnologías de representación existentes proporcionan un conjunto de

conjeturas sobre qué atender y qué ignorar. La selección de cualquiera de ellos implica un grado de compromiso

ontológico: la selección tendrá un impacto significativo en nuestra percepción y enfoque de la tarea, así como en nuestra

percepción del mundo que se está modelando.

Los compromisos se acumulan en capas

El compromiso ontológico de una representación comienza por lo tanto al nivel de las tecnologías de representación

y se construye desde allí. A medida que ponemos la tecnología a trabajar, se establecen nuevos niveles de compromiso.

El uso de estructuras enmarcadas en INTERNIST ofrece un ejemplo ilustrativo. En el nivel más fundamental, la decisión

de ver el diagnóstico en términos de marcos sugiere pensar en términos de prototipos, defectos y una jerarquía

taxonómica. Pero, ¿prototipos de qué y cómo se organizará la taxonomía?

Una descripción temprana del sistema [21] muestra cómo estas preguntas fueron respondidas en la tarea que nos

ocupa, suministrando el segundo nivel de compromiso:


La base de conocimientos que subyace en el sistema INTERNIST se compone de dos tipos básicos de elementos:

entidades y manifestaciones de la enfermedad. También contiene una jerarquía de categorías de enfermedades,

organizadas principalmente en torno al concepto de sistemas de órganos, teniendo en el nivel superior categorías tales

como "enfermedad hepática","enfermedad renal", etc.

Los prototipos, en consecuencia, están destinados a captar enfermedades prototípicas (por ejemplo, un "caso

clásico" de una enfermedad) y se organizarán en una taxonomía indexada en torno a los sistemas de órganos. Se trata

de un conjunto de opciones razonable e intuitivo, pero claramente no es la única forma de aplicar marcos a la tarea; por

lo tanto, es otro nivel de compromiso ontológico.

En la tercera (y en este caso última) capa, este conjunto de opciones es instanciado: ¿qué enfermedades serán

incluidas y en qué ramas de la jerarquía aparecerán? Las cuestiones ontológicas que surgen incluso en este nivel

pueden ser fundamentales. Consideremos, por ejemplo, la determinación de cuáles de los siguientes factores se

consideran enfermedades (es decir, estados anormales que requieren curación): alcoholismo, homosexualidad, y

síndrome de fatiga crónica. El compromiso ontológico aquí es suficientemente obvio e importante como para que a

menudo sea objeto de debate en el campo mismo, independientemente de la construcción de razonadores

automatizados.

Hay que tomar decisiones similares con todas las tecnologías de representación, porque cada una de ellas sólo

proporciona un primer orden de aproximación sobre cómo ver el mundo: ofrecen una forma de ver pero no indican cómo

instanciar esa visión. Como los marcos sugieren prototipos y taxonomías, pero no nos dicen qué cosas seleccionar como

prototipos, las reglas sugieren pensar en términos de inferencias plausibles, pero no nos dicen qué inferencias plausibles

hay que atender. Del mismo modo, la lógica nos dice que debemos ver el mundo en términos de individuos y relaciones,

pero no especifica qué individuos y relaciones utilizar.

El compromiso con una visión particular del mundo comienza con la elección de una tecnología de representación, y

se acumula a medida que se van tomando decisiones sobre cómo ver el mundo en esos términos.

Un recordatorio: Una RC no es una estructura de datos

Hay que tener en cuenta que en cada capa, incluso en la primera (por ejemplo, seleccionar reglas o marcos), las

opciones que se toman son sobre la representación, no sobre las estructuras de datos. Parte de lo que hace que un

lenguaje sea representativo es que tiene sentido [13], es decir, existe una correspondencia entre sus construcciones y las

cosas en el mundo exterior. Esa correspondencia conlleva a su vez una restricción.

Una red semántica, por ejemplo, es una representación, mientras que un grafo es una estructura de datos. Son

entidades de diversa índole, aunque una invariablemente se utiliza para implementar la otra, precisamente porque la red

tiene (debe tener) una semántica. Esa semántica se manifestará en parte porque limita la topología de la red: una red

que pretende describir las afiliaciones familiares tal como las conocemos no puede tener un ciclo en sus vínculos padre,
mientras que los grafos (es decir, las estructuras de datos) no están por supuesto bajo ninguna restricción y pueden tener

ciclos arbitrarios.

Mientras que cada representación debe ser implementada en la máquina por alguna estructura de datos, la

propiedad representacional está en la correspondencia con algo en el mundo y en la restricción que la correspondencia

impone.

Rol III: Una RC es una Teoría Parcial del Razonamiento Inteligente

El tercer rol de una representación es como teoría parcial del razonamiento inteligente. Este papel se debe a que la

concepción inicial de una representación está motivada normalmente por alguna perspicacia que indica cómo la gente

razona inteligentemente, o por alguna creencia sobre lo que significa razonar inteligentemente en realidad.

La teoría es parcial en dos sentidos distintos:

1. la representación normalmente incorpora sólo una parte de la percepción o creencia que la motivó, y

2. esa percepción o creencia es a su vez sólo una parte del fenómeno complejo y multifacético del razonamiento

inteligente.

La teoría del razonamiento inteligente de una representación es a menudo implícita, pero puede hacerse más

evidente examinando sus tres componentes:

1. la concepción fundamental de inferencia inteligente de la representación;

2. el conjunto de inferencias que la representación establece; y

3. el conjunto de inferencias que recomienda.

Mientras que las inferencias establecidas indican lo que puede inferirse, las inferencias recomendadas se refieren a

lo que debe inferirse. (Se necesitan directrices porque el conjunto de inferencias establecidas suele ser demasiado

grande para ser utilizado indiscriminadamente). Mientras que la ontología que examinamos antes nos dice cómo ver, las

inferencias recomendadas sugieren cómo razonar.

Estos componentes también pueden ser vistos como las respuestas de la representación a las tres cuestiones

fundamentales correspondientes:

1. ¿Qué significa razonar inteligentemente?

2. ¿Qué podemos inferir de lo que sabemos? y

3. ¿Qué debemos deducir de lo que sabemos?

Las respuestas a estas preguntas están en el corazón del espíritu y la mentalidad de una representación; conocer su

postura acerca de estos temas nos dice mucho al respecto.

Comenzamos con el primero de estos componentes, examinando dos de las diversas concepciones

fundamentalmente diferentes del razonamiento inteligente que se han explorado en la IA. Esas concepciones y sus
supuestos subyacentes demuestran la amplia gama de opiniones sobre la cuestión y establecen un contexto importante

para los demás componentes.

¿Qué es el razonamiento inteligente?

¿Cuáles son las propiedades esenciales que definen el razonamiento inteligente?

Como consecuencia de la relativa juventud de la IA como disciplina, las percepciones sobre la naturaleza del

razonamiento inteligente a menudo han provenido del trabajo en otros campos. Cinco campos --lógica matemática,

psicología, biología, estadística y economía-- han inspirado cinco nociones distinguibles de lo que constituye el

razonamiento inteligente (ver Tabla siguiente).

Una visión, históricamente derivada de la lógica matemática, hace suponer que el razonamiento inteligente es una

variedad de cálculos formales, típicamente deducibles; los ejemplos modernos de esta visión en AI son los logistas. Una

segunda visión, arraigada en el trabajo de la psicología, ve el razonamiento como un comportamiento humano

característico y ha dado lugar tanto al extenso trabajo sobre la resolución de problemas humanos como a la gran

colección de sistemas basados en el conocimiento.

Un tercer enfoque, poco arraigado en la biología, opina que la clave del razonamiento es la arquitectura de la

maquinaria que lo realiza, por lo que el razonamiento es un comportamiento de estímulo/respuesta característico que

surge de la interconexión paralela de una gran colección de procesadores muy simples. Los investigadores que trabajan

en varias variedades de conexionismo son los descendientes actuales de esta línea de trabajo. Un cuarto enfoque,

derivado de la teoría de la probabilidad, añade a la lógica la noción de incertidumbre, dando lugar a una visión en la que

razonar inteligentemente significa obedecer a los axiomas de la teoría de la probabilidad. Una quinta visión, desde la
economía, añade el ingrediente adicional de los valores y preferencias, conduciendo a una visión del razonamiento

inteligente definido por la adherencia a los principios de la teoría de utilidad.

Explorar brevemente el desarrollo histórico de los dos primeros puntos de vista ilustrará las diferentes concepciones

que tienen de la naturaleza fundamental del razonamiento inteligente y demostrará las profundas diferencias de fondo

que surgen como consecuencia.

Razonamiento inteligente: la visión lógica y la visión psicológica

Consideremos primero la tradición que rodea a la lógica matemática como una visión del razonamiento inteligente.

Esta visión tiene sus orígenes históricos en los esfuerzos de Aristóteles por acumular y catalogar los silogismos, en un

intento por determinar lo que se debe tomar como argumento convincente. (3) La línea continúa con Descartes, cuya

geometría analítica muestra que la obra de Euclides, aparentemente preocupada por el material del pensamiento puro

(líneas de ancho cero, círculos perfectos del tipo que sólo los dioses podían hacer), podía de hecho conectarse con el

álgebra, una forma de cálculo, algo que los simples mortales podían hacer.

En tiempos de Leibnitz la agenda es bastante específica y contundente: no buscó nada menos que un "cálculo del

pensamiento" que permitiera resolver todos los desacuerdos humanos con la simple invocación "Calculemos". Para

entonces existe una creencia clara y concreta de que, al igual que la geometría de Euclides, que alguna vez fue una

geometría divina e inalcanzable, podía ser capturada con el álgebra, alguna (o quizás cualquiera) variedad de esa

materia efímera llamada pensamiento podría ser capturada en el cálculo, específicamente la deducción lógica.

En el siglo XIX, Boole proporcionó las bases para el cálculo proposicional en sus "Leyes del Pensamiento"; el trabajo

posterior de Frege y Peano proporcionó una base adicional para la forma moderna del cálculo de predicados. El trabajo

de Davis, Putnam y Robinson en el siglo XX proporcionó los últimos pasos en la mecanización de la deducción lo

suficiente como para permitir a los primeros demostradores automáticos de teoremas.

La descendencia moderna de esta línea de desarrollo intelectual incluye los muchos esfuerzos que utilizan la lógica

de primer orden como representación y alguna variedad de deducción como motor del razonamiento, así como el amplio

cuerpo de trabajo con la agenda explícita de hacer computacional el razonamiento lógico, ejemplificado por PROLOG.

Esta línea de desarrollo ilustra claramente cómo los enfoques de la representación se basan en la naturaleza del

razonamiento inteligente y la forma en que éste se fundamenta. Por ejemplo, se encuentra aquí el desarrollo histórico de

la premisa subyacente de que razonar inteligentemente significa razonar lógicamente; cualquier otra cosa es un error o

una aberración. Junto a esto, está la creencia de que "lógicamente" a su vez significa lógica de primer orden, por lo

general con deducción correcta. Por simple transitividad, estos dos se contraen en una parte clave de la lógica

subyacente del razonamiento inteligente: razonar inteligentemente significa razonar de la manera definida por la lógica de

primer orden.
Una segunda parte importante de esta visión es la creencia asociada de que el razonamiento inteligente es un

proceso que puede ser capturado en una descripción formal, particularmente una descripción formal que es precisa y

concisa.

Pero también son posibles puntos de vista muy diferentes sobre la naturaleza del razonamiento inteligente. Una

visión claramente diferente se encuentra en la parte de la IA influenciada por la tradición psicológica. Esa tradición,

arraigada en el trabajo de Hebb, Bruner, Miller, y Newell & Simon, rompió con la visión de estímulo/respuesta exigida por

el conductismo y sugirió en su lugar que el comportamiento de resolver problemas humanos podía ser visto en términos

de metas, planes y otras estructuras mentales complejas. Las manifestaciones modernas incluyen el trabajo sobre SOAR

como un mecanismo general para producir razonamientos inteligentes y sistemas basados en el conocimiento como un

medio para capturar el razonamiento experto humano.

Comparar estas dos tradiciones revela diferencias significativas e ilustra las consecuencias de adoptar una u otra

visión del razonamiento inteligente. En la tradición logicista, el razonamiento inteligente se toma como una forma de

cálculo, por lo general la deducción en la lógica de primer orden, mientras que la tradición basada en la psicología toma

como característica definitoria del razonamiento inteligente que es una variedad particular de la conducta humana. En la

visión logicista, el objeto de interés es por lo tanto un constructo definible en términos formales a través de las

matemáticas, mientras que para los influenciados por la tradición psicológica es un fenómeno empírico del mundo

natural. Por lo tanto, existen dos supuestos muy diferentes sobre la naturaleza esencial del fenómeno fundamental que

se debe captar.

Una segunda diferencia surge al considerar el carácter de las respuestas que cada uno busca. El punto de vista

logicista ha buscado tradicionalmente caracterizaciones compactas y precisas de la inteligencia, buscando el tipo de

caracterizaciones encontradas en las matemáticas (y a veces en la física). La tradición psicológica, por el contrario,

sugiere que la inteligencia no es sólo un fenómeno natural, sino que es un fenómeno natural intrínsecamente complejo:

como la anatomía y la fisiología humanas son sistemas intrínsecamente complejos que resultan de un largo proceso de

evolución, tal vez lo sea la inteligencia. Como tal, la inteligencia puede ser una colección amplia y fundamentalmente ad

hoc de mecanismos y fenómenos, para la cual puede no ser posible realizar descripciones completas y concisas.

Son varias las consecuencias útiles que se derivan de la comprensión de las diferentes posiciones adoptadas por

cada tradición sobre esta cuestión fundamental. En primer lugar, demuestra que seleccionar cualquiera de los

descendientes modernos de esas tradiciones -es decir, cualquiera de las tecnologías de representación mostradas al

final de la tabla- significa elegir más que una representación: en el mismo acto también estamos seleccionando una

concepción de la naturaleza fundamental del razonamiento inteligente.

En segundo lugar, esas concepciones difieren de manera importante: hay diferencias fundamentales en la

concepción del fenómeno que intentamos captar. Las diferentes concepciones a su vez significan que existen profundas

diferencias de fondo en el carácter y las metas de los diversos esfuerzos de investigación que intentan crear programas
inteligentes. En pocas palabras: diferentes concepciones de la naturaleza del razonamiento inteligente conducen a

diferentes metas, definiciones de éxito y diferentes artefactos creados.

Por último, esas diferencias rara vez se expresan. Esto a su vez conduce a argumentos que pueden ser expresados

en términos de temas como la elección de la representación (por ejemplo, las virtudes del razonamiento sólido en FOPC

vs. la dificultad de caracterizar inferencias producidas por sistemas basados en marcos), cuando los temas reales son,

creemos, las diferentes concepciones de la naturaleza fundamental de la inteligencia. Comprender las diferentes

posiciones ayuda a analizar y resolver los problemas de manera apropiada.

¿Qué inferencias se autorizan?

El segundo componente de la teoría del razonamiento inteligente de una representación es su conjunto de

inferencias autorizadas, es decir, un conjunto seleccionado de inferencias que se consideran conclusiones apropiadas

para extraer de la información disponible. La definición clásica viene dada por la lógica formal tradicional, donde las

únicas inferencias autorizadas son las inferencias correctas (es decir, aquellas comprendidas por la vinculación lógica, en

las que cada modelo para el conjunto de axiomas es también un modelo para la conclusión). Esta respuesta tiene una

serie de importantes beneficios, incluyendo la satisfacción intuitiva (un argumento válido nunca introducirá error), explícito

(ya que sabemos exactamente de qué estamos hablando), lo suficientemente preciso como para que pueda ser objeto de

pruebas formales, y lo suficientemente antiguo como para que hayamos acumulado una experiencia significativa sobre

él.

La lógica también ha explorado diversas formas de inferencia poco sólidas, incluyendo la circunscripción y el

secuestro. Esta exploración se ha guiado normalmente por el requisito de que haya "una justificación teórica del modelo

bien motivada"[19], como por ejemplo el criterio de modelo mínimo de circunscripción. Este requisito mantiene un

componente fundamental del enfoque logicista: si bien está dispuesto a llegar a conclusiones que son verdaderas en

algún subconjunto de los modelos (y no en cada modelo) el conjunto de inferencias sancionadas sigue siendo concebido

en términos teóricos del modelo y se especifica precisamente en esos términos.

Otras representaciones han explorado otras definiciones: los sistemas de razonamiento probabilista (por ejemplo,

[20]) permiten las inferencias especificadas mediante la teoría de la probabilidad, mientras que el trabajo sobre los

agentes racionales (por ejemplo,[7]) se basa en conceptos de la teoría de la racionalidad económica.

Entre las tecnologías de representación de conocimiento común, los sistemas basados en reglas capturan conjeturas

del tipo que hace el experto humano, conjeturas que no son necesariamente ni sólidas ni verdaderas en ningún modelo.

Una representación basada en marcos anima a saltar a conclusiones posiblemente incorrectas basadas en buenos

resultados, expectativas o incumplimientos. Ambos comparten la tradición psicológica de definir el conjunto de

inferencias autorizadas con referencia al comportamiento del experto humano, más que a un modelo formal abstracto.

Forma y contenido de las respuestas


Como muestran estos ejemplos, los diferentes enfoques de representación especifican inferencias autorizadas de

maneras que difieren tanto en el contenido como en la forma. Mientras que la especificación de la lógica, por ejemplo, se

expresa en términos de teoría de modelos y es matemáticamente precisa, otras representaciones proporcionan

respuestas expresadas en otros términos, a menudo con una precisión considerablemente menor. La teoría de los

marcos, por ejemplo, ofrece una definición expresada en términos de comportamiento humano y se especifica sólo

aproximadamente.

Las diferencias de contenido y estilo, a su vez, tienen su origen en las diferentes concepciones de razonamiento

inteligente exploradas anteriormente. La definición en términos de comportamiento humano es apropiada para los

marcos porque la teoría concibe el razonamiento inteligente como una forma característica del comportamiento humano.

Al tratar de describir ese comportamiento, la teoría se enfrenta a la tarea de caracterizar un fenómeno empírico complejo

que sólo puede ser captado en forma aproximada en este momento, y que puede que nunca sea especificable con

precisión matemática, de ahí la idoneidad de una respuesta aproximada.

Para la teoría de los marcos, por tanto, la especificación de inferencias sancionadas es tanto informal como empírica,

como una consecuencia inevitable de su concepción de la inteligencia. Sin embargo, el trabajo (y otros trabajos como

éste) no es descuidado ni carece de precisión causal; la concepción subyacente del razonamiento inteligente dicta un

enfoque diferente de la tarea, un conjunto de términos diferentes en los que expresar la respuesta y un enfoque diferente

para la respuesta.

El objetivo general es reconocer la legitimidad de una variedad de enfoques para especificar inferencias aceptadas:

la teoría de modelos puede ser familiar y poderosa, pero incluso para los sistemas formales no es el único lenguaje

posible. En términos más generales, las definiciones formales no son los únicos términos en los que se puede especificar

la respuesta. La elección del vocabulario apropiado y el grado de formalidad dependen a su vez de la concepción básica

del comportamiento inteligente.

¿Qué inferencias se recomiendan?

Mientras que las inferencias autorizadas nos dicen qué conclusiones podemos sacar, ese conjunto es

invariablemente muy grande y por lo tanto nos proporciona una restricción insuficiente. Cualquier sistema automatizado

que intente razonar, guiado sólo por el conocimiento de las inferencias autorizadas, pronto se verá abrumado por las

elecciones. De ahí que necesitemos algo más que una indicación de qué inferencias podemos hacer legalmente, también

necesitamos alguna indicación de qué inferencias son las apropiadas para hacer, es decir, inteligentes. Esta indicación

viene dada por el conjunto de inferencias recomendadas.

Obsérvese que la necesidad de una especificación de inferencias recomendadas significa que al especificar una

representación también necesitamos decir algo sobre cómo razonar inteligentemente. La representación y el

razonamiento están inextricablemente entrelazados, y son útiles: una representación del conocimiento es una teoría del

razonamiento inteligente.
Razonablemente a menudo esa teoría ha sido proporcionada por la observación del comportamiento humano. La

exposición original de Minsky de la teoría del marco, por ejemplo, ofrece un ejemplo claro de un conjunto de inferencias

recomendadas y un conjunto inspirado en la observación del comportamiento humano. Consideremos lo siguiente, de la

introducción al artículo original de marcos[17]:

Esta es una teoría parcial del pensamiento..... Cada vez que uno se encuentra con una nueva situación (o

hace un cambio sustancial en su punto de vista), selecciona de la memoria una estructura llamada marco; un

esquema recordado para adaptarse a la realidad cambiando los detalles según sea necesario.

Un marco...[representa] una situación estereotipada, como estar en una cierta clase de salón o ir a una fiesta de

cumpleaños de un niño.

La primera frase ilustra la interrelación entre razonamiento y representación: se trata de un documento sobre la

representación del conocimiento, pero anuncia desde el principio que también es una teoría del pensamiento. Esa teoría,

a su vez, surgió de una percepción del razonamiento inteligente humano, es decir, de cómo la gente podía llegar a hacer

el tipo de inferencias sencillas de sentido común que parecen difíciles de captar en los programas. La teoría señala un

conjunto particular de inferencias para recomendar, a saber, el razonamiento en el estilo de la concordancia anticipada.

Se pueden dar caracterizaciones similares de inferencias recomendadas para la mayoría de las otras tecnologías de

representación. Las redes semánticas en su forma original, por ejemplo, recomiendan la propagación bidireccional a

través de la red, inspirada en el carácter interconectado de las definiciones de las palabras y la parte de la inteligencia

humana manifestada en la habilidad de las personas para encontrar conexiones entre conceptos aparentemente

dispares. Las reglas de los sistemas basados en el conocimiento recomiendan inferencias plausibles, inspiradas en la

observación del razonamiento humano experto.

La lógica, por el contrario, ha adoptado tradicionalmente una postura minimalista al respecto. La representación en sí

misma sólo ofrece una teoría de inferencias autorizadas, buscando permanecer en silencio sobre la cuestión de qué

inferencias recomendar.

El silencio sobre este tema está motivado por el deseo de generalidad en la maquinaria de inferencia y una forma

declarativa (es decir, independiente del uso) para el lenguaje, ambos objetivos fundamentales del enfoque logicista:"...

los logicistas se esfuerzan por hacer que el proceso de inferencia sea lo más uniforme y el dominio lo más independiente

posible y por representar todo el conocimiento (incluso el conocimiento sobre cómo usar el conocimiento) de forma

declarativa". [19]

Pero una representación con estos objetivos no puede destacar ningún conjunto particular de inferencias que se

puedan recomendar, por dos razones. En primer lugar, si el proceso de inferencia ha de ser general y uniforme (es decir,

trabajar sobre todos los problemas, y trabajar de la misma manera), debe ser neutral en cuanto a qué inferencias

recomendar: cualquier subconjunto particular de inferencias que se intente destacar podría ser apropiado en una

situación pero fatalmente malo en otra, ya que ninguna estrategia de inferencia (preferencias unitarias, conjunto de
apoyo, etc.) es universalmente apropiada. En segundo lugar, si las declaraciones en el lenguaje han de ser declarativas,

deben expresar un hecho sin ninguna indicación de cómo razonar con él (la expresión libre de uso es una característica

definitoria de una representación declarativa). Por lo tanto, el motor de inferencia no puede recomendar inferencias (o

pierde su generalidad y uniformidad) y las afirmaciones de hecho en el lenguaje no pueden recomendar inferencias (ya

que al incrustar tal información pierden su carácter declarativo). (4)

El deseo de generalidad y de expresión libre de uso impide así que la representación misma pueda elegir inferencias

para recomendar. Pero si la representación en sí no puede hacer la recomendación, el usuario debe hacerlo, ya que la

alternativa --búsqueda no guiada-- es insostenible.

Esto es en parte una virtud deliberada del enfoque logicista: impedir que la representación seleccione inferencias y,

por lo tanto, exigir al usuario que lo haga, ofrece la oportunidad de que esa información se represente explícitamente, en

lugar de estar implícitamente incrustada en la maquinaria de la representación (como, por ejemplo, en los sistemas

basados en reglas, o en PROLOG).

Una dificultad con este objetivo admirable surge al tratar de proporcionar al usuario las herramientas para expresar

las estrategias y guiar el sistema. Se utilizan comúnmente tres enfoques: hacer que el usuario le diga al sistema qué

hacer, que el usuario lo guíe para que haga lo correcto y que construya estrategias de inferencia para propósitos

especiales. Al "decirle al sistema lo que debe hacer" queremos decir que el usuario recomiende un conjunto de

inferencias escribiendo declaraciones en el mismo lenguaje (declarativo) utilizado para expresar hechos sobre el mundo

(por ejemplo, MRS[9]). Al "guiar al sistema a hacer lo correcto" nos referimos a que el usuario seleccione

cuidadosamente los axiomas, teoremas y lemas que se le suministrarán al sistema. La presencia de un lema, por

ejemplo, no es simplemente un hecho que el sistema deba conocer, sino que también proporciona una manera de

abreviar una larga cadena de deducciones en un solo paso, permitiendo que el sistema dé un "gran" paso en una cierta

dirección (a saber, la dirección en la que el lema nos lleva). Con una cuidadosa selección de hechos y lemas el usuario

puede recomendar indirectamente un conjunto particular de inferencias. Por "estrategias de inferencia de propósito

especial" nos referimos a construir estrategias de control específicas directamente en el demostrador de teoremas. Esto

puede ofrecer una aceleración significativa y un nivel pragmáticamente útil de eficiencia computacional.

Cada uno de estos enfoques tiene tanto beneficios como inconvenientes. Expresar las estrategias de razonamiento

en la lógica de primer orden está en consonancia con el espíritu del enfoque logicista, es decir, la representación explícita

del conocimiento en una representación uniforme y declarativa. Pero esto es a menudo problemático en la práctica: un

lenguaje diseñado para expresar los hechos declarativamente no es necesariamente bueno para expresar la información

imperativa característica de una estrategia de razonamiento.

La selección cuidadosa de los lemas es, en el mejor de los casos, una codificación indirecta de la información

orientativa que debe facilitarse. Por último, los mecanismos de deducción para fines especiales son potentes, pero
incrustan la estrategia de razonamiento tanto invisible como procedimentalmente, anulando los objetivos originales de

inferencia independiente del dominio y de representación explícita y declarativa.

La buena noticia aquí es que al permanecer deliberadamente en silencio sobre el tema de las inferencias

recomendadas, la lógica ofrece tanto un grado de generalidad como la posibilidad de hacer que la información sobre las

inferencias recomendadas sea explícita y esté disponible para ser razonada a su vez. La noticia menos positiva es que la

tarea de guiar el sistema se ha dejado al usuario sin asistencia conceptual, y las prácticas que a veces provocan

fracasan en algunos de los objetivos clave que motivaron el enfoque al principio.

Rol IV: Una RC es un medio para computación eficiente

Desde un punto de vista puramente mecanicista, el razonamiento en las máquinas (y algo más debatible, en las

personas) es un proceso computacional. En pocas palabras, para usar una representación debemos calcular con ella.

Como resultado, las preguntas acerca de la eficiencia computacional son inevitablemente centrales en la noción de

representación.

Esto ha sido reconocido desde hace mucho tiempo, al menos implícitamente, por los diseñadores de

representaciones: junto con su especificación de un conjunto de inferencias recomendadas, las representaciones ofrecen

habitualmente un conjunto de ideas sobre cómo organizar la información de forma que se facilite hacer esas inferencias.

Una parte importante de la noción original de marcos, por ejemplo, se refiere a este tipo de sugerencias, como ilustra la

introducción del artículo sobre marcos:

Un marco...[representa] una situación estereotipada, como estar en una cierta clase de salón o ir a una fiesta

de cumpleaños de un niño.

A cada marco se le añaden varios tipos de información. Parte de esta información se refiere a cómo utilizar el marco.

Algunos hablan de lo que uno puede esperar que suceda a continuación. Algunos se refieren a qué hacer si estas

expectativas no se confirman.

La noción de desencadenantes y el agregado de procedimientos en los marcos no es tanto una declaración sobre

qué procedimientos escribir (sobre esto la teoría es bastante vaga), como una descripción de una manera útil de

organizar la información: por ejemplo, (paráfrasis de arriba) adjuntar a cada marco información sobre cómo usar el

marco, qué hacer si no se confirman las expectativas, etc. Del mismo modo, la organización de los marcos en jerarquías

taxonómicas permite el razonamiento taxonómico y facilita su ejecución (como en las redes estructuradas de herencia).

Otras representaciones ofrecen orientaciones similares. Las redes semánticas tradicionales facilitan la propagación

bidireccional por el simple hecho de proporcionar un conjunto apropiado de enlaces, mientras que los sistemas basados

en reglas facilitan inferencias plausibles al proporcionar indicadores desde objetivos a reglas cuya conclusión coincide

(para encadenamientos hacia atrás) y desde hechos a reglas cuya premisa coincide (para encadenamientos hacia

adelante).
Si bien la cuestión del uso eficiente de las representaciones ha sido abordada por los diseñadores de las

representaciones, en el sentido más amplio del término, el campo parece haber sido históricamente ambivalente en su

reacción. El reconocimiento temprano de la noción de adecuación heurística[16] demuestra que los investigadores

apreciaron desde el principio la importancia de las propiedades computacionales de una representación, pero el tono de

gran parte del trabajo posterior en la lógica (por ejemplo,[13]) sugirió que la epistemología (contenido de conocimiento)

por sí sola importaba, y dejaba fuera de la agenda la eficiencia computacional. La epistemología sí importa, por supuesto,

y puede resultar útil estudiarla sin la posibilidad de que distraiga la atención sobre la velocidad. Pero al final debemos

calcular con nuestras representaciones, por lo que la eficiencia debe ser parte de la agenda.

El péndulo más tarde se balanceó bruscamente, a lo que podríamos llamar la vista imperativa computacional.

Algunos trabajos en este sentido (por ejemplo,[15]) ofrecían lenguajes de representación cuyo diseño estaba fuertemente

impulsado por el deseo de proporcionar no sólo eficiencia, sino también eficacia garantizada. El resultado parece ser un

lenguaje de velocidad significativa pero con una potencia expresiva restringida[6].

Cualquiera de los dos extremos de este espectro parece problemático: ignoramos las consideraciones

computacionales a nuestro riesgo, pero también podemos preocuparnos demasiado por ellas, produciendo

representaciones rápidas pero inadecuadas para su uso real.

Rol V: Una RC es un medio de expresión humana

Finalmente, las representaciones del conocimiento son también el medio por el que expresamos cosas sobre el

mundo, el medio de expresión y comunicación en el que le contamos a la máquina (y quizás entre nosotros) sobre el

mundo. Este rol de las representaciones es inevitable siempre y cuando necesitemos decirle a la máquina (u otras

personas) sobre el mundo, y siempre y cuando lo hagamos creando y comunicando representaciones. (5) La quinta

función de las representaciones del conocimiento es, pues, como medio de expresión y comunicación para nosotros.

A su vez, esto plantea dos grupos importantes de preguntas. Un grupo es conocido: ¿Qué tan bien funciona la

representación como medio de expresión? ¿Qué tan general es? ¿Qué tan preciso? ¿Proporciona una adecuación

expresiva? etc.

Una pregunta importante que se discute con menos frecuencia es: ¿Qué tan bien funciona como medio de

comunicación? Es decir, ¿qué tan fácil es para nosotros "hablar" o pensar en ese idioma? ¿Qué tipo de cosas se dicen

fácilmente en el lenguaje y qué tipo de cosas son tan difíciles como para ser pragmáticamente imposibles?

Observe que las preguntas aquí son de la forma "¿qué tan fácil es?" en lugar de "¿podemos?" Este es un lenguaje

que debemos utilizar, por lo que las cosas que son posibles en principio son útiles pero insuficientes; la verdadera

cuestión es de utilidad pragmática. Si la representación hace que las cosas sean posibles pero no fáciles, entonces como

usuarios reales nunca sabremos si hemos malinterpretado la representación y no sabemos cómo usarla, o si realmente
no puede expresar algunas cosas que nos gustaría decir. Una representación es el lenguaje en el que nos comunicamos,

por lo que debemos ser capaces de hablarlo sin esfuerzo heroico.

Consecuencias para la investigación y la práctica

Creemos que esta visión de la representación del conocimiento puede influir de manera útil en la práctica y puede

ayudar a informar el debate en torno a varias cuestiones de la investigación sobre la representación. Para la práctica

ofrece un marco que ayuda a hacer explícitos los puntos de vista importantes y el "espíritu" de una representación, e

ilustra la diferencia en el diseño que resulta de satisfacer en vez de violar ese espíritu.

Las consecuencias del punto de vista para la investigación incluyen (i) una concepción más amplia de la

representación, instando a que se tengan en cuenta todas las funciones al crear lenguajes de representación, (ii) el

reconocimiento de que una representación engloba una teoría del razonamiento inteligente, (iii) la capacidad de usar la

visión más amplia de la representación para guiar la combinación de representaciones, (iv) la capacidad de usar la visión

más amplia para diseccionar algunos de los argumentos sobre la equivalencia formal de las representaciones; y (v) la

creencia de que la representación debe ser más amplia.

Las limitaciones de espacio requieren que esbocemos brevemente estas consecuencias aquí; una discusión

completa se encuentra en[5].

Consecuencia para la práctica: Caracterización del espíritu de una representación

Los roles enumerados arriba ayudan a caracterizar y hacer explícito el "espíritu" de una representación, el importante

conjunto de ideas e inspiraciones que se esconden detrás (y, significativamente, son a menudo menos obvias que) de la

maquinaria concreta utilizada para implementar la representación. El espíritu es a menudo difícil de describir con

precisión, pero creemos que está bien caracterizado por los últimos cuatro roles enumerados anteriormente (todas las

representaciones son sustitutos, por lo tanto hay poca diferencia entre ellos en el primer rol). La postura que una

representación adopta sobre cada uno de estos temas, junto con su justificación para esa postura, indica lo que la

representación está tratando de decir sobre cómo ver y razonar acerca del mundo.

La idea de los marcos, por ejemplo, está en su encarnación original[17] principalmente un compromiso ontológico y

una teoría del razonamiento inteligente basada en las percepciones sobre la cognición humana y la organización del

conocimiento en la memoria.

El mayor compromiso ontológico, por supuesto, es observar el mundo en términos de descripciones estereotipadas,

es decir, conceptos descritos en términos de lo que suele ser verdad sobre ellos. Esto es particularmente adecuado para

conceptos en el mundo natural, donde las categorías rara vez tienen especificaciones precisas en términos de

condiciones necesarias y suficientes, y donde abundan las excepciones. Existe un compromiso ontológico adicional en la

vinculación de los marcos con los sistemas para capturar los cambios de perspectiva; esto nos anima a buscar estos

cambios cuando observamos el mundo.


La teoría del razonamiento inteligente incrustado en los marcos afirma que gran parte del razonamiento se basa en el

reconocimiento, en particular comparando los estereotipos con las instancias individuales. Las sugerencias relativas a la

organización del conocimiento se basan en la creencia de que la información en la memoria humana está rica y

explícitamente interconectada, más que estructurada como un conjunto de hechos independientes o sólo conectados

implícitamente.

La teoría de los marcos recomienda inferencias producidas por la concordancia de estereotipos e instanciamiento, y

facilita esas inferencias por la propia estructura del marco, así como la posterior organización de los marcos en sistemas

de marcos.

La teoría permite inferencias que son poco sólidas, como en el razonamiento analógico y por defecto que se hace al

emparejar marcos. También se sancionan inferencias que implican desajustes relativamente grandes, con el fin de

modelar la comprensión que es persistente incluso ante inconsistencias.

La teoría proporciona un medio para el cálculo potencialmente eficiente, al considerar la comprensión como

igualación en lugar de deducción. Por último, ofrece un medio de expresión particularmente útil para describir conceptos

en el mundo natural, donde a menudo se necesita alguna forma de indicar qué propiedades tiene un objeto normalmente,

sin comprometerse con afirmaciones sobre lo que siempre es verdad.

El espíritu debe ser complacido, no superado

Dos consecuencias útiles resultan de caracterizar una representación en estos términos, haciendo explícita y

comprensible su posición sobre los roles. En primer lugar, permite una especie de teoría explícitamente invocada del uso

de la representación de Whorfian. Mientras que la representación que seleccionemos tendrá consecuencias inevitables

para nuestra forma de ver y razonar sobre el mundo, al menos podemos seleccionarla consciente y cuidadosamente,

intentando encontrar un par de gafas apropiadas para la tarea que nos ocupa. Los pasos en esta dirección incluirían que

los diseñadores de representación caracterizaran cuidadosamente la naturaleza de los vidrios que están suministrando

(por ejemplo, haciendo explícitos los compromisos ontológicos, las inferencias recomendadas, etc.) y haciendo que el

campo desarrolle principios para hacer coincidir las representaciones con las tareas.

En segundo lugar, esas caracterizaciones facilitarían el uso apropiado de una representación. Por apropiado

queremos decir usarlo en su espíritu, es decir, usado para lo que estaba destinado a hacer, no para lo que se puede

hacer. Sin embargo, con una regularidad sorprendente, el espíritu original de una representación se ve como un

oponente a vencer. Con una regularidad sorprendente, el espíritu se olvida, reemplazado por una visión mucho más

mecanicista que ve una estructura de datos en lugar de una representación, computación más que inferencia. Los

trabajos escritos con esta mentalidad suelen contener afirmaciones de cómo el autor fue capaz, a través de un acto

creativo, heroico y a menudo oscuro, de conseguir una representación para hacer algo que normalmente no hubiéramos

pensado capaz de hacer.


Pero si de eso se trata el uso de una representación, se convierte en una forma extraña y terriblemente incómoda de

programación: la tarea se convierte en hacer lo que ya sabemos que queremos hacer, pero nos vemos obligados a

hacerlo usando sólo los constructos disponibles en la representación, no importa cuán buenos o malos sean los ajustes.

En ese caso, el trabajo creativo es a menudo la superación de la representación, viendo cómo podemos conseguir

que se comporte como otra cosa (6). El resultado son representaciones del conocimiento aplicadas de un modo que no

está basado en las inspiraciones y percepciones que llevaron a su invención y que son la fuente de su capacidad. Los

sistemas construidos con este espíritu a menudo funcionan a pesar de sus representaciones, no por ellas; funcionan

porque los autores, aunque con gran esfuerzo, lograron superar la representación.

Consecuencias para la investigación: La representación y el razonamiento están entrelazados

En varias ocasiones en el desarrollo del campo, se ha sugerido que deberíamos considerar la representación del

conocimiento en términos puramente epistemológicos, es decir, asumir el papel singular de la representación para

transmitir el contenido del conocimiento (por ejemplo,[13]). Como hemos señalado anteriormente, la epistemología

importa, pero no es todo lo que importa. La representación y el razonamiento están inextricablemente entrelazados: no

podemos hablar de uno sin también, inevitablemente, discutir el otro. Argumentamos también que el intento de tratar la

representación como contenido del conocimiento por sí solo conduce a una concepción incompleta de la tarea de

construir un razonador inteligente.

Cada una de estas afirmaciones se fundamenta en una observación hecha anteriormente. Observamos primero que

cada representación encierra en su núcleo una concepción de lo que constituye el razonamiento inteligente (por ejemplo,

la Tabla I). De ahí que toda discusión sobre la representación lleve inevitablemente consigo una visión (quizás implícita)

del razonamiento inteligente.

También observamos que, al construir un razonador inteligente no basta con indicar qué inferencias son legales, sino

que también necesitamos saber cuáles son las apropiadas (es decir, las recomendadas). Un ejemplo familiar de la lógica

muestra muy bien este punto: de AA podemos inferir A∧AA∧A, A∧A∧AA∧A∧A, etc. Todas estas son inferencias legales,

pero difícilmente son inferencias inteligentes.

De ahí nuestra afirmación de que una teoría de inferencia legal es por lo tanto insuficiente; para construir un

razonador inteligente también necesitamos una teoría de inferencia inteligente. De hecho, puede haber múltiples teorías

de inferencia inteligente, cada una específica a un dominio de tarea en particular.

Consecuencias para la investigación: Combinación de representaciones

Recordemos que una representación es, entre otras cosas, una teoría del razonamiento inteligente y un conjunto de

mecanismos para implementar esa teoría. Creemos que la atención apropiada a ambos aspectos, en el orden apropiado,

constituye una diferencia significativa en el resultado de cualquier esfuerzo de combinación de representación.


Demasiado a menudo, los esfuerzos de combinación parecen concebidos en términos de encontrar formas para que

los dos mecanismos trabajen juntos, con una atención insuficiente (y a veces nula) a lo que consideramos la tarea mucho

más importante: determinar cómo las dos teorías del razonamiento inteligente podrían trabajar juntas. Centrarse en los

mecanismos significa determinar cómo, por ejemplo, las reglas, los procedimientos y los objetos pueden invocarse

mutuamente. Centrarse en las teorías del razonamiento inteligente significa prestar atención a qué tipo de razonamiento

está dentro del espíritu de cada representación y cómo esas variedades de razonamiento podrían combinarse

sensatamente.

Dos esfuerzos por combinar las representaciones ilustran las diferentes concepciones de la tarea que resulta de

centrarse en el mecanismo y en el razonamiento. Como primer ejemplo, consideremos esta descripción del sistema

LOOPS[22] y sus esfuerzos para integrar varios paradigmas:

Algunos ejemplos ilustran la integración de paradigmas en LOOPS: el "espacio de trabajo" de un conjunto

de reglas es un objeto, las reglas son objetos, y también lo son los conjuntos de reglas. Los métodos en las

clases pueden ser funciones LISP o conjuntos de reglas. Los procedimientos en valores activos pueden ser

funciones LISP, conjuntos de reglas o métodos de llamada. El anillo en el logo LOOPS refleja el hecho de que

LOOPS no sólo contiene los diferentes paradigmas, sino que los integra. Los paradigmas están diseñados no

sólo para complementarse entre sí, sino también para ser usados juntos en combinación.

Comparemos la mentalidad y el enfoque de arriba con esta visión de una empresa similar, también dirigida a

combinar reglas y marcos[23]:

Las reglas y marcos son dos esquemas opuestos para representar diferentes tipos de conocimiento. Las

reglas son apropiadas para representar implicaciones lógicas, o para asociar acciones a las condiciones bajo las

cuales se deben tomar las acciones. ... Los marcos (o redes semánticas) son apropiados para definir términos y

describir objetos y las relaciones taxonómicas de clase/miembro entre ellos. Una importante capacidad de

razonamiento de los sistemas de marcos con semántica bien definida es que pueden inferir las relaciones de

clase/miembro entre marcos basándose en sus definiciones.

Dado que las fortalezas y debilidades de las reglas y marcos son complementarias entre sí, un sistema que integre

ambos se beneficiará de las ventajas de ambas técnicas. Este artículo describe una arquitectura híbrida llamada

programación basada en la clasificación que amplía la arquitectura del sistema de producción utilizando capacidades de

clasificación automática dentro de las representaciones de marcos. Al hacerlo, el sistema realza el poder de un patrón de

concordancia en un sistema de producción, desde la concordancia simbólica a la semántica, organiza reglas en clases

de reglas basadas en sus funcionalidades, e infiere las diversas relaciones entre reglas que facilitan la representación

explícita del conocimiento de control.

Obsérvese en particular cómo el primero de estos esfuerzos se centra en los mecanismos computacionales, mientras

que el segundo se refiere a la representación y al razonamiento. El primero busca permitir que varias estructuras de
programación -entre ellas reglas y objetos estructurados- trabajen juntas, mientras que el segundo intenta permitir que

dos representaciones -reglas y objetos estructurados- trabajen juntas. El primero busca permitir mecanismos para

invocarse unos a otros, mientras que el segundo considera las diferentes variedades de inferencia naturales a dos

representaciones y sugiere cómo esas dos clases de razonamiento podrían trabajar sinérgicamente: las reglas deben ser

usadas para el tipo de razonamiento que captan mejor --las implicaciones lógicas no restringidas-- y los marcos deben

ser usados por su fortaleza, es decir, el razonamiento taxonómico. El primer trabajo propone una arquitectura

computacional, mientras que el segundo ofrece una arquitectura de representación y razonamiento.

Ambas son empresas importantes, pero creemos que donde el objetivo es combinar representaciones, la tarea debe

ser concebida en términos centrales para una representación: su teoría del razonamiento inteligente. Para ello, debemos

considerar qué tipo de razonamiento esperamos de cada representación, debemos proponer un diseño para la forma en

que esos esquemas de razonamiento trabajarán juntos, y debemos tener una justificación para creer que esta será una

combinación efectiva. Lo primero y más importante que requerimos en esta tarea es una arquitectura de representación,

a partir de la cual se va a seguir la arquitectura computacional adecuada. Creemos que los esfuerzos que sólo se centran

en el segundo de estos dos aspectos están comenzando en el lugar equivocado y no llegarán a ser ni mucho menos una

parte crucial de la meta.

Consecuencias para la investigación: Argumentos sobre la equivalencia formal

Existe un patrón familiar en la investigación de la representación del conocimiento en el que la descripción de una

nueva tecnología de representación del conocimiento es seguida por afirmaciones de que las nuevas ideas son en

realidad formalmente equivalentes a una tecnología existente. Históricamente, la reivindicación se ha expresado a

menudo en términos de equivalencia con la lógica. Las redes semánticas, por ejemplo, se han descrito en estos términos

(por ejemplo,[11],[18], mientras que el desarrollo de marcos condujo a una secuencia de tales reivindicaciones, incluida la

sugerencia de que "La mayoría de los `marcos' es sólo una nueva sintaxis para la lógica de primer orden" ([13]).

Que los marcos también pueden ser una sintaxis alternativa parece claro; que son sencilla o simplemente eso parece

considerablemente menos claro. El hecho de que los marcos no sean totalmente distintos de la lógica parece claro; que

toda la idea pueda verse como lógica parece mucho menos clara.

Creemos que afirmaciones como las anteriores son sustanciales sólo en el contexto de una noción de interpretación

estricta de lo que es una representación del conocimiento. Hayes[13] es explícito sobre parte de su postura al

respecto:"Se puede caracterizar un lenguaje representacional como uno que tiene (o se le puede dar) una teoría

semántica" y también sobre las estrechas líneas trazadas alrededor del argumento:"Aunque a veces se entienden los

marcos a nivel metafísico y a veces a nivel computacional, los discutiré como una propuesta representacional", es decir,

como un lenguaje con una teoría semántica, y nada más. Tanto la metafísica como la computación han sido

consideradas al margen. Y otra vez:"Nada de esta discusión[sobre los marcos como un "dispositivo computacional" para

organizar el acceso e inferencia de la memoria] involucra cuestiones de representación". Aquí se hace evidente que la
afirmación se refiere menos a marcos y más a una definición de lo que se considerará como "cuestiones de

representación".

Nótese que específicamente excluidas de la discusión están el compromiso ontológico de la representación, es

decir,"qué entidades se supone que existen en el mundo", y las propiedades computacionales que la representación

proporciona. A pesar de las afirmaciones en sentido contrario, argumentaríamos que la ontología de los marcos (y otras

representaciones) y las preguntas computacionales no sólo involucran cuestiones de representación, sino que son

cuestiones de representación. Estas y otras propiedades son cruciales para la representación del conocimiento tanto en

principio como en cualquier uso real.

Consecuencias para la investigación: los cinco roles son importantes

Si bien las representaciones a menudo se diseñan prestando considerable atención a uno u otro de los temas

enumerados en nuestras cinco funciones, creemos que todas las funciones tienen una importancia considerable y que

ignorar cualquiera de ellas puede dar lugar a insuficiencias importantes. Mientras que los diseñadores rara vez pasan por

alto el papel de la representación como sustituto y como definición de inferencias autorizadas, no es raro que haya una

orientación insuficiente sobre los otros roles, y las consecuencias son importantes.

Como hemos argumentado anteriormente, por ejemplo, el compromiso ontológico es importante: la orientación que

proporciona al dar sentido a la profusión de detalles en el mundo es una de las cosas más importantes que ofrece una

representación. Sin embargo, algunas representaciones, en una búsqueda de la generalidad, ofrecen poco apoyo en esta

dimensión.

Un argumento similar se aplica a la teoría del razonamiento inteligente: una representación puede guiar y facilitar el

razonamiento si tiene en su corazón una teoría de lo que el razonamiento debe hacer. Una orientación insuficiente aquí

nos dejará susceptibles a las dificultades tradicionales de la elección no guiada.

La computación pragmáticamente eficiente es importante porque la mayor parte del uso de una representación es

(por definición) en el caso promedio. El interés en producir representaciones más débiles para garantizar un mejor

rendimiento en el peor de los casos puede ser erróneo, exigiendo mucho más de lo necesario y pagando un alto precio

por ello. (7) El uso de una representación como medio de expresión y comunicación, importa porque debemos ser

capaces de hablar el lenguaje para utilizarlo. Si no podemos determinar cómo decir lo que estamos pensando, no

podemos usar la representación para comunicarnos con el sistema de razonamiento.

Por supuesto, intentar diseñar representaciones para acomodar los cinco roles es un reto, pero creemos que la

alternativa es la creación de herramientas con deficiencias significativas.

El objetivo de la investigación en RC
Creemos que la preocupación principal del campo de la representación del conocimiento debe ser comprender y

describir la riqueza del mundo. Sin embargo, en la práctica, la investigación que se describe a sí misma como un trabajo

de representación del conocimiento fundamental ha concentrado casi todos sus esfuerzos en un canal mucho más

estrecho, la mayor parte de ellos centrados en el razonamiento taxonómico y por defecto (por ejemplo,[2],[15],[8]).

Creemos que no es un accidente que la visión útil para encontrar un buen conjunto de abstracciones temporales

provenga del examen minucioso de una tarea realista establecida en un dominio del mundo real. Subraya nuestra

convicción (compartida por otros; ver[14]) de que intentar describir la riqueza del mundo natural es la función apropiada

para el trabajo de RC

Nuestro argumento aquí se refiere tanto al etiquetado como a la metodología: (i) trabajos como[10] y[14] deben ser

reconocidos por la comunidad RC como de importancia central para la investigación RC, no categorizados como

diagnósticos o física cualitativa y vistos como no relacionados, y (ii) las percepciones obtenidas en[10] y[14] provienen

del estudio del mundo, no de los lenguajes. Sostenemos que aquellos que optan por identificarse como investigadores de

KR deberían estar desarrollando teoría y tecnología que facilite proyectos como estos; y, en cambio, aquellos que están

construyendo proyectos como estos se dedican a una importante variedad de investigación de RC.

Si bien las herramientas y las técnicas son importantes, el campo es y debe ser mucho más rico que eso,

principalmente porque el mundo es mucho más rico que eso. Creemos que entender y describir esa riqueza debe ser la

preocupación central del campo.

Resumen

Hemos argumentado que una representación del conocimiento desempeña cinco roles distintos, cada uno importante

para la naturaleza de la representación y sus tareas básicas. Esos roles crean demandas múltiples, a veces en

competencia, que requieren un equilibrio selectivo e inteligente entre las características deseadas. Esas cinco funciones

también ayudan a caracterizar claramente el espíritu de las representaciones y tecnologías de representación que se han

desarrollado.

Esta visión tiene consecuencias tanto para la investigación como para la práctica en el campo. En el ámbito de la

investigación, aboga por una concepción de la representación más amplia que la que se utiliza habitualmente, instando a

que los cinco aspectos son cuestiones esenciales de representación. Sostiene que el compromiso ontológico que aporta

una representación es una de sus contribuciones más significativas; por lo tanto, el compromiso debe ser sustancial y

cuidadosamente escogido. También sugiere que la tarea fundamental de la representación es describir el mundo natural

y afirma que el campo avanzaría más lejos tomando esto como su preocupación central.

Para la práctica del trabajo de RC, la perspectiva sugiere que la combinación de representaciones es una tarea que

debe ser impulsada por visiones sobre cómo combinar sus teorías de razonamiento inteligente, no sus mecanismos de

implementación. La opinión también insta a que se comprenda y se conceda indulgencia al espíritu fundamental de las
representaciones. Sugerimos que las tecnologías de representación no deben ser consideradas como oponentes a

vencer, forzadas a comportarse de una manera particular, sino que deben ser entendidas en sus propios términos y

utilizadas de maneras que se basan en las ideas que fueron su inspiración original y su fuente de poder.

Notas

1. Por el contrario, la acción puede sustituir al razonamiento. Este dualismo ofrece una manera de entender la

relación entre las representaciones simbólicas tradicionales y el enfoque de la acción, que argumenta que la

acción puede vincularse directamente a la percepción, sin necesidad de intermediar las representaciones

simbólicas.

2. La frase "compromiso ontológico" no es tal vez precisamente correcta para lo que tenemos en mente aquí, pero

es la aproximación más cercana disponible. Mientras que la ontología, en sentido estricto, se ocupa de lo que

existe en el mundo, hemos redactado esta sección cuidadosamente en términos de cómo ver el mundo,

esquivando intencionalmente muchas cuestiones filosóficas espinosas comunes que rodean las afirmaciones

de lo que existe. Una segunda forma de abordar el tema es observar que el "mundo" que nos interesa

capturar es el mundo dentro de la mente de algún observador humano inteligente (por ejemplo, un médico,

ingeniero, etc.), en cuyo caso se puede argumentar plausiblemente que en ese mundo existen reglas,

prototipos, etc., que sí existen.

3. Obsérvese que incluso al principio hay un indicio de la idea de que la forma deseada de razonamiento podría

ser descriptible en un conjunto de reglas formales.

4. Las consecuencias de este enfoque son evidentes incluso en el uso de la forma normal disyuntiva como

representación canónica: aunque X1∧X2∧X3→X4X1∧X2∧X3→X4 es semánticamente equivalente

a ¬X1∨¬X2∨X4∨¬X3¬X1∨¬X2∨X4∨¬X3, se pierde alguna información potencialmente útil en la

transformación. La primera forma podría ser leída como sugiriendo que X1X1, X2X2 y X3X3 tienen algo en

común, a saber, que deben ser consideradas como las precondiciones necesarias para establecer X4X4. Esto

puede ser una pista útil sobre cómo razonar en el problema, pero si es así, se pierde en la transformación a

FND. Considere en cambio lenguajes como microPLANNER y PROLOG, que hacen uso explícito de la forma

de la regla de inferencia para ayudar a guiar el proceso de deducción.

5. Probablemente seguirá siendo útil aunque las máquinas inventen sus propias representaciones de

conocimiento basadas en la experiencia independiente del mundo: si sus representaciones se vuelven

incomprensibles para nosotros, las máquinas no podrán ni decirnos lo que saben o explicar sus conclusiones.

6. Por supuesto, es útil establecer la equivalencia de dos representaciones mostrando cómo se puede hacer que

una persona se comporte como otra. Pero este es un ejercicio que sólo se debe hacer una vez, y se hace por

su propio bien y no porque sea una buena práctica de construcción de sistemas.

7. Como hemos argumentado en otras partes[4], un "acantilado computacional" (es decir, un comportamiento

inaceptable en el peor de los casos) es un problema sólo si no se puede interrumpir toda inferencia, una vez
que se pone en marcha. El simple hecho de que el cálculo limitado en recursos evita cualquier inferencia de

atrapar permanentemente al programa en una tarea que requiere cantidades de tiempo irrazonables.

La representación del conocimiento y el razonamiento es un área de la inteligencia artificial cuyo objetivo


fundamental es representar el conocimiento de una manera que facilite la inferencia a partir de dicho
conocimiento. Wikipedia

También podría gustarte