Está en la página 1de 159

Inteligencia Articial

Curso: 2001/2002 Alumna: Laura M. Castro Souto Profesores: Vicente Moret Bonillo Mariano Cabrero Canosa Eduardo Mosqueira Rey

Indice general
1. Introduccin o 1.1. Cuestiones Preliminares . . . . . . . . . 1.2. Algunas deniciones . . . . . . . . . . . 1.3. Consideraciones Generales sobre IA . . . 1.3.1. Programas de IA . . . . . . . . . 1.3.2. Sistemas basados en conocimiento 1.3.3. Sistemas expertos . . . . . . . . . 7 8 12 13 14 15 15 17 18 21 22 23 24 25 27 27 27 29 30 30 32 36 39 39 41 42 43 43 44 46 48

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

2. Resolucin de Problemas o 2.1. Espacio de Estados . . . . . . . . . . . . . . . . . . . 2.2. Caracter sticas de los Procesos de Bsqueda . . . . . u 2.2.1. Direccin del proceso de bsqueda . . . . . . . o u 2.2.2. Topolog del proceso de bsqueda . . . . . . a u 2.2.3. El problema de la representacin . . . . . . . o 2.2.4. Seleccin sistemtica de operadores relevantes o a 2.2.5. Funciones heur sticas . . . . . . . . . . . . . . 2.3. Estrategias de Exploracin del E.E. . . . . . . . . . . o 2.3.1. Bsqueda preferente por amplitud (anchura) . u 2.3.2. Bsqueda preferente por profundidad . . . . . u 2.3.3. Generacin y prueba . . . . . . . . . . . . . . o 2.3.4. Ascensin a colinas . . . . . . . . . . . . . . . o 2.3.5. Bsqueda por el mejor nodo: A . . . . . . . . u 2.3.6. Bsqueda por el mejor nodo: Agendas . . . . u 3. Representaciones del Conocimiento 3.1. Aspectos Generales . . . . . . . . . . . . . . . . 3.2. Lgica de Proposiciones y Lgica de Predicados o o 3.2.1. Alfabeto . . . . . . . . . . . . . . . . . . 3.2.2. Lenguaje formal . . . . . . . . . . . . . . 3.2.3. Reglas de inferencia . . . . . . . . . . . . 3.3. Ingenier del Conocimiento y Lgica Formal . . a o 3.4. Evaluacin y Resolucin en Lgica Formal . . . o o o 3.5. Introduccin a otras Lgicas . . . . . . . . . . . o o 3

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

4 4. Mtodos de Representacin del Conocimiento e o 4.1. Redes Semnticas . . . . . . . . . . . . . . . . . a 4.2. Modelos de Dependencia Conceptual . . . . . . 4.3. Frames y Guiones . . . . . . . . . . . . . . . . . 4.3.1. Frames . . . . . . . . . . . . . . . . . . . 4.3.2. Guiones . . . . . . . . . . . . . . . . . . 4.4. Paradigma de Orientacin a Objetos . . . . . . o 4.4.1. Abstraccin . . . . . . . . . . . . . . . . o 4.4.2. Encapsulamiento . . . . . . . . . . . . . 4.4.3. Modularidad . . . . . . . . . . . . . . . . 4.4.4. Jerarqu . . . . . . . . . . . . . . . . . a 4.4.5. Polimorsmo . . . . . . . . . . . . . . . 4.4.6. Ventajas e Inconvenientes de la O.O. . . 4.5. Reglas de Produccin . . . . . . . . . . . . . . . o 5. Sistemas de Produccin o 5.1. Base de Conocimientos . . 5.2. Memoria Activa . . . . . . 5.3. Motor de Inferencias . . . 5.4. Ciclo bsico de un Sistema a

INDICE GENERAL 51 52 54 54 55 56 57 58 58 59 59 60 61 61 67 68 68 69 71 73 74 74 74 75 75 75 79 80 81 81 83 84 84 85 86 87

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . de Produccin o

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

6. Representacin de Conocimiento Temporal o 6.1. Especialista Temporal de Kahn y Gorry . . . . . . . . 6.1.1. Representacin de las referencias temporales . . o 6.1.2. Organizacin de las especicaciones temporales o 6.1.3. Preguntas al especialista temporal . . . . . . . . 6.2. Modelo de Allen . . . . . . . . . . . . . . . . . . . . . . 6.2.1. Relaciones Temporales de Allen . . . . . . . . . 6.2.2. Lgica temporal de Allen . . . . . . . . . . . . . o 6.2.3. Cr ticas al modelo de Allen . . . . . . . . . . . 6.3. Algebra de Puntos Temporales . . . . . . . . . . . . . . 6.3.1. Algebra de Puntos vs. Algebra de Intervalos . . 7. Razonamiento Categrico y Bayesiano o 7.1. Modelo Categrico . . . . . . . . . . . . . . . . . . . . o 7.1.1. Interpretacin Diferencial . . . . . . . . . . . . o 7.1.2. Elementos del Razonamiento Categrico . . . . o 7.1.3. Procedimiento Sistemtico para el R. Categrico a o 7.2. La Correccin Bayesiana . . . . . . . . . . . . . . . . . o

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

8. Factores de Certidumbre 93 8.1. Modelo de los Factores de Certidumbre . . . . . . . . . . . . . . . . . . . . 93 8.2. Combinacin de Evidencias . . . . . . . . . . . . . . . . . . . . . . . . . . 97 o 8.3. Propagacin de Incertidumbre . . . . . . . . . . . . . . . . . . . . . . . . . 100 o

INDICE GENERAL 9. Teor Evidencial a 9.1. La Teor Evidencial de Dempster y Shafer . . . . . . . . . a 9.1.1. Combinacin de Evidencias . . . . . . . . . . . . . o 9.1.2. Credibilidad, Plausibilidad e Intervalo de Conanza 9.1.3. Casos Particulares de la Teor Evidencial . . . . . a 10.Conjuntos Difusos 10.1. Aspectos Generales . . . . . . . . . . . 10.2. Caracterizacin y Nomenclatura . . . . o 10.3. Estructura Algebraica . . . . . . . . . 10.4. Operaciones Algebraicas . . . . . . . . 10.5. Rep. del Conocimiento y Razonamiento . . . . . . . . . . . . . . . . Difuso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

5 103 . 104 . 106 . 108 . 109 111 . 111 . 114 . 115 . 118 . 119 . . . . . . . . . . . . . . . . . . . . . 123 123 125 127 128 128 129 129 130 131 131 131 131 132 134 137 138 138 138 139 142 142 149

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

11.Ingenier del Conocimiento a 11.1. Caracter sticas Generales de los Sistemas Expertos . . 11.2. Anlisis de la Viabilidad de un Sistema Experto . . . . a 11.3. Organizacin General de un Sistema Experto . . . . . . o 11.3.1. Bases de Conocimientos . . . . . . . . . . . . . 11.3.2. Motor de Inferencias . . . . . . . . . . . . . . . 11.3.3. Interfaces . . . . . . . . . . . . . . . . . . . . . 11.4. Fases de la Adquisicin del Conocimiento . . . . . . . . o 11.4.1. Conceptualizacin . . . . . . . . . . . . . . . . . o 11.4.2. Formalizacin . . . . . . . . . . . . . . . . . . . o 11.4.3. Elicitacin . . . . . . . . . . . . . . . . . . . . . o 11.4.4. Operacionalizacin . . . . . . . . . . . . . . . . o 11.4.5. Vericacin y revisin . . . . . . . . . . . . . . o o 11.5. Tcnicas de Extraccin del Conocimiento . . . . . . . . e o 11.6. Mtodo Estructurado de Adquisicin del Conocimiento e o

12.Vericacin y Validacin de Sst. Inteligentes o o 12.1. Vericacin de Sistemas Inteligentes . . . . . . . . . . . . . o 12.1.1. Vericacin de Especicaciones . . . . . . . . . . . o 12.1.2. Vericacin de Mecanismos de Inferencia . . . . . . o 12.1.3. Vericacin de Bases de Conocimientos . . . . . . . o 12.2. Validacin de Sistemas Inteligentes . . . . . . . . . . . . . o 12.2.1. Principales caracter sticas del proceso de Validacin o 12.2.2. Metodolog de Validacin . . . . . . . . . . . . . . a o

INDICE GENERAL

Cap tulo 1 Introduccin o


La Inteligencia Articial (IA) es una disciplina relativamente reciente, fruto de trabajos en distintas reas del pensamiento que fueron denitivamente aglutinados tras el a advenimiento de las ciencias de la computacin como materia consolidada de investigacin o o y desarrollo. La Inteligencia Articial est ligada al concepto de inteligencia, por cuanto sta a e representa una faceta ms propia de los seres humanos que de los seres vivos en general, a aunque, como veremos, esta ultima armacin es discutible y su veracidad depender de o a cmo denamos el concepto de inteligencia. o Podr considerarse que la IA es una ciencia que trata de establecer las bases para a el posterior desarrollo de un conjunto de tcnicas destinadas a dotar a las mquinas de e a una cierta autonom Esta autonom puede referirse a aspectos muy diversos, como la a. a comunicacin con las mquinas en lenguaje natural, la toma de decisiones en un dominio o a concreto, la toma de decisiones en el tiempo o el aprendizaje. La IA, como ciencia que nos va a permitir comprender algunos de los principios bsia cos de la educacin computacional, no hace mucho que ha dejado de ser una disciplina o emergente. Su grado de consolidacin no es absoluto, sus logros actuales, aunque cuao litativamente hablando son importantes, cuantitativamente distan mucho de cubrir los objetivos inicialmente planteados: estamos todav lejos de poder construir mquinas que a a piensen, aprendan y creen por s mismas. No obstante, muchos han sido los esfuerzos empleados en dotar a la IA del peso espec co que ya tiene. La IA, como veremos, maneja conocimientos, esto es, informacin procesada; podr o amos describirla por tanto como una disciplina informtica que se apoya en otras1 y que se puede a abordar desde dos perspectivas: como ciencia y como tcnica. e Ciencia interpreta Tcnica construye e Cultura aglutina

La informtica se ocupa del tratamiento y generacin de informacin datos contextualizados. a o o

8 El n que persigue no es unico: simulacin (plano f o sico: construccin) o

CAP ITULO 1. INTRODUCCION

autmatas (plano intelectual: comprensin) o o robots inteligentes (plano metaf sico: poder mgico) a

1.1.

Cuestiones Preliminares

Es en los textos mitolgicos donde aparecen las primeras referencias a los androides. o Uno de ellos, Talos, obra de Ddalo, es descrito como un gigantesco robot de bronce encare gado de la custodia y defensa de la isla de Minos: recorr a diario la su per a metro en busca de visitantes indeseables. Si algn infeliz era descubierto e identicado como enemigo, Tau los saltaba dentro de una hoguera, en la que permanec hasta ponerse incandescente, y a luego abrazaba al recin llegado hasta provocarle la muerte. e Tambin en la Mitolog encontramos referencias sobre los androides femeninos conse a truidos por Hefaistos, seres de oro macizo dotados de inteligencia (capaces de hablar) y cuya misin era ayudar a caminar a su creador. o Ms modernamente, y probablemente fruto de la imaginacin popular, encontramos a o la leyenda del Golem, que puede considerarse como uno de los primeros paradigmas de la IA. El Golem era una estatuilla de arcilla roja a la que un rabino de la comunidad jud de Praga, Dezadel, dio vida a travs de un ritual de magia negra. El Golem no hac a e a nada por iniciativa propia, y su unico cometido era el de actual como un el esclavo de su creador. Tras una vida pesada y aburrida, se fueron despertando en el Golem instintos que hasta entonces hab permanecido ocultos y, poco a poco, fue liberndose de la tutela de an a su amo, convirtindose en un personaje terror e co y malvado. Finalmente, Dezadel destruy al Golem, aunque la leyenda asegura que reaparece en Praga cada treinta y tres aos. o n Pero quizs los antecedentes histricos ms remotos de la IA haya que buscarlos en a o a la antigua Grecia. En concreto, y pertenecientes a la poca alejandrina, Arqu e medes, Demetrio de Farleria, Architas de Tarente y Hern de Alejandr fueron los verdaderos o a precursores de una disciplina que hoy se conoce con elnombre de Automtica. a Arqu medes construy los mecanismos defensivos que fueron empleados para tratar de o contener los ataques de la ota romana sobre Siracusa. Por su parte, Architas de Tarente, ms prosaico, construy una paloma que bat las alas. Demetrio de Farleria dedic sus a o a o esfuerzos a la construccin de un caracol mecnico capaz de avanzar arrastrndose. Fio a a nalmente, Hern de Alejandr dise y construy unos actores articiales capaces de o a no o representar escenas de la guerra de Troya. Es en esta poca donde podemos buscar los e principios generales de los autmatas, segn los cuales: o u Los mecanismos de un autmata actan en virtud de su propia estructura o u interna. La accin procede de una adecuada organizacin de fuerzas motrices, o o naturales y articiales.

1.1. CUESTIONES PRELIMINARES La movilidad de los autmatas afecta a todo el conjunto, y no slo a o o ciertas partes.

Ya en la Edad Media, encontramos el mayordomo de San Alberto y el len orido de o Leonardo, aunque los ms reseables son los trabajos de Llull, que constituyen la primera a n aproximacin a la IA desde el pensamiento. Llull establece en su obra Ars Magna las bases o de una tcnica que an hoy, con algunas modicaciones, se sigue utilizando en IA. e u El mtodo llulliano consiste en realizar un ensayo exhaustivo y sistemtico de todos e a los procedimientos y principios bsicos que pudieran ser utiles para resolver problemas a concretos. El mtodo propuesto requiere: e Adquirir los principios fundamentales conocidos y admitidos por todos en un dominio de aplicacin determinado. o Agotar todas las posibles combinaciones de dichos principios. La losof del mtodo llulliano es clara: al realizar un ensayo exhaustivo de todos a e los principios fundamentales de un dominio tendr amos que ser capaces de encontrar la solucin a nuestro problema, siempre y cuando est bien denido, y considerando mentes o e nitas. No obstante, este mtodo presenta varios inconvenientes: e Determinar cules son realmente los principios bsicos de un dominio. a a La inevitable explosin combinatoria. o Tras los trabajos de Llull, y ya en plena Edad Moderna, es obligado mencionar a los Droz, quienes construyeron tres autmatas notables a tamao natural: uno de ellos o n fue diseado para escribir distintos mensajes de hasta cuarenta caracteres; este autmata n o mov el papel con una mano y la pluma con la otra, mientras los ojos segu el trazado a an de la pluma sobre el papel. Otro hac dibujos variados. El ultimo tocaba el rgano, y a o presionaba con sus dedos las teclas, mientras su pecho sub y bajaba con el ritmo de su a respiracin y su cabeza acompaaba la msica. Estos tres autmatas estaban accionados o n u o por complej simos mecanismos de relojer a. Tambin, por esa misma poca, Vaucanson acomet la construccin de los autmatas e e a o o que, hoy en d pueden considerarse ms evolucionados. En efecto, su autista, caramia, a llista y el pato que graznaba, bat las alas, com y hac la digestin de forma mecnica, a a a o a son de una perfeccin notable. o La diferencia fundamental entre estos autmatas y las criaturas de la mitolog no es o a morfolgica, sino de actitud: estriba en la manera de comunicarse. As para indicarle al o , escritor de los Droz que deb cambiar el texto, era necesario cambiar su programa 2 , lo a cual requer seis horas de trabajo de un experto relojero. Por el contrario, los autmatas a o de Hefaistos entend mensajes hablados. an
2

Programar: instruir, dar indicaciones sobre cmo realizar una tarea. o

10

CAP ITULO 1. INTRODUCCION

Histricamente, la aproximacin a las ciencias puede realizarse desde pticas derivadas o o o de la metaf sica o desde pticas ms intelectuales. Ambas aproximaciones son vlidas y o a a muestran el inters del gnero humano por explicar fenmenos que an no se entienden. e e o u Pero junto a estos intentos vlidos y leg a timos aparecen siempre actitudes oportunistas como la que se reeja en la historia del Malzel Chess Automaton, un prodigioso autmata o que era capaz de jugar al ajedrez al mismo nivel que los mejores especialistas de la poca e (en realidad era un fraude y quien era un consumado jugador de ajedrez era el enano que se acomodaba en su carcasa). Curiosamente, Edgar Allan Poe, sabedor de los prodigios que se le atribu al Malzel an Chess Automaton, construy una prueba lgica segn la cual el autmata en cuestin no o o u o o pod ser autntico. La argumentacin de Poe se basaba en dos pilares fundamentales: a e o Ninguna mquina puede cambiar su estrategia durante un desarrollo prea tendidamente intelectual. Las mismas fuentes intelectuales no tiene por qu producir las mismas respuestas ante los mismos est e mulos. No hay ninguna mquina que sea capaz de utilizar conocimiento derivado a de la experiencia. Los procesos inductivos y de aprendizaje no son propios de ingenios mecnicos. a Lo que Poe no sab es que su argumentacin, que no era ms que una traduccin del a o a o llamado rgimen Lovelace segn el cual una mquina slo puede hacer lo que se le ordee u a o na, es falsa. Hoy sabemos que las mquinas pueden modicar sus estrategias de trabajo a durante la resolucin de ciertos problemas. Adems, incorporan conocimiento derivado o a de la experiencia (en forma de conocimiento heur stico) y lo utilizan para inferir nuevos hechos y para aprender de su propia experiencia. Sin embargo, la verdadera historia de la IA se inicia con los deseos de Babbage de que su mquina analtica fuese capaz de tratar adecuadamente juegos como el ajedrez. En a realidad, lo que Babbage pretend era construir una mquina capaz de pensar, aprender a a y crear, y cuya capacidad para realizar estos actos se incrementase hasta que los problemas tratados fuesen del mismo nivel que los destinados a los humanos, proyecto que casi les cuesta la vida a l y a su colaboradora Ada Lovelace. e Pero la curiosidad y el afn de superacin son caracter a o sticas propias del gnero humae no, y la Historia sigue su curso inexorable. As tras la calculadora de Pascal, el sistema , binario de Leibniz, la lgica simblica de Frege, las mquinas lgicas de Stanthome y o o a o Sevons y el lgebra de Boole, en 1943 se publican tres art a culos tericos relativos a lo que o hoy se conoce como Ciberntica. En el primero, Wiener, Rosenblueth y Bigelow sugieren e distintas formas de conferir nes y propsitos a las mquinas. En el segundo, McCulloch o a y Pitts ponen de maniesto de qu modo las mquinas pueden emplear los conceptos de e a lgica y de abstraccin y demuestran que cualquier ley de entrada-salida puede modelio o zarse a travs de una red de neuronas articiales. En el ultimo de estos art e culos, Craik propone que las mquinas empleen modelos y analog en la resolucin de problemas. a as o Mientras, en el MIT se trabajaban modelos que permitiesen establecer un conjunto de principios sencillo que explicasen las actividades de la mente humana, y Ernst desarrollaba su General Problem Solver, un planicador.

1.1. CUESTIONES PRELIMINARES

11

Mas todas estas ideas no salieron de la pura especulacin terica hasta mediados de o o los aos 50, en los que los ordenadores de la poca empezaban ya a ser adecuados para n e permitir la programacin de procesos lo sucientemente complejos3 (aparece Von Neuo mann y su arquitectura secuencial de computador). En 1956, un grupo de investigadores se rene en el Darmouth College para discutir u sobre la posibilidad de construir mquinas genuinamente inteligentes. Entre los investia gadores que all se dieron cita estaban Samuel, que hab desarrollado un programa para a jugar a las damas, McCarthy, que se dedicaba a la construccin de sistemas en los que lleo var a cabo razonamientos de sentido comn, y Minsky, que trabajaba sobre un problema u de geometr plana con la esperanza de conseguir que el ordenador emplease razonamiena to analgico sobre guras. Junto a stos, Newell, Shaw y Simon, fueron los verdaderos o e promotores de la IA, trmino acuado en su d por McCarthy. e n a Tras esta reunin se formaron diversos grupos de cient o cos que siguieron trabajando de forma independiente. As Newell y Simon formaron un equipo con la idea de desa, rrollar modelos de comportamiento humano, iniciando as la rama conexionista 4 . Por su parte, McCarthy y Minsky formaron otro equipo dedicado a la construccin de mquio a nas inteligentes, sin preocuparse especialmente del comportamiento humano, tal y como continuar haciendo la rama simbolista 5 de la IA. Ms tarde surgir enfoques mixtos6 . a a an El primer planteamiento supuso la emulacin de la actividad cerebral y, en la medida o de lo posible, la rplica de su estructura. El segundo, la construccin de sistemas en los e o que los procedimientos empleados para resolver problemas son de naturaleza tal que, de ser empleados por un ser vivo, ste ser considerado inteligente. Ambas aproximaciones, e a decididamente divorciadas durante mucho tiempo, son sin embargo necesarias para obtener resultados m nimamente interesantes. La primera porque el estudio y el desarrollo de sistemas inteligentes mediante el uso de simuladores da la oportunidad de alcanzar epistemolog complejas. La segunda por el gran inters que supone el diseo y el anlisis de as e n a sistemas que sean capaces de resolver problemas intelectualmente dif ciles. Ambos enfoques cubren los objetivos fundamentales de la IA moderna: la comprensin o de la inteligencia humana y la utilizacin de mquinas para adquirir conocimiento y tratar o a satisfactoriamente problemas complicados. Se asume que el comportamiento inteligente se rige por mecanismos automticos y parece conveniente potenciar las caracter a sticas diferenciasles de los ordenadores que los hacen mejores que los humanos en algunas tareas.

Shanon: El ordenador es un simulador de la actividad cerebral, La informacin se degrada a o medida que es utilizada Teor de la Informacin, La informacin tiende a desordenarse Teor de a o o a la Entrop de la Informacin. a o 4 Los tambin llamados pulcros; para ellos el ordenador es un campo de pruebas funcional y estructural e del cerebro humano. 5 Los desaliados, que buscan slo el comportamiento inteligente, manejan conocimiento. n o 6 Sistemas simblico-conexionistas, que usan RNA para lo que stas son buenas clasicacin, reconoo e o cimiento de patrones y simbolismo para controlar esa informacin. o

12

CAP ITULO 1. INTRODUCCION

1.2.

Algunas deniciones

Denir es uno de los mtodos de descubrir. e Turing Pueden pensar las mquinas?. Test de Turing: la inteligencia pasa a un sea gundo plano, se centra en la indistinguibilidad de comportamientos7 . Andre Mareaux Inteligencia es la posesin de los medios para dominar las cosas o a o los hombres. Minsky Inteligencia es la forma de resolver problemas que an no se entienden. u Hassentein La inteligencia se dene en funcin de sus propiedades constituyentes: o no desencadenada voluntariedad inferencia memoria Es una descripcin fenomenolgica: los seres inteligentes o o se comunican tienen conocimiento interno y autoconocimiento tienen memoria y son capaces de procesar nuevas experiencias tienen intencionalidad (lo ms dif a cil) tienen creatividad ineren y razonan Nilson La IA es una ciencia que estudia los mecanismos generales necesarios para lograr que los ordenadores hagan cosas que, por el momento, los humanos hacen mejor. Dendral En respuesta a Es posible disear un artefacto que examine unas observacion nes y produzca hiptesis relevantes para explicarlas?, disea un sistema que conso n truye la mejor hiptesis para explicar correctamente un conjunto de datos usando o mecanismos de razonamiento inductivo y emp rico (proceso dirigido por los datos). En el otro extremo, (partiendo de una hiptesis relacionarla con los datos para o conrmarla) se tienen los sistemas expertos. IA Disciplina encargada de disear mquinas de forma que stas sean capaces de n a e llevar a cabo tareas que, de ser realizadas por un ser humano, requerir algn an u tipo de inteligencia.

Tiempo real duro: respuesta inmediata; tiempo real blando: respuesta no inmediata pero ms rpida a a que la del experto humano.

1.3. CONSIDERACIONES GENERALES SOBRE IA

13

Rama de las ciencias de la computacin en la que se intentan encontrar eso quemas generales de representacin del conocimiento y formalizar procesos de o razonamiento coherentes que permitan resolver problemas diferentes en dominios ms bien estrechos8 . a Ciencia que utiliza elementos simblicos y numricos, conjuntos semnticos, o e a procesos heur sticos, mecanismos lgicos. . . para emular el comportamiento de o los seres humanos. Son elementos de comportamiento inteligente: Indexacin: sistema endgeno de organizacin tal que dado un problema o o o slo el conocimiento relevante es usado. o Curiosidad : necesidad de exploracin de posibles soluciones inicialmente o no contempladas, planteamiento de nuevas propuestas. Aprendizaje: incorporacin de nueva informacin potencialmente util (lo o o adecuado y en el momento oportuno). Ampliacin, estructuracin y armonizacin: tareas que median entre los o o o conocimientos vacilantes de un novato y el conocimiento sereno de un verdadero experto empleando heur stica.

Figura 1.1: Niveles epistemolgicos de la IA. o

1.3.

Consideraciones Generales sobre IA

Los dos planteamientos anteriores dan lugar a una dicotom dif de resolver: qu es a cil e la IA, una ciencia o una ingenier Como ciencia, debe desarrollar el vocabulario y los a? conceptos que permiten ayudar a entender y reproducir comportamiento inteligente. Como ingenier debe denir y utilizar un conjunto de mtodos que permitan adquirir conocia, e miento de alto nivel, formalizarlo, representarlo segn un esquema computacionalmente u ecaz, y utilizarlo para resolver problemas en dominios de aplicacin concretos. o
8

Esta denicin se aproxima mucho a la de sistema experto. o

14

CAP ITULO 1. INTRODUCCION

La discusin sobre los mbitos de aplicabilidad de la IA nos permite clasicar (criterio o a de Waterman) los sistemas inteligentes en tres niveles distintos: programas de IA, sistemas basados en conocimiento y sistemas expertos.

1.3.1.

Programas de IA

Los programas de IA exhiben cierto comportamiento inteligente fruto de la aplicacin o hbil de heur a sticas en sentido amplio, entendiendo como heur stica un tipo de conocimiento dif cilmente formalizable, fruto de la experiencia y que se establece impl citamente para tratar de encontrar respuestas ms o menos correctas, pero siempre vlidas, a un a a problema concreto. La utilizacin de conocimiento heur o stico no garantiza encontrar soluciones ptimas, pero s permite garantizar el hallazgo de soluciones aceptables, si existen, o a travs de los denominados procesos inferenciales. e Inferencia es el proceso que permite la comprensin de un signicado en funcin de o o cierta informacin relacionada. Su idea est ligada a los procesos de razonamiento, que o a frecuentemente exigen la realizacin de varias inferencias para lograr establecer concluo siones vlidas. El estudio del razonamiento nos permite su clasicacin en, al menos, tres a o modos diferentes: 1. Razonamiento deductivo: parte de una premisa general A1 y de una premisa particular A2 referida a la primera parte de A1 y trata de demostrar la premisa particular A3 referida a la segunda parte de A1.
A1 : La gripe produce fiebre A2 : Luis tiene gripe ---------------------------A3 : Luis tiene fiebre

Este es el modo de razonamiento propio de las matemticas y su empleo a no genera conocimiento nuevo, simplemente aplicamos conocimiento dado sobre situaciones particulares para obtener conclusiones vlidas. a 2. Razonamiento inductivo o no montono: parte de dos premisas de naturao leza particular A2 y A3 e intenta obtener la asercin general A1. o
A2 : Estos objetos caen A3 : Estos objetos tienen masa -----------------------------A1 : Los objetos con masa caen

Este modo de razonamiento est ligado a la experimentacin y es propio a o de ciencias naturales como la f sica y la qu mica. Genera conocimiento nuevo, basndose en la observacin de eventos y en las posibles relaciones a o que pueden encontrarse. Plantea como problema que puede dar lugar a errores importantes (sustityase con masa por son rojos), que se miniu mizan mediante un cuidadoso anlisis previo de las premisas particulares a que se pretenden relacionar. Adems, basta un unico contraejemplo para a refutarlo.

1.3. CONSIDERACIONES GENERALES SOBRE IA 3. Razonamiento abductivo o impreciso: trabaja sobre la plausibilidad de las conclusiones, tratando formalmente de relacionar aserciones de tipo A1 con aserciones de tipo A3 para concluir aserciones de tipo A2.
A1 : Los cuadros de Goya presentan la caracterstica X A3 : Este cuadro presenta la caracterstica X -----------------------------------------------------A2 : Este cuadro es de Goya

15

Este modo de razonamiento trata de concluir algo sobre la posible relacin entre dos aserciones que se sabe que son ciertas, aunque dicha o relacin puede ser cierta o no. Entre sus caracter o sticas reconocemos que est ligado al concepto de incertidumbre (la conclusin viene afectada de a o incertidumbre, se puede suponer cierta salvo que se demuestre lo contrario), que genera nuevo conocimiento y que es el modo de razonamiento tpico de la IA, aunque no el unico.

1.3.2.

Sistemas basados en conocimiento

El siguiente nivel es el de los sistemas basados en conocimiento, en los que los conocimientos del dominio concreto y las estructuras de control que se utilizan para manipularlo se encuentran f sicamente separados, lo que va a requerir la denicin e implementacin de o o arquitecturas diferentes a las que estamos habituados, y en las que unos y otras puedan ser desarrollados independientemente entre s de forma que una misma estructura de control , pueda ser utilizada en muchas bases de conocimiento diferentes y viceversa.

1.3.3.

Sistemas expertos

Por ultimo, los sistemas expertos pueden considerarse especializaciones de los sistemas basados en conocimiento que utilizan conocimiento particular de un dominio de aplicacin o concreto para tratar de resolver problemas del mundo real, limitados en tamao, pero de n gran complejidad. La construccin de sistemas expertos requiere del empleo de tcnicas desarrolladas o e para construir programas de IA y la utilizacin de las arquitecturas denidas para el o desarrollo de sistemas basados en conocimiento, pero adems es imprescindible la realia zacin de esfuerzos en aspectos diferenciales como son, por ejemplo, la adquisicin del o o conocimiento y el aprendizaje. La incorporacin de informacin espec o o ca de un dominio se simplica notablemente si se pueden establecer categor en el conocimiento barajado. as Estas categoras pueden denirse en relacin al origen y procedencia del conocimiento o mencionado, con respecto al experto humano de quien lo extraemos: Conocimiento pblico, que puede obtenerse directamente a partir de fuenu tes t picas (manuales, libros), comnmente aceptado y universalmente u reconocido.

16

CAP ITULO 1. INTRODUCCION Conocimiento semipblico, expl u cito pero no universalmente reconocido ni comnmente aceptado, utilizado casi de forma exclusiva por los espeu cialistas del rea concreta. a Conocimiento privado, no expl cito, no universalmente reconocido ni comnmente aceptado, de marcado carcter heur u a stico, endgeno de cada o uno, fruto de la propia experiencia.

Un sistema de conocimiento pretende familiarizarse con el conocimiento pblico, imu plementar el semipblico y extraer el privado. u

Cap tulo 2 Resolucin de Problemas o


No podemos decir que algo o alguien exhibe comportamiento inteligente si no explota de manera ecaz y eciente un conjunto m nimo de conocimientos. Decimos que un sistema es ecaz cuando es capaz de resolver correctamente un problema, y decimos que es eciente cuando, adems de comportarse ecazmente, optimiza los recursos disponibles. a Una arquitectura, natural o articial, bien denida y estructurada pero vac no puede a, utilizarse para resolver problemas mientras no incorpora procedimientos de resolucin y o conocimientos propios del dominio de los problemas planteados. Est claro que no todos los problemas son iguales, por los que los tipos de conocimiento a necesarios (las tcnicas para abordarlos) van a ser diferentes tambin. En general, el tipo e e de problema planteado condiciona la tcnica de resolucin a emplear. No obstante, la e o decisin de utilizar una tcnica de IA o una tcnica convencional de programacin puede o e e o ser tambin cuestin de planteamiento. Como norma general, el empleo de tcnicas de IA e o e debe permitir la construccin de programas que: o Capten generalizaciones, de forma que cada situacin individual que se o produzca no tenga que ser representada de forma separada, sino que todas aquellas situaciones que compartan propiedades deben ser agrupadas. Hagan explcito su conocimiento (que generen explicaciones en lenguaje natural), al objeto de facilitar su comprensin. o Puedan actualizarse continuamente, de forma que sea factible modicar el conocimiento sin tener que manipular ni alterar todo el programa. Puedan ser empleados en muchas situaciones, an cuando las respuestas u que generen sean parcialmente correctas o imprecisas. La aplicacin de estos criterios en la resolucin de problemas de dominios concretos, o o conduce a la construccin de programas con caracter o sticas esencialmente diferentes a los construidos mediante tcnicas convencionales: e 1. Los programs de IA deben ser empleados para tratar fundamentalmente dominios simblicos, mientras que los programas convencionales son o particularmente idneos para tratar dominios numricos. o e 17

18

CAP ITULO 2. RESOLUCION DE PROBLEMAS 2. La bsqueda de soluciones en los dominios apetecidos por la IA se realiza u a travs de procesos heur e sticos1 en los que los pasos hacia la solucin sueo len ir impl citos. Por el contrario, los programas convencionales emplean procedimientos algor tmicos de bsqueda, con pasos expl u citos hacia la solucin. o 3. En los programas convenicionales la informacin y el control se encueno tran f sicamente integrados en una misma estructura, mientras que en los programas de IA el conocimiento del dominio y las estructuras de control suelen estar f sicamente separados, dando como resultado arquitecturas mucho ms modulares. a

Como siempre ocurre, la diferencia no es lo sucientemente evidente como para permitirnos establecer una frontera clara entre los problemas de la IA (aqullos para cuya e resolucin est indicada la aplicacin de tcnicas de IA) y los problemas convencionales o a o e (aqullos para cuya resolucin estn indicadas las tcnicas de programacin convencional). e o a e o Sin embargo, un anlisis cuidadoso del dominio nos puede dar pistas a la hora de elegir a una u otra losof y evitar as errores provocados por el hecho de no ajustar la tcnica a, e al tipo de problema que queremos resolver. Supongamos que podemos denir a priori un conjunto de situaciones posibles y unas reglas del juego potencialmente utiles, y tambin que podemos disear unas estrategias e n generales, que investiguen la aplicabilidad de las reglas del juego sobre los estados para obtener otros estados, de forma que sea el ordenador quien encuentre por s mismo la solucin al problema. Ntese que este enfoque es de naturaleza no determin o o stica, y que un programa que siguiese este planteamiento ser muy general, podr utilizarse para a a resolver un nmero ilimitado de problemas, ya que slo cambiar las reglas del juego u o an aplicables, en funcin del estado del problema en cada momento. Para conseguir esto, en o IA se dene el espacio de estados del problema.

2.1.

Espacio de Estados

En IA es util denir el dominio del problema que queremos resolver como un espacio de estados, que es una descripcin formal del universo de discurso y est constituido por o a los siguientes elementos: Un conjunto de estados iniciales I. Un conjunto de operadores O que denen operaciones permitidas entre estados. En el espacio de estados no todas las operaciones denidas van a ser aplicables siempre: en un momento dado, el conjunto de estados que representa la situacin actual de nuestro problema es quien determina o el subconjunto de operadores aplicables (o relevantes) del conjunto
El conocimiento heur stico es un conocimiento dif cilmente formalizable, fruto de la experiencia y que se establece impl citamente para tratar de encontrar respuestas ms o menos correctas, pero siempre a vlidas, a problemas de dominios concretos. a
1

2.1. ESPACIO DE ESTADOS de operadores previamente denido. Para que un operador pueda ser considerado relevante debe cumplir un conjunto de requisitos m nimos. Un conjunto de metas M (objetivos) que cumplen los requisitos sucientes para ser consideradas soluciones aceptables de nuestro problema2 . La solucin no es la meta, sino la trayectoria de bsqueda, la secuencia de o u estados que conduce del inicial al nal.

19

Llamaremos nodo a un punto concreto del espacio de estados y estado a la secuencia de pasos que se ha seguiro para llegar a un nodo. El espacio de estados (I, O, M ) es util porque permite describir formalmente un pro blema como un conjunto de transformaciones desde unas situaciones dadas hasta unas situaciones deseadas, a travs de un conjunto de operaciones permitidas. Ms concretae a mente, nos permite contemplar el proceso global de solucin de un problema como: o la aplicacin de un conjunto de tcnicas conocidas, cada una de ellas o e denida como un paso simple en el espacio de estados, y un proceso de bsqueda o estrategia general de exploracin del espacio u o de estados. Formalmente: Si I = [i1 , i1 , . . . , in ] dene al conjunto de estados iniciales, O = [o1 , o2 , . . . , om ] dene al conjunto de operadores potencialmente utiles y M = [m1 , m2 , . . . , mt ] dene al conjunto de metas o estados nales, la bsqueda se dene como el u proceso de exploracin del espacio de estados que produce O : (I M ), o una evolucin desde los estados iniciales hasta los estados nales obtenida o tras la aplicacin de un conjunto de operadores. En este mismo contexto, una o transicin simple en el espacio de estados puede representarse o ox : (iz iw ) con iz , iw I, iz , iw M y ox O. / Si iw M , entonces iw representa una solucin aceptable para nuestro probleo ma. La llamada prueba de meta o test de realizacin aplicada a la descripcin o o de un estado permitir decidir si alguno de los nuevos estados generados se a trata de un estado meta. Cualquier otro estado alcanzado durante la bsqueda u que no pertenezca al conjunto de metas puede ser considerado como un nuevo estado inicial del problema. Este formalismo de resolucin normalmente se traduce en la creacin de programas o o menos ecientes que los convencionales, pero mucho ms exibles y generales. En cuala quier caso, la resolucin de problemas en IA requiere siempre una descripcin formal y o o manejable del problema, esto es, la elaboracin de un modelo computacional del universo o
2

En IA se habla de soluciones aceptables, no de mejor solucin. o

20 de discurso o dominio del problema.

CAP ITULO 2. RESOLUCION DE PROBLEMAS

El espacio de estados, aunque imprescindible para la representacin formal de un proo blema de IA, tan slo nos proporciona lo que podr o amos llamar el soporte f sico del dominio. El aspecto ms dinmico de obtencin de soluciones se materializa a travs de a a o e los llamados procesos de bsqueda, mecanismos generales de exploracin del E.E. u o El concepto de bsqueda est u a ntimamente ligado a la aplicacin de operadores relevano tes. Ms generalmente, la bsqueda se puede asimilar a los procesos de control qe gu a u an la ejecucin de un programa de IA, segn los cuales el sistema debe ser capaz de decidir o u en todo momento cul ser su prximo movimiento en el espacio de estados. Conviene a a o que la bsqueda sea sistemtica (para evitar rodeos innecesarios) y que la aplicacin u a o de cada operador provoque un movimiento que genere la aparicin de un estado nuevo o (que no haya sido generado ya, para evitar hacer y deshacer continuamente). As nos , encontramos con diversas estrategias: Estrategia 1 A priori, una buena posibilidad podr ser la de aplicar el primer operador, a segn un orden establecido, que cumpla los requisitos del estado actual, y vericar si u el nuevo estado es meta. Esta estrategia de bsqueda es sistemtica, pero no observa u a la condicin de generar estados nuevos, con lo cual puede caer en un bucle. Adems, o a hay operadores cuya aplicacin se repite, lo cual no es deseable tampoco. o Estrategia 2 Intentando evitar la aplicacin repetitiva de operadores, pero manteniendo o el criterio de sistematicidad, podr seguirse este otro esquema: a 1. seleccionar los operadores que veriquen las precondiciones del estado actual 2. descartar aqullos que ya hayan sido aplicados e 3. aplicar el primero de los restantes3 . 4. test de realizacin para el nuevo estado o Ntese que esta estrategia nos obliga a denir estructuras adicionales que nos pero mitan comprobar si un operador ha sido aplicado ya o no; adems, an no evita la a u generacin de estados ya generados, y puede no encontrar solucin. o o Estrategia 3 Tratando de impedir de forma expl cita los inconvenientes sealados en la n primera estrategia, podr denirse el esquema siguiente: a 1. seleccionar los operadores que veriquen las precondiciones del estado actual 2. descartar los que ya hayan sido aplicados 3. descartar aqullos cuya aplicacin no genere un estado nuevo e o 4. aplicar el primero de los restantes 5. prueba de meta
Si en este punto los operadores se ordenasen aleatoriamente podr amos llegar a una solucin por o casualidad o conseguir diferentes soluciones para los mismos estados inicial y nal.
3

2.2. CARACTER ISTICAS DE LOS PROCESOS DE BUSQUEDA

21

Nuevamente precisar amos denir estructuras adicionales (aparte de saber qu opee radores hemos aplicado ya, debemos comprobar si un estado es nuevo o no), y podemos an no encontrar solucin. Parece evidente que hemos de sacricar algo si u o queremos encontrarla. Estrategia 4 Seguir los pasos: a 1. seleccin de los operadores que veriquen las precondiciones del estado actual o 2. descarte de los que no generen estados nuevos 3. aplicacin del primero de los restantes o 4. test de realizacin o Ahora s se encuentra una solucin, pero parece claro que no es una forma ptima o o de proceder. El motivo por el cual se ha ilustrado de este modo el hipottico proceso que el sistema e ha seguido para encontrar una solucin es tratar de evidenciar las diferencis existentes o entre los programas convencionales y los programas de IA. El conocimiento del sistema (operadores, precondiciones) se dene de manera totalmente independiente de la forma de utilizarlo (estrategias, mecanismos de control del conocimiento). Adems, a medida a que vamos explorando diversas estrategias de resolucin, vamos encontrando la necesidad o de denir estructuras auxiliares. Y, por ultimo, la solucin encontrada por el sistema es o aceptable (cumple los requisitos para ser meta), pero puede no ser la mejor. La validez de la solucin encontrada depender mucho del tipo de problema planteado. o a Las distintas estrategias de bsqueda que se presentan en este cap u tulo tratarn de a resolver este tipo de problemas.

2.2.

Caracter sticas Generales de los Procesos de B squeda u

Como ya hemos mencionado, los programas de IA deben ser exibles y generales, de forma que, independientemente del universo de discurso, permitan la utilizacin de o tcnicas aplicables a la resolucin de cualquier problema, y que sean de una eciencia, e o por lo menos, aceptable. Surgen as las llamadas tcnicas de b squeda de propsito e u o general, conocidas tambin como mtodos dbiles de exploracin del E.E. Estas e e e o tcnicas derivan de la idea de bsqueda heur e u stica, y pueden denirse independientemente de cualquier tarea particular, o del dominio concreto considerado4 . Cada tcnica de bsqueda tiene sus ventajas, inconvenientes e idiosincrasia particular. e u Antes de decidirnos por una u otra, es conveniente estudiar su idoneidad en relacin al o tipo de problema y dominio planteado. Esta idoneidad puede establecerse analizando un conjunto de caracter sticas esenciales que condicionan el proceso de bsqueda: u
Evidentemente, esta armacin no debe tomarse al pie de la letra: el tipo de tarea a resolver y el o dominio del problema inuyen claramente en la eleccin de una u otra tcnica; aunque conceptualmente o e todas son igualmente aplicables, unas son ms apropiadas que otras. a
4

22

CAP ITULO 2. RESOLUCION DE PROBLEMAS direccin del proceso de bsqueda o u topolog del proceso de bsqueda a u representacin de los estados por los que discurre la resolucin del proo o blema criterios establecidos y procedimiento denido para la seleccin sistemtio a ca de los operadores relevantes en funcin de los estados alcanzados o posibilidad de optimizar los procesos de bsqueda mediante el empleo de u 5 funciones heursticas (usar conocimientos sobre la propia bsqueda) u

2.2.1.

Direccin del proceso de b squeda o u

Existen dos direcciones fundamentales que podemos denir a la hora de congurar un proceso de bsqueda determinado: u desde los estados iniciales hacia los estados meta, mediante la generacin o de estados intermedios obtenidos tras la aplicacin sucesiva de operadores o relevantes (postura: qu hago con lo que tengo? ): e EE(I, O, M ) O : (I M )

desde los estados meta hacia los estados iniciales, investigando qu estae dos previos al estado (o estados) meta, y qu operadores aplicables, nos e producen una transicin deseada (postura: qu tendr que haber hecho o e a para llegar aqu? ): EE(I, O, M ) O : (M I)

La primera direccin denida congura un razonamiento progresivo o dirigido por o los datos, mientras que la segunda congura un razonamiento regresivo o dirigido por los objetivos. Entre ambas situaciones l mite, encontramos cierto tipo de problemas para los cuales es conveniente emplear estrategias mixtas de bsqueda. As en algunos casos es conveu , niente iniciar un proceso dirigido por los datos y, llegado un punto, cambiar la direccin o de la bsqueda, o viceversa, iniciar un proceso dirigido por los objetivos, que permita el u establecimiento de un conjunto de hiptesis razonables, y luego confrontar las hiptesis o o con los datos, a travs de un proceso progresivo. e Sea como fuere, parece claro que la direccin del proceso condiciona, al menos en parte, o los resultados y la eciencia del sistema, pero. . . cundo es aconsejable optar por una u a otra? Existe algn criterio que nos permita discriminar entre ambas opciones? u La eleccin sobre la direccin de bsqueda ms conveniente debe considerar tres aso o u a pectos diferentes:
5

La mejor funcin heur o stica nos dar idealmente, la mejor solucin en tiempo 0. a, o

2.2. CARACTER ISTICAS DE LOS PROCESOS DE BUSQUEDA tamao relativo de los conjuntos I y M (es preferible explorar el espacio n de estados de forma que progresemos desde un conjunto inicialmente pequeo de informacin de partida hacia un conjunto mayor de estados) n o factor de ramicacin (nmero promedio estimacin de estados que o u o se pueden alcanzar desde uno dado, nmero de operadores aplicables u llegados a un momento dado profundidad; inuye en la ecacia del proceso de bsqueda, de modo que trataremos de explorar el espacio de u estados segn la direccin del menor factor de ramicacin6 ) u o o inclusin de estructuras explicativas como requisito inicial en el diseo de o n nuestro sistema inteligente (si el programa debe ser capaz de explicar su proceso de razonamiento, es conveniente que lo realice en la direccin o que concuerde ms aproximadamente con la forma de razonar del usuario a humano)

23

2.2.2.

Topolog del proceso de b squeda a u

Una forma sencilla de explorar el espacio de estados es generar dinmicamente 7 un a rbol, partiendo de un determinado estado, inicial o nal, y expandirlo tras la ejecucin a o 8 de uno o varios operadores relevantes . Es totalmente viable que un mismo estado sea generado durante la exploracin de o diversos caminos, lo que supone un esfuerzo adicional de computacin que se traduce o en una menor eciencia del proceso de bsqueda. Este inconveniente puede mitigarse u cambiando la topolog del proceso y convirtiendo el rbol en un grafo dirigido. a a En la tabla 2.1 (pgina 24) se expone un mecanismo de conversin completo de rbol a o a de bsqueda a grafo de bsqueda, ya que, adems de cambiar la topolog del proceso, u u a a registra el mejor camino cada vez que se genera un nuevo estado. La utilizacin de grafos de bsqueda reduce los esfuerzos de exploracin del espacio de o u o estados, aunque tiene el inconveniente de que obliga a comprobar si cada nuevo estado generado pertenece ya al conjunto de estasod generados en pasos anteriores. Las topolog en rbol suelen causar problemas de memoria, pero la bsqueda puede as a u ser ms rpida. Las topolog en grafo, aparte de ser conceptualmente ms correctas, a a as a minimizan los problemas de memoria, aunque pueden hacer disminuir la eciencia al tener que efectuar comprobaciones frecuentes. As pues, ambos esquemas tienen ventajas e inconvenientes, de modo que en ultimo trmino la eleccin depende del dominio del e o problema planteado.
Aunque, por desgraca, suele ir normalmente en la direccin contraria a la que indica el primer punto o (tamao relativo de I y M ). n 7 En IA los rboles de decisin son siempre impl a o citos, slo se materializan cuando se ejecuta un o determinado proceso inferencial. 8 El nmero de operadores relevantes ejecutados depende de la tcnica de exploracin elegida, como u e o veremos.
6

24

CAP ITULO 2. RESOLUCION DE PROBLEMAS


(a) Generar (uno o ms) estados a tras la aplicacin de (uno o ms) operadores relevantes o a (b) Examinar el conjunto de estados generados; para cada uno: (b.1) Si el estado es nuevo a~adirlo y volver a (a) n (b.2) Si ya exista descartarlo e ir a (c) (c) A~adir un enlace entre el nodo que se est expandiendo n a y su sucesor (d) Recorrer el nuevo camino desde el principio (d.1) Si es ms corto a insertarlo como mejor camino y propagar el cambio reorganizar el grafo si es necesario volver a (a) (d.2) Si no es ms corto a volver a (a)

Cuadro 2.1: Algoritmo de transformacin de rbol a grafo. o a

2.2.3.

El problema de la representacin o

De acuerdo con las estructuras denidas en el espacio de estados, el problema de la representacin puede estudiarse desde tres perspectivas diferentes: o Representacin de los objetos, entidades relevantes o hechos del dominio o (estructura del conocimiento) naturaleza esttica. a Representacin de las relaciones entre objetos, entidades relevantes o heo chos del dominio (estructuras que nos permiten transitar por el espacio de estados: operadores) naturaleza dinmica. a Representacin de las secuencias de estados surgidas durante los procesos o de bsqueda (de la estrategia y los mecanismos de control necesarios u para organizar la bsqueda convenientemente, representacin dinmica u o a del proceso de bsqueda de soluciones). u La representacin de los nodos y la representacin de las relaciones entre los nodos o o denen el problema de la representacin del conocimiento, que veremos ms adelante. o a Aunque de las tres perspectivas la ms relacionada con la bsqueda es la representacin a u o de las secuencias de estados, todas ellas estn estrechamente relacionadas y, normalmente, a la eleccin de determinados esquemas de representacin para entidades y relaciones suele o o condicionar el esquema de representacin idneo para las secuencias de estados. o o

2.2. CARACTER ISTICAS DE LOS PROCESOS DE BUSQUEDA

25

2.2.4.

Seleccin sistemtica de operadores relevantes o a

Ya hemos comentado cmo la aplicacin de un determinado operador sobre un estado o o dado produce un nuevo estado, pero. . . cmo podemos reconocer, de entre el conjunto o global de operadores potencialmente utiles, aqullos que realmente son aplicables a nuestro e estado actual? Cmo podemos extraer del conjunto global de operadores un subconjunto o de operadores relevantes? Este problema dene lo que en IA se denomina emparejamiento, que constituye una de las tareas ms costosas y lentas de los programas de IA. Existen varios tipos de empaa 9 rejamiento , cada uno con sus ventajas e inconvenientes, y la eleccin del tipo de empao rejamiento suele depender del esquema utilizado para representar el conocimiento: El emparejamiento literal realiza una bsqueda simple a travs de todos u e los operadores del conjunto O, analizando las precondiciones de cada uno en el contexto del estado actual considerado y extrayendo los que las veriquen. Este tipo de emparejamiento presenta el problema de que su eciencia est muy ligada al nmero de operadores denidos en el conjunto O; si a u consideramos que los problemas realmente interesantes en IA requieren la utilizacin de gran nmero de operadores, deducimos que este mtoo u e do suele ser intr nsecamente ineciente en los problemas reales. Por otra parte, para un estado particular no siempre es evidente que un operador determinado sea aplicable, a veces es dif saber si un estado satisfacil ce o no las precondiciones del operador (puede ocurrir que el operador empareje completamente con el estado, o que sus precondiciones sean un subconjunto de la descripcin del estado, o que coincidan slo parcialo o mente, o bien que no coincidan en absoluto), de modo que slo es util en o dominios pequeos en los que la exploracin de patrones, costosa y lenta, n o se vea compensada por lo restringido del conocimiento involucrado. Como ventaja, es un mtodo muy informativo. e El emparejamiento con variables es de naturaleza no literal, y es especialmente util cuando el problema que tratamos de resolver requiere una bsqueda extensa en la que no haya variables involucradas. Es ms desu a criptivo que el anterior, y reduce el nmero de operadores. Lo ilustraremos u con un ejemplo. Tengamos los siguientes hechos del dominio (describen la situacin actual o del problema):
HIJO HIJO HIJO HIJA HIJA HIJA
9

(Mara, Juan) (Juan, Pedro) (Pedro, Toms) a (Pedro, Rosa) (Juan, Ana) (Ana, Rosa)

Proceso de seleccin de operadores relevantes. o

26

CAP ITULO 2. RESOLUCION DE PROBLEMAS donde HIJO (A,B) signica que B es hijo de A, y los operadores:
op1 : HIJO (x,y) AND HIJO (y,z) -> NIETO (x,z) op2 : HIJA (x,y) AND HIJO (y,z) -> NIETO (x,z) op3 : HIJO (x,y) AND HIJA (y,z) -> NIETA (x,z)

Encontrar un estado meta supone encontrar un estado que incluya los mismos hechos que el estado de partida y, adems, algn hecho que india u que que realmente es meta (hecho inferido). Si quisiramos saber quin e e es nieto de Juan nos interesar aplicar los operadores 1 2, puesto a o que son los que concluyen sobre la existencia de un nieto. La meta se obtendr inmediatamente con slo sustituir x por Juan, pero para ello a o tendr amos que encontrar primero un y que vericase HIJO (Juan,y) AND HIJO (y,z) para alg n valor de z. Esto supondr comprobar todos los u a hijos de Juan y vericar que alguno de ellos tenga a su vez un hijo, o comprobar entre todos los que tengan algn hijo que alguno de ellos es a u su vez hijo de Juan. Frecuentemente, encontraremos muchos valores que satisfagan los predicados por separado, pero muy pocos que los satisfagan todos. Una vez identicados los operadores aplicables en el estado actual, y en el caso de que hayamos podido identicar ms de uno, es cuando se presenta el conicto: debemos ser a capaces de poder elegir de entre dicho conjunto de conicto la utilizacin del operador que o a priori nos ofrezca ms garant de xito en la bsqueda de un camino adecuado hacia a as e u la meta. Un enfoque correcto de este problema de resolucin de conictos es fundamental o en la construccin de sistemas inteligentes. o Aunque muchas veces los mecanismos idneos de resolucin de conictos son depeno o dientes del universo de discurso, del esquema de representacin elegido y del procedimiento o de bsqueda empleado, tambin es cierto que toda estrategia de resolucin de conictos u e o debe respetar los siguientes criterios generales: si puede evitarse, no deben aplicarse operadores que ya hayan sido utilizados deben tratar de aplicarse primero operadores que emparejen con los hechos ms recientemente incorporados a la base de hechos que describe a nuestro estado actual, de manera que utilicemos informacin ms real y o a actual (lo que obliga a ser capaces de identicar la secuencia temporal en la incorporacin de hechos; eciencia inferencial y computacional) o se tratar de aplicar primero operadores con precondiciones ms restrictia a vas, ms espec a cos (buscando mayor discriminacin, acotar el problema) o de no darse ninguna de las condiciones anteriores, se seleccionar uno (o a varios) operadores al azar

2.3. ESTRATEGIAS DE EXPLORACION DEL E.E.

27

2.2.5.

Funciones heur sticas

Se conoce como funcin heurstica a aquella funcin de carcter numrico que permite o o a e cuanticar el benecio de una transicin efectuada en el espacio de estados del dominio del o problema a resolver. Suelen resultar utiles a la hora de optimizar los procesos de bsqueda, u ya que intentan guiar la exploracin del espacio de estados en la direccin ms provechosa, o o a sugiriendo el mejor camino a seguir (a priori) cuando disponemos de varias alternativas, intentando llegar a la solucin de manera intuitiva (nos dice cun lejos estamos de llegar o a a la solucin). o

2.3.

Estrategias de Exploracin del E.E. o

La ecacia del proceso de bsqueda viene frecuentemente determinada por la estrategia u empleada y por los mecanismos diseados para controlar la aplicacin del conocimiento n o del dominio. Est claro que, para cada universo de discurso, siempre podremos establecer estrategias a espec cas (tcnicas ad-hoc, concretas, para casos concretos) de exploracin del espacio e o de estados, es decir, tcnicas de b squeda de propsito espec e u o co. No obstante, desde la perspectiva de la IA, son mucho ms interesantes las estrategias genricas que a e unen a su generalidad una eciencia razonable. Tales estrategias genricas se agrupan en e lo que habitualmente se denominan mtodos dbiles de exploracin del espacio de e e o 10 estados . Cualquier mtodo dbil de exploracin del E.E. congura una bsqueda que ser de e e o u a uno de los siguientes tipos: En anchura. En profundidad. Mixta profundidad-anchura.

2.3.1.

B squeda preferente por amplitud (anchura) u

La bsqueda preferente por amplitud o bsqueda en anchura trata de generar amplios u u y crecientes segmentos en el E.E. y en cada nuevo nivel generado verica si el objetivo ha sido alcanzado antes de pasar al siguiente. Su caracter stica fundamental es, pues, que se expanden todos los nodos de un mismo nivel antes de acceder a nodos de niveles inferiores11 . La implementacin computacional del mtodo utiliza dos listas de nodos: o e ABIERTOS, nodos que se han generado y a los que se les ha aplicado la funcin de evaluacin pero que an no han sido examinados (no se han o o u generado sus sucesores)
10 11

Se denominan as porque el conocimiento que aaden al problema es dbil. n e Puede verse, pues, como una materializacin del ars magna de Ramn Llull. o o

28

CAP ITULO 2. RESOLUCION DE PROBLEMAS CERRADOS, nodos que ya han sido examinados (esta lista tiene la nalidad de evitar la creacin de ciclos en el proceso de bsqueda) o u

Cada nodo n del rbol de bsqueda mantendr enlaces a todos sus sucesores, pero a u a slo a un unico predecesor. El algoritmo se muestra en la tabla 2.2 (pgina 28). o a

1. Colocar el nodo inicial en ABIERTOS 2. Aplicar el test de realizacin a este nodo; o Si es meta, salir e informar de la solucin o 3. Si ABIERTOS est vaca a salir e informar del fallo 4. Obtener el primer nodo (N) de ABIERTOS y a~adirlo a CERRADOS n 5. Expandir N generando todos sus sucesores aplicando todos los operadores relevantes; Si no hay sucesores, volver a 3 sino a~adir los sucesores al final de ABIERTOS n y actualizar sus enlaces para que apunten a N 6. Aplicar a los sucesores el test de realizacin; o Si alguno de ellos es meta, salir e informar de la solucin o siguiendo los enlaces hasta el nodo inicial 7. Volver a 3

Cuadro 2.2: Algoritmo de Bsqueda en Anchura. u

Los caminos que se exploran paralelamente y no resultan en solucin, se dicen no reo solutivos; nada indica que no puedan ser parte de una solucin a otro nivel. o Los procedimientos de bsqueda en anchura, por ser exhaustivos (y sistemticos, ya u a que se aplican todos los operadores que pueden emparejarse con todos y cada uno de los nodos del nivel considerado), nos permiten asegurar que, en espacios de estados nitos y bien construidos, el sistema siempre encontrar la solucin al problema, y adems, dicha a o a solucin ser la mejor. o a Desgraciadamente, los mtodos en anchura son impracticables en dominios amplios, e ya que el nmero de nodos generado en cada nivel sucesivo crece de manera exponencial u y, consecuentemente, las necesidades de memoria y el tiempo computacional empleado en la bsqueda tambin lo hacen. u e

2.3. ESTRATEGIAS DE EXPLORACION DEL E.E.

29

2.3.2.

B squeda preferente por profundidad u

A diferencia de los mtodos en anchura, los mtodos en profundidad seleccionan un e e camino determinado y siguen por l hasta agotarlo completamente. En los mtodos en e e profundidad puros el test de realizacin se efecta cada vez que se genera un nuevo nodo. o u Puede ocurrir que el camino recorrido sea resolutivo y lleve a una solucin del problema o o puede que agotemos todas las posibilidades de expansin sin haber encontrado nada. En o este ultimo caso hay que efectuar una vuelta atrs y explorar otro camino diferente (ver a algoritmo12 en tabla 2.3, pgina 29). a
1. Colocar el nodo inicial N en CAMINO 2. Aplicar el test de realizacin a este nodo. o Si es meta, salir 3. Expandir N aplicando el primer operador no aplicado para gener un sucesor S. 4. Si ningn operador es aplicable, u salir 5. En caso contrario, realizar una bsqueda en profundidad u partiendo de S

Cuadro 2.3: Algoritmo de Bsqueda en Profundidad. u Los mtodos en profundidad son sensibles a la posicin relativa de los operadores en e o una lista, ya que este es el criterio que se utiliza para la seleccin de operadores en caso o de conicto. Desde una perspectiva computacional, requieren menos recursos de memoria que los mtodos en anchura, ya que consideran un espacio de bsqueda ms limitado, pero e u a pueden tratar de explorar caminos muy largos habiendo alternativas mejores e incluso no llegar nunca a alcanzar una solucin; no est clara su sistematicidad (la bsqueda en o a u profundidad pura es un procedimiento sistemtico, pero permite que encontremos la a 13 solucin por casualidad , sin que tenga, por supuesto, que ser la mejor) y hay que o hacer un montn de comprobaciones, por lo que se es ms ineciente desde el punto de o a vista temporal. En ocasiones, los caminos generados por los mtodos en profundidad no se exploran e completamente, abandonndose la bsqueda tras alcanzarse sin xito una determinada a u e profundidad. Ello puede suponer que consideremos que un determinado camino es infructuoso cuando, en realidad, se estaba muy cerca de la solucin. o Lo normal, en la prctica, es emplear estrategias mixtas y desarrollar procedimiena tos que combinen, de una forma u otra, caracter sticas de los mtodos en anchura y e profundidad. A continuacin veremos varios de estos mtodos. o e
12 13

La ruta con la solucin en este algoritmo queda almacenada en la lista de nodos CAMINO. o Este aspecto se enfatiza si, tras cada expansin, los operadores aplicables se reordenan aleatoriamente. o

30

CAP ITULO 2. RESOLUCION DE PROBLEMAS

2.3.3.

Generacin y prueba o

El mtodo de generacin y prueba es un procedimiento de bsqueda en profundidad e o u casi puro, en el que deben recorrerse caminos completos antes de realizar ninguna comprobacin (lo que cambia, pues, es slo el lugar donde se realiza la prueba de meta, que o o se limita a responder armativa o negativamente acerca de la validez del camino generado). En su forma ms sistemtica, el mtodo de generacin y prueba es una bsqueda a a e o u exhaustiva en el espacio del problema (ver tabla 2.4, pgina 30). a
1. Generar una solucin posible o 2. Aplicarle la prueba de meta 3. Si es solucin, o parar sino volver a 1

Cuadro 2.4: Algoritmo de Bsqueda Mixta Generacin y Prueba. u o Si la generacin es sistemtica y exhaustiva, siempre encontraremos la solucin, si o a o existe. Sin embargo, si el dominio de prueba es muy amplio, la exploracin del espacio de o estados mediante este mtodo puede requerir demasiado tiempo. e Los procedimientos de bsqueda vistos hasta ahora tienen una caracter u stica comn: u forman parte de las denominadas bsquedas ciegas. Parte de los problemas que aparecen en u ellos pueden ser resueltos empleando las denominadas tcnicas heur e sticas de bsqueda, u que suelen mejorar la eciencia de los procesos de resolucin de problemas sacricano do la exhaustividad de la respuesta, dejando de considerar algunos caminos que parece improbable que conduzcan a la solucin. o Las estrategias de bsqueda informada tratan, pues, de optimizar los procesos de u bsqueda utilizando funciones heur u sticas que les permitan guiar la exploracin del E.E. o en la direccin ms provechosa, sugiriendo el mejor camino a seguir cuando se dispone o a de varias alternativas.

2.3.4.

Ascensin a colinas o

El procedimiento de ascensin a colinas es una variante del mtodo de profundidad en o e el que la seleccin del siguiente nodo a expandir se realiza de acuerdo con alguna medicin o o heur stica que permite estimar la distancia que queda por recorrer hasta la meta. En su forma ms sencilla, el algoritmo de ascensin a colinas se presenta en la tabla 2.5 (pgina a o a 31). A diferencia de la bsqueda en profundidad, con este algoritmo una rama no tiene u por qu ser explorada hasta agotarse, sino que el proceso de expansin terminar en el e o a momento en que se encuentra un nodo sucesor que no mejora el estado actual.

2.3. ESTRATEGIAS DE EXPLORACION DEL E.E.


1. Colocar el nodo inicial N en CAMINO 2. Aplicar el test de realizacin al nodo N; o Si es meta, salir 3. Repetir hasta encontrar un sucesor 3.1. Aplicar a N un operador no aplicado para generar un sucesor S 3.2. Si no hay ningn operador aplicable, u salir 3.3. En caso contrario, aplicar la funcin heurstica a S o 3.4. Si mejora la funcin heurstica del estado actual, o ir a 4 3.5. Si no, volver a 3.1 4. Continuar el proceso de bsqueda partiendo de S u

31

Cuadro 2.5: Algoritmo de Bsqueda Ascensin a colinas. u o Tambin se podr decir que el mtodo de ascensin a colinas es similar a generacin e a e o o y prueba, pero cuando se llega a una situacin en la que hay que hacer backtracking se o aplican varios operadores en el nodo predecesor, es decir, se abre una pequea componente n en anchura y se comprueba si alguno de los nodos generados es meta; si no lo es ninguno, se aplica una funcin heur o stica para continuar por alguno de ellos. Una variante util del mtodo de ascensin a colinas simple consiste en considerar todos e o los posibles movimientos a partir del estado actual y elegir el mejor de ellos como nuevo estado. Este mtodo se denomina ascensin por la mxima pendiente o b squeda e o a u del gradiente (ver tabla 2.6, pgina 32) y, contrasta con el mtodo bsico, en el que el a e a primer estado que parezca mejor que el actual se selecciona como siguiente. Tanto la ascensin a colinas bsica como la de mxima pendiente pueden no encontrar o a a una solucin si caen en un estado del que no es posible generar nuevos estados mejores que o l, pero que an no es solucin. Esto ocurre cuando el proceso de bsqueda se encuentra e u o u con un mximo local, una meseta o una cresta. Considerando el E.E. como una supercie a n-dimensional en la que cada punto est denido por los valores que denen ese estado y a su valor de la funcin heur o stica: Un mximo local es un estado puntual mejor que cualquiera de sus a vecinos pero peor que otros estados ms lejanos14 . Cuando estn prximos a a o a la solucin, los mximos locales se denominan estribaciones. o a Una meseta es un rea plana del espacio de estados en la que toos a
Llegados a uno, cualquier operacin o movimiento que hagamos nos llevar a un estado aparentemente o a peor, aunque en realidad no estemos aproximando a la solucin. o
14

32

CAP ITULO 2. RESOLUCION DE PROBLEMAS


1. Colocar el nodo inicial N en el CAMINO 2. Aplicar el test de realizacin a este nodo; o Si es meta, salir 3. Aplicar a N todos los operadores disponibles y generar todos sus sucesores Sj. 4. Si no hay ningn operador aplicable, u salir 5. En caso contrario, aplicar la funcin heurstica a todos los Sj o 6. Si la funcin heurstica de algn Sj mejora la del estado actual, o u llamar a Sj MEJORNODO e ir a 8 7. En caso contrario, salir 8. Continuar el proceso de bsqueda partiendo de MEJORNODO u

Cuadro 2.6: Algoritmo de Bsqueda Ascensin por mxima pendiente. u o a los estados individuales tienen un mismo valor de la funcin heur o stica, de suerte que no es posible determinar cul es la mejor direccin para a o continuar la bsqueda. u Una cresta es un tipo especial de mximo local, un rea del espacio de a a estados que tiene estados con mejores valores de la funcin heur o stica que los de regiones colindantes, y adems posee una inclinacin, pero la oriena o tacin de esta regin alta hace que sea imposible atravesarla mediante o o transiciones simples. Estos inconvenientes del mtodo tienen dif solucin. Como norma general, cuando e cil o aparece alguna de estas situaciones se pueden intentar las siguientes estrategias: regresar a un nodo previo e intentar una direccin diferente (mximos o a locales) realizar un gran salto en el espacio de bsqueda (mesetas) u aplicar ms de un operador antes de comparar de nuevo los valores de la a funcin heur o stica (crestas)

2.3.5.

B squeda por el mejor nodo: A u

Los mtodos de bsqueda por el mejor nodo combinan algunas de las ventajas de los e u mtodos en profundidad y en anchura. Bsicamente, se trata de organizar una bsquee a u da mixta profundidad-anchura guiada hacia el nodo ms prometedor por una funcin a o heur stica que se aplica a cada paso, con independencia de la rama del rbol a la que a pertenezca el nodo en cuestin. A esta familia de mtodos pertenecen el algoritmo A y o e

2.3. ESTRATEGIAS DE EXPLORACION DEL E.E. las Agendas que veremos a continuacin. o

33

El algoritmo A trata de expandir el nodo ms cercano a la meta, de entre los nodos a que se encuentran en las rutas menos costosas que parten del estado inicial. Para ello, utiliza una funcin de evaluacin f denida como o o f (n) = g(n) + h(n) donde g(n) es el coste de la ruta que va del nodo de partida al nodo actual n, calculada como la suma de los costes de cada una de las acciones individuales que se emprenden a lo largo de la ruta y h(n) es la funcin heur o stica, que proporciona una estimacin del o coste m nimo adicional de llegar desde el nodo actual n hasta el nodo meta. Ntese que o g no es una estimacin, se conoce exactamente su valor. o El algoritmo A utiliza un grafo dirigido para representar el E.E. En su implementacin, hace uso de las listas de nodos ABIERTOS y CERRADOS. Bsicamente se procede por o a pasos, expandiendo un nodo en cada paso hasta que se genere un nodo que corresponda a un estado meta. En cada paso, se toman los nodos ms prometedores que se han generado a hasta el momento, pero que no se han expandido (ABIERTOS). Se generan los sucesores del nodo elegido, se les aplica la funcin de evaluacin y se elige de nuevo el siguiente nodo o o a expandir. Cada nodo n en el grafo mantendr enlaces a todos sus sucesores, pero slo a o a un unico predecesor: aqul que se encuentre en el camino ptimo para llegar desde el e o nodo inicial hasta el estado n. El procedimiento Propagar Mejora(VIEJO) se utiliza para propagar la mejora obtenida sobre el coste del nodo apuntado por VIEJO. VIEJO apunta a sus sucesores. Cada sucesor, a su vez, apunta a sus sucesores, y as sucesivamente. Por tanto, para propagar el nuevo coste hacia abajo, podemos hacer una bsqueda en profundidad, empezando en u VIEJO, cambiando el valor g de cada nodo (y por tanto su valor f ). La propagacin tero mina cuando se alcanza o bien un nodo sin sucesores, o bien un nodo para el que ya se ha encontrado un camino equivalente o mejor15 . Es fcil examinar esta condicin: el enlace a o paterno de cada nodo apunta hacia atrs a su mejor predecesor conocido, de modo que a conforme propagamos a un nodo siguiente debemos mirar si su predecesor apunta al nodo del que estamos viniendo y, si lo hace, continuar, pero si no lo hace, entonces su valor g ya reeja el mejor camino del que forma parte as que la propagacin debe parar ah o . Claro que tambin es posible que al propagar un nuevo valor de g hacia abajo el camino e que estamos siguiendo se vuelva mejor para un nodo que el camino a travs del antecesor e actual. Por eso debemos comparar los dos y si el camino a travs del antecesor actual es e an mejor, detener tambin la propagacin, pero si el camino a travs del cual estamos u e o e propagando es mejor que el camino del antecesor actual debemos cambiar el antecesor y continuar la propagacin. o Es conveniente realizar algunas observaciones sobre el papel de las funciones g, h y f en
Esta segunda comprobacin garantiza que el algoritmo acabar aunque haya ciclos en el grafo. Si hay o a un ciclo, la segunda vez que visitemos un nodo veremos que el camino no es mejor que la primera vez que lo visitamos.
15

34

CAP ITULO 2. RESOLUCION DE PROBLEMAS


1. Poner el nodo inicial en ABIERTOS; asignarle g(n)=0 y el h(n) que corresponda; calcular f(n); inicializar CERRADOS a lista vaca 2. Si ABIERTOS est vaca, a informar del fallo y terminar 3. Elegir de ABIERTOS el nodo con mejor valor de f; llamarle MEJORNODO; quitarlo de ABIERTOS y meterlo en CERRADOS 4. Si MEJORNODO es meta, salir e informar de la solucin siguiendo o los enlaces que llevan del nodo meta al inicial 5. Expandir MEJORNODO generando todos sus sucesores Si no tiene sucesores, ir a 2 6. Para cada sucesor 6.1. Poner SUCESOR apuntando a MEJORNODO 6.2. Calcular g(SUCESOR)=g(MEJORNODO)+coste(MEJORNODO,SUCESOR) 6.3. Si SUCESOR est en ABIERTOS, a llamar a este nodo VIEJO; a~adir VIEJO a la lista de sucesores de MEJORNODO; n Si g(VIEJO)>g(SUCESOR), hacer que el enlace paterno de VIEJO apunte a MEJORNODO; hacer g(VIEJO)=g(SUCESOR); calcular f(VIEJO)=g(SUCESOR)+h(VIEJO); eliminar SUCESOR 6.4. Si SUCESOR est en CERRADOS, a llamar a este nodo VIEJO, a~adir VIEJO a la lista de sucesores de MEJORNODO; n Si g(VIEJO)>g(SUCESOR), hacer que el enlace paterno de VIEJO apunte a MEJORNODO; hacer g(VIEJO)=g(SUCESOR); calcular f(VIEJO)=g(SUCESOR)+h(VIEJO); eliminar SUCESOR; propagar el nuevo mejor coste realizando un recorrido en profundidad a partir de VIEJO /* Propagar_Mejora(VIEJO) */ 6.5. Si SUCESOR no est ni en ABIERTOS ni en CERRADOS, a calcular h(SUCESOR) y f(SUCESOR), introducirlo en ABIERTOS a~adirlo a la lista de sucesores de MEJORNODO n --------------------------------------------------------------------coste(MEJORNODO, SUCESOR)=coste de aplicar el operador que nos lleva de MEJORNODO a SUCESOR cuando SUCESOR existe en ABIERTOS, es que el nodo ya exista y lo que se hace es actualizarlo como hijo de MEJORNODO si g(VIEJO)>g(SUCESOR) debemos decidir si el nuevo padre que hemos encontrado para el nodo es mejor que el que tena, y si es as actualizar el coste y el enlace paterno, de modo que en el grafo queden slo caminos ptimos o o propagar el nuevo mejor coste es necesario cuando acabamos de encontrar un mejor camino a VIEJO (se propaga la mejora a todos sus sucesores)

Cuadro 2.7: Algoritmo de Bsqueda A . u

2.3. ESTRATEGIAS DE EXPLORACION DEL E.E.


1. Para cada SUCESOR Nj de VIEJO 1.1. Si el puntero al padre apunta a VIEJO, actualizar g(Nj)=g(VIEJO)+coste(VIEJO,Nj); actualizar f(Nj) 1.1.1. Si Nj est en CERRADOS, a Propagar_Mejora(Nj) 1.2. Si el puntero al padre no apunta a VIEJO, 1.2.1. Si g(VIEJO)<g(padre de Nj), poner como padre de Nj a VIEJO; g(Nj)=g(VIEJO)+coste(VIEJO,Nj) actualizar f(Nj) 1.2.1.1. Si Nj est en CERRADOS, a Propagar_Mejora(N_j)

35

Cuadro 2.8: Algoritmo Propagar Mejora(VIEJO). el algoritmo A . La funcin g nos permite escoger el nodo a expandir sobre la base, no slo o o de cun bueno es el nodo en s mismo (medido por h), sino tambin sobre la base de cun a e a bueno era el camino hasta el nodo. Al incorporar g en f , por tanto, no siempre elegiremos como nuestro siguiente nodo a expadir el nodo que parece ms cercano a la meta. Esto es a util si nos interesa minimizar el coste del camino solucin, por ejemplo. Pero si slo nos o o importa llegar a una solucin de la forma que sea, podemos denir siempre g como 0. Si o queremos encontrar un camino que tenga el menor nmero de pasos, entonces debemos u asignar una constante, usualmente 1, al coste de ir desde un nodo a su sucesor. Si, por otra parte, queremos encontrar el camino de menor coste y unos operadores cuestan ms a que otros, el coste de ir de un nodo a otro tendr que reejar los costes de los operadores. a As pues, el algoritmo A puede usarse tanto si estamos interesados en encontrar un camino de coste total m nimo, como si simplemente queremos encontrar cualquier camino de la forma ms rpida posible. a a En cuanto a h, si es un estimador perfecto del coste del camino hasta la meta, entonces A converger inmediatamente hacia la meta sin bsqueda. Si h siempre es 0, la bsqueda a u u estar controlada por g. si g tambin es 0, la estrategia de bsqueda se realizar al azar. a e u a Si g siempre es 1, se realizar una bsqueda en anchura. a u El algoritmo A es completo y admisible. Es completo porque siempre acaba encontrando un camino solucin, si existe. Es admisible porque para cualquier grafo, termina o siempre obteniendo un camino ptimo desde un estado inicial hasta un estado meta, con o tal de que exista alguno de estos caminos. Se puede demostrar que el algoritmo A es admisible siempre que la funcin heur o stica lo sea, es decir, que raramente encontrar una a solucin cuyo coste sea mayor que el de la solucin ptima si la estimacin de la funcin o o o o o heur stica sobreestima el verdadero coste del camino slo en . o Por ultimo, es importante resaltar que el algoritmo A no tiene por qu resultar ade e cuado para cualquier problema de bsqueda y su utilidad se deber evaluar dentro del u a contexto de cada problema. Por ejemplo, en un caso en el que interesase el camino que que-

36

CAP ITULO 2. RESOLUCION DE PROBLEMAS

da por recorrer, ser ms adecuado un algoritmo como el de ascensin a colinas que, ms a a o a que realizar la bsqueda global de forma efectiva, escoge bien entre los estados sucesores u del nodo actual.

2.3.6.

B squeda por el mejor nodo: Agendas u

Hasta ahora se ha asumido que el hecho de que varios caminos lleven de modo independiente al mismo estado no refuerza el mrito de ese estado. Sin embargo, esto no siempre e se cumple: existen situaciones en las que no existe una unica y simple funcin heur o stica que mida la distancia entre un nodo dado y un objetivo. Adems, el que distintos caminos a recomienden el cambio a un mismo estado mediante la realizacin de una tarea, puede o ser importante si cada uno de ellos proporciona una razn de por qu ese estado puede o e conducir a resolver el problema. Cuantas ms razones haya, aumenta la posibilidad de a que la tarea lleve a la solucin. En estos casos, es necesaria alguna estructura que nos o permita almacenar las tareas propuestas, junto a las razones que se han propuesto para ellas, y algn mecanismo que nos permita gestionar este conjunto. u Las agendas son, bsicamente, listas de tareas que puede (o debe) realizar un sistema. a Cada una de las tareas de la agenda suele llevar asociada una lista de razones por las cuales se presume que acometer esa tarea es conveniente (que sern utilizadas para elaborar a justicaciones y explicar procesos), y un valor que representa el peso total de la evidencia que sugiere que la tarea es util (as una agenda puede considerarse como un conjunto de , 16 tareas organizadas por pesos prioridades). El mtodo de b squeda conducido por agendas es un procedimiento por el mejor e u nodo en el que debe elegirse la mejor tarea de la agneda y ejecutarse, asignando para ello los recusos necesarios. El trmino tarea puede tener distintos signicados: puede entenderse e como una descripcin expl o cita de lo que debe hacerse a continuacin o simplemente ser o una mera indicacin acerca de cul debe ser el siguiente nodo a expandir. Por otra parte, o a una misma tarea puede llevar asociadas distintas justicaciones, y no todas ellas han de pesar lo mismo. Este mtodo, sin embargo, provoca el gasto de una gran cantidad de tiempo en mane tener ordenada la agenda, de modo que en la prctica se utiliza una estrategia modicada a que compara los nuevos valores de las tareas slo con algunos elementos superiores de o la agenda (entre cinco y diez, normalmente) y si es mejor se inserta el nodo en su lugar adecuado en cabeza de la lista y si no se deja donde estaba o simplemente se inserta al nal de la agenda (de vez en cuando se recorre la agenda y se reordena). Esta estrategia puede hacer que se ejecute ocasionalmente una tarea que no sea la mejor, pero su coste es signicativamente menor que el del algoritmo original. Existen algunos dominios de problemas en los que no es apropiado utilizar un mecanismo de agenda, por ejemplo, en sistemas de razonamiento no montono en los que las o razones y justicaciones que apoyan en un momento dado una tarea pueden no mantenerse un tiempo despus. e
Este orden permitir adems, la insercin ordenada de nuevas tareas; si las justicaciones de una a, a o tarea cambian, el peso debe ser recalculado y puede que tenga que ser trasladada a una nueva localizacin o en la lista.
16

2.3. ESTRATEGIAS DE EXPLORACION DEL E.E.

37

Hasta que se alcance un estado objetivo o la agenda est vaca hacer: e 1. Identificar la mejor tarea de la agenda (MEJORNODO) 2. Ejecutarla 3. Si se han generado nuvas tareas, para cada una de ellas 3.1. Si no estaba ya en la agenda, a~adirla a la lista n 3.2. Si ya estaba en la agenda, si no tiene la misma justificacin, o a~adir la nueva justificacin n o 4. Si se ha a~adido una tarea o una justificacin, n o calcular el peso asignado a estas tareas combinando la evidencia de todas sus justificaciones y recomponer la agenda

Cuadro 2.9: Algoritmo de Bsqueda conducida mediante Agenda. u

38

CAP ITULO 2. RESOLUCION DE PROBLEMAS

Cap tulo 3 Representaciones Formales del Conocimiento


Resulta evidente que si un programa de IA debe explotar ecazmente un conjunto determinado de conocimientos de un dominio concreto, al menos parte de la potencia de dicho programa vendr determinada por la ecacia y la consistencia del esquema que a hayamos elegido para representar el conocimiento.

3.1.

Aspectos Generales de la Representacin o del Conocimiento

En cualquier dominio de aplicacin nos encontraremos siempre dos tipos de entidades o diferentes: hechos o verdades del dominio y representaciones de los hechos1 Para manipular computacionalmente hechos necesitamos denir un conjunto de procedimientos que los conviertan en representaciones. Una vez ejecutado nuestro programa de IA, necesitamos nuevos procedimientos que conviertan las representaciones internas en hechos comprensibles para nosotros. Este proceso congura lo que se denomina fase de codicacin-decodicacin 2 . o o Cualquier procedimiento para representar conocimiento tiene que reunir un conjunto m nimo de condiciones: Transparencia Concepto que hace referencia a si podemos o no identicar fcilmente el conocimiento representado. a
Las estructuras internas que manipulan los programas de IA y que se corresponden con las verdades del dominio. 2 En ambas se va a producir una inevitable prdida de informacin. e o
1

39

40

CAP ITULO 3. REPRESENTACIONES DEL CONOCIMIENTO

Figura 3.1: Ciclo bsico de codicacin-decodicacin. a o o Naturalidad Signica si podemos o no representar el conocimiento en su forma original. Claridad Referencia si podemos o no representar directamente el conocimiento. Eciencia O facilidad relativa con la que se puede acceder a conocimientos espec cos durante la ejecucin. o Adecuacin O capacidad del esquema de representacin para representar o o todos los conocimientos y tipos de conocimiento que requiere el sistema. Modularidad O capacidad del esquema de representacin para fragmentar o 3 los distintos tipos de conocimiento del sistema. Un aspecto importante a tener en cuenta es la exibilidad con la que podemos manejar el conocimiento. Como regla general, cuanto mayor sea el nivel del conocimiento barajado, menor ser su exibilidad: el conocimiento de alto nivel es potente pero muy a poco exible, mientras que el conocimiento de bajo nivel des exible pero poco potente. Los esquemas de representacin del conocimiento existentes pueden clasicarse en las o siguientes categor as:
El conocimiento involucrado en los distintos procesos de razonamiento puede estar detallado de muy diversas formas: hablamos de principios primarios o bloques de construccin bsicos sobre los que se o a basa el dominio en cuestin y a partir de los que deben poder ser desarrollados otros principios ms o a espec cos, nuevos teoremas y reglas de accin, base a su vez para derivar conocimientos adicionales. o
3

3.2. LOGICA DE PROPOSICIONES Y LOGICA DE PREDICADOS Mtodos Declarativos, hacen nfasis en la representacin del conocimiene e o to como una acumulacin o coleccin de hechos estticos a los que se o o a aade cierta informacin limitada que describe cmo se va a emplear el n o o mencionado conocimiento, esto es, para cuya manipulacin se dene un o conjunto genrico y restringido de procedimientos. Presentan la ventaja e de que las verdades del dominio se almacenan una sola vez y es fcil ina crementar e incorporar nuevo conocimiento sin modicar ni alterar el ya existente. Mtodos Procedimentales, que enfatizan la representacin del conocie o miento en forma de estructuras dinmicas (procedimientos, en los que la a representacin de los hechos va impl o cita) que describen procedimienos de utilizacin de los conocimientos. Sus ventajas son, por ejemplo, que al o dar prioridad a los procedimientos sehace mayor nfasis en las capacidae des inferenciales del sistema, que permiten explorar distintos modelos y tcnicas de razonamiento, que permiten trabajar con falta de informacin e o y con datos de carcter probabil a stico y que incorporan de forma natural conocimiento de tipo heur stico.

41

En realidad, los problemas interesantes de IA suelen requerir distintas proporciones de ambas losof en la representacin del conocimiento del dominio. as o

3.2.

Lgica de Proposiciones y Lgica de Predicados o o

La lgica de proposiciones y la lgica de predicados suelen englobarse en lo que o o denominamos lgica formal. Como esquema de representacin del conocimiento, la lgio o o ca formal permite derivar conocimiento4 a partir de conocimiento ya existente a travs e de procesos deductivos, esto es, permite armar que una aseveracin es cierta si puede o deducirse a partir de otras que se sabe que son ciertas. La ms sencilla de las lgicas formales es la lgica de proposiciones, en la que los hechos a o o del mundo real se representan como proposiciones lgicas (frmulas bien denidas, FBD, o o o frmulas bien formadas, FBF), por ejemplo: Scrates es un hombre se denotar o o a socrateshombre y Aristteles es un hombre ser aristoteleshombre. Est claro o a a que la lgica de proposiciones presenta varios problemas, como la representacin ecaz o o de varios ejemplos de una misma entidad y la cuanticacin, no es una representacin o o verstil. a Surge la necesidad, pues, desde la ptica formal, de utilizar la lgica de predicados, o o 5 que representa el conocimiento como declaraciones lgicas que son FBF o FBD. As el o , ejemplo anterior se convierte en hombre(socrates). Los componentes bsicos de un esquema de representacin del conocimiento basado a o en lgica de predicados son: o
Aunque no es nuevo conocimiento, sino slo conocimiento que no estaba representado, explicitado. o Distincin proposicin-declaracin: una declaracin es una proposicin que permite cuanticacin o o o o o o o ejemplicacin. o
5 4

42 Alfabeto

CAP ITULO 3. REPRESENTACIONES DEL CONOCIMIENTO

Lenguaje formal Conjunto de enunciados bsicos o axiomas a Reglas inferenciales Los axiomas describen fragmentos de conocimiento y las reglas inferenciales se aplican a los axiomas para tratar de deducir nuevos enunciados verdaderos.

3.2.1.

Alfabeto

En cualquier lenguaje formal, el alfabeto es el conjunto de s mbolos a partir de los que se construyen los enunciados. En lgica de predicados el alfabeto est constituido por: o a Predicados, representan relaciones en el dominio de discurso y pueden tomar dos valores: verdadero o falso. Un predicado es verdadero si los elementos involucrados verican la relacin especicada. Los predicados y o los trminos que identican los elementos relacionados se utilizan para dee nir las frmulas atmicas o tomos (unidades estructurales m o o a nimas que se pueden denir), por ejemplo: hombre(juan), masalto(juan,pepe) o masalto(juan,padre(pepe)). Variables, conjuntos de constantes. Funciones, describen elementos y los identican como resultado unico de la aplicacin de una transformacin entre otros elementos del dominio, o o por ejemplo: padre(juan), madre(padre(juan)) o asesino(x). Constantes, representan elementos espec cos del dominio de discurso. Juntores, elementos gramaticales del lenguaje que permiten representar declaraciones compuestas: AND, hace que para que una FBD sea cierta todos y cada uno de los componentes relacionados tengan que serlo. OR, hace que si al menos uno de los componentes relacionados es cierto, la FBD correspondiente lo sea. NOT 6 , cambia el estado lgico deuna expresin. o o , establece relaciones de implicacin entre expresiones, siendo la o construccin A B equivalente a not A or B. o =, indica la equivalencia lgica entre dos FBD. o Cuanticadores, elementos que resuelven uno de los problemas mencionados en la lgica de proposiciones: o
En realidad, el not es un operador lgico, no un juntor. La diferencia entre ambos estriba en que o un operador lgico slo cambia la entrada, no establece una relacin, funciona como un modicador, o o o mientras que un juntor relaciona dos elementos a travs de un operador lgico. e o
6

3.2. LOGICA DE PROPOSICIONES Y LOGICA DE PREDICADOS Universal x, establece que la FBD es cierta para todos los valores que puede tomar x. Existencial x, establece que existe al menos un x que hace verdadera la FBD. En ambos casos la variable genrica x asociada al cuanticador se denoe mina variable cuanticada, mientras que el alcance del cuanticador es la FBD que le sigue. Delimitadores, elementos como , y (), necesarios para obtener representaciones correctas del conocimiento.

43

Con predicados, variables, funciones y constantes pueden construirse frmulas atmio o cas susceptibles de una adecuada representacin. Juntores, cuanticadores y delimitadores o aportan la semntica necesaria para dotar de signicado al conjunto espec a co de s mbolos denidos en el dominio y establecer su correspondencia en el universo de los hechos.

3.2.2.

Lenguaje formal

El lenguaje formal asociado a la lgica de predicados es el conjunto de tods las FBD o 7 que se pueden construir legalmente a partir del alfabeto. Se puede denir inductivamente una FBD del siguiente modo: Cualquier frmula atmica es FBD. o o Si F y G son FBD, entonces tambin lo son not F, F and G, F or G e y FG. Si x es una variable y F es una FBD, entonces tambin son FBD (x)F e y (x)F . El conjunto de FBD que seamos capaces de construir sobre un dominio concreto constituye el lenguaje formal asociado. Existen, sin embargo, expresiones sencillas que, de acuerdo con la denicin anterior, o no pueden ser consideradas FBD, como por ejemplo not f(A), (P )P (A) o (f )f (A). Estas expresiones no son FBD en lgica de predicados. Las lgicas que no permiten cuano o ticacin sobre predicados o funciones se denominan lgicas de primer orden. o o

3.2.3.

Reglas de inferencia

La inferencia en lgica formal es el proceso de ejemplicacin que permite generar o o nuevas FBD a partir de FBD ya existentes, mediante la aplicacin de las llamadas reglas o de inferencia. De tales reglas, la ms comn es la llamada modus ponens que se puede a u expresar: [P 1 and (P 1 P 2)] P 2
7

Reejando elmente el dominio que se quiere representar, de acuerdo con su estructura.

44

CAP ITULO 3. REPRESENTACIONES DEL CONOCIMIENTO

que no es sino la formalizacin del razonamiento deductivo. Otra regla de inferencia o comn es la especializacin universal : u o individuo and (x)[f (x)] f (individuo) Adems de estas dos reglas bsicas de inferencia existen otras, como la sustitucin, el a a o modus tollens, etc., todas ellas capaces de generar nuevas FBD a partir de FBD ya existentes. Con estas reglas, con tal de que los axiomas construidos sean vlidos, la inferencia a sintctica es siempre posible. Desgraciadamente, que una inferencia sea posible no quiere a decir que el resultado tenga o no el menor inters. Por el contrario, en lgica formal es e o muy comn que las inferencias realizadas conduzcan a informacin absolutamente irreleu o vante y, adems, no se nos asegura la obtencin de nueva informacin util en un tiempo a o o prudencial.

3.3.

Ingenier del Conocimiento y Lgica Formal a o

Una de las tareas de la Ingenier del Conocimiento es estructurar y codicar a conocimiento para que ste sea utilizado de forma eciente por un programa de IA. Veree mos a continuacin algunas de sus caracter o sticas fundamentales en relacin con la lgica o o formal. Cuando empleamos un esquema de representacin del conocimiento basado en lgica o o formal, el proceso bsico de ingenier del conocimiento consta de las siguientes fases que a a constituyen una metodolog de diseo y desarrollo: a n 1. Identicacin: Comprensin e identicacin del conocimiento relevante o o o del dominio. 2. Formalizacin: Formalizacin de los enunciados correspondientes. o o 3. Descomposicin: Anlisis o fragmentacin de los enunciados en sus partes o a o constituyentes. 4. Traduccin: Establecimiento de la simbolog adecuada para representar o a elementos y relaciones. 5. Recomposicin: Construccin de las FBD. o o Estos cinco pasos conguran la base de codicacin mediante la cual pretendemos o obtener representaciones del conocimiento del dominio manejables desde una perspectiva computacional8 . Podemos ver un ejemplo en la tabla 3.1 (pgina 45). a En este proceso, aparecen frecuentemente problemas de interpretacin, ante los que o debemos adoptar una postura desde la cual nos interesa siempre encontrar estructuras lo ms simtricas posibles. Las transformaciones usualmente provocarn la prdida de maa e a e tices: en ocasiones ser una prdida aceptable, pero las expresiones correspondientes no a e
Puesto que, como sabemos, necesitamos que la informacin est preprocesada para usarla en IA; no o e todo el conocimiento de un dominio ser relevante, ni ser siempre el mismo. a a
8

3.3. INGENIER DEL CONOCIMIENTO Y LOGICA FORMAL IA


Declaracin: "Mil es un perro foxterrier blanco" o u (1) Descomposicin: Mil es un perro o u Mil es un foxterrier u Mil es blanco u (2) Traduccin: perro(Mil) o u foxterrier(Mil) u blanco(Mil) u (3) Recomposicin: perro(Mil) and foxterrier(Mil) and blanco(Mil) o u u u

45

Cuadro 3.1: Ejemplo de codicacin de una expresin. o o podrn ser consideradas equivalentes. Se plantearn cuestiones como: podemos prescina a dir de elementos de la frase original y sin embargo obtener una FBD apropiada? qu es e lo verdaderamente informativo? podemos eliminar tiempos verbales, sujetos en tercera persona, primera? podemos asumir relaciones causa-efecto no evidentes como implicaciones? podemos perder matices cuantitativos? En la mayor de los casos, depender del a a contexto: la misma informacin en distintos contextos puede ser considerada de diferente o manera. Al margen de problemas de interpretacin intr o nsecamente asociados a la semntica, a existen otros problemas derivados de la interpretacin de frases en su contexto. Por ejemo plo, consideremos las dos siguientes frases: A todo el mundo le gusta el arte o el deporte y En los EE.UU. todos son o republicanos o demcratas. Ambas son estructuralmeno te idnticas pero presentan importantes diferencias conceptuales debidas a cuestiones de e contexto. Su traduccin debe efectuarse teniendo en cuenta (y especicando) la naturaleza o del juntor or:

OR exclusivo: (Vx)[persona(x) -> gusta_arte(x) or gusta_deporte(x) or [gusta_arte(x) and gusta_deporte(x)]] (Vx)[estadounidense(x) -> republicano(x) or democrata(x) OR inclusivo: (Vx)[persona(x) -> gusta_arte(x) or gusta_deporte(x)] (Vx)[estadounidense(x) -> republicano(x) or democrata(x) and not [republicano(x) and democrata(x)]]

Dependiendo de las fases de identicacin y formalizacin, a la hora de codicar coo o nocimiento en lgica formal deberemos decidir qu carcter le queremos dar al juntor or o e a para obtener las mejores representaciones en el dominio. Lo que est claro es que, en una a

46

CAP ITULO 3. REPRESENTACIONES DEL CONOCIMIENTO

misma aplicacin, no se pueden mezclar juntores or de distinta naturaleza9 . o Empero, siempre deberemos ser capaces de encontrar una traduccin en lenguaje foro mal satisfactoria para un determinado enunciado en lenguaje natural. En la fase de decodicacin se hace uso de la semntica para interpretar los enuno a ciados de las correspondientes FBD. Igual que la codicacin, la decodicacin suele ir o o siempre acompaada de cierta imprecisin, ambigedad o inexactitud. Los esfuerzos deben n o u dirigirse hacia la minimizacin de la imprecisin asociada a los lenguajes formales. o o

3.4.

Evaluacin y Resolucin en Lgica Formal o o o

Hemos visto que la lgica formal permite derivar declaraciones nuevas, y ciertas, a o partir de un conjunto de axiomas o principios bsicos (las verdades en nuestro dominio de a discurso). En cualquier caso, la verdad de una declaracin est relacionada con el proceso o a de interpretacin. En lgica de proposiciones la verdad de una proposicin compleja puede o o o determinarse a partir de los valores de la tabla 3.2 (pgina 46). a x y s s s no no no no s x and y s no no no x or y s s no s x ->y s no s s not x no no s s x=y s no s no

Cuadro 3.2: Tabla de Verdad. En lgica formal, la determinacin de la verdad de una frmula compleja supone la reo o o duccin sucesiva de la declaracin, desde dentro hacia afuera, utilizando convenientemente o o la tabla de verdad. Este procedimiento de evaluacin es muy sensible a la dicultad de o los dominios, y se complica enormemente an en dominios relativamente sencillos, aunque u con frecuencia ello es debido a deciencias en la fase de codicacin, donde la ambigedad o u del lenguaje natural, la multitud de representaciones ms o menos equivalentes y la caa rencia de sentido comn conducen muchas veces a callejones sin salida. u El mtodo propuesto para evaluar expresiones no es muy operativo computacionale mente, ya que nos obliga a realizar diversas sustituciones. Lo ideal ser disponer de un a procedimiento de demostracin que llevase a cabo, en una unica operacin, la variedad o o de procesos involucrados en un razonamiento basado en declaraciones de la lgica formal. o Surgen as los procedimientos de resolucin, que operan sobre declaraciones previa o mente normalizadas. La resolucin obtiene demostraciones por medio de la denominada refutacin, prueo o ba consistente en tratar de encontrar que la negacin de una declaracin produce una o o contradiccin axiomtica. Este enfoque es radicalmente diferente a la tcnica hasta ahora o a e empleada de demostracin hacia atrs (desde los teoremas hasta los axiomas). o a
9

Al menos denominndolos con el mismo s a mbolo.

3.4. EVALUACION Y RESOLUCION EN LOGICA FORMAL

47

De todas formas, antes de aplicar la resolucin por refutacin hemos de tener todo o o nuestro conocimiento estructuralmente normalizado. Para ello, trataremos de construir la denominada forma normalizada conjuntiva de Davis que, en esencia, trata de simplicar las FBD y separar los cuanticadores del resto de la frmula. El procedimiento para o obtenerla es: 1. Eliminar las implicaciones. 2. Reducir el nmero de negaciones. u 3. Normalizar las variables para que cada cuanticador est ligado a una e unica variable. 4. Obtener la frmula normalizada prenex, constituida por un prejo de o cuanticadores seguido por una matriz libre de cuanticadores. 5. Eliminar los cuanticadores existenciales. 6. Abandonar el prejo. 7. Convertir la matriz en una conjuncin de disyunciones. o 8. Identicar las clusulas. a 9. Normalizar las variables por separado en el conjunto de clusulas genea radas en el paso anterior. Para realizar las transformaciones necesarias para obtener la forma normalizada conjuntiva de Davis es util considerar las equivalencias de la tabla 3.3 (pgina 47). a P1 P2 not P 1 or P 2 P 1 or (P 2 and P 3) (P 1 or P 2) and (P 1 or P 3) P 1 and (P 2 or P 3) (P 1 and P 2) or (P 1 and P 3) P1 P2 not P 2 not P 1 not (not P 1) P1 not (P 1 or P 2) not P 1 and not P 2 not (P 1 and P 2) not P 1 or not P 2 not xP (x) x not P (x) not xP (x) x not P (x) P 1 or F also P1 P 1 or V erdadero V erdadero P 1 and F also F also P 1 and V erdadero P1 P 1 or not P 1 V erdadero P 1 and not P 1 F also Cuadro 3.3: Tabla de Equivalencias. La eliminacin de cuanticadores existenciales es posible ya que debe existir al meo nos un valor que pueda sustituir a la variable cuanticada existencialmente, y que haga verdadera la frmula. As podemos eliminar el cuanticador sustituyendo la variable por o ,

48

CAP ITULO 3. REPRESENTACIONES DEL CONOCIMIENTO

una referencia a una funcin que genere el valor deseado. Dado que no siempre conocemos o el valor que hace verdadera la frmula, debemos crear un nuevo nombre de funcin para o o cada sustitucin. De este modo no hacemos ninguna armacin sobre tales funciones y o o slo indicamos que deben existir. Por ejemplo: o (y)presidente(y) = presidente(S1) (x)(y)padre(y, x) = (x)padre(S2(x), x) Tales funciones se denominan funciones de Skolem si tienen argumentos y constantes de Skolem si no los tienen. Una vez conseguida una frmula prenex en la que los unicos cuanticadores sean o universales, puede prescindirse del prejo sin que por ello la declaracin se vea afectada. o Para convertir la matriz resultante en una conjuncin de disyunciones tendremos que o emplear las propiedades asociativa y distributiva: P 1 or (P 2 or P 3) = (P 1 or P 2) or P 3 (P 1 and P 2) or P 3 = (P 1 or P 3) and (P 2 or P 3) Una vez obtenidas e identicadas las clusulas correspondientes, la normalizacin de a o variables por separado supone renombrar las variables de forma que no haya dos clusulas a que hagan referencia a la misma variable. El resultado nal es una disyuncin de literales. o Obtenida la forma normalizada conjuntiva de Davis, el mtodo de resolucin por ree o futacin no es ms que un proceso iterativo simple en el que, en cada paso, se resuelven o a dos clusulas llamadas clusulas padres producindose una nueva clusula inferida10 . El a a e a proceso contina hasta que encontremos una clusula vac (indicativa de una contradicu a a cin) o bien no se pueda seguir. El hecho de llegar a una contradiccin partiendo de un o o conjunto de axiomas ciertos a los que se ha incorporado la negacin de la hiptesis que o o queremos vericar, es indicativo de que la hiptesis debe ser cierta. o

3.5.

Introduccin a otras Lgicas o o

Las lgicas formales de primer orden son utiles para encarar problemas en una amplia o variedad de dominios. Sin embargo, hay multitud de campos interesantes en los que, simplemente, los esquemas de representacin del conocimiento basados en lgica formal de o o primer orden son totalmente inadecuados, como por ejemplo en casos en los que la informacin contiene grados relativos de magnitudes, es incierta o imprecisa, posee heur o sticas amplias, etc. Para tratar de resolver este tipo de problemas han sido propuestos diversos enfoques, entre los que cabe considerar: Lgicas no montonas o o Razonamiento probabil stico
Dicho coloquialmente, buscaremos pares de proposiones (P, P ) en la disyuncin de literales nal o con el propsito de irlos descartando. o
10

3.5. INTRODUCCION A OTRAS LOGICAS Lgica difusa o Modelos de credibilidad o modelos cuasiestad sticos Razonamiento por concepto Tratamiento de incertidumbre

49

Por ejemplo, la lgica no montona permite la eliminacin del conocimiento. De este o o o modo, la verosimilitud de una armacin puede estar basada en la falta de conanza en o alguna otra armacin. o Los sistemas tradicionales basados en lgica formal son montonos en el sentido de o o que el nmero de declaraciones verdaderas se incrementa estrictamente en el transcurso u de los procesos inferenciales (otra cosa es que esa nueva informacin resulte util). Pueden o aadirse nuevas declaraciones al sistema y demostrarse nuevas relaciones, y ello nunca n invalidar una declaracin demostrada o conocida previamente. Esto hace que cuando se a o aade una nueva declaracin no sea necesario realizar ningn anlisis de consistencia y n o u a que, dada una declaracin que acaba de ser demostrada, no sea necesario recordar las o declaraciones en las que se ha basado dicha demostracin, ya que no hay riesgo de que o desaparezcan. Desgraciadamente, lo sistemas montonos tienen problemas cuando trabajan con ino formacin incompleta, entornos cambiantes y generacin de supuestos, situaciones todas o o ellas t picas de problemas del mundo real. Los sistemas no montonos basan su estrategia en el hecho de que, normalmente, nunca o se dispone de toda la informacin que es util para resolver un problema. Sin embargo, o cuando dicha informacin falta, siempre pueden hacerse suposiciones sensatas mientras o no se presente ninguna evidencia contradictoria. La construccin de tales suposiciones origina lo que se denomina razonamiento por o defecto, que es un caso particular de lgica no montona. Su no-monotonicidad proviene o o del hecho de que la conclusin de una evidencia nueva puede forzar la eliminacin de o o conocimiento hasta entonces considerado cierto o vlido. a

50

CAP ITULO 3. REPRESENTACIONES DEL CONOCIMIENTO

Cap tulo 4 Mtodos Estructurados de e Representacin del Conocimiento o


La lgica formal permite la utilizacin de procedimientos de resolucin que posibilitan o o o el razonamiento con hechos. Sin embargo, los objetos del universo real tienen propiedades y se relacionan con otros objetos. As ser util disponer de estructuras de representacin , a o que permitiesen, por una parte, agrupar propiedades, y por otra, obtener descripciones unicas de objetos complejos. Por otra parte, los objetos no son las unicas entidades es tructuradas del universo, tambin ser muy util poder representar ecazmente escenarios e a y secuencias t picas de acontecimientos. Para tratar de dar respuesta a tales cuestiones, en IA se utilizan esquemas no formales de representacin del conocimiento1 . Estos esquemas son fundamentalmente o mtodos estructurados de representacin, y tienen que vericar las siguientes propiedades: e o Adecuacin representacional El esquema elegido debe ser capaz de repreo sentar las distintas clases de conocimiento del dominio. Adecuacin inferencial El esquema elegido debe permitir la manipulacin o o del conocimiento para obtener conocimiento nuevo. Eciencia inferencial El esquema debe ser verstil utilizando aquella infora macin que permita optimizar el proceso inferencial. o Eciencia adquisicional El esquema debe suministrar v que permitan la as incorporacin de informacin y conocimiento nuevos, es decir, debe ser o o fcilmente actualizable segn aumenta el conocimiento del dominio. a u Independientemente del esquema de representacin elegido, es muy util considerar una o serie de elementos que nos permiten establecer relaciones entre distintas estructuras de conocimiento. Tales elementos son: as a es un (is a): que permite establecer relaciones entre taxonom jerrquicas.
Que tambin pueden clasicarse como esquemas declarativos o procedimentales ver seccin 3.1, e o pgina 41. a
1

51

52

CAP ITULO 4. METODOS DE REPRESENTACION DEL CONOCIMIENTO es parte de (part of): que permite establecer relaciones entre objetos y componentes de un objeto.

Una propiedad importante de ambas relaciones es la de transitividad, que est vinculaa da al razonamiento deductivo. Adems, la transitividad de la relacin es un nos permite a o establecer un mtodo para la obtencin de propiedades de los objetos relacionados, lo que e o congura un proceso de herencia de propiedades mediante el cual, si un objeto pertenece a una determinada clase, a travs de la relacin es un dicho objeto hereda las propiedades e o de la clase. Desde una perspectiva formal podemos denir una correspondencia entre ambas relaciones y la lgica de predicados, donde hombre(marco) se convierte en es un(marco, o hombre). Los mtodos declarativos que estudiaremos en este cap e tulo sern: a Redes semnticas, que permiten describir simultneamente acontecimiena a tos y objetos. Modelos de dependencia conceptual, estructuras especializadas que proporcionan mecanismos para representar relaciones entre los componentes de una accin. o Frames, estructuras genricas que permiten representar objetos complejos e desde diferentes puntos de vista. Guiones, estructuras especializadas, que derivan de las frames y que son utiles para representar secuencias comunes de acontecimientos.

Aunque bsicamente diferentes, estas cuatro estructuras de representacin comparten a o ciertos elementos: en todos ellos las entidades complejas pueden describirse como una coleccin de atributos y unos valores asociados (estructuras slot-and-ller ). o Tambin haremos en este cap e tulo una breve descripcin del paradigma de Orientacin o o a Objetos como esquema alternativo y potente de representacin jerrquica de objetos y o a clases que comparten propiedades. El mtodo procedimental que estudiaremos ser el de las Reglas de Produccin. e a o

4.1.

Redes Semnticas a

Las redes semnticas son estructuras declarativas de representacin en las que el a o conocimiento se representa como un conjunto de nodos conectados entre s por medio de arcos etiquetados que representan relaciones ling usticas entre nodos. En las redes semnticas cada propiedad incluye un enlace unidireccional. Para estaa blecer enlaces bidireccionales hay que tratar cada relacin por separado (como dos enlaces o unidireccionales). Un enlace puede ser considerado como algo que aseveramos de un nodo en relacin a otro. Puesto que una aseveracin dada slo puede ser cierta o falsa, un o o o enlace es una relacin binaria entre nodos. o

4.1. REDES SEMANTICAS

53

Figura 4.1: Una red semntica sencilla. a Dos de las relaciones binarias ms corrientes en las redes semnticas son las relaciones a a ya mencionadas es un y es parte de. En este contexto, la relacin es un se emplea o para establecer el hecho de que un elemento dado es miembro de una clase de elementos que tienen en comn un conjunto de propiedades distinguibles, aunque tambin puede u e emplearse para representar situaciones, acciones y eventos. Las relaciones ms frecuentes en redes semnticas pueden clasicarse en una de las a a siguientes categor as: Ocurrencia: cuando se relaciona un miembro de una categor general con a la categor a la que pertenece (se suele etiquetar pertenece). a Generalizacin: cuando se relaciona una entidad con otra de carcter ms o a a general (es un ejemplicacin). o Agregacin: cuando se relacionan componentes de un objeto con el objeto o propiamente dicho (es parte de). Accin: cuando se establecen v o nculos dinmicos entre diferentes objetos. a Propiedades: que son relaciones entre objetos y caracter sticas de los objetos. Desde una perspectiva computacional, la implementacin de una red semntica requieo a re la construccin de una tabla de n tuplas del tipo objeto-atributo-valor de forma o que el objeto sea el nodo padre, el atributo sea el arco y el valor sea el nodo destino. Tambin existe una correspondencia directa entre las redes semnticas y la lgica formal, e a o donde los predicados tendr un aspecto atributo(objeto,valor). an En redes semnticas, la herencia de propiedades nos dice que cualquier propiedad que a consideremos cierta para una clase de elementos debe ser cierta para cualquier ejemplo de la clase. Este concepto hace que las redes semnticas sean particularmente interesantes a para representar dominios que se puedan estructurar como taxonom as.

54

CAP ITULO 4. METODOS DE REPRESENTACION DEL CONOCIMIENTO

En cuanto a la forma de razonar con redes semnticas, el modelo permite obtener asoa ciaciones simplemente rastreando los enlaces del sistema, sin que ninguna regla semntica a rigurosa gu el proceso. Esto hace que, mientras que en un sistema de lgica formal, e o dado que las inferencias se realizan sobre la base de manejos sintcticos uniformes de a s mbolos, stas sean siempre vlidas (aunque en ocasiones puedan ser irrelevantes), en e a redes semnticas las relaciones que se representan pueden no ser totalmente rigurosas (la a mayor de las veces por condiciones de excepcin no reconocidas) y, por lo tanto, las a o inferencias obtenidas por rastreo pueden no ser vlidas. a Otra tcnica de corriente de razonamiento con redes semnticas es el emparejamiento, e a consistente en la construccin de fragmentos de red, algunos de cuyos nodos tiene valores o denidos pero otros no. En este caso los nodos sin valores se representan por variables. El sistema debe entonces tratar de encontrar un fragmento de la red semntica original a que encaje perfectamente en el fragmento de red semntica que hemos construido para a representar nuestro problema.

4.2.

Modelos de Dependencia Conceptual

La dependencia conceptual intenta representar el signicado de frases en lenguaje natural de forma que se posibilite la derivacin de conclusiones y la representacin sea o o independiente del lenguaje utilizado en las declaraciones originales. Una representacin de dependencia conceptual no se construye a partir de primitio vas que correspondan a palabras concretas de una declaracin dada, sino que se utilizan o primitivas conceptuales que pueden combinarse para formar signicados de palabras en cualquier lenguaje. La dependencia conceptual proporciona, pues, simultneamente una a estructura y un conjunto espec co de primitivas a partir de las cuales pueden construirse representaciones de elementos concretos de informacin. o Este modelo facilita el razonamiento con el conocimiento representado ya que al descomponer el conocimiento en primitivas se necesitan menos reglas de inferencia, muchas inferencias estn autocontenidas en la representacin y la estructura inicial construida con a o la informacin disponible facilita el enfoque de atencin del programa que debe entender o o las frases, ya que contiene huecos que debern rellenarse2 . a

4.3.

Frames y Guiones

Ante un problema nuevo, nadie empieza directamente un anlisis exhaustivo y desde a cero para construir incrementalmente estructuras de conocimiento cada vez ms complea jas hasta alcanzar la que describa perfectamente la nueva situacin presentada. Por el o contrario, el primer paso susle consistir en recuperar experiencias anteriores y tratar de razonar por semejanza.
Pregunta de examen: Cmo representar o amos en redessemnticas una dependencia conceptual? Resa puesta: Mediante un arco etiquetado.
2

4.3. FRAMES Y GUIONES

55

4.3.1.

Frames

Las frames3 pueden describirse como redes semnticas complejas que tratan el proa blema de la representacin desde la ptica del razonamiento por semejanza: describen o o clases de objetos y pueden denirse como representaciones estructuradas de conocimiento estereotipado4 . Estructuralmente, una frame consta de una cabecera, que le da nombre y es representativa de la clase de objetos que se describen en ella, y de un conjunto de slots, cada uno de los cuales representa una propiedad o atributo del elemento genrico representado por e la frame. Cada slot puede tener distintos slots anidados y sin limitacin de profundidad, o debiendo tenerse en cuenta que dicha posicin del slot en la frame puede cambiar su signio cado, pues cada una de las identaciones de los slots representa un nivel de conocimiento o nivel epistemolgico, y su contenido es una especializacin del nivel anterior. o o
automvil o tipos todo_terreno deportivo utilitario componentes carrocera puertas cap o

Cuadro 4.1: Ejemplo de frame. Un sistema en el que el conocimiento est representado por medio de frames utiliza e con profusin el concepto de herencia, para lo que se emplean slots de tipo es un, que o permiten la entrada de informacin a una frame en un nivel de conocimiento determinado o y partir del cual la informacin de la clase correspondiente pasa al objeto considerado (en o ese sentido, una frame puede ser considerada de orden superior). Las frames suelen incorporar tambin informacin procedimental. Para ello, ciertos e o slots llevan asociados procedimientos que la mayor parte del tiempo estn inactivos, pero a que cuando son activados desencadenan acciones concretas. Algunos de tales procedimientos, denominados demons son: if needed, if added, if removed, if stored, if retrieved, etc. Cuando un demon es activado (por una entrada en la frame, al nivel correspondiente), el procedimiento que sigue al demon es ejecutado y, normalmente, el demon, cumplida ya su misin, es eliminado inmediatamente. Los demons son estructuras muy utiles ya o que proporcionan uniones procedimentales entre distintas frames, posibilitan la ejecucin o de rutinas externas e imprimen un cierto carcter dinmico a la representacin del conoa a o cimiento con frames. Como estructuras de representacin, las frames pueden emplearse o
3 4

La palabra inglesa frame puede signicar esqueleto, marco o fotograma. Un estereotipo puede considerarse un paradigma (mejor modelo) estructural.

56

CAP ITULO 4. METODOS DE REPRESENTACION DEL CONOCIMIENTO

como elementos descriptivos o elementos de control del conocimiento. Con lo visto, podemos ya resaltar que: Las frames permiten denir procesos de razonamiento con informacin o incompleta. Las frames permiten inferir rpidamente hechos no representados de fora ma expl cita. Las frames imprimen cierto carcter dinmico a la representacin al dea a o nir procesos que establecen relaciones entre otras frames y conexiones con el mundo exterior. Las frames utilizan con profusin el concepto de herencia. o El razonamiento con frames suele comenzar con la seleccin de una frame determio nada que se ajuste a nuestra situacin actual. Dado que en la mayor de los casos no o a tendremos ninguna frame que describa exactamente nuestro estado inicial, comenzaremos seleccionando la ms ajustada en base a la evidencia parcial disponible. A continuacin, a o se produce la ejemplicacin de la frame seleccionada tras considerar ciertas condiciones o espec cas actuales. En general, el proceso de ejemplicacin asocia un individuo particular con una clase, o es decir, obtenemos una descripcin individual del problema actual considerando, por un o lado, la descripcin de la clase genrica y, por otro lado, las caracter o e sticas espec cas actuales. Este procedimiento, aunque potente, est siempre sujeto y matizado por la experiencia a individual, de modo que en ocasiones la subjetividad en la percepcin desvirta la calidad o u de la representacin. o

4.3.2.

Guiones

Los guiones son especializaciones del concepto general de frame, que conforman estructuras capaces de representar prototipos de secuencias de sucesos. En los guiones el tiempo es siempre una variable impl cita. Los elementos estructurales ms habituales de los guiones son: a Las condiciones de entrada o condiciones iniciales de aplicabilidad del guin. o Los resultados o hechos que sern verdaderos una vez el guin sea ejecua o tado. Las herramientas u objetos relevantes en el desarrollo del guin. o Los papeles o roles que representan los actores que actan en el guin. u o Las escenas o secuencias t picas de eventos del guin. o

4.4. PARADIGMA DE ORIENTACION A OBJETOS

57

En los guiones no existen reglas absolutas que denan contenidos genricos. As un e , mismo evento puede ser contemplado segn distintos factores de tiempo, lugares de ocuu rrencia o puntos de vista. En los guiones el proceso de razonamiento est basado en que, si un determinado guin a o es apropiado para describir una situacin dada, debe poder ser tambin utilizado para o e predecir acontecimientos no mencionados expl citamente. As para razonar sobre la base , de un guin, ste debe ser previamente seleccionado mediante lo que se denomina proceso o e de activacin. o Existen dos tipos fundamentales de guiones: Los guiones instantneos (aquellos a los que podemos referirnos siempre a pero que no son el foco de atencin principal de nuestro problema). o Los guiones no instantneos (que constituyen el foco de atencin principal a o de nuestro problema). La activacin de un guin instantneo se realiza deniendo punteros en lugares eso o a tratgicos de forma que, cada vez que tal guin sea requerido, sepamos dnde buscarlo. e o o Por el contrario, en el caso de los guiones no instantneos, procede la activacin total a o del mismo tras el proceso de emparejamiento de la situacin inicial con el conjunto de o guiones que describen secuencias en nuestro dominio. As la secuencia de eventos en un , guin puede entenderse como una cadena causal gigante. o

4.4.

Paradigma de Orientacin a Objetos o

Desde mediados de la dcada de los 70 se produjo una fertilizacin rec e o proca entre la programacin orientada a objetos y la investigacin y el desarrollo en IA, lo que condujo o o a diversas y utiles extensiones de los lenguajes de IA. Los objetos aparecen como una extensin del concepto de frames y su principal cao racter stica es que encapsulan en una misma representacin, los datos y las estructuras o procedimentales encargadas de manejar esos datos5 . Aunque esta aproximacin pueda parecer poco natural, ya que los sistemas de IA siemo pre han tendido a separar la informacin declarativa de la procedimental, se corresponde o con una visin en la cual el mundo no est formado por datos y procedimientos, sino por o a entidades que encapsulan sus propios datos y los procedimientos para manejarlos, lo que provee de una base ms rme para el desarrollo de sistemas. a Un objeto se dene como una coleccin de informacin (atributos) que representa o o una entidad del mundo real y una descripcin de cmo esa informacin es manipulada o o o (mtodos). La forma de comunicacin entre objetos es mediante el env de mensajes. e o o Mensajes y mtodos son dos caras de la misma moneda, los mtodos son los procedimientos e e que se invocan cuando un objeto recibe un mensaje6 .
Recordemos que en las frames la incorporacin de informacin procedimental slo aparec en forma o o o a de demons. 6 En terminolog de programacin tradicional, un mensaje es una llamada a una funcin. a o o
5

58

CAP ITULO 4. METODOS DE REPRESENTACION DEL CONOCIMIENTO

Los objetos pertenecen a clases, en la prctica una clase es como un esquema o plana tilla que se utiliza para denir o crear objetos. Los cinco elementos ms importantes del esquema de orientacin a objetos son: a o Abstraccin. o Encapsulamiento. Modularidad. Jerarqu a. Polimorsmo. Los veremos en las secciones siguientes.

4.4.1.

Abstraccin o

La abstraccin consiste en ignorar aspectos de una entidad que no son relevantes para o el problema actual, de forma que podamos centrar nuestra atencin en aquellos aspectos o que s lo son. La aproximacin de la O.O. fomenta que el desarrollador use abstracciones o en los datos y en los procedimientos para simplicar su descripcin del problema. o Denir una abstraccin signica describir una entidad del mundo real, no importa lo o compleja que pueda ser, y a continuacin utilizar esa descripcin en un programa. El o o elemento clave de la abstraccin es la clase, que se puede denir como una descripcin o o abstracta de un grupo de objetos, cada uno de los cuales se diferencia por su estado espec co y por la posibilidad de realizar una serie de operaciones.

4.4.2.

Encapsulamiento

El encapsulamiento se dene como el proceso de almacenar en un mismo compartimento los elementos de una abstraccin que constituyen su estructura y su comportamieno to. Abstraccin y encapsulamiento son conceptos complementarios: la primera se centra o en el comportamiento observable de un objeto y el segundo en la implementacin que da o lugar a ese comportamiento. El encapsulamiento tambin implica ocultacin de informacin, de forma que cada e o o objeto revela lo menos posible de su estructura interna. Esta parte pblica del objeto es u lo que se conoce como interfaz, mientras que los detalles internos del objeto que se ocultan al exterior se denominan implementacin. o As una operacin es vista por sus usuarios como si fuera una simple entidad, aunque , o en realidad est formada por una secuencia de operaciones a bajo nivel. Tambin un objeto e e es visto como un simple objeto en vez de como una composicin de sus partes individuales. o La supresin de los detalles de bajo nivel nos permite razonar acerca de la operacin u o o objeto de forma ms eciente. a Un encapsulamiento inteligente permite que cambios en el diseo afecten al sistema n slo de forma local. As a medida que evoluciona un sistema, sus desarrolladores pueden o , ver que una aplicacin real o bien ciertas operaciones llevan demasiado tiempo, o bien o

4.4. PARADIGMA DE ORIENTACION A OBJETOS

59

ciertos objetos consumen un espacio excesivo. En estas situaciones se suele cambiar la representacin de un objeto, pero sin alterar su interfaz. Esta capacidad para cambiar la o representacin de una abstraccin sin alterar a ninguno de los clientes que la utilizan es o o una de las ventajas ms importantes del encapsulamiento. a

4.4.3.

Modularidad

El hecho de fragmentar un programa en componentes individuales suele contribuir a reducir su complejidad en algn grado, adems de crear una serie de fronteras bien u a denidas y documentadas dentro del programa, que tienen un valor muy alto de cara a la comprensin del mismo. o La modularidad es la propiedad que tiene un sistema que ha sido descompuesto en un conjunto de partes o mdulos que sean cohesivos (agrupando abstracciones que o guarden cierta relacin lgica) y dbilmente acoplados (minimizando las dependencias o o e entre mdulos). o Los principios de abstraccin, encapsulamiento y modularidad son sinrgicos: un obo e jeto proporciona una frontera bien denida alrededor de una sola abstraccin, y tanto el o encapsulamiento como la modularidad proporcionan barreras que rodean esa abstraccin. o En cualquier caso, encontrar las clases y los objetos correctos y organizarlos despus en e mdulos separados son decisiones de diseo independientes. La identicacin de clases o n o y objetos es parte del diseo lgico de un sistema, mientras que la identicacin de los n o o mdulos es parte del diseo f o n sico del mismo. No pueden tomarse todas las decisiones de diseo lgico antes de tomar todas las decisiones de diseo f n o n sico y viceversa, sino que estas decisiones de diseo se dan de forma iterativa. n

4.4.4.

Jerarqu a

Una jerarqu es una clasicacin de las abstracciones. Como hemos visto anteriora o mente, las dos jerarqu ms importantes en un sistema complejo son la jerarqu de as a a generalizacin/especializacin, que dene relaciones es un y la jerarqu de agregacin, o o a o que dene relaciones es parte de. Las jerarquas de generalizacin/especializacin tambin se conocen como herencia. o o e Bsicamente, la herencia dene una relacin entre clases, en las que una clase comparte a o la estructura de comportamiento denida en una o ms clases (herencia simple y herencia a mltiple, respectivamente). La herencia representa as una jerarqu de abstracciones, en u a las que una subclase hereda de una o ms superclases. T a picamente, una subclase aumenta o redene la estructura y el comportamiento de sus superclases. A medida que se desarrolla la jerarqu de herencias, aquellas estructuras y coma portamientos comunes a diferentes clases tendern a migrar hacia superclases comunes. a Las superclases representan abstracciones generalizadas y las subclases representan especializaciones en las que los campos y mtodos de la superclase experimentan aadidos, e n modicaciones o incluso ocultaciones. As la herencia permite declarar las abstracciones , con econom de expresin. a o

60

CAP ITULO 4. METODOS DE REPRESENTACION DEL CONOCIMIENTO

Si realizamos una pequea reexin sobre los conceptos que hemos visto hasta el n o momento, vemos que existe una cierta tensin entre encapsulamiento y jerarqu El eno a. capsulamiento intenta proporcionar una barrera opaca tras la que ocultar los mtodos e y el estado, mientras que la herencia requiere abrir esa interfaz en cierto grado y puede permitir el acceso a los mtodos y al estado a sus subclases pero no a otro tipo de clases. e Esto responde a un principio fundamental de la tcnica de descomposicin modular e o que se conoce como principio abierto-cerrado. Este principio simplemente dice que los mdulos deben ser a la vez abiertos y cerrados: un mdulo debe ser abierto en el o o sentido de estar disponible para ser extendido a travs de la herencia, y debe ser cerrado e en el sentido de que su descripcin o interfaz sea estable y est bien denida. Es la forma o e de conjugar dos objetivos incompatibles: mantener los mdulos abiertos a modicaciones o posteriores y dar al sistema la estabilidad suciente de forma que un cambio en un mdulo o no implique una reaccin en cadena de cambios en muchos otros mdulos que se basen o o directa o indirectamente en l7 . e

4.4.5.

Polimorsmo

Polimorsmo signica literalmente capacidad para adoptar varias formas. En el desarrollo O.O. el polimorsmo puede aparecer de varias formas, siendo la ms comn de a u ellas aqulla en que a una variable de una superclase se le asigna un objeto perteneciente e a una de sus subclases.

Figura 4.2: Tipos de polimorsmo en O.O. El polimorsmo suele combinarse con otra caracter stica, denominada ligadura dina mica, que permite decidir qu mtodo se aplicar a un determinado objeto en tiempo de e e a ejecucin y no en tiempo de compilacin. o o Otra forma de polimorsmo es lo que se conoce como sobrecarga: decimos que un mtodo est sobrecargado cuando a dicho nombre se le pueden asignar distintos cuerpos. e a La forma de determinar qu cuerpo del mtodo hay que ejecutar en cada momento puede e e hacerse por los parmetros del mtodo (sobrecarga paramtrica) o por la clase a la que a e e pertenece el mtodo (sobrecarga de mensajes). e
Relacionado con esto, en programacin O.O. se manejan los conceptos de atributo pblico, privado o o u protegido y mtodos de acceso de escritura y de lectura. e
7

4.5. REGLAS DE PRODUCCION

61

4.4.6.

Ventajas e Inconvenientes de la O.O.

El paradigma de la O.O. presenta varias ventajas entre las que podemos citar: Flexibilidad y extensibilidad: la combinacin de las caracter o sticas de herencia, polimorsmo, ligadura dinmica, etc. hacen posible utilizar y a denir de forma clara mdulos funcionalmente incompletos que permio ten su extensin sin transtornar la operacin de otros mdulos o de sus o o o clientes. De esta forma, los sistemas son exibles, fcilmente extensibles a y de mantenimiento menos costoso. Reutilizacin: los objetos bien diseados constituyen la base para otros o n sistemas que se ensamblan en gran parte a partir de mdulos reutilizables, o lo que redunda en una mayor productividad. Escalabilidad: la combinacin de la reutilizacin con la extensibilidad o o permite desarrollar nuevos sistemas complejos a partir de partes ya desarrolladas, lo que reduce la complejidad del desarrollo. Naturalidad: la aproximacin O.O. corresponde a una visin ms natural o o a del mundo real que los t picos diseos top-down que se basan en una n descomposicin funcional por renamiento progresivo. o Seguridad: la ocultacin de la informacin contribuye a la construccin o o o de sistemas seguros.

Sin embargo, esta tcnica de representacin del conocimiento no est exenta de incone o a venientes entre los que citamos: Rendimiento: el empleo profuso de la herencia, el polimorsmo y la ligadura dinmica ofrece mucha potencia al desarrollo pero su complejidad a puede afectar al rendimiento global del sistema al consumir ms recursos a (memoria, tiempo,. . . ). Problemas de reutilizacin: es fcil caer en diseos ad-hoc no pensados o a n para su reutilizacin posterior. Un diseo reutilizable necesita una consio n deracin especial y un coste de desarrollo mayor. o Cambio de cultura: la aproximacin a objetos obliga a pensar en trminos o e de objetos y mensajes, mientras que la programacin habitual est peno a sada en trminos de datos y funciones. El cambio de puntos de vista no e siempre es fcil. a

4.5.

Reglas de Produccin o

Las reglas de produccin son esquemas de representacin del conocimiento que o o pertenecen a lo que hemos denominado mtodos procedimentales de representacin, en los e o que la mayor parte de los conocimientos se representan como procedimientos dinmicos. a

62

CAP ITULO 4. METODOS DE REPRESENTACION DEL CONOCIMIENTO

Estructuralmente, las reglas de produccin son elementos de representacin del o o conocimiento dinmico constituidas por: a una parte IF (condicin o premisa) o una parte THEN (conclusin o accin) o o opcionalmente, una parte ELSE (conclusin-accin alternativa)8 o o La premisa de una regla est constituida por un conjunto de clusulas que pueden a a anidarse a travs de los juntores u operadores lgicos de relacin and, or y el modicae o o dor lgico not. o Una vez denida la estructura clausal, el siguiente paso es encontrar una representacin interna adecuada, tanto para las clusulas como para las acciones y alternativas. o a Este proceso es dependiente de la herramienta utilizada y/o del lenguaje empleado, pero siempre debe ser compatible con la representacin elegida para el conocimiento esttico o o a declarativo, por lo que normalmente se realiza a travs de ternas (parametro|relacin|valor), e o donde los parmetros son las caracter a sticas que queremos investigar (deben compararse con los valores dados a travs del operador de relacin denido, para determinar si la e o clusula es cierta o no). a En la tabla 4.2 (pgina 63) puede verse un ejemplo de cmo las reglas pueden cooperar a o con otras estructuras de representacin declarativa del conocimiento, por ejemplo frames. o En algunos casos de anidamientos homogneos de clusulas, es util denir y considerar e a distintos tipos de reglas: Reglas IFALL, en las que todas las clusulas de la premisa han de ser a ciertas para que se ejecute la accin o se establezca la conclusin de la o o parte THEN ; equivalen a una regla en la que todas las clusulas estn a e anidadas por medio de operadores and. Reglas IFANY, en las que al menos una clusula de la premisa ha de a ser cierta para que se ejecute la accin o se establezca la conclusin; o o equivalen a una regla en la que todas las clusulas estn anidadas por a e medio de operadores or. Reglas IFSOME, en las que al menos una clusula de la premisa ha de a ser cierta para que se ejecute la accin o se establezca la conclusin; o o equivalen a una regla en la que todas las clusulas estn anidadas por a e medio de operadores or.

En contra de lo que pudisemos pensar, la accin else no se ejecuta slo cuando la premisa es falsa, e o o sino tambin en el caso de que no se tenga informacin suciente como para determinar su veracidad, lo e o que nos permite, pues, el trabajo con conocimiento incompleto.

4.5. REGLAS DE PRODUCCION

63

(HEMODYN-1) /* regla 1 */ IF : (presion_arterial sistolica) gt 160 AND : (presion_arterial diastolica) gt 95 AND : (presion_arterial media) gt 130 THEN : (diagnostico hemodinamico hipertension_arterial) AND : (ACTUALIZAR (diagnostico hemodinamico hipertension_arterial) base_de_datos ) (GASOM-1) /* regla 2 */ IF : (gases_arteriales CO2) eq hypercapnia AND : (gases_arteriales pH) eq acidemia AND : (gases_arteriales Bic) eq normal THEN : (diagnostico respiratorio acidosis_respiratoria) /* frame 1 */ presion_arterial sistolica 177 diastolica 99 media 131 /* frame 2 */ gases_arteriales CO2 hypercapnia pH acidemia Bic normal /* nueva frame generada tras la ejecucion */ diagnostico hemodinamico hipertension_arterial respiratorio acidosis_respiratoria

Cuadro 4.2: Ejemplo de funcionamiento de reglas de produccin y frames. o

64

CAP ITULO 4. METODOS DE REPRESENTACION DEL CONOCIMIENTO

La diferencia entre las reglas IFANY y/o IFSOME es que en las primeras cuando se encuentra una clusula que verica la condicin ya no es preciso investigar ms y la a o a accin se ejecuta o la hiptesis se establece, mientras que en las segundas se investigan o o todas las clusulas antes de ejecutar la accin o establecer la hiptesis (lo que se hace a o o igualmente cuando al menos una de ellas es cierta). Es decir, una regla IFANY formaliza una bsqueda no exhaustiva y una IFSOME representa una bsqueda exhaustiva (que, u u por consiguiente, nos har conocer ms cosas del dominio). Asimismo, la estructura de a a los hechos representados por las reglas IFANY e IFSOME cambia tambin, pues aqullas e e consideran un or exclusivo y stas implican un or inclusivo. e La denicin de distintos tipos de reglas no excluye en absoluto la posibilidad de nuevos o anidamientos, aunque se considera una mala prctica (es mejor desdoblar las veces que a haga falta y obtener una estructura de conocimiento ms compacta), es decir, a pesar de a que ser vlida una regla: a a
IFALL : OR : A verdadero NOT C=desconocido NOT V=blanco Luis=alto : H=hiptesis o

THEN

es preferible esta otra opcin: o


IFALL : A verdadero NOT V=blanco Luis=alto THEN : H=hipotesis IFALL : NOT C=desconocido NOT V=blanco Luis=alto THEN : H=hipotesis

La representacin del conocimiento mediante reglas de produccin presenta ciertas o o ventajas: Las condiciones y las acciones involucradas son expl citas. El conocimiento es expresado de forma muy modular, ya que cada regla de un sistema dado constituye una unidad completa de conocimiento (y, por tanto, si es eliminada, el sistema sigue funcionando). Las reglas de produccin permiten almacenar y utilizar conocimiento de o una gran especidad y el conocimiento implicado suele ser de naturaleza heur stica.

4.5. REGLAS DE PRODUCCION

65

Una bsqueda dirigida por lo objetivos utilizando reglas de produccin se har enu o a trando por la parte THEN, mientras que una bsqueda dirigida por los datos, se har u a desde las condiciones hacia las conclusiones.

66

CAP ITULO 4. METODOS DE REPRESENTACION DEL CONOCIMIENTO

Cap tulo 5 Sistemas de Produccin o


Los sistemas de produccin pueden denirse como sistemas inteligentes basados o en reglas (de produccin) en los que los mecanismos de emparejamiento son una parte o explcita de su arquitectura (estructura)1 . Podemos clasicarlos en dos categor segn la sintaxis de sus reglas y su estructura as, u de control: Sistemas de produccin dirigidos por los datos, por los antecedentes, o progresivos: o en ellos las inferencias se obtienen cuando los antecedentes de una o ms de sus a reglas de produccin se empareja con al menos una parte de los hechos que descrio ben el estado actual. No todos los hechos tienen por qu verse representados en la e regla, pero el antecedente de sta s debe estar completamente representado en los e hechos. Cuando esto ocurre, se dice que la regla en cuestin se ha activado y est en o a condiciones de ser ejecutada, o, lo que es lo mismo, se ha seleccionado como potencialmente ejecutable (su ejecucin o no depender de la estrategia de exploracin o a o elegida). Sistemas de produccin dirigidos por los objetivos, por las metas, o regresivos, evoo cativos: en ellos tanto los antecedentes como los consecuentes de las reglas deben ser considerados como aserciones sobre los datos. En este caso, la activacin de las o reglas tiene lugar por medio de un encadenamiento regresivo (hacia atrs), y el ema parejamiento se efecta a travs de las conclusiones de las reglas. As para alcanzar u e , una determinada meta hay que congurar un proceso evocativo en el que de forma recursiva se vayan estableciendo los antecedentes de las metas como submetas de orden inferior. Un sistema de produccin est constituido por tres elementos fundamentales: o a La base de conocimientos La memoria activa El motor de inferencias
1

Esto hace que sean lentos, pero tambin muy informativos. e

67

68

CAP ITULO 5. SISTEMAS DE PRODUCCION

Figura 5.1: Arquitectura bsica de un sistema de produccin. a o

5.1.

Base de Conocimientos

La base de conocimientos describe el universo de discurso o dominio en el que el sistema de produccin tiene que plantear soluciones. Est constituida por bases de hechos o a y bases de reglas (relativas a diferentes aspectos del dominio2 ). Las bases de hechos forman el esqueleto declarativo del sistema de produccin y su o misin es articular estticamente todos los hechos potencialmente relevantes del dominio3 o a (esto es, los datos o hechos inferenciales o no que forman parte de las reglas). Puede decirse que las bases de hechos dan una estructura a las bases de reglas. Por su parte, las bases de reglas constituyen el esqueleto procedimental del sistema de produccin y a travs de ellas se posibilita la construccin de los circuitos inferenciales o e o que permitirn obtener conclusiones vlidas. a a Obviamente la estructura de las bases de hechos y las bases de reglas debe ser compatible, es decir, tal que ambas entidades puedan comprenderse entre s .

5.2.

Memoria Activa

La memoria activa o memoria de trabajo es la estructura que contiene toda la informacin de naturaleza esttica necesaria para resolver (plantear) un problema concreto. o a Esta informacin incluye: o datos iniciales del problema (informacin de partida) o datos incorporados con posterioridad
Por ejemplo, podr agruparse todas las entidades relevantes para el estudio de la qu an mica en una base de hechos, y el conjunto de todas las relaciones que se pueden establecer entre dichas entidades en una base de reglas. Ambas estructuras podr estar diferenciadas respecto al conocimiento relevante an qu mica orgnica, inorgnica, anal a a tica,. . . . 3 Un ejemplo ser conjuntos de frames. an
2

5.3. MOTOR DE INFERENCIAS hechos establecidos durante los procesos inferenciales hiptesis de trabajo, metas o submetas que todav no han sido establecidas4 o a

69

En la memoria activa es donde se producen todos los cambios de estado del sistema, de forma que es la memoria activa la que representa siempre el estado actual. Por esta razn, es la responsable de interaccionar con el mundo exterior, aceptando la entrada de o informacin de naturaleza no inferencial, y es tambin el foco permanente de atencin o e o de las reglas del sistema. En ella, mediante procesos inferenciales, se activarn y ejecua tarn reglas que harn desaparecer submetas como hiptesis al conrmarlas como hechos a a o (ambas representaciones no pueden, lgicamente, coexistir). La potencia de este mecaniso mo se reeja tambin en que, paralelamente, surge informacin, como resultado de los e o emparejamientos con las reglas, que no se buscaba. Cuando el proceso se detiene, la memoria activa contiene una descripcin del estado o nal del problema, datos, hechos e hiptesis (alternativas o proporcionadas). o Los hechos y los datos de la memoria activa corresponden a entidades de la base de hechos, pero con valores concretos asociados. La diferencia entre hechos y datos es la procedencia de dichos valores asociados: mientras los valores de las trayectorias correspondientes a los hechos de la base son asignados a travs de un proceso inferencial e (procedencia interna), los datos representan informacin que procede directamente del o mundo exterior. Por ultimo, las hiptesis son trayectorias completas (incluyendo o no o valores), cuya veracidad se desea investigar.

5.3.

Motor de Inferencias

El motor de inferencias consta de dos entidades: un intrprete y una estrategia de e control (global, que puede estar constituida por varias estrategias de control concretas), f sicamente separados de la base de conocimientos del dominio de aplicacin. Contiene los o mecanismos necesarios para5 : Examinar la memoria activa y determinar qu reglas deben ejecutarse, e en funcin de la estrategia de bsqueda elegida y de los modelos imo u plementados para la resolucin de los conictos que pudiesen aparecer o (estrategia de control). Controlar y organizar el proceso de ejecucin de las reglas seleccionadas. o Actualizar la memoria activa. Asegurar que el sistema tiene autoconocimiento (saber qu reglas han e sido activadas en todo momento, cules han sido ejecutadas, qu hecho a e ha sido el ultimo en ser incorporado, etc.).
Por ejemplo, en sistemas de produccin dirigidos por los objetivos. Se indican mostrndolas entre o a parntesis. e 5 Vase tema 2, pgina 17. e a
4

70

CAP ITULO 5. SISTEMAS DE PRODUCCION

El proceso global de trabajo del motor de inferencias se produce por ciclos denominados ciclos bsicos del sistema de produccin, cuya naturaleza es netamente diferente si el a o proceso de bsqueda est dirigido por los datos o lo est por los objetivos. u a a En cualquier caso, todo motor de inferencias debe ser considerado como un intrprete y, e como tal, no es ms que un programa de naturaleza secuencial cuya misin es decidir qu es a o e lo que hay que hacer en cada momento, reconociendo y activando las reglas apropiadas en funcin de6 : o los criterios de activacin elegidos o las estrategias de bsqueda implementadas u la direccin de trnsito por el espacio de estados o a el test de realizacin (prueba de meta) o

Adems, para tratar de optimizar el proceso de exploracin del espacio de estados, la a o estrategia de control debe observar criterios como la produccin de movimientos vlidos o a en el susodicho espacio de estados, sistematicidad y eciencia7 . As pues, el motor de inferencias es quien gobierna los procesos inferenciales en los sistemas de produccin y, dado que stos estn basados esencialmente en reglas, cono e a sideraremos, desde una perspectiva totalmente general, dos procedimientos bsicos de a materializacin de la propagacin del conocimiento en el sistema: o o Encadenamiento progresivo (proceso de bsqueda dirigido por los datos) u Encademaniento regresivo (proceso dirigido por los objetivos) Adems del tipo de encadenamiento de reglas, todo motor de inferencias debe incluir, a como norma general: emparejador o intrprete, que active las reglas relevantes en cada moe mento de acuerdo con el estado de la memoria activa estrategia de bsqueda, que incluya heur u sticas de exploracin del espacio o de estados mecanismos de autoconocimiento, que permitan identicar estructuras utilizadas, estados del problema, cambios en la memoria activa, rdenes o de prioridades de aciones y hechos inferidos,. . . mecanismos de terminacin de los procesos inferenciales o
6 7

Grandes casas comerciales, como IBM desarrollan productos comerciales especializados de este tipo. Ver ejemplos en [1], cap tulo 6, seccin 6.4, pgina 147 y siguientes. o a

5.4. CICLO BASICO DE UN SISTEMA DE PRODUCCION

71

5.4.

Ciclo bsico de un Sistema de Produccin a o

Independientemente de si un proceso inferencial est dirigido por los antecedentes o a por las metas, el ciclo bsico de un sistema de produccin est constituido por dos fases a o a claramente diferenciadas: 1. Fase de decisin o seleccin de reglas, que involucra: o o a) Restriccin. o b) Equiparacin. o c) Resolucin de conictos. o 2. Fase de accin o ejecucin de las reglas seleccionadas. o o La restriccin trata de simplicar el proceso de equiparacin eliminando del foco de o o atencin del motor de inferencias aquellas reglas que claramente no tienen nada que ver o con el estado actual representado en la memoria activa del sistema. Esta tarea suele ser realizada durante la fase de ingenier del conocimiento o fase de diseo y construccin del a n o sistema inteligente, y t picamente se traduce en una organizacin del dominio de discurso o por temas. Esta forma de abordar la etapa de restriccin es llevada a cabo a priori y o es de marcada naturaleza esttica. Existe una alternativa de naturaleza ms dinmica, a a a que consiste en abordar la restriccin a partir del llamado metaconocimiento (conocimieno to sobre conocimiento), formalizado como metarreglas que a nivel local y dentro de un proceso inferencial dado, son capaces de establecer prioridades a la hora de acometer el proceso de activacin de reglas. Las metarreglas tambin pueden utilizarse en la fase de o e accin durante la etapa de resolucin de conictos. o o La equiparacin (o emparejamiento) trata de identicar qu reglas son potencialmente o e relevantes en el contexto del problema que queremos resolver (conjunto conicto). Si el proceso sigue un encadenamiento progresivo (dirigido por los datos), consistir en seleca cionar aquellas reglas cuyos antecedentes estn representados en hechos y/o datos de la e memoria activa. Si por el contrario el encadenamiento es regresivo, se encontrarn aquea llas reglas que concluyan algo sobre hiptesis presentes en la memoria activa. o Finalmente, en la etapa de resolucin de conictos se decidir qu regla (o reglas) se o a e aplican. Esta decisin est fuertemente condicionada por la estrategia genrica de bsqueo a e u da implementada en la estructura de control del motor de inferencias. Una vez superada la fase de decisin o seleccin de reglas, el sistema est preparado o o a para dispararlas f sicamente. Es la fase de accin o ejecucin, cuyo resultado es la o o actualizacin de la memoria activa con nuevos hechos y/o hiptesis, el marcaje de las o o estructuras utilizadas y la vericacin de si el proceso c o clico debe continuar o ha nalizado (se ha encontrado la solucin al problema o bien no pueden utilizarse ms reglas). o a

72

CAP ITULO 5. SISTEMAS DE PRODUCCION

Cap tulo 6 Representacin de Conocimiento o Temporal


En todo sistema f sico en estudio, la inclusin de la variable tiempo incrementa la o dicultad asociada al tratamiento de los problemas del dominio. La IA contempla el problema temporal desde dos puntos de vista: la representacin computacional de la o informacin dependiente del tiempo y el razonamiento basado en informacin temporal. o o La utilizacin de informacin temporal es importante en muchos dominios y probleo o mas, ya que permite identicar contextos temporales, comparar datos pasados entre s , realizar prediccines, etc. o El problema de la representacin del conocimiento temporal puede ser tratado sintctio a ca o semnticamente. El tratamiento sintctico se puede realizar mediante asociaciones a a etiqueta-evento o mediante grafos de evolucin en los que se indiquen relaciones temo porales y no slo relaciones causales; desde una perspectiva semntica, el tiempo suele o a emplearse como contexto y estar impl cito. En relacin con los procesos inferenciales el tiempo es importante porque permite el o establecimiento de relaciones causales, important simas en IA, resultado de considerar conjuntamente hallazgos efectuados durante el proceso inferencial y la cronolog de los a mismos. El establecimiento de estas relaciones causales aumenta las capacidades predictivas de los sistemas inteligentes. Sea como fuere, los problemas clave de la representacin del conocimiento temporal o son dos: representacin del eje temporal o ajuste de la granularidad Podemos considerar que el eje temporal est constituido por una secuencia de puntos a discretos, de forma que los eventos suceden en instantes concretos de dicho eje, o bien podemos suponer que el eje temporal es una secuencia continua de intervalos, de forma que los eventos suceden en alguno de tales segmentos temporales. En ambos casos, la representacin del conocimiento ser diferente. o a 73

74

CAP ITULO 6. REPRESENTACION DE CONOCIMIENTO TEMPORAL

En cuanto al ajuste de granularidad, es importante que la representacin sea capaz de o contemplar intervalos de tiempo ms o menos largos dependiendo del contexto. a Claro est que, adems de considerar los puntos anteriores, es necesario un modelo a a capaz de manejar la informacin temporal. Veremos algunos en el presente cap o tulo.

6.1.

Especialista Temporal de Kahn y Gorry

La aproximacin de Kahn y Gorry (1977) es uno de los primeros trabajos que abordan o la problemtica de la representacin temporal. Arman que el conocimiento temporal a o puede incluirse en gran parte en un conjunto de rutinas a las que se reeren colectivamente como el especialista temporal, que estar al servicio de los programas de resolucin a o de problemas para tratar aquellas cuestiones temporales que apareciesen en el dominio. Este especialista se alimenta con una serie de sentencias que hacen referencia a cuestiones temporales; el programa puede instar al especialista a realizar deducciones y responder a preguntas sobre dichas sentencias temporales. Adems, ste acepta especicaciones tema e porales en diversos formatos, detecta inconsistencias y vuelve a deducir hechos basados en las especicaciones que causaban la inconsistencia.

6.1.1.

Representacin de las referencias temporales o

Una especicacin temporal es una sentencia que parcialmente establece la relacin o o temporal entre dos eventos, cada uno de los cuales puede ser considerado un punto de tiempo. Las especicaciones temporales que referencian ms de dos eventos pueden ser a descompuestas en sentencias ms sencillas que slo involucren dos eventos temporales. a o Uno de los eventos de la especicacin suele actuar como evento de referencia. o El hecho de utilizar puntos de tiempo obliga a que las referencias temporales que involucran intervalos temporales sean divididas en dos eventos separados que corresponden al inicio y al nal de la ocurrencia.

6.1.2.

Organizacin de las especicaciones temporales o

El modo segn el que el especialista temporal organiza las especicaciones temporales u es importante, ya que esta organizacin tiene mucha inuencia en la eciencia con que se o responde a las distintas cuestiones. Puede hacerlo de tres maneras1 : 1. Mediante fechas, insertando los eventos en una l nea temporal segn su u fecha, admitiendo expresiones difusas permitiendo incluir sus l mites superior e inferior. 2. Mediante eventos de referencia, cuando hay eventos que son usados con frecuencia, y cuya fecha se conoce con exactitud, pueden ser usados para calcular la fecha de otros eventos relacionados con ellos. 3. Mediante cadenas antes/despus, que ocurren cuando los eventos princie pales forman una secuencia.
1

La eleccin depende del usuario o

6.2. MODELO DE ALLEN

75

6.1.3.

Preguntas al especialista temporal

El especialista temporal puede responder a tres tipos de preguntas acerca de los hechos almacenados en sus bases de datos: 1. Sucedi X en la expresin temporal T? o o 2. Cundo sucedi X? a o 3. Qu sucedi en la expresin temporal T? e o o La capacidad del especialista temporal de responder preguntas reside en un conjunto de programas llamados colectivamente fetcher, cuyas tareas son aceptar un patrn que o especica una pregunta, interpretarlo para determinar el tipo de pregunta y seleccionar los mtodos adecuados para responderla. Cada mtodo es un programa independiente e e diseado para responder un tipo particular de pregunta haciendo uso de la organizacin n o de hechos concreta de la base de datos.

6.2.

Modelo de Allen

Este segundo modelo se basa en la utilizacin de intervalos de tiempo como elementos o fundamentales para establecer relaciones temporables, justicndolo alegando que su utia lizacin permite representar de forma ms natural la informacin temporal, ya que, por o a o ejemplo: Normalmente las referencias temporales son vagas e impl citas, ms fciles a a de representar con intervalos que con puntos. Algunos eventos parecer ser instantneos pero si los examinamos minua ciosamente veremos que pueden ser descompuestos en nuevos eventos, que a su vez se podr descomponer en otros nuevos, razn por la cual an o la utilizacin de puntos de tiempo no ser util ya que stos no se pueden o a e descomponer. Existen ejemplos en los que el uso de puntos de tiempo (de anchura cero) nos conducen a situaciones problemticas (cambio de encendido a a apagado en una bombilla, fcilmente asumible con intervalos cerrados a en el inicio y abiertos en el nal). Ahora bien, si permitimos puntos de tiempo, los intervalos pueden ser representados por sus puntos nales pudiendo denir un intervalo como un par ordenado de puntos sobre la l nea real que dene el tiempo, donde el primer punto es menor que el segundo. Esta solucin, no obstante, no es conveniente segn Allen debido o u a que no facilita estructurar el conocimiento de una manera adecuada para la realizacin de tareas t o picas de razonamiento temporal.

6.2.1.

Relaciones Temporales de Allen

Una vez establecido que el elemento bsico de la representacin temporal es el intervalo, a o es necesario denir las posibles relaciones existentes entre dichos intervalos. Allen dene

76

CAP ITULO 6. REPRESENTACION DE CONOCIMIENTO TEMPORAL

un total de trece posibles relaciones entre un par ordenado de intervalos de tiempo (tabla 6.1, pgina 76). a
Simbolo para la inversa > / bi X X Y X X Y X Y X Y X Y Y

Relacion X antes Y (before) X igual Y (equal) X seguido de Y (meets) X superpuesto a Y (overlaps) X durante Y (during) X comienza Y (starts) X finaliza Y (finishes)

Simbolo < / b

Ejemplo Y

= / eq m

sin inversa mi

oi

di

si

fi

Figura 6.1: Las 13 relaciones temporales de Allen. Las relaciones entre intervalos se representan en una red donde los nodos son intervalos individuales y los arcos entre dichos nodos llevan etiquetas que indican las posibles relaciones existentes entre ellos. Si existe incertidumbre sobre la relacin que debe existir o en un determinado arco, la solucin propuesta es poner todos los casos posibles en el arco. o La red mantiene siempre una informacin completa sobre los intervalos. Cuando se o introduce una nueva relacin se deben calcular todas las consecuencias que conlleve. Esto o se hace calculando el cierre transitivo de las relaciones temporales: el nuevo hecho aade n una restriccin sobre cmo sus dos intervalos deber ser relacionados, lo que podr suo o an a, cesivamente, introducir nuevas restricciones entre nuevos intervalos a travs de las reglas e de transitividad que gobiernan las relaciones temporales, que se muestran en la tabla 6.12 . El algoritmo para realizar la propagacin transitiva consta de una subrutina llamada o Restricciones que es la funcin de transitividad en s para listas de relaciones (etiquetas o de los arcos); se asume la existencia de una cola denominada PorHacer que almacena las relaciones a procesar, dos intervalos i y j relacionados por el conjunto de relaciones N (i, j)
Esta tabla omite la relacin = y muestra las relaciones posibles entre A y C dadas las relaciones entre o A-B y B-C.
2

6.2. MODELO DE ALLEN


B r2 C / A r1 B <a < < > ?? d < o m d s > oi mi d f d di < o < oi < o m d s > m < mi < o m d s > s < si < f < o m d s > <

77

>b

??

>

>

dc

<

>

??

did

< o m di <

oe

oif

mg

< o m di <

> oi di mi si > oi di mi si >

o oi d di = ods

di

> oi mi d f < o m d s o di

> oi mi d f oi di si

> oi mi d f <

>

> oi mi d f d

>

>

o di

oi di si

di o

> oi mi d f di

di si oi

< o m d s di

< o m di > oi mi di si <

< o m

o oi d di = > oi mi ods

<

oi di si

di o

dso

< o m

oi d f ods

mih

si

< o m di <

> oi mi di si >

o oi d di = <

o di <

>

oi d f m

oi > mi m

oi

oi di si <

f = >

dso

oi d f d

>

oi d f < o m o di ods

>

s si = <

d f oi s

>

mi

mi

>

sij

fk

< o m di <

>

oi d f d

< o m di di

oi d f oi

mi

s si = si

<m o di

o di m

mi

s si = d

oi

>

<

> oi mi di si

ods

> oi mi di si di

> oi mi oi di si

>

> oi mi di

f =

si oi di

f =

Relacin o Relacin o c Relacin o d Relacin o e Relacin o f Relacin o g Relacin o h Relacin o i Relacin o j Relacin o k Relacin o l Relacin o
b

antes. despus. e durante. contiene. superpuesto a. superpone a. seguido de. sigue a. comienza. comenzado por. naliza. nalizado por.

Cuadro 6.1: Tabla de transitividad para las relaciones temporales.

78

CAP ITULO 6. REPRESENTACION DE CONOCIMIENTO TEMPORAL

y R(i, j) como la nueva relacin a aadir a la red temporal. o n Restricciones (R1, R2) { C = O para cada r1 en R1 para cada r2 en R2 C = C U T(r1, r2); return C } A~adir R(i,j) n { A~adir <i,j> a la cola PorHacer n mientras (PorHacer /= vaca) hacer { coger el siguiente <i,j> de la cola PorHacer N(i,j) = R(i,j) para cada nodo k tal que Comparable(k,j) hacer { R(k,j) = N(k,j) ^ Restricciones(N(i,k), R(i,j)) si R(k,j) = O entonces return contradiccin o si R(k,j) /= N(k,j) entonces a~adir <k,j> a PorHacer n } para cada nodo k tal que Comparable(i,k) hacer { R(i,k) = N(i,k) ^ Restricciones(R(i,j), N(k,j)) si R(i,k) = O entonces return contradiccin o si R(i,k) /= N(i,k) entonces a~adir <i,k> a PorHacer n } } } Por sencillez, el predicado Comparable puede suponerse siempre cierto inicialmente. Para reducir los requisitos de espacio de la representacin sin afectar de forma imo portante a los mecanismos inferenciales, Allen introduce los intervalos de referencia, intervalos temporales que agrupan otros intervalos. Las restricciones temporales entre cada par de intervalos incluidos en un intervalo de referencia estn calculadas de antemano. a

6.2. MODELO DE ALLEN

79

Cada intervalo se relaciona con el resto de intervalos del sistema unicamente a travs e del intervalo de referencia, dando lugar a una jerarqu en rbol basada en intervalos de a a referencia. En este caso es necesario redenir el predicado Comparable de modo que para cualesquiera nodos K y J, Comparable(k,j) es cierto si: Referencia(k) Referencia(j) /= O (comparten algn intervalo de u referencia), k Referencia(j), o j Referencia(k). donde Referencia(n) es el conjunto de intervalos de referencia para cualquier nodo N . La losof es que no se calculan las relaciones entre intervalos de distintos intervalos a de referencia: si no hay relacin directa entre dos nodos, se obtiene a travs de la red por o e transitividad. Ya que los intervalos de referencia tienen el mismo comportamiento que los intervalos temporales, pueden contener as mismo, como decimos, intervalos de referencia, deniendo de esta manera una jerarqu de grupos representable grcamente mediante un rbol. a a a

6.2.2.

Lgica temporal de Allen o

Basndose en las relaciones entre intervalos temporales descritas en el apartado ana terior, Allen establece una lgica temporal que, bsicamente, consiste en una extensin o a o temporal de la lgica de predicados de primer orden. o La lgica consta de tres tipos bsicos de trminos: o a e trminos del tipo intervalo de tiempo, referidos a intervalos temporales e trminos del tipo propiedad, referidos a proposiciones (ciertas o no) e durante un intervalo temporal trminos correspondientes a objetos del dominio e Uno de los predicados ms importantes es se mantiene(p, t)3 . Otras primitivas bsia a cas de relaciones entre intervalos se deducen de lo visto hasta ahora: durante(t1 , t2 ), t1 est totalmente contenido en t2 a comienza(t1 , t2 ), empiezan juntos pero acaba antes t1 finaliza(t1 , t2 ), acaban juntos pero empieza antes t2 antes(t1 , t2 ), t1 es antes de t2 y no coinciden superpuesto(t1 , t2 ), t1 empieza antes que t2 y se solapan seguido(t1 , t2 ), t1 est justo antes que t2 a
3

En ingls, holds(p, t), la propiedad p se cumple durante todo el intervalo t. e

80

CAP ITULO 6. REPRESENTACION DE CONOCIMIENTO TEMPORAL igual(t1 , t2 ), son el mismo intervalo

De nuevo, son aplicables las reglas de la tabla de transitividad 6.1 y adems el uso a de and, or, all y exists que permiten las expresiones lgicas permite construir otros o predicados. Como puede verse, el modelo de las relaciones temporales de Allen da a la variable temporal una representacin formal de implementacin sencilla gracias a su base en la o o lgica de predicados de primer orden. o

6.2.3.

Cr ticas al modelo de Allen

Las cr ticas al modelo de Allen se han centrado sobre todo en el hecho de no utilizar puntos de tiempo y basar su representacin en intervalos temporales. Pueden clasicarse o en dos vertientes: Cr ticas a la representacin del conocimiento, entre las que destaca el o trabajo de Galton (1990) quien argumenta que el modelo de Allen no es adecuado para representar hechos que estn en movimiento continuo, que a estar en una posicin diferente en cada instante de tiempo (y por tanan o to no pueden estar en una posicin en un intervalo de tiempo, ya que eso o signicar que durante ese intervalo estuvieron parados). Galton propoa ne una revisin al modelo de Allen que incluya instantes temporales o adems de intervalos, aadiendo dos nuevos predicados: a n dentroDe(i, t), el instante i cae en el intervalo t limita(i, t), el instante i limita al intervalo t Cr ticas a la complejidad de los clculos realizados con intervalos tema porales, entre las que destacan los trabajos de Vilain y Kautz (1986) y van Beek (1992, 1996). Estos autores reconocen la sencillez y fcil implea mentacin del modelo de Allen, pero indican que el lgebra de intervalos o a en la que se basa requiere gran cantidad de recursos computacionales, en particular, dos de las operaciones fundamentales: la bsqueda de todas las relaciones posibles entre pares de intervalos u (o puntos), que se hace mediante un razonamiento deductivo atendiendo a las relaciones transitivas entre intervalos temporales la bsqueda de un escenario consistente con la informacin suminisu o trada, lo que signica encontrar una subred de la red actual en la que cada nodo se etiquete con una sola relacin y que exista una o instanciacin consistente de dicha subred (si no existe, la que no es o consistente es la propia red) En el lgebra de intervalos estas dos operaciones son NP-completas. Para a solucionar este problema, Vilain y Kautz, y posteriormente van Beek, proponen un lgebra ms sencilla basada en puntos de tiempo y presentan a a un mtodo para convertir las representaciones en intervalos temporales e en representaciones en puntos temporales.

6.3. ALGEBRA DE PUNTOS TEMPORALES

81

6.3.

Algebra de Puntos Temporales

Una alternativa al razonamiento basado en intervalos de tiempo es el basado en puntos de tiempo. En el lgebra de puntos stos se relacionan entre s a travs de vectores de a e e relacin, cada uno de los cuales est compuesto por un conjunto de relaciones bsicas eno a a tre puntos, que son las 3 que se indican en la gura 6.2, frente a las 13 del modelo de Allen:

Relacion X precede Y (precedes) X igual Y (same) X sigue Y (follows)

Simbolo < X

Ejemplo Y

= Y

X Y X

>

Figura 6.2: Las tres posibles relaciones entre puntos de tiempo. Vilain y Kautz denen adems dos operaciones bsicas entre puntos o intervalos de a a tiempo: Suma, interseccin entre dos vectores que denen una relacin entre o o intervalos o puntos para devolver el vector representante de la relacin o menos restrictiva permitida. Multiplicacin, equivalente a la operacin que el modelo de Allen deo o nominaba Restricciones, que dados tres intervalos A, B y C y dos vectores que relacionen A B y B C, permite obtener el vector menos restrictivo que relaciona A C. El lgebra temporal basada en puntos posee tambin las operaciones de adicin y proa e o ducto, cuyas tablas se muestran en la pgina 82. a Para las redes de puntos, van Beek presenta algoritmos ms ecientes para realizar las a tareas del razonamiento temporal. En concreto dene un algoritmo de complejidad O(n2 ) en el tiempo para la tarea de encontrar un escenario consistente (donde n es el nmero u de puntos) y uno de complejidad O(max(mn2 , n3 )) en el tiempo para encontrar todas las posibles relaciones entre puntos de tiempo (donde n es el nmero de puntos y m es el u nmero de pares de puntos que no pueden considerarse iguales). u

6.3.1.

Algebra de Puntos vs. Algebra de Intervalos

La facilidad en el tratamiento del lgebra de puntos parece hacerla ms adecuada a a para la representacin del tiempo. La mayor de los problemas que requieren manejar o a

82

CAP ITULO 6. REPRESENTACION DE CONOCIMIENTO TEMPORAL < < < < < < = = < > > > > > = > = > = = = = = = < < > > = = ? < > = = ?

< > = = ?

Cuadro 6.2: Adicin en el lgebra de puntos temporales. o a < < < < ? ? ? ? < ? ? ? ? > ? ? > > > ? ? = ? < ? > > = ? = ? ? = ? ? ? ? = ? ? ? ? ? ? ? ? ? ?

< > = = ?

Cuadro 6.3: Multiplicacin en el lgebra de puntos temporales. o a relaciones temporales pueden ser representados mediante puntos de tiempo. Sin embargo, los puntos de tiempo son inadecuados para representar, por s mismos, toda la semntica del lenguaje natural. Adems, presenta muchos inconvenientes para a a modelizar muchos de los eventos y acciones del mundo real. En estos casos, la representacin temporal basada en intervalos es mejor. o La mayor de las relaciones basadas en intervalos tienen una traduccin directa en a o lgebra de puntos: se puede considerar que un intervalo queda delimitado por sus puntos a extremos (inicial y nal), y traducir las relaciones existentes entre intervalos a relaciones entre los puntos extremos de dichos intervalos. No obstante, no todas las relaciones entre intervalos pueden ser expresadas sin prdidas e como relaciones entre sus puntos de inicio y n. En concreto lo que no puede expresarse con puntos son expresiones en las que aparecen disyunciones. De esta forma, existen dos tipos de redes temporales: basadas en intervalos (Interval Algebra) y basadas en puntos (Point Algebra). Tambin existe un subconjunto de las e redes basadas en intervalos denominadas redes SIA (Simple Interval Algebra) que son directamente representables en base a redes basadas en puntos. Estas redes SIA incluyen todas las relaciones no ambiguas entre intervalos (de forma que no tienen prdida de e informacin), es decir, relaciones que pueden ser expresadas usando vectores que contienen o slo un simple constituyente (un slo elemento). Incluso se consideran algunas relaciones o o ambiguas, pero no todas: se puede representar la ambigedad en relacin de pares de u o puntos nales, pero no en relacin a intervalos completos. o

Cap tulo 7 Razonamiento Categrico y o Correccin Bayesiana o


La IA no slo se ocupa de mecanismos generales relacionados con la bsqueda de o u soluciones en un espacio dado, o de cmo representar y utilizar el conocimiento de un o determinado dominio de discurso. Otro aspecto es el que corresponde a los mecanismos y/o procesos inferenciales, punto de partida de los llamados modelos de razonamiento. En cualquier dominio, la propagacin del conocimiento1 por medio de programas de o IA se efecta siempre siguiendo un modelo de razonamiento bien denido. Estos modelos u de razonamiento forman parte del motor de inferencias, si hablamos de sistemas de produccin, o de las estructuras de control del conocimiento, si hablamos de cualquier otro o tipo de sistemas de IA, y contribuyen de manera decisiva a organizar correctamente la bsqueda de soluciones. u Normalmente, las caracter sticas del dominio y las caracter sticas de los problemas que deben resolverse condicionan el tipo de modelo de razonamiento que debemos emplear. As : Hay dominios de naturaleza simblica en los que las soluciones pueden o establecerse con total seguridad; en estos casos se emplean modelos categricos de razonamiento. o Hay dominios de naturaleza estad stica en los que las soluciones no pueden ser un vocamente obtenidas y en los que es necesario averiguar cul a de las posibles soluciones encontradas es la ms probable; en estos casos a es preferible razonar con modelos de naturaleza estad stica, de los cuales el esquema bayesiano es el ms utilizado. a Hay otros dominios en los que aparece el concepto de incertidumbre, que puede ser inherente a los datos del problema y a los hechos del dominio o a los propios mecanismos inferenciales. En estos casos elegiremos modelos de razonamiento cuasi-estad sticos, capaces de manipular correctamente dicha incertidumbre.
1

Establecimiento de circuitos inferenciales apropiados

83

84

CAP ITULO 7. RAZONAMIENTO CATEGORICO Y BAYESIANO Por ultimo, hay dominios en los que los elementos inferenciales incluyen matices de carcter ling a ustico, entre los que pueden establecerse jerarqu y clasicaciones. En estos casos es conveniente emplear modelos de as razonamiento basados en conjuntos difusos. Dominios reales = c1 (categoricos) + c2 (estadisticos)+ c3 (cuasiestadisticos) + c4 (dif usos) + . . .

Esta clasicacin no es exhaustiva ni rigurosa (hay ms dominios, hay dominios que o a participan de varias de las caracter sticas mencionadas,. . . ).

7.1.

Modelo Categrico o

A continuacin trataremos el primero de los modelos comentados en la clasicacin o o inicial del tema: el modelo categrico. o

7.1.1.

Interpretacin Diferencial o

Una de las grandes cuestiones en la resolucin de problemas de IA es cmo utilizar o o los datos y las verdades demostradas, segn un procedimiento encadenado y lgico, pau o ra discriminar entre las posibles soluciones inicialmente candidatas hasta encontrar la verdadera respuesta del problema planteada. Cuando el dominio es de naturaleza simblica, ya se ha comentado que el proceso de o razonamiento adecuado debe seguir una aproximacin categrica. Uno de tales procedio o mientos es el de la interpretacin inferencial, cuyo proceso global sigue aproximadao mente un esquema como el siguiente2 : 1. Recopilacin de informacin relevante. o o 2. Anlisis de la importancia relativa de las manifestaciones del problema a (ponderacin de la informacin). o o 3. Anlisis de las posibles causas del problema tras considerar, conjunta a y razonablemente, todas las manifestaciones del problema. Ello implica el establecimiento tentativo de relaciones causa-efecto (relacin de la o informacin disponible con un conjunto de interpretaciones inicialmente o posibles). 4. Exclusin una a una de todas aquellas interpretaciones (hiptesis) que o o no pueden ser explicadas completa y razonablemente por los datos.
Este proceso de razonamiento -sistemtico pero complejo- puede simplicarse en funcin del grado a o de experiencia, que ayuda en la optimizacin de recursos al restringir al mximo el conjunto inicial de o a hiptesis merced al conocimiento heur o stico y al efectuar el proceso de establecimiento de relaciones causa-efecto de manera ecaz y eciente. Por ello, se buscan modelos sistemticos que utilicen adems a a algn sucedneo de sentido comn e intuicin. u a u o
2

7.1. MODELO CATEGORICO 5. Fin del proceso con alguno de los siguientes resultados: a) Existe una unica solucin (que ha sido encontrada). o b) No hay ninguna solucin (el conjunto de hiptesis formulado inicialo o mente no es consistente con los datos). c) Hay varias soluciones posibles (hiptesis que se corresponden con los o datos) entre las que no se puede discriminar.

85

7.1.2.

Elementos del Razonamiento Categrico o

Puesto que una de las tareas que hay que realizar en un proceso de razonamiento categrico es establecer un conjunto de relaciones causales, comenzaremos describiendo o nuestro dominio de discurso a partir de dos entidades diferentes, entre las que debemos ser capaces de establecer relaciones: manifestaciones posibles en el dominio de discurso interpretaciones posibles en el dominio de discurso Cualquier dominio no estar completamente descrito, pues, en cuanto no se especia quen todas las posibles manifestaciones de los problemas que puedan darse en l, todos e los posibles problemas del dominio y todas las relaciones causales que puedan establecerse entre problemas y manifestaciones en dicho dominio. Formalmente, para construir el modelo necesitamos denir una serie de funciones de carcter booleano (ya que el modelo es categrico, en l algo est presente o ausente, es a o e a posible o es imposible) que nos sirvan para describir el dominio: Si x1 , x2 , . . . , xn es el conjunto completo de todas las manifestaciones posibles del universo de discurso, entonces la funcin f (x1 , x2 , . . . , xn ), o booleana, asignar el valor 1 a la manifestacin xi si sta est presente a o e a en el problema concreto que nos ocupe, 0 en caso contrario (no todas o las manifestaciones posibles estn presentes en un mismo momento). a Si y1 , y2 , . . . , ym es el conjunto completo de todas las posibles interpretaciones que se pueden dar a los problemas del dominio, para un problema concreto la funcin g(y1 , y2 , . . . , ym ) asignar valor 1 a la interpretacin o a o yj si sta es posible, 0 en caso contrario. e o

Es necesaria una tercera funcin, E = E(X, Y ) = E(x1 x2 . . . xn , y1 y2 . . . ym ), funcin o o de conocimiento, que representa el conjunto de todas las posibles relaciones causales que se pueden establecer en nuestro dominio de discurso, entre manifestaciones e interpretaciones. Con estos 3 elementos, un problema se reduce a encontrar en un dominio, ante un conjunto f de manifestaciones relacionadas con un problema, la funcin g que satisface: o E : (f g)

86

CAP ITULO 7. RAZONAMIENTO CATEGORICO Y BAYESIANO

esto es, encontrar el conjunto de interpretaciones que es compatible con las observaciones y datos de que se dispone, tras la aplicacin del conocimiento que se tiene sobre el dominio o de discurso. Este procedimiento, pese a ser ecaz, no es, no obstante, eciente. Los procedimientos lgicos clsicos, la complejidad de los procesos de resolucin, etc. podr hacer inviable o a o an la resolucin de determinados problemas. Aparece, por tanto, la necesidad de encontrar o alternativas mejores, conceptualmente correctas y computacionalmente ecaces. Una de ellas se describe a continuacin. o

7.1.3.

Procedimiento Sistemtico para el R. Categrico a o

El procedimiento sistemtico que se propone para razonar categricamente consta de a o las siguientes fases: 1. Identicacin de los conjuntos completos de manifestaciones, interpretao ciones e funcin de conocimiento: o a) construccin del conjunto de todas las combinaciones que se puedan o establecer entre las manifestaciones del dominio, conjunto de complejos de manifestaciones b) construccin del conjunto de todas las combinaciones que se puedan o establecer entre las interpretaciones del dominio, conjunto de complejos de interpretaciones c) construccin del conjunto completo de todas las combinaciones poo sibles entre complejos de manifestaciones y complejos de interpretaciones, conjunto de complejos manifestacin-interpretacin o o es decir, si hemos identicado n manifestaciones y t interpretaciones en el dominio, el nmero de complejos de manifestaciones ser 2n , el de u a complejos de interpretaciones ser 2t y el de complejos manifestacina o (n+t) interpretacin ser 2 o a . Dado el carcter exhaustivo del procedimiento, los elementos de los tres conjuntos (que a son, como hemos denido, completos) son mutuamente excluyentes. El conjunto de complejos manifestacin-interpretacin representa el total de situaciones idealmente posibles o o en nuestro universo de discurso, aunque es evidente que no todas ellas vana poder darse en la realidad. Es ms, muchas de ellas sern claramente absurdas. El papel del conocia a miento ser restringir el conjunto total de situaciones idealmente posibles a un conjunto a de situaciones realmente posibles (permitidas por el propio conocimiento disponible)3 . Realizado este paso, si nuestro conocimiento sobre el dominio es completo y ste e est descrito correctamente, la solucin a cualquier problema que podamos plantearnos a o
En otros trminos, pasar de la base lgica expandida, BLE, lista exhaustiva de complejos mae o nifestacin-interpretacin posibles, a la base lgica reducida, BLR, lista de complejos manifestacino o o o interpretacin compatibles con el conocimiento que se tiene sobre el dominio. o
3

7.2. LA CORRECCION BAYESIANA

87

estar en la BLR. Habr que buscar entre los complejos que la forman aqullos que prea a e senten las manifestaciones realmente presentes en cada caso (problema) concreto. Adems, la aparicin e incorporacin de nuevas declaraciones al conocimiento es sena o o cilla, slo supone recalcular la BLR y revisar las manifestaciones presentes en la nueva o lista de complejos. La situacin de no hallar ningn complejo en la BLR que contenga un determinado o u complejo de manifestaciones tiene tres interpretaciones: las manifestaciones no son realmente las que se estn manejando a el conocimiento no es correcto, la funcin E tiene algn error o u el dominio no est bien construido a El primer problema se resuelve efectuando una nueva recogida de datos para comprobar que no se han cometido fallos al construir la funcin f . Si el conjunto de manifestaciones o sigue siendo el mismo, entonces debe sospecharse de la funcin de conocimiento (puede ser o incompleta, demasiado restrictiva o simplemente falsa) o de la construccin del dominio o (que puede contener manifestaciones y/o posibles interpretaciones que no se hayan tenido en cuenta). El caso contrapuesto, en el que en la BLR aparecen dos complejos manifestacino interpretacin que contienen la(s) manifestacin(es) concretas del problema en cuestin, o o o permite acotar la solucin mediante el or de los mencionados complejos compatibles, o pero no resolver el problema por completo. Como regla general, esta situacin no es o aceptable, y constituye uno de los problemas ms serios del modelo que acabamos de a desarrollar: la incertidumbre surge espontneamente en el modelo categrico. a o Otro problema importante de este modelo es la casi siempre inevitable explosin como binatoria en la construccin de la BLE. Estas y otras deciencias ms sutiles aconsejan o a la puesta a punto de un modelo alternativo.

7.2.

La Correccin Bayesiana o

Las interpretaciones categricas son ms bien infrecuentes en el mundo real. Ya heo a mos comentado que no todos los problemas se maniestan, algunos no lo hacen nunca y otros tardan mucho en hacerlo. Adems, la presencia de una manifestacin no siempre es a o indicativa de algn problema. u Con estas consideraciones, vamos a replantearnos la cuestin desde otro punto de o vista: dado un universo y un conjunto de atributos, cul es la probabilidad de que un a determinado elemento del universo presente ciertos atributos del conjunto total? En trminos estad e sticos, si N es una determinada poblacin (nmero de situaciones) o u y x1 , x2 , . . . , xn es el conjunto de todos los atributos posibles, la funcin f (x1 , x2 , . . . , xn ) o booleana genera un subconjunto de atributos. De este modo, si N (f ) es el subconjunto

88

CAP ITULO 7. RAZONAMIENTO CATEGORICO Y BAYESIANO

de los elementos de N que presentan tales atributos, la probabilidad total de f ser a Probabilidad total = P (f ) = N (f ) N

El concepto de probabilidad total de la estad stica bayesiana no es, sin embargo, suciente para construir un modelo de razonamiento. Necesitamos introducir el concepto de probabilidad condicional (la probabilidad de las causas). En la probabilidad condicional aparecen involucrados dos sucesos, de forma qe la ocurrencia del segundo depende de la ocurrencia del primero. Este planteamiento se acerca algo ms a los aspectos relativos al razonamiento. Sin embargo, lo que interesa en principio a es interpretar cosas que ya han pasado, para lo cual necesitamos introducir, adems del a mecanismo a priori, algn mecanismo para razonar a posteriori. Es decir, no slo u o saber con qu probabilidad se dar una consecuencia conocidas las probabilidades de sus e a causas, sino, conocida la probabilidad de una consecuencia, saber la probabilidad de sus causas. Este fue, precisamente, el planteamiento del reverendo Bayes, que se tradujo en la ecuacin elemental de su famoso teorema: o p(A/E) = p(E/A)p(A) p(E)

que permite obtener la probabilidad condicional a posteriori a partir de la probabilidad condicional a priori y de las probabilidades totales. Esta expresin debe poder o generalizarse para el anlisis de problemas ms complicados. Supngase la siguiente sia a o tuacin: o A E a E c Total a + c donde a b c d = = = = verdaderos positivos falsos positivos falsos negativos verdaderos negativos A Total b a+b d c+d b+d N

A partir de estos datos pueden establecerse las siguientes probabilidades totales o prevalencias: p(E) = p(A) = (a + b) N (a + c) N p(E) = p(A) = (c + d) N (b + d) N

7.2. LA CORRECCION BAYESIANA y las siguientes probabilidades condicionales: (1) (2) (3) p(E/A) = p(E/A) = p(E/A) = a a+c b b+d c a+c d b+d (5) (6) (7) p(A/E) = p(A/E) = p(A/E) = a a+b c c+d b a+b d c+d

89

(4) p(E/A) =

(8) p(A/E) =

(1) suele denominarse sensibilidad y (4) especidad ; suele interesar conseguir la mxia ma sensibilidad y a la vez la mxima especidad. a Por el teorema de Bayes sabemos que p(A/E) = p(E/A)p(A) p(E)

siendo el trmino denominador el que impide la generalizacin; tambin sabemos que e o e p(E) = de la expresin (1) se deduce o a = (a + c)p(E/A) y de la expresin (2) o b = (b + d)p(E/A) Por otra parte, p(A) = y p(A) = por lo que (a + c) = N p(A) y (b + d) = N p(A) y sustituyendo a = N p(A) p(E/A) b = N p(A) p(E/A) (b + d) N (a + c) N (a + b) N

90

CAP ITULO 7. RAZONAMIENTO CATEGORICO Y BAYESIANO

Si sustituimos a su vez en la expresin de p(E) resulta o p(E) = p(A)p(E/A) + p(A)p(E/A) Y llevando este resultado a la expresin original del teorema de Bayes, obtenemos o p(A/E) = p(E/A)p(A) p(E/A)p(A) + p(E/A)(A)

ecuacin que es directamente generalizable, dando lugar a la expresin generalizada del o o teorema de Bayes: p(A0 /E) = p(E/A0 )p(A0 ) i p(E/Ai )p(Ai )

si consideramos ms de dos posibilidades (en lugar de simplemente A y A). a As pues, si el tratamiento lgico de un problema concreto es correcto, si los conjuntos o de manifestaciones e interpretaciones son completos, si las manifestaciones y las interpretaciones cumplen el requisito de independencia exigido por el teorema de Bayes, si la funcin de conocimiento est bien construida y si el tratamiento estad o a stico efectuado es correcto, entonces slo las probabilidades condicionales relativas a complejos manifestao cin-interpretacin que aparecen en la BLR tendrn valores distintos de cero. De no ser o o a as deber pensarse en alguna de las siguientes deciencias: , a el planteamiento lgico no es correcto o la funcin de conocimiento no es correcta (es incompleta o est mal conso a truida) la estad stica no ha sido bien realizada Adems, para asegurar la consistencia matemtica del modelo se tiene que cumplir a a que P (mi /i0 ) = 1
i

De esta manera, la solucin ms probable de entre los complejos manifestacin-intero a o pretacin presentes en la BLR que aporten la manifestacin real ser sencillamente la que o o a tenga mayor probabilidad. A pesar de todo, la correccin bayesiana tambin presenta problemas: si manifestacioo e nes e interpretaciones no son independientes, el modelo bayesiano fracasa4 . Esta limitacin o del modelo plantea problemas cuando se pretende su aplicacin en dominios del mundo o real, en los que los requisitos de independencia casi nunca se cumplen.
Ojo: las manifestaciones han de ser independientes entre s y las interpretaciones independientes entre s pero no han de ser manifestaciones independientes de interpretaciones, o de lo contrario no habr , a relaciones causales!
4

7.2. LA CORRECCION BAYESIANA

91

Pero sta no es la unica deciencia del modelo bayesiano. En los problemas interesantes e para la aplicacin de tcnicas de IA, la informacin suele ir apareciendo progresivameno e o te, secuencialmente y, generalmente, de forma poco ordenada. En estos casos, adecuar la aproximacin bayesiana a la interpretacin secuencial supone considerar que la informao o cin factual aparece incrementalmente y, por lo tanto, habr que adaptar las ecuaciones o a correspondientes. Sea E1 el conjunto de toda la informacin disponible en un momento dado, y sea S1 o un nuevo dato (un nuevo elemento de informacin que acaba de aparecer). Entonces E o ser el nuevo conjunto formado por la informacin de E1 y el nuevo dato S1 . La ecuacin a o o del teorema de Bayes se reescribe: p(Ii /E) = p(S1 /Ii y E1 )p(Ii /E1 ) j p(S1 /Ij y E1 )p(Ij /E1 )

reescritura que complica an ms la estad u a stica asociada a la aplicacin del modelo o bayesiano. Otro problema frecuente de este modelo procede de su aplicacin poco cuidadosa, y o un ultimo gran problema es consecuencia de su consistencia matemtica. Al respecto, y a por denicin, siempre se tiene que cumplir que o p(A) + p(A) = 1 Sin embargo, cuando tratamos con problemas del mundo real, dif cilmente puede asumirse esta consistencia, es decir, que un mismo conjunto de evidencias apoye simultneaa mente (aunque en distinto grado) una hiptesis y su negacin. Este es uno de los puntos o o ms dbiles de los modelos estad a e sticos cuando tratamos con conocimiento en lugar de tratar con datos. En problemas del mundo real, dada una proposicn basada en o la experiencia, la consistencia matemtica no tiene por qu mantenerse. Necesitamos la a e puesta a punto de un nuevo modelo, y al efecto surgirn los modelos cuasiestad a sticos 5 como factores de certidumbre y la teor evidencial de Dempster y Shafer. a

Usan con profusin heur o sticas para paliar los defectos de los modelos estad sticos.

92

CAP ITULO 7. RAZONAMIENTO CATEGORICO Y BAYESIANO

Cap tulo 8 Factores de Certidumbre


Parte de los inconvenientes encontrados en los modelos vistos en cap tulos anteriores podr ser resueltos empleando conocimiento heur an stico. Si ms concretamente nos refea rimos a los problemas estad sticos derivados de la inevitable y exhaustiva recoleccin de o datos, una posible solucin podr pasar por el establecimiento de un nuevo concepto, el o a de probabilidad condicional subjetiva, que denimos como una medida numrica que relae ciona dos sucesos, de forma que la ocurrencia de uno est condicionada por la ocurrencia a del otro, pero donde la relacin no est avalada por amplios estudios estad o a sticos. As la expresin , o p(Ii /Sk ) = x podr traducirse como si la manifestacin Sk est presente, entonces segn mi a o a u experiencia hay una probabilidad (subjetiva) x de que la interpretacin sea Ii . o Este enfoque resuelve el problema de la recogida masiva de informacin y datos, pero o sigue presentando problemas, ya que es posible que la suma de las probabilidades condicionales subjetivas sea distinta de la unidad p(Ii /Sk ) = 1
i

situacin que no es compatible con la estad o stica tradicional, pero que puede resolverse normalizando a uno las correspondientes probabilidades condicionales subjetivas, con el unico objetivo de mantener la consistencia matemtica del modelo. a Otros problemas, sin embargo, no son tan fciles de resolver, ya que cuando trabaa jamos con informacin de carcter simblico en lugar de con datos numricos aparecen o a o e conceptos como imprecisin, incertidumbre, falta de informacin, credibilidad,. . . que son o o dif ciles de denir. La necesidad de construir programas inteligentes capaces de manipular estos tipos diferentes de informacin sugiere la conveniencia de formalizar nuevas aproxio maciones y modelos.

8.1.

Modelo de los Factores de Certidumbre


93

La expresin p(Ii /Sk ) = x puede interpretarse en trminos de implicacin como o e o

94

CAP ITULO 8. FACTORES DE CERTIDUMBRE

Sk Ii expresin en la que x dene la llamada potencia evidencial de la implicacin. Cuano o do x = 1 se dice que la relacin entre Sk e Ii es patognmica (de absoluta certeza, sin o o ninguna incertidumbre); en otro caso, para x 0 y x < 1 la potencia evidencial establece la intensidad de la relacin causal. o A lo largo de un proceso completo de razonamiento, y manteniendo Ii como hiptesis o de trabajo, seguramente aparecer evidencia a favor de la hiptesis considerada, pero a o tambin en contra de la misma. Si aplicamos un esquema bayesiano al problema planteado, e deber amos concluir tambin que e Sk Ii lo cual, como hemos visto, cuando trabajamos con conocimiento es inaceptable. En 1975, para tratar de resolver este tipo de problemas, Shortlie y Buchanan plantearon un modelo de razonamiento de naturaleza ad hoc que sacudi los cimientos del o entonces incipiente mundo de la IA por su consiguiente carencia de una base terica fuerte. o No obstante, fue inmediatamente aceptado debido a su fcil comprensin y a la calidad a o de los resultados obtenidos tras su aplicacin. Sus ideas bsicas pueden resumirse en: o a Dada una hiptesis que est siendo considerada, la potencia evidencial de o a una declaracin debe representarse a travs de dos medidas diferentes: la o e medida de conanza creciente, M B y la medida de desconanza creciente, M D, que son en realidad ndices dinmicos que representan a incrementos asociados a evidencias nuevas. Si h es una hiptesis y e una evidencia, la misma evidencia e no puede, o simultneamente, incrementar y disminuir la conanza en h. a M B(h, e) representa el incremento de la conanza en h dada la evidencia e. M D(h, e) representa el incremento de la desconanza en h dada la evidencia e. Con estas premisas podemos establecer el siguiente formalismo y casos particulares: sea p(h) la conanza previa en h antes de aparecer e, p(h/e) la conanza en h tras la aparicin de e y 1 p(h) la desconanza previa en h antes de aparecer e, o 1. Si p(h/e) > p(h), entonces la nueva evidencia produce un aumento de conanza en la hiptesis considerada. En este caso, o M B(h, e) > 0 M D(h, e) = 0 y M B(h, e) se dene como el incremento de la conanza entre un factor normalizador (si p(h/e) = 1, M B(h, e) debe ser 1):
1x

8.1. MODELO DE LOS FACTORES DE CERTIDUMBRE p(h/e) p(h) 1 p(h)

95

M B(h, e) =

De modo que M B(h, e) representa el incremento relativo de la conanza en la hiptesis h tras la aparicin de la evidencia e, que coincide con o o la disminucin relativa de la desconanza en h tras la aparicin de la o o evidencia e. 2. Si p(h) > p(h/e), entonces la nueva evidencia produce un aumento de la desconanza1 depositada en la hiptesis considerada. En este caso, o M B(h, e) = 0 M D(h, e) > 0 y M D(h, e) se dene M D(h, e) = p(h) p(h/e) p(h)

De modo que M D(h, e) representa el incremento relativo de la desconanza en la hiptesis h tras la aparicin de la evidencia e, que coincide o o con la disminucin relativa de la conanza en h tras la aparicin de la o o evidencia e. 3. Si p(h/e) = p(h), entonces la nueva evidencia es independiente de la hiptesis considerada, ya que no aumenta ni la conanza ni la descono anza. En este caso, M B(h, e) = M D(h, e) = 0 Claramente, si p(h) simboliza una probabilidad a priori en sentido clsico, podemos a establecer los valores l mite de las correspondientes medidas de conanza y desconanza crecientes segn las expresiones: u si p(h) = 1 (certeza absoluta) 1 max[p(h/e), p(h)] p(h) M B(h, e) = p(h) = 1 max[1, 0] p(h) si p(h) = 0 (falsedad absoluta) 1 min[p(h/e), p(h)] p(h) M D(h, e) = p(h) = 0 min[1, 0] p(h) Ambas expresiones no son ms que representaciones formales y simtricas de las mea e didas de conanza y desconanza crecientes, expresadas en trminos de probabilidades e condicionales y de probabilidades a priori. Adems de estas dos medidas, Shortlie y Buchanan denen un tercer a ndice, denominado factor de certidumbre, CF , que combina las dos anteriores:
1

Ojo: no disminucin de la conanza! o

96

CAP ITULO 8. FACTORES DE CERTIDUMBRE

CF (h, e) = M B(h, e) M D(h, e) expresin que tambin es de carcter formal (carece de entidad propia, coincide con o e a M B con M D), ya que una misma evidencia nunca puede incrementar, simultneamente, o a la conanza y la desconanza en la misma hiptesis. o Shortlie y Buchanan justican su introduccin como un medio para facilitar la como paracin entre potencias evidenciales de hiptesis alternativas en relacin a una misma o o o evidencia. En cada una de las tres medidas desarrolladas podemos identicar las siguientes caracter sticas: rangos 0 M B(h, e) 1 0 M D(h, e) 1 1 CF (h, e) 1 (no s se dice siempre 0) e comportamiento en casos extremos e hipotesis mutuamente excluyentes Si h es cierta (p(h/e) = 1), 1 p(h) =1 1 p(h) M D(h, e) = 0 CF (h, e) = 1 M B(h, e) = Si h es cierta (p(h/e) = 1), 0 0 p(h) =1 M D(h, e) = 0 p(h) CF (h, e) = 1 es decir, M B(h, e) = 1 si y slo si M D(h, e) = 1, resultado que se obo tiene sin ms que recordar cmo se denen M B y M D. Por otra parte, si a o h1 y h2 son hiptesis mutuamente excluyentes y M B(h1 , e) = 1, entonces o podemos armar rotundamente que M D(h2 , e) = 1 (algo que ser util a para propagar conocimiento). evidencias independientes de la hipotesis Sea h la hiptesis considerada y e una evidencia; si e es independiente de o h (ni la apoya ni va en su contra), entonces p(h/e) M B(h, e) M D(h, e) CF (h, e) = p(h) = 0 = 0 = 0 M B(h, e) =

8.2. COMBINACION DE EVIDENCIAS diferencia entre factores de certidumbre y probabilidades condicionales Uno de los puntos ms dbiles de los modelos probabil a e sticos era el hecho de que una misma evidencia apoyaba simultneamente una hiptesis y a o su negacin, como consecuencia de la consistencia matemtica de tales o a modelos (p(h/e) + p(h/e) = 1). Este inconveniente no aparece en este modelo, cuyos autores arman textualmente . . . los factores de certidumbre de las hiptesis h y h no son o complementarios a la unidad, son opuestos entre s as si el apoyo que ; , una evidencia presta a una hiptesis es bajo, no debe ser alto el apoyo a o su negacin, sobre todo si la informacin no es completa (el apoyo a amo o bas, en ese caso debe ser bajo). Tal armacin se demuestra analizando o casos extremos: Si p(h/e) > p(h), entonces [p(h/e) = 1 p(h/e)] < [1 p(h) = p(h)], de modo que M B(h, e) = 0 M D(h, e) > 0 M B(h, e) > 0 M D(h, e) = 0 pero CF (h, e) = M B(h, e) M D(h, e) = = 0 [p(h) p(h/e)] [p(h) p(h/e)] = = p(h) p(h) 1 p(h/e) 1 + p(h) p(h) p(h/e) = = 1 p(h) 1 p(h)

97

= M B(h, e) = CF (h, e) por lo que CF (h, e) = CF (h, e). El mismo resultado se obtiene si consideramos el otro caso extremo, en el que p(h) > p(h/e).

8.2.

Combinacin de Evidencias o

Cmo manejar los factores de certidumbre? En el caso concreto de una unica evidencia o la respuesta es clara: Se indicar un valor mayor que cero y menor o igual a uno si la evidencia a en cuestin apoya la hiptesis. o o Se indicar un valor menor que cero, pero mayor o igual a menos uno, si a la evidencia en cuestin va en contra de la hiptesis. o o

98

CAP ITULO 8. FACTORES DE CERTIDUMBRE Se indicar un valor igual a cero si se estima que la evidencia encontrada a no tiene nada que ver con la hiptesis considerada. o

El problema, no obstante, se complica cuando hay ms de una evidencia relativa a a una misma hiptesis. En ese caso hablamos de combinacin de evidencias que afectan a o o una misma hiptesis. El problema planteado puede formularse en los siguientes trminos: o e Sea un conjunto de reglas, todas ellas con la misma conclusin, cada una de las cuales o viene afectada de un factor de certidumbre diferente, cul es el factor de certidumbre a resultante, considerando toda la evidencia? if e1 then H with CF (H, e1 ) if e2 then H with CF (H, e2 ) ... if en then H with CF (H, en ) Los factores de certidumbre de las distintas reglas pueden interpretarse como las potencias evidenciales de las relaciones causales correspondientes: e1 e2 en
CF (H,e1 )

...

H H H

CF (H,e2 )

CF (H,en )

Cada una de las evidencias contribuye, favorable o desfavorablemente, al establecimiento de la veracidad de la hiptesis considerada. El problema estriba en encontrar una o formulacin adecuada que permita evaluar CF (H, E) donde E = e1 e2 . . . en (toda o la evidencia). Shortlie y Buchanan proponen una primera aproximacin para la combinacin eno o tre pares de evidencias que se reeren a la misma hiptesis, considerando los tres casos o posibles: 1. Si e1 y e2 contribuyen positivamente a la veracidad de la hiptesis H, o entonces CF (H, e1 ) > 0 CF (H, e2 ) > 0 CF (H, e1 e2 ) = CF (H, e1 ) + CF (H, e2 ) [CF (H, e1 ) CF (H, e2 )] (se resta la interseccin para no tenerla en cuenta dos veces) o 2. Si e1 y e2 contribuyen negativamente a la veracidad de la hiptesis H, o entonces CF (H, e1 ) < 0 CF (H, e2 ) < 0 CF (H, e1 e2 ) = CF (H, e1 ) + CF (H, e2 ) + [CF (H, e1 ) CF (H, e2 )]

8.2. COMBINACION DE EVIDENCIAS 3. Si e1 contribuye positivamente a la veracidad de la hiptesis H y e2 o contribuye negativamente, entonces CF (H, e1 ) > 0 CF (H, e2 ) < 0 CF (H, e1 ) CF (H, e2 ) < 0 CF (H, e1 e2 ) = CF (H, e1 ) + CF (H, e2 ) (se impone el que ms inuya) a

99

Esta primera aproximacin es coherente con la idea de que, ante la posibilidad de o informacin incompleta, el efecto conjunto de dos evidencias debe ser igual a la suma de o sus efectos por separado menos su efecto conjunto (en el caso de contribucin positiva). En o otras palabras, nos previene de la hipottica situacin de que ambas evidencias pudieran e o no ser completamente independientes (caso en el que la mencionada interseccin ser o a no vac a). Adems, las expresiones anteriores son directamente generalizables, pues si en lugar de a dos evidencias tenemos n, todas ellas (por ejemplo) con CF s mayores que cero, el efecto conjunto de todas ellas sobre la hiptesis H responde a la expresin o o
n n n

CF (H, E) =
i

CFi
i<j
i

CFi CFj +
i<j<k
i

CFi CFj CFk . . .

(obsrvese la alternancia de signos, que asegura que eliminamos las componentes de e interseccin, y que las sucesivas condiciones de las sumas evitan duplicar los productos o de los factores de certidumbre involucrados). Esta aproximacin parece razonable y no tiene ninguna sura terica. No obstante, o o fueron los propios Shortlie y Buchanan quienes inmediatamente propusieron un modelo alternativo debido a la falta de asociatividad de la formulacin y sus consecuencias. o En primer lugar, el orden en que aparecen las evidencias modica considerablemente el resultado nal, aunque ello puede ser una ventaja en dominios en los que hay relaciones temporales y para los que el orden de aparicin de las evidencias es realmente importano te. La segunda objecin tiene que ver con la gran sensibilidad de la formulacin ante la o o aparicin de evidencias contradictorias en estados avanzados del proceso de razonamiento. o Ni Shortlie ni Buchanan consideraron aceptable esta situacin y propusieron una o segunda aproximacin que paliaba estas deciencias: o Si CF (H, e1 ) > 0 y CF (H, e2 ) > 0, entonces CF (H, e1 e2 ) = CF (H, e1 ) + CF (H, e2 ) [CF (H, e1 ) CF (H, e2 )] Si CF (H, e1 ) < 0 y CF (H, e2 ) < 0, entonces CF (H, e1 e2 ) = CF (H, e1 ) + CF (H, e2 ) + [CF (H, e1 ) CF (H, e2 )]

100

CAP ITULO 8. FACTORES DE CERTIDUMBRE Si CF (H, e1 ) CF (H, e2 ) < 0, entonces CF (H, e1 e2 ) = CF (H, e1 ) + CF (H, e2 ) 1 min{|CF (H, e1 )|, |CF (H, e2 |}

Esta nueva forma de combinar evidencias referidas a una misma hiptesis s que es o asociativa y, por lo tanto, las evidencias se pueden considerar en cualquier orden sin que el resultado nal se vea afectado2 . Adems presenta la ventaja de permitir modelia zar procesos de razonamiento sin tener que almacenar expl citamente los M Bs y los M Ds. Quedan, no obstante, algunos problemas por resolver. Por ejemplo, el modelo supone impl citamente independencia condicional de las evidencias. Por ello, si e1 implica lgicao mente a e2 , entonces CF (H, e1 e2 ) deber ser igual a CF (H, e1 ), pero de la aplicacin a o del modelo no se deduce este resultado, lo que constituye un problema no resuelto de la combinacin de evidencias. Al respecto, Shortlie y Buchanan proponen algunas alternao tivas como estructurar muy bien las bases de conocimientos o agrupar en una sola regla clusulas con evidencias condicionalmente dependientes. En todo caso, tales soluciones a pertenecen ms al mbito de la ingenier del conocimiento que al de la IA. a a a

8.3.

Propagacin de Incertidumbre o

Hasta ahora hemos considerado que la evidencia relacionada con una hiptesis era un o hecho (a favor o en contra de la hiptesis) que no ven afectado de incertidumbre. Por o a ello, el factor de certidumbre correspondiente CF (h, e) pod ser interpretado como la a potencia evidencial de la implicacin e h de forma que o si CF (h, e) = 1, la evidencia e implica lgicamente a la hiptesis h o o si CF (h, e) = 1, la evidencia e implica lgicamente a la negacin de la o o hiptesis h o si CF (h, e) = 0, la evidencia e es independiente de la hiptesis h o Sin embargo, cuando tratamos de representar conocimiento para luego llevar a cabo procesos de razonamiento, lo ms normal y lo ms correcto es tratar de establecer relaa a ciones causales basadas en hechos inciertos. Es decir, si establecemos la relacin causal o imprecisa si e entonces h con CF (h, e) la imprecisin asociada est referida a la implicacin subyacente (siempre que tengamos o a o e podremos concluir h con una incertidumbre asociada dada por el facor de certidumbre); lo normal, sin embargo, es que en los problemas reales la propia evidencia venga afectada de una cierta imprecisin, que en el curso de un proceso inferencial contribuir a modicar o a la incertidumbre de las conclusiones alcanzadas.
2

Es el denominador el que convierte el modelo en asociativo prescindiendo de la relacin de orden. o

8.3. PROPAGACION DE INCERTIDUMBRE

101

Ntese que hay una sutil diferencia entre imprecisin e incertidumbre. La impreo o cisin es una caracter o stica que afecta a las entidades, hechos y/o datos del dominio, mientras que la incertidumbre es una caracter stica ligada a los procesos de razonamiento. En cualquier caso, si basamos nuestro proceso de razonamiento en hechos imprecisos, las conclusiones que obtengamos sern inciertas, no podrn establecerse con total a a certidumbre. Y esto justamente es uno de los problemas ms cruciales de la IA: la proa pagacin de la incertidumbre3 . o Este problema surge, fundamentalmente, por dos circunstancias que pueden darse aislada o conjuntamente: La propia evidencia es imprecisa La evidencia considerada es consecuencia de otra regla y forma parte de un proceso de razonamiento que supone varias inferencias (arrastra la imprecisin) o Shortlie y Buchanan proponen un esquema en el que la primera circunstancia puede considerarse como un caso particular de la segunda. De este modo, si tenemos si E entonces E con CF (E, E ) = x y si E entonces H con CF (H, E) = y se genera el circuito inferencial E E H y para resolverlo postulan CF (H, E ) = CF (H, E) max[0, CF (E, E )] Esta formulacin presenta una dicultad no prevista: cuando CF (E, E ) es menor que o cero y por tanto E apoya la negacin de E, la ecuacin proporciona un CF (H, E ) = 0 o o que impide armar nada (ni positivo ni negativo) sobre la hiptesis considerada4 . o Este inconveniente del modelo fue estudiado por Heckerman, disc pulo de Shortlie y Buchanan, quien propuso una formulacin alternativa basndose en el siguiente razoo a namiento: Dado que CF (E, E ) = CF (E, E ), la l nea de razonamiento de nuestro circuito inferencial deber poder modicarse en los siguientes trminos a e E E H
Que est ligado al concepto de entrop de la informacin, segn el cual la informacin tiende a a a o u o degradarse en la medida que es utilizada. 4 Esto es, si hay evidencias contradictorias se contesta siempre no s. e
3

102 en lugar de

CAP ITULO 8. FACTORES DE CERTIDUMBRE

E E H para aquellos casos en los que CF (E , E) < 0. As directamente, podemos obtener el , factor de certidumbre buscado, CF (H, E ) = CF (H, E) max[0, CF (E, E )] La modicacin de Heckerman puede resumirse del siguiente modo: o CF (H, E ) = CF (h, E) CF (E, E ) CF (E, E ) 0

CF (H, E ) = CF (h, E) CF (E, E ) CF (E, E ) < 0 El esquema supuestamente alternativo de Heckerman no es, no obstante, ms que una a aplicacin estricta del modelo de Shortlie y Buchanan, que adolece por otra parte del o mismo problema que hemos comentado en relacin al esquema bayesiano: precisamente o Shortlie y Buchanan establecieron que CF (H, E) = CF (H, E) como un argumento en contra de la consistencia matemtica de los modelos estad a sticos cuando, en lugar de 5 datos, empleamos conocimiento . Un ultimo aspecto relacionado con la propagacin de incertidumbre es el relativo a o la combinacin lgica de evidencias. Recordemos que en los sistemas de produco o cin las clusulas de los antecedentes de las reglas sol estar anidadas a travs de o a an e operadores lgicos and, or y not. Cmo se obtienen los valores de expresiones como o o CF (H1 and H2 , E) o CF (H1 or H2 , E) a partir de CF (H1 , E) y CF (H2 , E) donde E es toda la evidencia del antecedente? Evidentemente, el procedimiento seguido debe pasar por evaluar primero el antecedente e inferir luego la conclusin teniendo en cuenta la potencia evidencial de la declaracin o o correspondiente. As si E representa la evidencia disponible (que puede no coincidir exac, tamente con la de la declaracin) y teniendo en cuenta la propia regla, o CF (H, E) = CF (H, [E1 and (E2 or E3 ) and E4 ]) CF ([E1 and (E2 or E3 ) and E4 ], E) expresin que tiene en cuenta simultneamente la potencia evidencial de la declaracin o a o (primer factor) y la imprecisin en la informacin disponible de acuerdo con la estructura o o del antecedente de la regla (segundo factor). Las funciones propuestas para evaluar los efectos de las conjunciones y de las disyunciones son: CF (H1 and H2 , E) = min{CF (H1 , E), CF (H2 , E)} CF (H1 or H2 , E)
5

= max{CF (H1 , E), CF (H2 , E)}

No obstante, no Shortlie ni Buchanan dan demasiada importancia a esta peculiaridad de su modelo y siguen pensando que de la armacin de un hecho no debe derivarse tambin una cuanticacin para o e o la negacin del hecho armado. o

Cap tulo 9 Teor Evidencial a


A diferencia del modelo de los factores de certidumbre de Shortlie y Buchanan, el esquema de razonamiento propuesto por Dempster y Shafer s tiene una fuerte base teri o 1 ca . Nosotros, no obstante, veremos una simplicacin notable, aunque no por ello menos o rigurosa, de la misma. El esquema de razonamiento que proponen Dempster y Shafer en su teor evidencial a es atractivo, entre otra razones: porque permite modelizar de forma sencilla la incertidumbre asociada a evidencias e hiptesis o porque permite considerar conjuntos de hiptesis sin que la conanza o depositada en cada uno de ellos tenga que ser distribuida de ningn u modo entre cada una de las hiptesis individuales del conjunto2 o porque permite reejar de forma elegante la falta de conocimiento tan frecuentemente ligada a los procesos de razonamiento porque contiene a la teor de la probabilidad como un caso particular a porque contiene a algunas de las funciones combinatorias de evidencias del modelo de los factores de certidumbre (concretamente, a aqullas que e 3 funcionan bien en el modelo de Shortlie y Buchanan) La cuestin es, cmo maneja este nuevo modelo el conocimiento inexacto y la falta o o de conocimiento?
La teor evidencial o teor de lo desconocido fue, de hecho, inicialmente, un modelo de razonaa a miento propuesto por Dempster que se convirti en toda una teor tras la formalizacin de Shafer. o a o 2 Una de las novedades, como vemos, es que el concepto de hiptesis se generaliza a grupo de hiptesis, o o de modo que lo que aqu pretende decirse es que el apoyo de una evidencia no discrimina entre ellas. 3 Es decir, funciones combinatorias donde dos o ms evidencias se reeren a la misma hiptesis, no a o cadenas de evidencias del estilo E E H, donde hemos visto que hay problemas.
1

103

104

CAP ITULO 9. TEOR EVIDENCIAL IA

9.1.

La Teor Evidencial de Dempster y Shafer a

En primer lugar, dado un universo de discurso cualquiera, se introduce el concepto de marco de discernimiento, que se dene como el conjunto nito de todas las hiptesis o que se pueden establecer en el dominio del problema, esto es, todas las posibles soluciones que se pueden dar en l (de las que se asume que una y slo una es la correcta). e o Este marco de discernimiento forma un conjunto completo, y por tanto exhaustivo, de hiptesis mutuamente excluyentes. o Por otra parte, como ya ha sido esbozado, el efecto de una determinada evidencia sobre el conjunto global de hiptesis no viene determinado por la contribucin de la conanza o o depositada en las hiptesis individuales. Por el contrario, el efecto de cada evidencia afecta o generalmente a un subconjunto de hiptesis del marco de discernimiento, planteamieno to totalmente coherente con la realidad de casi todos los problemas reales. En stos, las e evidencias prcticamente nunca conrman slo una hiptesis, sino que lo ms normal es a o o a que permitan discriminar entre grupos de hiptesis alternativas, mantenindose la incero e tidumbre entre las propias hiptesis individuales. o As pues, segn esta teor se dene u a, = {H1 , H2 , . . . , Hn } H1 , H 2 , . . . , H n A () marco de discernimiento hiptesis del marco o subconjunto cualquiera del marco conjunto de todos los subconjuntos posibles del marco (partes de)

En este contexto, la aparicin de una determinada evidencia e que favorezca a un o subconjunto A de (A ) en un determinado grado representado por me (A). Dicho me , que toma valores en el intervalo cerrado [0, 1] (me [0, 1]), es el indicativo de la conanza que la evidencia e permite depositar en A, se denomina funcin bsica de asignacin o a o de verosimilitud. Todo esto se representa: e : A = {ha , hb , hc } me (A) = x, con x [0, 1] Adems, el 1 x restante no se asigna a A, sino a , ya que no podemos saber a realmente dnde va a parar la conanza de esa evidencia, de cuant 1 x (modelo de o a incertidumbre). Visto de otro modo, en ausencia de toda evidencia se tiene que me () = 1 ya que es, por denicin, el conjunto de todas las soluciones posibles tras anlisis del o a dominio. Si entonces surge una evidencia e relativa a un A tal que me (A) = x

9.1. LA TEOR EVIDENCIAL DE DEMPSTER Y SHAFER IA entonces es lgico pensar que se reduce o me () = 1 x

105

Incluso algebraicamente, pensando en como conjunto partes de4 , si tenemos un A A () que es apoyado en x por una evidencia e, no tiene sentido realmente intentar hablar del complementario de A para asignarle la conanza 1 x. Adems, se denen las siguientes condiciones para la funcin bsica de asignacin de a o a o verosimilitud : la suma extendida a todos los subconjuntos del marco de todas las funciones de asignacin de verosimilitud vale 1 (ya que la solucin est neo o a cesariamente en el marco) m(A) = 1
A

la funcin bsica de asignacin de verosimilitud del conjunto vac vale o a o o 0 (por la misma razn anterior) o m() = 0

De manera que, volviendo a lo que comentbamos anteriormente, la forma elegante a que la teor evidencial proporcionaba para tratar la falta de conocimiento asociada a los a procesos de razonamiento, puede expresarse: e : A m(A) = x, con 0 x 1 y ya que m(A) = 1
A

el resto de la conanza que no ha sido asignada a A corresponde a m() = 1 m(A) = 1 x

Todo subconjunto del marco de discernimiento para el cual exista una evidencia e tal que verique me (A) = 0 se denomina elemento focal. As pues, puesto que la evi dencia e supone la asignacin de una conanza dada x a un determinado elemento focal o A del marco, el resto de la conanza no asignada representa la ignorancia o falta de conocimiento sobre el grado de importancia de la evidencia en relacin al elemento focal o 5 considerado y, por tanto, esa conanza no asignada 1 x debe ser asignada al propio
Cuya cardinalidad es, pues, 2# , donde # es la cardinalidad del marco. En otras palabras, se sabe que la evidencia apoya al elemento focal en un grado x, sin embargo, la conanza no asignada 1 x no sabemos si contribuye o no a A o a cualquier otro subconjunto del marco.
5 4

106

CAP ITULO 9. TEOR EVIDENCIAL IA

marco de discernimiento porque lo que s es sabido, por construccin del esquema, es que o la solucin est en l. o a e La formulacin completa de la aproximacin es la siguiente: o o = {H1 , H2 , . . . , Hn } A e me (A) marco de discernimiento elemento focal evidencia referida a A medida de asignacin bsica de o a verosimilitud de A dado e e : A m(A) = x m() = 1 x m(B) = 0 B , B = , B = A = = = =

Si el planteamiento fuese probabil stico, la misma evidencia apoyar al elemento focal a A y al complemento del mismo, p(A) = x p(A) = 1 x y recordemos que ste era uno de los aspectos ms dbiles de los modelos probabil e a e sticos. De este modo, puede armarse que el procedimiento segn el cual se maneja la falta de u informacin en la teor evidencial corrige las carencias de los modelos probabil o a sticos.

9.1.1.

Combinacin de Evidencias o

Aunque todo lo visto hasta el momento es totalmente correcto, parece claro que en problemas reales las evidencias no vienen solas. Ms an, distintas evidencias no necesaa u riamente tienen por qu referirse a los mismos elementos focales. La cuestin que ocupa e o esta seccin es, pues, la consideracin del efecto conjunto de todas las evidencias. o o Si dos (o ms) fuentes de informacin proporcionan sendas evidencias relativas a dos a o elementos focales de un mismo marco de discernimiento, las funciones de asignacin bsica o a de verosimilitud se combinan para dar una nueva funcin de asignacin bsica de verosio o a militud que representa el efecto conjunto de ambas evidencias sobre la interseccin de los o elementos focales correspondientes: e1 : A1 m1 (A1 ) = x e2 : A2 m2 (A2 ) = y m12 (C) = m1 (A1 ) m2 (A2 ) donde C = A1 A2 expresin que puede generalizarse directamente6 para distintas parejas de elementos o focales, m12 (C) =
C=Ai Bj
6

m1 (Ai ) m2 (Bj )

La funcin de distribucin de probabilidad conjunta es, como vemos, el producto. o o

9.1. LA TEOR EVIDENCIAL DE DEMPSTER Y SHAFER IA

107

formulacin que coincide con la de asignacin de probabilidad a la interseccin de dos o o o sucesos independientes en la teor clsica de la probabilidad, motivo por el que se puede a a armar que la teor evidencial asume impl a citamente independencia entre las evidencias. Por otra parte, est claro que la primera condicin exigida a la funcin de asignacin a o o o bsica de verosimilitud se cumple, a m12 (C) = 1
C=Ai Bj

Sin embargo, puede ocurrir que distintas evidencias sealen a elementos focales muy n distintos, tanto que no tengan ningn elemento en comn, y por tanto su interseccin sea u u o nula. Esto introduce una peculiaridad en el modelo: e1 : A1 m1 (A1 ) = x con 0 < x 1 e2 : A2 m2 (A2 ) = y con 0 < y 1 m12 (C) = m12 () = m1 (A1 ) m2 (A2 ) = xy = 0 donde C = A1 A2 = resultado que contradice la segunda condicin exigida a la funcin bsica de asignacin o o a o de verosimilitud, segn la que la solucin tiene que estar en el marco de discernimiento. u o Cmo se soluciona esta aparente contradiccin? Echando mano de la normalizacin, o o o a n de conseguir que esta funcin de asignacin de verosimilitud se mantenga dentro o o de los l mites denidos, lo que supone corregir las asignaciones a elementos focales de interseccin no nula, de forma que su suma siga siendo la unidad. La nueva expresin o o para la combinacin de evidencias es, nalmente, o m1 (Ai )m2 (Bj ) m12 (C) =
C=Ai Bj

m1 (Ai )m2 (Bj ) =


C=Ai Bj

1
Ai Bj =

m1 (Ai )m2 (Bj )

m1 (Ai )m2 (Bj )


Ai Bj =

La expresin del denominador K = o


Ai Bj =

m1 (Ai )m2 (Bj ) es una medida de la com-

patibilidad existente entre las evidencias que estn siendo combinadas que se denomina a grado de conicto. As en la expresin , o m1 (Ai )m2 (Bj ) m12 (C) = el factor
C=Ai Bj

1K

1 se denomina factor de normalizacin. o 1K

108

CAP ITULO 9. TEOR EVIDENCIAL IA

Dmonos cuenta de que cuando las distintas evidencias sealan a distintos elementos e n focales entre los que no hay intersecciones nulas, no se puede hablar de evidencias contradictorias, no se dan conictos, K = 0 y la expresin normalizada para m12 (C) coincide o con la expresin sin normalizar. Por el contrario, cuando las evidencias son totalmente o contradictorias (cada evidencia apoya totalmente a una hiptesis -o grupo de - particular o y distinta) y todos los elementos focales son disjuntos entre s el conicto es total, K = 1 , y la combinacin de evidencias no est denida. o a

9.1.2.

Credibilidad, Plausibilidad e Intervalo de Conanza

La teor evidencial permite el seguimiento de la evolucin dinmica de la conanza a o a depositada en los subconjuntos del marco de discernimiento a medida que aparecen nuevas evidencias. Para ello se denen dos nuevas medidas, la credibilidad y la plausibilidad que son indicadores de la m nima y mxima conanza que podemos depositar en un a elemento focal dado y se denen: Credibilidad Cr(A) =
BA

m(B)

Plausibilidad

P l(A) =
BA=

m(B)

La credibilidad es una medida de las contribuciones que todos los subconjuntos de A (elemento focal considerado, subconjunto del marco de discernimiento) ejercen sobre el propio A. Por su parte, la plausibilidad considera tambin las contribuciones de otros e subconjuntos con interseccin no nula, es decir, no slo tiene en cuenta los subconjuntos o o del propio elemento focal, sino tambin todas las contribuciones de todos aquellos sube conjuntos que tienen algo que ver con dicho elemento A. Una tercera medida importante es el llamado intervalo de conanza, que se construye, para cada elemento focal, a partir de la credibilidad y de la plausibilidad. As en , cada nivel del proceso de razonamiento, el intervalo de conanza es el segmento del espacio numrico [0, 1] que tiene como valor m e nimo el valor de la credibilidad del elemento focal y como valor mximo el correspondiente valor de la plausibilidad. El intervalo de a conanza representa la incertidumbre asociada al elemento focal considerado. Cuanto ms a cerca se encuentren los valores de credibilidad y plausibilidad, menos incertidumbre hay respecto a la conanza (ms estrecho es el intervalo). a La evolucin de la credibilidad en y plausibilidad de un elemento focal a medida que o van apareciendo evidencias se comporta de la siguiente manera: Con una sola evidencia, la credibilidad de un elemento focal coincide exactamente con la medida de asignacin bsica de verosimilitud, mientras o a que la plausibilidad es igual a 1. A medida que aparecen evidencias, la credibilidad se reajusta segn las u frmulas que se han indicado, del mismo modo que la plausibilidad. o

9.1. LA TEOR EVIDENCIAL DE DEMPSTER Y SHAFER IA Se puede demostrar que si A es un elemento focal: 0 0 Cr(A) Cr(A) Cr(A) 1 P l(A) 1 P l(A) P rob(A) P l(A)

109

donde P rob(A) es la probabilidad estad stica. Es decir, en el caso en que Cr(A) = P l(A) la formulacin de Dempster y Shafer contiene exactamente a (produce los mismos o resultados que) la teor de la probabilidad. a Credibilidad y plausibilidad se pueden usar, pues, para medir la evolucin de la incero tidumbre a lo largo del tiempo (con la aparicin de evidencias, al reasignar la conanza, o se redistribuye la ignorancia entre los diferentes elementos focales del marco de discernimiento). As , Si Si Si Si Cr(A) Cr(A) Cr(A) Cr(A) = = = = 0 y P l(A) P l(A) P l(A) P l(A) = 1 = 1 = 0 = 05 entonces entonces entonces entonces la incertidumbre sobre A es total A es absolutamente cierto A es absolutamente falso es absolutamente cierto que no se sabe nada

siendo los tres ultimos casos ejemplos de certidumbre completa.

9.1.3.

Casos Particulares de la Teor Evidencial a

La teor evidencial contiene, bajo ciertos supuestos y en ciertas situaciones, al modelo a de los factores de certidumbre de Shortlie y Buchanan. Ms concretamente, la teor a a evidencial funcional igual que el modelo de Shortlie y Buchanan en aquellos casos en los que ste funciona bien (evidencias independientes que apoyan el mismo elemento focal e hiptesis), y lo mejora notablemente cuando el modelo de los factores de certidumbre o presenta carencias (casos de dependencia de evidencias).

110

CAP ITULO 9. TEOR EVIDENCIAL IA

Cap tulo 10 Conjuntos Difusos


En este mundo nada es verdad y nada es mentira, todo es segn el color del u cristal con que se mira. Refranero popular espaol. n Esta es la nocin de conjuntos difusos, para los que la descripcin de objetos y eno o tidades del mundo real debe realizarse segn los criterios ling u usticos propios de los seres humanos, que son en su mayor ambiguas. a Esta ambigedad es, no obstante, una caracter u stica esencial no slo del lenguaje sino o de los procesos de clasicacin, establecimiento de taxonom y jerarqu e incluso de o as as los procesos de razonamiento. Adems, la ambigedad no slo puede surgir de las dea u o niciones de las cosas, sino que puede ser de carcter subjetivo e incluso debida al contexto. a De modo que los conjuntos ordinarios, en los que un elemento del universo determinado pertenece o no pertenece al conjunto, no nos bastan para representar el conocimiento habitualmente empleado, y mucho menos para razonar con l. Las Matemticas y la IA, e a no pod quedar al margen de esta peculiaridad, y en 1965 Lofti Zadeh hizo pblicos sus an u trabajos relacionados con el tema en su famoso art culo Fuzzy Sets.

10.1.

Aspectos Generales de los Conjuntos Difusos

Un conjunto ordinario puede denirse como una coleccin de elementos1 . Si un eleo mento del universo est representado en la coleccin, el elemento en cuestin pertenece a a o o dicho conjunto. En estos casos se puede decir que el grado de pertenencia de un elemento cualquiera del universo de discurso o referencial tiene un valor booleano, de forma que:
1

si el elemento pertenece al conjunto, el valor booleano es 1 si el elemento no pertenece al conjunto, el valor booleano es 0

Hay tres maneras de denir un conjunto: por descripcin, por enumeracin y, como veremos en este o o tema, a travs de una funcin de pertenencia. e o

111

112

CAP ITULO 10. CONJUNTOS DIFUSOS

De este modo, puede construirse una funcin f , para conjuntos ordinarios una funo cin booleana, tal que dado un elemento s del referencial U y dado un subconjunto A U : o fA (x) = 1 x A fA (x) = 0 x A / Ampliaremos ahora la cuestin a ese tipo especial de conjuntos que hemos denominado o conjuntos difusos. En su caso dec amos que matices de carcter ling a ustico, subjetivo, etc. nos imped establecer con claridad el grado de pertenencia de algunos elementos an del referencial al conjunto difuso considerado. As habr elementos del referencial que cla, a ramente pertenezcan al conjunto, habr otros que claramente no pertenezcan y habr un a a tercer tipo de elementos que pertenezcan en cierto grado. Debemos entonces considerar que la funcin f adopta los siguientes valores, dado un o elemento x del referencial U y un subconjunto difuso A U : fA (x) = 1 x A fA (x) = 0 x A / 0 < fA (x) < 1 x pertenece en cierto grado a A La funcin f cuantica del algn modo el grado de pertenencia de un elemento del o u referencial al conjunto difuso considerado. As un conjunto difuso es aqul en el que , e no existe una frontera clara entre la pertenencia y la no pertenencia de determinados elementos del referencial. Del mismo modo, podemos apreciar que los conjuntos ordinarios son un caso particular de los conjuntos difusos. Para establecer los l mites difusos del conjunto correspondiente vamos a necesitar criterios, que casi siempre van a ser arbitrarios, aunque el problema de la denicin de o criterios para la fuzzycacin (difuminacin) de conjuntos no es trivial. o o Por otra parte, la aproximacin difusa no es muy natural en trminos ling o e usticos, con lo cual nos encontramos ante un nuevo problema, el de la clasicacin ling o ustica con conjuntos difusos. Al respecto, la idea bsica es que, una vez hemos sido capaces de a segmentar el espacio numrico indicativo de los grados de pertenencia de los elementos e del referencial al subconjunto difuso considerado, debemos segmentar tambin el espae cio ling ustico, estableciendo un conjunto determinado de etiquetas dotadas de contenido semntico, y hacer corresponder a cada etiqueta ling a ustica un intervalo numrico cone creto segn un criterio m u nimamente razonable. Existen estudios tericos que tratan de o demostrar que la mxima imprecisin ling a o ustica puede conseguirse a travs de una escala e 2 semntica formada por no ms de nueve elementos literales . a a En resumen, la fuzzycacin de un conjunto pasa por los siguientes puntos: o Identicar las propiedades del conjunto y elegir una de ellas como caracter stica.
As como en el tema anterior ve amos que el nmero de etiquetas ling u usticas deb ser un nmero a u impar, debido a la escala (1, 0, 1), en este caso no es necesario porque la gradacin es arbitraria y suave. o
2

10.1. ASPECTOS GENERALES Denir criterios de pertenencia. Caracterizar el espacio difuso. Normalizar ling usticamente.

113

Por ultimo, debemos notar una serie de aspectos relacionados con este tratamiento:

La funcin fA (x) denida para la zona difusa no tiene por qu ser lineal, o e aunque es necesario que sea continua. La escala ling ustica asociada al espacio numrico, aunque es arbitraria, e depende del tipo de clasicacin que queremos obtener. o El nmero de elementos semnticos de la escala ling u a ustica tambin es e arbitrario. En algunos casos es posible denir conjuntos difusos ling usticamente complementarios que hagan ms natural la expresin verbal. a o Cualquier conjunto, sea cual sea su naturaleza, es difuminable, es decir, se puede establecer una gradacin entre los niveles de pertenencia de diso tintos elementos de un referencial con respecto al conjunto considerado.

fA(x)

A="ser joven"

Zona Difusa

0 0 25 65 Edad(x)

fA(x) =1 para todo x/Edad(x)<25 fA(x) =0 para todo x/Edad(x)>65 65Edad(x) fA(x) = para todo x/Edad(x) en [25,65] 6525

Figura 10.1: Ejemplo de funcin de pertenencia a un conjunto difuso. o

114

CAP ITULO 10. CONJUNTOS DIFUSOS

10.2.

Caracterizacin y Nomenclatura o de Conjuntos Difusos

Cualquier conjunto, sea difuso u ordinario, tiene que poder ser descrito de manera conveniente. En el caso de los conjuntos ordinarios, dado que se puede establecer sin ambigedades la correspondiente relacin de pertenencia de los elementos del referencial u o al conjunto considerado, resulta equivalente caracterizar al conjunto en cuestin en funcin o o de su dominio o haciendo expl citos los elementos que lo constituyen. Por otra parte, ya hemos visto que para cada elemento de un referencial dado, podemos denir una funcin f (de carcter booleano en el caso de conjuntos ordinarios) tal que a o a cada elemento del referencial le asignar su valor lgico correspondiente, 0 1, segn el a o o u elemento en cuestin pertenezca o no al conjunto. De modo que: o Dado un referencial U y un subconjunto del mismo A U , fA (x) = 1 x A = 0 xA / Aplicando este criterio al conjunto ordinario A = 2, 4, 6, 8 (conjunto de los naturales pares menores que diez), A estar perfectamente determinado con la expresin: a o fA (x) = fA (1) = 0 + fA (2) = 1 + fA (3) = 0 + fA (4) = 1 + . . . donde + se lee y. Otra expresin equivalente, ms simplicada, es: o a fA (x) = 0/1 + 1/2 + 0/3 + 1/4 + 0/5 + 1/6 + . . . donde se presentan los valores de la funcin grado de pertenencia frente a los elementos o del referencial considerado. Por lo tanto, un subconjunto ordinario A de un referencial U puede ser descrito: Impl citamente. Expl citamente. Mediante una fA (x) booleana x U . Por razones obvias, cuando trabajemos con conjuntos difusos preferiremos emplear descripciones impl citas o utilizar las funciones de grado de pertenencia. En este ultimo caso, tendremos en cuenta que se pierde el carcter booleano de la mencionada funcin: a o A U tal que A es difuso fA (x)/fA (x) : U [0, 1]x U es decir, la funcin fA (x) puede tomar cualquier valor en el intervalo [0, 1]. o

10.3. ESTRUCTURA ALGEBRAICA

115

Como veremos ms adelante, esta forma de nombrar a los conjuntos difusos nos lleva a directamente a establecer que los conjuntos ordinarios son un caso particular de los conjuntos difusos (como ya hab amos mencionado), aunque no tienen la misma estructura algebraica (como demostraremos).

10.3.

Estructura Algebraica de los Conjuntos Difusos

Para investigar la estructura algebraica de los conjuntos difusos se tienen que vericar un conjunto de propiedades, que trataremos de establecer y desarrollar a continuacin. o Conjunto vac o Sea un referencial U y sea Z U tal que fZ (x) : U [0, 1] x U
3

decimos que Z = fZ (x) = 0 x U

Identidad Sea un referencial U y sean Z U y B U tales que fA (x) : U [0, 1] x U fB (x) : U [0, 1] x U decimos que A = B fA (x) = fB (x) x U Complementariedad Sea un referencial U y sea A U tal que fA (x) : U [0, 1] x U decimos que A = Ac fA (x) = 1 fA (x) x U Obviamente, fA (x) : U [0, 1].
3

Expresin que dene a Z como conjunto difuso (p.examen). o

116 Inclusin o

CAP ITULO 10. CONJUNTOS DIFUSOS

Sea un referencial U y sean A U y B U tales que fA (x) : U [0, 1] x U fB (x) : U [0, 1] x U decimos que B A fB (x) fA (x) x U caracterizacin que es totalmente anloga a la que obtendr o a amos si considersemos a conjuntos ordinarios y los describisemos con notacin difusa. e o Unin o Sea un referencial U y sean A U , B U y C U tales que fA (x) : U [0, 1] x U fB (x) : U [0, 1] x U fC (x) : U [0, 1] x U decimos que C = A B fC (x) = max{fA (x), fB (x)} x U algo que es intuitivo en conjuntos ordinarios pero no tanto con conjuntos difusos. La unin se puede denotar tambin como fA (x)orfB (x) = fA (x) fB (x) o simplemente o e fA orfB y puede demostrarse que tiene la propiedad asociativa. Interseccin o Sea un referencial U y sean A U , B U y C U tales que fA (x) : U [0, 1] x U fB (x) : U [0, 1] x U fC (x) : U [0, 1] x U decimos que C = A B fC (x) = min{fA (x), fB (x)} x U La interseccin se puede denotar tambin como fA (x)andfB (x) = fA (x) fB (x) o o e simplemente fA andfB y puede demostrarse que tiene la propiedad asociativa. Leyes de DeMorgan Sea un referencial U y sean A U y B U tales que fA (x) : U [0, 1] x U fB (x) : U [0, 1] x U Las leyes de DeMorgan establecen (y se puede demostrar) que:

10.3. ESTRUCTURA ALGEBRAICA El complementario de la unin equivale a la interseccin de los compleo o mentarios: (A B) = A B El complementario de la interseccin equivale a la unin de los compleo o mentarios: (A B) = A B Leyes Distributivas Los conjuntos difusos verican tambin las leyes distributivas: e Distributividad de la interseccin respecto de la unin: o o Dado un referencial U y dados A U , B U y C U tales que fA (x) : U [0, 1] x U fB (x) : U [0, 1] x U fC (x) : U [0, 1] x U se cumple que C (A B) = (C A) (C B) Distributividad de la unin respecto de la interseccin: o o Dado un referencial U y dados A U , B U y C U tales que fA (x) : U [0, 1] x U fB (x) : U [0, 1] x U fC (x) : U [0, 1] x U se cumple que C (A B) = (C A) (C B)

117

Segn lo visto hasta ahora todo parece indicar que los conjuntos difusos tienen esu tructura de lgebra de Boole; sin embargo, hay dos leyes del lgebra de Boole que los a a conjuntos difusos no satisfacen, que son el principio de no contradiccin y la ley del o tercero exclu do: Ley del Tercero Exclu do Dado un referencial U y dado A U , donde A es ordinario, se cumple que AA =U Sin embargo, si A es un conjunto difuso, es decir, fA (x) : U [0, 1] x U , A A fA fA = max{fA (x), fA (x)} = max{fA (x), 1 fA (x)} x U que es siempre mayor o igual a
1 2

pero no necesariamente 1.

118 Principio de No Contradiccin o

CAP ITULO 10. CONJUNTOS DIFUSOS

Dado un referencial U y dado A U , donde A es ordinario, se cumple que AA = Sin embargo, si A es un conjunto difuso, es decir, fA (x) : U [0, 1] x U , A A fA fA = min{fA (x), fA (x)} = min{fA (x), 1 fA (x)} x U que es siempre menor o igual a
1 2

pero no necesariamente 0.

10.4.

Operaciones Algebraicas con Conjuntos Difusos

El desarrollo efectuado hasta ahora nos permite describir algunas operaciones algebraicas que podemos realizar con conjuntos difusos. La descripcin de tales operaciones o se realizar a partir de las correspondientes funciones de grado de pertenencia. a Producto Sea un referencial U y sean A U y B U tales que fA (x) : U [0, 1] x U fB (x) : U [0, 1] x U denimos A B fAB (x) = fA (x) fB (x) x U Se verica que el producto de conjuntos ordinarios coincide con su interseccin, mieno tras que en el caso de los conjuntos difusos se observa que fAB (x) fAB (x) x U es decir, el producto es ms restrictivo que la interseccin. a o Suma y Suma Acotada Sea un referencial U y sean A U y B U tales que fA (x) : U [0, 1] x U fB (x) : U [0, 1] x U denimos A + B fA+B (x) = fA (x) + fB (x) x U La suma de conjuntos difusos slo est denida cuando fA (x) + fB (x) 1 x U . o a Para evitar este problema se dene la suma acotada A| + |B fA|+|B (x) = min{1, fA (x) + fB (x)} x U

10.5. REP. DEL CONOCIMIENTO Y RAZONAMIENTO DIFUSO Diferencia y Diferencia Absoluta Sea un referencial U y sean A U y B U tales que fA (x) : U [0, 1] x U fB (x) : U [0, 1] x U denimos A B fAB (x) = fA (x) fB (x) x U

119

La diferencia de conjuntos difusos slo est denida cuando fB (x) fA (x) x U , o a es decir, slo se puede establecer cuando B A. Para evitar este problema se dene la o diferencia absoluta |A B| f|AB| (x) = |fA (x) fB (x)| x U N cleo u Sea un referencial U y sea A U tal que fA (x) : U [0, 1] x U denimos nucleo(A) = NA = {x U/fA (x) = 1} Un conjunto difuso se dice normalizado si tiene ncleo. u Relacin difusa o Dado un referencial U denimos una relacin difusa de orden n en U como un cono o junto difuso A en el espacio U U . . . U caracterizado por una funcin de grado de pertenencia del tipo
n veces

fA (x1 , x2 , . . . , xn ) x U

10.5.

Representacin del Conocimiento o y Razonamiento Difuso

Iniciaremos ahora una aproximacin a la representacin del conocimiento y el razonao o miento difusos. En las frases del lenguaje natural podemos reconocer predicados difusos, cuanticadores difusos e incluso probabilidades difusas (no numricas). Las aproximacioe nes ms convencionales usualmente empleadas para representar conocimiento (modelos a basados en lgica de primer orden o en las teor clsicas de la probabilidad) carecen de o as a medios para representar ecazmente el signicado de conceptos difusos y no permiten por tanto manipular correctamente el conocimiento de sentido comn. La causa evidente es u fundamentalmente que el conocimiento derivado del sentido comn es lxicamente impreu e ciso y de naturaleza no categrica. o

120

CAP ITULO 10. CONJUNTOS DIFUSOS

Las caracter sticas estudiadas de los conjuntos difusos nos dan pistas sobre la que ser una manera ms adecuada de proceder, si lo que queremos es aplicar esquemas de a a representacin del conocimiento y modelos de razonamiento basados en lgica difusa: o o En lgica difusa el razonamiento categrico es un caso particular del o o razonamiento aproximado. En lgica difusa todo es una cuestin de grado. o o Cualquier sistema lgico puede ser fuzzycado. o En lgica difusa el conocimiento debe ser interpretado como una coleccin o o de restricciones difusas que operan sobre una coleccin de variables. o En lgica difusa los problemas de razonamiento (y por tanto los procesos o inferenciales) deben interpretarse como propagaciones de las restricciones difusas.

La cuestin es: cmo podr o o amos representar en un sistema difuso una declaracin del o tipo Si x es A, entonces y es B, donde A es un subconjunto difuso de un referencial U y B es un subconjunto difuso de un referencial V (que puede ser igual o distinto a U ) y x U , y V ? La respuesta no es unica y varios autores proponen distintas soluciones. Zadeh, por su parte, sugiere que la funcin de grado de pertenencia de una declaracin o o de este tipo puede calcularse: fA B(x, y) = A | + |B = min{1, 1 fA (x) + fB (y)} x U, y V As se introduce el mecanismo de inferencia conocido como modus ponens, que gene ralizado para conjuntos difusos se puede representar: A -> B a -------b

donde a se parece a A pero no es A y b se parece a B pero no es B. As la expresin , o para calcular fB (y) es: fb (y) = supV [A | + |B] a A U, a U, B V, b V

por lo que fb (y) = supV [min{min{1, 1 fA (x) + fB (y)}, fa (x)}] x U, y V . No obstante, el modus ponens es la unica diferencia en el razonamiento de los sistemas difusos frente al razonamiento en sistemas ms clsicos y convencionales. a a

10.5. REP. DEL CONOCIMIENTO Y RAZONAMIENTO DIFUSO Certeza

121

En sistemas que utilizan lgica bivalente la verdad de una declaracin slo puede teo o o ner dos valores: cierta o falsa. Por el contrario, en sistemas multivaluados la verdad de una declaracin puede ser un elemento de un conjunto nito, un intervalo o un lgebra o a de Boole. Particularmente, en lgica difusa la verdad de una declaracin puede ser un o o subconjunto difuso parcialmente ordenado, pero normalmente se asume la existencia de un subconjunto difuso del intervalo [0, 1] o, dicho de otro modo, un punto de dicho intervalo. As los denominados valores ling , usticos de la verdad de una declaracin pueden o expresarse por medio de etiquetas del tipo cierto, muy cierto, no exactamente cierto, . . . , correspondientes a subconjuntos difusos del mencionado intervalo. Predicados En sistemas bivalentes los predicados son categricos, pero en sistemas difusos los o predicados son, precisamente, difusos. Modicadores En sistemas clsicos el unico modicador realmente utilizado es la negacin not. En a o sistemas difusos hay una gran variedad de modicadores (muy, ms, bastante,. . . ) que son a esenciales para generar los valores apropiados de las variables ling usticas involucradas en un proceso. Cuanticadores En los sistemas clsicos hay unicamente dos cuanticadores, el universal y el existena cial. En los sistemas difusos, por el contrario, encontramos una gran variedad de cuanticadores (pocos, bastantes, normalmente, la mayor . . ). a,. Probabilidades En los sistemas lgicos clsicos la probabilidad es numrica. En los sistemas difusos, o a e la probabilidad se expresa por medio de etiquetas ling usticas (probabilidades difusas: plausible, poco probable, alrededor de,. . . ). El manejo de tales probabilidades difusas debe efectuarse a travs de la aritmtica difusa. e e Posibilidades A diferencia de en los sistemas lgicos clsicos, el concepto de posibilidad en los sisteo a mas difusos no es bivalente. De hecho, al igual que con las probabilidades, las posibilidades pueden ser tratadas como variables ling usticas que adoptan valores del tipo casi imposible, bastante posible,. . .

122

CAP ITULO 10. CONJUNTOS DIFUSOS

Modos de razonamiento: Razonamiento Categrico o El Razonamiento Categrico utiliza declaraciones difusas, pero no emplea ni cuantio cadores difusos ni probabilidades difusas (son predicados categricos sobre declaraciones o difusas, cuyos predicados de conclusin son difusos, conjuncin de las premisas anteriores). o o Modos de razonamiento: Razonamiento Silog stico El Razonamiento Silog stico produce inferencias con premisas que incorporan cuanticadores difusos (y utilizan por tanto aritmtica difusa para la obtencin de sus conclue o siones). Modos de razonamiento: Razonamiento Disposicional En el Razonamiento Disposicional las premisas son disposiciones y la conclusin obo tenida es una mxima que debe interpretarse como un mandato disposicional. a Modos de razonamiento: Razonamiento Cualitativo Por ultimo, el Razonamiento Cualitativo se dene en sistemas difusos como un modo de razonamiento en el cual las relaciones de entrada/salida de un sistema se representan por medio de una coleccin de reglas difusas (tipo IF-THEN) en las que los antecedentes y o los consecuentes incluyen variables ling usticas. Este tipo de razonamiento es el empleado habitualmente en las aplicaciones de la lgica difusa al anlisis de sistemas y control de o a procesos.

Actualmente la aplicacin de los conjuntos difusos a los sistemas inteligentes es un o tema de gran inters en investigacin. De todas formas, aunque las bases tericas del e o o formalismo difuso estn bastante claras, su aplicacin a sistemas de naturaleza inferencial a o encuentra problemas que hoy en d siguen sin estar resueltos. S parece, no obstante, que a los sistemas difusos aplicados a problemas de control estn proporcionando soluciones a alternativas y de gran brillantez y elegancia frente a planteamientos ms tradicionales. a

Cap tulo 11 Introduccin a la Ingenier del o a Conocimiento


Como ciencia, hemos visto que la IA trata de desarrollar el vocabulario y los conceptos que permiten ayudar a comprender, y en ocasiones a reproducir, comportamiento inteligente. Como ingeniera, trata de denir y formalizar un conjunto de mtodos que nos e permitan adquirir conocimiento de algo nivel y representarlo segn un esquema computau cionalmente ecaz, para resolver problemas dif ciles en dominios de aplicacin concretos. o Es decir, la IA como ciencia desarrolla modelos, y como ingenier del conocimiento a los aplica para tratar de resolver problemas intelectualmente complicados. Los programas resultantes de la aplicacin de tcnicas de ingenier del conocimiento se denominan o e a Sistemas Expertos.

11.1.

Caracter sticas Generales de los Sistemas Expertos

Los Sistemas Expertos son programas inteligentes diseados para asistir a los expern tos humanos en dominios del mundo real, limitados en extensin, pero intelectualmente o dif ciles. Tratan de modelizar en un programa el conocimiento y el modo de razonar de los expertos humanos, por lo que no tienen por qu proponer las mismas soluciones a los e mismos problemas ni se les debe exigir que proporcionen la mejor solucin, sino que o basta con que sea aceptable. Desde una perspectiva estructural, los Sistemas Expertos no slo representan al doo minio que tratan de modelizar, sino que tambin deben conservar representaciones de su e propia estructura interna y su funcionamiento. Esta ultima caracter stica, el autoconocimiento, es la que permite a los sistemas expertos justicar sus conclusiones, explicar sus procesos de razonamiento e incrementar dinmicamente el conocimiento que poseen. a Para conseguir avances en estos puntos, la Ingenier del Conocimiento ha sugerido y a sugiere arquitecturas que separan claramente los conocimientos del dominio de los mecanismos de inferencia y control.

123

124

CAP ITULO 11. INGENIER DEL CONOCIMIENTO IA

Otro aspecto relativo a los Sistemas Expertos es la importancia decisiva de la experiencia a la hora de resolver un problema. Esta experiencia, el conocimiento heur stico, est a ntimamente relacionada con los conocimientos y mtodos de actuacin de un verdae o dero experto humano. El grado de experiencia de un profesional cualquiera en un dominio concreto suele repercutir en la capacidad del individuo en cuestin para resolver ciertos o problemas en los que otros de la misma profesin fracasar o no tendr tanto xito. o an an e En cualquier caso, al margen de estas consideraciones hay que destacar el papel preponderante de los dominios de aplicacin y de las tareas para las que se precisan conocimientos o y experiencia. No todos los dominios ni todas las tareas son igualmente apropiadas para la construccin de Sistemas Expertos1 . Muchos problemas pueden ser resueltos utilizando o tcnicas de programacin convencional2 , mientras que otros requieren la aplicacin de e o o 3 tcnicas de Ingenier del Conocimiento . e a Atendiendo a los diferentes dominios que un ingeniero del Conocimiento puede encontrarse y considerando idneas aquellas tareas cuya ejecucin y/o resolucin se requiere o o o experiencia, en los trminos anteriormente expuestos, podemos sealar algunos problemas e n tipo para los cuales podr ser deseable, e incluso conveniente, el diseo y desarrollo de a n un sistema experto: Interpretacin de Informacin. o o Prediccin. o Pronstico y Prevencin. o o Diseo. n Planicacin. o Monitorizacin y Supervisin. o o Ayuda a la decisin. o Enseanza asistida por ordenador. n Control. Aprendizaje. Estas suelen ser tareas t picas que aconsejan el empleo de tcnicas de IC para conse truir programas inteligentes, en casi cualquier dominio de aplicacin. Es decir, los SE no o tienen sentido en dominios deterministas, y lo adquieren en los que es necesaria cierta experiencia4 .
En adelante, SE. Y si es as es preferible, ya que la informtica convencional es ms rpida en ejecucin y desarrollo , a a a o que la informtica inteligente. a 3 En adelante, IC. 4 Ser deseable un SE en un sistema diseado para interpretar informacin? S desde el momento en a n o , que usar informacin supone usar conocimiento. o
2 1

11.2. ANALISIS DE LA VIABILIDAD DE UN SISTEMA EXPERTO

125

11.2.

Anlisis de la Viabilidad a de un Sistema Experto

Los SE contienen informacin estructurada, razonada y adaptable a cambios sucesivos. o Por otra parte, los expertos humanos en un dominio concreto son escasos, dif ciles de encontrar y caros de mantener. Podemos considerar que los SE popularizan el conocimiento de los expertos humanos y reducen el coste de formacin de nuevos expertos. Pero la o construccin de un SE realmente util es un proceso largo y costoso, de modo que cundo o a es realmente viable la construccin de un SE? o D.A.Waterman trata de responder a esta pregunta proponiendo una metodolog de a diseo basada en el estudio de cuatro caracter n sticas esenciales: Justicacin, Posibilidad, o Adecuacin y Exito: o
IF: AND: AND: AND: La construccin del SE est justificada o a La construccin del SE es posible o La construccin del SE es adecuada o Hay ciertas garantas de xito tras la construccin del SE e o

THEN: La construccin del SE es viable o

Este anlisis de viabilidad debe ser previo a cualquier intento de desarrollo y trata de a identicar dominios, problemas y tareas en los que verdaderamente merece la pena intentar la construccin de un SE. Ahora bien, cundo podemos decir que un SE est justicado, o a a su construccin es posible, adecuada, o podemos albergar razonables esperanzas de xito o e tras su implementacin? Seguimos con la metodolog de Waterman: o a Justicacin o Se dene el criterio de justicacin basndose en realidades de tipo social, econmico o a o o coyuntural:
IF: OR: OR: OR: OR: OR: OR: Hay necesidad de experiencia en un entorno hostil Existe una verdadera carencia de experiencia humana Se necesita experiencia simultnea en distintos lugares a Se ha detectado prdida de experiencia humana (en un dominio concreto) e Hay una alta tasa de recuperacin de la inversin o o No hay soluciones alternativas Un enfoque de programacin convencional no es satisfactorio o

THEN: El desarrollo de un SE est justificado a

Como se puede ver, el anlisis de viabilidad introduce matices subjetivos, algo que es a una constante en toda la metodolog siendo labor del ingeniero de Conocimiento decidir a, cundo y cundo no se verican las premisas correspondientes. a a

126 Posibilidad

CAP ITULO 11. INGENIER DEL CONOCIMIENTO IA

El criterio de posibilidad hace referencia a algunos de los aspectos ms pragmticos en a a el desarrollo de un SE.
IF: AND: AND: AND: AND: AND: AND: AND: Existen varios expertos cooperativos Los expertos logran ponerse de acuerdo Los expertos son capaces de articular sus mtodos e y procedimientos de trabajo Las tareas no son excesvamente difciles Las tareas estn suficientemente estructuradas a El sentido comn no es determinante u Se dispone de un nmero suficiente de casos relevantes para la u verificacin y posterior validacin del producto o o Las tareas no son exclusivamente de carcter terico a o

THEN: El desarrollo de un SE es posible

Esta fase trata de averiguar si somos o no capaces de articular las fuentes de conocimiento, las tareas que hay que resolver y los medios disponibles. Adecuacin o El criterio de adecuacin implica investigar tres frentes, todos ellos vinculados al tipo o de problema que queremos resolver:
IF: AND: AND: La NATURALEZA del problema aconseja el desarrollo de un SE La COMPLEJIDAD del problema aconseja el desarrollo de un SE El ALCANCE del problema aconseja el desarrollo de un SE

THEN: El desarrollo de un SE es adecuado

Cada una de estas tres caracter sticas (Naturaleza, Complejidad y Alcance) se deben investigar por separado:
IF: AND: AND: AND: El producto desarrollado cubre necesidades a largo plazo (su dominio es estable, no cambiante) Las tareas involucradas no requieren investigacin bsica o a (globalmente) Las tareas requieren manipulacin simblica o o Las tareas requieren soluciones heursticas

THEN: La naturaleza del problema aconseja la construccin de un SE o

11.3. ORGANIZACION GENERAL DE UN SISTEMA EXPERTO


IF: AND: AND:

127

Las tareas no son demasiado fciles a El conocimiento necesario aconseja la definicin de ms de una base o a de conocimientos Es posible planificar efectos

THEN: La complejidad del problema aconseja la construccin de un SE o IF: AND: AND: Las tareas tienen valor prctico a Las tareas tienen un tama~o manejable n No es previsible que el producto quede inmediatamente obsoleto

THEN: El alcance del problema aconseja la construccin de un SE o

Exito El estudio del xito debe concentrarse casi exclusivamente en aspectos econmicos, e o pol ticos y de mercado. Este hecho marca una de las diferencias entre la IA como ciencia y la IA como ingenier mientras que la ciencia se preocupa de la creacin y difusin de a: o o conocimientos, la ingenier se preocupa de construir productos rentables. a
IF: AND: AND: AND: AND: AND: AND: Se efecta una transferencia de tecnologa adecuada u (se patenta y comercializa) Los directivos estn mentalizados y tienen perspectivas realistas a Hay cambios mnimios en los procedimientos habituales (usabilidad) Los usuarios finales no rechazan categricamente o la tecnologa de los SE Los resultados no dependen de vaivenes polticos El dominio es relativamente estable Los objetivos estn adecuadamente definidos a

THEN: Hay ciertas garantas de xito tras la construccin de un SE e o

Todo este anlisis de viabilidad puede ser representado mediante un circuito inferencial a muy sencillo. En cualquier caso, Waterman no dice qu sucede si alguno de los requisitos e del anlisis de viabilidad no es satisfecho5 (es decir, en ese caso la viabilidad no est dea a nida). Este modelo, adems, es booleano, pero podr hacerse con cualquier mtodo de a a e razonamiento impreciso de los que hemos estudiado.

11.3.

Organizacin General de un Sistema Experto o

Una vez investigada la viabilidad del SE conviene recordar brevemente la arquitectura t pica de este tipo de sistemas (sistemas de produccin), que consta de los siguientes o grandes bloques:
Curiosidad: Es viable un SE para anlisis de viabilidad de SE? Obviamente no, pues la complejidad a no lo justica, este anlisis es muy sencillo. a
5

128

CAP ITULO 11. INGENIER DEL CONOCIMIENTO IA Bases de conocimientos Motor de inferencias Memoria activa6

A estos tres bloques aadiremos un cuarto, el de Interfaces con el Usuario, del que en n gran medida puede llegar a depender el xito de nuestro sistema experto. e

11.3.1.

Bases de Conocimientos

En las bases de conocimientos debemos considerar la inclusin y articulacin de tres o o mdulos que incorporan diferentes tipos de conocimiento: o Conocimiento declarativo o descriptivo, que se reere a los elementos descriptivos del dominio de discurso, contemplados desde una perspectiva esttica: a Objetos del universo Relaciones estticas entre objetos a Deniciones Vocabulario Hechos Hiptesis, suposiciones, restricciones y taxonom o as Conocimiento operativo o de accin, integrado por entidades que descrio ben el dominio de discurso desde una perspectiva dinmica: a Procesos y demons Reglas Heur sticas Ejemplos Metaconocimiento (conocimiento sobre conocimiento), tipo de conocimiento operativo que, a nivel local, permite controlar el funcionamiento del sistema. Un ejemplo t pico son las metarreglas7

11.3.2.

Motor de Inferencias

El motor de inferencias consta bsicamente de un intrprete y de un mdulo de cona e o trol (intrprete+estrategia). Ms espec e a camente, deberemos denir e implementar en el motor de inferencias8 estructuras que nos permitan ejecutar al menos algunas de las siguientes tareas:
Contiene la descripcin completa del estado actual del sistema durante un proceso de ejecucin, por o o lo que durante la fase de desarrollo podemos prescindir de su descripcin pormenorizada. o 7 Elementos de control con estructura de reglas que se utilizan para regular procesos, por ejemplo: IF: Hay ms de una regla activada THEN: Ejecutar primero la que haya a sido ms recientemente activada. a 8 En realidad no se hace nunca, hay motores de inferencias comerciales muy buenos.
6

11.4. FASES DE LA ADQUISICION DEL CONOCIMIENTO Denicin del tipo de encadenamiento y gestin del mismo o o Mecanismos de unicacin, emparejamiento e interpretacin o o Gestin de prioridades, agendas y pizarras o Modelos y esquemas de razonamiento del sistema Clculos a

129

11.3.3.

Interfaces

Este es el tercer gran mdulo al que debemos prestar atencin durante la fase de IC. Su o o misin es permitir que el SE interaccione con el usuario y con el mundo exterior. Dentro o de este mdulo podemos distinguir tres subsistemas genricos: o e Subsistemas de usuario, que permiten la interaccin uni o bidireccional o del SE con el usuario o con los dispositivos de entrada de informacin y o datos. T picamente esta interaccin se consigue a travs de mens, gro e u a cos, rutinas de adquisicin de datos que actan sobre sistemas conectados o u a instrumentos, accesos a bases de datos, etc. Subsistemas de explicacin, que facilitan el seguimiento de los procesos o inferenciales realizados por el sistema. Este seguimiento suele ser requerido en momentos precisos mientras tiene lugar un proceso consultivo determinado, aunque tambin puede ser utilizado para la validacin y e o depuracin del producto desarrollado. Un subsistema t o pico de explicacin debe ser capaz de responder adecuadamente a cuestiones: cmo? o o (visualizando las reglas de produccin), por qu? (visualizando la pila o e de objetivos y reglas activadas) y justif cate (visualizando las reglas desde los datos hasta el nal). Los subsistemas de explicacin utilizan o con profusin el autoconocimiento del sistema. o Subsistemas de actualizacin del conocimiento, que deben posibilitar la o adquisicin de nuevo conocimiento y la constante actualizacin del coo o nocimiento ya existente en el sistema. T picamente esta tarea se facilita considerablemente con el empleo de procesadores de lenguaje natural o la utilizacin de herramientas de IC (shells). o

11.4.

Fases de la Adquisicin del Conocimiento o

Ya hemos mencionado en alguna ocasin que no podemos considerar que algo muestre o un comportamiento inteligente si no utiliza de manera ecaz y eciente un conjunto m nimo de conocimientos. En este sentido, los problemas vistos hasta ahora son utiles para comprender los principios bsicos de la IA, pero no nos permiten formarnos una idea a de lo que realmente subyace tras los SE. Disponemos de una estructura, una arquitectura y unas tcnicas de bsqueda de soluciones, de representacin del conocimiento, pero falta e u o todav dotar a estos elementos de contenido, es decir, de conocimiento. a

130

CAP ITULO 11. INGENIER DEL CONOCIMIENTO IA

La adquisicin del conocimiento, en el mbito estricto de la IC, es sin duda uno de los o a cuellos de botella de la IA, hasta el punto que es su problema actual, dado el desarrollo de las herramientas de que se dispone hoy en d para la construccin de SE. a o Dado un dominio cualquiera, no podemos pretender resolver el problema de la adquisicin del conocimiento sentando a un grupo de expertos y dialogando con ellos. Hay o que tener muy presente que el objetivo nal es la creacin de un modelo computacional o cualitativo de comportamiento inteligente, en un dominio de aplicacin concreto. Para o ello, como paso previo, hay que unicar terminolog a: Dominio Area de aplicacin sobre la que queremos construir nuestro sistema. o Tareas Problemas que se van a presentar en el dominio y que tendremos que resolver. Mtodos Estrategias y/o procedimientos de resolucin de los problemas plane o teados. Sobre todos y cada uno de los puntos anteriores tendremos que denir nuestra metodolog de adquisicin del conocimiento teniendo en cuenta que modelizar un problema a o implica extraer conocimiento del mundo exterior, articularlo, estructurarlo y traducirlo computacionalmente. No se modeliza un problema simplemente transriendo experiencia y conocimientos. Adems, las bases de conocimientos son modelos del dominio de aplia cacin; en ellas se incluyen entidades relevantes, procesos y estrategias de resolucin de o o problemas. Y por ultimo, el conocimiento de los expertos, tal y como ellos nos lo comu nican, es incompleto, aproximado y poco operativo computacionalmente hablando. En base a estos argumentos, nuestra labor de adquisicin del conocimiento debe seguir o una metodolog concreta, que observe las siguientes cinco fases: a Conceptualizacin o Formalizacin de conceptos o Elicitacin o Operacionalizacin o Vericacin y revisin o o

11.4.1.

Conceptualizacin o

La conceptualizacin se reere al dominio de aplicacin y a las tareas que pretendeo o mos resolver. Esta fase permite identicar los elementos clave, las relaciones, los procesos y otras entidades del dominio que son relevantes en la construccin de un SE concreto. o Para conceptualizar correctamente un dominio tendremos que efectuar un anlisis coma pleto y detallado de las tareas identicadas y tratar de caracterizar qu es lo que hay que e resolver, cules son las entradas disponibles, cules son las salidas deseadas y qu tipo a a e de informacin necesitamos para resolver los problemas. Adems, tendremos que como a prender, pensando en su posterior articulacin, los mtodos y tcnicas apropiadas para la o e e resolucin de los problemas del dominio. o

11.4. FASES DE LA ADQUISICION DEL CONOCIMIENTO

131

11.4.2.

Formalizacin o

Podemos denir la formalizacin como el proceso de construcccin de representao o ciones simblicas que nos permitan traducir los resultados de la conceptualizacin, de o o carcter abstracto, en algo que pueda ser implementado en una mquina. As la formalia a , zacin de conceptos implica asimilar las entidades clave, las relaciones, los mtodos, etc. o e y encontrar un procedimiento estructurado o lgico para su posterior representacin como o putacional (frames, reglas, predicados, funciones,. . . ). En denitiva, se trata de decidir qu tipo de estructura es ms util para representar cada una de las entidades relevantes e a identicadas tras el proceso de conceptualizacin. o

11.4.3.

Elicitacin o

La elicitacin es un proceso de extraccin del conocimiento de los expertos humanos o o que se realiza de una forma estructurada y consistente con el proceso de conceptualizacin. o Supone, en primer lugar, disear algn tipo de estrategia estructurada de interlocucin n u o con los expertos. Ello puede obligarnos a identicar previamente distintas categor de as informacin y establecer unos formatos adecuados a la lgica de los procesos con los que o o nos enfrentamos. A continuacin, procede el diseo y materializacin de alguna estructura o n o f sica (formularios, interfaces,. . . ) con la que llevar a cabo la elicitacin del conocimiento. o Finalmente, esta fase concluye con la traduccin de la informacin adquirida en una o o representacin estructurada o formal. o

11.4.4.

Operacionalizacin o

En esta fase se trata de hacer computacionalmente operativos los conocimientos previamente elicitados. Para ello trataremos de encontrar o construir los procedimientos de representacin ms apropiados que permitan al conocimiento elicitado ejecutar las tao a reas deseadas. Ello supone encontrar el procedimiento computacional que mejor simule las estrategias de resolucin descritas por los expertos, seleccionar, adaptar o desarrollar o intrpretes y construir prototipos y realizar simulaciones que incluyan diversos modos de e interaccin con el usuario. o

11.4.5.

Vericacin y revisin o o

Es la ultima fase del proceso y con ella se pretende comprobar el funcionamiento de las estructuras implementadas y, si procede, efectuar las correcciones oportunas. Desgraciadamente, constataremos la necesidad de efectuar varias reimplementaciones a medida que el proyecto avanza, segn vamos analizando los resultados de las sucesivas vericaciones u y revisiones, por diversas razones: el experto suele cambiar de idea conforme el sistema evoluciona, acaba por acostumbrarse al prototipo y comienza a exigir ms cosas, el ingea niero de conocimiento va aprendiendo sobre el dominio de aplicacin y l mismo sugiere o e posibles mejoras del sistema, y se familiariza con el entorno de trabajo del sistema y suele proponer modicaciones acerca de la integracin nal del sistema. o

132

CAP ITULO 11. INGENIER DEL CONOCIMIENTO IA

En cualquier caso, la vericacin y revisin del sistema inteligente en desarrollo tamo o bin debe seguir unas pautas bien denidas. Un procedimiento adecuado para llevarla a e cabo podr ser: a construir un primer prototipo que opere siempre con un mismo conjunto de entradas y renarlo hasta obtener la respuesta deseada realizar una primera revisin en la que se le permita al usuario introducir o nuevos datos, lo que supone dinamizar el sistema en desarrollo y permite detectar errores en los procesos de razonamiento implementados realizar sucesivas revisiones segn el procedimiento anterior hasta conseu guir un sistema optimizado que seea capaz de trabajar con informacin o y datos reales

11.5.

Tcnicas de Extraccin del Conocimiento e o

Mencionaremos ahora brevemente algunas de las distintas tcnicas que se pueden e emplear en el proceso de extraccin del conocimiento. o Observacin directa o La observacin directa es en realidad una tcnica de extraccin del conocimiento o e o previa al diseo real del sistema inteligente. Consiste simplemente en la observacin pasiva n o del modo en que un experto se enfrenta con los problemas del dominio de aplicacin, con o el objetivo de familiarizar al ingeniero de conocimiento con ste y su entorno (se relaciona e con la fase de Conceptualizacin). o Diseccin del problema o Tras la observacin directa, procede la discusin informal con los expertos sobre un o o conjunto de problemas representativos del dominio, lo que se denomina diseccin del o problema. El objetivo buscado es averiguar de qu manera los expertos tienden a orgae nizar sus conocimientos, cmo representan mentalmente sus conceptos y sus ideas, cmo o o analizan la informacin inconsistente, inexacta o imprecisa. Pueden formularse las preo guntas siguientes: qu caracter e sticas diferenciales tiene este problema concreto frente a otros del dominio? qu tipo de informacin es precisa y qu datos son relevantes en la e o e resolucin del problema? o qu tipo de soluciones son adecuadas? e podemos reducir el problema planteado a subproblemas no interactivos (independientes9 )?
Tratar con subproblemas no independientes puede dar lugar a la aparicin de informacin redundante, o o conictiva,. . .
9

11.5. TECNICAS DE EXTRACCION DEL CONOCIMIENTO qu tipo de conocimientos se necesitan para resolver el problema? e qu elementos bsicos deben incluirse en una explicacin correcta, adee a o cuada y sucientemente informativa?

133

El resultado de una diseccin del problema bien hecha suele ser la aparicin de nuevos o o trminos, conceptos y relaciones. e Descripcin del problema o Supone describir problemas t picos relacionados con cada categor importante de a respuestas, con el n de descubrir estrategias y enfoques bsicos, de carcter general, a a para tratar de establecer una organizacin jerrquica del conocimiento de los expertos. o a Anlisis a Para aplicar esta tcnica se requiere que los expertos resuelvan, en presencia del ingee niero del conocimiento, un conjunto de problemas del dominio. Los problemas planteados deben ser realistas, y el experto comentar todos y cada uno de sus procedimientos de a resolucin. Las explicaciones debern ser pormenorizadas, exhaustivas y detalladas. Por o a su parte, el ingeniero del conocimiento deber cuestionar cada paso de la resolucin efeca o tuada por el experto, y tratar de generalizar las conclusiones y metodolog aplicadas, a as sin que ello suponga prdida de la calidad inferencial. e Renamiento Es un proceso de anlisis invertido, en el que el experto plantea problemas al ingeniero a del conocimiento para que ste los resuelva. Los problemas planteados deben ser de die cultad creciente, y el experto debe supervisar al ingeniero del conocimiento mientras trata de resolver los problemas. Si ya existe un prototipo operativo, el proceso de renamiento se repite con el sistema. El objetivo nal es la cr tica de planteamientos, la bsqueda de u soluciones alternativas y la optimizacin de los procesos de resolucin. o o Examen Supone la revisin microscpica del conocimiento del sistema. Aqu es el experto quien o o debe analizar todas y cada una de las reglas del sistema, supervisar las estrategias de resolucin y dar el visto bueno al prototipo construido. Como resultado colateral, el o resultado de un buen examen suele ser el incremento y mejora de las posibilidades de explicacin y justicacin del SE. o o Validacin o Ms que una tcnica de extraccin es un proceso completo mediante el cual se pretende a e o comprobar que el SE, considerado globalmente, funciona correctamente frente a problemas reales y en entornos reales.

134

CAP ITULO 11. INGENIER DEL CONOCIMIENTO IA

Todas las tcnicas de extraccin del conocimiento que se acaban de exponer se apoyan e o en una serie de herramientas de ayuda, como son: Entrevistas Permiten generar conocimientos sobre la terminolog del domia nio y sobre el universo de discurso que se pretende modelizar, y pueden ser de dos tipos: estructuradas (con guin) o no estructuradas (ino formales). Anlisis de tareas y protocolos Trata de determinar cules son las limitaa a ciones impuestas por la naturaleza del problema, cul es el conocimiento a relevante y cul es la estructura genrica de los diversos problemas del a e dominio. Para lograr los objetivos propuestos hay que investigar el comportamiento del experto en el marco de las tareas identicadas, analizarlo minuciosamente y conseguir un conjunto de reglas relevantes. Clasicacin de conceptos Es util porque en todo proceso inteligente, adeo ms del conocimiento detallado disponible estrictamente relativo al domia nio, los expertos utilizan un conocimiento ms global, de muy alto nivel y a muy estructurado, que les permite organizar procesos inferenciales complicados. Como consecuencia, tienden a agrupar la informacin en clases o y establecer jerarqu entre ellas. as

11.6.

Mtodo Estructurado e de Adquisicin del Conocimiento o

La discusin efectuada hasta el momento nos va a permitir proponer no slo una o o metodolog para la adquisicin del conocimiento, sino una metodolog completa de IC a o a (ya que el resultado nal deber ser un SE perfectamente operativo), en la que podemos a distinguir las siguientes fases: Fase Inicial Realizacin de entrevistas no estructuradas ni dirigidas o Obtencin de ejemplos para su anlisis conjunto por parte de expero a tos humanos y de ingenieros del conocimiento Establecimiento de un conjunto inicial de reglas Fase Metodolgica o Estructuracin macroscpica del conocimiento obtenido en la fase o o anterior Organizacin global tentativa del sistema en desarrollo o Clasicacin de todos los elementos de informacin que compartan o o caracter sticas Fase Estructurada Organizacin y estructuracin microscpica de los conjuntos de ino o o formacin que comparten caracter o sticas

11.6. METODO ESTRUCTURADO DE ADQUISICION DEL CONOCIMIENTO 135 Diseo y construccin de prototipos y mdulos individuales n o o Evaluacin y renamiento, por separado, de todos y cada uno de los o prototipos y mdulos construidos o Fase de Evaluacin o Integracin de mdulos o o Optimizacin de las estructuras de control o Adecuacin de las interfaces y de los mecanismos de explicacin y de o o justicacin o Validacin del sistema en el laboratorio o Validacin del sistema en su entorno real de trabajo o Vuelta atrs10 a

Fase de Adquisicion del Conocimiento + Tecnicas de Adquisicion del Conocimiento + Herramientas de Adquisicion del Conocimiento Metodo Estructurado de Adquisicion del Conocimiento

10

Cuando no sea necesaria, el SE ser completamente operativo. a

136

CAP ITULO 11. INGENIER DEL CONOCIMIENTO IA

Cap tulo 12 Vericacin y Validacin de Sistemas o o Inteligentes


La vericacin y validacin son dos de las etapas ms importantes en el anlisis del o o a a comportamiento de un sistema inteligente. Sin entrar en grandes profundidades, veremos que con la vericacin trataremos de comprobar si hemos construido nuestro sistema o correctamente (es decir, que el software implementado no tiene errores y que el producto nal satisface los requisitos y las especicaciones de diseo) y con la validacin nos n o referiremos a un anlisis de la calidad del sistema inteligente en su entorno real de trabajo a (lo que nos permitir determinar si el producto desarrollado satisface convenientemente a las expectativas inicialmente depositadas1 ). Ambas fases forman la base de un entramado ms complejo destinado a evaluar globala mente el comportamiento de un sistema inteligente. Por simplicidad, las fases posteriores a la vericacin y validacin se agrupan bajo el trmino evaluacin, que se encarga de o o e o analizar aspectos que van ms all de la correccin de las soluciones nales del sistema a a o (utilidad, robustez, velocidad, eciencia, posibilidades de ampliacin, facilidad de manejo, o anlisis coste vs. benecio, etc.). a

Evaluacion Validacion Verificacion

Figura 12.1: Pirmide del anlisis del comportamiento de un S.I. a a


Por qu hay que comprobar si un SE se comporta como un humano? Porque es un modelo compue tacional del experto del dominio.
1

137

138

CAP ITULO 12. VERIFICACION Y VALIDACION DE SST. INTELIGENTES

12.1.

Vericacin de Sistemas Inteligentes o


Vericacin del cumplimiento de las especicaciones o Vericacin de los mecanismos de inferencia o Vericacin de la base de conocimientos o

La vericacin de SI2 es un proceso que incluye las siguientes tareas: o

12.1.1.

Vericacin de Especicaciones o

El anlisis del cumplimiento de las especicaciones puede ser llevado a cabo por los a desarrolladores, los usuarios, los expertos y/o un grupo de evaluadores independientes. En el software convencional este proceso est cada vez ms automatizado con el advenimiento a a de las herramientas de ingenier del software asistida por ordenador (CASE), aunque su a inclusin en el mbito de la IC es lenta. o a Las cuestiones a analizar en este proceso consisten en comprobar si: Se ha implementado el paradigma de representacin del conocimiento o adecuado Se ha empleado la tcnica de razonamiento adecuada e El diseo y la implementacin han sido llevados a cabo modularmente n o La conexin con el software externo se realiza de forma adecuada o La interfaz de usuario cumple las especicaciones Las facilidades de explicacin son apropiadas para los potenciales usuarios o del sistema Se cumplen los requisitos de rendimiento en tiempo real El mantenimiento del sistema es posible hasta el grado especicado El sistema cumple las especicaciones de seguridad La base de conocimientos est protegida ante modicaciones realizadas a por el personal no autorizado

12.1.2.

Vericacin de Mecanismos de Inferencia o

El uso de shells comerciales ha reducido la dicultad de la vericacin de los mecaniso mos de inferencia, ya que se asume que sta ha sido realizada por los desarrolladores de la e herramienta3 . La responsabilidad del ingeniero del conocimiento recae fundamentalmente en la eleccin de la herramienta apropiada. o
En adelante abreviaremos as Sistemas Inteligentes. Sin embargo, esta asuncin no siempre es cierta, sobre todo en versiones nuevas de las herramientas, o de modo que en aplicaciones que trabajan en dominios cr ticos aqullos en los que no se puede asumir e el coste de un error el correcto funcionamiento debe vericarse a travs de distintas pruebas. e
3 2

12.1. VERIFICACION DE SISTEMAS INTELIGENTES

139

En ocasiones, no obstante, los problemas con las shells comerciales pueden estar causados no por errores en su programacin, sino por un desconocimiento de su funcionamieno to exacto. Por ejemplo, los procedimientos de resolucin de conictos o los mecanismos o de herencia pueden hacer dif el seguimiento del curso exacto de la inferencia, de forma cil que aunque el conocimiento esttico est vericado, el funcionamiento nal del sistema a e puede no ser el apropiado. En caso de que decidamos construir nuestros propios mecanismos de inferencia, ser prea ciso realizar su vericacin, pudiendo aplicar para ello las tcnicas diseadas en ingenier o e n a del software. Siempre que sea posible, se recomienda la utilizacin de mecanismos de o inferencia certicados cuyo funcionamiento correcto se haya probado.

12.1.3.

Vericacin de Bases de Conocimientos o

La vericacin de la base de conocimientos es plena responsabilidad del ingeniero del o conocimiento. Se basa en el concepto de anomal Una anomal es un uso poco comn a. a u del esquema de representacin del conocimiento, que puede ser considerado como un error o potencial (existen anomal que no constituyen errores, y viceversa). as La vericacin de la base de conocimientos no nos asegura que las respuestas de o nuestro sistema sean correctas, lo que nos asegura es que el sistema ha sido diseado e n implementado de forma correcta. La mayor de los estudios sobre este tema se reeren a a los sistemas basados en reglas, ya que son los ms populares. a Aspectos que se suelen examinar a la hora de vericar una base de conocimientos son la consistencia y la completitud (ver tabla 12.1, pgina 140). a Inuencia de las medidas de incertidumbre Las reglas para vericar la consistencia y completitud que aparecen en la tabla 12.1 mencionada son vlidas siempre y cuando los sistemas no incluyan incertidumbre. En caso a de que s exista dicha incertidumbre la validez de las pruebas queda en entredicho, ya que, como veremos, situaciones normales pueden ser tomadas como errores. En sistemas que pretenden medir incertidumbres o grados de asociacin (utilizando o factores de certidumbre, probabilidades bayesianas o cualquier otro mtodo) es impore tante vericar que estos valores son consistentes, completos, correctos y no redudantes. Esta tarea se realiza, en primer lugar, asegurndonos que cada regla incluye un factor de a incertidumbre y que estos factores cumplen los aspectos de la teor en la que se basan. a La bsqueda de anomal en las medidas de incertidumbre de un SI es un proceso que u as no ha recibido mucha atencin por parte de los investigadores, quiz debido al limitado o a nmero de SE que hacen uso extensivo de dichas medidas. El modo en que el uso de u dichas medidas de incertidumbre puede afectar a la realizacin de los tests de consistencia o y completitud puede verse en los siguientes ejemplos: Redundancia: si antes no afectaba a la salida del sistema, ahora puede causar graves problemas ya que, al contar la misma informacin dos veces, o

140

CAP ITULO 12. VERIFICACION Y VALIDACION DE SST. INTELIGENTES

Consistencia

Reglas redundantes

Reglas conictivas Reglas englobadas en otras

Reglas circulares

Condiciones IF innecesarias Completitud Valores no referenciados de atributos

Valores ilegales de atributos

Reglas inalcanzables

Reglas sin salida

p(x)q(x)r(x) q(x)p(x)r(x) (aunque ojo, esto no tiene por qu ser e redundante; ejemplo, un sistema que trabaje con informacin temporal) o p(x)q(x)r(x) p(x)q(x) r(x) p(x)q(x)r(x) p(x)r(x) (la primera es ms concreta) a p(x)q(x) q(x)r(x) r(x)p(x) p(x)q(x)r(x) p(x) q(x)r(x) Ocurre cuando algunos valores del conjunto de posibles valores de un atributo no son cubiertos por la premisa de ninguna otra regla. Una regla referencia valores de atributos que no estn incluidos en el conjunto a de valores vlidos para ese atributo. a p(x)r(x) p(x) no aparece como conclusin de o otra regla ni puede obtenerse del exterior (razonamiento progresivo) p(x)q(x)r(x) r(x) no es una conclusin nal y no o aparece en la premisa de ninguna otra regla (razonamiento proogresivo)

Cuadro 12.1: Vericacin de la consistencia y completitud en bases de conocimientos. o

12.1. VERIFICACION DE SISTEMAS INTELIGENTES se pueden modicar los pesos de las conclusiones. Reglas englobadas en otras: esta situacin puede no ser errnea ya que o o las dos reglas pueden indicar la misma conclusin pero con distintas cono anzas. La regla englobada ser un renamiento de la regla ms general a a para el caso de que tengamos ms informacin. a o Reglas circulares: pueden existir casos en los que la utilizacin de medidas o de incertidumbre rompan la circularidad de un conjunto de reglas. Por ejemplo, si el factor de certidumbre de una conclusin implicada en el o ciclo cae por debajo de un umbral (normalmente entre 0,2 y 0,2) se considera que el valor de la conclusin es desconocido y el ciclo se o rompe. Condiciones IF innecesarias: igual que en el caso de las reglas englobadas en otras, una condicin IF innecesaria puede utilizarse para variar la o conanza en la conclusin nal. o Reglas inalcanzables: es un caso muy frecuente, que de forma similar al caso de las reglas sin salida, puede ocurrir que existan reglas que por causa de los factores de certidumbre se conviertan en inalcanzables. Reglas sin salida: la deteccin de este tipo de reglas se complica con la o introduccin de la incertidumbre. As una regla puede convertirse en o , una regla sin salida si su conclusin tiene una certidumbre por debajo o del umbral en el cual un valor se considera conocido. Vericacin dependiente o independiente del dominio o

141

La vericacin de un SI puede enfocarse desde dos puntos de vista diferentes: verio cacin dependiente del dominio y vericacin independiente del dominio. La o o primera se basa en la deteccin de las anomal a travs de tcnicas heur o as e e sticas mediante las cuales se analiza la base de conocimientos pero sin tener en consideracin el dominio o de aplicacin. Por el contrario, la segunda utiliza metaconocimiento del propio universo o de discurso para examinar la bases de conocimiento implementadas4 . El inconveniente de este procedimiento es que el metaconocimiento, al no ser ms que conocimiento soa bre conocimiento, tambin debe ser vericado. Adems, puede no ser estable, si existe e a aportacin continua de nuevo conocimiento, y por ultimo, el desarrollo de una aplicacin o o que permita realizar vericaciones dependientes del dominio suele ser una tarea lenta y costosa, en parte por el hecho de tener que adquirir el metaconocimiento necesario y en parte por tener que mantenerlo. Automatizacin de los mecanismos de vericacin o o De las distintas fases que componen el anlisis del comportamiento de un sistema a inteligente, la fase de vericacin es en la que se ha conseguido un mayor grado de autoo matizacin mediante distintos tipos de herramientas. Dentro de estas herramientas de o
Un ejemplo de este tipo de vericacin es el sistema TEIRESIAS, que supervisa la introduccin de o o conocimiento en el SE MYCIN.
4

142

CAP ITULO 12. VERIFICACION Y VALIDACION DE SST. INTELIGENTES

vericacin podemos establecer dos grupos: las dependientes del dominio (que hacen o uso del metaconocimiento) y las independientes del dominio (que se basan principalmente en convertir la base de conocimientos en una representacin independiente, o mediante tablas o grafos, a partir de la que se buscan las posibles anomal as).

12.2.

Validacin de Sistemas Inteligentes o

Una vez vericado el software del sistema, el proceso debe continuar con la validacin del producto. Recordemos que validar un SI supone analizar si los resultados del o sistema son correctos y por lo tanto se comporta como un experto ms en un dominio de a aplicacin concreto, y si se cumplen las necesidades y los requisitos del usuario. o La validacin puede verse desde dos ptimas diferentes: o o Validacin orientada a los resultados Su objetivo es comparar el rendio miento del sistema con un rendimiento esperado (proporcionado por una referencia estndar o por expertos humanos) y comprobar que el sistema a alcanza un nivel que se considera aceptable. Validaci orientada al uso Se centra en cuestiones que hacen referencia on a la relacin hombre-mquina, ms all de la correccin de los resultados o a a a o obtenidos por el sistema. Normalmente la validacin orientada a los resultados es un prerrequisito para la realio zacin de una validacin orientada al uso. As si un sistema no presenta un rendimiento o o , aceptable, los aspectos concernientes a la validacin orientada al uso son irrelevantes5 . o

12.2.1.

Principales caracter sticas del proceso de Validacin o

Al estudiar la Validacin nos damos cuenta de que no existe una clasicacin global o o de los problemas a resolver ni tampoco existe una clara relacin entre estos problemas o y las tcnicas destinadas a solucionarlos. Entre los principales problemas existentes en e la Validacin cabe destacar la falta de mtricas de evaluacin prcticas y rigurosas, la o e o a falta de especicaciones, que conduce a evaluaciones subjetivas, y la falta de herramientas adecuadas. El proceso de Validacin presenta distintos problemas para el ingeniero del conocio miento, que debe conocer las distintas aproximaciones para su eventual solucin: o Personal involucrado en la validacin El primer elemento a considerar o es el ingeniero del conocimiento que ha desarrollado el sistema (ya que es quien mejor conoce las caracter sticas del SI, aunque puede que no sea totalmente objetivo); tambin es necesario contar con expertos humanos e (ya que el mtodo bsico para realizar la validacin es el anlisis de e a o a
Por este motivo muchos autores incluyen la validacin orientada al uso como una de las primeras o fases de la evaluacin, rerindose con validacin slo a la validacin orientada a resultados. o e o o o
5

12.2. VALIDACION DE SISTEMAS INTELIGENTES casos de prueba ya resueltos, con los que se estudiarn las discrepancias a encontradas), preferiblemente en general ajenos a los que colaboraron en el desarrollo del sistema (para conseguir que el conocimiento del sistema se adece al de un consenso de expertos y no unicamente al del experto u colaborador, aunque su independencia tambin puede predisponer a la e falacia del superhombre 6 ); y por ultimo, los usuarios nales, aunque en fases posteriores, cuando el conocimiento ya est validado. e Partes del sistema a validar Nuestro principal objetivo es lograr que los resultados nales del SI sean correctos, aunque tambin es interesante e analizar si los resultados intermedios son correctos (ya que los nales dependen de ellos) o si el razonamiento seguido hasta dar con la solucin o (sus estructuras) es el apropiado (ya que un proceso de razonamiento incorrecto puede provocar errores cuando queramos ampliar nuestra base de conocimientos). Datos utilizados en la validacin El uso de casos de prueba es el mtodo o e ms ampliamente utilizado para la validacin de SE. En un mundo ideal a o contar amos con una gran cantidad de casos que representar un rango an completo de problemas que ser analizados por una serie de experan tos, pero en la realidad desafortunadamente es muy comn no disponer u ms que de un nmero reducido de casos y con pocos expertos que nos a u ayuden a analizarlos. Para que una muestra de casos sea susceptible de ser aceptada en un proceso de validacin debe cumplir dos propiedao des fundamentales: cantidad (para que las medidas de rendimiento que obtengamos sean estad sticament signicativas) y representatividad (no slo hay que capturar un nmero elevado de casos, sino que deben ser o u representativos de los problemas comunes a los que se va a enfrentar el SI). La cobertura de casos es mucho ms importante que su nmero, y a u deben representar con abilidad el dominio de entrada del sistema (casos susceptibles de ser tratados). En el caso extremo de no disponer de casos de prueba para validar el sistema (ya que no es aconsejable utilizar los casos empleados en el diseo) se pueden usar casos sintticos, generados n e articialmente por los expertos. Criterios de validacin Podemos diferenciar dos tipos de validacin ateno o diendo al tipo de criterio establecido: validacin contra el experto (se o utilizan las opiniones y diagnsticos de expertos humanos como criterio o de validacin; inconvenientes: subjetividad) y validacin contra el probleo o ma (contrastar los resultados del sistema con la situacin real; inconveo nientes: falacia del superhombre, no disponibilidad de la solucin real). o Momento en que se realiza la validacin El punto de vista ms comno a u mente aceptado es el de realizar la validacin a lo largo del desarrollo o del sistema, realizando preferentemente un desarrollo incremental en el
6

143

Exigir ms al SI de lo que se exigir a un experto humano. a a

144

CAP ITULO 12. VERIFICACION Y VALIDACION DE SST. INTELIGENTES cual, al nal de cada incremento, se realiza una validacin. La validacin o o que se realiza en etapas tempranas del desarrollo est muy vinculada al a proceso de adquisicin del conocimiento (renamiento del conocimiento). o Otro aspecto a tener en cuenta consiste en la diferenciacin entre: o Validacin retrospectiva Se realiza sobre casos histricos ya resueltos o o y almacenados en una base de datos. Es el tipo de validacin ms o a comnmente realizada en los SE, pudiendo ser una validacin contra u o expertos o contra el problema. Se utiliza en las etapas de desarrollo del sistema, antes de que ste se instale en su campo de trabajo e habitual. Validacin prospectiva Consiste en confrontar al sistema con casos o reales y ver si es capaz de resolverlos o no. No se utilizan casos almacenados en una base de datos, sino casos que en este momento estn a siendo tratados por expertos humanos (se relaciona con la validacin o contra el problema). El inconveniente surge, asimismo, cuando el dominio de aplicacin es cr o tico y el coste de una decisin errnea no es o o asumible. Suele utilizarse, no obstante, cuando ya se ha validado retrospectivamente el sistema y se desea realizar una nueva validacin o en el campo de aplicacin. o Mtodos de validacin Los mtodos para realizar la validacin se pueden e o e o dividir en dos grupos principales: Mtodos cualitativos Emplean tcnicas subjetivas de comparacin de e e o rendimiento: validacin de supercie (proceso informal de discusin o o y anlisis entre expertos e ingenieros del conocimiento), prueba de a Turing, test de campo (exposicin del sistema a los usuarios), valio dacin de subsistemas, anlisis de sensibilidad (presentacin de eno a o tradas muy similares). Mtodos cuantitativos Se basan en medidas estad e sticas: Medidas de pares (mtodos de validacin contra expertos). Se e o dividen en medidas de acuerdo y medidas de asociacin. o Medidas de acuerdo: Indice de acuerdo (cociente entre el nmero de observaciones u de acuerdo y las totales):
k

nij I=
i=j

=
i=j

pij

Ventaja: interpretacin sencilla. Inconveniente: no diferencia o los desacuerdos segn su importancia y no tiene en cuenta la u casualidad.

12.2. VALIDACION DE SISTEMAS INTELIGENTES Indice de acuerdo contra uno (similar al anterior, considera acuerdos parciales, los que se diferencian en una sola categor a):
k

145

nij I=
i=j1
i=j

=
i=j1
i=j

pij

Ventaja: elimina problemas asociados a las categor semnas a ticas ordinales con l mites poco claros y permite en anlisis a de tendencias optimistas o pesimistas (respectivamente, por encima y por debajo de la diagonal de acuerdo). Kappa (corrige acuerdos debidos a la casualidad): k= p0 pc 1 pc

donde p0 es la proporcin de acuerdo observado y pc la proo porcin de acuerdo esperado debido a la casualidad, de modo o que 1 pc es el mximo acuerdo posible una vez eliminada la a casualidad y p0 pc es el acuerdo obtenido una vez eliminada la casualidad. Esto es, si k < 0 el ndice de acuerdo es menor an que el u esperado debido a la casualidad, si k = 0 el ndice de acuerdo es el esperado debido a la casualidad y si k = 1 el acuerdo es completo, independientemente de la casualidad.
k

pc =
i=j

pi. p.j

Problema: trata todos los desacuerdos de la misma forma. Kappa ponderada (corrige el problema de la Kappa):
k

vij poij kw = 1
i=1,j=1 k

vij pcij
i=1,j=1

Medidas de asociacin miden el grado de asociacin lineal entre o o el sistema y el experto humano (tau de Kendall, rho de Spearman,. . . ). Medidas de grupo. Las medidas de pares son utiles cuando el nmero de expertos es reducido (para cada par de expertos hay u

146

CAP ITULO 12. VERIFICACION Y VALIDACION DE SST. INTELIGENTES que hacer una tabla de contingencia), pero si la validacin invoo lucra un grupo amplio de expertos, la informacin que proporo cionan las medidas de pares puede resultar dif de interpretar. cil En todo caso, las medidas de pares sirven de base para este otro tipo de medidas, cuyo objetivo es analizar conjuntamente las interpretaciones de los expertos y tratar de buscar estructuras de representacin que permitan una interpretacin ms sencilla o o a dentro del contexto de la validacin. o El procedimiento para obtener medidas de grupo es obtener medidas de pares para cada uno de los posibles pares de expertos de la validacin, agrupar los resultados en una tabla resumen y o obtener la medida de grupo a partir de stas. Algunas medidas e de grupo son: Indice de Williams: P0 I0 = Pn donde P0 representa el acuerdo existente entre un experto aislado en relacin a un grupo de expertos de referencia y Pn o representa el acuerdo existente dentro de dicho grupo de referencia. Se denen a su vez: P0 = Pn =
n1 a=1 n a=1

P(0,a) n P(a,b)

n b=a+1

n(n 1) La interpretacin de In es que si In < 1 el acuerdo entre el o experto aislado y el grupo de expertos es menor que el acuerdo entre los propios miembros del grupo, si In = 1, el experto aislado coincide con el grupo al mismo nivel que los miembros del grupo entre s y si In > 1 el experto aislado coincide con el consenso del grupo. Anlisis cluster. Su objetivo es establecer grupos de expertos a segn su grado de concordancia e identicar a cul se parece u a ms nuestro SI, existiendo para ello dos variantes: mtodos a e jerrquicos y mtodos no jerrquicos. a e a La aplicacin de un mtodo jerrquico de anlisis cluster implio e a a ca la construccin de una matriz de concordancia que describa o las distancias entre todos los miembros involucrados en el estudio. Una distancia apropiada podr ser, por ejemplo, los a ndices de acuerdo encontrados entre los distintos expertos. A partir de los datos de la matriz de concordancia podemos establecer una secuencia de agrupamientos anidados que denen una estructura en rbol denominada dendrograma, en la que a cada nivel representa una particin del conjunto global de los o elementos que son objeto del anlisis. a

12.2. VALIDACION DE SISTEMAS INTELIGENTES Por su parte, los mtodos no jerrquicos de anlisis cluster e a a realizan una clasicacin en la que se minimiza la suma de o los cuadrados de las distancias entre cada punto y el centroide de su clase. Para ello hay que predenir un nmero arbitrario u de clsteres, situar aleatoriamente los centroides de cada uno, u asignar cada punto al centroide ms cercano y reevaluar itea rativamente las posiciones de los nuevos centroides de cada clster. La mayor dicultad es la interpretacin del concepto u o de coordenadas de puntos, por lo que generalmente se preere el uso de mtodos jerrquicos. e a Ratios de acuerdo. Miden el acuerdo existente entre un experto (o SI) y una referencia estndar (que puede ser un consenso entre a expertos validacin contra el experto o la solucin real al proo o blema planteado validacin contra el problema). Problema: o no siempre existe o puede denirse una referencia estndar (slo a o si existe un sistema f sico que evoluciona). Errores en la validacin En el proceso de validacin se pueden dar dos o o tipos de errores: errores de Tipo I (cuando el sistema es considerado como no vlido aun a pesar de serlo, se denominan tambin de riesgo a e para el desarrollador) y errores de Tipo II (cuando se acepta como vlido a un sistema que no lo es; siendo ms peligrosos que el caso anterior, se a denominan tambin de riesgo para el usuario). e

147

148

CAP ITULO 12. VERIFICACION Y VALIDACION DE SST. INTELIGENTES

Experto

D D

Referencia Estndar a D D a b c d a+c b+d

a+b c+d

Cuadro 12.2: Tabla de contingencia Ratios de Acuerdo Ratio de verdaderos positivos Ratio de verdaderos negativos Sensibilidad Ratio de falsos positivos Ratio de falsos negativos Especidad Valor predictivo positivo Valor predictivo negativo Cuadro 12.3: Ratios de Acuerdo Otras medidas de Similitud a+d Indice de acuerdo a+b+c+d a Coeciente de Jaccard a+b+c Cuadro 12.4: Medidas de Similitud

a a+c d b+d b b+d c a+c a a+b d c+d

12.2. VALIDACION DE SISTEMAS INTELIGENTES

149

12.2.2.

Metodolog de Validacin a o

Como hemos visto, la validacin no es un proceso sencillo de aplicar. Para facilitar o su ejecucin, puede dividirse en tres fases claramente diferenciadas: o Planicacin Fase de anlisis de caracter o a sticas del dominio de aplicacin, o del sistema y de la etapa de desarrollo en la que se encuentre el sistema para establecer una serie de estrategias de validacin. o Aplicacin Fase en la que se llevan a la prctica las estrategias establecidas o a en la fase anterior y se aplican medidas cuantitativas que puedan darse dentro de un contexto cualitativo. Es necesario realizar una captura de casu stica de validacin suciente o y representativa. Generalmente los casos de prueba debern ser preproa cesados para corregir errores, transformar datos a representaciones ms a adecuadas e incluir informacin adicional (formato de la BB.DD., orden o de las categor semnticas, pesos de desacuerdo,. . . ). Una vez realizaas a das la captura y el preprocesado de la casu stica se realizan las medidas cuantitativas. Interpretacin Fase en la que se utilizan los resultado de la anterior para o dilucidar si el SI se comporta realmente como un experto dentro de su campo de aplicacin. Es la fase ms compleja de la metodolog porque los o a a resultados de los tests estad sticos deben tener en cuenta la naturaleza del problema que estamos tratando y las caracter sticas de la muestra empleada en su obtencin. o

Indice alfabtico e
lgebra de puntos temporales, 81 a Ars Magna, 9 prenex, 48 abstraccin, 58 o acoplamiento, 59 alfabeto, 42 anomal 139 a, autmatas o principios generales, 8 autoconocimiento, 123 Automtica, 8 a axioma, 42 bsqueda, 20 u anchura, 27 ascensin a colinas, 30 o gradiente, 31 mxima pendiente, 31 a ciega, 30 dirigida por los datos, 22 por los objetivos, 22 generacin y prueba, 30 o informada, 30 mejor nodo A , 32 Agendas, 36 procesos caracter sticas, 21 componentes, 21 direccin, 22 o topolog 23 a, profundidad, 29 progresiva, 22 regresiva, 22 backtracking, 31 base de conocimientos, 68 150 bases de conocimientos, 128 certidumbre factor de, 96 factores, 93 Ciberntica, 10 e clase, 58 codicacin, 39 o cohesin, 59 o comportamiento inteligente, 17 conexionistas, 11 conjuntos difusos, 111 caracterizacin, 114 o estructura algebraica, 115 nomenclatura, 114 operaciones algebraicas, 118 conocimiento adquisicin o fases, 129 mtodo estructurado, 134 e declarativo o descriptivo, 128 extraccin o tcnicas, 132 e ingenier del, 44, 123 a operativo o de accin, 128 o pblico, 15 u privado, 16 representacin, 39 o mtodos declarativos, 41 e mtodos procedimentales, 41 e semipblico, 16 u sistemas basados en, 15 temporal, 73 representacin, 73 o constante, 42 credibilidad, 108

INDICE ALFABETICO cresta, 32 cuanticador, 42 existencial, 43 universal, 43 decodicacin, 39 o delimitador, 43 emparejamiento con variables, 25 literal, 25 encapsulamiento, 58 error de Tipo I, 147 de Tipo II, 147 espacio de estados, 18 estrategias de exploracin, 27 o anchura, 27 mixta, 27 profundidad, 27 especicacin temporal, 74 o estado, 19 evaluacin, 137 o evidencias combinacin, 97, 102 o factor de normalizacin, 107 o FBD, 41 FBF, 41 forma normalizada conjuntiva de Davis, 47 frame, 55 cabecera, 55 demons, 55 razonamiento, 56 slot, 55 funcin, 42 o de pertenencia, 112 fuzzycacin, 112 o grado de conicto, 107 guiones, 56 activacin, 57 o instantneos, 57 a no instantneos, 57 a razonamiento, 57 herencia, 59 mltiple, 59 u simple, 59 heur stica funcin, 27 o implementacin, 58 o imprecisin, 100 o incertidumbre, 15, 100 propagacin, 100 o incremento de conanza, 94 de desconanza, 94 inferencia, 14 reglas, 42, 43 Inteligencia Articial deniciones, 12 programas, 14 caracter sticas, 17 interfaces, 129 interfaz, 58 intervalo de referencia, 79 intervalo de conanza, 108 jerarqu 58, 59 a, agregacin, 59 o especializacin, 59 o generalizacin, 59 o juntor, 42 Kahn y Gorry especialista temporal, 74 lgica o de predicados, 41 de proposiciones, 41 formal, 41 no montona, 49 o lenguaje formal, 42, 43 mximo local, 31 a mtodo e llulliano, 9 marco de discernimiento, 104

151

152 memoria activa, 68 memoria de trabajo, 68 meseta, 32 metaconocimiento, 128 modelo categrico, 84 o modelos de dependencia conceptual, 54 modularidad, 58, 59 motor de inferencias, 69, 128 nodo, 19 objeto, 57 atributos, 57 mtodos, 57 e operador seleccin de, 25 o Orientacin a Objetos, 57 o plausibilidad, 108 polimorsmo, 58, 60 ligadura dinmica, 60 a sobrecarga, 60 de mensajes, 60 paramtrica, 60 e potencia evidencial, 94 predicado, 42 principio abierto-cerrado, 60 probabilidad total, 88 rgimen Lovelace, 10 e Ramn Llull, 9 o razonamiento abductivo, 15 categrico, 122 o cualitativo, 122 deductivo, 14 difuso, 119 disposicional, 122 impreciso, 15 inductivo, 14 no montono, 14 o por defecto, 49 por semejanza, 54 silog stico, 122

INDICE ALFABETICO tipos, 14 redes semnticas, 52 a implementacin, 53 o razonamiento, 54 reglas de produccin, 61 o representacin o problema de, 24 resolucin o procedimientos, 46 refutacin, 46 o Shanon, 11 Shortlie y Buchanan modelo, 94 simbolistas, 11 sistemas de produccin, 67 o base de conocimientos, 68 ciclo bsico, 71 a memoria activa, 68 memoria de trabajo, 68 motor de inferencias, 69 tipos, 67 expertos, 15, 123 anlisis de viabilidad, 125 a organizacin, 127 o Skolem constantes, 48 funciones, 48 tabla de equivalencias, 47 de verdad, 46 teor evidencial, 103 a teorema de Bayes, 88 validacin, 137, 142 o contra el experto, 143 contra el problema, 143 mtodos cualitativos, 147 e mtodos cuantitativos, 147 e metodolog 149 a, prospectiva, 144 retrospectiva, 144 variable, 42

INDICE ALFABETICO vericacin, 137, 138 o dependiente del dominio, 141 independiente del dominio, 141 Von Neumann, 11

153

154

INDICE ALFABETICO

Indice de guras
1.1. Niveles epistemolgicos de la IA. . . . . . . . . . . . . . . . . . . . . . . . . 13 o 3.1. Ciclo bsico de codicacin-decodicacin. . . . . . . . . . . . . . . . . . . 40 a o o 4.1. Una red semntica sencilla. . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 a 4.2. Tipos de polimorsmo en O.O. . . . . . . . . . . . . . . . . . . . . . . . . 60 5.1. Arquitectura bsica de un sistema de produccin. . . . . . . . . . . . . . . 68 a o 6.1. Las 13 relaciones temporales de Allen. . . . . . . . . . . . . . . . . . . . . 76 6.2. Las tres posibles relaciones entre puntos de tiempo. . . . . . . . . . . . . . 81 10.1. Ejemplo de funcin de pertenencia a un conjunto difuso. . . . . . . . . . . 113 o 12.1. Pirmide del anlisis del comportamiento de un S.I. . . . . . . . . . . . . . 137 a a

155

156

INDICE DE FIGURAS

Indice de cuadros
2.1. 2.2. 2.3. 2.4. 2.5. 2.6. 2.7. 2.8. 2.9. Algoritmo Algoritmo Algoritmo Algoritmo Algoritmo Algoritmo Algoritmo Algoritmo Algoritmo de de de de de de de transformacin de rbol a grafo. . . . . . . o a Bsqueda en Anchura. . . . . . . . . . . . u Bsqueda en Profundidad. . . . . . . . . . u Bsqueda Mixta Generacin y Prueba. . . u o Bsqueda Ascensin a colinas. . . . . . . . u o Bsqueda Ascensin por mxima pendiente. u o a Bsqueda A . . . . . . . . . . . . . . . . . u Propagar Mejora(VIEJO). . . . . . . . . . . . . de Bsqueda conducida mediante Agenda. . . u . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 28 29 30 31 32 34 35 37

3.1. Ejemplo de codicacin de una expresin. . . . . . . . . . . . . . . . . . . 45 o o 3.2. Tabla de Verdad. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 3.3. Tabla de Equivalencias. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 4.1. Ejemplo de frame. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 4.2. Ejemplo de funcionamiento de reglas de produccin y frames. . . . . . . . . 63 o 6.1. Tabla de transitividad para las relaciones temporales. . . . . . . . . . . . . 77 6.2. Adicin en el lgebra de puntos temporales. . . . . . . . . . . . . . . . . . 82 o a 6.3. Multiplicacin en el lgebra de puntos temporales. . . . . . . . . . . . . . . 82 o a 12.1. Vericacin de la consistencia y completitud en bases de conocimientos. o 12.2. Tabla de contingencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.3. Ratios de Acuerdo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12.4. Medidas de Similitud . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140 148 148 148

157

158

INDICE DE CUADROS

Bibliograf a
[1] Moret Bonillo, Vicente y Alonso Betanzos, Amparo y Cabrero Canosa, Mariano y Guijarro Berdias, Bertha y Mosqueira Rey, Eduardo. n Fundamentos de Inteligencia Articial. Servicio de Publicaciones de la Universidad de La Corua, Octubre 2000. n a 2 edicin. o

159