Inteligencia Aritificial. Un Enfoque Moderno (2da Edición) - Stuart J. Russell y Peter Norvig

INTELIGENCIA ARTIFICIAL UN ENFOQUE MODERNO Segunda edicionINTELIGENCIA ARTIFICIAL UN ENFOQUE MODERNO Segunda edicion Stuart J. Russell y Peter Norvig Traduccién: Juan Manuel Corchado Rodriguez Facultad de Ciencias Universidad de Salamanca Fernando Martin Rubio, José Manuel Cadenas Figueredo, Luis Daniel Hernandez Molinero y Enrique Paniagua Aris Facultad de Informatica Universidad de Murcia Raquel Fuentetaja Pinzin y Monica Robledo de los Santos Universidad Pontificia de Salamanca, campus Madrid Ramén Rizo Aldeguer Escuela Politécnica Superior Universidad de Alicante Reyvisién técnica: Juan Manuel Corchado Rodriguez Facultad de Ciencias Universidad de Salamanca Fernando Martin Rubio Facultad de Informética Universidad de Murcia Andrés Castille Sanz y Maria Luisa Diez Plata Facultad de Informatica Universidad Pomtificia de Salamanca, campus Madrid Coordinaci6n general de la traducci6n y revision técnica: Luis Joyanes Aguilar Facultad de Informatica Universidad Pontificia de Salamanca, campus Madrid Madhid « México + Santafé de Bogotd + Buenos Aires * Caracas * Lima ‘Montevideo « San Juan * San José * Santiago + S80 Paulo « Whita Plains‘Dos de calogacin tigen {NTELIGENCIA ARTIFICIAL. UN ENFOQUE MODERNO Segunda eicién PEARSON EDUCACION, S.A, Mate, 2004 Matrix tfcesice 81.3 ormit 195 % 250 Paginas 1240 “Todas tos derechos reservados. (Queda probibida, salvo excepcidn previstaen la le, cualquier forma de reproduccién, distribucién, comunicaciGn publica y transformacisn de esta ob sin contar con autorizacin de los tituares de propiedad intelectual La infraccign de los derechos mencionados puede ser consttutiva de delito contra la propiedad intelectual (arts. 270 sets. Cédigo Penal) DERECHOS RESERVADOS (© 2004 por PEARSON EDUCACION; S.A. Ribera del Loira, 28 ‘28042 Madrid (Espaa) INTELIGENCIA ARTIFICIAL. UN ENFOQUE MODERNO. Segunda edicién RUSSELL, S.J; NORVIG, P. ISBN: 84.208-4003-X Depésito Legal: M-26913-2004 PEARSON PRENTICI HALL es un sello editorial autorizado de PEARSON EDUCACION, S.A. Authorized wanstation from the English language edition, entitled ARTIFICIAL INTELLIGENCE: ‘A MODERN APPROACH, 2" edition by RUSSELL, STUART; NORVIG, PETER. Published by Pearson Education, Inc, publishing as Prentice Hall (© 2008. All rights reserved No part or this book may be reproduced or transmitted in any form or by any means, electronic or mechanical, including photocopying, recording or by any information storage retrieval system, without permission from Pearson Falucation, Inc. ISBN: 0-13-790395.2 Equipo editori Eaitor: David Fayerman Aragén ‘Técnico editorial: Ana Isabel Equipo de produccién: Director: José Antonio Clares ‘Técnico: José Antonio Heman Disefio de cubierta: Equipo de dsefio de PEARSON EDUCACION, S.A. ‘Composicién: COPIBOOK, SL. Impreso por: Top Printer Plus IMPRESO EN ESPANA - PRINTED IN SPAINContenido ———=__———— ee Pr élogo XIX Sobre los autores XXV 1 Introduccién, 1 LI (Quées Ia IA? 2 Comportamiento humano: el enfoque de la Prueba de Turing 3 Pensar como un humano: el enfoque del modelo cognitive 3 4 5 6 Pensamiento racional: el enfoque de las «leyes del pensamientor Actuar de forma racional: el enfoque del agente racional 1.2. Los fundamentos de la inteligencia artificial Filosofia (desde el afio 428 a.C. hasta el presente) 6 eméticas (aproximadamente desde el afio 800 al presente) 9 Economia (desde el ao 1776 hasta el presente) un Neurociencia (desde el ao 1861 hasta el presente) 2 Pricotogia (desde el allo 1879 hasta el presente) Is Ingenieria computacional (desde el alo 1940 hasta el presente) 6 Teoria de control y cibernética (desde el afio 1948 hasta el presente) 7 Lingiifstica (desde el afio 1957 hasta el presente) 18 1.3. Historia de la inteligencia artificial 9 Génesis de la inteligencia artificial (1943-1955) 0 Nacimiento de la inteligencia artificial (1956) 20 Entusiasmo inicial, grandes esperanzas (1952-1969) 2 Una dosis de realidad (1966-1973) 24 Sistemas basados en el conocimiento: ;clave del poder? (1969-1979) 26 La IA se convierte en una industria (desde 1980 hasta el presente) 28 Regreso de las redes neuronales (desde 1986 hasta el presente) 29 1A se convierte en una ciencia (dese 1987 hasta el presente) 29 mergencia de los sistemas inteligentes (desde 1995 hasta el presente) 31 14 Blestado del arte 32 LS Resumen 3 Notas bibliogrificas e historicas 34 Ejercicios 35 2 Agentes inteligentes 7 2.1 Agentes y su entorno 7 2.2 Buen comportamiento: el conceplo de racionalidad 40 Medidas de rendimiento 40 Racionalidad 41vr CONTENIDO: Onnisciencia, aprendizaje y autonomia 2.3 La naturaleza del entorno Especificacisn del entorno de trabajo Propiedades de los entornos de trabajo Estructura de los Programas de los agentes Agentes reactivos simples Agen Agentes basatlos en objetivos Agentes hasalos en utilidad Agentes que aprenden 2.5 Resumen Notas bibliograticas ¢ historicas Ejervicios mes s reactivos basaadas en modelos Resolver problemas mediante bisqueda 3.1 Agentes resolventes-problemas, Problemas y soluciones bien definidos Formular los problemas 3.2. Ejemplos de problemas Problemas de jug Problemas del mundo real 3.3. Buisqueda de soluciones Medir el renslimiento de la resolucién del problema 344 Bstrategias de buisqueds no informada Buisqueda primero en anchura Bhisqueda de costo uniforme Buisqueda primero en profundidad Baisqueda de profundidac limitada Buisqueda primero en profundic: Buisqueda bidireccional Comparacién de las estrategias de buisqueda no informad, 3.5. Bvitar estados repetidos 3.6 Bisqueda con informacidn parcial con profundidad iterativa Problemas sin sensores Problemas de contings 3.7 Resumen Notas hibliografi Ejervicios as e historieas, Busqueda informada y exploracién 4.1 Estrategias de busqueda informada (heuristicas) Baisqueda voraz, primero el mejor Buisqueda A*: minimizar el costo estimado (otal dela solucivin Buisqueda heurfstica con memoria acotada Aprender a buscar mejor 4.2 Funciones heuristicas, El efecto de la precisisn heuristica en el rendimiento Inventar funciones heurfsticas sdmisibles Aprendizaje de heuristicas desde la experiencia 4.3. Algoritmos de biisqueda local y problemas de optimizacivin 2 4 “4 7 SI Sl 53 55 37 58 59 2 63 65 7CONTENIDO Buisqueda de ascensi6n de colinas Buisqueda de temple simulado Buisqueda por haz local Algoritmos genstivos 4.4 Buisqueda local en espacios continuos 45. Agentes de buisqueda online y ambientes desconocidos Problemas de busqueda en linea (online) Agentes de biisquedsa en linea (online) Buisqueda local en linea (online) Aprendizaje en la busqueda en linea (online) 4.6 Resumen Notas bibliogesticas hist6rieas Bje Problemas de satisfaceidn de restriceiones 5.1 Problemas de satisfaccidn de restriecioney 5.2. Buisqueda con vuelta atris para PSR lable y ordenantiento de valor Propagacidn de la informaciéin a través de lus restrieciones Comprobitcién hacia delante Propay Manejo de restricciones especiales Vuelta atrais inteligente: mirando hacia atras 5.3. Brisqueda local para problemas de satisfaccidn de restricciones 54 La estructura de los problemas 5.5. Resumen icin de testricciones Notas bibliogrificas e histiricas Bjercicios isqueda entre adversarios 6.1 Juegos 6.2 Decisiones 6ptimas en juezos ‘sirategias Optimas EL algoritmo minimax Decisiones Sptimas en juegos multijugador 6.3 Pods alfa-beta 6.4 Decisiones en tiempo real imperfectas Funciones de evaluaci6n Corte de ka bvisquedl 6.5. Juegos que ineluyen un clemento de posibilidud Evaluacién de la posieidn en juegos con nodos de posibilidad Complejidad del minimaxesperado Juegos de cartas 6.6 Programas de juegos 6.7 Discusivn 68 Resumen Notss bibliogrificas c historias Rjereivios Agentes ligicos. 71 Agentes basados en conocimiento 7.2 EL mundo de wampusvu CONTENIDO 73 14 16 a4 78 Logica Logica propovicional: una logica muy sencilla Sintaxis Semintica Una base de conocimiento sencilla Inferencia Equivalencia, validez y satisfacibilidad Patrones de razonamiento en légica proposicional Resolucién Forma normal conjuntiva Un algoritmo de resolucién Completitud de la resolucién Encadenamiento hacia delante y hacia atras Inferencia proposicional efectiva Un algoritmo completo con backtracking («vuelta atti») Algoritmos de busqueda local Problemas duros de satisfucibilidad Agentes basados en lgica proposicional Encontrar hoyos y wurmpas utilizando la inferencia t6gica Guardar la pista acerca de la localizaci6n y ls orientacién del agente Agentes hasados en circuitos Una comparacion Resumg Notas bibliogrificas ¢ hist6rieas Logica de primer orden a 82 83 Ba Revisidn de la representacitn Sintaxis y semantica de la lbgica de primer orden Modelos en bogies de primer orden Simbolos e intespretaciones Términos Sentencias atémicas Senteacias compuestas Cuantificadores (Cuantificador universal (9) ‘Cuantificacion existencial () Cuantificadores anidados Conexiones entre ¥ y 3 ewaldad Unlizar la logiea de primer orden Aserciones y petiviones en Ioxica de primer orden EI dominio del parentesco Naimeros, conjuntos y Bistas EL mundo de wempus Ingenieria del conocimiento con I6gica de primer orden Fl proceso de ingenierfa del conocimiento El dominio de los eitcuitos eleetrinicos Meotificar ka tarea Recopilar cl conocimiento relevante socabulario Decidir el 29 230 233 233 235 236 239) 2a 22 23 24d 248 2s 240 251 253 253 255 256 260 i 262 26685 Notas bibliogri CONTENIDO Codificar el conocimiento general del dominio Codificar fa instancia del problema Planteat peticiones al procedimiento de inferencia Depurar la base de conocimiento Resumen case histori Ejercicios 9 Inferencia en légica de primer orden 9 93 94 9.6 Logica proposicional vs. Légica de primer orden Reglas de inferencia para cuantificadores Reduecidn a la inferencia proposicional Uniticaci6n y sustitueivn Una regia de inferencia de primer orden Unificacién Almacenamiento y recuperacisn Encadenamiento hacia delante Cléusulas positivas de primer orden Un algoritmo sencillo de encadenamiento hacia delante Encadenamiento hacia delante eficiente Emparejar reglas con los hechos conocidos Encadenamiento hacia delante incremental Hechos irrelevantes Encadenamiento hacia atris Un algoritmo de encadenamiento hacia atris Programacién légica Implementacién eficiente de programas li Inferencia redundante y bucles infinitos Programacin logica con restricciones Resolucion Formas normales conjumtivas en logiea de primer orden La regla de inferencia de resolucisn Demostraciones de ejemplo Completitud de Ia resolucisn Manejar la iguatdad Estratewias de resolucion Resolucion unitaria Resolucién mediante conjunto soporte Reyolucién lineal Subsuneién Demostradores de teoremas Diseio de un demostrador de teoremas Ampliarel Prolog Demostradores de teorensis como asistentes Usos pricticos de los demostradores de teoremas Resumen, Notas bibliogrificas e histirieas Ejereicios 1 Representacién det conacimiento ier ontoliigiea fa y objets Ix 300 300 301 301 302 308 308 309 310 310 BI 312 313 314 15 318 318.CONTENIDO, u Objetos compuestos Medidas Sustancias y objetos 10.3 Acciones, situaciones y eventos La ontologia del ealeulo de Staaciones Deseripcidn de accioves en el caleulo de situaciones Resolver el problema de ka representaci6n del marco ofver el problema de la inferencia del marco El tiempo y el caleulo de eventos Eventos generalizaclos Procesos Intervallos Flujos y abjetos 10.4 Eventos mentales y objetos mentales Una teoria formal de ereencias, Conocimiento y ereenciz Conocimiento, tiempo y accidn 10,5. El mundo de ta compra por Internet Comparacion de ofertas 10.6 Sistemas de razonamiento para cateyorias Redes semanticas Liigica descriptiva 10.7 Razonamiento con informacicn por defecto Mundos abiertos y eertados Negacisin como fallo y sementieas de modlelado estates Cireunseripcidn y logiea por defecto 10.8 Sistemas de maneaiimiento de verdad 10.9 Resumen Notas bibli Ejercicios ficas e historicas Planificaciin TLL El problema de planificacion EL lenguaje de fos problemas de planificacion Expresividad y extensiones, Ejemplo: transporte de carga aéreo Ejemplo: el problema de la rueds de recambio Ejemplo: J ntundo de fos bloques 11.2. Planificacion con buisquedas en espacios de estado Busquedas hacia-delante en el espacin de estados Buisqued hacia-atris en el espacio de estados Heuristicas para ta busqueda en el espacio de estado 11.3. Planificacion ordenada parcialmente Ejemplo de planiicacién de orden parcial “Planifieacién de orden parcial con variables independientes, Heurfsticas para planificacion de orien parcial HA Grafos de planiti Gralos de planifigacidn para estimacton de heuristicas PLagoritmes Guaruetan Interrupeidin de Grarsin.as, 11.5 Phinificacidn con ligica proposicional 308, 309) 37 373 373 315 a7 379 389 381 383 set 386 387 387 389 390 301 395, 397 397 401 402 403, 405 406 409 aul 412 ay a 48 a 431 133 434 434 46 436 438 439 441 445 44s, 449 450 453 454 497 i582 116 7 CONTENIDO Descripeisin de problemas de planificaci6n en I6giea proposicionsl Complejidad de codificaciones proposicionales Analisis de los enfoques de plant Resumen Notas bibliognificas e histories Ejercicios Planificaci6n v aceién en el mundo real 12.1 Tiempo. planiticacidn y recursos Programacién con resttieeidn de recursos 12.2. Redes de planificavién jerérquica de tareas Representucidn de descomposicion de aeciones, Moaliicaci6n de planificadores para su descomposicidn Discusion 12.3 Planificaciin y acciin en dominios no deterministas 12.4 Planificacion condicional Planifieacin condicional en entomnos completamente observables Planificacién condicional en entornos parcialmente observables 12.5. Vigilancia de ejecucicn y replanificacién 12.6 Planificacior continua 12.7 Pkaifieacién multiagente ‘Cooperacién: planes y objetivos conjuntos Planificacidn condicional en entornos parcialmente observables Mecanismos de coordinacidn Mecanismos dle eoordinacion 128 Resumen Notas hibliognifieas ¢ histricas Bjercicios Incertidumb 1B. Comportamiento bajo incertidumbre Manipulacisn de} conocimiento incierto Incertidumbre y devisiones racionales Disco de un agente de decision te6rieo 13.2. Notacion buisica con probabilidades Proposiciones Sucesns atmicos Probabilidad prion Probabilidad condicional 13.3 Los axiomas de la probabilidad Utilizacion de los sxiomas de probabilidad Por qué los axiomas dela probabildee! son razonables 13.4 Inferencia usando las ditriaciones conjuntas tales 13.5. Indypendencia 136. La Regls de Bayes y su uso Apficacidn de la egha de Bayes: el ease sencillo © Utlizacn de ha repla de Bayes: comibinavion de evideneia 147 ELmundo wiempus revista 13K Resumen, Notas hilbliogritieas ¢ historieas Ejercieios XI 458, 462 463 465 460) 469 475 475 478 481 482 48a 487 490 498 493 498 502 507 512 512 sla sis 517 si sis 527 527 528 530) sal 532 su 5a 536 537 539 540) Sal sad 546, 547 54s 550) 584 555 ss?xi CONT ENDO 14 Razonamiento probabilista 14.1 Larepresentacisn del conocimiento en un dominio incierto 14.2 La seiaintiew de las redes hayesianas La representacién de la distribucién conjunta completa ‘Un método para la construccidn de redes bayesianas Compactacién y ordenacién de nodos Relaciones de independencia condicional en redes bayesianas 14.3 Representacidn eficiente de las distribuciones condicionales Redes bayesianas con variables continua, 14.4 Inferencia exacta en redes bayesianas Inferencia por enumeracion EL algoritmo de climinacién de variables La complejidad de [a inferencia exacta Algoritmos basados en grupos 14.5 _Inferencia aproximada en rei Métodos de muestreo directo ‘Muestreo por rechazo en redes bayesianas Ponderacién de la verosimilitud Inferencia por simulacion en eadenas de Markov 14.6 Extension de la probabilidad a representaciones de primer orden 14.7 Otros enfogues al razonamiento con incertidumbre Metodos asados en reglas para rizonamiento con incertidumbre Representacién de ln ignorancia: eorfa de Dempster-Shafer Representacién de Ja vaguedad: conjuntos difusos y légica difusa 148, Resumen Notas bibliogrificas ¢ historicas Ejercicios es bayesianas 15. Razonamiento probabilista en el tiempo 15.1. El tiempo y la incertidumbre Estados y observaciones, Proceso estacionarios e hipstesis de Markov 15.2 Infereneia en modelos temporales Filtrado y prediecicin Suavizacde Encontrar la secuencia mis probable 15.3 Modelos ocultas de Markow Algoritmos matriciales simplificados 1540 Fluus de Kalman Actualizacidn de distribuciones gaussianas Un ejemplo unidimensional sencillo Fl caso genera Aplicabilidad del fltrada de Kalman ISS Rey Construceidn de RBDS Infereneia exacta en RBDs Infereneia aproxinada en RBDs 15.0 Reconocimiento de! hab Sonilos del halt Palabras es hayesianas dindmicas Oraciones S61 S61 564 S64 565 566 508 50) ST ST 575 377 S80) S80) 583 585 587 590) sus 596, 598 599 onl oo! 06 ou oul on ol ols. 6l7 ow on 624 or 028 on 632 O38 635, 636. a0) 641 as 647 4 6s16 7 18 CONTENIDO Construccion de un reconocedor del hublt 15.7 Resun Notas bibliog Bjeteicios Toma de decisiones sencillas 16.1 Combinacidn de ereencias y deseos hajo condiciones de incertidumbre 16.2 Los fundamentos de la teoria de ts utiidad Restricciones sobre preferencias racionales y entonces aparecié ta utitidad 16.3 Funciones de utilidad La utilidad del dinero, scala de utilidad y evaluacidn de fa utilidad 164 Funciones de utitidad multiatribato Predominio . Pstructura de preferencia y utilidad multiatribuco referencias sin incertidumbre Preferencias con incertidumbre 16.5 Redes de decision Representacién de un problema de decision mediante una ted de decisidn Evuluacidin en redes de decision 16.6 El valor de la informacion Un ejemplo sencillo Una formuta general Propiedades del valor de Ia informacién Implementacién de un agente recopilador de informacién 16.7. Sistemas expertos basados en la teorfa de la decisién. 16.8 Resumen Notas bibliogitfieas e historieas Ejercicios Toma de decisiones complejas 17.1 Problemas de deciston secuenciales Un ejemplo Optimalidad en problemay de decision secuenciales 17.2. Iteraci6n de valores Utildades de Los estados Fl algoritmo de iteracién de valores Convergencia de la iteracidn de valores 17.8 Heracion de politicas 174 Procesos de decision de Matkov parcialmente observables 17.5. Agentes basados en Ia teoria de la decisicin 17.6 Decisiones con varios agentes: teorfa de juegos 17.7. Disefio de mecanismos, V7.8 Resumen . Notas bibliogiicas e histéricas Aprendizaje de observaciones IX.1 Formas de aprendizaje 18.2 Aprendizaje inductive XI 654 656 656 659 663 664 665 666 608 669 669) on om o7t 77 677 678 679 om os 682 682 683 685 685 680. 690 690 92 697 698, 698, 01 0d 704 05 07 710 m2 116 19 79 732 733 736 739 79 72XIV CONTENIDO » 20 18.3 Aprender drbotes de decisidin Arboles de decisin como herramienta de desarrollo, Expresividad de los dirboles de decision Inducir irboles de decision a partir de ejemplos Eleceidn de los atrbutos de test Valoracisn de la calidad del algoritmo de aprendizaje Ruido y sobreajuste Extensidn de la aplicabilidad de los érboles de decision I84_ Aprendizaje de conjuntos de hipstesis 18.5 Por qué funciona cl aprendizaje”: teoréa computacional del aprendizaje ic ian? ‘Aprendizaje de listas de decision Discusion 18.6 Resumen Notas bibliogrificas e histérieas Bjetvicios intos ejemplos se ne Conocimiento en el aprendizaje 19.1 Uns formulacién légica del aprendizaje Ejemplos e hipstesis asqueda mejor-hipstesis-aetual Bisqueda de minimo compromise 19.2. Conocimiento en el aprendizaje Algunos ejemplos seneillos Algunos esquemas generales 19.3 Aprendizaje basado en explicaciones, Extracr reglas generals & partir de ejemplos: Mejorar la ef 19.4 Aprendizaje basado en informacién relevante Determinar el espacio de hipatesis Aprender y utilizar informacidn relevante 19,5 Programacion logics inductivar Un ciemplo M do «le aprendizaje inductive de arriba a abajo (Top-down Aprendizaje induetivo con deduccidn inverst Hacer descubrimientos con la programe! 186 Resumen Notas bibliogrificas ¢ historicas Eereicios Metodos estadisticns de aprendizaje 20.1 Aprendizaie estadistico 20.2. Aprendizate con datos completos [Aprendizaje del parsimetro de maxima verosimilitud: modelos diseretos Modelos de Bayes simpley (Naive B: Aprendizaje de parimetos de niixima verosimilitud: modelos continuos Aprendizaje de pardmetos Bayesiano Aprendizaje de la estructura de kis redes bayesianas 20.3 Aprendizaje con variables ocultay: el algoritmne EM. Ay Aprendizaje de redes bayesianas con variables veultas res) ipamivnty no supervisalor aprenulizatie de mezclas de m4 a4 74s 146 750 752 753 755 756 700 761 103 105, 766 167 709) T™ mm mm 116 Ts 782 784 784 786 187 780 1 2 792 795 795 78, sol 803 805 806 809 su si Bis SIs Bis 819 821 823 825 826, #29)CONTENIDO, Aprendizaje de modelos de Markov ocultos Forma general del algoritmo EM Aprendizaje de la estructura de las redes de Bayes con variables ocultas 204 Aprendizaje basado en instancias Maadelos de vecinos mis cereanos Modelos nticleo 20.5 Redes nevronales Unidades en redes neuronales Estructura de las re Redes neuronales de una sola capa con alimentaci6n-hacia-delante (perceptrones) Redes neuronales multicapa con alimentacisn hacia delante Aprendizaje de la estructura de las redes neuronales 20.6 Maiguinas miicleo 20.7 Caso de estudio: reconocedor de digitos escritos a mano 20.8 Resumen Notas bibliogeaticas e bistéricas Bjercicios Aprendizaje por refuerzo 21.1 Introduccisn 21,2 Aprendizaje por refuerzo pasivo Estimacion directa de la utilidad Programacion dinamica adaptativa Aprendizaje de diferencia temporal 21.3 Aprendizaje por refuerzo active Exploracion Aprendizaje de una Funcién Accién: Valor 214) Generalizacién en aprendizaje por vefuerzo Aplicaciones a juey Aplicacién a control de robots 21.5 Biisqueda de la politica 21.6 Resumen Notas bibliootiicas e histuricas Ejereicios 2.1 La comunicacién como accion Fundamentos del lenguaje Etapas de la comunicacisn Una gramstiea formal para un fragmento del espaiiol EI Iéxico de e0 La Gramitica de eb 22.3. Anilisis sintgetien Anilisis sintictico eficiente 24 Gramatieas aumentadas Subeateyorizacion del verbo Capacidad generativa de lay gramtiticas uments 22.5. Interpretacidn semantics Fa semtdntiea de un fragmento en espaol Tiempo y forma verbal Cuantiticacivin xv 831 832 833, 834 835 837 838 839 840 saz 846 ssl 851 855) 897 859. 863 867 867 869) 870. aT sr 816 876 880 882 885) 886 887 800) 801 894 897 898, 809) 900 903 904 904 905 908: old 916 ons ow 90 921XVI CONTENIDO 2B 4 Interpretacin pragmatica Generacién de lenguajes con DCGs 22.6 Ambigitedad y desambigiiedad Desambiguacién 22.7 Comprensi6n del diseurso Resolucién por referencia La estructura de un discurso coherente in gramatical Notas bibliogr Bjercicios Procesamiento proba 23.1. Modelos prohabilisticos de! lenguaje Gramticas probahilisticas independientes del contexto Aprendizaje de probabilidades para PCFGs. Aprendizaje de la estructura de las reglas para PCF Recuperacion de datos Evaluacidn de los Sistemas de RD Refinamientos RD Presentacién de Jos conjuntos de resultados Implementar sistemas RD 23.3 Extraccién de la informacién 234 Traduccién avtomitica Sistemas de traduccién automa ‘Tradueci6n automtica estaistica Probabilidades de aprendizaje para la traduccion automtica 23.5 Resumen Notas bibliogrificas e histérieas Ejercicios Percepeidn 24.1 Introduccion 24.2 Formacién de la imagen Imigenes sin lentes: a edimara de orificio 6 pinhole Sistemas de lentes Luz: la fotometrfa de la formacion de imégenes Color: Is espectrofotometria de la formaciéin de imiigenes 24.3. Operaciones de procesamiento de imagen :t bajo nivel Deteccidn de aristas Segmentacidn de la imagen 244 Extraceidn de informacion tridimensional Movimiento. Extereoscopia binocular Gradientes de textura Sombreado Contormo 24.5 Reconocimiente de abjetos Reconocimiento basado en la intensidd Reconocimient basado en las earacteristivas Estimacidin de postura 925 926 927 929 930. 9B 932, 934 936 937 oat 945: 945: 949 950 951 952 955 956 957 959 961 964 966, 967 970. 972 972 o75. 97 979 ost 982 983 983 985; ONG os7 990 991 993) 996 vor co) hoon nod 1007 aos iw% CONTENIDO, 24.6 Empleo de la visidn para a manip 24.7 Resumen Notas hibliograiicas e historicas Bjercicios Robstica 25.1. Introduecién 25.2 Hardware robotico Sensores, Efectores 25.3 Percepeisn robsitica Localiz ‘én Generacién de mapas Otros tipos de percepeidn Planear el movimiento Eypacio de configuracién Métodos de descomposicidn en celdas Métodos de esqueletizacién 25.5. Planificar movimientos inciertos Métodos robustos 25.6 Movimiento Dinémica y control Control del campo de potencial Control reactive 25.7 Arquitecturas software robéticas Arquitectura de subsumpeiéin Arquitectura de tres capas Lenguajes de programacidn roboticos 258 Dominios de aplicacién 259 Resumen Notas bibliografieas e historieas. Ejercicios Fundamentos wéficos, 26.1 TA débil: {pueden kas maquinas uetuar con inteligencia? EL argumento de incapacidad La objecion matemstica £1 arguanento de la informalidad 26.2. 1A fuerte: pueden las miguinas pensar de verdad? BE problema de mente-cuerpo El experimento del «cerebro en una cubetar El experiment de ta prétesis cerebral La habitacién ehina 26.3 La ética y los rieygos de desarrollar la Inteligeneia Artificial 26.4 Resumen Notas bibliogr icas ¢ histories Hjeteivins TA: presente y future 27.1 Componentes de tos agentes 27.2 Arquitecturay de agentes XVI 1012 rol 11s 11s 1023 1023 1025 102s 1027 1029 1031 1036 1039 1039 tao lows 1046 1047 1048 1031 10st 1054 1055 10ST 1058 oso 1000 1061 1064 1005 1069 1075 1075 77 1078 lo79 Lost losa loss 10K6 oss: 1090 109s 1095 1098 1099 loo hozXVI CONTENIDO 27,3. ¢kstamos Hevando la diteccidn salecuada? 274 {Qué ocurriia si la LA tuviera éxito? A. Fundamentos matem: cos A.1Anilisis de ka complejidad y la notacion OF ) Ana Los proble isis asintstico inherentemente dificiles y NP A.2 Vectores, matrices y ilgebra lineal |A.3._ Distribuciones de probabilidades Notas bibliogrificas e historicas B Notas sobre lenguajes y algo B.1Definicisn de lenguajes con Backus: Naur Form (BNF) B.2__ Algoritmos de descripcisn en pseudocédigo B3 Ayuda en lines Bibliografia Indice alfabético Hos 1106 1109 1109 1109 io m2 tg ins 17 17 1s 19 124 1179ee Prologo ———————— La Intcligencia Artificial (IA) es un campo grande (enorme), y este libro también, He intentado explorarlo con plena profundidad acompafiéndolo constantemente de Wigica, probabilidad y matemiticas; de percepcién, razonamiento, aprendizaje y accién, es decir, de todo To que procede de los dispositivos microelectrOnicos hasta los explorado- res del planetario de la robstica, Otra razén para que este libro se pueda considerar espléndido es ka profundidad en la presentacidn de los resultados, aunque nos hayamos, esforzado por abarcar s6lo las ideas mas centrales en fa parte principal de cada eapste. lo, En las notas bibliogriticas al final de cada capitulo se proporcionan consejos para promover resultados, EI subtitulo de este libro es «Un Enfoque Moderno». Lat intencin de esta frase bas- {ante vaefa es el hecho de que hemos intentado sintetizar lo que se conoce ahora dentio de un marco de trabajo comin, en vez de intentar explicar cada uno de los subeampos de la IA dentro de su propio contexto histérico. Nos disculpamos ante aquellos cuyos. subcampos son, como resultado, menos reconocibles de lo que podrfan haber sido de cualquier otra forma. El principal tema unificador es Ia idea del agente inteligente, Definimos la 1A como el estudio de los agentes que reciben percepciones del entorno y Hevan a cabo las ac ciones, Cada a gente implementa una funcidn la cual estructur Jas secuencias de las per cepciones en acciones; también tratamos las diferentes formas de representar estas funciones, tales como sistemas de produccién, agentes reactivos, plani icadores condicionales en tiempo real, redes neurales y sistemas tedricos para las decisiones. Explicaremos el papel del aprendizaje cuando aleanza al diseiador y eémo se introduce en entornos des conocidos, mostrando también cémo ese papel limita el disefio del agente, favorecien- do asi la representaci6n y el razonamiento explicitos del conocimiento, Trataremos la robdtica y su visién no como problemas con una definicisn independiente, sino como algo que ocurre para lograr los objetivos. Daremos importancia al entorno de las tareas al determinar el diseao apropiado de Tos agentesXX PROLOGO Nuestro objetivo principal es el de transmitir las ideas que han surgido durante los diltimos 50 aiios de investigacién en IA y trabajos afines durante los dos titimos mile nios. Hemos intentado evitar una excesiva formalidad en la presentacidn de estas ideas a la vez que hemos intentado cuidar la precisiGn, Siempre que es necesario y adecuado, incluimos algoritmos en pseudo cédigo para concretar las ideas, lo que se describe en el Apéndice B. Las implementaciones en varios lenguajes de programacién estén disponibles en el sitio Web de este libro, en la direccién de Internet aima.es.berkeley.edu, Este libro se ha pensado principalmente para utilizarse en un curso de diplomatui en. una serie de varios cursos, También se puede utilizar en un curso de licenciatura (quizés acompaiado de algunas de las fuentes primarias, como las que se sugieren en las notas bibliograficas), Debida a la extensa cobertura y a la gran cantidad de algorit- ‘mos detallados, también es una herramienta Gti! como manual de referencist primario para alumnos de licenciatura superior y profesionales que deseen abarcar mas alld de su propio subcampo, El Gnico prerrequisito es familiarizarse con los conceptos basicos de la Ciencia de la informédtica (algoritmos, estructuras de datos, complejidad) a un nivel de aprendizaje de segundo afo. El célculo de Freshman es titi para entender las redes new- rales y el aprendizaje estadistico en detalle, En el Apéndice A se ofrecen los fundamentos matemiiticos necesarios. Vision general del libro El libro se divide en ocho partes. La Parte 1, Inteligencia Artificial, ofrece una visién de la empresa de TA basado en la idea de los agentes inteligentes, sistemas que pueden decidir qué hacer y entonces actutar. La Parte I, Resolucién de Problemas, se concentra en los métodos para decidir qué hacer cuando se planean varios pasos con antelacién, por ejemplo, navegar para eruzar un pais 0 jugar al ajedrez. La Parte 11, Conocimien- to y Razonamiento, abarca las formas de representar el conocimiento sobre el mundo, es decir, cémo funciona, qué aspecto tiene actualmente y cémo podria actuar, y estudia tambign edmo ravonar de forma légica con ese conocimiento, La Parte IV, Planifica ci6n, abarca cémo utilizar esos métodos de razonamiento para decidir qué hacer, parti- cularmente construyendo planes. La Parte V, Conocimiento y Razonamiento Inci tos, se asemeja a las Partes HIT y EV, pero se concentra en el razonamiento y en la toma de decisiones en presencia de la incertidumbre del mundo, la forma en que se podria en- frentar, por ejemplo, a un sistema de tratamiento y diagnosis médicos, Las Partes II y V describen esa parte del agente inteligente responsable de aleanzar Jas decisiones. La Parte [V, Aprendizaje, describe los métodos para generar el conoci: miento requerido por los componentes de la toma de decisiones. La Parte VI, Comu- nicacién, Percepeién y Actuacién, describe las formas en que un agente inteligente puede percibir su entorno para saber lo que estii ocurriendo, tanto si es mediante la vision, el tacto, el ofdo 0 el entendimiento del idioma; también describe cémo se pueden tra formar Jos pkines en aeciones reales, o bien en movimientos de un robot, o bien en dr- denes del lenguaje natural, Finalmente, la Parte VII, Conelusiones, analiza el pasado y el futuro de la TA y sus repercusiones filossticas y éticas.PROLOGO—-XXT Cambios de la primera edicién Desde que en 1995 se publics la primera edicisn, la LA ha suftido muchos cambios, por lo tanto esta edicidn también ha sufrido muchos cambios. Se han vuelto a escribir todos Jos capitulos elocuentemente para reflejar los titimos trabajos de este campo, reinter- pretar los trabajos anteriores para que haya mayor coherencia con los actuales y mejorar la direccidn pedagdgica de las ideas. Los seguidores de la [A deberfan estar alenta dos, ya que las técnicas actuales son mucho mais pricticas que las del aio 1995; por ejemplo, los algoritmos de planificacién de la primera edicisin podrian slo de unos cuantos pasos, mientras que los algoritmos de esta edicién superan los miles de pasos. En la deduccidn probalistica se han visto mejoras similares de érdenes de magnitud, procesamiento de lenguajes y otros subcampoy. A continuaci Jos cambios mas destacables de esta edicién eenerar pla n se muestran + En la Parte T hacemos un reconocimiento de las contribuciones histérieas a la teorfa de controles, teorfa de juegos, economia y neurociencia, Esto ayudard a sintonizar con una cobertura més integrada de estas ideas en los siguientes ea pitulos, + En la Parte II se estudian los algoritmos de busqueda en linea, y se ha afiadido un capitulo nuevo sobre la satisfaccidn de las limitaciones. Este tiltimo proporeiona una conexién natural con el material sobre la légica. + En la Parte III la l6gica proposicional, que en la primera edicién, se present como un peldaio a la légica de primer orden, ahora se presenta como un lenguaje de re- presentaciGn ttil por propio derecho, con ripidos algoritmos de deduccién y di- seftos de agentes basados en circ den se han reorganizado para presentar el material de forma mas clara, anadiendo el ejemplo del dominio de compras en Internet la Parte IV incluimos los métodos de planificacién mas actuales, tales como GaapupLan y la planificacién asada en la satisfabilidad, ¢ inerementamos ka cobertura de la planificaciGn temporal, planificacién condicional, planificacién j rérquica y planificacién multiagente tos. Los capitulos sobre la Iégiva de primer or + En la Parte V hemos aumentado el material de redes Bayesianas con algoritmos nuevos, tales como la eliminacidn de variables y el algoritmo Monte Carlo de ea- dena Markov; también hemos creado un capitulo nuevo sobre el razonamiento temporal incierto, abarcando los modelos ocultos de Markov, los filtros Kalman y las redes dindmicas Bayesianas. Los procesos de decisién de Markov se estudian en profundidad, anadiendo tam canismos. én secciones de teoria de juegos y disefios de me- + En la Parte VI combinamos trabajos de aprendizaje estadistico, simbélico y new ral, y afadimos secciones para impulsar los algoritmos, el algoritmo EM, aprendizaje basado en instancias, y métodos kernel «de micleo» (Soporte a méquinas vectoriales). + En la Parte VIL el estudio del procesamiento de lenguajes aiade secciones sobre el pro esamiento del discurso y la induceién gramatical, asi como un capitulo so-XXIT pROLOGO. bre los modelos de lenguaje probalistico, con aplicaciones en la recuperacién de informacién y en la traduccién automitica. El estudio de la robética enfatiza la in- tegracién de datos inciertos de sensores, y el capitulo sobre la visidn actualiza el material sobre el reconocimiento de objetos + Ena Parte VIII introducimos una seccién sobre las repercusiones éticas de la LA Utilizacion del libro (oe) ‘esto wuevo 27 capitulos componen a totalidad del libro, que a su vez estén compuestos por sesio nes para clases que pueden durar una semana, por tanto para completar el libro se pue den necesitar hasta dos semestres, Alternativamente, se puede adaptar un curso de forma que se adecue a los intereses del instructor @ del alumno. Si se utiliza el libro completo, servird como soporte para cursos tanto si son reducidos, de introduceién, para diplomaturas o para licenciados ¢ ingenieros, de especializacién, en temas avanzados. En la pagina Web aima.cs.berkeley.cdu, se oftecen programas de muestra recopilados de miis de 600 escuelas y facultades, ademds de sugerencias que ayudaran a encontrar la secuencia més adecuada para sas necesidades. Se han incluido 385 ejercicios que requieren una buena programacién, y se han mar. cao con el icono de un teclado. Estos ejercicios se pueden resolver utilizando el repo: sitorio de eddigos que se encuentra en ka pigina Web, aima.cs.berkeley.edu. Algunos de ellos son tan grandes que se pueden considerar proyectos de fin de trimestre. Alzunos ejercicios requieren consultar otros libros de (exto para investigar y se han marcado con el icono de un fibro. Los puntos importantes también se han mareado con un icono que indica puntos im portantes. Hemos incluido un indice extenso de 10.000 elementos que facilitan la utili- zacidn del libro, Ademis, siempre que aparece un término nuevo, tambicn se destaca enel mangen Utilizacién de la pagina Web En la pagina Web se puede encontrar + implementaciones de los algoritmos de! libro en diferentes lenguajes de progra- macién, + una relacién de aproximadamente 600 universidades y centros, que han utilizade este libro, muchos de ellos con enlaces a los materiales de cursos en la red + una relacidn de unos 800 enlaces a sitios Web con contenido itil sobre la 1A, + una lista de tados los capitulo, uno a uno, material y enlaces complementarios. + instrucciones sobre & Gmo unirse a un grupo de debate Sobre el libro, + instrucciones sobre cémo contactar con los autores mediante preguntas y comen: tarios.pRoLoco XXII + instrucciones sobre como informar de los errores del libro, en el caso probable de que existieran. y + copias de las figuras del libro, junto con diapositivas y otro tipo de material para profesores Agradecimientos Jitendra Malik ha eserito la mayor parte del Capitulo 24 (sobre la visién). Gran parte det Capitulo 25 (sobre robsitica) de esta edicidin ha sido eserite por Sebastian Thrun, mientras que la primers edicién fue escrita por John Canny. Doug Edwards investigé las notas historicas de la primera edici6n. Tim Huang, Mark Paskin y Cinthia Bruyns ayudo a realizar el formato de los diagramas y algoritmos. Alan Apt, Sondra Chavez, Toni Holm, Jake Warde, Irwin Zucker y Camille Trentacoste de Prentice Hall hicieron todo lo que pudieron para cumplir con el tiempo de desarrollo y aportaron muchas sugerencias so: bre el diseito y el contenido del libro. Stuart quiere agradecer & sus padres el continuo apoyo y aliento demostrado, y a su esposa, Loy Sheflott su gran paciencia e infinita sabiduria, También desea que Gordon y Lucy puedan leer esta obra muy pronto. Y a RUGS (Russells Unusual Group of Stu- dents) por haber sido de verdad de gran ayuda Peter quiere agradecer a sus padres (Torsten y Gerda) el nimo que le aportaron para impulsarle a empezar el proyecto, y a su mujer Kr amigos por animarle y to- Jerar todas las horas que ha dedicado en escribir y en volver a escribir su trabajo. Estamos en deuda con los bibliotecarios de las universidades de Berkeley, Stanford. y con el MIT y la NASA; y con los desarrolladores de CiteSeer y Google por haber re volucionado la forma en que hemos realizado gran parte de la investigacién Obviamente, nos es imposible agradecer a todas las personas que han utilizado el libro y que han realizado sugerencias, sin embargo nos gustaria mostrar especial ageade- cimiento alos comentarios que han realizado personas como Eyal Amir, Krzysztof Apt, Ellery Aziel, Jeff Van Baalen, Brian Baker, Don Barker, Tony Barrett, James Newton Bass, Don Beal, Howard Beck, Wolfgang Bibel, John Binder, Larry Bookman, David R. Boxall, Gerhard Brewka, Selmer Bringsjord, Carla Brodley, Chris Brown, Wilhelm Burger, Lauren Burka, Joao Cachopo, Murray Campbell, Norman Carver, Emmanuel Castro, Anil Chakravarthy, Dan Chisatick, Roberto Cipolla, David Cohen, James Cole- man, Julie Ann Comparini, Gary Cottrell, Ernest Davis, Rina Dechter, Tom Dieterich, Chuck Dyer, Barbara Engelhardt, Doug Edwards, Kutluhan Erol, Oren Etzioni, Hana Fi- lip, Douglas Fisher, Jeffrey Forbes, Ken Ford, John Foster, Alex Franz, Bob Futrelle, Ma- rek Galecki, Stefan Gerberding, Stuart Gill, Sabine Gi th Golub, Gosta Grah- ne, Russ Greiner. Eric Grimson, Barbara Grosz, Larry Hall, Steve Hanks, Othar Hansson, Emst Heinz, Jim Hendler, Christoph Herrmann, Vasant Honavar, Tim Huang, Seth Hutchinson, Joost Jacob, Magnus Johansson, Dan Jurafsky, Leslie Kaelbling, Keiji Kanavawa, Surekha Kasibhatla, Simon Kasif, Henry Kautz, Gernot Kersehbaumer, Ri- chard Kirby, Kevin Knight, Sven Koenig, Daphne Koller, Rich Korf, James Kurien, Jobn Lafferty, Gus Larsson, John Lazzaro, Jon LeBlane, Jason Leatherman, Prank Lee, . hijos sner,XXIV PROLOGO Edward Lim, Pierre Louveaux, Don Loveland, Sridhar Mahadevan, Jim Martin, Andy Mayer, David McGrane, Jay Mendelsohn, Brian Milch, Steve Minton, Vibhu Mittal, Le- ‘ora Morgenstern, Stephen Muggleton, Kevin Murphy, Ron Musick, Sung Myaeng, Lee Naish, Pandu Nayak, Bernhard Nebel, Stuart Nelson, XuanLong Nguyen, Ilah Nour bakhsh, Steve Omohundro, David Page, David Palmer, David Parkes, Ron Parr, Mark Paskin, Tony Passera, Michael Pazzani, Wim Pijls, Ira Pohl, Martha Pollack, David Po- ole, Bruce Porter, Malcolm Pradhan, Bill Pringle, Lorraine Prior, Greg Provan, William Rapaport, Philip Resnik, Francesca Rossi, Jonathan Schaeffer, Richard Scherl, Lars Schuster, Soheil Shams, Stuart Shapiro, Jude Shavlik, Satinder Singh, Daniel Sleator. David Smith, Bryan So, Robert Sproull, Lynn Stein, Larry Stephens, Andreas Stolcke. Paul Stradling, Devika Subramanian, Rich Sutton, Jonathan Tash, Austin Tate, Michael Thiel: William Thompson, Sebastian Thrun, Eric Tiedemann, Mark Torrance, Ran- dall Upham, Paul Utgoff, Peter van Beek, Hal Varian, Sunil Vemuri, Jim Waldo, Bon- nie Webber, Dan Weld, Michael Wellman, Michael Dean White, Kamin Whitehouse, Brian Williams, David Wolfe, Bill Woods, Alden Wright, Richard Yen, Weixiong Zhang, Shlomo Zilberstein, y los revisores anénimos proporcionados por Prentice Hall Acerca de la portada La ilustracién de la portada ha sido disefiada por los autores y ejecutada por Lisa Marie Sardegna y Maryann Simmons utilizando SGI Inventor™ y Photshop™ de Adobe, representa los siguientes elementos de la historia de Ta TA: 1. Elalgoritmo de planificacién del De Motu Animatium, Arist6teles (400 aC.) 2. El generador de conceptos del Ars Magna de Ramén Lull (1300 d.C.) 3, El motor de diferencias de Charles Babbage, un prototipo de! primer computador universal (1848) La notacisn de légica de primer orden de Gottlob Frege (1789). 5. Los diagramas del razonamiento logico de Lewis Carroll (1886) 6. La notacién de redes probalisticas de Sewall Wright (1921). 7. Alan Turing (1912-1954). 8. £1 Robot Shakey (1969-1973) 9. Un sistema experto de diagndstico actual (1993)Sobre los autores ————————————— re Stuart Russell nacié en 1962 en Portsmouth, Inglaterra. En 1982, obtuvo su B.A. en Fisica formando parte de los primeros en el cuadro de honor de la Universidad de Ox- ford. En 1986 obtuvo el Ph. D. en Informatica por la Universidad de Stanford. Ms tarde empez6 a trabajar en la Universidad de California, Berkeley, en donde es profesor de Informatica, director del centro de Sistemas Inteligentes y colaborador del Smith-Zadeh ‘en Ingenieria. En 1990, recibis el premio Presidential Young Investigator Award de la National Sciencie Foundation (Fundacién Nacional de las Ciencias), y en 1995 obtuvo el premio compartido en el Computers y Thought Award, En 1996 se convirtié en Mi- llar Profesor de la University of California, y en el afto 2000 fue nombrado rector de la universidad. En 1998, dio la lectura inaugural de la Stanford University, Forsythe Me- morial Lectures. Forma parte como «Fellow», y es uno de los primeros miembros de! Executive Council de la American Association for Artificical Intelligence, Ha publica- do un gran ndimero de trabajos, més de 100 sobre una gran variedad de temas en inteligencia artificial. ¥ es autor de otros dos libros: The Use of Knowledge in Analogy and Induction, y (con Erik Wefald) Do the Right Thing: Studies in Limited Rationality. Peter Norvig es director de Search Quality de Google, Ine. y forma parte, como «Fe- How» y miembro del Executive Council en la American Association for Artificial Inte- igence. Anteriormente, fue director de la Divisién de Ciencias Computacionales del Ames Research Center de la NASA, en donde supervisaba la investigacién y el desarrollo en inteligencia artificial. Antes de eso, trabaj6 como director de ciencia en Junglee, donde ayudé a desarrollar uno de los primeros servicios de extraccién de informacién cen Internet, y trabajé también como cientifico senior en Sun Microsystems Laboratories, cuyo trabajo consistia en recuperar informacién inteligente. Recibi6 un B.S. en Mate- méticas Aplicadas por la Brown University, y un Ph. D, en informatica por la Universi- dad de California en Berkeley. Es profesor de la University of Southern California, y miembro de ta facultad de investigacién en Berkeley. Tiene en su haber més de 50 pu- blicaciones en Informética entre las que se incluyen los libros: Paradigms of Al Pro- gramming: Case Studies in Common Lisp, Verbmobil: A Translation System for Face- to-Face Dialog, e Intelligent Help Systems for UNIX.samc Introduccion Donde se intentaré explicar por qué se considera a la inteligencia artificial un tema digno de estudio y donde se intentard definirla con exactitud; es esta tarea muy recomendable antes de emprender de leno su estudio. Los hombres se han denominado a sf mismos como Home sapiens (hombre sabio) porque nuestras capacidades mentales son muy importantes para nosotros. Durante miles de afios, hemos tratado de entender cémo pensamos; es decir, entender c6mo un simple pufiado de materia puede percibir, entender, predecir y manipular un mundo mucho més grande y complicado que ella misma. El campo de la inteligencia artificial, © 1A, va mas alld: no sélo intenta comprender, sino que también se esfuerza en cons ir entidades inteligentes. La TA es una de las ciencias mas recientes. El trabajo comen7s poco después de la Segunda Guerra Mundial, y el nombre se acuiié en 1956. La TA se cita, junto a la bio logia molecular, como un campo en el que a la mayoria de cientificos de otras disciplinas «les gustaria trabajar». Un estudiante de ciencias fisicas puede pensar razonablemente que todas las buenas ideas han sido ya propuestas por Galileo, Newton, Einstein y otros, Porel contrario, la IA atin tiene flecos sin cerrar en los que podrian trabajar varios Eins teins a tiempo completo, La TA abarca en la aetualidad una gran variedad de subcampos, que van desde ére- ias de propdsito general, como el aprendizaje y la percepcisn, a otras mis especificas como cl ajedrez, Ia demostracién de teoremas matematicos, la escritura de poesia y el diag~ néstico de enfermedades, La IA sintetiza y automatiza tareas intelectuales y es, por lo Lanto, potencialmente relevante para cualquier ambito de li actividad intelectual huma. nna, En este sentido, es un campo genuinamente universal.20 INTE 1.1 :Qué es la IA? ACIONALIOND LIGENCIA ARTIFICIAL, UN ENEOQUE MODERNO- Hemos proclamado que la TA es excitante, pero no hemos dicho qué es. La Figura 1.1 presenta definiciones de inteligencia artificial extratdas de ocho libros de texto. Las que aparecen en la parte superior se refieren a procesos mentales y al razonamiento, mien tras que las de Ia parte inferior aluden a la conducta. Las definiciones de la izquierda miden el éxito en términos de la fidelidad en la forma de actuar de los humanos, mien tras que las de la derecha toman como referencia un concepto ideal de inteligencia, que Hamaremos racionalidad. Un sistema es racional si hace «lo correeto», en funcidn de su conocimiento. ‘A Io largo de la historia se han seguido los cuatro enfoques mencionados. Como es de esperar. existe un enfrentamiento entre los enfoques centrados en los humanos y los centrados en tomo a Ja racionalidad'. El enfoque centrado en el comportamiento hun no debe ser una ciencia empirica, que incluya hipstesis y confirmaciones mediante experimentos. El enfoque racional implica una combinacidn de matemiticas e ingenierfa Cada grupo al mismo tiempo ha ignorado y ha ayudado al otro, A continuacién revisa- remos cada uno de los cuatro enfoques con més detalle, san como humanos Sistemas que piensan racionalmente ales median. les». (Ch E] nuevo y excitante esfuerzo de hacer que fos | El estudio de las facultades me ccomputadores piensen... miquinias con mentes, en | te el uso de modelos computacion | cel mus amplio sentido literal». (Haugeland, 1985) | niak y McDermott, 1985) | EL estudio de los cileulos que hacen posible | percibir, razonar y actuar», (Winston, 1992) | {Lea automatizacion de} actividades que vinew | lamos con procesos de pensamiento humano, se- Lividades como ta toma de decisiones, resolucion e problemas, aprendizaje...» (Bellman, 1978) smas que aetdan como Sistemas qu i actiian racionalmente Inveli encia Computacional es el estudio | el disefio de agentes inteligentes». (Poole et | ul, 1998) | para realizar funciones que euando son realiza {das por personas requieren de inteligencia» (Kureweil, 1990) «4 estudio de como lograr que los computado- | res realicen tareas que, por el momento, los hut IA... esti relacionada con conductas intel _gentes en artefactos». (Nilsson, 1998) ‘laste de desaolarmdguinas con eapacidad | = manos hacen mejor» Rich y Knight 1991) | Figura 1.1 Algunas definiciones de inteligencia artificial, organizadas en cuatto categortas CConvione aclarat que al distinguie entre comportamiente humano y sacianal no se esti sugiriende que hy Fhuanos son necesariamente arravionaless en el sentide de sinestahilidad emocionabs © saesequtlibri mental». Basta con damos cuenta de yue nu somos perfectas: no todos somos maestros de ajedre7, inelus aquellos que conocemos txkss fas regs dle ajedre7:y desafortunadamente, no todas obtenemies ua sobre saliente en un examen, Kahneman ¢f af. (1982) ha elaborade un catilo Sistemaiticamente cometen fos hummanos cus fazonsan, con algunos be los errores quePAUEEADE TURING RacesaMienro 0€ ‘ENGUAE WATURAL ePRESENTACION Del CONDIMENT azowamento Aurowarico| apaewowaie agua ‘PARUEBA De TURING toon. ‘sta coMPUTACONAL ronorica INTRODUCCION Comportamiento humano: el enfoque de la Prueba de Turing La Prueba de Turing, propuesta por Alan Turing (1950), se disefié para proporcionar tuna definicién operacional y satisfactoria de inteligencia, En ver. de proporcionar una lista larga y quizd controvertida de cualidades necesarias para obtener inteligencia arti ficialmente, é1 sugiri6 una prueba basada en la incapacidad de diferenciar entre entida. des inteligentes indiscutibles y seres humanos. El computador supera la prueba si un eva luador humano no es capaz de distinguir si lay respuestas, a una serie de preguntas planteadas, son de una persona o no. En el Capitulo 26 se comentan detalles de esta prue ba y se discute si un computador que supera la prucba es realmente inteligente, Hoy por hoy, podemos decir que programar un computador para que supere la prueba requiere un trabajo considerable, El computador deberia poscer las siguientes capacidades: + Procesamiento de lenguaje natural que le permita comunicarse satistactoriamente sen inglés. + Representacién del conocimiento para almacenar lo que se conoce 0 siente. + Razonamiento automatico para utilizar la informacién almacenada pa ponder a preguntas y extraer nuevas conclusiones, + Aprendizaje automatico para adaptarse a nuevas circunstancias y para detectar y extrapolar patrones. La Prueba de Turing evité deliberadamente la interacci6n fisiea directa entre el evalua dor y el computador, dado que para medir la inteligencia es innecesario simular fisica ‘mente a una persona. Sin embargo, la Hamada Prueba Global de Turing incluye una se- al de video que permite al evaluador valorar la capacidad de percepeién del evaluado, y también le da la oportunidad al evaluador de pasar objetos fisicos «a través de una ven- tanita», Para superar la Prueba Global de Turing el computador debe estar dotado de + Visién computacional para percibir objetos. + Robética para manipular y mover objetos. © ser reconocide Estas seis disciplinas abarcan la mayor parte de la 1A, y Turing me por diselar una prueba que se conserva vigente despues de 50) afios. Los investigadores del campo de la TA han dedicado poco esfuerzo a la evaluaciGn de sus sistemas con ka Prueba de Turing, por creer que es mas importante el estudio de los prineipios en los que se basa fa intetigencia que duplicar un ejemplar. La biisqueda de un ingenio que «volara artificialmente> tuvo éxito cuando los hermanos Wright, entre otros, dejaron de imitar Jos pajaros y comprendieron los principios de la aerodindmica. Los textos de ingenierfa aaerodindmica no definen el objetivo de su campo como la construccidn de «mdiguinas que vuelen como palomas de forma que puedan incluso confundir a otras palomas» Pensar como un humano: el enfoque del modelo cognitive Para poder decir que un programa dado piensa como un humano, es necesarin contar eon, tun mecanismo para determinar c6mo piensan los humanos, ES necesario penetrar en el4 INTELIGENCIA ARTIFICIAL, UN ENFOQUE MODERNO, ‘HENCIACOBNITHA suocismos, Lasicn funcionami to de Jas mentes humanas. Hay dos formas de hacerlo: mediante intros- peccién (intentando atrapar nuestros propios pensamientos conforme éstos van apare- ciendo) y mediante experimentos psicol6g suficientemente precisa sobre cémo trabaja la ment cos, Una vez se cuente con una teorfa lo se podrd expresar esa teoria en la forma de un programa de computador. Si los datos de entradasalida del programa y los tiempos de reaccion son similares a los de un humano, existe la evidencia de que algu nos de los mecanismos del programa se pueden comparar con los que utilizan los seres humanos. Por ejemplo, a Allen Newell y Herbert Simon, que desarrollaron el «Sistema de Resolucién General de Problemas» (SRGP) (Newell y Simon, 1961), no les bast6 con que sti programa resolviera correctamente los problemas propuestos. Lo que les intere- saba era seguir la pista de jas etapas del proceso de razonamiento y compararlas con kas seguidas por humanos los que se les enfrenté a los mismos problemas. En el campo interdisciplinario de la ciencia cognitiva convergen modelos computacionales de TA y téenicas experimentales de psicologia intentando elaborar teorfas precisas y verificables sobri cl funcionamiento de la mente h mana. La ciencia cognitiva es un campo fascinante, merecedora de una enciclopedia de dicada a ella (Wilson y Keil, 1999). En este libro no se intenta describir qué se conoce de la cognicién humana, Ocasionalmente se hacen comentarios acerca de similitudes. 6 diferencias entre técnicas de 1A y cognicidn humana. La auténtica ciencia cognitiva se fundamenta necesariamente en ka investigacién experimental en humanos y animales, y en esta obra se asume que el lector sélo tiene acceso @ un computador para experimentar, En los comienzos de la TA habia confusidn entre las distintas aproximaciones: un autor podria argumentar que un algoritmo resolvia adecuadamente una tarea y que por tan- fo era un buen modelo de representaci6n humana, © viceversa. Los autores actuales hacen diferencia entre las dos reivindicaciones; esta distincién ha permitide que ambas disciplinas, 1A y ciencia e nitiva, se desarrollen mas rapidamente. Los dos campos con- Lindian alimentiindose entre si, especialmente cn las areas de la vision y el lenguaje na tural. En particular, el campo de la visin ha avanzado recientemente con la ayuda de una propuesta integrada que tiene en cuenta la evidencia neurofisiolgica y los mode- Jos computacionales. Pensamiento racional: el enfoque de las «leyes del pensamiento» EL filosofo griego Aristételes fue uno de los primeros en intentar codificar la «manera correcta de pensar», es decir, un proceso de razonamiento irrefutable. Sus silogismos son esquemas de estructuras de argumentacién mediante las que siempre se llega a conclusiones correctas si se parte de premisas correctas (por ejemplo: «Séerates es un hombre; todos los hombres son mortales; por lo tanto Séerates es mortal»). Estas leyes de pen- siimiento supuestamente gobiernan Ja manera de operar de ka mente; su estudio fue el inicio de un campo Hlamado Iégic Estudiosos de la ligica desarrollaron, en el siglo 1X, una notacién precisa para definir sentencias sobre todo tipo de elementos del mundo y especiticar relaciones entreLoaistx soente ene RACIONAL INTRODUCCION 5 ellos (compérese esto con la notacién aritmética comiin, que prictic para representar afirmaciones acerca de Ia igualdad y desigualdad entre nimeros). Ya en 1965 existian programas que, en principio, resolvian cualquier problema resoluble descrito en notaci6n l6gica’. La llamada tradicién logista dentro del campo de la inteligencia artificial trata de construir sistemas inteligentes a partir de estos programas, Este enfoque presenta dos obstaculos. No es féeil transformar conocimiento informal y expresarlo en los términos formales que requieren de notacién l6gica, particular- mente cuando el conocimiento que se tiene es inferior al 100 por 100. En segundo Iu gar, hay una gran diferencia entre poder resolver un problema «en principio» y hacerlo en la préctica, Incluso problemas con apenas wna docena de datos pueden agotar los recursos computacionales de cualquier computador a menos que cuente con alguna directiva sobre los pasos de razonamiento que hay que Hevar a cabo primero. Aunque los dos obs: téculos anteriores estan presentes en fodo intento de construir sistemas de razonamien- to computacional, surgieron por primera vez en la tradicién l6gica amente s6lo sirve Actuar de forma racional: el enfoque del agente racional Un agente es algo que razona (agente viene del | informaticos se espera que tengan otros atributos que los distingan de los «programas» convencionales, como que estén dotados de controles auténomos, que perciban su entorno, que persistan durante un perfodo de tiempo prolongado, que se adapten a los cambios, y que sean capaces de alcanzar objetivos diferentes. Un agente racional es aquel que actiia con la intencién de alcanzar el mejor resultado , cuando hay incertidumbre, el mejor resultado esperado. En cl caso del enfoque de la 1A segiin las «leyes del pensamiento», todo el énfasis se pone en hacer inferencias correctas, La obtencidn de estas inferencias correctas puede, a veces, formar parte de lo que se considera un agente racional, ya que una manera racional de actuar es legar a la conclusién logica de que si una accin dada permite alcanzar un objetivo, hay que Hevar a cabo dicha accién. Sin embargo, el efectuar una inferencia correcta no depende siempre de la rucionalidad, ya que existen situaciones para Jas que no hay nada correcto que hacer y en las que hay que toni ten también formas de actuar racionalmente que no implican realizar inferencias, Por ejemplo, el retirar la mano de una estufi caliente es un acto reflejo mucho mas eficien te que una respuesta lenta Hevada a cabo tras una deliberacién cuidadosa. Todas la habilidades que se necesitan en la Prueba de Turing deben permitir emprender acciones racionales, Por lo tanto, es necesario contar con la capacidad para representar el conocimiento y razonar basdndonos en él, porque ello permitira alcanzar d cisiones correctas en una amplia gama de situaciones. Es necesario ser capaz de generat sentencias comprensibles en lenguaje natural, ya que el enunciado de tales oraciones permite a los agentes desenvolverse en una sociedad compleja. El aprendizaje no se leva cabo por erudicién exclusivamente, sino que profundizar en el conocimiento de eémo funciona el mundo facilita la concepcidn de estrategias mejores para manejarse en él in agere, hacer). Pero de los agentes una decisién. Exis- Sino se encuentea una solueidn, el programa nunca debe parar de buscar6 (CLA ARTIFICIAL. UN ENFOQUE MODERNO La percepcisn visual es necesaria no sélo porque ver es divertido, sino porque es necesaria para poder tener una idea mejor de lo que una accién puede Megat a representar, por ejemplo, el ver un delicioso bocadillo contribuird a que nos acerquemos a él. Por esta razén, el estudiar la IA desde el enfoque del diseiio de un agente racional ofrece al menos dos ventajas. La primera es mds general que el enfoque que proporcionan las «leyes del pensamiento», dado que el efectuar inferencias correctas es slo uno de los mecanismos existentes para garantizar la racionalidad., La segunda es més afin a la forma en la que se ha producido el avance cientifico que los enfoques basados en la conducta o pensamiento humano, porque la norma de la racionalidad estd claramente de- finida y es de aplicaciGn general. Por el contrario, la conducta humana se adapta bien a un entorno espeeffico, y en parte, es producto de un proceso evolutivo complejo, en gran medida desconocido, que atin esti lejos de Hevarnos a la perfecci6n. Por tanto, esta obra se centraré en los principios generales que rigen a los agentes racionales y en los elementos necesarios para construirlos. Mas adelante quedara patente que a pesar de la aparente facilidad con la que se puede describir un problema, cuando se intenta resolver surgen una enorme variedad de cuestiones. El Capitulo 2 revisa algunos de estos aspectos con més detalle, Un elemento importante a tener en cuenta es el siguiente: més bien pronto que tarde se observard cémo obtener una racionalidad perfecta (hacer siempre lo correcto) no es posible en entornos complejos. La demanda computacional que esto implica es demasiado grande. En la mayor parte de esta obra se adoptaré la hipétesis de trabajo de que la racionalidad perfecta es un buen punto de partida para el andlisis. Lo cual sim- plifica el problema y proporciona el escenario base adecuado sobre el que se asientan Jos cimientos de este campo, Los Capitulos 6 y 17 se centran explicitamente en el tema maeuatoxn de la racionalidad limitada (actuar adecuadamente cuando no se cuenta con el tiempo suficiente para efectuar todos los cdlculos que serfan deseables). 1.2 Los fundamentos de la inteligencia artificial sei 6n presenta una breve historia de las disciplinas que han contribuido con puntos de vista y técnicas al desarrollo de la IA, Como toda revisién histérica, en este caso se centra en un pequefio ntimero de personas, eventos ¢ ideas € ignora otras. que también fueron importantes. La historia se organiza en tomo a una serie de cuestiones, dejando claro que no se quiere dar la impresi6n de que estas cuestiones son las inicas por las que las disciplinas se han preocupado y que el objetivo ultimo de todas estas disciplinas era hacer avanzar la TA. idea Filosofia (desde el afio 428 a.C. hasta el presente) + {Se pueden utilizar reglas formales para extraer conclusiones vélidas’? + ,Como se genera la inteligencia mental a partir de un cerebro fisico? + {De dénde viene el conocimiento? + {Como se pasa del conocimiento a la accisn’?unuisuo eavenLisn rine inoveeion INTRODUCCION 7 Aristételes (384-322 a.C.) fue el primero en formular un conjunto preciso de leyes que gobernaban Ja parte racional de la inteligencia. El desarroll6 un sistema informal para razonar {J Juadamente con silogismos, que en principio permitia extraer conclusiones, mecénicamente, a partir de premisas iniciales. Mucho después, Ramén Lull (d. 1315) tuvo Ia idea de que el razonamiento siti se podria obtener por medios artificiales. Sus, «ideas» aparecen representadas en la portada de este manuscrito. Thomas Hobbes (1588- 1679) propuso que el razonamiento era como a computacién numérica, de forma que «nosotros sumamos y restamos silenciosamente en nuestros pensamientos». La auto- matizacién de la computacién en si misma estaba en marcha; alrededor de 1500, Leo- nardo da Vinei (1452-1519) disefé, aunque no construyé, una calculadora mecinica; construcciones recientes han mostrado que su diseito era funcional. La primera méqui- na calculadora conocida se construy6 alrededor de 1623 por el cientifico alemén Wil- helm Schickard (1592-1635), aunque la Pascalina, construida en 1642 por Blaise Pas- cal (1623-1662), sea més famosa, Pascal escribi6 que «la méquina aritmética produce efectos que parecen més similares a los pensamientos que a las acciones animales». Gott- fried Wilhelm Leibniz (1646-1716) construy6 un dispositivo mecénico con el objetivo de Hevar a cabo operaciones sobre conceptos en lugar de sobre ntimeros, pero su cam po de accién era muy limitado. Ahora que sabemos que un conjunto de reglas pueden describir la parte racional y formal de la mente, el siguiente paso es considerar la mente como un sistema fisico. René Descartes (1596-1650) proporciona la primera discusién clara sobre la distincién entre la mente y la materia y los problemas que surgen. Uno de los problemas de una con- cepcién puramente fisica de la mente es que parece dejar poco margen de maniobra al libre albedrio: si el pensamiento esta totalmente gobernado por leyes fisicas, entonces una piedra podrfa «decidir» caer en direcciGn al centro de la Tierra gracias a su libre albedrio, A pesar de ser denodado defensor de la capacidad de razonamiento, Descartes fue un defensor del dualismo. Sostenia que existe una parte de la mente (0 del alma o del espititu) que esti al margen de la naturaleza, exenta de la influencia de las leyes ff- sicas. Los animales, por el contrario, no poseen esta cualidad dual; a ellos se le podria concebir como si se tratasen de maquinas. Una alternativa al dualismo es el materia- lismo, que considera que las operaciones del cerebro realizadas de acuerdo a las leyes de la fisica constituyen la mente. El libre albedrio es simplemente la forma en la que la percepcién de las opciones disponibles aparecen en el proceso de seleccién. Dada una mente fisica que gestiona conocimiento, el siguiente problema es establecer las fuentes de este conocimiento, El movimiento empirico, iniciado con el Novum Or- ganum’, de Francis Bacon (1561-1626), se caracteriza por el afoorismo de John Locke (1632-1704): «Nada existe en la mente que no haya pasado antes por los sentidos». Da vid Hume (1711-1776) propuso en A Treatise of Human Nature (Hume, 1739) lo que aactualmente se conoce como principio de induceidn: las reglas generales se obtienen mediante la exposici6n a asociaciones repetidas entres sus elementos. Sobre la base de las propuestas de Ludwig Wittgenstein (1889-1951) y Bertrand Russell (1872-1970), el famoso Cireulo de Viena, tiderado por Rudolf Carnap (1891-1970), desarroll6 ta doe- wvina del positivismo légico. Esa doctrina sostiene que todo el conocimiento se puede Una actual icin del Organon, © instrumento de pensamienta, de Arist6tcles8 INTELIGENCIA ARTIFICIAL, UN ENFOQUE MODERNO, Posirismo Ldcico ‘Seneca oe sseMAcion ‘eowia eux CONFRMACON caracterizar mediante teorias logicas relacionadas, en Ultima instancia, con sentencias de observacién que corresponden a estimulos sensoriales*, La teorfa de la confirma- cidn de Carnap y Carl Hempel (1905-1997) intenta explicar emo el conocimiento se obtiene a partir de la experiencia. El libro de Carnap, The Logical Structure of the World (1928), define un procedimiento computacional explicito para la extraceidn de conocimiento a partir de experiencias primarias, Fue posiblemente la primera teoria en mo: trar la mente como un proceso computacional. El ltimo elemento en esta discusi6n filos6fica sobre la mente es la relaci6n que exis- fe entre conocimiento y accién, Este asunto es vital para la TA, ya que la inteligencia requiere tanto accién como razonamiento, Mas atin, simplemente con comprender cémo se justifican determinadas acciones se puede Hegar a saber cémo construir un agente cuyas acciones sean justificables (0 racionales). Aristételes argumenta que las acciones se pue: den justificar por la conexién légica entre los objetivos y el conocimiento de los efectos de Jas acciones (la tiltima parte de este extracto también aparece cn Ja portada de este libro): {Cémo es que el pensamiento viene acompafiado en algunos casos de acciones y en otros no’, zen algunos casos por movimiento y en otros no? Parece como si la misma cos sucediera tanto si razondramos o hiciéramos inferencias sobre objetos que no cambian; pero en este caso el fin es una proposicién especulativa... mientras li conclusién resul- ante de las dos premisas es una accidn,.. Yo necesito abrigarme; una manta abriga. Yo necesito una manta. Qué necesito, qué debo hacer; necesito una manta, Necesito hacer tuna manta. Y la conclusién, «Yo tengo que hacer una manta, es una acci6n, (Nussbaum, 1978, p. 40) En Nicomachean Ethics (Libro 1. 3, 1112b), Arist6teles continga trabajando en este tema, sugiriendo un algoritmo Nosotros no reflexionamos sobre los fines, sino sobre los medios. Un médico no rete. xiona sobre si debe curar, ni un orador sobre si debe persuadi... Ellos asumen el fin y consideran cémo y con qué medios se obtienen, y si resulta facil y es por tanto produc tivo; mientras que si sélo se pued por un medio se ti se aleanzard por este y por qué medios se obtendra éste, hasta que se Hegue a la causa primera.... y lo dltimo en el orden del andlisis parece ser lo primero en el orden de los ween consideracisn cima acontecimientos. Y si se Hega a un estado imposible, se abandona kt biisqueda, como por ejemplo si se necesita dinero y no se puede conseguir; pero si hay una posibilidad se in tentar El algoritmo de AristGteles se implement6 2.300 aftos mas tarde por Newell y Si- mon con [x ayuda de su programa SRGP. El cual se conoce como sistema de planificacidn regresivo (véase el Capitulo 11), El analisis basado en objetivos es ttil, pero no indica qué hacer cuando varias acciones nos Hlevan a la consecucién del objetivo, o cuando ninguna accisn facilita su com: pleta consecuci6n. Antoine Armauld (1612-1694) describi6 correctamente una forma cuantitativa para decidir qué accién Hevar a cabo en un caso como este (véase el Capt tulo 16). El libro Utilitarianism (Mill, 1863) de John Stuart Mill (1806-1873) propone [En este eontexto,es posible comprobar rechavsa tla asevercigin significativa mediante el anlisi el si -xperimentacidn, Dado que esto no es apical en x may parte del nifcado de las palabras. mediante mito de ki metafisica, como era imtencidn, el positivism ligico se hizo impopulir en alpunos eculessuconrno ‘oneta oe IncomPuettuD INTRODUCCION 9 la idea de un criterio de decisi6n racional en todos los dmbitos de la actividad humana. En la siguiente secci6n se explica una teoria de fa decision mas formalmente Matemiaticas (aproximadamente desde el afio 800 al presente) + Qué reglas formales son las adecuadas para obtener conclusiones vilidas? + (Qué se puede computar? + (C6mo razonamos con informacién incierta? Los filsofos delimitaron las ideas mas importantes de la TA, pero para pasar de abi a una ciencia formal es necesario contar con una formukicién matemiitica en tres reas fundamentales: lgica, computacién y probabilidad, El concepto de légica formal se remonta a los filésofos de la antigua Grecia (v el Capitulo 7), pero su desarrollo matemitico comenz6 realmente con el trabajo de George Boole (1815-1864) que definié la I6gica proposicional o Booleana (Boole, 1847), En 1879. Gottlob Frege (1848-1925) extendis la l6gica de Boole para ineluir objetos y relaciones, y ered la logica de primer orden que se utiliza hoy como el sistema mis basico de representacin de conocimiento’. Alfred Tarski (1902-1983) introdujo una teorfa de referencia que ensefia cémo relacionar objetos de una Iégiva con objetos del mundo real. E} paso siguiente consistié en definir los limites de lo que se podfa hacer con la légica y la informatica. Se piensa que el primer algoritmo no trivial es el algoritmo Fuelideo pata el calcu Jo del maximo comin divisor. El considerar los algoritmos como objetos en si mismos se remonta a la época de al-Khowarazmi, un matemiédtico persa del siglo 1x, con cuyos escritos también se introdujeron los nimeros arabigos y el algebra en Europa, Boole, entre otros, presenté algoritmos para Hevar a cabo deducciones Iégicas y hacia el final del si- lo x1X se Hevaron a cabo numerosos esfuerzos para formalizar el razonamiento matematico general con la logica deductiva, En 1900, David Hilbert (1862-1943) present una lista de 23 problemas que acertadamente predijo ocuparfan a los mateméticos durante todo ese siglo, En ef tiltimo de ellos se preguntaba si existe un algoritmo que permita determinar la validez de cualquier proposicién Iégica en la que aparezcan nti- eros natures (el famoso Ensscheidungsproblem, o problema de decisidn). Basicamente, Jo que Hilbert se preguntaba es si hay Iimites fundamentales en ta capacidad de los procedimientos efectivos de demostracién, En 1930, Kurt Gidel (1906-1978) demostrs que existe un procedimiento eficiente para demostrar cualquier aseveraci6n verdadera en la légica de primer orden de Frege y Russell, sin embargo con la légica de primer orden no era posible capturar el principio de induccién matematica necesario para la caracte- riracidn de los ntimeros naturales. En 1931, demosted que, en efecto, existen limites reales. Mediante su teorema de incompletitud demosir6 que en cualquier lenguaje que tuviera la capacidad suficiente para expresar las propiedades de loy nimeros naturales. existen aseveraciones verdaderas no decidible en el sentido de que no es posible decidir su validez mediante ningin algoritmo, La nntacitin para Is Iogicu de primer orden propuests por Pre ‘ones que son aparentemente abvias cuando se observa el ejemplo que aparece en lx eubierta de este fibre c ne se ha aceptaito universalmente, por ra10 INTRLIGENCIA ARTIFICIAL. UN ENFOQUE MODERNO| e-coupcermun monABILOAD El resultado fundamental anterior se puede interpretar también como la indicacién de que existen algunas funciones de los ntimeros enteros que no se pueden representar mediante un algoritmo, es decir no se pueden calcular. Lo anterior Hevé @ Alan Turing (1912-1954) @ tratar de caracterizar exactamente aquellas funciones que sf eran susceptibles de ser caracterizadas, La nociGn anterior es de hecho problematica hasta cier- to punto, porque no es posible dar una definici6n formal a la nocién de eilculo o procedimiento efectivo. No obstante, la tesis de Church-Turing, que afirma que la méqui: na de Turing (Turing, 1936) es capaz de caleular cualquier funci6n computable, goza de aceptacién generalizada ya que proporciona una definicién suficiente, Turing también demostrs que existen algunas funciones que no se pueden calcular mediante la méqui: na de Turing. Por ejemplo, ninguna maquina puede decidir en general si un programa dado produciré una respuesta a partir de unas entradas, o si seguiré calculando inde! nidamente, Si bien ser no decidible ni computable son importantes para comprender el proceso del calculo, la nocidn de intratabilidad tuvo repercusiones mas importantes. En térm nos generales se dice que un problema es intratable si el tiempo necesario para la reso- luci6n de casos particulares de dicho problema crece exponencialmente con el tamaiio de dichos casos. La diferencia entre crecimiento polinomial y exponencial de la complejidad se destacé por primera vez a mediados de los aitos 60 (Cobham, 1964; Edmonds, 1965). Es importante porque un crecimiento exponencial implica la imposibilidad de re solver casos moderadamente grandes en un tiempo razonable, Por tanto, se debe optar por dividir e1 problema de la generacién de una conducta inteligente en subproblemas que sean tratables en vez. de manejar problemas intratables. {Como se puede reconocer un problema intratable? La teorfa de la NP-completitud, propuesta por primera vez por Steven Cook (1971) y Richard Karp (1972) propone un método, Cook y Karp demostraron la existencia de grandes clases de problemas de razonamiento y biisqueda combinatoria canénica que son NP completos. Toda clase de problema a la que la clase de problemas NP completos se pueda reducit sera seguramente intratable (aunque no se ha demostrado que los problemas NP completos son necesariamente intratables, la mayor parte de los tedricos asf lo creen), Estos resultados con- trastan con el optimismo con el que la prensa popular recibi6 a los primeros computa dotes, «Supercerebros Electrdnicos que eran «jMis répidos que Einstein!» A pesar del rapido incremento en Ia velocidad de los computadores, los sistemas inteligentes se ca- racterizarn por el uso cuidadoso que hacen de los recursos. De manera sueinta, jel mun. does un ejemplo de problema extremadamente grande! Recientemente la 1A ha ayuda do a explicar por qué algunos ejemplos de problemas NP completos son dificiles de resolver y otros son ficiles (Cheeseman et al., 1991) Ademis de la l6gica y el calculo, la tercera gran contribucién de las matemiiticas a la IA es la teorfa de la probabilidad. E1 italiano Gerolamo Cardano (1501-1576) fue el primero en proponer la idea de probabilidad, presentindola en términos de los resultados de juegos de apuesta, Lat probabilidad se convirti6é pronto en parte imprescindible de Jas ciencias cuantitativas, ayudando en el tratamiento de mediciones con incertidumbre y de teorias incompletas. Pierre Fermat (1601-1665), Blaise Pascal (1623-1662), James, Bernoulli (1654-1705), Pierre Laplace (1749-1827), entre ottos, hieieron avanzar esta te oria e introdujeron nuevos métodos estadisticos. Thomas Bayes (1702-1761) propuso una‘eonia ok beeision ‘Teoria o ues wvesricacion ‘renariva INTRODUCCION 11 regla para la actualizaciGn de probabilidades subjetivas a la luz de nuevas evidencias. La regla de Bayes y el area resultante Hamado andlisis Bayesian conforman la base de las propuestas mas modernas que abordan el razonamiento incierto en sistemas de 1A. Economia (desde el afio 1776 hasta el presente) + {Como se debe Hlevar a cabo el proceso de toma de decisiones para maximizar el rendimiento? + {Como se deben Hlevar a cabo acciones cuando otros no colaboren’? + {Como se deben Hevar a cabo acciones cuando los resultados se obtienen en un futuro lejano? La ciencia de la economfa comenzé en 1776, cuando ef fildsofo escocés Adam Smith (1723-1790) publics An Inguiri into the Nature and Causes of the Wealth of Nations. Aun- que los antiguos griegos, entre otros, habian hecho contribuciones al pensamiento eco- n6mico, Smith fue el primero en tratarlo como una ciencia, utilizando la idea de que las economias pueden concebirse como un conjunto de agentes individuales que intentan maximizar su propio estado de bienestar econémico. La mayor parte de la gente cree que la economia slo se trata de dinero, pero los economistas dicen que ellos realmente estudian cémo la gente toma decisiones que les llevan a obtener los beneficios esperados Léon Walras (1834-1910) formaliz6 el tratamiento matematico del «beneficio deseado» © utilidad, y fue posteriormente mejorado por Frank Ramsey (1931) y después por John von Neumann y Oskar Morgenstern en su libro The Theory of Games and Economic Be- havior (1944). La teorfa de ta decisién, que combina la teorfa de la probabilidad con la teoria de 1a utilidad, proporciona un marco completo y formal para la toma de dec ndmicas 0 de otra indole) realizadas bajo incertidumbre, esto es, en casos en los que las descripciones probabilisticas capturan adecuadamente la forma en la que se toman las decisiones en el entorno; fo cual es adecuado para «grandes» economias en las que cada agente no necesita prestar atencidin a las acciones que Hleven a cabo el resto de los agentes individualmente. Cuando se trata de «pequefias» economias, la situacién se asemeja mas ka de un juego: las acciones de un jugador pueden afectar significativamente a 1a utilidad de otro (tanto positiva como negativamente). Los desarrollos de von Neumann, y Morgenstern a partir de la teorfa de juegos (véase también Luce y Raiffa, 1957) mos- traban el hecho sorprendente de que, en algunos juegos, un agente racional debia actuar de forma aleatoria o, al menos, aleatoria en apariencia con respecto a sus contrincantes. La gran mayorfa de los economistas no se preocuparon de lx tercera cuestién men: cionada anteriormente, es decir, emo tomar decisiones racionales cuando Jos resultados de las acciones no son inmediatos y por el contrario se obtienen los resultados de las acciones de forma secuencial. El campo de la investigacién operativa persigue este objet vo; dicho campo emergié en la Segunda Guerra Mundial con los esfuerzos evados a cabo en ef Reino Unido en 1a optimizacién de instalaciones de radar, y posteriormente en aplicaciones civiles relacionadas con la toma de decisiones de direcciGn complejas. El trabajo de Richard Bellman (1957) formaliza una clase de problemas de decisién secuencial Hamados procesos de decisién de Markov, que se estudiarin en los Capftulos 17 y 21 jones (eco-12 INTELIGENCIA ARTIFICIAL. UN ENFOQUE MODERNO savsraccion cunociNcin neuroma EL trabajo en la economia y la investigacién operativa ha contribuido en gran medi- daa la nocidin de agente racional que aqui se presenta, aunque durante muchos aos ka invest en el campo de Ia IA se ha desarrollado por sendas separadas. Una razén fue la complejidad aparente que trae consigo el tomar decisiones racionales. Herbert Simon (1916-2001), uno de los primeros en investigar en el campo de la 1A, gané el premio Nobel en Econom(a en 1978 por su temprano trabajo, en el que moste6 que los modelos basados en satisfaccién (que toman decisiones que son «suficientemente buenas», en vez de realizar edlculos laboriosos para alcanzat decisiones éptimas) proporcionaban tuna descripeién mejor del comportamiento humano real (Simon, 1947). En los afios 90, hubo un resurgimiento del interés en las técnicas de decisiGn teérica para sistemas basados en agentes (Wellman, 1995). Neurociencia (desde el aiio 1861 hasta el presente) + {Como procesa informacién el cerebro? La Neurociencia es el estudio del sistema neurol6gico, y en especial del cerebro, La forma exacta en la que en un cerebro se genera el pensamiento es uno de los grandes misterios de la ciencia, Se ha observado durante miles de aflos que el cerebro esta de a guna manera involucrado en los procesos de pensamiento, ya que fuertes golpes en la cabeza pueden ocasionar minusvalia mental. También es ampliamente conocido que los cerebros humanos son de alguna manera diferentes; aproximadamente en el 335 aC. Aristoteles eseribid, ade entre todos los animales el hombre tiene el cerebro mas grande en proporcién a su tamaio»®. Aunque, no fue hasta mediados del siglo xvii cuando se avept6 mayoritariamente que el cerebro es ta base de fi conciencia, Hasta este momento, se pensaba que estaba localizado en el corazén, el bazo y la gkindula pineal El estudio de Paul Broca (1824-1880) sobre la afasia (dificultad para hablar) en pacientes con el cerebro dafado, en 1861, le dio fuerza a este campo y convencid a la sociedad médica de la existencia de éreas localizadas en el cerebro responsables de funciones cognitivas especificas. En particular, mostré que la produccién del habla se Jocalizaba en una parte del hemisferio izquierdo: hoy en dia conocida como el area de Broca’, En esta época ya se sabia que el cerebro estaba formado por células nerviosas 0 neuronas, pero no fue hasta 1873 cuando Camillo Golgi (1843-1926) desarroll6 una téc- nica de coloraci6n que permitié la observacién de neuronas individuales en el cerebro (véase la Figura 1.2). Santiago Ramén y Cajal (1852-1934) utiliz6 esta técnica es sus estudios pioneros sobre la estructura neuronal del cerebro’ En la actualidad se dispone de informacién sobre la relacién existente entre las dre as del cerebro y las partes del cuerpo humano que controlan o de las que reciben impulsos Desde entences, se ha descubierte que algunas especies de delfinesy balls tienen cerebros relativamente andes, Alora se pienst que ef gran tama de los cerebros humanos se debe en parte a lt mejora reciente {on su sistema de rerigeracion, ” Muchos itan a Alexander Hood (1824) como una fuente posiblemente anterior. insist en la ereencia de que las Tunciones cerebrales se dessrrollaron inickalmente en el medio con tino en ef que his neuronas estaban inmersis, mientras que Cajal prupuase ka sdectrina neuronal», Ambos conypartieron el prema Nobel en 1906 pronunciando ua discurso de aveplacin antagsnice,INTRODUCCION 13 y Asborizacian axonal x Ly VY La Dendrita —_/ Axi » Nivteo Sinapsis Cuerpo de la cétuls 0 Soma | Figura 1.2 Partey de una célula nerviosa 0 neurona. Cada neurona contiene un cuerpo celular, 0 soma, que tiene un niicleo celular. Un ntimero de fibras llamadas dendritas se ramifican a partir del ‘cuerpo de la célula junto con una tinica fibra larga llamada ax6n. El axdn se alarga considerable- mente, mucho ms que lo que se representa en esta imagen, Normalmente mien un centimetro (100 veces mis que el didmetro del cuerpo de la célula), pero pueden alcanzar hasta un metro de longi: ud. Una neurona se conecta con entre 10 y 100.000 neuronas formando una marafia Hamada sinapsis. Las sefiales se propagan de neurona a neurona mediante una reaccién electroquimica com- Plicada. Las sefiales controlan ta actividad del cerebro a corto plazo, y permiten establecer cambios en la posieién y conectividad de las neuronas « largo plazo., Se piensa que estos mecanismos forman la base del aprendizaje del cerebro. La mayorfa del procesamiento de informacién se leva a cabo en la corteza del cerebro, la capa més externa de éste. La unidad de organizacién bisica es ‘una columna de tejido de aproximadamente 0.5 mm de diémetto, con lo cual se amplia la profur: idad total de la conteza cerebral, que en el caso de fos humanos es de cuatro mm, Una columna ccontiene aproximadamente 20,000 neuronas. sensoriales, Tales relaciones pueden cambiar de forma radical incluso en pocas semanas, y algunos animales parecen disponer de miiltiples posibilidades. Mas atin, no se tie ne totalmente claro cémo algunas dreas se pueden encargar de ciertas funciones que eran responsabilidad de reas dafadas, No hay pricticamente ninguna teoria que explique cémo se almacenan recuerdos individuales. Los estudios sobre la actividad de los cerebros intactos comenz6 en 1929 con el descubrimiento del electroencefalograma (EEG) desarrollado por Hans Berger. El reciente descubrimiento de las imagenes de resonancia magnética funcional IRM) (Ogawa et al., 1990) esté proporcionando a los neurdlogos imagenes detalladas de la actividad cerebral sin precedentes, permitiéndoles obtener medidas que se corresponden con pro- esos cognitivos en desarrollo de manera muy interesante, Este campo esté evolucionando ances en los estudios en celdas individuales y su actividad neuronal. A pesar de estos avances, nos queda un largo camino para Hegar a comprender eémo fun- ionan todos estos procesos cognitivos. gracias a los14 INTELIGENCIA ARTIFICIAL. UN ENFOQUE MODERNO La conclusion verdaderamente increfble es que una coleccién de simples células puede llegar a generar razonamiento, aceién, y conciencia 0, dicho en otras palabras, los cerebros generan las inteligencias (Searle, 1992). La tinica teorfa alternativa es el mis- ticismo: que nos dice que existe alguna esfera mistica en la que las mentes operan fuera del control de la ciencia fisica Cerebros y computadores digitales realizan tareas bastante diferentes y tienen propiedades distintas. La Figura 1.3 muestra cémo hay 1.000 veces mds neuronas en un ce rebro humano medio que puertas légicas en la UCP de un computador estindar. La ley de Moore’ predice que el ntimero de puertas l6gicas de la UCP se igualard con el de neuronas del cerebro alrededor del afio 2020. Por supuesto, poco se puede inferir de esta pre dicci6n; mas atin, la diferencia en la capacidad de almacenamiento es insignificante com- parada con las diferencias en la velocidad de intercambio y en paralelismo, Los circuitos de los computadores pueden ejecutar una instruccién en un nanosegundo, mientras que las neuronas son millones de veces mas lentas, Las neuronas y las sinapsis del cerebro estin activas simultneamente, mientras que los computadores actuales tienen una o como mucho varias UCP. Por tanto, incluso sabiendo que un computador es un millon de veces mas rpido en cuanto a su velocidad de intercambio, el cerebro acaba siendo 100,000 veces mas répido en lo que hace. Psicologia (desde el afio 1879 hasta el presente) + {Como piensan y actin Jos humanos y los animale: La psicologia cientifica se inici6 con los trabajos de! fisico aleman Hermann von Helm- holtz (1821-1894), segtin se referencia habitualmente, y su discipulo Wilhelm Wundt (1832-1920). Helmholtz. aplicé el método cientifico al estudio de Ja vista humana, y su obra Handbook of Physiological Optics, todavia en nuestros dias, se considera como «el tratado actual mas importante sobre la fisica y la fisiologfa de la vista humana» (Nalwa, 1993, p. 15). En 1879, Wundt abrié el primer laboratorio de psicologfa experimental en Computador Cerebro Humane Unidades computacionales LUCE, 10* puertas 10!" neuronas Unidades de Almacenamiento | 10" bits RAM 10" neuronas 10" bits disco 10" Sinapsis Duracisn de un cielo 10" see 10 see Ancho de banda 10" bite 10" bitshsec Memoriy actualizaciénisee | 10" 0" ra 1.3 ComparaciOn basica entre los recursos de eémputo generales de que disponen los computadores (circa 2003) y el cerebro, Las cifras correspondientes a los computadores se han incrementado ten al menos un Factor 10 desde la primera edicidn de este libro, y se espera que suceda la mismo en costa década, Las cifras correspondientes al cerebro no han cambiado en los Gltimos 10,000 aos. ley de Moore dice que el nlimero de transistores por pul ula cura se duplica eat at «ae y me dio. La eapacidad del cerebro by 0 se dobla aproximaadamente eal dos © cua millones de aosconouerisHo rescoLocta ‘coca INTRODUCCION 15, la Universidad de Leipzig. Wundt puso mucho énfasis en la realizacién de experimen- {os controlados cuidadosamente en la que sus operarios realizaban tareas de percepeidn © asociacién al tiempo que sometian a introspecciGn sus procesos mentales. Los meti culosos controles evolucionaron durante un largo periodo de tiempo hasta convertir la psicologia en una ciencia, pero la naturaleza subjetiva de los datos hizo poco probable que un investigador pudiera contradecir sus propias teorfas. BiGlogos, estudiando el comportamiento humano, por el contrario, carecfan de datos introspectivos y desarrollaron tuna metodologfa objetiva, tal y como describe H. S. Jennings (1906) en su influyente trabajo Behavior of the Lower Organisms. E1 movimiento conductista, liderado por John Watson (1878-1958) aplicé este punto de vista a los humanos, rechazando cualquier teoria en la que intervinieran procesos mentales, argumentando que la introspeceién no aportaba una evidencia fiable. Los conductistas insistieron en el estudio exclusivo de mediciones objetivas de percepciones (0 estimulos) sobre animales y de las acciones re- sultantes (0 respuestas). Construcciones mentales como conocimientos, creencias, objetivos y pasos en un razonamiento quedaron descartadas por ser consideradas «psicolog popular» no cientifica. El conductismo hizo muchos descubrimientos utilizando ratas y palomas, pero (uvo menos éxito en la comprensién de los seres humanos. Atin asi, su influencia en la psicologia fue notable (especialmente en Estados Unidos) desde aproximadamente 1920 hasta 1960. La conceptualizacién del cerebro como un dispositivo de procesamiento de infor- macién, caracteristica principal de la psicologfa cognitiva, se remonta por fo menos a las obras de William James"? (1842-1910), Helmholtz también pone énfasis en que la percepci6n entraita cierto tipo de inferencia légica inconsciente. Este punto de vista cog nitivo se vio eclipsado por el conductismo en Estados Unidos, pero en la Unidad de Psi- cologfa Aplicada de Cambridge, dirigida por Frederic Bartlett (1886-1969), los mode- Jos cognitivos emergieron con fuerza. La obra The Nature of Explanation, de Kenneth Craik (1943), discfpulo y sucesor de Bartlett, reestablece enérgicamente a legitimidad de términos «mentales» como creencias y objetivos, argumentando que son tan ciemti- ficos como lo pueden ser Ia presidn y la temperatura cuando se habla acerca de los gat~ ses, a pesar de que éstos estén formados por moléculas que no tienen ni presién ni temperatura, Craik establece tres elementos clave que hay que tener en cuenta para disefiar un agente basado en conocimiento: (1) el estimulo deberd ser traducido a una represen- taci6n interna, (2) esta representacidn se debe manipular mediante procesos cognitivos para asf generar nuevas representaciones internas, y (3) éstas, a su vez, se traduciran de nuevo en acciones. Dejé muy claro por qué consideraba que estos eran los requisitos id6. neos para diseflar un agente: fa Siel organism tc y de todas sus posibles acciones, ser capaz de probar diversas opciones, decidir cual es ne en su cabeza «un modelo a pequefia escala» de la realidad externa Ja mejor, planificar su reacci6n ante posibles situaciones futuras antes de que éstas sur jan, emplear lo aprendido de experiencias pasadas en situaciones presentes y futuras, y ten tado momento, reaccionar ante los imprevistos que acontezcan de manera satisfacto ria, segura y mais competente (Craik, 1943), "William James era hermano del novelista Henry James, Se comenta que Henry escribi6 novelas ‘come si se tratara de Ga como Si se Utara de vel mata ivologia y William eseribid sobre psicol16 INTELIGENCLA ARTIFICIAL. UN ENFOQUE MODERNO| ‘EMCI cOGMIA Después de la muerte de Craik en un accidente de bicicleta en 1945, Donald Boadbent con- linud su trabajo. y st libro Perception and Communication (1958) incluy6 algunos de los primeros modelos de procesamiento de informacién del fendmeno psicoldgico. Mientras tanto, en Estados Unidos el desarrollo del modelo computacional Hlevo a la creaci6n del campo de la ciencia cognitiva, Se puede decir que este campo comenzé en un simposio cel brado en el MIT. en septiembre de 1956 (como se veriia continuacién este evento tuvo lugar séilo dos meses despues de la conferencia en la que «naciG ka 1A), En este simposio, George Miller present6 The Magic Number Seven, Noam Chomsky present6 Three Models of Language, y Allen Newell y Herbert Simon presentaron The Logic Theory Machine. E tres art{culos influyentes mostraron cémo se podian utilizar los modelos informeticos para modelar la psicologia de la memoria, el lenguaje y el pensamiento légico, respectivamen- te. Los psicélogos comparten en a actualidad el punto de vista comiin de que «la teoria cognitiva debe ser como un programa de computador» (Anderson, 1980), 0 dicho de otra forma, debe describir un mecanismo de procesamiento de informacién detallado, lo cual lleva consigo la imptementacisn de algunas funciones cognitivas. (os Ingenieria computacional (desde el afio 1940 hasta el presente) + {Como se puede c nstruir un computador eticiente? Para que la inteligencia artificial pueda Hegar a ser una realidad se necesitan dos cosas: inteligencia y un artefacto. El computador ha sido cl artefacto elegido. El computador clectrnico digital moderno se inventé de manera independiente y casi simulta cientificas en tres paises involucrados en la Si nea por nda Guerra Mundial. El equipo de Alan ‘Turing construy6. en 1940, el primer computador operacional de cardcter eleetromecs nico, Hamado Heath Robinson!" con un tinico propdsito: descifrar mensajes alemanes. En 1943 el mismo grupo des neral basada en valvulas de vacfo"*, El primer computador operacional programable fue e1Z-3, inventado por Konrad Zuse en Alemania, en 1941, Zuse también invent6 los i= meros de coma flotante y el primer lenguaje de programacién de alto nivel, Plankalkiil Elp tudor eleeirdnico, el ABC, fue creado por John Atanasoff junto a su discipulo Clifford Berry entre 1940 y 1942 en la Universidad Estatal de towa. Las investigaciones de Atanasoff recibieron poco apoyo y reconocimiento; el ENIAC, desarrolla do en el marco de un proyecto militar seereto, en la Universidad de Pensilvania, por un equipo en el que trabajaban entre otros John Mauchly y John Eckert, puede considerar~ se como el precursor de los computadores modernos. Desde mediaos del siglo pasado, cada generacién de dispositivos hardware ha con Hevado un aumento en ka velocidad de proceso y en [a capacidad de almacenamiento. rroll6 cl Colossus, una maquina potente de propésito ge mer comp Heat Rohinson fue un caricaturisa famoso por sus dibujs, que representaban artefactos de uso cari. ceaprichosos y ahsurdanemte complies, por ejemplo. ne past nar mantels en el pan Hosa mpo de Ia TA, porejen 1993), EI gobierno "Fe fa postauers, Tari iso utilizar estos computadones para investigar en el c 1 jugar la ajedrer (Turing efINTRODUCCION 17 asi como una reduceidn de precios. La potencia de los computadores se dobla cada 18. meses aproximadamente y seguits a este ritmo durante una o dos déeadas mas. Después, se necesitars ingenieria molec ar y ofras tecnologias novedosas. Por supuesto que antes de la aparicidn de los computadores ya habia dispositivos de Aleulo, Las primeras maquinas automaticas, que datan del siglo xvi, ya se menciona- ron en la pagina seis. La primera méquina programable fue un tekar, desarrollado en 1805 por Joseph Marie Jacquard (1752-1834) que utilizaba tarjetas perforadas para almacenar informacin sobre los patrones de los bordados. A mediados del siglo xtx, Charles, Babbage (1792-1871) disefié dos maquinas, que no Heg6 a construir, Lat «Meiquina de Diferencias». que aparece en la portada de este manuscrito, se concibié con la intencién de facilitar los c@lculos de tablas matems icas para proyectos cientificos y de ingenieria, Finalmente se construy6 y se presenté en 1991 en el Museo de ki Ciencia de Londres (Swade, 1993), La «Maquina Analitica» de Babbage era mucho mas ambiciosa: incluia memoria direccionable, programas almacenados y saltos condieionales: fue el primer tefacto dotado de Jos elementos necesarios para realizar una computaci6n universal Ada Lovelace, colega de Babbage e hija del poeta Lord Byron, fue seguramente la primera programadora (el lenguaje de programacion Ada se lama asf en honor a esta programadora), Ella escribi6 programas para la inacabada Maquina Analttica e incluso especuld acerca de la posibilidad de que 1a maquina jugara al ajedrez y compusiese mtisica La JA también tiene una deuda con la parte software de la informatica que ha proporcionado los sistemas operativos, los lenguajes de programaci6n, y las herramientas necesarias para escribir programas modernos (y articulos sobre ellos), Sin embargo, en este rea la deuda se ha saldado: la investigacidn en IA ha generado numerosas ideas no- vedlosas de las que se ha beneficiado lt info ‘tica en general, como por ejemplo el tiempo compartido, los intérpretes imperativos, los computadores personales con interfaces grificas y ratones, entornos de desarrollo ripido, listas enlazadas, administracién automitica de memoria, y conceptos claves de la programacidn simbdlica, funcional, dind- mica y orientada a objetos, Teoria de control y cibernética (desde el afio 1948 hasta el presente) + {Como pueden los artefactos operar bajo su propio control? Ktesibios de Alejandrfa (250 a.C.) construyé la primera maquina auto controlada: un reloj de agua con un regulador qui fa e1 flujo de agua circulando por él, con un ritmo constante y predecible, Esta invencién cambié la definicisn de lo que un artefacto po: dia hacer. Anteriormente, solamente seres vivos podian modificar su comportamiento como respuesta a cambios en st entorno. Otros ejemplos de sistemas de control auto re- gulables y retroalimentados son el motor de vapor. creado por James Watt (1736-1819), yeltermoxtato, inventado por Cornelis Drebbel (1572-1633). que también inve marino, | manter Gel sub- Wworfa matenxitica de los sistemas con retroalimentucidn estables se desarroll6 enel siglo xix,18 INTELIGENCIA ARTIFICIAL. UN ENFOQUE MODERNO ‘eon contRoX cape uncidw osenvo La figura central del desarrollo de fo que ahora se Tlama ka teorfa de control fue Nor- bert Wiener (1894-1964). Wiener fue un matematico brillante que trabajé en sistemas. de control biolégicos y mecanicos y en sus vineulos con la cognicién, De la misma forma que Craik (quien también utiliz6 sistemas de control como modelos psicolégicos), Wiener y sus colegas Arturo Rosenblueth y Julian Bigelow desafiaron la ortodoxia conductista (Rosenblueth et al., 1943). Ellos veian el comportamiento determinista como algo emergente de un mecanismo regulador que intenta minimizar el «error» (la diferencia entre el estado presente y el estado objetivo). A finales de los afios 40, Wiener junto a Warren McCulloch, Walter Pitts y John von Neumann, organizaron una serie de conferencias en las que se exploraban los nuevos modelos cognitivos matematicas y computacionales, ¢ influyeron en muchos otros investigadores en el campo de las ciencias del comportamiento. El libro de Wiener, Cybernetics (1948), fue un bestseller y desve 16 al pablico tas posibilidades de las méquinas con inteligencia artificial La teoria de control moderna, especialmente la rama conocida como control éptimo estocistico, tiene como objetivo el disefo de sistemas que maximizan una funeién ob- Jetivo en el tiempo. Lo cual se asemeja ligeramente a nuestra visién de lo que es Ia TA diseio de sistemas que se comportan de forma dptima, ;Por qué, entonces, IA y teorfa de control son dos campos diferentes, especialmente teniendo en cuenta la cercana relacidn entre sus creadores? La respuesta estd en el gran acoplamiento existente entre las técnicas matemiticas con las que estaban familiarizados los investigadores y entre los conjuntos de problemas que se abordaban desde cada uno de los puntos de vista, El calculo y el algebra matricial, herramientas de la teorfa de control, se utilizaron en la definiciGn de sistemas que se podian describir mediante conjuntos fijos de variables continuas; mas atin, el andlisis exacto es s6lo posible en sistemas lineales. La IA se fun d6 en parte para escapar de las limitaciones matemiticas de la teoria de control en los. afios 50. Las herramientas de inferencia Iégica y computacidn permitieron a los inves tigadores de IA afrontar problemas relacionados con el lenguaje, vi que estaban completamente fuera del punto de mira de la teor (in y planificacion, control. fade Lingiiistica (desde el afio 1957 hasta el presente) + {Como esta relacionado el Lenguaje con el pensamiento? En 1957, B. F. Skinner publics Verbal Behavior, La obra presentaba una visi6n exten- say detallada desde el enfoque conductista al aprendizaje del lenguaje, y estaba escrita por los expertos mis destacados de este campo. Curiosamente, una revision de este bro Hleg6 a ser tan famosa como la obra misma, y provocé el casi total desinterés por el conductismo. El autor de la revisién fue Noam Chomsky, quien acababa de publicar un libro sobre su propia teorfa, Syntactic Structures. Chomsky mostré cémo la teorfa conductista no abordaba el tema de la creatividad en el lenguaje: no explicaba cmo es posible que un nifio sea capaz de entender y construir oraciones que nunca antes ha escuchado, La teorfa de Chomsky (basada en modelos sintécticos que se remontaban al lingiiista indio Panini, aproximadamente 350 a.C.) si podia explicar lo anterior y, a diferenc! de teorias anteriores, posefa cl formalismo suficiente como para permitir su progra maciénINTRODUCCION 19 La lingiifstica moderna y la [A enacieron», al mismo tiempo y maduraron juntas, so- ee lapandose en un campo hibrido llamado lingiifstiea computacional o procesamiento del lenguaje natural. El problema del entenlimiento del [enguaje se mostr6 pronto mu cho mas complejo de lo que se habia pensado en 1957. El entendimiento del lenguaje requiere la compransidn de la materia bajo estudio y de su contexto, y no solamente el entendimiento de fa estructura de las sentencias. Lo cual puede parecer obvio, pero no lo fue para la mayorfa de la comunidad investigadora hasta los afios 60. Gran parte de los primeros trabajos de investigaciOn en el drea de la representacién del conocimien- to (cl estudio de cémo representar el conocimiento de forma que el computador pueda razonar a partir de dicha representacién) estaban vinculados al lenguaje y a la bisqueda de informacidn en el campo del Jenguaje, y su base eran las investigaciones realizadas durante décadas en cl anilisis filos6fico del lenguaje. 1.3. Historia de la inteligencia artificial Una vez revisado el material basico de la IA propiamente dicha, ya en condiciones de cubrir el desarrollo Génesis de la inteligencia artificial (1943-1955) Warren McCulloch y Walter Pitts (1943) han sido reconocidos como los autores del primer trabajo de IA. Partieron de tres fuentes: conocimientos sobre la fisiologfa basica y funcionamiento de las neuronas en el cerebro, el andlisis formal de la légica proposi- onal de Russell y Whitehead y la teorfa de la computacidn de Turing, Propusieron un, modelo constituido por neuronas artificiales, en el que cada una de ellas se caracteriza- ba por estar «activada» 0 «desactivaday; la «activacién» se daba como respuesta a ka es- timulaci6n producida por una cantidad suficiente de neuronas vecinas. El estado de una neurona se veia como «equivalente, de hecho, a una proposicisn con unosestimulos ade~ cuados», Mostraron, por ejemplo, que cualquier funcién de cémputo podria calcularse media inte alguna red de neuronas in conectadas, y que todos los conectores ldgicos (and, or, not, etc.) se podrfan implementar utilizando estructuras de red sencillas. McCulloch y Pitts también sugirieron que redes adecuadamente definidas podrian aprender. Donald Hebb (1949) propuso y demostrs una sencilla regia de actualizacién para modificar las intensidades de las conexiones entre neuronas. Su regla, ahora llamada de aprendizaje Hebbiano o de Hebb, sigue vigente en la actualidad. Dos estudiantes graduados en el Departamento de Matematicas de Princeton, Mar- vin Minsky y Dean Edmonds, construyeron el primer computador a partir de una red neuronal en 1951, El NaC, como se Hamé, utilizaba 3.000 vilvulas de vacfo y un mecanismo de piloto automatico obtenido de los desechos de un avidn bombardero B-24 para simular una red con 40 neuronas. El comité encargado de evaluar el doctorado de Minsky veia con escepticismo el que este tipo de trabajo pudiera considerarse como matemitico, pero se dice que von Newmann dijo, «Si no lo es actualme fe, alin dia lo sera20 INTPLIGENCIA ARTIFICIAL, UN ENFOQUE MODERNO Minsky posteriormente probs teoremas influyentes que mostraron las limitaciones de la investigacién con redes neuronales. Hay un mimero de trabajos iniciales que se pueden caracterizar como de IA, pero fue Alan Turing quien articulé primero una vision de la LA en su articulo Computing Machinery and Intelligence. en 1950. Abi, introdujo la prueba de Turing je automatico, los algoritmos genéricos y el aprendizaje por refuerzo, el aprendiza. Nacimiento de la inteligencia artificial (1956) Princeton acogié a otras de la figuras seferas de la LA, John MeCarthy. Posteriormente asu graduacién, McCarthy se transladé al Dartmouth College, que se crigirfa en el lugar del nacimiento oficial de este campo, MeCarthy convencid Minsky, Claude Shannon y Nathaniel Rochester para que le ayudaran a aumentar adores americanos en la teoria de autématas, las redes neuronales y el estudio de la inteligencia, Organizaron un taller con una duracién de dos meses en Darmouth en el verano de 1956. Hubo diez asistentes en total, entre los que se intclufan Trenchard More de Prin- ceton, Arthur Samuel de IBM, y Ray Solomonoff y Oliver Selfridge del MIT. Dos investigadores det Carnegie Tech'’, Allen Newell y Herbert Simon, acapararon a atencién. Si bien los demas también tenfan algunas ideas y, en algunos casos, pro gramas para aplicaciones determinadas como el juego de damas, Newell y Simon con- aban ya con un programa de razonamiento, el Tedrico Légico (TL), del que Simon afirmaba: «Hemos inventado un programa de computacidn capa de pensar de manera no numérica, con fo que ha quedado resuelto el venerable problema de ba dualidad mente-cuerpo»"'. Poco después del término del taller, el programa ya era capaz de demostrar gran parte de Jos teoremas del Capitulo 2 de Principia Matematica de Russell y Whitehead, Se dice que Russell se manifest6 complacido cuando Simon le mostrs que la demostraci6n de un teorema que el programa habia generado era mas corta que la que aparecfa en Principia. Los editores de la revista Journal of Symbolic Logic resuharon menos impresionados y rechazaron un atticulo cuyos autores eran Newell, Simon y el Tedrico Logieo (TL) El aller de Dartmouth no produjo ningtin avance notable, pero puso Jas figuras importantes de este campo. Durante los siguie dlominado por estos personajes, cl interés de los investi n contacto a 20 aiios, el campo estuvo { como por sus estudiantes y colegas del MIT, CMU, Stanford ¢ IBM. Quiz lo tltimo que surgié de! taller tue el consenso en adoptar el nue- Yo nombre propuesto por McCarthy para este campo: Inteligencia Artificial. Quiz «ra cionalidad computacional» hubiese sido mas adecuado, pero «A» se ha mantenido, Revisando la propuesta del taller de Dartmouth (MeCarthy et al., 1955), se puede apreciar por qué fue necesario para la 1A convertirse en un campo separado. ;Por qué Acinafitente Universidad Carnegie Mellon (CMD. Newell y Simon tumbich desirrollaron un lenguaje de procesamiente de lists, IPL. para poster eseribi el TL. No disponian dle un compiler y to radujeron a cékige nxiquin st mano. Para evi eres, trabaj som en paralclo,diciendo en v7 alr niet binarius, conforme esctibian cada imstrucc ion pare asesistema oe Stabovos visions INTRODUCCION 21 no todo el trabajo hecho en el campo de Ja 1A se ha realizado bajo el nombre de teort de control, o investigaci6n operativa, o teorfa de ka decisién, que, después de todo, per- siguen objetivos similares a los de la 1A? O, ;por qué no es la TA una rama de Jas ma temdticas? La primera respuesta es que la LA desde el primer momento abareé ta idea de duplicar facultades humanas como la creatividad, la auto-mejora y el uso de! lenguaje Ninguno de los otros campos tenfan en cuenta esos temas. La segunda respuesta esta re lacionada con la metodologia. La TA es el inico de estos campos que es claramente una rama de la informatica (aunque la investigacién operativa comparte el énfasis en fa si- mulacién por computador), ademas la IA es el nico campo que persigue la construc cién de miquinas que funcionen automiticamente en medios complejos y cambiantes, Entusiasmo inicial, grandes esperanzas (1952-1969) Los primeros aftos de la TA estuvieron Henos de éxitos (aunque con ciertas limitaciones) Teniendo en cuenta lo primitivo de los computadores y as herramientas de programa- cién de aquella época, y el hecho de que s6lo unos pocos atios antes, a los computadores se les consideraba como artefactos que podian realizar trabajos aritméticos y nada mas, resulté sorprendente que un computador hiciese algo remotamente inteligente. La comunidad cientifica, en su mayoria, prefitié creer que «una méquina nunca podria hacer tareas» (véase el Capitulo 26 donde aparece una extensa lista de fareas recopitada uring). Naturalmente, los investigadores de IA responderfan demostrando lat reali- jon de una tarea tras otra, John McCarthy se tefiere a esta época como la era de «| Mira mamd, ahora sin manos!» ya Al temprano éxito de Newell y Simon siguié el del sistema de resolucién general de problemas. 0 SRGP. A diferencia de! Tedrico Logico, desde un principio este programa se diseid para que imitara protocolos de resolucién de problemas de los seres humanos. Dentro de! limitado nimero de puzles que podia manejar, result6 que Ta se cuencia en la que el programa consideraba que los subobjetivos y las posibles acciones eran semejantes a lt manera en que los seres humanos abordaban los mismos problemas. Es decir. el SRGP posiblemente fue el primer programa que incorpord el enfoque de «pensar como un ser humano». El éxito del SRGP y de los programas que le siguieron, como los modelos de cognicién, Hevaron a Newell y Simon (1976) a formular la famosa hipotesis del sistema de simbolos fisicos, que afirma que «un sistema de simbolos ff sicos tiene los medios suficientes y necesarios para generar una accién inteligente». Lo que ellos querfan decir es que cualquier sistema (human o maquina) que exhibiese inteligencia deberia operar manipulando estructuras de datos compuestas por simbolos: Posteriormente se vera que esta hipétesis se ha modificado atendiendo a distintos puntos de vista En IBM, Nathaniel Rochester y sus colegas desarrotlaron algunos de los primeros programas de LA. Herbert Gelernter (1959) construyé el demostrador de teoremas de ge~ ometrfa (DTG). el cual era eapaz de probar teoremas que muchos estudiantes de n atieas podian encontrar muy complejos de resolver. A comienzos 1952, Arthur Samuel escribi6 una serie de programas para el juego de fas damas que eventualmente apren- dieron a jugar hasta aleanzar un nivel equivalente al de un amateur, De paso, eehé por22 INTELIGENCIA ARTIFICIAL. UN ENFOQUE MODERNO tierra la idea de que los computadores slo pueden hacer lo que se les dice: su programa pronto aprendié a jugar mejor que su creador. El programa se present en la televi- sién en febrero de 1956 y caus6 una gran impresién, Como Turing, Samuel tenfa difi cultades para obtener el tiempo de cémputo. Trabajaba por las noches y utilizaba miquinas que atin estaban en perfodo de prueba en la planta de fabricacién de IBM. E Capitulo 6 trata el tema de los juegos. y en el Capitulo 21 se describe con detalle las téc nicas de aprendizaje utilizadas por Samuel. John McCarthy se traslad6 de Darmouth al MIT, donde realiz6 tres contribuciones cru- ciales en un aio hist6rico: 1958. En el Laboratorio de LA del MIT Memo Ntimero 1 McCarthy definid el lenguaje de alto nivel Lisp, que se convertirfa en el lenguaje de pro- gramaci6n dominante en la 1A. Lisp es el segundo lenguaje de programacién mas antiguo que se utiliza en la actualidad, ya que aparecié un ano después de FORTRAN. Con Lisp. McCarthy tenfa la herramienta que necesitabs, pero el acceso a los escasos y costosos recursos de cmputo atin era un problema serio, Para solucionarlo, él, junto a otros miembros del MIT, inventaron el tiempo compartido, También, en 1958, MeCarthy publics un articulo titulado Programs with Common Sense, en cel que describya el Generador de Con- sejos, un programa hipotético que podria considerarse como el primer sistema de LA completo, Al igual que el Tedrico Légico y el Demostrador de Teoremas de Geomet McCarthy diseié su programa para buscar la solucidn a problemas utilizando el conocimiento, Pero, a diferencia de los otros, manejaba el conocimiento general del mundo. Por ejemplo, mosteé cémo algunos axiomas sencillos permitéan a un programa generar un plan para conducirnos hasta el aeropuerto y tomar un avin. El programa se disené para que aceptase nuevos axiomas durante el curso normal de operaciGn, permitiéndole asi ser competente en dreas nuevas, sin necesidad de reprogramacion. El Generador de Consejos in- corporaba asi los prineipios centrales de la representacién del conocimiento y el razon: miento: es «til contar con una representacién formal y explicita del mundo y de la forma en que Ia acci6n de un agente afecta al mundo, asf como, ser eapaces de manipular estas representaciones con procesos deductivos. Es sorprendente constatar cémo mucho de lo propuesto en el articulo escrito en 1958 permanece vigente incluso en la actualidad, 1958 fue el aiio en et que Marvin Minsky se traslad6 al MIT, Sin embargo, su cola: boracién inicial no duré demasiado, MeCarthy se centré en la representacién y el raz0- namiento con légica formal, mientras que Minsky estaba més interesado en lograr que los programas funcionaran y eventualmente desarrollé un punto de vista anti-Igico. En 1963, MeCarthy cred el Laboratorio de 1A en Stanford. Su plan para construir la version mas reciente del Generador de Consejos con ayuda de la I6gica sufrid un considerable impulso gracias al descubrimiento de J, A. Robinson del método de resolucién (un algoritmo completo para la demostraci6n de teoremas para la l6gica de primer orden; véase el Ca 9), Bl trabajo realizado en Stanford hacia énfasis en los métodos de propésito general para el razonamiento légico. Algunas aplicaciones de la Igica inclufan los sistemas de plani- ficaciGn y respuesta a preguntas de Cordell Green (1969), asf como el proyecto de ro: batica de Shakey en cl nuevo Instituto de Investigacién de Stanford (Stanford Research Institute, SRD. Este Gitimo proyecto, comentado en detalle en el Capitulo 25, fue el p mero que demostr6 la total integraci6n del razonamiento I6gico y Ia actividad fisica Minsky supervis6 el trabajo de una serie de estudiantes que eligieron un ntimero de problemas limitados cuya solucién parecié requerir inteligencia. Estos dominios limi- losmcroMunoos INTRODUCCION 23 tados se conoven como micromundos. El programa SAINT de James Slagle (19632) fue capaz de resolver problemas de integracién de calculo en forma cerrada, habituales en los primeros cursos de licenciatura. El programa ANALOGY de Tom Evans (1968) resolvia problemas de analogfa geométrica que se aplicaban en las pruebas de medicién de inteligencia, semejante al de la Figura 1.4. El programa STUDENT de Daniel Bo- brow (1967) podia resolver problemas de dlgebra del tipo: Siel ntimero de clientes de Tom es dos veces el cuadrado det 20 por ciento de ta cant: dad de anuncios que realiza, y éstos ascienden a 45, , cuyo resultado fue «el vodka es bueno pero la carne esta podrida» es un buen ejemplo del tipo de dificultades que surgieron En un informe presentado en 1966, el comité consultivo deckard que «no se ha logrado obtener ninguna traduccisn de textos cientificos generales ni se prevé obtener ninguna en un futuro inmediato». Se eancel6 todo el patrocinio del gobierno estadounidense que se habfa asignado a los proyectos académicos sobre traduccién, Hoy dia, la traduccion auitomdtica es una herramienta imperfecta pero de uso extendido en documentos técni se «el espiritu es fu cos, comerciales, gubernamentales y de Internet El segundo problema fue que muchos de los problemas que se estaban intentando resolver mediante Ja LA eran intratables. La mayorfa de los primeros programas de LA resolvian problemas experimentando con diversos pasos hasta que se llegara a encon- traruna solucitin, Esto funcions en los primeros programas debido a que los micromundos con los qu nes posibles y secuencias de soluciones muy cortas. Antes de que se desarrollara la teorfa de la complejidad computacional, se crefa que para «aumentar» el tamaiio de los programas de forma qui inerementar lt velocidad del hardware y aumentar kas memorias. El optimismo que acom: paiié al logro de la demostracién de problemas. por ejemplo, pronto se vio eelipsado cuando los investigadores fracasaron en la demostracisn de teoremas que implicaban mas de unas pocas decenas de condiciones. ET hecho de que, en principio, un programa sea capac; © se trabajaba contenfan muy pocos objetos, y por lo tanto muy pocas avcio. estos pudiesen solucionar grandes problemas seria necesario de encontrar una soluci6n no implica que tal programa encierre todos loy mecanismos necesarios para encongrar la solucién en la practica, La ilusoria nocidn de una ilimitada capacidad de cémputo no sélo existi6 en los pro gramay para la resolucién de problemas. Los primeros experimentos en el campo de la evolucién automiatica (ahora Hlamados algoritmos genéticos) (Friedberg, 1958: Fried- berg cf al., 1959) estaban basados en la, sin duda correcta, premisa de que efeetuando una adecuada serie de pequefiay mutaciones a un programa de cédigo maquina se po- .cherar un programa con buen rendimiento aplicable en cualquier tarea sencilla Después surgié la idea de probar con mutaciones aleatorias aplicando un proceso de se: leccidin con el fin de conservar aquellas mutaciones que hubiesen demostrado ser mas titles, No obstante, las miles de horas de CPU dedicadas, no dieron lugar a ningdin avance tangible, Los algoritmos genéticos actuales utilizan representaciones mejores y han tenido mis éxito. La incapacidad para manejar la «explosicn combinatoria» fue una de las principa- les eriticas que se hicieron a ka 1A en el informe de Lighthill (Lighthill, 1973). informe en el que se bas6 la decisién del gobierno britinico para retirar kt ayuda a ls investig, ciones sobre IA, excepto en dos tniversidades. (La tradicién oral presenta un cuadro an,26 INTELIGENCIA ARTIFICIAL, UN ENFOQUE MODERNO, nnéron0s ess poco distinto y mis animado, en el que se vislumbran ambiciones politicas y animad- versiones personales, cuya descripeidn esté fuera del dmbito de esta obra.) El tercer absticulo se derivé de las limitaciones inherentes a las estructuras basicas que se utilizaban en la generacién de la conducta inteligente, Por ejemplo, en 1969, en el libro de Minsky y Papert, Perceptrons, se demostré que si bien era posible lograr que los petceptrones (una red neuronal simple) aprendieran cualquier cosa que pudiesen re presentar, su capacidad de representaci6n era muy limitada, En particular, un perceptrén con dos entradas no se podia entrenar para que aprendiese a reconocer cusindo sus dos entradas eran diferentes. Si bien los resultados que obtuvieron no eran aplicables a redes més complejas multicapa, los fonds para la investigacién de las redes neuronales se redujeron a précticamente nada. Es irénico que los nuevos algoritmos de aprendizaje de retroalimentacié utilizados en las redes multicapa y que fueron 1a causa del gran resurgimiento de fa investigaciGn en redes neuronales de finales de los aiios 80, en rea. lidad, se hayan descubierto por primera vez en 1969 (Bryson y Ho, 1969). Sistemas basados en el conocimiento: gclave del poder? (1969-1979) El cuadro que dibujaba la resolucién de problemas durante la primera década de la in- vestigacién en la IA estaba centrado en el desarrollo de mecanismos de biisqueda de pro pésito general, en los que se entrelwzaban elementos de razonamiento basicos para encontrar asi soluciones completas. A estos procedimientos se les ha denominado métodos dél les, debido a que no tratan problemas mas amplios o més complejos. La alternativa a los métodos débiles es el uso de conocimiento especifico del dominio que facilita el desarro- Ho de etapas de razonamiento mas largas, pudiéndose asf resolver casos recurrentes en dominios de conocimiento restringido, Podrfa afirmarse que para resolver un problema en a prdctica, es necesario saber de antemano la correspondiente respuesta. El programa DENDRAL (Buchanan ¢7 al., 1969) constituye uno de los primeros ejemplos de este enfoque. Fue disefiado en Stanford, donde Ed Feigenbaum (discfpulo de Her bert Simon), Bruce Buchanan (filésofo convertido en informético) y Joshua Lederberg (genetista ganador del Premio Nobel) colaboraron en fa solucién del problema de infe rir una estructura molecular partir de la informaciGn proporeionada por un espectr- metro de masas. El programa se alimentaba con Ja firmula clemental de la molécula (por ejemplo, C,H, NO.) y el espectro de masas, proporcionando las masas de los dis lintos fragmentos de la molécula generada después de ser bombardeada con un haz de clectrones. Por ejemplo, un espectro de masas con un pico en m = 15, corresponderfa a Ja masa de un fragmento de metilo (CH). La version mas simple del programa generaba todas las posibles estructuras que co rrespondieran a la formula, luego predecfa el espectro de masas que se observari caso, en cada y comparaba éstos con el especiro real. Como era de esperar, el método anterior result6 pronto inviable para el caso de moléculas con un tamafio considerable. Los creadores de DENDRAL consultaron con quimicos analiticos y se dieron cuenta de que éstos trabajaban buscando patrones conocidos de picos en cl espectro que sugerian estructuras comunes en la molécuta, Por ejemplo, par identificar el subgrupo (con un peso de 28) de las cetonas (C=0) se emples la siguiente restSTEMS EXPERTOS INTRODUCCION 27 si hay dos picos en x, y x, tales que a) x, + 4 = M + 28 (siendo M la masa de toda la moléculay b) x, ~ 28 es.un pico alto; ©) x, ~ 28 es.un pico alto, d) al menos una de x, yx, es alta, entonees existe un subgrupo de jonas, Alreconocer que la molécula contiene una subestructura concreta se reduce el niimero de posibles candidatos de forma considerable, La potencia de DENDRAL se basaba en que: ‘Toda la informacién te6rica necesaria para resolver estos problemas se ha proyectado de su forma general {componente predicho por el espectro] («primeros principios») a formas eficientes especiales («recetas de cocina»). (Feigenbaum et al.. 1971) La trascendencia de DENDRAL se debi6 a ser el primer sistema de conocimiento in- fenso que tuvo éxito: su base de conocimiento estaba formada por grandes cantidades de reglas de propdsito particular. En sistemas diseflados posteriormente se incorporaron también Ios elementos fundamentales de la propuesta de McCarthy para el Generator de Consejos, la nftida separaciGn del conocimiento (en forma de reglas) de la parte correspondiente al razonamiento. Teniendo en cuenta esta leccisn, Feigenbaum junto con otros investigadores de Stanford dieron comienzo al Proyecto de Programacién Heutistica, PPH, dedicado a determinar el grado con ef que [1 nueva metodologia de los sistemas expertos podia aplicarse a otras eas de la actividad humana, fe gran esfuerzo se realiz6 en el drea del diagndstico médico, Feigenbaum, Buchanan y el doctor Edward Shorlliffe disefiaron el progra maMYCIN, parael diagndstico de infecciones sangufneas. Con 450 reglas aproximadamente, MYCIN era capaz de hacer diagndsticos tan buenios como los de un experto y, desde tego, ‘mejores que los de un médico recién graduado, Se distingufa de DENDRAL en dos aspe tos principalmente. En primer lugar, a diferencia de las reglas de DENDRAL, no se contaba con un modelo te6rico desde el cual se pudiesen deducir las reglas de MYCIN, Pue nece rio obtenerlas a partir de extensas entrevistas con los expertos. quienes las habfan obtenido de libros de texto, de otros expertos o de su experiencia directa en casos précticos, En segundo, lugar, las reglas deberfan reflejar la incertidumbre inherente al conocimiento médico. MYCIN contaba con un elemento que facilitaba el caculo de incertidumbre denominado factores de certeza (véase el Capitulo 13), que al parecer (en aquella época) correspondfa muy bien a la manera como los médicos ponderaban las evidencias al hacer un diagndstico. La importancia del conocimiento del dominio se demostré también en el drea de ka comprensién del lenguaje natural. Aunque el sistema SHRDLU de Winograd pata la com- prensién del lenguaje natural habfa suseitado mucho entusiasmo, su dependencia del andlisis sintéctico provocs algunos de los mismos problemas que habfan aparecido en los trabajos realizados en la traduceién automatica. Era eapaz de ambigiedad e identificar los pronombres utilizados, gracias a que se habia disefiado es pecialmente para un area (el mundo de Tos bloques). Fueron varios los investigadores que, como Eugene Charniak, estudiante de Winograd en el MIT, opinaron que para una solida comprensién del lengdaje era necesario contar con un conocimiento general sobre el mundo y un método general para usar ese conocimiento. igui esolver los problemas de28 nanos INTELIGENCIA ARTIFICIAL, UN ENFOQUE MODERNO in Yale, el I al afirmar: « gilista transformado en informético Roger Schank refor76 lo anterior {0 existe eso que Haman sintaxis», lo que irrité a muchos lingiiistas, pero sirvi6 para iniciar un Util debate. Schank y sus estudiantes disearon una serie de pro- ‘gramas (Schank y Abelson, 1977; Wilensky, 1978; Schank y Riesbeck, 1981; Dyer, 1983) cuyo objetivo era fa comprensién del lenguaje natural, El foco de aten taba menos en el lenguaje per se y mis en los problemas vinculados a fa representacién y razonamiento del conocimiento necesario para ka comprensi6n del Lenguaje. Entre los problemas estaba el de la representacidn de situaciones estereotipo (Cullingford, 1981), la des cripci6n de la organizaci6n de la memoria humana (Rieger, 1976; Kolodner, 1983) y ta comprensién de planes y objetivos (Wilensky, 1983) El crecimiento generalizado de aplicaciones para solucionar problemas del mundo real provocs el respectivo aumento en Ja demanda de esquemas de representacién del conocimiento que funcionaran. Se desarroll6 una considerable cantidad de lenguajes de representacin y razonamiento diferentes. Algunos basados en ka ldgica, por ejemplo el lenguaje Prolog goz6 de mucha aceptacién en Europa, aceptacién que en Estados Uni- dos fue para la familia del PLANNER. Otros, siguiendo la nocién de marcos de Minsky (1975), se decidieron por un enfoque mas estructurado, al recopilar informacién sobre objetos concretos y tipos de eventos, organizando estos tipos en grandes jerarquias ta- xondmicas. similares at las biol6gicas. La IA se convierte en una industria (desde 1980 hasta el presente) El primer sistema experto comercial que tuvo éxito, R I, inicié st actividad en Digital Equip- ment Corporation (McDermott, 1982). EI programa se utilizaba en la elaboracién de pedi- dos de nuevos sistemas informaticos, En 1986 representaba para ka compaitia un ahorro es timado de 40 millones de dslares al aio. En 1988, el grupo de Inteligencia Artificial de DEC habja distribuido ya 40 sistemas expertos, y habfa mas en camino, Du Pont utilizaba ya 100 yestaban en etapa de desarrollo 500 mas, lo que le generaba ahorro de diez millones de d6: lares anuales aproximadamente, Casi todas las compaiifas importantes de Estados Unidos contaban con su propio grupo de 1A, en el que se utilizaban o investigaban sistemas expertos. En 1981 los japoneses anunciaron el proyecto «Quinta Generacién», un plan de diez aflos para consttuir computadores inteligentes en los que pudiese ejecutarse Prolog. Como respuesta Estados Unidos constituyé la Microelectronics and Computer Technology Corporation (MCC), consorcio eneargado de mantener la competitividad nacional en estas dreas. En ambos casos, la LA formaba parte de un gran proyecto que inclufa el disefio de chips y la investigaciGn de la relacién hombre maquina. Sin embargo, los com ponentes de IA generados en el marco de MCC y del proyecto Quinta Generacién nunca alcanzaron sus objetivos. En el Reino Unido, el informe Alvey restaurs el patrocinio sus- pendido por el informe Lighthill!® so Sistemats Inteligentes Buassddos en Coie wniento (IKBS. fitetligent Knunvledge-Bused Systems) ya que la Inteligencin Aniticil habia sk oficiatmnente csneeladaconexonistas| INTRODUCCION 29 En su conjunto, la industria de la 1A crecié rapidamente, pasando de unos pocos mi- Hones de dotares en 1980 a billones de délares en 1988. Poco después de este perfodo. eg la época Hamada «El Invierno de ka LA», que afecté a muchas empresas que no fue ron capaces de desarrollar los extravagantes productos prometidos. Regreso de las redes neuronales (desde 1986 hasta el presente) Aunque ka informatica habfa abandonado de manera general el campo de las redes neuronales a finales de los afios 70, ef trabajo continud en otros campos. Hopfield (1982) utilizaron técnicas de la mecinica estadistica para analizar las propiedades de almacenamiento y optimizacién de las redes, tratando colecciones de nodos como. colecciones de dtomos, Psicélogos como David Rumelhart y Geoff Hinton continuaron con, el estudio de modelos de memoria basados en redes neuronales. Como se verd en el Ca- pitulo 20, el impulso mas fuerte se produjo a mediados de ta década de los 80, euando por Jo menos cuatro grupos distintos reinventaron el algoritmo de aprendizaje de retroali- mentacién, mencionado por vez primera en 1969 por Bryson y Ho. El algoritmo se apli- 66 a diversos problemas de aprendizaje en los campos de la informética y la psicologta, y la gran difusin que conocieron los resultados obtenidos. publicados en la coleccién Pa- rallel Distributed Processing (Rumelhart y McClelland, 1986). suscité gran entusiasmo, Aquellos modelos de inteligencia artificial lamados conexionistas" fueron vistos por algunos como competidores tanto de los modelos simbélicos propuestos por Newell y Simon como de la aproximacidn légica de McCarthy entre otros (Smolensky, 1988). Pue- de parecer obvio que los humanos manipulan simbolos hasta cierto nivel, de hecho, el libro The Symbolic Species (1997) de Terrence Deacon sugiere que esta es la caracteristica que define 3 los humanos, pero los conexionistas més ardientes se preguntan si la manipulacién de los simbolos desempeiia algtin papel justificable en determinados modelos, de cognicién. Este interrogante no ha sido atin clarificado, pero la tendencia actual es que Jas uproximaciones conexionistas y simb6licas son complementatias y no competidoras cos como John IA se convierte en una ciencia (desde 1987 hasta el presente) En Jos tltimos afios se ha producido una revolucidn tanto en el contenido como en lat metodologia de trabajo en el campo de la inteligencia artificial.”” Actualmente es mais usual el desarrollo sobre tearfas ya existentes que proponer teorias totalmente novedo- Se usa he taduccivin Hiteral del trmino connections por no existir un téemino equivalene en espaol (N. del RD). Hay quien ha caracteriz twos de TA debe fs do este cambio como la vietoria de los puleros (aquellos que consideran que las ase rigurossunente en las matemiticas)sobse los desaliados (aquellos que despucs tte intentar muchas ideas, eseriben alunos progrannts ¥ despues evabdan kas que aparentemente Funcions) Amuos enfextes son titles, Fst tendencia favor de uni mayor puleritud es sem de que el eampe ha 149 cial no implies que tal estabilidad se puede ver aera poco estructurada30° INTELIGENCLA ARTIFICIAL. UN ENFOQUE MODERNO nena oF omT0S sas, tomar como base rigurosos teoremas o sdlidas evidencias experimentales mas que intuicién, y demostrar la utilidad de las aplicaciones en el mundo real mas que crear ejemplos de juguete. La TA se funds en parte en e! marco de una rebelién en contra de las limitaciones de los campos existentes como la teorfa de control o la estadistica, y ahora abarca estos pos. Tal y como indica David McAllester (1998), En los primeros aft de la LA parecfa perfectamente posible que las nuevas formas de la ‘computacién simbélica, por ejemplo, los marcos y las redes semiinticas, hicieran que ‘mayor parte de la teoria clasica pasara a ser obsoleta, Esto Hlev6 a la IA a una especie de aislamiento, que la separd del resto de las ciencias de la computacién. En la actualidad se estd abandonando este aiskamiento, Existe la creencia de que el aprendizaje automé- tico no se debe separar de la teorfa de la informacién, que el razonamiento incierto no se debe separar de los modelos estocdsticos, de que la biisqueda no se debe aislar de la op- timizacién clisica y el control, y de que et razonamiento automiitico no se debe se} de los métodos formales y del andlisis estitico. En términos metodoligicos, se puede decir, con rotundidad, que la TA ya forma parte del mbito de los métodos cientificos. Para que se acepten, las hipétesis se deben someter a tigurosos experimentos empiticos, y los resultados deben analizarse estadisticamente para identificar su relevancia (Cohen, 1995). El uso de Internet y el compartir reposito- tios de datos de prucba y eddigo, ha hecho posible que ahora se puedan contrastar experimentos, Un buen modelo de ta tendenci impo del reconocimiento del habla, En la década de Jos 70 se sometié a prueba una gran variedad de arquitecturas y enfoques. Muchos de ellos fueron un tanto ad hoc y resultaban frigiles, y fueron probados slo en unos pocos ejemplos elegidos especialmente. En aftos recientes, las aproximaciones basadas en los modelos de Markov ocultos, MMO, han pasado a dominar el drea Dos son las caracterfsticas de los MMO que tienen relevancia, Primero, se basan en una rigurosa teorfa matemética, lo cual ha permitido a los investigadores del lenguaje basarse en los resultados de investigaciones matemticas hechas en oiros campos a lo largo de varias décadas. En segundo lugar, los modelos se han generado mediante un proceso de aprendizaje en grandes corpus de datos de lenguaje reales. Lo cual garantiza una funcionalidad robusta, y en sucesivas pruebas ciegas, los MMO han mejorado sus resultados a un ritmo constante. La tecnologia del habla y el campo rekacionado del reconocimiento de caracteres manuscritos estin actualmente en transicién hac generalizada utilizacién en aplicaciones industriales y de consumo, Las redes neuronales también siguen esta tendencia. La mayor parte del trabajo realizado con redes neuronales en fa década de los 80 se realiz6 con la idea de dejar a un Tado lo que se podfa hacer y de descubrir en qué se difereneiaban las redes neurona les de otras tGenicas «tradicionales». La utilizacién de metodologfas mejor actual es el ¢: a una idas y marcos teGricos, ha autorizado que este campo aleance un grado de conocimiento que ha permitido que ahora las redes neuronales se puedan comparar con otras téenicas similares de campos como la estadistica, el reconocimiento de patrones y el aprendizaje automa tico, de forma que las téenicas mas prometedoras pueden aplicarse a cualquier proble ma. Ce de datos no resultado de estos desarrollos, fa tecnologia denominada mine ha generado una nueva y vigorosa industria.INTRODUCCION 31 La aparicién de Probabilistic Reasoning in Intelligent Systems de Judea Pearl (1988) hizo que se aceptara de nuevo la probabilidad y la teoria de la decisién como parte de la TA, como consecuencia del resurgimiento del interés despertado y gracias especialmente al articulo In Defense of Probability de Peter Cheeseman (1985). El formalismo de las redes de Bayes aparecié para facilitar la representacidn eficiente y el razonamiento riguroso en situaciones en las que se disponfa de conocimiento incierto, Este enfoque supera con creces muchos de los problemas de los sistemas de razonamiento probabi- listico de las décadas de los 60 y 70; y ahora domina la investi; zonamiento incierto y los sistemas expertos. Esta aproximacién facilita el aprendizaje a partir de la experiencia, y combina lo mejor de la LA ckisica y las redes neuronales. El trabajo de Judea Pearl (1982a) y de Eric Horvitz y David Heckerman (Horvitz y Hee- kerman, 1986; Horvitz et al., 1986) sirvid para promover la nocidn de sistemas expertos normativos: es decir, tos que actéian racionalmente de acuerdo con las leyes de ta teoria de la decisidn, sin que intenten imitar las etapas de razonamiento de los expertos humanos. El sistema operativo Windows™ incluye varios sistemas expertos de diagndstico normativos para la correccién de problemas. En los Capitulos 13 y 16 se abor- da este tema. Revoluciones similares y suaves se han dado en robstica, visién por computador, y aprendizaje automético. La comprensiGn mejor de los problemas y de su complejidad, junto a un incremento en la sofisticacién de las matemiticas ha facilitado el desarrollo de una agenda de investigacién y de métodos mas robustos. En cualquier caso, la for- malizacion y especializacién ha llevado también a la fragmentaci6n: areas como la visin y la robotica estn cada ver. mas aislados de la «rama centrab> de la IA. La concepeién unificadora de IA como diseito de agentes racionales puede facilitar la unificacin de estos campos diferentes. gaciéin de la LA en el ra- Emergencia de los sistemas inteligentes (desde 1995 hasta el presente) Quizas animados por el progreso en la resolucién de subproblemas de IA, los investigadores han comenzado a trabajar de nuevo en el problema del «agente total». El trabajo de Allen Newell, John Laird, y Paul Rosenbloom en Soak (Newell, 1990; Laird et al., 1987) es el ejemplo mejor conocido de una arquitectura de agente completa, El amado «movimiento situado> intenta entender la forma de actuar de los agentes in- _mersos en entornos reales, que disponen de sensores de entradas continuas. Uno de los medios ms importantes para los agentes inteligentes es Internet. Los sistemas de IA han Hegado a ser tan comunes en aplicaciones desarrolladas para la Web que el sufijo «bob» se ha introducido en el lenguaje comin. Mas atin, tecnologfas de IA son la base de muchas hetramientas para Internet, como por ejemplo motores de biisqueda, sistemas de recomendacidn, y los sistemas para la construccidn de portales Web. Ademids de la primera edicién de este libro de texto (Russell y Norvig, 1995), otros libros de texto han adoptado recientemente la perspectiva de agentes (Poole et al.. 1998: Nilsson, 1998), Una de las conclusiones que se han extraido al tratar de construir agen. {es completos ha sido que se deberfan reorganizar los subcampos aistados de la 1A. para32 INTELIGENCIA ARTIFICIAL, UN ENFOQUE MODERNO que sus resultados se puedan interrelacionatr. En particular, ahor que los sistemas sensoriales (visiGn, snar, reconocimiento del habla, etc.) no pueden generar informaci6n totalmente fidedigna del medio en el que habitan, Otra segunda consecuencia importante, desde la perspectiva del agente, es que la IA se ha ido acercando otros campos, como la teoria de control y la economia, que también tratan con agentes, se ere mayoritariamente 1.4 El estado del arte {Qué es capaz de hacer la LA hoy en dia? Responder de manera concisa es difieil por que hay muchas actividades divididas en muchos subcampos. Aquf se presentan unas cuantas aplicaciones; otras apareceri Planificacién auténoma: a un centenar de millones de millas de la Tierra, el programa de ka NASA Agente Remoto se convirti6 en el primer programa de planificaci6n auténoma a bordo que controlaba la planificacién de las operaciones de una nave espa cial desde abordo (Jonsson ef al., 2000), El Agente Remoto generaba planes a partir de objetivos generales especificados desde tierra, y monitorizaba las operaciones de la nave espacial segtin se ejecutaban los planes (deteccién, diagnéstico y recuperacisn de problemas segiin ocurrian) Juegos: Deep Blue de IBM fue el primer sistema que derroté a un campedn mundial en una partida de ajedrez cuando supers a Garry Kasparov por un resultado de 3.5, 2.5 en una partida de exhibicién (Goodman y Keene, 1997). Kasparov dijo que habia percibido un «nuevo tipo de inteligencia» al otro lado del tablero. La revista Newsweek describid la partida como «La partida final». El valor de las acciones de IBM se incre- ment6 en 18 billones de détares. Control auténomo: el sistema de visién por computador ALVIN fue entrenado para dirigir un coche de forma que siguiese una linea. Se instalé en una furgoneta controls da por computador en el NavLan de UCM y se utiliz6 para dirigir al vehyeulo por Es- tados Unidos, Durante 2.850 millas controlé la direccién del vehiculo en e! 98 por cien to del trayecto, Una persona lo sustituyé en ef dos por ciento restante, principalmente en vias de Salida, E] NavLAB posee videocdmaras que transmiten imagenes de lt carretera a ALVIN, que posteriormente calcula la mejor direccidn a seguir, basndose en las experiencias acumuladas en los viajes de entrenamiento. Di los programas de diagndstico médico basados en el andlisis probabilis ta han Hegado a aleanzar niveles similares a los de médicos expertos en algunas reas de la medicina, Heckerman (1991) describe un caso en el que un destacado experto en a patologfa de los nodos linfiticos se mofs del diagnéstico generado por un programa cen un caso especialmente dificil, EI ereador del progt al computador como habia genera importantes en los que habs a lo largo del texto. ma le sugirid que le preguntase ido el diagndstico, La miquina indies los factores mis basado su decision y explic6 la ligers imeraccidn existen te enire varios de los sintomas en este caso, Eventualmente, el experto acepté el diag. ami. Planificacién logi néstico del progr durante la crisis del Golfo Pérsico de 1991, fas fuerzas de Estados Unidos desarrollaron la herramienta Dynanie Analysiv and Replaning ToolINTRODUCCION 33 (DART) (Cross y Walker, 1994), para automatizat la planificacién y organizacion logistics del transporte. Lo que ineluia hasta 50.000 vehiculos, carga y personal a la vez, teniendo en cuenta puntos de partida, destinos, rutas y la resolucién de conflictos entre otros pardmetros. Las técnieas de planiticaci6n de 1A permitieron que se generara un plan en. cuestidn de horas que podria haber Hlevado semanas con otros métodos, La agencia DAR- PA (Defense Advanced Research Project Agency) atirmé que esta aplicacién por sf sola habia mas que amortizado los 30 aftos de inversién de DARPA en TA. Robética: muchos cirujanos utilizan hoy en dia asistentes robot en operaciones de microcirugia. HipNav (DiGioia ¢f al., 1996) es un sistema que utiliza técnicas de vision por computador para crear un modelo tridimensional de la anatomga interna del pacien- te y después utiliza un control robotizado para guiar el implante de prétesis de cadera. Procesamiento de lenguaje y resolucién de problemas: Proven # (Littman etal 1999) es un programa informatico que resuelve crucigramay mejor que kt mayoria de Jos humanos, utilizando restricciones en programas de relleno de palabras, una gran base de datos de crucigramas, y varias fuentes de informacidn como diccionarios y bases de datos ontine, que incluyen la lista de peliculas y los actores que intervienen en ellas, entre otras cosas. Por ejemplo, determina que la pista «Historia de Niza» se puede resolver “TAGE> ya que su base de datos incluye el par pista/soluci6n «Historia en Fran- ciVETAGE» y porque reconoce que los patrones «Niza X» y «X en Francia» a menu- do tienen [a misma solucién. El prog judad de Francia, pero es capaz de resolver el puzle Estos son algunos de los ejemplos de sistemas de inteligencia artificial que existen hoy en dia. No se trata de magia o ciencia ficcién, son mas bien ciencia, ingenieria y ma teméticas, para los que este libro proporciona una introduccién, con «d rama no sabe que Niza es una 1.5 Resumen En este capitulo se define la IA y se establecen los antecedentes culturales que han ser vido de base. Al unos de los aspectos mas destacables son. + Cada uno tiene una visi6n distinta de lo que ¢s la IA. Es importante responder a as dos pre; std interesado en el razonamiento y el comporta: miento? ;Desea modelar seres humanos o trabajar a partir de un ideal esténdar? + Eneste libro se adopta el criterio de que Ia inteligencia tiene que ver prineipalmente con las acciones racionales. Desde un punto de vista ideal, un agente intel te es aquel que emprende la mejor accidn posible ante una situacién dada, Se estudiard ef problema de la construccién de ay sentido, + Los fildsofos (desde el aio 400 a.C.) facilitaron el poder imaginar la 1A, al con. cebir la idea de que 1a mente es de alguna manera como una maquina que Funcio- naa partir del conocimiento codificado en un lenguaje interno, y al considerar que el pensamiento servéa para seleccionar la accidn a Hevar a cabo. Las matemidticas proporcionaron las herramientas para manipular untas siguientes: ; entes que sean inteligentes en este anto las ase veraciones de certeza ligicas, como las inciertas de tipo probabilista, Asimismo,M INTELIGENCIA ARTIFICIAL, UN ENFOQUE MODERNO prepararon el terreno para un entendimiento de lo que es el célculo y el razona miento con algoritmos. + Los economistas formalizaron el problema de la toma de decisiones para maximizar Jos resultados esperados. + Los psicdlogos adoptaron la idea de que los humanos y los animales podéan considerarse maquinas de procesamiento de informacién, Los lingitistas demostraron que el uso del lenguaje se ajusta a ese modelo, + Los informticos proporcionaron los artefactos que hicieron posible la aplicacién de la IA. Los programas de TA tienden a ser extensos y no podrian funcionar sin los grandes avances en velocidad y memoria aportados por la industria informé- ca + La teorfa de control se centra en el diseito de dispositivos que actian de forma 6p- tima con base en la retroalimentacién que reciben del entorno en el que estan inmersos. Inicialmente, las herramientas mateméticas de la teorfa de control eran bastante diferentes a las tenicas que utilizaba la LA, pero ambos estn acercando, + Las historia de la 1A ha pasado por ciclos de éxito, injustificado optimismo y con- secuente desaparicién de entusiasmo y apoyos finaneieros. También ha habido ciclos caracterizados por la introduccién de enfoques nuevos y creatives y de un perfeccionamiento sistemtico de los mejores + LalA ha avanzado mis rpidamente en la década pasada debido al mayor uso del metodo cientifico en la experimentacién y comparaci6n de propuestas. + Los avanees re ento de las bases te6rieas de la in teligencia han ido aparejados con las mejoras realizadas en la optimizacién de los sistemas reales. Los subeampos de la IA se han integrado mas y la TA ha encon- trado elementos comunes con otras disciplinas. ampos se ntes logrados en el entendimn NOTAS BIBLIOGRAFICAS E HISTORICAS. Elestatus metodolégico de la inteligencia artificial se ha investigado en The Sciences of the Anifivial, escrito por Hetb Simon (1981), en el cual se analizan reas de investigacidn interesadas en ef desarrollo de artefactos complejos. Explica como la IA se puede ver como ciencia y matemiitica, Cohen (1995) proporciona una visi6n de la metodolo- fa experimental en el marco de la LA. Ford y Hayes (1995) prese de la utilidad de la Prueba de Turing, Artificial Intelligence: The Very Idea, de John Haugeland (1985), muestra una ver- sién amena de los problemas pricticos y filoséficos de la IA. La ciencia cognitiva est bien descrita en varios textos recientes Johnson-Laird, 1988; Stillings et al., 1995; Thagard, 1996) y en la Encyclopedia of the Cognitive Sciences (Wilson y Keil, 1999), Baker (1989) cubre la parte sintéetiea de la linguistica moderna, y Chierchia y MeConnell-Ginet (1990) la semadntica, Jurafsky y Martin (2000) revisan la lingifstica computacional. una revisidn eritica Los primeros trabajos en el campo de la TA se citan en Computers and Thought (1963), de Feigenbaum y Feldman, en Seinantie Information Processing de Minsky, y en la serie Machine Intelligence, editada por Donald Michie, Webber y Nilsson (1981)INTRODCCION 35 y Luger (1995) han recogido una nutrida cantidad de artéculos influyentes. Los primeros articulos sobre redes neuronales estén reunidos en Neurocomputing (Anderson y Rosenfeld, 1988). La Encyclopedia of AI (Shapiro, 1992) contiene articulos de investi- zacion sobre pricticamente todos los temas de IA. Estos articulos son muy ttiles para iniciarse en las diversas dreas presentes en la literatura cien El trabajo més reciente se encuentra en las actas de las mayores conferencias de 1A: la International Joint Conference on Al (ICAL), de caracter bianual, la European Con- {ference on AI(BCA\), de carécter bianual, y la National Conference on Al, conocida nor malmente como AAAL por la organizaci6n que la patrocina. Las revistas cientificas que presentan aspectos generales de la LA mas importantes son Artificial Intelligence, Com- putational Intelligence, IEEE Transactions on Pattern Analysis and Machine Intelligence, IEEE Intelligent Systems, y la revista electr6nica Journal of Artificial Intelligence Re- search, Hay también numerosas revistas y conferencias especializadas en areas concre- tas, que se mencionarsin en los capitulos apropiados. La asociaciones profesionales de A mas importantes son la American Association for Artificial Intelligence (AAAD), la ACM Special Interest Group in Artificial Intelligence (SIGART), y la Society for Arti- ficial Intelligence and Simulation of Behaviour (AISB). La revista Al Magazine de AAAL contiene muchos articulos de interés general y manuales, y su pagina Web, aaai.org contiene noticias e informacién de referencia. EJERCICIOS El propésito de los siguientes ejercicios es estimular la discusién, y algunos de ellos se podrian utilizar como proyectos. Alternativamente, se podria hacer un esfuerzo inicial para solucionarlos ahora, de forma que una vez se haya lefdo todo el libro se pueda re- visar estos primeros intentos, LI Defina con sus propias palabras: (a) inteligencia, (b) inteligencia artificial, (c) agente. 1.2 Lea el articulo original de Turing sobre IA (Turing, 1950). En é1 se comentan al: gunas objeciones potenciales a su propuesta y a su prueba de inteligencia. ¢Cudle: estas objeciones tiene todavia validez? ;Son validas sus refutaciones? ;Se le ocurren nue~ 1 teniendo en cuenta los desarrollos realizados desde que se escribi6 el articulo? En el articulo, Turing predijo que para el alto 2000 seria probable que un computador tuviera un 30 por ciento de posibilidades de superar una Prueba de Turing dirigida por un evaluador inexperto con una duracién de cinco minutos. ;Con- sidera razonable lo anterior en el mundo actual? ;Y en los priximos 50 aos? vas objeciones a esta propues 1.3 Todos Jos aitos se otorga el premio Loebner al programa que lo hace mejor en una Prueba de Turing concreta, Investigue y haga un informe sobre el tltimo ganador del pr mio Loebner. ;Qué técnica utiliza? ;Cémo ha hecho que progrese la investigacisn en e campo de la 1A? 1.4 Hay clases de problemas bien conocidos que son intratables para los computadores, yotras clases sobre los cuales un computador no pueda tomar una decision, ;Quiere esto es imposible lograr la JA? decir que36 INTELIGENCIA ARTIFICIAL, UN ENFOQUE MODERNO 1.5 Supdngase que se extiende ANALOGY, el programa de Evans, como para aleanzar una puntuacidn de 200 en una prueba normal de cociente de inteligencia. ;Quiere decir lo anterior que se ha creado un programa més inteligente que un ser humano? Expliquese. 1.6 {Cémo puede la introspeccidn (revisidn de los pensamientos {ntimos) ser inexac- ta? {Se puede estar equivocado sobre lo que se cree? Diseiitase. 1.7 Consulte en [a literatura existente sobre la 1A si alguna de las siguientes tareas se puede efectuar con computadores: a) _Jugar una partida de tenis de mesa (ping-pong) decentemente. 4) Conducir un coche en el centro del Cairo. c) Comprar comestibles para una semana en el mercado. d) Comprar comestibles para una semana en la web, fe) Jugar una partida de bridge decentemente a nivel de competicidn, J) Descubrir y demostrar nuevos teoremas matematicos. 'g)Escribir intencionadamente una historia divertida, h) Ofrecer asesorfa legal competente en un drea determinada. i) Traducir inglés hablado al sueco hablado en tiempo real 4) Realizar una operacién de cirugéa compleja. En el caso de las tareas que no sean factibles de realizar en la actualidad, trate de describir cudles son las dificultades y calcule para cuando se podran superar 1.8 Algunos autores afirman que la percepcién y las habilidades motoras son la parte nds importante de la inteligencia y que las eapacidades de «alto nivel> son mas bien pa- rasitas (simples altadidos a las eapacidades bisicas). Es un hecho que la mayor parte de la evolucin y que ka mayor parte del cerebro se han concentrado en la percepcidn y kas habilidades motoras. en tanto Ta LA ha descubi I6gica resultan mas sencillas, Flo que tareas como juegos e inferencia muchos sentidos, que percibir y aetuar en el mundo sea {Considerarfa usted que ha sido un error la concentracién tradicional de la 1A en las ca pacidades cognitivas de alto nivel? 1.9 ;Por qué Ja evoluci6n tiende a generar sistemas que actian racionalmente? ;Qué objetivos deben intentar aleanzar estos sistemas? 1.10 (Son racionales tas acciones reflejas (como retirar la mano de una estufa caliente)? {Son inteligentes? 1.11 «En realidad los computadores no son inteligentes, hacen solamente lo que le di: cen los programadores». ¢ s clerta la itima aseveracién, € implica a la primera? 1.12 «din realidad los animales no son inteligentes, hacen solamente lo que le dicen sus genes». ,Es cierta la tltima aseveracién, e implica a la primera? 1.13. «Ein realidad los animales, los humanos y los computadores no pueden ser inte: ligentes, ellos sélo hacen fo que los tomos que los Forman les dictan siguiendo las leyes de la Fisica». ES cierta ka tiltima aseveracisn, e implica # la primera?Agentes inteligentes ———L TEE Donde se discutird la naturaleza de los agentes ideales, sus diversos habitats y tas formas de organizar los tipos de agentes existences. 21 Capitulo 1 identifica el concepto de agente racional como central en la perspectiva de la inteligencia artificial que presenta este libro. Esta nocién se concreta mas a lo Tar go de este capitulo, Se mostrar como el concepto de racionalidad se puede aplicar a una amplia variedad de agentes que operan en cualquier medio imaginable. En el libro, la idea es utilizar este concepto para desarrollar un pequeiio conjunto de principios de di seflo que sirvan para construir agentes ttiles, sistemas que se puedan Tamar razonablemente inteligentes. Se comienza examinando los agentes, los medios en los que se desenvuelven, y la interacci6n entre éstos. La observacién de que algunos agentes se comportan mejor que otros nos leva naturalmente a la idea de agente racional, aquel que se comporta tan bien como puede. La forma de actuar del agente depende de la naturaleza del medio; algunos habitats son mas complejos que otros. Se proporciona una categorizacién cruda del medio y se muestra eémo las propiedades de un habitat influyen en el disefio de a ne tes adecuados para ese entorno, Se presenta un niimero de «esquemas» basicos para el disefio de agentes, a los que se dard cuerpo a lo largo del libro, 2.1 Agentes y su entorno ieovonnmente Un agente es cualquier cosa capaz de percibir su medioambiente con la ayuda de sensores y actuar en ese medio utilizando actuadores', La Figura 2.1 ilustra esta idea sim- Se usteste tino para indicar el elemento gue reaceiona sun estimulo realizando una deci (del RD),38 INTELIGENCIA ARTIFICIAL, UN ENFOQUE MODERNO, sensor ‘vcuanon encePcion secure ne PencEPTORES Fumotin oes ace Porespeiones a1uatqure OIpay, Acciones Figura 2.1 Los agentes interactdan con el medioambiente mediante sensores y efectores, ple. Un agente humano tiene ojos, ofdos y otros drganos sensoriales ademas de manos, piernas, boca y otras partes del cuerpo para actuar. Un agente robot recibe pulsaciones del teclado, archivos de informacién y paquetes via red a modo de entradas sensoriales y actiia sobre ef medio con mensajes en e! monitor, escribiendo ficheros y enviando paquetes por la red. Se trabajard con la hipstesis general de que cada agente puede percibir sus propias acciones (pero no siempre sus efectos). El término percepcidn se utiliza en este contexto para indicar que el agente puede recibir entradas en cualquier instante. La secuencia de percepciones de un agente refleja el historial completo de lo que el agente ha recibido. En general, un agente tomard una decision en un momento dado dependiendo de la secuencia completa de per cepciones hasta ese instante. Si se puede especificar qué decisién tomaré un agente para cada una de las posibles secuencias de percepciones, entonces se habrié explicado mas ‘© menos todo lo que se puede decir de un agente, En términos matematicos se puede de- cirque el comportamiento del agente viene dado por la funei6n del agente que proyects una percepcién dada en una accién, La funcién que describe el comportamierito de un agente se puede presentar en forma de tabla: en la mayoria de los casos esta tabla seria muy grande (infinita a menos que se limite el tamaiio de la secuencia de percepciones que se quiera considerar), Dado un agente, con el que se quiera experimentar, se puede, en principio, construir esta ta bla teniendo en cuenta todas las secuencias de percepcidn y determinando qué accién lleva a cabo ef agente en respuesta’, La tabla es, por supuesto, una caracterizacién ex ierna del agente. Inicialmente, la funciGn del agente para un agente artificial se imple Sie agente seleeciona la acc de manera aleatoria entonces seria necesario probar cada Secuencia rau hus veces para identifica lt probabifidad de cada accidn, Se puede pensar que aetuar de manera aleatort. cs ridiculo. pero como se vera posteriormente puede ser muy inteligente‘PROGRAMA DEL oeNTE AGENTES INTELIGENTES 39) mentara mediante el programa del agente. Es importante diferenciar estas dos ideas. .a funcién del agente es una descripeiGn matemtica abstracta; el programa del agente cs una implementacién completa, que se cjecuta sobre la arquitectura del agente. Para ilustrar esta idea se utilizard un ejemplo muy simple, el mundo de la aspiradora presentado en la Figura 2.2, Este mundo es tan simple que se puede describir todo lo que en él sucede; es un mundo hecho a medida, para el que se pueden inventar otras va- riaciones. Este mundo en particular tiene solamente dos localizaciones: cuadricula A y B. La aspiradora puede percibir en qué cuadrante se encuentra y si hay suciedad en él Puede elegir si se mueve hacia la izquierda, derecha, aspirar la suciedad 0 no hacer nada. Una funcién muy simple para el agente vendria dada por: si la cuadricula en la que se encuentra esta sucia, entonces aspirar, de otra forma cambiar de cuadricula. Una muestra parcial de la funcidn del agente representada en forma de tabla aparece en Ia Figura 2.3. Un programa de agente simple para esta funcién de agente se mostrar posteriormente en la Figura 2.8. Figura 2.21 mundo de Ia aspiradora con dos localizaciones solamente. [Secuencia de percepeione Acciéin aneale Ot 1A, Limpio} Derecha 1A, Sucio| Aspirar 1B, Limpiol Iequierda 1B, Sucio| Aspinar IA. Limpio},{A, Limpio} Derecha TA, Limpio}, [A, Sucio} Aspirar (4, Limpia},[4, Limpio|, (A, Limo} Derecha 1A, Limpio},[A, Limpio} (A, Sucio] Aspirar | Figura2.3 Tabla parcial de una funcién de agente sencilla para el mundo de la aspiradora que muestra en la Figura 2.240 INTELIGENCIA ARTIFICIAL, UN ENEOQt MODERNO Revisando la Figura 2.3, se aprecia que se pueden definir varios agentes para el mundo de la aspiradora simplemente rellenando la columna de la derecha de formas distintas La pregunta obvia, entonces es: ,cudl es la mejor forma de rellenar wna tabla? En otras palabras, (qué hace que un agente sea bueno o malo, inteligente o estipido? Estas pre- ntas se responden en fa siguiente seccién Antes de terminar esta seccién, es necesario remarcar que la noci6n de agente es supuestamente una herramienta para el anilisis de sistemas, y no una caracterizaciGn ab soluta que divida el mundo entre agentes y no agentes. Se puede ver una calculadora de mano como un agente que elige la acci6n de mostrar «4» en la pantalla, dada la secuencia de percepciones «2 + 2 =», Pero este andlisis diffcilmente puede mejorar nuestro conocimiento acerca de las calculadoras. 2.2 Buen comportamiento: el concepto de racionalidad ee Racionst eooas o€ ewoimenro Un agente racional es aque! que hace lo correcto; en términos conceptuales, cada elemento de la tabla que define la funcién del agente se tendrfa que rellenar correctamente. Obvia- mente, hacer lo correcto es mejor que hacer algo incorrecto. pero qué significa hacer lo correcto? Como primera aproximacién, se puede decir que lo correct es aquello que per mite al agente obtener un resultado mejor. Por tanto, se nevesita determinar una forma de medir el éxito, Ello, junto a la descripeién del entorno y de los sensores y actuatdores del agente, proporcionard una especificacién completa de la tarea que desempefia el agente Dicho esto, ahora es posible definir de forma mais precisa qué significa la racionalidad, Medidas de rendimiento Las medidas de rendimiento incluyen los criterios que determinan el éxito en el comportamiento del agente, Cuando se sitda un agente en un medio, éste genera una secuencia de acciones de acuerdo con las percepciones que recibe. Esta se de acciones hace que su habitat pase por una secuencia de estados. Si la secuencia es la deseada, enton ces el agente habrif actuado correctamente. Obviamente, no hay una Gniea medic adecuada para todos los agentes, Se puede preguntar al agente por su opinidn subjetiva acerca de su propia actuacién, pero muchos agentes serfan incapaces de contestar, y otto» podrian engaitarse a si mismos’, Por tanto hay que insistir en la importancia de utilizar medidas de rendimiento objetivas, que normalmente determinaré el disefiador encargt do de la construccisn del agente. Si retomamos el ejemplo de la aspiradora de la seceitn anterior, se puede proponer utilizar como medida de rendimiento la cantidad de suciedad limpiada en un perfodo de ne Tos agent hhumanos son conocidos en particule por su savidez, hacen ereer que no quieren alge des pués de no baberlo podido conseguir, par ejemplo, «Ah bueno, de todas form no queria ee estapie Pie ini Nobeltsciou oe GENTE RACIONAL AGENTES INTELIGENTES 4 ocho horas. Con agentes racionales, por supuesto, se obtiene lo que se demanda, Un ager te racional puede maximizar su medida de rendimiento limpiando la suciedad, tirando Ja basura al suelo, limpisindola de nuevo, y asf sucesivamente, Una medida de rendimiento mis adecuada recompensaria al agente por tener el suelo limpio. Por ejemplo, podria ga- har un punto por cada cuadricula limpia en cada periodo de tiempo (quizas habria que incluir algtin tipo de penalizacién por la electricidad gastada y el ruido generado). Como regla general, es mejor disenar medidas de wilidad de acuerdo con lo que se quiere para el entorno, mis que de acuerdo con cémo se erce que el agente debe comportarse il. Por ejemplo, Ja nocidn de «suelo limpio» del parrafo anterior est basada en un nivel de limpieza medio a Jo largo del tiempo. Ademas, este nivel medio de limpieza se puede alcancar de dos formas diferentes, llevando a cabo una limpieza mediocre pero continua o limpiando en profundidad. pero realizando largos descansos, La forma més adecuada de hacerlo puede venir dada por la opinién de un encargado de la limpieza profesional, pero en realidad s una cuestidn filoséfica profunda con fuertes implicaciones. ,Qué es mejor, una vida temeraria con altos y bajos, 0 una existencia segura pero aburrida? {Qué es mejor, una economia en la que todo el mundo vive en un estado de moderada pobreza o una en Ta que algunos viven en la abundancia y otros son muy pobres? Estas cuestiones se dejan como ejercicio para los lectores diligentes. La seleccién de la medida de rendimiento no es siempre f Racionalidad La racionalidad en un momento determinado depende de cuatro factores: + La medida de rendimiento que define el criterio de 21 conocimiento del medio en el que habita acumulado por el agente. to. + Las acciones que el agente puede Hevar a cabo. + La secuencia de percepciones del agente hasta este momento. Esto nos Heva a la definicién de agente racional En cada posible secuencia de pervepciones, un agente racional deberd emprender aque Ha accivin que supuestamente maximice su medida de rendimiento, bastindose en las evi denvias aportadas por la secucncia de percepciones y en el conocimiento que el agente maniene almacenado. Considerando que el agente aspiradora limpia una cuadricula si esta sucia y se mueve a la otra si no lo esta (ésta es Ja funcidn del agente que aparece en Ia tabla de la Figu- ra 2.3), ;se puede considerar racional? ;Depende! Primero, se debe determinar cual es Ja medida de rendimiento, qué se conoce del entorno, y qué sensores y actuadores tiene el agente, Si asumimos que + La medida de rendimiento premia con un punto al agente por cada recuadro limpio cn un periodo de tiempo conereto, a lo largo de una «vida» de 1,000 perfodos. + La «geogratia» del medio se conoce a priori (Figura 2.2), pero que la distribueign I del agente no se conocen, Lay cuadriculas se mantienen limpias y aspirando se timpia la cuadricula en que se encuentte el agente. Las aeciones /sgnierda y Derecha mueven al agente hacia la izquierda y de Ta suciedad y la localizaci6n inie'42 INTELIGENCIA ARTIFICIAL, UN ENFOQUE MODERNO, omwisciencn derecha excepto en el caso de que ello pueda llevar al agente fuera del recinto, en este caso el agente permanece donde se encuentra. + Las tinicas acciones permitidas son Izquierda, Derecha, Aspirar y NoOp (no hacer nada). + Elagente percibe correctamente su localizacién y siesta localizac ciedad. 6n contiene su Puede afirmarse que bajo estas circunstancias el agente es verdaderamente racional; el rendimiento que se espera de este agente es por lo menos tan alto como el de cualquier otro agente. El Ejercicio 2.4 pide que se pruebe este hecho. Facilmente se puede observar que el agente puede resultar irracional en circunstancias diferentes, Por ejemplo, cuando toda la suciedad se haya eliminado el agente osci- lard innecesariamente hacia delante y atrds; si la medida de rendimiento incluye una pe nalizacién de un punto por cada movimiento hacia la derecha e izquierda, la respuesta del agente sera pobre. Un agente mas eficiente no hard nada si estd seguro de que todas las cuadriculas estan limpias. Si una cuadricula se ensucia de nuevo, el agente debe iden- tificarlo en una de sus revisiones ocasionales y limpiarla. Si no se conoce la geografia del entorno, el agente tendré que explorarla y no quedarse parado en las cuadriculas A y B. El Ejercicio 2.4 pide que se disefien agentes para estos casos, Omnisciencia, aprendizaje y autonomia Es necesario tener cuidado al distinguir entre racionalidad y omnisciencia, Un agente “omnisciente conoce el resultado de su accién y actia de acuerdo con él; sin embargo, en realidad la omnisciencia no es posible. Considerando el siguiente ejemplo: estoy pa- seando por los Campos Eliseos y veo un amigo al otro lado de la calle. No hay tritico alrededor y no tengo ningin compromiso, entonces, actuando racionalmente, comenzaria acruzar la calle. Al mismo tiempo, 2 33.000 pies de altura, se desprende la puerta de un avin’, y antes de que termine de cruzar al otro lado de la calle me encuentro aplastado. {Fue irracional cruzar la calle? Serfa de extrafiar que en mi nota necrol6gica apareciera «Un idiota intentando eruzar la calle». Este ejemplo muestra que la racionalidad no es lo mismo que fa perfecci6n, La ra- cionatidad maximiza el rendimiento esperado, mientras ta perfeccién maximiza el resul tado real, Alejarse de:la necesidad de la perfeccidn no es solo cuestidn de hacer justicia con los agentes. EI asunto es que resulta imposible disefiar un agente que siempre Heve a cabo. de forma sucesiva, las mejores acciones después de un acontecimiento, a menos que se haya mejorado el rendimiento de las bolas de cristal o las maquinas de tiempo. La definicién propuesta de racionalidad no requiere omnisciencia, ya que la eleccin racional depende s6lo de la secueneia de percepeidn hasta la fecha. Es necesario ase~ gurase de no haber permitido, por descuido, que el agente se dedique decididamente evar a cabo acciones poco inteligentes. Por ejemplo, si el agente no mirase a ambos ke dos de la calle antes de cruzar una calle muy concurrida, entonces sui secuencia de pet " Veuve N. Henderson, «New door latches urged lor Boeing 747 jumbo jets» (es urgente dotar de nue cerraduras alas puertas de los Boeing jumbo 747), Washington Post, 24 de agosto de 1989.‘ECOPLACION OF ‘FORIUCION exptonscion peaewoie svroxowla AGENTES INTELIGENTES 43 cepcidn no le indicaria que se esta acercando un gran camidn a gran velocidad. ;La definicién de racionalidad nos esté indicando que esté bien cruzar la calle? ;Todo locon- ratio! Primero, no seria racional cruzar la calle s6lo teniendo esta secuencia de per cepciones incompleta: el riesgo de accidente al cruzarla sin mirar es demasiado grande. Segundo, un agente racional debe elegir la accién de «mirar» antes de intentar cruzar la calle, ya que ef mirar maximiza ef rendimiento esperado. Llevar a cabo acciones con la intencién de modificar percepciones futuras, en ocasiones proceso denominado reco- pilacién de informaci6n, es una parte importante de la racionalidad y se comenta en profundidad en el Capitulo 16. Un segundo ejemplo de recopilacién de informacién lo proporciona la exploracién que debe llevar a cabo el agente aspiradora en un medio inicialmente desconocido, La definicién propuesta implica que el agente racional no sélo recopile informacién, sino que aprenda lo maximo posible de lo que esté percibiendo. La configuracién ini cial del agente puede reflejar un conocimiento preliminar del entomo, pero a medida que el agente adquiere experiencia éste puede modificarse y aumentar. Hay casos excepcio- nales en los que se conoce totalmente el entorno a priori. En estos casos, el agente no necesita percibir y aprender; simplemente acttia de forma correcta, Por supuesto, estos agentes son muy frigiles. Considérese el caso de! humilde escarabajo estercolero. Des- pués de cavar su nido y depositar en él su huevos, tomé una bola de estiércol de una pila cercana para tapar su entrada, Si durante el trayecto se le quita la bola, el escarabajo continuard su recorrido y hard como si estuviera tapando la entrada del nido, sin tener la bola y sin darse cuanta de ello, La evolucién incorporé una s en la conducta del escarabajo, y cuando se viola, el resultado es un compor satisfactorio. La avispa cavadora es un poco més inteligente, La avispa hembra cavaré una madriguera, saldra de ella, picard a una oruga y la Hevard a su madriguera, se introduciré en la madriguera para comprobar que todo esté bien, arrastrard fa oruga hasta el fondo y pondra sus huevos. La oruga servira como fuente de alimento cuando Jos huevos se abran, Hasta ahora todo bien, pero si un entomdlogo desplaza la oruga unos centimetros yera cuando la avispa esté revisando la situaciGn, ésta volverd a la etapa de «arrastre» que figura en su plan, y continuard con el resto del plan sin modificacién alguna, incluso después de que se intervenga para desplazar la oruga. La avispa cavadora no es capaz de aprender que su plan innato esté fallando, y por tanto no Io cambiard. Los agentes con éxito dividen las tareas de calcular la funcién del agente en tres periodos diferentes: cuando se esté diseftando el agente, y estén los diseftadores encar- gados de realizar algunos de estos cilculos; cuando esté pensando en la siguiente opera- cidn, el agente realiza mas cileulos; y cuando esté aprendiendo de la experiencia, el agente lleva a cabo més ealculos para decidir cémo modificar su forma de comportarse. Se dice que un agente carece de autonomia cuando se apoya més en el conocimiento inicial que le proporciona su diseiiador que en sus propias percepciones. Un agente racional debe ser autGnomo, debe saber aprender a determinar cémo tiene que compensar el conocimiento incompleto o parcial inicial. Por ejemplo, el agente aspiradora que aprenda a prever dOnde y cuindo aparecerd suciedad adicional lo hari mejor que otro que no aprenda, En la practica, pocas veces se necesita autonomfa completa desde el comienzo: cuando el agente haya tenido poca 6 ninguna experiencia, tendra que actuar de forma aleatoria a menos que el disefiador le haya proporcionado ayuda, Asi, de la44 INTELIGENCTA ARTIFICIAL, UN ENFOQUE MODERNO misma forma que la evolucién proporciona a Jos animales s6lo los reactivos necesarios para que puedan sobrevivir lo suficiente para aprender por ellos mismos, serfa razonable proporcionar a fos agentes que disponen de inteligencia artificial un conocimiento inicial, asi como de la capacidad de aprendizaje. Después de las suficientes experiencias interaccionando con el entorno. el comportamiento del agente racional ser efecti- vamente independiente del conocimiento que posefa inicialmente, De ahi, que la incor- poracisn del aprendizaje facilite el disefto de agentes racionales individuales que tendrin éxito en una gran cantidad dle medios. 2.3. La naturaleza del entorno ‘eoRN0s oF TRARAID eas Ahora que se tiene una definicién de racionalidad. se esta easi preparado para pensar en la construccién de agentes racionales. Primero, sin embargo, hay que centrarse en los entornos de trabajo, que son esencialmente los «problemas» para los que los agentes racionales son las «soluciones». Para ello se comienza mostrando eémo especificar un entorno de trabajo, ilustrando el proceso con varios ejemplos, Posteriormente se mos- trard que el entorno de trabajo oftece diferentes posibilidades, de forma que cada una de las posibilidades influyen directamente en el disefio del programa del agente Especificacién del entorno de trabajo En Ia discusién de la racionalidad de un agente aspiradora simple, hubo que especificar Jas medidas de rendimiento, el entorno, y los actuadores y sensores del agente, Todo ello forma lo que se Hama el entorno de trabajo, para cuya denominacisn se utiliza el acronimo REAS (Rendimiento, Entorno, Actuadores, Sensores), En el disenio de un agen: te, el primer paso debe ser siempre especificar el entorno de trabajo de ta forma mais completa posible El mundo de la aspiradora fue un ejemplo simple: considérese ahora un problema mas complejo: un taxista automatico. Este ejemplo se utilizard a lo largo del capitulo. Antes de alarmar al lector, conviene aclarar que en la actualidad la construccién de un taxi automatizado esti fuera del alcance de la tecnologia actual. Véase en la piigina 31 la descripeidn de un robot conductor que ya existe en la actwalidad, o Tea las actas de ka conferencia Intelligent Transportation Systems. La tarea de conducir un automévil, en su (otalidad, es extremadamente ilinitada. No hay limite en cuanto al ntimero de nuevas combinaciones de circunstancias que pueden surgir (por esta razén se eligi esta actividad en la presente discusisn). La Figura 2.4 resume la descripeién REAS para el en torno de trabajo del taxi. El préximo parrafo explica cada uno de sus elementos en mas detalle. Primero, ;cusl es el entorno de trabajo en el que el taxista automation aspira a con- ducit?? Dentro de las cuatlidades deseables que deberfa tener se incluyen el que Hegue al destino correcto: que minimice el consumo de combustible; que minimice el tiem. po de viaje y/o coste: que minimice el nimero de infracciones de trilivo y de moles- tias a otros conductores: que maximice kt seguridad, lt comodidad det pasajero y elAGENTES INTELIGENTES 48 Aewadures | Senses “joe Camas, sonar Entorno Carreteras, Dirveciin } otro iatico, aacelerador peatones, freno, seta, bocina, visualizador lee veloeimetto, GPS, tacomett. visuatizador de laacele del ber Tipo de agente : Seguro, ripid, | clientes eficio sensores del motor, teclado, un taxista automa beneficio. Obviamente, alguno de estos abjetivos entran en conflicto por lo que habra gue Megar a acuerdos. Siguiente, ;cuil es el entorno en el que se encontrard el taxi? Cualquier taxista debe estar preparado para circular por distintas earreteras, desde caminos rurales y calles ur banas hasta autopistas de 12 carriles, En las carreteras se pueden encontrar con trifico, peatones, animales, obras, coches de policia, charcos y baches. El taxista también tie ne que comunicarse tanto con pasajeros reales como potenciales. Hay también elecciones opcionales. El taxi puede operar en California del Sur, donde la nieve es raramente un problema, 0 en Alaska, donde raramente no lo es. Puede conducir siempre por la derecha, o puede ser Io suficientemente flexible como para que circule por la izquierda cuando se encuentre en ef Reino Unido o en Japon, Obviamente, cuanto mas restringido esté el entono, mis féeil sera el problema del diseiio, Los actuadores disponibles en un taxi automitico sersin mas 6 menos los mismos que Jos que tiene a st alcance un conductor humano: el control del motor a través del acelerador y control sobre la direcci6n y los frenos. Ademas, necesitard tener una pantalla de visualizaci6n o un sintetizador de voz. para responder los pasajeros, y quizas algdn mecanismo para comunicarse, educadamente 0 de otra forma, con otros vehiculos. Para aleanzar sus objetivos en el entorno en el que circula, el taxi necesita saber dénde estd, qué otros elementos estan en ki carretera, y a qué velocidad circula, Sus sensores basicos deben, por tanto, incluir una o mas cmaras de televisiGn dirigidas, un veloef metro y un (acdmetro, Para controlar el vehiculo «decuadamente, especialmente cn las: curvas. debe tener un acelerador; debe conocer el estado mecdnico del vwehicuto, de forma que necesitard sensores que controlen ef motor y el sistema eléetrico, Debe tener instrumentos que no estén disponibles para un conductor medio: un sistema de posicio- namiento global via satélite (GPS) para proporcionarle informacién exacta sobre su posicién con respecto a un mapa eleetrSnico, y sensores infrarrojos © sonares. para detectar las distancias con respecto a otros coches y obstéculos. Finalmente, necesitard un teclado 0 micréfono para que el pasajero le indique su destino. La Figura 2.5 muestra un esquema con Jos elementos REAS basics para diferentes clases de agentes adicionales. Mis ejemplos aparecersin en el Ejercicio 2.5, Puede Sorprender a algunos lectores que se incluya en fa lista de tipos de agente algunos pro- grtmas que operan en la fotalidad del entorno artificial definido por las entradas del teclado y tos caracteres imps sos.en ef monitor, «Seguramente», nos podamos presun-

Inteligencia Aritificial. Un Enfoque Moderno (2da Edición) - Stuart J. Russell y Peter Norvig

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Inteligencia Aritificial. Un Enfoque Moderno (2da Edición) - Stuart J. Russell y Peter Norvig

Cargado por

Copyright:

Formatos disponibles

También podría gustarte