Lenguaje Natural: Descripción de las Etapas para su Tratamiento Alejandro Peña Ayala

INSTITUTO POLITÉCNICO NACIONAL

Alejandro Peña Ayala

Cursó la licenciatura en Informática en la UPIICSA del IPN. Posteriormente obtuvo el Diplomado en Java y Aplicaciones Web en el ITAM, la Especialidad y la Maestría en Inteligencia Artificial en la Fundación Arturo Rosenblueth. Actualmente es candidato al grado de Doctor en Ciencias de la Computación por el Centro de Investigación en Computación del IPN, contando para ello del respaldo del CONACYT y del IPN a través de una beca. Entre sus distinciones académicas están: El haberse titulado por la opción de escolaridad en 1981, conforme al reglamento del IPN. El reconocimiento hecho por el CONCACYT y el Diario de México en el evento: “Los mejores estudiantes de México generación 1981”, como el mejor estudiante en la Licenciatura en Informática del IPN. Además de haber obtenido el grado de de Maestría en Inteligencia Artificial con mención honorífica. A la par de su desarrollo académico, Alejandro Peña ha ejercido la carrera magisterial, profesional, de investigación y ministerial. En 1981 ingresó a la planta docente de la UPIICSA, donde actualmente es profesor titular C e investigador. Durante el lapso 1989-1994 ofreció cátedra en la Maestría en Sistemas Computacionales del ITESM-CEM. Además de haber hecho lo propio en las Maestrías en Sistemas de Información y Ciencias de la Computación en la Fundación Arturo Rosenblueth. En el ámbito profesional de la Informática, desde 1978 se ha desenvuelto en los sectores privado, público, bancario y empresarial, desempeñando cargos como: Programador, analista y líder de proyecto en la entonces Secretaría de Comercio. Jefe de Soporte Técnico en el (desaparecido) Instituto Mexicano de Comercio Exterior. Subdirector de Sistemas en la Secretaría de Salud. Subgerente de Proyectos Especiales en el Banco Nacional de Comercio Exterior. Coordinador de Sistemas en Banamex. Fue fundador y Director General de la empresa Neuralware, dedicada a las Tecnologías de la Información. Como resultado de sus estudios doctorales orientados al ámbito de la Educación basada en Web, ha publicado: varios Reportes Técnicos, y presentado diversos trabajos en congresos nacionales e internacionales celebrados en ciudades de cuatro continentes, como por ejemplo: Washington-USA., Vancouver Canáda, Melbourne Australia, Bensaçon – Francia, Grindelwald – Suiza, y Bali – Indonesia. Las memorias de sus artículos han sido editadas por organizaciones como IEEE y Springer. Así mismo es autor de una colección de libros relacionados con la Informática y la Inteligencia Artificial. Actualmente, Alejandro Peña es Apóstol y Director General del World Outreach Light to the Nations Ministries (WOLNM), cuya visión es la formación de discípulos, mediante el uso de las Tecnologías de la Información y del Conocimiento, a nivel mundial dedicados a predicar el Evangelio. Por sus ocupaciones académicas, profesionales y ministeriales, Alejandro Peña ha tenido la oportunidad de visitar diversos países y regiones del mundo, amén de haber arribado a sitios extremos del planeta como: La Antártida, el océano glaciar Ártico, y el centro del desierto de Australia. También ha explorado islas exóticas como Hawai, Tahití, y Rarotonga; y otras remotas como Spitsbergen y Baffin. A raíz de tales experiencias, Alejandro Peña ofrece el testimonio de las maravillas naturales que Dios ha hecho en el mundo para deleite del ser humano, y en particular de sus hijos que son salvos a través de Jesucristo y llenos de su Espíritu Santo, quien les anima a clamar: ¡Abba, Padre!

Lenguaje Natural: Descripción de las Etapas para su Tratamiento

.

México - .Lenguaje Natural: Descripción de las Etapas para su Tratamiento Alejandro Peña Ayala INSTITUTO POLITÉCNICO NACIONAL .

Centro Histórico. Alejandro Peña Ayala INSTITUTO POLITÉCNICO NACIONAL Dirección de Publicaciones Revillagigedo 83.F. 06070.PRIMERA EDICIÓN 2006. D. © 2006. México. D. ISBN: 970-94797-3-3 Impreso en: México / Printed in México .R.

Así mismo.El autor reconoce que esta obra ha sido inspirada de manera especial por su Padre. el trabajo es el resultado de su experiencia profesional. Hermano Jesús y Consolador como parte de los proyectos de investigación de World Outreach Light to the Nations Ministries (WOLNM). . como investigador y docente en la Unidad Profesional Interdisciplinaria de Ingeniería y Ciencias Sociales y Administrativas (UPIICSA) del Instituto Politécnico Nacional (IPN) y fruto del desarrollo de su tesis doctoral en el Centro de Investigación en Computación del Instituto Politécnico Nacional.

.

PRÓLOGO .

.

Por tal motivo. En este ejemplar. se evitan los problemas de ruido y reconocimiento de patrones característicos del ambiente normal de comunicación entre seres vivos. se aborda el tratamiento de lenguaje natural que es alimentado al computador a través de un periférico como el teclado. Además de tratar la interpretación y la generación del lenguaje. técnicos y estructuras de datos que se recomiendan emplear para el desarrollo de aplicaciones destinadas al tratamiento del lenguaje natural por un sistema de cómputo. su tratamiento por medio de sistemas de cómputo. Dada la naturaleza del lenguaje natural. Al estar reasentado el texto en forma magnética. Para ello las personas se valen de una serie de convenciones fonéticas y visuales que hacen posible el entendimiento. Los análisis lexicográficos. sintácticos y semánticos.El lenguaje natural es una de las manifestaciones de la capacidad cognitiva del ser humano en la que da curso a la exteriorización de sus pensamientos a sus semejantes. A lo largo del material se exponen las actividades. . constituye un reto de investigación y desarrollo. el material que se presenta en esta edición se compone de seis capítulos en los que se abordan los temas de: Naturaleza del lenguaje natural.

TABLA DE CONTENIDO
INTRODUCCIÓN 3 1. ÁMBITO DEL LENGUAJE NATURAL ..................................................................................................................7

1.1 PERFIL.................................................................................................................................. 7 1.2 ÁREAS DE ESTUDIO.......................................................................................................... 7 1.2.1 Lingüística ...................................................................................................................... 7 1.2.2 Psicología ....................................................................................................................... 9 1.2.3 Filosofía .......................................................................................................................... 9 1.2.4 Neurociencias ............................................................................................................... 11 1.2.5 Comunicación Social.................................................................................................... 13 1.3 RAMAS DE INVESTIGACIÓN......................................................................................... 13 1.3.1 Comprensión del Lenguaje Natural Escrito ................................................................. 13 1.3.2 Diálogo Sonoro............................................................................................................. 14 1.4 DESARROLLOS ................................................................................................................ 14 1.5 APLICACIONES Y PROGRAMAS .................................................................................. 16 1.6 REPRESENTACIÓN .......................................................................................................... 16 1.6.1 Representación.............................................................................................................. 16 1.6.2 Mapeo ........................................................................................................................... 17 1.6.3 Nivel de Interacción entre los Componentes................................................................ 18 1.7 ETAPAS EN EL PROCESAMIENTO ............................................................................... 18
2. ANÁLISIS LÉXICO 25

2.1 DESCRIPCIÓN ................................................................................................................... 25 2.2 LENGUAJE......................................................................................................................... 25 2.2.1 Alfabeto ........................................................................................................................ 25 2.2.2 Morfología .................................................................................................................... 26 2.2.3 Diccionario ................................................................................................................... 28 2.2.4 Unidades Léxicas.......................................................................................................... 28 2.3 PROCEDIMIENTO ............................................................................................................ 30 2.4 ADMINISTRACIÓN DE ERRORES ................................................................................. 33 2.5 DESARROLLO................................................................................................................... 34
3. ANÁLISIS SINTÁCTICO .......................................................................................................................................37

3.1 DESCRIPCIÓN DEL ANÁLISIS SINTÁCTICO .............................................................. 37 3.2 ELEMENTOS ..................................................................................................................... 37 3.2.1 Gramáticas .................................................................................................................... 37 3.2.2 Redes de Transición...................................................................................................... 38 3.2.3 Parsers........................................................................................................................... 41 3.3 TEORÍAS DE CHOMSKY ................................................................................................. 42 3.4 REDES DE TRANSICIÓN AUMENTADAS (RTA) ........................................................ 47 3.5 DESARROLLO DEL MÓDULO SINTÁCTICO............................................................... 51
4. ANÁLISIS SEMÁNTICO........................................................................................................................................57

4.1 NATURALEZA .................................................................................................................. 57 4.2 ELEMENTOS ..................................................................................................................... 57 4.2.1 Contexto ....................................................................................................................... 57 4.2.3 Relación ........................................................................................................................ 58 4.3. ESTUDIO DE GRAMÁTICAS SEMÁNTICAS............................................................... 58 4.3.1 Teoría Semántica .......................................................................................................... 58

4.4 GRAMATICAS CASE ....................................................................................................... 62 4.5 REDES SEMÁNTICAS ...................................................................................................... 65 4.5.1 Búsqueda ...................................................................................................................... 66 4.5.2 Representación de Predicados no Binarios................................................................... 66 4.5.3 Distinciones Importantes .............................................................................................. 68 4.5.4 Herencia Simple ........................................................................................................... 69 4.5.5 Herencia Múltiple......................................................................................................... 69 4.5.6 Excepciones .................................................................................................................. 70 4.6 DEPENDENCIA CONCEPTUAL...................................................................................... 70 4.6.1 Argumentos para la Representación en CD.................................................................. 72 4.7 CONSTRUCCIÓN DEL MÓDULO SEMANTICO ......................................................... 73
5. COMPRENSIÓN 79

5.1 PERFIL................................................................................................................................ 79 5.2 PROCESO ........................................................................................................................... 79 5.3 DESCRIPCIÓN DEL ANÁLISIS PRAGMÁTICO ........................................................... 80 5.4 TÉCNICAS.......................................................................................................................... 83 5.5.1 Empleo de la Atención ................................................................................................. 83 5.5.2 Modelo de Creencias .................................................................................................... 83 5.5 ANÁLISIS DEL MÉTODO DE DIRECCIÓN POR METAS............................................ 85 5.6 GUIONES............................................................................................................................ 86 5.6.1 Representación de conocimiento .................................................................................. 86 5.6.2 Razonamiento ............................................................................................................... 88 5.6.3 Ventajas y Desventajas................................................................................................. 89 5.7 COMPRENSIÓN DE HISTORIAS .................................................................................... 89 5.7.1 Interés ........................................................................................................................... 89 5.7.2 Comprensión de Historias ............................................................................................ 90 6.8 CREACIÓN DE UN INTERPRETADOR.......................................................................... 90
6. GENERACIÓN DE LENGUAJE ............................................................................................................................95

6.1 CONSIDERACIONES........................................................................................................ 95 6.2 PROCEDIMIENTO ............................................................................................................ 95 6.3 USO DE PLANTILLAS...................................................................................................... 96 6.4 MODELOS DE GENERACIÓN ........................................................................................ 98 6.5 PROCEDIMIENTO INVERSO .......................................................................................... 99 6.6 EXPRESIONES ................................................................................................................ 100 6.7 CREACIÓN DE UN MODELO ....................................................................................... 101
CONCLUSIONES REFERENCIAS 109 113

................................ 67 Figura 40.............. ................................................................................................ 31 Figura 11... ........................................................................................ . RTEF de una Gramática del Inglés................... Red Semántica n-aria.......................... 68 Figura 42...... 59 Figura 30................... Tipos de Mapeo....... 17 Figura 4............. Representación de Comparaciones......................... Ejemplo de Distinguidores....................... 64 Figura 35................ Oración en Voz Activa... Esquema de un Sistema de Lenguaje Natural......................................................................................................... 12 Figura 3............................................................................... 64 Figura 36................................................. Oración por Medio de una Gramática Case............. 59 Figura 28.......................................................................................................................................................................................................................... 42 Figura 18.......... 40 Figura 16............................ Frases Emitidas por una Semántica Generativa...................... Gramática...... Procedimiento de Entrada del Analizador Léxico.... Procedimiento de Salida del Analizador Léxico.............................................................................................. Programa para Gramática tipo RTA.............. 41 Figura 17.................... Herencia Simple.............................................................. Atributos de los Símbolos de un Frase Marcada... Rutas Amalgamadas para Interpretar una Oración......... Marcadores Usados en la Teoría Semántica............................. 68 Figura 43................ Desarrollo de una Gramática Transformacional. RTEF para una Gramática.............. Funcionamiento de la Teoría de Sintaxis....... Marcadores Semánticos................................................ .................... . ...... 44 Figura 20...... 68 Figura 44........................ Red Semántica Relacional............ ........ Ciclo del Analizador Léxico.............. 61 Figura 32......... RTEF no Determínistica........................................................... ..................................... .............................. 67 Figura 41..............................................................................TABLA DE FIGURAS Figura 1............... Relación de Entidades............ RTEF para una Simple Gramática... Frases Marcadas por una Semántica Generativa................ .................................. Conjugación de Oraciones de una Gramática Transformacional................... 39 Figura 15..................... 25 Figura 9............. 46 Figura 22......... 53 Figura 26.......................... Estructura de Frase........................................................................ Aplicación de Unidades Léxicas............................ 65 Figura 38............................ 62 Figura 33.............. Gramática Libre de Contexto......................................................... .................. Contexto de un Lenguaje.................................... 20 Figura 8.............. ........................................................................................................... ............................................. Expresión Arborescente. .. 7 Figura 2.. .. 39 Figura 14............................................................................... .... 52 Figura 25............... 60 Figura 31.. Oración en Voz Pasiva................................................................................. ................................................................................ ..................................................... 32 Figura 12........................................... 29 Figura 10............................................ Regiones Cerebrales Responsables del Lenguaje..................................................... Representación de Objetos.............................. Interacción entre los Componentes de una Oración..... 69 .................... Evolución de un Sistema de Lenguaje Natural.................................. ................ 20 Figura 7...................................................................................... Composición del Ser Humano................................ 37 Figura 13................ ............................ ............. ......... 47 Figura 23.................................. Red Semántica Binaria....................... ........................... ................................................... Árbol de Traducción......... .......................... 45 Figura 21.................... 19 Figura 6.......... Oración Positiva Expresada Medio de Case Frame................................ .......................... .............. 59 Figura 29...... 58 Figura 27........................................ 50 Figura 24... 18 Figura 5.................................... 63 Figura 34..................... 66 Figura 39............................................. 64 Figura 37........................................................................................ Estructura Ligada para una Frase....................................................... Oración Negativa Expresada por Medio de Case Frame..... 44 Figura 19.....................................................................

..................................................... ....................................... 105 . 101 Figura 72..................................................... Generación de Significado para una Frase.................... 97 Figura 65.... 102 Figura 73..... Resultados del Análisis Sintáctico.............. Causa-Efecto de Eventos y Estados................................................ .................. Representación de Estados Mentales....................................................... Representación de la Dependencia Conceptual............................................................ Esquema de un Sistema de Lenguaje Natural....................... 73 Figura 50......................................................................... 79 Figura 53........................................................... ... .. 101 Figura 70......... 98 Figura 66............................ 99 Figura 68. 101 Figura 71... Terminación y Correlación........................ Significado Parcial de una Oración................................................ Abstracción de Perspectivas en Niveles...................... Estructura de Frames............................. 91 Figura 60................ 97 Figura 63 Template de la Oración...................... Un Acto Provoca la Ejecución de Otro............................ 82 Figura 57. Exposición de Respuesta del Intérprete.................... Inferencia........................................ 91 Figura 61.............. 99 Figura 67...................... 80 Figura 54...................... ........... Generación de Significado para una Frase......... Relación de Cambios de Estado...................... Flujo de Generación de Lenguaje............................................... 81 Figura 55.................. 74 Figura 51............... 100 Figura 69...... . 104 Figura 79... Perspectivas que Involucran Eventos Positivos........................................................................................... Instancias de Eventos que Terminan en Relación o Acto........................................................ 87 Figura 59. Estados Mentales Ligados por Inicio........................ Interpretación de Textos Fuente.................... Generación de Lenguaje.............. .. ..................................................................... 96 Figura 62.............. ....................................... ................................ 102 Figura 74... 104 Figura 78................................................................................................................................................ Red Semántica Particionada.. Representación de la “intención” de una oración.. Ejemplo de Perspectivas........................... Historia del Regalo de Juan a María .................................................. ... Asociación de Situaciones Diversas por Medio de Eventos....... .............. 97 Figura 64.............................................................. 72 Figura 49................................................. 70 Figura 48.............................................................................................................................................. Base de Conocimientos basada en Frames............................................................ ................ Representación de Excepciones ...... .............. Abstracción a un Mayor Nivel mediante Unidades........ 84 Figura 58................................... 70 Figura 47... 69 Figura 46................................................................................ Modelo de Oración por medio de Frames...... 75 Figura 52.......................................................................................................................................... ................................ ............................. 81 Figura 56...... 102 Figura 75...... 103 Figura 76............................................................ Herencia Múltiple...............Figura 45............................................. Un Acto Implica la Ejecución de Otros...... 103 Figura 77.. Dependencia Conceptual........ .................... Uso de los Tiempos Conceptuales........................................................................ ..... ............... Guión del Restaurante............................................................

........................... 28 Tabla 11................ Formato de Diccionario........ Comparativos....................................................... Derivados Irregulares........................ 26 Tabla 5.................... ..................................................... 28 Tabla 10................................................... Formato de la Estructura Temporal Fuente.............. Formato de la Estructura Temporal Fuente..................................................................................................................................... 27 Tabla 6.................... 17 Tabla 2.............. 27 Tabla 9............... ................................................... Uso de Tiempos........................... 30 Tabla 13.. Limitaciones y Ventajas de los Lenguajes...........LISTA DE TABLAS Tabla 1................................... Generación de Raíces Incorrectas........ ................................. .......................................................................... 29 Tabla 12...................................... Opciones de Género y Número........................ 27 Tabla 7..................... Formato de la Unidad Léxica.............................. Tipo de Organización y Acceso ...... Alfabeto de la Lengua Castellana...................... 26 Tabla 4.................................................................................................. .... ......... ..................... 51 .................................................. 25 Tabla 3................................................... Ejemplos de Palabras Compuestas............. 27 Tabla 8...................................... .....................................

.

INTRODUCCIÓN .

.

entre los que destaca el Informático que aparto un conocimiento valioso. lo cual ha motivado a profundizar en el uso de instrumentos y tecnologías que tiendan a emular el diálogo natural entre los usuarios sin menoscabo que uno de los participantes sea una máquina. obligan a los sectores productivos de los países a invertir en el desarrollo. Por tal motivo. Las tendencias mundiales de automatización. las etapas para el proceso del lenguaje natural y se concluye con una serie de observaciones para la creación de esta clase de aplicaciones. Por tanto. cultures y domésticas del ser humano. gracias a los beneficios que brindan en el tratamiento de información de una manera confiable.INTRODUCCIÓN Los sistemas de cómputo se han convertido en una herramienta para el desempeño de labores profesionales. Para crear este tipo de proyectos se requiere la intervención de varios campos especializados. producción e implementación de bienes con un alto nivel de contenido tecnológico. Proveer un vehículo de comunicación sencillo y natural entre el operador y el sistema ha sido un factor determinante de éxito de estas aplicaciones. Para enriquecer y facilitar la investigación y desarrollo de este clase de aplicaciones. globalización y modernización. la lingüística y la inteligencia artificial. Un ejemplo contundente es la generalización de aplicaciones de cómputo como el uso de un sistema operativo estándar en los computadores personales y el intercambio de información a través de internet por medio de un protocolo universal. técnicas y procedimientos necesarios en la concepción. Es por ello. deportivas. la estructura del material se compone por un conjunto de capítulos dedicados a describir las etapas del procesamiento del lenguaje natural comenzando por describir la naturaleza del propio lenguaje. uno de los temas integrantes de su formación se concentra a proponer todos los conceptos. Su popularidad ha crecido aceleradamente gracias a la evolución de la electrónica y las comunicaciones. Una de ellos se conoce como Lenguaje Natural. diseño e implementación de sistemas para el proceso de lenguaje natural escrito. comprensión y generación del lenguaje natural que expresa un usuario y la aplicación que opera. . Disciplina que basa sus fundamentos en las matemáticas. investigación y desarrollo de sistemas que emplean interfases basadas en el lenguaje natural. sociales. Con ella se aborda el reto de construir sistemas de cómputo orientados al manejo. que han aportado avances y mejoras significativas en la fabricación de equipo cada día más poderoso y a la vez económico. comerciales. que como parte de la formación de un especialista en sistemas de información se le brindan los elementos logísticos y experiencias apropiadas para el diseño de aplicaciones basadas en el uso del lenguaje natural. que acompañado por la robustez y facilidad en el empleo de los programas de cómputo. generación. se ha compilado el Reporte Técnico como resultado de los estudios. En donde el factor común es facilitar el uso de los productos e incrementar la utilidad. han hecho en conjunto una herramienta muy valiosa para el bienestar de la sociedad. organizado en algunas materias específicas. rápida y precisa.

Con este material se pretende motivar al estudio. procedimiento. aplicaciones y programas del lenguaje natural. Así mismo. el uso de plantillas. la comprensión de historias y una serie de lineamientos para crear un intérprete. el diccionario. el manejo de errores e implementación. la composición de expresiones y el proceso para construir un módulo. El capítulo tres describe la naturaleza del Análisis Sintáctico. además de ofrecer un resumen de las teorías de Chomsky y de las redes de transición aumentadas. la morfología. identifica sus elementos. además de presentar el método de dirección por metas y los guiones. amén de ofrecer recomendaciones para crear un módulo Semántico. como un medio simple de diálogo. y modelos de generación. el manejo de unidades léxicas. el análisis pragmático. las ramas de investigación. tales como las gramáticas. las áreas de estudio. concluyendo con una serie de lineamientos para crear un módulo sintáctico. desarrollo y aplicación de sistemas de información que incluyan como interfase hombre-máquina mecanismos para el procesamiento de lenguaje natural. En los últimos apartados del Reporte Técnico se presentan las conclusiones y referencias bibliográficas. las Redes Semánticas y la Dependencia Conceptual. técnicas para la interpretación como la atención y el modelo de creencias. El capítulo seis aborda el tema de la generación del lenguaje a partir de las consideraciones. En el capítulo dos se presenta la descripción del Análisis Léxico a partir de los elementos del lenguaje.4 Lenguaje Natural: Descripción de las Etapas para su Tratamiento El cuerpo del Reporte Técnico se desglosa de la siguiente forma: El capítulo uno se ofrece un panorama del lenguaje natural. También ofrece un apartado para el análisis de las gramáticas semánticas y CASE. En el capítulo cuatro se dedica a presentar el Análisis Semántico a partir de un perfil y de sus elementos. . describe el procedimiento inverso en la generación de lenguaje. El capítulo cinco introduce un perfil de la Interpretación del lenguaje natural acompañado por la descripción del proceso para su tratamiento.

CAPÍTULO 1. ÁMBITO DEL LENGUAJE NATURAL .

.

pero no siempre está ilustrado por una sola letra o grafía. Composición del Ser Humano. para expresar sus ideas. y fonemas que se realizan en consonantes: /d/f/l/m/ñ/p/t/. emociones y necesidades. esperando cierta clase de respuesta por parte de su interlocutor. La lingüística juega un papel muy importante en el análisis del lenguaje natural debido a que regula su correcto empleo. Por eso el sistema fonológico y el alfabeto ortográfico con que se escribe el español. Cada fonema representa un sonido. morfología y la fonología.1 PERFIL El lenguaje natural “LN” es la forma de comunicación que el humano aprende de su ambiente y usa para comunicarse con los demás. . 1. El español posee fonemas que se identifican como vocales: /a/e/i/o/u/.. tejidos.. Entre sus áreas de estudio se encuentran la sintaxis. ojos.2. representadas como fonemas. como se muestra en la Figura 1: Espíritu Intuición Conciencia Comunión El ser humano es Tripartito [1] Mente Alma Sentimientos Voluntad Cuerpo Exterior: cabello.1.2 ÁREAS DE ESTUDIO 1. Fonética. Figura 1. Es la parte de la gramática que estudia la concordancia o armonía que entre varias clases de palabras ha establecido el uso. gramática. piel.1 Lingüística Es el estudio del lenguaje encargado de explicar la composición y empleo del lenguaje [2]. Estudia la acústica (la formación y propagación de los sonidos) y la fisiología (como funcionan los órganos al producir sonido) de las expresiones pronunciadas. ÁMBITO DEL LENGUAJE NATURAL 1. a través de varias ramas. huesos. Los desajustes entre ambos alfabetos consisten en que: . Interior: venas. Como parte de sus intereses está la regulación misma del lenguaje. semántica. además de normar y el orden en que se colocan los diversos elementos que componen a la oración. . régimen o dependencia mutua. La sintaxis constituye la parte formal del lenguaje. es por ello que existen las Academias de la lengua. no guardan entre sí una exacta correspondencia. entre las que destacan: Sintaxis.

La fonología estudia cuál es el valor de los fonemas desde el punto de vista de su función en la lengua. Mientras que la letra “h” no corresponde a ningún sonido ni representa ningún fonema. gala (/g/). gui). Representa. bala (/b/).8 Lenguaje Natural: Descripción de las Etapas para su Tratamiento El fonema /b/ corresponde a dos letras (“b” y “v”). lo mismo que el fonema /y/ (letras “ll” e “y” inicial de sílaba). todas las cualidades fónicas que lo hacen identificable en el habla. sólo tiene valor ortográfico. co. El fonema /j/ corresponde a la letra “j” y también a la letra “g”. carece de significado. por si solo. “ll” (fonema /y/). “u” (ca. cu) y el fonema /s/ (que se escribe con las letras “s”. El fonema es el elemento más simple de la lengua. Es la disciplina científica que estudia los cambios de significación que han operado en las palabras. “z”. gi). “c “ seguida de “e” o de “i”: ce. o bien. la “c” que precede a las vocales “a”. resulta una diferencia de significado. antes de “e” o de “i” (gue. “o”. en: “pala (/p/). Por ejemplo el fonema /l/. La letra “x” corresponde a dos sonidos representados por sus respectivos fonemas: /k/ y /s/. El fonema es pues la unidad fonológica unidad que se caracteriza por ser diferenciadora de significado. sala (/s/). en abstracto. pero solamente cuando va seguida de las vocales “e” e “i” (ge. por ejemplo. La letra “w” no se usa en el español más que en palabras procedentes del inglés (en ese caso suena como “u”: Washington) o procedentes del alemán (entonces suena como el fonema /b/ Wagner). Semántica. tala (/t/). también indica cómo se combina con otros para formar palabras y frases. Fonología. La letra “r” a veces representa al fonema /r/ (arete) y a veces al fonema /rr/ (rata). Corresponden a tres letras: el fonema /k/ (que se describe con la “k”. mala (/m/). “o”. pero carente de significado en sí misma. “rr” (fonema /rr/) y “gu” seguida de “e” o de “i” (fonema /g/). El fonema /g/ corresponde a la letra “g” cuando va antes de “a”. jala (/j/)”. -ala el fonema omitido determina la diferencia de la palabra. la fonología investiga que diferencias fónicas están relacionadas con diferencias de significado. Así pues. Hay letras dobles: ch (fonema /ch/). pero si en la palabra ley se sustituye por el fonema /rr/ (rey). “u” (ga. y el fonema /rr/ (letras “r”. corresponde a la letra doble gu. “rr” intervocálica). qué relaciones establece un fonema con los demás dentro de un paradigma y como se da este. . go . ci). “qu” (fonema /k/).gu). la “qu”).

La descripción del comportamiento como resultado del estudio psicológico no es casual o carente de objetivo.2. Como tal. la predicción y el control del mismo. entre otros. 1. aprendizaje y la personalidad. y condiciones espirituales de su desarrollo”.3 Filosofía Se interesa fundamentalmente en dos áreas de estudio del lenguaje. el cual se puede generalizar en tres fases: • • • Se empieza con un pensamiento. la segunda por medio del formalismo en las estructuras y significados. La forma en que se relaciona la psicología y el lenguaje natural estriba en el interés de comprender como se produce el proceso de generación y entendimiento del lenguaje. La gramática es rígida por el principio de que todos los elementos mantienen entre sí relaciones semánticas.individuo y ente social. esencia. la explicación pretende identificar las causas que motivan a un determinado comportamiento en el individuo. además de su origen. . La filosofía define al lenguaje de la siguiente manera: “Parte de la filosofía que investiga las aportaciones de este medio de expresión. la cognición. capaces de generar o producir todas las oraciones posibles y aceptables del lenguaje. el estudio del lenguaje tomó gran importancia. Para poder entender el proceso de generación del lenguaje se debe de abordar el problema tomando en consideración temas donde este se ve involucrado y tiene que ver. la justicia. Se encarga de estudiar los elementos del lenguaje y sus combinaciones. Sócrates utilizó ampliamente un método que utilizaba al lenguaje. 1.Ámbito del Lenguaje Natural 9 Gramática. Para los griegos. mientras que el control significa que el psicólogo de algún modo manipula la situación para obtener un resultado esperado. La predicción ocurre cuando el psicólogo anticipa correctamente eventos que ocurren en circunstancias naturales. aplicando métodos de inferencia. La primera como forma de pensamiento del ser humano . como lo son el pensamiento.2 Psicología Psicología es el estudio científico del comportamiento. en forma de preguntas llamado en filosofía como “Mayéutica”. Producimos los sonidos del habla que forman dichas palabras y frases. trata de formular una serie de reglas. Escogemos palabras y frases que expresen la idea. Básicamente. la psicología describe el comportamiento (el qué) y trata de explicar las causas del mismo (el por qué). utilizándolo primordialmente para hallar una definición. El estudio del comportamiento tiene como propósito la explicación. el concepto de lo que es el amor. Estudia la función (sintaxis) y la forma (morfología) de los signos lingüísticos. como iniciadores de la filosofía. ellos utilizaban con frecuencia la palabra “λóγos” que en griego significa palabra y en latín se tradujo como verbo. la templanza y la compasión. Además.2.

en el lenguaje natural. el lenguaje natural. que arriesga su vida por ella. tiene que ser muy distinta de lo que hace creer la lógica y la estética. por ligera que sea.10 Lenguaje Natural: Descripción de las Etapas para su Tratamiento El método socrático recibe el nombre de Dialéctico. poco importa. acontecimientos históricos de gran importancia han cambiado su valor. La forma de pensamiento anterior se refleja. es la afirmación de un valor adherido a esa verdad. políticas. por ejemplo. si esto es así. ni la de redondear períodos. es porque la vida de la cual es expresión. nada tiene que ver con las ideas puras. y nuevas concepciones sociales. no apunta ni a un ideal lógico ni a un ideal literario. religiosas y económicas surgen y desaparecen. mientras se viva. originario. El juicio intelectual de “La tierra gira” se cambia en juicio de valor en la boca de Galileo al gritar entre los jueces “eppur si muove”. es una creación de la colectividad que ningún individuo aislado puede llegar a dominar enteramente. antes de conocer el lenguaje artificial. este axioma no interesa en sí mismo mientras no se sienta. no es la de construir silogismos. . La voz “Libertad”. y esto no es posible sino cuando. sino de la de todos y en todas sus manifestaciones. es un producto que se hereda y que el niño aprende lentamente a través de los años. primitivamente. Si el lenguaje no es una creación lógica. Otros afirman que el lenguaje se desarrolla de acuerdo con las necesidades humanas. En su tratado Interpretatione afirma que “las voces son los primeramente signos de las pasiones del alma y éstas son imágenes de las cosas”. Si se dice que la vida es corta. no tiene igual significado en una democracia liberal que en una dictadura. se representará muy vivamente que los cuatro pesos que lleva a casa son una suma más importante que cada una de los sumandos. Algunos le llaman lenguaje “natural” al que experimenta el niño cuando quiere comunicarse. Así una palabra puede tener muchos sentidos. Aún en las épocas recientes. su función es biológica y social. según la filosofía. no pretendió satisfacer ninguna necesidad sino obedeció al simple placer de nombrar cosas. El lenguaje supone un medio de comunicación previo. natural. mediante asociaciones simples o complejas. esta idea general no penetra realmente en alguien. pero un obrero que ha ganado dos pesos por la mañana y dos pesos por la tarde. Pero esto no es ya una idea. A medida que la historia varía. no está al servicio ni de la razón pura ni del arte. el lenguaje cambia y también se adapta a otras funciones y trata de expresar otros sentimientos. Para la filosofía. En ese momento ya no es una verdad científica. su función primordial constante. el que todos hablamos. Diferentes concepciones políticas bastan para alterar el mecanismo expresivo del lenguaje. El lenguaje humano es artificial. la verdad le parece tan preciosa a quien la emite. no significa lo mismo en nuestro tiempo que en la “Antigüedad Clásica” o en la “Edad Media”. Según los italianos Vico y Croce. el lenguaje es una actividad poética que. como el arte de debatir mediante preguntas y respuestas. es un valor. para así llegar a la verdad. ni la de plegarse a las leyes. más que gracias a una modificación subjetiva acompañada de una vibración efectiva. pienso yo en mi vida o en la vida de otras personas implicadas en mi existencia. Aristóteles llamó symbola (signos) a las palabras y pragmata (imágenes) a los conceptos. La ecuación “dos y dos son cuatro” deja indiferente a quien la conciba con su pura abstracción. El lenguaje está simplemente al servicio de la vida y no de la vida de unos pocos.

ya que este recibe todos los impulsos que mandan otros órganos que participan en el lenguaje. el izquierdo es el que tiene las funciones del movimiento de la mano derecha. llamada actualmente zona de Wernicke. relacionada también con el lenguaje. la escritura. que es el motor de los músculos extrínsecos de la lengua. la lógica. cuando un hombre ingresó al hospital con una seria infección en una pierna. Nuestro cerebro está dividido en hemisferios cerebrales.es decir el lenguaje . es el motor de dos músculos de la faringe y laringe. . Poco después de que Broca informara de sus descubrimientos.2. como son: músculos de la laringe. parietal. podemos decir que el lóbulo encargado de estas funciones es el lóbulo parietal. Gall había llegado a la conclusión de que los lóbulos frontales (la parte del cerebro más cercana a la parte superior de la frente) estaban especializada en el habla.4 Neurociencias Las neurociencias son aquellas disciplinas que se encargan de estudiar el sistema nervioso.y de la capacidad de desarrollar las ideas y las respuestas motoras necesarias para llevarlas a cabo. Localización de la Función Mientras estudiaba el cerebro. la capacidad de usar símbolos como un medio de comunicación . Enfocándonos solamente al habla y al lenguaje. El primer caso de Broca ocurrió en 1861. Tan murió a consecuencia de la infección. su composición y funcionamiento. La zona de Wernicke está situada en el lóbulo temporal. Carl Wernicke identificó una segunda zona del cerebro. los cuales. Un admirador de la obra de Gall se sintió tan impresionado por esta afirmación. Lo asombroso fue que las zonas de Wernicke y de Broca resultaron estar relacionadas con diferentes aspectos del lenguaje. las cuerdas vocales. por lo que esa zona llegó a llamarse “de Broca”. y Broca pudo realizar un examen postmórtem del cerebro. La corteza cerebral que forma a los hemisferios se divide en cuatro regiones principales denominadas “lóbulo frontal.Ámbito del Lenguaje Natural 11 1. Broca investigó otros casos más. Cabe mencionar que los impulsos son llevados al cerebro mediante nervios. el lenguaje. el habla. el cual se ocupa del reconocimiento de estímulos sensoriales específicos. La autopsia reveló lesiones en la parte izquierda del lóbulo frontal. también había sufrido durante muchos años la pérdida del habla. Durante los tres años siguientes. y el vago. el órgano principal para el aprendizaje del lenguaje es el cerebro. porque era la única palabra que podía decir. Dos días después que Broca lo examinó. temporal y occipital”. que entre otras funciones. Cada uno de los trastornos en el habla iba acompañado de una lesión en el lóbulo frontal izquierdo. Este reto impulsó a un joven neurocirujano llamado Paul Broca a comenzar el examen de pacientes que sufrían de pérdida del habla. por lo que respecta al lenguaje se interesa en precisar las partes responsables de su manejo e interpretación. lo llamaban “Tan”. Estos órganos que coordinan la producción del habla. la lengua. que ofreció una recompensa de quinientos francos a cualquiera que pudiera encontrar un paciente con lesión en el lóbulo frontal y sin un trastorno en el habla. Órganos que Participan en el Aprendizaje del Lenguaje Como se mencionó anteriormente. Podemos mencionar el nervio hipogloso. una parte del cerebro situada sobre la oreja. derivan sus impulsos nerviosos de distintos centros. las matemáticas y las ciencias. a su vez están gobernados por un centro común en el cerebro.

donde es comprendida como un mensaje verbal. . pero es difícil comprender las palabras y las oraciones están incompletas... La zona de “Broca” es responsable de la programación de los músculos de la cara. las lesiones en la zona de “Wernicke” también alteran la comprensión del lenguaje. papá y Dick. Además de perturbar el lenguaje hablado. El lenguaje hablado se origina en la zona de “Wernicke”. una lesión en la zona de “Broca” afecta el habla.. Las diferencias entre las “afasias de Wernicke” y “de Broca” llevaron a Wernicke a formular un modelo de cómo el cerebro produce el lenguaje. la oración es transferida a la zona de “Broca”. dientes”. Por ejemplo. la señal pasa a la zona de “Wernicke”. mientras que una lesión en la zona de “Wernicke” deja el habla intacta.. y las palabras están unidas en algo que parecen oraciones. casi cien años después. De esta forma... pero perturba la comprensión del lenguaje y la formación de oraciones con sentido. no la tienen para comprender el lenguaje. Las lesiones en la zona de “Wernicke” producen un tipo diferente de afasia. lunes. Aunque los pacientes con la “afasia de Broca” tienen dificultad para expresarse. pero esas oraciones carecen de sentido. o “afasia”. Entonces.. Cuando se pidió a un paciente con lesión en la zona de “Wernicke” que describiera un grabado donde había dos niños robando galletas a espaldas de una mujer. un paciente dijo: “Sí. la lengua y la laringe para que la persona emita la oración formada en la zona de “Wernicke”. este modelo es ampliamente aceptado aún.. el paciente respondió: “Mama está aquí lejos trabajando su trabajo para hacer a ella mejor. al preguntarle acerca de una cita con el dentista. Allí es donde se forman las oraciones con sentido. y. miércoles nueve en punto. Las oraciones pueden estar gramaticalmente correctas y el habla misma puede ser normal. Según este modelo.. Regiones Cerebrales Responsables del Lenguaje. pero las oraciones carecen de sentido. Ella está trabajando otro tiempo”. Hoy en día. como se aprecia en la Figura 2. diez en punto... Toda la información parece estar presente.12 Lenguaje Natural: Descripción de las Etapas para su Tratamiento Una lesión (daño en los tejidos) en la zona de Broca producía un trastorno del habla caracterizado por lentitud y dificultad al hablar y una articulación deficiente lo cual hace difícil la comprensión de las palabras. cuando se oye una palabra. El habla en sí es normal. doctores. Los pacientes con afasia de “Wernicke” fuerte no pueden comprender ni siquiera palabras solas... pero cuando ella está mirando los dos niños mirando en la otra parte.. Figura 2. el lenguaje podrá tener sentido pero generalmente no se puede expresar como una oración completa. En este tipo de trastorno del habla.

Por eso los pacientes que sufren lesiones debido a una trombosis en el lado izquierdo del cerebro. constituida yuxtaposición de elementos muy dispares. inmediatas y visibles (denominadas “primarias”) y los efectos secundarios.5 Comunicación Social En la comunicación social concurren diversas disciplinas como la sociología. juicios apriorísticos o su propia ideología. El segundo método estudia los cambios que se producen en la opinión durante diferentes emisiones como por ejemplo las campañas electorales o publicitarias. del contexto y persona que lo expresa. sintáctica y semánticamente en función al conocimiento que se tiene del lenguaje. y se insiste cada vez mas en las posibilidades de diversificación que ofrecen el desarrollo de la prensa especializada y la multiplicación de emisores de radio. además del conocimiento "ordinario" [3].2.3 RAMAS DE INVESTIGACIÓN 1. ciencias jurídicas y políticas y la publicidad.1 Comprensión del Lenguaje Natural Escrito El entendimiento del lenguaje natural escrito se conoce en al ámbito de la inteligencia artificial como "Procesamiento de Lenguaje Natural" y se enfoca en la recepción de texto cuyo contenido es interpretado léxica. etc. Efectos Secundarios Al observarse los efectos secundarios de modo sociólogo se llega a desempeñar el papel de ensayista que suple la falta de información con intuición. 1.3. Efectos Primarios La sociología de observación los efectos primarios se ha desarrollado a partir de dos prototipos de estudios muy característicos. la pertenencia a una religión y la residencia en zona rural predisponían al voto republicano. son menos aparentes y sin duda mas generales. y no en el derecho. pero resultan capaces de modificar progresivamente el modo de pensar o actuar de una época o sociedad. televisión e internet. por ejemplo. mientras que la combinación inversa se inclinaba hacia el partido demócrata. Cuando la comunicación social emplea medios masivos de comunicación ejerce dos tipos principales de influencias: las mas directas. tienen dificultades con el habla. con lo que se pondera la eficacia de una difusión. El primero compara las distintas convicciones y respuestas individuales antes y después de la explosión de la comunicación. 1. Las encuestas de opinión pública son un digno ejemplo de la aplicación de este enfoque. producidos a mediano o largo plazo.Ámbito del Lenguaje Natural 13 Tanto Wernicke como Broca descubrieron que los centros del lenguaje en el cerebro humano se localizaban casi siempre en el hemisferio izquierdo. esperando cierto tipo de reacción. las cuales en forma individual ponen una especial atención a la “comunicación de masas” procurando que cada miembro de ellas quede cautivo del mensaje deseado. donde una muestra de personas con diversas características pueden mostrar patrones de preferencias específicas. Los comunicólogos están de acuerdo en creer que el horizonte de la cultura moderna se modifica por la continua acción de los medios de comunicación. Se define como la existencia de una cultura en forma de mosaico. . al cuestionar las inclinaciones políticas de los electores en los Estados Unidos de América se detectó que la combinación de un nivel socioeconómico elevado.

etc. ya que a pesar de que generalmente un fonema no tiene un significado específico. los cuales son determinados por el lenguaje aprendido y el lugar del mecanismo anatómico de producción (el cual normalmente es el mismo para todos los humanos). Cada lenguaje incluye un conjunto finito de fonemas a partir del cual puede expresarse completamente. relaciones. dialoga con el usuario para realizar tareas de planeación en la configuración del "mundo de los bloques". El procesamiento del lenguaje natural sonoro emplea todos los elementos de la interpretación del lenguaje escrito. rápidamente se reconoció que para entender el texto a traducir se requería de enormes cantidades de conocimiento "ordinario" y en particular.14 Lenguaje Natural: Descripción de las Etapas para su Tratamiento 1. más el conocimiento adicional sobre fonología así como la correspondiente al tratamiento. . que no están explícitas en el texto. al ligarse con los morfemas anteriores se obtienen: imprevisto. se necesitaba la capacidad para hacer inferencias acerca de objetos. al ser combinado con otros conforme a patrones establecidos produce “unidades significativas” llamadas “morfemas”. para generar respuestas apropiadas aplicando reglas heurísticas dependientes del dominio. 1.2 Diálogo Sonoro Conocido como "Procesamiento del lenguaje hablado" es caracterizado por los sonidos que el ser humano es capaz de producir. desprovisto y subdesarrollo. procurando evitar ambigüedades y eliminar ruido. sin embargo. sub. depuración y digitalización del sonido.4 DESARROLLOS Los primeros proyectos en el campo del lenguaje natural iniciaron en los 60´s con los siguientes trabajos [4]: ELIZA & STUDENT: Fueron dos proyectos a cargo de Weizenbaum & Bobrow orientados al diálogo.3. estos sistemas almacena información acerca de sus dominios ("diálogo entre el terapeuta y su paciente") con estructuras ad-hoc traduciendo declaraciones e interrogaciones sencillas en "palabras clave" o "simples patrones" que se asocian con objetos definidos y relaciones. Su éxito fue muy limitado porque el sistema no conocía nada del tema a traducir en un sentido razonable. como por ejemplo: preciso. Traductores Automáticos: las primeras aplicaciones iniciaron en ese tiempo. El diálogo es generado hilvanando "lapsos de sonido individuales" en patrones reconocidos. des. Al estudio de dichos patrones de sonido se llama "fonología". que traducía del inglés al francés basado en representaciones semánticas y en esquemas de inferencia. Pero si requiere asociarse con otro para adquirir un significado real se llama “morfema ligado”. La interpretación sonora del lenguaje comienza por identificar fonemas que constituyen la más pequeña unidad del lenguaje hablado y que se distingue de los demás. Si un morfema tiene “personalidad” propia por sí solo se denomina “morfema libre”. por medio de declaraciones y comandos contesta preguntas acerca del estado de los bloques y las razones para efectuar movimientos. etc. provisto. como sería: mi. Durante los 70´s y 80´s han destacado las siguientes aplicaciones: SHRDLV: desarrollado por Winograd. desarrollo. El trabajo más significativo a comienzos de los 70´s fue el sistema hecho por Yonck Wilks. intenciones.

implementó la hipótesis de la descomposición en primitivas del lenguaje a través de lo que denominó la “dependencia conceptual”. implementó la interpretación aplicando varios “puntos de vista” con su particular “sistema de creencias” como se modela al ser humano con su diversidad de idiosincrasias. mientras que el "entendimiento del lenguaje" se realiza a través de procedimientos que son activados en respuesta a la interpretación de la oración. Utiliza “frames conversacionales” para guiar la entrevista y generar información. PAM. Creado por Carbonell. También desarrollado por Schank. aplicó conceptos de modularidad y compartición de estructuras de conocimiento a través del uso de “frames”. como evitar dichas fallas o recuperarse de ellas. BORIS. También aplicó la hipótesis del entendimiento como resultado de una interferencia espontánea.Ámbito del Lenguaje Natural 15 El sistema integra la sintaxis. MARGIE. para orientarlo al relato de historias. POLITICS. Generado por Lebowitz. Construido por Dyer integra una gran variedad de estructuras de conocimiento como los Scripts. introdujo el uso de “Scripts” para estructurar grandes cantidades de información y situaciones estereotipadas que se “alimentan” al sistema para generar un resumen. Desarrollado por Xerox. Tales estructuras de conocimiento permitían generar distintos comentarios a partir de un mismo texto. hacer preguntas y exponer conclusiones. produciendo al final un consenso de las conclusiones obtenidas. IPP. relatar la historia o contestar preguntas al respecto del tema. aplica varias clases de generalización acerca de protagonistas y actividades típicas en la historia y con el propósito de adquirir información que pueda usarse para emitir especulaciones sobre las razones que motivan cierta conducta o el desenlace de los eventos. usa varias categorías de planes. donde oraciones idénticas expresadas en distintas lenguas pudieran tener la misma representación conceptual. Es decir. SAM. su propósito. Realizado por Schank. a partir del texto se generan diversas interpretaciones sobre su significado. razones por las que pueda fallar. simula a un asistente de reservaciones áreas que asesora al usuario en la planeación de un viaje. aplicando el manejo de excepciones y uso de “defaults”. planes y manejo de creencias en “unidades de tematización abstracta” que contienen la descripción del plan. habilita el uso de “planes” como estructuras de conocimiento para tipificar metas comunes de la gente y los medios característicos que emplean para alcanzarlas. Elaborado en Rochester University para implementar diversos tipos de diálogos. ARGOT. MS Parlaprop. Construido por Schank. elaborado por Charniak. cada uno de ellos expresando un particular modo de pensar. Con estas herramientas el sistema obtuvo resultados muy interesantes. semántica y el proceso de razonamiento a través de "Hipótesis de Representación Procedural" en donde el significado de las oraciones y sus componentes están representados en estructuras procedurales. GVS. como los “objetivo” en donde se representa una meta y los de “comunicación” que contienen secciones de dialogo para introducir temas. .

. que está enfocada a regular los elementos estructurales del lenguaje. es necesario considerar 4 dominios: • • • • La estructura lingüística.6. Tutores inteligentes. Sistemas expertos. Creado por los laboratorios Bell es un lenguaje diseñado para manipular strings como datos primarios. Reconocimiento de voz. Herramientas de programación sobresale: SNOBOL. 1. COMIT: Es el primer lenguaje encontrado a proceso de strings. La acción humana y su interacción con el mundo. Sistemas de planeación. Y en general los sistemas de información orientados a interactuar con el usuario final mediante el lenguaje. La correspondencia entre las estructuras lingüísticas y el mundo Proceso cognoscitivo. involucra las estructuras de conocimiento y su manipulación por el procesador del lenguaje. Para cumplir con el objetivo de hacerse entender.6 REPRESENTACIÓN 1. El “patrón” es una secuencia de caracteres que es buscada en el contenido del “string-sujeto” para hacer referencia a dicha instancia de string por ejemplo: paso 1 texto = ‘valor 1 * valor 2’ paso 2 texto ‘*’ = ‘**’ resulta en: texto = “valor 1 ** valor 2’ ICON: sucesor de SNOBOL incluye el proceso de listas tipo LISP [5] y el empleo de reglas.5 APLICACIONES Y PROGRAMAS Entre los campos de aplicación destacan: • • • • • • • • Sistemas conversacionales. Traductores.1 Representación El ser humano usa el lenguaje natural para satisfacer la necesidad de transmitir sus "conceptos internos" a su prójimo a través de representarlos por un medio (llamado lenguaje) compuesto de elementos y reglas (para interrelacionarlos). con el propósito de lograr que el receptor "entienda" lo que realmente desea expresar. El formato de sus instrucciones es: etiqueta string-sujeto patrón = string-objeto: go-to etiqueta El “string-sujeto” es el string cuyo contenido se actualiza. Generadores de historias. la cual asocia al lenguaje dentro del contexto del tiempo relativo a hechos y expectativas. del cual selecciona aquellas unidades que mejor los ilustran.16 Lenguaje Natural: Descripción de las Etapas para su Tratamiento 1.

"Faxeamelo"..000 en Enero”.“Se eleva mucho Juan” VENTAJAS Es flexible al permitir el uso de las expresiones necesarias con el grado de detalle requerido permitiendo que el interlocutor genere su inferencia.Ámbito del Lenguaje Natural 17 Amén de considerar estos dominios es necesario reconocer algunas limitaciones al comprender el lenguaje. Hay distintas formas de expresar lo mismo: ."Subió el índice de la bolsa” . . n * 1: Por ejemplo un "Query" puede expresarse de varias formas: “Dame los clientes con ventas superiores a $10.“Juan brinca mucho” . 2 3 Es evolutivo y adaptativo con base a los deseos de la gente. Expresión Arborescente."El candidato de P_ _ se pronunció por desterrar la corrupción del ." La misma expresión significa diferentes cosas en distintos contextos: -"Levanta el gato" (al cambiar una llanta o cargar a la mascota). 1. como su entendimiento es necesario reconocer el proceso de “mapeo” que existe tanto de parte del que expresa el mensaje como de aquel que lo recibe."Tírame un bipaso" . como las que se presentan en la Tabla 1: Tabla 1. usando un finito número de símbolos. en donde la idea básica es convertir la forma original de un concepto a otra. 4 El lenguaje es muy rico en su forma de expresión. Es imposible editar un programa o diccionario completo del lenguaje: . existiendo entonces varias relaciones de “mapeo”.6. Limitaciones y Ventajas de los Lenguajes.2 Mapeo Para llevar a cabo tanto la representación del lenguaje. Permite expresiones de un mundo infinito.. tal como aparece en la Figura 3 y 4: 1 a 1: Una expresión matemática: = A= B*2+8 traducida a un árbol A + * 8 B 2 Figura 3. # 1 LIMITACIONES Expresiones breves o vagas: . pero también las ventajas al hacer uso de él.

6. Asocia información a los morfemas. es necesario reconocer el "rol" de ellas y la relación que guardan entre sí. 1. Generador léxico. La goma durante la clase. 1. Tipos de Mapeo. Analizador morfológico. contestar preguntas y generar respuestas.18 Lenguaje Natural: Descripción de las Etapas para su Tratamiento “Proporciona una lista de los clientes que compraron mas de $10. Analizador semántico. Fonología. Analizador sintáctico.000 AND MES = "ENERO" 1 * n: Son situaciones que obligan a emplear mucho conocimiento del dominio para entender correctamente su significado: "Juan le grita a Pedro ¡pásamela!" El balón durante el partido de basketball. SELECT * FOR VENTA > 10. Relaciona el texto con la base de conocimientos del contexto para emitir una representación del significado del texto alimentado. las cuales son ilustradas en la Figura 6: Traductor: integra varios subsistemas: • • • • • • Analizador léxico. aceptar como entrada texto en lenguaje natural. El ovoide durante el partido de football americano. Por ejemplo: “Pedro vio a su novia en el parque con una cámara” es descrito en la Figura 5. Identifica la raíz de las palabras.000 el mes pasado”.3 Nivel de Interacción entre los Componentes Debido a que la expresión a representar está compuesta por varios elementos. Conceptualmente está integrado por las siguientes funciones. desarrollar inferencias a partir de tal conocimiento y texto alimentado. la bolsa se cayó al piso. considerando las diversas alternativas de significado en función de su naturaleza y contexto.7 ETAPAS EN EL PROCESAMIENTO Un sistema de lenguaje natural “SLN” está diseñado para entender y manipular lenguaje. Valida la estructura gramatical del texto y asocia un significado a la declaración. n * m: Representa al hecho de haber muchas formas de expresar distintas cosas: Se cayó la bolsa hubo pérdidas en el mercado financiero La bolsa cerro a la baja Figura 4. almacenar conocimiento ligado al dominio de la aplicación. Descompone el texto en unidades de palabra. . Dividido en tres etapas.

Ámbito del Lenguaje Natural

19

S ¿Quién tenía la cámara? Si fue Pedro: NP VP

Pedro

V

NP

PP

Vio

DET

NOM

PP

con una cámara

a su novia S

en el parque

Pero si fue la novia de Pedro NP VP

Pedro

V

NP

Vio

DET

NOM

PP

a

su

novia

en el parque con una con una cámara

Figura 5. Interacción entre los Componentes de una Oración. Interpretador. Lo constituye un responsable de interactuar con la base de conocimientos en función al tipo de texto alimentado. Si es una pregunta, esta debe ser contestada, pero si es una afirmación (hecho o negación) se agrega a la base y actualiza en un caso a otras entidades. También desarrolla inferencias a partir del conocimiento almacenado. Generador. Es el subsistema encargado de producir el texto de salida dirigido al usuario en función a la naturaleza del texto de entrada, puede emitir: • Declaraciones de asentimiento: Okay. • Preguntas: Como se llama el sujeto? • Dudas: No entendí. • Rechazos: Contradice a la afirmación de… • Respuestas: La consecuencia del acto es…

20

Lenguaje Natural: Descripción de las Etapas para su Tratamiento

Representación interna

Texto de Entrada

Traductor

Interpretador

Generador

Base de conocimiento Texto de Salida Figura 6. Esquema de un Sistema de Lenguaje Natural. Representación Interna (“RI”). Es el mapeo del texto de entrada en un formato adecuado para la manipulación de los módulos del SLN y consiste en las estructuras almacenadas en la base de conocimientos. Base de Conocimientos (“BC”). Se constituye por 3 tipos de elementos interrelacionados: • Entidades. Son personas, animales, objetos o lugares que deben ser descritos y que protagonizan los eventos. • Eventos. Son acciones que pueden ocurrir involucrando entidades con roles de actor, objeto, instrumento, origen y destino; además de poder involucrar a otras acciones. • Situaciones. Combinan entidades y eventos con condiciones y resultados. Implementación de un sistema de lenguaje natural. Se puede considerar como un sistema a desarrollar con alcances incrementales, como círculos concéntricos que ilustran cada fase en la forma mostrada en la Figura 7.

Traducción Inferencia Respues Aprendizaj Figura 7. Evolución de un Sistema de Lenguaje Natural.

Ámbito del Lenguaje Natural

21

Traducción. Los textos recibidos son procesados hasta generar su representación interna “RI” para después, a partir de ella, emitir el texto de salida. Inferencia. Una vez obtenida la RI del texto recibido, se hacen todas las inferencias posibles al asociar el RI con la base de conocimientos “BC”. Las conclusiones son representadas como RI para que el “Generador” emita el texto de salida. Respuesta. Después de haber emitido la RI equivalente a la pregunta alimentada, se activan los mecanismos de inferencia que explotan la BC para satisfacer el requerimiento. Una vez obtenida la respuesta en su forma de RI se le encomienda al “Generador” su exposición. Aprendizaje. Las declaraciones introducidas al SLN son representadas internamente y confrontadas con la BC actual, para determinar casos de: • • • Integración. Agregando o actualizando el conocimiento. Contradicción. Requiriendo contradicción, confirmación, renovación, convivencia o rechazo. Confusión. Al no poder comprender el significado o contexto del texto.

22 Lenguaje Natural: Descripción de las Etapas para su Tratamiento .

CAPÍTULO 2. ANÁLISIS LÉXICO .

.

1 DESCRIPCIÓN El subsistema del análisis léxico dentro de un SLN involucra el "mapeo" entre una cadena de entrada o salida de texto y los elementos léxicos a ser manipulados por el sistema. z a b . . 2. b á é ú ó # . 9 . oraciones y textos con significado propio dentro del lenguaje al que pertenecen como se muestra en la Tabla 2: Tabla 2. . .2. Alfabeto de la Lengua Castellana.1 Alfabeto Constituye el repertorio de símbolos válidos que a través de su interrelación forman el universo de palabras. 0 1 . .2 LENGUAJE 2. En la fase inicial transforma la cadena en unidades léxicas. frases. A B .. Figura 8. selecciona las palabras apropiadas para expresar el significado deseado [6]. . Ciclo del Analizador Léxico. ANÁLISIS LÉXICO 2.2. ? / . Mientras que al final.

2 Morfología Se orienta a identificar la raíz de los verbos. etc.. Al usar un mismo verbo para una persona específica. como en el ejemplo descrito en la Tabal 5: .26 Lenguaje Natural: Descripción de las Etapas para su Tratamiento 2. Consiste en identificar y eliminar los prefijos y sufijos que acompañan a la raíz de la palabra. TÉRMINO desunión juegos infidelidades des in PREFIJO RAÍZ unión juego fidelidad s es SUFIJO Conjugaciones. entre las situaciones más comunes están: Prefijos y Sufijos. por ejemplo como se aprecia en la siguiente Tabla 3: Tabla 3. pronombres. Uso de Tiempos. Ejemplos de Palabras Compuestas. de tal forma que se pueda distinguir la esencia del significado de la palabra analizada.2. SIMPLE Pronombre Presente Yo Tú Ellas leo amas oyen Pasado leí amaste oyeron Futuro leeré amarán oirán PROGRESIVO Presente leyendo amando oyendo Pasado leyendo amando oyendo PARTICIPIO Presente leído amado oído Pasado leído amado oído Irregulares. Las palabras derivadas de la raíz no observan un patrón ordinario. Al asociar los verbos a los pronombres en un solo tiempo se derivan varias presentaciones: • • • • • • Yo corro tú corres Él / ella corre Nosotros corremos Vosotros corréis Ellos/ellas corren Tiempos. pero con distintos tiempos se obtienen los casos señalados en la Tabla 4: Tabla 4. sustantivos.

Raíz comida saber sonar hablar Derivada comensal. Raíz Portería Elevador misión Opciones portero. Opciones de Género y Número.Análisis Léxico 27 Tabla 5. sonido hablador. Estos son sólo algunos de los casos más comunes al tratar de identificar la raíz de la palabra. misionera. En consecuencia a la adaptación del término al género y número del vocablo original se altera. como por ejemplo en la Tabla 8 se presentan casos de raíces: Tabla 8. misiones Diminutivos y Aumentativos. proceso en el cual se puede incurrir en errores al generar raíces que no correspondan y que representan otra cosa. tal como aparece en la Tabla 6: Tabla 6. Generación de Raíces Incorrectas. Diminutivo pelotita camioncito corralito Raíz pelota camión corral Superlativo pelotota camionsote corralón Incongruencias. sabiduría suena. Comparativos. comedor sabio. Tabla 7. Derivados Irregulares. portera. porteros elevadorista misionero. Son todas aquellas palabras que se usan para expresar una comparación a partir de una referencia. Palabra pelotón piñín corrido Ramos universo Raíz Pelota Piña Correr Ramo Verso . habla Género y número. tal como se señala en la Tabla 7. sonaja.

N47 ap. clase de estructura y métodos de búsqueda o combinación de estos como los mostrados en la Tabla 10.3 Diccionario El diccionario representa el acervo de morfemas y derivados oficialmente aceptados para una lengua. ––– ap....4 Unidades Léxicas Las "Unidades Léxicas" o "UL" son las estructuras de información que representan a cada palabra del texto a procesar por los módulos del SLN.3. binario.. Veamos la Figura 9 donde se ilustran los conceptos expuestos: .2.. El diccionario determina la capacidad del SLN y debe describirse adecuadamente su formato. llave duplicada Combinación de los métodos de acceso 2.. relacional.. hash Acceso aleatorio y dinámico. Formato de Diccionario... 570 ap. tipo de organización y representación. V71 ap. Por lo que respecta a la organización y acceso al diccionario se debe elegir la representación apropiada. cuyo formato contiene la identificación precisa del término.540 ap.. 571 Tiempo ––– ––– ap. distribuida ACCESO Secuencial Por # de registro. llave compuesta. por lo que un SLN incluye para cada "término" su significado. También debe considerar la separación de homónimos para asignar un registro distinto para cada significado de la manera mostrada en la Tabla 9: Tabla 9. . referencia a la raíz o sus derivados. A671 ap.. así como los métodos de acceso. ap. información para identificar su información estructural. C71 ap.28 Lenguaje Natural: Descripción de las Etapas para su Tratamiento 2. frecuencia de uso Secuencial con acceso directo Indexado Jerárquica.47 ap. llave única. TP ––– ––– . Tipo de Organización y Acceso ORGANIZACIÓN Secuencial. F720 ap F721 Función Estructural Tipo ap. Regist Identifica Cabez Significado ro dor a 300 700 1032 5720 5721 C0450 A712 C0877 F0140 F0141 cuanto agosto caer falda falda apuntador x2 ap. Estas piezas de información conocidas como “unidades léxicas” o “tokens” deben ser manipuladas fácilmente por los analizadores sintácticos y semánticos para producir la "Representación Interna" apropiada al texto. . –– –– . su asociación con la raíz o vocablo al que corresponde en el diccionario y también su referencia con la “estructura temporal del texto fuente" en donde aparece la palabra original y sus atributos propios resultantes del análisis morfológico. Tabla 10. así como también tienen que ser lo suficiente expresivas para que el "generador" produzca el texto de salida apropiado.2. para lograr la eficiencia en su manejo. Asociación Raíz ––– 0 0 0 0 Derivados ap.1. 82 Sinó n.

mas. Aplicación de Unidades Léxicas Ahora bien. Formato de la Estructura Temporal Fuente. mas. pasado 89714 89714 –––– –––– –––– Finalmente. sin.. c0450 indef. # Registro Termino 15 Cuanto 19 Agosto 20 ? Ap.007 Figura 9. pasado a712 3era. Diccionario Persona Genero Número Tiempo .. el contenido del “Token” o “Unidad Léxica” debe ser lo suficiente conciso pero a la vez completo para eficientar su manejo. los datos que deben aparecer en su descripción son los que se muestran en la Tabla 12: . una muestra del formato para la “Estructura Temporal Fuente” aparece en la Tabla 11. sin. Tabla 11.Análisis Léxico 29 UN TOTAL DE $748.

1000. la. Las clases cerradas son: • • • • • • • • • • • • • Conjunciones: Asociación: Preposición: Pronombre: Número: Ordinal: Determinante: Negación: Comparativo: Operador: Pregunta: Cuantificador: Exclamativo: y.. un... APUNTADORES Identificador 42B 87I Diccionario C0450 A712 ETF 15 19 Tipo INTERR OG.... menos.. Identifican la función primaria de la palabra.. . abarcan la mayoría de términos del diccionario. él. 2.. 1. por. 3er... Qué. más. para. porque. .... 2do. muchos.. yo... una. .. Son aquellas palabras con un número restringido de instancias y son de carácter funcional por depender de otros para adquirir un significado preciso dentro del texto. 0. Finalmente.3 PROCEDIMIENTO Esencialmente son dos direcciones de procesamiento de texto a cargo del Analizador Léxico y cuya descripción se detalla a continuación: • Conversión del texto de entrada a Unidades Léxicas... NOMBR E FUNCIÓN Categoría Clase CERRAD NOMINAL A ABIERTA PREGUNTA ... tú. Cómo. los.... pero.. Quién.. ninguno. claro.... a. veces. 1er. . es útil reconocer las categorías de “UL”: Abiertas. mayor.. mas....... ..... o... oh.. • Generación del texto de salida a partir de Unidades Léxicas.. .. Formato de la Unidad Léxica. 2. . Acción: Típicamente verbos que ilustran eventos Modificador Nominal: Abarcan a los adjetivos Modificador de Acción: Incluye a los adverbios Cerradas.. antes. si.30 Lenguaje Natural: Descripción de las Etapas para su Tratamiento Tabla 12. agrupándose en las siguientes clases: Nominales: Nombres y nombres propios que identifican entidades u objetos animados o no.... algunos. aquellos no..

Procedimiento de Entrada del Analizador Léxico. tiempos. • Búsqueda en el diccionario. • Selección del morfema para las cadenas que contienen un palabra. . Ejecuta cuatro tareas: • • • • Acceso de cada uno de los caracteres integrantes del texto. conjugaciones. Realiza las siguientes tareas: • Emisión de cadenas de palabras o símbolos. separadores (... Analizador Morfológico.) y cualquier otra convención que ayude a delimitar los “strings”. Generación de la “Unidad de palabra” correspondiente. A partir del texto alimentado al SLN en modo carácter el analizador léxico activa sus módulos secuencial o simultáneamente para generar las “UL” correspondientes conforme a la Figura 10 siguiente: Figura 10. aumentativos. . • Procesos especiales para la detección y tratamiento de: prefijos. ! ¿ ? .Análisis Léxico 31 Procedimiento de Entrada. compuestos por uno o varios caracteres. etc. géneros. : . Identificación del tipo de carácter conforme al “alfabeto”. a través de alguno de los siguientes métodos. considerando los delimitadores. Manejo de errores para los caracteres no registrados en el alfabeto. los cuales se almacenan en la “Estructura Temporal Fuente”. La esencia de las tareas realizadas por los módulos integrantes del analizador léxico son: Analizador Fonológico.

. T. Procedimiento de Salida del Analizador Léxico.. ya sea morfema o derivado. .7).. Dicho módulo deberá incluir un procedimiento que emita “cadenas” con unidades léxicas. F”. ver la sección 2.. Generador Léxico. símbolo. aprovecha la información del diccionario y base de conocimientos para emitir el morfema mas adecuado a la representación. sintacticamente y semánticamente correctas para alimentar al “Analizador Léxico” conforme al esquema de la Figura 11. Esta opción puede ser interactiva con el usuario o automatizada con las limitaciones del caso y la supervisión del administrador del SLN.”.. El módulo “Generador” del SLN es el encargado de proporcionar los elementos y pautas del texto a producir. valiéndose de la “Base de Conocimientos” y de la emisión y actualización de las estructuras de datos denominadas “Representación Interna” (“R.) crea la “Unidad Léxica” correspondiente registrando los datos y ligas necesarios acorde con la información pertinente y las estructuras de datos empleados (“E. Conforme a la naturaleza del morfema (número.. Texto Texto Texto Texto Expositor Morfológico Generador Palabras de Generador Morfemas de Estructura Temporal de Salida Base de Conocimie ntos Representa ciones Internas Diccionario Figura 11. En resumen. Procedimiento de Salida. Diccionario. las funciones a ejercer por los módulos son: Generador de morfemas.32 Lenguaje Natural: Descripción de las Etapas para su Tratamiento • • Actualización del diccionario al aceptar una nueva palabra.). además de registrar sus asociaciones con otras nuevas y ya existentes. Accede a las “UL” y “RI” producidas por el subsistema “generador”. Generación del morfema correspondiente a la cadena. palabra. I.

raíz cantar.. nombre propio. al momento de su exposición. que se espera esté representada. comentario.. género.. expresión artística musical La emisión del texto de salida será evaluada por el usuario hasta el final. número.. diccionario. símbolos y números. De esta forma el SLN será capaz de adoptarlas. persona. modifique por otras que el sistema maneje o bien las confirme. Manipula el morfema y estructuras de datos que empleó el módulo antecesor. el primero. hacer su transformación o reemplazo por aquel término que satisfaga las condiciones de tiempo. nombre. agregar la palabra. provocaría actualizar el diccionario agregando registros y asociaciones diversas para los siguientes significados: • • • • canto canto Canto canto acción de cantar. conjugada en presente.... etc. Es el encargado de ensamblar el texto compuesto por las cadenas de palabras. incorporando los separadores y símbolos especiales para editar el mensaje. apellido de persona. Mientras que la segunda clase es técnica. Después se podrá verificar el buen desempeño de los módulos de salida del analizador léxico. . realizando la incorporación a las estructuras de datos correspondientes (alfabeto. procura de ser necesario.. motivada por los clásicos errores de programación. nombre. en donde lo primero a observar es la naturaleza de la declaración expuesta por el sistema (pregunta.. Por ejemplo. su contexto. la emisión de inferencias erróneas (sobre todo el análisis morfológico) y el empleo de conocimientos incompletos o erróneos representados en el diccionario y base de conocimientos. Expositor fonológico.4 ADMINISTRACIÓN DE ERRORES Existen dos tipos de errores en la fase léxica del SLN. su análisis semántico e interpretación haya sido correcta y que el funcionamiento del generador reaccione con eficacia al mandato que se espera realice. Correspondiendo al personal técnico la modificación al sistema. comenzando por confirmar que el texto de entrada haya sido representado léxica y sintácticamente bien. .. la identificación de los ajustes a realizar es más difícil ya que deberá revisar el ciclo completo del funcionamiento del SLN. es necesario el diálogo con el usuario para detectar inconsistencias durante el análisis fonológico y morfológico para que las evalúe. Por lo tanto.. 2.). integre las “ligas” entre los términos involucrados (raíz con sus derivadas) y sobre todo realice las pruebas de consistencia para identificar y manejar adecuadamente las contradicciones o sinónimos. asignado a la orilla de un objeto de forma . es el resultado de la interacción del usuario donde él proporciona texto con palabras o caracteres impropios del lenguaje manejado por el sistema. afirmación.Análisis Léxico 33 Generador de palabras.. estructura sintáctica y consistencia en el vocabulario empleado.. primera persona singular. Sin embargo. . registrando en la “estructura temporal de salida” la palabra propuesta. respuesta. rechazo.). al usar la palabra “canto” en varios ejemplos con distintos contextos.

Por lo tanto. se agregan las estructuras de datos que otros subsistemas crean como las “RI”. así como del ámbito de aplicación y dominio de conocimiento que explotará [7]. se prueban en orden inverso los módulos de salida. A su vez. comenzando por el “generador de morfemas” y concluyendo con el “expositor fonológico”. a partir de las unidades de palabra que genere. una vez creadas las estructuras de datos iniciales para los elementos básicos del lenguaje. para gradualmente aumentar el grado de riqueza y profundidad del lenguaje.5 DESARROLLO Es recomendable aplicar una estrategia de desarrollo “incremental” y de “ensayo y error” para el subsistema del analizador léxico. a partir de las definiciones conceptuales de la estructura y funcionamiento de todo el SLN. Naturalmente. creando estructuras de datos y casos ad-hoc para cada uno de ellos con el propósito de evaluarlos independientemente para integrarlos al final. . evalúa el desempeño del analizador morfológico y realiza una prueba exhaustiva de casos. Finalmente el generador léxico haga su parte. se inicia la construcción y prueba del primer módulo de entrada. El desarrollo incremental es con el fin de abordar problemas sencillos con estructuras de texto simples y cortas en una primera etapa.34 Lenguaje Natural: Descripción de las Etapas para su Tratamiento 2. esta estrategia se puede alterar desarrollando en paralelo los módulos. con base en estos resultados.

ANÁLISIS SINTÁNTICO .CAPÍTULO 3.

.

. por lo que es necesario interpretar correctamente la naturaleza de ellas para elegir la más apropiada a la aplicación en turno. genero. Los sistemas de lenguaje natural (SLN) dedican una atención especial a la representación y uso de aquella parte gramatical del lenguaje natural que pretenden procesar. considerando el entorno (libre de contexto) y formas de procesamiento (generativa). monitor despliega .2.. | en | a |. cuya representación clásica es a través de reglas que evalúan o generan un “espacio de estados“ para el análisis o producción de oraciones. etc. número. Generalmente el subsistema tiene dos módulos principales: Gramática. Es el proceso que compara el “texto de entrada” contra la gramática para generar las estructuras jerárquicas correspondientes [8]. Figura 12. tiempos. enunciados.. O --> FN --> FN1 --> Adj --> Adjs --> Art --> Pro --> NomPer-> Nom --> FV --> Verbo-> FN FV Art FN1 Nom Adj e | pequeño el | yo | juan | archivo | Verbo | Imprime | Pro | NomPer | FN1 Adjs Adj | largo la | tú | maría | impresora FN | copia | los él pedro | | rápido | | los | . . artículos. negaciones... sus variantes (conjugación.1 Gramáticas La gramática de un lenguaje natural representa el “núcleo” que define la naturaleza de los componentes (verbos. variantes y reglas que se van a utilizar dentro del universo del propio lenguaje. Es la representación declarativa de los elementos sintácticos del lenguaje Traductor. etc. etc. componentes y reglas de interrelación propias del lenguaje. entre otros enfoques. En la Figura 12 se presenta un ejemplo de gramática “libre de contexto” para el idioma español {10]..). ANÁLISIS SINTÁCTICO 3. 3.. Para implementar la gramática de un lenguaje se usa una parte de las matemáticas conocida como “lenguajes formales”.2 ELEMENTOS 3. Constituye el fundamento para regular el uso del lenguaje dentro de la sociedad [9].3. Gramática Libre de Contexto.) y reglas para su interrelación (frases.). por lo que es necesario determinar el subconjunto de componentes.. interrogaciones. | . Dentro de este marco.. sustantivos..1 DESCRIPCIÓN DEL ANÁLISIS SINTÁCTICO El análisis sintáctico es la etapa en el proceso de “lenguaje natural” en donde una oración “lineal” de texto alimentado por el usuario es convertida a una estructura jerárquica que corresponde a las “unidades de significado de la oración“ de acuerdo a la naturaleza.. existe una variedad de “representaciones” gramaticales acordes con el nivel de alcance (finitas).

Estado. Es un módulo de proceso que arranca a partir de un “estado inicial” hacia otros cuando una condición en particular ocurre conforme a las transformaciones que se van procesando. Una fuerte capacidad para identificar el tipo de estructura que corresponde a cada oración gramatical del lenguaje. Cada una de estas clases de redes tienen en común los siguientes fundamentos: Una red gramatical se compone por los siguientes elementos: Máquina. Red. Ilustran la condición que produce la transición desde un estado a otro. Se dice de aquellas máquinas donde a partir de cualquier punto de transición el siguiente estado puede determinarse a partir del estado actual y las condiciones que provocan la transición. . cuyo fundamento descansa en la “Teoría de Grafos” y en las “Máquinas de Estados Finitos”. Es el camino formado por un conjunto de nodos y arcos. Es una descripción del componente gramatical que está representado como un “lugar” dentro de la red de alternativas caracterizada por la transición que provoca el cumplimiento de las condiciones asociadas al estado. para identificar el significado del conjunto de oraciones contenidas en un lenguaje (sentencias gramaticales) y que pueden ser completamente “empatadas” por las reglas gramaticales. siendo etiquetadas por el identificador de la condición. A continuación se describen los primeros dos tipos de redes. Es la representación gráfica y de estructura de datos. mientras que la tercera se hará en el inciso 3. Puesto que es conocido el número de estados posibles a generar.2. Arcos. a partir de un estado dado hasta otro determinado.4. Existen varios tipos de redes que difieren en complejidad y eficacia: • • • De estados finitos Recursivas Aumentadas Es esencial reconocer que la gramática indica las siguientes asociaciones con el lenguaje: Una débil capacidad generativa. Estados Finitos.2 Redes de Transición Un modelo ampliamente usado en los SLN para implementar gramáticas se conoce por “Redes de transición”. para generar uno nuevo. integrada por estados (“nodos”) y condiciones (“arcos”) que se recorren o generan a lo largo de la evaluación o emisión de un texto. Ruta.38 Lenguaje Natural: Descripción de las Etapas para su Tratamiento 3. se considera “finito”.

En éste diagrama los círculos identifican a los “nodos” o “estados” mientras que los arcos a las “condiciones”. RTEF para una Simple Gramática. sin embargo hay casos donde pudieran generarse diversos estados a partir del mismo tipo. “El niño llora” Se representa gráficamente como aparece en la Figura 13: Art q0 q1 Nom q2 Verbo q3 Figura 13. Al ampliar los elementos de la gramática anterior de acuerdo con la red descrita en la Figura 14: Art q0 q1 Nom q2 Verbo Adjetivo q3 Verbo q4 Figura 14. “ La niña juega” Los ejemplos presentados de gramáticas son “determinísticos” porque sólo se produce un estado específico a partir de un mismo tipo de palabra. es decir. RTEF para una Gramática. Las redes empleadas en este modelo son dirigidas. para representar la secuencia en la cual las palabras pueden aparecer en una oración mediante el recorrido de una ruta a través de la red. tienen un sólo “estado inicial” y uno o varios finales (identificados por una diagonal). Por ejemplo: La red de una gramática que represente la secuencia: “Artículo Nombre Verbo” [11]. al “símbolo terminal” que produce la transición entre un estado actual y el subsiguiente. Gracias al uso de la cabeza de flecha se reconoce la dirección de la transición. convirtiendo la red a la categoría de las “no determinísticas” como se ilustra en la Figura 15: . Se pueden reconocer oraciones más amplias como: El niño gordo corre”.Análisis Sintáctico 39 Red de Transición de Estados Finitos (RTEF) Es la red más elemental que conecta los nodos por medio de arcos dirigidos. Para evaluar oraciones tipo: “El gato corre”.

incorpora a las condiciones el tratamiento de estados (además de los “símbolos terminales”). el caso contrario. porque su estructura o elementos no corresponden a la gramática representada. En la Figura 16 se muestra un ejemplo de una “RTR” del idioma inglés: En esta gramática se evalúan oraciones como: “The dog eats”.40 Lenguaje Natural: Descripción de las Etapas para su Tratamiento Art q0 q1 Nom q2 Auxiliar q3 Verbo Verbo q4 Verbo q5 Complemento q6 Figura 15. Por lo que incorporan a la red otras condiciones para representar a cada estado que etiqueta a los arcos de la red. el manejo de repeticiones consecutivas o discontinuas de símbolos terminales y también de estados. Red de Transición Recursiva (RTR) Amen de las características y elementos de las “RTEF”. ya se evaluaron todas las palabras de la oración original y aún no se llega a un estado final. “The little black dog run on the street” y “The american young boy at the fifth street has played the electric guitar with his old papa”. RTEF no Determínistica. de la manera mostrada en la Figura 16: . la evaluación de pruebas. de lo contrario se rechaza el arco y se evalúan los otros que salen del estado actual. hasta que alguno tenga éxito. Recorrer una “RTR” involucra evaluar los arcos de cada nodo. “ El jugador corrió mucho”. Si corresponde a un “Nombre de Estado” el control se traslada a la red que lo representa comenzando a recorrerla desde su estado inicial hasta alcanzar un estado final o hallar un error. entonces el control retorna al arco etiquetado. Las declaraciones que evalúa son: “ El joven ha corrido”. “ Los niños corrieron”. se hace “ backtrack” en los estados explorados para recorrer otras rutas aún no evaluadas. entonces se rechaza el texto que está siendo evaluado. si regresó con éxito transita al estado que apunta. Sin embargo pueden aparecer casos en los que la oración evaluada tiene palabras pendientes de ser analizadas y ya se alcanzó un estado final o bien. de lo contrario. si ninguna de ellas tiene éxito.

cada regla que empata agrega un elemento a la estructura o la termina de generar. La estructura más sencilla que produce es el “árbol de traducción “ en donde aparecen las reglas y el resultado del “empate”. 3. Descendente. de las condiciones al estado. . Al traducir una oración hay dos direcciones en que se puede llevar a cabo: Ascendente. aplicando a sus elementos las reglas en forma inversa.2.3 Parsers Independientemente de la gramática el proceso de ”traducción” compara las reglas contra las palabras del texto de entrada. Comienza con el símbolo “inicial” aplicando las reglas que puedan empatarse hasta alcanzar uno de los estados finales.Análisis Sintáctico 41 FN s AUX Fn q2 Det Fn Adj Nom q8 Prep Fp q9 Fn q6 q1 VER q4 AUX q3 Nom q7 FP VER Fn FP q5 q10 S: Oración Ver: Verbo Adj: Adjetivo Fn: Frase Nominal FP: Frase Preposicional Nom: Nombre Aux: Auxiliar Verbal Det: Determinante Prep: Preposición Figura 16. Parte de la oración de entrada. Sus niveles corresponden a la aplicación de una regla gramatical cuyos nodos representan una palabra o un nodo no terminal (ver Figura 17). es decir. generando un árbol cuyos nodos terminales representan las palabras del texto evaluado. RTEF de una Gramática del Inglés.

42

Lenguaje Natural: Descripción de las Etapas para su Tratamiento

La elección del sentido depende del factor de ramificación, la evaluación heurística, la información disponible y el mecanismo de traducción; siendo conveniente en ocasiones combinar las dos direcciones dentro del módulo traductor. Otro aspecto relevante a considerar es la cantidad y variedad de traducciones que se pueden generar a partir del mismo texto y gramática siendo necesario decidir si: • • • • Se van a explorar todas las alternativas Se acepta como única a la primera interpretación generada Al obtener varias, cómo se reconocerá a la mejor Cómo aprovechar la heurística para lograr que la mejor solución es la primer interpretación hallada. O

FN

FV

NOM

VERBO

FN

juan

tomó

ARTICULO

NOM

ADJETIVO

la Figura 17. Árbol de Traducción.

pelota

roja

Es necesario reconocer que el proceso de traducción de un texto es equivalente al problema de hallar una representación idéntica a otra, por lo que obliga a desarrollar una “búsqueda” dentro de un espacio de estados, invitando a emplear las herramientas de búsqueda ciega y heurística clásicas.

3.3 TEORÍAS DE CHOMSKY
En 1957, Chomsky publicó un libro intitulado “Reglas para la generación del lenguaje”, basado en las teorías formales del lenguaje expuestas por Bloomfield, expone una representación de “estructuras” que pretenden modelar el mecanismo natural-inherente del ser humano en el aprendizaje y generación del lenguaje.

Análisis Sintáctico

43

El fundamento de su teoría descansa en el hecho de que el lenguaje natural es infinito, pero que sin embargo la capacidad de entendimiento y expresión por el hombre, no depende únicamente de las palabras y oraciones que haya escuchado y hablado, sino que siempre hay términos y frases que aunque no integren su repertorio y experiencia en comunicación será capaz de comprenderlas y emitirlas llegado el momento. El núcleo de tal teoría es la observación de que el aprendizaje del lenguaje no sólo depende de memorizar todas las oraciones que el ser humano escucha y dice, sino que ante todo está dotado por un mecanismo capaz de interpretar y producir “estructuras del lenguaje”. Chomsky desarrolló el concepto de “gramáticas generativas” para representar a las estructuras naturales que el hombre emplea en el manejo del lenguaje, definiéndolas como: Una estructura formalizada con precisión matemática que genera sin un parámetro específico cualquier información que no está representada explícitamente en el sistema, dando vida a oraciones gramaticales que en conjunto integran un lenguaje, describiendo y asociando a cada una de ellas su descripción estructural o análisis gramatical. A lo largo del trabajo desarrolla las siguientes clases de gramáticas generativas: Gramática Generativa de Estado Finitos. Se concibe como una máquina capaz de representar y transitar por un conjunto de estados finitos, emitiendo un “símbolo específico” al pasar de un estado a otro. El proceso arranca a partir de un estado específico “inicial”, transita por diversas rutas generando palabras, para llegar a un estado dado, denominado “final”. A la secuencia de palabras emitidas se le llama “oración” y al conjunto de ellas se identifica como lenguaje, mientras que a la máquina se le conoce como “gramática de estados finitos”. Gramática Generativa de Estructuras de Frase. En lugar de manejar “palabras” específicas durante la transición de un estado a otro, se emplean “constituyentes” (verbos, sustantivos,....), las cuales pueden estar definidos por otros, y éstos a su vez por algunos más específicos hasta llegar a especificarse por “palabras”. Como por ejemplo: O -> FN -> FV -> ART -> NOM -> VERBO-> FN + FV ART + NOM VERBO + FN el, la, los, ..... casa, juan, perro,.... pinta, come, juega, cuida

La oración que se evalúa o genera tiene una representación estructural denominada “frase marcada”. Por ejemplo al aplicar la gramática anterior se produce la oración y frase marcada mostrada en la Figura 18. O-> FN + FV ART + NOM + FV el + NOM + FV el + perro + FV

44

Lenguaje Natural: Descripción de las Etapas para su Tratamiento

el el el el el

+ perro + VERBO + FN + perro + cuida + FN + perro + cuida + ART + NOM + perro + cuida + la + NOM + perro + cuida + la + casa O

FN

FV

ART

NOM

V

FN

el

perro

cuida

ART

NOM

la Figura 18. Estructura de Frase.

casa

Gramática Generativa Transformacional: Además de producir la “estructura de frase” como resultado de la primera etapa en el proceso, desarrolla a partir de dicha estructura una nueva denominada “componente transformacional” y concluye emitiendo otra llamada “componente morfémica”. Estas transformaciones sucesivas sobre la estructura frase permiten identificar ciertos aspectos que solamente aparecen a ese nivel de representación. Por ejemplo, una declaración en “voz activa” puede convertirse a “voz pasiva” para después “afinarse” y presentarse como una frase final tal como se muestra en la Figura 19: Aplicación de la gramática Estructura de la frase Jhon will break the window FN1 AUX VERBO Aplicación de reglas morfémicas

Componente morfémico The window will be broken by John

Aplicación de las reglas de transformación

Componente transformacional The windowwill be – EN break by Jhon

Figura 19. Desarrollo de una Gramática Transformacional.

Conjugación de Oraciones de una Gramática Transformacional. the chickens are ready to eat -> The chickens have been prepared for us to eat them. 2 the girl has a lovely voice integrando las oraciones se producen [ the girl [ the girl has a lovely voice]is singing] [the girl [the girl is singing] has a lovely voice] al transformarse produce al transformarse produce the girl who is singing has a lovely voice the girl with a lovely voice is singing the singing girl has a lovely voice Figura 20. Como resultado de las experiencias al aplicar esta gramática se observó la separación del nivel sintáctico de las oraciones producidas con respecto al contexto semántico en el que se expresan.Análisis Sintáctico 45 La “estructura de frase” dentro de este desarrollo viene a jugar el papel de “estructura de fundamento”. mientras que el “componente morfémico” desempeña el de “estructura frontal”. Por ejemplo. como por ejemplo: I am going to work -> I am not going to work. También manejan los casos de negación o interrogación de la oración. Muchas veces. Teoría de Sintaxis Como producto de las experiencias en la aplicación de las “estructuras sintácticas”. Maneja aspectos más interesantes y complejos que las antecesoras. Gramática Generativa de Transformaciones Generalizadas. provocando la emisión de oraciones sin sentido. si dos oraciones tienen el sustantivo en común se combinan por medio de una serie de transformaciones como se ilustra en la Figura 20: 1 the girl is singing . contradictorias o tergiversadas. Chomsky expuso en 1965 la “teoría de sintaxis” en donde la gramática consta de los siguientes componentes: . -> The chickens are hungry and ready to eat their food. la aplicación de reglas de transformación tratan con la relación existente entre el verbo y el sustantivo.

Cuando la descripción y rol del verbo ignora la naturaleza de las frases nominales que lo rodean (sujeto y objeto) se dice que es una gramática de “contexto libre”. O FN FV ART NOM V F género . semántico y fonológico. tipo tiempo . nombre . como por ejemplo: . se procura que no tengan la misma “estructura de la frase” mediante la adición de identificadores. número . Transformación. pero si las toma en cuenta e inclusive produce listas de atributos para cada una de ellas. en la Figura 21 se muestra una “frase marcada” con atributos asociados a sus elementos. Durante la fase desarrollada por el componente sintáctico su analizador léxico proporciona para cada palabra información de interés para los módulos sintáctico. Atributos de los Símbolos de un Frase Marcada. Figura 21. se dice entonces que es una gramática “sensitiva al contexto”. tiempo sujeto . . . en donde los nodos que terminan con esa lista se denominan “símbolos complejos”. Por lo que concierne a la transformación de la “estructura fundamento” a otras como las interrogaciones y preguntas que provocan una diferente interpretación. animado persona número tipo . Por ejemplo. nombre animado animal número .46 Lenguaje Natural: Descripción de las Etapas para su Tratamiento Sintáctico Base: Compuesto por reglas que producen la estructura de la frase y reglas de intersección léxica. mientras que el fonológico la “maquilla” para su exposición. Semántico Fonológico El componente sintáctico es “generativo” pues produce las “estructuras fundamento” que alimentan a otros dos componentes de carácter “interpretativo” ya que el sintáctico asocia a la “estructura de la frase” su significado. objeto . género número .

Maquillaje “Estructura Fundamento” “Estructura Fundamento” Figura 22. en donde se separa la función de la semántica con respecto a la transformación. usan un “Árbol de traducción” como estructura de las palabras de la oración que “empata” con los elementos de la red.Análisis Sintáctico 47 Estructura Frontal The tree is growing The tree is not growing Is the tree growing <<<- Estructura Fundamento The tree grow .4 REDES DE TRANSICIÓN AUMENTADAS (RTA) Las “RTR” emplean más condiciones y acciones para recorrer una red. 3. cuando una oración se genera de otra.(+ progresivo) NEG The tree grow -(+ progresivo) Q the tree grow -(+ progresivo) El componente semántico emplea reglas de producción y marcadores semánticos para formar rutas amalgamadas que identifican varios sentidos de la oración. A pesar de las previsiones para evitar la “degeneración” del significado de una oración. . Funcionamiento de la Teoría de Sintaxis. con el objeto de no cambiar el significado. como por ejemplo: “John sprayed paint on the wall”-------->“The wall sprayed with paint by John” BASE Reglas Análisis Léxico Reglas de inserción léxica “Estructura Fundamento” SEMÁNTICO Reglas de Marcadores proyección Semánticos TRANSFORMACIÓN Transformaciones Estructuras de semánticos árbol Rutas Amalgamadas “Estructura Fundamento” Fonólogo: Componentes. que a su vez tienen la misma “estructura de frase”. También varias partes de la oración son mantenidas como registros hasta que la estructura completa pueda ser determinada. La interrelación de los componentes se ilustra en la Figura 22. aún se puede presentar el problema.

.48 Lenguaje Natural: Descripción de las Etapas para su Tratamiento Por ejemplo. POP Es un arco “Dummy” usado para determinar si un estado terminal ha sido alcanzado y cómo será la construcción final. como por ejemplo si es pasiva o interrogativa. Sin embargo en las “RTA” hay cuatro clases de arcos: CAT Es el arco original en el símbolo terminal que identifica la clase de palabra o categoría que causó que el arco haya sido considerado. SENDR Transfiere el valor al siguiente nivel inferior de la red para asignarlo a un registro. LIFT Transfiere el valor el siguiente valor superior de la red para su asignamiento. las “RTA” usan la nomenclatura siguiente: < Red Transición > --> (< arcos > < arcos > * ) < arcos > --> (< estado > < arco > * ) < arco > --> (CAT < categoría > < prueba > < acción > * < acci_term > | (PUSH < estado > < prueba > < acción > * < acci_term > | (TST < etiqueta > < prueba > < acción > * < acci_term > | (POP < forma > < prueba > ) o < acción > --> (SETR < registro > < forma > ) | (SENDR < registro > < forma > ) | (LIFTR < registro > < forma > ) < acci_term> --> (TO < estado >) | (JUMP < estado >) < forma > --> (GETR < registro >) | * | (GETF < característica >) | (APPEND <registro> <forma>) | (BUILD <fragmento> <registro> *) * Indica un elemento repetible en la especificación del lenguaje. palabra o frase. Los arcos CAT. como en las “RTR”. similarmente. Al usar la función PUSH implica moverse a un nivel más bajo de la red de transición comenzando en el estado cuyo nombre es especificado. TST y PUSH tienen una prueba y acción terminada al menos que debe ocurrir. Hay tres posibles acciones usadas para construir las partes de la oración: SETR Asignan un valor al registro especificado. Se pueden hacer pruebas sobre parte de la oración que ha sido construida. cuando se encuentra un verbo. & Actual valor de entrada. éste se almacena en un registro tipo “V” (Verbo). el elemento con el que se está trabajando. PUSH Inserta elementos en la pila POP Saca elementos de la pila <arcos> Una RTA se define por uno o más conjunto de arcos ( *) donde un arco es un estado con sus arcos asociados. PUSH Es el arco con un nombre de estado. todas las palabras de una “FN” (Frase Nominal) se guardan en un registro clase “FN”. TST Permite usar un arco de acuerdo a una condición arbitraria y no solamente porque una palabra específica es encontrada.

JUMP Señala el nodo a procesar sin mover el apuntador del texto de entrada. para que al final genere la siguiente estructura: (S DCL (FN (Dete el) (Adje) (Nomb niño)) (FV (Vcome) (FN (Dete un) (Adj) (Nomb helado) )) Conforme a la gramática de la Figura 16 se describe a continuación el lenguaje tipo “RTA” que corresponde al “nivel superior” utilizando el “/” para señalar el comienzo de una “RTA” cuyo nombre aparece antes. ya que las palabras aún no han sido “empatadas”. Por ejemplo. y el contenido del registro “V” en la posición de “+”. se puede agregar una frase preposicional al final de una nominal que ya ha sido formada y colocada en el registro “FN”. GETF Determina el valor de un atributo específico de la palabra de entrada actual APPEND Adhiere valores al contenido del registro especificado. Después identifica que la entrada actual “un helado” es una “FN” luego encuentra la regla de arriba. BUILD Construye partes o toda la frase final a partir del contenido de los registros especificados. TO Indica que el apuntador de entrada será movido a la siguiente palabra del texto de entrada y que nodo será procesado a continuación. seguido de uno o mas signos “+” para indicar los nodos a ser incluidos y finalmente los atributos y registros cuyos valores sean derivados. La frase: “El niño come un helado” genera la “FN” “El niño” que asigna al registro “Sujeto” y el verbo “Come” al registro “V”.Análisis Sintáctico 49 Las acciones terminales TO y JUMP especifican si el proceso debe ser terminado con la palabra actual o frase. construyendo la “FV” “come un helado”. Señala primero el fragmento a construir. por ejemplo: (SET FV (BUILD (FV ( V + ) & ) V ) ) Primero construye el fragmento FV colocando el valor actual en la posición de “&”. ( (S / (PUSH FN /T (SETR SUJETO &) (SETR TIPO “DCL”) (TO Q1) ) (CAT AUX T (SETR AUX &) (SETR TIPO “Q”) (TO Q2) ) ) . si el apuntador a la entrada deberá se movido o deberá permanecer donde está y cual estado será procesado a continuación. Las funciones usadas para describir los datos manipulados son: GETR Regresa el valor de un registro específico. tal como se muestra en al gramática que aparece en la Figura 23. y a continuación asigna el fragmento al registro “FV”.

Gramática. .50 Lenguaje Natural: Descripción de las Etapas para su Tratamiento (Q1 (CAT V T (SETR AUX NIL ) (SETR V & ) (TO Q4) ) (CAT AUX T (SETR AUX & ) (TO Q3) ) ) (Q2 (PUSH FN/T (SETR SUJETO &) (TO Q3) ) ) (Q3 (CAT V T (SETR V &) (TO Q4) ) ) (Q4 (PUSH FN/T (SETR FV (BUILD (FV (V +) &) V) ) (SETR CFP NIL) (TO Q5) ) (POP (BUILD (S+++(FV +) ) TIPO SUJETO AUX V) T ) ) (Q5 (PUSH FP/T (SETR CFP (APPEND (GETR CFP) FPR ) ) (TO Q5) ) (POP (BUILD (S++++) TIPO SUJETO AUX FV) T) ) (FN/ (CAT Name T (SETR NAME &) (TO Q8) ) (CAT Det T (SETR DETER &) (SETR ADJE NIL) (TO Q6) ) ) (Q6 (CAT Adj T (SETR ADJE (APPEND (GETR ADJE) (LIST &) ) ) (TO Q6) ) (CAT Name T (SETR NAME &) (SETR CFP NIL) (TO Q7) ) ) (Q7 (PUSH FP/T (SETR CFP (APPEND (GETR CFP) FPR ) ) (TO Q7) (POP (BUILD (FN (Dete +) (Adje +) (Nomb+)+) DETER ADJE NAME CPF ) T ) ) (Q8 (POP (BUILD (FN (Nomb + ) ) Name ) T ) ) (FP / (CAT Prep T (SETR PREP &) (TO Q9) ) ) (Q9 (PUSH FN/T ( POP (SETR FPR(BUILD (FP (Prep +) &) PREP) ) T ) ) ) Figura 23.

frontal.. FV. algoritmos y estructuras de datos necesarias en la construcción del subsistema de análisis sintáctico. su “hijo” y “hermano” conforme a la siguiente Tabla 13. FN. para después proceder al diseño de las reglas y redes correspondientes. Recorrido de las Estructuras.) Descendiente: Apuntador Hermano: Apuntador Antecesor: Apuntador Unidad Léxica: Apuntador El árbol ligado con esta clase de registros tiene la siguiente ilustración. pilas..El campo “Unidad Léxica” almacena el apuntador a la descripción léxica del símbolo terminal reconocido como se aprecia en la Figura 24. Artículo. donde se indica la secuencia a explorar de nodos y ramas: Tabla 13..Análisis Sintáctico 51 Otras frases que son validadas generan un resultado: “John run “ ---( S DCL (FN (Nomb John) ) ( FV (V run) ) ) “Will Marie drink the milk and coffe” (S Q (FB (Nomb Marie) ) Will (FV (V drink) (FN (Dete the) (Adje) (Nomb milk) (FP (Prep and) (FN (Nomb coffee) ) ) ) ) ) 3.) pueden representarse por medio de nodos con el siguiente formato de registro: Constituyente: (Oración. Por tal motivo a continuación se ofrece una descripción de su aprovechamiento [12]: Estructuras ligadas. . Formato de la Estructura Temporal Fuente. Entre los elementos más útiles al momento de la implementación del módulo están: las estructuras ligadas. recursividad.. Adverbio. Método de Recorrido Visita al Nodo Padre El árbol del hijo El árbol del padre Preorder 1 2 3 Inorder 2 1 3 Postorder 3 1 2 . Los diversos tipos de estructuras (de frase. El análisis y generación de oraciones almacenadas en las estructuras ligadas debe apoyarse en un eficiente mecanismo de creación y acceso. en donde la “X” representa nulo y “Ç “ el llamado a la función que identifica la palabra reconocida (símbolo terminal).5 DESARROLLO DEL MÓDULO SINTÁCTICO El desarrollador debe elegir el tipo de gramática que más se ajuste a la naturaleza y componentes del lenguaje a representar. También deberá elegir el medio de programación más flexible que disponga para el manejo de funciones.. reglas. en donde el orden en el recorrido entre nodos puede o no facilitar la tarea.. compiladores e intérpretes. Para ello existen tres direcciones y órdenes clásicas a considerar al momento de visitar un nodo “padre”.. tablas. listas.

interpretación y manipulación de las reglas es un factor determinante en la eficiencia del subsistema de análisis sintáctico por lo que se debe diseñar estructuras y mecanismos de acceso adecuados. A través de usar “CAR” como etiqueta del arco y condiciones en el “CDR” se almacena cada regla: ( ó (FN FV) ) ( FN ( Art Nombre ) ) ( Art ( el la los . Adjetivo. Verbo. Representación de las reglas. Los estados y arcos de la red se relacionan con una tripleta en cada localidad. Q1. . Q4. Donde “Ni” es el nodo del cual sale el arco y “Ns” es el nodo a donde llega el arco “a”. Verbo. Q3. Por ejemplo: (Qo. Verbo. En la primera se compila la gramática generando varias tablas y estructuras de datos y en la otra se interpreta. Estructura Ligada para una Frase. Nom. a. T). a. Q1) (Q1. de acuerdo con el formato: ( Ni. Verbo.Q2) (Q2. E) (Q2. Art. Q4) Reglas: Mientras que la relación entre los elementos de una regla (estado actual-->arco) y los nodos de una red se representan por medio de un arreglo de cuatro campos con el formato: (Ni. T) (Q1. T) (Q2. Ns). Nom. El almacenamiento. F) Implementación de RTA. en donde “T” indica el Tipo de arco que se usa: “E” de estado (se compone por su propia red) “T” terminal (se divide en símbolos terminales) “F” estado final de la red. Adjetivo. F) (Q3.. acceso. Q4. (Qo.52 Lenguaje Natural: Descripción de las Etapas para su Tratamiento O X X X FN X FV X X ART E N X perro V come Figura 24. usando dicha información al contrastar el texto a evaluar. como se ilustra en la Figura 25. ) ) Tablas. Dentro de las alternativas de representación de reglas tenemos las siguientes: Listas. Q4) (Q3. explotando las capacidades del lenguaje de programación empleado. Se puede concebir el análisis de una oración como un proceso que atraviesa por dos etapas. Q3) (Q2... Q2. Art. Ns.

Es conveniente grabarla como una lista observando el mismo formato de entrada. Tabla de comandos. CDR. Durante la primera fase se producen las siguientes tablas: Gramática que se introduce al “compilador” de la fase 1. identificando fácilmente a cada tipo de elemento por su posición en la lista de la gramática de entrada.4.Análisis Sintáctico 53 Gramática Texto de entrada Fase 1 Compilador Gramatical Fase 1 Interprete Gramatical Gramaticalmente almacenada como Oración analizada en sus componentes estructurales Tabla de comandos Tabla de registros Tabla de nombre de estado Tabla ATN Figura 25.. Dentro de cada arco (lista) hay un “nombre de estado” y a continuación un nuevo nivel de listas que define “posibles arcos”. Tabla de nombres de estado. Al más alto nivel es una lista de un conjunto de arcos representados por listas. Son inicializados conforme la gramática es leída.. Cada arco proporciona una lista de acciones a ser ejecutadas si el arco es tomado. aplicando las funciones clásicas de acceso de listas del lenguaje LISP como CAR. Programa para Gramática tipo RTA. ATN y de registros. La estructura es una lista de listas de. Almacenamiento de la gramática.. Los nombres ATN van seguidos por el “/” . Member. etc. El formato mostrado en el ejemplo de la sección 4.. en función del índice que se le asigne será ejecutada por la función “case” preconstruida durante la segunda fase. Estos son nodos acompañados por la descripción de condiciones y pruebas definidas para él. Cada localidad tiene un nombre de comando distinto a la gramática alimentada al momento de ser “analizada”. ya que: Un nombre de estado es el “car” de cada conjunto de arcos (Q1. Las acciones son concluidas por una acción terminal (o símbolo).

inicializándose al comienzo de la gramática para actualizarse apuntando al siguiente nodo asignando el valor del “apuntador next” del nodo que actualmente está procesando.54 Lenguaje Natural: Descripción de las Etapas para su Tratamiento Los nombres de registro ocurren en las declaraciones de acción y varía el lugar que ocupan acorde con el formato de la instrucción: (SETR AUX &). También se emplea un “contador de localidad” para señalar el nodo a procesar. Mientras que en la fase de “interpretación” la “clave” está en usar un proceso “case” para ejecutar los comandos indexados por la tabla. ATN o registro y su apuntador. Cuando un arco terminal es alcanzado (ya sea TO o JUMP) el nombre de estado al cual se apunta será encontrado en la “tabla de estado” y el apuntador del nodo al que corresponderá será el nuevo valor del contador de localidad. Por ejemplo “CAT” al determinar que categoría asociada es “verdad”. . entonces las acciones del arco son ejecutadas. Cada rutina de comando explota los parámetros requeridos de la gramática y llama a la rutina apropiada. El formato de las tablas es idéntico: Nombre del estado. la acción terminal causará el retorno de la rutina con el “contador de localidad” apuntando al siguiente nodo a ser ejecutado.

ANÁLISIS SEMÁNTICO .CAPÍTULO 4.

.

que le proporciona una “personalidad” específica dentro del contexto que usa. acceso. animal. … Tipo de ser: humano. Tiempo: permanente. ámbito familiar. Reconociendo que dentro de este marco existen otros dominios más pequeños y específicos en función de ciertas particularidades (región. homónimos. país. entendimiento..4. expresión. acrónimos. símbolos) y sus asociaciones (frases.. educacional... padre.. largo. explotación y actualización de las representaciones de conocimiento sobre el leguaje. edad. el conocimiento “mundano” y el del “dominio” de la aplicación que se emplee dentro del sistema. Significado Es el concepto. Receptor: empleado... Poniendo particular atención a la definición. significado o propósito. .2. hasta las estructuras más complejas integradas por sus elementos llevan consigo un concepto. Su diseño conserva una plena integración con el resto de subsistemas en el aprovechamiento de “unidades léxicas” (UL).2 ELEMENTOS 4.…) son como “entes” inanimados al carecer de significado. Por lo que el significado o valor real de un elemento o asociación del lenguaje va íntimamente ligado al “contexto” en que es expresado y a quién va dirigido (ver Figura 26) [10]. etc. El subsistema de análisis semántico como parte de un SLN representa el núcleo del “conocimiento” que domina la aplicación y en función a su variedad y detalle será la riqueza de vocabulario. Circunstancia: necesidad.. urgencia.. . guerra. corto. hijo.) y por lo tanto el significado particular que se asocia a sus elementos.. ANÁLISIS SEMÁNTICO 4. “validación de oraciones”. El significado tiene atributos de: • • • • • • • Alcance: universal. regional.).. oraciones.. aceptado y empleado por los miembros de la sociedad que aplica dicho lenguaje como medio de expresión y entendimiento [9]. respuesta y utilidad que el propio sistema ofrezca. . es por ello que desde los átomos del lenguaje. . .. antónimos. razón o conocimiento que está detrás del símbolo o expresión oral. área profesional. . de moda. idea . También debemos reconocer que al momento de “compilar” significados a expresiones verbales o escritas.. actividad.1 Contexto Es el ámbito social en donde se circunscribe el lenguaje que se emplea (raza.. Emisor: funcionario.. niño.. otorgándole “vida” y razón de existir. que es asignado. fin. los cuales vienen a alterar el manejo del lenguaje. actividad. . nivel cultural... rutinaria.1 NATURALEZA Los componentes del lenguaje (palabras. religión. “diccionarios” y “representaciones internas” tanto del texto interpretado como del generado. idea. Contexto: cultural. modismos. 4. surgen las variantes de: sinónimos.

2.58 Lenguaje Natural: Descripción de las Etapas para su Tratamiento Lengua Castellana Popular En México en la costa norte Cómputo Eventos Eventos Figura 26.3. Si bien la relación que guardan los caracteres del alfabeto para integrar “palabras” es observada en el subsistema de análisis léxico y la asociación entre sujetos. . La descripción sintáctica usa “marcadores gramaticales” para identificar los posibles usos de una palabra. A cada “Unidad Léxica” le acompaña una descripción fonológica. 4. como se ilustra en la Figura 27. detectar anomalías en su significado e identificar asociaciones entre las oraciones. 4. verbos y objetos es evaluada por el análisis sintáctico. mientras que la semántica incluye “marcadores semánticos” y “distinguidores” para hacer diferenciaciones esenciales de “rol” del significado así como para describir a este. Generan distintas interpretaciones de la oración. Este es en resumen el objetivo del analizador semántico.3.1 Teoría Semántica Jerrold Katz y Jerry Fodor en 1964 publicaron “La Teoría de la Estructura de una Semántica” enfatizando la distinción de los niveles de análisis sintáctico del semántico. tampoco lo sería para las palabras al estar aisladas unas de otras. Inclusive al formar frases y estar desunidos no alcanzarían la riqueza expresiva de un texto. es conveniente concebir al lenguaje como un “sistema” con elementos específicos e interrelacionados con el propósito de compartir conceptos. otra sintáctica y una semántica con sus diversos significados. su pretensión fue a través de la teoría semántica describir la “habilidad interpretativa” de las personas en consideración a su capacidad para reconocer a los componentes de una oración. Reglas de proyección. Por tal motivo. Dicha teoría emplea dos componentes [11].3 Relación De igual forma que los elementos del alfabeto al permanecer separados entre sí no tendrían utilidad alguna. Contexto de un Lenguaje. Diccionario. en el semántico se cuida la correspondencia entre el contexto y el significado de cada elemento de la oración para atribuirle un valor específico conforme a la naturaleza de la expresión. ESTUDIO DE GRAMÁTICAS SEMÁNTICAS 4.

Marcadores Semánticos. ofreciendo el sentido apropiado para cada uno de ellos. NOTA: ( ) Marcador Gramatical. comparan el significado de las palabras de una oración con los posibles significados de esta. como por ejemplo: This suit is too light Reglas de proyección El saco es de color claro El saco está hecho de un material ligero Interpretaciones Figura 29. Ejemplo de Distinguidores. al menos que el contexto de la oración sea el de un “cuento” entonces los “distinguidores” deberán estar descritos acordes con cada contexto en los cuales la palabra puede ser protagonista. Pero si el único sujeto es la palabra “árbol” entonces será desechada la interpretación clásica del verbo. ilustradas en la Figura 29. . { } Marcador Semántico. Marcadores Usados en la Teoría Semántica.Análisis Semántico 59 DRIVER nombre adjetivo COCINA nombre verbo Driver ROJO nombre adjetivo (nombre) {humano} (verbo) {humano} {ocasional} [capaz de manejar un vehículo cuya ocupación no es la de conducir autos] {profesional} [ocupación: conductor de autos] {ejecutable} [instrucciones de cómputo] {configuración} [declaraciones de las características de los recursos de cómputo] Figura 27. Las “reglas de proyección”. asociando los “marcadores semánticos” con los “distinguidores”. [ ] Distinguidor Los “marcadores semánticos” describen los elementos del lenguaje y se emplean al correlacionar el significado entre las palabras señaladas en la Figura 28: requiere VERBO: cantar un sujeto palabra con sujeto animado marcador semántico Figura 28. clarificando las ambigüedades.

[Abundancia de colores contrastantes]<(objeto físico) V (actividad social) > A. procurando alcanzar la “mejor” de la forma más económica posible. Ball: Nombre. Ball. Ball. Nombre. {objeto físico}.2+A IV. {objeto físico}. Colorful: Adjetivo. [Distintos caracteres y expresiones]<(objeto conceptual V (actividad social) > C.60 Lenguaje Natural: Descripción de las Etapas para su Tratamiento A este proceso de aplicación de reglas se le conoce como “rutas amalgamadas”. compuesta de condiciones conjuntas que al cumplirse todas emiten una conclusión específica “interpretación” equivalente a desarrollar un “espacio de estados” en donde se emiten cero o varias interpretaciones finales. [propósito de recreación a través del baile] < (Evento) > B. en el cual se genera un universo de interpretaciones del significado para una oración. [forma esférica de material ligero] < (juguete) V (instrumento deportivo) > 2.2+B Al considerar que el verbo “hit” requiere un objeto con un “marcador semántico” {objeto físico} II IV Al considerar mas la naturaleza de “hit” quedaría la interpretación II Figura 30.1+A 11. (color). Rutas Amalgamadas para Interpretar una Oración. . El formato de las “reglas de proyección” es equivalente al de las “reglas de producción”. como se ilustra en la Figura 30. the man hits the colorful ball Se generan interpretaciones 1. [forma esférica de material pesado] < (armamento) > Al continuar el proceso de rutas amalgamadas 1. {actividad social}. Nombre. 1 +B 111. (evaluativo). Colorful: Adjetivo.

La “estructura base” contiene los componentes esenciales pero no necesariamente las palabras que aparecerán en la “estructura frontal”. . Por ejemplo. Dicho de otra manera. ya que al producirse la primera debe registrar todo el significado que sea posible asociar. la cual se indica por la combinación del significado “thick” y las características del verbo [+ PRO] e [+ INCHOATIVE]. como por ejemplo: El metal esta duro | El metal endureció The sauce is thick | The sauce thickened Estas semejanzas pueden explicarse por las transformaciones léxicas que se aplican. dicha situación “léxica” será una de tantas transformaciones aplicadas durante la generación de una oración como se aprecia en la Figura 31: Frase Marcada (Estructura base) “We exterminated Whales”. destacan la similitud entre la “estructura base” de una oración y la “representación de su significado”. como en el ejemplo de la Figura 32 donde se muestra la progresión desde el más bajo nivel de la estructura base hasta su mas alto nivel. por lo tanto comienza con la representación del significado.. “crear”.. Estas semánticas observan las similitudes entre ciertos adjetivos y verbos. S NP We V cause NP S NP VP VP NP S VP V become V alive Frase Frontal “We caused whales to become dead” “We caused whales to die” S NP We V VP NP V whales V dead cause become whales Mod not Figura 31. “vivir”.Análisis Semántico 61 Semanticas Generativas Propuestas por Fillmore. lo interpreta para emitir la “estructura frontal” y aplica las “reglas fonológicas” para arrivar a la representación fonológica. . o progresivo e inicial o formativo. “llegar a ser”. la palabra “nacer” será base tipo: “causa”. Frases Emitidas por una Semántica Generativa. la oración expresa que la “sauce thickens” ( ) transformándose paulatinamente desde un estado inicial al estado del ser "thick". En esta interpretación thicken significa llegar a hacerse thick.

Aplicada para objetos indirectos que resultan afectados por la acción. “Aquel pollo tiene una lombriz”. Usado para nombres y pronombres que correspondan al objeto del verbo en forma directa. Localidad. “Juan le pego al niño con un balón”. "Juan puso el vaso sobre la mesa”. Dativo. “María prestó a Lourdes su vestido”. Indica el lugar u orientación espacial de la acción. “El policía disparó hacia arriba”. 4. Frases Marcadas por una Semántica Generativa. Objetivo. . Neutral. Se emplea para el sujeto. conforme a la siguiente clasificación [9]: • • • • • • • Agente. predicado nominativo o un nombre ligado al sujeto por un verbo copulativo. Posesivo genitivo. Muestra membresía o pertenencia.62 Lenguaje Natural: Descripción de las Etapas para su Tratamiento S FN S For the sauce to be thick S FN ART N AUX PAST S FN ART the N sauce AUX PAST FV S AUX PASADO FV V +V +PRO +INCHOATIVE V for to be thick +PRO +INCHOATIVE FV V thicked +INCHOATIVE Figura 32. “La pelota rompió el vidrio”.4 GRAMATICAS CASE En 1967 Charles Fillmore presentó el trabajo intitulado “Un caso para un caso” donde ofrece una “estructura case” para nombres y pronombres mostrando la relación de una palabra con otras. Es el objeto sobre el que se actúa. Instrumental Fuerza inanimada u objeto envuelto en la acción. “El auto rojo de Carlos”.

Indica partes adverbiales de la oración: “El señor cerró la puerta fuertemente” Momento. Señala el tiempo en que ocurre la acción: “Juan tomó el vuelo a la última hora” Los mecanismos que identifican los específicos “cases” adecuados para un verbo se conocen por “Case Frames” e indican cuales estructuras son “no permitidas”. .. Forma. Momento. Modales V+C1+C2+. Esencia. Esencia..+ Cn La preposición es el verbo acompañado de uno más estructuras case distintas Correr beber. cada una asociada a una particular relación “case”: Oración Modalidad Preposición V Ci K FN Modalidad + Preposición Modo. Expresa la naturaleza de la oración: declarativa. Manera. K + FN (preposición) (preposición) + ( Art) + (Adj | N)* + N + (oración | FN) Donde * significa repetición.. ( opcional | alternativo). amar.Análisis Semántico 63 Su énfasis se orienta a la estructura básica de una oración compuesta de un verbo y una o más frases nominales. hube. Oración por Medio de una Gramática Case. has.. Aspecto.. ... Muestra el sentido de la oración: positiva “El niño juega”. Aspecto. requeridas y opcionales. Agrega valor al tiempo indicando si la acción es continua: perfecto “El niño esta llorando” o si ha sido completada imperfecto “La niña estuvo cantando” Forma.. Son los verbos auxiliares: he. como en el ejemplo descrito en la Figura 34 y 35: Abrir [Objetivo (Agente) (Instrumental)] Juan abrió la puerta A: Juan O: La puerta La llave no abrió la puerta I: La llave O: La puerta Juan abrió la puerta con la llave A: Juan I: La llave O: La puertaZ . estática “Ella si esta trabajando” y progresiva “Los muchachos están jugando” Modo... Tiempo. que individualmente identifican un aspecto de la frase verbal de acuerdo a los siguientes criterios: Tiempo.. interrogativa. pasado. Agrega información de la intensidad del verbo: simple “El perro ladra”. Presente. negativa “Carezco de dinero” e indeterminada “quizás llueva” Modales. La modalidad de la oración es definida por la combinación de varios modos. como en el ejemplo de la Figura 33: “Peter will not steal the dog” Modalidad Negativa Futuro Declarativo Peter steal the dog Verbo C1 steal Peter C2 the dog Figura 33.. Manera.

on. Los verbos se asocian a “case frames” por medio de un identificador en el diccionario. in: Localidad Of. donde un mismo “case frame” se puede aprovechar para varios verbos. Oración en Voz Activa. en el idioma inglés se reconocen preposiciones específicas para cada estructura “case”. Oración Negativa Expresada por Medio de Case Frame.64 Lenguaje Natural: Descripción de las Etapas para su Tratamiento Golpear [Objeto (Instrumental) (Agente)] Pedro golpeó al niño con el balón O M Pasado Declarativo Simple Negativa Indeterminada Verbo golpear F Agente Pedro Instrumento el balón Objeto al niño Figura 34. como se muestra en la Figura 36: “Alguien golpeó la puerta con el balón”. K instrumento con el balón complemento 3 K nil Objeto la puerta . Dar [Objeto (Agente) (Dativo)] Maria le dio su libro a Raquel O M Pasado Imperfectivo Simple Positivo Declarativa Verbo dar F Agente María Dativo Raquel Objeto su libro Figura 35. Oración Positiva Expresada Medio de Case Frame. O M verbo golpear F complemento 1 complemento 2 K agente nil alguien Figura 36. from: Posesivo Aunque no es indispensable que exista una preposición para ayudar a identificar al tipo de estructura. By: Agente By o With: Instrumental To: Agente At. Las preposiciones ayudan a expresar la relación entre el verbo y la frase nominal.

Oración en Voz Pasiva. Por lo tanto. Los “cases” restantes son agregados en función al tipo de preposición. si la FN que precede al verbo es de un ser animado. entonces la FN que sigue al verbo será el “objeto”. el “instrumental” puede ser el sujeto en una oración activa. La herencia monótona se puede manejar mejor con este tipo de estructura que con la lógica pura. se puede asumir que se trata del “agente”. debe ser entonces el sujeto. que en este caso debe ser un ente animado. se haría el siguiente tratamiento: La preposición “con” identifica “el balón” como un case tipo “instrumental”. al interpretar la oración: “Juan rompió el vidrio con el balón” . Por ejemplo. y la herencia no monótona puede soportarse muy fácilmente [12]: .5 REDES SEMÁNTICAS Una red semántica es un tipo de estructura de ranura y relleno. la primera es el objeto y la segunda el instrumento. Pero si dos frases nominales siguen al verbo.Análisis Semántico 65 Mientras que en la Figura 37 se expresa la oración de voz pasiva: “La puerta fue golpeada con el balón por alguien”: O M verbo golpear F complemento 1 complemento 2 K agente por alguien K instrumento con el balón complemento 3 K nil Objeto la puerta Figura 37. Para identificar el sujeto y objeto de la frase no hay preposiciones que auxilien. Si el “case” mas a la izquierda del “case frame” es obligatorio. 4. Mientras que el análisis de oraciones procura identificar los “cases” correspondientes a las preposiciones y comenzar a “llenar” los “huecos” del “case frame” correspondiente al verbo. La generación de oraciones que emplean “estructuras case” aplican 3 reglas: • • • Sujeto. por lo que se usa el conocimiento asociado a las palabras en sus unidades léxicas y evalúan el tipo de sujeto asociado al verbo de la oración. resulta adecuada para soportar la herencia a lo largo de los enlaces ”es – un” e “instancia”. Si no existe el ”agente”. Objeto. Los objetos no tienen preposiciones y debe situarse el “case” en el extremo derecho del “case frame” Frases Preposicionales.

es que en los sistemas de ranura y relleno el conocimiento está estructurado como un conjunto de entidades acompañadas por sus atributos. Esta clase de razonamiento utiliza una de las grandes ventajas de las estructuras de ranura y relleno sobre las representaciones puramente lógicas. Este proceso se llamó búsqueda de intersección. Con este proceso es posible usar la red de la figura siguiente de manera que se puedan responder preguntas tales como ¿Cuál es la conexión entre Brooklyn Dodgers y azul?. ya que se establecen compromisos en la relación con el contenido de las representaciones. Mamífero) equipo (Pee-Wee-Reese.2 Representación de Predicados no Binarios Las redes semánticas se pueden considerar como un modo natural de representar las relaciones que podrían aparecer como instancias de los predicados binarios en la lógica de predicados. Azul) .5. Esta estructura tiene una gran utilidad además de soportar la herencia. observando donde se encontraba dicha activación. 4. A continuación se describe el enfoque de redes semánticas. tal como aparece en la Figura 38. sus representaciones y las técnicas para razonar con ellas. Red Semántica Binaria. Por ejemplo.5.1 Búsqueda Una de las primeras formas de usar las redes semánticas fue para encontrar relaciones entre objetos. ya que tienen la ventaja de organizar conocimiento en función a las entidades que proporcionan las representaciones de ranura y relleno.66 Lenguaje Natural: Descripción de las Etapas para su Tratamiento La razón por la que la herencia se ejecuta de un modo sencillo. Mamifero es-un Persona tiene-parte Nariz instancia azul Pee-Wee-Reese equipo Brooklin-Dodgers Figura 38. Brooklyn-Dodgers) instancia (Pee-Wee-Reese. dividiendo la activación a partir de cada uno de los dos nodos. Persona) color-del-uniforme (Pee-Wee-Reese. 4. algunos de los arcos de la figura anterior se podrían representar en lógica como: es-un (Persona. Describe las relaciones de las propiedades fácilmente. por las siguientes razones: Indexa los predicados binarios en función de su primer argumento. A este tipo de estructura se le conoce como de “relleno fuerte”. Se implementa mediante la programación es orientada a objetos.

5-3). se puede expresar en redes semánticas. descubrir el libro concreto al que se refiere la frase es similar al problema de decidir el antecedente correcto de un pronombre. Los predicados de tres o más argumentos también pueden convertirse a forma binaria creando un nuevo objeto que represente todo el predicado. Se representa en una red semántica creando un nodo que muestre el juego específico G23 y se relacionan las tres partes de la información con dicho nodo. Esta técnica es útil para representar los contenidos de una oración declarativa típica que describa distintos aspectos de un evento en concreto. Dodgers. La figura siguiente muestra la red que surge al hacer esto. y puede ser un problema muy complicado).Análisis Semántico 67 También el conocimiento expresado en predicados de mayor aridad. Red Semántica Relacional. tal como se ilustra en la Figura 40: dar agente es-un Ev 7 libro instancia objeto Juan Lb 23 beneficiario Mary Figura 40. de la forma ejemplificada en la Figura 39. Supóngase que se sabe: marcador(Cubs. y después introduciendo predicados binarios para describir la relación con este nuevo objeto de cada uno de los argumentos originales. Red Semántica n-aria. hombre) y de este modo es mucho más fácil hacer la representación en una red semántica. Así por ejemplo: hombre(Marco) se podría reescribir como: instancia(Marco. . algunas de las primeras aplicaciones de las redes semánticas fueron en programas de comprensión del inglés. De hecho. Partido Equipo visitante cubs es-un G 23 marcador 5-2 equipo local dodgers Figura 39. La frase “Juan le dio el libro a Mary” Se podría representar por medio de una red como la que se muestra en la siguiente figura (El nodo etiquetado como LB23 representa el libro concreto al que se refiere la frase “el libro”.

debería haber una diferencia entre un enlace que defina una nueva entidad y otro que relacione dos entidades ya existentes. (¿aumentaría el número 1. Los nodos Al y A2 son dos nuevos conceptos para representar la estatura de “Juan” y la estatura de “Bill” respectivamente.72?). Utilizando estos conceptos definidos es posible representar algunos hechos como el aumento de la estatura de “Juan”. mientras que otros (como más grande que y valor) únicamente describen relaciones entre entidades que ya existen.72 Figura 43.72 m y que es más alto que Bill” en la forma expresada en la Figura 43: Juan valor 72 A1 altura mayor que altura A2 Bill A2 Bill 1. Considérese la red de la Figura 41: altura Jun Figura 41. que antes no se podía hacer. Pero ahora supóngase que se desea modelar el hecho de que “Juan” es más alto que “Bíll” de la manera mostrada en la Figura 42: Juan altura > altura A1 Figura 42. Algunas veces resulta útil introducir el arco valor para hacer más clara esta distinción. Otro ejemplo de una importante distinción que se ha ignorado es la diferencia entre las propiedades de un nodo en sí mismo y las propiedades que un nodo únicamente sostiene y pasa a sus instancias. . Por ejemplo.3 Distinciones Importantes En las redes que se han descrito hasta ahora se han hecho comentarios sobre distinciones que son importantes en el razonamiento. así se podría utilizar la siguiente red para representar que “Juan mide 1. Relación de Entidades. Representación de Objetos. Ambos nodos representan objetos que existen independientemente de la relación que pueda existir entre ellos.68 Lenguaje Natural: Descripción de las Etapas para su Tratamiento 4. Los procedimientos que operan en redes como estas pueden utilizar el hecho de que algunos arcos (como por ejemplo estatura) definen nuevas entidades.5. Representación de Comparaciones. están definidos por sus relaciones con los nodos “Juan” y “Bill”.

5 Herencia Múltiple Se dan casos en los cuales un objeto puede aprovechar propiedades de otros. de la misma forma que las aves y las plantas crecen. “a kind of ” o “a instance of ”. reproducen y mueren.Análisis Semántico 69 Por ejemplo. se puede ilustrar lo que se hace en un modelo de red. Herencia Múltiple. practicantes de algún deporte. El gato aprovecha las características de los mamíferos. 4. solteros y que se las ingenian para trabajar. teniendo en cuenta el costo y la complejidad. pero esto ya es otro apartado.5. Herencia Simple. La red ilustra un patrón clásico de muchos estudiantes a nivel licenciatura: jóvenes.4 Herencia Simple Una ventaja de las redes semánticas es apropiarse de las características de un objeto por otro que esta relacionado con él a través de un arco tipo “is-a”. crece. tal como aparece en la Figura 45: joven trabajador deportista Juega Basket ocupación empleado is-a estudiante de profesional Figura 45. y lo que se quiere es que la hereden. Sin embargo. 4. Es difícil capturar estas distinciones sin asignar más estructura a nuestras nociones de nodo. de acuerdo con el ejemplo de la Figura 44: ser vivo is-a procreado en animal l a-kind-of nace en mamifero plancenta a-instance-of perro guardian gato procreado semilla oviparo en vegetal nace. hijo de familia soltero Edad 16- . reproduce y muere nace huevo en trepad Figura 44. una propiedad del nodo “persona” es el hecho de que es una subclase del nodo “mamífero”. si ejemplificamos una solución orientada a redes semánticas para un problema más sencillo. Pero el nodo “persona” tiene como una de sus partes una raíz. Las instancias del nodo “persona” si la tienen.5. enlace y valor. es decir nace en placenta al igual que el perro es procreado en óvulo y por lo tanto.

Muestra la relación OBJECT CASE R Ilustra la relación RECIPIENT CASE. Dependencia Conceptual Donde los símbolos tienen los siguientes significados: Las flechas. por lo que dichas propiedades deberán especificarse explícitamente en el objeto que presenta la excepción. . Las flechas dobles. sino con “primitivas conceptuales” que pueden combinarse para formar el significado de las palabras de cualquier lenguaje concreto. 4. y se da preferencia a ella. Señala los tipos de enlaces entre el actor y la acción P Tiempo pasado. Representación de Excepciones La propiedad “nace en” asignada al los “mamíferos” no se asocia al objeto “ornitorrínco” ya que este cuenta con la propia. ((Nace en huevo) . La Figura 47 muestra un ejemplo de la forma en que se representa el conocimiento en CD para la frase “le di un libro al hombre" hombre de P ATRAN o libro R Figura 47. como se ilustra en la Figura 46. indica una transferencia de posesión. ((Nace en placenta) . En CD las representaciones de las acciones se construyen a partir de un conjunto de acciones primitivas. . . .6 DEPENDENCIA CONCEPTUAL La dependencia conceptual (CD). La representación en CD de una frase no se construye con las primitivas que corresponden a las palabras que aparecen en la frase. ATRANS Acción primitiva utilizada por la teoría. Mamífero is .a Ornitorrinco Figura 46. facilitando extraer inferencias de ellas con independencia del lenguaje en el que estén expresadas. es una teoría enfocada a representar el tipo de conocimiento de los eventos que normalmente aparecen en las frases de lenguaje natural.6 Excepciones Hay situaciones en que no deben ser apropiadas las características de otro objeto a pesar de la herencia.70 Lenguaje Natural: Descripción de las Etapas para su Tratamiento 4. Un conjunto típico de primitivas tomado de Schank y Abelson (1977) es el siguiente: .5. Indican direcciones de la dependencia.

hablar) Concentración de un órgano sensorial hacia un estímulo (p... lo deje”: . ej. cuyas variantes son: p f t ts tf k ? / nil delta c Pasado Futuro Transición Transición de comienzo Transición finalizada Continuación Interrogativa Negativa Presente Atemporal Condicional En la figura 48 muestra un ejemplo del uso de estos tiempos cuya frase tomada es “como fumar puede matarte. ej. escuchar) Un segundo conjunto de bloques construidos de CD es el conjunto de las dependencias permitidas entre las conceptualizaciones descritas en una frase. ej. existen cuatro categorías conceptuales primitivas a partir de las cuales se pueden construir estructuras de dependencia. ej. ej.. decidir) Producción de sonidos (p.Análisis Semántico 71 ATRANS PTRANS PROPEL MOVE GRASP INGEST EXPEL MTRANS MBUILD SPEAK ATTEND Transferencias de una relación abstracta (p. ir) Aplicación de fuerza física a un objeto (p. llorar) Transferencia de información mental (p. comer) Expulsión de algo del cuerpo de un animal (p.. ej. ej. empujar) Movimiento de una parte del cuerpo por su dueño (p. patear) Asimiento de un objeto por un actor (p. ej.. Las conceptualizaciones que representan eventos pueden modificarse de varias formas para aportar información a un frase conforme al tiempo verbal. decir) Construcción de información nueva a partir de la vieja (p. ej... Estas son: ACTs PPs Aas Pas Acciones Objetos (productores de imágenes) Modificadores de acciones (asistentes de acciones) Modificadores de PPs (asistentes de imágenes) Las estructuras de dependencia son en sí mismas conceptualizaciones y pueden servir como componentes de estructuras de dependencia más grandes. dar) Transferencia de una localización física de un objeto (p. ej... ej.. empuñar) Ingestión de un objeto por parte de un animal (p..

Donar. Pero la idea que hay debajo de “creé” puede representarse en CD como un MTRANS de un hecho en la memoria de “John”. Por ejemplo en la Figura 49 se considera la frase: “bill.72 Lenguaje Natural: Descripción de las Etapas para su Tratamiento uno uno INGES 1 c hum R cigarrillo c INGES muerto uno P vivo c hum R 1 cigarrillo Figura 48. En el enlace vertical de causalidad indica que “fumar mata”. puede ser importante.6. se almacenan los resultados como parte de la representación y por lo tanto pueden utilizarse repetidas veces. Robar. Uso de los Tiempos Conceptuales.1 Argumentos para la Representación en CD Las inferencias sobre quién posee un objeto actualmente y sobre quién los poseyó antes. 4. En una representación de CD estas posibles inferencias pueden establecerse una vez y asociarse con la primitiva ACT ATRANS. la palabra “creé” se utiliza para simplificar el ejemplo. amenazo a john con romperle la nariz” La representación dice “Bill” informó a “John” de que él hará algo para romperle la nariz de “John”. Sin embargo. “Bill” hizo esto de forma que “John” creerá que si él hace alguna otra cosa (diferente de lo que “Bill” hará para romper su nariz). . sino que también debe emplearse las inferencias asociadas con la información específica. Una vez aplicadas. sabemos sólo que fumar puede matar. Para construirla no sólo debe utilizarse la información que explícitamente se establece en una frase. Tomar. En esta representación. está marcada con “c”. entonces “Bill” romperá la nariz de “John”. Las acciones “hace 1” y “hace 2” son poseedores postizos que se refieren a algo como acciones aún no especificadas. en lugar de una ocasión por cada palabra que describe este ACT. Por ejemplo todos los verbos siguientes implican una transferencia de posesión de un objeto: Dar. no que necesariamente lo haga. Las representaciones sólo necesitan usarse una vez por cada primitiva ACT. El enlace horizontal de causalidad indica que la primera me hace dejar de fumar la cuantificación “tfp“ asignada a la dependencia entre “I” en “INGEST” indican que fumar (una instancia de “INGEST”) ha acabado y que esto ocurrió en el pasado.

Por ejemplo después de escuchar que “Bill” amenazó a “John” con romperle la nariz. Los elementos no especificados por la representación de una parte de información pueden utilizarse como un centro de atención para la comprensión de eventos posteriores conforme se van produciendo. Esta acción se podría sustituir por la postiza “hacer 2” representada en la Figura 49. 4. . tal como se indica en la figura 51. La presencia de estos objetos postizos da pista sobre por ejemplo que otros objetos o eventos son importantes para comprender el caso de estudio. Representación de la Dependencia Conceptual.por John rota Figura 49. así como las “estructuras temporal fuente”.7 CONSTRUCCIÓN DEL MÓDULO SEMANTICO El subsistema semántico debe aprovechar el trabajo. Podríamos esperar averiguar que acción está intentando evitar “Bill” que “John” lleve a cabo. estructuras de datos y de significado que los módulos predecesores generan en su labor: unidades léxicas y estructuras de soporte de la frase.Análisis Semántico 73 John Bill Bill nariz poseida-por John C John hace hace rota Bill P C M John cree Bill hace nariz Poseida. “el diccionario” y “estructuras transformacional” y “frontal” como se aprecia en la Figura 50 [12] El desarrollador debe elegir cuidadosamente los procedimientos y estructuras de datos para implementar el subsistema de “análisis semántico” insistiendo en concebir la aplicación como un proceso de “búsqueda” en donde a partir de los resultados emitidos por los analizadores léxico y sintáctico se generan diversas trayectorias para derivar la interpretación más adecuada tanto a las palabras como al texto.

Marcos Dependencia Conceptual Subsistema Flujo de datos Estructuras de Datos Bases de Datos Figura 50. Esquema de un Sistema de Lenguaje Natural. al considerar al “contexto” limitaría la explosión de significados derivados al permitir la producción de aquellos que satisfagan los requerimientos. y para ello. de ser necesario a efecto de conservar congruencia con ellas. . Esto último implica la replica de las definiciones originales para producir tantas versiones como interpretaciones distintas se generen. Cada interpretación del texto inferida crea su propia “estructura semántica” para la oración y cada una de sus palabras actualizando inclusive las definiciones y contenidos registrados en las “unidades léxicas”. “estructuras temporales fuente” y la “estructura frase”.74 Lenguaje Natural: Descripción de las Etapas para su Tratamiento Texto Análisis Léxico Análisis Sintáctico Análisis Semántic Representación Semántica Unidades Lexicas Estructura de la Frase Estructura del Contexto Estructura Temporal Fuente Componente Transformaciona Estructuras “Case” Componente Morfémico Representación de significado Diccionario Atributos frase marcadas de Redes Semánticas.

. Generación de Significado para una Frase.Análisis Semántico 75 Contexto definición UL1 Texto UL2 . (Estructura de la frase) IS1 Estructura Semántica IS2 Estructura Semántica ISm Estructura Semántica Figura 51. . .

76 Lenguaje Natural: Descripción de las Etapas para su Tratamiento .

COMPRENSÍON .CAPÍTULO 5.

.

5. Parte de las acciones. en el jardín hay muchos árboles”. . Integrantes de un grupo expresado participan en otra oración: “Los empleados de la fábrica se declararon en huelga. como se ilustra en la Figura 52: DISCURSO INTERPRETACIÓN ORACION 1 . hoy los carros con calcomanía color rojo no circulan”. Evento está ligado con otros: “Pedro jugó el domingo y anotó dos goles”. considerando a una especie de discurso que ocurre dentro de un contexto específico. . . Reconociendo las “entidades” y “relaciones” involucradas en la oración. “Juan habló con María. Un evento se asocia con otro: “Hubo un alto índice de contaminación ayer. Una oración puede usar entidades que pertenecen a otras que fueron expresadas en otras oraciones: “Rubén estrena casa. Cuanto más importante resulta considerarlos al tratarse de textos y diálogos que deben ser interpretados. el líder del sindicato lo anunció ayer”. Considerar el uso de referencias “anafóricas”: le ==> Juan dijo ==> Juan a María la ==> María quería ==> Juan y María • • • • • • Parte de las entidades. ORACION 1000 SLN CONCEPTO1 CONCEPTO2 . 5. . Por lo que se requieren advertir distintos tipos de relaciones que ligan frases y partes del discurso. Elementos de conjuntos. . como son las siguientes [10]: Entidades idénticas: Observar el ejemplo. le dijo que la quería”. Son acciones que ocurren cronológicamente: “José invitó a cenar a su novia” y “pagó con su tarjeta de crédito”. CONCEPTO 2000 ENTIDADES OBJETOS: -ATRIBUTOS -VALOR RELACIONES -ACCIONES -TIEMPO -FRECUENCIA SIGNIFICADO Y PROPOSITO DE LA ORACION EVALUADA Figura 52. Cada uno de ellos representa a una instancia de cierta clase de “entidades”: “Juan corre rápido” y “Montreal es una ciudad bilingüe” Ligas casuales.1 PERFIL La interpretación del lenguaje natural escrito tiene el propósito de asociar los conceptos que corresponden a la expresión para determinar su significado y propósito. Generación de Significado para una Frase.2 PROCESO Para entender una oración sencilla es indispensable tomar en cuenta el contexto en que se expresa. Nombres propios. Secuencia de eventos. COMPRENSIÓN 5.

. El subsistema del análisis semántico al hacer su función de: Mapear palabras individuales en objetos apropiados de la base de conocimientos. De manera implícita se hace referencias a ciertas a condiciones y atributos de los protagonistas: “Dame un beso”. Al ser procesada por el subsistema de análisis sintáctico arroja el árbol mostrado en la Figura 53: S (RM1) FN PRO (RM2) verbo want FN PRO ADJS FV S (RM3) FV (RM4) FN RM2 Bill’s ADJS Doc N File Figura 53.80 Lenguaje Natural: Descripción de las Etapas para su Tratamiento • Forzar eventos. son novios. Resultados del Análisis Sintáctico.. Una acción anima a realizar otras: “Jaime le dice a su mamá que tiene hambre” Asumir condiciones y estados.. Emplea una base de conocimientos que contiene “frames” para objetos. Las aplicaciones que interpretan múltiples oraciones deben usar gran cantidad de conocimiento y limitar las condiciones del dominio al que pertenece el discurso.3 DESCRIPCIÓN DEL ANÁLISIS PRAGMÁTICO Al reconocer que el módulo de “Interpretación” forma parte de un sistema de lenguaje natural es importante identificar el rol de los módulos que le acompañan y que cuyos resultados en el procesamiento de texto deberá aprovechar o proveer. del lenguaje y del contexto en que se expresa el discurso y sus oraciones. Para que el SLN sea capaz de reconocer estas clases de relaciones entre las oraciones.. Crear las estructuras correctas que correspondan al significado de las palabras individuales combinadas entre sí. como los ilustrados en la Figura 54. debe usar una gran cantidad de conocimiento ordinario. 5. El hombre pide a una mujer. A partir del cual se genera el significado de los elementos de la oración en forma congruente a la base de conocimientos de acuerdo con las Figura 54 y 55. Por ejemplo la oración: “I want to print Bill’s doc file”.

Struc nombre: carta extensión: doc owner: User 073 en-directorio: / Bill / Printing: isa: Evento Físico *agente: debe-ser (animado y programa) *objeto: debe-ser (información . Base de Conocimientos basada en Frames.System: intance: Programa Figura 54. .Object F1: instance: File . Significado Parcial de una Oración.Comprensión 81 User:---isa: persona nombre: debe ser <string> User: 068 instance: User nombre: Susan User: 073 instance: User nombre: Bill File .objeto) Wanting: isa: Evento Mental *agente: debe-ser (animado) *objeto: debe-ser (estado o evento) Commanding: isa: Evento Mental *agente: debe-ser (animado o programa) *ejecutante: debe-ser (animado o programa) *objeto: debe-ser (evento) This . RM1 { La oración completa } instance: Wanting agente: RM2 { I } objeto: RM3 {un evento de impresión} RM2 {I} RM3 { un evento de impresión } instance: Printing agente: RM2 { I } objeto: RM4 { Bill’s .doc file } RM4 instance: File-Struct extensión: doc owner: RM5 { Bill } RM5 instance: Persona nombre: Bill Figura 55.Struct isa: Informatión .

doc . o sea debemos reconocer su interpretación. como en este caso sería la emisión del comando: Lpr/bill/carta. Una vez completada la descripción en términos de congruencia con la base de conocimientos empleada se prosigue al paso final del proceso de “interpretación” que es: “decidir que hacer como resultado de la oración evaluada”. se puede determinar que archivo está siendo referenciado a “F 1” al ser el único con extensión “doc” y cuyo propietario es “Bill ”. Una estrategia es registrar lo expresado como un hecho y que se hará con él. Con estos elementos el subsistema de interpretación procura discernir el tipo de oración a la cual se refiere el texto y también identifica a los individuos relacionados ( “ I ”. Para descubrir su naturaleza se pueden aplicar reglas que caracterizan diálogos cooperativos. haciendo uso de un modelo de discurso con base al contexto al que pertenece. de las imperativas. interrogativas o negativas. “ Bill ”. En el ejemplo que se está desarrollando. Una vez que la referencia correcta para “Bill” es conocida. produciendo el significado final de la manera mostrada en la Figura 56: Significado: instancia: agente: ejecutante: objeto: P27 instancia: agente: objeto: Commanding User 068 This-System P27 Printing This-System F1 Figura 56. desde el cual pueda relacionar que el usuario identificado por el pronombre “I” es la instancia “User 068” y que la única persona a la que se refiere el nombre propio “Bill” corresponde a el objeto “User 073”. El paso final en el análisis pragmático es traducir (cuando es necesario) desde la base de conocimientos a la representación adecuada que implemente la acción que corresponda a la “intención” de la oración. “ doc ” ). donde el mismo se encarga de imprimir un archivo con extensión “doc” cuyo propietario es “Bill”. por lo que se deben reconocer oraciones declarativas. entonces el sistema debería ir adelante y hacerlo. Hay un evento de “querer” en el quién habla (identificado como “ I ”) desea que una acción de “impresión” ocurra.82 Lenguaje Natural: Descripción de las Etapas para su Tratamiento Los marcadores de referencia “RM” corresponden al evento de más alto nivel de la oración. se usa el hecho que cuando el usuario expresa lo que quiere hacer y que el sistema es capaz de realizar. Representación de la “intención” de una oración. Por medio del análisis pragmático se buscan las respuestas a dichas interrogantes.

Se representan como “hechos” (verdades generales) en la base de conocimientos. “perderá” (alarma).. Por ejemplo al observar el siguiente texto [11]: Instalación del Sistema Operativo SCO Fast Start. así como por medio de “frames” y “scripts”.. pronombres. pues sí perderá! Destacan los siguientes elementos: • • • Frase.5.2 Modelo de Creencias El modelo de creencias es un concepto abstracto que pretende “caracterizar” la naturaleza y rol de las entidades y de sus interrelaciones con otras. lo que supone que se imagina el usuario al respecto. 5. y así sucesivamente. después eliges una instalación “fresh” y proporcionan los parámetros de: medios. adjetivos. Para generar modelos es útil clasificarlos en dos partes: aquellas creencias comunes entre los protagonistas y las que son individuales: Modelos de creencias compartidas.. discurso y frase que está siendo evaluada.4 TÉCNICAS 5. También existen variantes del modelo de creencia de lo que considera el propio S.L. lo que se pudiera el usuario pensar que el sistema considera. monitor.. Símbolos. Primero “booteas” con el disco de arranque. además de representar estados y eventos que particularizan una situación dada. “y” (indican la secuencia de procedimiento) “booteas” (palabra clave que indica una acción indica una acción técnica a realizar) “fresh” (palabra clave que indica a partir de cero la instalación). como frases.. “después”.N. tarjeta de red.. Tales elementos son representados en la base de conocimientos de una manera apropiada para que a partir de ellos se generen búsquedas que infieran: • • • La información faltante. sobre el tema.Comprensión 83 5. teclado.1 Empleo de la Atención Para facilitar la interpretación de texto es útil identificar aquellas partes que “llaman la atención”. . ! No olvides respaldar el contenido original del disco. Identificar el tipo de oración y sobre todo su intención. Estos últimos se aplican para ilustrar situaciones estereotipadas. Instalación del Sistema. dirigir la búsqueda o inferencia de información faltante e ilustrar razonamiento monotónico. “Primero”.5.. En un SLN durante la fase de “interpretación” se puede generar modelos de creencia del dominio. palabras o símbolos clave. Precisar a que objeto específico se está haciendo referencia por medio de los nombres propios. no expresada en la oración y que se maneja implícitamente o que se expresa en otra parte del discurso. ¡ ! Llamar la atención. Palabras. mouse y CD..

que pudieran ser falsas injustificadas.) en que se le asocia dicho valor o falsedad bajo circunstancias específicas que pudieran presentarse. Estas clases de lógicas representan el valor de verdad concerniente a creencias. Otra forma de representar creencias individuales es particionar la base de conocimientos para organizar las creencias compartidas separándolas de las individuales. como se ilustra en la siguiente Figura 57. pero las individuales se registrarán por separado por cada personaje involucrado. ... Red Semántica Particionada. Proporcionan medios para interpretar variantes del lenguaje que involucran referencias a otros tiempos.84 Lenguaje Natural: Descripción de las Etapas para su Tratamiento Modelos de creencias individuales. intenciones y obligaciones.P) la cual es verdadera siempre y cuando “A” crea que “P” es verdadera. A través del uso de redes semánticas particionadas se puede representar tales requerimientos. circunstancias y estados mentales de la gente. Las primeras creencias no deben duplicarse en la representación. También se usa el operador KNOW-WHAT (A. donde aparecen tres espacios de creencias: • S 1 cree que María golpeó a Bill • S2 cree que Silvia golpeó a Bill • S3 cree que alguien golpeó a Bill GOLPEAR MARIA INSTANCIA AGENTE ACTO1 DATIVO BILL S1 S3 SILVIA AGENTE S2 Figura 57. irracional o contradictorias. insatisfechas. Se utiliza el operador modal “BELIEVE” que permite representar afirmaciones de la forma: BELIEVE (A. conocimiento. futuro..P) el cual es verdadero si “A” conoce el valor de la función “P”. al llegar a ocurrir (“lógica condicional”). Se pueden implementar por medio del uso de la “lógica modal” quien está interesada en los diversos “modos” en que una ación puede ser “verdadera” y el momento (pasado. presente. deseos. a pesar de que “P” pudiera ser creída como falsa por otra aserción.

C.. Logro de objetivos: titularse... puesto que especifican elementos que deben participar en el tema en cuestión.. para realizar G). G ): Precondición: KNOW-WHAT (A.Comprensión 85 5. Preservación de estados: salud.. NEAR (A. cuyo resultado es el cumplimiento DONE de la meta “G”. permitiendo al sistema formar una coherente representación del texto evaluado aunque haya información omitida.. adquirir. gozo.P) READY (P) Postcondición: DONE (G) Esta descripción representa para que “A” (“Juan”) use “P” (“PC”) debe realizar “G” (“comprar”). Entre las metas comunes redactadas en historias.C. conquistar. debiéndose cumplir las condiciones: “A” debe saber donde esta “P” (donde venden “PC’s”) “A” debe estar cerca de “P” “P” debe estar disponible. . trabajar.. Por ejemplo... que se describe como: USE ( A. cantar... en el texto: “Juan quiere comprar una P.C. LOCATION (P) ) . . Se reconoce: • • • • • • • Meta: El hijo de Juan tiene su P. de P.5 ANÁLISIS DEL MÉTODO DE DIRECCIÓN POR METAS Otra técnica que ayuda a interpretar el sentido del texto evaluado es el reconocer la intención que el protagonista persigue alcanzar “meta” y el “plan” que considera aplicar para lograrla. para su hijo”. En la interpretación de la oración anterior podemos hacer uso del operador USE (por A.. posesiones. Plan: Compuesto de los subplanes: Juan ahorra dinero Juan investiga opciones Juan compra cotizaciones Juan elige Juan adquiere la P.. para que viajes al extranjero”.. Conquista de deseos: amar.. Para lograr esos objetivos se representan planes en la base de conocimientos. Metas instrumentales: cumplen condiciones para habilita metas superiores: “Obtén tu pasaporte. Metas de placer: paz. P. reportajes y libros están: • • • • • • Satisfacción de necesidades: comer.

Regularmente hay varios operadores y planes alternativos para alcanzar el mismo objetivo. • Pista. En los guiones se parte de la idea que en el mundo real existen patrones de secuencia de eventos como cuando se sale de viaje. La presencia de estos objetos puede ser inferida aún si ellos son mencionados explícitamente en la historia o secuencia de eventos a analizar. etc. • Escenas: Son secuencias de eventos que ocurren en un momento dado. al final arrojan un conjunto de resultados que provocan la ocurrencia de eventos posteriores (posiblemente descritos por otros guiones). La presencia de este elemento también puede ser inferida. Corresponde a una variación específica en un patrón mas general. es decir. como a posteriores que ellos provocan que ocurran.C. así que el sistema puede usar esta meta como parte de la principal. 5.1 Representación de conocimiento Los guiones son mecanismos de representación del conocimiento que pueden ser utilizados para comprender conjuntos de eventos o historias estereotipadas en un contexto en particular. Location (P) ) El módulo interpretador debe asociar el objetivo de adquirir la P. • Apoyos. Si se identifican individuos específicos estos pueden ser insertados en los huecos apropiados. Los guiones tienen un conjunto de condiciones de entrada que hacen posible la ocurrencia de sus eventos. Las diferentes pistas de un mismo guión compartirán patrones. “Juan” necesita cumplir submetas.86 Lenguaje Natural: Descripción de las Etapas para su Tratamiento Para adquirir la PC.P) postcondición: know-what (A. dentro de la cadena los eventos están conectados a otros anteriores que los hacen posibles.6.P)” en donde “A” busca a “P”. Los eventos pueden ser representados con dependencia conceptual.6 GUIONES 5. una de ellas es conocer donde comprar una P. aunque no a todos sus componentes.. Requisitos que deben ser satisfechos para que los eventos descritos en el guión puedan ocurrir. aunque no sean menciona. • Papeles. Podemos ver a un guión como una lista de descripciones de eventos que contienen variables a las que se les da el nombre de “huecos” y asociado a ellos puede haber información acerca de los tipos de valores que contiene. por lo que se hace uso del operador “LOOK-FOR (A. Por lo que el problema de generar coherentes interpretaciones de un texto o discurso puede involucrar considerar muchos planes parciales y operadores. Son los huecos que representa a la gente involucrada en los eventos descritos en el guión. con la actividad de buscar un almacén distribuidor. se va a comer a un restaurante. En la Figura 58 se presenta parte del guión del restaurante (Schank 1997) [4]: .C. como: Look-For (A. Huecos que representan objetos involucrados en los eventos descritos en el guión. Los elementos que se especifican en un guión son: • Condiciones de entrada. Estos patrones surgen de relaciones causales entre.P): precondición can-recognite (A. cumpliendo ciertas condiciones y generando resultados específicos. reconociendo que “Juan” está buscando un lugar donde comprarla. así como valores que son usados si no hay otra información disponible. por lo que pudieran desarrollarse distintas alternativas de interpretación con sus variantes respectivas.

Guión del Restaurante. IR A LA ESCENA 4) Escena 4: Salir L MTRANS a M (LA CUENTA) M MOVE (ESCRIBE LA CUENTA) M PTRANS M a L M ATRANS “LA CUENTA “ a L L ATRANS “LA PROPINA“ a M L PTRANS L a J L ATRANS DINERO a J PTRANS L FUERA DEL RESTAURANTE (CAMINO DE NO PAGAR) Figura 58. F= comida. . M ATRANS C a L. P = Propietario Condiciones de entrada: Si tiene hambre. Cuenta. Menú. M = Mesero. EN CASO CONTRARIO. L INGEST C (OPCIÓN: VOLVER A LA ESCENA 2 PARA PEDIR MÁS. J = Cajero. dinero Papeles: L = Cliente.Comprensión 87 Pista: Cafetería Apoyos: Mesas. Si tiene dinero Escena 1: Entrada L PTRANS L a EL RESTAURANTE L ATTEND OJOS a LAS MESAS L MBUILD donde sentarse L PTRANS a LA MESA L MOVE L a POSICIÓN SENTADO Escena 2: Pedir L PTRANS MENÚ L L MTRANS SEÑA A M M PTRANS M a LA MESA M ATRANS MENÚ a L *L MBUILD elección de C L MTRANS seña a M M PTRANS M a LA MESA L MTRANS ‘quiero C’ a M M PTRANS a M o M MTRANS (ATRANS C) a O o MTRANS ‘no hay C’ a M o (GUIÓN PREPARAR C) M PTRANS a M L IR A LA ESCENA 3 M MTRANS ‘no hay C’ a L (VOLVER * ) o (IR A LA ESCENA 4 POR EL CAMINO DE NO PAGAR) Escena 3: Comer O ATRANS C a M. O = Cocinero.

ejemplo: “ Juan salió al restaurante anoche. La interpretación. Los guiones pueden también ser útiles indicando las relaciones entre los eventos que fueron mencionados. por lo que el programa de comprensión infiere que la secuencia completa previa ocurrió normalmente.2 Razonamiento Si un guión en particular es reconocido como apropiado en una situación dada entonces puede ser muy útil en la predicción de la ocurrencia de eventos que no fueron mencionados explícitamente. La respuesta a: Cenó Juan anoche ? sería afirmativa aunque no se haya mencionado explícitamente. De eventos que no han sido explícitamente mencionados. para ser accesado más tarde si es necesario. A la pregunta: Porqué le llevo la mesera el menú a Juan? . para ver lo que provocó la acción) Porque “Juan” se lo pidió (analizando hacia atrás en la cadena causal. La coincidencia en precondiciones. en cuyo caso puede ser suficiente guardar el apuntador al guión. El ordeno una hamburguesa. papeles y/o eventos de un guión pueden servir como indicadores que este guión puede ser activado. si un guión es una gran cadena causal puede proporcionar información sobre las relaciones entre los eventos por ejemplo: “Juan salió a cenar. Como guión principal. Ella realmente disfrutó del nuevo Picasso exhibido”. esta podría ser una estrategia apropiada para señalar el guión del restaurante cuando se trata de analizar una historia como la siguiente: “Susana pasó por su restaurante favorito camino al museo. La mesera trajo el menú y él ordenó una hamburguesa”. del guión o guiones apropiados. apoyos. El guión del restaurante se activó por la coincidencia de los eventos de la historia con los del guión. para encontrar el evento o acción que provocará). El guión puede proporcionar dos respuestas: Porque “Juan” se lo pidió (analizando hacia atrás en la cadena causal. se sentó y llamó a la mesera. . Cuando un guión ha sido activado para una situación en particular. es útil en: • • La predicción. Los dos primeros pasos en un proceso de utilización de guiones son: • • Selección entre los guiones que se encuentran en memoria. Hay dos formas en las que puede ser útil activar un guión: Como guión auxiliar (aquel que se menciona brevemente y puede ser referido de nuevo pero no en la situación central). en cuyo caso es apropiado activar el guión completamente y tratar de llenar sus huecos con los objetos particulares y la gente involucrada que aparezca explícitamente en la historia que se esté analizando.88 Lenguaje Natural: Descripción de las Etapas para su Tratamiento 5. Pagó y se fue a su casa”. La utilización del guión para completar las partes no especificadas del texto a comprender.6. Coherente de un conjunto de observaciones.

Su desventaja es que no son adecuados para representar cualquier clase de conocimiento. se enojo y se fue”. Para un nivel mas elevado de planes y objetivos el problema es “identificar los objetivos y planes que debemos seguir”. ya que no son estructuras generales que funcionan adecuadamente para modelar los tipos específicos de conocimiento para los cuales fueron diseñados. se sentó y espero largo tiempo. tal habilidad depende de nuestro conocimiento acumulado. “Juan fue a un restaurante. Enfocar la atención en eventos poco usuales. Una interpretación coherente de la situación presentada en el texto..6. El interés significa “poner atención en ciertas cosas o acciones”.1 Interés Uno de los problemas centrales en el entendimiento del lenguaje natural ha sido la creación de inferencias y el control de las mismas. el cual nos marca las rutas a seguir de manera natural.. 5. Una respuesta es: “debemos seguir el camino mas interesante”.. La atención en eventos poco usuales: • • “Juan salió a cenar.7 COMPRENSIÓN DE HISTORIAS 5.3 Ventajas y Desventajas Entre las principales ventajas de los guiones están: • • • Predecir eventos que no han sido explícitamente mencionados. esta meta no se logra a menos que conozcamos el lugar en donde podemos buscar información que sea útil para ligar el nuevo conocimiento con el texto antes analizado.7. lo que en forma abstracta se traduce en “dejar libre nuestro sistema de inferencias”. se le mostró una mesa. 5. La parte importante de esta historia es la salida de la secuencia esperada de eventos en un restaurante. pues esto ocurrió antes de la interrupción pero no puede inferirse si pagó la cuenta. se sentó y llamó a la mesera. ordenó una hamburguesa.Comprensión 89 Para enfocar. La mesera trajo el menú y él ordeno una hamburguesa”. Puede suponerse que vio la carta. Una pregunta que surge al analizar este problema es: ¿Qué tan extensas deben ser nuestras búsquedas de inferencias?“ Para generar su respuesta debemos crear inferencias que ayuden a unir entre sí el texto analizado. A continuación se presenta una oración incompleta que puede ir ligada con los conceptos que aparecen después: “Juan iba caminando por la calle cuando .” .. considerando que cada una de ellas es creada y tratada a su vez como entrada del mismo sistema generando un número infinito de combinaciones. Una vez que la secuencia típica de eventos se irrumpe no puede seguir utilizándose el guión para predecir eventos posteriores.

de tal manera que podía emitir juicios sobre “supuestos” que argumentan ciertas acciones e intenciones. para representar esta capacidad de evaluación de interés se requiere de un módulo especial llamado “Understander” quien trata de analizar y calificar el texto de entrada con relación al contexto del diálogo que se está desarrollando. como se muestra en el siguiente diálogo: John quería la bicicleta de Bill El se acercó a Bill y le pregunto si estaba dispuesto a darle la bicicleta Bill se opuso John le dijo a Bill que daría treinta dólares por ella. por lo que se deben usar criterios heurísticos dinámicos para caracterizar esta situación.7. implementaron “scripts” para facilitar la interpretación de ciertas oraciones y palabras claves contenidas en un texto. actualizan y explotan para cumplir la función sustantiva de la aplicación acorde con el flujo de “conversación” sostenida con el usuario conforme se ilustra en la siguiente Figura 59 [12]: . lo cual nos indica que: Las cosas poco comunes son mas interesantes que las ordinarias El interés es una propiedad dinámica fuertemente dependiente del contexto. pero Bill no estuvo de acuerdo Entonces John le dijo a Bill que le rompería un brazo si no le permitía tenerla Bill le dio la bicicleta Las inferencias que “PAM” es capaz de generar son: Porqué John se dirigió a Bill ? Porque quería tener su bicicleta Porqué Bill le dio su bicicleta ? Porque no quería ser lastimado PAM uso planes como estructuras de conocimiento para tipificar metas de la gente y de los medios que emplean para alcanzarlas. 5. En general.8 CREACIÓN DE UN INTERPRETADOR El subsistema “interpretador” al formar parte de un sistema de lenguaje natural aprovecha las estructuras de datos y bases de conocimiento que el resto de módulos crean. se comió una galleta. escuchó una explosión.90 Lenguaje Natural: Descripción de las Etapas para su Tratamiento • • • • vio un gato decidió amarrarse un zapato. El punto crítico es decidir que tema es más interesante que otro conforme a diversos puntos de vista y en situaciones cambiantes. a su vez “entiende” historias basadas en objetivos (como las respuestas que se ofrecieron en el texto analizado anteriormente) y asume que todos los planes y objetivos de los actores en una historia pueden ser constantemente monitoreados. construido por Schann y Abelson en 1977. 6.2 Comprensión de Historias Una de los proyectos que destaca en el uso del concepto de “interés” como solución al problema del manejo de inferencias es “PAM”. Es obvio que los primeros incisos son poco relevantes en comparación al último.

En el flujo de entrada el “intérprete”: • • • • Enriquece las definiciones semánticas de los elementos del texto que es evaluado Precisa la naturaleza y propósito de la oración Deduce los elementos. Usuario Exposición de Respuesta Intérprete Generador de Lenguaje Análisis semántico Análisis Sintáctico Análisis léxico Figura 60. pregunta. declaración. Interpretación de Textos Fuente. estados y acciones involucradas explícitamente en la frase. Evalúa las respuesta ofrecidas por el módulo “generador” conforme a los requisitos manifestados Ordena la ejecución correspondiente al tipo de respuesta seleccionada Presenta la respuesta al usuario. Exposición de Respuesta del Intérprete. negación. despedida Mientras que la exposición de la respuesta el “intérprete”: • • • • Instruye al módulo “generador de lenguaje” para realizar el tipo de respuesta adecuada al texto fuente. instrucción.Comprensión 91 Usuario Texto de Entrada Análisis léxico Análisis sintáctico Análisis Semántico Intérprete Conceptos Significado Oración Propósito Respuesta Figura 59. Identifica el tipo de reacción del sistema: saludo. . Al integrar el “Interprete” al SLN se obtiene el esquema de resultados y estructuras de datos ilustrada en la Figura 60. conforme al discurso y dominio de la aplicación.

92 Lenguaje Natural: Descripción de las Etapas para su Tratamiento .

CAPÍTULO 6. GENERACION DE LENGUAJE .

.

actualización de conocimiento. sintáctico y léxico para producir las frases en lenguaje natural acordes a la respuesta o expresión deseada. El requerimiento. contradicción y desconocimiento en la información expuesta [10]. dudas. preguntas. La interpretación de estos insumos se traduce en directivas que se transmiten al “generador del lenguaje”. Las oraciones de salida son interpretadas y de ser necesario corregidas antes de transferirse al “conversador” para su exposición al usuario. etc.. negaciones. 6. también se reciben los requerimientos de expresión que el módulo conversador emplea.1 CONSIDERACIONES El sistema de Lenguaje Natural incluye un subsistema especializado en la emisión de lenguaje natural como respuesta a: La iniciativa del propio SLN para iniciar. En respuesta a una petición.. saludos. GENERACIÓN DE LENGUAJE 6.. objetivo y restricciones que el subsistema de “conversación” establece en la coordinación del proceso de diálogo entre el SLN y el usuario.2 PROCEDIMIENTO El SLN interactúa con el usuario durante la sesión no solamente como medio de comunicación para el control de la sesión e interpretación de las expresiones del usuario.6. consulta u observación expresada por el propio usuario. El “universo” del idioma que se utiliza para expresar la comunicación: alfabeto. En dicha ilustración se observa como puerta de comunicación al subsistema de “conversación” para recibir las expresiones del usuario y presentar las frases de exposición (respuesta. propósito y condiciones que el subsistema “interpretador” emite para responder a la expresión alimentada por el usuario. Las oraciones fuente son procesadas hasta llegar al subsistema intérprete. orden. Este último interactúa con la base de conocimientos y los subsistemas semántico. La frase u oración que el subsistema genera debe considerar los siguientes requerimientos: • • • • • • La orden. sino también al ofrecer las respuestas apropiadas a sus requerimientos. .. diccionario.. Como reacción a un estado de la sesión: pausa.. El “discurso” que durante ese momento de la sesión se expresa a través de las oraciones que el usuario y el SLN han expresado alternadamente.) del SLN. sintaxis. controlar o terminar una sesión con el usuario. por lo cual interactúa con el resto de subsistemas como se ilustra en la Figura 61. El “dominio” de especialidad que el SLN maneja y que el usuario desea explotar. El “conocimiento mundano” que caracteriza la expresión del lenguaje: afirmaciones.

3 USO DE PLANTILLAS A través del uso de redes “semánticas” y “frames” como estructuras para representar conocimiento orientado a la formulación de ciertos tipos de frases. se ilustra a continuación a través de las Figuras 62.. etc.deporte. andar – con . clases y superclases de objetos con sus instancias respectivas.. • Inherencia: Atributos IS-A. la edad de una persona. Atributo DEFAULT son valores que se afirman como válidos para cierta clase de objetos en ausencia de otros específicos para ellos. Cuando no se dispone del valor correspondiente. 63 y 64. se emplean las parejas “atributo . por ejemplo: la superficie y volumen de un cuerpo geométrico. • Defaults. pero lenta como medio de transporte. • Procedimientos. Por ejemplo.fiestas. IS-A-INSTANCE-OF entre subclases. se aplican los siguientes procedimientos ilustrados en la Figura 62. Base de conocimientos 6..filler) para asociar valores fijos o variables a ciertos elementos de las oraciones (nombres. .). esto se ilustra en la siguiente figura”: Al describir frases a través de propiedades (parejas “atributo – valor”) y emplear estas clases de asociaciones para inferir los valores correspondientes se pueden generar las instancias de oración específicas a la expresión que se desea generar. por ejemplo: “una bicicleta de carreras es muy veloz para el ciclismo.amigos. Generación de Lenguaje.. al definir una oración para responder el precio de una PC. Atributo PERSPECTIVE son los tipos de apreciación que se les da a los objetos acorde con un particular punto de vista. adjetivos.96 Lenguaje Natural: Descripción de las Etapas para su Tratamiento exposición conversador Respuesta expresión oración fuente requerimiento de expresión intérprete Requerimiento de Respuesta Expresión generador lenguaje Generación de Lenguaje Natural Analizadores: Semántico. IS-KIND-OF. como: “a los jóvenes les gusta pasatiempos (hacer .a. Sintáctico.. Léxico Figura 61.)”. • Perspectivas. ir .valor” (slot . que se ejecutan al momento de requerirse.. Atributo IF-NEEDED son cálculos especializados de la clase de objetos.

) Is a instance of Proceso 42: Monto = (Costo CPU + Costo Monitor + Costo Disco + Windows ) * 1.. Inferencia... Desk Pro ( (Modelo Powe) .. Monto: $12.00 Defaults. A través de las siguientes definiciones.) Is a kind of Compaq ( (Marca Compaq ) . Venta de PC: Precio Total.. (procesador: default a 321).395..15 default 321 procesador: pentium perspective: venta de pc (.) Figura 64..(monto: proceso 42). Ejemplo de Perspectivas. .(marca______) (modelo_______) . EL PRECIO TOTAL DE LA PC (MARCA_________) (MODELO_______) ES DE: (MONTO_________) CON UN (PROCESADOR_________) Figura 63 Template de la Oración.. Procesador: Pentium Perspectiva. Marca y modelo: Acer power 5200 Procedimiento. La inferencia de valores para los atributos faltantes se hace por medio de: Inherencia...Generación de Lenguaje 97 Prespective: Medio de comunicación periódico Is-a novedades Prespective: Fuente de trabajo empresa Is-a novedades Prespective: Fuente de basura papel Is-a novedades Figura 62.

.000 muertes. 300. como se ilustra en la Figura 65: lugar día hora evento evento desastre muertos heridos damnificados sin casa temblor falla magnitud nivel río hombre velocidad dirección deporte marcador ganador evento social sede propósito evento político partido asistentes desborde huracán evento deportivo evento cultural fundación expositor Figura 65. se pueden generar textos.4 MODELOS DE GENERACIÓN Por medio de los marcos se pueden formular oraciones y conjuntos asociados de ellas. dejó un saldo de 1. como los siguientes : “Entre los desastres mas fuertes ocurridos en Bejin. Otro ejemplo de un texto orientado a reportar un temblor usa un modelo con las propiedades descritas en la Figura 66. la capital de China destaca el temblor ocurrido el 14 de Octubre de 1960 a las 2:40 de la mañana. Mediante la estructuración adecuada de marcos se pueden describir distintos tipos de modelos de oración y texto donde se integren varias frases coherentes. Estructura de Frames.000 damnificados.000 de ellos se quedaron sin casa. también se pueden producir aplicando nodos de redes semánticas y propiedades que caracterizan objetos. acciones y situaciones típicas.000 resultaron heridos y se reportaron 31.98 Lenguaje Natural: Descripción de las Etapas para su Tratamiento 6. 165. Al explotar la estructura del frame descrita y asociarse al conocimiento sobre fenómenos específicos.9 grado en la escala de richter.050. El siniestro se debió a una falla ocurrida en la costa del pacífico que alcanzó una magnitud de 6.

Dic .000 pacifico 6.Generación de Lenguaje 99 Como ejercicio al lector se solicita redactar una historia con los datos del terremoto ocurrido en la ciudad de México en 1985.000 sin casa 300.000 San Andrés 7..Nicaragua.400 500.. conforme a la secuencia ilustrada en la Figura 67: Estructuras frontales intérprete oración generada Análisis Léxico Requiere texto a emitir Generador lenguaje de Estructuras semánticas Estructura de texto Análisis semántico Estructuras Sintácticas Análisis Sintáctico Figura 67.000 232. Flujo de Generación de Lenguaje. lugar día hora muertes Bejin.China 14 -Oct .60 2:40 am 31. 15 .2 mercali muy grave temblor falla magnitud escala seriedad Figura 66. 6.050.000 65.9 richter fuerte Managua.000 heridos damnificados 1. La secuencia mostrada lleva a cabo el siguiente proceso: .77 14: 15 pm 50.000 200.5 PROCEDIMIENTO INVERSO La generación de lenguaje a cargo del subsistema responsable implica la participación de otros subsistemas en un flujo opuesto al de la interpretación del texto. Modelo de Oración por medio de Frames.

• Susana le dijo al niño que pusiera el cilindro en el bloque rojo.6 EXPRESIONES Mediante el uso de “marcos” y “dependencia conceptual” se pueden obtener inferencias que enriquecen el significado de la oración a generar como son: • Deducir que pasará cuando algo es hecho • Imaginar los detalles de como algo fue probablemente hecho. Relación de Cambios de Estado. • El niño come helado. La estructura semántica es procesada por el subsistema sintáctico para verificar su consistencia gramatical y hacer las adecuaciones respectivas para generar una estructura sintáctica. • Las acciones implican cambios en los estados y relaciones “causa . emitiendo así la oración frontal que será expuesta al usuario después de las evaluaciones y correcciones aplicadas por los subsistemas generador e interpretador. procediendo a formular la estructura de texto adecuada para su exposición.100 Lenguaje Natural: Descripción de las Etapas para su Tratamiento Una vez que el subsistema de interpretación determina la respuesta a generar “ordena” un requerimiento del tipo de texto a emitir representado en la estructura de datos apropiada. y 70 de ejemplo que describen la representación de una oración específica respectivamente: • El niño disfrutó colocar el cilindro encima del bloque rojo. 6.efecto”. agente objeto destino niño cilindro bloque rojo Mover objeto PTRANS Cambio estado de objeto destino gusto niño Figura 68. El generador recibe el requerimiento. Para ilustrar la aplicación de estos conceptos. se muestran a continuación tres Figuras 68. número. El subsistema semántico incorpora los conceptos faltantes a la estructura del texto y que en forma individual sean congruentes con el significado de la estructura completa produciendo otra mas rica con significado semántico. El subsistema léxico refina la composición de la estructura recién emitida modificando los elementos de la oración conforme al género. • Traducir al lenguaje natural las oraciones que se puedan derivar a partir de la estructura “marcos– dependencia”. tiempo y tipo de expresión. . 69.

conocidos como “estados mentales” como los mostrados en la Figura 71. distinguiendo eventos favorables de los negativos. .7 CREACIÓN DE UN MODELO La implementación de un subsistema “generador de lenguaje” debe considerar “perspectivas” para evaluar la realidad. Hablar MTRANS agente objeto destino agente Mover objeto PTRANS objeto destino niño cilindro bloque rojo Susan orden niño Figura 69. por lo que se debe usar una representación adecuada para caracterizar esos puntos de vista. Exito EM Tiempo i Fracaso EM i i Habilita + i Motivación - + - EM EM Figura 71. Un Acto Provoca la Ejecución de Otro. agente el niño Comer INGEST objeto helado Mover objeto PTRANS agente objeto El niño cuchara Mover parte del cuerpo agente el niño objeto mano Figura 70. Un Acto Implica la Ejecución de Otros.Generación de Lenguaje 101 6. Representación de Estados Mentales.

Abstracciones de eventos y estados mentales que se asocian produciendo elementos claves de relación como los indicados en la Figura 74: éxito EM éxito + éxito pérdida - Figura 74. Estados Mentales Ligados por Inicio. en donde uno provoca el surgimiento de otro (esto se denomina recursión). Instancias de Eventos que Terminan en Relación o Acto.102 Lenguaje Natural: Descripción de las Etapas para su Tratamiento Los estados mentales pueden iniciar eventos positivos o negativos. recursión cambio de pensamiento perseverancia EM Tiempo i EM i i + EM EM EM Figura 72. provocando entonces estados mentales específicos como de alegría o frustración. de la manera ejemplificada en la Figura 73: tiempo éxito solución pérdida + t + t + + t + + t + pérdida correlación + correlación + + t + t + + éxito + t + t + fracaso + Figura 73. . Terminación y Correlación. Asociación de Situaciones Diversas por Medio de Eventos. se denomina “perseverancia” como se muestra en la Figura 72. Hay abstracciones que involucran únicamente “estados mentales”. cuando un “EM” produce la terminación de otro se entiende como un “cambio de pensamiento” y si persiste durante un lapso. También existen abstracciones basadas en eventos ligados que terminan o relacionan ligas:.

Otros ejemplos de secuencias de estados y eventos que producen diversas abstracciones tales como las mostradas en la Figura 75: “levantarse de la adversidad” EM EM “éxito fortuito” solución de problema - EM + + “El fracaso obliga a reflexionar y levantarse para conquistar victorias” + “Un problema provoca crisis. después ocurre una situación negativa a uno de ellos que provoca un estado y este una acción positiva que resuelve a la negativa. en ese momento. . al otro protagonista le ocurre un evento negativo que genera un estado mental y por lo tanto una acción positiva que termina el evento positivo que primero ocurrió y se asocia con un evento negativo hacia el primer actor provocando la terminación del evento positivo que primeramente le había sucedido.Generación de Lenguaje 103 Esta figura ilustra situaciones. También los estados y eventos se pueden ligar a través de perspectivas como las indicadas en la Figura 76: perspectiva 1 + perspectiva 2 M + Figura 76. Al usar las perspectivas de los personajes involucrados en una historia se pueden caracterizar el tipo de eventos que ocurren de acuerdo con su particular interés. A continuación se ilustra en la Figura 77 los estados mentales que asumen dos actores y la evaluación que cada quién otorga a los eventos que ocurren. ambos tienen una actitud relacionada que da lugar a eventos positivos ligados. Causa-Efecto de Eventos y Estados. pero una solución lo concluye” “Un problema motiva a hallar una solución que lo resuelva” Figura 75. el estado mental (actitud) de invertir en la bolsa de valores por que ofrece ganancias atractivas. Perspectivas que Involucran Eventos Positivos. mas tarde ocurre un evento que hace “caer” a la bolsa y se terminan las ganancias. como por ejemplo.

le agradeció apreciando mucho a detalle. se pueden caracterizar texto representativo de historias como la siguiente: • • • • • Juan quiso dar un regalo a María” Juan quiso comprar una cadena por lo que necesitó dinero Entonces piensa vender algo Vendió un televisor y con ese dinero compró la cadena Después se la dio a María. ella se la puso. solución . A través de la relación de eventos y estados asociados en perspectivas con diversos niveles de abstracción.104 Lenguaje Natural: Descripción de las Etapas para su Tratamiento perspectiva 1 EM EM perspectiva 2 M + + - EM - - EM - Figura 77. Abstracción de Perspectivas en Niveles. En el caso anterior se puedo concebir un mayor nivel de abstracción integrando la representación de “eventos” y “estados” en “unidades”. Abstracción a un Mayor Nivel mediante Unidades. Mientras que en el siguiente. se aplica el caso de que “Tomás está molesto con Alberto porque al resolver un problema personal provocó un evento que paró una acción de éxito que estaba realizando” de la manera ejemplificada en la Figura 78: éxito Solución internacional al problema éxito relación pérdida Figura 78.

Historia del Regalo de Juan a María C i aprecia el detalle + .Generación de Lenguaje 105 Esta historia se ilustra mediante estados y eventos de la manera apreciada en la figura 79: PERSPECTIVA Juan María quiere obsequiar EM i quiere dar una cadena EM i necesita dinero i piensa vender algo EM i + EM venta de una tv consigue dinero + compra la cadena + recibe el regalo i agradece dá el regalo + + + +| Figura 79.

106 Lenguaje Natural: Descripción de las Etapas para su Tratamiento .

CONCLUSIONES .

.

así como su razonamiento. Entre los aspectos que revelan la complejidad del procesamiento del lenguaje natural está el lograr una correcta representación semántica del significado de cada uno de los elementos que componen la oración. generalmente usuario-máquina. Así mismo. a efecto de crear interfases más amables e inteligentes que faciliten la interacción hombremáquina. los esquemas de proceso y las técnicas de tratamiento de lenguajes apropiadas como son las gramáticas. cuyos resultados se traducen a una metodología que describe las etapas para la creación de aplicaciones especializadas en la interpretación de lenguaje natural escrito y la generación de texto. se consideran escenarios para la traducción de texto escrito en diversos lenguajes. al procurar un entendimiento del diálogo compuesto por varias oraciones expresadas por los protagonistas. los mecanismos de representación de conocimiento y los modelos de interpretación. se espera que este trabajo motive al investigador. Durante la descripción de las etapas de la metodología se procura reunir los conceptos. representa uno de los retos que aún continúan siendo abordados en los escenarios de investigación. se recrea una plataforma logística que orienta la construcción de sistemas de tratamiento del lenguaje natural. buscando extender los alcances logrados. el sintáctico y el semántico. la comprensión de la oración como un todo. También aparece la exploración de mecanismos de aprendizaje de máquina para la validación sintáctica y el análisis semántico. las estructuras de datos. para alcanzar estas funcionalidades se requiere del concurso de tres tipos de análisis: el léxico. . Así mismo. y entender el contexto en que ésta se inscribe a la luz de las oraciones que la preceden y aquellas que aparecen después. docente y estudiante a profundizar en el campo del tratamiento del lenguaje natural. a efecto de desarrollar modelos y mecanismos más efectivos para cada una de las etapas de procesamiento. Por lo que. Con todos estos elementos. En suma. Como parte de las líneas de trabajo futuro se encuentran: La incorporación de modelos difusos de conocimiento que permitan la representación de conocimiento aproximado.CONCLUSIONES El Reporte Técnico representa la investigación y desarrollo de aplicaciones en el campo del procesamiento del lenguaje natural. basados en modelos de redes neuronales y de computación evolutiva.

.

REFERENCIAS .

.

K. Publishers. McGraw Hill.. Addison Wesley. B. .... USA. Expert Systems and Applied Artificial Intelligence. Santa Biblia [2] Feigenbaum. P. [3] Tabor .REFERENCIAS [1] Tarso.. A. 2da. 2da. USA.. Addisson Wesley. Butterworth Heinemann. Horn.. Artificial Intelligence. USA [5] Winston. T. 3ra. [11] Rowman.P. [12] Efraim. USA. Littlefield. [9] Covington. Carta a los a los Tesalonicenses. I. [10] Harris. R. E. USA. México.. [7] Winston.. Programming for Artificial Intelligence. Artificial Intelligence”.D. Edition. [8] Dutta.. Knowledge Processing & Applied Artificial Intelligence. Implementing Japanese Artificial Intelligence Techniques. M. McGraw Hill. McCorduck.. Edition. La Quinta Generación. [4] Rich. Addisson Wesley. R. LISP. [6] Bratko. P. A. USA. S. Mcmillan Publishing. 5. Patrick Henry. P H. Natural Language processing for Prolog programmers. Edition. 1era. Natural Language Processing. M.13. E. Introduction to Natural Language Processing. USA. Planeta. USA. Prentice Hall. Prentice Hall. USA.

Octubre 2005 . Expedición al Ártico Canadiense. 63º Norte.000 ejemplares Diseño Portada. Enero de 2006. México. Alejandro Peña Ayala Fotografía de la Portada: Isla de Baffin.F. 06070. Edición: 1. Iqaluit. D. Centro Histórico.Impreso en los Talleres Gráficos de la Dirección de Publicaciones del Instituto Politécnico Nacional Revillagigedo 83.

Su tratamiento por computadora representa un reto dada su complejidad fonética. como primera instancia para abordar el tema. semántica y contextual. es conveniente concentrarse en el tratamiento del Lenguaje Natural representado por caracteres alimentados al computador. Es decir. Además de introducirlo en los procesos de interpretación y generación de lenguaje. Por tal motivo. ISBN: 970-94797-3-3 # 001 . que están interesados en ampliar sus conocimientos para desarrollar aplicaciones en el tratamiento de Lenguaje Natural. el lector encuentra una descripción de la naturaleza del tratamiento del Lenguaje Natural y obtiene un perfil de las etapas involucradas. representa una actividad natural de comunicación de toda clase de pensamientos. El tratamiento de Lenguaje Natural no solo tiende a facilitar la comunicación entre las personas y los sistemas de cómputo. En esta obra.El lenguaje como forma de expresión de los seres vivos. gráfica. En los capítulos se explican los procedimientos e instrumentos que se emplean para desarrollar el análisis léxico. profesionistas y especialistas del ámbito de los sistemas. electrodomésticos y de transporte. sino también con los equipos de comunicación. Al facilitar la interacción entre el individuo y los equipos se amplia su aprovechamiento y se fomenta su consumo. la Informática y la Computación. que el texto a interpretar carece de los problemas naturales de reconocimiento fonético y visual. La obra se dedica a los estudiantes. sintáctico y semántico. así como del ruido y la distorsión clásica del ambiente natural.

Sign up to vote on this title
UsefulNot useful