P. 1
Lenguaje Natural

Lenguaje Natural

|Views: 2.222|Likes:
Publicado pormanuel_ls

More info:

Published by: manuel_ls on Jul 19, 2011
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

01/29/2013

pdf

text

original

Sections

  • 1. ÁMBITO DEL LENGUAJE NATURAL
  • 1.1 PERFIL
  • Figura 1. Composición del Ser Humano
  • 1.2 ÁREAS DE ESTUDIO
  • 1.2.1 Lingüística
  • 1.2.2 Psicología
  • 1.2.3 Filosofía
  • 1.2.4 Neurociencias
  • Figura 2. Regiones Cerebrales Responsables del Lenguaje
  • 1.2.5 Comunicación Social
  • 1.3 RAMAS DE INVESTIGACIÓN
  • 1.3.1 Comprensión del Lenguaje Natural Escrito
  • 1.3.2 Diálogo Sonoro
  • 1.4 DESARROLLOS
  • 1.5 APLICACIONES Y PROGRAMAS
  • 1.6 REPRESENTACIÓN
  • 1.6.1 Representación
  • Tabla 1. Limitaciones y Ventajas de los Lenguajes
  • 1.6.2 Mapeo
  • Figura 4. Tipos de Mapeo
  • 1.6.3 Nivel de Interacción entre los Componentes
  • 1.7 ETAPAS EN EL PROCESAMIENTO
  • Figura 5. Interacción entre los Componentes de una Oración
  • Figura 6. Esquema de un Sistema de Lenguaje Natural
  • Figura 7. Evolución de un Sistema de Lenguaje Natural
  • 2.1 DESCRIPCIÓN
  • Figura 8. Ciclo del Analizador Léxico
  • 2.2 LENGUAJE
  • 2.2.1 Alfabeto
  • Tabla 2. Alfabeto de la Lengua Castellana
  • 2.2.2 Morfología
  • Tabla 3. Ejemplos de Palabras Compuestas
  • Tabla 4. Uso de Tiempos
  • Tabla 5. Derivados Irregulares
  • Tabla 6. Opciones de Género y Número
  • Tabla 7. Comparativos
  • Tabla 8. Generación de Raíces Incorrectas
  • 2.2.3 Diccionario
  • Tabla 9. Formato de Diccionario
  • Tabla 10. Tipo de Organización y Acceso
  • 2.2.4 Unidades Léxicas
  • Figura 9. Aplicación de Unidades Léxicas
  • Tabla 11. Formato de la Estructura Temporal Fuente
  • Tabla 12. Formato de la Unidad Léxica
  • 2.3 PROCEDIMIENTO
  • Figura 10. Procedimiento de Entrada del Analizador Léxico
  • Figura 11. Procedimiento de Salida del Analizador Léxico
  • 2.4 ADMINISTRACIÓN DE ERRORES
  • 2.5 DESARROLLO
  • 3. ANÁLISIS SINTÁCTICO
  • 3.1 DESCRIPCIÓN DEL ANÁLISIS SINTÁCTICO
  • 3.2 ELEMENTOS
  • 3.2.1 Gramáticas
  • Figura 12. Gramática Libre de Contexto
  • 3.2.2 Redes de Transición
  • Figura 13. RTEF para una Simple Gramática
  • Figura 14. RTEF para una Gramática
  • Figura 15. RTEF no Determínistica
  • Figura 16. RTEF de una Gramática del Inglés
  • 3.2.3 Parsers
  • Figura 17. Árbol de Traducción
  • 3.3 TEORÍAS DE CHOMSKY
  • Figura 18. Estructura de Frase
  • Figura 19. Desarrollo de una Gramática Transformacional
  • Figura 20. Conjugación de Oraciones de una Gramática Transformacional
  • Figura 21. Atributos de los Símbolos de un Frase Marcada
  • Figura 22. Funcionamiento de la Teoría de Sintaxis
  • 3.4 REDES DE TRANSICIÓN AUMENTADAS (RTA)
  • Figura 23. Gramática
  • 3.5 DESARROLLO DEL MÓDULO SINTÁCTICO
  • Tabla 13. Formato de la Estructura Temporal Fuente
  • Figura 24. Estructura Ligada para una Frase
  • Figura 25. Programa para Gramática tipo RTA
  • 4. ANÁLISIS SEMÁNTICO
  • 4.1 NATURALEZA
  • 4.2 ELEMENTOS
  • 4.2.1 Contexto
  • Figura 26. Contexto de un Lenguaje
  • 4.2.3 Relación
  • 4.3. ESTUDIO DE GRAMÁTICAS SEMÁNTICAS
  • 4.3.1 Teoría Semántica
  • Figura 27. Marcadores Usados en la Teoría Semántica
  • Figura 28. Marcadores Semánticos
  • Figura 29. Ejemplo de Distinguidores
  • Figura 30. Rutas Amalgamadas para Interpretar una Oración
  • Figura 31. Frases Emitidas por una Semántica Generativa
  • Figura 32. Frases Marcadas por una Semántica Generativa
  • 4.4 GRAMATICAS CASE
  • Figura 33. Oración por Medio de una Gramática Case
  • Figura 34. Oración Negativa Expresada por Medio de Case Frame
  • Figura 35. Oración Positiva Expresada Medio de Case Frame
  • Figura 36. Oración en Voz Activa
  • Figura 37. Oración en Voz Pasiva
  • 4.5 REDES SEMÁNTICAS
  • 4.5.1 Búsqueda
  • Figura 38. Red Semántica Binaria
  • 4.5.2 Representación de Predicados no Binarios
  • Figura 39. Red Semántica n-aria
  • Figura 40. Red Semántica Relacional
  • 4.5.3 Distinciones Importantes
  • Figura 41. Relación de Entidades
  • Figura 42. Representación de Objetos
  • Figura 43. Representación de Comparaciones
  • 4.5.4 Herencia Simple
  • Figura 44. Herencia Simple
  • 4.5.5 Herencia Múltiple
  • Figura 45. Herencia Múltiple
  • 4.5.6 Excepciones
  • Figura 46. Representación de Excepciones
  • 4.6 DEPENDENCIA CONCEPTUAL
  • Figura 47. Dependencia Conceptual
  • Figura 48. Uso de los Tiempos Conceptuales
  • 4.6.1 Argumentos para la Representación en CD
  • Figura 49. Representación de la Dependencia Conceptual
  • 4.7 CONSTRUCCIÓN DEL MÓDULO SEMANTICO
  • Figura 50. Esquema de un Sistema de Lenguaje Natural
  • Figura 51. Generación de Significado para una Frase
  • 5.1 PERFIL
  • Figura 52. Generación de Significado para una Frase
  • 5.2 PROCESO
  • 5.3 DESCRIPCIÓN DEL ANÁLISIS PRAGMÁTICO
  • Figura 53. Resultados del Análisis Sintáctico
  • Figura 54. Base de Conocimientos basada en Frames
  • Figura 55. Significado Parcial de una Oración
  • Figura 56. Representación de la “intención” de una oración
  • 5.4 TÉCNICAS
  • 5.5.2 Modelo de Creencias
  • Figura 57. Red Semántica Particionada
  • 5.5 ANÁLISIS DEL MÉTODO DE DIRECCIÓN POR METAS
  • 5.6 GUIONES
  • 5.6.1 Representación de conocimiento
  • Figura 58. Guión del Restaurante
  • 5.6.2 Razonamiento
  • 5.6.3 Ventajas y Desventajas
  • 5.7 COMPRENSIÓN DE HISTORIAS
  • 5.7.1 Interés
  • 5.7.2 Comprensión de Historias
  • 6.8 CREACIÓN DE UN INTERPRETADOR
  • Figura 59. Interpretación de Textos Fuente
  • Figura 60. Exposición de Respuesta del Intérprete
  • 6. GENERACIÓN DE LENGUAJE
  • 6.1 CONSIDERACIONES
  • 6.2 PROCEDIMIENTO
  • Figura 61. Generación de Lenguaje
  • 6.3 USO DE PLANTILLAS
  • Figura 62. Ejemplo de Perspectivas
  • Figura 63 Template de la Oración
  • Figura 64. Inferencia
  • 6.4 MODELOS DE GENERACIÓN
  • Figura 65. Estructura de Frames
  • Figura 66. Modelo de Oración por medio de Frames
  • 6.5 PROCEDIMIENTO INVERSO
  • Figura 67. Flujo de Generación de Lenguaje
  • 6.6 EXPRESIONES
  • Figura 68. Relación de Cambios de Estado
  • 6.7 CREACIÓN DE UN MODELO
  • Figura 69. Un Acto Provoca la Ejecución de Otro
  • Figura 70. Un Acto Implica la Ejecución de Otros
  • Figura 71. Representación de Estados Mentales
  • Figura 72. Estados Mentales Ligados por Inicio, Terminación y Correlación
  • Figura 73. Instancias de Eventos que Terminan en Relación o Acto
  • Figura 74. Asociación de Situaciones Diversas por Medio de Eventos
  • Figura 75. Causa-Efecto de Eventos y Estados
  • Figura 76. Perspectivas que Involucran Eventos Positivos
  • Figura 77. Abstracción de Perspectivas en Niveles
  • Figura 78. Abstracción a un Mayor Nivel mediante Unidades
  • Figura 79. Historia del Regalo de Juan a María

Lenguaje Natural: Descripción de las Etapas para su Tratamiento Alejandro Peña Ayala

INSTITUTO POLITÉCNICO NACIONAL

Alejandro Peña Ayala

Cursó la licenciatura en Informática en la UPIICSA del IPN. Posteriormente obtuvo el Diplomado en Java y Aplicaciones Web en el ITAM, la Especialidad y la Maestría en Inteligencia Artificial en la Fundación Arturo Rosenblueth. Actualmente es candidato al grado de Doctor en Ciencias de la Computación por el Centro de Investigación en Computación del IPN, contando para ello del respaldo del CONACYT y del IPN a través de una beca. Entre sus distinciones académicas están: El haberse titulado por la opción de escolaridad en 1981, conforme al reglamento del IPN. El reconocimiento hecho por el CONCACYT y el Diario de México en el evento: “Los mejores estudiantes de México generación 1981”, como el mejor estudiante en la Licenciatura en Informática del IPN. Además de haber obtenido el grado de de Maestría en Inteligencia Artificial con mención honorífica. A la par de su desarrollo académico, Alejandro Peña ha ejercido la carrera magisterial, profesional, de investigación y ministerial. En 1981 ingresó a la planta docente de la UPIICSA, donde actualmente es profesor titular C e investigador. Durante el lapso 1989-1994 ofreció cátedra en la Maestría en Sistemas Computacionales del ITESM-CEM. Además de haber hecho lo propio en las Maestrías en Sistemas de Información y Ciencias de la Computación en la Fundación Arturo Rosenblueth. En el ámbito profesional de la Informática, desde 1978 se ha desenvuelto en los sectores privado, público, bancario y empresarial, desempeñando cargos como: Programador, analista y líder de proyecto en la entonces Secretaría de Comercio. Jefe de Soporte Técnico en el (desaparecido) Instituto Mexicano de Comercio Exterior. Subdirector de Sistemas en la Secretaría de Salud. Subgerente de Proyectos Especiales en el Banco Nacional de Comercio Exterior. Coordinador de Sistemas en Banamex. Fue fundador y Director General de la empresa Neuralware, dedicada a las Tecnologías de la Información. Como resultado de sus estudios doctorales orientados al ámbito de la Educación basada en Web, ha publicado: varios Reportes Técnicos, y presentado diversos trabajos en congresos nacionales e internacionales celebrados en ciudades de cuatro continentes, como por ejemplo: Washington-USA., Vancouver Canáda, Melbourne Australia, Bensaçon – Francia, Grindelwald – Suiza, y Bali – Indonesia. Las memorias de sus artículos han sido editadas por organizaciones como IEEE y Springer. Así mismo es autor de una colección de libros relacionados con la Informática y la Inteligencia Artificial. Actualmente, Alejandro Peña es Apóstol y Director General del World Outreach Light to the Nations Ministries (WOLNM), cuya visión es la formación de discípulos, mediante el uso de las Tecnologías de la Información y del Conocimiento, a nivel mundial dedicados a predicar el Evangelio. Por sus ocupaciones académicas, profesionales y ministeriales, Alejandro Peña ha tenido la oportunidad de visitar diversos países y regiones del mundo, amén de haber arribado a sitios extremos del planeta como: La Antártida, el océano glaciar Ártico, y el centro del desierto de Australia. También ha explorado islas exóticas como Hawai, Tahití, y Rarotonga; y otras remotas como Spitsbergen y Baffin. A raíz de tales experiencias, Alejandro Peña ofrece el testimonio de las maravillas naturales que Dios ha hecho en el mundo para deleite del ser humano, y en particular de sus hijos que son salvos a través de Jesucristo y llenos de su Espíritu Santo, quien les anima a clamar: ¡Abba, Padre!

Lenguaje Natural: Descripción de las Etapas para su Tratamiento

.

México - .Lenguaje Natural: Descripción de las Etapas para su Tratamiento Alejandro Peña Ayala INSTITUTO POLITÉCNICO NACIONAL .

Alejandro Peña Ayala INSTITUTO POLITÉCNICO NACIONAL Dirección de Publicaciones Revillagigedo 83.R.PRIMERA EDICIÓN 2006. © 2006. México. D.F. D. ISBN: 970-94797-3-3 Impreso en: México / Printed in México . 06070. Centro Histórico.

como investigador y docente en la Unidad Profesional Interdisciplinaria de Ingeniería y Ciencias Sociales y Administrativas (UPIICSA) del Instituto Politécnico Nacional (IPN) y fruto del desarrollo de su tesis doctoral en el Centro de Investigación en Computación del Instituto Politécnico Nacional. . Así mismo. Hermano Jesús y Consolador como parte de los proyectos de investigación de World Outreach Light to the Nations Ministries (WOLNM).El autor reconoce que esta obra ha sido inspirada de manera especial por su Padre. el trabajo es el resultado de su experiencia profesional.

.

PRÓLOGO .

.

sintácticos y semánticos. Además de tratar la interpretación y la generación del lenguaje. el material que se presenta en esta edición se compone de seis capítulos en los que se abordan los temas de: Naturaleza del lenguaje natural. A lo largo del material se exponen las actividades. Los análisis lexicográficos. . Dada la naturaleza del lenguaje natural. En este ejemplar. se evitan los problemas de ruido y reconocimiento de patrones característicos del ambiente normal de comunicación entre seres vivos. Por tal motivo. se aborda el tratamiento de lenguaje natural que es alimentado al computador a través de un periférico como el teclado. constituye un reto de investigación y desarrollo. técnicos y estructuras de datos que se recomiendan emplear para el desarrollo de aplicaciones destinadas al tratamiento del lenguaje natural por un sistema de cómputo.El lenguaje natural es una de las manifestaciones de la capacidad cognitiva del ser humano en la que da curso a la exteriorización de sus pensamientos a sus semejantes. Para ello las personas se valen de una serie de convenciones fonéticas y visuales que hacen posible el entendimiento. su tratamiento por medio de sistemas de cómputo. Al estar reasentado el texto en forma magnética.

TABLA DE CONTENIDO
INTRODUCCIÓN 3 1. ÁMBITO DEL LENGUAJE NATURAL ..................................................................................................................7

1.1 PERFIL.................................................................................................................................. 7 1.2 ÁREAS DE ESTUDIO.......................................................................................................... 7 1.2.1 Lingüística ...................................................................................................................... 7 1.2.2 Psicología ....................................................................................................................... 9 1.2.3 Filosofía .......................................................................................................................... 9 1.2.4 Neurociencias ............................................................................................................... 11 1.2.5 Comunicación Social.................................................................................................... 13 1.3 RAMAS DE INVESTIGACIÓN......................................................................................... 13 1.3.1 Comprensión del Lenguaje Natural Escrito ................................................................. 13 1.3.2 Diálogo Sonoro............................................................................................................. 14 1.4 DESARROLLOS ................................................................................................................ 14 1.5 APLICACIONES Y PROGRAMAS .................................................................................. 16 1.6 REPRESENTACIÓN .......................................................................................................... 16 1.6.1 Representación.............................................................................................................. 16 1.6.2 Mapeo ........................................................................................................................... 17 1.6.3 Nivel de Interacción entre los Componentes................................................................ 18 1.7 ETAPAS EN EL PROCESAMIENTO ............................................................................... 18
2. ANÁLISIS LÉXICO 25

2.1 DESCRIPCIÓN ................................................................................................................... 25 2.2 LENGUAJE......................................................................................................................... 25 2.2.1 Alfabeto ........................................................................................................................ 25 2.2.2 Morfología .................................................................................................................... 26 2.2.3 Diccionario ................................................................................................................... 28 2.2.4 Unidades Léxicas.......................................................................................................... 28 2.3 PROCEDIMIENTO ............................................................................................................ 30 2.4 ADMINISTRACIÓN DE ERRORES ................................................................................. 33 2.5 DESARROLLO................................................................................................................... 34
3. ANÁLISIS SINTÁCTICO .......................................................................................................................................37

3.1 DESCRIPCIÓN DEL ANÁLISIS SINTÁCTICO .............................................................. 37 3.2 ELEMENTOS ..................................................................................................................... 37 3.2.1 Gramáticas .................................................................................................................... 37 3.2.2 Redes de Transición...................................................................................................... 38 3.2.3 Parsers........................................................................................................................... 41 3.3 TEORÍAS DE CHOMSKY ................................................................................................. 42 3.4 REDES DE TRANSICIÓN AUMENTADAS (RTA) ........................................................ 47 3.5 DESARROLLO DEL MÓDULO SINTÁCTICO............................................................... 51
4. ANÁLISIS SEMÁNTICO........................................................................................................................................57

4.1 NATURALEZA .................................................................................................................. 57 4.2 ELEMENTOS ..................................................................................................................... 57 4.2.1 Contexto ....................................................................................................................... 57 4.2.3 Relación ........................................................................................................................ 58 4.3. ESTUDIO DE GRAMÁTICAS SEMÁNTICAS............................................................... 58 4.3.1 Teoría Semántica .......................................................................................................... 58

4.4 GRAMATICAS CASE ....................................................................................................... 62 4.5 REDES SEMÁNTICAS ...................................................................................................... 65 4.5.1 Búsqueda ...................................................................................................................... 66 4.5.2 Representación de Predicados no Binarios................................................................... 66 4.5.3 Distinciones Importantes .............................................................................................. 68 4.5.4 Herencia Simple ........................................................................................................... 69 4.5.5 Herencia Múltiple......................................................................................................... 69 4.5.6 Excepciones .................................................................................................................. 70 4.6 DEPENDENCIA CONCEPTUAL...................................................................................... 70 4.6.1 Argumentos para la Representación en CD.................................................................. 72 4.7 CONSTRUCCIÓN DEL MÓDULO SEMANTICO ......................................................... 73
5. COMPRENSIÓN 79

5.1 PERFIL................................................................................................................................ 79 5.2 PROCESO ........................................................................................................................... 79 5.3 DESCRIPCIÓN DEL ANÁLISIS PRAGMÁTICO ........................................................... 80 5.4 TÉCNICAS.......................................................................................................................... 83 5.5.1 Empleo de la Atención ................................................................................................. 83 5.5.2 Modelo de Creencias .................................................................................................... 83 5.5 ANÁLISIS DEL MÉTODO DE DIRECCIÓN POR METAS............................................ 85 5.6 GUIONES............................................................................................................................ 86 5.6.1 Representación de conocimiento .................................................................................. 86 5.6.2 Razonamiento ............................................................................................................... 88 5.6.3 Ventajas y Desventajas................................................................................................. 89 5.7 COMPRENSIÓN DE HISTORIAS .................................................................................... 89 5.7.1 Interés ........................................................................................................................... 89 5.7.2 Comprensión de Historias ............................................................................................ 90 6.8 CREACIÓN DE UN INTERPRETADOR.......................................................................... 90
6. GENERACIÓN DE LENGUAJE ............................................................................................................................95

6.1 CONSIDERACIONES........................................................................................................ 95 6.2 PROCEDIMIENTO ............................................................................................................ 95 6.3 USO DE PLANTILLAS...................................................................................................... 96 6.4 MODELOS DE GENERACIÓN ........................................................................................ 98 6.5 PROCEDIMIENTO INVERSO .......................................................................................... 99 6.6 EXPRESIONES ................................................................................................................ 100 6.7 CREACIÓN DE UN MODELO ....................................................................................... 101
CONCLUSIONES REFERENCIAS 109 113

........ 20 Figura 8................................ 62 Figura 33............ Tipos de Mapeo.... Esquema de un Sistema de Lenguaje Natural........................................ 7 Figura 2...................... Representación de Objetos......................... Red Semántica Binaria. ............................................... 64 Figura 36.......................... Composición del Ser Humano.............. 17 Figura 4.................................................................................................................................................................................................... 47 Figura 23................................................................. 64 Figura 35..... 64 Figura 37............................... 67 Figura 41................................................................................................ Relación de Entidades.................... Regiones Cerebrales Responsables del Lenguaje....................................... Ciclo del Analizador Léxico..................... 45 Figura 21..................................................................... 68 Figura 42.................... Expresión Arborescente........................................... ...................................... 37 Figura 13...................................................................................................... ................................................... 46 Figura 22...... Ejemplo de Distinguidores..... Marcadores Semánticos....................................... .............................. 59 Figura 29........ 66 Figura 39. 53 Figura 26....... 39 Figura 14................ Red Semántica Relacional...................................... 31 Figura 11............................................................................................. ...... Aplicación de Unidades Léxicas.................................................................. 59 Figura 30...................... 52 Figura 25.............. ...... ....... Desarrollo de una Gramática Transformacional................................................. Frases Emitidas por una Semántica Generativa....................................................................... 61 Figura 32....................................................... Oración por Medio de una Gramática Case.... .......... ...... Gramática Libre de Contexto........... Rutas Amalgamadas para Interpretar una Oración................................................... Red Semántica n-aria............... 40 Figura 16................ Funcionamiento de la Teoría de Sintaxis..................................................... 20 Figura 7................ 68 Figura 44................................................................................ .... ............................................... 59 Figura 28.... Herencia Simple............................................... Estructura de Frase................. 67 Figura 40........... Evolución de un Sistema de Lenguaje Natural.......................................... Árbol de Traducción.................................................. . 29 Figura 10.............................................. .......... .................................. RTEF para una Simple Gramática.......... Oración en Voz Activa............ ........................ RTEF para una Gramática......................................................................................................... Estructura Ligada para una Frase... 60 Figura 31................................................................. 69 ... ..... Gramática... Interacción entre los Componentes de una Oración......................... .... ...... Contexto de un Lenguaje............. .............. 50 Figura 24........................ Oración Negativa Expresada por Medio de Case Frame..... ........................ Representación de Comparaciones..... RTEF no Determínistica..................... 41 Figura 17........................... ............ ............................ 12 Figura 3....................... 39 Figura 15........................... 25 Figura 9....... Programa para Gramática tipo RTA.............. Conjugación de Oraciones de una Gramática Transformacional.......................... ...........TABLA DE FIGURAS Figura 1..................................................................... Marcadores Usados en la Teoría Semántica.............................................................................................. ................................................................................................ .................................... 44 Figura 19. 18 Figura 5....................................... 58 Figura 27... .. Oración en Voz Pasiva................................................ Atributos de los Símbolos de un Frase Marcada................................................... 44 Figura 20.................... Procedimiento de Entrada del Analizador Léxico. 68 Figura 43....................................................................................................... 63 Figura 34.......... 32 Figura 12............................ RTEF de una Gramática del Inglés............................ 65 Figura 38................................................................ ............................ Procedimiento de Salida del Analizador Léxico.. Oración Positiva Expresada Medio de Case Frame............................ 19 Figura 6......... Frases Marcadas por una Semántica Generativa...................................... 42 Figura 18......................................

........................ Instancias de Eventos que Terminan en Relación o Acto.................. 75 Figura 52.......................... Historia del Regalo de Juan a María .... Inferencia.... Un Acto Provoca la Ejecución de Otro.... 72 Figura 49.. ............................................................................... 84 Figura 58.................................... . 97 Figura 63 Template de la Oración...... ............ 103 Figura 77............... ..................................... Generación de Significado para una Frase................................ 104 Figura 78......... Interpretación de Textos Fuente................. Generación de Significado para una Frase................................... 82 Figura 57............ Modelo de Oración por medio de Frames.... .......................... Esquema de un Sistema de Lenguaje Natural.............. ............................................ ...... Terminación y Correlación...................................................... Causa-Efecto de Eventos y Estados............... 97 Figura 64.... Perspectivas que Involucran Eventos Positivos................................................................................................................................................................... Herencia Múltiple.............................. Red Semántica Particionada................... Exposición de Respuesta del Intérprete...................................................................................... ...... ............................ 70 Figura 47......... .................................................... 105 ................................. Estructura de Frames................. ...... Guión del Restaurante......................................................... 101 Figura 72................. Representación de la Dependencia Conceptual.. 70 Figura 48........ Representación de Excepciones ................................................................................................... 97 Figura 65................. Estados Mentales Ligados por Inicio..................................................... .................. 102 Figura 73... Resultados del Análisis Sintáctico. Ejemplo de Perspectivas................................................... Uso de los Tiempos Conceptuales........ 96 Figura 62...................................................... 100 Figura 69................... 102 Figura 74.......... Asociación de Situaciones Diversas por Medio de Eventos...................................................... Dependencia Conceptual.................................. ............. Representación de la “intención” de una oración.......................................... 91 Figura 61............................................................................................... 79 Figura 53......... .............................................. Generación de Lenguaje.......... 99 Figura 68................................. .........................................................................Figura 45............................ Un Acto Implica la Ejecución de Otros....................... 104 Figura 79................................ ........................ . 74 Figura 51...................... ........................ 101 Figura 70........................................................... Significado Parcial de una Oración.................. 80 Figura 54.............................. 102 Figura 75................................ 73 Figura 50............................................ 81 Figura 55.... 99 Figura 67............................... ................... Base de Conocimientos basada en Frames.......................... 69 Figura 46............... 91 Figura 60............................................................................................. 87 Figura 59....................................... Relación de Cambios de Estado................................................................ 101 Figura 71............. 81 Figura 56......... 98 Figura 66........................................................................ 103 Figura 76........... Representación de Estados Mentales................. Abstracción de Perspectivas en Niveles................................... Abstracción a un Mayor Nivel mediante Unidades............. Flujo de Generación de Lenguaje............

..... Generación de Raíces Incorrectas............................................ Formato de la Unidad Léxica............................. ........ Formato de la Estructura Temporal Fuente............... 25 Tabla 3................................................................................................................................................... ....................................................................................................LISTA DE TABLAS Tabla 1................................................................................................ Formato de Diccionario................................................ Ejemplos de Palabras Compuestas................................. 27 Tabla 9...................................................................................................... 29 Tabla 12....................................... Limitaciones y Ventajas de los Lenguajes..................................... ............................... 26 Tabla 4.............. Formato de la Estructura Temporal Fuente..... 28 Tabla 11................................. Tipo de Organización y Acceso ...................................... Derivados Irregulares.......... ....................................................... .................. 27 Tabla 8........................................ Uso de Tiempos................... Alfabeto de la Lengua Castellana................. 26 Tabla 5............................................. 28 Tabla 10.......... 51 .............. Opciones de Género y Número..................... 30 Tabla 13... 27 Tabla 6..... 17 Tabla 2.... ................................. ..................... . Comparativos............ 27 Tabla 7.

.

INTRODUCCIÓN .

.

se ha compilado el Reporte Técnico como resultado de los estudios. que han aportado avances y mejoras significativas en la fabricación de equipo cada día más poderoso y a la vez económico. comerciales. Por tal motivo. cultures y domésticas del ser humano. diseño e implementación de sistemas para el proceso de lenguaje natural escrito. Un ejemplo contundente es la generalización de aplicaciones de cómputo como el uso de un sistema operativo estándar en los computadores personales y el intercambio de información a través de internet por medio de un protocolo universal. Con ella se aborda el reto de construir sistemas de cómputo orientados al manejo. Su popularidad ha crecido aceleradamente gracias a la evolución de la electrónica y las comunicaciones. comprensión y generación del lenguaje natural que expresa un usuario y la aplicación que opera. técnicas y procedimientos necesarios en la concepción. que como parte de la formación de un especialista en sistemas de información se le brindan los elementos logísticos y experiencias apropiadas para el diseño de aplicaciones basadas en el uso del lenguaje natural.INTRODUCCIÓN Los sistemas de cómputo se han convertido en una herramienta para el desempeño de labores profesionales. rápida y precisa. sociales. . la estructura del material se compone por un conjunto de capítulos dedicados a describir las etapas del procesamiento del lenguaje natural comenzando por describir la naturaleza del propio lenguaje. Es por ello. Por tanto. organizado en algunas materias específicas. Proveer un vehículo de comunicación sencillo y natural entre el operador y el sistema ha sido un factor determinante de éxito de estas aplicaciones. la lingüística y la inteligencia artificial. Disciplina que basa sus fundamentos en las matemáticas. generación. Para enriquecer y facilitar la investigación y desarrollo de este clase de aplicaciones. han hecho en conjunto una herramienta muy valiosa para el bienestar de la sociedad. lo cual ha motivado a profundizar en el uso de instrumentos y tecnologías que tiendan a emular el diálogo natural entre los usuarios sin menoscabo que uno de los participantes sea una máquina. globalización y modernización. En donde el factor común es facilitar el uso de los productos e incrementar la utilidad. gracias a los beneficios que brindan en el tratamiento de información de una manera confiable. Una de ellos se conoce como Lenguaje Natural. producción e implementación de bienes con un alto nivel de contenido tecnológico. uno de los temas integrantes de su formación se concentra a proponer todos los conceptos. investigación y desarrollo de sistemas que emplean interfases basadas en el lenguaje natural. obligan a los sectores productivos de los países a invertir en el desarrollo. deportivas. que acompañado por la robustez y facilidad en el empleo de los programas de cómputo. las etapas para el proceso del lenguaje natural y se concluye con una serie de observaciones para la creación de esta clase de aplicaciones. Para crear este tipo de proyectos se requiere la intervención de varios campos especializados. Las tendencias mundiales de automatización. entre los que destaca el Informático que aparto un conocimiento valioso.

tales como las gramáticas. técnicas para la interpretación como la atención y el modelo de creencias. además de ofrecer un resumen de las teorías de Chomsky y de las redes de transición aumentadas. como un medio simple de diálogo. El capítulo tres describe la naturaleza del Análisis Sintáctico. concluyendo con una serie de lineamientos para crear un módulo sintáctico. . el manejo de unidades léxicas. En los últimos apartados del Reporte Técnico se presentan las conclusiones y referencias bibliográficas. En el capítulo cuatro se dedica a presentar el Análisis Semántico a partir de un perfil y de sus elementos. procedimiento. describe el procedimiento inverso en la generación de lenguaje. identifica sus elementos. el manejo de errores e implementación. las áreas de estudio.4 Lenguaje Natural: Descripción de las Etapas para su Tratamiento El cuerpo del Reporte Técnico se desglosa de la siguiente forma: El capítulo uno se ofrece un panorama del lenguaje natural. y modelos de generación. la comprensión de historias y una serie de lineamientos para crear un intérprete. Así mismo. el diccionario. En el capítulo dos se presenta la descripción del Análisis Léxico a partir de los elementos del lenguaje. aplicaciones y programas del lenguaje natural. el análisis pragmático. las Redes Semánticas y la Dependencia Conceptual. las ramas de investigación. amén de ofrecer recomendaciones para crear un módulo Semántico. desarrollo y aplicación de sistemas de información que incluyan como interfase hombre-máquina mecanismos para el procesamiento de lenguaje natural. además de presentar el método de dirección por metas y los guiones. el uso de plantillas. El capítulo cinco introduce un perfil de la Interpretación del lenguaje natural acompañado por la descripción del proceso para su tratamiento. Con este material se pretende motivar al estudio. El capítulo seis aborda el tema de la generación del lenguaje a partir de las consideraciones. También ofrece un apartado para el análisis de las gramáticas semánticas y CASE. la morfología. la composición de expresiones y el proceso para construir un módulo.

CAPÍTULO 1. ÁMBITO DEL LENGUAJE NATURAL .

.

régimen o dependencia mutua. pero no siempre está ilustrado por una sola letra o grafía. gramática. representadas como fonemas. Es la parte de la gramática que estudia la concordancia o armonía que entre varias clases de palabras ha establecido el uso. ojos. Los desajustes entre ambos alfabetos consisten en que: . Composición del Ser Humano. además de normar y el orden en que se colocan los diversos elementos que componen a la oración. . Interior: venas. tejidos. La lingüística juega un papel muy importante en el análisis del lenguaje natural debido a que regula su correcto empleo.. . morfología y la fonología. para expresar sus ideas. El español posee fonemas que se identifican como vocales: /a/e/i/o/u/. entre las que destacan: Sintaxis. Por eso el sistema fonológico y el alfabeto ortográfico con que se escribe el español. a través de varias ramas. Cada fonema representa un sonido.2.. emociones y necesidades. como se muestra en la Figura 1: Espíritu Intuición Conciencia Comunión El ser humano es Tripartito [1] Mente Alma Sentimientos Voluntad Cuerpo Exterior: cabello.1 PERFIL El lenguaje natural “LN” es la forma de comunicación que el humano aprende de su ambiente y usa para comunicarse con los demás. Entre sus áreas de estudio se encuentran la sintaxis. piel. no guardan entre sí una exacta correspondencia. Como parte de sus intereses está la regulación misma del lenguaje. es por ello que existen las Academias de la lengua. Fonética.1 Lingüística Es el estudio del lenguaje encargado de explicar la composición y empleo del lenguaje [2]. Estudia la acústica (la formación y propagación de los sonidos) y la fisiología (como funcionan los órganos al producir sonido) de las expresiones pronunciadas. esperando cierta clase de respuesta por parte de su interlocutor. 1. Figura 1. huesos.1. La sintaxis constituye la parte formal del lenguaje. y fonemas que se realizan en consonantes: /d/f/l/m/ñ/p/t/.2 ÁREAS DE ESTUDIO 1. ÁMBITO DEL LENGUAJE NATURAL 1. semántica.

en abstracto. Así pues. resulta una diferencia de significado. La letra “w” no se usa en el español más que en palabras procedentes del inglés (en ese caso suena como “u”: Washington) o procedentes del alemán (entonces suena como el fonema /b/ Wagner). corresponde a la letra doble gu. carece de significado. Semántica.gu). o bien. “qu” (fonema /k/). Mientras que la letra “h” no corresponde a ningún sonido ni representa ningún fonema. sala (/s/). ci). La fonología estudia cuál es el valor de los fonemas desde el punto de vista de su función en la lengua. Corresponden a tres letras: el fonema /k/ (que se describe con la “k”. go . “u” (ca. El fonema es el elemento más simple de la lengua. jala (/j/)”. la “qu”). pero si en la palabra ley se sustituye por el fonema /rr/ (rey). por si solo. La letra “r” a veces representa al fonema /r/ (arete) y a veces al fonema /rr/ (rata). Es la disciplina científica que estudia los cambios de significación que han operado en las palabras. por ejemplo. “o”. gui). co. “c “ seguida de “e” o de “i”: ce. El fonema es pues la unidad fonológica unidad que se caracteriza por ser diferenciadora de significado. lo mismo que el fonema /y/ (letras “ll” e “y” inicial de sílaba). la “c” que precede a las vocales “a”. “rr” intervocálica). pero carente de significado en sí misma. Representa. gi). en: “pala (/p/). “z”. antes de “e” o de “i” (gue. “u” (ga.8 Lenguaje Natural: Descripción de las Etapas para su Tratamiento El fonema /b/ corresponde a dos letras (“b” y “v”). pero solamente cuando va seguida de las vocales “e” e “i” (ge. sólo tiene valor ortográfico. -ala el fonema omitido determina la diferencia de la palabra. todas las cualidades fónicas que lo hacen identificable en el habla. cu) y el fonema /s/ (que se escribe con las letras “s”. la fonología investiga que diferencias fónicas están relacionadas con diferencias de significado. y el fonema /rr/ (letras “r”. qué relaciones establece un fonema con los demás dentro de un paradigma y como se da este. Por ejemplo el fonema /l/. también indica cómo se combina con otros para formar palabras y frases. bala (/b/). La letra “x” corresponde a dos sonidos representados por sus respectivos fonemas: /k/ y /s/. mala (/m/). . Fonología. tala (/t/). Hay letras dobles: ch (fonema /ch/). gala (/g/). “ll” (fonema /y/). El fonema /g/ corresponde a la letra “g” cuando va antes de “a”. “rr” (fonema /rr/) y “gu” seguida de “e” o de “i” (fonema /g/). “o”. El fonema /j/ corresponde a la letra “j” y también a la letra “g”.

la cognición. Básicamente.individuo y ente social. entre otros.Ámbito del Lenguaje Natural 9 Gramática. La predicción ocurre cuando el psicólogo anticipa correctamente eventos que ocurren en circunstancias naturales. 1. Además. la segunda por medio del formalismo en las estructuras y significados. Escogemos palabras y frases que expresen la idea. como iniciadores de la filosofía. utilizándolo primordialmente para hallar una definición. la explicación pretende identificar las causas que motivan a un determinado comportamiento en el individuo. ellos utilizaban con frecuencia la palabra “λóγos” que en griego significa palabra y en latín se tradujo como verbo. Para poder entender el proceso de generación del lenguaje se debe de abordar el problema tomando en consideración temas donde este se ve involucrado y tiene que ver. Para los griegos. en forma de preguntas llamado en filosofía como “Mayéutica”. La descripción del comportamiento como resultado del estudio psicológico no es casual o carente de objetivo. aprendizaje y la personalidad. como lo son el pensamiento. la predicción y el control del mismo. el cual se puede generalizar en tres fases: • • • Se empieza con un pensamiento. Producimos los sonidos del habla que forman dichas palabras y frases. Sócrates utilizó ampliamente un método que utilizaba al lenguaje. trata de formular una serie de reglas. La primera como forma de pensamiento del ser humano . el concepto de lo que es el amor.2 Psicología Psicología es el estudio científico del comportamiento. Se encarga de estudiar los elementos del lenguaje y sus combinaciones. la psicología describe el comportamiento (el qué) y trata de explicar las causas del mismo (el por qué).2. mientras que el control significa que el psicólogo de algún modo manipula la situación para obtener un resultado esperado. la justicia.3 Filosofía Se interesa fundamentalmente en dos áreas de estudio del lenguaje. El estudio del comportamiento tiene como propósito la explicación. y condiciones espirituales de su desarrollo”. Como tal.2. además de su origen. 1. . capaces de generar o producir todas las oraciones posibles y aceptables del lenguaje. Estudia la función (sintaxis) y la forma (morfología) de los signos lingüísticos. esencia. La filosofía define al lenguaje de la siguiente manera: “Parte de la filosofía que investiga las aportaciones de este medio de expresión. el estudio del lenguaje tomó gran importancia. aplicando métodos de inferencia. La gramática es rígida por el principio de que todos los elementos mantienen entre sí relaciones semánticas. la templanza y la compasión. La forma en que se relaciona la psicología y el lenguaje natural estriba en el interés de comprender como se produce el proceso de generación y entendimiento del lenguaje.

esta idea general no penetra realmente en alguien. A medida que la historia varía. la verdad le parece tan preciosa a quien la emite. no significa lo mismo en nuestro tiempo que en la “Antigüedad Clásica” o en la “Edad Media”. Según los italianos Vico y Croce. si esto es así. en el lenguaje natural. Aún en las épocas recientes. no es la de construir silogismos.10 Lenguaje Natural: Descripción de las Etapas para su Tratamiento El método socrático recibe el nombre de Dialéctico. acontecimientos históricos de gran importancia han cambiado su valor. se representará muy vivamente que los cuatro pesos que lleva a casa son una suma más importante que cada una de los sumandos. La voz “Libertad”. El lenguaje humano es artificial. Diferentes concepciones políticas bastan para alterar el mecanismo expresivo del lenguaje. el lenguaje natural. Algunos le llaman lenguaje “natural” al que experimenta el niño cuando quiere comunicarse. sino de la de todos y en todas sus manifestaciones. pero un obrero que ha ganado dos pesos por la mañana y dos pesos por la tarde. ni la de plegarse a las leyes. es porque la vida de la cual es expresión. nada tiene que ver con las ideas puras. como el arte de debatir mediante preguntas y respuestas. pienso yo en mi vida o en la vida de otras personas implicadas en mi existencia. La forma de pensamiento anterior se refleja. políticas. no pretendió satisfacer ninguna necesidad sino obedeció al simple placer de nombrar cosas. religiosas y económicas surgen y desaparecen. para así llegar a la verdad. tiene que ser muy distinta de lo que hace creer la lógica y la estética. es un producto que se hereda y que el niño aprende lentamente a través de los años. En ese momento ya no es una verdad científica. La ecuación “dos y dos son cuatro” deja indiferente a quien la conciba con su pura abstracción. antes de conocer el lenguaje artificial. según la filosofía. Para la filosofía. por ligera que sea. El lenguaje supone un medio de comunicación previo. este axioma no interesa en sí mismo mientras no se sienta. que arriesga su vida por ella. más que gracias a una modificación subjetiva acompañada de una vibración efectiva. En su tratado Interpretatione afirma que “las voces son los primeramente signos de las pasiones del alma y éstas son imágenes de las cosas”. es la afirmación de un valor adherido a esa verdad. Si el lenguaje no es una creación lógica. Pero esto no es ya una idea. primitivamente. El lenguaje está simplemente al servicio de la vida y no de la vida de unos pocos. Si se dice que la vida es corta. y nuevas concepciones sociales. ni la de redondear períodos. Así una palabra puede tener muchos sentidos. Aristóteles llamó symbola (signos) a las palabras y pragmata (imágenes) a los conceptos. es un valor. el lenguaje es una actividad poética que. el que todos hablamos. poco importa. no apunta ni a un ideal lógico ni a un ideal literario. no está al servicio ni de la razón pura ni del arte. por ejemplo. no tiene igual significado en una democracia liberal que en una dictadura. su función es biológica y social. Otros afirman que el lenguaje se desarrolla de acuerdo con las necesidades humanas. y esto no es posible sino cuando. natural. el lenguaje cambia y también se adapta a otras funciones y trata de expresar otros sentimientos. su función primordial constante. . mediante asociaciones simples o complejas. es una creación de la colectividad que ningún individuo aislado puede llegar a dominar enteramente. originario. El juicio intelectual de “La tierra gira” se cambia en juicio de valor en la boca de Galileo al gritar entre los jueces “eppur si muove”. mientras se viva.

la escritura.Ámbito del Lenguaje Natural 11 1. Poco después de que Broca informara de sus descubrimientos. Un admirador de la obra de Gall se sintió tan impresionado por esta afirmación. El primer caso de Broca ocurrió en 1861. las matemáticas y las ciencias. Cada uno de los trastornos en el habla iba acompañado de una lesión en el lóbulo frontal izquierdo. cuando un hombre ingresó al hospital con una seria infección en una pierna. Gall había llegado a la conclusión de que los lóbulos frontales (la parte del cerebro más cercana a la parte superior de la frente) estaban especializada en el habla. el habla.es decir el lenguaje . Podemos mencionar el nervio hipogloso. también había sufrido durante muchos años la pérdida del habla. una parte del cerebro situada sobre la oreja. La zona de Wernicke está situada en el lóbulo temporal. Dos días después que Broca lo examinó. ya que este recibe todos los impulsos que mandan otros órganos que participan en el lenguaje. los cuales. Cabe mencionar que los impulsos son llevados al cerebro mediante nervios. a su vez están gobernados por un centro común en el cerebro. la capacidad de usar símbolos como un medio de comunicación . que ofreció una recompensa de quinientos francos a cualquiera que pudiera encontrar un paciente con lesión en el lóbulo frontal y sin un trastorno en el habla. La corteza cerebral que forma a los hemisferios se divide en cuatro regiones principales denominadas “lóbulo frontal. el lenguaje.4 Neurociencias Las neurociencias son aquellas disciplinas que se encargan de estudiar el sistema nervioso. el izquierdo es el que tiene las funciones del movimiento de la mano derecha. Tan murió a consecuencia de la infección. derivan sus impulsos nerviosos de distintos centros. Este reto impulsó a un joven neurocirujano llamado Paul Broca a comenzar el examen de pacientes que sufrían de pérdida del habla. su composición y funcionamiento.y de la capacidad de desarrollar las ideas y las respuestas motoras necesarias para llevarlas a cabo. que es el motor de los músculos extrínsecos de la lengua. las cuerdas vocales. Nuestro cerebro está dividido en hemisferios cerebrales. podemos decir que el lóbulo encargado de estas funciones es el lóbulo parietal. el órgano principal para el aprendizaje del lenguaje es el cerebro. y el vago. Localización de la Función Mientras estudiaba el cerebro. el cual se ocupa del reconocimiento de estímulos sensoriales específicos. relacionada también con el lenguaje. por lo que respecta al lenguaje se interesa en precisar las partes responsables de su manejo e interpretación. que entre otras funciones. Estos órganos que coordinan la producción del habla. Lo asombroso fue que las zonas de Wernicke y de Broca resultaron estar relacionadas con diferentes aspectos del lenguaje. la lógica.2. Enfocándonos solamente al habla y al lenguaje. es el motor de dos músculos de la faringe y laringe. por lo que esa zona llegó a llamarse “de Broca”. Carl Wernicke identificó una segunda zona del cerebro. Órganos que Participan en el Aprendizaje del Lenguaje Como se mencionó anteriormente. parietal. Broca investigó otros casos más. llamada actualmente zona de Wernicke. La autopsia reveló lesiones en la parte izquierda del lóbulo frontal. lo llamaban “Tan”. y Broca pudo realizar un examen postmórtem del cerebro. temporal y occipital”. la lengua. Durante los tres años siguientes. como son: músculos de la laringe. . porque era la única palabra que podía decir.

. el paciente respondió: “Mama está aquí lejos trabajando su trabajo para hacer a ella mejor.. pero cuando ella está mirando los dos niños mirando en la otra parte. y... Ella está trabajando otro tiempo”. la lengua y la laringe para que la persona emita la oración formada en la zona de “Wernicke”. Los pacientes con afasia de “Wernicke” fuerte no pueden comprender ni siquiera palabras solas.. El habla en sí es normal.. Según este modelo. papá y Dick. Además de perturbar el lenguaje hablado. y las palabras están unidas en algo que parecen oraciones. un paciente dijo: “Sí. Toda la información parece estar presente.. Las oraciones pueden estar gramaticalmente correctas y el habla misma puede ser normal. Entonces. donde es comprendida como un mensaje verbal. doctores. pero esas oraciones carecen de sentido. casi cien años después. De esta forma. Cuando se pidió a un paciente con lesión en la zona de “Wernicke” que describiera un grabado donde había dos niños robando galletas a espaldas de una mujer.. una lesión en la zona de “Broca” afecta el habla. como se aprecia en la Figura 2. la oración es transferida a la zona de “Broca”. la señal pasa a la zona de “Wernicke”. el lenguaje podrá tener sentido pero generalmente no se puede expresar como una oración completa. Las diferencias entre las “afasias de Wernicke” y “de Broca” llevaron a Wernicke a formular un modelo de cómo el cerebro produce el lenguaje. mientras que una lesión en la zona de “Wernicke” deja el habla intacta. cuando se oye una palabra. Figura 2. Las lesiones en la zona de “Wernicke” producen un tipo diferente de afasia. Por ejemplo. Hoy en día. o “afasia”. lunes. diez en punto.. este modelo es ampliamente aceptado aún. En este tipo de trastorno del habla.. dientes”. El lenguaje hablado se origina en la zona de “Wernicke”. La zona de “Broca” es responsable de la programación de los músculos de la cara.. las lesiones en la zona de “Wernicke” también alteran la comprensión del lenguaje. Regiones Cerebrales Responsables del Lenguaje. pero perturba la comprensión del lenguaje y la formación de oraciones con sentido.. miércoles nueve en punto. no la tienen para comprender el lenguaje.12 Lenguaje Natural: Descripción de las Etapas para su Tratamiento Una lesión (daño en los tejidos) en la zona de Broca producía un trastorno del habla caracterizado por lentitud y dificultad al hablar y una articulación deficiente lo cual hace difícil la comprensión de las palabras. al preguntarle acerca de una cita con el dentista.. pero las oraciones carecen de sentido. Allí es donde se forman las oraciones con sentido. pero es difícil comprender las palabras y las oraciones están incompletas... Aunque los pacientes con la “afasia de Broca” tienen dificultad para expresarse.

producidos a mediano o largo plazo. Efectos Secundarios Al observarse los efectos secundarios de modo sociólogo se llega a desempeñar el papel de ensayista que suple la falta de información con intuición. y no en el derecho. donde una muestra de personas con diversas características pueden mostrar patrones de preferencias específicas. sintáctica y semánticamente en función al conocimiento que se tiene del lenguaje.5 Comunicación Social En la comunicación social concurren diversas disciplinas como la sociología. Los comunicólogos están de acuerdo en creer que el horizonte de la cultura moderna se modifica por la continua acción de los medios de comunicación. El segundo método estudia los cambios que se producen en la opinión durante diferentes emisiones como por ejemplo las campañas electorales o publicitarias. mientras que la combinación inversa se inclinaba hacia el partido demócrata. Se define como la existencia de una cultura en forma de mosaico. y se insiste cada vez mas en las posibilidades de diversificación que ofrecen el desarrollo de la prensa especializada y la multiplicación de emisores de radio. tienen dificultades con el habla. ciencias jurídicas y políticas y la publicidad. 1. etc. Las encuestas de opinión pública son un digno ejemplo de la aplicación de este enfoque. son menos aparentes y sin duda mas generales. Efectos Primarios La sociología de observación los efectos primarios se ha desarrollado a partir de dos prototipos de estudios muy característicos. pero resultan capaces de modificar progresivamente el modo de pensar o actuar de una época o sociedad. . Cuando la comunicación social emplea medios masivos de comunicación ejerce dos tipos principales de influencias: las mas directas. con lo que se pondera la eficacia de una difusión. del contexto y persona que lo expresa. las cuales en forma individual ponen una especial atención a la “comunicación de masas” procurando que cada miembro de ellas quede cautivo del mensaje deseado.3. Por eso los pacientes que sufren lesiones debido a una trombosis en el lado izquierdo del cerebro.2. juicios apriorísticos o su propia ideología.3 RAMAS DE INVESTIGACIÓN 1. inmediatas y visibles (denominadas “primarias”) y los efectos secundarios.1 Comprensión del Lenguaje Natural Escrito El entendimiento del lenguaje natural escrito se conoce en al ámbito de la inteligencia artificial como "Procesamiento de Lenguaje Natural" y se enfoca en la recepción de texto cuyo contenido es interpretado léxica. esperando cierto tipo de reacción. televisión e internet. 1. por ejemplo.Ámbito del Lenguaje Natural 13 Tanto Wernicke como Broca descubrieron que los centros del lenguaje en el cerebro humano se localizaban casi siempre en el hemisferio izquierdo. constituida yuxtaposición de elementos muy dispares. El primero compara las distintas convicciones y respuestas individuales antes y después de la explosión de la comunicación. la pertenencia a una religión y la residencia en zona rural predisponían al voto republicano. además del conocimiento "ordinario" [3]. al cuestionar las inclinaciones políticas de los electores en los Estados Unidos de América se detectó que la combinación de un nivel socioeconómico elevado.

los cuales son determinados por el lenguaje aprendido y el lugar del mecanismo anatómico de producción (el cual normalmente es el mismo para todos los humanos). El procesamiento del lenguaje natural sonoro emplea todos los elementos de la interpretación del lenguaje escrito. Su éxito fue muy limitado porque el sistema no conocía nada del tema a traducir en un sentido razonable. por medio de declaraciones y comandos contesta preguntas acerca del estado de los bloques y las razones para efectuar movimientos. Al estudio de dichos patrones de sonido se llama "fonología". . desarrollo. etc. procurando evitar ambigüedades y eliminar ruido. Si un morfema tiene “personalidad” propia por sí solo se denomina “morfema libre”. para generar respuestas apropiadas aplicando reglas heurísticas dependientes del dominio.14 Lenguaje Natural: Descripción de las Etapas para su Tratamiento 1. provisto. relaciones. des. Cada lenguaje incluye un conjunto finito de fonemas a partir del cual puede expresarse completamente. El trabajo más significativo a comienzos de los 70´s fue el sistema hecho por Yonck Wilks. Traductores Automáticos: las primeras aplicaciones iniciaron en ese tiempo. se necesitaba la capacidad para hacer inferencias acerca de objetos. rápidamente se reconoció que para entender el texto a traducir se requería de enormes cantidades de conocimiento "ordinario" y en particular. Pero si requiere asociarse con otro para adquirir un significado real se llama “morfema ligado”.3. intenciones. estos sistemas almacena información acerca de sus dominios ("diálogo entre el terapeuta y su paciente") con estructuras ad-hoc traduciendo declaraciones e interrogaciones sencillas en "palabras clave" o "simples patrones" que se asocian con objetos definidos y relaciones. ya que a pesar de que generalmente un fonema no tiene un significado específico. sub. depuración y digitalización del sonido.4 DESARROLLOS Los primeros proyectos en el campo del lenguaje natural iniciaron en los 60´s con los siguientes trabajos [4]: ELIZA & STUDENT: Fueron dos proyectos a cargo de Weizenbaum & Bobrow orientados al diálogo. desprovisto y subdesarrollo. al ligarse con los morfemas anteriores se obtienen: imprevisto. dialoga con el usuario para realizar tareas de planeación en la configuración del "mundo de los bloques". Durante los 70´s y 80´s han destacado las siguientes aplicaciones: SHRDLV: desarrollado por Winograd. etc. que traducía del inglés al francés basado en representaciones semánticas y en esquemas de inferencia. al ser combinado con otros conforme a patrones establecidos produce “unidades significativas” llamadas “morfemas”. como por ejemplo: preciso. La interpretación sonora del lenguaje comienza por identificar fonemas que constituyen la más pequeña unidad del lenguaje hablado y que se distingue de los demás. 1.2 Diálogo Sonoro Conocido como "Procesamiento del lenguaje hablado" es caracterizado por los sonidos que el ser humano es capaz de producir. El diálogo es generado hilvanando "lapsos de sonido individuales" en patrones reconocidos. como sería: mi. que no están explícitas en el texto. más el conocimiento adicional sobre fonología así como la correspondiente al tratamiento. sin embargo.

Elaborado en Rochester University para implementar diversos tipos de diálogos. Creado por Carbonell. donde oraciones idénticas expresadas en distintas lenguas pudieran tener la misma representación conceptual. . GVS. Construido por Dyer integra una gran variedad de estructuras de conocimiento como los Scripts. razones por las que pueda fallar. habilita el uso de “planes” como estructuras de conocimiento para tipificar metas comunes de la gente y los medios característicos que emplean para alcanzarlas. También desarrollado por Schank. como los “objetivo” en donde se representa una meta y los de “comunicación” que contienen secciones de dialogo para introducir temas. ARGOT. Construido por Schank. BORIS. elaborado por Charniak. Es decir. como evitar dichas fallas o recuperarse de ellas. a partir del texto se generan diversas interpretaciones sobre su significado. usa varias categorías de planes. Realizado por Schank. PAM. MS Parlaprop. semántica y el proceso de razonamiento a través de "Hipótesis de Representación Procedural" en donde el significado de las oraciones y sus componentes están representados en estructuras procedurales. hacer preguntas y exponer conclusiones. planes y manejo de creencias en “unidades de tematización abstracta” que contienen la descripción del plan. MARGIE. POLITICS. produciendo al final un consenso de las conclusiones obtenidas. Utiliza “frames conversacionales” para guiar la entrevista y generar información. cada uno de ellos expresando un particular modo de pensar. Generado por Lebowitz. simula a un asistente de reservaciones áreas que asesora al usuario en la planeación de un viaje.Ámbito del Lenguaje Natural 15 El sistema integra la sintaxis. su propósito. implementó la hipótesis de la descomposición en primitivas del lenguaje a través de lo que denominó la “dependencia conceptual”. IPP. mientras que el "entendimiento del lenguaje" se realiza a través de procedimientos que son activados en respuesta a la interpretación de la oración. SAM. Con estas herramientas el sistema obtuvo resultados muy interesantes. También aplicó la hipótesis del entendimiento como resultado de una interferencia espontánea. implementó la interpretación aplicando varios “puntos de vista” con su particular “sistema de creencias” como se modela al ser humano con su diversidad de idiosincrasias. aplicó conceptos de modularidad y compartición de estructuras de conocimiento a través del uso de “frames”. Tales estructuras de conocimiento permitían generar distintos comentarios a partir de un mismo texto. Desarrollado por Xerox. aplicando el manejo de excepciones y uso de “defaults”. aplica varias clases de generalización acerca de protagonistas y actividades típicas en la historia y con el propósito de adquirir información que pueda usarse para emitir especulaciones sobre las razones que motivan cierta conducta o el desenlace de los eventos. introdujo el uso de “Scripts” para estructurar grandes cantidades de información y situaciones estereotipadas que se “alimentan” al sistema para generar un resumen. relatar la historia o contestar preguntas al respecto del tema. para orientarlo al relato de historias.

El formato de sus instrucciones es: etiqueta string-sujeto patrón = string-objeto: go-to etiqueta El “string-sujeto” es el string cuyo contenido se actualiza.6.16 Lenguaje Natural: Descripción de las Etapas para su Tratamiento 1. Sistemas de planeación. Y en general los sistemas de información orientados a interactuar con el usuario final mediante el lenguaje.6 REPRESENTACIÓN 1. Para cumplir con el objetivo de hacerse entender. . COMIT: Es el primer lenguaje encontrado a proceso de strings. Traductores. Herramientas de programación sobresale: SNOBOL. Generadores de historias.1 Representación El ser humano usa el lenguaje natural para satisfacer la necesidad de transmitir sus "conceptos internos" a su prójimo a través de representarlos por un medio (llamado lenguaje) compuesto de elementos y reglas (para interrelacionarlos). Creado por los laboratorios Bell es un lenguaje diseñado para manipular strings como datos primarios. Reconocimiento de voz. del cual selecciona aquellas unidades que mejor los ilustran. Sistemas expertos. El “patrón” es una secuencia de caracteres que es buscada en el contenido del “string-sujeto” para hacer referencia a dicha instancia de string por ejemplo: paso 1 texto = ‘valor 1 * valor 2’ paso 2 texto ‘*’ = ‘**’ resulta en: texto = “valor 1 ** valor 2’ ICON: sucesor de SNOBOL incluye el proceso de listas tipo LISP [5] y el empleo de reglas. es necesario considerar 4 dominios: • • • • La estructura lingüística. la cual asocia al lenguaje dentro del contexto del tiempo relativo a hechos y expectativas. La correspondencia entre las estructuras lingüísticas y el mundo Proceso cognoscitivo. La acción humana y su interacción con el mundo. que está enfocada a regular los elementos estructurales del lenguaje. Tutores inteligentes. 1. con el propósito de lograr que el receptor "entienda" lo que realmente desea expresar. involucra las estructuras de conocimiento y su manipulación por el procesador del lenguaje.5 APLICACIONES Y PROGRAMAS Entre los campos de aplicación destacan: • • • • • • • • Sistemas conversacionales.

2 Mapeo Para llevar a cabo tanto la representación del lenguaje. 2 3 Es evolutivo y adaptativo con base a los deseos de la gente.. Limitaciones y Ventajas de los Lenguajes. tal como aparece en la Figura 3 y 4: 1 a 1: Una expresión matemática: = A= B*2+8 traducida a un árbol A + * 8 B 2 Figura 3. Hay distintas formas de expresar lo mismo: .“Juan brinca mucho” . # 1 LIMITACIONES Expresiones breves o vagas: . Expresión Arborescente." La misma expresión significa diferentes cosas en distintos contextos: -"Levanta el gato" (al cambiar una llanta o cargar a la mascota). .Ámbito del Lenguaje Natural 17 Amén de considerar estos dominios es necesario reconocer algunas limitaciones al comprender el lenguaje.6.. usando un finito número de símbolos. como las que se presentan en la Tabla 1: Tabla 1. existiendo entonces varias relaciones de “mapeo”."Faxeamelo". Es imposible editar un programa o diccionario completo del lenguaje: .“Se eleva mucho Juan” VENTAJAS Es flexible al permitir el uso de las expresiones necesarias con el grado de detalle requerido permitiendo que el interlocutor genere su inferencia. en donde la idea básica es convertir la forma original de un concepto a otra. como su entendimiento es necesario reconocer el proceso de “mapeo” que existe tanto de parte del que expresa el mensaje como de aquel que lo recibe. 1. 4 El lenguaje es muy rico en su forma de expresión. n * 1: Por ejemplo un "Query" puede expresarse de varias formas: “Dame los clientes con ventas superiores a $10."El candidato de P_ _ se pronunció por desterrar la corrupción del . pero también las ventajas al hacer uso de él. Permite expresiones de un mundo infinito."Tírame un bipaso" .000 en Enero”."Subió el índice de la bolsa” .

Generador léxico. Dividido en tres etapas.7 ETAPAS EN EL PROCESAMIENTO Un sistema de lenguaje natural “SLN” está diseñado para entender y manipular lenguaje.18 Lenguaje Natural: Descripción de las Etapas para su Tratamiento “Proporciona una lista de los clientes que compraron mas de $10.3 Nivel de Interacción entre los Componentes Debido a que la expresión a representar está compuesta por varios elementos. Asocia información a los morfemas. Analizador morfológico. Por ejemplo: “Pedro vio a su novia en el parque con una cámara” es descrito en la Figura 5.6. las cuales son ilustradas en la Figura 6: Traductor: integra varios subsistemas: • • • • • • Analizador léxico. desarrollar inferencias a partir de tal conocimiento y texto alimentado. Relaciona el texto con la base de conocimientos del contexto para emitir una representación del significado del texto alimentado. El ovoide durante el partido de football americano. Identifica la raíz de las palabras. la bolsa se cayó al piso. es necesario reconocer el "rol" de ellas y la relación que guardan entre sí. Analizador sintáctico. SELECT * FOR VENTA > 10. contestar preguntas y generar respuestas.000 AND MES = "ENERO" 1 * n: Son situaciones que obligan a emplear mucho conocimiento del dominio para entender correctamente su significado: "Juan le grita a Pedro ¡pásamela!" El balón durante el partido de basketball. 1. Fonología. considerando las diversas alternativas de significado en función de su naturaleza y contexto. 1. La goma durante la clase. n * m: Representa al hecho de haber muchas formas de expresar distintas cosas: Se cayó la bolsa hubo pérdidas en el mercado financiero La bolsa cerro a la baja Figura 4.000 el mes pasado”. aceptar como entrada texto en lenguaje natural. Tipos de Mapeo. almacenar conocimiento ligado al dominio de la aplicación. Descompone el texto en unidades de palabra. Analizador semántico. Valida la estructura gramatical del texto y asocia un significado a la declaración. Conceptualmente está integrado por las siguientes funciones. .

Ámbito del Lenguaje Natural

19

S ¿Quién tenía la cámara? Si fue Pedro: NP VP

Pedro

V

NP

PP

Vio

DET

NOM

PP

con una cámara

a su novia S

en el parque

Pero si fue la novia de Pedro NP VP

Pedro

V

NP

Vio

DET

NOM

PP

a

su

novia

en el parque con una con una cámara

Figura 5. Interacción entre los Componentes de una Oración. Interpretador. Lo constituye un responsable de interactuar con la base de conocimientos en función al tipo de texto alimentado. Si es una pregunta, esta debe ser contestada, pero si es una afirmación (hecho o negación) se agrega a la base y actualiza en un caso a otras entidades. También desarrolla inferencias a partir del conocimiento almacenado. Generador. Es el subsistema encargado de producir el texto de salida dirigido al usuario en función a la naturaleza del texto de entrada, puede emitir: • Declaraciones de asentimiento: Okay. • Preguntas: Como se llama el sujeto? • Dudas: No entendí. • Rechazos: Contradice a la afirmación de… • Respuestas: La consecuencia del acto es…

20

Lenguaje Natural: Descripción de las Etapas para su Tratamiento

Representación interna

Texto de Entrada

Traductor

Interpretador

Generador

Base de conocimiento Texto de Salida Figura 6. Esquema de un Sistema de Lenguaje Natural. Representación Interna (“RI”). Es el mapeo del texto de entrada en un formato adecuado para la manipulación de los módulos del SLN y consiste en las estructuras almacenadas en la base de conocimientos. Base de Conocimientos (“BC”). Se constituye por 3 tipos de elementos interrelacionados: • Entidades. Son personas, animales, objetos o lugares que deben ser descritos y que protagonizan los eventos. • Eventos. Son acciones que pueden ocurrir involucrando entidades con roles de actor, objeto, instrumento, origen y destino; además de poder involucrar a otras acciones. • Situaciones. Combinan entidades y eventos con condiciones y resultados. Implementación de un sistema de lenguaje natural. Se puede considerar como un sistema a desarrollar con alcances incrementales, como círculos concéntricos que ilustran cada fase en la forma mostrada en la Figura 7.

Traducción Inferencia Respues Aprendizaj Figura 7. Evolución de un Sistema de Lenguaje Natural.

Ámbito del Lenguaje Natural

21

Traducción. Los textos recibidos son procesados hasta generar su representación interna “RI” para después, a partir de ella, emitir el texto de salida. Inferencia. Una vez obtenida la RI del texto recibido, se hacen todas las inferencias posibles al asociar el RI con la base de conocimientos “BC”. Las conclusiones son representadas como RI para que el “Generador” emita el texto de salida. Respuesta. Después de haber emitido la RI equivalente a la pregunta alimentada, se activan los mecanismos de inferencia que explotan la BC para satisfacer el requerimiento. Una vez obtenida la respuesta en su forma de RI se le encomienda al “Generador” su exposición. Aprendizaje. Las declaraciones introducidas al SLN son representadas internamente y confrontadas con la BC actual, para determinar casos de: • • • Integración. Agregando o actualizando el conocimiento. Contradicción. Requiriendo contradicción, confirmación, renovación, convivencia o rechazo. Confusión. Al no poder comprender el significado o contexto del texto.

22 Lenguaje Natural: Descripción de las Etapas para su Tratamiento .

CAPÍTULO 2. ANÁLISIS LÉXICO .

.

Alfabeto de la Lengua Castellana.. 0 1 . b á é ú ó # . ? / . selecciona las palabras apropiadas para expresar el significado deseado [6].2 LENGUAJE 2. . . frases. oraciones y textos con significado propio dentro del lenguaje al que pertenecen como se muestra en la Tabla 2: Tabla 2.2. z a b . ANÁLISIS LÉXICO 2.1 Alfabeto Constituye el repertorio de símbolos válidos que a través de su interrelación forman el universo de palabras.1 DESCRIPCIÓN El subsistema del análisis léxico dentro de un SLN involucra el "mapeo" entre una cadena de entrada o salida de texto y los elementos léxicos a ser manipulados por el sistema. Ciclo del Analizador Léxico. . En la fase inicial transforma la cadena en unidades léxicas. Mientras que al final. Figura 8. 2.2. . A B . . 9 .

Las palabras derivadas de la raíz no observan un patrón ordinario.26 Lenguaje Natural: Descripción de las Etapas para su Tratamiento 2. de tal forma que se pueda distinguir la esencia del significado de la palabra analizada. SIMPLE Pronombre Presente Yo Tú Ellas leo amas oyen Pasado leí amaste oyeron Futuro leeré amarán oirán PROGRESIVO Presente leyendo amando oyendo Pasado leyendo amando oyendo PARTICIPIO Presente leído amado oído Pasado leído amado oído Irregulares.2. entre las situaciones más comunes están: Prefijos y Sufijos. Consiste en identificar y eliminar los prefijos y sufijos que acompañan a la raíz de la palabra. Al usar un mismo verbo para una persona específica. por ejemplo como se aprecia en la siguiente Tabla 3: Tabla 3. sustantivos. Uso de Tiempos. etc.. pero con distintos tiempos se obtienen los casos señalados en la Tabla 4: Tabla 4. TÉRMINO desunión juegos infidelidades des in PREFIJO RAÍZ unión juego fidelidad s es SUFIJO Conjugaciones. pronombres. Al asociar los verbos a los pronombres en un solo tiempo se derivan varias presentaciones: • • • • • • Yo corro tú corres Él / ella corre Nosotros corremos Vosotros corréis Ellos/ellas corren Tiempos. Ejemplos de Palabras Compuestas. como en el ejemplo descrito en la Tabal 5: .2 Morfología Se orienta a identificar la raíz de los verbos.

tal como aparece en la Tabla 6: Tabla 6. Derivados Irregulares. Diminutivo pelotita camioncito corralito Raíz pelota camión corral Superlativo pelotota camionsote corralón Incongruencias. En consecuencia a la adaptación del término al género y número del vocablo original se altera. como por ejemplo en la Tabla 8 se presentan casos de raíces: Tabla 8. porteros elevadorista misionero. Tabla 7. sabiduría suena. Raíz Portería Elevador misión Opciones portero. tal como se señala en la Tabla 7. sonido hablador. portera. Palabra pelotón piñín corrido Ramos universo Raíz Pelota Piña Correr Ramo Verso . Son todas aquellas palabras que se usan para expresar una comparación a partir de una referencia. Estos son sólo algunos de los casos más comunes al tratar de identificar la raíz de la palabra. Comparativos. misiones Diminutivos y Aumentativos.Análisis Léxico 27 Tabla 5. sonaja. comedor sabio. Raíz comida saber sonar hablar Derivada comensal. habla Género y número. proceso en el cual se puede incurrir en errores al generar raíces que no correspondan y que representan otra cosa. Generación de Raíces Incorrectas. misionera. Opciones de Género y Número.

También debe considerar la separación de homónimos para asignar un registro distinto para cada significado de la manera mostrada en la Tabla 9: Tabla 9.. Veamos la Figura 9 donde se ilustran los conceptos expuestos: .3. así como también tienen que ser lo suficiente expresivas para que el "generador" produzca el texto de salida apropiado. Formato de Diccionario.1. hash Acceso aleatorio y dinámico. llave duplicada Combinación de los métodos de acceso 2. .3 Diccionario El diccionario representa el acervo de morfemas y derivados oficialmente aceptados para una lengua. binario. El diccionario determina la capacidad del SLN y debe describirse adecuadamente su formato.. 82 Sinó n.. . 570 ap.47 ap. F720 ap F721 Función Estructural Tipo ap. C71 ap. por lo que un SLN incluye para cada "término" su significado. Asociación Raíz ––– 0 0 0 0 Derivados ap. así como los métodos de acceso. Por lo que respecta a la organización y acceso al diccionario se debe elegir la representación apropiada. Tipo de Organización y Acceso ORGANIZACIÓN Secuencial. ––– ap.28 Lenguaje Natural: Descripción de las Etapas para su Tratamiento 2.2... llave compuesta.. N47 ap.. Estas piezas de información conocidas como “unidades léxicas” o “tokens” deben ser manipuladas fácilmente por los analizadores sintácticos y semánticos para producir la "Representación Interna" apropiada al texto. Tabla 10.4 Unidades Léxicas Las "Unidades Léxicas" o "UL" son las estructuras de información que representan a cada palabra del texto a procesar por los módulos del SLN. distribuida ACCESO Secuencial Por # de registro. clase de estructura y métodos de búsqueda o combinación de estos como los mostrados en la Tabla 10. información para identificar su información estructural. relacional. cuyo formato contiene la identificación precisa del término. TP ––– ––– . 571 Tiempo ––– ––– ap.2. para lograr la eficiencia en su manejo. A671 ap. ap.540 ap. V71 ap. Regist Identifica Cabez Significado ro dor a 300 700 1032 5720 5721 C0450 A712 C0877 F0140 F0141 cuanto agosto caer falda falda apuntador x2 ap. –– –– .. llave única... su asociación con la raíz o vocablo al que corresponde en el diccionario y también su referencia con la “estructura temporal del texto fuente" en donde aparece la palabra original y sus atributos propios resultantes del análisis morfológico. tipo de organización y representación. referencia a la raíz o sus derivados. frecuencia de uso Secuencial con acceso directo Indexado Jerárquica..

sin.. Diccionario Persona Genero Número Tiempo . el contenido del “Token” o “Unidad Léxica” debe ser lo suficiente conciso pero a la vez completo para eficientar su manejo.007 Figura 9.Análisis Léxico 29 UN TOTAL DE $748. mas. los datos que deben aparecer en su descripción son los que se muestran en la Tabla 12: . Tabla 11. # Registro Termino 15 Cuanto 19 Agosto 20 ? Ap. c0450 indef. Aplicación de Unidades Léxicas Ahora bien. una muestra del formato para la “Estructura Temporal Fuente” aparece en la Tabla 11. mas. pasado a712 3era. Formato de la Estructura Temporal Fuente. sin. pasado 89714 89714 –––– –––– –––– Finalmente..

. menos. pero..... veces.. Quién. los. la....30 Lenguaje Natural: Descripción de las Etapas para su Tratamiento Tabla 12.. 2... para. si. muchos. 3er.. Formato de la Unidad Léxica.. Finalmente... más. APUNTADORES Identificador 42B 87I Diccionario C0450 A712 ETF 15 19 Tipo INTERR OG. .. mayor. Identifican la función primaria de la palabra. aquellos no.. 1..... tú.. él.3 PROCEDIMIENTO Esencialmente son dos direcciones de procesamiento de texto a cargo del Analizador Léxico y cuya descripción se detalla a continuación: • Conversión del texto de entrada a Unidades Léxicas... 1er. Qué. yo. oh...... 1000.... algunos... o. mas.. NOMBR E FUNCIÓN Categoría Clase CERRAD NOMINAL A ABIERTA PREGUNTA . . . • Generación del texto de salida a partir de Unidades Léxicas. Cómo.... es útil reconocer las categorías de “UL”: Abiertas.. 2do. Acción: Típicamente verbos que ilustran eventos Modificador Nominal: Abarcan a los adjetivos Modificador de Acción: Incluye a los adverbios Cerradas. por... 0... abarcan la mayoría de términos del diccionario.. Las clases cerradas son: • • • • • • • • • • • • • Conjunciones: Asociación: Preposición: Pronombre: Número: Ordinal: Determinante: Negación: Comparativo: Operador: Pregunta: Cuantificador: Exclamativo: y. ninguno. 2. . una. un. porque. .... antes. a.. agrupándose en las siguientes clases: Nominales: Nombres y nombres propios que identifican entidades u objetos animados o no.. claro. . Son aquellas palabras con un número restringido de instancias y son de carácter funcional por depender de otros para adquirir un significado preciso dentro del texto. ..

! ¿ ? . conjugaciones.. : . Identificación del tipo de carácter conforme al “alfabeto”. Ejecuta cuatro tareas: • • • • Acceso de cada uno de los caracteres integrantes del texto.Análisis Léxico 31 Procedimiento de Entrada. compuestos por uno o varios caracteres. Analizador Morfológico. tiempos. Manejo de errores para los caracteres no registrados en el alfabeto. . • Búsqueda en el diccionario. A partir del texto alimentado al SLN en modo carácter el analizador léxico activa sus módulos secuencial o simultáneamente para generar las “UL” correspondientes conforme a la Figura 10 siguiente: Figura 10. Realiza las siguientes tareas: • Emisión de cadenas de palabras o símbolos. • Procesos especiales para la detección y tratamiento de: prefijos. Generación de la “Unidad de palabra” correspondiente. La esencia de las tareas realizadas por los módulos integrantes del analizador léxico son: Analizador Fonológico. los cuales se almacenan en la “Estructura Temporal Fuente”. considerando los delimitadores. Procedimiento de Entrada del Analizador Léxico. separadores (. • Selección del morfema para las cadenas que contienen un palabra. .. aumentativos.) y cualquier otra convención que ayude a delimitar los “strings”. etc. géneros. a través de alguno de los siguientes métodos.

F”. valiéndose de la “Base de Conocimientos” y de la emisión y actualización de las estructuras de datos denominadas “Representación Interna” (“R..32 Lenguaje Natural: Descripción de las Etapas para su Tratamiento • • Actualización del diccionario al aceptar una nueva palabra. Esta opción puede ser interactiva con el usuario o automatizada con las limitaciones del caso y la supervisión del administrador del SLN.) crea la “Unidad Léxica” correspondiente registrando los datos y ligas necesarios acorde con la información pertinente y las estructuras de datos empleados (“E. sintacticamente y semánticamente correctas para alimentar al “Analizador Léxico” conforme al esquema de la Figura 11.. palabra. ya sea morfema o derivado. T. además de registrar sus asociaciones con otras nuevas y ya existentes... símbolo. Generador Léxico. Dicho módulo deberá incluir un procedimiento que emita “cadenas” con unidades léxicas.7). las funciones a ejercer por los módulos son: Generador de morfemas. I. Procedimiento de Salida del Analizador Léxico. Conforme a la naturaleza del morfema (número.).. Accede a las “UL” y “RI” producidas por el subsistema “generador”. . En resumen.. Diccionario. El módulo “Generador” del SLN es el encargado de proporcionar los elementos y pautas del texto a producir. Procedimiento de Salida. Generación del morfema correspondiente a la cadena. Texto Texto Texto Texto Expositor Morfológico Generador Palabras de Generador Morfemas de Estructura Temporal de Salida Base de Conocimie ntos Representa ciones Internas Diccionario Figura 11. aprovecha la información del diccionario y base de conocimientos para emitir el morfema mas adecuado a la representación.”. ver la sección 2.

el primero. nombre. comentario. etc. en donde lo primero a observar es la naturaleza de la declaración expuesta por el sistema (pregunta. que se espera esté representada. Por ejemplo.Análisis Léxico 33 Generador de palabras. su contexto. nombre. nombre propio. Mientras que la segunda clase es técnica. persona. De esta forma el SLN será capaz de adoptarlas. 2.. Después se podrá verificar el buen desempeño de los módulos de salida del analizador léxico. afirmación.... primera persona singular. incorporando los separadores y símbolos especiales para editar el mensaje.. apellido de persona.. provocaría actualizar el diccionario agregando registros y asociaciones diversas para los siguientes significados: • • • • canto canto Canto canto acción de cantar. la identificación de los ajustes a realizar es más difícil ya que deberá revisar el ciclo completo del funcionamiento del SLN. Expositor fonológico. número. raíz cantar. comenzando por confirmar que el texto de entrada haya sido representado léxica y sintácticamente bien. conjugada en presente. modifique por otras que el sistema maneje o bien las confirme.. agregar la palabra.). Sin embargo. símbolos y números. asignado a la orilla de un objeto de forma . . .4 ADMINISTRACIÓN DE ERRORES Existen dos tipos de errores en la fase léxica del SLN. Manipula el morfema y estructuras de datos que empleó el módulo antecesor.. Es el encargado de ensamblar el texto compuesto por las cadenas de palabras. motivada por los clásicos errores de programación. registrando en la “estructura temporal de salida” la palabra propuesta. estructura sintáctica y consistencia en el vocabulario empleado.. Correspondiendo al personal técnico la modificación al sistema... la emisión de inferencias erróneas (sobre todo el análisis morfológico) y el empleo de conocimientos incompletos o erróneos representados en el diccionario y base de conocimientos. diccionario. procura de ser necesario. . es necesario el diálogo con el usuario para detectar inconsistencias durante el análisis fonológico y morfológico para que las evalúe. género. expresión artística musical La emisión del texto de salida será evaluada por el usuario hasta el final. Por lo tanto. al momento de su exposición.. integre las “ligas” entre los términos involucrados (raíz con sus derivadas) y sobre todo realice las pruebas de consistencia para identificar y manejar adecuadamente las contradicciones o sinónimos. rechazo. realizando la incorporación a las estructuras de datos correspondientes (alfabeto.. hacer su transformación o reemplazo por aquel término que satisfaga las condiciones de tiempo. al usar la palabra “canto” en varios ejemplos con distintos contextos. respuesta.). es el resultado de la interacción del usuario donde él proporciona texto con palabras o caracteres impropios del lenguaje manejado por el sistema. su análisis semántico e interpretación haya sido correcta y que el funcionamiento del generador reaccione con eficacia al mandato que se espera realice.

El desarrollo incremental es con el fin de abordar problemas sencillos con estructuras de texto simples y cortas en una primera etapa. una vez creadas las estructuras de datos iniciales para los elementos básicos del lenguaje. creando estructuras de datos y casos ad-hoc para cada uno de ellos con el propósito de evaluarlos independientemente para integrarlos al final.5 DESARROLLO Es recomendable aplicar una estrategia de desarrollo “incremental” y de “ensayo y error” para el subsistema del analizador léxico. para gradualmente aumentar el grado de riqueza y profundidad del lenguaje. . a partir de las definiciones conceptuales de la estructura y funcionamiento de todo el SLN. esta estrategia se puede alterar desarrollando en paralelo los módulos. se agregan las estructuras de datos que otros subsistemas crean como las “RI”. Naturalmente.34 Lenguaje Natural: Descripción de las Etapas para su Tratamiento 2. Finalmente el generador léxico haga su parte. se inicia la construcción y prueba del primer módulo de entrada. se prueban en orden inverso los módulos de salida. A su vez. así como del ámbito de aplicación y dominio de conocimiento que explotará [7]. evalúa el desempeño del analizador morfológico y realiza una prueba exhaustiva de casos. Por lo tanto. comenzando por el “generador de morfemas” y concluyendo con el “expositor fonológico”. a partir de las unidades de palabra que genere. con base en estos resultados.

CAPÍTULO 3. ANÁLISIS SINTÁNTICO .

.

Constituye el fundamento para regular el uso del lenguaje dentro de la sociedad [9].3.) y reglas para su interrelación (frases.2. etc. Para implementar la gramática de un lenguaje se usa una parte de las matemáticas conocida como “lenguajes formales”. variantes y reglas que se van a utilizar dentro del universo del propio lenguaje. | en | a |.... tiempos. Generalmente el subsistema tiene dos módulos principales: Gramática. interrogaciones. componentes y reglas de interrelación propias del lenguaje. Es el proceso que compara el “texto de entrada” contra la gramática para generar las estructuras jerárquicas correspondientes [8]. sustantivos. por lo que es necesario determinar el subconjunto de componentes.).. ANÁLISIS SINTÁCTICO 3. sus variantes (conjugación.. negaciones. Es la representación declarativa de los elementos sintácticos del lenguaje Traductor.1 DESCRIPCIÓN DEL ANÁLISIS SINTÁCTICO El análisis sintáctico es la etapa en el proceso de “lenguaje natural” en donde una oración “lineal” de texto alimentado por el usuario es convertida a una estructura jerárquica que corresponde a las “unidades de significado de la oración“ de acuerdo a la naturaleza.. considerando el entorno (libre de contexto) y formas de procesamiento (generativa).).1 Gramáticas La gramática de un lenguaje natural representa el “núcleo” que define la naturaleza de los componentes (verbos. 3. Los sistemas de lenguaje natural (SLN) dedican una atención especial a la representación y uso de aquella parte gramatical del lenguaje natural que pretenden procesar... cuya representación clásica es a través de reglas que evalúan o generan un “espacio de estados“ para el análisis o producción de oraciones. entre otros enfoques. número. etc. Figura 12. O --> FN --> FN1 --> Adj --> Adjs --> Art --> Pro --> NomPer-> Nom --> FV --> Verbo-> FN FV Art FN1 Nom Adj e | pequeño el | yo | juan | archivo | Verbo | Imprime | Pro | NomPer | FN1 Adjs Adj | largo la | tú | maría | impresora FN | copia | los él pedro | | rápido | | los | . existe una variedad de “representaciones” gramaticales acordes con el nivel de alcance (finitas). En la Figura 12 se presenta un ejemplo de gramática “libre de contexto” para el idioma español {10]. etc. artículos. genero.2 ELEMENTOS 3.... Gramática Libre de Contexto. . enunciados. por lo que es necesario interpretar correctamente la naturaleza de ellas para elegir la más apropiada a la aplicación en turno. monitor despliega . | . Dentro de este marco.

Estados Finitos. Red. Se dice de aquellas máquinas donde a partir de cualquier punto de transición el siguiente estado puede determinarse a partir del estado actual y las condiciones que provocan la transición. Es una descripción del componente gramatical que está representado como un “lugar” dentro de la red de alternativas caracterizada por la transición que provoca el cumplimiento de las condiciones asociadas al estado. integrada por estados (“nodos”) y condiciones (“arcos”) que se recorren o generan a lo largo de la evaluación o emisión de un texto. mientras que la tercera se hará en el inciso 3. para identificar el significado del conjunto de oraciones contenidas en un lenguaje (sentencias gramaticales) y que pueden ser completamente “empatadas” por las reglas gramaticales. siendo etiquetadas por el identificador de la condición.4. Puesto que es conocido el número de estados posibles a generar. . A continuación se describen los primeros dos tipos de redes.2 Redes de Transición Un modelo ampliamente usado en los SLN para implementar gramáticas se conoce por “Redes de transición”. Es el camino formado por un conjunto de nodos y arcos. a partir de un estado dado hasta otro determinado. Ruta.38 Lenguaje Natural: Descripción de las Etapas para su Tratamiento 3. se considera “finito”. Una fuerte capacidad para identificar el tipo de estructura que corresponde a cada oración gramatical del lenguaje. para generar uno nuevo. Es un módulo de proceso que arranca a partir de un “estado inicial” hacia otros cuando una condición en particular ocurre conforme a las transformaciones que se van procesando. Ilustran la condición que produce la transición desde un estado a otro. Es la representación gráfica y de estructura de datos. Cada una de estas clases de redes tienen en común los siguientes fundamentos: Una red gramatical se compone por los siguientes elementos: Máquina. Existen varios tipos de redes que difieren en complejidad y eficacia: • • • De estados finitos Recursivas Aumentadas Es esencial reconocer que la gramática indica las siguientes asociaciones con el lenguaje: Una débil capacidad generativa. Arcos.2. Estado. cuyo fundamento descansa en la “Teoría de Grafos” y en las “Máquinas de Estados Finitos”.

Al ampliar los elementos de la gramática anterior de acuerdo con la red descrita en la Figura 14: Art q0 q1 Nom q2 Verbo Adjetivo q3 Verbo q4 Figura 14. al “símbolo terminal” que produce la transición entre un estado actual y el subsiguiente. convirtiendo la red a la categoría de las “no determinísticas” como se ilustra en la Figura 15: . RTEF para una Gramática. Por ejemplo: La red de una gramática que represente la secuencia: “Artículo Nombre Verbo” [11].Análisis Sintáctico 39 Red de Transición de Estados Finitos (RTEF) Es la red más elemental que conecta los nodos por medio de arcos dirigidos. sin embargo hay casos donde pudieran generarse diversos estados a partir del mismo tipo. es decir. Para evaluar oraciones tipo: “El gato corre”. “El niño llora” Se representa gráficamente como aparece en la Figura 13: Art q0 q1 Nom q2 Verbo q3 Figura 13. Se pueden reconocer oraciones más amplias como: El niño gordo corre”. Las redes empleadas en este modelo son dirigidas. “ La niña juega” Los ejemplos presentados de gramáticas son “determinísticos” porque sólo se produce un estado específico a partir de un mismo tipo de palabra. Gracias al uso de la cabeza de flecha se reconoce la dirección de la transición. para representar la secuencia en la cual las palabras pueden aparecer en una oración mediante el recorrido de una ruta a través de la red. En éste diagrama los círculos identifican a los “nodos” o “estados” mientras que los arcos a las “condiciones”. RTEF para una Simple Gramática. tienen un sólo “estado inicial” y uno o varios finales (identificados por una diagonal).

RTEF no Determínistica. entonces se rechaza el texto que está siendo evaluado. Recorrer una “RTR” involucra evaluar los arcos de cada nodo. la evaluación de pruebas. el manejo de repeticiones consecutivas o discontinuas de símbolos terminales y también de estados. En la Figura 16 se muestra un ejemplo de una “RTR” del idioma inglés: En esta gramática se evalúan oraciones como: “The dog eats”. el caso contrario. Red de Transición Recursiva (RTR) Amen de las características y elementos de las “RTEF”. “The little black dog run on the street” y “The american young boy at the fifth street has played the electric guitar with his old papa”. ya se evaluaron todas las palabras de la oración original y aún no se llega a un estado final. Sin embargo pueden aparecer casos en los que la oración evaluada tiene palabras pendientes de ser analizadas y ya se alcanzó un estado final o bien. “ Los niños corrieron”. porque su estructura o elementos no corresponden a la gramática representada. “ El jugador corrió mucho”. Las declaraciones que evalúa son: “ El joven ha corrido”.40 Lenguaje Natural: Descripción de las Etapas para su Tratamiento Art q0 q1 Nom q2 Auxiliar q3 Verbo Verbo q4 Verbo q5 Complemento q6 Figura 15. Por lo que incorporan a la red otras condiciones para representar a cada estado que etiqueta a los arcos de la red. si regresó con éxito transita al estado que apunta. entonces el control retorna al arco etiquetado. de la manera mostrada en la Figura 16: . hasta que alguno tenga éxito. de lo contrario se rechaza el arco y se evalúan los otros que salen del estado actual. incorpora a las condiciones el tratamiento de estados (además de los “símbolos terminales”). de lo contrario. si ninguna de ellas tiene éxito. Si corresponde a un “Nombre de Estado” el control se traslada a la red que lo representa comenzando a recorrerla desde su estado inicial hasta alcanzar un estado final o hallar un error. se hace “ backtrack” en los estados explorados para recorrer otras rutas aún no evaluadas.

. Parte de la oración de entrada. Al traducir una oración hay dos direcciones en que se puede llevar a cabo: Ascendente.3 Parsers Independientemente de la gramática el proceso de ”traducción” compara las reglas contra las palabras del texto de entrada. generando un árbol cuyos nodos terminales representan las palabras del texto evaluado. 3. La estructura más sencilla que produce es el “árbol de traducción “ en donde aparecen las reglas y el resultado del “empate”. Sus niveles corresponden a la aplicación de una regla gramatical cuyos nodos representan una palabra o un nodo no terminal (ver Figura 17). Comienza con el símbolo “inicial” aplicando las reglas que puedan empatarse hasta alcanzar uno de los estados finales. aplicando a sus elementos las reglas en forma inversa.Análisis Sintáctico 41 FN s AUX Fn q2 Det Fn Adj Nom q8 Prep Fp q9 Fn q6 q1 VER q4 AUX q3 Nom q7 FP VER Fn FP q5 q10 S: Oración Ver: Verbo Adj: Adjetivo Fn: Frase Nominal FP: Frase Preposicional Nom: Nombre Aux: Auxiliar Verbal Det: Determinante Prep: Preposición Figura 16. Descendente. RTEF de una Gramática del Inglés. cada regla que empata agrega un elemento a la estructura o la termina de generar. es decir.2. de las condiciones al estado.

42

Lenguaje Natural: Descripción de las Etapas para su Tratamiento

La elección del sentido depende del factor de ramificación, la evaluación heurística, la información disponible y el mecanismo de traducción; siendo conveniente en ocasiones combinar las dos direcciones dentro del módulo traductor. Otro aspecto relevante a considerar es la cantidad y variedad de traducciones que se pueden generar a partir del mismo texto y gramática siendo necesario decidir si: • • • • Se van a explorar todas las alternativas Se acepta como única a la primera interpretación generada Al obtener varias, cómo se reconocerá a la mejor Cómo aprovechar la heurística para lograr que la mejor solución es la primer interpretación hallada. O

FN

FV

NOM

VERBO

FN

juan

tomó

ARTICULO

NOM

ADJETIVO

la Figura 17. Árbol de Traducción.

pelota

roja

Es necesario reconocer que el proceso de traducción de un texto es equivalente al problema de hallar una representación idéntica a otra, por lo que obliga a desarrollar una “búsqueda” dentro de un espacio de estados, invitando a emplear las herramientas de búsqueda ciega y heurística clásicas.

3.3 TEORÍAS DE CHOMSKY
En 1957, Chomsky publicó un libro intitulado “Reglas para la generación del lenguaje”, basado en las teorías formales del lenguaje expuestas por Bloomfield, expone una representación de “estructuras” que pretenden modelar el mecanismo natural-inherente del ser humano en el aprendizaje y generación del lenguaje.

Análisis Sintáctico

43

El fundamento de su teoría descansa en el hecho de que el lenguaje natural es infinito, pero que sin embargo la capacidad de entendimiento y expresión por el hombre, no depende únicamente de las palabras y oraciones que haya escuchado y hablado, sino que siempre hay términos y frases que aunque no integren su repertorio y experiencia en comunicación será capaz de comprenderlas y emitirlas llegado el momento. El núcleo de tal teoría es la observación de que el aprendizaje del lenguaje no sólo depende de memorizar todas las oraciones que el ser humano escucha y dice, sino que ante todo está dotado por un mecanismo capaz de interpretar y producir “estructuras del lenguaje”. Chomsky desarrolló el concepto de “gramáticas generativas” para representar a las estructuras naturales que el hombre emplea en el manejo del lenguaje, definiéndolas como: Una estructura formalizada con precisión matemática que genera sin un parámetro específico cualquier información que no está representada explícitamente en el sistema, dando vida a oraciones gramaticales que en conjunto integran un lenguaje, describiendo y asociando a cada una de ellas su descripción estructural o análisis gramatical. A lo largo del trabajo desarrolla las siguientes clases de gramáticas generativas: Gramática Generativa de Estado Finitos. Se concibe como una máquina capaz de representar y transitar por un conjunto de estados finitos, emitiendo un “símbolo específico” al pasar de un estado a otro. El proceso arranca a partir de un estado específico “inicial”, transita por diversas rutas generando palabras, para llegar a un estado dado, denominado “final”. A la secuencia de palabras emitidas se le llama “oración” y al conjunto de ellas se identifica como lenguaje, mientras que a la máquina se le conoce como “gramática de estados finitos”. Gramática Generativa de Estructuras de Frase. En lugar de manejar “palabras” específicas durante la transición de un estado a otro, se emplean “constituyentes” (verbos, sustantivos,....), las cuales pueden estar definidos por otros, y éstos a su vez por algunos más específicos hasta llegar a especificarse por “palabras”. Como por ejemplo: O -> FN -> FV -> ART -> NOM -> VERBO-> FN + FV ART + NOM VERBO + FN el, la, los, ..... casa, juan, perro,.... pinta, come, juega, cuida

La oración que se evalúa o genera tiene una representación estructural denominada “frase marcada”. Por ejemplo al aplicar la gramática anterior se produce la oración y frase marcada mostrada en la Figura 18. O-> FN + FV ART + NOM + FV el + NOM + FV el + perro + FV

44

Lenguaje Natural: Descripción de las Etapas para su Tratamiento

el el el el el

+ perro + VERBO + FN + perro + cuida + FN + perro + cuida + ART + NOM + perro + cuida + la + NOM + perro + cuida + la + casa O

FN

FV

ART

NOM

V

FN

el

perro

cuida

ART

NOM

la Figura 18. Estructura de Frase.

casa

Gramática Generativa Transformacional: Además de producir la “estructura de frase” como resultado de la primera etapa en el proceso, desarrolla a partir de dicha estructura una nueva denominada “componente transformacional” y concluye emitiendo otra llamada “componente morfémica”. Estas transformaciones sucesivas sobre la estructura frase permiten identificar ciertos aspectos que solamente aparecen a ese nivel de representación. Por ejemplo, una declaración en “voz activa” puede convertirse a “voz pasiva” para después “afinarse” y presentarse como una frase final tal como se muestra en la Figura 19: Aplicación de la gramática Estructura de la frase Jhon will break the window FN1 AUX VERBO Aplicación de reglas morfémicas

Componente morfémico The window will be broken by John

Aplicación de las reglas de transformación

Componente transformacional The windowwill be – EN break by Jhon

Figura 19. Desarrollo de una Gramática Transformacional.

provocando la emisión de oraciones sin sentido. -> The chickens are hungry and ready to eat their food. si dos oraciones tienen el sustantivo en común se combinan por medio de una serie de transformaciones como se ilustra en la Figura 20: 1 the girl is singing . 2 the girl has a lovely voice integrando las oraciones se producen [ the girl [ the girl has a lovely voice]is singing] [the girl [the girl is singing] has a lovely voice] al transformarse produce al transformarse produce the girl who is singing has a lovely voice the girl with a lovely voice is singing the singing girl has a lovely voice Figura 20. Gramática Generativa de Transformaciones Generalizadas. Como resultado de las experiencias al aplicar esta gramática se observó la separación del nivel sintáctico de las oraciones producidas con respecto al contexto semántico en el que se expresan. la aplicación de reglas de transformación tratan con la relación existente entre el verbo y el sustantivo. Muchas veces. como por ejemplo: I am going to work -> I am not going to work. Teoría de Sintaxis Como producto de las experiencias en la aplicación de las “estructuras sintácticas”.Análisis Sintáctico 45 La “estructura de frase” dentro de este desarrollo viene a jugar el papel de “estructura de fundamento”. the chickens are ready to eat -> The chickens have been prepared for us to eat them. Por ejemplo. contradictorias o tergiversadas. mientras que el “componente morfémico” desempeña el de “estructura frontal”. Maneja aspectos más interesantes y complejos que las antecesoras. Conjugación de Oraciones de una Gramática Transformacional. También manejan los casos de negación o interrogación de la oración. Chomsky expuso en 1965 la “teoría de sintaxis” en donde la gramática consta de los siguientes componentes: .

número . mientras que el fonológico la “maquilla” para su exposición. Atributos de los Símbolos de un Frase Marcada. . como por ejemplo: . en donde los nodos que terminan con esa lista se denominan “símbolos complejos”. se dice entonces que es una gramática “sensitiva al contexto”. se procura que no tengan la misma “estructura de la frase” mediante la adición de identificadores. nombre animado animal número . tipo tiempo . objeto . Durante la fase desarrollada por el componente sintáctico su analizador léxico proporciona para cada palabra información de interés para los módulos sintáctico. Transformación. Cuando la descripción y rol del verbo ignora la naturaleza de las frases nominales que lo rodean (sujeto y objeto) se dice que es una gramática de “contexto libre”.46 Lenguaje Natural: Descripción de las Etapas para su Tratamiento Sintáctico Base: Compuesto por reglas que producen la estructura de la frase y reglas de intersección léxica. Semántico Fonológico El componente sintáctico es “generativo” pues produce las “estructuras fundamento” que alimentan a otros dos componentes de carácter “interpretativo” ya que el sintáctico asocia a la “estructura de la frase” su significado. O FN FV ART NOM V F género . género número . pero si las toma en cuenta e inclusive produce listas de atributos para cada una de ellas. tiempo sujeto . . animado persona número tipo . Por lo que concierne a la transformación de la “estructura fundamento” a otras como las interrogaciones y preguntas que provocan una diferente interpretación. nombre . en la Figura 21 se muestra una “frase marcada” con atributos asociados a sus elementos. Por ejemplo. semántico y fonológico. Figura 21.

con el objeto de no cambiar el significado.(+ progresivo) NEG The tree grow -(+ progresivo) Q the tree grow -(+ progresivo) El componente semántico emplea reglas de producción y marcadores semánticos para formar rutas amalgamadas que identifican varios sentidos de la oración. en donde se separa la función de la semántica con respecto a la transformación. La interrelación de los componentes se ilustra en la Figura 22. 3.Análisis Sintáctico 47 Estructura Frontal The tree is growing The tree is not growing Is the tree growing <<<- Estructura Fundamento The tree grow . aún se puede presentar el problema. que a su vez tienen la misma “estructura de frase”.4 REDES DE TRANSICIÓN AUMENTADAS (RTA) Las “RTR” emplean más condiciones y acciones para recorrer una red. A pesar de las previsiones para evitar la “degeneración” del significado de una oración. Funcionamiento de la Teoría de Sintaxis. como por ejemplo: “John sprayed paint on the wall”-------->“The wall sprayed with paint by John” BASE Reglas Análisis Léxico Reglas de inserción léxica “Estructura Fundamento” SEMÁNTICO Reglas de Marcadores proyección Semánticos TRANSFORMACIÓN Transformaciones Estructuras de semánticos árbol Rutas Amalgamadas “Estructura Fundamento” Fonólogo: Componentes. . usan un “Árbol de traducción” como estructura de las palabras de la oración que “empata” con los elementos de la red. También varias partes de la oración son mantenidas como registros hasta que la estructura completa pueda ser determinada. Maquillaje “Estructura Fundamento” “Estructura Fundamento” Figura 22. cuando una oración se genera de otra.

PUSH Es el arco con un nombre de estado. como en las “RTR”. las “RTA” usan la nomenclatura siguiente: < Red Transición > --> (< arcos > < arcos > * ) < arcos > --> (< estado > < arco > * ) < arco > --> (CAT < categoría > < prueba > < acción > * < acci_term > | (PUSH < estado > < prueba > < acción > * < acci_term > | (TST < etiqueta > < prueba > < acción > * < acci_term > | (POP < forma > < prueba > ) o < acción > --> (SETR < registro > < forma > ) | (SENDR < registro > < forma > ) | (LIFTR < registro > < forma > ) < acci_term> --> (TO < estado >) | (JUMP < estado >) < forma > --> (GETR < registro >) | * | (GETF < característica >) | (APPEND <registro> <forma>) | (BUILD <fragmento> <registro> *) * Indica un elemento repetible en la especificación del lenguaje. SENDR Transfiere el valor al siguiente nivel inferior de la red para asignarlo a un registro. cuando se encuentra un verbo. como por ejemplo si es pasiva o interrogativa. el elemento con el que se está trabajando. Se pueden hacer pruebas sobre parte de la oración que ha sido construida. éste se almacena en un registro tipo “V” (Verbo). palabra o frase. & Actual valor de entrada. todas las palabras de una “FN” (Frase Nominal) se guardan en un registro clase “FN”. Hay tres posibles acciones usadas para construir las partes de la oración: SETR Asignan un valor al registro especificado. Los arcos CAT. Al usar la función PUSH implica moverse a un nivel más bajo de la red de transición comenzando en el estado cuyo nombre es especificado. Sin embargo en las “RTA” hay cuatro clases de arcos: CAT Es el arco original en el símbolo terminal que identifica la clase de palabra o categoría que causó que el arco haya sido considerado. TST y PUSH tienen una prueba y acción terminada al menos que debe ocurrir. LIFT Transfiere el valor el siguiente valor superior de la red para su asignamiento. . TST Permite usar un arco de acuerdo a una condición arbitraria y no solamente porque una palabra específica es encontrada. similarmente. PUSH Inserta elementos en la pila POP Saca elementos de la pila <arcos> Una RTA se define por uno o más conjunto de arcos ( *) donde un arco es un estado con sus arcos asociados. POP Es un arco “Dummy” usado para determinar si un estado terminal ha sido alcanzado y cómo será la construcción final.48 Lenguaje Natural: Descripción de las Etapas para su Tratamiento Por ejemplo.

si el apuntador a la entrada deberá se movido o deberá permanecer donde está y cual estado será procesado a continuación. seguido de uno o mas signos “+” para indicar los nodos a ser incluidos y finalmente los atributos y registros cuyos valores sean derivados. construyendo la “FV” “come un helado”. La frase: “El niño come un helado” genera la “FN” “El niño” que asigna al registro “Sujeto” y el verbo “Come” al registro “V”. ya que las palabras aún no han sido “empatadas”. GETF Determina el valor de un atributo específico de la palabra de entrada actual APPEND Adhiere valores al contenido del registro especificado. TO Indica que el apuntador de entrada será movido a la siguiente palabra del texto de entrada y que nodo será procesado a continuación. Por ejemplo. ( (S / (PUSH FN /T (SETR SUJETO &) (SETR TIPO “DCL”) (TO Q1) ) (CAT AUX T (SETR AUX &) (SETR TIPO “Q”) (TO Q2) ) ) . y a continuación asigna el fragmento al registro “FV”. para que al final genere la siguiente estructura: (S DCL (FN (Dete el) (Adje) (Nomb niño)) (FV (Vcome) (FN (Dete un) (Adj) (Nomb helado) )) Conforme a la gramática de la Figura 16 se describe a continuación el lenguaje tipo “RTA” que corresponde al “nivel superior” utilizando el “/” para señalar el comienzo de una “RTA” cuyo nombre aparece antes. Las funciones usadas para describir los datos manipulados son: GETR Regresa el valor de un registro específico.Análisis Sintáctico 49 Las acciones terminales TO y JUMP especifican si el proceso debe ser terminado con la palabra actual o frase. JUMP Señala el nodo a procesar sin mover el apuntador del texto de entrada. se puede agregar una frase preposicional al final de una nominal que ya ha sido formada y colocada en el registro “FN”. por ejemplo: (SET FV (BUILD (FV ( V + ) & ) V ) ) Primero construye el fragmento FV colocando el valor actual en la posición de “&”. y el contenido del registro “V” en la posición de “+”. Señala primero el fragmento a construir. Después identifica que la entrada actual “un helado” es una “FN” luego encuentra la regla de arriba. tal como se muestra en al gramática que aparece en la Figura 23. BUILD Construye partes o toda la frase final a partir del contenido de los registros especificados.

50 Lenguaje Natural: Descripción de las Etapas para su Tratamiento (Q1 (CAT V T (SETR AUX NIL ) (SETR V & ) (TO Q4) ) (CAT AUX T (SETR AUX & ) (TO Q3) ) ) (Q2 (PUSH FN/T (SETR SUJETO &) (TO Q3) ) ) (Q3 (CAT V T (SETR V &) (TO Q4) ) ) (Q4 (PUSH FN/T (SETR FV (BUILD (FV (V +) &) V) ) (SETR CFP NIL) (TO Q5) ) (POP (BUILD (S+++(FV +) ) TIPO SUJETO AUX V) T ) ) (Q5 (PUSH FP/T (SETR CFP (APPEND (GETR CFP) FPR ) ) (TO Q5) ) (POP (BUILD (S++++) TIPO SUJETO AUX FV) T) ) (FN/ (CAT Name T (SETR NAME &) (TO Q8) ) (CAT Det T (SETR DETER &) (SETR ADJE NIL) (TO Q6) ) ) (Q6 (CAT Adj T (SETR ADJE (APPEND (GETR ADJE) (LIST &) ) ) (TO Q6) ) (CAT Name T (SETR NAME &) (SETR CFP NIL) (TO Q7) ) ) (Q7 (PUSH FP/T (SETR CFP (APPEND (GETR CFP) FPR ) ) (TO Q7) (POP (BUILD (FN (Dete +) (Adje +) (Nomb+)+) DETER ADJE NAME CPF ) T ) ) (Q8 (POP (BUILD (FN (Nomb + ) ) Name ) T ) ) (FP / (CAT Prep T (SETR PREP &) (TO Q9) ) ) (Q9 (PUSH FN/T ( POP (SETR FPR(BUILD (FP (Prep +) &) PREP) ) T ) ) ) Figura 23. Gramática. .

donde se indica la secuencia a explorar de nodos y ramas: Tabla 13. frontal.. algoritmos y estructuras de datos necesarias en la construcción del subsistema de análisis sintáctico.) Descendiente: Apuntador Hermano: Apuntador Antecesor: Apuntador Unidad Léxica: Apuntador El árbol ligado con esta clase de registros tiene la siguiente ilustración. en donde el orden en el recorrido entre nodos puede o no facilitar la tarea..) pueden representarse por medio de nodos con el siguiente formato de registro: Constituyente: (Oración. Artículo.Análisis Sintáctico 51 Otras frases que son validadas generan un resultado: “John run “ ---( S DCL (FN (Nomb John) ) ( FV (V run) ) ) “Will Marie drink the milk and coffe” (S Q (FB (Nomb Marie) ) Will (FV (V drink) (FN (Dete the) (Adje) (Nomb milk) (FP (Prep and) (FN (Nomb coffee) ) ) ) ) ) 3. Recorrido de las Estructuras.5 DESARROLLO DEL MÓDULO SINTÁCTICO El desarrollador debe elegir el tipo de gramática que más se ajuste a la naturaleza y componentes del lenguaje a representar. .. También deberá elegir el medio de programación más flexible que disponga para el manejo de funciones. en donde la “X” representa nulo y “Ç “ el llamado a la función que identifica la palabra reconocida (símbolo terminal). Entre los elementos más útiles al momento de la implementación del módulo están: las estructuras ligadas.. compiladores e intérpretes. Los diversos tipos de estructuras (de frase. FN.. Por tal motivo a continuación se ofrece una descripción de su aprovechamiento [12]: Estructuras ligadas.El campo “Unidad Léxica” almacena el apuntador a la descripción léxica del símbolo terminal reconocido como se aprecia en la Figura 24. listas. recursividad. pilas. Para ello existen tres direcciones y órdenes clásicas a considerar al momento de visitar un nodo “padre”. Adverbio. su “hijo” y “hermano” conforme a la siguiente Tabla 13. tablas. para después proceder al diseño de las reglas y redes correspondientes. reglas... Formato de la Estructura Temporal Fuente. FV. El análisis y generación de oraciones almacenadas en las estructuras ligadas debe apoyarse en un eficiente mecanismo de creación y acceso. Método de Recorrido Visita al Nodo Padre El árbol del hijo El árbol del padre Preorder 1 2 3 Inorder 2 1 3 Postorder 3 1 2 .

acceso. Q2. Q4. Nom. Representación de las reglas. (Qo. en donde “T” indica el Tipo de arco que se usa: “E” de estado (se compone por su propia red) “T” terminal (se divide en símbolos terminales) “F” estado final de la red. interpretación y manipulación de las reglas es un factor determinante en la eficiencia del subsistema de análisis sintáctico por lo que se debe diseñar estructuras y mecanismos de acceso adecuados. Q4) Reglas: Mientras que la relación entre los elementos de una regla (estado actual-->arco) y los nodos de una red se representan por medio de un arreglo de cuatro campos con el formato: (Ni. Verbo. Nom.. A través de usar “CAR” como etiqueta del arco y condiciones en el “CDR” se almacena cada regla: ( ó (FN FV) ) ( FN ( Art Nombre ) ) ( Art ( el la los . F) Implementación de RTA. Adjetivo. Art. Q1.. El almacenamiento. Estructura Ligada para una Frase. Por ejemplo: (Qo. Donde “Ni” es el nodo del cual sale el arco y “Ns” es el nodo a donde llega el arco “a”. Adjetivo. de acuerdo con el formato: ( Ni. Los estados y arcos de la red se relacionan con una tripleta en cada localidad. T) (Q2. usando dicha información al contrastar el texto a evaluar. . como se ilustra en la Figura 25. T) (Q1. Verbo.. Dentro de las alternativas de representación de reglas tenemos las siguientes: Listas. F) (Q3. a. T). Ns. Art. Verbo. Q4. E) (Q2. Q3) (Q2.52 Lenguaje Natural: Descripción de las Etapas para su Tratamiento O X X X FN X FV X X ART E N X perro V come Figura 24. En la primera se compila la gramática generando varias tablas y estructuras de datos y en la otra se interpreta. Q4) (Q3.Q2) (Q2. Q3. Se puede concebir el análisis de una oración como un proceso que atraviesa por dos etapas. ) ) Tablas. a. Verbo. Ns). explotando las capacidades del lenguaje de programación empleado. Q1) (Q1.

. Es conveniente grabarla como una lista observando el mismo formato de entrada. Son inicializados conforme la gramática es leída. Al más alto nivel es una lista de un conjunto de arcos representados por listas. ATN y de registros. Member. en función del índice que se le asigne será ejecutada por la función “case” preconstruida durante la segunda fase. etc. Dentro de cada arco (lista) hay un “nombre de estado” y a continuación un nuevo nivel de listas que define “posibles arcos”. Almacenamiento de la gramática. Cada localidad tiene un nombre de comando distinto a la gramática alimentada al momento de ser “analizada”. identificando fácilmente a cada tipo de elemento por su posición en la lista de la gramática de entrada. Tabla de nombres de estado. Los nombres ATN van seguidos por el “/” . Estos son nodos acompañados por la descripción de condiciones y pruebas definidas para él. aplicando las funciones clásicas de acceso de listas del lenguaje LISP como CAR. La estructura es una lista de listas de... Programa para Gramática tipo RTA.Análisis Sintáctico 53 Gramática Texto de entrada Fase 1 Compilador Gramatical Fase 1 Interprete Gramatical Gramaticalmente almacenada como Oración analizada en sus componentes estructurales Tabla de comandos Tabla de registros Tabla de nombre de estado Tabla ATN Figura 25. Tabla de comandos. Durante la primera fase se producen las siguientes tablas: Gramática que se introduce al “compilador” de la fase 1. Cada arco proporciona una lista de acciones a ser ejecutadas si el arco es tomado. El formato mostrado en el ejemplo de la sección 4. CDR. Las acciones son concluidas por una acción terminal (o símbolo)..4. ya que: Un nombre de estado es el “car” de cada conjunto de arcos (Q1.

. entonces las acciones del arco son ejecutadas.54 Lenguaje Natural: Descripción de las Etapas para su Tratamiento Los nombres de registro ocurren en las declaraciones de acción y varía el lugar que ocupan acorde con el formato de la instrucción: (SETR AUX &). También se emplea un “contador de localidad” para señalar el nodo a procesar. inicializándose al comienzo de la gramática para actualizarse apuntando al siguiente nodo asignando el valor del “apuntador next” del nodo que actualmente está procesando. ATN o registro y su apuntador. la acción terminal causará el retorno de la rutina con el “contador de localidad” apuntando al siguiente nodo a ser ejecutado. El formato de las tablas es idéntico: Nombre del estado. Por ejemplo “CAT” al determinar que categoría asociada es “verdad”. Cada rutina de comando explota los parámetros requeridos de la gramática y llama a la rutina apropiada. Mientras que en la fase de “interpretación” la “clave” está en usar un proceso “case” para ejecutar los comandos indexados por la tabla. Cuando un arco terminal es alcanzado (ya sea TO o JUMP) el nombre de estado al cual se apunta será encontrado en la “tabla de estado” y el apuntador del nodo al que corresponderá será el nuevo valor del contador de localidad.

ANÁLISIS SEMÁNTICO .CAPÍTULO 4.

.

significado o propósito. actividad. niño. es por ello que desde los átomos del lenguaje.. actividad. religión.. surgen las variantes de: sinónimos. regional. Circunstancia: necesidad.2. razón o conocimiento que está detrás del símbolo o expresión oral. el conocimiento “mundano” y el del “dominio” de la aplicación que se emplee dentro del sistema... educacional. rutinaria. Receptor: empleado. otorgándole “vida” y razón de existir.. que es asignado. hasta las estructuras más complejas integradas por sus elementos llevan consigo un concepto. símbolos) y sus asociaciones (frases. corto. oraciones. Significado Es el concepto. guerra. idea .. padre.. expresión. urgencia. hijo.…) son como “entes” inanimados al carecer de significado. Tiempo: permanente. “validación de oraciones”. Emisor: funcionario. . Por lo que el significado o valor real de un elemento o asociación del lenguaje va íntimamente ligado al “contexto” en que es expresado y a quién va dirigido (ver Figura 26) [10]. Su diseño conserva una plena integración con el resto de subsistemas en el aprovechamiento de “unidades léxicas” (UL). explotación y actualización de las representaciones de conocimiento sobre el leguaje.. .. El subsistema de análisis semántico como parte de un SLN representa el núcleo del “conocimiento” que domina la aplicación y en función a su variedad y detalle será la riqueza de vocabulario. . .1 Contexto Es el ámbito social en donde se circunscribe el lenguaje que se emplea (raza. fin..4. . modismos... los cuales vienen a alterar el manejo del lenguaje. largo. acceso.) y por lo tanto el significado particular que se asocia a sus elementos. También debemos reconocer que al momento de “compilar” significados a expresiones verbales o escritas. de moda..1 NATURALEZA Los componentes del lenguaje (palabras. acrónimos. etc. edad. El significado tiene atributos de: • • • • • • • Alcance: universal. entendimiento. “diccionarios” y “representaciones internas” tanto del texto interpretado como del generado.. área profesional. Contexto: cultural. Reconociendo que dentro de este marco existen otros dominios más pequeños y específicos en función de ciertas particularidades (región. que le proporciona una “personalidad” específica dentro del contexto que usa. idea.. Poniendo particular atención a la definición..2 ELEMENTOS 4. animal.. … Tipo de ser: humano..).. antónimos. . país. nivel cultural. ANÁLISIS SEMÁNTICO 4. ámbito familiar. homónimos. . 4. respuesta y utilidad que el propio sistema ofrezca. aceptado y empleado por los miembros de la sociedad que aplica dicho lenguaje como medio de expresión y entendimiento [9].

Dicha teoría emplea dos componentes [11].2. Si bien la relación que guardan los caracteres del alfabeto para integrar “palabras” es observada en el subsistema de análisis léxico y la asociación entre sujetos. La descripción sintáctica usa “marcadores gramaticales” para identificar los posibles usos de una palabra. Generan distintas interpretaciones de la oración. su pretensión fue a través de la teoría semántica describir la “habilidad interpretativa” de las personas en consideración a su capacidad para reconocer a los componentes de una oración. otra sintáctica y una semántica con sus diversos significados.3 Relación De igual forma que los elementos del alfabeto al permanecer separados entre sí no tendrían utilidad alguna. 4. verbos y objetos es evaluada por el análisis sintáctico.58 Lenguaje Natural: Descripción de las Etapas para su Tratamiento Lengua Castellana Popular En México en la costa norte Cómputo Eventos Eventos Figura 26.3. ESTUDIO DE GRAMÁTICAS SEMÁNTICAS 4. Inclusive al formar frases y estar desunidos no alcanzarían la riqueza expresiva de un texto. 4. Por tal motivo. A cada “Unidad Léxica” le acompaña una descripción fonológica. Diccionario. es conveniente concebir al lenguaje como un “sistema” con elementos específicos e interrelacionados con el propósito de compartir conceptos.1 Teoría Semántica Jerrold Katz y Jerry Fodor en 1964 publicaron “La Teoría de la Estructura de una Semántica” enfatizando la distinción de los niveles de análisis sintáctico del semántico. Este es en resumen el objetivo del analizador semántico. detectar anomalías en su significado e identificar asociaciones entre las oraciones. Reglas de proyección.3. como se ilustra en la Figura 27. en el semántico se cuida la correspondencia entre el contexto y el significado de cada elemento de la oración para atribuirle un valor específico conforme a la naturaleza de la expresión. tampoco lo sería para las palabras al estar aisladas unas de otras. . Contexto de un Lenguaje. mientras que la semántica incluye “marcadores semánticos” y “distinguidores” para hacer diferenciaciones esenciales de “rol” del significado así como para describir a este.

comparan el significado de las palabras de una oración con los posibles significados de esta. ofreciendo el sentido apropiado para cada uno de ellos. asociando los “marcadores semánticos” con los “distinguidores”. como por ejemplo: This suit is too light Reglas de proyección El saco es de color claro El saco está hecho de un material ligero Interpretaciones Figura 29. . [ ] Distinguidor Los “marcadores semánticos” describen los elementos del lenguaje y se emplean al correlacionar el significado entre las palabras señaladas en la Figura 28: requiere VERBO: cantar un sujeto palabra con sujeto animado marcador semántico Figura 28. Las “reglas de proyección”. clarificando las ambigüedades. Ejemplo de Distinguidores. Pero si el único sujeto es la palabra “árbol” entonces será desechada la interpretación clásica del verbo. Marcadores Usados en la Teoría Semántica. ilustradas en la Figura 29. al menos que el contexto de la oración sea el de un “cuento” entonces los “distinguidores” deberán estar descritos acordes con cada contexto en los cuales la palabra puede ser protagonista.Análisis Semántico 59 DRIVER nombre adjetivo COCINA nombre verbo Driver ROJO nombre adjetivo (nombre) {humano} (verbo) {humano} {ocasional} [capaz de manejar un vehículo cuya ocupación no es la de conducir autos] {profesional} [ocupación: conductor de autos] {ejecutable} [instrucciones de cómputo] {configuración} [declaraciones de las características de los recursos de cómputo] Figura 27. NOTA: ( ) Marcador Gramatical. { } Marcador Semántico. Marcadores Semánticos.

{actividad social}. [Distintos caracteres y expresiones]<(objeto conceptual V (actividad social) > C. como se ilustra en la Figura 30. the man hits the colorful ball Se generan interpretaciones 1.60 Lenguaje Natural: Descripción de las Etapas para su Tratamiento A este proceso de aplicación de reglas se le conoce como “rutas amalgamadas”. Rutas Amalgamadas para Interpretar una Oración. compuesta de condiciones conjuntas que al cumplirse todas emiten una conclusión específica “interpretación” equivalente a desarrollar un “espacio de estados” en donde se emiten cero o varias interpretaciones finales. en el cual se genera un universo de interpretaciones del significado para una oración. Colorful: Adjetivo. procurando alcanzar la “mejor” de la forma más económica posible. (color). [propósito de recreación a través del baile] < (Evento) > B. [Abundancia de colores contrastantes]<(objeto físico) V (actividad social) > A. {objeto físico}. Ball: Nombre. (evaluativo). Ball.1+A 11. [forma esférica de material pesado] < (armamento) > Al continuar el proceso de rutas amalgamadas 1. [forma esférica de material ligero] < (juguete) V (instrumento deportivo) > 2.2+B Al considerar que el verbo “hit” requiere un objeto con un “marcador semántico” {objeto físico} II IV Al considerar mas la naturaleza de “hit” quedaría la interpretación II Figura 30. Ball. 1 +B 111. El formato de las “reglas de proyección” es equivalente al de las “reglas de producción”.2+A IV. Colorful: Adjetivo. Nombre. Nombre. . {objeto físico}.

La “estructura base” contiene los componentes esenciales pero no necesariamente las palabras que aparecerán en la “estructura frontal”. lo interpreta para emitir la “estructura frontal” y aplica las “reglas fonológicas” para arrivar a la representación fonológica. S NP We V cause NP S NP VP VP NP S VP V become V alive Frase Frontal “We caused whales to become dead” “We caused whales to die” S NP We V VP NP V whales V dead cause become whales Mod not Figura 31. dicha situación “léxica” será una de tantas transformaciones aplicadas durante la generación de una oración como se aprecia en la Figura 31: Frase Marcada (Estructura base) “We exterminated Whales”. ya que al producirse la primera debe registrar todo el significado que sea posible asociar. la palabra “nacer” será base tipo: “causa”.. como por ejemplo: El metal esta duro | El metal endureció The sauce is thick | The sauce thickened Estas semejanzas pueden explicarse por las transformaciones léxicas que se aplican.. Por ejemplo. “llegar a ser”. o progresivo e inicial o formativo. la oración expresa que la “sauce thickens” ( ) transformándose paulatinamente desde un estado inicial al estado del ser "thick". “crear”. por lo tanto comienza con la representación del significado. destacan la similitud entre la “estructura base” de una oración y la “representación de su significado”. Estas semánticas observan las similitudes entre ciertos adjetivos y verbos. como en el ejemplo de la Figura 32 donde se muestra la progresión desde el más bajo nivel de la estructura base hasta su mas alto nivel. . la cual se indica por la combinación del significado “thick” y las características del verbo [+ PRO] e [+ INCHOATIVE]. “vivir”. Dicho de otra manera. .Análisis Semántico 61 Semanticas Generativas Propuestas por Fillmore. En esta interpretación thicken significa llegar a hacerse thick. Frases Emitidas por una Semántica Generativa.

Dativo. Se emplea para el sujeto. Aplicada para objetos indirectos que resultan afectados por la acción. “Aquel pollo tiene una lombriz”. “El auto rojo de Carlos”. 4. conforme a la siguiente clasificación [9]: • • • • • • • Agente. . Instrumental Fuerza inanimada u objeto envuelto en la acción. “El policía disparó hacia arriba”. “La pelota rompió el vidrio”. Frases Marcadas por una Semántica Generativa. Neutral. Usado para nombres y pronombres que correspondan al objeto del verbo en forma directa. “Juan le pego al niño con un balón”.4 GRAMATICAS CASE En 1967 Charles Fillmore presentó el trabajo intitulado “Un caso para un caso” donde ofrece una “estructura case” para nombres y pronombres mostrando la relación de una palabra con otras. Posesivo genitivo. Es el objeto sobre el que se actúa.62 Lenguaje Natural: Descripción de las Etapas para su Tratamiento S FN S For the sauce to be thick S FN ART N AUX PAST S FN ART the N sauce AUX PAST FV S AUX PASADO FV V +V +PRO +INCHOATIVE V for to be thick +PRO +INCHOATIVE FV V thicked +INCHOATIVE Figura 32. “María prestó a Lourdes su vestido”. Objetivo. Localidad. predicado nominativo o un nombre ligado al sujeto por un verbo copulativo. "Juan puso el vaso sobre la mesa”. Muestra membresía o pertenencia. Indica el lugar u orientación espacial de la acción.

K + FN (preposición) (preposición) + ( Art) + (Adj | N)* + N + (oración | FN) Donde * significa repetición. Oración por Medio de una Gramática Case.. Son los verbos auxiliares: he. Esencia.. pasado. Modales V+C1+C2+. Forma. negativa “Carezco de dinero” e indeterminada “quizás llueva” Modales. como en el ejemplo descrito en la Figura 34 y 35: Abrir [Objetivo (Agente) (Instrumental)] Juan abrió la puerta A: Juan O: La puerta La llave no abrió la puerta I: La llave O: La puerta Juan abrió la puerta con la llave A: Juan I: La llave O: La puertaZ . Tiempo. Expresa la naturaleza de la oración: declarativa. Agrega información de la intensidad del verbo: simple “El perro ladra”. hube. Agrega valor al tiempo indicando si la acción es continua: perfecto “El niño esta llorando” o si ha sido completada imperfecto “La niña estuvo cantando” Forma..+ Cn La preposición es el verbo acompañado de uno más estructuras case distintas Correr beber.. La modalidad de la oración es definida por la combinación de varios modos... Esencia.Análisis Semántico 63 Su énfasis se orienta a la estructura básica de una oración compuesta de un verbo y una o más frases nominales. ( opcional | alternativo). amar. . . Manera. estática “Ella si esta trabajando” y progresiva “Los muchachos están jugando” Modo. Aspecto. has.. Aspecto. Presente.. cada una asociada a una particular relación “case”: Oración Modalidad Preposición V Ci K FN Modalidad + Preposición Modo.. Señala el tiempo en que ocurre la acción: “Juan tomó el vuelo a la última hora” Los mecanismos que identifican los específicos “cases” adecuados para un verbo se conocen por “Case Frames” e indican cuales estructuras son “no permitidas”. Indica partes adverbiales de la oración: “El señor cerró la puerta fuertemente” Momento. interrogativa. Manera. requeridas y opcionales... que individualmente identifican un aspecto de la frase verbal de acuerdo a los siguientes criterios: Tiempo. Momento.. Muestra el sentido de la oración: positiva “El niño juega”. como en el ejemplo de la Figura 33: “Peter will not steal the dog” Modalidad Negativa Futuro Declarativo Peter steal the dog Verbo C1 steal Peter C2 the dog Figura 33.

Las preposiciones ayudan a expresar la relación entre el verbo y la frase nominal. from: Posesivo Aunque no es indispensable que exista una preposición para ayudar a identificar al tipo de estructura. O M verbo golpear F complemento 1 complemento 2 K agente nil alguien Figura 36. Dar [Objeto (Agente) (Dativo)] Maria le dio su libro a Raquel O M Pasado Imperfectivo Simple Positivo Declarativa Verbo dar F Agente María Dativo Raquel Objeto su libro Figura 35. on. Oración Negativa Expresada por Medio de Case Frame.64 Lenguaje Natural: Descripción de las Etapas para su Tratamiento Golpear [Objeto (Instrumental) (Agente)] Pedro golpeó al niño con el balón O M Pasado Declarativo Simple Negativa Indeterminada Verbo golpear F Agente Pedro Instrumento el balón Objeto al niño Figura 34. in: Localidad Of. By: Agente By o With: Instrumental To: Agente At. como se muestra en la Figura 36: “Alguien golpeó la puerta con el balón”. donde un mismo “case frame” se puede aprovechar para varios verbos. Oración en Voz Activa. K instrumento con el balón complemento 3 K nil Objeto la puerta . Oración Positiva Expresada Medio de Case Frame. en el idioma inglés se reconocen preposiciones específicas para cada estructura “case”. Los verbos se asocian a “case frames” por medio de un identificador en el diccionario.

debe ser entonces el sujeto. La generación de oraciones que emplean “estructuras case” aplican 3 reglas: • • • Sujeto.5 REDES SEMÁNTICAS Una red semántica es un tipo de estructura de ranura y relleno. por lo que se usa el conocimiento asociado a las palabras en sus unidades léxicas y evalúan el tipo de sujeto asociado al verbo de la oración. 4. Pero si dos frases nominales siguen al verbo. el “instrumental” puede ser el sujeto en una oración activa. Objeto. Por ejemplo. Oración en Voz Pasiva. al interpretar la oración: “Juan rompió el vidrio con el balón” . La herencia monótona se puede manejar mejor con este tipo de estructura que con la lógica pura. Los objetos no tienen preposiciones y debe situarse el “case” en el extremo derecho del “case frame” Frases Preposicionales. si la FN que precede al verbo es de un ser animado. Si no existe el ”agente”. Si el “case” mas a la izquierda del “case frame” es obligatorio. la primera es el objeto y la segunda el instrumento. se haría el siguiente tratamiento: La preposición “con” identifica “el balón” como un case tipo “instrumental”.Análisis Semántico 65 Mientras que en la Figura 37 se expresa la oración de voz pasiva: “La puerta fue golpeada con el balón por alguien”: O M verbo golpear F complemento 1 complemento 2 K agente por alguien K instrumento con el balón complemento 3 K nil Objeto la puerta Figura 37. resulta adecuada para soportar la herencia a lo largo de los enlaces ”es – un” e “instancia”. Por lo tanto. Mientras que el análisis de oraciones procura identificar los “cases” correspondientes a las preposiciones y comenzar a “llenar” los “huecos” del “case frame” correspondiente al verbo. entonces la FN que sigue al verbo será el “objeto”. que en este caso debe ser un ente animado. Los “cases” restantes son agregados en función al tipo de preposición. se puede asumir que se trata del “agente”. y la herencia no monótona puede soportarse muy fácilmente [12]: . Para identificar el sujeto y objeto de la frase no hay preposiciones que auxilien.

Red Semántica Binaria. es que en los sistemas de ranura y relleno el conocimiento está estructurado como un conjunto de entidades acompañadas por sus atributos. tal como aparece en la Figura 38. dividiendo la activación a partir de cada uno de los dos nodos. Mamifero es-un Persona tiene-parte Nariz instancia azul Pee-Wee-Reese equipo Brooklin-Dodgers Figura 38. 4. observando donde se encontraba dicha activación.5.5. Persona) color-del-uniforme (Pee-Wee-Reese. Esta clase de razonamiento utiliza una de las grandes ventajas de las estructuras de ranura y relleno sobre las representaciones puramente lógicas. ya que tienen la ventaja de organizar conocimiento en función a las entidades que proporcionan las representaciones de ranura y relleno. Azul) . Esta estructura tiene una gran utilidad además de soportar la herencia.2 Representación de Predicados no Binarios Las redes semánticas se pueden considerar como un modo natural de representar las relaciones que podrían aparecer como instancias de los predicados binarios en la lógica de predicados. Con este proceso es posible usar la red de la figura siguiente de manera que se puedan responder preguntas tales como ¿Cuál es la conexión entre Brooklyn Dodgers y azul?. A continuación se describe el enfoque de redes semánticas.1 Búsqueda Una de las primeras formas de usar las redes semánticas fue para encontrar relaciones entre objetos. sus representaciones y las técnicas para razonar con ellas. Brooklyn-Dodgers) instancia (Pee-Wee-Reese. Por ejemplo. ya que se establecen compromisos en la relación con el contenido de las representaciones. A este tipo de estructura se le conoce como de “relleno fuerte”. Mamífero) equipo (Pee-Wee-Reese. algunos de los arcos de la figura anterior se podrían representar en lógica como: es-un (Persona. por las siguientes razones: Indexa los predicados binarios en función de su primer argumento. Se implementa mediante la programación es orientada a objetos. Este proceso se llamó búsqueda de intersección.66 Lenguaje Natural: Descripción de las Etapas para su Tratamiento La razón por la que la herencia se ejecuta de un modo sencillo. Describe las relaciones de las propiedades fácilmente. 4.

descubrir el libro concreto al que se refiere la frase es similar al problema de decidir el antecedente correcto de un pronombre.Análisis Semántico 67 También el conocimiento expresado en predicados de mayor aridad. . De hecho. Los predicados de tres o más argumentos también pueden convertirse a forma binaria creando un nuevo objeto que represente todo el predicado. algunas de las primeras aplicaciones de las redes semánticas fueron en programas de comprensión del inglés. Dodgers. se puede expresar en redes semánticas. 5-3). de la forma ejemplificada en la Figura 39. Partido Equipo visitante cubs es-un G 23 marcador 5-2 equipo local dodgers Figura 39. Supóngase que se sabe: marcador(Cubs. Red Semántica Relacional. La frase “Juan le dio el libro a Mary” Se podría representar por medio de una red como la que se muestra en la siguiente figura (El nodo etiquetado como LB23 representa el libro concreto al que se refiere la frase “el libro”. Esta técnica es útil para representar los contenidos de una oración declarativa típica que describa distintos aspectos de un evento en concreto. Red Semántica n-aria. tal como se ilustra en la Figura 40: dar agente es-un Ev 7 libro instancia objeto Juan Lb 23 beneficiario Mary Figura 40. hombre) y de este modo es mucho más fácil hacer la representación en una red semántica. y después introduciendo predicados binarios para describir la relación con este nuevo objeto de cada uno de los argumentos originales. Así por ejemplo: hombre(Marco) se podría reescribir como: instancia(Marco. Se representa en una red semántica creando un nodo que muestre el juego específico G23 y se relacionan las tres partes de la información con dicho nodo. La figura siguiente muestra la red que surge al hacer esto. y puede ser un problema muy complicado).

Los nodos Al y A2 son dos nuevos conceptos para representar la estatura de “Juan” y la estatura de “Bill” respectivamente. Relación de Entidades. Ambos nodos representan objetos que existen independientemente de la relación que pueda existir entre ellos. Los procedimientos que operan en redes como estas pueden utilizar el hecho de que algunos arcos (como por ejemplo estatura) definen nuevas entidades. que antes no se podía hacer. debería haber una diferencia entre un enlace que defina una nueva entidad y otro que relacione dos entidades ya existentes.72 m y que es más alto que Bill” en la forma expresada en la Figura 43: Juan valor 72 A1 altura mayor que altura A2 Bill A2 Bill 1. así se podría utilizar la siguiente red para representar que “Juan mide 1. mientras que otros (como más grande que y valor) únicamente describen relaciones entre entidades que ya existen. Representación de Objetos. Por ejemplo. Representación de Comparaciones.68 Lenguaje Natural: Descripción de las Etapas para su Tratamiento 4. Otro ejemplo de una importante distinción que se ha ignorado es la diferencia entre las propiedades de un nodo en sí mismo y las propiedades que un nodo únicamente sostiene y pasa a sus instancias. Considérese la red de la Figura 41: altura Jun Figura 41. . Algunas veces resulta útil introducir el arco valor para hacer más clara esta distinción.3 Distinciones Importantes En las redes que se han descrito hasta ahora se han hecho comentarios sobre distinciones que son importantes en el razonamiento. Pero ahora supóngase que se desea modelar el hecho de que “Juan” es más alto que “Bíll” de la manera mostrada en la Figura 42: Juan altura > altura A1 Figura 42. (¿aumentaría el número 1. Utilizando estos conceptos definidos es posible representar algunos hechos como el aumento de la estatura de “Juan”. están definidos por sus relaciones con los nodos “Juan” y “Bill”.72?).5.72 Figura 43.

La red ilustra un patrón clásico de muchos estudiantes a nivel licenciatura: jóvenes.5. es decir nace en placenta al igual que el perro es procreado en óvulo y por lo tanto. hijo de familia soltero Edad 16- . pero esto ya es otro apartado. 4. Herencia Simple. Pero el nodo “persona” tiene como una de sus partes una raíz. crece. Es difícil capturar estas distinciones sin asignar más estructura a nuestras nociones de nodo. Sin embargo. reproducen y mueren. Herencia Múltiple. enlace y valor. se puede ilustrar lo que se hace en un modelo de red. de acuerdo con el ejemplo de la Figura 44: ser vivo is-a procreado en animal l a-kind-of nace en mamifero plancenta a-instance-of perro guardian gato procreado semilla oviparo en vegetal nace.4 Herencia Simple Una ventaja de las redes semánticas es apropiarse de las características de un objeto por otro que esta relacionado con él a través de un arco tipo “is-a”. de la misma forma que las aves y las plantas crecen.5 Herencia Múltiple Se dan casos en los cuales un objeto puede aprovechar propiedades de otros. una propiedad del nodo “persona” es el hecho de que es una subclase del nodo “mamífero”.Análisis Semántico 69 Por ejemplo. El gato aprovecha las características de los mamíferos.5. tal como aparece en la Figura 45: joven trabajador deportista Juega Basket ocupación empleado is-a estudiante de profesional Figura 45. practicantes de algún deporte. 4. solteros y que se las ingenian para trabajar. Las instancias del nodo “persona” si la tienen. “a kind of ” o “a instance of ”. si ejemplificamos una solución orientada a redes semánticas para un problema más sencillo. reproduce y muere nace huevo en trepad Figura 44. y lo que se quiere es que la hereden. teniendo en cuenta el costo y la complejidad.

.6 Excepciones Hay situaciones en que no deben ser apropiadas las características de otro objeto a pesar de la herencia. Dependencia Conceptual Donde los símbolos tienen los siguientes significados: Las flechas. Representación de Excepciones La propiedad “nace en” asignada al los “mamíferos” no se asocia al objeto “ornitorrínco” ya que este cuenta con la propia. ((Nace en huevo) . La Figura 47 muestra un ejemplo de la forma en que se representa el conocimiento en CD para la frase “le di un libro al hombre" hombre de P ATRAN o libro R Figura 47. ((Nace en placenta) . Un conjunto típico de primitivas tomado de Schank y Abelson (1977) es el siguiente: . 4. La representación en CD de una frase no se construye con las primitivas que corresponden a las palabras que aparecen en la frase. . por lo que dichas propiedades deberán especificarse explícitamente en el objeto que presenta la excepción. indica una transferencia de posesión. Indican direcciones de la dependencia. . facilitando extraer inferencias de ellas con independencia del lenguaje en el que estén expresadas. es una teoría enfocada a representar el tipo de conocimiento de los eventos que normalmente aparecen en las frases de lenguaje natural. y se da preferencia a ella. En CD las representaciones de las acciones se construyen a partir de un conjunto de acciones primitivas.6 DEPENDENCIA CONCEPTUAL La dependencia conceptual (CD). Señala los tipos de enlaces entre el actor y la acción P Tiempo pasado. Muestra la relación OBJECT CASE R Ilustra la relación RECIPIENT CASE. ATRANS Acción primitiva utilizada por la teoría.70 Lenguaje Natural: Descripción de las Etapas para su Tratamiento 4. Mamífero is . .a Ornitorrinco Figura 46. sino con “primitivas conceptuales” que pueden combinarse para formar el significado de las palabras de cualquier lenguaje concreto. Las flechas dobles. como se ilustra en la Figura 46.5.

escuchar) Un segundo conjunto de bloques construidos de CD es el conjunto de las dependencias permitidas entre las conceptualizaciones descritas en una frase. dar) Transferencia de una localización física de un objeto (p. ej.. patear) Asimiento de un objeto por un actor (p. ej. ej.. empuñar) Ingestión de un objeto por parte de un animal (p... decir) Construcción de información nueva a partir de la vieja (p. ej. Estas son: ACTs PPs Aas Pas Acciones Objetos (productores de imágenes) Modificadores de acciones (asistentes de acciones) Modificadores de PPs (asistentes de imágenes) Las estructuras de dependencia son en sí mismas conceptualizaciones y pueden servir como componentes de estructuras de dependencia más grandes.. Las conceptualizaciones que representan eventos pueden modificarse de varias formas para aportar información a un frase conforme al tiempo verbal. lo deje”: . comer) Expulsión de algo del cuerpo de un animal (p. ej.. hablar) Concentración de un órgano sensorial hacia un estímulo (p. llorar) Transferencia de información mental (p. ej.. ir) Aplicación de fuerza física a un objeto (p. ej.. existen cuatro categorías conceptuales primitivas a partir de las cuales se pueden construir estructuras de dependencia. empujar) Movimiento de una parte del cuerpo por su dueño (p. decidir) Producción de sonidos (p.Análisis Semántico 71 ATRANS PTRANS PROPEL MOVE GRASP INGEST EXPEL MTRANS MBUILD SPEAK ATTEND Transferencias de una relación abstracta (p... ej. cuyas variantes son: p f t ts tf k ? / nil delta c Pasado Futuro Transición Transición de comienzo Transición finalizada Continuación Interrogativa Negativa Presente Atemporal Condicional En la figura 48 muestra un ejemplo del uso de estos tiempos cuya frase tomada es “como fumar puede matarte. ej. ej.. ej.

El enlace horizontal de causalidad indica que la primera me hace dejar de fumar la cuantificación “tfp“ asignada a la dependencia entre “I” en “INGEST” indican que fumar (una instancia de “INGEST”) ha acabado y que esto ocurrió en el pasado. Pero la idea que hay debajo de “creé” puede representarse en CD como un MTRANS de un hecho en la memoria de “John”. Las acciones “hace 1” y “hace 2” son poseedores postizos que se refieren a algo como acciones aún no especificadas. sabemos sólo que fumar puede matar. En el enlace vertical de causalidad indica que “fumar mata”. no que necesariamente lo haga. Tomar. en lugar de una ocasión por cada palabra que describe este ACT.72 Lenguaje Natural: Descripción de las Etapas para su Tratamiento uno uno INGES 1 c hum R cigarrillo c INGES muerto uno P vivo c hum R 1 cigarrillo Figura 48. la palabra “creé” se utiliza para simplificar el ejemplo. Por ejemplo todos los verbos siguientes implican una transferencia de posesión de un objeto: Dar. Robar. Donar. “Bill” hizo esto de forma que “John” creerá que si él hace alguna otra cosa (diferente de lo que “Bill” hará para romper su nariz). Una vez aplicadas. entonces “Bill” romperá la nariz de “John”. . sino que también debe emplearse las inferencias asociadas con la información específica.6. 4. amenazo a john con romperle la nariz” La representación dice “Bill” informó a “John” de que él hará algo para romperle la nariz de “John”. está marcada con “c”. Uso de los Tiempos Conceptuales. En esta representación. Sin embargo. se almacenan los resultados como parte de la representación y por lo tanto pueden utilizarse repetidas veces.1 Argumentos para la Representación en CD Las inferencias sobre quién posee un objeto actualmente y sobre quién los poseyó antes. Para construirla no sólo debe utilizarse la información que explícitamente se establece en una frase. Las representaciones sólo necesitan usarse una vez por cada primitiva ACT. Por ejemplo en la Figura 49 se considera la frase: “bill. puede ser importante. En una representación de CD estas posibles inferencias pueden establecerse una vez y asociarse con la primitiva ACT ATRANS.

Los elementos no especificados por la representación de una parte de información pueden utilizarse como un centro de atención para la comprensión de eventos posteriores conforme se van produciendo. tal como se indica en la figura 51. . así como las “estructuras temporal fuente”. Por ejemplo después de escuchar que “Bill” amenazó a “John” con romperle la nariz. Esta acción se podría sustituir por la postiza “hacer 2” representada en la Figura 49. Representación de la Dependencia Conceptual. Podríamos esperar averiguar que acción está intentando evitar “Bill” que “John” lleve a cabo. La presencia de estos objetos postizos da pista sobre por ejemplo que otros objetos o eventos son importantes para comprender el caso de estudio. “el diccionario” y “estructuras transformacional” y “frontal” como se aprecia en la Figura 50 [12] El desarrollador debe elegir cuidadosamente los procedimientos y estructuras de datos para implementar el subsistema de “análisis semántico” insistiendo en concebir la aplicación como un proceso de “búsqueda” en donde a partir de los resultados emitidos por los analizadores léxico y sintáctico se generan diversas trayectorias para derivar la interpretación más adecuada tanto a las palabras como al texto.Análisis Semántico 73 John Bill Bill nariz poseida-por John C John hace hace rota Bill P C M John cree Bill hace nariz Poseida. estructuras de datos y de significado que los módulos predecesores generan en su labor: unidades léxicas y estructuras de soporte de la frase.por John rota Figura 49. 4.7 CONSTRUCCIÓN DEL MÓDULO SEMANTICO El subsistema semántico debe aprovechar el trabajo.

al considerar al “contexto” limitaría la explosión de significados derivados al permitir la producción de aquellos que satisfagan los requerimientos. de ser necesario a efecto de conservar congruencia con ellas. y para ello. Esquema de un Sistema de Lenguaje Natural. “estructuras temporales fuente” y la “estructura frase”. Cada interpretación del texto inferida crea su propia “estructura semántica” para la oración y cada una de sus palabras actualizando inclusive las definiciones y contenidos registrados en las “unidades léxicas”.74 Lenguaje Natural: Descripción de las Etapas para su Tratamiento Texto Análisis Léxico Análisis Sintáctico Análisis Semántic Representación Semántica Unidades Lexicas Estructura de la Frase Estructura del Contexto Estructura Temporal Fuente Componente Transformaciona Estructuras “Case” Componente Morfémico Representación de significado Diccionario Atributos frase marcadas de Redes Semánticas. Esto último implica la replica de las definiciones originales para producir tantas versiones como interpretaciones distintas se generen. . Marcos Dependencia Conceptual Subsistema Flujo de datos Estructuras de Datos Bases de Datos Figura 50.

. Generación de Significado para una Frase. . (Estructura de la frase) IS1 Estructura Semántica IS2 Estructura Semántica ISm Estructura Semántica Figura 51.Análisis Semántico 75 Contexto definición UL1 Texto UL2 . .

76 Lenguaje Natural: Descripción de las Etapas para su Tratamiento .

CAPÍTULO 5. COMPRENSÍON .

.

Nombres propios. hoy los carros con calcomanía color rojo no circulan”. Cuanto más importante resulta considerarlos al tratarse de textos y diálogos que deben ser interpretados. Secuencia de eventos. . CONCEPTO 2000 ENTIDADES OBJETOS: -ATRIBUTOS -VALOR RELACIONES -ACCIONES -TIEMPO -FRECUENCIA SIGNIFICADO Y PROPOSITO DE LA ORACION EVALUADA Figura 52. Por lo que se requieren advertir distintos tipos de relaciones que ligan frases y partes del discurso. COMPRENSIÓN 5.5. “Juan habló con María. 5.1 PERFIL La interpretación del lenguaje natural escrito tiene el propósito de asociar los conceptos que corresponden a la expresión para determinar su significado y propósito. Evento está ligado con otros: “Pedro jugó el domingo y anotó dos goles”. Considerar el uso de referencias “anafóricas”: le ==> Juan dijo ==> Juan a María la ==> María quería ==> Juan y María • • • • • • Parte de las entidades. como son las siguientes [10]: Entidades idénticas: Observar el ejemplo. el líder del sindicato lo anunció ayer”. Cada uno de ellos representa a una instancia de cierta clase de “entidades”: “Juan corre rápido” y “Montreal es una ciudad bilingüe” Ligas casuales. . en el jardín hay muchos árboles”. Reconociendo las “entidades” y “relaciones” involucradas en la oración. . ORACION 1000 SLN CONCEPTO1 CONCEPTO2 . Parte de las acciones. Un evento se asocia con otro: “Hubo un alto índice de contaminación ayer. Una oración puede usar entidades que pertenecen a otras que fueron expresadas en otras oraciones: “Rubén estrena casa. Generación de Significado para una Frase. .2 PROCESO Para entender una oración sencilla es indispensable tomar en cuenta el contexto en que se expresa. considerando a una especie de discurso que ocurre dentro de un contexto específico. Integrantes de un grupo expresado participan en otra oración: “Los empleados de la fábrica se declararon en huelga. . le dijo que la quería”. Elementos de conjuntos. como se ilustra en la Figura 52: DISCURSO INTERPRETACIÓN ORACION 1 . Son acciones que ocurren cronológicamente: “José invitó a cenar a su novia” y “pagó con su tarjeta de crédito”.

Para que el SLN sea capaz de reconocer estas clases de relaciones entre las oraciones. Las aplicaciones que interpretan múltiples oraciones deben usar gran cantidad de conocimiento y limitar las condiciones del dominio al que pertenece el discurso. Una acción anima a realizar otras: “Jaime le dice a su mamá que tiene hambre” Asumir condiciones y estados. son novios. debe usar una gran cantidad de conocimiento ordinario. como los ilustrados en la Figura 54. Resultados del Análisis Sintáctico. A partir del cual se genera el significado de los elementos de la oración en forma congruente a la base de conocimientos de acuerdo con las Figura 54 y 55. del lenguaje y del contexto en que se expresa el discurso y sus oraciones... De manera implícita se hace referencias a ciertas a condiciones y atributos de los protagonistas: “Dame un beso”. 5. Al ser procesada por el subsistema de análisis sintáctico arroja el árbol mostrado en la Figura 53: S (RM1) FN PRO (RM2) verbo want FN PRO ADJS FV S (RM3) FV (RM4) FN RM2 Bill’s ADJS Doc N File Figura 53. Crear las estructuras correctas que correspondan al significado de las palabras individuales combinadas entre sí. El subsistema del análisis semántico al hacer su función de: Mapear palabras individuales en objetos apropiados de la base de conocimientos. . El hombre pide a una mujer. Por ejemplo la oración: “I want to print Bill’s doc file”.80 Lenguaje Natural: Descripción de las Etapas para su Tratamiento • Forzar eventos.3 DESCRIPCIÓN DEL ANÁLISIS PRAGMÁTICO Al reconocer que el módulo de “Interpretación” forma parte de un sistema de lenguaje natural es importante identificar el rol de los módulos que le acompañan y que cuyos resultados en el procesamiento de texto deberá aprovechar o proveer. Emplea una base de conocimientos que contiene “frames” para objetos..

Significado Parcial de una Oración.Struc nombre: carta extensión: doc owner: User 073 en-directorio: / Bill / Printing: isa: Evento Físico *agente: debe-ser (animado y programa) *objeto: debe-ser (información .doc file } RM4 instance: File-Struct extensión: doc owner: RM5 { Bill } RM5 instance: Persona nombre: Bill Figura 55.Comprensión 81 User:---isa: persona nombre: debe ser <string> User: 068 instance: User nombre: Susan User: 073 instance: User nombre: Bill File . Base de Conocimientos basada en Frames.System: intance: Programa Figura 54. RM1 { La oración completa } instance: Wanting agente: RM2 { I } objeto: RM3 {un evento de impresión} RM2 {I} RM3 { un evento de impresión } instance: Printing agente: RM2 { I } objeto: RM4 { Bill’s .objeto) Wanting: isa: Evento Mental *agente: debe-ser (animado) *objeto: debe-ser (estado o evento) Commanding: isa: Evento Mental *agente: debe-ser (animado o programa) *ejecutante: debe-ser (animado o programa) *objeto: debe-ser (evento) This .Struct isa: Informatión .Object F1: instance: File . .

donde el mismo se encarga de imprimir un archivo con extensión “doc” cuyo propietario es “Bill”. Por medio del análisis pragmático se buscan las respuestas a dichas interrogantes. se usa el hecho que cuando el usuario expresa lo que quiere hacer y que el sistema es capaz de realizar. Con estos elementos el subsistema de interpretación procura discernir el tipo de oración a la cual se refiere el texto y también identifica a los individuos relacionados ( “ I ”. de las imperativas. El paso final en el análisis pragmático es traducir (cuando es necesario) desde la base de conocimientos a la representación adecuada que implemente la acción que corresponda a la “intención” de la oración.82 Lenguaje Natural: Descripción de las Etapas para su Tratamiento Los marcadores de referencia “RM” corresponden al evento de más alto nivel de la oración. se puede determinar que archivo está siendo referenciado a “F 1” al ser el único con extensión “doc” y cuyo propietario es “Bill ”. Una vez que la referencia correcta para “Bill” es conocida. “ doc ” ). “ Bill ”. En el ejemplo que se está desarrollando. como en este caso sería la emisión del comando: Lpr/bill/carta. Una estrategia es registrar lo expresado como un hecho y que se hará con él. entonces el sistema debería ir adelante y hacerlo. Una vez completada la descripción en términos de congruencia con la base de conocimientos empleada se prosigue al paso final del proceso de “interpretación” que es: “decidir que hacer como resultado de la oración evaluada”. produciendo el significado final de la manera mostrada en la Figura 56: Significado: instancia: agente: ejecutante: objeto: P27 instancia: agente: objeto: Commanding User 068 This-System P27 Printing This-System F1 Figura 56.doc . interrogativas o negativas. Hay un evento de “querer” en el quién habla (identificado como “ I ”) desea que una acción de “impresión” ocurra. desde el cual pueda relacionar que el usuario identificado por el pronombre “I” es la instancia “User 068” y que la única persona a la que se refiere el nombre propio “Bill” corresponde a el objeto “User 073”. Representación de la “intención” de una oración. Para descubrir su naturaleza se pueden aplicar reglas que caracterizan diálogos cooperativos. por lo que se deben reconocer oraciones declarativas. haciendo uso de un modelo de discurso con base al contexto al que pertenece. o sea debemos reconocer su interpretación.

lo que se pudiera el usuario pensar que el sistema considera. Palabras.N. tarjeta de red. pronombres..Comprensión 83 5. lo que supone que se imagina el usuario al respecto. “y” (indican la secuencia de procedimiento) “booteas” (palabra clave que indica una acción indica una acción técnica a realizar) “fresh” (palabra clave que indica a partir de cero la instalación). Precisar a que objeto específico se está haciendo referencia por medio de los nombres propios. ! No olvides respaldar el contenido original del disco. Primero “booteas” con el disco de arranque. “Primero”... Por ejemplo al observar el siguiente texto [11]: Instalación del Sistema Operativo SCO Fast Start. discurso y frase que está siendo evaluada. “después”. no expresada en la oración y que se maneja implícitamente o que se expresa en otra parte del discurso. 5. mouse y CD. Identificar el tipo de oración y sobre todo su intención. como frases.L.. Símbolos.. .5. Para generar modelos es útil clasificarlos en dos partes: aquellas creencias comunes entre los protagonistas y las que son individuales: Modelos de creencias compartidas. Estos últimos se aplican para ilustrar situaciones estereotipadas. Tales elementos son representados en la base de conocimientos de una manera apropiada para que a partir de ellos se generen búsquedas que infieran: • • • La información faltante. En un SLN durante la fase de “interpretación” se puede generar modelos de creencia del dominio. sobre el tema.5.2 Modelo de Creencias El modelo de creencias es un concepto abstracto que pretende “caracterizar” la naturaleza y rol de las entidades y de sus interrelaciones con otras. Instalación del Sistema.1 Empleo de la Atención Para facilitar la interpretación de texto es útil identificar aquellas partes que “llaman la atención”. además de representar estados y eventos que particularizan una situación dada. También existen variantes del modelo de creencia de lo que considera el propio S.. y así sucesivamente. teclado. adjetivos.. así como por medio de “frames” y “scripts”. dirigir la búsqueda o inferencia de información faltante e ilustrar razonamiento monotónico. monitor. ¡ ! Llamar la atención. Se representan como “hechos” (verdades generales) en la base de conocimientos.. después eliges una instalación “fresh” y proporcionan los parámetros de: medios. palabras o símbolos clave. “perderá” (alarma).4 TÉCNICAS 5. pues sí perderá! Destacan los siguientes elementos: • • • Frase.

Otra forma de representar creencias individuales es particionar la base de conocimientos para organizar las creencias compartidas separándolas de las individuales. donde aparecen tres espacios de creencias: • S 1 cree que María golpeó a Bill • S2 cree que Silvia golpeó a Bill • S3 cree que alguien golpeó a Bill GOLPEAR MARIA INSTANCIA AGENTE ACTO1 DATIVO BILL S1 S3 SILVIA AGENTE S2 Figura 57. Se utiliza el operador modal “BELIEVE” que permite representar afirmaciones de la forma: BELIEVE (A. deseos. futuro. irracional o contradictorias. pero las individuales se registrarán por separado por cada personaje involucrado. como se ilustra en la siguiente Figura 57. Proporcionan medios para interpretar variantes del lenguaje que involucran referencias a otros tiempos. al llegar a ocurrir (“lógica condicional”). . Se pueden implementar por medio del uso de la “lógica modal” quien está interesada en los diversos “modos” en que una ación puede ser “verdadera” y el momento (pasado.P) la cual es verdadera siempre y cuando “A” crea que “P” es verdadera. Estas clases de lógicas representan el valor de verdad concerniente a creencias. conocimiento.P) el cual es verdadero si “A” conoce el valor de la función “P”. Las primeras creencias no deben duplicarse en la representación.. A través del uso de redes semánticas particionadas se puede representar tales requerimientos.84 Lenguaje Natural: Descripción de las Etapas para su Tratamiento Modelos de creencias individuales. intenciones y obligaciones. insatisfechas. que pudieran ser falsas injustificadas. Red Semántica Particionada.. a pesar de que “P” pudiera ser creída como falsa por otra aserción.. presente. También se usa el operador KNOW-WHAT (A.) en que se le asocia dicho valor o falsedad bajo circunstancias específicas que pudieran presentarse. circunstancias y estados mentales de la gente.

. reportajes y libros están: • • • • • • Satisfacción de necesidades: comer. En la interpretación de la oración anterior podemos hacer uso del operador USE (por A.. debiéndose cumplir las condiciones: “A” debe saber donde esta “P” (donde venden “PC’s”) “A” debe estar cerca de “P” “P” debe estar disponible.Comprensión 85 5. gozo. . posesiones. G ): Precondición: KNOW-WHAT (A. para que viajes al extranjero”. en el texto: “Juan quiere comprar una P..P) READY (P) Postcondición: DONE (G) Esta descripción representa para que “A” (“Juan”) use “P” (“PC”) debe realizar “G” (“comprar”)... puesto que especifican elementos que deben participar en el tema en cuestión. NEAR (A. Se reconoce: • • • • • • • Meta: El hijo de Juan tiene su P. Plan: Compuesto de los subplanes: Juan ahorra dinero Juan investiga opciones Juan compra cotizaciones Juan elige Juan adquiere la P. conquistar. cantar. Por ejemplo. Metas instrumentales: cumplen condiciones para habilita metas superiores: “Obtén tu pasaporte. para su hijo”. cuyo resultado es el cumplimiento DONE de la meta “G”....C... que se describe como: USE ( A. Preservación de estados: salud. para realizar G). permitiendo al sistema formar una coherente representación del texto evaluado aunque haya información omitida. .. Conquista de deseos: amar.C. Entre las metas comunes redactadas en historias. Logro de objetivos: titularse.. LOCATION (P) ) .. adquirir. trabajar. P.5 ANÁLISIS DEL MÉTODO DE DIRECCIÓN POR METAS Otra técnica que ayuda a interpretar el sentido del texto evaluado es el reconocer la intención que el protagonista persigue alcanzar “meta” y el “plan” que considera aplicar para lograrla. Para lograr esos objetivos se representan planes en la base de conocimientos.. de P.C.. Metas de placer: paz.

Estos patrones surgen de relaciones causales entre.P) postcondición: know-what (A. reconociendo que “Juan” está buscando un lugar donde comprarla. • Escenas: Son secuencias de eventos que ocurren en un momento dado. • Apoyos. se va a comer a un restaurante.6. así que el sistema puede usar esta meta como parte de la principal. La presencia de estos objetos puede ser inferida aún si ellos son mencionados explícitamente en la historia o secuencia de eventos a analizar. así como valores que son usados si no hay otra información disponible. Los guiones tienen un conjunto de condiciones de entrada que hacen posible la ocurrencia de sus eventos.C. dentro de la cadena los eventos están conectados a otros anteriores que los hacen posibles. Si se identifican individuos específicos estos pueden ser insertados en los huecos apropiados. Los eventos pueden ser representados con dependencia conceptual. Huecos que representan objetos involucrados en los eventos descritos en el guión. Los elementos que se especifican en un guión son: • Condiciones de entrada. como: Look-For (A. es decir.P): precondición can-recognite (A. por lo que se hace uso del operador “LOOK-FOR (A.P)” en donde “A” busca a “P”. etc. Las diferentes pistas de un mismo guión compartirán patrones. En la Figura 58 se presenta parte del guión del restaurante (Schank 1997) [4]: . 5. Por lo que el problema de generar coherentes interpretaciones de un texto o discurso puede involucrar considerar muchos planes parciales y operadores. una de ellas es conocer donde comprar una P.1 Representación de conocimiento Los guiones son mecanismos de representación del conocimiento que pueden ser utilizados para comprender conjuntos de eventos o historias estereotipadas en un contexto en particular. • Papeles. Podemos ver a un guión como una lista de descripciones de eventos que contienen variables a las que se les da el nombre de “huecos” y asociado a ellos puede haber información acerca de los tipos de valores que contiene. • Pista. Son los huecos que representa a la gente involucrada en los eventos descritos en el guión.6 GUIONES 5. cumpliendo ciertas condiciones y generando resultados específicos. aunque no a todos sus componentes. al final arrojan un conjunto de resultados que provocan la ocurrencia de eventos posteriores (posiblemente descritos por otros guiones).. En los guiones se parte de la idea que en el mundo real existen patrones de secuencia de eventos como cuando se sale de viaje. por lo que pudieran desarrollarse distintas alternativas de interpretación con sus variantes respectivas. Location (P) ) El módulo interpretador debe asociar el objetivo de adquirir la P.86 Lenguaje Natural: Descripción de las Etapas para su Tratamiento Para adquirir la PC. con la actividad de buscar un almacén distribuidor. Corresponde a una variación específica en un patrón mas general. Regularmente hay varios operadores y planes alternativos para alcanzar el mismo objetivo. aunque no sean menciona. La presencia de este elemento también puede ser inferida.C. Requisitos que deben ser satisfechos para que los eventos descritos en el guión puedan ocurrir. como a posteriores que ellos provocan que ocurran. “Juan” necesita cumplir submetas.

Guión del Restaurante. EN CASO CONTRARIO. O = Cocinero. F= comida. J = Cajero. IR A LA ESCENA 4) Escena 4: Salir L MTRANS a M (LA CUENTA) M MOVE (ESCRIBE LA CUENTA) M PTRANS M a L M ATRANS “LA CUENTA “ a L L ATRANS “LA PROPINA“ a M L PTRANS L a J L ATRANS DINERO a J PTRANS L FUERA DEL RESTAURANTE (CAMINO DE NO PAGAR) Figura 58.Comprensión 87 Pista: Cafetería Apoyos: Mesas. . Si tiene dinero Escena 1: Entrada L PTRANS L a EL RESTAURANTE L ATTEND OJOS a LAS MESAS L MBUILD donde sentarse L PTRANS a LA MESA L MOVE L a POSICIÓN SENTADO Escena 2: Pedir L PTRANS MENÚ L L MTRANS SEÑA A M M PTRANS M a LA MESA M ATRANS MENÚ a L *L MBUILD elección de C L MTRANS seña a M M PTRANS M a LA MESA L MTRANS ‘quiero C’ a M M PTRANS a M o M MTRANS (ATRANS C) a O o MTRANS ‘no hay C’ a M o (GUIÓN PREPARAR C) M PTRANS a M L IR A LA ESCENA 3 M MTRANS ‘no hay C’ a L (VOLVER * ) o (IR A LA ESCENA 4 POR EL CAMINO DE NO PAGAR) Escena 3: Comer O ATRANS C a M. Menú. P = Propietario Condiciones de entrada: Si tiene hambre. M = Mesero. M ATRANS C a L. Cuenta. L INGEST C (OPCIÓN: VOLVER A LA ESCENA 2 PARA PEDIR MÁS. dinero Papeles: L = Cliente.

esta podría ser una estrategia apropiada para señalar el guión del restaurante cuando se trata de analizar una historia como la siguiente: “Susana pasó por su restaurante favorito camino al museo. De eventos que no han sido explícitamente mencionados. Pagó y se fue a su casa”. papeles y/o eventos de un guión pueden servir como indicadores que este guión puede ser activado. se sentó y llamó a la mesera. Los guiones pueden también ser útiles indicando las relaciones entre los eventos que fueron mencionados. para ser accesado más tarde si es necesario. La interpretación. . El ordeno una hamburguesa.88 Lenguaje Natural: Descripción de las Etapas para su Tratamiento 5. La respuesta a: Cenó Juan anoche ? sería afirmativa aunque no se haya mencionado explícitamente. Ella realmente disfrutó del nuevo Picasso exhibido”. La mesera trajo el menú y él ordenó una hamburguesa”. para encontrar el evento o acción que provocará). Coherente de un conjunto de observaciones.6. El guión puede proporcionar dos respuestas: Porque “Juan” se lo pidió (analizando hacia atrás en la cadena causal. La utilización del guión para completar las partes no especificadas del texto a comprender. es útil en: • • La predicción. para ver lo que provocó la acción) Porque “Juan” se lo pidió (analizando hacia atrás en la cadena causal. por lo que el programa de comprensión infiere que la secuencia completa previa ocurrió normalmente. en cuyo caso puede ser suficiente guardar el apuntador al guión. en cuyo caso es apropiado activar el guión completamente y tratar de llenar sus huecos con los objetos particulares y la gente involucrada que aparezca explícitamente en la historia que se esté analizando. apoyos. ejemplo: “ Juan salió al restaurante anoche. si un guión es una gran cadena causal puede proporcionar información sobre las relaciones entre los eventos por ejemplo: “Juan salió a cenar.2 Razonamiento Si un guión en particular es reconocido como apropiado en una situación dada entonces puede ser muy útil en la predicción de la ocurrencia de eventos que no fueron mencionados explícitamente. Los dos primeros pasos en un proceso de utilización de guiones son: • • Selección entre los guiones que se encuentran en memoria. La coincidencia en precondiciones. A la pregunta: Porqué le llevo la mesera el menú a Juan? . del guión o guiones apropiados. Cuando un guión ha sido activado para una situación en particular. Como guión principal. El guión del restaurante se activó por la coincidencia de los eventos de la historia con los del guión. Hay dos formas en las que puede ser útil activar un guión: Como guión auxiliar (aquel que se menciona brevemente y puede ser referido de nuevo pero no en la situación central).

” . Una interpretación coherente de la situación presentada en el texto. se sentó y llamó a la mesera. el cual nos marca las rutas a seguir de manera natural. pues esto ocurrió antes de la interrupción pero no puede inferirse si pagó la cuenta. Una respuesta es: “debemos seguir el camino mas interesante”.1 Interés Uno de los problemas centrales en el entendimiento del lenguaje natural ha sido la creación de inferencias y el control de las mismas. se sentó y espero largo tiempo. La mesera trajo el menú y él ordeno una hamburguesa”. La parte importante de esta historia es la salida de la secuencia esperada de eventos en un restaurante. tal habilidad depende de nuestro conocimiento acumulado. Una pregunta que surge al analizar este problema es: ¿Qué tan extensas deben ser nuestras búsquedas de inferencias?“ Para generar su respuesta debemos crear inferencias que ayuden a unir entre sí el texto analizado.. se le mostró una mesa. 5. Puede suponerse que vio la carta. Su desventaja es que no son adecuados para representar cualquier clase de conocimiento. ordenó una hamburguesa. La atención en eventos poco usuales: • • “Juan salió a cenar. se enojo y se fue”.. A continuación se presenta una oración incompleta que puede ir ligada con los conceptos que aparecen después: “Juan iba caminando por la calle cuando . considerando que cada una de ellas es creada y tratada a su vez como entrada del mismo sistema generando un número infinito de combinaciones. esta meta no se logra a menos que conozcamos el lugar en donde podemos buscar información que sea útil para ligar el nuevo conocimiento con el texto antes analizado. lo que en forma abstracta se traduce en “dejar libre nuestro sistema de inferencias”. El interés significa “poner atención en ciertas cosas o acciones”. Una vez que la secuencia típica de eventos se irrumpe no puede seguir utilizándose el guión para predecir eventos posteriores. “Juan fue a un restaurante.Comprensión 89 Para enfocar. Enfocar la atención en eventos poco usuales. ya que no son estructuras generales que funcionan adecuadamente para modelar los tipos específicos de conocimiento para los cuales fueron diseñados..7.. Para un nivel mas elevado de planes y objetivos el problema es “identificar los objetivos y planes que debemos seguir”.6.7 COMPRENSIÓN DE HISTORIAS 5. 5.3 Ventajas y Desventajas Entre las principales ventajas de los guiones están: • • • Predecir eventos que no han sido explícitamente mencionados.

actualizan y explotan para cumplir la función sustantiva de la aplicación acorde con el flujo de “conversación” sostenida con el usuario conforme se ilustra en la siguiente Figura 59 [12]: . a su vez “entiende” historias basadas en objetivos (como las respuestas que se ofrecieron en el texto analizado anteriormente) y asume que todos los planes y objetivos de los actores en una historia pueden ser constantemente monitoreados. por lo que se deben usar criterios heurísticos dinámicos para caracterizar esta situación. 6. escuchó una explosión. En general. se comió una galleta. para representar esta capacidad de evaluación de interés se requiere de un módulo especial llamado “Understander” quien trata de analizar y calificar el texto de entrada con relación al contexto del diálogo que se está desarrollando.2 Comprensión de Historias Una de los proyectos que destaca en el uso del concepto de “interés” como solución al problema del manejo de inferencias es “PAM”. construido por Schann y Abelson en 1977. pero Bill no estuvo de acuerdo Entonces John le dijo a Bill que le rompería un brazo si no le permitía tenerla Bill le dio la bicicleta Las inferencias que “PAM” es capaz de generar son: Porqué John se dirigió a Bill ? Porque quería tener su bicicleta Porqué Bill le dio su bicicleta ? Porque no quería ser lastimado PAM uso planes como estructuras de conocimiento para tipificar metas de la gente y de los medios que emplean para alcanzarlas. 5. lo cual nos indica que: Las cosas poco comunes son mas interesantes que las ordinarias El interés es una propiedad dinámica fuertemente dependiente del contexto.7. de tal manera que podía emitir juicios sobre “supuestos” que argumentan ciertas acciones e intenciones.8 CREACIÓN DE UN INTERPRETADOR El subsistema “interpretador” al formar parte de un sistema de lenguaje natural aprovecha las estructuras de datos y bases de conocimiento que el resto de módulos crean. El punto crítico es decidir que tema es más interesante que otro conforme a diversos puntos de vista y en situaciones cambiantes. Es obvio que los primeros incisos son poco relevantes en comparación al último. como se muestra en el siguiente diálogo: John quería la bicicleta de Bill El se acercó a Bill y le pregunto si estaba dispuesto a darle la bicicleta Bill se opuso John le dijo a Bill que daría treinta dólares por ella.90 Lenguaje Natural: Descripción de las Etapas para su Tratamiento • • • • vio un gato decidió amarrarse un zapato. implementaron “scripts” para facilitar la interpretación de ciertas oraciones y palabras claves contenidas en un texto.

Al integrar el “Interprete” al SLN se obtiene el esquema de resultados y estructuras de datos ilustrada en la Figura 60. Interpretación de Textos Fuente. instrucción. estados y acciones involucradas explícitamente en la frase. despedida Mientras que la exposición de la respuesta el “intérprete”: • • • • Instruye al módulo “generador de lenguaje” para realizar el tipo de respuesta adecuada al texto fuente. En el flujo de entrada el “intérprete”: • • • • Enriquece las definiciones semánticas de los elementos del texto que es evaluado Precisa la naturaleza y propósito de la oración Deduce los elementos.Comprensión 91 Usuario Texto de Entrada Análisis léxico Análisis sintáctico Análisis Semántico Intérprete Conceptos Significado Oración Propósito Respuesta Figura 59. pregunta. declaración. Usuario Exposición de Respuesta Intérprete Generador de Lenguaje Análisis semántico Análisis Sintáctico Análisis léxico Figura 60. . Evalúa las respuesta ofrecidas por el módulo “generador” conforme a los requisitos manifestados Ordena la ejecución correspondiente al tipo de respuesta seleccionada Presenta la respuesta al usuario. Identifica el tipo de reacción del sistema: saludo. negación. Exposición de Respuesta del Intérprete. conforme al discurso y dominio de la aplicación.

92 Lenguaje Natural: Descripción de las Etapas para su Tratamiento .

CAPÍTULO 6. GENERACION DE LENGUAJE .

.

Como reacción a un estado de la sesión: pausa.1 CONSIDERACIONES El sistema de Lenguaje Natural incluye un subsistema especializado en la emisión de lenguaje natural como respuesta a: La iniciativa del propio SLN para iniciar. En dicha ilustración se observa como puerta de comunicación al subsistema de “conversación” para recibir las expresiones del usuario y presentar las frases de exposición (respuesta. GENERACIÓN DE LENGUAJE 6. Este último interactúa con la base de conocimientos y los subsistemas semántico. El “conocimiento mundano” que caracteriza la expresión del lenguaje: afirmaciones. preguntas. controlar o terminar una sesión con el usuario. negaciones. consulta u observación expresada por el propio usuario. orden. El “dominio” de especialidad que el SLN maneja y que el usuario desea explotar.. saludos.) del SLN. dudas.... sintáctico y léxico para producir las frases en lenguaje natural acordes a la respuesta o expresión deseada. por lo cual interactúa con el resto de subsistemas como se ilustra en la Figura 61. objetivo y restricciones que el subsistema de “conversación” establece en la coordinación del proceso de diálogo entre el SLN y el usuario. 6. La frase u oración que el subsistema genera debe considerar los siguientes requerimientos: • • • • • • La orden. En respuesta a una petición. El “discurso” que durante ese momento de la sesión se expresa a través de las oraciones que el usuario y el SLN han expresado alternadamente. contradicción y desconocimiento en la información expuesta [10].2 PROCEDIMIENTO El SLN interactúa con el usuario durante la sesión no solamente como medio de comunicación para el control de la sesión e interpretación de las expresiones del usuario. La interpretación de estos insumos se traduce en directivas que se transmiten al “generador del lenguaje”.6. sintaxis.. etc. sino también al ofrecer las respuestas apropiadas a sus requerimientos. El “universo” del idioma que se utiliza para expresar la comunicación: alfabeto. también se reciben los requerimientos de expresión que el módulo conversador emplea. diccionario. Las oraciones de salida son interpretadas y de ser necesario corregidas antes de transferirse al “conversador” para su exposición al usuario. Las oraciones fuente son procesadas hasta llegar al subsistema intérprete. propósito y condiciones que el subsistema “interpretador” emite para responder a la expresión alimentada por el usuario. . El requerimiento. actualización de conocimiento..

ir . Por ejemplo... esto se ilustra en la siguiente figura”: Al describir frases a través de propiedades (parejas “atributo – valor”) y emplear estas clases de asociaciones para inferir los valores correspondientes se pueden generar las instancias de oración específicas a la expresión que se desea generar. • Perspectivas.. IS-KIND-OF. Generación de Lenguaje. etc. se aplican los siguientes procedimientos ilustrados en la Figura 62. adjetivos.96 Lenguaje Natural: Descripción de las Etapas para su Tratamiento exposición conversador Respuesta expresión oración fuente requerimiento de expresión intérprete Requerimiento de Respuesta Expresión generador lenguaje Generación de Lenguaje Natural Analizadores: Semántico. la edad de una persona.. por ejemplo: la superficie y volumen de un cuerpo geométrico. como: “a los jóvenes les gusta pasatiempos (hacer .a.).3 USO DE PLANTILLAS A través del uso de redes “semánticas” y “frames” como estructuras para representar conocimiento orientado a la formulación de ciertos tipos de frases. pero lenta como medio de transporte. . clases y superclases de objetos con sus instancias respectivas. por ejemplo: “una bicicleta de carreras es muy veloz para el ciclismo.fiestas.amigos.)”. Atributo DEFAULT son valores que se afirman como válidos para cierta clase de objetos en ausencia de otros específicos para ellos. al definir una oración para responder el precio de una PC. andar – con .. • Inherencia: Atributos IS-A.deporte. • Procedimientos. IS-A-INSTANCE-OF entre subclases. Atributo PERSPECTIVE son los tipos de apreciación que se les da a los objetos acorde con un particular punto de vista. • Defaults. Cuando no se dispone del valor correspondiente.filler) para asociar valores fijos o variables a ciertos elementos de las oraciones (nombres. Léxico Figura 61. Sintáctico. Atributo IF-NEEDED son cálculos especializados de la clase de objetos.valor” (slot . se emplean las parejas “atributo .. Base de conocimientos 6. 63 y 64. que se ejecutan al momento de requerirse. se ilustra a continuación a través de las Figuras 62.

15 default 321 procesador: pentium perspective: venta de pc (.00 Defaults. Procesador: Pentium Perspectiva. Venta de PC: Precio Total...395. La inferencia de valores para los atributos faltantes se hace por medio de: Inherencia. Desk Pro ( (Modelo Powe) .Generación de Lenguaje 97 Prespective: Medio de comunicación periódico Is-a novedades Prespective: Fuente de trabajo empresa Is-a novedades Prespective: Fuente de basura papel Is-a novedades Figura 62. Ejemplo de Perspectivas. Monto: $12. EL PRECIO TOTAL DE LA PC (MARCA_________) (MODELO_______) ES DE: (MONTO_________) CON UN (PROCESADOR_________) Figura 63 Template de la Oración. Marca y modelo: Acer power 5200 Procedimiento..) Is a instance of Proceso 42: Monto = (Costo CPU + Costo Monitor + Costo Disco + Windows ) * 1.. ... A través de las siguientes definiciones..(monto: proceso 42).) Is a kind of Compaq ( (Marca Compaq ) . Inferencia. (procesador: default a 321).(marca______) (modelo_______) .) Figura 64....

como los siguientes : “Entre los desastres mas fuertes ocurridos en Bejin. 165.9 grado en la escala de richter.4 MODELOS DE GENERACIÓN Por medio de los marcos se pueden formular oraciones y conjuntos asociados de ellas. El siniestro se debió a una falla ocurrida en la costa del pacífico que alcanzó una magnitud de 6. la capital de China destaca el temblor ocurrido el 14 de Octubre de 1960 a las 2:40 de la mañana. también se pueden producir aplicando nodos de redes semánticas y propiedades que caracterizan objetos.000 de ellos se quedaron sin casa.98 Lenguaje Natural: Descripción de las Etapas para su Tratamiento 6. acciones y situaciones típicas. como se ilustra en la Figura 65: lugar día hora evento evento desastre muertos heridos damnificados sin casa temblor falla magnitud nivel río hombre velocidad dirección deporte marcador ganador evento social sede propósito evento político partido asistentes desborde huracán evento deportivo evento cultural fundación expositor Figura 65. Mediante la estructuración adecuada de marcos se pueden describir distintos tipos de modelos de oración y texto donde se integren varias frases coherentes. se pueden generar textos.000 damnificados. Al explotar la estructura del frame descrita y asociarse al conocimiento sobre fenómenos específicos.000 resultaron heridos y se reportaron 31.050.000 muertes. Otro ejemplo de un texto orientado a reportar un temblor usa un modelo con las propiedades descritas en la Figura 66. 300. Estructura de Frames. dejó un saldo de 1. .

000 65. 6. Modelo de Oración por medio de Frames.5 PROCEDIMIENTO INVERSO La generación de lenguaje a cargo del subsistema responsable implica la participación de otros subsistemas en un flujo opuesto al de la interpretación del texto..050.Dic . 15 .2 mercali muy grave temblor falla magnitud escala seriedad Figura 66.Generación de Lenguaje 99 Como ejercicio al lector se solicita redactar una historia con los datos del terremoto ocurrido en la ciudad de México en 1985.. lugar día hora muertes Bejin.000 San Andrés 7. conforme a la secuencia ilustrada en la Figura 67: Estructuras frontales intérprete oración generada Análisis Léxico Requiere texto a emitir Generador lenguaje de Estructuras semánticas Estructura de texto Análisis semántico Estructuras Sintácticas Análisis Sintáctico Figura 67.Nicaragua. La secuencia mostrada lleva a cabo el siguiente proceso: . Flujo de Generación de Lenguaje.000 sin casa 300.400 500.000 200.000 232.000 heridos damnificados 1.000 pacifico 6.60 2:40 am 31.China 14 -Oct .77 14: 15 pm 50.9 richter fuerte Managua.

El subsistema semántico incorpora los conceptos faltantes a la estructura del texto y que en forma individual sean congruentes con el significado de la estructura completa produciendo otra mas rica con significado semántico. Para ilustrar la aplicación de estos conceptos. • Las acciones implican cambios en los estados y relaciones “causa . tiempo y tipo de expresión. número. Relación de Cambios de Estado. El generador recibe el requerimiento. procediendo a formular la estructura de texto adecuada para su exposición. El subsistema léxico refina la composición de la estructura recién emitida modificando los elementos de la oración conforme al género. • Traducir al lenguaje natural las oraciones que se puedan derivar a partir de la estructura “marcos– dependencia”. 69. agente objeto destino niño cilindro bloque rojo Mover objeto PTRANS Cambio estado de objeto destino gusto niño Figura 68. 6.6 EXPRESIONES Mediante el uso de “marcos” y “dependencia conceptual” se pueden obtener inferencias que enriquecen el significado de la oración a generar como son: • Deducir que pasará cuando algo es hecho • Imaginar los detalles de como algo fue probablemente hecho. se muestran a continuación tres Figuras 68. La estructura semántica es procesada por el subsistema sintáctico para verificar su consistencia gramatical y hacer las adecuaciones respectivas para generar una estructura sintáctica. • Susana le dijo al niño que pusiera el cilindro en el bloque rojo. emitiendo así la oración frontal que será expuesta al usuario después de las evaluaciones y correcciones aplicadas por los subsistemas generador e interpretador.100 Lenguaje Natural: Descripción de las Etapas para su Tratamiento Una vez que el subsistema de interpretación determina la respuesta a generar “ordena” un requerimiento del tipo de texto a emitir representado en la estructura de datos apropiada.efecto”. y 70 de ejemplo que describen la representación de una oración específica respectivamente: • El niño disfrutó colocar el cilindro encima del bloque rojo. . • El niño come helado.

Un Acto Provoca la Ejecución de Otro. conocidos como “estados mentales” como los mostrados en la Figura 71.Generación de Lenguaje 101 6. Exito EM Tiempo i Fracaso EM i i Habilita + i Motivación - + - EM EM Figura 71. distinguiendo eventos favorables de los negativos. agente el niño Comer INGEST objeto helado Mover objeto PTRANS agente objeto El niño cuchara Mover parte del cuerpo agente el niño objeto mano Figura 70. Hablar MTRANS agente objeto destino agente Mover objeto PTRANS objeto destino niño cilindro bloque rojo Susan orden niño Figura 69. por lo que se debe usar una representación adecuada para caracterizar esos puntos de vista. Un Acto Implica la Ejecución de Otros. Representación de Estados Mentales.7 CREACIÓN DE UN MODELO La implementación de un subsistema “generador de lenguaje” debe considerar “perspectivas” para evaluar la realidad. .

. Terminación y Correlación. Estados Mentales Ligados por Inicio. Abstracciones de eventos y estados mentales que se asocian produciendo elementos claves de relación como los indicados en la Figura 74: éxito EM éxito + éxito pérdida - Figura 74. También existen abstracciones basadas en eventos ligados que terminan o relacionan ligas:.102 Lenguaje Natural: Descripción de las Etapas para su Tratamiento Los estados mentales pueden iniciar eventos positivos o negativos. recursión cambio de pensamiento perseverancia EM Tiempo i EM i i + EM EM EM Figura 72. Hay abstracciones que involucran únicamente “estados mentales”. provocando entonces estados mentales específicos como de alegría o frustración. Asociación de Situaciones Diversas por Medio de Eventos. de la manera ejemplificada en la Figura 73: tiempo éxito solución pérdida + t + t + + t + + t + pérdida correlación + correlación + + t + t + + éxito + t + t + fracaso + Figura 73. se denomina “perseverancia” como se muestra en la Figura 72. en donde uno provoca el surgimiento de otro (esto se denomina recursión). Instancias de Eventos que Terminan en Relación o Acto. cuando un “EM” produce la terminación de otro se entiende como un “cambio de pensamiento” y si persiste durante un lapso.

También los estados y eventos se pueden ligar a través de perspectivas como las indicadas en la Figura 76: perspectiva 1 + perspectiva 2 M + Figura 76. ambos tienen una actitud relacionada que da lugar a eventos positivos ligados.Generación de Lenguaje 103 Esta figura ilustra situaciones. Al usar las perspectivas de los personajes involucrados en una historia se pueden caracterizar el tipo de eventos que ocurren de acuerdo con su particular interés. Perspectivas que Involucran Eventos Positivos. . mas tarde ocurre un evento que hace “caer” a la bolsa y se terminan las ganancias. Otros ejemplos de secuencias de estados y eventos que producen diversas abstracciones tales como las mostradas en la Figura 75: “levantarse de la adversidad” EM EM “éxito fortuito” solución de problema - EM + + “El fracaso obliga a reflexionar y levantarse para conquistar victorias” + “Un problema provoca crisis. el estado mental (actitud) de invertir en la bolsa de valores por que ofrece ganancias atractivas. como por ejemplo. pero una solución lo concluye” “Un problema motiva a hallar una solución que lo resuelva” Figura 75. después ocurre una situación negativa a uno de ellos que provoca un estado y este una acción positiva que resuelve a la negativa. Causa-Efecto de Eventos y Estados. A continuación se ilustra en la Figura 77 los estados mentales que asumen dos actores y la evaluación que cada quién otorga a los eventos que ocurren. al otro protagonista le ocurre un evento negativo que genera un estado mental y por lo tanto una acción positiva que termina el evento positivo que primero ocurrió y se asocia con un evento negativo hacia el primer actor provocando la terminación del evento positivo que primeramente le había sucedido. en ese momento.

solución .104 Lenguaje Natural: Descripción de las Etapas para su Tratamiento perspectiva 1 EM EM perspectiva 2 M + + - EM - - EM - Figura 77. Mientras que en el siguiente. Abstracción de Perspectivas en Niveles. se pueden caracterizar texto representativo de historias como la siguiente: • • • • • Juan quiso dar un regalo a María” Juan quiso comprar una cadena por lo que necesitó dinero Entonces piensa vender algo Vendió un televisor y con ese dinero compró la cadena Después se la dio a María. En el caso anterior se puedo concebir un mayor nivel de abstracción integrando la representación de “eventos” y “estados” en “unidades”. se aplica el caso de que “Tomás está molesto con Alberto porque al resolver un problema personal provocó un evento que paró una acción de éxito que estaba realizando” de la manera ejemplificada en la Figura 78: éxito Solución internacional al problema éxito relación pérdida Figura 78. Abstracción a un Mayor Nivel mediante Unidades. le agradeció apreciando mucho a detalle. A través de la relación de eventos y estados asociados en perspectivas con diversos niveles de abstracción. ella se la puso.

Historia del Regalo de Juan a María C i aprecia el detalle + .Generación de Lenguaje 105 Esta historia se ilustra mediante estados y eventos de la manera apreciada en la figura 79: PERSPECTIVA Juan María quiere obsequiar EM i quiere dar una cadena EM i necesita dinero i piensa vender algo EM i + EM venta de una tv consigue dinero + compra la cadena + recibe el regalo i agradece dá el regalo + + + +| Figura 79.

106 Lenguaje Natural: Descripción de las Etapas para su Tratamiento .

CONCLUSIONES .

.

generalmente usuario-máquina. para alcanzar estas funcionalidades se requiere del concurso de tres tipos de análisis: el léxico. los mecanismos de representación de conocimiento y los modelos de interpretación.CONCLUSIONES El Reporte Técnico representa la investigación y desarrollo de aplicaciones en el campo del procesamiento del lenguaje natural. y entender el contexto en que ésta se inscribe a la luz de las oraciones que la preceden y aquellas que aparecen después. a efecto de crear interfases más amables e inteligentes que faciliten la interacción hombremáquina. los esquemas de proceso y las técnicas de tratamiento de lenguajes apropiadas como son las gramáticas. representa uno de los retos que aún continúan siendo abordados en los escenarios de investigación. Durante la descripción de las etapas de la metodología se procura reunir los conceptos. así como su razonamiento. a efecto de desarrollar modelos y mecanismos más efectivos para cada una de las etapas de procesamiento. se recrea una plataforma logística que orienta la construcción de sistemas de tratamiento del lenguaje natural. Así mismo. Por lo que. En suma. También aparece la exploración de mecanismos de aprendizaje de máquina para la validación sintáctica y el análisis semántico. buscando extender los alcances logrados. Como parte de las líneas de trabajo futuro se encuentran: La incorporación de modelos difusos de conocimiento que permitan la representación de conocimiento aproximado. Entre los aspectos que revelan la complejidad del procesamiento del lenguaje natural está el lograr una correcta representación semántica del significado de cada uno de los elementos que componen la oración. Así mismo. se consideran escenarios para la traducción de texto escrito en diversos lenguajes. cuyos resultados se traducen a una metodología que describe las etapas para la creación de aplicaciones especializadas en la interpretación de lenguaje natural escrito y la generación de texto. la comprensión de la oración como un todo. Con todos estos elementos. se espera que este trabajo motive al investigador. las estructuras de datos. basados en modelos de redes neuronales y de computación evolutiva. docente y estudiante a profundizar en el campo del tratamiento del lenguaje natural. . el sintáctico y el semántico. al procurar un entendimiento del diálogo compuesto por varias oraciones expresadas por los protagonistas.

.

REFERENCIAS .

.

. USA [5] Winston. 2da. USA. 3ra. T. Implementing Japanese Artificial Intelligence Techniques.. Prentice Hall. USA. [6] Bratko. USA. E. Introduction to Natural Language Processing. Edition. México.P. Mcmillan Publishing. P H.. S. Addison Wesley. Natural Language processing for Prolog programmers. [8] Dutta.. Addisson Wesley. [7] Winston. P. [10] Harris.K. [4] Rich. Planeta. Natural Language Processing. 2da. Programming for Artificial Intelligence. P. R. A. McGraw Hill. Edition.13. Horn.. Artificial Intelligence”. LISP. McCorduck. Knowledge Processing & Applied Artificial Intelligence. [11] Rowman. Edition.. USA. USA..D. A. Butterworth Heinemann. I. Carta a los a los Tesalonicenses. Littlefield. 1era. Publishers. Prentice Hall. USA. Expert Systems and Applied Artificial Intelligence.. [9] Covington. USA. Santa Biblia [2] Feigenbaum. La Quinta Generación... [3] Tabor . M. R. Addisson Wesley. [12] Efraim. Artificial Intelligence.. M. Patrick Henry. B. . USA. 5. McGraw Hill. E.REFERENCIAS [1] Tarso.

Alejandro Peña Ayala Fotografía de la Portada: Isla de Baffin. Octubre 2005 . D. Edición: 1. Enero de 2006.Impreso en los Talleres Gráficos de la Dirección de Publicaciones del Instituto Politécnico Nacional Revillagigedo 83. México.F. Iqaluit. 06070. Centro Histórico. Expedición al Ártico Canadiense.000 ejemplares Diseño Portada. 63º Norte.

profesionistas y especialistas del ámbito de los sistemas. Al facilitar la interacción entre el individuo y los equipos se amplia su aprovechamiento y se fomenta su consumo. electrodomésticos y de transporte. En los capítulos se explican los procedimientos e instrumentos que se emplean para desarrollar el análisis léxico. es conveniente concentrarse en el tratamiento del Lenguaje Natural representado por caracteres alimentados al computador. gráfica. Por tal motivo. Es decir. representa una actividad natural de comunicación de toda clase de pensamientos. semántica y contextual. sintáctico y semántico. El tratamiento de Lenguaje Natural no solo tiende a facilitar la comunicación entre las personas y los sistemas de cómputo. el lector encuentra una descripción de la naturaleza del tratamiento del Lenguaje Natural y obtiene un perfil de las etapas involucradas. como primera instancia para abordar el tema. sino también con los equipos de comunicación. la Informática y la Computación. Además de introducirlo en los procesos de interpretación y generación de lenguaje. La obra se dedica a los estudiantes. ISBN: 970-94797-3-3 # 001 . que el texto a interpretar carece de los problemas naturales de reconocimiento fonético y visual.El lenguaje como forma de expresión de los seres vivos. Su tratamiento por computadora representa un reto dada su complejidad fonética. En esta obra. así como del ruido y la distorsión clásica del ambiente natural. que están interesados en ampliar sus conocimientos para desarrollar aplicaciones en el tratamiento de Lenguaje Natural.

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->