Está en la página 1de 232

UNIVERSIDAD DE

LAS PALMAS DE GRAN CANARIA

DEPARTAMENTO DE
INFORMTICA Y SISTEMAS

TESIS DOCTORAL

Automatizacin del anlisis sintctico del Espaol

Autor: D. Luis Javier Losada Garca


Director: Dr. D. Octavio Santana Surez
Codirector: Dr. D. Jos Rafael Prez Aguiar
Diciembre 2002
UNIVERSIDAD DE
LAS PALMAS DE GRAN CANARIA

DEPARTAMENTO DE
INFORMTICA Y SISTEMAS

TESIS DOCTORAL

Automatizacin del anlisis sintctico del Espaol

Autor: D. Luis Javier Losada Garca


Director: Dr. D. Octavio Santana Surez
Codirector: Dr. D. Jos Rafael Prez Aguiar
Enero 2003
UNIVERSIDAD DE LAS PALMAS DE GRAN CANARIA

DOCTORADO EN INFORMTICA

DEPARTAMENTO DE INFORMTICA Y SISTEMAS

Programa Informtica Documental y Lingstica Computacional

Automatizacin del anlisis sintctico


del Espaol

Tesis doctoral presentada por D. Luis Javier Losada Garca


Dirigida por el Dr. D. Octavio Santana Surez
Codirigida por el Dr. D. Jos Rafael Prez Aguiar

El director, El codirector, El doctorando

Las Palmas de Gran Canaria. Enero, 2003


Resumen

La presente tesis se engloba en la lnea de los trabajos realizados por el Grupo de

Estructuras de Datos y Lingstica Computacional de la ULPGC durante los ltimos

aos, en el mbito de las aplicaciones orientadas a la lingstica computacional. A partir

de los trabajos de reconocimiento y generacin morfolgica automticos se pasa al

siguiente nivel en el campo de la lingstica: la sintaxis. En esta tesis se han logrado

soluciones a los problemas que se producen a la hora de realizar la automatizacin de la

sintaxis.

Como resultado de los trabajos realizados se han desarrollado dos motores DeFuSE

Desambiguador Funcional de Sentencias del Espaol y AMoSinE Analizador

MorfoSintctico del Espaol.

DeFuSe se orienta a los procesos de desambiguacin funcional sirviendo como base

para aplicaciones de niveles superiores. La desambiguacin funcional se ha desarrollado en

funcin de un estudio de las relaciones de vecindad en el seno de las estructuras bsicas de la

gramtica espaola los sintagmas. Permite adems la posibilidad de tener en consideracin

o no las palabras antiguas o desusadas permitiendo su mejor adaptacin a textos antiguos o

actuales.

AMoSinE se trata de un motor orientado al anlisis de las estructuras sintcticas de una

sentencia, almacenando estas y ponindolas a disposicin de otras aplicaciones. El motor se

basa en una definicin en forma de reglas simples de la gramtica espaola; las cuales son

utilizadas durante el proceso de generacin de rboles de representacin que son generados a

travs del algoritmo de tipo chart rboles mltiples virtuales al que se le incorporan una serie
de mecanismos de poda a los que hemos denominado desambiguacin estructural. Este motor

no parte de la sentencia en s, sino que utiliza los resultados de DeFuSe.

En ambos casos se han desarrollado interfaces de usuario dando lugar a dos aplicaciones
finales.
Lingstica computacional y analizadores sintcticos

Agradecimientos

Quiero expresar mi profundo agradecimiento al Dr. D. Octavio Santana Surez,


Director del Grupo de Estructuras de Datos y Lingstica Computacional, en cuyo seno ha
sido desarrollada esta Tesis, y al Dr. D. Jos Prez Aguiar, por todos sus consejos, gran
inters, esfuerzo y tiempo dedicados a este trabajo. A mis padres por su apoyo
incondicional en todo momento. A todos los integrantes del Grupo de Estructuras de Datos
y Lingstica Computacional, por su total colaboracin y disponibilidad y al Dr. D. Manuel
Alvar Ezquerra por su aportacin indispensable.

-9-
Lingstica computacional y analizadores sintcticos

- 10 -
Lingstica computacional y analizadores sintcticos

Captulo 1

Lingstica computacional y analizadores


sintcticos

- 11 -
Lingstica computacional y analizadores sintcticos

- 12 -
Lingstica computacional y analizadores sintcticos

Captulo 1 Apartado 1
Introduccin histrica

1.1.- Introduccin.
En un principio, los equipos informticos tenan como nica funcin la
realizacin de clculos matemticos; sin embargo, los avances realizados tanto a nivel
de hardware como de software han hecho que el campo de la informtica sea aplicable a
una amplia gama de funciones. Entre las diferentes reas que toca la informtica se
encuentra la lingstica computacional.
La lingstica computacional es la rama de la informtica (donde sta se une a la
lingstica) que se dedica al estudio del lenguaje natural y la interaccin de la
informtica con ste. Dentro de las aplicaciones de la lingstica computacional cabe
destacar las siguientes:
Apoyo en la preparacin de documentos (correccin ortogrfica, sintctica y
de estilo).
Recuperacin y almacenamiento de la informacin.
Reconocimiento y sntesis del habla.
Traduccin automtica de textos entre diferentes idiomas.
Y en general todas aquellas aplicaciones donde se realice una interaccin con
el usuario por medio del lenguaje natural.
En las siguientes pginas realizaremos un anlisis del estado del arte de la
lingstica computacional, centrndonos en los analizadores y las gramticas.

1.2.- Historia de la lingstica computacional.


El procesamiento del lenguaje natural se remonta a la dcada de 1940, el uso de
los ordenadores durante la Segunda Guerra Mundial para clculo de tablas de artillera y

- 13 -
Lingstica computacional y analizadores sintcticos

criptoanlisis fue llevado a cabo desde algunos aos antes de 1945 con el final de la
guerra los investigadores pudieron dedicarse a otros tipos de aplicaciones, amplindose
la gama de estudios sobre procesamiento del lenguaje natural. Hasta 1960 fue bastante
fcil reunir los trabajos sobre Procesamiento del Lenguaje Natural por la pequea
cantidad de los mismos; sin embargo, desde entonces, se han realizado muchas
investigaciones en este campo.
Contenidos del apartado:
Antecedentes histricos.
Procesamiento del lenguaje natural desde 1966 hasta 1980.
Procesamiento del lenguaje natural desde 1980.

1.2.1.- Antecedentes histricos.


Entre los primeros estudios sobre el procesamiento del lenguaje natural se
encuentran las propuestas para la mecanizacin de la traduccin del lenguaje, que son
anteriores a la invencin de los ordenadores digitales. La primera aplicacin reconocible
fue un diccionario desarrollado en el Birkbeck College (Londres, 1948). El inters
americano data de un memorndum escrito en 1949 por Warren Weaver que haba
trabajado en tablas de codificacin durante la Segunda Guerra Mundial. Su idea era
simple, un documento en un lenguaje cualquiera puede ser visto como informacin
codificada siendo el cdigo el lenguaje en el que se encuentra escrito el documento;
una vez que este cdigo fuese franqueado, sera posible pasar tal cdigo a un lenguaje
distinto desde este punto de vista el Alemn poda ser visto como Ingls codificado.
Aparecieron grupos de desarrollo en el campo de la traduccin con mquinas en
Estados Unidos, Reino Unido, Francia y la Unin Sovitica. Los sistemas americanos se
concentraron inicialmente en la traduccin del Alemn al Ingls, por el inters en
traducir los mltiples documentos captados durante la guerra. Con el paso del tiempo, el
material alemn qued obsoleto y fue entonces (con la Guerra Fra) cuando se comenz
a trabajar en traductores de Ruso al Ingls, del Ruso al Francs o del Ingls al Ruso y
del Francs al Ruso.
Los primeros investigadores en el tema eran matemticos que trabajaban con la
primitiva maquinaria de computacin de la poca. Algunos eran bilinges (por ejemplo
alemanes que haban emigrado a Estados Unidos); su conocimiento de ambas lenguas
haca suponer que seran capaces de escribir programas que al menos pudieran traducir

- 14 -
Lingstica computacional y analizadores sintcticos

satisfactoriamente textos tcnicos. Pronto se vio que la tarea que se deba realizar era
extremadamente difcil: el lenguaje era mucho ms complejo que lo que se haba
supuesto, y an peor, aunque fueran expertos en su lengua, era muy difcil codificar el
conocimiento del lenguaje en un programa de ordenador.
Obviamente, los profesionales indicados para pedirles ayuda eran los lingistas.
La literatura de los aos 50 muestra un crecimiento de los trabajos en traduccin
automtica, observndose una tendencia en jvenes investigadores hacia la lingstica
orientada a la traduccin automtica; sin embargo, el problema principal se encontraba
en que no existan teoras lingsticas sobre el tema. Es en 1957 cuando aparece
publicado Syntactic Structures, de Noam Chomsky quien revolucion la lingstica
introduciendo la idea de gramtica generativa: sta consiste en la descripcin de las
estructuras sintcticas basndose en reglas. Aunque algunos no estn de acuerdo con las
teoras de Chomsky, casi todos los trabajos desde 1957 en Procesamiento del Lenguaje
Natural han sido realizados bajo su influencia.
Los primeros sistemas no eran capaces de traducir de manera satisfactoria sin
una importante intervencin del usuario. Antes de 1957, y dada la falta de teoras
lingsticas, se formularon propuestas en el sentido de que el texto deba ser pre-
editado para as marcar las dificultades: por ejemplo, eliminar las ambigedades de las
palabras. Como los sistemas automticos de traduccin no eran capaces de producir
resultados fluidos, el documento debera ser editado a fin de convertirlo en
comprensible para la mquina y posteriormente la traduccin deba ser tambin editada.
La introduccin de la pre-edicin y la post-edicin de los textos traducidos por la
mquina introdujo la idea de que en tareas que eran todava muy difciles para que el
ordenador las realizara por s mismo, ste poda usarse como una herramienta para
asistir a las personas. En la traduccin asistida por ordenador, la mquina acta como
una memoria que elimina la necesidad de recordar amplios vocabularios. Bar-Hillel
concluy que la Traduccin Completamente Automtica de Alta Calidad (Fully-
Automatic High-Quality Translation) era imposible sin conocimiento. Revis los
proyectos del momento y concluy que los mtodos usados que en esencia
relacionaban parejas de palabras estaban destinados a fallar. La razn era simple: los
traductores humanos aaden su capacidad cognitiva a las estructuras del lenguaje en las
que estn trabajando.
A mitad de los aos 60 la inversin pblica estadounidense para el desarrollo de
la traduccin automtica alcanzaba unos 20 millones de dlares anuales. El Comit

- 15 -
Lingstica computacional y analizadores sintcticos

Asesor para el Procesamiento Automtico del Lenguaje (ALPAC: Automatic


Language Processing Advisory Committee) realiz un informe sobre los resultados de
la inversin y concluy que no existe una mquina de traduccin de textos cientficos y
no se espera que aparezca ninguna a corto plazo.

1.2.2.- Procesamiento del lenguaje natural desde 1966 hasta 1980.

Algunos sugieren que el Procesamiento del Lenguaje Natural desapareci


virtualmente de escena despus del informe ALPAC; la evidencia contradice este punto
de vista. Es cierto que se realizaron menos trabajos en Procesamiento del Lenguaje
Natural; sin embargo, hubo importantes desarrollos y sistemas en los 15 aos siguientes
algunos de los cuales siguen teniendo influencia hoy en da. Los temas sobre los que
se ha trabajado son:

REDES DE TRANSICIN aumentadas. Es un mtodo de representacin del


conocimiento con el que se pueden representar potentes gramticas para
procesar la sintaxis. Sera un error verlo slo como un procesador sintctico,
pues es ms que un analizador de la estructura del lenguaje: proporciona un
formalismo para expresar el conocimiento sobre el dominio de la aplicacin.

GRAMTICA DE CASOS. Lenguajes como el Espaol expresan la relacin entre


verbos y nombres por medio del uso de preposiciones de encadenamiento.
Considrese la siguiente sentencia:

Juan compr un billete para Mara en la estacin de autobuses

Por la posicin de las palabras Juan y billete se sabe que Juan es el agente
instigador de la accin y que billete es el objeto de la misma. Mara es la
beneficiaria de la accin debido al uso de la preposicin para antes del
sustantivo. La preposicin en indica que la accin se realiza en la estacin de
autobuses. En otros lenguajes que no usan preposiciones, la informacin la
lleva la palabra o la posicin que ocupa.

REPRESENTACIONES SEMNTICAS. Se han desarrollado significativos avances


en el procesamiento semntico. Schank y sus colaboradores introdujeron la
nocin de Dependencia Conceptual: un mtodo para expresar el lenguaje en
trminos de primitivas semnticas estos sistemas se escriban sin incluir
procesamiento sintctico. Quillians introduce la idea de red semntica que

- 16 -
Lingstica computacional y analizadores sintcticos

est constituida por nodos1 y enlaces2; stas son usadas para la


representacin del conocimiento en muchos sistemas. Willian Woods emple
la idea de semntica procedimental como una representacin intermedia
entre el sistema del procesamiento del lenguaje y un sistema de bases de
datos.
Los sistemas ms destacados son:
SHRDLU. El sistema SHRDLU de Terry Winograd simulaba un robot que
manipulaba bloques sobre una mesa. Este poda manipular instrucciones
como Pick up the red pyramid y responder a cuestiones como What does the
blue box contain? La importancia de SHRDLU radica en que muestra que la
sintaxis, la semntica y el razonamiento sobre el mundo pueden ser
combinados para producir un sistema que entienda el lenguaje natural. Se
trata de un sistema muy limitado que slo es capaz de manejar un pequeo
nmero de sentencias y su dominio est limitado al mundo de los bloques. El
trabajar con un dominio muy pequeo hace que el sistema sea muy potente;
sin embargo, al ampliar el dominio, la efectividad del sistema decrece.
LUNAR. Es un sistema de interfaz con bases de datos el cual trabaja con
redes de transicin aumentadas y la semntica procedimental de Woods. Su
nombre proviene de una base de datos usada para el almacenamiento de
informacin sobre rocas lunares. La demostracin informal del sistema se
realiz en la Segunda Conferencia Anual sobre Ciencia Lunar en 1971.
LIFER/LADDER. Es uno de los sistemas de Lingstica Computacional ms
imprevisibles. Fue diseado como una interfaz en lenguaje natural con una
base de datos sobre barcos de la marina estadounidense. Usa una gramtica
orientada a la semntica: emplea etiquetas como BARCO o ATRIBUTO
ms que las sintcticas como nombre o verbo. Ello implica que se limita a
trabajar en un dominio restringido como lo hace el sistema SHRDLU.

1.2.3.- Procesamiento del lenguaje natural desde 1980.


A partir de la dcada de los 80 se ha producido gran cantidad de estudios en el
campo de la Lingstica Computacional. Cabe sobre todo destacar la aparicin de

1
Un nodo es una estructura que tiene asociada una correspondencia con un objeto, evento, actor, entidad o
cualidad del ambito de representacin.
2
Un enlace es una relacin entre dos nodos.

- 17 -
Lingstica computacional y analizadores sintcticos

mltiples formalismos gramaticales para la representacin de los lenguajes naturales, es


decir, la aparicin de diferentes sistemas de representacin del conocimiento contenido
en las sentencias del lenguaje natural para su tratamiento. Sobre estos temas y los
ltimos avances se hace referencia en los siguientes apartados de este trabajo.

1.3.- El espaol y la lingstica computacional.


En lo que respecta a las tecnologas de la lengua y el Espaol, los primeros
trabajos de anlisis computacionales del Espaol fueron realizados por un equipo de
informticos y lingistas entre los que se encuentran Francisco Marcos Marn y Manuel
Ariza, en el Centro de Clculo de la Universidad Complutense en los aos 71 y 72. En
estos comienzos tambin cabe destacar el Diccionario del Espaol de Mxico, dirigido
por Luis Fernando Lara y el Diccionario histrico del grupo del Centro de Clculo de la
Universidad Complutense.
Otros trabajos posteriores que cabe nombrar son:
Los trabajos sobre lexicografa de Manuel Alvar Ezquerra en la Universidad
de Mlaga
La tesis sobre aplicacin informtica al anlisis literario de Ramn Almela
dirigida por A. Quilis.
Los llevados acabo dentro del proyecto EUROTRA. Orientados al desarrollo
de prototipos para la traduccin automtica entre lenguas de la Comunidad
Europea.
Los llevados a cabo en la Universidad Autnoma de Madrid, en el centro
cientfico UAM-IBM; entre stos sobresale la tesis doctoral CORRECTOR:
Un sistema de verificacin sintctica y estilstica de textos de Consuelo
Rodrguez Magro (1993).
Y los realizados por el Grupo de Investigacin en Lingstica Computacional
de la Universidad de Barcelona.
Siguiendo el camino recorrido por la lingstica computacional en espaol, debe
mencionarse el Programa de Tecnologa Lingstica de la Sociedad Estatal Quinto
Centenario: se desarroll entre los aos 1990 y 1992 y es donde se ha asignado la mayor
cantidad de recursos sobre lingstica computacional en el mundo hispano.
Es destacable tambin el esfuerzo realizado por la Unin Europea en la
financiacin de proyectos sobre procesamiento del lenguaje natural, lo cual no es de

- 18 -
Lingstica computacional y analizadores sintcticos

extraar si se tiene en cuenta la variedad de idiomas que se pueden encontrar dentro de


sta. A continuacin se presentan algunos proyectos lingsticos financiados por la
Unin Europea:
Programa LIBRARIES.
Proyecto BIBLIOTECA. Entorno a la integracin de trabajos
correspondientes a los campos de: reconocimiento de documentos,
anlisis composicional, indizacin de palabras, procesamiento del
lenguaje natural y sistema de lenguaje de marcas estandar generalizado
(SGML: Standard Generalized Markus Languaje).
Proyecto CANAL/LS. Desarrollo de un sistema de acceso multilinge
para catlogos de bibliotecas.
Proyecto TRANSLIB. Obtencin de un sistema de acceso multilinge a
catlogos de bibliotecas mediante la integracin de nuevas herramientas
con otras ya existentes.
Programa MLAP.
Proyecto GRAMCHECK. Obtencin de un corrector gramatical y
estilstico multilinge a partir de la Plataforma de Ingeniera Lingstica
Avanzada (ALEP: Advanced Linguistics Engineering Platform).
Proyecto INTERVAL. Creacin de nuevos estndares y una nueva
terminologa tanto para futuros proyectos como para recursos ya
existentes en los siguientes campos: comunicaciones celulares o
comunicaciones va satlite; farmacia, entorno, ferrocarriles y sistemas
financieros internacionales.
Proyecto SPEECHDAT. Mediante la creacin de una infraestructura
apropiada, minimiza los costes de los Recursos del Lenguaje Hablado
(SLR: Speaking Language Resources) tales como bases de datos orales,
modelos de pronunciacin, etc.
Proyecto TRADE. Ampla un prototipo de traduccin automtica ya
existente basado en el E-framework y muestra su capacidad de uso como
base para un sistema industrial de traduccin automtica.
Programa LRE.
Proyecto CRATER. Diseo de un etiquetador gramatical automtico y de
corpus paralelos.

- 19 -
Lingstica computacional y analizadores sintcticos

Proyecto EAGLES. Establece un conjunto coordinado de grupos de


expertos en el rea de la investigacin de pre-normativa lingstica. El
Grupo tendr un papel decisivo en la definicin, evaluacin, validacin,
promocin y expansin de las especificaciones comunes para la
descripcin y representacin de los datos lingsticos.
Proyecto LS-GRAM. Desarrolla herramientas lingusticas documentadas,
probadas y bien diseadas para las nueve lenguas comunitarias. Estas
herramientas se basarn en un software comn (ALEP) y reutilizarn el
conocimiento lingustico contenido en descripciones gramaticales ya
existentes.
Proyecto MULTEXT. Contribuye al desarrollo de software apto para
manipular y analizar corpora de textos y crea corpora textuales
multilinges con indicaciones estructurales y lingusticas.
Procura establecer convenciones para la codificacin de tales corpora.
Proyecto ONOMASTICA. Crea un conjunto de lexicones con la
pronunciacin de los nombres de ciudades, pases, calles, compaas y
productos europeos y hace posible el control de calidad de los corpora
orales. Un objetivo secundario fundamental consiste en la preparacin
de reglas letra-sonido especficas para los nombres de cada lengua.
Proyecto EUROTRA. Es un proyecto europeo con dos finalidades: 1)
desarrollar prototipos para la traduccin automtica entre las diferentes
lenguas de la Comunidad Europea; 2) estimular la investigacin en el
campo de la lingstica computacional entre los miembros de la
Comunidad Europea.
Proyecto NERC (Network Of European Reference Corpora). Son las
siglas de la Red Europea de Corpus de referencia. Se trata de un
consorcio cuya funcin es estudiar la viabilidad de definir
recomendaciones sobre la provisin de corpus de referencia en Europa.
Programa ESPRIT III
Proyecto ACQUILEX II. Este proyecto intenta ampliar los resultados
obtenidos en ACQUILEX I al continuar con la investigacin de diseo
de lexicones. Al mismo tiempo, procura hacer uso de grandes corpora
como fuente de datos para la construccin semiautomtica de recursos

- 20 -
Proceso de automatizacin del anlisis sintactico del espaol.

lxicos.
La traduccin automtica es uno de los campos de la lingstica computacional
en los que ms hincapi se ha hecho como ya se vio con anterioridad. Con respecto al
espaol existen mltiples traductores comerciales que en su mayora son herramientas
de ayuda a la traduccin no traducen de una forma totalmente correcta, sino que dan
como resultado un texto orientativo que debe ser post-editado. A continuacin se
presenta una lista de los traductores comerciales en todos figura el espaol:
Tabla 1.1
Traductores automticos

Nombre Fabricante Distribuidor


Spanish Assistant 1.0 Globalink Worldwide Sales Corporation Espaa
Power Translator Standart Globalink Worldwide Sales Corporation
Power Translator DeLuxe Globalink Worldwide Sales Corporation Espaa
Power Translator Professional Globalink Globalink
Spanish Amigo Westeliff Software Worldwide Sales Corporation Espaa
Key Translator Pro 1.0 SoftKey ABC Analog, SL
WinBabel 1.0 Babel Informtica Babel Informtica
WinBabel 2.0 Babel Informtica Sedyco
Transcend Intergraph Intergraph
Translation Manager IBM IBM
Personal Translation Manager IBM IBM
Metal/X Gesellschaft Fr Multilenguale System Incyta
GmbH

Se presenta ahora una relacin de las asociaciones concernientes al tema en


Espaa.
Asociacin de Historia de la Lengua Espaola.
Sociedad Espaola de Lingstica.
Asociacin Espaola de Lingstica Aplicada.
Sociedad Espaola para el Procesamiento del Lenguaje Natural (SEPLN).
sta es la ms directamente relacionada con la Lingstica Computacional y
celebra todos los aos un congreso donde se presentan los ltimos avances
sobre el tema.
Las dos primeras se dedican sobre todo a estudios tericos de la lengua,
aunque en sus convenciones tambin se presentan ponencias sobre aplicaciones
informticas a la lengua.

- 21 -
Proceso de automatizacin del anlisis sintactico del espaol.

- 22 -
Proceso de automatizacin del anlisis sintactico del espaol.

Captulo 1 Apartado 2
Sintaxis y analizadores sintcticos

2.1.- Introduccin.
En este apartado se hace referencia a temas relacionados con:
Sintaxis: Explica cmo las palabras son agrupadas para formar sentencias.
Analizadores sintcticos: Programas que aplican conocimiento sintctico para
construir descripciones de sentencias usualmente en forma de rbol.
Contenidos del apartado:
Adecuacin de los autmatas de estado finito para el procesamiento
sintctico.
Introduccin a la terminologa de sintaxis y a las gramticas libres del
contexto.
Bsqueda y control en el anlisis.

2.2.- Adecuacin de los autmatas de estado finito para el procesamiento


sintctico.
Contenidos del apartado:
Introduccin a los autmatas o redes de estado finito.
Ideas sobre la adecuacin.
Adecuacin matemtica y notacional.
Adecuacin matemtica de los autmatas de estado finito.
Adecuacin notacional de los autmatas de estado finito.
Resumen.

- 23 -
Proceso de automatizacin del anlisis sintactico del espaol.

2.2.1.- Introduccin a los autmatas o redes de estado finito.


En los autmatas de estado finito aparecen dos elementos; nodos y enlaces. Los
nodos representan posibles estados por los que se puede pasar, existen tres tipos de
estados; estados iniciales, son aquellos de los que se parte inicialmente, estados
intermedios, son aquellos por los que se pasa pero en los cuales no debe finalizar el
proceso y estados finales, en los que al concluir el proceso se pueden derivar
consecuencias. Los enlaces representan las reglas que hacen que pasemos de un estado a
otro. Se presenta a continuacin un ejemplo en el que se representa el autmata de
estado finito para representar un caso cotidiano de la vida diaria:

Figura 1.1
Ejemplo de autmata de estado finito

Se presenta el autmata de estado finito para la accin de subirse


a un coche y ponerlo en marcha.

1 a 2 b 3 c 4text

Inicialmente nos encontramos en un estado inicial junto al coche


(estado 1) a travs de la accin subirse al coche (enlace a) pasamos al
estado intermedio 2 (dentro del coche). Desde el estado 2 al estado 3
(llave en el contacto) introduciendo la llave de contacto (enlace b) y
girando sta (enlace c) pasamos al estado final coche en marcha
(estado 4).

Es posible el uso de redes de estado finito para reconocer sentencias del espaol
y de otros idiomas; sin embargo, es posible mostrar que ningn autmata de estado
finito puede modelar algunas construcciones del lenguaje, por ejemplo las sentencias
anidadas todo ello se muestra en los siguientes apartados.
Las descripciones con un Autmata de estado finito de la sintaxis de los
lenguajes naturales son repetitivas y se alargan demasiado.

2.2.2.- Ideas sobre la adecuacin.


Se debe tener alguna manera de evaluar las teoras sobre el lenguaje; un trmino
usado es adecuacin.
La idea de evaluar una teora por su adecuacin se centra en que sea suficiente y
no redundante para describir o explicar el fenmeno observado. Esto es obvio: se desea

- 24 -
Proceso de automatizacin del anlisis sintactico del espaol.

una descripcin que cubra todo lo que se quiere describir, de otra manera, no se es capaz
de describir algunas cosas que se sabe que existen. Adems debe ser justamente
suficiente, es decir, ha de ser suficiente pero utilizando los mnimos recursos.
Una teora puede ser evaluada por el criterio de la adecuacin. Podemos hablar
de adecuacin a varios niveles: por ejemplo, una teora puede describir todas las
posibles secuencias que un lenguaje incluye y ninguna ms, pero no dar ninguna
informacin de cmo el cerebro produce dichas sentencias. Si se quiere producir una
descripcin de las sentencias de un lenguaje, sta ser una teora adecuada; si se intenta
entrar en los procesos cognitivos humanos la teora sera inadecuada. Es por ello que
podemos limitar las teoras por el requerimiento de justamente suficiente.
Supngase que se tienen tres gramticas con diferente potencial matemtico y
diferente necesidad de requerimientos de computacin.
1. Reconoce todas las posibles sentencias y la necesidad de requerimientos es
mxima.
2. Reconoce todas las posibles sentencias y la necesidad de requerimientos es
media.
3. No reconoce todas las sentencias y los requerimientos son mnimos.
Vase que la opcin tercera no es adecuada. En cambio, s lo son la 1 y la 2. De
estas dos, es preferible la segunda, pues la teora es justamente suficiente.

2.2.3.- Adecuacin matemtica y notacional.


Se puede usar una gran variedad de puntos de vista de adecuacin para describir
las gramticas sintcticas, aqu se limita a dos: matemtica y notacional.
Adecuacin matemtica. Hace referencia a cmo se caracterizan
formalmente los objetos por la notacin.
Adecuacin notacional. Se cie a cmo la notacin describe los objetos del
mundo real y su interpretacin en el modelo propuesto.
Estas definiciones pueden parecer un poco confusas, pero se clarificarn al ver
cmo se usan para evaluar los autmatas de estado finito como modelo de sintaxis del
espaol.

2.2.4.- Adecuacin matemtica de los autmatas de estado finito.


Para ilustrar la utilizacin de los autmatas de estado finito en las descripciones
sintcticas, se presenta a continuacin una Red de Transicin de estado finito para unas

- 25 -
Proceso de automatizacin del anlisis sintactico del espaol.

posibles sentencias:

Figura 1.2
Representacin de sentencia con un autmata de estado finito

El gato.
El buen gato.
El muy buen gato.
El muy muy buen gato.
El muy buen y alto gato.
El muy buen y muy alto gato.
etc.
muy muy

el buen y alto gato text

gato

gato

Para ilustrar el ejemplo se usaran cadenas de caracteres en vez de etiquetar los


arcos con palabras se har con caracteres. Se puede representar la red de transicin de
estado finito que reconozca y genere las siguientes cadenas:

Figura 1.3
Reconocimiento de cadenas mediante un autmata de estado finito

ch
cdh
cddh
cdefgh
cdefdgh
etc.
d d

c e f g h text

h
h

Las cadenas constituyen un lenguaje no-restringido pueden tener cualquier


nmero de d. Sin embargo, supngase que se quiere modelar un reconocedor que acepte
una de las siguientes:

- 26 -
Proceso de automatizacin del anlisis sintactico del espaol.

Figura 1.4
Cadenas a reconocer
cdefdgh
cddefddgh
cdddefdddgh
etc

pero que rechace:


Figura 1.5
Cadenas a rechazar
cddefdgh
cdefddgh
cddddefdgh
cdefdddddgh

El reconocedor debe slo aceptar entradas de la forma: cdaefdagh , donde a>0.


Es imposible representar reconocedores que describan este lenguaje y slo este lenguaje
con un Autmata de estado finito, pues no es posible representar la eliminacin de las
ristras de la figura 5.
Parece ser que las cadenas de letras arbitrarias tienen poco que hacer en el
espaol, al igual que en otros idiomas. Por otro lado, es posible demostrar que el
Espaol incluye sentencias que son similares en su estructura. Considrese la siguiente
sentencia:
La chica cuya madre que haba sido dibujada por Van Gogh era cantante naci en
Madrid
Puede separarse en:
Figura 1.6
Anidamiento de sentencias
La chica
cuya madre
que haba sido dibujada por Van Gogh
era cantante
naci en Madrid

Esta sentencia se puede extender de forma indefinida simplemente aadiendo


ms y ms sentencias en el centro; gracias a tal caracterstica de anidamiento de
sentencias se puede concluir que es imposible modelar enteramente la sintaxis del
espaol con una Red de Transicin de estado finito; por tanto, los autmatas de estado
finito son matemticamente inadecuados para modelar el espaol, pues son incapaces de

- 27 -
Proceso de automatizacin del anlisis sintactico del espaol.

modelar sentencias como las vistas con anterioridad.


Es posible escribir descripciones de la gramtica espaola que incluyan
sentencias anidadas, pero ello es objeto de otra seccin.

2.2.5.- Adecuacin notacional de los autmatas de estado finito.


Considrese una Red de Transicin de estado finito para la oracin El gato
salt sobre la maleta por el fuego.
Figura 1.7
Anlisis de oracin

determinante sustantivo verbo preposicin determinante sustantivo preposicin determinante sustantivo


El gato salt sobre la maleta por el fuego

Es fcil ver que esta red contiene repeticiones: por ejemplo, la secuencia
determinante-sustantivo aparece tres veces y la secuencia
preposicin-determinante-sustantivo aparece dos. En informtica se le da gran
importancia al concepto de modularidad.
El mismo tipo de criterio debe aplicarse a las gramticas. En este caso, una red
de transicin de estado finito no puede ser optima, porque tendra repeticiones
innecesarias. Si se tiene un elemento que procese sustantivo, puede aadirse a la red e
indicar que se trata de un sustantivo. Si puede hacerse modular el conocimiento
humano, nicamente debera realizarse la eleccin una sola vez.

2.2.6.- Resumen.
Se usan varios tipos de adecuacin como criterio para evaluar las teoras. De
ellos, la adecuacin matemtica y la de notacin se usan para evaluar los autmatas de
estado finito, y se ha visto que son inadecuados porque son incapaces de describir
matemticamente algunas estructuras del espaol y no son ptimos desde el punto de
vista notacional.

2.3.- Introduccin a la terminologa de sintaxis y a las gramticas libres


del contexto.
La sintaxis tiene una terminologa que incluye palabras como smbolos
terminales, pre-terminales y no-terminales. Esta seccin define estos trminos e
introduce otros comunes como sustantivo, verbo, preposicin, determinante, etc...
Las gramticas libres del contexto son un mtodo para describir el lenguaje. Se

- 28 -
Proceso de automatizacin del anlisis sintactico del espaol.

introducen mostrando cmo se relacionan con la estructura de rbol de la sentencia.


Contenidos del apartado:
Limitaciones de los autmatas de estado finito.
Gramticas libres del contexto.
Estructura de rbol.
Ambigedad.
Categoras sintcticas.

2.3.1.- Limitaciones de los autmatas de estado finito.


Como se vio, los autmatas de estado finito son matemticamente inadecuados
para la descripcin de los lenguajes naturales que incluyen sentencias anidadas.
El ejemplo de las figuras 4 y 5 requerira que el reconocedor slo pudiera
aceptar entradas de la forma cdefdgh, donde a>0; por tanto, una secuencia vlida
sera, figura 8:
Figura 1.8
Secuencia aceptada
cdefdgh

Si se modifica un poco la notacin e introducimos el concepto de regla una


regla se define como una implicacin en la que aparece un smbolo a la izquierda de la
misma, siendo este sustituible por el smbolo o los smbolos que aparecen a la derecha
de la misma poniendo en minscula las palabras del lenguaje (en el ejemplo c, d, e, f,
g, h) y en mayscula el smbolo que aparece a la izquierda de la regla que aparece en la
figura 9, con ello nos queda lo que aparece en la figura 9.

Figura 1.9
Secuencia intermedia
cdKdgh

K en vez de ef, implica la regla de la figura 10:

Figura 1.10
Representacin de regla

K ef

Significa que la secuencia cdKdgh puede escribirse como cdefdgh. Se puede


hacer que K represente a varios valores posibles, figura 11:

- 29 -
Proceso de automatizacin del anlisis sintactico del espaol.

Figura 1.11
Representacin de varias secuencias que dan lugar a un mismo smbolo

K ef
K dKd
Ahora el smbolo K puede sustituirse de dos maneras. Finalmente se va a aadir
una nueva regla, figura 12:
Figura 1.12
Regla de representacin

S cdKdgh

Si se comienza con el smbolo S, se puede reescribir sustituyendo lo que hay a la


derecha de la flecha por lo que aparece a su izquierda, figura 13:
Figura 1.13
Uso de las reglas
S {Comienzo (raz)}
cdKdgh {Uso del lado derecho de la regla S}
cddKddgh {Reemplazo de K por el lado derecho de la segunda regla K}
cdddKdddgh { Reemplazo de K por el lado derecho de la segunda regla K}
cdddefdddgh { Reemplazo de K por el lado derecho de la primera regla K}

El describir las derivaciones lnea a lnea es slo una manera de hacerlo; otra
forma ms atractiva sera su representacin en rbol, donde cada nivel presenta las
derivaciones realizadas. De este modo la regla, figura 12, sera representada como,
figura 14:

Figura 1.14
rbol de representacin

cd K dgh

rbol de representacin para S cdKdgh

El rbol para las derivaciones anteriores sera, figura 15:

- 30 -
Proceso de automatizacin del anlisis sintactico del espaol.

Figura 1.15
rbol de representacin

cd d d ef d d dgh
rbol de representacin
para la cadena cdddefdddgh.

2.3.2.- Gramticas libres del contexto.


En los esfuerzos para superar las limitaciones de los autmatas de estado finito,
se ha desarrollado un nuevo formalismo denominado Gramticas Libres del Contexto
(GLC). Las GLC tienen las siguientes caractersticas:
Un lado derecho y otro izquierdo separados por una flecha.
Un solo smbolo en el lado izquierdo
Los smbolos en el lado izquierdo son siempre no-terminales.
Los smbolos en el lado derecho pueden ser terminales o no-terminales.
De esta manera la gramtica que se ha usado hasta ahora quedara, figura 16:
Figura 1.16
Representacin de la gramtica

S cdKdgh
K ef
K dKd

Los smbolos no-terminales son S y K y los terminales son: c, d, e, f, g y h.

- 31 -
Proceso de automatizacin del anlisis sintactico del espaol.

El ejemplo visto puede parecer un tanto abstracto. A continuacin se ver cmo


se adapta ms a los lenguajes naturales, figura 17:

Figura 1.17
Representacin de la gramtica

SENTENCIA SINTAGMA_NOMINAL FRASE_VERBAL


FRASE_VERBAL GRUPO_VERBAL SINTAGMA_NOMINAL
FRASE_VERBAL verbo SINTAGMA_NOMINAL
GRUPO_VERBAL auxiliar verbo
SINTAGMA_NOMINAL pronombre
SINTAGMA_NOMINAL sustantivo
SINTAGMA_NOMINAL adjetivo sustantivo

Los smbolos no-terminales son: SENTENCIA, FRASE_VERBAL,


SINTAGMA_NOMINAL y GRUPO_VERBAL; los smbolos adjetivo, auxiliar,
pronombre, sustantivo y verbo etiquetan palabras del espaol. Es por ello que hay que
aadir algunas reglas ms, figura 18:

Figura 1.18
Smbolos pre-terminales

auxiliar estn
sustantivo pollo
pronombre ellos
verbo estn
verbo comiendo

Las palabras del lxico constituirn los lmites del rbol y se usar el trmino
pre-terminal para describir aquellos smbolos que en la siguiente derivacin dan lugar a
smbolos terminales. En este caso los smbolos pre-terminales son: adjetivo, auxiliar,
sustantivo, pronombre y verbo.

2.3.3.- Estructura de rbol.


Supngase que se tiene una sentencia como Ellos estn comiendo pollo. Puede
usarse la gramtica para reconocer que forma parte o no del lenguaje descrito por la
gramtica; en caso de pertenecer se puede representar mediante una estructura de rbol.

- 32 -
Proceso de automatizacin del anlisis sintactico del espaol.

Figura 1.19
rbol de representacin para ellos estn comiendo pollo

SENTENCIA

SINTAGMA_NOMINAL FRASE_VERBAL

pronombre GRUPO_VERBAL SINTAGMA_NOMINAL

auxiliar verbo sustantivo

Ellos estn comiendo pollo

2.3.4.- Ambigedad.
A veces existe ms de una interpretacin posible en este caso hablamos de
ambigedad. En procesamiento del lenguaje natural se distingue entre ambigedad
global existe ms de una posible interpretacin de la sentencia y ambigedad local
una parte de la expresin parece ambigua. Esta nueva perspectiva permitir ignorar a
todas o a algunas de sus interpretaciones.

2.3.5.- Categoras sintcticas.


Se tienen smbolos terminales, pre-terminales y no-terminales. Los terminales
son palabras del lxico; los smbolos no-terminales sirven para escribir reglas que
describen frases en las Gramticas Libres del Contexto. Las frases son simplemente
agrupaciones de palabras que toman su nombre de alguna palabra importante en la frase,
por ejemplo:
frase nominal
frase verbal.
sentencia
Existen otras agrupaciones que son utilizadas como GRUPO_VERBAL, figura
17.
Los smbolos pre-terminales se usan como categoras en las Gramticas Libres
del Contexto, figura 20:

- 33 -
Proceso de automatizacin del anlisis sintactico del espaol.

Figura 1.20
Categoras

adjetivo: califica a un nombre.


adverbio: califica a un verbo.
auxiliar: verbo que se utiliza acompaando a otro para aadir algn significado.
determinante: especifica.
sustantivo: se refiere a un objeto o entidad.
preposicin: denota posicin
pronombre: hace referencia a una persona, animal, planta o cosa sin usar su nombre.
verbo: hace referencia a una accin.

2.4.- Bsqueda y control en el anlisis.


En esta seccin se muestra cmo la estructura de rbol de frase puede
desarrollarse de abajo arriba y de arriba a abajo usando la gramtica y el lxico
presentados en la seccin sobre Terminologa de la Sintaxis y Gramticas Libres del
Contexto.

Contenidos del apartado:


Estrategias de anlisis.
Estrategia descendente.
Estrategia ascendente.
Control de las estrategias en la bsqueda.
Control en profundidad.
Control en anchura.
Evaluacin de los controles en profundidad y en anchura.
Resumen.

Con la sentencia Ellos estn comiendo pollo se ve que el anlisis puede ser
controlado en profundidad o en anchura.

2.4.1.- Estrategias de anlisis.


La gramtica que se present en el apartado de Terminologa de la Sintaxis y
Gramticas Libres del Contexto tomaba el aspecto, figura 21:

- 34 -
Proceso de automatizacin del anlisis sintactico del espaol.

Figura 1.21
Representacin de la gramtica

SENTENCIA SINTAGMA_NOMINAL FRASE_VERBAL


FRASE_VERBAL GRUPO_VERBAL SINTAGMA_NOMINAL
FRASE_VERBAL verbo SINTAGMA_NOMINAL
GRUPO_VERBAL auxiliar verbo
SINTAGMA_NOMINAL pronombre
SINTAGMA_NOMINAL sustantivo
SINTAGMA_NOMINAL adjetivo sustantivo

El lxico, figura 22:


Figura 1.22
Smbolos pre-terminales y lxico

auxiliar estn
sustantivo pollo
pronombre ellos
verbo estn
verbo comiendo

Se ha visto que es posible derivar la estructura de rbol desde la gramtica para


la sentencia Ellos estn comiendo pollo. En esta seccin se ver cmo buscar
soluciones en forma de estructura de rbol; existen dos estrategias de bsqueda
principales: descendente y ascendente.

2.4.2.- Estrategia descendente.


Esta estrategia es conocida como conducida por hiptesis, pues esencialmente
opera proponiendo que la cadena de entrada Ellos estn comiendo pollo est
representada en su totalidad por un smbolo de la gramtica; en tal ejemplo se puede
suponer que dicho smbolo es SENTENCIA:
Figura 1.23
Primer nivel superior aadido

SENTENCIA

Ellos estn comiendo pollo

- 35 -
Proceso de automatizacin del anlisis sintactico del espaol.

Se puede entonces escribir los smbolos no-terminales en los que deriva


SENTENCIA y tambin seleccionar uno de los no-terminales para expandirlo:

Figura 1.24
Primer descenso

SENTENCIA

SINTAGMA_NOMINAL FRASE_VERBAL

pronombre

Ellos estn comiendo pollo

Se repite el proceso expandiendo otro no-terminal:

Figura 1.25
Segundo descenso

SENTENCIA

SINTAGMA_NOMINAL FRASE_VERBAL

pronombre GRUPO_VERBAL SINTAGMA_NOMINAL

Ellos estn comiendo pollo

y otro:

- 36 -
Proceso de automatizacin del anlisis sintactico del espaol.

Figura 1.26
Tercer descenso

SENTENCIA

SINTAGMA_NOMINAL FRASE_VERBAL

pronombre GRUPO_VERBAL SINTAGMA_NOMINAL

auxiliar verbo

Ellos estn comiendo pollo

hasta que se agota la expansin de los smbolos no-terminales.

Figura 1.27
Cuarto descenso

SENTENCIA

SINTAGMA_NOMINAL FRASE_VERBAL

pronombre GRUPO_VERBAL SINTAGMA_NOMINAL

auxiliar verbo sustantivo

Ellos estn comiendo pollo

- 37 -
Proceso de automatizacin del anlisis sintactico del espaol.

2.4.3.- Estrategia ascendente.

La estrategia de bsqueda ascendente es conocida como conducida por datos.


Para distinguir los smbolos de la gramtica opera construyendo el rbol hacia arriba a
partir de la cadena de entrada.

Figura 1.28
Primer nivel inferior aadido

pronombre auxiliar verbo sustantivo

Ellos estn comiendo pollo

Se intenta aadir un no-terminal que cubra uno o ms de los smbolos terminales.

Figura 1.29
Primer ascenso

SINTAGMA_NOMINAL

pronombre auxiliar verbo sustantivo

Ellos estn comiendo pollo

Repitiendo el proceso:

Figura 1.30
Segundo ascenso

SINTAGMA_NOMINAL GRUPO_VERBAL

pronombre auxiliar verbo sustantivo

Ellos estn comiendo pollo

- 38 -
Proceso de automatizacin del anlisis sintactico del espaol.

y de nuevo:
Figura 1.31
Tercer ascenso

SINTAGMA_NOMINAL GRUPO_VERBAL SINTAGMA_NOMINAL

pronombre auxiliar verbo sustantivo

Ellos estn comiendo pollo

otra vez:
Figura 1.32
Cuarto ascenso

FRASE_VERBAL

SINTAGMA_NOMINAL GRUPO_VERBAL SINTAGMA_NOMINAL

pronombre auxiliar verbo sustantivo

Ellos estn comiendo pollo

Hasta que se llegue a cubrir todo con el smbolo raz, figura 33:
Figura 1.33
Quinto ascenso

SENTENCIA

FRASE_VERBAL

SINTAGMA_NOMINAL GRUPO_VERBAL SINTAGMA_NOMINAL

pronombre auxiliar verbo sustantivo

Ellos estn comiendo pollo

- 39 -
Proceso de automatizacin del anlisis sintactico del espaol.

2.4.4.- Control de las estrategias de anlisis.


Como se vio en la seccin sobre ambigedad (4.2.4), existe ms de una
estructura de rbol que pueden derivarse a partir de la gramtica cuando se aplica a
Ellos estn comiendo pollo. Lo normal es desear que el sistema de Procesamiento del
Lenguaje Natural encuentre todos los rboles de ambigedad global de la sentencia; por
ello cuando se escriben algoritmos se tiene que aplicar un mtodo que considere todas
las posibilidades para estar seguros de que el resultado del analizador sea completo.
Control es el nombre que se da al proceso que maneja las alternativas en las
bsquedas; esencialmente, hay dos tipos de control: en profundidad y en anchura.

2.4.5.- Control en profundidad.


El control en profundidad se propone como alternativa alcanzar un terminal o
que se produzca un bloqueo; slo entonces se considera la siguiente alternativa. Este
control se usa normalmente en aplicaciones desarrolladas en Prolog y se asocia siempre
con el trmino vuelta atrs cronolgica.
Como ejemplo, considrese la bsqueda descendente cuando ha llegado hasta el
punto descrito en la figura 34:

Figura 1.34
Anlisis parcial

SENTENCIA

SINTAGMA_NOMINAL FRASE_VERBAL

pronombre

Ellos estn comiendo pollo

Existen dos reglas FRASE_VERBAL que pueden usarse, figura 35:

- 40 -
Proceso de automatizacin del anlisis sintactico del espaol.

Figura 1.35
Reglas posibles para frase verbal

FRASE_VERBAL GRUPO_VERBAL SINTAGMA_NOMINAL


FRASE_VERBAL verbo SINTAGMA_NOMINAL

Bajo el control en profundidad, las alternativas se ubican en una pila3; se toma el


primer tem de la misma y se expande si es no-terminal. As la pila evoluciona:

Figura 1.36
Evolucin de la pila

Estado anterior de la pila. Estado actual de la pila.

GRUPO_VERBAL SINTAGMA_NOMINAL auxiliar verbo SINTAGMA_NOMINAL

verbo SINTAGMA_NOMINAL verbo SINTAGMA_NOMINAL

GRUPO_VERBAL auxiliar verbo [+ SINTAGMA_NOMINAL]


FRASE_VERBAL verbo SINTAGMA_NOMINAL

Cuando auxiliar y verbo (de la regla GRUPO_VERBAL) han sido tratados, las
reglas alternativas para SINTAGMA_NOMINAL son las que aparecen en la pila de la
figura 37:

Figura 1.37
Reglas alternativas para frase nominal

Reglas Pila

SINTAGMA_NOMINAL pronombre pronombre

SINTAGMA_NOMINAL sustantivo sustantivo

SINTAGMA_NOMINAL adjetivo sustantivo adjetivo sustantivo

FRASE_VERBAL verbo SINTAGMA_NOMINAL verbo SINTAGMA_NOMINAL

Cada alternativa ser extrada de la pila hasta que slo quede, figura 38:

3
Una pila es una estructura de datos en la cual el elemento que primero se extrae es el ltimo que se ha
insertado.

- 41 -
Proceso de automatizacin del anlisis sintactico del espaol.

Figura 1.38
Regla final

FRASE_VERBAL verbo SINTAGMA_NOMINAL

Entonces slo puede usarse una regla alternativa para FRASE_VERBAL.

2.4.6.- Control en anchura.


El control en anchura usa una cola4 en vez de una pila como estructura de datos.
Se observa la diferencia volviendo de nuevo al manejo de las reglas alternativas
FRASE_VERBAL.
Hay dos reglas FRASE_VERBAL que pueden usarse, figura 39:

Figura 1.39
Bucles posibles para frase verbal

FRASE_VERBAL GRUPO_VERBAL SINTAGMA_NOMINAL


FRASE_VERBAL verbo SINTAGMA_NOMINAL

La primera entrada se elimina de la cola y se expande, pero la nueva se aade al


final de la cola, figura 40:

Figura 1.40
Adicin a la cola

FRASE_VERBAL verbo SINTAGMA_NOMINAL


GRUPO_VERBAL auxiliar verbo [+ SINTAGMA_NOMINAL]

Esto significa que la prxima entrada a expandir es la regla alternativa


FRASE_VERBAL y no la del GRUPO_VERBAL.

2.4.7.- Evaluacin de los controles en profundidad y en anchura.


Ambos producen el mismo resultado, pero no en el mismo orden. Si existe ms
de una solucin, la bsqueda en anchura encuentra primero la solucin con un menor
nmero de pasos como ejemplo lmite tmese la excepcin indicada en el siguiente
4
Una cola es una estructura de datos en la que las extracciones se realizan en el mismo orden en que los
datos fueron introducidos.

- 42 -
Proceso de automatizacin del anlisis sintactico del espaol.

prrafo.
La excepcin ms importante se produce cuando la bsqueda se detiene en
cuanto existe un bucle infinito en el rbol de bsqueda. Considrese una situacin
donde existe una solucin y un bucle infinito en el rbol de bsqueda: la bsqueda en
anchura encontrar la solucin antes de desaparecer en el bucle infinito. La bsqueda en
profundidad encontrar la solucin finita o se perder en el bucle infinito en funcin del
orden en que se defina la gramtica.

Figura 1.41
Caso de bucle infinito

Sea la primera regla de la gramtica:


SENTENCIA SENTENCIA y SENTENCIA
El analizador en profundidad comenzar siempre por esta regla
en la cual existe un bucle infinito por la izquierda que hace que la
bsqueda se pierda en el mismo; sin embargo, si la bsqueda se
realiza en anchura s se podr encontrar la solucin.

SENTENCIA

SENTENCIA y SENTENCIA

SENTENCIA y SENTENCIA

Cuando no hay bucles infinitos no est claro cul es la solucin ms adecuada.


La de profundidad puede ser la opcin ms prctica desde el punto de vista de que
mantiene menos entradas en la pila. Cuando los recursos de memoria en la mquina son
pocos, es digno de tenerse en cuenta el control en profundidad. Actualmente la memoria
no suele ser un problema importante y el seleccionar un mtodo u otro depender de
otros criterios.
2.4.8.- Algunas consideraciones en el anlisis.
La complejidad de la estructura de las sentencias del lenguaje natural hace que

- 43 -
Proceso de automatizacin del anlisis sintactico del espaol.

sea necesario tener en cuenta algunos puntos:


Cada constituyente de la sentencia es posible que vare su significado segn
el contexto. El significado y la funcin de algunas palabras pueden variar
dependiendo de las que las rodean.
La informacin representada por una sentencia depende de la relacin entre
sus constituyentes.
Debido a ello deber aadirse a las categoras una mayor informacin sintctica
y semntica para realizar un anlisis conforme con las sentencias.
Por otro lado, el que un anlisis se pueda llevar a cabo o no sea fsicamente
tratable, es funcin de dos factores principales:
De la estructura del espacio de bsqueda. Pngase como ejemplo el caso en
que se tienen dos derivaciones posibles y que alguna de sus subderivaciones
coinciden.

Figura 1.42
Subrboles coincidentes

SENTENCIA

SINTAGMA_NOMINAL FRASE_VERBAL

adjetivo sustantivo GRUPO_VERBAL SINTAGMA_NOMINAL

Subrbol A
verbo_auxiliar verbo adjetivo sustantivo

Subrbol B

Los subarboles A y el B son iguales, por lo tanto, slo es necesario realizar las
derivaciones una vez.
Entonces sera posible reducir el espacio de bsqueda y por ello algunos
algoritmos de bsqueda tabulan las subderivaciones. Estos algoritmos
tabulares se usan ampliamente en el modelado del lenguaje cuando se
dispone de gramticas apropiadas.
De la exhaustividad del modelo de bsqueda.

- 44 -
Proceso de automatizacin del anlisis sintactico del espaol.

2.4.9.- Resumen.
Se ha visto que es posible realizar un anlisis de una sentencia de manera
descendente o ascendente, dependiendo de si se empieza por un smbolo hiptesis
o por una palabra datos. Adems se ha estudiado que existen dos tipos de control para
realizar el anlisis: en profundidad y en anchura. De este modo se dispone de cuatro
tipos de algoritmos de bsqueda:
1. En profundidad descendente.
2. En anchura descendente.
3. En profundidad ascendente.
4. En anchura ascendente.

- 45 -
Proceso de automatizacin del anlisis sintactico del espaol.

- 46 -
Proceso de automatizacin del anlisis sintactico del espaol.

Captulo 1 Apartado 3
Formalismos gramaticales

3.1.- Introduccin.
Los sistemas gramaticales de los aos de la dcada de 1970 evitaban
deliberadamente el uso intensivo del procesamiento sintctico, e incluso algunos
eliminaban toda la informacin sintctica de sus sistemas; sin embargo, muchos
lingistas ven la sintaxis como una parte fundamental del procesamiento del lenguaje
humano, mientras que los ingenieros del lenguaje contemplan la sintaxis como un
mecanismo para la eliminacin de ambigedades con pequeas cantidades de
informacin. Los lingistas tericos han reaccionado en contra de la gramtica de Noam
Chomsky Gramtica Generativa que se basa principalmente en la informacin
sintctica.
Como resultado de todo esto aparecen varias gramticas que codifican una
mayor cantidad de informacin para la representacin sintctica categora: sustantivo,
persona: tercera, gnero: masculino en lugar de una informacin nica sustantivo,
verbo. Estas gramticas reciben el nombre de Gramticas de Unificacin y resultan ms
discriminantes en los analizadores de sentencias.
Contenidos del apartado:
Gramticas de Unificacin.
Tipos de gramticas segn su funcin.
Tendencias futuras de las gramticas.

3.1.1.- Gramticas de Unificacin.


Cuando se desea procesar un lenguaje es necesario definir su gramtica
formalismos para su representacin. Existen diferentes modelos gramaticales que

- 47 -
Proceso de automatizacin del anlisis sintactico del espaol.

permiten definir la estructura de un lenguaje.


En los ltimos tiempos se estn imponiendo las gramticas denominadas de
Unificacin. El concepto de Gramtica de Unificacin fue introducido por Martin Kay
a finales de la decada de 1970. La caracterstica de estas gramticas es que cada
categora est compuesta por una serie de rasgos; cuando dos categoras se unen para
formar otra mayor, los rasgos deben ser compatibles. Entre los diferentes formalismos
de unificacin se encuentran:

Gramtica de Unificacin de Categoras (CUG: Categorial Unification


Grammar) (Haddock, Klein, et al., 1987; Karttunen, 1989; UszKoreit, 1986).
Gramtica de agregacin de rboles (TAG: Tree Adjuntion Grammar). (Joshi
& Schabes, 1992). Esta gramtica se caracteriza por utilizar unas estructuras
denominadas rboles para la representacin. En este formalismo se definen
dos tipos de rboles; auxiliares e iniciales. Los rboles iniciales representan
las estructuras del lenguaje que no contienen recursividad; las caractersticas
de estos rboles son: 1) todos los nodos internos al rbol son no-terminales,
2) todos los nodos hoja son terminales o no-terminales marcados con
sustitucin5. Por otro lado, los rboles auxiliares representan las estructuras
recursivas, y sus caractersticas son: 1) todos los nodos internos son
no-terminales, 2) todos los nodos hoja son terminales o no-terminales
marcados con sustitucin, excepto en un nodo no-terminal denominado pie
que slo se usa para agregar el rbol a otro nodo, 3) el nodo pie est
etiquetado igual que el nodo raz.
En este formalismo se definen dos tipos de operaciones: sustitucin y
agregacin. En la operacin de sustitucin, el nodo inicial del rbol se
combina con un nodo hoja no-terminal marcado con sustitucin en otro rbol
inicial para dar lugar a un nuevo rbol. En la operacin de agregacin, un
rbol auxiliar se inserta en un nodo no-terminal de un rbol inicial. El nodo
raz y el pie del rbol auxiliar deben emparejarse al nodo al que se agrega el
rbol auxiliar.

5
Los nodos no-terminales se marcan como nodos que pueden ser sustituidos, indicando as que este nodo
puede ser sustituido por el rbol que se deriva del smbolo no terminal.

- 48 -
Proceso de automatizacin del anlisis sintactico del espaol.

Figura 1.43
Operacin de sustitucin.

Figura 1.44
Operacin de agregacin.

Gramtica de Unificacin de Funciones (FUG: Funtion Unification


Grammar). (Kay, 1984).
Gramtica de Estructura de Frase Generalizada (GPSG: Generalized Phrase
Structure Grammar).
Gramtica de Estructura de Frase Dirigida (HPSG: Head-Driven Phrase-
Structure Grammar). (Pollard & Sag, 1994)
Se trata de una gramtica basada en restricciones: aproximacin lxica a
teora gramatical que moldea el lenguaje humano como un sistema de
restricciones sobre estructuras de rasgos.
En la figura 45 se muestra un ejemplo para la sentencia Pedro llora. La
estructura expresa que tal sentencia Pedro llora es un objeto de clase
sentencia, cuya representacin fonolgica es <pedro, llora>, y que ha sido
formada por dos objetos: uno por la sentencia Pedro y otro por llora y que
la semntica contenida en la sentencia es la misma que para llora.
En maysculas aparecen escritos los atributos y les siguen sus valores.

- 49 -
Proceso de automatizacin del anlisis sintactico del espaol.

Figura 1.45
Representacin HPSG

CATEGORA sen tencia


FONO. < pedro, llora >
SINTAXIS ...
CATEGORA sustantivo CATEGORA verbo
FONO. pedro FONO. llora
per 3
DTRS < per 3 , SINTAXIS agr >
SINTAXIS agr num sg
num sg
rel llorar
SEMNTICA Arg
[rel ] SEMNTICA
l Pedro'
arg Arg
Sem
SEMNTICA Sem

Gramtica Funcional del Lxico (LFG: Lexical Funtional Grammar)


En LFG existen dos niveles de representacin sintctica: Estructuras
Constituyentes y Estructuras Funcionales. Las primeras tienen la forma de
estructura de rbol libre del contexto; las segundas estn compuestas por
parejas de atributos y valores los atributos pueden ser caractersticas como
tiempo y genero, o funciones como sujeto u objeto. El nombre de la teora
pone de relieve una importante diferencia entre LFG y la tradicin
chomskiana a partir de la que se ha desarrollado. Muchos fenmenos se
orientan a ser analizados de una manera ms natural en trminos de
funciones gramaticales representadas en el lxico o en Estructuras
Funcionales que al nivel de la estructura de frase. Un ejemplo es la
alternancia entre activa y pasiva ms que tratarse como una
transformacin, se maneja en el lxico. Las funciones gramaticales no son
derivadas de las configuraciones de estructura de frase, pero se representan
en el nivel paralelo de la Estructura Funcional.

- 50 -
Proceso de automatizacin del anlisis sintactico del espaol.

Figura 1.46
Estructura Constituyente.
S f1

(f1 SUBJ) = f2 f1 = f4
NP f2 VP f4

f2 = f3 f4 = f5 (f4 OBJ) = f6
N f3 V f5 NP f6

(f3 PRED) = Juan (f6 PRED) = comprar <(f5 SUBJ)(f5 OBJ)> f6 = f7


(f3 NUM) = SING (f5 SUBJ NUM) = SING N f7
(f3 PERS) = 3 (f5 SUBJ PERS) = 3
Juan compr
(f7 PRED) = pan
(f7 NUM) = SING
(f7 PERS) = 3
pan
Figura 1.47
Estructura Funcional.

PRED 'comprar < ( f 5 SUBJ ), ( f 5 OBJ ) > '


f1 f2 PRED 'Juan'
f4 SUBJ f3 NUM sing
f5 PERS 3
f6 PRED 'pan'
OBJ f7 NUM sing
PERS 3

Gramtica de Enlace (Link Grammar). Hace referencia a una gramtica de


enlaces cuando es posible dibujar enlaces entre las palabras de una sentencia
de forma que: (1) los requerimientos locales de cada palabra son satisfechos,
(2) los enlaces no se cruzan, y (3) las palabras forman un grfico conectado.

- 51 -
Proceso de automatizacin del anlisis sintactico del espaol.

Gramtica Relacional (Relational Grammar). Esta gramtica fue creada


inicialmente para el entendimiento de lenguajes visuales como las
expresiones matemticas y los diagramas. La idea bsica es que el
vocabulario de los Lenguajes Relaciones est compuesto de objetos y estos
se agrupan jerrquicamente en expresiones de niveles superiores a travs de
relaciones entre objetos.

3.1.2.- Tipos de gramticas segn su funcin.


Existe una posible divisin de las gramticas segn la funcin a la que se
orienten; se pueden distinguir tres tipos:
Gramticas Lingsticas. Las teoras lingsticas han sido usadas para
explicar los aspectos de tipo lingstico de unin de los elementos del
lenguaje.
Gramticas Orientadas a Tareas. Gramticas que indican cmo las relaciones
relevantes para una tarea deben ser especificadas en el lenguaje natural.
Gramticas Orientadas a Datos. A partir de un proceso de aprendizaje se
determina una funcin de evaluacin que da los mejores resultados para el
anlisis de un corpus dado.

3.1.3.- Tendencias futuras de las gramticas.


Se tiende a que los sistemas orientados a interactuar entre el usuario y la
mquina en lenguaje natural realicen tanto el anlisis como la generacin de estructuras;
por ello, se recomienda que las gramticas sean tiles para ambos casos: gramticas
reversibles se caracterizan por ser capaces tanto de analizar como de generar. Son
destacables los trabajos sobre gramticas reversibles realizados por Gertjan van Noord.
Un programa o sistema es denominado r-reversible si evala una relacin binaria
r en ambas direcciones. La idea es que dado un elemento de una pareja relacionada, el
programa fije el otro elemento de la pareja. Para codificar la direccin de la relacin, se
asume que la entrada al programa consiste en una pareja (direccin, x). El valor de
direccin ser binario e indica si el proceso se realiza de izquierda a derecha o de
derecha a izquierda generacin o anlisis.

- 52 -
Proceso de automatizacin del anlisis sintactico del espaol.

Captulo 1 Apartado 4
Evaluacin de la eficiencia de los sistemas de anlisis
sintctico automatizado

Las dos medidas que se ponen en juego para evaluar los sistemas de anlisis
sintctico son:
B
Convocatoria =
D
B = Nmero de anlisis de la sentencia bien relizados por el sistema.
D = Nmero de anlisis posibles de la sentencia.
B
Precisin =
G
G = Nmero de anlisis devueltos por el sistema bien o mal realizados.

Tabla 1.2
Ejemplo de casos posibles

Nivel de
Caso 1 Caso 2 Caso 3 Caso 4 Caso 5 Caso 6
deteccin.
Nmero de anlisis
posibles de la 2 2 2 2 2 2
sentencia (D)
Nmero de anlisis
devueltos por el
2 4 1 2 8 2
sistema bien o mal
realizados (G)
Nmero de anlisis de
la sentencia bien
2 2 1 1 2 0
relizados por el
sistema (B)
Convocatoria 100% 100% 50% 50% 100% 0%
Precisin 100% 50% 100% 50% 25% 0%

- 53 -
Proceso de automatizacin del anlisis sintactico del espaol.

- 54 -
Proceso de automatizacin del anlisis sintactico del espaol.

Captulo 2

Resumen gramatical del espaol

- 55 -
Proceso de automatizacin del anlisis sintactico del espaol.

- 56 -
Proceso de automatizacin del anlisis sintactico del espaol.

Captulo 2 Apartado 1
La sintaxis del espaol

1.1.- Introduccin.
El anlisis sintctico es la descripcin formal de la estructura de una sentencia y
de las relaciones que entre sus elementos se establecen. En el presente documento se
presentan las diferentes estructuras que se dan en la lengua espaola. Se pretende dar
una visin exclusivamente estructural sin entrar en cuestiones semnticas o de tipo
lgico, debido a que su finalidad es la creacin de una gramtica formal que permita la
implementacin de una herramienta de anlisis sintctico automatizado.

1.2.- La oracin o proposicin.


Se denomina oracin a un conjunto de palabras tal que la combinacin de las mismas da lugar a
una unidad con sentido completo, es decir, no necesita de ninguna otra unidad para tener significacin.
Una oracin puede estar formada por dos unidades un sujeto ms un predicado o por una
sola un predicado; diferencindose as entre oraciones unimembres o bimembres.
El caso de la oracin unimembre se da cuando no existe un sujeto al ser el verbo impersonal.
oracin predicado
llova
En el caso de las oraciones bimembres siempre existe un sujeto y un predicado. Estos dos
constituyentes se pueden ordenar y combinar de diferentes maneras.
oracin sujeto + predicado
el coche es rojo
oracin predicado + sujeto
hablaron los accionistas
oracin predicado + sujeto + predicado
hablaron los accionistas sobre los beneficios

oracin {sujeto tcito o desinencial, sujeto indeterminado} + predicado

- 57 -
Proceso de automatizacin del anlisis sintactico del espaol.

{ellos} te llamaron esta tarde


{no se sabe quin} tocan al timbre
Para este ltimo caso el sujeto s existe pero se encuentra elidido, siendo
reconocible a travs del verbo o no se puede asegurar quin realiza o recibe la accin
es a lo que se llama oracin impersonal eventual.

1.3.- La oracin compuesta.


Varias oraciones pueden unirse para dar lugar a otra oracin, se har mencin a
estas oraciones como proposiciones. Segn ONI90 es posible dividirlas en:
Tabla 2.1
Clasificacin de las oraciones compuestas
Copulativas
Disyuntivas
Adversativas
Explicativas
Coordinadas
Yuxtapuestas
Distributivas
Propiamente coordinadas

Conclusivas
Ilativas
Continuativas

Inordinadas
Subordinadas
Adverbiales

Proposiciones coordinadas:
Proposiciones coordinadas copulativas. Indican una unin de significados, a
una proposicin se le aade el significado de otra. Se utilizan los conectores: y,
e, ni y excepcionalmente que
oracin proposicin + conjuncin {y, e, que} + proposicin
vendr y cantar
oracin conjuncin {ni} + proposicin + conjuncin {ni} + proposicin
ni vendr ni te llamar
Proposiciones coordinadas disyuntivas. Expresan juicios contradictorios, una
proposicin excluye a la otra. Conectores: o, u, o bien o similares

oracin proposicin + conjuncin {o, u, o bien} + proposicin


te marchas o te echo

- 58 -
Proceso de automatizacin del anlisis sintactico del espaol.

oracin conjuncin {o, u, o bien} + proposicin + conjuncin {o, u, o


bien} + proposicin
o bien vienes a las seis o vienes maana temprano
Proposiciones coordinadas adversativas. Indican oposicin, lo que afirma una
contradice a la otra. Conectores: mas, pero, aunque, sino, sin embargo o
similares
oracin proposicin + conjuncin {mas, pero, aunque, sino, sin
embargo} + proposicin
te llam pero no estabas
Proposiciones coordinadas explicativas. Tienen un significado de aclaracin o
explicacin. Los conectores aparecen entre comas. Conectores: o sea, es decir,
esto es o similares.
sali tarde, es decir, no llegar a tiempo
Proposiciones coordinadas distributivas. Indican alternancia. Se clasifican en
yuxtapuestas o propiamente coordinadas.
Las yuxtapuestas distributivas. Se encuentran unidas mediante elementos que no
son conjunciones y que pueden ser adverbios o pronombres; aparecen
encabezando cada una de las proposiciones que dan lugar a la oracin completa.
Conectores: unos ... otros, stos ... aquellos, aqu ... all, etc.
oracin conector + proposicin + conector + proposicin
aqu estuve, all llegar
Las propiamente coordinadas. Siempre unidas por conjunciones. Conectores: ya
... ya, ni ... ni, bien ... bien, etc.
oracin conjuncin + proposicin + conjuncin + proposicin
ya lleg, ya se va
Proposiciones coordinadas ilativas. Indican una relacin de causa efecto,
siendo la primera proposicin la causa y la segunda el efecto o conclusin a la
que da lugar y se clasifican en conclusivas y continuativas.
Conclusivas. La segunda proposicin indica una conclusin de la primera; el
conector utilizado es la coma y la segunda proposicin viene introducida por
elementos como luego, as que, por lo tanto, etc.

oracin proposicin + coma + introductor + proposicin

- 59 -
Proceso de automatizacin del anlisis sintactico del espaol.

canta, luego no es mudo


Continuativas. Debido a que el conector es un punto, un punto y coma o una
coma se analizan por separado; no obstante, en la segunda existe un introductor
que denota una relacin con la oracin anterior que permitira realizar un anlisis
conjunto.
oracin proposicin + punto + introductor + proposicin
llegamos tarde. As que no entramos a clase
Proposiciones subordinadas:
Se dividen en dos grupos dependiendo de la funcin que realiza la proposicin
subordinada en la oracin:
Proposiciones inordinadas. Tienen funcin de objeto o adyacente.
objeto conector + proposicin
ella quiere que le escribas
Subordinadas adverbiales. Tienen la funcin de circunstancial.
circunstancial conector + proposicin
te llamar cuando llegue

1.4.- El sujeto.
El sujeto es la parte de la oracin que concuerda con el verbo en nmero y
persona, siendo el que realiza una accin o al que se le atribuye algo.
El sujeto puede aparecer o no; se habla entonces de sujeto expreso, cuando
aparece, o tcito o desinencial, cuando se encuentra sobreentendido. Tambin se da el
caso de la no existencia del sujeto cuando el ncleo del predicado es un verbo
impersonal.
el perro mordi al nio es una oracin con sujeto expreso.
{l} llam por telfono ayer es una oracin con sujeto tcito.
llovi durante varios das oracin sin sujeto.
NOTA: El trabajo actual se centrar en el lenguaje escrito y, a partir de aqu,
cuando se haga referencia al sujeto se supondr que se trata de un sujeto expreso.
El sujeto puede adems dividirse en dos tipos, segn el nmero de ncleos que
aparezcan en el mismo; con ello se habla de sujeto simple y de sujeto compuesto.
Tipos de sujeto:
Por su naturaleza:

- 60 -
Proceso de automatizacin del anlisis sintactico del espaol.

Nominal. Su ncleo es un sustantivo.


el nio corre
Pronominal. Su ncleo es un pronombre.
l vendr a las ocho
Verbal. El ncleo es un verbo sustantivado un infinitivo.
comer es un placer
Proposicional. El sujeto est formado por una proposicin de valor
sustantivo.
quien te llam vendr a las ocho
Por su composicin
Unitario. Un solo ncleo.
Mara toca la guitarra
Complejo. Un ncleo ms un conjunto de elementos adyacentes.
el coche de Juan est roto
Mltiple. Ms de un ncleo.
el coche y la casa se quemaron
Por su funcin
Agente. Realiza la accin del verbo.
yo canto
Causativo. El sujeto es la causa de la oracin
Juan construy un gran edificio
Paciente. No ejecuta la accin sino que la recibe. Se da en la voz pasiva.
los rosales fueron podados
Pseudoagente. Cuando el sujeto parece que realiza la accin pero en
realidad es un sujeto paciente.
yo me cort el pelo
Estativo. Aparece en oraciones copulativas.
el coche est roto
Por su presencia
Expreso. Aparece en la oracin
los nios juegan
Elptico o desinencial. Se omite y es conocido a travs de la desinencia
del verbo.

- 61 -
Proceso de automatizacin del anlisis sintactico del espaol.

ayer fuimos a la playa (nosotros)


Indeterminado. Es el sujeto de oraciones impersonales eventuales.
tocan al timbre
Contextual. Cuando es reconocido a travs del contexto.
el profesor entr en la clase. Comenz explicando ... (el profesor)
Desde el punto de vista estructural el sujeto puede estar constituido de la
siguiente manera:
sujeto sintagma nominal homogneo
el nio juega
sujeto sintagma nominal heterogneo
Juan y Mara fueron de vacaciones
sujeto sintagma nominal sustitutivo
yo vendr pronto
sujeto proposicin con funcin de sujeto
quien te llam volver a llamar

1.5.- El sintagma nominal.


Todo sintagma est constituido por un conjunto de elementos lingsticos, el tipo
de sintagma depender del elemento que forme su ncleo. As, un sintagma nominal es
un conjunto de elementos cuyo ncleo es un nombre desde un punto de vista funcional.
El sintagma nominal es una de las estructuras que ms aparece formando parte
de los diferentes componentes de la oracin. Se definen distintos tipos de sintagmas
nominales segn su estructura, diferencindose tres grupos: el sintagma nominal
homogneo, el sintagma nominal heterogneo y el sintagma nominal sustitutivo.

1.5.1.- El sintagma nominal homogneo.


La estructura del sintagma nominal homogneo viene dada por la regla:
sintagma nominal homogneo presentadores + ncleo nominal + adyacentes
En esta estructura puede faltar cualquier elemento salvo el ncleo nominal.
presentador + ncleo nominal + adyacente el coche azul
presentador + ncleo nominal varios barcos
ncleo nominal + adyacente nio bueno
ncleo nominal Mara

- 62 -
Proceso de automatizacin del anlisis sintactico del espaol.

Y tambin los elementos pueden aparecer en distintos rdenes, las posibles


combinaciones del sintagma nominal homogneo son:
sintagma nominal homogneo presentador + ncleo nominal +
adyacente
el coche azul es mo
sintagma nominal homogneo presentador + ncleo nominal +
adyacentes
el coche verde grande est en venta
sintagma nominal homogneo presentador + adyacente + ncleo
nominal
el gran coche fue presentado ayer
sintagma nominal homogneo presentador + adyacentes + ncleo
nominal
el pequeo gran hombre abandon la carrera
sintagma nominal homogneo presentador + ncleo nominal
la casa est en ruinas
sintagma nominal homogneo ncleo nominal + presentador
nio mo qu pena me das
sintagma nominal homogneo ncleo nominal + adyacente
plazas grandes implican grandes gastos
sintagma nominal homogneo ncleo nominal + adyacentes
plaza grande floreada que fue construida hace un ao
sintagma nominal homogneo adyacente + ncleo nominal
pequeo granuja ven aqu ahora mismo
sintagma nominal homogneo adyacentes + ncleo nominal
pequeo gran hombre, no te rindas
Para los presentadores existe un conjunto de posibilidades que se presentan a
continuacin:
presentador determinante actualizador
determinante actualizador artculo
el coche est en el taller
determinante actualizador demostrativo
esa casa es ma

- 63 -
Proceso de automatizacin del anlisis sintactico del espaol.

determinante actualizador posesivo


su carpeta esta llena de papeles comprometidos
Los posesivos pueden encontrarse antepuestos o pospuestos al sustantivo que
acompaan, dando lugar a dos grupos:
Posesivos antepuestos: mi, mis, tu, tus, su, sus, nuestro, nuestra, nuestros,
nuestras, vuestro, vuestra, vuestros, vuestras.
mi coche lo compr all
Posesivos pospuestos: mo, ma, mos, mas, tuyo, tuya, tuyos, tuyas, suyo, suya,
suyos, suyas, nuestro, nuestra, nuestros, nuestras, vuestro, vuestra, vuestros, vuestras.
el coche mo lo usaras cuando yo te lo permita
presentador determinante cuantificador
determinante cuantificador numeral
diez das faltan para acabar
determinante cuantificador extensivo
Son cuantificadores que indican una medida aproximada: un, unos, una, unas, algn,
alguno, algunos, alguna, algunas, ninguno, ninguna, cierto, ciertos, tal, tales, mucho,
muchos, mucha, muchas, poco, pocos, poca, pocas, bastante, bastantes, demasiado,
demasiados, demasiada, demasiadas, cualquiera, otro, otros, otra, otras, varios, varias,
ambos, ambas,...
cualquier coche me viene bien
ambos hermanos se llevan muy bien
presentador introductor (slo, sobre todo,...)
slo esta casa te ser alquilada
sobre todo los informticos no estarn all
Dentro de los elementos que forman el sintagma nominal homogneo se definen
los siguientes:
presentador adjetivo demostrativo
este rbol ser cortado
presentador adjetivo posesivo antepuesto
mi libro no se publicar hasta dentro de un ao
presentador adjetivo posesivo antepuesto o pospuesto
nuestra casa est abierta para ti
el libro nuestro es un recuerdo de familia

- 64 -
Proceso de automatizacin del anlisis sintactico del espaol.

presentador adjetivo posesivo pospuesto


el coche mo est en el taller
presentador otros adjetivos
pocos nios vendrn a la fiesta
presentador artculo determinado
la mesa del comedor es pequea
ncleo nominal sustantivo
el barco ser puesto en venta
adyacente adjetivo calificativo
el coche rojo fue el causante del accidente
adyacentes adyacente + adyacente
el pequeo gran hombre te llam
adyacentes adyacente + adyacentes
el color verde brillante extrao no me gusta
Los presentadores y los adyacentes se engloban en un nico grupo que es el de
modificador.

1.5.2.- El sintagma nominal sustitutivo.


El sintagma nominal sustitutivo es aquel en el cual el ncleo nominal no est
formado por un sustantivo sino por una palabra cuya categora gramatical puede ser:
pronombre personal tnico, otro pronombre, adjetivo, infinitivo o pronombre de relativo
sintagma nominal sustitutivo presentador + ncleo nominal +
adyacente
el cantar aturdidor me est quitando el sueo
sintagma nominal sustitutivo presentador + ncleo nominal +
adyacentes
este bailar mareante repetitivo me tiene aturdido
sintagma nominal sustitutivo presentador + adyacente + ncleo
nominal
el dulce cantar me atrajo
sintagma nominal sustitutivo presentador + adyacentes + ncleo
nominal
la dulce tranquilizadora cancin hizo que el nio se durmiera

- 65 -
Proceso de automatizacin del anlisis sintactico del espaol.

sintagma nominal sustitutivo presentador + ncleo nominal


el cual vino por Navidad
sintagma nominal sustitutivo ncleo nominal + presentador
cantar mo que extrao suena
sintagma nominal sustitutivo ncleo nominal + adyacente
cantar dulce de los pjaros
sintagma nominal sustitutivo ncleo nominal + adyacentes
situacin econmica actual preocupa a los ciudadanos
sintagma nominal sustitutivo adyacente + ncleo nominal
agobiante viajar que me est cansando
sintagma nominal sustitutivo adyacentes + ncleo nominal
feroz solitario animal que merodeaba por los alrededores
Las estructuras permitidas para el ncleo nominal:
ncleo nominal pronombre personal tnico
yo vendr pronto
ncleo nominal pronombre personal tono
me llam
ncleo nominal otro pronombre
nadie vendr a mi fiesta
ncleo nominal adjetivo
el rojo brillaba
ncleo nominal infinitivo
el comer es una necesidad
ncleo nominal pronombre de relativo
el cual no s si vendr
Los adyacentes y los presentadores se mantienen igual que en el sintagma nominal
homogneo:
presentador adjetivo demostrativo
este caminar es muy montono
presentador adjetivo posesivo antepuesto
mi cantar es melodioso
presentador adjetivo posesivo antepuesto o pospuesto
nuestro bailar parece el de las gallinas

- 66 -
Proceso de automatizacin del anlisis sintactico del espaol.

presentador adjetivo posesivo pospuesto


el correr tuyo es como el de las tortugas
presentador artculo determinado
el andar es bueno para la salud
adyacente adjetivo calificativo
el ruidoso tronar retumbaba en mis odos
adyacentes adyacente + adyacente
nuestro triste acompasado caminar se vio alegrado por las canciones
adyacentes adyacente + adyacentes
el pintar verde brillante extrao

1.5.3.- El sintagma nominal heterogneo.


Aparece cuando existe ms de un ncleo nominal. Se define su estructura a partir
del sintagma nominal homogneo, del sintagma nominal sustitutivo y de s mismo.
sintagma nominal heterogneo sintagma nominal homogneo +
conector + sintagma nominal homogneo
el nio y la nia no vendrn
sintagma nominal heterogneo sintagma nominal homogneo +
conector + sintagma nominal sustitutivo
Mara y yo iremos de viaje
sintagma nominal heterogneo sintagma nominal homogneo +
conector + sintagma nominal heterogneo
la casa, el coche y el barco son de su propiedad
sintagma nominal heterogneo sintagma nominal sustitutivo +
conector + sintagma nominal sustitutivo
t y yo podramos ir al cine
sintagma nominal heterogneo sintagma nominal sustitutivo +
conector + sintagma nominal homogneo
ella y el nio estarn en casa a las diez
sintagma nominal heterogneo sintagma nominal sustitutivo +
conector + sintagma nominal heterogneo
nosotros, la pandilla y los otros no fuimos los culpables de nada

- 67 -
Proceso de automatizacin del anlisis sintactico del espaol.

1.6.- La proposicin como sujeto.


El sujeto tambin puede estar formado por una proposicin.
proposicin con funcin de sujeto proposicin de infinitivo
salir corriendo cansa
proposicin con funcin de sujeto proposicin introducida por
conjuncin
que trabajes me gusta

1.7.- El predicado.
El predicado es la parte de la oracin que dice algo del sujeto, concordando con ste
en nmero, persona y gnero. Est formado por uno o varios ncleos verbales y una
serie de complementos.

1.7.1.- El ncleo verbal.


En cuanto al ncleo verbal puede ser desde una forma verbal simple hasta una
locucin, pasando por las formas verbales compuestas y las perfrasis verbales. Las
estructuras que lo forman son las siguientes:
ncleo verbal forma verbal simple
forma verbal simple verbo
ellos fueron de pesca
ncleo verbal forma verbal compleja
forma verbal compleja auxiliar + participio
el caso fue estudiado por los fiscales
forma verbal compleja auxiliar de incidencia directa + infinitivo
suele cantar por las maanas
forma verbal compleja auxiliar de incidencia indirecta + conjuncin
+ infinitivo
tiene que venir a media tarde
forma verbal compleja auxiliar de incidencia indirecta + preposicin
+ infinitivo
ha de tener cuidado si no quiere perderlo todo
forma verbal compleja auxiliar + gerundio
el equipo local va ganando

- 68 -
Proceso de automatizacin del anlisis sintactico del espaol.

forma verbal compleja forma verbal simple + conjuncin coordinante


+ forma verbal simple
los nios juegan y ren
forma verbal compleja forma verbal simple + conjuncin coordinante
+ forma verbal compleja
bailan y cantan durante la noche
forma verbal compleja lexa compleja
lexa compleja verbo + sintagma nominal
hace falta que vengas
lexa compleja verbo + sintagma preposicional
da por supuesto que no ir
ncleo verbal infinitivo con valor de forma verbal
cmo pensar en ello?
Las estructuras del siguiente nivel son:
auxiliar verbo
est comiendo a deshora
auxiliar de incidencia directa verbo
suele cantar por las maanas
auxiliar de incidencia indirecta verbo
tiene que venir a media tarde
procltico pronombre personal tono
lo har por la tarde
1.7.2.- El objeto directo.
Su funcin es la de concretar la significacin del verbo de la oracin. Est
formado por un sintagma nominal o por un sintagma preposicional encabezado por la
preposicin a y exclusivamente cuando se refiere a persona, animal o cosa
personificada. Lo exigen los verbos transitivos para tener sentido completo. Tambin
realizan la funcin de objeto directo los pronombres personales: lo, los, la, las, me, te,
se, nos, os.
trae el libro trelo
Las pruebas para identificar el objeto directo son:
1 Si se transforma la oracin en pasiva, el objeto directo se convierte en sujeto
agente.

- 69 -
Proceso de automatizacin del anlisis sintactico del espaol.

el Betis gan el partido el partido fue ganado por el Betis


2 El objeto directo se puede sustituir por los pronombres lo, la, los, las.
el Betis gan el partido el Betis lo gan
Llamaremos oraciones transitivas a las que llevan objeto directo y oraciones
intransitivas a las que carecen de l.
Las estructuras del objeto directo son:
objeto directo sintagma nominal homogneo
Juan cant una cancin estupenda
objeto directo sintagma nominal heterogneo
treme un vaso de agua
objeto directo sintagma nominal sustitutivo
lo comprar maana
objeto directo sintagma preposicional
he llamado a tu padre
objeto directo proposicin de infinitivo
quiere cantar en el saln
objeto directo proposicin introducida por conjuncin
quiero que me llames
objeto directo proposicin de estilo directo
Juan dijo: <<llmame esta tarde>>

1.7.3.- El objeto indirecto.


Complementa indirectamente el verbo, indica sobre qu o quin recae la accin,
expresa la persona, animal o cosa que recibe las consecuencias de la accin. Est
formado por un sintagma preposicional encabezado siempre por la preposicin a.
Tambin pueden funcionar como objeto indirecto los pronombres personales me, te, se,
le, nos, os, les.
el mdico ha recetado penicilina a mi abuelo
Las pruebas para identificar el complemento indirecto son:
1 No cambia de funcin al transformar la oracin en pasiva.
yo he trado un regalo a Pedro un regalo ha sido trado a Pedro (por m)
2 Puede ser sustituido por el pronombre le, les.

- 70 -
Proceso de automatizacin del anlisis sintactico del espaol.

yo he trado un regalo a Pedro yo le he trado un regalo


Las estructuras posibles para el objeto indirecto son:
objeto indirecto sintagma preposicional
sintagma preposicional preposicin + sintagma nominal homogneo
escrib unos versos a Mara
sintagma preposicional preposicin + sintagma nominal sustitutivo
escrib unos versos a ella
sintagma preposicional preposicin + sintagma nominal heterogneo
comprar bombones a Mara y su hija
sintagma preposicional preposicin + proposicin
quiere a quien te quiera
objeto indirecto sintagma nominal sustitutivo
cmprale fruta

1.7.4.- El atributo.
Las oraciones con atributo se denominan atributivas o cualitativas y se caracterizan
por llevar un verbo copulativo; cuando el verbo no es copulativo las oraciones se
denominan predicativas. El ncleo de estas oraciones lo forma el atributo y no el verbo.
Las realizaciones sintagmticas del atributo son:
atributo sintagma nominal homogneo
Juan es un buen amigo
atributo sintagma nominal sustitutivo
mi coche es aquel
atributo sintagma nominal heterogneo
el coche es grande y azul
atributo sintagma preposicional
sintagma preposicional preposicin + sintagma nominal homogneo
Manolo es de Las Palmas
sintagma preposicional preposicin + sintagma nominal sustitutivo
(pronombre)
el libro es de ella
sintagma preposicional preposicin + sintagma nominal heterogneo
el coche es de ella y Juan

- 71 -
Proceso de automatizacin del anlisis sintactico del espaol.

atributo proposicin
atributo proposicin de infinitivo
su orden es traer el coche
atributo proposicin introducida por que
la situacin del pas est que arde

1.7.5.- El circunstancial.
Es un elemento complementario y no obligatorio en una oracin que puede ser
desempeado por un sintagma preposicional, un sintagma nominal, un sintagma
adverbial o toda una oracin subordinada adverbial. En cualquier caso indica una
circunstancia referida a la accin verbal de tiempo, de modo, de lugar, de cantidad, de
afirmacin, de negacin, de duda, etc.
Luis corri ayer
nos dirigimos a la ciudad
No cambia al poner la oracin en pasiva y no es sustituible por un pronombre.
hoy yo he trado un libro hoy un libro ha sido trado por m
Las posibles realizaciones sintagmticas del circunstancial son:
circunstancial sintagma preposicional
sintagma preposicional preposicin + sintagma nominal
ven a las tres
sintagma preposicional preposicin + sintagma verbal
llegaremos al salir el sol
sintagma preposicional preposicin + sintagma adverbial
no llegaremos hasta entonces
circunstancial sintagma adverbial
sintagma adverbial adverbio
no vendr
sintagma adverbial adverbio + adverbio
l lleg muy tarde
sintagma adverbial adverbio + sintagma preposicional
estaremos lejos del pas
sintagma adverbial adverbio + sintagma adverbial
muy adorablemente te escuch

- 72 -
Proceso de automatizacin del anlisis sintactico del espaol.

sintagma adverbial locucin adverbial


de todas maneras no estar
circunstancial sintagma nominal
har el examen la tarde del seis
circunstancial sintagma nominal + adverbio
poco tiempo despus fue expulsado
circunstancial proposicin
proposicin introducida por transpositor
iremos cuando queramos
proposicin de gerundio
la convenci cantando una bella cancin
proposicin de participio absoluto
finaliz el trabajo resueltas las dudas
Es posible dividir el circunstancial en diferentes tipos en funcin de la informacin
semntica de la estructura adverbial que lo forma. As es posible hablar de:
Circunstancial de afirmacin
s, ir temprano
Circunstancial de argumento
charlaron sobre el tema
Circunstancial de cantidad
compramos cuatro kilos
Circunstancial de causa
todo sali mal por su ineptitud
Circunstancial de compaa
fue a la fiesta con Mara
Circunstancial de duda
tal vez pueda ir ms tarde
Circunstancial de fin
l trabaj duro para ganar dinero
Circunstancial de lugar
pasaron todo el da en casa
Circunstancial de medio
pidi que realizaran el examen con bolgrafo azul

- 73 -
Proceso de automatizacin del anlisis sintactico del espaol.

Circunstancial de modo
l la bes dulcemente
Circunstancial de negacin
no lo llamaron
Circunstancial de oposicin
los de derechas votaron contra los de izquierdas
Circunstancial de tiempo
el encuentro se produjo el martes

1.7.6.- El complemento agente.


Es el elemento que ejecuta la accin verbal en una oracin pasiva su ncleo
verbal est en voz pasiva. Va encabezado por las preposiciones por o de.
los ladrones del supermercado fueron detenidos por la polica
La prueba para identificarlo es: Se convierte en el sujeto al transformar la
oracin en activa.
la polica detuvo a los ladrones del supermercado
complemento agente sintagma preposicional (preposiciones: por, de)
sintagma preposicional preposicin (por, de) + sintagma nominal
homogneo
la cancin fue interpretada por Juan
de todos es reconocido su inters
sintagma preposicional preposicin (por, de) + sintagma nominal
sustitutivo
el incendio fue provocado por ellos
sintagma preposicional preposicin (por, de) + sintagma nominal
heterogneo
la casa fue adornada por m y mi amiga

1.7.7.- El complemento predicativo.


Se trata de un complemento especial cuya funcin es la de complementar la
significacin de dos elementos oracionales. Est formado por un adjetivo o un sintagma
nominal que complementa al verbo y al sujeto, o bien, al verbo y al objeto directo.

- 74 -
Proceso de automatizacin del anlisis sintactico del espaol.

Predicativo subjetivo. Formalmente se parece al atributo, pero se distingue de l


porque no va con verbos copulativos. No es sustituible por lo como lo es el atributo,
tal y como puede verse en el siguiente ejemplo.
complemento
atributo
predicativo

"el toro cay muerto" "el toro est muerto"

"el toro lo cay" "el toro lo est"

Concuerda con el sujeto en gnero y nmero.


el toro cay muerto
los toros cayeron muertos
predicativo subjetivo sintagma adjetivo
Juan escribi tranquilo
predicativo subjetivo sintagma preposicional
yo vivo sin problemas
Predicativo objetivo. Concuerda con el objeto directo en gnero y nmero.
yo encontr enfermo al gato
yo encontr enfermos a los gatos
predicativo objetivo sintagma adjetivo
lo encontraron nervioso
predicativo objetivo sintagma preposicional
lo vi en un estado lamentable
predicativo objetivo sintagma nominal
encontr marchitas las rosas

1.7.8.- El suplemento.
Es un complemento del verbo cuya funcin la realiza un sintagma preposicional
que no acta como circunstancial, aunque lo parezca, porque no equivale a un adverbio.
Desde el punto de vista de su alcance es similar al objeto directo ya que delimita y
precisa el significado del verbo al que acompaa.
pensaba en las palabras de Andrs
me acord de ti
En una misma oracin puede haber suplemento y complemento circunstancial.
me acord de ti ayer

- 75 -
Proceso de automatizacin del anlisis sintactico del espaol.

Nunca pueden coincidir un suplemento y un complemento directo, Son


incompatibles
Como principales caractersticas del suplemento se encuentran:
Puede suprimirse sin que cambie el significado de la oracin.
No se ve afectado por el cambio de gnero y nmero del sujeto.
Siempre se encuentra introducido por una preposicin.
Su posicin en la oracin es libre, puede cambiarse de lugar sin cambiar
el significado de la misma.
Las estructuras de suplemento son:
suplemento sintagma preposicional
sintagma preposicional preposicin + sintagma nominal
ellos confan en el progreso
sintagma preposicional preposicin + sintagma nominal
sustitutivo
ellos confan en ella

1.7.9.- Las estructuras del predicado.


Las reglas que definen las estructuras del predicado vienen dadas por las
combinaciones de elementos que puedan aparecer en el mismo. En una definicin
formal de tipo estructural, sera necesario indicar todas las posibles combinaciones;
como la colocacin de la mayor parte de los elementos es libre, se originara un enorme
nmero de posibles estructuras del predicado.

1.8.- El vocativo.
El vocativo es un sintagma nominal con el cual se llama la atencin de aquel o
aquello a lo que se dirige el interlocutor. Como llamada de atencin no tiene ninguna
funcin ni relacin con ninguno de los elementos de la oracin, sino que debe
considerarse dentro del contexto total. Desde un punto de vista gramatical puede
considerarse una proposicin yuxtapuesta. Como caracterstica principal, cabe decir que
siempre se encuentra separado del resto de la oracin por comas.
vocativo sintagma nominal
t, te he dicho que no vengas tarde

- 76 -
Proceso de automatizacin del anlisis sintactico del espaol.

- 77 -
Proceso de automatizacin del anlisis sintactico del espaol.

Captulo 2 Apartado 2
Formalizacin estructural

2.1.- Resumen estructural de la gramtica.

En las siguientes tablas se muestra la gramtica desde un punto de vista


estructural. La primera columna de la tabla 2.2 muestra las estructuras que pueden
generarse directamente de las de partida que aparecen en el fila inferior. Cada cuadro de
la tabla indica, con un s o no, si la estructura puede o no generarse a partir de la
estructura de partida indicada.

Tabla 2.2

Sujeto, verbo y complementos


atributo no no no s no s no s s s s
circunstancial no no no s s no s s s no s
ncleo verbal s s s no no no no no no no no
objeto directo no no no s si no no s s s s
objeto indirecto no no no no no no no no no no s
predicativo objetivo no no no no no no no s s no s
predicativo subjetivo no no no no no s no no no no s
sujeto no no no s si no no s s s no
suplemento no no no no no no no no no no s
complemento agente no no no no no no no no no no s
vocativo no no no no no no no s s s no


infinitivo con valor de forma verbal

sintagma nominal heterogneo

estructuras generadas
sintagma nominal homogneo

sintagma nominal sustitutivo


proposicin subordinada

sintagma preposicional
forma verbal compleja

forma verbal simple

sintagma adverbial
sintagma adjetivo
proposicin

estructuras de partida

- 78 -
Proceso de automatizacin del anlisis sintactico del espaol.

En la tabla 2.3 aparecen las oraciones simples consideradas en la primera


columna y las combinaciones de sujeto y predicado a partir de las cuales pueden
formarse.
Tabla 2.3

Oraciones simples
oracin transitiva no s s s s
oracin atributiva no s s s s
oracin intransitiva no s s s s
oracin de suplemento no s s s s
oracin pasiva no s s s s

predicado + sujeto +predicado


estructuras generadas

sujeto + predicado

predicado + sujeto

predicado
estructuras de partida
sujeto

Finalmente quedan por definir como estructuras posibles a aceptar por la


gramtica las oraciones compuestas y el predicado cuyas posibles construcciones
pueden ser definidas como:
Oraciones compuestas = conjunto de dos o ms proposiciones unidas entre s
Predicado = combinacin de las estructuras: atributo, circunstanciales, ncleo
verbal, objeto directo, predicativo objetivo, predicativo subjetivo, suplemento,
complemento agente.

2.2.- Reglas generadas.

Del estudio de la gramtica espaola se infiere el conjunto de reglas que


representa la gramtica y que ser utilizado para la automatizacin del anlisis sintctico
del espaol Se ha considerado un solo circunstancial para reducir el nmero de reglas
a tratar, tratndose esta regla como una regla especial que representa varios smbolos.

adyacente adjetivo
adyacente adverbio
adyacente coma + construccin comparativa
adyacente construccin comparativa
adyacente grupo adjetivo comparativo
adyacente pronombre de relativo
adyacente proposicin subordinada

- 79 -
Proceso de automatizacin del anlisis sintactico del espaol.

adyacente sintagma adjetivo


adyacentes adverbio + adjetivo
adyacentes adyacente + adyacente
adyacentes adyacente + adyacentes
adyacentes adyacente + coma + adyacentes
adyacentes adyacente + conjuncin coordinante + adyacente
aposicin proposicin subordinada
aposicin sintagma nominal homogneo
aposicin sustantivo
aposicin sustantivo + adjetivo
aposicin sustantivo + sustantivo
atributo proposicin subordinada
atributo sintagma adjetivo
atributo sintagma nominal heterogneo
atributo sintagma nominal homogneo
atributo sintagma nominal sustitutivo
atributo sintagma preposicional
auxiliar verbo
auxiliar verbo + participio
auxiliar pasivo verbo
circunstancial circunstancial + conector + circunstancial
circunstancial contraccin + proposicin de infinitivo
circunstancial contraccin ms sintagma adverbial
circunstancial gerundio
circunstancial locucin adverbial
circunstancial proposicin
circunstancial proposicin subordinada
circunstancial sintagma adverbial
circunstancial sintagma nominal homogneo
circunstancial sintagma nominal sustitutivo
circunstancial sintagma preposicional
complemento adjetivo sintagma preposicional
complemento agente sintagma preposicional
complemento preposicional del nombre proposicin
complemento preposicional del nombre proposicin subordinada
complemento preposicional del nombre sintagma preposicional
conector adverbio + adjetivo
conector coma
conector conjuncin
conector conjuncin + conjuncin
conector conjuncin coordinante
conector conjuncin coordinante + adverbio
conector preposicin + sustantivo
conector punto y coma
conector punto y coma + conector + coma
conector verbo + infinitivo
conector subordinante adjetivo + conjuncin

- 80 -
Proceso de automatizacin del anlisis sintactico del espaol.

conector subordinante adverbio


conector subordinante adverbio + adjetivo
conector subordinante adverbio + adverbio
conector subordinante adverbio + adverbio + conjuncin
conector subordinante adverbio + conjuncin
conector subordinante adverbio + conjuncin coordinante + adverbio
conector subordinante adverbio + conjuncin coordinante + adverbio +
conjuncin
conector subordinante adverbio + conjuncin coordinante + otro pronombre
conector subordinante adverbio + verbo + conjuncin
conector subordinante conjuncin
conector subordinante conjuncin + adverbio
conector subordinante conjuncin + adverbio + adverbio
conector subordinante conjuncin + conjuncin
conector subordinante conjuncin + conjuncin + adverbio
conector subordinante conjuncin + preposicin
conector subordinante contraccin + adverbio
conector subordinante contraccin + infinitivo
conector subordinante contraccin + sustantivo + conjuncin
conector subordinante preposicin
conector subordinante preposicin + adverbio
conector subordinante preposicin + adverbio + conjuncin
conector subordinante preposicin + artculo determinado + sustantivo +
preposicin + conjuncin
conector subordinante preposicin + conjuncin
conector subordinante preposicin + infinitivo
conector subordinante preposicin + infinitivo + preposicin + conjuncin
conector subordinante preposicin + otro pronombre
conector subordinante preposicin + sustantivo
conector subordinante pronombre de relativo
conector subordinante verbo + conjuncin
conector subordinante verbo + preposicin
construccin comparativa adverbio + adverbio + sintagma nominal heterogneo
construccin comparativa adverbio + adverbio + sintagma nominal homogneo
construccin comparativa adverbio + adverbio + sintagma nominal sustitutivo
construccin comparativa adverbio + artculo determinado + sintagma
preposicional
construccin comparativa adverbio + sintagma nominal heterogneo
construccin comparativa adverbio + sintagma nominal homogneo
construccin comparativa adverbio + sintagma nominal sustitutivo
construccin comparativa 2 adverbio + sintagma nominal heterogneo +
conjuncin + sintagma nominal heterogneo
construccin comparativa 2 adverbio + sintagma nominal heterogneo +
conjuncin + sintagma nominal homogneo
construccin comparativa 2 adverbio + sintagma nominal heterogneo +
conjuncin + sintagma nominal sustitutivo
construccin comparativa 2 adverbio + sintagma nominal homogneo +
conjuncin + sintagma nominal heterogneo

- 81 -
Proceso de automatizacin del anlisis sintactico del espaol.

construccin comparativa 2 adverbio + sintagma nominal homogneo +


conjuncin + sintagma nominal homogneo
construccin comparativa 2 adverbio + sintagma nominal homogneo +
conjuncin + sintagma nominal sustitutivo
contraccin ms sintagma adverbial contraccin + sintagma verbal
forma verbal compleja auxiliar + adjetivo
forma verbal compleja auxiliar + conjuncin + infinitivo
forma verbal compleja auxiliar + conjuncin + infinitivo con pronombre
encltico
forma verbal compleja auxiliar + gerundio
forma verbal compleja auxiliar + gerundio con pronombre encltico
forma verbal compleja auxiliar + infinitivo
forma verbal compleja auxiliar + infinitivo con pronombre encltico
forma verbal compleja auxiliar + participio
forma verbal compleja auxiliar + participio + adjetivo
forma verbal compleja auxiliar + participio + participio
forma verbal compleja auxiliar + preposicin + infinitivo
forma verbal compleja auxiliar + preposicin + infinitivo con pronombre
encltico
forma verbal compleja infinitivo + conjuncin coordinante + infinitivo
forma verbal compleja pronombre personal tono + verbo
forma verbal compleja verbo + conjuncin coordinante + verbo
forma verbal simple verbo
forma verbal simple verbo con pronombre encltico
grupo adjetivo adverbio + sintagma adjetivo
grupo adjetivo comparativo adverbio + adjetivo + conjuncin + sintagma
nominal heterogneo
grupo adjetivo comparativo adverbio + adjetivo + conjuncin + sintagma
nominal homogneo
grupo adjetivo comparativo adverbio + adjetivo + conjuncin + sintagma
nominal sustitutivo
grupo nominal adverbio + sintagma nominal homogneo
locucin adverbial preposicin + adverbio
morfema de pasiva pronombre personal tono
morfema de voz media pronombre personal tono
morfema impersonal pronombre personal tono
ncleo nominal adjetivo
ncleo nominal infinitivo
ncleo nominal infinitivo con pronombre encltico
ncleo nominal otro pronombre
ncleo nominal pronombre de relativo
ncleo nominal pronombre personal tono
ncleo nominal pronombre personal tnico
ncleo nominal sustantivo
ncleo verbal adjetivo
ncleo verbal forma verbal compleja
ncleo verbal forma verbal simple
ncleo verbal gerundio

- 82 -
Proceso de automatizacin del anlisis sintactico del espaol.

ncleo verbal gerundio con pronombre encltico


ncleo verbal infinitivo
ncleo verbal infinitivo con pronombre encltico
ncleo verbal participio
ncleo verbal copulativo forma verbal compleja
ncleo verbal copulativo forma verbal simple
ncleo verbal copulativo gerundio
ncleo verbal copulativo infinitivo
ncleo verbal pasivo adjetivo
ncleo verbal pasivo forma verbal compleja
ncleo verbal pasivo participio
objeto directo artculo determinado + proposicin subordinada
objeto directo proposicin
objeto directo proposicin de infinitivo
objeto directo proposicin subordinada
objeto directo puntuacin + proposicin
objeto directo sintagma nominal heterogneo
objeto directo sintagma nominal homogneo
objeto directo sintagma nominal sustitutivo
objeto directo sintagma preposicional
objeto indirecto sintagma nominal sustitutivo
objeto indirecto sintagma preposicional
oracin atributiva predicado
oracin atributiva predicado + coma + sujeto + predicado
oracin atributiva predicado + puntuacin
oracin atributiva predicado + sujeto
oracin atributiva predicado + sujeto + predicado
oracin atributiva predicado + sujeto + predicado + puntuacin
oracin atributiva predicado + sujeto + puntuacin
oracin atributiva sujeto + coma + predicado
oracin atributiva sujeto + predicado
oracin atributiva sujeto + predicado + puntuacin
oracin de suplemento predicado
oracin de suplemento predicado + coma + sujeto + predicado
oracin de suplemento predicado + puntuacin
oracin de suplemento predicado + sujeto
oracin de suplemento predicado + sujeto + predicado
oracin de suplemento predicado + sujeto + predicado + puntuacin
oracin de suplemento predicado + sujeto + puntuacin
oracin de suplemento sujeto + coma + predicado
oracin de suplemento sujeto + predicado
oracin de suplemento sujeto + predicado + puntuacin
oracin exclamativa puntuacin + oracin atributiva + puntuacin
oracin exclamativa puntuacin + oracin de suplemento + puntuacin
oracin exclamativa puntuacin + oracin intransitiva + puntuacin
oracin exclamativa puntuacin + oracin pasiva + puntuacin
oracin exclamativa puntuacin + oracin transitiva + puntuacin

- 83 -
Proceso de automatizacin del anlisis sintactico del espaol.

oracin exclamativa puntuacin + sentencia + puntuacin


oracin interrogativa puntuacin + oracin atributiva + puntuacin
oracin interrogativa puntuacin + oracin de suplemento + puntuacin
oracin interrogativa puntuacin + oracin intransitiva + puntuacin
oracin interrogativa puntuacin + oracin pasiva + puntuacin
oracin interrogativa puntuacin + oracin transitiva + puntuacin
oracin interrogativa puntuacin + sentencia + puntuacin
oracin intransitiva predicado
oracin intransitiva predicado + coma + sujeto + predicado
oracin intransitiva predicado + puntuacin
oracin intransitiva predicado + sujeto
oracin intransitiva predicado + sujeto + predicado
oracin intransitiva predicado + sujeto + predicado + puntuacin
oracin intransitiva predicado + sujeto + puntuacin
oracin intransitiva sujeto + coma + predicado
oracin intransitiva sujeto + predicado
oracin intransitiva sujeto + predicado + puntuacin
oracin pasiva predicado
oracin pasiva predicado + coma + sujeto + predicado
oracin pasiva predicado + puntuacin
oracin pasiva predicado + sujeto
oracin pasiva predicado + sujeto + predicado
oracin pasiva predicado + sujeto + predicado + puntuacin
oracin pasiva predicado + sujeto + puntuacin
oracin pasiva sujeto + coma + predicado
oracin pasiva sujeto + predicado
oracin pasiva sujeto + predicado + puntuacin
oracin transitiva predicado
oracin transitiva predicado + coma + sujeto + predicado
oracin transitiva predicado + puntuacin
oracin transitiva predicado + sujeto
oracin transitiva predicado + sujeto + predicado
oracin transitiva predicado + sujeto + predicado + puntuacin
oracin transitiva predicado + sujeto + puntuacin
oracin transitiva sujeto + coma + predicado
oracin transitiva sujeto + predicado
oracin transitiva sujeto + predicado + puntuacin
predicativo objetivo sintagma adjetivo
predicativo subjetivo sintagma adjetivo
preposicin subordinante preposicin
preposicin subordinante preposicin + preposicin
preposicin subordinante ms presentador contraccin
presentador adjetivo demostrativo
presentador adjetivo posesivo antepuesto
presentador adjetivo posesivo antepuesto o pospuesto
presentador adjetivo posesivo pospuesto
presentador artculo determinado

- 84 -
Proceso de automatizacin del anlisis sintactico del espaol.

presentador otro pronombre


proposicin oracin atributiva
proposicin oracin de suplemento
proposicin oracin exclamativa
proposicin oracin interrogativa
proposicin oracin intransitiva
proposicin oracin transitiva
proposicin de infinitivo oracin atributiva
proposicin de infinitivo oracin de suplemento
proposicin de infinitivo oracin intransitiva
proposicin de infinitivo oracin transitiva
proposicin de infinitivo proposicin de infinitivo + proposicin de infinitivo
proposicin de infinitivo coordinada proposicin de infinitivo + conector +
proposicin de infinitivo
proposicin subordinada conector subordinante + coma + oracin atributiva
proposicin subordinada conector subordinante + coma + oracin copulativa
proposicin subordinada conector subordinante + coma + oracin de
suplemento
proposicin subordinada conector subordinante + coma + oracin intransitiva
proposicin subordinada conector subordinante + coma + oracin transitiva
proposicin subordinada conector subordinante + coma + sentencia
proposicin subordinada conector subordinante + oracin atributiva
proposicin subordinada conector subordinante + oracin copulativa
proposicin subordinada conector subordinante + oracin de suplemento
proposicin subordinada conector subordinante + oracin intransitiva
proposicin subordinada conector subordinante + oracin transitiva
proposicin subordinada conector subordinante + proposicin de infinitivo
proposicin subordinada conector subordinante + sentencia
proposicin subordinada oracin atributiva
proposicin subordinada oracin de suplemento
proposicin subordinada oracin intransitiva
proposicin subordinada oracin transitiva
sentencia conector + proposicin
sentencia conector + proposicin + conector + proposicin
sentencia exclamacin + coma + oracin atributiva
sentencia exclamacin + coma + oracin de suplemento
sentencia exclamacin + coma + oracin exclamativa
sentencia exclamacin + coma + oracin interrogativa
sentencia exclamacin + coma + oracin intransitiva
sentencia exclamacin + coma + oracin transitiva
sentencia oracin atributiva + coma + exclamacin
sentencia oracin atributiva + coma + vocativo
sentencia oracin de suplemento + coma + exclamacin
sentencia oracin de suplemento + coma + vocativo
sentencia oracin exclamativa + coma + exclamacin
sentencia oracin interrogativa + coma + exclamacin
sentencia oracin interrogativa + coma + vocativo

- 85 -
Proceso de automatizacin del anlisis sintactico del espaol.

sentencia oracin intransitiva + coma + exclamacin


sentencia oracin intransitiva + coma + vocativo
sentencia oracin pasiva + coma + exclamacin
sentencia oracin pasiva + coma + vocativo
sentencia oracin transitiva + coma + exclamacin
sentencia oracin transitiva + coma + vocativo
sentencia predicado + coma + vocativo + coma + predicado
sentencia predicado + coma + vocativo + coma + predicado + sujeto
sentencia proposicin + coma + conector + coma + proposicin
sentencia proposicin + coma + proposicin subordinada
sentencia proposicin + coma + sentencia
sentencia proposicin + coma + vocativo + punto y coma + proposicin
sentencia proposicin + conector + proposicin
sentencia proposicin + conector + sentencia
sentencia proposicin + proposicin subordinada
sentencia proposicin subordinada + coma + proposicin
sentencia sujeto + predicado + coma + vocativo + coma + predicado
sentencia vocativo + coma + oracin atributiva
sentencia vocativo + coma + oracin de suplemento
sentencia vocativo + coma + oracin exclamativa
sentencia vocativo + coma + oracin interrogativa
sentencia vocativo + coma + oracin intransitiva
sentencia vocativo + coma + oracin pasiva
sentencia vocativo + coma + oracin transitiva
sintagma adjetivo adjetivo
sintagma adjetivo adjetivo + complemento adjetivo
sintagma adjetivo adverbio + adjetivo
sintagma adjetivo artculo determinado + adverbio + adjetivo
sintagma adjetivo sintagma adjetivo + conjuncin coordinante + sintagma
adjetivo
sintagma adverbial adjetivo + adverbio
sintagma adverbial adverbio
sintagma adverbial adverbio + adjetivo
sintagma adverbial adverbio + adverbio
sintagma adverbial adverbio + adverbio + proposicin subordinada
sintagma adverbial adverbio + conjuncin + sintagma nominal heterogneo
sintagma adverbial adverbio + conjuncin + sintagma nominal homogneo
sintagma adverbial adverbio + conjuncin + sintagma nominal sustitutivo
sintagma adverbial adverbio + sintagma nominal heterogneo
sintagma adverbial adverbio + sintagma nominal homogneo
sintagma adverbial adverbio + sintagma nominal homogneo + adverbio
sintagma adverbial adverbio + sintagma preposicional
sintagma adverbial artculo determinado + adverbio + proposicin subordinada
sintagma adverbial preposicin subordinante + adverbio
sintagma adverbial sintagma nominal homogneo + adverbio
sintagma nominal heterogneo adyacente + ncleo nominal + conector + ncleo
nominal

- 86 -
Proceso de automatizacin del anlisis sintactico del espaol.

sintagma nominal heterogneo adyacentes + ncleo nominal + conector +


ncleo nominal
sintagma nominal heterogneo sintagma nominal homogneo + conector +
sintagma nominal heterogneo
sintagma nominal heterogneo sintagma nominal homogneo + conector +
sintagma nominal homogneo
sintagma nominal heterogneo sintagma nominal homogneo + conector +
sintagma nominal sustitutivo
sintagma nominal heterogneo sintagma nominal sustitutivo + conector +
sintagma nominal heterogneo
sintagma nominal heterogneo sintagma nominal sustitutivo + conector +
sintagma nominal homogneo
sintagma nominal heterogneo sintagma nominal sustitutivo + conector +
sintagma nominal sustitutivo
sintagma nominal homogneo adyacente + ncleo nominal
sintagma nominal homogneo adyacente + ncleo nominal + adyacente
sintagma nominal homogneo adyacente + ncleo nominal + adyacente +
complemento preposicional del nombre
sintagma nominal homogneo adyacente + ncleo nominal + adyacentes
sintagma nominal homogneo adyacente + ncleo nominal + adyacentes +
complemento preposicional del nombre
sintagma nominal homogneo adyacente + ncleo nominal + aposicin
sintagma nominal homogneo adyacente + ncleo nominal + coma + aposicin
sintagma nominal homogneo adyacente + ncleo nominal + complemento
preposicional del nombre
sintagma nominal homogneo adyacente + ncleo nominal + dos puntos +
aposicin
sintagma nominal homogneo adyacente + presentador + ncleo nominal
sintagma nominal homogneo adyacentes + ncleo nominal
sintagma nominal homogneo adyacentes + ncleo nominal + adyacente
sintagma nominal homogneo adyacentes + ncleo nominal + adyacente +
complemento preposicional del nombre
sintagma nominal homogneo adyacentes + ncleo nominal + adyacentes +
complemento preposicional del nombre
sintagma nominal homogneo adyacentes + ncleo nominal + complemento
preposicional del nombre
sintagma nominal homogneo ncleo nominal
sintagma nominal homogneo ncleo nominal + adyacente
sintagma nominal homogneo ncleo nominal + adyacente + complemento
preposicional del nombre
sintagma nominal homogneo ncleo nominal + adyacentes
sintagma nominal homogneo ncleo nominal + aposicin
sintagma nominal homogneo ncleo nominal + coma + aposicin
sintagma nominal homogneo ncleo nominal + complemento preposicional del
nombre
sintagma nominal homogneo ncleo nominal + presentador
sintagma nominal homogneo presentador + adyacente + ncleo nominal

- 87 -
Proceso de automatizacin del anlisis sintactico del espaol.

sintagma nominal homogneo presentador + adyacente + ncleo nominal +


adyacente + complemento preposicional del nombre
sintagma nominal homogneo presentador + adyacente + ncleo nominal +
complemento preposicional del nombre
sintagma nominal homogneo presentador + ncleo nominal
sintagma nominal homogneo presentador + ncleo nominal + adyacente
sintagma nominal homogneo presentador + ncleo nominal + adyacente +
complemento preposicional del nombre
sintagma nominal homogneo presentador + ncleo nominal + adyacentes
sintagma nominal homogneo presentador + ncleo nominal + aposicin
sintagma nominal homogneo presentador + ncleo nominal + aposicin +
adyacente
sintagma nominal homogneo presentador + ncleo nominal + aposicin +
coma + adyacente
sintagma nominal homogneo presentador + ncleo nominal + coma +
adyacente
sintagma nominal homogneo presentador + ncleo nominal + coma +
aposicin
sintagma nominal homogneo presentador + ncleo nominal + complemento
preposicional del nombre
sintagma nominal homogneo presentador + ncleo nominal + dos puntos +
aposicin
sintagma nominal sustitutivo adyacente + ncleo nominal
sintagma nominal sustitutivo adyacente + ncleo nominal + adyacente +
complemento preposicional del nombre
sintagma nominal sustitutivo adyacente + presentador + ncleo nominal
sintagma nominal sustitutivo artculo determinado + sintagma preposicional
sintagma nominal sustitutivo ncleo nominal
sintagma nominal sustitutivo ncleo nominal + adyacente
sintagma nominal sustitutivo ncleo nominal + adyacentes
sintagma nominal sustitutivo presentador + adyacente + ncleo nominal
sintagma nominal sustitutivo presentador + ncleo nominal
sintagma nominal sustitutivo presentador + ncleo nominal + adyacente
sintagma nominal sustitutivo presentador + ncleo nominal + adyacente +
complemento preposicional del nombre
sintagma nominal sustitutivo presentador + ncleo nominal + adyacentes
sintagma nominal sustitutivo presentador + ncleo nominal + complemento
preposicional del nombre
sintagma preposicional preposicin + conector subordinante + proposicin
sintagma preposicional preposicin subordinante + proposicin
sintagma preposicional preposicin subordinante + proposicin de infinitivo
sintagma preposicional preposicin subordinante + proposicin subordinada
sintagma preposicional preposicin subordinante + sintagma adjetivo
sintagma preposicional preposicin subordinante + sintagma adverbial
sintagma preposicional preposicin subordinante + sintagma nominal
heterogneo
sintagma preposicional preposicin subordinante + sintagma nominal
homogneo

- 88 -
Proceso de automatizacin del anlisis sintactico del espaol.

sintagma preposicional preposicin subordinante + sintagma nominal sustitutivo


sintagma preposicional preposicin subordinante ms presentador +
proposicin subordinada
sintagma preposicional preposicin subordinante ms presentador + sintagma
nominal heterogneo
sintagma preposicional preposicin subordinante ms presentador + sintagma
nominal homogneo
sintagma preposicional preposicin subordinante ms presentador + sintagma
nominal sustitutivo
sintagma preposicional sintagma preposicional + conjuncin + sintagma
preposicional
sintagma preposicional sintagma preposicional + conjuncin coordinante
sintagma preposicional
sintagma verbal infinitivo + sintagma nominal homogneo
subordinada comparativa proposicin subordinada
sujeto proposicin
sujeto proposicin de infinitivo
sujeto proposicin de infinitivo coordinada
sujeto proposicin subordinada
sujeto sintagma nominal heterogneo
sujeto sintagma nominal homogneo
sujeto sintagma nominal sustitutivo
suplemento sintagma preposicional
vocativo proposicin
vocativo sintagma nominal homogneo

Como regla adicional aparece el predicado con la forma:

predicado *

donde * representa todas las combinaciones posibles.

- 89 -
Proceso de automatizacin del anlisis sintactico del espaol.

- 90 -
Proceso de automatizacin del anlisis sintactico del espaol.

Captulo 3

Proceso de automatizacin del anlisis


sintctico del espaol

- 91 -
Proceso de automatizacin del anlisis sintactico del espaol.

- 92 -
Proceso de automatizacin del anlisis sintactico del espaol.

- 93 -
Proceso de automatizacin del anlisis sintactico del espaol.

- 94 -
Proceso de automatizacin del anlisis sintactico del espaol.

Captulo 3 Apartado 1
Introduccin al proceso de anlisis sintctico

El anlisis sintctico consiste en reconocer la estructura que define las relaciones existentes
entres los elementos de una sentencia; su representacin se hace mediante rboles.
Figura 3.1
rbol de representacin

Sentencia

Sujeto Predicado

Ncleo verbal Atributo

El nio es alto

Los pasos que se realizan durante un anlisis sintctico automatizado de una sentencia son los
que se aprecian en el siguiente diagrama.

Figura 3.2
Etapas del anlisis

Caracterizacin gramatical Anlisis sintctico

Generacin de rboles de
Anlisis Desambiguacin Desambiguacin
Sentencia rboles de + estructural
representacin
morfolgico funcional representacin sintctica

Paso 1: Caracterizacin gramatical.


1.1.- Anlisis morfolgico de la sentencia. Durante este proceso se
obtienen las funciones que puede desempear cada palabra en la

- 95 -
Proceso de automatizacin del anlisis sintactico del espaol.

sentencia. El anlisis morfolgico se lleva a cabo mediante la aplicacin


realizada por el Grupo de Estructuras de Datos y Lingstica
Computacional de la Universidad de Las Palmas de Gran Canaria.
1.2.- Desambiguacin funcional. Se descartan las funciones gramaticales
que invaliden su entorno inmediato.
Paso 2: Anlisis sintctico.
2.1.- Generacin de rboles de representacin. Se generan los posibles
rboles de anlisis; sern aceptados slo aquellos en los que el smbolo
de nivel superior cubra todos los smbolos y sea raz que d lugar a una
oracin completa. Se ha implementado un algoritmo de tipo Chart
Bidireccional Ascendente con Predicciones Descendentes Dirigido por
Sucesos y basado en rboles Mltiples Virtuales6.
2.2.- Desambigacin estructural. Se evita generar los rboles que violan
la gramtica debido a la existencia de ambigedades estructurales.

6
[QUE96] Analizador presentado por Jose F. Quesada (CICA) en el Congreso del 96 de la SEPLN.

- 96 -
Proceso de automatizacin del anlisis sintactico del espaol.

Captulo 3 Apartado 2
Las ambigedades funcionales en el proceso de anlisis

2.1.- Introduccin.
Cuando se analiza una sentencia pueden existir formas que desde el punto de
vista morfolgico puedan pertenecer a varias categoras gramaticales; en estos casos se
habla de ambigedad funcional.
Por ejemplo, en la sentencia la casa estaba habitada, la forma la puede
tener varias interpretaciones

Artculo determinado
Sustantivo (nota musical)
Pronombre personal

Se tienen entonces tres posibles combinaciones de categoras gramaticales, todas


ellas deben ser estudiadas durante un proceso de anlisis automatizado. En una
gramtica para la formalizacin de la sintaxis del espaol se encontrarn reglas con la
forma:

presentador artculo determinado


ncleo nominal sustantivo
ncleo nominal pronombre personal

En este caso, la debe dar lugar a un smbolo presentador pero hay dos smbolos
ms del tipo ncleo nominal, con lo que aparecern tres rboles de representacin, de

- 97 -
Proceso de automatizacin del anlisis sintactico del espaol.

los cuales dos son errneos, adems existirn dos rboles exactamente iguales salvo en
un nodo hoja en los nodos hoja se encuentran las categoras gramaticales. sta es una de
las ambigedades que aparecen con mayor frecuencia en el espaol, debido a la alta
frecuencia de aparicin de los artculos.
Para cada forma de su universo, el procesador morfolgico desarrollado por el
Grupo de Estructuras de Datos y Lingstica Computacional de la Universidad de Las
Palmas de Gran Canaria (http://www.gedlc.ulpgc.es/morfolog/morfolog.htm)
proporciona un conjunto de caracterizaciones gramaticales, lxicas, etctera; en la tabla
1 se asigna un comportamiento funcional a nivel sintctico a cada elemento distintivo de
la respuesta no son suficientemente homogneos debido a la diversidad de las fuentes
que se han utilizado en su construccin, y que han sido respetadas.

Tabla 3.1
Asignacin de comportamientos funcionales.

Comportamiento
Respuesta del procesador morfolgico
funcional
abreviatura, siglas, acrnimo o monograma abreviatura (1)
adjetivo adjetivo
adjetivo comparativo adjetivo
adjetivo correlativo adjetivo
adjetivo demostrativo adjetivo demostrativo
adjetivo indefinido adjetivo
adjetivo indefinido plural adjetivo
adjetivo interrogativo adjetivo
adjetivo latino adjetivo
adjetivo numeral adjetivo
adjetivo plural adjetivo
adjetivo ponderativo adjetivo
adjetivo posesivo adjetivo posesivo
adjetivo pronominal adjetivo
adjetivo relativo adjetivo
adjetivo superlativo adjetivo
adverbio adverbio
adverbio afirmativo adverbio
adverbio comparativo adverbio
adverbio correlativo adverbio
adverbio de cantidad adverbio
adverbio de duda adverbio
adverbio de lugar adverbio
adverbio de modo interrogativo adverbio
adverbio de modo interrogativo y exclamativo adverbio
adverbio de modo relativo comparativo adverbio
adverbio de negacin adverbio
adverbio de orden adverbio
adverbio de tiempo adverbio
adverbio de tiempo interrogativo adverbio
adverbio demostrativo adverbio
adverbio interrogativo adverbio
adverbio interrogativo de lugar adverbio
adverbio latino adverbio
adverbio modo adverbio
adverbio numeral latino adverbio
adverbio relativo de cantidad adverbio
adverbio relativo de lugar adverbio

- 98 -
Proceso de automatizacin del anlisis sintactico del espaol.

Comportamiento
Respuesta del procesador morfolgico
funcional
adverbio relativo de tiempo adverbio
afijo sustantivo
apellido sustantivo
apcope apcope (1)
artculo determinado artculo determinado
artculo indeterminado artculo indeterminado (2)
conjuncin conjuncin
conjuncin adversativa conjuncin
conjuncin causal conjuncin
conjuncin concesiva conjuncin
conjuncin condicional conjuncin
conjuncin copulativa conjuncin coordinante
conjuncin distributiva conjuncin
conjuncin disyuntiva conjuncin coordinante
conjuncin final conjuncin
conjuncin ilativa conjuncin
conjuncin latina conjuncin
conjuncin subordinante temporal conjuncin
contraccin contraccin
contraccin antigua de preposicin y pronombre contraccin
elemento prefijal sustantivo
elemento sufijal sustantivo
exclamacin exclamacin (3)
expresin expresin (1)
expresin latina expresin (1)
nombre propio sustantivo
nombre propio de mujer sustantivo
nombre propio de varn sustantivo
nombre propio femenino sustantivo
nombre propio femenino plural sustantivo
nombre propio masculino sustantivo
nombre propio masculino plural sustantivo
nombre propio toponmico sustantivo
onomatopeya onomatopeya (1)
palabra de otro idioma extranjerismo (1)
palabra de otro idioma usada como adjetivo adjetivo
palabra de otro idioma usada como adverbio adverbio
palabra de otro idioma usada como adverbio de modo adverbio
palabra de otro idioma usada como sustantivo sustantivo
palabra de otro idioma usada como sustantivo de gnero comn sustantivo
palabra de otro idioma usada como sustantivo femenino sustantivo
palabra de otro idioma usada como sustantivo femenino plural sustantivo
palabra de otro idioma usada como sustantivo masculino sustantivo
palabra de otro idioma usada como sustantivo masculino plural sustantivo
preposicin preposicin
preposicin latina preposicin
pronombre otro pronombre
pronombre correlativo otro pronombre
pronombre demostrativo otro pronombre
pronombre demostrativo en funcin adjetiva adjetivo demostrativo
pronombre en funcin adjetiva otro pronombre
pronombre exclamativo otro pronombre
pronombre indefinido otro pronombre
pronombre interrogativo otro pronombre
pronombre latino otro pronombre
pronombre personal pronombre personal
pronombre plural otro pronombre
pronombre posesivo otro pronombre
pronombre relativo pronombre de relativo
smbolo sustantivo
smbolo qumico sustantivo
sustantivo sustantivo
sustantivo de gnero ambiguo sustantivo
sustantivo de gnero ambiguo en plural sustantivo
sustantivo de gnero comn sustantivo
sustantivo de gnero comn en plural sustantivo
sustantivo femenino sustantivo

- 99 -
Proceso de automatizacin del anlisis sintactico del espaol.

Comportamiento
Respuesta del procesador morfolgico
funcional
sustantivo femenino plural sustantivo
sustantivo masculino sustantivo
sustantivo masculino plural sustantivo
verbo verbo
verbo auxiliar verbo
verbo defectivo verbo
verbo impersonal verbo
verbo intransitivo verbo
verbo pronominal verbo
verbo recproco verbo
verbo transitivo verbo
verbo unipersonal verbo
voz mnemotcnica para los modos de silogismo voz mnemotcnica (1)

(1)
Como las denominaciones de abreviatura, apcope, expresin, extranjerismo,
onomatopeya y voz mnemotcnica, que aparecen en la columna de comportamientos
funcionales, no describen realmente un comportamiento, sino que constituyen
caracterizaciones lxicas o lexicolgicas, las voces incluidas en estos grupos debern ser
posteriormente estudiadas para definir su particular comportamiento funcional.
(2)
La lingstica moderna sabe que en espaol hay un solo artculo, el que la tradicin
gramatical llamaba determinado; el artculo llamado indeterminado no es sino un
numeral. A pesar de ello, en este trabajo se prefiere seguir manteniendo la distincin
tradicional por considerar que, para las necesidades del anlisis que se plantea, el
indeterminado puede actuar como presentador adems de como adyacente.
(3)
Las exclamaciones se detectan grficamente por el signo de admiracin con lo que no
conllevan ambigedad.
En consonancia con la categorizacin gramatical del lxico descrita por el
Diccionario de la Real Academia Espaola, los comportamientos funcionales que se han
considerado son: sustantivo, adjetivo, adjetivo demostrativo, adjetivo posesivo,
adverbio, pronombre personal, pronombre de relativo, los otros pronombres, artculo,
preposicin, conjuncin, conjuncin coordinante y contraccin.
Dentro de la etiqueta de sustantivo se engloban aquellas categoras que pueden
funcionar como ncleo de un sintagma nominal homogneo. Bajo la denominacin de
adjetivo se consideran las que pueden complementar a un nombre o ser ncleo de un
sintagma adjetivo; entre los adjetivos se distinguen los posesivos y demostrativos
debido a que pueden considerarse como introductores de ncleos nominales. En los
pronombres se han distinguido los demostrativos con funcin adjetiva debido a que su
comportamiento es ms de adjetivo que de pronombre, los personales, y los de relativo,

- 100 -
Proceso de automatizacin del anlisis sintactico del espaol.

por las funciones especficas que pueden soportar, y el resto se considera bajo la
denominacin de otro pronombre. Las conjunciones coordinantes sern tenidas en
cuenta de manera especial porque se utilizan para enlazar estructuras formales del
mismo nivel sintctico se incluyen todas bajo la denominacin de conjuncin.
Algunas categoras sern desglosadas ms adelante: para los pronombres personales
se distinguir entre tonos y tnicos; entre los adjetivos posesivos se separarn los que
pueden aparecer antepuestos, pospuestos y en ambas posiciones con respecto al ncleo
nominal al que complementan; entre los verbos, se distinguirn las formas personales
del infinitivo, del gerundio y del participio; entre las formas contractas se considerar la
combinacin de una preposicin y un presentador y, a veces, la de tres elementos.
Adems se encuentran identificadas las palabras que son antiguas o estn en
desuso que podrn considerarse o no segn el tipo de texto que se desee estudiar. A fin
de clasificar las palabras que pudieran ser antiguas, se estudia tal informacin en los
diccionarios DRA95, VOX97, MOL96 y CLA97 son los nicos que poseen el dato de
antigua en algunos vocablos. Dado que las fuentes consultadas no son homogneas al
respecto, una misma entrada puede llevar la etiqueta de antigua o desusada por uno o
varios diccionarios, y por el resto no. As, por ejemplo:

Tabla 3.2
Ejemplos de consideracin de palabras anticuadas o desusadas
Entrada Categora Significado DRA95 VOX97 MOL96 CLA97
abiete m. Abeto desusada en uso en uso no aparece
amigabilidad f. Disposicin para contraer en uso desusada en uso en uso
amistad
alpartaz m. Trozo de malla de en uso antigua en uso no aparece
acero...
entrego m. Accin y efecto en uso no aparece antigua no aparece
cegamiento m. Ceguedad antigua actual antigua no aparece

Esto lleva a implementar un criterio que aporte luz a tal clasificacin. Se tratan
como antiguas:
1. Todas las entradas que el DRA97 caracteriza como antiguas o desusadas y que no
aparezcan ni en el VOX97 ni en el CLA97 (Estos dos diccionarios suelen incorporar
neologismos o nuevas acepciones para entradas antiguas; recogen un lxico ms
moderno).

- 101 -
Proceso de automatizacin del anlisis sintactico del espaol.

2. Todas las entradas que el VOX97 caracteriza como antiguas o desusadas que no
aparezcan en el CLA97.
3. Todas las entradas que MOL96 caracteriza como antiguas o desusadas y que no
aparezcan ni en el DRA97 ni en el VOX97 ni en el CLA97.
Otro problema es la consideracin de antigua en una funcin gramatical
especfica de una entrada con varias funciones gramaticales; esto se resuelve
separndolas en dos entradas distintas la antigua y la no antigua, siempre que en las
fuentes, para la funcin gramatical caracterizada como antigua, no exista esa misma
entrada con la misma funcin gramatical caracterizada como no antigua, con
independencia de su significado. Por ejemplo, girante se separa en dos entradas:
adjetivo y masculino antiguo; sin embargo, inga se mantiene como una nica entrada no
antigua: adjetivo usado tambin como sustantivo masculino o femenino.

Tabla 3.3
Ejemplos de consideracin de palabras con funciones antiguas o desusadas
Entrada Categora DRA97 VOX97 MOL96 CLA97
girante adj. m. adj. en uso adj. en uso adj. en uso no aparece
m. antigua m. no aparece m. antigua
inga adj. m. adj. en uso adj. en uso adj. en uso no aparece
m. antiguo m. en uso m. en uso
m. en uso f. en uso

2.2.- Las ambigedades funcionales del espaol.


Al obtener los grupos de posibles ambigedades funcionales que aparecen en el universo de
palabras que trata el procesador morfolgico se observa la existencia de conjuntos que van de dos a cinco
opciones posibles.

Tabla 3.4
Ambigedades funcionales del espaol.
Grupos de categoras con ambigedad Grupos de categoras con ambigedad
adjetivo, adverbio adverbio, preposicin, conjuncin, adjetivo
adjetivo, adverbio, otro pronombre adverbio, pronombre personal tnico, sustantivo
adjetivo, otro pronombre adverbio, sustantivo
adjetivo, otro pronombre, artculo indeterminado, sustantivo adverbio, sustantivo, adjetivo
adjetivo, otro pronombre, sustantivo adverbio, sustantivo, preposicin
adjetivo, sustantivo conjuncin coordinante, sustantivo
adjetivo, sustantivo, adverbio conjuncin, sustantivo
adjetivo, sustantivo, adverbio, otro pronombre gerundio, adverbio
adjetivo, verbo gerundio, sustantivo, adjetivo
adjetivo, verbo, sustantivo infinitivo, adjetivo
adverbio, adjetivo infinitivo, adjetivo, sustantivo
adverbio, adjetivo, conjuncin infinitivo, adverbio, sustantivo, adjetivo
adverbio, adjetivo, sustantivo infinitivo, sustantivo
adverbio, conjuncin infinitivo, sustantivo, adjetivo
adverbio, conjuncin, adjetivo, sustantivo participio, adjetivo
adverbio, conjuncin, sustantivo participio, adjetivo, adverbio
adverbio, conjuncin, sustantivo, adjetivo participio, adjetivo, sustantivo

- 102 -
Proceso de automatizacin del anlisis sintactico del espaol.

Grupos de categoras con ambigedad Grupos de categoras con ambigedad


participio, adverbio, adjetivo verbo, adjetivo, adverbio
participio, adverbio, sustantivo, adjetivo verbo, adjetivo, adverbio, conjuncin
participio, sustantivo verbo, adjetivo, adverbio, otro pronombre
participio, sustantivo, adjetivo verbo, adjetivo, preposicin
participio, sustantivo, adjetivo, adverbio verbo, adjetivo, otro pronombre
participio, verbo, adjetivo verbo, adjetivo, otro pronombre, artculo indeterminado
participio, verbo, sustantivo, adjetivo verbo, adjetivo, otro pronombre, sustantivo
preposicin, adjetivo verbo, adjetivo, sustantivo
preposicin, sustantivo verbo, adjetivo, sustantivo, adverbio, otro pronombre
preposicin, sustantivo, adjetivo verbo, adjetivo, sustantivo, preposicin, conjuncin
pronombre personal tono, artculo determinado verbo, adverbio
pronombre personal tono, artculo determinado, sustantivo verbo, adverbio, adjetivo
pronombre personal tono, sustantivo verbo, adverbio, preposicin, sustantivo
pronombre personal tnico, sustantivo verbo, adverbio, sustantivo
otro pronombre, adjetivo verbo, adverbio, sustantivo, adjetivo
otro pronombre, adjetivo, sustantivo, adverbio verbo, conjuncin
otro pronombre, adjetivo demostrativo verbo, contraccin
otro pronombre, sustantivo verbo, gerundio
sustantivo, adjetivo verbo, infinitivo
sustantivo, adjetivo, adverbio verbo, infinitivo, sustantivo
sustantivo, adjetivo, adverbio, pronombre de relativo verbo, participio, adjetivo
sustantivo, adjetivo, adverbio, otro pronombre verbo, participio, adverbio, sustantivo, adjetivo
sustantivo, adjetivo, adverbio, otro pronombre, pronombre verbo, participio, sustantivo
de relativo verbo, participio, sustantivo, adjetivo
Sustantivo, adjetivo, preposicin verbo, preposicin
Sustantivo, adjetivo, otro pronombre verbo, preposicin, sustantivo
sustantivo, adjetivo posesivo antepuesto verbo, pronombre personal tnico
sustantivo, adverbio verbo, otro pronombre
sustantivo, adverbio, adjetivo verbo, otro pronombre, adjetivo
sustantivo, adverbio, adjetivo, otro pronombre, pronombre verbo, otro pronombre, adjetivo demostrativo
de relativo verbo, otro pronombre, pronombre personal tnico
sustantivo, adverbio, conjuncin coordinante verbo, otro pronombre, sustantivo, adjetivo demostrativo
sustantivo, adverbio, otro pronombre verbo, sustantivo
sustantivo, conjuncin verbo, sustantivo, adjetivo
sustantivo, contraccin verbo, sustantivo, adjetivo, adverbio
sustantivo, preposicin verbo, sustantivo, adjetivo, otro pronombre
sustantivo, preposicin, adjetivo verbo, sustantivo, adverbio
sustantivo, pronombre personal tono verbo, sustantivo, preposicin
sustantivo, pronombre personal tono, artculo determinado
sustantivo, otro pronombre, pronombre de relativo
verbo, adjetivo

Para facilitar el proceso de desambiguacin, en la categora verbo se contemplan cuatro


opciones diferenciadas: infinitivo, gerundio, participio y forma verbal personal, porque
presentan diferencias de funcin y de posicin en las estructuras sintcticas.

2.3.- Estructuras sintcticas bsicas y parejas funcionales.


En espaol se define un conjunto de estructuras bsicas que se repiten y se
combinan entre s para dar lugar a las sentencias del discurso. La composicin de estas
estructuras determina los conjuntos de parejas de categoras que aparecen en una
sentencia dentro de estas estructuras de tipo local. Para realizar un estudio de tipo
local se aade el smbolo NULO con categora nulo; este smbolo siempre
aparecer al principio y al final de cada estructura toda estructura estar formada al
menos por tres smbolos.
Se tienen las siguientes estructuras sintcticas:

- 103 -
Proceso de automatizacin del anlisis sintactico del espaol.

Sintagma nominal.
Sintagma nominal homogneo.
Sintagma nominal heterogneo.
Sintagma nominal sustitutivo.
Forma verbal.
Sintagma preposicional.
Sintagma adjetivo.
Sintagma adverbial.
Las estructuras formales que se detallan a continuacin son el resultado del
estudio de diferentes gramticas espaolas, completadas con estructuras adicionales
puestas de manifiesto al aplicar el desarrollo alcanzado sobre distintos corpus de
oraciones y textos.

2.3.1.- Sintagma nominal homogneo.


El sintagma nominal homogneo contiene la siguiente estructura bsica:
nulo + presentador o determinante + ncleo nominal + adyacentes + nulo
El presentador o determinante puede ser: artculo determinado, artculo
indeterminado, adjetivo posesivo y adjetivo demostrativo. El ncleo nominal lo forma
un sustantivo. El adyacente puede ser: adjetivo, la preposicin de seguida de un
sintagma (complemento preposicional del nombre) y sustantivo (aposicin).
Esta estructura puede sufrir ciertas variaciones en cuanto a la presencia y a la
posicin de sus elementos. El ncleo nominal siempre estar presente, mientras que el
presentador y los adyacentes pueden no aparecer. Algunos adyacentes adjetivo
preceden al ncleo nominal y en ocasiones el presentador adjetivo posesivo sucede
al ncleo nominal.
Las configuraciones por parejas consecutivas se resumen en la tabla 5.

Tabla 3.5
Parejas del sintagma nominal homogneo.

presentador o
seguido de nulo ncleo nominal adyacente
determinante
nulo no s s s
presentador o s no s s
determinante
ncleo nominal s s no s
adyacente s s s s

- 104 -
Proceso de automatizacin del anlisis sintactico del espaol.

2.3.1.1.- nulo + presentador o determinante


nulo + artculo determinado
{nulo} el coche
nulo + artculo indeterminado.
{nulo} un coche
nulo + adjetivo posesivo
nulo + adjetivo posesivo antepuesto (mi, mis, tu, tus, su, sus)
{nulo} mi coche
nulo + adjetivo posesivo antepuesto o pospuesto (nuestro, nuestros, nuestra,
nuestras, vuestro, vuestros, vuestra, vuestras)
{nulo} nuestro coche
nulo + adjetivo demostrativo
{nulo} este coche
2.3.1.2.- nulo + ncleo nominal
nulo + sustantivo
{nulo} Juan
2.3.1.3.- nulo + adyacentes
nulo + adjetivo
{nulo} Roja rosa
2.3.1.4.- presentador o determinante + nulo
adjetivo posesivo + nulo
adjetivo posesivo antepuesto o pospuesto + nulo
el coche nuestro {nulo}
adjetivo posesivo pospuesto (mo, mos, ma, mas, tuyo, tuyos, tuya, tuyas, suyo,
suyos, suya, suyas) + nulo
el coche tuyo {nulo}
adjetivo demostrativo + nulo
el rbol ese {nulo}
2.3.1.5.- presentador o determinante + ncleo nominal (concuerdan en gnero y nmero)
artculo determinado + sustantivo
el coche
artculo indeterminado + sustantivo
un coche
adjetivo posesivo + sustantivo

- 105 -
Proceso de automatizacin del anlisis sintactico del espaol.

adjetivo posesivo antepuesto + sustantivo


mi coche
adjetivo posesivo antepuesto o pospuesto + sustantivo
nuestro coche
adjetivo demostrativo + sustantivo
este coche
2.3.1.6.- presentador + adyacente (concuerdan en gnero y nmero)
artculo determinado + adjetivo
la retumbante campana
artculo indeterminado + adjetivo
un nuevo comienzo
adjetivo posesivo + adjetivo
adjetivo posesivo antepuesto + adjetivo
mi viejo amigo
adjetivo posesivo antepuesto o pospuesto + adjetivo
nuestra nueva casa
adjetivo demostrativo +adjetivo
este viejo coche
2.3.1.7.- ncleo nominal + nulo
sustantivo + nulo
Juan {nulo}
2.3.1.8.- ncleo nominal + presentador o determinante (concuerdan en gnero y
nmero)
sustantivo + adjetivo posesivo
sustantivo + adjetivo posesivo pospuesto
el ordenador tuyo
sustantivo + adjetivo posesivo antepuesto o pospuesto
el ordenador nuestro
sustantivo + adjetivo demostrativo
el coche este
2.3.1.9.- ncleo nominal + adyacentes
sustantivo + adjetivo (concuerdan en gnero y nmero)
el coche nuevo
sustantivo + preposicin
la casa de Juan

- 106 -
Proceso de automatizacin del anlisis sintactico del espaol.

sustantivo + sustantivo
el rey len, el coche bomba, los nios probeta
2.3.1.10.- adyacentes + nulo
adjetivo + nulo
el coche verde {nulo}
sustantivo + nulo
el rey len {nulo}
2.3.1.11.- adyacentes + presentador o determinante (concuerdan en gnero y
nmero)
adjetivo + adjetivo posesivo
adjetivo + adjetivo posesivo pospuesto
la casa nueva ma
adjetivo + adjetivo posesivo pospuesto o antepuesto
la casa nueva nuestra
adjetivo + adjetivo demostrativo
la casa nueva aquella
2.3.1.12.- adyacentes + ncleo nominal (concuerdan en gnero y nmero)
adjetivo + sustantivo
la nueva casa
2.3.1.13.- adyacente + adyacente
adjetivo + adjetivo (concuerdan en gnero y nmero)
el coche rojo brillante
adjetivo + preposicin
el coche rojo de Juan

2.3.2.- El sintagma nominal heterogneo.


Los sintagmas nominales heterogneos son combinaciones de los homogneos.
sintagma nominal homogneo + conector + sintagma nominal homogneo
Los conectores son las conjunciones desde el punto de vista gramatical y la
coma (,) desde el punto de vista grfico; se deben aadir las combinaciones de
categoras funcionales de la tabla 6:
Tabla 3.6
El conector en el sintagma nominal heterogneo
Precedido de conector Seguido de conector
Presentador S S

- 107 -
Proceso de automatizacin del anlisis sintactico del espaol.

Ncleo nominal S S
Adyacentes S S

2.3.2.1- conector + presentador.


conjuncin coordinante + artculo determinado
el coche y la casa
conjuncin coordinante + artculo indeterminado
un coche o una casa
conjuncin coordinante + adjetivo posesivo
conjuncin coordinante + adjetivo posesivo antepuesto
un coche o mi casa
conjuncin coordinante + adjetivo posesivo antepuesto y pospuesto
un coche y nuestra casa
conjuncin coordinante + adjetivo demostrativo
un coche o esta casa
, + artculo determinado
Juan, la hermana y el padre
, + artculo indeterminado
un coche, una casa y un viaje
, + adjetivo posesivo
, + adjetivo posesivo antepuesto
un coche, mi casa y un viaje
, + artculo posesivo antepuesto y pospuesto
un coche, nuestra casa y un viaje
, + adjetivo demostrativo
un coche, esta casa o el yate
2.3.2.2.- conector + ncleo nominal.
conjuncin coordinante + sustantivo
Lidia y Mara
, + sustantivo
Lidia, Mara y Laura
2.3.2.3.- conector + adyacentes
conjuncin coordinante + adjetivo
el libro y viejas cosas

- 108 -
Proceso de automatizacin del anlisis sintactico del espaol.

, + adjetivo
el libro, viejas cosas
2.3.2.4.- presentador + conector
adjetivo posesivo + conjuncin coordinante
adjetivo posesivo pospuesto + conjuncin coordinante
el coche mo y el tuyo
adjetivo posesivo antepuesto o pospuesto + conjuncin coordinante
el coche nuestro y el tuyo
adjetivo posesivo + ,
adjetivo posesivo pospuesto + ,
el coche mo, el de ella y el tuyo
adjetivo posesivo antepuesto pospuesto + ,
el coche nuestro, el de ella y el tuyo
2.3.2.5.- ncleo nominal + conector
sustantivo + conjuncin coordinante
Juan y yo
sustantivo + ,
Juan, Pedro y Paco

2.3.2.6.- adyacentes + conector


adjetivo + conjuncin coordinante
el coche rojo y la casa azul
adjetivo + ,
el coche rojo, la casa azul

2.3.3.- El sintagma nominal sustitutivo.


El sintagma nominal sustitutivo aparece cuando el ncleo nominal est
constituido por una categora diferente al sustantivo: el pronombre y los adjetivos e
infinitivos precedidos de artculo. Respecto al sintagma nominal homogneo aparecen
las siguientes nuevas parejas:
2.3.3.1.- nulo + ncleo nominal
nulo + pronombre

- 109 -
Proceso de automatizacin del anlisis sintactico del espaol.

nulo + pronombre personal tnico (slo: yo, nosotros, t, vos, vosotros, l, ella,
ellos, ellas)
{nulo} Yo ir pronto
nulo + otro pronombre
{nulo} nadie vendr
2.3.3.2.- presentador + ncleo nominal (concuerda en gnero y nmero)
Cuando un adjetivo funciona como ncleo nominal:
artculo determinado + adjetivo (concuerdan en gnero y nmero)
el inquieto
artculo indeterminado + adjetivo (concuerdan en gnero y nmero)
un inquieto
adjetivo demostrativo + adjetivo (concuerdan en gnero y nmero)
este inquieto
Cuando el infinitivo funciona como ncleo nominal. El presentador siempre en
masculino singular.
artculo determinado + infinitivo
el cantar
artculo indeterminado + infinitivo
un cantar
adjetivo posesivo + infinitivo
adjetivo posesivo antepuesto + infinitivo
mi cantar
adjetivo posesivo antepuesto o pospuesto + infinitivo
nuestro cantar
adjetivo demostrativo + infinitivo
este cantar
El pronombre de relativo tambin puede funcionar como ncleo nominal. Con
los pronombres que y cual funcionan como ncleos del sintagma nominal cuando se
encuentran precedidos de un artculo. Adems quien puede sustituir a el que, la que, los
que y las que.
artculo determinado + pronombre de relativo.
el cual, el que
2.3.3.3.- ncleo nominal + nulo

- 110 -
Proceso de automatizacin del anlisis sintactico del espaol.

pronombre + nulo
pronombre personal tnico (slo: yo, nosotros, t, vos, vosotros, l, ella, ellos, ellas)
+ nulo
Juan y yo {nulo}
otro pronombre + nulo
Nadie {nulo}, el cual {nulo}
adjetivo + nulo
el inquieto {nulo}
infinitivo + nulo
el cantar {nulo}
pronombre de relativo + nulo
el cual {nulo}
2.3.3.4.- ncleo nominal + presentador (concuerda en gnero y nmero)
pronombre de relativo + adjetivo posesivo
pronombre de relativo + adjetivo posesivo pospuesto
el cual tuyo
pronombre de relativo + adjetivo posesivo pospuesto o antepuesto
el cual nuestro
adjetivo + adjetivo posesivo (concuerdan en gnero y nmero)
adjetivo + adjetivo posesivo pospuesto
el inquieto tuyo
adjetivo + adjetivo posesivo pospuesto o antepuesto
el inquieto nuestro
adjetivo + adjetivo demostrativo (concuerda en gnero y nmero)
el inquieto este
infinitivo + adjetivo posesivo (el presentador siempre en masculino singular)
infinitivo + adjetivo posesivo pospuesto
el cantar tuyo
infinitivo + adjetivo posesivo pospuesto o antepuesto
el cantar nuestro
infinitivo + adjetivo demostrativo (el presentador en masculino singular)
el bailar este
2.3.3.5.- ncleo nominal + adyacentes

- 111 -
Proceso de automatizacin del anlisis sintactico del espaol.

adjetivo + adjetivo (concuerdan en gnero y nmero)


el inquieto inteligente
adjetivo + preposicin
el inquieto de la casa de enfrente
infinitivo + adjetivo (el adjetivo siempre en masculino singular)
el cantar sonoro
infinitivo + preposicin
el cantar de la soprano
infinitivo + participio. El participio puede aparecer tras un infinitivo con funcin
adjetiva.
el estar cansado
infinitivo + gerundio.
estar comiendo
2.3.3.6.- adyacentes + ncleo nominal (concuerdan en gnero y nmero)
adjetivo + adjetivo
el inteligente inquieto
adjetivo + infinitivo (el adjetivo siempre en masculino singular)
el sonoro cantar

2.3.4.-El verbo.
Las estructuras verbales pueden ser divididas en dos grupos; formas verbales
simples y formas verbales complejas.

2.3.4.1.- Las formas verbales simples.


Estn formadas por un verbo en modo activo con estructura bsica:
nulo + forma verbal simple + nulo
y dan lugar a las siguientes parejas:
2.3.4.1.1- nulo + forma verbal simple
nulo + forma verbal personal
{nulo} fueron de paseo, {nulo} cantronse mutuamente
nulo + infinitivo
Cmo {nulo} cantar ?
2.3.4.1.2- forma verbal simple + nulo

- 112 -
Proceso de automatizacin del anlisis sintactico del espaol.

forma verbal personal + nulo


Ellos no vendrn {nulo}
infinitivo + nulo
Cmo cantar {nulo}?
2.3.4.2.- La forma verbal compleja
Tiene las siguientes estructuras bsicas:
2.3.4.2.1.- nulo + auxiliar + forma impersonal +nulo
2.3.4.2.1.1.- nulo + auxiliar
nulo + verbo
{nulo} haber comido, {nulo} fue estudiado
{nulo} suele hablar, {nulo} puedes ir
{nulo} va perdiendo
2.3.4.2.1.2.- nulo + forma impersonal
nulo + participio. En algunos casos el verbo se encuentra sobreentendido por lo que
no aparece.
{nulo} ha sido realizado por: {nulo} Realizado por:
2.3.4.2.1.3.- auxiliar + forma impersonal
verbo auxiliar {haber, ser} + participio
haber comido, fue estudiado, haba sido llamado
verbo auxiliar {auxiliar de incidencia directa} + infinitivo
suele hablar, puedes ir
verbo auxiliar + gerundio
va perdiendo
2.3.4.2.1.4.- forma impersonal + nulo
participio + nulo
haber comido {nulo}, fue estudiado {nulo}
infinitivo + nulo
suele hablar {nulo}, puedes ir {nulo}
gerundio + nulo
va perdiendo {nulo}
2.3.4.2.2.- nulo + procltico + forma personal + nulo
2.3.4.2.2.1.- nulo + procltico
nulo + pronombre personal tono (me, nos, te, os, le, les, la, las, lo, los, se)

- 113 -
Proceso de automatizacin del anlisis sintactico del espaol.

{nulo} lo es
2.3.4.2.2.2.- procltico + forma personal
pronombre personal tono + forma verbal personal
lo es, lo ha comido, lo suele hablar, lo va perdiendo
2.3.4.2.2.3.- forma verbal + nulo
forma verbal personal + nulo
lo es {nulo}
participio + nulo
lo ha comido {nulo}
infinitivo + nulo
lo suele hablar {nulo}
gerundio + nulo
lo va perdiendo {nulo}
2.3.4.2.3.- nulo + auxiliar de incidencia indirecta + conjuncin + infinitivo +nulo
La conjuncin aceptada es que al tratarse de un solo caso se debe tratar como
un caso especial.
2.3.4.2.3.1.- nulo + auxiliar de incidencia indirecta
nulo + forma verbal personal
{nulo} tiene que ir
2.3.4.2.3.2.- auxiliar de incidencia indirecta + conjuncin
forma verbal personal + que
tiene que ir
2.3.4.2.3.3.- conjuncin + infinitivo
que + infinitivo
tiene que ir
2.3.4.2.3.4.- infinitivo + nulo
infinitivo + nulo
tiene que ir {nulo}

2.3.4.2.4.- nulo + auxiliar de incidencia indirecta + preposicin + infinitivo + nulo


Tambin debe tratarse como caso especial, pues las preposiciones aceptadas son
a, de, en y por.
2.3.4.2.4.1.- nulo + auxiliar de incidencia indirecta

- 114 -
Proceso de automatizacin del anlisis sintactico del espaol.

nulo + verbo
{nulo} empieza a tener, {nulo} ha de extenderse, {nulo} tarda en reintegrarse,
{nulo} empieza por cambiar
2.3.4.2.4.2.- auxiliar de incidencia indirecta + preposicin
verbo + preposicin
empieza a tener, ha de extenderse, no tarda en reintegrarse, empieza por
cambiar
2.3.4.2.4.3.- preposicin + infinitivo
preposicin + infinitivo
empieza a tener, ha de extenderse, no tarda en reintegrarse, empieza por
cambiar
2.3.4.2.4.4.- infinitivo + nulo
infinitivo + nulo
empieza a tener {nulo}, ha de extenderse {nulo}, no tarda en reintegrarse
{nulo}, empieza por cambiar {nulo}
2.3.4.2.5.- mltiples ncleos verbales
2.3.4.2.5.1.- verbo + conector
verbo + conjuncin coordinante
Ellos llegarn y comern
verbo + ,
Ellos llegarn, comern y se irn
2.3.4.2.5.2.- conector + verbo
conjuncin coordinante + verbo
Ellos llegarn y comern
, + verbo
Ellos llegarn, comern y se irn

2.3.5.- El sintagma preposicional.


El sintagma preposicional se encuentra formado por una preposicin ms un
sintagma nominal; da lugar al siguiente conjunto de combinaciones:
2.3.5.1.- nulo + preposicin
nulo + preposicin
{nulo} en el cuarto

- 115 -
Proceso de automatizacin del anlisis sintactico del espaol.

2.3.5.2.- preposicin + presentador


preposicin + artculo determinado
en el cuarto
preposicin + artculo indeterminado
en un cajn del escritorio
preposicin + adjetivo posesivo
preposicin + adjetivo posesivo antepuesto
ven a mi casa
preposicin + adjetivo posesivo antepuesto o pospuesto
ven a nuestra casa
preposicin + adjetivo demostrativo
ven a esta casa
2.3.5.3.- preposicin + ncleo nominal
preposicin + sustantivo
para Juan
preposicin + pronombre
preposicin + pronombre personal tnico (slo: m, conmigo, nosotros, ti, contigo,
vos, vosotros, l, ella, ellos, ellas, s, consigo)
a ella
preposicin + otro pronombre
de alguien
2.3.5.4.- preposicin + adyacentes
preposicin + adjetivo
en cuatro segundos
2.3.5.5.- preposicin + preposicin. En algunos casos aparecen dos preposiciones
siendo la primera a o hasta.
preposicin + preposicin
a por ellos
hasta en la sopa

2.3.6.- El sintagma adjetivo.


2.3.6.1.- El sintagma adjetivo simple

- 116 -
Proceso de automatizacin del anlisis sintactico del espaol.

El sintagma adjetivo slo aparece con verbos copulativos, funciona como


atributo y est formado por un adjetivo, con estructura bsica:
nulo + ncleo del sintagma adjetivo + nulo
2.3.6.1.1.- nulo + ncleo del sintagma adjetivo
nulo + adjetivo
el coche es {nulo} grande {nulo}
S. Adjetivo
2.3.6.1.2.- ncleo del sintagma adjetivo + nulo
adjetivo + nulo
el coche es {nulo} grande {nulo}
2.3.6.2.- El sintagma adjetivo mltiple
Pueden aparecer unidos por conectores.
nulo + ncleo del sintagma adjetivo + conector + ncleo del sintagma adjetivo + nulo
2.3.6.2.1.- adjetivo + conector
adjetivo + conjuncin coordinante
el coche es grande y alto
adjetivo + ,
el coche es grande, alto y duro
2.3.6.2.2.- conector + adjetivo
conjuncin coordinante + adjetivo
el coche es grande y alto
, + adjetivo
el coche es grande, alto y duro

2.3.7.- El sintagma adverbial.


Las estructuras sintcticas del sintagma adverbial son:
nulo + adverbio + nulo
nulo + adverbio + adverbio + nulo
nulo + adverbio + sintagma preposicional + nulo
nulo + adverbio + sintagma nominal + nulo
nulo + locucin adverbial + nulo
2.3.7.1.- nulo + adverbio + nulo
2.3.7.1.1.- nulo + adverbio

- 117 -
Proceso de automatizacin del anlisis sintactico del espaol.

nulo + adverbio
Juan vendr {nulo} maana
2.3.7.1.2.- adverbio + nulo
adverbio + nulo
Juan vendr maana {nulo}
2.3.7.2.- nulo + adverbio + adverbio + nulo
2.3.7.2.1.- adverbio + adverbio
adverbio + adverbio
ms an
2.3.7.3.- nulo + adverbio + sintagma preposicional + nulo
2.3.7.3.1.- adverbio + preposicin
adverbio + preposicin
aqu en Canarias
2.3.7.4.- nulo + adverbio + sintagma nominal + nulo
2.3.7.4.1.- adverbio + presentador
adverbio + artculo determinado
mediante las reglas
adverbio + artculo indeterminado
mediante unas tasas
adverbio + adjetivo posesivo
adverbio + adjetivo posesivo antepuesto
mediante mi coche
adverbio + adjetivo posesivo antepuesto o pospuesto
mediante nuestras manos
adverbio + adjetivo demostrativo
mediante este tractor
2.3.7.4.2.- adverbio + ncleo nominal
adverbio + sustantivo
durante tiempo
2.3.7.4.3.- adverbio + adyacente
adverbio + adjetivo
muy grande
2.3.7.5.- nulo + locucin adverbial + nulo

- 118 -
Proceso de automatizacin del anlisis sintactico del espaol.

2.3.7.5.1.- preposicin + adverbio


preposicin + adverbio
de ms lejos
2.3.7.6.- El adverbio como adyacente. El adverbio puede aparecer en algunos casos
como adyacente de un adjetivo dentro de un sintagma nominal con lo que se debe aadir
la combinacin:
artculo determinado + adverbio
el muy canalla
Este caso se da con adverbios que modifican el grado de un adjetivo el adverbio hace funcin
de cuantificador.

2.3.8.- La unin entre distintas estructuras.


Las estructuras bsicas se combinan entre s para dar lugar a estructuras de mayor tamao. En
muchos casos no es necesario ninguna partcula de unin, pero en otros s. Cuando las estructuras que se
unen son proposiciones es necesario un elemento de unin, ste puede ser: conjuncin, coma (,) o
punto y coma (;). Es por lo que se aaden nuevas parejas.
2.3.8.1.- nulo + elemento de unin
nulo + conjuncin
Yo canto {nulo} y {nulo} t bailas
nulo + ,
La casa {nulo} , {nulo} comprada por ellos {nulo} , {nulo} es grande

nulo + ;
Sal a comer {nulo} ; {nulo} volver tarde
2.3.8.2.- elemento de unin + nulo
conjuncin + nulo
Yo canto {nulo} y {nulo} tu bailas
, + nulo
la casa {nulo} , {nulo} comprada por ellos {nulo} , {nulo} es grande
; + nulo
Sal a comer {nulo} ; {nulo} volver tarde

2.4.- El proceso de desambiguacin.


La desambiguacin consiste en realizar el anlisis morfolgico adecuado de cada una de las
palabras de un texto, eliminando los resultados que no respondan a su funcin en el texto.
Para automatizar el proceso de desambiguacin se realiza un estudio de las
posibles combinaciones de categoras. Se parte de los siguientes datos:

- 119 -
Proceso de automatizacin del anlisis sintactico del espaol.

A) Un conjunto de comportamientos funcionales permitidos (S).

Tabla 3.7
Comportamientos funcionales.
adjetivo
adjetivo demostrativo
adjetivo posesivo antepuesto
adjetivo posesivo antepuesto o pospuesto
adjetivo posesivo pospuesto
adverbio
artculo determinado
artculo indeterminado
conjuncin
conjuncin coordinante
contraccin
preposicin
pronombre de relativo
pronombre personal tono
pronombre personal tnico
otro pronombre
sustantivo
forma verbal personal
infinitivo
gerundio
participio
coma
punto y coma
puntuacin
nulo

B) El conjunto de grupos de posibles ambigedades del espaol (A).


A = {G0, G1, ..., Gn} donde Gi es el grupo de ambigedad i-simo. Cada grupo de
ambigedad est formado por un conjunto de k smbolos pertenecientes a S, sin
repeticiones, tal que su nmero es siempre mayor que dos y uno de los smbolos sea
siempre nulo los grupos fueron presentados en la tabla 4 del apartado 2 Las
ambigedades del espaol, sin incluir el smbolo nulo.

C) El conjunto de parejas (P) de smbolos de la forma a + b, donde a y b pertenecen a


S, que puedan darse en las estructuras locales del espaol las parejas fueron
presentadas en el apartado 3 Estructuras sintcticas del espaol. En la tabla 8 se
presentan todas las parejas y las condiciones de concordancia para ellas 1
concordancia en gnero y nmero, 2 el presentador debe encontrarse en masculino
singular, 3 el verbo que precede al participio es haber o ser, 4 la primera preposicin
debe ser a o hasta, 5 pueden aparecer dos adjetivos juntos que pertenecen a distintos
sintagmas no siendo necesaria la concordancia en gnero y nmero, esto ocurre cuando

- 120 -
Proceso de automatizacin del anlisis sintactico del espaol.

el segundo adjetivo es un, una, uno, unas o unos, 6 el adverbio debe tener caratersticas
de cuantificador.

Tabla 3.8
Parejas de comportamientos funcionales

adjetivo + adjetivo (1)(5) coma + infinitivo


adjetivo + adjetivo demostrativo (1) coma + nulo
adjetivo + adjetivo posesivo antepuesto o pospuesto (1) coma + participio
adjetivo + adjetivo posesivo pospuesto (1) coma + pronombre personal tnico
adjetivo + coma coma + sustantivo
adjetivo + conjuncin coordinante conjuncin + nulo
adjetivo + contraccin conjuncin coordinante + adjetivo
adjetivo + infinitivo (2) conjuncin coordinante + adjetivo demostrativo
adjetivo + nulo conjuncin coordinante + adjetivo posesivo antepuesto
adjetivo + preposicin conjuncin coordinante + adjetivo posesivo antepuesto o
adjetivo + sustantivo (1) pospuesto
adjetivo demostrativo + adjetivo (1) conjuncin coordinante + artculo determinado
adjetivo demostrativo + infinitivo (2) conjuncin coordinante + artculo indeterminado
adjetivo demostrativo + nulo conjuncin coordinante + forma verbal personal
adjetivo demostrativo + sustantivo (1) conjuncin coordinante + gerundio
adjetivo posesivo antepuesto + adjetivo (1) conjuncin coordinante + infinitivo
adjetivo posesivo antepuesto + adverbio (6) conjuncin coordinante + nulo
adjetivo posesivo antepuesto + infinitivo (2) conjuncin coordinante + participio
adjetivo posesivo antepuesto + sustantivo (1) conjuncin coordinante + pronombre de relativo
adjetivo posesivo antepuesto o pospuesto + adjetivo (1) conjuncin coordinante + sustantivo
adjetivo posesivo antepuesto o pospuesto + coma contraccin + adjetivo
adjetivo posesivo antepuesto o pospuesto + conjuncin contraccin + adjetivo demostrativo
adjetivo posesivo antepuesto o pospuesto + conjuncin contraccin + infinitivo
coordinante contraccin + pronombre de relativo
adjetivo posesivo antepuesto o pospuesto + infinitivo (2) contraccin + sustantivo
adjetivo posesivo antepuesto o pospuesto + nulo forma verbal personal + coma
adjetivo posesivo antepuesto o pospuesto + sustantivo (1) forma verbal personal + conjuncin coordinante
adjetivo posesivo pospuesto + coma forma verbal personal + gerundio
adjetivo posesivo pospuesto + conjuncin coordinante forma verbal personal + infinitivo
adjetivo posesivo pospuesto + nulo forma verbal personal + nulo
adverbio + adjetivo forma verbal personal + participio (3)
adverbio + adjetivo demostrativo forma verbal personal + preposicin
adverbio + adjetivo posesivo antepuesto gerundio + nulo
adverbio + adjetivo posesivo antepuesto o pospuesto infinitivo + adjetivo (2)
adverbio + adverbio infinitivo + adjetivo demostrativo (2)
adverbio + artculo determinado infinitivo + adjetivo posesivo antepuesto o pospuesto (2)
adverbio + artculo indeterminado infinitivo + adjetivo posesivo pospuesto (2)
adverbio + conjuncin coordinante infinitivo + adverbio
adverbio + contraccin infinitivo + contraccin
adverbio + nulo infinitivo + gerundio
adverbio + participio infinitivo + nulo
adverbio + preposicin infinitivo + participio
adverbio + sustantivo infinitivo + preposicin
artculo determinado + adjetivo (1) nulo + adjetivo
artculo determinado + adverbio (6) nulo + adjetivo demostrativo
artculo determinado + infinitivo (2) nulo + adjetivo posesivo antepuesto
artculo determinado + preposicin nulo + adjetivo posesivo antepuesto o pospuesto
artculo determinado + pronombre de relativo (1) nulo + adverbio
artculo determinado + sustantivo (1) nulo + artculo determinado
artculo indeterminado + adjetivo (1) nulo + artculo indeterminado
artculo indeterminado + infinitivo (2) nulo + coma
artculo indeterminado + pronombre de relativo (1) nulo + conjuncin
artculo indeterminado + sustantivo (1) nulo + conjuncin coordinante
coma + adjetivo nulo + contraccin
coma + adjetivo demostrativo nulo + forma verbal personal
coma + adjetivo posesivo antepuesto nulo + gerundio
coma + adjetivo posesivo antepuesto o pospuesto nulo + infinitivo
coma + artculo determinado nulo + otro pronombre
coma + artculo indeterminado nulo + participio
coma + forma verbal personal nulo + preposicin
coma + gerundio nulo + pronombre de relativo

- 121 -
Proceso de automatizacin del anlisis sintactico del espaol.

nulo + pronombre personal tnico


nulo + punto y coma
nulo + puntuacin
nulo + sustantivo
otro pronombre + conjuncin coordinante
otro pronombre + contraccin
otro pronombre + nulo
participio + nulo
participio + participio
preposicin + adjetivo
preposicin + adjetivo demostrativo
preposicin + adjetivo posesivo antepuesto
preposicin + adjetivo posesivo antepuesto o pospuesto
preposicin + adverbio
preposicin + artculo determinado
preposicin + artculo indeterminado
preposicin + forma verbal personal
preposicin + infinitivo
preposicin + otro pronombre
preposicin + pronombre de relativo
preposicin + pronombre personal tono
preposicin + pronombre personal tnico
preposicin + puntuacin
preposicin + sustantivo
preposicin + preposicin (4)
pronombre de relativo + adjetivo posesivo antepuesto
pospuesto (1)
pronombre de relativo + adjetivo posesivo pospuesto (1)
pronombre de relativo + nulo
pronombre personal tono + forma verbal personal
pronombre personal tono + nulo
pronombre personal tono + pronombre personal tono
pronombre personal tnico + coma
pronombre personal tnico + conjuncin coordinante
pronombre personal tnico + contraccin
pronombre personal tnico + nulo
pronombre personal tnico + preposicin
punto y coma + nulo
puntuacin + nulo
sustantivo + adjetivo (1)
sustantivo + adjetivo demostrativo (1)
sustantivo + adjetivo posesivo antepuesto o pospuesto (1)
sustantivo + adjetivo posesivo pospuesto (1)
sustantivo + coma
sustantivo + conjuncin coordinante
sustantivo + contraccin
sustantivo + nulo
sustantivo + participio
sustantivo + preposicin
sustantivo + sustantivo

- 122 -
Proceso de automatizacin del anlisis sintactico del espaol.

D) Un conjunto de combinaciones de categoras sintcticas vedadas (Q).


Debido a la existencia de reglas de la forma nulo + categora y categora + nulo
es posible que se acepten combinaciones que no deben permitirse.
Tabla 3.9
Combinaciones vedadas
adjetivo posesivo antepuesto o pospuesto + adjetivo posesivo antepuesto
adjetivo posesivo antepuesto o pospuesto + adjetivo posesivo antepuesto o pospuesto
adjetivo posesivo antepuesto o pospuesto + preposicin
coma + conjuncin + puntuacin
conjuncin coordinante + nulo
forma verbal personal + forma verbal personal
nulo + adjetivo demostrativo + forma verbal personal
preposicin + pronombre personal tono
pronombre personal tono + adjetivo
pronombre personal tono + adjetivo demostrativo
pronombre personal tono + adjetivo posesivo antepuesto
pronombre personal tono + adjetivo posesivo antepuesto o pospuesto
pronombre personal tono + adverbio
pronombre personal tono + artculo determinado
pronombre personal tono + conjuncin
pronombre personal tono + contraccin
pronombre personal tono + otro pronombre
pronombre personal tono + preposicin
pronombre personal tono + pronombre personal tnico
pronombre personal tono + sustantivo
puntuacin + conjuncin + coma
puntuacin + conjuncin + puntuacin

E) Un conjunto de casos especiales:


Aparicin de varias palabras que se pueden interpretar como formas verbales
personales en la secuencia. En la sentencia ellos confan en el progreso, tanto
confan como progreso se identifican como formas verbales personales; sin
embargo, como no existe ningn tipo de nexo de unin entre esas formas verbales
no se consideran las secuencias en las que ambas palabras se reconocen como forma
verbal personal.
Casos de desambiguacin entre el sustantivo y el adjetivo. Se ha considerado que en
los casos de ambigedad entre adjetivo y sustantivo, si existe presentador y ningn
adyacente, se opta por la opcin de sustantivo ya que su funcin es la de ncleo de
sintagma nominal. Este es el caso de la oracin el nio es alto, donde nio acta
como sustantivo y no como adjetivo.

- 123 -
Proceso de automatizacin del anlisis sintactico del espaol.

Reconocimiento del adjetivo frente al participio. En caso de ambigedad entre


adjetivo y participio se interpreta como adjetivo siempre que no figuren los nicos
verbos auxiliares que pueden acompaar al participio haber y ser. En la sentencia
el partido result aburrido la palabra aburrido se considera adjetivo y no
participio.
Pronombres personales precedidos de preposicin. De la palabra que precede a los
pronombres personales m, ti o s desaparece cualquier ambigedad porque debe ser
una preposicin. Este es el caso de la oracin Juan trajo una carta para m donde
para es preposicin y no forma verbal simple, ni adjetivo, ni conjuncin.
Modificacin en la concordancia flexiva para evitar cacofona. En los sintagmas
nominales, las palabras que acompaan al ncleo deben concordar en gnero y
nmero con l; sin embargo, existen casos en los cuales esto no ocurre, y son
aquellos en los que el ncleo comienza por a o ha tnicas, su flexin es femenino
singular y su presentador es el artculo determinado el como el agua, el hacha.
Particularidades de qu. Cuando se encuentra tras un smbolo de interrogacin o de
exclamacin se descarta la categora funcional conjuncin.
Particularidades de que. Ser conjuncin y no otra cosa, siempre que vaya precedida
de un verbo o un adverbio. Ser pronombre de relativo tras el, la, las, lo, los. Tras
una coma slo podr ser pronombre o conjuncin.
Particularidades de de. Cuando se encuentra antepuesta a un sustantivo su categora
funcional ser la de preposicin.
Particularidades de no. Slo funciona como sustantivo cuando va precedido de el o
un.
Particularidades de sobre y muy. El valor de sustantivo para estas dos palabras es
rechazado cuando es seguido por otro sustantivo.
Particularidades de te. Cuando se tiene la combinacin categora funcional +
sustantivo + verbo si el sustantivo se trata de la palabra te y la categora funcional
que abre la combinacin no se trata de un artculo u otro presentador, entonces se
rechaza la combinacin, pues te se trata de un pronombre personal.
Particularidades de para. Su funcin como adjetivo es rechazable ante adjetivo
posesivo, sustantivo, infinitivo y adjetivo.
Particularidades del adjetivo posesivo. En el caso de poder ser sustantivo es posible
rechazar esta funcin ante sustantivo, adjetivo e infinitivo.

- 124 -
Proceso de automatizacin del anlisis sintactico del espaol.

F) Restricciones opcionales por frecuencia:


Existe un conjunto de categoras funcionales que aparecen con gran frecuencia en
cualquier texto. Algunas de las palabras que pertenecen a estas categoras presentan
ambigedad funcional, apareciendo posibles funciones que se dan con muy poca
frecuencia. Tmese la, puede tener asignadas las funciones artculo determinado,
pronombre personal tono y sustantivo, sin embargo, la funcin sustantivo nota
musical se da en muy pocos casos. As pues es posible rechazar de manera opcional
la funcin sustantivo para aquellas palabras que pudiendo asignarseles las funciones
pronombre personal tono, pronombre personal tnico, conjuncin o preposicin,
tambien se les pueda asignar la funcin sustantivo. Por ejemplo, en la casa la palabra
la puede funcionar como artculo determinado, pronombre personal tono o sustantivo
y casa tiene asociadas como posibles categoras funcionales verbo y sustantivo; las
combinaciones posibles son seis, desechando la funcin de sustantivo asociada a la, el
nmero de combinaciones a estudiar pasa a ser la mitad.

A partir de estos datos es posible realizar un estudio de todas las combinaciones que
pudieran aparecer en cualquier texto del espaol que contengan ambigedades. Las
combinaciones se toman en elementos de tres.
Cj = tal que , SA y A
Teniendo en cuenta que existen 112 grupos posibles de ambigedades y 21
categoras, se obtienen un nmero de combinaciones posibles 133*133*112 = 1981168
de tres elementos; cada una de ellas dar lugar a un conjunto de ternas de funciones
posibles, el proceso de desambiguacin consistir en eliminar las ternas que no se
puedan dar.
Se siguen los siguientes pasos:
1. Se realiza el anlisis morfolgico de la sentencia y se obtiene el conjunto de
combinaciones posibles de funciones.
Ejemplo: El partido result una broma da lugar al siguiente anlisis de
posibles funciones:

El: artculo determinado


Partido: adjetivo, participio, sustantivo

- 125 -
Proceso de automatizacin del anlisis sintactico del espaol.

Result: forma verbal personal


Una: adjetivo, artculo indeterminado, pronombre, forma verbal personal
Broma: forma verbal personal, sustantivo

Esto da lugar al siguiente conjunto de posibles secuencias:


nulo + artculo determinado + adjetivo + forma verbal personal + adjetivo + forma verbal personal + nulo
nulo + artculo determinado + adjetivo + forma verbal personal + adjetivo + sustantivo + nulo
nulo + artculo determinado + adjetivo + forma verbal personal + artculo indeterminado + forma verbal personal +
nulo
nulo + artculo determinado + adjetivo + forma verbal personal + adjetivo + artculo indeterminado + nulo
nulo + artculo determinado + adjetivo + forma verbal personal + pronombre + forma verbal personal + nulo
nulo + artculo determinado + adjetivo + forma verbal personal + pronombre + sustantivo + nulo
nulo + artculo determinado + adjetivo + forma verbal personal + forma verbal personal + forma verbal personal +
nulo
nulo + artculo determinado + adjetivo + forma verbal personal + forma verbal personal + sustantivo + nulo
nulo + artculo determinado + participio + forma verbal personal + adjetivo + forma verbal personal + nulo
nulo + artculo determinado + participio + forma verbal personal + adjetivo + sustantivo + nulo
nulo + artculo determinado + participio + forma verbal personal + artculo indeterminado + forma verbal personal +
nulo
nulo + artculo determinado + participio + forma verbal personal + adjetivo + artculo indeterminado + nulo
nulo + artculo determinado + participio + forma verbal personal + pronombre + forma verbal personal + nulo
nulo + artculo determinado + participio + forma verbal personal + pronombre + sustantivo + nulo
nulo + artculo determinado + participio + forma verbal personal + forma verbal personal + forma verbal personal +
nulo
nulo + artculo determinado + participio + forma verbal personal + forma verbal personal + sustantivo + nulo
nulo + artculo determinado + sustantivo + forma verbal personal + adjetivo + forma verbal personal + nulo
nulo + artculo determinado + sustantivo + forma verbal personal + adjetivo + sustantivo + nulo
nulo + artculo determinado + sustantivo + forma verbal personal + artculo indeterminado + forma verbal personal +
nulo
nulo + artculo determinado + sustantivo + forma verbal personal + adjetivo + artculo indeterminado + nulo
nulo + artculo determinado + sustantivo + forma verbal personal + pronombre + forma verbal personal + nulo
nulo + artculo determinado + sustantivo + forma verbal personal + pronombre + sustantivo + nulo
nulo + artculo determinado + sustantivo + forma verbal personal + forma verbal personal + forma verbal personal +
nulo
nulo + artculo determinado + sustantivo + forma verbal personal + forma verbal personal + sustantivo + nulo

Como se puede observar se han aadido como principio y final de sentencia


la funcin nulo.

2. Se examina cada una de las secuencias de tres en tres elementos para ver si se
rechaza o no el central. Dada la secuencia de funciones + + , entonces se
acepta si y slo si se da alguna de las siguientes condiciones:
{ + } y { + } pertenecen a P
{nulo + } y { + } pertenecen a P
{ + } y { + nulo} pertenecen a P
{ nulo + } y { + nulo} pertenecen a P

- 126 -
Proceso de automatizacin del anlisis sintactico del espaol.

Debe tenerse en cuenta que cuando se rechaza cualquier elemento de una


secuencia se rechaza toda la secuencia y no es necesario examinar los restantes
elementos.
Para la secuencia nulo + artculo determinado + participio + forma verbal
personal + forma verbal personal + forma verbal personal + nulo, se muestran
las ternas en la tabla 10.
Tabla 3.10
Anlisis de ternas del ejemplo
Ternas
nulo + artculo determinado + participio Rechazada
artculo determinado + participio + forma verbal personal No analizada
participio + forma verbal personal + forma verbal personal No analizada
forma verbal personal + forma verbal personal + forma verbal personal No analizada
forma verbal personal + forma verbal personal + nulo No analizada

El proceso deja las siguientes secuencias no rechazadas:


nulo + artculo determinado + sustantivo + forma verbal personal + forma verbal personal + forma verbal personal + nulo
nulo + artculo determinado + sustantivo + forma verbal personal + forma verbal personal + sustantivo + nulo
nulo + artculo determinado + sustantivo + forma verbal personal + adjetivo + forma verbal personal + nulo
nulo + artculo determinado + sustantivo + forma verbal personal + adjetivo + sustantivo + nulo
nulo + artculo determinado + sustantivo + forma verbal personal + pronombre + forma verbal personal + nulo
nulo + artculo determinado + sustantivo + forma verbal personal + pronombre + sustantivo + nulo
nulo + artculo determinado + sustantivo + forma verbal personal + articulo indeterminado + forma verbal personal + nulo
nulo + artculo determinado + sustantivo + forma verbal personal + articulo indeterminado + sustantivo + nulo
nulo + artculo determinado + adjetivo + forma verbal personal + forma verbal personal + forma verbal personal + nulo
nulo + artculo determinado + adjetivo + forma verbal personal + forma verbal personal + sustantivo + nulo
nulo + artculo determinado + adjetivo + forma verbal personal + adjetivo + forma verbal personal + nulo
nulo + artculo determinado + adjetivo + forma verbal personal + adjetivo + sustantivo + nulo
nulo + artculo determinado + adjetivo + forma verbal personal + pronombre + forma verbal personal + nulo
nulo + artculo determinado + adjetivo + forma verbal personal + pronombre + sustantivo + nulo
nulo + artculo determinado + adjetivo + forma verbal personal + articulo indeterminado + forma verbal personal + nulo
nulo + artculo determinado + adjetivo + forma verbal personal + articulo indeterminado + sustantivo + nulo

3. De las secuencias no rechazadas se eliminan las que contengan alguna


subsecuencia vedada.
Por ejemplo si se analiza la secuencia:
nulo + pronombre personal + forma verbal personal + forma verbal personal +
sustantivo + nulo
aparece la combinacin forma verbal personal + forma verbal personal que se
encuentra como vedada en la tabla 9 por lo que queda rechazada. Tras el anlisis de
vedadas quedan las siguientes secuencias:
nulo + artculo determinado + sustantivo + forma verbal personal + adjetivo + sustantivo + nulo
nulo + artculo determinado + sustantivo + forma verbal personal + articulo indeterminado + forma verbal personal + nulo
nulo + artculo determinado + sustantivo + forma verbal personal + articulo indeterminado + sustantivo + nulo
nulo + artculo determinado + adjetivo + forma verbal personal + adjetivo + sustantivo + nulo
nulo + artculo determinado + adjetivo + forma verbal personal + articulo indeterminado + forma verbal personal + nulo
nulo + artculo determinado + adjetivo + forma verbal personal + articulo indeterminado + sustantivo + nulo

- 127 -
Proceso de automatizacin del anlisis sintactico del espaol.

4. Anlisis de casos especiales. Se da la aparicin de dos categoras de tipo forma verbal personal
entre las cuales no aparece un nexo de unin vlido. Tras la aplicacin de la eliminacin de las
secuencias correspondientes el resultado ser:

nulo + artculo determinado + sustantivo + forma verbal personal + adjetivo + sustantivo + nulo
nulo + artculo determinado + sustantivo + forma verbal personal + artculo indeterminado + sustantivo + nulo

2.5.- Reduccin de las alternativas por desambigacin funcional.


La eliminacin de ambigedades producir una notable mejora del rendimiento
del proceso de anlisis sintctico. Se presenta a continuacin un ejemplo y las
caractersticas de esta mejora: de la sentencia hablaron los representantes de los
distintos municipios, se obtienen las siguientes combinaciones de comportamientos
funcionales a analizar:
Tabla 3.11
Combinaciones posibles para la sentencia del ejemplo

hablaron los representantes de los distintos municipios


1 Verbo artculo sustantivo preposicin artculo adjetivo sustantivo
2 Verbo artculo sustantivo preposicin pronombre adjetivo sustantivo
3 Verbo articulo sustantivo sustantivo artculo adjetivo sustantivo
4 Verbo artculo sustantivo sustantivo pronombre adjetivo sustantivo
5 Verbo pronombre sustantivo preposicin artculo adjetivo sustantivo
6 Verbo pronombre sustantivo preposicin pronombre adjetivo sustantivo
7 Verbo pronombre sustantivo sustantivo artculo adjetivo sustantivo
8 Verbo pronombre sustantivo sustantivo pronombre adjetivo sustantivo

Existen 8 combinaciones posibles todas deberan analizarse; sin embargo,


es posible rechazar la mayor parte aplicando las reglas anteriormente expuestas. Para la
primera aparicin de los, se reducen las combinaciones a analizar en un 50%; si a las
restantes combinaciones se aplican las reglas sobre la aparicin de la palabra de, se
volver a reducir en un 50%; y, finalmente, si se repite el proceso con el segundo los se
tendr una nueva reduccin del 50%. En total, la reduccin obtenida es del 87,5% se
eliminan 7 de las 8 posibles combinaciones.
As pues, la reduccin de las combinaciones a estudiar puede calcularse a partir
de la siguiente frmula que indica el nmero mnimo de combinaciones a desechar.

k
n
R ( n, k ) =
i =1 2i

Donde k es el nmero de veces que se aplica una regla de este tipo para una
misma palabra es posible aplicar varias de estas reglas cuando el analizador morfolgico

- 128 -
Proceso de automatizacin del anlisis sintactico del espaol.

devuelve ms de dos comportamientos funcionales y n es el nmero de


combinaciones totales.

3
8 8 8 8 8 8 8
R (8,3) = = + + = + + =7
i =1 2
i
21 22 23 2 4 8

Si se desea obtener el porcentaje entonces:

100 R(n, k ) k
1 1
Porcentaje = = 100 = 100 1
n i =1 2k 2k

As pues para el ejemplo visto se tiene:

1 7
Porcentaje = 100 1 = 100 = 87,5%
23 8

2.6.- Estadsticas.
Se presentan dos estudios estadsticos. El primero hace referencia al anlisis realizado sobre
todas las combinaciones tericamente posibles de ambigedades cuando se toman elementos de tres en
tres. El segundo expone los resultados obtenidos del anlisis de un texto.
Se utiliza como medida de bondad de la desambiguacin:
B = (p*100)/(n-1)
Donde
p = nmero total de combinaciones nmero de combinaciones aceptadas
n = nmero de combinaciones posibles.

2.6.1.- Estudio sobre ternas tericas.


Se distinguen cuatro casos segn la localizacin de las ambigedades. Para cada uno, se
presentan los resultados cuando se aplica slo el anlisis de parejas, parejas ms combinaciones vedadas y
el caso ms favorable cuando tambin interviene la concordancia.

2.6.1.1.- Caso 1. Cuando cualquier palabra con ambigedad tiene a ambos lados palabras ambiguas.

Figura 3.3
Estudio sobre ternas tericas: a) con ambigedad por ambos lados

- 129 -
Proceso de automatizacin del anlisis sintactico del espaol.

Parejas
45
Parejas + vedadas

Bondad de la desambigacin 40 Parejas + vedadas + flexin

35
30
25
20
15
10
5
0
0 20 40 60 80 100 120
Combinaciones

2.6.1.2.- Caso 2. Cuando cualquier palabra con ambigedad tiene a la derecha cualquier
palabra ambigua y a la izquierda otra que no lo sea.
Figura 3.4
Estudio sobre ternas tericas: b) con ambigedad slo por la derecha

45 Parejas
Parejas + vedadas
40 Parejas + vedadas + flexin
Bondad de la desambigacin

35

30

25

20

15

10

0
0 5 10 15 20 25
Combinaciones

2.6.1.3.- Caso 3. Cuando cualquier palabra con ambigedad tiene a la izquierda


cualquier palabra ambigua y a la derecha otra que no lo sea.

- 130 -
Proceso de automatizacin del anlisis sintactico del espaol.

Figura 3.5
Estudio sobre ternas tericas: c) con ambigedad slo por la izquierda

45 Parejas
Parejas + vedadas
40 Parejas + vedadas+ flexin
Bondad de la desambigacin

35

30

25

20

15

10

0
0 5 10 15 20 25
Combinaciones

Los casos 2 y 3 presentan resultados diferentes debido a que no se obtiene el


mismo resultado de la combinacin A + B + C que de la C + B + A, pues la existencia
de una pareja de categoras + no implica la existencia de la pareja +.
Tabla 3.12
Cuadro de aceptaciones y rechazos de parejas de comportamientos funcionales

Categora por el lado izquierdo


adjetivo ap ap al ap ap al al al al ap ap ap al al al al ap al ap al al ap al al ap
adjetivo demostrativo ap al al al ri al al al al al al al al al al al ap al ap al al al al al ap
adjetivo posesivo antepuesto ap ri ri ri ri ap ri ri ri ri ri ri ri ri ri ri ap ri ap ri ri ri ri ri ri
adjetivo posesivo antepuesto o pospuesto ap al rv rv ri al al al ap ap al rv al al al al ap al ap al al ap al al ap
adjetivo posesivo pospuesto al al al al ri al al al al ap al al al al al al al al al al al ap al al ap
adverbio ap ap ap ap ri ap ap ap al ap ap ap al al al al ap al al al al al al al ap
artculo determinado ap ri ri ri ri ap ri ri ri ri ri ap ap ri ri ri ap ri ap ri ri ri ri ri ri
artculo indeterminado ap ri ri ri ri ri ri ri ri ri ri ri ap ri ri ri ap ri ap ri ri ri ri ri ri
conjuncin al al al al ri al al al al al al al al al al al al al al al al al al al ap
conjuncin coordinante ap ap ap ap ri al ap ap al al al al ap al al al ap ap ap ap al al al al rv
contraccin ap ap ri ri ri ri ri ri ri ri ri ri ap ri ri ri ap ri ap ri ri ri ri ri ri
preposicin ap ap ap ap ri ap ap ap ri ri ri ap ap rv ap ap ap ap ap ri ri ri ri ap ri
pronombre de relativo al al al ap ap al al al al al al al al al al al al al al al al al al al ap
pronombre personal tono rv rv rv rv ri rv rv rv rv al rv rv al ap rv rv rv ap al al al al al al ap
pronombre personal tnico al al al al ri al al al al ap ap ap al al al al al al al al al ap al al ap
otro pronombre al al al al ri al al al al ap ap al al al al al al al al al al al al al ap
sustantivo ap ap al ap ap al al al al ap ap ap al al al al ap al al al al ap al al ap
forma verbal personal al al al al ri al al al al ap al ap al al al al al rv ap ap ap ap al al ap
infinitivo ap ap al ap ap ap al al al al ap ap al al al al al al al ap ap al al al ap
gerundio al al al al ri al al al al al al al al al al al al al al al al al al al ap
participio al al al al ri al al al al al al al al al al al al al al al al al al al ap
coma ap ap ap ap ri al ap ap al al al al al al ap al ap ap ap ap ap al al al ap
punto y coma al al al al ri al al al al al al al al al al al al al al al al al al al ap
puntuacin al al al al ri al al al al al al al al al al al al al al al al al al al ap
nulo ap ap ap ap ri ap ap ap ap ap ap ap ap ap ap ap ap ap ap ap ap ap ap ap ri

- 131 -
Proceso de automatizacin del anlisis sintactico del espaol.

conjuncin coordinante

otro pronombre

coma
punto y coma
forma verbal personal
adjetivo
adjetivo demostrativo
adjetivo posesivo antepuesto
adjetivo posesivo antepuesto o pospuesto
adjetivo posesivo pospuesto
adverbio
artculo determinado
artculo indeterminado
conjuncin

contraccin
preposicin
pronombre de relativo
pronombre personal tono
pronombre personal tnico

sustantivo

infinitivo
gerundio
participio

puntuacin
nulo
Categora por el lado derecho

Donde:
ap = se acepta porque constituye pareja por regla sintctica
ri = se rechaza por imposibilidad de formar pareja
rv = se rechaza por ser pareja vedada
al = se acepta porque forma pareja en los lmites de estructuras

Dado el nmero de categoras aceptadas de 25, cada tringulo a los lados de la


diagonal principal est formado por 300 elementos. Se obtiene un total de 99 elementos
asimtricos con lo que el porcentaje de asimetra de las reglas gramaticales utilizadas es
del 33%. Si no se tienen en cuenta las combinaciones vedadas entonces el nmero de
elementos asimtricos es 88 dando un porcentaje de asimetra de 27%.
2.6.1.4.- Caso 4. Cuando cualquier palabra con ambigedad tiene palabras sin
ambigedad a la derecha y a la izquierda.
Figura 3.6
Estudio sobre ternas tericas: d) sin ambigedad por ambos lados

Parejas
45 Parejas + vedadas
40 Parejas + vedadas + flexin
Bondad de la desambigacin

35

30

25

20

15
10

0
2 3 4 5
Combinaciones

- 132 -
Proceso de automatizacin del anlisis sintactico del espaol.

2.6.2.- Estudio sobre texto real.


Se ha seleccionado como texto de prueba la traduccin de El Principito de Antoine de Saint
Exupry obtenido de la web:
http://www.geocities.com/Athens/Delphi/1469/principito/prin_indice.html .
La distribucin del nmero de combinaciones de las sentencias para el texto es:
Figura 3.7
Distribucin del nmero de combinaciones por sentencia en el texto

200
180
Nmero de sentencias

160
140
120
100
80
60
40
20
0
2 40 192 768 2592 10240 29160 92160 2E+05 1E+06 2E+08
Nmero de combinaciones

Las combinaciones de elementos tomados de tres en tres en el texto real seleccionado son las que
se presentan a continuacin:

Figura 3.8
Distribucin de los tipos de ternas en el texto

Con ambigedad
por ambos lados
Con ambigedad 12%
slo por la
derecha
12%

Con ambigedad Sin ambigedad


slo por la central
izquierda 58%
12%
Sin ambigedad
por ambos lados
13%

La bondad media de la desambiguacin en el anlisis por parejas es:


B parejas = 15 %
Por parejas ms combinaciones vedadas es:
B parejas + vedadas = 67 %
Por parejas, ms combinaciones vedadas, ms flexin es:
B parejas + vedadas + flexin = 75 %
Por parejas, ms combinaciones vedadas, ms flexin y ms casos especiales es:
B parejas + vedadas + flexin + casos especiales = 86 %

- 133 -
Proceso de automatizacin del anlisis sintactico del espaol.

En cuanto al nmero de combinaciones rechazadas mediante la aplicacin de


cada mtodo se obtienen los siguientes porcentajes:

Figura 3.9
Distribucin de las combinaciones

Sin eliminar
Eliminadas por 14%
casos Eliminadas por
especiales parejas
11% 15%

Eliminadas por Eliminadas por


flexin vedadas
8% 52%

2.7.- Conclusiones.
Considerando la desambiguacin como el proceso por el cual se rechazan
funciones no vlidas para las palabras que forman parte de una sentencia, es posible
eliminar, de promedio, cerca del 80%: permite reducir el nmero de combinaciones que
deben estudiarse en los tratamientos de textos que necesitan conocer la funcin
gramatical de las palabras.
Se obtiene como conclusin que no es posible una desambiguacin completa sin
introducir nuevos mecanismos de nivel superior; as, por ejemplo, para reconocer un
adjetivo que acta aisladamente como un sintagma adjetivo, es necesario conocer si el
verbo de la oracin es copulativo. Por otro lado, la desambiguacin y el anlisis
sintctico deben complementarse entre s para la obtencin de resultados con menor
grado de ambigedad desde la perspectiva de la consideracin de la sentencia entera.
Esta desambigacin acelera el proceso de anlisis sintctico al podar
estructuras incorrectas.

- 134 -
Proceso de automatizacin del anlisis sintactico del espaol.

Captulo 3 Apartado 4
Las ambigedades estructurales de la gramtica

4.1.- Introduccin.
En el anlisis sobre textos escritos, al aplicar la gramtica definida en el captulo
2 a una combinacin de comportamientos funcionales de las palabras de una sentencia
es posible que se genere ms de un rbol de anlisis. A esta aparicin de mltiples
resultados se denomina ambigedad estructural. La existencia de ms de una regla con
el mismo smbolo o combinacin de smbolos en su parte derecha es lo que se denomina
ambigedad estructural directa. La siguiente lista presenta las reglas que dan lugar a
ambigedades estructurales directas, por coincidir sus partes derechas.

Grupo 1:
adyacente
ncleo nominal
ncleo verbal adjetivo
ncleo verbal pasivo
sintagma adjetivo

Grupo 2:
adyacente
conector subordinante adverbio
sintagma adverbial

Grupo 3:
adyacentes
conector
conector subordinante adverbio + adjetivo
sintagma adjetivo
sintagma adverbial

- 135 -
Proceso de automatizacin del anlisis sintactico del espaol.

Grupo 4:
conector subordinante
adverbio + adverbio
sintagma adverbial

Grupo 5:
construccin comparativa adverbio+ sintagma nominal

sintagma adverbial heterogneo

Grupo 6:
construccin comparativa
adverbio + sintagma nominal
grupo nominal
homogneo
sintagma adverbial

Grupo 7:
sintagma nominal homogneo
adyacente + ncleo nominal
sintagma nominal sustitutivo

Grupo 8:
adyacente + ncleo nominal +
sintagma nominal homogneo
adyacente + complemento
sintagma nominal sustitutivo
preposicional del nombre

Grupo 9:
sintagma nominal homogneo adyacente + presentador + ncleo

sintagma nominal sustitutivo nominal

Grupo 10:
conector
conjuncin
conector subordinante

Grupo 11:
conector
conjuncin + conjuncin
conector subordinante

Grupo 12:
ncleo verbal
ncleo verbal copulativo forma verbal compleja
ncleo verbal pasivo

Grupo 13:
ncleo verbal
forma verbal simple
ncleo verbal copulativo

Grupo 14:
circunstancial
ncleo verbal gerundio
ncleo verbal copulativo

- 136 -
Proceso de automatizacin del anlisis sintactico del espaol.

Grupo 15:
ncleo nominal
ncleo verbal infinitivo
ncleo verbal copulativo

Grupo 16:
ncleo nominal
infinitivo con pronombre encltico
ncleo verbal

Grupo 17:
sintagma nominal homogneo
ncleo nominal
sintagma nominal sustitutivo

Grupo 18:
sintagma nominal homogneo
ncleo nominal + adyacente
sintagma nominal sustitutivo

Grupo 19:
sintagma nominal homogneo
ncleo nominal + adyacentes
sintagma nominal sustitutivo

Grupo 20:
proposicin
proposicin de infinitivo oracin atributiva
proposicin subordinada

Grupo 21:
proposicin
proposicin de infinitivo oracin de suplemento
proposicin subordinada

Grupo 22:
proposicin
proposicin de infinitivo oracin intransitiva
proposicin subordinada

Grupo 23:
proposicin
proposicin de infinitivo oracin transitiva
proposicin subordinada

Grupo 24:
ncleo verbal
participio
ncleo verbal pasivo

Grupo 25:
oracin atributiva
predicado
oracin de suplemento

- 137 -
Proceso de automatizacin del anlisis sintactico del espaol.

oracin intransitiva
oracin pasiva
oracin transitiva

Grupo 26:
oracin atributiva
oracin de suplemento
predicado + coma + sujeto +
oracin intransitiva
predicado
oracin pasiva
oracin transitiva

Grupo 27:
oracin atributiva
oracin de suplemento
oracin intransitiva predicado + puntuacin
oracin pasiva
oracin transitiva

Grupo 28:
oracin atributiva
oracin de suplemento
oracin intransitiva predicado + sujeto
oracin pasiva
oracin transitiva

Grupo 29:
oracin atributiva
oracin de suplemento
oracin intransitiva predicado + sujeto + predicado
oracin pasiva
oracin transitiva

Grupo 30:
oracin atributiva
oracin de suplemento
predicado + sujeto + predicado +
oracin intransitiva
puntuacin
oracin pasiva
oracin transitiva

Grupo 31:
oracin atributiva
oracin de suplemento
oracin intransitiva predicado + sujeto + puntuacin
oracin pasiva
oracin transitiva

Grupo 32:
conector subordinante preposicin

- 138 -
Proceso de automatizacin del anlisis sintactico del espaol.

preposicin subordinante

Grupo 33:
conector subordinante
preposicin + adverbio
locucin adverbial

Grupo 34:
conector
preposicin + sustantivo
conector subordinante

Grupo 35:
sintagma nominal homogneo presentador + adyacente + ncleo

sintagma nominal sustitutivo nominal

Grupo 36:
sintagma nominal homogneo
presentador + ncleo nominal
sintagma nominal sustitutivo

Grupo 37:
sintagma nominal homogneo presentador + ncleo nominal +

sintagma nominal sustitutivo adyacente

Grupo 38:
presentador + ncleo nominal +
sintagma nominal homogneo
adyacente + complemento
sintagma nominal sustitutivo
preposicional del nombre

Grupo 39:
sintagma nominal homogneo presentador + ncleo nominal +

sintagma nominal sustitutivo adyacentes

Grupo 40:
presentador + ncleo nominal +
sintagma nominal homogneo
complemento preposicional del
sintagma nominal sustitutivo
nombre

Grupo 41:
morfema de impersonal
morfema de pasiva
pronombre personal tono
morfema de voz media
ncleo nominal

Grupo 42:
adyacente
conector subordinante pronombre de relativo
ncleo nominal

Grupo 43:
ncleo nominal otro pronombre

- 139 -
Proceso de automatizacin del anlisis sintactico del espaol.

presentador

Grupo 44:
circunstancial
complemento preposicional del
nombre
proposicin
objeto directo
sujeto
vocativo

Grupo 45:
objeto directo
proposicin de infinitivo
sujeto

Grupo 46:
adyacente
aposicin
atributo
circunstancial
complemento preposicional del proposicin subordinada
nombre
objeto directo
subordinada comparativa
sujeto

Grupo 47:
oracin exclamativa puntuacin + oracin atributiva +

oracin interrogativa puntuacin

Grupo 48:
oracin exclamativa puntuacin + oracin de suplemento

oracin interrogativa + puntuacin

Grupo 49:
oracin exclamativa puntuacin + oracin intransitiva

oracin interrogativa +puntuacin

Grupo 50:
oracin exclamativa puntuacin + oracin pasiva +

oracin interrogativa puntuacin

Grupo 51:
oracin exclamativa puntuacin + oracin transitiva +

oracin interrogativa puntuacin

Grupo 52:
oracin exclamativa
puntuacin + sentencia + puntuacin
oracin interrogativa

- 140 -
Proceso de automatizacin del anlisis sintactico del espaol.

Grupo 53:
adyacente
atributo
sintagma adjetivo
predicativo objetivo
predicativo subjetivo

Grupo 54:
atributo
objeto directo sintagma nominal heterogneo
sujeto

Grupo 55:
atributo
circunstancial
objeto directo sintagma nominal homogneo
sujeto
vocativo

Grupo 56:
atributo
circunstancial
objeto directo sintagma nominal sustitutivo
objeto indirecto
sujeto

Grupo 57:
atributo
circunstancial
complemento adjetivo
complemento agente
complemento preposicional del sintagma preposicional
nombre
objeto directo
objeto indirecto
suplemento

Grupo 58:
oracin atributiva
oracin de suplemento
oracin intransitiva sujeto + coma + predicado
oracin pasiva
oracin transitiva

Grupo 59:
oracin atributiva
oracin de suplemento sujeto + predicado
oracin intransitiva

- 141 -
Proceso de automatizacin del anlisis sintactico del espaol.

oracin pasiva
oracin transitiva

Grupo 60:
oracin atributiva
oracin de suplemento
oracin intransitiva sujeto + predicado + puntuacin
oracin pasiva
oracin transitiva

Grupo 61:
aposicin
sustantivo
ncleo nominal

Grupo 62:
auxiliar
auxiliar pasivo verbo
forma verbal simple

Con estas reglas se crea una tabla de conflictos primarios que indica qu parejas
de smbolos no terminales podran dar lugar a rboles de anlisis errneos.

- 142 -
Proceso de automatizacin del anlisis sintactico del espaol.

Tabla 3.18
Conflictos primarios
adyacente s s s s s s s s s s s s s s s
adyacentes s s s s
aposicin s s s s s s s s s
atributo s s s s s s s s s s s s s s
auxiliar s s
auxiliar pasivo s s
circunstancial s s s s s s s s s s s s s s
complemento adjetivo s s s s s s s
complemento agente s s s s s s s
complemento preposicional del nombre s s s s s s s s s s s s
conector s s s s
conector subordinante s s s s s s s s
construccin comparativa s s
forma verbal simple s s
grupo nominal s s
locucin adverbial s
morfema de pasiva s s s
morfema de voz media s s s
morfema de impersonal s s s
ncleo nominal s s s s s s s s s s s
ncleo verbal s s s s s s
ncleo verbal copulativo s s s s
ncleo verbal pasivo s s s s s
objeto directo s s s s s s s s s s s s
objeto indirecto s s s s s s s s
oracin atributiva s s s s
oracin de suplemento s s s s
oracin exclamativa s
oracin interrogativa s
oracin intransitiva s s s s
oracin pasiva s s s s
oracin transitiva s s s s
predicativo objetivo s s s
predicativo subjetivo s s s
preposicin subordinante s
presentador s
proposicin s s
proposicin de infinitivo s s
proposicin subordinada s s
sintagma adjetivo s s s s s s s s
sintagma adverbial s s s s s s s
sintagma nominal homogneo s
sintagma nominal sustitutivo s
subordinada comparativa s s s s s s s
sujeto s s s s s s s s s
suplemento s s s s s s s
vocativo s s s s s s
complemento preposicional del nombre

sintagma nominal homogneo


sintagma nominal sustitutivo
construccin comparativa

subordinada comparativa
preposicin subordinante

proposicin subordinada
ncleo verbal copulativo

proposicin de infinitivo
morfema de impersonal

oracin de suplemento
morfema de voz media
conector subordinante
complemento adjetivo

oracin interrogativa

predicativo subjetivo
ncleo verbal pasivo
complemento agente

oracin exclamativa
forma verbal simple

predicativo objetivo
oracin intransitiva

sintagma adverbial
morfema de pasiva
locucin adverbial

oracin atributiva

oracin transitiva

sintagma adjetivo
objeto indirecto
ncleo nominal
auxiliar pasivo

oracin pasiva
grupo nominal
circunstancial

objeto directo
ncleo verbal

presentador
proposicin

suplemento
adyacentes
adyacente

aposicin

conector

vocativo
atributo
auxiliar

sujeto

A partir de la tabla 3.18 se analiza cada conflicto en busca de soluciones a los


mismos. Adems de los conflictos primarios aparecen otros conflictos que se tratarn
ms adelante. Existen situaciones de ambigedades reales que pueden dar lugar a ms
de una interpretacin vlida de una sentencia.

4.2.- Resolucin de conflictos primarios.


Aunque un buen uso de la puntuacin lo que no sucede siempre resuelve
muchos casos, no existe una regla nica para la resolucin de estos conflictos la
seleccin de un nico smbolo depende de diversos factores. A continuacin se

- 143 -
Proceso de automatizacin del anlisis sintactico del espaol.

proponen mltiples consideraciones que dan lugar a reglas para la resolucin de


conflictos; la superposicin de estas reglas producir la eliminacin de los rboles de
anlisis no aceptables. En algunos casos, las reglas pueden aplicarse en el momento de
aadir un nuevo smbolo durante el proceso de anlisis cuando las reglas dependan de
los smbolos de los niveles inferiores, en otros habr que esperar a completar el rbol.

4.2.1.- Las ambigedades y las palabras necesarias.


Para algunos complementos no pueden emplearse todas las palabras de un
comportamiento funcional determinado: as, cualquier pronombre no origina un objeto
directo, ni cualquier preposicin de un sintagma preposicional un objeto indirecto.

Regla: Palabras necesarias






Figura 3.23
Ejemplo regla palabras necesarias
= objeto directo

=sintagma preposicional

() = {preposicin "a"} sintagma nominal

Es posible aplicar esta regla a diferentes sintagmas:

4.2.1.1.- Los sintagmas preposicionales.


Todo sintagma preposicional est constituido por una preposicin ms un
sintagma nominal. Los diferentes smbolos que presentan conflicto se caracterizan
porque no pueden utilizar cualquier preposicin, as por ejemplo el complemento
preposicional del nombre lleva la preposicin de.

Tabla 3.19

- 144 -
Proceso de automatizacin del anlisis sintactico del espaol.

Las preposicionales en la resolucin de conflictos

contra

segn
desde

hacia

sobre
hasta
entre

para
bajo
ante

tras
con

por

sin

en
de
a
atributo s s s
circunstancial de afirmacin
circunstancial de argumento s
circunstancial de cantidad s s s
circunstancial de causa s
circunstancial de compaa s
circunstancial de distancia s
circunstancial de duda s
circunstancial de estima s s
circunstancial de fin s
circunstancial de lugar s s s s s s s
circunstancial de medio o instrumento s
circunstancial de modo s s
circunstancial de oposicin s
circunstancial de tiempo s s s s s s
complemento adjetivo s s
complemento agente s s
complemento preposicional del nombre s S s s
objeto directo s
objeto indirecto s s
sintagma adverbial s s
suplemento s s s s
Conflicto: S No No S No S S S No S No No S S No S No

La tabla 3.19 muestra qu preposiciones pueden aparecer con cada complemento


a que da lugar el sintagma preposicional. En algn caso se eliminan los conflictos
aparecen con un NO y en el resto se reduce la conflictividad. Las preposiciones
cabe y so son anticuadas y actualmente no se usan.
Al analizar de Juan en la sentencia el coche de Juan es nuevo, la aplicacin
de la regla 1 permite rechazar su interpretacin como objeto directo y mantener la de
complemento preposicional del nombre.
Figura 3.24
Aplicacin de la regla palabras necesarias para el smbolo complemento preposicional del nombre

Complemento
"de Juan" =sintagma preposicional Genera = preposicional del
nombre

preposicin "de"

Aceptado como
(Complemento preposicional del Pertenece a complemento
Si
nombre) = {"de"} ( ) ? preposicional del
nombre

Figura 3.25
Aplicacin de la regla palabras necesarias para el smbolo objeto directo

- 145 -
Proceso de automatizacin del anlisis sintactico del espaol.

= sintagma
"de Juan" Genera = objeto directo
preposicional

preposicin "de"

Pertenece a Rechazado como


(objeto directo) = {"a"} No
( ) ? objeto directo

Caso de doble preposicin:


Debe tenerse en cuenta que existen casos en los cuales hay una concatenacin de
preposiciones y es la segunda la que se encuentra asociada al complemento.
Lo veo hasta en la sopa (complemento circunstancial de lugar)
Lleva gabardina hasta en verano (complemento circunstancial de tiempo)
Aqu hay que pedir permiso hasta para toser (complemento circunstancial de
finalidad)
Se mete hasta con su padre (complemento circunstancial de compaa)
Para estos casos, se utiliza la misma tabla de preposiciones para la aplicacin de
la regla, pero la referencia es la segunda preposicin.
Caso de contraccin:
El sintagma preposicional puede tener como primer elemento la contraccin al o
del que son el equivalente a preposicin + artculo determinado. Si se separa la
contraccin en sus dos componentes es posible aplicar las mismas consideraciones de la
tabla 3.20.
Tabla 3.20
Las contracciones en la resolucin de conflictos

Estructura Contracciones
circunstancial de argumento del
circunstancial de cantidad del
circunstancial de distancia al
circunstancial de lugar al
circunstancial de precio o estima del
complemento agente del
complemento preposicional del nombre del
objeto directo al
objeto indirecto al
suplemento del

Consideraciones adicionales:
Existe un conjunto de palabras que normalmente no son reconocidas como
preposiciones, pero que tienen comportamientos funcionales similares y que se
denominan preposiciones imperfectas. stas son: aparte, aun, como, conforme, cuando,

- 146 -
Proceso de automatizacin del anlisis sintactico del espaol.

durante, donde, mediante, mientras, no obstante, excepto, salvo, ms, menos e incluso.
Deben tratarse como preposiciones o no, segn corresponda.
Tabla 3.21
Las preposiciones imperfectas en la resolucin de conflictos

no obstante
conforme

mediante

mienras
durante

excepto
cuando

menos
aparte

donde
como

salvo

pero
ms
aun
locucin adverbial si
circunstancial de afirmacin s
circunstancial de argumento
circunstancial de cantidad si s s s s
circunstancial de causa
circunstancial de compaa
circunstancial de distancia si s
circunstancial de duda
circunstancial de estima
circunstancial de fin
circunstancial de lugar s
circunstancial de medio o instrumento si s
circunstancial de modo s s
circunstancial de oposicin
circunstancial de tiempo si s s s
complemento agente
complemento preposicional del nombre
objeto directo
objeto indirecto
suplemento

4.2.1.2.- Los pronombres personales tonos.


La regla palabras necesarias puede ser aplicada a los smbolos objeto directo y
objeto indirecto en lo que se refiere a los pronombres. Tanto el objeto directo como el
indirecto pueden estar constituidos por un pronombre personal tono; sin embargo, los
pronombres permitidos no son los mismos para ambos.

Tabla 3.22
Los pronombres personales tonos en la resolucin de conflictos

Estructura Pronombres
objeto directo la, las, lo, los, me, nos, os, se, te
objeto indirecto la, las, le, les, lo, los, me, nos, os, se, te
atributo lo
morfema de pasiva se
morfema de impersonal se
morfema de voz media me, se

4.2.1.3.- Otros casos.


Otros casos para diferentes categoras de palabras son:
Tabla 3.23
Otras categoras en la resolucin de conflictos

Estructura Categora Palabras permitidas


adyacente adverbio como, ms, menos, no, todo, toda
adyacente pronombre de relativo cuya, cuyas, cuyo, cuyos, que

- 147 -
Proceso de automatizacin del anlisis sintactico del espaol.

conector subordinante adverbio apenas, como, conforme, cuanto, donde, mientras, siempre, tal, tan
conector subordinante conjuncin aunque, con que, cuando, cuantos, cuantas, para, porque, que, si
construccin comparativa adverbio as, como
grupo adjetivo adverbio como
grupo adjetivo comparativo adverbio ms, menos
grupo adjetivo comparativo otro pronombre conmigo, contigo, consigo
grupo nominal adverbio todo
objeto directo pronombre de relativo que, qu
sintagma adverbial adjetivo un
subordinada comparativa conjuncin que
objeto directo puntuacin dos puntos
presentador otro pronombre que, qu

4.2.2.- Las ambigedades y los smbolos no permitidos.


Se pueden dar casos como el siguiente:
llegamos tarde nosotros
Nosotros puede dar lugar a un sintagma nominal sustitutivo, ste a su vez puede
dar lugar a un objeto o a un sujeto. El smbolo objeto directo debiera ser rechazado
porque los pronombres personales tonos slo pueden tener funcin de objeto cuando
les precede una preposicin.
Figura 3.26
Generacin incorrecta de objeto directo
= objeto directo

= sintagma nominal sustitutivo

( ) = pronombre personal tono

Regla : Smbolos no permitidos.





Relacin de casos:
Tabla 3.24
Smbolos no permitidos

()
objeto directo sintagma nominal sustitutivo infinitivo
objeto directo sintagma nominal sustitutivo otro pronombre
objeto directo sintagma nominal sustitutivo pronombre personal tono
objeto indirecto sintagma nominal sustitutivo infinitivo
objeto indirecto sintagma nominal sustitutivo otro pronombre
objeto indirecto sintagma nominal sustitutivo pronombre de relativo

- 148 -
Proceso de automatizacin del anlisis sintactico del espaol.

objeto indirecto sintagma nominal sustitutivo pronombre personal tono


sujeto sintagma nominal sustitutivo pronombre personal tnico
sintagma nominal sustitutivo ncleo nominal adjetivo
sintagma nominal sustitutivo ncleo nominal infinitivo
sintagma nominal sustitutivo ncleo nominal infinitivo con pronombre
sintagma nominal sustitutivo ncleo nominal otro pronombre
sintagma nominal sustitutivo ncleo nominal pronombre de relativo
sintagma nominal sustitutivo ncleo nominal pronombre personal tono
sintagma nominal sustitutivo ncleo nominal pronombre personal tnico
sintagma nominal homogneo ncleo nominal sustantivo

4.2.3.- Las ambigedades y los smbolos relacionados.


Algunos smbolos no pueden aparecer sin la existencia de otros smbolos en el
mismo rbol de anlisis.

Regla: Smbolos necesarios.


! "

Relacin de casos
El predicativo obligatorio debe encontrarse acompaado de un ncleo verbal
copulativo.
El objeto directo, el indirecto y otras estructuras que complementan al verbo
deben aparecer con un ncleo verbal.
As, puede definirse el siguiente grupo de relaciones entre estructuras:
Tabla 3.25
Smbolos necesarios

- Nuevo smbolo - Smbolo necesario


atributo ncleo verbal copulativo
auxiliar pasivo ncleo verbal pasivo
complemento agente ncleo verbal pasivo
ncleo verbal copulativo atributo
ncleo verbal pasivo auxiliar pasivo
objeto directo ncleo verbal
oracin atributiva atributo
oracin atributiva ncleo verbal copulativo
oracin de suplemento ncleo verbal
oracin de suplemento suplemento
oracin intransitiva ncleo verbal
oracin pasiva ncleo verbal pasivo
oracin transitiva ncleo verbal
oracin transitiva objeto directo
predicativo objetivo objeto directo
subordinada comparativa atributo

Consideracin de caractersticas especiales en los smbolos relacionados:


Para reducir la aparicin de objetos directos reconocidos de manera errnea es
conveniente tener en cuenta la necesidad de que el verbo sea transitivo.

- 149 -
Proceso de automatizacin del anlisis sintactico del espaol.

En la oracin el nio es alto, el sintagma nominal el nio puede dar lugar


desde un punto de vista estructural a un objeto directo; sin embargo, como es
proviene del verbo ser que es intransitivo debe rechazarse el smbolo objeto directo.
El tener en cuenta que los verbos copulativos son a su vez intransitivos ayuda a no
confundir un atributo con un objeto directo. As pues se redefine la regla anterior como:

Regla: Smbolos necesarios con condicin.


! "

Relacin de casos
Tabla 3.26
Smbolos necesarios con condicin
Smbolo Smbolos Condicin
objeto directo gerundio el gerundio debe ser transitivo
objeto directo infinitivo el infinitivo debe ser transitivo
objeto directo infinitivo con pronombre encltico el infinitivo con pronombre encltico debe ser transitivo
objeto directo participio el participio debe ser transitivo
objeto directo verbo el verbo debe ser transitivo
objeto directo verbo con pronombre encltico el verbo con pronombre encltico debe ser transitivo

4.2.4.- Las ambigedades y los smbolos incompatibles.


Si se desea que el anlisis sea lo ms completo posible, se darn casos de reglas
del tipo:

oracin transitiva sujeto + predicado


oracin intransitiva sujeto + predicado

Como ambas reglas se aplican en una misma situacin dan lugar a rboles
errneos. Sin embargo, es posible rechazar el smbolo oracin transitiva si no se
encuentra entre sus nodos inferiores un smbolo objeto directo; no obstante, rechazar o
aceptar el smbolo oracin intransitiva es un caso diferente, pues se basa en la no
existencia de un smbolo y no en su existencia.
Es por ello que se define el concepto de smbolos incompatibles. De modo que
dados dos smbolos incompatibles en un rbol de anlisis, ste ser rechazado.

Regla: Smbolos incompatibles.

- 150 -
Proceso de automatizacin del anlisis sintactico del espaol.

! "

Relacin de casos
Tabla 3.27
Smbolos incompatibles

- nuevo smbolo - smbolo incompatible


atributo atributo
atributo morfema de pasiva
atributo objeto directo
atributo objeto indirecto
atributo oracin intransitiva
atributo oracin transitiva
atributo predicativo objetivo
atributo predicativo subjetivo
atributo suplemento
complemento agente suplemento
morfema de impersonal morfema de impersonal
morfema de impersonal morfema de pasiva
morfema de impersonal morfema de voz media
morfema de impersonal predicativo subjetivo
morfema de impersonal sujeto
morfema de pasiva atributo
morfema de pasiva morfema de impersonal
morfema de pasiva morfema de pasiva
morfema de pasiva morfema de voz media
morfema de pasiva objeto directo
morfema de pasiva objeto indirecto
morfema de voz media morfema de impersonal
morfema de voz media morfema de pasiva
morfema de voz media morfema de voz media
ncleo verbal ncleo verbal
ncleo verbal ncleo verbal copulativo
ncleo verbal ncleo verbal pasivo
ncleo verbal copulativo ncleo verbal
ncleo verbal copulativo ncleo verbal copulativo
ncleo verbal copulativo ncleo verbal pasivo
ncleo verbal pasivo ncleo verbal
ncleo verbal pasivo ncleo verbal copulativo
ncleo verbal pasivo ncleo verbal pasivo
ncleo verbal pasivo oracin atributiva
ncleo verbal pasivo oracin de suplemento
ncleo verbal pasivo oracin transitiva
objeto directo atributo
objeto directo morfema de pasiva
objeto directo oracin de suplemento
objeto directo oracin intransitiva
objeto indirecto atributo
objeto indirecto morfema de pasiva
oracin atributiva ncleo verbal pasivo
oracin de suplemento ncleo verbal pasivo
oracin de suplemento objeto directo
oracin intransitiva atributo
oracin intransitiva objeto directo
oracin intransitiva suplemento
oracin transitiva atributo
oracin transitiva ncleo verbal pasivo
predicativo objetivo atributo
predicativo objetivo predicativo objetivo
predicativo objetivo predicativo subjetivo
predicativo subjetivo atributo
predicativo subjetivo morfema de impersonal
predicativo subjetivo predicativo objetivo
predicativo subjetivo predicativo subjetivo
sujeto morfema de impersonal

- 151 -
Proceso de automatizacin del anlisis sintactico del espaol.

suplemento atributo
suplemento complemento agente
suplemento oracin intransitiva
suplemento suplemento

En este grupo se encuentran aquellos elementos que no se pueden duplicar


dentro de un predicado salvo en oraciones compuestas, en cuyo caso se tratara de
varios predicados.

4.2.5.- Las concordancias.


Entre las diferentes estructuras que componen una oracin se dan casos de
obligatoriedad en la concordancia de ciertas caractersticas.

Regla : Concordancias.

"
#

Relacin de casos
Existe un conjunto de concordancias resueltas durante el proceso de
desambiguacin funcional captulo 2. Se caracterizan por atender a parejas ordenadas
de smbolos adyacentes. Las concordancias deben ser de nuevo verificadas durante el
proceso de creacin de los sintagmas, ya que pueden aceptarse parejas ante la
posibilidad de que la unin constituya los lmites entre estructuras de carcter local,
aunque no deben aceptarse como parte de un mismo sintagma.
Tabla 3.28
Concordancias analizadas durante la desambiguacin funcional
adjetivo + adjetivo concordancia en gnero y nmero
adjetivo + adjetivo demostrativo concordancia en gnero y nmero
adjetivo + adjetivo posesivo antepuesto o pospuesto concordancia en gnero y nmero
adjetivo + adjetivo posesivo pospuesto concordancia en gnero y nmero
adjetivo + infinitivo el adjetivo debe encontrarse en masculino singular
adjetivo + sustantivo concordancia en gnero y nmero
adjetivo demostrativo + adjetivo concordancia en gnero y nmero
adjetivo demostrativo + infinitivo el adjetivo debe encontrarse en masculino singular
adjetivo demostrativo + sustantivo concordancia en gnero y nmero
adjetivo posesivo antepuesto + adjetivo concordancia en gnero y nmero
adjetivo posesivo antepuesto + infinitivo el adjetivo debe encontrarse en masculino singular
adjetivo posesivo antepuesto + sustantivo concordancia en gnero y nmero
adjetivo posesivo antepuesto o pospuesto + adjetivo concordancia en gnero y nmero
adjetivo posesivo antepuesto o pospuesto + infinitivo el adjetivo debe encontrarse en masculino singular
adjetivo posesivo antepuesto o pospuesto + sustantivo concordancia en gnero y nmero
artculo determinado + adjetivo concordancia en gnero y nmero
artculo determinado + infinitivo el artculo debe encontrarse en masculino singular
artculo determinado + pronombre de relativo concordancia en gnero y nmero
artculo determinado + sustantivo concordancia en gnero y nmero

- 152 -
Proceso de automatizacin del anlisis sintactico del espaol.

artculo indeterminado + adjetivo concordancia en gnero y nmero


artculo indeterminado + infinitivo el artculo debe encontrarse en masculino singular
artculo indeterminado + pronombre de relativo concordancia en gnero y nmero
artculo indeterminado + sustantivo concordancia en gnero y nmero
forma verbal personal + participio el verbo que precede al participio es haber o ser
infinitivo + adjetivo el adjetivo debe encontrarse en masculino singular
infinitivo + adjetivo demostrativo el adjetivo debe encontrarse en masculino singular
infinitivo + adjetivo posesivo antepuesto o pospuesto el adjetivo debe encontrarse en masculino singular
infinitivo + adjetivo posesivo pospuesto el adjetivo debe encontrarse en masculino singular
preposicin + preposicin la primera preposicin debe ser a o hasta
pronombre de relativo + adjetivo posesivo antepuesto o pospuesto concordancia en gnero y nmero
pronombre de relativo + adjetivo posesivo pospuesto concordancia en gnero y nmero
sustantivo + adjetivo concordancia en gnero y nmero
sustantivo + adjetivo demostrativo concordancia en gnero y nmero
sustantivo + adjetivo posesivo antepuesto o pospuesto concordancia en gnero y nmero
sustantivo + adjetivo posesivo pospuesto concordancia en gnero y nmero

Concordancia entre sujeto y ncleo verbal: En las oraciones con verbo en forma
personal debe concordar en nmero y persona con el ncleo de la estructura del sujeto.
(sujeto, ncleo verbal) = {nmero, persona}
(sujeto, ncleo verbal pasivo) = {nmero, persona}
(sujeto, ncleo verbal copulativo) = {nmero, persona}
Adems de la concordancia entre sujeto y predicado se deben cumplir las concordancias entre los
siguientes descendientes del predicado siempre en gnero y nmero:

Adyacente con ncleo nominal.


Objeto directo con objeto directo.
Objeto indirecto con objeto indirecto.
Predicativo objetivo con objeto directo.
Predicativo subjetivo con ncleo verbal.
Predicativo subjetivo con sujeto.
Presentador con ncleo nominal.

Consideraciones adicionales
Desde el punto de vista de la implantacin de las reglas de concordancia, se
hacen las siguientes consideraciones respecto a las flexiones de algunas palabras:
Los adverbios ms, menos y no se considera que actan con las flexiones masculino,
femenino, singular y plural.
A los artculos determinados lo y los se les aplica la flexin masculino.
A los sustantivos se les aplica la flexin tercera persona. Se considera la flexin
plural para los sustantivos gente, todo, infinidad, resto, millar, caterva, montn,
tipo, multitud y vida. Si el sustantivo no tiene asociadas las flexiones de gnero o

- 153 -
Proceso de automatizacin del anlisis sintactico del espaol.

nmero se le asignan todas las posibles. Cuando los numerales representan las horas
del da, se les debe asignar la flexin plural y el gnero femenino.
A todo adjetivo se le imputa la flexin tercera persona. A los adjetivos numerales a
partir del dos se les dota de la flexin plural. A mal se le asigna masculino y
singular; a cada masculino, femenino y singular.
Para los pronombres de relativo qu y que se mantienen las flexiones masculino,
femenino, singular, plural y tercera persona.
Para los pronombres personales yo, nosotros, nosotras la flexin debe ser primera
persona; para t, vosotros, vosotras, usted, ustedes segunda persona; para l, usted,
ustedes, ella, ellos, ellas tercera persona; para me masculino, femenino y primera
persona; para te masculino, femenino, y segunda persona; para se masculino,
femenino y tercera persona; para la, lo y le tercera persona.
A las palabras que entran en el grupo otro pronombre se les asigna la flexin tercera
persona; a eso masculino; plural a aquello; femenino a esa y aquella; a nadie, a
algo, a todo y a toda singular; plural a todos y todas.
Para los infinitivos se toma la flexin singular y tercera persona.
Si tienen como flexin primera persona, a las palabras con categora funcional verbo
y verbo con pronombre encltico se les asigna tambin tercera persona.

4.2.6.- Informacin ideolgica.


Cabe introducir informacin semntica para la eliminacin de ambigedades
mediante el anlisis ideolgico de las palabras. Para ello, ser necesario introducir una
nueva regla de anlisis.

Regla: Semntica necesaria.


#
#
"

En el siguiente ejemplo el complemento circunstancial de tiempo se rechaza


porque entre las palabras que lo forman ninguna indica tiempo o momento.

- 154 -
Proceso de automatizacin del anlisis sintactico del espaol.

Figura 3.27
Circunstancial de tiempo rechazado

la lluvia trajo alivio al campesino

a + el ncleo nominal
presentador ncleo nominal ncleo verbal ncleo nominal
sintagma
sintagma nominal homogneo nominal preposicin presentador
homogneo

objeto directo sintagma nominal homogneo

sintagma preposicional

circunstancial de tiempo

sujeto predicado

oracin transitiva

Del anlisis ideolgico de campesino resulta que ninguna de sus ideas


relacionadas tiene que ver con tiempo o momento.

Tabla 3.29
Anlisis ideolgico de campesino
Modos de vida
Grupos sociales Hbitat Actividades
Nacionalidad Campo Agricultor

Se presenta a continuacin un ejemplo con un circunstancial de tiempo.

El domingo os cazaron y pescaron estas perdices y corvinas

Para este caso, la palabra ncleo del circunstancial de tiempo es domingo y


aparece en el diccionario ideolgico dentro del grupo de segundo, como medida de
cantidad en este caso la cantidad es de tiempo. Por tanto, el anlisis puede ser
aceptado.
Tabla 3.30
Anlisis ideolgico de domingo
Relaciones generales
Cantidad
Segundo

Es necesario disponer para cada smbolo el conjunto de significados


ideolgicos aceptables .
Tabla 3.31
Anlisis ideolgicos asociados al circunstancial de tiempo

- 155 -
Proceso de automatizacin del anlisis sintactico del espaol.


circunstancial de tiempo Relaciones generales Cantidad Segundo
circunstancial de tiempo Relaciones Generales Tiempo - Tiempo
circunstancial de tiempo Relaciones Generales Tiempo - Periodo

Ejemplos:
Siempre algn forastero se presentaba en las augustas salas

Tabla 3.32
Anlisis ideolgico de siempre
Relaciones generales El individuo Modos de vida
Tiempo Conocimiento Comunicacin
Frecuencia Certeza Preposicin

Los gatos como el perro, permanecieron el da encerrados

Tabla 3.33
Anlisis ideolgico de da
Relaciones generales El individuo Naturaleza
Tiempo Creencia Conducta Atmsfera
Edad Ritual Tradicin Clima

Luis y l pasaron el verano en Mendoza

Tabla 3.34
Anlisis ideolgico de verano
Relaciones generales
Cantidad
Segundo

Sera conveniente crear una nueva disposicin ideolgica que contuviera las
palabras necesarias para la eliminacin de este tipo de ambigedades; los grupos seran
uno por cada complemento circunstancial y no varios como ocurre si se utiliza un
diccionario ideolgico clsico. Con ello se lograra una mejora en la eficiencia de la
automatizacin del proceso de anlisis sintctico.

Consideraciones
Para la sentencia Hablaron los representantes de los municipios, es posible que
los representantes de los municipios sea reconocido como complemento
circunstancial de lugar.

- 156 -
Proceso de automatizacin del anlisis sintactico del espaol.

Figura 3.28
Aceptacin incorrecta del circunstancial

hablaron los representantes de los municipios Nivel 1

artculo sustantivo Nivel 2

preposicin presentador ncleo nominal Nivel 3

preposicin
sintagma nominal homogneo Nivel 4
subordinante

artculo sustantivo sintagma preposicional Nivel 5

verbo presentador ncleo nominal complemento preposicional del nombre Nivel 6

forma verbal
sintagma nominal heterogneo Nivel 7
simple

ncleo verbal circunstancial de lugar Nivel 8

predicado Nivel 9

oracin intransitiva Nivel 10

Esto se debe a que la palabra municipio figura asociada a lugar en los


diccionarios ideolgicos; sin embargo, para este caso, el problema es fcilmente
resoluble si se atiende slo a las palabras con categora funcional en el nivel ms alto
del supuesto complemento circunstancial de lugar: los representantes.
Si se tomara como ejemplo Blancas palomas picoteaban en el granero. Para
el complemento circunstancial de lugar en el granero se obtiene el siguiente anlisis:
Figura 3.29
Niveles con palabras relevantes

en el granero Nivel 1

artculo sustantivo Nivel 2

preposicin presentador ncleo nominal Nivel 3

preposicin
sintagma nominal homogneo Nivel 4
subordinante

sintagma preposicional Nivel 5

complemento preposicional del nombre Nivel 6

De tener en cuenta el nivel superior, se analizara solamente la palabra


irrelevante presentadores, conectores y preposiciones; por ello, hay que llegar
hasta el nivel ms alto que contenga palabras relevantes.

- 157 -
Proceso de automatizacin del anlisis sintactico del espaol.

4.2.6.1- Relaciones ideolgicas y smbolos.


En la sentencia el nio compr el libro podra darse el caso de que el nio
fuera reconocido como objeto directo; sin embargo, al tratarse de una persona
informacin ideolgica, slo podra ser objeto directo si formara parte de un
sintagma preposicional.
Figura 3.30
Reconocimiento incorrecto de un objeto directo

el nio compr el libro

artculo sustantivo verbo artculo sustantivo

forma verbal
presentador ncleo nominal presentador ncleo nominal
simple

sintagma nominal homogneo ncleo verbal sintagma nominal homogneo

objeto directo .....

predicado

oracin transitiva

Regla: Semntica incompatible.


#
, #

"
,

4.2.6.2- Relaciones ideolgicas entre smbolos.


Existen casos en los cuales puede aplicarse un anlisis de las relaciones de tipo
ideolgico entre los smbolos de una oracin. Sea la sentencia el nio compr el
libro, desde un punto de vista puramente estructural tanto el nio como el libro
podran realizar la funcin de sujeto pues son sintagmas nominales que concuerdan con
el verbo: se hace necesario buscar relaciones de tipo semntico. El ncleo verbal es un
verbo que implica una accin comprar y es posible asociar a este tipo de verbos
slo cuando se encuentran en modo activo con sujetos que sean seres vivos: se
aceptara el nio como sujeto.

- 158 -
Proceso de automatizacin del anlisis sintactico del espaol.

Figura 3.31
Reconocimiento incorrecto de sujeto

el nio compr el libro

artculo sustantivo verbo artculo sustantivo

forma verbal
presentador ncleo nominal presentador ncleo nominal
simple

sintagma nominal homogneo ncleo verbal sintagma nominal homogneo

... sujeto

predicado

oracin transitiva

Regla : Relaciones ideolgicas entre smbolos.


Esta regla se aplica al ncleo del sujeto con el ncleo verbal.

4.2.7.- Casos especiales.


En ocasiones la aplicacin de los mtodos anteriores no resuelve el problema: se
deben resolver como casos especiales.

4.2.7.1.- Proposiciones.
La proposicin y la proposicin subordinada se diferencian en cmo se unen al
resto de la oracin la proposicin requiere un conector que acta como coordinante y
la proposicin subordinada de un conector subordinante.
La proposicin de infinitivo debe tener como ncleo verbal un infinitivo.

4.2.7.2.- Oraciones interrogativas y exclamativas.


Las oraciones interrogativas y exclamativas tienen la misma estructura y se
diferencian en los signos de puntuacin que las delimitan: las exclamaciones para la
oracin exclamativa y las interrogaciones para la oracin interrogativa.

- 159 -
Proceso de automatizacin del anlisis sintactico del espaol.

4.2.7.3.- Doble objeto directo.


Puede aparecer un doble objeto directo dislocacin izquierda. Es fcilmente
reconocible por las siguientes caractersticas:
1) Se encuentran el uno junto al otro.
2) El primero se encuentra al principio de la oracin
3) El segundo es un cltico pronominal
4) Debe existir concordancia en gnero y nmero entre los ncleos del
objeto directo.

A Juan lo vi por primera vez el ao pasado.


Ese jarrn lo compr el ao pasado.

El doble objeto directo tiene la siguiente estructura:

objeto directo + objeto directo (formado por un sintagma nominal sustitutivo) + verbo

Regla: Doble objeto directo




$
$

Por error en la sentencia el nio estudia la leccin, se podra tomar un doble


objeto directo ya que la como sustantivo da lugar a un sintagma nominal que produce
el primer objeto directo y leccin forma el segundo.
Debe tenerse en cuenta que en oraciones compuestas pueden aparecer dos
objetos directos por cada forma verbal personal: cada pareja debe cumplir la condicin
de doble objeto directo.

- 160 -
Proceso de automatizacin del anlisis sintactico del espaol.

4.2.7.4.- Eliminacin de opciones segn la posicin de los presentadores.


a) Caso de presentadores pospuestos.
Cuando el smbolo sintagma nominal homogneo contiene una subestructura del
tipo

ncleo nominal + presentador

el presentador nunca podr ser un adjetivo posesivo antepuesto, ya que debera ir


delante del ncleo nominal.
Para la sentencia bes Juan su mano se puede generar la siguiente respuesta:
Juan: sustantivo
su: adjetivo posesivo antepuesto
mano: sustantivo

Figura 3.32
Presentador antepuesto

Juan su mano Juan su mano

adjetivo adjetivo
sustantivo sustantivo
posesivo posesivo

ncleo nominal presentador presentador ncleo nominal

sintagma nominal homogneo sintagma nominal homogneo

Podra generar un smbolo sintagma nominal homogneo con

Juan su ncleo nominal + presentador

pero quedara rechazado por la siguiente regla.

Regla: Presentadores pospuestos


% & '

- 161 -
Proceso de automatizacin del anlisis sintactico del espaol.

b) Caso de presentadores antepuestos.


El sintagma adjetivo puede encontrarse tras un presentador cuando el
presentador finaliza un sintagma nominal o ante un sustantivo cuando el sustantivo abre
un sintagma nominal. Esto da lugar a que se den casos en los que se generen sintagmas
adjetivos de modo errneo: as en el rojo coche se da una secuencia del tipo
presentador + adjetivo + sustantivo, que podra generar un smbolo sintagma adjetivo a
partir del adjetivo, aunque la funcin real del adjetivo es la de adyacente. Es necesario
saber qu presentadores deben ir antepuestos, para que nunca se genere un sintagma
adjetivo tras un presentador antepuesto.

Figura 3.33
Rechazo del sintagma adjetivo

el rojo coche

artculo adjetivo

sintagma
presentador
adjetivo

Regla: Presentadores antepuestos


$
$

- 162 -
Proceso de automatizacin del anlisis sintactico del espaol.

Relacin de casos
Los smbolos adjetivo demostrativo, artculo determinado y otro pronombre
slo aparecen antepuestos al ncleo nominal. Los adjetivos posesivos pueden dividirse
en: aquellos que slo pueden preceder al ncleo nominal mi, mis, tu, tus, su, sus,
aquellos que slo pueden ir pospuestos mo, ma, mos, mas, tuyo, tuya, tuyos, tuyas,
suyo, suya, suyos, suyas y los que pueden figurar tanto antepuestos como pospuestos
nuestro, nuestra, nuestros, nuestras, vuestro, vuestra, vuestros, vuestras.

4.2.7.5.- Conectores.
Existe un conjunto de combinaciones de palabras que dan lugar a conjunciones
conjuntivas, se consideran las siguientes: a consecuencia, a distincin de, a fin de, a fin
de que, a lo que parece, a medida que, a menos que, a pesar, a pesar de, ahora bien,
ahora que, al menos, al objeto de, al objeto de que, al parecer, al paso que, antes bien,
as como, as es que, as pues, as y todo, aun cuanto, aunque ms, bien as como, bien
que mal, cada cuanto que, cada y cuanto que, como quiera que, como si, con objeto de,
con objeto de que, con todo, con todo eso, con todo esto, conocer se conoce que, cuanto
ms, cuanto ms que, cuanto y ms que, dado que, de consiguiente, de forma que, de
manera que, de modo que, de suerte que, dejante que, en consecuencia, en demasa, en
inteligencia de que, en la inteligencia de que, en manera que, entre que, ms que,
mientras ms, mientras que, no obstante, o bien como, para que, pese a, por
consecuencia, por consiguiente, por donde, por el consiguiente, por lo menos, por lo
mismo, por manera que, por mucho que, por que, presupuesto que, pues bien, pues que,
puesto que, que hasta, segn y como, segn y conforme, si bien, si ya, siempre que,
siempre y cuando que, supuesto que, tan pronto, tan siquiera, tan y mientras, visto que,
ya que.

4.2.7.6.- Otros casos.


Existen determinadas situaciones en las que pueden resolverse ambigedades a
partir de consideraciones sobre las palabras, categoras gramaticales y objetos que
intervienen:
Los adverbios s y no. Las palabras s y no cuando actan como adverbios
dan lugar a un sintagma adverbial sin que participe ningn otro smbolo.
La partcula se ante lo, la, los, las. Cuando se dan combinaciones del tipo
se lo dije, es posible reconocer de manera errnea como objetos directos

- 163 -
Proceso de automatizacin del anlisis sintactico del espaol.

tanto a se como a lo; sin embargo, se ante lo, la, los, las, no ser nunca
objeto directo.
Subordinadas introducidas por de que. Cuando se tiene una oracin
subordinada introducida por el conector de que, la funcin de la subordinada
nunca ser la de circunstancial. Ejemplo "La idea de que somos amigos me
alegra".
El pronombre de relativo como conector subordinante. El pronombre de
relativo puede dar lugar a un ncleo nominal o a un conector subordinante.
Como el conector subordinante tiene como funcin la unin de una
proposicin subordinada, necesita que la sentencia contenga al menos dos
ncleos verbales uno por proposicin.
Acompaantes necesarios. El adyacente debe acompaar a una palabra que
pueda ser ncleo nominal o a otro modificador del ncleo nominal. El
adjetivo como ncleo nominal debe ir acompaado de un presentador que
sustantive su funcin.
La aposicin. Se rechaza la generacin de aposicin se considera
adyacente cuando se genera a partir de un sustantivo que puede tener
funcin de adjetivo.
El verbo auxiliar haber. Cuando aparecen casos como hemos salido en el que
hemos puede considerarse el ncleo verbal y salido un sustantivo, se debe tener en
cuenta que el verbo haber como ncleo siempre debe ir acompaado de un objeto
directo.
El ncleo verbal pasivo. El ncleo de una oracin pasiva est siempre
compuesto por una forma verbal compleja, en la que el auxiliar es siempre el
verbo ser.
El ncleo verbal copulativo. Slo puede generarse a partir de un conjunto
reducido de verbos estar, parecer, permanecer, resultar, hacerse,
seguir,...

4.3.- Resolucin de otros conflictos.


Adems de las reglas anteriores, existe un conjunto de reglas que, sin aplicarse
directamente a ningn conflicto primario, sirven para eliminar ambigedades.

- 164 -
Proceso de automatizacin del anlisis sintactico del espaol.

4.3.1.- Smbolos que no pueden cubrir toda la oracin.


Toda oracin cumple una serie de caractersticas en cuanto a lo que a su
estructura se refiere: debe tener sujeto y predicado, y en ciertos casos, tal vez slo
predicado. El smbolo sujeto no puede cubrir por si slo toda la secuencia objeto del
anlisis.
La proposicin y la proposicin subordinada son smbolos que se han definido
para generar anlisis de oraciones compuestas, es por ello que un smbolo proposicin
teniendo la misma estructura que los smbolos oracin, no debe nunca cubrir toda la
sentencia.

Regla: Smbolos totales.



4.3.2.- La forma verbal compleja.


Una estructura de perfrasis verbal formada por ms de dos elementos,
genera una forma verbal compleja slo en los siguientes casos, [GOM02]:

Tabla 3.35
Perfrasis verbales consideradas
acabar de + infinitivo
deber de + infinitivo
dejar de + infinitivo
echarse a + infinitivo
empezar a + infinitivo
estar para + infinitivo
explotar a + infinitivo
haber de + infinitivo
haber que + infinitivo
ir a + infinitivo
llagar a + infinitivo
ponerse a + infinitivo
romper a + infinitivo
tener que + infinitivo
venir a + infinitivo
volver a + infinitivo

4.3.3.- Otros casos.


Existen determinadas situaciones en las que pueden resolverse ambigedades a
partir de consideraciones sobre las palabras, categoras gramaticales y objetos que
intervienen:

- 165 -
Proceso de automatizacin del anlisis sintactico del espaol.

Cuando aparece el adverbio muy, no puede dar lugar por s slo a ningn tipo
de sintagma, pues su funcin es la de modificar el significado de otras
palabras.
Las palabras a y de tienen como posibles funciones la de preposicin y
sustantivo. Cuando se encuentran ante un presentador su funcin es la de
preposicin, y no pueden dar lugar a ningn nuevo smbolo por s solas.
La palabra se puede aparecer ante el verbo sin una funcin concreta dentro
de la oracin; en tal caso, el ncleo verbal se encuentra siempre en tercera
persona.
En oraciones como el pjaro que canta muestra su alegra, que puede
funcionar como adyacente; sin embargo, nunca lo har pospuesto al ncleo
nominal, y en tal caso no puede complementar a pjaro. Lo mismo ocurre
con la palabra no en la oracin como Isabel no nos llame, no la
esperaremos, donde no en ningn caso complementa a Isabel.
Existe un conjunto de palabras que no podrn dar lugar a un sintagma por s
solas. As, las palabras tan y muy no pueden generar un sintagma adverbial
si no van acompaadas de otros elementos. Lo mismo ocurre con algn, un,
unos, unas respecto del sintagma adjetivo.
Cuando existe una ambigedad funcional del tipo adjetivo y sustantivo, tal
que la palabra por s sola en ambos casos d lugar a un smbolo atributo, es
posible descartar el smbolo atributo generado a partir del sustantivo.
Si un adjetivo se encuentra precedido por un presentador slo en el caso
de tratarse de presentador que no pueda aparecer pospuesto al ncleo
nominal, como el artculo determinado no puede dar lugar a un sintagma
adjetivo.
En la oracin te tengo dicho que no vengas tarde a casa, es posible
eliminar la ambigedad de la palabra tarde descartando la opcin verbo
cuando se encuentra tras otro verbo.
El predicativo subjetivo no puede aparecer con verbos copulativos, pues en
tal caso su funcin sera la de atributo.
Si aparece antepuesta una preposicin a un sintagma nominal, el nico
smbolo que puede generarse a partir del sintagma nominal es el sintagma
preposicional correspondiente.

- 166 -
Proceso de automatizacin del anlisis sintactico del espaol.

En oraciones como Juan, que es diligente, trabaja sin descanso, se podra


reconocer la combinacin sustantivo + conector + sustantivo como la unin
de dos sintagma nominales homogneos para dar lugar a un sintagma
nominal heterogneo; sin embargo, para que el conector que une dos
sintagmas nominales sea la coma, es necesario que al menos uno de los
sintagmas sea heterogneo.
Cuando una proposicin subordinada tiene funcin de adyacente, siempre se
encontrar pospuesta al ncleo nominal, nunca antepuesta.
Cuando se genera un adyacente a partir de un sintagma adjetivo, el sintagma
adjetivo estar formado por al menos dos palabras.
Si existe un vocativo, aparece separado por una coma.

4.4.- Consideraciones para la generacin del smbolo predicado.


La existencia de ambigedades da lugar a mltiples smbolos que pueden no
formar ningn rbol final. Esto produce un aumento importante del tiempo de
procesamiento. Uno de los mayores problemas aparece en la generacin de smbolos
predicado. Las reglas que definen las estructuras del predicado vienen dadas por las
combinaciones de elementos que puedan aparecer en el mismo. En una definicin
formal de tipo estructural sera necesario indicar todas las posibles combinaciones;
debido a que la colocacin de la mayor parte de los elementos es libre, el nmero de
posibles estructuras del predicado sera enorme.
Si el nmero de elementos del predicado es n, entonces son posibles n!
combinaciones. Sean los elementos posibles ncleo verbal, objeto directo, objeto
indirecto, predicativo objetivo, predicativo subjetivo, atributo, complemento agente,
suplemento, circunstancial de tiempo, circunstancial de lugar, circunstancial de modo,
circunstancial de fin, circunstancial de causa, circunstancial de medio, circunstancial
de argumento, circunstancial de compaa, circunstancial de negacin, circunstancial
de afirmacin, circunstancial de cantidad, circunstancial de oposicin, circunstancial
de duda. Se tienen 21 elementos; si se supone que los dos nicos elementos que pueden
repetirse en un predicado simple son el objeto directo y el objeto indirecto se ha
considerado que los circunstanciales no se repiten para calcular una cota inferior del
mximo nmero de combinaciones posibles, se obtiene un nmero de posibles

- 167 -
Proceso de automatizacin del anlisis sintactico del espaol.

combinaciones segn las variaciones de 23 elementos tomados de n en n para n desde 1


hasta 23 y sumndolas.

23 23
23!
V23,i =
i =1 i =1 (23 i )!

Sin embargo, todas no se pueden dar por lo que no es necesario aadirlas como
reglas; existen combinaciones de diferentes elementos que no pueden aparecer
formando parte de un mismo predicado, como se muestra en la siguiente tabla.
Tabla 3.36
Parejas de smbolos incompatibles en un mismo predicado
atributo atributo
atributo morfema de pasiva
atributo objeto directo
atributo objeto indirecto
atributo predicativo objetivo
atributo predicativo subjetivo
atributo suplemento
complemento agente suplemento
morfema de impersonal morfema de impersonal
morfema de impersonal morfema de pasiva
morfema de impersonal morfema de voz media
morfema de impersonal predicativo subjetivo
morfema de pasiva atributo
morfema de pasiva morfema de impersonal
morfema de pasiva morfema de pasiva
morfema de pasiva morfema de voz media
morfema de pasiva objeto directo
morfema de pasiva objeto indirecto
morfema de voz media morfema de impersonal
morfema de voz media morfema de pasiva
morfema de voz media morfema de voz media
ncleo verbal ncleo verbal
ncleo verbal ncleo verbal copulativo
ncleo verbal ncleo verbal pasivo
ncleo verbal copulativo ncleo verbal
ncleo verbal copulativo ncleo verbal copulativo
ncleo verbal copulativo ncleo verbal pasivo
ncleo verbal pasivo ncleo verbal
ncleo verbal pasivo ncleo verbal copulativo
ncleo verbal pasivo ncleo verbal pasivo
objeto directo atributo
objeto directo morfema de pasiva
objeto indirecto atributo
objeto indirecto morfema de pasiva
predicativo objetivo atributo
predicativo objetivo predicativo objetivo
predicativo objetivo predicativo subjetivo
predicativo subjetivo atributo
predicativo subjetivo morfema de impersonal
predicativo subjetivo predicativo objetivo
predicativo subjetivo predicativo subjetivo
suplemento atributo
suplemento complemento agente
suplemento suplemento

Aparte de las reducciones que puedan suponer las reglas de desambiguacin


vistas hasta ahora en la no generacin de smbolos predicado, es posible aprovechar

- 168 -
Proceso de automatizacin del anlisis sintactico del espaol.

ciertas caractersticas del predicado. En las reglas en las que aparece el predicado se
encuentra delimitando por el principio o el final el smbolo que genera, o bien es
adyacente a un smbolo de puntuacin. Es por ello que se deben rechazar todas aquellas
combinaciones de smbolos, que tengan como finalidad la posible generacin de
smbolos predicado, tal que alguno de los extremos no es principio o final del smbolo
generado o exista un smbolo de puntuacin adyacente.
Existen casos en los cuales esta condicin puede no cumplirse. Es el caso de la
existencia de oraciones subordinadas, en estos casos antes de rechazar un evento debe
tenerse en cuenta la posibilidad de que se trate de una oracin subordinada, para ello se
verifica la existencia de elementos subordinantes y la existencia de mltiples formas
verbales.
Existe un conjunto de smbolos a los cuales es posible aplicarles reglas similares.
As, la proposicin ya sea coordinada o subordinada debe llevar antepuesto o pospuesto,
segn sea el caso, algn tipo de conector, ya sea subordinante o coordinante. De igual
manera cualquier tipo de oracin que vaya a dar lugar a una de estas proposiciones
debe cumplir estas mismas condiciones. Teniendo en cuenta estas caractersticas es
posible eliminar la generacin de smbolos intermedios, reduciendo la carga del
proceso.

4.5.- Resumen de aplicacin de reglas.


Se resume la aplicacin de reglas sobre los distintos smbolos en la siguiente
tabla.
Tabla 3.37
Resumen de aplicacin de reglas por smbolo
adyacente si si si
adyacentes si
atributo si si si si si si
auxiliar si si
auxiliar pasivo si
circunstancial si si si si
complemento adjetivo si si
complemento agente si si si si si
complemento preposicional del nombre si si si
conector si si
conector subordinante si si si
construccin comparativa si
forma verbal compleja si si
forma verbal simple si si
grupo adjetivo si
grupo adjetivo comparativo si
grupo nominal si si
locucin adverbial si si
morfema de impersonal si si si
morfema de pasiva si si si
morfema de voz media si si si

- 169 -
Proceso de automatizacin del anlisis sintactico del espaol.

ncleo nominal si
ncleo verbal si si
ncleo verbal copulativo si si si si
ncleo verbal pasivo si si si
objeto directo si si si si si si si si
objeto indirecto si si si si si si
oracin atributiva si si si si
oracin de suplemento si si si si
oracin exclamativa si
oracin interrogativa si
oracin intransitiva si si si si
oracin pasiva si si
oracin transitiva si si si si si
predicado s si
predicativo objetivo si si si si si
predicativo subjetivo si si si si si
preposicin subordiannte ms presentador si si
preposicin subordinante si si
presentador si si si
proposicin si si si si
proposicin de infinitivo si si
proposicin subordinada si si si si
sintagma adjetivo si si si
sintagma adverbial si si si si
sintagma nominal heterogneo si si si si
sintagma nominal homogneo si si si si
sintagma nominal sustitutivo si si si
sintagma preposicional si si si
subordinada comparativa si si
sujeto si si s si si
suplemento si si si si
vocativo si si si

oraciones interrogativas y exclamativas


relaciones ideolgicas entre smbolos
smbolos necesarios con condicin

presentadores antepuestos
presentadores pospuestos
semntica incompatible
smbolos incompatibles
smbolos no permitidos

semntica necesaria
smbolos necesarios
palabras necesarias

doble objeto directo


smbolos totales
concordancias

proposiciones

otros casos

- 170 -
Proceso de automatizacin del anlisis sintactico del espaol.

4.6.- Los grupos y las reglas de resolucin de conflictos primarios.


Grupo 1.
Las reglas que dan lugar a la ambigedad son:

adyacente adjetivo
ncleo nominal adjetivo
ncleo verbal adjetivo
ncleo verbal pasivo adjetivo
sintagma adjetivo adjetivo
Se aplican las siguientes reglas:
Simbolos incompatibles. El ncleo verbal es incompatible con la existencia de
otro ncleo verbal, con la de un ncleo verbal copulativo y con la de un ncleo
verbal pasivo. El ncleo verbal pasivo es incompatible con la existencia de un
ncleo verbal, con la de un ncleo verbal copulativo, con la de otro ncleo
verbal pasivo, con la de una oracin atributiva, con la de una oracin de
suplemento y con la una oracin transitiva.
Concordancias. El adyacente debe concordar en gnero y nmero con el ncleo
nominal. El ncleo nominal debe concordar en gnero y nmero con el
adyacente y con el presentador. El ncleo verbal y el ncleo verbal pasivo
deben concordar en nmero y persona con el sujeto.
Casos especiales: Otros casos. El ncleo verbal pasivo. El ncleo verbal
pasivo siempre debe encontrarse en forma compuesta; en el caso de generarse a
partir de un adjetivo debe ir acompaado del auxiliar pasivo ser.
Casos especiales: Otros casos. Acompaantes necesarios. El adyacente debe
acompaar a una palabra que pueda ser ncleo nominal o a otro modificador del
ncleo nominal. El adjetivo como ncleo nominal debe ir acompaado de un
presentador que sustantive su funcin.

Grupo 2.
Las reglas que dan lugar a la ambigedad son:
adyacente adverbio
conector subordinante adverbio
sintagma adverbial adverbio
Se aplican las siguientes reglas:
Palabras necesarias: Otros casos. Cuando el adyacente se genera desde
adverbio requiere que la palabra de partida sea como, ms, menos, no, todo o
toda. Cuando el conector subordiante se genera desde adverbio requiere que la

- 171 -
Proceso de automatizacin del anlisis sintactico del espaol.

palabra de partida sea apenas, como, conforme, cuanto, donde, mientras,


siempre, tal o tan.
Concordancias. El adyacente debe concordar en gnero y nmero con el ncleo
nominal al que acompaa.
Casos especiales: Otros casos. Los adverbios s y no. Las plabras s y no
cuando actan como adverbios dan lugar a un sintagma adverbial sin que
participe ningn otro smbolo.

Grupo 3, 4, 11, 33 y 34.


Las reglas que dan lugar a la ambigedad son:
adyacentes adverbio + adjetivo
conector adverbio + adjetivo
conector subordinante adverbio + adjetivo
sintagma adjetivo adverbio + adjetivo
sintagma adverbial adverbio + adjetivo
conector subordinante adverbio + adverbio
sintagma adverbial adverbio + adverbio
----------------------------------------------------------------------------
conector conjuncin + conjuncin
conector subordinante conjuncin + conjuncin
----------------------------------------------------------------------------
conector subordinante preposicin + adverbio
locucin adverbial preposicin + adverbio
----------------------------------------------------------------------------
conector preposicin + sustantivo
conector subordinante preposicin + sustantivo
Se aplica la siguiente regla:
Casos especiales: Conectores. Los conectores slo pueden estar formados por
un determinado conjunto de palabras.

Grupos 5 y 6.
Las reglas que dan lugar a la ambigedad son:
construccin comparativa adverbio+ sintagma nominal heterogneo
sintagma adverbial adverbio+ sintagma nominal heterogneo
----------------------------------------------------------------------------
construccin comparativa adverbio + sintagma nominal homogneo
grupo nominal adverbio + sintagma nominal homogneo
sintagma adverbial adverbio + sintagma nominal homogneo
Se aplica la siguiente regla:

- 172 -
Proceso de automatizacin del anlisis sintactico del espaol.

Palabras necesarias: Otros casos. La construccin comparativa slo puede


comenzar con los adverbios as o como.

Grupos 7, 8, 9, 17, 18, 19, 35, 36, 37, 38, 39 y 40


Las reglas que dan lugar a la ambigedad son:
sintagma nominal homogneo adyacente + ncleo nominal
sintagma nominal sustitutivo adyacente + ncleo nominal
----------------------------------------------------------------------------
sintagma nominal homogneo adyacente + ncleo nominal +
adyacente + complemento preposicional del nombre
sintagma nominal sustitutivo adyacente + ncleo nominal +
adyacente + complemento preposicional del nombre
----------------------------------------------------------------------------
sintagma nominal homogneo adyacente + presentador + ncleo
nominal
sintagma nominal sustitutivo adyacente + presentador + ncleo
nominal
----------------------------------------------------------------------------
sintagma nominal homogneo ncleo nominal
sintagma nominal sustitutivo ncleo nominal
----------------------------------------------------------------------------
sintagma nominal homogneo ncleo nominal + adyacente
sintagma nominal sustitutivo ncleo nominal + adyacente
----------------------------------------------------------------------------
sintagma nominal homogneo ncleo nominal + adyacentes
sintagma nominal sustitutivo ncleo nominal + adyacentes
----------------------------------------------------------------------------
sintagma nominal homogneo presentador + adyacente + ncleo
nominal
sintagma nominal sustitutivo presentador + adyacente + ncleo
nominal
----------------------------------------------------------------------------
sintagma nominal homogneo presentador + ncleo nominal
sintagma nominal sustitutivo presentador + ncleo nominal
----------------------------------------------------------------------------
sintagma nominal homogneo presentador + ncleo nominal +
adyacente
sintagma nominal sustitutivo presentador + ncleo nominal +
adyacente
----------------------------------------------------------------------------
sintagma nominal homogneo presentador + ncleo nominal +
adyacente + complemento preposicional del nombre
sintagma nominal sustitutivo presentador + ncleo nominal +
adyacente + complemento preposicional del nombre
----------------------------------------------------------------------------

- 173 -
Proceso de automatizacin del anlisis sintactico del espaol.

sintagma nominal homogneo presentador + ncleo nominal +


adyacentes
sintagma nominal sustitutivo presentador + ncleo nominal +
adyacentes
----------------------------------------------------------------------------
sintagma nominal homogneo presentador + ncleo nominal +
complemento preposicional del nombre
sintagma nominal sustitutivo presentador + ncleo nominal +
complemento preposicional del nombre
Se aplica la siguiente regla:
Smbolos no permitidos. El ncleo nominal de un sintagma nominal
homogneo es siempre un sustantivo. Cuando el ncleo nominal se genera a
partir de un adjetivo, de un infinitivo, de un infinitivo con pronombre, de otro
pronombre, de un pronombre de relativo, de un pronombre personal tono o de
un pronombre personal tnico dar lugar a un sintagma nominal sustitutivo.

Grupo 10.
Las reglas que dan lugar a la ambigedad son:
conector conjuncin
conector subordinante conjuncin
Se aplica la siguiente regla:
Palabras necesarias: Otros casos. Cuando el conector subordiante se genera
desde una conjuncin requiere que la palabra de partida sea aunque, con que,
cuando, cuantos, cuantas, para, porque, que o si.

Grupo 12.
Las reglas que dan lugar a la ambigedad son:
ncleo verbal forma verbal compleja
ncleo verbal copulativo forma verbal compleja
ncleo verbal pasivo forma verbal compleja
Se aplican las siguientes reglas:
Simbolos incompatibles. El ncleo verbal es incompatible con la existencia de
otro ncleo verbal, con la de un ncleo verbal copulativo y con la de un ncleo
verbal pasivo. El ncleo verbal copulativo es incompatible con la existencia de
un ncleo verbal, con la de otro ncleo verbal copulativo y con la de un ncleo
verbal pasivo. El ncleo verbal pasivo es incompatible con la existencia de un

- 174 -
Proceso de automatizacin del anlisis sintactico del espaol.

ncleo verbal, con la de un ncleo verbal copulativo, con la de otro ncleo


verbal pasivo, con la de una oracin atributiva, con la de una oracin de
suplemento y con la una oracin transitiva.
Smbolos necesarios. El ncleo verbal copulativo requiere la existencia de un
atributo.
Casos especiales: Otros casos. El ncleo verbal pasivo. El auxiliar del ncleo
verbal pasivo debe ser siempre el verbo ser.
Casos especiales: Otros casos. El ncleo verbal copulativo. El ncleo verbal
copulativo slo puede generarse a partir de un conjunto reducido de verbos los
copulativos.

Grupo 13 y 14.
Las reglas que dan lugar a la ambigedad son:
ncleo verbal forma verbal simple
ncleo verbal copulativo forma verbal simple
----------------------------------------------------------------------------
circunstancial gerundio
ncleo verbal gerundio
ncleo verbal copulativo gerundio
Se aplican las siguientes reglas:
Simbolos incompatibles. El ncleo verbal es incompatible con la existencia de
otro ncleo verbal, con la de un ncleo verbal copulativo y con la de un ncleo
verbal pasivo. El ncleo verbal copulativo es incompatible con la existencia de
un ncleo verbal, con la de otro ncleo verbal copulativo y con la de un ncleo
verbal pasivo.
Smbolos necesarios. El ncleo verbal copulativo requiere la existencia de un
atributo.
Casos especiales: Otros casos. El verbo auxiliar haber. Cuando el ncleo
verbal es el verbo haber, debe encontrarse acompaado de un objeto directo.
Casos especiales: Otros casos. El ncleo verbal copulativo. El ncleo verbal
copulativo slo puede generarse a partir de un conjunto reducido de verbos los
copulativos.

Grupo 15.
Las reglas que dan lugar a la ambigedad son:

- 175 -
Proceso de automatizacin del anlisis sintactico del espaol.

ncleo nominal infinitivo


ncleo verbal infinitivo
ncleo verbal copulativo infinitivo
Se aplican las siguientes reglas:
Simbolos incompatibles. El ncleo verbal es incompatible con la existencia de
otro ncleo verbal, con la de un ncleo verbal copulativo y con la de un ncleo
verbal pasivo. El ncleo verbal copulativo es incompatible con la existencia de
un ncleo verbal, con la de otro ncleo verbal copulativo y con la de un ncleo
verbal pasivo.
Smbolos necesarios. El ncleo verbal copulativo requiere la existencia de un
atributo.
Casos especiales: Otros casos. El ncleo verbal copulativo. El ncleo verbal
copulativo slo puede generarse a partir de un conjunto reducido de verbos los
copulativos.

Grupo 16.
Las reglas que dan lugar a la ambigedad son:
ncleo nominal infinitivo con pronombre encltico
ncleo verbal infinitivo con pronombre encltico
Se aplican las siguientes reglas:
Simbolos incompatibles. El ncleo verbal es incompatible con la existencia de
otro ncleo verbal, con la de un ncleo verbal copulativo y con la de un ncleo
verbal pasivo.
Concordancias. El ncleo verbal debe concordar en nmero y persona con el
sujeto de la oracin por ser infinitivo debe ser singular y tercera persona.

Grupo 20, 21, 22 y 23.


Las reglas que dan lugar a la ambigedad son:
proposicin oracin atributiva
proposicin de infinitivo oracin atributiva
proposicin subordinada oracin atributiva
----------------------------------------------------------------------------
proposicin oracin de suplemento
proposicin de infinitivo oracin de suplemento
proposicin subordinada oracin de suplemento
----------------------------------------------------------------------------
proposicin oracin intransitiva

- 176 -
Proceso de automatizacin del anlisis sintactico del espaol.

proposicin de infinitivo oracin intransitiva


proposicin subordinada oracin intransitiva
----------------------------------------------------------------------------
proposicin oracin transitiva
proposicin de infinitivo oracin transitiva
proposicin subordinada oracin transitiva
Se aplica la siguiente regla:
Casos especiales: Proposiciones. La proposicin y la proposicin
subordinada se diferencian en cmo se unen al resto de la oracin la
proposicin requiere un conector que acta como coordinante y la subordinada
de un conector subordinante. La proposicin de infinitivo debe tener como
ncleo verbal un infinitivo.

Grupo 24.
Las reglas que dan lugar a la ambigedad son:
ncleo verbal participio
ncleo verbal pasivo participio
Se aplican las siguientes reglas:
Simbolos incompatibles. El ncleo verbal es incompatible con la existencia de
otro ncleo verbal, con la de un ncleo verbal copulativo y con la de un ncleo
verbal pasivo. El ncleo verbal pasivo es incompatible con la existencia de un
ncleo verbal, con la de un ncleo verbal copulativo, con la de otro ncleo
verbal pasivo, con la de una oracin atributiva, con la de una oracin de
suplemento y con la una oracin transitiva.
Concordancias. El ncleo verbal y el ncleo verbal pasivo deben concordar en
nmero y persona con el sujeto.
Casos especiales: Otros casos. El ncleo verbal pasivo. Para que se genere un
ncleo verbal pasivo a partir de un participio debe existir el auxiliar pasivo ser.

Grupo 25, 26, 27, 28, 29, 30 y 31.


Las reglas que dan lugar a la ambigedad son:
oracin atributiva predicado
oracin de suplemento predicado
oracin intransitiva predicado
oracin pasiva predicado
oracin transitiva predicado
----------------------------------------------------------------------------

- 177 -
Proceso de automatizacin del anlisis sintactico del espaol.

oracin atributiva predicado + coma + sujeto + predicado


oracin de suplemento predicado + coma + sujeto + predicado
oracin intransitiva predicado + coma + sujeto + predicado
oracin pasiva predicado + coma + sujeto + predicado
oracin transitiva predicado + coma + sujeto + predicado
----------------------------------------------------------------------------
oracin atributiva predicado + puntuacin
oracin de suplemento predicado + puntuacin
oracin intransitiva predicado + puntuacin
oracin pasiva predicado + puntuacin
oracin transitiva predicado + puntuacin
----------------------------------------------------------------------------
oracin atributiva predicado + sujeto
oracin de suplemento predicado + sujeto
oracin intransitiva predicado + sujeto
oracin pasiva predicado + sujeto
oracin transitiva predicado + sujeto
----------------------------------------------------------------------------
oracin atributiva predicado + sujeto + predicado
oracin de suplemento predicado + sujeto + predicado
oracin intransitiva predicado + sujeto + predicado
oracin pasiva predicado + sujeto + predicado
oracin transitiva predicado + sujeto + predicado
----------------------------------------------------------------------------
oracin atributiva predicado + sujeto + predicado + puntuacin
oracin de suplemento predicado + sujeto + predicado + puntuacin
oracin intransitiva predicado + sujeto + predicado + puntuacin
oracin pasiva predicado + sujeto + predicado + puntuacin
oracin transitiva predicado + sujeto + predicado + puntuacin
----------------------------------------------------------------------------
oracin atributiva predicado + sujeto + puntuacin
oracin de suplemento predicado + sujeto + puntuacin
oracin intransitiva predicado + sujeto + puntuacin
oracin pasiva predicado + sujeto + puntuacin
oracin transitiva predicado + sujeto + puntuacin
Se aplican las siguientes reglas:
Simbolos incompatibles. La oracin atributiva es incompatible con la
existencia de un ncleo verbal pasivo. La oracin de suplemento es
incompatible con la existencia de un ncleo verbal pasivo y con la de un objeto
directo. La oracin intransitiva es incompatible con la existencia de un atributo,
con la de un objeto directo y con la de un suplemento. La oracin transitiva es
incompatible con la existencia de un atributo y con la de un ncleo verbal
pasivo. No es necesario considerar ninguna incompatibilidad para la oracin
pasiva ya que hereda las limitaciones de su ncleo verbal pasivo.

- 178 -
Proceso de automatizacin del anlisis sintactico del espaol.

Smbolos necesarios. La oracin atributiva requiere la existencia de un ncleo


verbal copulativo y de un atributo. La oracin de suplemento requiere la
existencia de un ncleo verbal y de un suplemento. La oracin intransitiva
requiere la existencia de un ncleo verbal. La oracin pasiva requiere la
existencia de un ncleo verbal pasivo. La oracin transitiva requiere la
existencia de un ncleo verbal y de un objeto directo.

Grupo 32.
Las reglas que dan lugar a la ambigedad son:
conector subordinante preposicin
preposicin subordinante preposicin
No se aplica directamente ninguna regla, aunque muchos de los conflictos se
resuelven en niveles superiores.

Grupo 41.
Las reglas que dan lugar a la ambigedad son:
morfema de impersonal pronombre personal tono
morfema de pasiva pronombre personal tono
morfema de voz media pronombre personal tono
ncleo nominal pronombre personal tono
Se aplican las siguientes reglas:
Palabras necesarias: Los pronombres personales tonos. El morfema de
impersonal y el morfema de pasiva requieren que el pronombre que gener el
pronombre personal tono sea se. El morfema de voz media requiere que el
pronombre que gener el pronombre personal tono sea me o se.
Simbolos incompatibles. El morfema de impersonal es incompatible con la
existencia de otro morfema de impersonal, con la de un morfema de pasiva, con
la de un morfema de voz media, con la de un predicativo subjetivo y con la de un
sujeto. El morfema de pasiva es incompatible con la existencia de un atributo,
con la de un morfema de impersonal, con la de otro morfema de pasiva, con la
de un morfema de voz media, con la de un objeto directo y con la de un objeto
indirecto. El morfema de voz media es incompatible con la existencia de un
morfema de impersonal, con la de un morfema de pasiva y con la de otro
morfema de voz media.

- 179 -
Proceso de automatizacin del anlisis sintactico del espaol.

Grupo 42.
Las reglas que dan lugar a la ambigedad son:
adyacente pronombre de relativo
conector subordinante pronombre de relativo
ncleo nominal pronombre de relativo
Se aplican las siguientes reglas:
Palabras necesarias: Otros casos. Cuando el adyacente se genera desde
pronombre de relativo requiere que la palabra de partida sea cuya, cuyas, cuyo,
cuyos o que.
Casos especiales: Otros casos. El pronombre de relativo como conector
subordinante. Para generar conector subordinante se requiere al menos dos
ncleos verbales.

Grupo 43.
Las reglas que dan lugar a la ambigedad son:
ncleo nominal otro pronombre
presentador otro pronombre
Se aplican las siguientes reglas:
Palabras necesarias: Otros casos. Cuando el presentador se genera desde otro
pronombre requiere que la palabra de partida sea que o qu.
Concordancias. Todo presentador se usa para introducir un ncleo nominal con
el que debe de concordar en gnero y nmero.
Casos especiales: Presentadores pospuestos y presentadores antepuestos. El
smbolo otro pronombre slo aparece antepuesto al ncleo nominal.

Grupo 44.
Las reglas que dan lugar a la ambigedad son:
circunstancial proposicin
complemento preposicional del nombre proposicin
objeto directo proposicin
sujeto proposicin
vocativo proposicin
Se aplican las siguientes reglas:
Smbolos incompatibles. El objeto directo es incompatible con la existencia de
un atributo, con la de un morfema de pasiva, con la de una oracin de

- 180 -
Proceso de automatizacin del anlisis sintactico del espaol.

suplemento y con la de una oracin intransitiva. El sujeto es incompatible con la


existencia de un morfema de impersonal.
Smbolos necesarios. El objeto directo requiere la existencia de un ncleo
verbal transitivo.
Concordancias. El sujeto debe concordar en nmero y persona con el ncleo
verbal.
Semntica necesaria. Cabe desechar ciertos circunstanciales lugar, tiempo y
cantidad en funcin de la informacin semntica de sus palabras.
Casos especiales: Doble objeto directo. De existir otro objeto directo, se
descarta la generacin de objeto directo a menos que el primero le siga en la
oracin, est generado a partir de un pronombre personal tono y sus ncleos
concuerden en gnero y nmero.

Grupo 45.
Las reglas que dan lugar a la ambigedad son:
objeto directo proposicin de infinitivo
sujeto proposicin de infinitivo
Se aplican las siguientes reglas:
Smbolos incompatibles. El objeto directo es incompatible con la existencia de
un atributo, con la de un morfema de pasiva, con la de una oracin de
suplemento y con la de una oracin intransitiva. El sujeto es incompatible con la
existencia de un morfema de impersonal.
Smbolos necesarios. El objeto directo requiere la existencia de un ncleo
verbal.
Concordancias. El sujeto debe concordar en nmero y persona con el ncleo
verbal.
Casos especiales: Doble objeto directo. De existir otro objeto directo, se
descarta la generacin de objeto directo a menos que el primero le siga en la
oracin, est generado a partir de un pronombre personal tono y sus ncleos
concuerden en gnero y nmero.

Grupo 46.
Las reglas que dan lugar a la ambigedad son:
adyacente proposicin subordinada

- 181 -
Proceso de automatizacin del anlisis sintactico del espaol.

aposicin proposicin subordinada


atributo proposicin subordinada
circunstancial proposicin subordinada
complemento preposicional del nombre proposicin subordinada
objeto directo proposicin subordinada
subordinada comparativa proposicin subordinada
sujeto proposicin subordinada
Se aplican las siguientes reglas:
Simbolos incompatibles. El atributo es incompatible con la existencia de otro
atributo, con la de un morfema de pasiva, con la de un objeto directo, con la de
un objeto indirecto, con la de una oracin intransitiva, con la de una oracin
transitiva, con la de un predicativo objetivo, con la de un predicativo subjetivo y
con la de un suplemento. El objeto directo es incompatible con la existencia de
un atributo, con la de un morfema de pasiva, con la de una oracin de
suplemento y con la de una oracin intransitiva. El sujeto es incompatible con la
existencia de un morfema de impersonal.
Smbolos necesarios. El atributo requiere la existencia de un ncleo verbal
copulativo. El objeto directo requiere la existencia de un ncleo verbal. La
subordinada comparativa requiere la existencia de un atributo.
Concordancias. El sujeto debe concordar nmero y persona con el ncleo
verbal.
Semntica necesaria. Cabe desechar ciertos circunstanciales lugar, tiempo y
cantidad en funcin de la informacin semntica de sus palabras.
Casos especiales: Doble objeto directo. De existir otro objeto directo, se
descarta la generacin de objeto directo a menos que el primero le siga en la
oracin, est generado a partir de un pronombre personal tono y sus ncleos
concuerden en gnero y nmero.

Grupo 47, 48, 49, 50, 51 y 52.


Las reglas que dan lugar a la ambigedad son:
oracin exclamativa puntuacin + oracin atributiva + puntuacin
oracin interrogativa puntuacin + oracin atributiva + puntuacin
----------------------------------------------------------------------------
oracin exclamativa puntuacin + oracin de suplemento +
puntuacin
oracin interrogativa puntuacin + oracin de suplemento +
puntuacin

- 182 -
Proceso de automatizacin del anlisis sintactico del espaol.

----------------------------------------------------------------------------
oracin exclamativa puntuacin + oracin intransitiva +puntuacin
oracin interrogativa puntuacin + oracin intransitiva +puntuacin
----------------------------------------------------------------------------
oracin exclamativa puntuacin + oracin pasiva + puntuacin
oracin interrogativa puntuacin + oracin pasiva + puntuacin
----------------------------------------------------------------------------
oracin exclamativa puntuacin + oracin transitiva + puntuacin
oracin interrogativa puntuacin + oracin transitiva + puntuacin
----------------------------------------------------------------------------
oracin exclamativa puntuacin + sentencia + puntuacin
oracin interrogativa puntuacin + sentencia + puntuacin
Se aplica la siguiente regla:
Casos especiales: Oraciones interrogativas y exclamativas. Este conflicto
siempre se resuelve ya que para generar oracin exclamativa los signos de
puntuacin han de ser las exclamaciones y para generar oracin interrogativa
los signos de puntuacin han de ser las interrogaciones.

Grupo 53.
Las reglas que dan lugar a la ambigedad son:
adyacente sintagma adjetivo
atributo sintagma adjetivo
predicativo objetivo sintagma adjetivo
predicativo subjetivo sintagma adjetivo
Se aplican las siguientes reglas:
Smbolos incompatibles. El atributo es incompatible con la existencia de otro
atributo, con la de un morfema de pasiva, con la de un objeto directo, con la de
un objeto indirecto, con la de una oracin intransitiva, con la de una oracin
transitiva, con la de un predicativo objetivo, con la de un predicativo subjetivo y
con la de un suplemento. El predicativo objetivo es incompatible con la
existencia de un atributo, con la de otro predicativo objetivo y con la de un
predicativo subjetivo. El predicativo subjetivo es incompatible con la existencia
de un atributo, con la de un morfema de impersonal, con la de un predicativo
objetivo y con la de otro predicativo subjetivo.
Smbolos necesarios. El atributo requiere la existencia de un ncleo verbal
copulativo y el predicativo objetivo la de un objeto directo.

- 183 -
Proceso de automatizacin del anlisis sintactico del espaol.

Concordancias. El adyacente debe concordar con el ncleo nominal al que acompaa


en gnero y nmero, el predicativo objetivo con el objeto directo en gnero, nmero y persona y
el predicativo subjetivo con el ncleo verbal y el sujeto en nmero y persona.

Grupo 54.
Las reglas que dan lugar a la ambigedad son:
atributo sintagma nominal heterogneo
objeto directo sintagma nominal heterogneo
sujeto sintagma nominal heterogneo
Se aplican las siguientes reglas:
Simbolos incompatibles. El atributo es incompatible con la existencia de otro
atributo, con la de un morfema de pasiva, con la de un objeto directo, con la de
un objeto indirecto, con la de una oracin intransitiva, con la de una oracin
transitiva, con la de un predicativo objetivo, con la de un predicativo subjetivo y
con la de un suplemento. El objeto directo es incompatible con la existencia de
un atributo, con la de un morfema de pasiva, con la de una oracin de
suplemento y con la de una oracin intransitiva. El sujeto es incompatible con la
existencia de un morfema de impersonal.
Smbolos necesarios. El atributo requiere la existencia de un ncleo verbal
copulativo y el objeto directo la de un ncleo verbal.
Concordancias. El sujeto debe concordar en nmero y persona con el ncleo
verbal.
Casos especiales: Doble objeto directo. De existir otro objeto directo, se descarta la
generacin de objeto directo a menos que el primero le siga en la oracin, est generado a partir
de un pronombre personal tono y sus ncleos concuerden en gnero y nmero.

Grupo 55.
Las reglas que dan lugar a la ambigedad son:
atributo sintagma nominal homogneo
circunstancial sintagma nominal homogneo
objeto directo sintagma nominal homogneo
sujeto sintagma nominal homogneo
vocativo sintagma nominal homogneo
Se aplican las siguientes reglas:
Simbolos incompatibles. El atributo es incompatible con la existencia de otro
atributo, con la de un morfema de pasiva, con la de un objeto directo, con la de

- 184 -
Proceso de automatizacin del anlisis sintactico del espaol.

un objeto indirecto, con la de una oracin intransitiva, con la de una oracin


transitiva, con la de un predicativo objetivo, con la de un predicativo subjetivo y
con la de un suplemento. El objeto directo es incompatible con la existencia de
un atributo, con la de un morfema de pasiva, con la de una oracin de
suplemento y con la de una oracin intransitiva. El sujeto es incompatible con la
existencia de un morfema de impersonal.
Smbolos necesarios. El atributo requiere la existencia de un ncleo verbal
copulativo y el objeto directo la de un ncleo verbal.
Concordancias. El sujeto debe concordar en nmero y persona con el ncleo
verbal.
Semntica necesaria. Cabe desechar ciertos circunstanciales lugar, tiempo y
cantidad en funcin de la informacin semntica de sus palabras.
Casos especiales: Doble objeto directo. De existir otro objeto directo, se
descarta la generacin de objeto directo a menos que el primero le siga en la
oracin, est generado a partir de un pronombre personal tono y sus ncleos
concuerden en gnero y nmero.

Grupo 56.
Las reglas que dan lugar a la ambigedad son:
atributo sintagma nominal sustitutivo
circunstancial sintagma nominal sustitutivo
objeto directo sintagma nominal sustitutivo
objeto indirecto sintagma nominal sustitutivo
sujeto sintagma nominal sustitutivo
Se aplican las siguientes reglas:
Smbolos no permitidos. Cuando el objeto directo o el objeto indirecto se
generan a partir de un sintagma nominal sustitutivo, los posibles ncleos
nominales se limitan a infinitivo, otro pronombre o pronombre personal tono.
Cuando el sujeto se genera a partir de un sintagma nominal sustitutivo, el ncleo
nominal se limita a pronombre personal tnico.
Simbolos incompatibles. El atributo es incompatible con la existencia de otro
atributo, con la de un morfema de pasiva, con la de un objeto directo, con la de
un objeto indirecto, con la de una oracin intransitiva, con la de una oracin
transitiva, con la de un predicativo objetivo, con la de un predicativo subjetivo y
con la de un suplemento. El objeto directo es incompatible con la existencia de

- 185 -
Proceso de automatizacin del anlisis sintactico del espaol.

un atributo, con la de un morfema de pasiva, con la de una oracin de


suplemento y con la de una oracin intransitiva. El objeto indirecto es
incompatible con la existencia de un atributo y con la de un morfema de pasiva.
El sujeto es incompatible con la existencia de un morfema de impersonal.
Smbolos necesarios. El atributo requiere la existencia de un ncleo verbal
copulativo y el objeto directo la de un ncleo verbal.
Concordancias. El sujeto debe concordar en nmero y persona con el ncleo
verbal. El objeto indirecto debe concordar en gnero y nmero con otro objeto
indirecto si lo hubiera.
Semntica necesaria. Cabe desechar ciertos circunstanciales lugar, tiempo y
cantidad en funcin de la informacin semntica de sus palabras.
Casos especiales: Doble objeto directo. De existir otro objeto directo, se
descarta la generacin de objeto directo a menos que el primero le siga en la
oracin, est generado a partir de un pronombre personal tono y sus ncleos
concuerden en gnero y nmero.

Grupo 57.
Las reglas que dan lugar a la ambigedad son:
atributo sintagma preposicional
circunstancial sintagma preposicional
complemento adjetivo sintagma preposicional
complemento agente sintagma preposicional
complemento preposicional del nombre sintagma preposicional
objeto directo sintagma preposicional
objeto indirecto sintagma preposicional
suplemento sintagma preposicional
Se aplican las siguientes reglas:
Palabras necesarias: Los sintagmas preposicionales. Algunos smbolos que se
generan a partir de un sintagma preposicional exigen del sintagma que comience
por determinadas preposiciones. El atributo requiere de, desde o para. El
complemento adjetivo requiere de o en. El complemento agente requiere de o
por. El complemento preposicional del nombre requiere de, en, por o sin. El
objeto directo requiere a. El objeto indirecto requiere a o para. El suplemento
requiere a, de, en o por.

- 186 -
Proceso de automatizacin del anlisis sintactico del espaol.

Smbolos incompatibles. El atributo es incompatible con la existencia de otro


atributo, con la de un morfema de pasiva, con la de un objeto directo, con la de
un objeto indirecto, con la de una oracin intransitiva, con la de una oracin
transitiva, con la de un predicativo objetivo, con la de un predicativo subjetivo y
con la de un suplemento. El complemento agente es incompatible con la
existencia de un suplemento. El objeto directo es incompatible con la existencia
de un atributo, con la de un morfema de pasiva, con la de una oracin de
suplemento y con la de una oracin intransitiva. El objeto indirecto es
incompatible con la existencia de un atributo y con la de un morfema de pasiva.
El suplemento es incompatible con la existencia de un atributo, con la de un
complemento agente, con la de una oracin intransitiva y con la de otro
suplemento.
Smbolos necesarios. El atributo requiere la existencia de un ncleo verbal
copulativo. El complemento agente requiere la existencia de un ncleo verbal
pasivo. El objeto directo requiere la existencia de un ncleo verbal.
Concordancias. El objeto directo debe concordar en gnero y nmero con otro
objeto directo si lo hubiera. El objeto indirecto debe concordar en gnero y
nmero con otro objeto indirecto si lo hubiera.
Semntica necesaria. Cabe desechar ciertos circunstanciales lugar, tiempo y
cantidad en funcin de la informacin semntica de sus palabras.
Casos especiales: Doble objeto directo. De existir otro objeto directo, se
descarta la generacin de objeto directo a menos que el primero le siga en la
oracin, est generado a partir de un pronombre personal tono y sus ncleos
concuerden en gnero y nmero.

Grupo 58, 59, 60.


Las reglas que dan lugar a la ambigedad son:
oracin atributiva sujeto + coma + predicado
oracin de suplemento sujeto + coma + predicado
oracin intransitiva sujeto + coma + predicado
oracin pasiva sujeto + coma + predicado
oracin transitiva sujeto + coma + predicado
----------------------------------------------------------------------------
oracin atributiva sujeto + predicado
oracin de suplemento sujeto + predicado
oracin intransitiva sujeto + predicado

- 187 -
Proceso de automatizacin del anlisis sintactico del espaol.

oracin pasiva sujeto + predicado


oracin transitiva sujeto + predicado
----------------------------------------------------------------------------
oracin atributiva sujeto + predicado + puntuacin
oracin de suplemento sujeto + predicado + puntuacin
oracin intransitiva sujeto + predicado + puntuacin
oracin pasiva sujeto + predicado + puntuacin
oracin transitiva sujeto + predicado + puntuacin
Se aplican las siguientes reglas:
Smbolos incompatibles. La oracin atributiva es incompatible con la
existencia de un ncleo verbal pasivo. La oracin de suplemento es
incompatible con la existencia de un ncleo verbal pasivo y con la de un objeto
directo. La oracin intransitiva es incompatible con la existencia de un atributo,
con la de un objeto directo y con la de un suplemento. La oracin transitiva es
incompatible con la existencia de un atributo y con la de un ncleo verbal
pasivo. No es necesario considerar ninguna incompatibilidad para la oracin
pasiva ya que hereda las limitaciones de su ncleo verbal pasivo.
Smbolos necesarios. La oracin atributiva requiere la existencia de un atributo
y la de ncleo verbal copulativo. La oracin de suplemento requiere la
existencia de un ncleo verbal y la de un suplemento. La oracin intransitiva
requiere la existencia de un ncleo verbal. La oracin pasiva requiere la
existencia de un ncleo verbal pasivo. La oracin transitiva requiere la
existencia de un ncleo verbal y la de un objeto directo.

Grupo 61.
Las reglas que dan lugar a la ambigedad son:
aposicin sustantivo
ncleo nominal sustantivo
Se aplica la siguiente regla:
Casos especiales: Otros casos. La aposicin. Se rechaza la generacin de
aposicin se considera adyacente cuando se genera a partir de un sustantivo
que puede tener funcin de adjetivo.

Grupo 62.
Las reglas que dan lugar a la ambigedad son:
auxiliar verbo

- 188 -
Proceso de automatizacin del anlisis sintactico del espaol.

auxiliar pasivo verbo


forma verbal simple verbo
Se aplica la siguiente regla:
Smbolos necesarios. Un auxiliar pasivo requiere la existencia de un ncleo
verbal pasivo.

Tabla 3.38
Resumen de aplicacin de reglas por grupo
1 X X X X
2 X X X
3 X
4 X
5
6
7 X
8 X
9 X
10 X
11 X
12 X X X
13 X X X X
14 X X X X
15 X X X
16 X X
17 X
18 X
19 X
20 X
21 X
22 X
23 X
24 X X
25 X X
26 X X
27 X X
28 X X
29 X X
30 X X
31 X X
32
33 X
34 X
35 X
36 X
37 X
38 X
39 X
40 X
41 X X
42 X X
43 X X X
44 X X X X X
45 X X X X
46 X X X X X
47 X
48 X
49 X
50 X
51 X
52 X
53 X X X
54 X X X X
55 X X X X X
56 X X X X X X
57 X X X X X X

- 189 -
Proceso de automatizacin del anlisis sintactico del espaol.

58 X
59 X
60 X
61 X
62 X

Casos especiales (presentadores pospuestos o pospuestos)


Palabras necesarias (pronombre personal tono)

Casos especiales (acompaantes necesarios)

Oracin interrogativa frente a exclamativa


Casos especiales (las proposiciones)
Palabras necesarias (preposiciones)

Palabras necesarias (otros casos)

Casos especiales (los conectores)


Casos especiales (verbo haber)
Smbolos incompatibles
Smbolos no permitidos

Semntica necesaria

Doble objeto directo


Smbolos necesarios

Casos especiales
Concordancias

4.7.- Ambigedades reales.


Se considera la aparicin de ambigedades reales en aquellos casos en los que se
obtiene como resultado mltiples anlisis sintcticos. Todos deben ser aceptados, ya que
algunos autores interpretan de diferente manera la funcin de alguna de sus partes.

Algunos ejemplos seran:


Hablaron los representantes de los municipios.
El complemento de los municipios puede estar modificando a los
representantes, o tener funcin de suplemento como parte del predicado verbal simple.

Figura 3.34
Interpretacin A

- 190 -
Proceso de automatizacin del anlisis sintactico del espaol.

hablaron los representantes de los municipios

verbo artculo sustantivo preposicin artculo sustantivo

forma verbal preposicin presentador ncleo nominal


presentador ncleo nominal
simple subordinante

ncleo verbal sintagma nominal homogneo

sintagma preposicional

complemento preposicional del nombre

sintagma nominal heterogneo

predicado sujeto

oracin intransitiva

Figura 3.35

Interpretacin B

hablaron los representantes de los municipios

verbo artculo sustantivo preposicin artculo sustantivo

forma verbal preposicin presentador ncleo nominal


presentador ncleo nominal
simple subordinante

ncleo verbal sintagma nominal homogneo sintagma nominal homogneo

sintagma preposicional

suplemento

predicado sujeto predicado

oracin intransitiva

Llenaron el vaso de agua.

Con de agua ocurre lo mismo que en la sentencia anterior.

Figura 3.36
Interpretacin A

- 191 -
Proceso de automatizacin del anlisis sintactico del espaol.

llenaron el vaso de agua

verbo artculo sustantivo preposicin sustantivo

forma verbal preposicin ncleo nominal


presentador ncleo nominal
simple subordinante
sintagma
ncleo verbal nominal
homogneo
sintagma preposicional

complemento preposicional del


nombre

sintagma nominal heterogneo

objeto directo

predicado

oracin intransitiva

Figura 3.37

Interpretacin B

llenaron el vaso de agua

verbo artculo sustantivo preposicin sustantivo

forma verbal preposicin


presentador ncleo nominal ncleo nominal
simple subordinante
sintagma
ncleo verbal sintagma nominal homogneo nominal
homogneo
sintagma preposicional

objeto directo suplemento

predicado

oracin intransitiva

Esa ruta cubre trescientos kilmetros


La parte de la sentencia trescientos kilmetros puede ser reconocida como
circunstancial de distancia, circunstancial de cantidad u objeto directo sujeto cuando
se convierte en pasiva.

- 192 -
Proceso de automatizacin del anlisis sintactico del espaol.

Figura 3.38
Interpretacin A

esa ruta cubre trescientos kilmetros

demostrativo sustantivo verbo adjetivo sustantivo

forma verbal ncleo nominal


presentador ncleo nominal adyacente
simple

sintagma nominal homogneo ncleo verbal sintagma nominal homogneo

circunstancial de distancia

sujeto predicado

oracin intransitiva

Figura 3.39
Interpretacin B

esa ruta cubre trescientos kilmetros

demostrativo sustantivo verbo adjetivo sustantivo

forma verbal ncleo nominal


presentador ncleo nominal adyacente
simple

sintagma nominal homogneo ncleo verbal sintagma nominal homogneo

circunstancial de cantidad

sujeto predicado

oracin intransitiva

Figura 3.40
Interpretacin C

esa ruta cubre trescientos kilmetros

demostrativo sustantivo verbo adjetivo sustantivo

forma verbal ncleo nominal


presentador ncleo nominal adyacente
simple

sintagma nominal homogneo ncleo verbal sintagma nominal homogneo

objeto directo

sujeto predicado

oracin transitiva

4.8.- Resultados estadsticos.


Se ha realizado el anlisis de 745 oraciones seleccionadas que cubrieran el
mayor espectro de la casustica inherente a la gramtica espaola. Se presentan como

- 193 -
Proceso de automatizacin del anlisis sintactico del espaol.

estadsticas el nmero de nodos smbolos generados durante el proceso de


generacin de rboles de representacin sintctica con la desambiguacin funcional
local basada en estructuras de carcter local y sin ella. Ante el coste computacional
del proceso sin desambiguacin funcional se han analizado las oraciones de hasta 8
smbolos para la comparacin.
Figura 3.41
Nodos generados durante el proceso de generacin de rboles de representacin sintctica

900
800
700
Nmero de nodos

600
con desambiguacin
500 funcional local
400 sin desambiguacin
funcional local
300
200
100
0
0 2 4 6 8 10
Nmero de smbolos

Puede verse que el nmero de nodos que se generan durante el proceso de anlisis medida del
costo de los procesos de generacin de rboles disminuye al aplicar la desambiguacin funcional local
y, en general, aumenta con el nmero de smbolos de la sentencia.

- 194 -
Proceso de automatizacin del anlisis sintactico del espaol.

Figura 3.42
Resultados

60

50
Nmero de respuestas

40
con desambiguacin
funcional local
30
sin desambiguacin
funcional local
20

10

0
0 2 4 6 8 10
Nmero de smbolos

El nmero de respuestas nmero de rboles de anlisis diferentes puede disminuir al aplicar


la desambiguacin funcional local. Porque la desambiguacin funcional local tiene en cuenta aspectos
que no se tratan en la desambiguacin estructural: las combinaciones vedadas y el conjunto de
restricciones por frecuencia que eliminan gran cantidad de posibilidades.
Estudiada la influencia de la etapa de la desambiguacin funcional local, se pasa a estudiar el
comportamiento del analizador sintctico con desambiguacin funcional local; de esta manera, se
analizan frases hasta un nmero de smbolos mayor. En las siguientes grficas se observa como el nmero
de nodos y el de respuestas tienden a aumentar de manera gradual con el nmero de smbolos; sin
embargo, aparecen picos y valles que responden a las caractersticas de las oraciones aumentando sobre
todo cuando se trata de oraciones compuestas y no slo al nmero de smbolos de la sentencia y al
nmero de combinaciones funcionales analizadas.

- 195 -
Proceso de automatizacin del anlisis sintactico del espaol.

Figura 3.43
Nmero de nodos generados durante el anlisis de texto real

1200

1000
Nmero de nodos

800

600

400

200

0
0 2 4 6 8 10 12 14 16 18
Nmero de smbolos de la oracin

Figura 3.44
Nmero de respuestas generadas durante el anlisis de texto real

180
160
Nmero de respuestas

140
120
100
80
60
40
20
0
0 2 4 6 8 10 12 14 16 18
Nmero de smbolos de la oracin

Otro dato de inters radica en la influencia del anlisis sintctico en el proceso de


desambiguacin funcional. Una vez que se realiza el proceso de anlisis, el nmero de combinaciones
aceptadas se reduce; la bondad en el proceso de desambiguacin funcional del 87% crece hasta un 96%.
En la siguiente grfica puede observarse cmo afecta a los resultados la aplicacin de los procesos de
desambiguacin estructural sobre la funcional.

- 196 -
Proceso de automatizacin del anlisis sintactico del espaol.

Figura 3.45
Influencia de la desambiguacin estructural en la bondad de la desambiguacin funcional

tras desambiguacin local tras generacin de rboles

100

80
Bondad media

60

40

20

0
0 2 4 6 8 10 12 14 16 18
Nmero de smbolos de la oracin

Figura 3.46
Influencia de la desambiguacin estructural en el
nmero de combinaciones aceptadas de la desambiguacin funcional

tras desambiguacin funcional local tras generacin de rboles

100
Combinaciones aceptadas

80

60

40

20

0
0 2 4 6 8 10 12 14 16 18
Nmero de smbolos de la oracin

- 197 -
Proceso de automatizacin del anlisis sintactico del espaol.

Captulo 3 Apartado 5
Integracin de los procesos de desambiguacin en el
algoritmo de anlisis

5.1.- Introduccin.
Se ha mostrado en captulos anteriores cmo generar los rboles de anlisis y
cmo realizar el proceso de desambiguacin; sin embargo, es importante que estos
procesos se acoplen de forma adecuada para reducir el tiempo de cmputo.

5.2.- La desambiguacin funcional.


La desambiguacin funcional es un proceso que se antepone no se integra a
la generacin de rboles para reducir los comportamientos funcionales que deben
observarse; sin embargo, existen algunas consideraciones a tener en cuenta a la hora de
tratar los resultados del desambiguador funcional por el algoritmo de anlisis.
Para cualquier sentencia, la desambiguacin funcional da como resultado:
Un conjunto de comportamientos funcionales aceptados para cada palabra.
Un conjunto de combinaciones de comportamientos funcionales aceptados.
Tomando la oracin lo hizo a escondidas el desambiguador devolver los
siguientes resultados:

Sentencia: lo hizo a escondidas

lo
Interpretaciones posibles: sustantivo, pronombre personal tono, artculo determinado
Interpretaciones aceptadas: sustantivo, pronombre personal tono

hizo
Interpretaciones posibles: verbo
Interpretaciones aceptadas: verbo

a
Interpretaciones posibles: sustantivo, preposicin
Interpretaciones aceptadas: sustantivo, preposicin

- 198 -
Proceso de automatizacin del anlisis sintactico del espaol.

escondidas
Interpretaciones posibles: adjetivo, sustantivo
Interpretaciones aceptadas: adjetivo, sustantivo

Combinaciones aceptadas (6 de 12):

1.- (lo) sustantivo (hizo) verbo (a) sustantivo (escondidas) adjetivo


2.- (lo) sustantivo (hizo) verbo (a) sustantivo (escondidas) sustantivo
3.- (lo) sustantivo (hizo) verbo (a) preposicin (escondidas) sustantivo
4.- (lo) pronombre personal tono (hizo) verbo (a) sustantivo (escondidas) adjetivo
5.- (lo) pronombre personal tono (hizo) verbo (a) sustantivo (escondidas) sustantivo
6.- (lo) pronombre personal tono (hizo) verbo (a) preposicin (escondidas) sustantivo

Es posible utilizar los resultados del desambiguador de diversas maneras:

Opcin 1. Generar los rboles a partir del anlisis morfolgico de las palabras y
filtrar los resultados finales con las combinaciones aceptadas por el
desambiguador. Este mtodo no mejora la velocidad de anlisis pues se generan
todos los rboles posibles y no se aprovechan los resultados del desambiguador
para realizar poda alguna.

Figura 3.49
Opcin 1: Filtrado final con las combinaciones aceptadas

Sentencia

Anlisis
morfolgico

Generacin de
Desambiguacin
rboles de
funcional
representacin

filtrado de rboles
con las
combinaciones
aceptadas

Resultados

- 199 -
Proceso de automatizacin del anlisis sintactico del espaol.

Opcin 2. Generar los rboles a partir de cada una de las combinaciones


aceptadas. Este mtodo poda los rboles desde la base no se consideran todos
los posibles comportamientos funcionales de las palabras. Como existen
subsecuencias de comportamientos funcionales que son comunes a varias
combinaciones, el realizar el anlisis para cada una de las combinaciones
multiplica innecesariamente el nmero de nodos.

Figura 3.50
Opcin 2: Generacin con las combinaciones aceptadas

Sentencia

Anlisis
morfolgico

Desambiguacin
funcional

Generacin de
rboles de
representacin para
cada combinacin
aceptada

Resultados

Opcin 3. Generar los rboles a partir de las interpretaciones aceptadas no se


duplican los nodos. Sin embargo, es posible que se articulen combinaciones
funcionales no aceptadas sera necesario un filtrado final con las
combinaciones aceptadas.

- 200 -
Proceso de automatizacin del anlisis sintactico del espaol.

Figura 3.51
Opcin 3: Generacin con comportamientos aceptados y filtrado final con las combinaciones aceptadas

Sentencia

Anlisis
morfolgico

Desambiguacin
funcional

Generacin de
rboles de
representacin
partiendo de las
interpretaciones
aceptadas

filtrado de rboles
con las
combinaciones
aceptadas

Resultados

Opcin 4. La forma ms adecuada de generar los rboles es partir de las


interpretaciones aceptadas sin permitir la generacin de smbolos desde
subsecuencias de comportamientos funcionales no incluidas en las
combinaciones aceptadas por el desambiguador; para ello se define la regla
denominada fusin de smbolos.

- 201 -
Proceso de automatizacin del anlisis sintactico del espaol.

Figura 3.52
Opcin 4: Generacin con comportamientos aceptados y filtrado con subsecuencias aceptadas

Sentencia

Anlisis
morfolgico

Desambiguacin
funcional

Generacin de
rboles de
representacin Filtrado con
partiendo de las subsecuencias
interpretaciones
aceptadas

Resultados

Regla: fusin de smbolos.



"
#
#

5.2.- La desambiguacin estructural.


La desambiguacin estructural consiste en rechazar smbolos no terminales en el
anlisis. Existen dos posibilidades: 1) generar todos los rboles y aplicar a cada uno de
ellos el proceso de desambiguacin y 2) integrar la desambiguacin en el proceso de
generacin.
Opcin 1. Generar todos los rboles antes de aplicar el proceso de
desambiguacin. Como no se realiza ninguna poda se generan gran cantidad de
smbolos que no forman rboles completos.

- 202 -
Proceso de automatizacin del anlisis sintactico del espaol.

Figura 3.53
Opcin 1: Desambiguacin estructural al final

Sentencia

Anlisis
morfolgico

Desambiguacin
funcional

Generacin de
rboles de
representacin Filtrado con
partiendo de las subsecuencias
interpretaciones
aceptadas

Filtrado por
desambiguacin
estructural

Resultados

Opcin 2. Es importante que el proceso de desambiguacin estructural sea


llevado a cabo en el momento adecuado para que la poda reduzca los tiempos de
respuesta del algoritmo de anlisis. Al integrar la desambiguacin en el proceso
de generacin, cada vez que se intenta generar un nuevo smbolo se realiza la
desambiguacin que acepta o no dicho smbolo si el smbolo es rechazado no
se generaran nuevos smbolos a partir de l.

- 203 -
Proceso de automatizacin del anlisis sintactico del espaol.

Figura 3.54
Opcin 2: Desambiguacin estructural integrada

Sentencia

Anlisis
morfolgico

Desambiguacin
funcional

Generacin de
rboles de
Filtrado con
representacin Filtrado con
desambiguacin
partiendo de las subsecuencias
estructural
interpretaciones
aceptadas

Resultados

Para para llevar a cabo esta integracin se dividen las reglas de desambiguacin
estructural en dos grupos:
En la generacin de smbolo. Se aplican en el momento de generar el smbolo y
requieren conocer todos los descendientes a partir de los que se ha generado el
smbolo. Las reglas de este grupo son: palabras necesarias, smbolos
necesarios, smbolos necesarios con condicin, semntica necesaria, semntica
incompatible, relaciones ideolgicas entre smbolos, doble objeto directo y
smbolos totales.
Antes de la generacin de smbolo. Pueden ser aplicadas antes del intento de
generacin del smbolo tambin deben ser aplicadas durante la generacin.
Son aquellas en las cuales no siempre es necesario conocer todos los
descendientes del nuevo smbolo. Las reglas de este grupo son: palabras
necesarias, smbolos no permitidos, smbolos incompatibles, concordancias,
doble objeto directo y smbolos totales. En este grupo se introduce tambien la
regla fusin de smbolos.
Algunas de las reglas aparecen en ambos grupos, pues no siempre pueden
aplicarse antes de la generacin del smbolo.

- 204 -
Proceso de automatizacin del anlisis sintactico del espaol.

La generacin de un nuevo smbolo se produce a partir de un conjunto de


smbolos que pueden unirse para dar lugar a uno nuevo. Pueden darse tres casos.
Que se genere una lista de smbolos cerrada en ambos lados una lista de
encuentra cerrada por alguno de sus extremos cuando no requiere de ningn
smbolo ms en dicho extremo. En tal caso, se genera un nuevo smbolo al
que se le aplican todas las reglas de desambiguacin antes de aceptarlo como
vlido. Tmese como ejemplo la sentencia el coche es grande: para
generar el sintagma nominal homogneo se unen los smbolos presentador +
ncleo nominal que cubren el coche que es una lista cerrada en ambos
extremos no se necesitan ms smbolos a ningn lado para generar un
nuevo smbolo. En este momento se aplican las reglas de desambiguacin al
nuevo smbolo.
Figura 3.55
Lista de smbolos cerrada en ambos lados

Smbolo Smbolo
Ms a la izquierda Ms a la derecha

cerrada cerrada

Que se genere una lista de smbolos cerrada en uno de sus lados siempre
ser el izquierdo al usarse slo las coberturas izquierdas. En tal caso, se
aplican las reglas de desambiguacin antes de la generacin de smbolo.
La regla doble objeto directo se aplica si la lista se encuentra cerrada por
la derecha.
La regla palabras necesarias se aplica cuando la lista se encuentra
cerrada por la izquierda.
La regla smbolos totales se aplica si se ha generado una lista tal que su
lmite cerrado coincida con los lmites de la sentencia de anlisis y por el
lado abierto le falte un nico smbolo que cubra una nica palabra.
El resto de las reglas se aplican en cualquier caso.
Tmese como ejemplo la sentencia el coche est en el almacn: a partir de
el coche, se genera un sujeto que origina una lista cerrada por la izquierda
y abierta por la derecha esperando un predicado con vista a una oracin.
En este momento ser posible aplicar las reglas.

- 205 -
Proceso de automatizacin del anlisis sintactico del espaol.

Figura 3.56
Lista de smbolos cerrada slo en un lado

Smbolo Smbolo
Ms a la izquierda Ms a la derecha

cerrada abierta

Que se genere una lista de abierta en ambos lados. Al estar generandose las
listas a partir de la cobertura izquierda este caso no se da pues todas las listas
sern cerradas al menos por la izquierda.

La aplicacin de las reglas antes de la generacin de smbolo no afecta al


resultado final del anlisis; sin embargo, reduce las combinaciones a tratar durante el
proceso de combinacin de eventos. Y, por tanto, mejora los tiempos de respuesta.

5.2.1- Mejoras con el uso de reglas de desambiguacin antes de la


generacin.
La siguiente figura muestra la comparacin entre los tiempos de anlisis con y
sin las reglas de desambiguacin antes de la generacin de smbolo. La mejora
progresa cuando aumenta el nmero de smbolos de la sentencia. Para sentencias
pequeas, el coste de la aplicacin de las reglas antes de la generacin de smbolo
puede hacer que los tiempos sean superiores; sin embargo, la mejora obtenida para
sentencias de ms de cuatro smbolos permite considerarla como muy positiva.

Figura 3.58
Resultados

- 206 -
Proceso de automatizacin del anlisis sintactico del espaol.

con pre-reglas sin pre-reglas

20
18
16
Tiempo (segundos)

14
12
10
8
6
4
2
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Nmero de smbolos de la oracin

- 207 -
Proceso de automatizacin del anlisis sintactico del espaol.

- 208 -
Proceso de automatizacin del anlisis sintactico del espaol.

Captulo 4

Aplicaciones desarrolladas

- 209 -
Proceso de automatizacin del anlisis sintactico del espaol.

- 210 -
Proceso de automatizacin del anlisis sintactico del espaol.

Captulo 4 Apartado 1
Introduccin

En las siguientes pginas se presentan dos aplicaciones realizadas: DeFuSe


Desambiguacin Funcional de Sentencias del Espaol y AmoSinE
Analizador Morfo-Sintctico del Espaol. Para ambas aplicaciones se han creado
interfaces de usuario, para poner de manifiesto la potencialidad y utilidad del trabajo.
La interfaz de DeFuSe permite ver el funcionamiento de los procesos de
desambiguacin funcional que fueron presentados en profundidad en el apartado 2 del
captulo 3. La interfaz permite seleccionar qu procesos aplicar durante el anlisis de un
texto y observar la influencia de cada uno de ellos. Tambin deja ignorar las palabras
antiguas o en desuso.
AmoSinE se presenta con una interfaz ms completa en la que se integra DeFuSe
y un analizador morfolgico. Adems, se incluye la posibilidad de seleccionar los
diferentes procesos de desambiguacin y observar cmo afectan al proceso de anlisis
sintctico.
Las aplicaciones han sido desarrolladas en C++ estndar bajo Microsoft
Windows su portabilidad a otros sistemas resulta fcil. As mismo, se han generado
libreras que permiten su utilizacin en otros proyectos actuales y futuros.
Finalmente deben considerarse las capacidades de DeFuSe y AmoSinE a la hora
de implementar nuevas aplicaciones. Estos motores pueden usarse en mltiples
aplicaciones: estudio de estilos, anlisis de textos, correctores ortogrficos y
gramaticales, buscadores avanzados, etc.
Como ejemplo tmese la aplicacin de bsquedas avanzadas en word
desarrollada por el Grupo de Estructuras de datos y Lingstica Computacional de la
ULPGC. La aplicacin consiste en un buscador de palabras en textos, que permite la

- 211 -
Proceso de automatizacin del anlisis sintactico del espaol.

bsqueda de apariciones tanto en su forma cannica como en las flexiones y


derivaciones que indique el usuario. La aplicacin de los mtodos de anlisis sintctico
del texto durante el proceso de bsqueda permite resolver casos como el de la oracin
el coche est estropeado; si se desea buscar las formas del verbo cochar, pero no las
formas del sustantivo coche y no se realiza un anlisis sintctico de la oracin con
anterioridad, el buscador encontrar coche en la oracin anterior como una posible
forma del verbo cochar el anlisis sintctico salva tal escollo.
Desde el punto de vista de un usuario final cabe destacar la posibilidad de usar
AMoSinE como una herramienta de apoyo en el aprendizaje de la lengua espaola.

- 212 -
Proceso de automatizacin del anlisis sintactico del espaol.

Captulo 4 Apartado 2
Desambiguador Funcional de Sentencias del Espaol:
DeFuSe

2.1.- Introduccin.
La herramienta DeFuSe realiza la desambiguacin automtica de sentencias con
una bondad media de los resultados del 86%. La aplicacin se basa en las caractersticas
de vecindad en el seno de las estructuras locales de la gramtica espaola, y aade una
serie de condiciones de unin concordancias y de prohibiciones en la unin
combinaciones vedadas, como se expres en el apartado 2 del captulo 3.

2.2.- Interfaz.
En la pantalla de la aplicacin que aparece en la figura 4.1 se observa:

Lnea de entrada de sentencia.


Ventana de resultados.
Opciones. Permite la seleccin de qu opciones se aplican durante el proceso
de desambiguacin. Estas opciones recogen las ya vistas en el apartado 2 del
captulo 3 correspondiente a la desambiguacin.

Parejas. Verificacin de s una categora funcional puede acompaar


a las que la rodean.
Flexin. Verificiacin de las concordancias.

- 213 -
Proceso de automatizacin del anlisis sintactico del espaol.

Combinaciones vedadas. Rechazo de combinaciones de funciones


que no deben de ser aceptadas y que se dan en la unin entre
estructuras locales de la gramtica.
Casos especiales. Consideraciones adicionales que se hacen con
respecto a algunas palabras concretas.

Restricciones por frecuencia. Permite descartar o no un conjunto de


caractersticas funcionales con baja frecuencia de aparicin.

Antiguas o desusadas. Descarta las funciones antiguas o desusadas de


las palabras.
Artculos. Descarta la categora funcional sustantivo en aquellas
palabras a las que se les puedan asignar al menos las categoras
artculo y sustantivo.
Pronombres. Descarta la categora funcional sustantivo en aquellas
palabras a las que se les puedan asignar al menos las categoras
pronombre de cualquier tipo y sustantivo.
Conjunciones. Descarta la categora funcional sustantivo en aquellas
palabras a las que se les puedan asignar al menos las categoras
conjuncin de cualquier tipo y sustantivo.
Preposiciones. Descarta la categora funcional sustantivo en aquellas
palabras a las que se les puedan asignar al menos las categoras
preposicin y sustantivo.

- 214 -
Proceso de automatizacin del anlisis sintactico del espaol.

Figura 4.1
Interfaz para DeFuSe

Opciones de desambiguacin Lnea de entrada de

Restricciones por frecuencia

Ventana de

Una vez introducida una lnea de texto y realizado el proceso de desambiguacin


se presentan en la ventana de resultados los siguientes datos:
1. Interpretaciones posibles: comportamientos funcionales de cada elemento de la
sentencia.
2. Interpretaciones aceptadas: comportamientos funcionales admitidos por el
desambiguador.
3. Combinaciones aceptadas: lista de combinaciones de comportamientos funcionales
que admite el desambiguador.

- 215 -
Proceso de automatizacin del anlisis sintactico del espaol.

Figura 4.2
Interfaz de presentacin de resultados

- 216 -
Proceso de automatizacin del anlisis sintactico del espaol.

Captulo 4 Apartado 3
Analizador Morfo-Sintctico del Espaol: AMoSinE

3.1.- Introduccin.
Esta aplicacin realiza el anlisis sintctico de oraciones del espaol. Se trata de
un motor que integra las aplicaciones de anlisis morfolgico y de desambiguacin
funcional, con los procesos de geneacin de rboles de anlisis sintctico y
desambiguacin estructural.

3.2.- Interfaz.
En la pantalla de la aplicacin aparecen los siguientes elementos:

Texto de entrada.
Zona de resultados. En esta zona aparecen tres botones, que aportan resultados de
diferente ndole.
Botn de anlisis sintctico. Presenta el resultado de cada uno de los
distintos anlisis sintcticos de la oracin.
Botn de desambiguacin funcional. Presenta los resultados de la
desambiguacin funcional de la oracin.
Botn de anlisis morfolgico. Presententa el anlisis morfolgico de
cada una de las palabras de la oracin analizada.
Men. Las opciones del men son:
Opciones. Permite seleccionar qu opciones de desambiguacin se
aplican durante el proceso de anlisis.

- 217 -
Proceso de automatizacin del anlisis sintactico del espaol.

Restricciones por frecuencia. Permite descartar resultados con baja


frecuencia de aparicin en textos puede mejorar la eficiencia de los
procesos de desambiguacin.
Ayuda. Presenta una pantalla de ayuda indicando el funcionamiento del
programa.
G.E.D.Y.L.C. Enlace a la pgina web del Grupo de Estructuras de Datos
y Lingstica Computacional de la U.L.P.G.C.

Figura 4.3
Interfaz para AmoSinE

Opciones del anlisis


Restricciones en el

Texto de entrada

Botn de desambiguacin
Botn de anlisis
funcional

Botn de anlisis

- 218 -
Proceso de automatizacin del anlisis sintactico del espaol.

3.2.1- Anlisis sintctico.


Cuando se realiza el anlisis sintctico de una oracin, los resultados aparecen al
pulsar este botn. A la izquierda aparece una lista que permite elegir entre los posibles
resultados del anlisis sintctico que se visualizarn a la derecha.

Figura 4.4
Anlisis sintctico

Visualizacin de cada

Lista de interpretaciones
sintcticas encontradas

3.2.2.- Desambiguacin funcional.


Al pulsar el botn aparecen aparecen los resultados del proceso de
desambiguacin con la misma disposicin que en DeFuSe.

- 219 -
Proceso de automatizacin del anlisis sintactico del espaol.

Figura 4.5
Desambiguacin funcional

3.2.3.- Anlisis morfolgico.


Presenta el resultado del anlisis morfolgico de la sentencia. A la izquierda se
presentan los diferentes elementos que forman parte de la oracin analizada incluye
tanto las palabras como los smbolos de puntuacin. A la derecha se visualizar el
anlisis morfolgico de la palabra que se seleccione en la lista.

- 220 -
Proceso de automatizacin del anlisis sintactico del espaol.

Figura 4.6
Anlisis morfolgico

3.2.4- Opciones del anlisis.


Los opciones posibles son:
Desambiguacin funcional. Si est marcada se realiza la desambiguacin
funcional con todas sus opciones y sin ninguna de sus restricciones por
frecuencia y si no se lleva a cabo el anlisis sobre todas las
combinaciones funcionales posibles.
Desambiguacin estructural. Si se marca esta casilla se aplicaran las
reglas de desambiguacin estructural: palabras necesarias, smbolos no
permitidos, smbolos necesarios, smbolos necesarios con condicin,
smbolos incompatibles, concordancias, smbolos totales, doble objeto
directo, presentadores pospuestos, presentadores antepuestos y los casos
especiales.
Desambiguacin semntica. Si est marcada se aplican todas las reglas
de desambiguacin estructural que introducen algn tipo de informacin

- 221 -
Proceso de automatizacin del anlisis sintactico del espaol.

semntica: semntica necesaria, semntica incompatible y relaciones


ideolgicas entre smbolos.
Figura 4.7
Opciones del anlisis

3.2.5- Restricciones por frecuencia.


Aparecen las siguientes opciones:

Slo verbales. Considera que el anlisis se realiza slo sobre oraciones


en las cuales aparece un ncleo verbal. Permite refinar los resultados, pues
existen casos en los que algunas reglas de desambiguacin estructural estn
relacionadas con el verbo de la oracin y que no seran de aplicacin general.
Tmese como ejemplo la oracin t, compra vino; existen seis posibles
combinaciones de categoras funcionales para la misma, una de ellas es:
pronombre personal tnico + coma + sustantivo + sustantivo; si esta
restriccin no est marcada se tienen en cuenta las oraciones con el verbo
elidido con una estructura del tipo sujeto + separador + predicado, se
identificara un sujeto y un predicado compuesto por dos sustantivos.

- 222 -
Proceso de automatizacin del anlisis sintactico del espaol.

Antiguas o desusadas. Descarta las funciones antiguas o desusadas de las


palabras.
Artculos. Descarta la categora funcional sustantivo en aquellas palabras
a las que se les puedan asignar al menos las categoras artculo y sustantivo.
Pronombres. Descarta la categora funcional sustantivo en aquellas
palabras a las que se les puedan asignar al menos las categoras pronombre
de cualquier tipo y sustantivo.
Conjunciones. Descarta la categora funcional sustantivo en aquellas
palabras a las que se les puedan asignar al menos las categoras conjuncin
de cualquier tipo y sustantivo.
Preposiciones. Descarta la categora funcional sustantivo en aquellas
palabras a las que se les puedan asignar al menos las categoras preposicin
y sustantivo.
Figura 4.8
Restricciones por frecuencia.

- 223 -
Proceso de automatizacin del anlisis sintactico del espaol.

- 224 -
Proceso de automatizacin del anlisis sintactico del espaol.

ndice de tablas

Tabla 1.1 Traductores automticos............................................................................................... 11


Tabla 1.2 Ejemplo de casos posibles............................................................................................ 43
Tabla 2.1 Clasificacin de las oraciones compuestas .................................................................. 48
Tabla 2.2 Sujeto, verbo y coplementos ......................................................................................... 69
Tabla 2.3 Oraciones simples......................................................................................................... 70
Tabla 3.1 Asignacin de comportamientos funcionales................................................................ 84
Tabla 3.2 Ejemplos de consideracin de palabras anticuadas o desusadas................................ 87
Tabla 3.3 Ejemplos de consideracin de palabras con funciones anticuadas o desusadas. ....... 88
Tabla 3.4 Ambigedades funcionales del espaol........................................................................ 88
Tabla 3.5 Parejas del sintagma nominal homogneo ................................................................... 90
Tabla 3.6 El conector en el sintagma nominal heterogneo ......................................................... 94
Tabla 3.7 Comportamientos funcionales.......................................................................................106
Tabla 3.8 Parejas de comportamientos funcionales .....................................................................107
Tabla 3.9 Combinaciones vedadas ...............................................................................................109
Tabla 3.10 Anlisis de ternas del ejemplo ......................................................................................112
Tabla 3.11 Combinaciones posibles para la sentencia del ejemplo ...............................................113
Tabla 3.12 Cuadro de aceptaciones y rechazos de parejas de comportamientos funcionales ......117
Tabla 3.13 Tabla de coberturas ......................................................................................................125
Tabla 3.14 Smbolos: raz y psilom (Tomita 1991)........................................................................130
Tabla 3.15 Derivabilidad parcial (Tomita 1991)...............................................................................130
Tabla 3.16 Adyacencia (Tomita 1991) ............................................................................................131
Tabla 3.17 Tabla de adyacencias ...................................................................................................136
Tabla 3.18 Conflictos primarios.......................................................................................................144
Tabla 3.19 Las preposiciones en la resolucin de conflictos ..........................................................146
Tabla 3.20 Las contracciones en la resolucin de conflictos ..........................................................148
Tabla 3.21 Las preposiciones imperfectas en la resolucin de conflictos ......................................148
Tabla 3.22 Los pronombres personales tnicos en la resolucin de conflictos ..............................149
Tabla 3.23 Smbolos relacionados ..................................................................................................150
Tabla 3.24 Smbolos incompatibles ................................................................................................151
Tabla 3.25 Concordancias analizadas durante la desambiguacin funcional ................................152
Tabla 3.26 Anlisis ideolgico de campesino .................................................................................154
Tabla 3.27 Anlisis ideolgico de domingo.....................................................................................154
Tabla 3.28 Anlisis ideolgico asociados al circunstancial de tiempo ............................................154
Tabla 3.29 Anlisis ideolgico de siempre......................................................................................154
Tabla 3.30 Anlisis ideolgico de da..............................................................................................154
Tabla 3.31 Anlisis ideolgico de verano........................................................................................155
Tabla 3.32 Perfrasis verbales consideradas ..................................................................................159
Tabla 3.33 Resumen de aplicacin de reglas .................................................................................165

- 225 -
Proceso de automatizacin del anlisis sintactico del espaol.

ndice de tablas

Tabla 1.1 Traductores automticos............................................................................................... 11


Tabla 1.2 Ejemplo de casos posibles............................................................................................ 43
Tabla 2.1 Clasificacin de las oraciones compuestas .................................................................. 48
Tabla 2.2 Sujeto, verbo y coplementos ......................................................................................... 69
Tabla 2.3 Oraciones simples......................................................................................................... 70
Tabla 3.1 Asignacin de comportamientos funcionales................................................................ 84
Tabla 3.2 Ejemplos de consideracin de palabras anticuadas o desusadas................................ 87
Tabla 3.3 Ejemplos de consideracin de palabras con funciones anticuadas o desusadas. ....... 88
Tabla 3.4 Ambigedades funcionales del espaol........................................................................ 88
Tabla 3.5 Parejas del sintagma nominal homogneo ................................................................... 90
Tabla 3.6 El conector en el sintagma nominal heterogneo ......................................................... 94
Tabla 3.7 Comportamientos funcionales.......................................................................................106
Tabla 3.8 Parejas de comportamientos funcionales .....................................................................107
Tabla 3.9 Combinaciones vedadas ...............................................................................................109
Tabla 3.10 Anlisis de ternas del ejemplo ......................................................................................112
Tabla 3.11 Combinaciones posibles para la sentencia del ejemplo ...............................................113
Tabla 3.12 Cuadro de aceptaciones y rechazos de parejas de comportamientos funcionales ......117
Tabla 3.13 Tabla de coberturas ......................................................................................................125
Tabla 3.14 Smbolos: raz y psilom (Tomita 1991)........................................................................130
Tabla 3.15 Derivabilidad parcial (Tomita 1991)...............................................................................130
Tabla 3.16 Adyacencia (Tomita 1991) ............................................................................................131
Tabla 3.17 Tabla de adyacencias ...................................................................................................136
Tabla 3.18 Conflictos primarios.......................................................................................................144
Tabla 3.19 Las preposiciones en la resolucin de conflictos ..........................................................146
Tabla 3.20 Las contracciones en la resolucin de conflictos ..........................................................148
Tabla 3.21 Las preposiciones imperfectas en la resolucin de conflictos ......................................148
Tabla 3.22 Los pronombres personales tnicos en la resolucin de conflictos ..............................149
Tabla 3.23 Smbolos relacionados ..................................................................................................150
Tabla 3.24 Smbolos incompatibles ................................................................................................151
Tabla 3.25 Concordancias analizadas durante la desambiguacin funcional ................................152
Tabla 3.26 Anlisis ideolgico de campesino .................................................................................154
Tabla 3.27 Anlisis ideolgico de domingo.....................................................................................154
Tabla 3.28 Anlisis ideolgico asociados al circunstancial de tiempo ............................................154
Tabla 3.29 Anlisis ideolgico de siempre......................................................................................154
Tabla 3.30 Anlisis ideolgico de da..............................................................................................154
Tabla 3.31 Anlisis ideolgico de verano........................................................................................155
Tabla 3.32 Perfrasis verbales consideradas ..................................................................................159

- 226 -
Proceso de automatizacin del anlisis sintactico del espaol.

Tabla 3.33 Resumen de aplicacin de reglas .................................................................................165

- 227 -
Proceso de automatizacin del anlisis sintactico del espaol.

Bibliografa

Artculos y libros:

[ALV94] Alvar Ezquerra, M. 1994. Diccionario de voces de uso actual. Arco-Libros. Madrid.

[BIA98] Bianchi De Cortina, Edith. 1998. Teora Gramatical (Gramtica Estructural).


Ediciones Daly S.L. Cordoba.

[BOS99] Bosque, I., Demonte. V. 1999. Gramtica descriptiva de la lengua espaola. Espasa.
Madrid.

[CAS94] Casares, J. 1994. Diccionario ideolgico de la lengua espaola. Gustavo Gili,


Barcelona.

[CLA97] Clave. 1997. Diccionario de Uso del Espaol Actual. Edicin en CD-ROM. SM.
Madrid.

[DRA95] Real Academia Espaola. 1995. Diccionario de la Lengua Espaola. Edicin


electrnica. Espasa-Calpe. Madrid.

[ESP91] Espasa. 1991. Gran Diccionario de Sinnimos y Antnimos. Espasa-Calpe. Madrid.

[GER83] Gertjan van Noord. 1983. Reversibility in Natural Language Processing. Tesis
doctoral, Universidad de Utrecht, Holanda.

[GIL98] Gili Gaya, S. 1998. Curso Superior de Sintaxis Espaola. Biblograf, s.a. Barcelona.

[GOM96] Gmez Guinovart, Javier. 1996. Aportaciones a la metodologa de evaluacin de los


sistemas de verificacin automtica de la sintaxis. Universidad de Vigo.

[GOM02] Gmez Torredo, Leonardo. 2002. Gramtica didactica del espaol. S.M. Madrid.

[GOM02] Gmez Torredo, Leonardo. 2002. Anlisis sintctico. Teora y prctica. S.M. Madrid.

[GN94] Gnter Neumann. 1994. A Uniform Computational Model for Natural Language
Parsing and Generation. Tesis doctoral, Universidad de Saarland.

[GUT78] Gutirrez Araus, M. L. 1978. Estructuras sintcticas del espaol actual. Sociedad
General Espaola de Librera, S.A. Madrid.

- 228 -
Proceso de automatizacin del anlisis sintactico del espaol.

[LAR96] Larousse. 1996. Gran Diccionario de la Lengua Espaola. Larousse Planeta, s.a.
Barcelona.

[LAZ53] Lzaro Carreter, Fernando. 1953. Diccionario de trminos


filolgicos. Biblioteca romnica hispnica. Editorial Gredos.
Madrid.

[MAR96] Marcos Marn, Francisco A. y otros. 1996. La lengua espaola en las autopistas de la
informacin. Informe sobre el espaol en el entorno multimedia. Gabinete de la Presidencia
del Gobierno, Fundesco (Fundacin para el Desarrollo de la Funcin Social de las
Comunicaciones).

[MOL96] Moliner, M. 1996. Diccionario de Uso del Espaol. Edicin en CD-ROM. Gredos.
Madrid.

[MOZ94] Benito Mozas, Antonio. 1994. Ejercicios de sintaxis. Teora y prctica. EDAF.

[OCT02] Santana Suarez, O.; Perez Aguiar, J.; Losada Garca, L.; Carreras Riudavets, F. 2002.
Hacia la desambiguacin funcional automtica en Espaol. Procesamiento del Lenguaje
Natural, n 28, SEPLN.

[ONV90] Onieva Morales, J. L. 1990. Cmo dominar el anlisis gramatical superior. Playor.
Madrid.

[QUE96] Quesada, Jos F. 1996. Un modelo robusto y eficiente para el anlisis sintctico de
lenguajes naturales mediante rboles mltiples virtuales. Centro Informtico Cientfico de
Andaluca (CICA).

[QUE97] Quesada, Jos F. 1997. El Algoritmo SCP de Anlisis Sintctico mediante


Propagacin de Restricciones. Tesis Doctoral. Universidad de Sevilla. Junio de 1997.

[RAE89] Real Academia Espaola. 1989. Esbozo de una nueva gramtica de la lengua
espaola. Espasa-Calpe. Madrid.

[ROD96] Rodriguez Magro, Consuelo. 1996. CORRECTOR: Un sistema de verificacin


sintctica y estilstica de textos. Centro de Investigacin UAM-IBM (Madrid), Centro de
Tecnologa de la Lengua (Sevilla).

[ROD92] Rodrguez, C.; Rubio, C.; Snchez, A.; Sopea, L. 1992. Herramientas de ayuda a la
redaccin de textos: Un sistema de verificacin lxica, sintctica y estilstica. Voz y Letra,
Tomo III, Volumen 1. Centro de Tecnologa de la lengua-IBM, Sevilla.

[ROD97] Rodrguez Magro, C.; Sopea, L. Villar, C. 1997. Caracterizacin sintctica de los
verbos castellanos para una gramtica en ordendor. Procesamiento del Lenguaje Natural.
Boletn n 7.

- 229 -
Proceso de automatizacin del anlisis sintactico del espaol.

[SAN97] Santana, O., J. Prez, Z. Hernndez, F. Carreras y G. Rodrguez. 1997. FLAVER:


Flexionador y lematizador automtico de formas verbales. Lingstica Espaola Actual
XIX, 2: 229-282.

[SAN99] Santana, O.; J. Prez, F. Carreras, J. Duque, Z. Hernndez y G. Rodrguez. 1999.


FLANOM: Flexionador y lematizador automtico de formas nominales. Lingstica
Espaola Actual XXI, 2: 253-297.

[VOX97] 1997. Diccionario General de la Lengua Espaola Vox. Edicin en CD-ROM.


Biblograf, s.a. Barcelona.

[WES89] Wescoat, Michael T. 1989. Practical Instructions for Working with the Formalism of
Lexical Functional Grammar. MS, Xerox PARC.

[ZAE95] Zaenen, A.; Uszkoreit, H.; Karlsson, F.; Karttunen, L.; Sanfilippo, A.; Pulman, S. G.;
Pereira, F.; Briscoe, T. 1995. Language Analysis and Understanding. Survey of the Art in
Human Language Technology. Captulo 3.

Pginas Web:

[CAL98] Callejo, F. http://usuarios.bitmailer.com/fcallejo/. 1998

[ROD00] Rodrguez, J. R.; Espaol XXI. El Habanero Digital


(http://www.elhabanero.cubaweb.cu). La Habana. Cuba. 2000

[SEMIA] SEM1A. http://www.cs.bham.ac.uk/~pjh/sem1a5/sem1a5.html.

- 230 -
Proceso de automatizacin del anlisis sintactico del espaol.

- 231 -
Proceso de automatizacin del anlisis sintactico del espaol.

- 232 -

También podría gustarte