Documentos de Académico
Documentos de Profesional
Documentos de Cultura
DEPARTAMENTO DE
INFORMTICA Y SISTEMAS
TESIS DOCTORAL
DEPARTAMENTO DE
INFORMTICA Y SISTEMAS
TESIS DOCTORAL
DOCTORADO EN INFORMTICA
sintaxis.
Como resultado de los trabajos realizados se han desarrollado dos motores DeFuSE
actuales.
basa en una definicin en forma de reglas simples de la gramtica espaola; las cuales son
travs del algoritmo de tipo chart rboles mltiples virtuales al que se le incorporan una serie
de mecanismos de poda a los que hemos denominado desambiguacin estructural. Este motor
En ambos casos se han desarrollado interfaces de usuario dando lugar a dos aplicaciones
finales.
Lingstica computacional y analizadores sintcticos
Agradecimientos
-9-
Lingstica computacional y analizadores sintcticos
- 10 -
Lingstica computacional y analizadores sintcticos
Captulo 1
- 11 -
Lingstica computacional y analizadores sintcticos
- 12 -
Lingstica computacional y analizadores sintcticos
Captulo 1 Apartado 1
Introduccin histrica
1.1.- Introduccin.
En un principio, los equipos informticos tenan como nica funcin la
realizacin de clculos matemticos; sin embargo, los avances realizados tanto a nivel
de hardware como de software han hecho que el campo de la informtica sea aplicable a
una amplia gama de funciones. Entre las diferentes reas que toca la informtica se
encuentra la lingstica computacional.
La lingstica computacional es la rama de la informtica (donde sta se une a la
lingstica) que se dedica al estudio del lenguaje natural y la interaccin de la
informtica con ste. Dentro de las aplicaciones de la lingstica computacional cabe
destacar las siguientes:
Apoyo en la preparacin de documentos (correccin ortogrfica, sintctica y
de estilo).
Recuperacin y almacenamiento de la informacin.
Reconocimiento y sntesis del habla.
Traduccin automtica de textos entre diferentes idiomas.
Y en general todas aquellas aplicaciones donde se realice una interaccin con
el usuario por medio del lenguaje natural.
En las siguientes pginas realizaremos un anlisis del estado del arte de la
lingstica computacional, centrndonos en los analizadores y las gramticas.
- 13 -
Lingstica computacional y analizadores sintcticos
criptoanlisis fue llevado a cabo desde algunos aos antes de 1945 con el final de la
guerra los investigadores pudieron dedicarse a otros tipos de aplicaciones, amplindose
la gama de estudios sobre procesamiento del lenguaje natural. Hasta 1960 fue bastante
fcil reunir los trabajos sobre Procesamiento del Lenguaje Natural por la pequea
cantidad de los mismos; sin embargo, desde entonces, se han realizado muchas
investigaciones en este campo.
Contenidos del apartado:
Antecedentes histricos.
Procesamiento del lenguaje natural desde 1966 hasta 1980.
Procesamiento del lenguaje natural desde 1980.
- 14 -
Lingstica computacional y analizadores sintcticos
satisfactoriamente textos tcnicos. Pronto se vio que la tarea que se deba realizar era
extremadamente difcil: el lenguaje era mucho ms complejo que lo que se haba
supuesto, y an peor, aunque fueran expertos en su lengua, era muy difcil codificar el
conocimiento del lenguaje en un programa de ordenador.
Obviamente, los profesionales indicados para pedirles ayuda eran los lingistas.
La literatura de los aos 50 muestra un crecimiento de los trabajos en traduccin
automtica, observndose una tendencia en jvenes investigadores hacia la lingstica
orientada a la traduccin automtica; sin embargo, el problema principal se encontraba
en que no existan teoras lingsticas sobre el tema. Es en 1957 cuando aparece
publicado Syntactic Structures, de Noam Chomsky quien revolucion la lingstica
introduciendo la idea de gramtica generativa: sta consiste en la descripcin de las
estructuras sintcticas basndose en reglas. Aunque algunos no estn de acuerdo con las
teoras de Chomsky, casi todos los trabajos desde 1957 en Procesamiento del Lenguaje
Natural han sido realizados bajo su influencia.
Los primeros sistemas no eran capaces de traducir de manera satisfactoria sin
una importante intervencin del usuario. Antes de 1957, y dada la falta de teoras
lingsticas, se formularon propuestas en el sentido de que el texto deba ser pre-
editado para as marcar las dificultades: por ejemplo, eliminar las ambigedades de las
palabras. Como los sistemas automticos de traduccin no eran capaces de producir
resultados fluidos, el documento debera ser editado a fin de convertirlo en
comprensible para la mquina y posteriormente la traduccin deba ser tambin editada.
La introduccin de la pre-edicin y la post-edicin de los textos traducidos por la
mquina introdujo la idea de que en tareas que eran todava muy difciles para que el
ordenador las realizara por s mismo, ste poda usarse como una herramienta para
asistir a las personas. En la traduccin asistida por ordenador, la mquina acta como
una memoria que elimina la necesidad de recordar amplios vocabularios. Bar-Hillel
concluy que la Traduccin Completamente Automtica de Alta Calidad (Fully-
Automatic High-Quality Translation) era imposible sin conocimiento. Revis los
proyectos del momento y concluy que los mtodos usados que en esencia
relacionaban parejas de palabras estaban destinados a fallar. La razn era simple: los
traductores humanos aaden su capacidad cognitiva a las estructuras del lenguaje en las
que estn trabajando.
A mitad de los aos 60 la inversin pblica estadounidense para el desarrollo de
la traduccin automtica alcanzaba unos 20 millones de dlares anuales. El Comit
- 15 -
Lingstica computacional y analizadores sintcticos
Por la posicin de las palabras Juan y billete se sabe que Juan es el agente
instigador de la accin y que billete es el objeto de la misma. Mara es la
beneficiaria de la accin debido al uso de la preposicin para antes del
sustantivo. La preposicin en indica que la accin se realiza en la estacin de
autobuses. En otros lenguajes que no usan preposiciones, la informacin la
lleva la palabra o la posicin que ocupa.
- 16 -
Lingstica computacional y analizadores sintcticos
1
Un nodo es una estructura que tiene asociada una correspondencia con un objeto, evento, actor, entidad o
cualidad del ambito de representacin.
2
Un enlace es una relacin entre dos nodos.
- 17 -
Lingstica computacional y analizadores sintcticos
- 18 -
Lingstica computacional y analizadores sintcticos
- 19 -
Lingstica computacional y analizadores sintcticos
- 20 -
Proceso de automatizacin del anlisis sintactico del espaol.
lxicos.
La traduccin automtica es uno de los campos de la lingstica computacional
en los que ms hincapi se ha hecho como ya se vio con anterioridad. Con respecto al
espaol existen mltiples traductores comerciales que en su mayora son herramientas
de ayuda a la traduccin no traducen de una forma totalmente correcta, sino que dan
como resultado un texto orientativo que debe ser post-editado. A continuacin se
presenta una lista de los traductores comerciales en todos figura el espaol:
Tabla 1.1
Traductores automticos
- 21 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 22 -
Proceso de automatizacin del anlisis sintactico del espaol.
Captulo 1 Apartado 2
Sintaxis y analizadores sintcticos
2.1.- Introduccin.
En este apartado se hace referencia a temas relacionados con:
Sintaxis: Explica cmo las palabras son agrupadas para formar sentencias.
Analizadores sintcticos: Programas que aplican conocimiento sintctico para
construir descripciones de sentencias usualmente en forma de rbol.
Contenidos del apartado:
Adecuacin de los autmatas de estado finito para el procesamiento
sintctico.
Introduccin a la terminologa de sintaxis y a las gramticas libres del
contexto.
Bsqueda y control en el anlisis.
- 23 -
Proceso de automatizacin del anlisis sintactico del espaol.
Figura 1.1
Ejemplo de autmata de estado finito
1 a 2 b 3 c 4text
Es posible el uso de redes de estado finito para reconocer sentencias del espaol
y de otros idiomas; sin embargo, es posible mostrar que ningn autmata de estado
finito puede modelar algunas construcciones del lenguaje, por ejemplo las sentencias
anidadas todo ello se muestra en los siguientes apartados.
Las descripciones con un Autmata de estado finito de la sintaxis de los
lenguajes naturales son repetitivas y se alargan demasiado.
- 24 -
Proceso de automatizacin del anlisis sintactico del espaol.
una descripcin que cubra todo lo que se quiere describir, de otra manera, no se es capaz
de describir algunas cosas que se sabe que existen. Adems debe ser justamente
suficiente, es decir, ha de ser suficiente pero utilizando los mnimos recursos.
Una teora puede ser evaluada por el criterio de la adecuacin. Podemos hablar
de adecuacin a varios niveles: por ejemplo, una teora puede describir todas las
posibles secuencias que un lenguaje incluye y ninguna ms, pero no dar ninguna
informacin de cmo el cerebro produce dichas sentencias. Si se quiere producir una
descripcin de las sentencias de un lenguaje, sta ser una teora adecuada; si se intenta
entrar en los procesos cognitivos humanos la teora sera inadecuada. Es por ello que
podemos limitar las teoras por el requerimiento de justamente suficiente.
Supngase que se tienen tres gramticas con diferente potencial matemtico y
diferente necesidad de requerimientos de computacin.
1. Reconoce todas las posibles sentencias y la necesidad de requerimientos es
mxima.
2. Reconoce todas las posibles sentencias y la necesidad de requerimientos es
media.
3. No reconoce todas las sentencias y los requerimientos son mnimos.
Vase que la opcin tercera no es adecuada. En cambio, s lo son la 1 y la 2. De
estas dos, es preferible la segunda, pues la teora es justamente suficiente.
- 25 -
Proceso de automatizacin del anlisis sintactico del espaol.
posibles sentencias:
Figura 1.2
Representacin de sentencia con un autmata de estado finito
El gato.
El buen gato.
El muy buen gato.
El muy muy buen gato.
El muy buen y alto gato.
El muy buen y muy alto gato.
etc.
muy muy
gato
gato
Figura 1.3
Reconocimiento de cadenas mediante un autmata de estado finito
ch
cdh
cddh
cdefgh
cdefdgh
etc.
d d
c e f g h text
h
h
- 26 -
Proceso de automatizacin del anlisis sintactico del espaol.
Figura 1.4
Cadenas a reconocer
cdefdgh
cddefddgh
cdddefdddgh
etc
- 27 -
Proceso de automatizacin del anlisis sintactico del espaol.
Es fcil ver que esta red contiene repeticiones: por ejemplo, la secuencia
determinante-sustantivo aparece tres veces y la secuencia
preposicin-determinante-sustantivo aparece dos. En informtica se le da gran
importancia al concepto de modularidad.
El mismo tipo de criterio debe aplicarse a las gramticas. En este caso, una red
de transicin de estado finito no puede ser optima, porque tendra repeticiones
innecesarias. Si se tiene un elemento que procese sustantivo, puede aadirse a la red e
indicar que se trata de un sustantivo. Si puede hacerse modular el conocimiento
humano, nicamente debera realizarse la eleccin una sola vez.
2.2.6.- Resumen.
Se usan varios tipos de adecuacin como criterio para evaluar las teoras. De
ellos, la adecuacin matemtica y la de notacin se usan para evaluar los autmatas de
estado finito, y se ha visto que son inadecuados porque son incapaces de describir
matemticamente algunas estructuras del espaol y no son ptimos desde el punto de
vista notacional.
- 28 -
Proceso de automatizacin del anlisis sintactico del espaol.
Figura 1.9
Secuencia intermedia
cdKdgh
Figura 1.10
Representacin de regla
K ef
- 29 -
Proceso de automatizacin del anlisis sintactico del espaol.
Figura 1.11
Representacin de varias secuencias que dan lugar a un mismo smbolo
K ef
K dKd
Ahora el smbolo K puede sustituirse de dos maneras. Finalmente se va a aadir
una nueva regla, figura 12:
Figura 1.12
Regla de representacin
S cdKdgh
El describir las derivaciones lnea a lnea es slo una manera de hacerlo; otra
forma ms atractiva sera su representacin en rbol, donde cada nivel presenta las
derivaciones realizadas. De este modo la regla, figura 12, sera representada como,
figura 14:
Figura 1.14
rbol de representacin
cd K dgh
- 30 -
Proceso de automatizacin del anlisis sintactico del espaol.
Figura 1.15
rbol de representacin
cd d d ef d d dgh
rbol de representacin
para la cadena cdddefdddgh.
S cdKdgh
K ef
K dKd
- 31 -
Proceso de automatizacin del anlisis sintactico del espaol.
Figura 1.17
Representacin de la gramtica
Figura 1.18
Smbolos pre-terminales
auxiliar estn
sustantivo pollo
pronombre ellos
verbo estn
verbo comiendo
Las palabras del lxico constituirn los lmites del rbol y se usar el trmino
pre-terminal para describir aquellos smbolos que en la siguiente derivacin dan lugar a
smbolos terminales. En este caso los smbolos pre-terminales son: adjetivo, auxiliar,
sustantivo, pronombre y verbo.
- 32 -
Proceso de automatizacin del anlisis sintactico del espaol.
Figura 1.19
rbol de representacin para ellos estn comiendo pollo
SENTENCIA
SINTAGMA_NOMINAL FRASE_VERBAL
2.3.4.- Ambigedad.
A veces existe ms de una interpretacin posible en este caso hablamos de
ambigedad. En procesamiento del lenguaje natural se distingue entre ambigedad
global existe ms de una posible interpretacin de la sentencia y ambigedad local
una parte de la expresin parece ambigua. Esta nueva perspectiva permitir ignorar a
todas o a algunas de sus interpretaciones.
- 33 -
Proceso de automatizacin del anlisis sintactico del espaol.
Figura 1.20
Categoras
Con la sentencia Ellos estn comiendo pollo se ve que el anlisis puede ser
controlado en profundidad o en anchura.
- 34 -
Proceso de automatizacin del anlisis sintactico del espaol.
Figura 1.21
Representacin de la gramtica
auxiliar estn
sustantivo pollo
pronombre ellos
verbo estn
verbo comiendo
SENTENCIA
- 35 -
Proceso de automatizacin del anlisis sintactico del espaol.
Figura 1.24
Primer descenso
SENTENCIA
SINTAGMA_NOMINAL FRASE_VERBAL
pronombre
Figura 1.25
Segundo descenso
SENTENCIA
SINTAGMA_NOMINAL FRASE_VERBAL
y otro:
- 36 -
Proceso de automatizacin del anlisis sintactico del espaol.
Figura 1.26
Tercer descenso
SENTENCIA
SINTAGMA_NOMINAL FRASE_VERBAL
auxiliar verbo
Figura 1.27
Cuarto descenso
SENTENCIA
SINTAGMA_NOMINAL FRASE_VERBAL
- 37 -
Proceso de automatizacin del anlisis sintactico del espaol.
Figura 1.28
Primer nivel inferior aadido
Figura 1.29
Primer ascenso
SINTAGMA_NOMINAL
Repitiendo el proceso:
Figura 1.30
Segundo ascenso
SINTAGMA_NOMINAL GRUPO_VERBAL
- 38 -
Proceso de automatizacin del anlisis sintactico del espaol.
y de nuevo:
Figura 1.31
Tercer ascenso
otra vez:
Figura 1.32
Cuarto ascenso
FRASE_VERBAL
Hasta que se llegue a cubrir todo con el smbolo raz, figura 33:
Figura 1.33
Quinto ascenso
SENTENCIA
FRASE_VERBAL
- 39 -
Proceso de automatizacin del anlisis sintactico del espaol.
Figura 1.34
Anlisis parcial
SENTENCIA
SINTAGMA_NOMINAL FRASE_VERBAL
pronombre
- 40 -
Proceso de automatizacin del anlisis sintactico del espaol.
Figura 1.35
Reglas posibles para frase verbal
Figura 1.36
Evolucin de la pila
Cuando auxiliar y verbo (de la regla GRUPO_VERBAL) han sido tratados, las
reglas alternativas para SINTAGMA_NOMINAL son las que aparecen en la pila de la
figura 37:
Figura 1.37
Reglas alternativas para frase nominal
Reglas Pila
Cada alternativa ser extrada de la pila hasta que slo quede, figura 38:
3
Una pila es una estructura de datos en la cual el elemento que primero se extrae es el ltimo que se ha
insertado.
- 41 -
Proceso de automatizacin del anlisis sintactico del espaol.
Figura 1.38
Regla final
Figura 1.39
Bucles posibles para frase verbal
Figura 1.40
Adicin a la cola
- 42 -
Proceso de automatizacin del anlisis sintactico del espaol.
prrafo.
La excepcin ms importante se produce cuando la bsqueda se detiene en
cuanto existe un bucle infinito en el rbol de bsqueda. Considrese una situacin
donde existe una solucin y un bucle infinito en el rbol de bsqueda: la bsqueda en
anchura encontrar la solucin antes de desaparecer en el bucle infinito. La bsqueda en
profundidad encontrar la solucin finita o se perder en el bucle infinito en funcin del
orden en que se defina la gramtica.
Figura 1.41
Caso de bucle infinito
SENTENCIA
SENTENCIA y SENTENCIA
SENTENCIA y SENTENCIA
- 43 -
Proceso de automatizacin del anlisis sintactico del espaol.
Figura 1.42
Subrboles coincidentes
SENTENCIA
SINTAGMA_NOMINAL FRASE_VERBAL
Subrbol A
verbo_auxiliar verbo adjetivo sustantivo
Subrbol B
Los subarboles A y el B son iguales, por lo tanto, slo es necesario realizar las
derivaciones una vez.
Entonces sera posible reducir el espacio de bsqueda y por ello algunos
algoritmos de bsqueda tabulan las subderivaciones. Estos algoritmos
tabulares se usan ampliamente en el modelado del lenguaje cuando se
dispone de gramticas apropiadas.
De la exhaustividad del modelo de bsqueda.
- 44 -
Proceso de automatizacin del anlisis sintactico del espaol.
2.4.9.- Resumen.
Se ha visto que es posible realizar un anlisis de una sentencia de manera
descendente o ascendente, dependiendo de si se empieza por un smbolo hiptesis
o por una palabra datos. Adems se ha estudiado que existen dos tipos de control para
realizar el anlisis: en profundidad y en anchura. De este modo se dispone de cuatro
tipos de algoritmos de bsqueda:
1. En profundidad descendente.
2. En anchura descendente.
3. En profundidad ascendente.
4. En anchura ascendente.
- 45 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 46 -
Proceso de automatizacin del anlisis sintactico del espaol.
Captulo 1 Apartado 3
Formalismos gramaticales
3.1.- Introduccin.
Los sistemas gramaticales de los aos de la dcada de 1970 evitaban
deliberadamente el uso intensivo del procesamiento sintctico, e incluso algunos
eliminaban toda la informacin sintctica de sus sistemas; sin embargo, muchos
lingistas ven la sintaxis como una parte fundamental del procesamiento del lenguaje
humano, mientras que los ingenieros del lenguaje contemplan la sintaxis como un
mecanismo para la eliminacin de ambigedades con pequeas cantidades de
informacin. Los lingistas tericos han reaccionado en contra de la gramtica de Noam
Chomsky Gramtica Generativa que se basa principalmente en la informacin
sintctica.
Como resultado de todo esto aparecen varias gramticas que codifican una
mayor cantidad de informacin para la representacin sintctica categora: sustantivo,
persona: tercera, gnero: masculino en lugar de una informacin nica sustantivo,
verbo. Estas gramticas reciben el nombre de Gramticas de Unificacin y resultan ms
discriminantes en los analizadores de sentencias.
Contenidos del apartado:
Gramticas de Unificacin.
Tipos de gramticas segn su funcin.
Tendencias futuras de las gramticas.
- 47 -
Proceso de automatizacin del anlisis sintactico del espaol.
5
Los nodos no-terminales se marcan como nodos que pueden ser sustituidos, indicando as que este nodo
puede ser sustituido por el rbol que se deriva del smbolo no terminal.
- 48 -
Proceso de automatizacin del anlisis sintactico del espaol.
Figura 1.43
Operacin de sustitucin.
Figura 1.44
Operacin de agregacin.
- 49 -
Proceso de automatizacin del anlisis sintactico del espaol.
Figura 1.45
Representacin HPSG
- 50 -
Proceso de automatizacin del anlisis sintactico del espaol.
Figura 1.46
Estructura Constituyente.
S f1
(f1 SUBJ) = f2 f1 = f4
NP f2 VP f4
f2 = f3 f4 = f5 (f4 OBJ) = f6
N f3 V f5 NP f6
- 51 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 52 -
Proceso de automatizacin del anlisis sintactico del espaol.
Captulo 1 Apartado 4
Evaluacin de la eficiencia de los sistemas de anlisis
sintctico automatizado
Las dos medidas que se ponen en juego para evaluar los sistemas de anlisis
sintctico son:
B
Convocatoria =
D
B = Nmero de anlisis de la sentencia bien relizados por el sistema.
D = Nmero de anlisis posibles de la sentencia.
B
Precisin =
G
G = Nmero de anlisis devueltos por el sistema bien o mal realizados.
Tabla 1.2
Ejemplo de casos posibles
Nivel de
Caso 1 Caso 2 Caso 3 Caso 4 Caso 5 Caso 6
deteccin.
Nmero de anlisis
posibles de la 2 2 2 2 2 2
sentencia (D)
Nmero de anlisis
devueltos por el
2 4 1 2 8 2
sistema bien o mal
realizados (G)
Nmero de anlisis de
la sentencia bien
2 2 1 1 2 0
relizados por el
sistema (B)
Convocatoria 100% 100% 50% 50% 100% 0%
Precisin 100% 50% 100% 50% 25% 0%
- 53 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 54 -
Proceso de automatizacin del anlisis sintactico del espaol.
Captulo 2
- 55 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 56 -
Proceso de automatizacin del anlisis sintactico del espaol.
Captulo 2 Apartado 1
La sintaxis del espaol
1.1.- Introduccin.
El anlisis sintctico es la descripcin formal de la estructura de una sentencia y
de las relaciones que entre sus elementos se establecen. En el presente documento se
presentan las diferentes estructuras que se dan en la lengua espaola. Se pretende dar
una visin exclusivamente estructural sin entrar en cuestiones semnticas o de tipo
lgico, debido a que su finalidad es la creacin de una gramtica formal que permita la
implementacin de una herramienta de anlisis sintctico automatizado.
- 57 -
Proceso de automatizacin del anlisis sintactico del espaol.
Conclusivas
Ilativas
Continuativas
Inordinadas
Subordinadas
Adverbiales
Proposiciones coordinadas:
Proposiciones coordinadas copulativas. Indican una unin de significados, a
una proposicin se le aade el significado de otra. Se utilizan los conectores: y,
e, ni y excepcionalmente que
oracin proposicin + conjuncin {y, e, que} + proposicin
vendr y cantar
oracin conjuncin {ni} + proposicin + conjuncin {ni} + proposicin
ni vendr ni te llamar
Proposiciones coordinadas disyuntivas. Expresan juicios contradictorios, una
proposicin excluye a la otra. Conectores: o, u, o bien o similares
- 58 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 59 -
Proceso de automatizacin del anlisis sintactico del espaol.
1.4.- El sujeto.
El sujeto es la parte de la oracin que concuerda con el verbo en nmero y
persona, siendo el que realiza una accin o al que se le atribuye algo.
El sujeto puede aparecer o no; se habla entonces de sujeto expreso, cuando
aparece, o tcito o desinencial, cuando se encuentra sobreentendido. Tambin se da el
caso de la no existencia del sujeto cuando el ncleo del predicado es un verbo
impersonal.
el perro mordi al nio es una oracin con sujeto expreso.
{l} llam por telfono ayer es una oracin con sujeto tcito.
llovi durante varios das oracin sin sujeto.
NOTA: El trabajo actual se centrar en el lenguaje escrito y, a partir de aqu,
cuando se haga referencia al sujeto se supondr que se trata de un sujeto expreso.
El sujeto puede adems dividirse en dos tipos, segn el nmero de ncleos que
aparezcan en el mismo; con ello se habla de sujeto simple y de sujeto compuesto.
Tipos de sujeto:
Por su naturaleza:
- 60 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 61 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 62 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 63 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 64 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 65 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 66 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 67 -
Proceso de automatizacin del anlisis sintactico del espaol.
1.7.- El predicado.
El predicado es la parte de la oracin que dice algo del sujeto, concordando con ste
en nmero, persona y gnero. Est formado por uno o varios ncleos verbales y una
serie de complementos.
- 68 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 69 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 70 -
Proceso de automatizacin del anlisis sintactico del espaol.
1.7.4.- El atributo.
Las oraciones con atributo se denominan atributivas o cualitativas y se caracterizan
por llevar un verbo copulativo; cuando el verbo no es copulativo las oraciones se
denominan predicativas. El ncleo de estas oraciones lo forma el atributo y no el verbo.
Las realizaciones sintagmticas del atributo son:
atributo sintagma nominal homogneo
Juan es un buen amigo
atributo sintagma nominal sustitutivo
mi coche es aquel
atributo sintagma nominal heterogneo
el coche es grande y azul
atributo sintagma preposicional
sintagma preposicional preposicin + sintagma nominal homogneo
Manolo es de Las Palmas
sintagma preposicional preposicin + sintagma nominal sustitutivo
(pronombre)
el libro es de ella
sintagma preposicional preposicin + sintagma nominal heterogneo
el coche es de ella y Juan
- 71 -
Proceso de automatizacin del anlisis sintactico del espaol.
atributo proposicin
atributo proposicin de infinitivo
su orden es traer el coche
atributo proposicin introducida por que
la situacin del pas est que arde
1.7.5.- El circunstancial.
Es un elemento complementario y no obligatorio en una oracin que puede ser
desempeado por un sintagma preposicional, un sintagma nominal, un sintagma
adverbial o toda una oracin subordinada adverbial. En cualquier caso indica una
circunstancia referida a la accin verbal de tiempo, de modo, de lugar, de cantidad, de
afirmacin, de negacin, de duda, etc.
Luis corri ayer
nos dirigimos a la ciudad
No cambia al poner la oracin en pasiva y no es sustituible por un pronombre.
hoy yo he trado un libro hoy un libro ha sido trado por m
Las posibles realizaciones sintagmticas del circunstancial son:
circunstancial sintagma preposicional
sintagma preposicional preposicin + sintagma nominal
ven a las tres
sintagma preposicional preposicin + sintagma verbal
llegaremos al salir el sol
sintagma preposicional preposicin + sintagma adverbial
no llegaremos hasta entonces
circunstancial sintagma adverbial
sintagma adverbial adverbio
no vendr
sintagma adverbial adverbio + adverbio
l lleg muy tarde
sintagma adverbial adverbio + sintagma preposicional
estaremos lejos del pas
sintagma adverbial adverbio + sintagma adverbial
muy adorablemente te escuch
- 72 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 73 -
Proceso de automatizacin del anlisis sintactico del espaol.
Circunstancial de modo
l la bes dulcemente
Circunstancial de negacin
no lo llamaron
Circunstancial de oposicin
los de derechas votaron contra los de izquierdas
Circunstancial de tiempo
el encuentro se produjo el martes
- 74 -
Proceso de automatizacin del anlisis sintactico del espaol.
1.7.8.- El suplemento.
Es un complemento del verbo cuya funcin la realiza un sintagma preposicional
que no acta como circunstancial, aunque lo parezca, porque no equivale a un adverbio.
Desde el punto de vista de su alcance es similar al objeto directo ya que delimita y
precisa el significado del verbo al que acompaa.
pensaba en las palabras de Andrs
me acord de ti
En una misma oracin puede haber suplemento y complemento circunstancial.
me acord de ti ayer
- 75 -
Proceso de automatizacin del anlisis sintactico del espaol.
1.8.- El vocativo.
El vocativo es un sintagma nominal con el cual se llama la atencin de aquel o
aquello a lo que se dirige el interlocutor. Como llamada de atencin no tiene ninguna
funcin ni relacin con ninguno de los elementos de la oracin, sino que debe
considerarse dentro del contexto total. Desde un punto de vista gramatical puede
considerarse una proposicin yuxtapuesta. Como caracterstica principal, cabe decir que
siempre se encuentra separado del resto de la oracin por comas.
vocativo sintagma nominal
t, te he dicho que no vengas tarde
- 76 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 77 -
Proceso de automatizacin del anlisis sintactico del espaol.
Captulo 2 Apartado 2
Formalizacin estructural
Tabla 2.2
infinitivo con valor de forma verbal
estructuras generadas
sintagma nominal homogneo
sintagma preposicional
forma verbal compleja
sintagma adverbial
sintagma adjetivo
proposicin
estructuras de partida
- 78 -
Proceso de automatizacin del anlisis sintactico del espaol.
Oraciones simples
oracin transitiva no s s s s
oracin atributiva no s s s s
oracin intransitiva no s s s s
oracin de suplemento no s s s s
oracin pasiva no s s s s
sujeto + predicado
predicado + sujeto
predicado
estructuras de partida
sujeto
adyacente adjetivo
adyacente adverbio
adyacente coma + construccin comparativa
adyacente construccin comparativa
adyacente grupo adjetivo comparativo
adyacente pronombre de relativo
adyacente proposicin subordinada
- 79 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 80 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 81 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 82 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 83 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 84 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 85 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 86 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 87 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 88 -
Proceso de automatizacin del anlisis sintactico del espaol.
predicado *
- 89 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 90 -
Proceso de automatizacin del anlisis sintactico del espaol.
Captulo 3
- 91 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 92 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 93 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 94 -
Proceso de automatizacin del anlisis sintactico del espaol.
Captulo 3 Apartado 1
Introduccin al proceso de anlisis sintctico
El anlisis sintctico consiste en reconocer la estructura que define las relaciones existentes
entres los elementos de una sentencia; su representacin se hace mediante rboles.
Figura 3.1
rbol de representacin
Sentencia
Sujeto Predicado
El nio es alto
Los pasos que se realizan durante un anlisis sintctico automatizado de una sentencia son los
que se aprecian en el siguiente diagrama.
Figura 3.2
Etapas del anlisis
Generacin de rboles de
Anlisis Desambiguacin Desambiguacin
Sentencia rboles de + estructural
representacin
morfolgico funcional representacin sintctica
- 95 -
Proceso de automatizacin del anlisis sintactico del espaol.
6
[QUE96] Analizador presentado por Jose F. Quesada (CICA) en el Congreso del 96 de la SEPLN.
- 96 -
Proceso de automatizacin del anlisis sintactico del espaol.
Captulo 3 Apartado 2
Las ambigedades funcionales en el proceso de anlisis
2.1.- Introduccin.
Cuando se analiza una sentencia pueden existir formas que desde el punto de
vista morfolgico puedan pertenecer a varias categoras gramaticales; en estos casos se
habla de ambigedad funcional.
Por ejemplo, en la sentencia la casa estaba habitada, la forma la puede
tener varias interpretaciones
Artculo determinado
Sustantivo (nota musical)
Pronombre personal
En este caso, la debe dar lugar a un smbolo presentador pero hay dos smbolos
ms del tipo ncleo nominal, con lo que aparecern tres rboles de representacin, de
- 97 -
Proceso de automatizacin del anlisis sintactico del espaol.
los cuales dos son errneos, adems existirn dos rboles exactamente iguales salvo en
un nodo hoja en los nodos hoja se encuentran las categoras gramaticales. sta es una de
las ambigedades que aparecen con mayor frecuencia en el espaol, debido a la alta
frecuencia de aparicin de los artculos.
Para cada forma de su universo, el procesador morfolgico desarrollado por el
Grupo de Estructuras de Datos y Lingstica Computacional de la Universidad de Las
Palmas de Gran Canaria (http://www.gedlc.ulpgc.es/morfolog/morfolog.htm)
proporciona un conjunto de caracterizaciones gramaticales, lxicas, etctera; en la tabla
1 se asigna un comportamiento funcional a nivel sintctico a cada elemento distintivo de
la respuesta no son suficientemente homogneos debido a la diversidad de las fuentes
que se han utilizado en su construccin, y que han sido respetadas.
Tabla 3.1
Asignacin de comportamientos funcionales.
Comportamiento
Respuesta del procesador morfolgico
funcional
abreviatura, siglas, acrnimo o monograma abreviatura (1)
adjetivo adjetivo
adjetivo comparativo adjetivo
adjetivo correlativo adjetivo
adjetivo demostrativo adjetivo demostrativo
adjetivo indefinido adjetivo
adjetivo indefinido plural adjetivo
adjetivo interrogativo adjetivo
adjetivo latino adjetivo
adjetivo numeral adjetivo
adjetivo plural adjetivo
adjetivo ponderativo adjetivo
adjetivo posesivo adjetivo posesivo
adjetivo pronominal adjetivo
adjetivo relativo adjetivo
adjetivo superlativo adjetivo
adverbio adverbio
adverbio afirmativo adverbio
adverbio comparativo adverbio
adverbio correlativo adverbio
adverbio de cantidad adverbio
adverbio de duda adverbio
adverbio de lugar adverbio
adverbio de modo interrogativo adverbio
adverbio de modo interrogativo y exclamativo adverbio
adverbio de modo relativo comparativo adverbio
adverbio de negacin adverbio
adverbio de orden adverbio
adverbio de tiempo adverbio
adverbio de tiempo interrogativo adverbio
adverbio demostrativo adverbio
adverbio interrogativo adverbio
adverbio interrogativo de lugar adverbio
adverbio latino adverbio
adverbio modo adverbio
adverbio numeral latino adverbio
adverbio relativo de cantidad adverbio
adverbio relativo de lugar adverbio
- 98 -
Proceso de automatizacin del anlisis sintactico del espaol.
Comportamiento
Respuesta del procesador morfolgico
funcional
adverbio relativo de tiempo adverbio
afijo sustantivo
apellido sustantivo
apcope apcope (1)
artculo determinado artculo determinado
artculo indeterminado artculo indeterminado (2)
conjuncin conjuncin
conjuncin adversativa conjuncin
conjuncin causal conjuncin
conjuncin concesiva conjuncin
conjuncin condicional conjuncin
conjuncin copulativa conjuncin coordinante
conjuncin distributiva conjuncin
conjuncin disyuntiva conjuncin coordinante
conjuncin final conjuncin
conjuncin ilativa conjuncin
conjuncin latina conjuncin
conjuncin subordinante temporal conjuncin
contraccin contraccin
contraccin antigua de preposicin y pronombre contraccin
elemento prefijal sustantivo
elemento sufijal sustantivo
exclamacin exclamacin (3)
expresin expresin (1)
expresin latina expresin (1)
nombre propio sustantivo
nombre propio de mujer sustantivo
nombre propio de varn sustantivo
nombre propio femenino sustantivo
nombre propio femenino plural sustantivo
nombre propio masculino sustantivo
nombre propio masculino plural sustantivo
nombre propio toponmico sustantivo
onomatopeya onomatopeya (1)
palabra de otro idioma extranjerismo (1)
palabra de otro idioma usada como adjetivo adjetivo
palabra de otro idioma usada como adverbio adverbio
palabra de otro idioma usada como adverbio de modo adverbio
palabra de otro idioma usada como sustantivo sustantivo
palabra de otro idioma usada como sustantivo de gnero comn sustantivo
palabra de otro idioma usada como sustantivo femenino sustantivo
palabra de otro idioma usada como sustantivo femenino plural sustantivo
palabra de otro idioma usada como sustantivo masculino sustantivo
palabra de otro idioma usada como sustantivo masculino plural sustantivo
preposicin preposicin
preposicin latina preposicin
pronombre otro pronombre
pronombre correlativo otro pronombre
pronombre demostrativo otro pronombre
pronombre demostrativo en funcin adjetiva adjetivo demostrativo
pronombre en funcin adjetiva otro pronombre
pronombre exclamativo otro pronombre
pronombre indefinido otro pronombre
pronombre interrogativo otro pronombre
pronombre latino otro pronombre
pronombre personal pronombre personal
pronombre plural otro pronombre
pronombre posesivo otro pronombre
pronombre relativo pronombre de relativo
smbolo sustantivo
smbolo qumico sustantivo
sustantivo sustantivo
sustantivo de gnero ambiguo sustantivo
sustantivo de gnero ambiguo en plural sustantivo
sustantivo de gnero comn sustantivo
sustantivo de gnero comn en plural sustantivo
sustantivo femenino sustantivo
- 99 -
Proceso de automatizacin del anlisis sintactico del espaol.
Comportamiento
Respuesta del procesador morfolgico
funcional
sustantivo femenino plural sustantivo
sustantivo masculino sustantivo
sustantivo masculino plural sustantivo
verbo verbo
verbo auxiliar verbo
verbo defectivo verbo
verbo impersonal verbo
verbo intransitivo verbo
verbo pronominal verbo
verbo recproco verbo
verbo transitivo verbo
verbo unipersonal verbo
voz mnemotcnica para los modos de silogismo voz mnemotcnica (1)
(1)
Como las denominaciones de abreviatura, apcope, expresin, extranjerismo,
onomatopeya y voz mnemotcnica, que aparecen en la columna de comportamientos
funcionales, no describen realmente un comportamiento, sino que constituyen
caracterizaciones lxicas o lexicolgicas, las voces incluidas en estos grupos debern ser
posteriormente estudiadas para definir su particular comportamiento funcional.
(2)
La lingstica moderna sabe que en espaol hay un solo artculo, el que la tradicin
gramatical llamaba determinado; el artculo llamado indeterminado no es sino un
numeral. A pesar de ello, en este trabajo se prefiere seguir manteniendo la distincin
tradicional por considerar que, para las necesidades del anlisis que se plantea, el
indeterminado puede actuar como presentador adems de como adyacente.
(3)
Las exclamaciones se detectan grficamente por el signo de admiracin con lo que no
conllevan ambigedad.
En consonancia con la categorizacin gramatical del lxico descrita por el
Diccionario de la Real Academia Espaola, los comportamientos funcionales que se han
considerado son: sustantivo, adjetivo, adjetivo demostrativo, adjetivo posesivo,
adverbio, pronombre personal, pronombre de relativo, los otros pronombres, artculo,
preposicin, conjuncin, conjuncin coordinante y contraccin.
Dentro de la etiqueta de sustantivo se engloban aquellas categoras que pueden
funcionar como ncleo de un sintagma nominal homogneo. Bajo la denominacin de
adjetivo se consideran las que pueden complementar a un nombre o ser ncleo de un
sintagma adjetivo; entre los adjetivos se distinguen los posesivos y demostrativos
debido a que pueden considerarse como introductores de ncleos nominales. En los
pronombres se han distinguido los demostrativos con funcin adjetiva debido a que su
comportamiento es ms de adjetivo que de pronombre, los personales, y los de relativo,
- 100 -
Proceso de automatizacin del anlisis sintactico del espaol.
por las funciones especficas que pueden soportar, y el resto se considera bajo la
denominacin de otro pronombre. Las conjunciones coordinantes sern tenidas en
cuenta de manera especial porque se utilizan para enlazar estructuras formales del
mismo nivel sintctico se incluyen todas bajo la denominacin de conjuncin.
Algunas categoras sern desglosadas ms adelante: para los pronombres personales
se distinguir entre tonos y tnicos; entre los adjetivos posesivos se separarn los que
pueden aparecer antepuestos, pospuestos y en ambas posiciones con respecto al ncleo
nominal al que complementan; entre los verbos, se distinguirn las formas personales
del infinitivo, del gerundio y del participio; entre las formas contractas se considerar la
combinacin de una preposicin y un presentador y, a veces, la de tres elementos.
Adems se encuentran identificadas las palabras que son antiguas o estn en
desuso que podrn considerarse o no segn el tipo de texto que se desee estudiar. A fin
de clasificar las palabras que pudieran ser antiguas, se estudia tal informacin en los
diccionarios DRA95, VOX97, MOL96 y CLA97 son los nicos que poseen el dato de
antigua en algunos vocablos. Dado que las fuentes consultadas no son homogneas al
respecto, una misma entrada puede llevar la etiqueta de antigua o desusada por uno o
varios diccionarios, y por el resto no. As, por ejemplo:
Tabla 3.2
Ejemplos de consideracin de palabras anticuadas o desusadas
Entrada Categora Significado DRA95 VOX97 MOL96 CLA97
abiete m. Abeto desusada en uso en uso no aparece
amigabilidad f. Disposicin para contraer en uso desusada en uso en uso
amistad
alpartaz m. Trozo de malla de en uso antigua en uso no aparece
acero...
entrego m. Accin y efecto en uso no aparece antigua no aparece
cegamiento m. Ceguedad antigua actual antigua no aparece
Esto lleva a implementar un criterio que aporte luz a tal clasificacin. Se tratan
como antiguas:
1. Todas las entradas que el DRA97 caracteriza como antiguas o desusadas y que no
aparezcan ni en el VOX97 ni en el CLA97 (Estos dos diccionarios suelen incorporar
neologismos o nuevas acepciones para entradas antiguas; recogen un lxico ms
moderno).
- 101 -
Proceso de automatizacin del anlisis sintactico del espaol.
2. Todas las entradas que el VOX97 caracteriza como antiguas o desusadas que no
aparezcan en el CLA97.
3. Todas las entradas que MOL96 caracteriza como antiguas o desusadas y que no
aparezcan ni en el DRA97 ni en el VOX97 ni en el CLA97.
Otro problema es la consideracin de antigua en una funcin gramatical
especfica de una entrada con varias funciones gramaticales; esto se resuelve
separndolas en dos entradas distintas la antigua y la no antigua, siempre que en las
fuentes, para la funcin gramatical caracterizada como antigua, no exista esa misma
entrada con la misma funcin gramatical caracterizada como no antigua, con
independencia de su significado. Por ejemplo, girante se separa en dos entradas:
adjetivo y masculino antiguo; sin embargo, inga se mantiene como una nica entrada no
antigua: adjetivo usado tambin como sustantivo masculino o femenino.
Tabla 3.3
Ejemplos de consideracin de palabras con funciones antiguas o desusadas
Entrada Categora DRA97 VOX97 MOL96 CLA97
girante adj. m. adj. en uso adj. en uso adj. en uso no aparece
m. antigua m. no aparece m. antigua
inga adj. m. adj. en uso adj. en uso adj. en uso no aparece
m. antiguo m. en uso m. en uso
m. en uso f. en uso
Tabla 3.4
Ambigedades funcionales del espaol.
Grupos de categoras con ambigedad Grupos de categoras con ambigedad
adjetivo, adverbio adverbio, preposicin, conjuncin, adjetivo
adjetivo, adverbio, otro pronombre adverbio, pronombre personal tnico, sustantivo
adjetivo, otro pronombre adverbio, sustantivo
adjetivo, otro pronombre, artculo indeterminado, sustantivo adverbio, sustantivo, adjetivo
adjetivo, otro pronombre, sustantivo adverbio, sustantivo, preposicin
adjetivo, sustantivo conjuncin coordinante, sustantivo
adjetivo, sustantivo, adverbio conjuncin, sustantivo
adjetivo, sustantivo, adverbio, otro pronombre gerundio, adverbio
adjetivo, verbo gerundio, sustantivo, adjetivo
adjetivo, verbo, sustantivo infinitivo, adjetivo
adverbio, adjetivo infinitivo, adjetivo, sustantivo
adverbio, adjetivo, conjuncin infinitivo, adverbio, sustantivo, adjetivo
adverbio, adjetivo, sustantivo infinitivo, sustantivo
adverbio, conjuncin infinitivo, sustantivo, adjetivo
adverbio, conjuncin, adjetivo, sustantivo participio, adjetivo
adverbio, conjuncin, sustantivo participio, adjetivo, adverbio
adverbio, conjuncin, sustantivo, adjetivo participio, adjetivo, sustantivo
- 102 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 103 -
Proceso de automatizacin del anlisis sintactico del espaol.
Sintagma nominal.
Sintagma nominal homogneo.
Sintagma nominal heterogneo.
Sintagma nominal sustitutivo.
Forma verbal.
Sintagma preposicional.
Sintagma adjetivo.
Sintagma adverbial.
Las estructuras formales que se detallan a continuacin son el resultado del
estudio de diferentes gramticas espaolas, completadas con estructuras adicionales
puestas de manifiesto al aplicar el desarrollo alcanzado sobre distintos corpus de
oraciones y textos.
Tabla 3.5
Parejas del sintagma nominal homogneo.
presentador o
seguido de nulo ncleo nominal adyacente
determinante
nulo no s s s
presentador o s no s s
determinante
ncleo nominal s s no s
adyacente s s s s
- 104 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 105 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 106 -
Proceso de automatizacin del anlisis sintactico del espaol.
sustantivo + sustantivo
el rey len, el coche bomba, los nios probeta
2.3.1.10.- adyacentes + nulo
adjetivo + nulo
el coche verde {nulo}
sustantivo + nulo
el rey len {nulo}
2.3.1.11.- adyacentes + presentador o determinante (concuerdan en gnero y
nmero)
adjetivo + adjetivo posesivo
adjetivo + adjetivo posesivo pospuesto
la casa nueva ma
adjetivo + adjetivo posesivo pospuesto o antepuesto
la casa nueva nuestra
adjetivo + adjetivo demostrativo
la casa nueva aquella
2.3.1.12.- adyacentes + ncleo nominal (concuerdan en gnero y nmero)
adjetivo + sustantivo
la nueva casa
2.3.1.13.- adyacente + adyacente
adjetivo + adjetivo (concuerdan en gnero y nmero)
el coche rojo brillante
adjetivo + preposicin
el coche rojo de Juan
- 107 -
Proceso de automatizacin del anlisis sintactico del espaol.
Ncleo nominal S S
Adyacentes S S
- 108 -
Proceso de automatizacin del anlisis sintactico del espaol.
, + adjetivo
el libro, viejas cosas
2.3.2.4.- presentador + conector
adjetivo posesivo + conjuncin coordinante
adjetivo posesivo pospuesto + conjuncin coordinante
el coche mo y el tuyo
adjetivo posesivo antepuesto o pospuesto + conjuncin coordinante
el coche nuestro y el tuyo
adjetivo posesivo + ,
adjetivo posesivo pospuesto + ,
el coche mo, el de ella y el tuyo
adjetivo posesivo antepuesto pospuesto + ,
el coche nuestro, el de ella y el tuyo
2.3.2.5.- ncleo nominal + conector
sustantivo + conjuncin coordinante
Juan y yo
sustantivo + ,
Juan, Pedro y Paco
- 109 -
Proceso de automatizacin del anlisis sintactico del espaol.
nulo + pronombre personal tnico (slo: yo, nosotros, t, vos, vosotros, l, ella,
ellos, ellas)
{nulo} Yo ir pronto
nulo + otro pronombre
{nulo} nadie vendr
2.3.3.2.- presentador + ncleo nominal (concuerda en gnero y nmero)
Cuando un adjetivo funciona como ncleo nominal:
artculo determinado + adjetivo (concuerdan en gnero y nmero)
el inquieto
artculo indeterminado + adjetivo (concuerdan en gnero y nmero)
un inquieto
adjetivo demostrativo + adjetivo (concuerdan en gnero y nmero)
este inquieto
Cuando el infinitivo funciona como ncleo nominal. El presentador siempre en
masculino singular.
artculo determinado + infinitivo
el cantar
artculo indeterminado + infinitivo
un cantar
adjetivo posesivo + infinitivo
adjetivo posesivo antepuesto + infinitivo
mi cantar
adjetivo posesivo antepuesto o pospuesto + infinitivo
nuestro cantar
adjetivo demostrativo + infinitivo
este cantar
El pronombre de relativo tambin puede funcionar como ncleo nominal. Con
los pronombres que y cual funcionan como ncleos del sintagma nominal cuando se
encuentran precedidos de un artculo. Adems quien puede sustituir a el que, la que, los
que y las que.
artculo determinado + pronombre de relativo.
el cual, el que
2.3.3.3.- ncleo nominal + nulo
- 110 -
Proceso de automatizacin del anlisis sintactico del espaol.
pronombre + nulo
pronombre personal tnico (slo: yo, nosotros, t, vos, vosotros, l, ella, ellos, ellas)
+ nulo
Juan y yo {nulo}
otro pronombre + nulo
Nadie {nulo}, el cual {nulo}
adjetivo + nulo
el inquieto {nulo}
infinitivo + nulo
el cantar {nulo}
pronombre de relativo + nulo
el cual {nulo}
2.3.3.4.- ncleo nominal + presentador (concuerda en gnero y nmero)
pronombre de relativo + adjetivo posesivo
pronombre de relativo + adjetivo posesivo pospuesto
el cual tuyo
pronombre de relativo + adjetivo posesivo pospuesto o antepuesto
el cual nuestro
adjetivo + adjetivo posesivo (concuerdan en gnero y nmero)
adjetivo + adjetivo posesivo pospuesto
el inquieto tuyo
adjetivo + adjetivo posesivo pospuesto o antepuesto
el inquieto nuestro
adjetivo + adjetivo demostrativo (concuerda en gnero y nmero)
el inquieto este
infinitivo + adjetivo posesivo (el presentador siempre en masculino singular)
infinitivo + adjetivo posesivo pospuesto
el cantar tuyo
infinitivo + adjetivo posesivo pospuesto o antepuesto
el cantar nuestro
infinitivo + adjetivo demostrativo (el presentador en masculino singular)
el bailar este
2.3.3.5.- ncleo nominal + adyacentes
- 111 -
Proceso de automatizacin del anlisis sintactico del espaol.
2.3.4.-El verbo.
Las estructuras verbales pueden ser divididas en dos grupos; formas verbales
simples y formas verbales complejas.
- 112 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 113 -
Proceso de automatizacin del anlisis sintactico del espaol.
{nulo} lo es
2.3.4.2.2.2.- procltico + forma personal
pronombre personal tono + forma verbal personal
lo es, lo ha comido, lo suele hablar, lo va perdiendo
2.3.4.2.2.3.- forma verbal + nulo
forma verbal personal + nulo
lo es {nulo}
participio + nulo
lo ha comido {nulo}
infinitivo + nulo
lo suele hablar {nulo}
gerundio + nulo
lo va perdiendo {nulo}
2.3.4.2.3.- nulo + auxiliar de incidencia indirecta + conjuncin + infinitivo +nulo
La conjuncin aceptada es que al tratarse de un solo caso se debe tratar como
un caso especial.
2.3.4.2.3.1.- nulo + auxiliar de incidencia indirecta
nulo + forma verbal personal
{nulo} tiene que ir
2.3.4.2.3.2.- auxiliar de incidencia indirecta + conjuncin
forma verbal personal + que
tiene que ir
2.3.4.2.3.3.- conjuncin + infinitivo
que + infinitivo
tiene que ir
2.3.4.2.3.4.- infinitivo + nulo
infinitivo + nulo
tiene que ir {nulo}
- 114 -
Proceso de automatizacin del anlisis sintactico del espaol.
nulo + verbo
{nulo} empieza a tener, {nulo} ha de extenderse, {nulo} tarda en reintegrarse,
{nulo} empieza por cambiar
2.3.4.2.4.2.- auxiliar de incidencia indirecta + preposicin
verbo + preposicin
empieza a tener, ha de extenderse, no tarda en reintegrarse, empieza por
cambiar
2.3.4.2.4.3.- preposicin + infinitivo
preposicin + infinitivo
empieza a tener, ha de extenderse, no tarda en reintegrarse, empieza por
cambiar
2.3.4.2.4.4.- infinitivo + nulo
infinitivo + nulo
empieza a tener {nulo}, ha de extenderse {nulo}, no tarda en reintegrarse
{nulo}, empieza por cambiar {nulo}
2.3.4.2.5.- mltiples ncleos verbales
2.3.4.2.5.1.- verbo + conector
verbo + conjuncin coordinante
Ellos llegarn y comern
verbo + ,
Ellos llegarn, comern y se irn
2.3.4.2.5.2.- conector + verbo
conjuncin coordinante + verbo
Ellos llegarn y comern
, + verbo
Ellos llegarn, comern y se irn
- 115 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 116 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 117 -
Proceso de automatizacin del anlisis sintactico del espaol.
nulo + adverbio
Juan vendr {nulo} maana
2.3.7.1.2.- adverbio + nulo
adverbio + nulo
Juan vendr maana {nulo}
2.3.7.2.- nulo + adverbio + adverbio + nulo
2.3.7.2.1.- adverbio + adverbio
adverbio + adverbio
ms an
2.3.7.3.- nulo + adverbio + sintagma preposicional + nulo
2.3.7.3.1.- adverbio + preposicin
adverbio + preposicin
aqu en Canarias
2.3.7.4.- nulo + adverbio + sintagma nominal + nulo
2.3.7.4.1.- adverbio + presentador
adverbio + artculo determinado
mediante las reglas
adverbio + artculo indeterminado
mediante unas tasas
adverbio + adjetivo posesivo
adverbio + adjetivo posesivo antepuesto
mediante mi coche
adverbio + adjetivo posesivo antepuesto o pospuesto
mediante nuestras manos
adverbio + adjetivo demostrativo
mediante este tractor
2.3.7.4.2.- adverbio + ncleo nominal
adverbio + sustantivo
durante tiempo
2.3.7.4.3.- adverbio + adyacente
adverbio + adjetivo
muy grande
2.3.7.5.- nulo + locucin adverbial + nulo
- 118 -
Proceso de automatizacin del anlisis sintactico del espaol.
nulo + ;
Sal a comer {nulo} ; {nulo} volver tarde
2.3.8.2.- elemento de unin + nulo
conjuncin + nulo
Yo canto {nulo} y {nulo} tu bailas
, + nulo
la casa {nulo} , {nulo} comprada por ellos {nulo} , {nulo} es grande
; + nulo
Sal a comer {nulo} ; {nulo} volver tarde
- 119 -
Proceso de automatizacin del anlisis sintactico del espaol.
Tabla 3.7
Comportamientos funcionales.
adjetivo
adjetivo demostrativo
adjetivo posesivo antepuesto
adjetivo posesivo antepuesto o pospuesto
adjetivo posesivo pospuesto
adverbio
artculo determinado
artculo indeterminado
conjuncin
conjuncin coordinante
contraccin
preposicin
pronombre de relativo
pronombre personal tono
pronombre personal tnico
otro pronombre
sustantivo
forma verbal personal
infinitivo
gerundio
participio
coma
punto y coma
puntuacin
nulo
- 120 -
Proceso de automatizacin del anlisis sintactico del espaol.
el segundo adjetivo es un, una, uno, unas o unos, 6 el adverbio debe tener caratersticas
de cuantificador.
Tabla 3.8
Parejas de comportamientos funcionales
- 121 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 122 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 123 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 124 -
Proceso de automatizacin del anlisis sintactico del espaol.
A partir de estos datos es posible realizar un estudio de todas las combinaciones que
pudieran aparecer en cualquier texto del espaol que contengan ambigedades. Las
combinaciones se toman en elementos de tres.
Cj = tal que , SA y A
Teniendo en cuenta que existen 112 grupos posibles de ambigedades y 21
categoras, se obtienen un nmero de combinaciones posibles 133*133*112 = 1981168
de tres elementos; cada una de ellas dar lugar a un conjunto de ternas de funciones
posibles, el proceso de desambiguacin consistir en eliminar las ternas que no se
puedan dar.
Se siguen los siguientes pasos:
1. Se realiza el anlisis morfolgico de la sentencia y se obtiene el conjunto de
combinaciones posibles de funciones.
Ejemplo: El partido result una broma da lugar al siguiente anlisis de
posibles funciones:
- 125 -
Proceso de automatizacin del anlisis sintactico del espaol.
2. Se examina cada una de las secuencias de tres en tres elementos para ver si se
rechaza o no el central. Dada la secuencia de funciones + + , entonces se
acepta si y slo si se da alguna de las siguientes condiciones:
{ + } y { + } pertenecen a P
{nulo + } y { + } pertenecen a P
{ + } y { + nulo} pertenecen a P
{ nulo + } y { + nulo} pertenecen a P
- 126 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 127 -
Proceso de automatizacin del anlisis sintactico del espaol.
4. Anlisis de casos especiales. Se da la aparicin de dos categoras de tipo forma verbal personal
entre las cuales no aparece un nexo de unin vlido. Tras la aplicacin de la eliminacin de las
secuencias correspondientes el resultado ser:
nulo + artculo determinado + sustantivo + forma verbal personal + adjetivo + sustantivo + nulo
nulo + artculo determinado + sustantivo + forma verbal personal + artculo indeterminado + sustantivo + nulo
k
n
R ( n, k ) =
i =1 2i
Donde k es el nmero de veces que se aplica una regla de este tipo para una
misma palabra es posible aplicar varias de estas reglas cuando el analizador morfolgico
- 128 -
Proceso de automatizacin del anlisis sintactico del espaol.
3
8 8 8 8 8 8 8
R (8,3) = = + + = + + =7
i =1 2
i
21 22 23 2 4 8
100 R(n, k ) k
1 1
Porcentaje = = 100 = 100 1
n i =1 2k 2k
1 7
Porcentaje = 100 1 = 100 = 87,5%
23 8
2.6.- Estadsticas.
Se presentan dos estudios estadsticos. El primero hace referencia al anlisis realizado sobre
todas las combinaciones tericamente posibles de ambigedades cuando se toman elementos de tres en
tres. El segundo expone los resultados obtenidos del anlisis de un texto.
Se utiliza como medida de bondad de la desambiguacin:
B = (p*100)/(n-1)
Donde
p = nmero total de combinaciones nmero de combinaciones aceptadas
n = nmero de combinaciones posibles.
2.6.1.1.- Caso 1. Cuando cualquier palabra con ambigedad tiene a ambos lados palabras ambiguas.
Figura 3.3
Estudio sobre ternas tericas: a) con ambigedad por ambos lados
- 129 -
Proceso de automatizacin del anlisis sintactico del espaol.
Parejas
45
Parejas + vedadas
35
30
25
20
15
10
5
0
0 20 40 60 80 100 120
Combinaciones
2.6.1.2.- Caso 2. Cuando cualquier palabra con ambigedad tiene a la derecha cualquier
palabra ambigua y a la izquierda otra que no lo sea.
Figura 3.4
Estudio sobre ternas tericas: b) con ambigedad slo por la derecha
45 Parejas
Parejas + vedadas
40 Parejas + vedadas + flexin
Bondad de la desambigacin
35
30
25
20
15
10
0
0 5 10 15 20 25
Combinaciones
- 130 -
Proceso de automatizacin del anlisis sintactico del espaol.
Figura 3.5
Estudio sobre ternas tericas: c) con ambigedad slo por la izquierda
45 Parejas
Parejas + vedadas
40 Parejas + vedadas+ flexin
Bondad de la desambigacin
35
30
25
20
15
10
0
0 5 10 15 20 25
Combinaciones
adjetivo ap ap al ap ap al al al al ap ap ap al al al al ap al ap al al ap al al ap
adjetivo demostrativo ap al al al ri al al al al al al al al al al al ap al ap al al al al al ap
adjetivo posesivo antepuesto ap ri ri ri ri ap ri ri ri ri ri ri ri ri ri ri ap ri ap ri ri ri ri ri ri
adjetivo posesivo antepuesto o pospuesto ap al rv rv ri al al al ap ap al rv al al al al ap al ap al al ap al al ap
adjetivo posesivo pospuesto al al al al ri al al al al ap al al al al al al al al al al al ap al al ap
adverbio ap ap ap ap ri ap ap ap al ap ap ap al al al al ap al al al al al al al ap
artculo determinado ap ri ri ri ri ap ri ri ri ri ri ap ap ri ri ri ap ri ap ri ri ri ri ri ri
artculo indeterminado ap ri ri ri ri ri ri ri ri ri ri ri ap ri ri ri ap ri ap ri ri ri ri ri ri
conjuncin al al al al ri al al al al al al al al al al al al al al al al al al al ap
conjuncin coordinante ap ap ap ap ri al ap ap al al al al ap al al al ap ap ap ap al al al al rv
contraccin ap ap ri ri ri ri ri ri ri ri ri ri ap ri ri ri ap ri ap ri ri ri ri ri ri
preposicin ap ap ap ap ri ap ap ap ri ri ri ap ap rv ap ap ap ap ap ri ri ri ri ap ri
pronombre de relativo al al al ap ap al al al al al al al al al al al al al al al al al al al ap
pronombre personal tono rv rv rv rv ri rv rv rv rv al rv rv al ap rv rv rv ap al al al al al al ap
pronombre personal tnico al al al al ri al al al al ap ap ap al al al al al al al al al ap al al ap
otro pronombre al al al al ri al al al al ap ap al al al al al al al al al al al al al ap
sustantivo ap ap al ap ap al al al al ap ap ap al al al al ap al al al al ap al al ap
forma verbal personal al al al al ri al al al al ap al ap al al al al al rv ap ap ap ap al al ap
infinitivo ap ap al ap ap ap al al al al ap ap al al al al al al al ap ap al al al ap
gerundio al al al al ri al al al al al al al al al al al al al al al al al al al ap
participio al al al al ri al al al al al al al al al al al al al al al al al al al ap
coma ap ap ap ap ri al ap ap al al al al al al ap al ap ap ap ap ap al al al ap
punto y coma al al al al ri al al al al al al al al al al al al al al al al al al al ap
puntuacin al al al al ri al al al al al al al al al al al al al al al al al al al ap
nulo ap ap ap ap ri ap ap ap ap ap ap ap ap ap ap ap ap ap ap ap ap ap ap ap ri
- 131 -
Proceso de automatizacin del anlisis sintactico del espaol.
conjuncin coordinante
otro pronombre
coma
punto y coma
forma verbal personal
adjetivo
adjetivo demostrativo
adjetivo posesivo antepuesto
adjetivo posesivo antepuesto o pospuesto
adjetivo posesivo pospuesto
adverbio
artculo determinado
artculo indeterminado
conjuncin
contraccin
preposicin
pronombre de relativo
pronombre personal tono
pronombre personal tnico
sustantivo
infinitivo
gerundio
participio
puntuacin
nulo
Categora por el lado derecho
Donde:
ap = se acepta porque constituye pareja por regla sintctica
ri = se rechaza por imposibilidad de formar pareja
rv = se rechaza por ser pareja vedada
al = se acepta porque forma pareja en los lmites de estructuras
Parejas
45 Parejas + vedadas
40 Parejas + vedadas + flexin
Bondad de la desambigacin
35
30
25
20
15
10
0
2 3 4 5
Combinaciones
- 132 -
Proceso de automatizacin del anlisis sintactico del espaol.
200
180
Nmero de sentencias
160
140
120
100
80
60
40
20
0
2 40 192 768 2592 10240 29160 92160 2E+05 1E+06 2E+08
Nmero de combinaciones
Las combinaciones de elementos tomados de tres en tres en el texto real seleccionado son las que
se presentan a continuacin:
Figura 3.8
Distribucin de los tipos de ternas en el texto
Con ambigedad
por ambos lados
Con ambigedad 12%
slo por la
derecha
12%
- 133 -
Proceso de automatizacin del anlisis sintactico del espaol.
Figura 3.9
Distribucin de las combinaciones
Sin eliminar
Eliminadas por 14%
casos Eliminadas por
especiales parejas
11% 15%
2.7.- Conclusiones.
Considerando la desambiguacin como el proceso por el cual se rechazan
funciones no vlidas para las palabras que forman parte de una sentencia, es posible
eliminar, de promedio, cerca del 80%: permite reducir el nmero de combinaciones que
deben estudiarse en los tratamientos de textos que necesitan conocer la funcin
gramatical de las palabras.
Se obtiene como conclusin que no es posible una desambiguacin completa sin
introducir nuevos mecanismos de nivel superior; as, por ejemplo, para reconocer un
adjetivo que acta aisladamente como un sintagma adjetivo, es necesario conocer si el
verbo de la oracin es copulativo. Por otro lado, la desambiguacin y el anlisis
sintctico deben complementarse entre s para la obtencin de resultados con menor
grado de ambigedad desde la perspectiva de la consideracin de la sentencia entera.
Esta desambigacin acelera el proceso de anlisis sintctico al podar
estructuras incorrectas.
- 134 -
Proceso de automatizacin del anlisis sintactico del espaol.
Captulo 3 Apartado 4
Las ambigedades estructurales de la gramtica
4.1.- Introduccin.
En el anlisis sobre textos escritos, al aplicar la gramtica definida en el captulo
2 a una combinacin de comportamientos funcionales de las palabras de una sentencia
es posible que se genere ms de un rbol de anlisis. A esta aparicin de mltiples
resultados se denomina ambigedad estructural. La existencia de ms de una regla con
el mismo smbolo o combinacin de smbolos en su parte derecha es lo que se denomina
ambigedad estructural directa. La siguiente lista presenta las reglas que dan lugar a
ambigedades estructurales directas, por coincidir sus partes derechas.
Grupo 1:
adyacente
ncleo nominal
ncleo verbal adjetivo
ncleo verbal pasivo
sintagma adjetivo
Grupo 2:
adyacente
conector subordinante adverbio
sintagma adverbial
Grupo 3:
adyacentes
conector
conector subordinante adverbio + adjetivo
sintagma adjetivo
sintagma adverbial
- 135 -
Proceso de automatizacin del anlisis sintactico del espaol.
Grupo 4:
conector subordinante
adverbio + adverbio
sintagma adverbial
Grupo 5:
construccin comparativa adverbio+ sintagma nominal
sintagma adverbial heterogneo
Grupo 6:
construccin comparativa
adverbio + sintagma nominal
grupo nominal
homogneo
sintagma adverbial
Grupo 7:
sintagma nominal homogneo
adyacente + ncleo nominal
sintagma nominal sustitutivo
Grupo 8:
adyacente + ncleo nominal +
sintagma nominal homogneo
adyacente + complemento
sintagma nominal sustitutivo
preposicional del nombre
Grupo 9:
sintagma nominal homogneo adyacente + presentador + ncleo
sintagma nominal sustitutivo nominal
Grupo 10:
conector
conjuncin
conector subordinante
Grupo 11:
conector
conjuncin + conjuncin
conector subordinante
Grupo 12:
ncleo verbal
ncleo verbal copulativo forma verbal compleja
ncleo verbal pasivo
Grupo 13:
ncleo verbal
forma verbal simple
ncleo verbal copulativo
Grupo 14:
circunstancial
ncleo verbal gerundio
ncleo verbal copulativo
- 136 -
Proceso de automatizacin del anlisis sintactico del espaol.
Grupo 15:
ncleo nominal
ncleo verbal infinitivo
ncleo verbal copulativo
Grupo 16:
ncleo nominal
infinitivo con pronombre encltico
ncleo verbal
Grupo 17:
sintagma nominal homogneo
ncleo nominal
sintagma nominal sustitutivo
Grupo 18:
sintagma nominal homogneo
ncleo nominal + adyacente
sintagma nominal sustitutivo
Grupo 19:
sintagma nominal homogneo
ncleo nominal + adyacentes
sintagma nominal sustitutivo
Grupo 20:
proposicin
proposicin de infinitivo oracin atributiva
proposicin subordinada
Grupo 21:
proposicin
proposicin de infinitivo oracin de suplemento
proposicin subordinada
Grupo 22:
proposicin
proposicin de infinitivo oracin intransitiva
proposicin subordinada
Grupo 23:
proposicin
proposicin de infinitivo oracin transitiva
proposicin subordinada
Grupo 24:
ncleo verbal
participio
ncleo verbal pasivo
Grupo 25:
oracin atributiva
predicado
oracin de suplemento
- 137 -
Proceso de automatizacin del anlisis sintactico del espaol.
oracin intransitiva
oracin pasiva
oracin transitiva
Grupo 26:
oracin atributiva
oracin de suplemento
predicado + coma + sujeto +
oracin intransitiva
predicado
oracin pasiva
oracin transitiva
Grupo 27:
oracin atributiva
oracin de suplemento
oracin intransitiva predicado + puntuacin
oracin pasiva
oracin transitiva
Grupo 28:
oracin atributiva
oracin de suplemento
oracin intransitiva predicado + sujeto
oracin pasiva
oracin transitiva
Grupo 29:
oracin atributiva
oracin de suplemento
oracin intransitiva predicado + sujeto + predicado
oracin pasiva
oracin transitiva
Grupo 30:
oracin atributiva
oracin de suplemento
predicado + sujeto + predicado +
oracin intransitiva
puntuacin
oracin pasiva
oracin transitiva
Grupo 31:
oracin atributiva
oracin de suplemento
oracin intransitiva predicado + sujeto + puntuacin
oracin pasiva
oracin transitiva
Grupo 32:
conector subordinante preposicin
- 138 -
Proceso de automatizacin del anlisis sintactico del espaol.
preposicin subordinante
Grupo 33:
conector subordinante
preposicin + adverbio
locucin adverbial
Grupo 34:
conector
preposicin + sustantivo
conector subordinante
Grupo 35:
sintagma nominal homogneo presentador + adyacente + ncleo
sintagma nominal sustitutivo nominal
Grupo 36:
sintagma nominal homogneo
presentador + ncleo nominal
sintagma nominal sustitutivo
Grupo 37:
sintagma nominal homogneo presentador + ncleo nominal +
sintagma nominal sustitutivo adyacente
Grupo 38:
presentador + ncleo nominal +
sintagma nominal homogneo
adyacente + complemento
sintagma nominal sustitutivo
preposicional del nombre
Grupo 39:
sintagma nominal homogneo presentador + ncleo nominal +
sintagma nominal sustitutivo adyacentes
Grupo 40:
presentador + ncleo nominal +
sintagma nominal homogneo
complemento preposicional del
sintagma nominal sustitutivo
nombre
Grupo 41:
morfema de impersonal
morfema de pasiva
pronombre personal tono
morfema de voz media
ncleo nominal
Grupo 42:
adyacente
conector subordinante pronombre de relativo
ncleo nominal
Grupo 43:
ncleo nominal otro pronombre
- 139 -
Proceso de automatizacin del anlisis sintactico del espaol.
presentador
Grupo 44:
circunstancial
complemento preposicional del
nombre
proposicin
objeto directo
sujeto
vocativo
Grupo 45:
objeto directo
proposicin de infinitivo
sujeto
Grupo 46:
adyacente
aposicin
atributo
circunstancial
complemento preposicional del proposicin subordinada
nombre
objeto directo
subordinada comparativa
sujeto
Grupo 47:
oracin exclamativa puntuacin + oracin atributiva +
oracin interrogativa puntuacin
Grupo 48:
oracin exclamativa puntuacin + oracin de suplemento
oracin interrogativa + puntuacin
Grupo 49:
oracin exclamativa puntuacin + oracin intransitiva
oracin interrogativa +puntuacin
Grupo 50:
oracin exclamativa puntuacin + oracin pasiva +
oracin interrogativa puntuacin
Grupo 51:
oracin exclamativa puntuacin + oracin transitiva +
oracin interrogativa puntuacin
Grupo 52:
oracin exclamativa
puntuacin + sentencia + puntuacin
oracin interrogativa
- 140 -
Proceso de automatizacin del anlisis sintactico del espaol.
Grupo 53:
adyacente
atributo
sintagma adjetivo
predicativo objetivo
predicativo subjetivo
Grupo 54:
atributo
objeto directo sintagma nominal heterogneo
sujeto
Grupo 55:
atributo
circunstancial
objeto directo sintagma nominal homogneo
sujeto
vocativo
Grupo 56:
atributo
circunstancial
objeto directo sintagma nominal sustitutivo
objeto indirecto
sujeto
Grupo 57:
atributo
circunstancial
complemento adjetivo
complemento agente
complemento preposicional del sintagma preposicional
nombre
objeto directo
objeto indirecto
suplemento
Grupo 58:
oracin atributiva
oracin de suplemento
oracin intransitiva sujeto + coma + predicado
oracin pasiva
oracin transitiva
Grupo 59:
oracin atributiva
oracin de suplemento sujeto + predicado
oracin intransitiva
- 141 -
Proceso de automatizacin del anlisis sintactico del espaol.
oracin pasiva
oracin transitiva
Grupo 60:
oracin atributiva
oracin de suplemento
oracin intransitiva sujeto + predicado + puntuacin
oracin pasiva
oracin transitiva
Grupo 61:
aposicin
sustantivo
ncleo nominal
Grupo 62:
auxiliar
auxiliar pasivo verbo
forma verbal simple
Con estas reglas se crea una tabla de conflictos primarios que indica qu parejas
de smbolos no terminales podran dar lugar a rboles de anlisis errneos.
- 142 -
Proceso de automatizacin del anlisis sintactico del espaol.
Tabla 3.18
Conflictos primarios
adyacente s s s s s s s s s s s s s s s
adyacentes s s s s
aposicin s s s s s s s s s
atributo s s s s s s s s s s s s s s
auxiliar s s
auxiliar pasivo s s
circunstancial s s s s s s s s s s s s s s
complemento adjetivo s s s s s s s
complemento agente s s s s s s s
complemento preposicional del nombre s s s s s s s s s s s s
conector s s s s
conector subordinante s s s s s s s s
construccin comparativa s s
forma verbal simple s s
grupo nominal s s
locucin adverbial s
morfema de pasiva s s s
morfema de voz media s s s
morfema de impersonal s s s
ncleo nominal s s s s s s s s s s s
ncleo verbal s s s s s s
ncleo verbal copulativo s s s s
ncleo verbal pasivo s s s s s
objeto directo s s s s s s s s s s s s
objeto indirecto s s s s s s s s
oracin atributiva s s s s
oracin de suplemento s s s s
oracin exclamativa s
oracin interrogativa s
oracin intransitiva s s s s
oracin pasiva s s s s
oracin transitiva s s s s
predicativo objetivo s s s
predicativo subjetivo s s s
preposicin subordinante s
presentador s
proposicin s s
proposicin de infinitivo s s
proposicin subordinada s s
sintagma adjetivo s s s s s s s s
sintagma adverbial s s s s s s s
sintagma nominal homogneo s
sintagma nominal sustitutivo s
subordinada comparativa s s s s s s s
sujeto s s s s s s s s s
suplemento s s s s s s s
vocativo s s s s s s
complemento preposicional del nombre
subordinada comparativa
preposicin subordinante
proposicin subordinada
ncleo verbal copulativo
proposicin de infinitivo
morfema de impersonal
oracin de suplemento
morfema de voz media
conector subordinante
complemento adjetivo
oracin interrogativa
predicativo subjetivo
ncleo verbal pasivo
complemento agente
oracin exclamativa
forma verbal simple
predicativo objetivo
oracin intransitiva
sintagma adverbial
morfema de pasiva
locucin adverbial
oracin atributiva
oracin transitiva
sintagma adjetivo
objeto indirecto
ncleo nominal
auxiliar pasivo
oracin pasiva
grupo nominal
circunstancial
objeto directo
ncleo verbal
presentador
proposicin
suplemento
adyacentes
adyacente
aposicin
conector
vocativo
atributo
auxiliar
sujeto
- 143 -
Proceso de automatizacin del anlisis sintactico del espaol.
=sintagma preposicional
Tabla 3.19
- 144 -
Proceso de automatizacin del anlisis sintactico del espaol.
contra
segn
desde
hacia
sobre
hasta
entre
para
bajo
ante
tras
con
por
sin
en
de
a
atributo s s s
circunstancial de afirmacin
circunstancial de argumento s
circunstancial de cantidad s s s
circunstancial de causa s
circunstancial de compaa s
circunstancial de distancia s
circunstancial de duda s
circunstancial de estima s s
circunstancial de fin s
circunstancial de lugar s s s s s s s
circunstancial de medio o instrumento s
circunstancial de modo s s
circunstancial de oposicin s
circunstancial de tiempo s s s s s s
complemento adjetivo s s
complemento agente s s
complemento preposicional del nombre s S s s
objeto directo s
objeto indirecto s s
sintagma adverbial s s
suplemento s s s s
Conflicto: S No No S No S S S No S No No S S No S No
Complemento
"de Juan" =sintagma preposicional Genera = preposicional del
nombre
preposicin "de"
Aceptado como
(Complemento preposicional del Pertenece a complemento
Si
nombre) = {"de"} ( ) ? preposicional del
nombre
Figura 3.25
Aplicacin de la regla palabras necesarias para el smbolo objeto directo
- 145 -
Proceso de automatizacin del anlisis sintactico del espaol.
= sintagma
"de Juan" Genera = objeto directo
preposicional
preposicin "de"
Estructura Contracciones
circunstancial de argumento del
circunstancial de cantidad del
circunstancial de distancia al
circunstancial de lugar al
circunstancial de precio o estima del
complemento agente del
complemento preposicional del nombre del
objeto directo al
objeto indirecto al
suplemento del
Consideraciones adicionales:
Existe un conjunto de palabras que normalmente no son reconocidas como
preposiciones, pero que tienen comportamientos funcionales similares y que se
denominan preposiciones imperfectas. stas son: aparte, aun, como, conforme, cuando,
- 146 -
Proceso de automatizacin del anlisis sintactico del espaol.
durante, donde, mediante, mientras, no obstante, excepto, salvo, ms, menos e incluso.
Deben tratarse como preposiciones o no, segn corresponda.
Tabla 3.21
Las preposiciones imperfectas en la resolucin de conflictos
no obstante
conforme
mediante
mienras
durante
excepto
cuando
menos
aparte
donde
como
salvo
pero
ms
aun
locucin adverbial si
circunstancial de afirmacin s
circunstancial de argumento
circunstancial de cantidad si s s s s
circunstancial de causa
circunstancial de compaa
circunstancial de distancia si s
circunstancial de duda
circunstancial de estima
circunstancial de fin
circunstancial de lugar s
circunstancial de medio o instrumento si s
circunstancial de modo s s
circunstancial de oposicin
circunstancial de tiempo si s s s
complemento agente
complemento preposicional del nombre
objeto directo
objeto indirecto
suplemento
Tabla 3.22
Los pronombres personales tonos en la resolucin de conflictos
Estructura Pronombres
objeto directo la, las, lo, los, me, nos, os, se, te
objeto indirecto la, las, le, les, lo, los, me, nos, os, se, te
atributo lo
morfema de pasiva se
morfema de impersonal se
morfema de voz media me, se
- 147 -
Proceso de automatizacin del anlisis sintactico del espaol.
conector subordinante adverbio apenas, como, conforme, cuanto, donde, mientras, siempre, tal, tan
conector subordinante conjuncin aunque, con que, cuando, cuantos, cuantas, para, porque, que, si
construccin comparativa adverbio as, como
grupo adjetivo adverbio como
grupo adjetivo comparativo adverbio ms, menos
grupo adjetivo comparativo otro pronombre conmigo, contigo, consigo
grupo nominal adverbio todo
objeto directo pronombre de relativo que, qu
sintagma adverbial adjetivo un
subordinada comparativa conjuncin que
objeto directo puntuacin dos puntos
presentador otro pronombre que, qu
Relacin de casos:
Tabla 3.24
Smbolos no permitidos
()
objeto directo sintagma nominal sustitutivo infinitivo
objeto directo sintagma nominal sustitutivo otro pronombre
objeto directo sintagma nominal sustitutivo pronombre personal tono
objeto indirecto sintagma nominal sustitutivo infinitivo
objeto indirecto sintagma nominal sustitutivo otro pronombre
objeto indirecto sintagma nominal sustitutivo pronombre de relativo
- 148 -
Proceso de automatizacin del anlisis sintactico del espaol.
Relacin de casos
El predicativo obligatorio debe encontrarse acompaado de un ncleo verbal
copulativo.
El objeto directo, el indirecto y otras estructuras que complementan al verbo
deben aparecer con un ncleo verbal.
As, puede definirse el siguiente grupo de relaciones entre estructuras:
Tabla 3.25
Smbolos necesarios
- 149 -
Proceso de automatizacin del anlisis sintactico del espaol.
Relacin de casos
Tabla 3.26
Smbolos necesarios con condicin
Smbolo Smbolos Condicin
objeto directo gerundio el gerundio debe ser transitivo
objeto directo infinitivo el infinitivo debe ser transitivo
objeto directo infinitivo con pronombre encltico el infinitivo con pronombre encltico debe ser transitivo
objeto directo participio el participio debe ser transitivo
objeto directo verbo el verbo debe ser transitivo
objeto directo verbo con pronombre encltico el verbo con pronombre encltico debe ser transitivo
Como ambas reglas se aplican en una misma situacin dan lugar a rboles
errneos. Sin embargo, es posible rechazar el smbolo oracin transitiva si no se
encuentra entre sus nodos inferiores un smbolo objeto directo; no obstante, rechazar o
aceptar el smbolo oracin intransitiva es un caso diferente, pues se basa en la no
existencia de un smbolo y no en su existencia.
Es por ello que se define el concepto de smbolos incompatibles. De modo que
dados dos smbolos incompatibles en un rbol de anlisis, ste ser rechazado.
- 150 -
Proceso de automatizacin del anlisis sintactico del espaol.
! "
Relacin de casos
Tabla 3.27
Smbolos incompatibles
- 151 -
Proceso de automatizacin del anlisis sintactico del espaol.
suplemento atributo
suplemento complemento agente
suplemento oracin intransitiva
suplemento suplemento
Regla : Concordancias.
"
#
Relacin de casos
Existe un conjunto de concordancias resueltas durante el proceso de
desambiguacin funcional captulo 2. Se caracterizan por atender a parejas ordenadas
de smbolos adyacentes. Las concordancias deben ser de nuevo verificadas durante el
proceso de creacin de los sintagmas, ya que pueden aceptarse parejas ante la
posibilidad de que la unin constituya los lmites entre estructuras de carcter local,
aunque no deben aceptarse como parte de un mismo sintagma.
Tabla 3.28
Concordancias analizadas durante la desambiguacin funcional
adjetivo + adjetivo concordancia en gnero y nmero
adjetivo + adjetivo demostrativo concordancia en gnero y nmero
adjetivo + adjetivo posesivo antepuesto o pospuesto concordancia en gnero y nmero
adjetivo + adjetivo posesivo pospuesto concordancia en gnero y nmero
adjetivo + infinitivo el adjetivo debe encontrarse en masculino singular
adjetivo + sustantivo concordancia en gnero y nmero
adjetivo demostrativo + adjetivo concordancia en gnero y nmero
adjetivo demostrativo + infinitivo el adjetivo debe encontrarse en masculino singular
adjetivo demostrativo + sustantivo concordancia en gnero y nmero
adjetivo posesivo antepuesto + adjetivo concordancia en gnero y nmero
adjetivo posesivo antepuesto + infinitivo el adjetivo debe encontrarse en masculino singular
adjetivo posesivo antepuesto + sustantivo concordancia en gnero y nmero
adjetivo posesivo antepuesto o pospuesto + adjetivo concordancia en gnero y nmero
adjetivo posesivo antepuesto o pospuesto + infinitivo el adjetivo debe encontrarse en masculino singular
adjetivo posesivo antepuesto o pospuesto + sustantivo concordancia en gnero y nmero
artculo determinado + adjetivo concordancia en gnero y nmero
artculo determinado + infinitivo el artculo debe encontrarse en masculino singular
artculo determinado + pronombre de relativo concordancia en gnero y nmero
artculo determinado + sustantivo concordancia en gnero y nmero
- 152 -
Proceso de automatizacin del anlisis sintactico del espaol.
Concordancia entre sujeto y ncleo verbal: En las oraciones con verbo en forma
personal debe concordar en nmero y persona con el ncleo de la estructura del sujeto.
(sujeto, ncleo verbal) = {nmero, persona}
(sujeto, ncleo verbal pasivo) = {nmero, persona}
(sujeto, ncleo verbal copulativo) = {nmero, persona}
Adems de la concordancia entre sujeto y predicado se deben cumplir las concordancias entre los
siguientes descendientes del predicado siempre en gnero y nmero:
Consideraciones adicionales
Desde el punto de vista de la implantacin de las reglas de concordancia, se
hacen las siguientes consideraciones respecto a las flexiones de algunas palabras:
Los adverbios ms, menos y no se considera que actan con las flexiones masculino,
femenino, singular y plural.
A los artculos determinados lo y los se les aplica la flexin masculino.
A los sustantivos se les aplica la flexin tercera persona. Se considera la flexin
plural para los sustantivos gente, todo, infinidad, resto, millar, caterva, montn,
tipo, multitud y vida. Si el sustantivo no tiene asociadas las flexiones de gnero o
- 153 -
Proceso de automatizacin del anlisis sintactico del espaol.
nmero se le asignan todas las posibles. Cuando los numerales representan las horas
del da, se les debe asignar la flexin plural y el gnero femenino.
A todo adjetivo se le imputa la flexin tercera persona. A los adjetivos numerales a
partir del dos se les dota de la flexin plural. A mal se le asigna masculino y
singular; a cada masculino, femenino y singular.
Para los pronombres de relativo qu y que se mantienen las flexiones masculino,
femenino, singular, plural y tercera persona.
Para los pronombres personales yo, nosotros, nosotras la flexin debe ser primera
persona; para t, vosotros, vosotras, usted, ustedes segunda persona; para l, usted,
ustedes, ella, ellos, ellas tercera persona; para me masculino, femenino y primera
persona; para te masculino, femenino, y segunda persona; para se masculino,
femenino y tercera persona; para la, lo y le tercera persona.
A las palabras que entran en el grupo otro pronombre se les asigna la flexin tercera
persona; a eso masculino; plural a aquello; femenino a esa y aquella; a nadie, a
algo, a todo y a toda singular; plural a todos y todas.
Para los infinitivos se toma la flexin singular y tercera persona.
Si tienen como flexin primera persona, a las palabras con categora funcional verbo
y verbo con pronombre encltico se les asigna tambin tercera persona.
- 154 -
Proceso de automatizacin del anlisis sintactico del espaol.
Figura 3.27
Circunstancial de tiempo rechazado
a + el ncleo nominal
presentador ncleo nominal ncleo verbal ncleo nominal
sintagma
sintagma nominal homogneo nominal preposicin presentador
homogneo
sintagma preposicional
circunstancial de tiempo
sujeto predicado
oracin transitiva
Tabla 3.29
Anlisis ideolgico de campesino
Modos de vida
Grupos sociales Hbitat Actividades
Nacionalidad Campo Agricultor
- 155 -
Proceso de automatizacin del anlisis sintactico del espaol.
circunstancial de tiempo Relaciones generales Cantidad Segundo
circunstancial de tiempo Relaciones Generales Tiempo - Tiempo
circunstancial de tiempo Relaciones Generales Tiempo - Periodo
Ejemplos:
Siempre algn forastero se presentaba en las augustas salas
Tabla 3.32
Anlisis ideolgico de siempre
Relaciones generales El individuo Modos de vida
Tiempo Conocimiento Comunicacin
Frecuencia Certeza Preposicin
Tabla 3.33
Anlisis ideolgico de da
Relaciones generales El individuo Naturaleza
Tiempo Creencia Conducta Atmsfera
Edad Ritual Tradicin Clima
Tabla 3.34
Anlisis ideolgico de verano
Relaciones generales
Cantidad
Segundo
Sera conveniente crear una nueva disposicin ideolgica que contuviera las
palabras necesarias para la eliminacin de este tipo de ambigedades; los grupos seran
uno por cada complemento circunstancial y no varios como ocurre si se utiliza un
diccionario ideolgico clsico. Con ello se lograra una mejora en la eficiencia de la
automatizacin del proceso de anlisis sintctico.
Consideraciones
Para la sentencia Hablaron los representantes de los municipios, es posible que
los representantes de los municipios sea reconocido como complemento
circunstancial de lugar.
- 156 -
Proceso de automatizacin del anlisis sintactico del espaol.
Figura 3.28
Aceptacin incorrecta del circunstancial
preposicin
sintagma nominal homogneo Nivel 4
subordinante
forma verbal
sintagma nominal heterogneo Nivel 7
simple
predicado Nivel 9
en el granero Nivel 1
preposicin
sintagma nominal homogneo Nivel 4
subordinante
- 157 -
Proceso de automatizacin del anlisis sintactico del espaol.
forma verbal
presentador ncleo nominal presentador ncleo nominal
simple
predicado
oracin transitiva
- 158 -
Proceso de automatizacin del anlisis sintactico del espaol.
Figura 3.31
Reconocimiento incorrecto de sujeto
forma verbal
presentador ncleo nominal presentador ncleo nominal
simple
... sujeto
predicado
oracin transitiva
4.2.7.1.- Proposiciones.
La proposicin y la proposicin subordinada se diferencian en cmo se unen al
resto de la oracin la proposicin requiere un conector que acta como coordinante y
la proposicin subordinada de un conector subordinante.
La proposicin de infinitivo debe tener como ncleo verbal un infinitivo.
- 159 -
Proceso de automatizacin del anlisis sintactico del espaol.
objeto directo + objeto directo (formado por un sintagma nominal sustitutivo) + verbo
- 160 -
Proceso de automatizacin del anlisis sintactico del espaol.
Figura 3.32
Presentador antepuesto
adjetivo adjetivo
sustantivo sustantivo
posesivo posesivo
% & '
- 161 -
Proceso de automatizacin del anlisis sintactico del espaol.
Figura 3.33
Rechazo del sintagma adjetivo
el rojo coche
artculo adjetivo
sintagma
presentador
adjetivo
- 162 -
Proceso de automatizacin del anlisis sintactico del espaol.
Relacin de casos
Los smbolos adjetivo demostrativo, artculo determinado y otro pronombre
slo aparecen antepuestos al ncleo nominal. Los adjetivos posesivos pueden dividirse
en: aquellos que slo pueden preceder al ncleo nominal mi, mis, tu, tus, su, sus,
aquellos que slo pueden ir pospuestos mo, ma, mos, mas, tuyo, tuya, tuyos, tuyas,
suyo, suya, suyos, suyas y los que pueden figurar tanto antepuestos como pospuestos
nuestro, nuestra, nuestros, nuestras, vuestro, vuestra, vuestros, vuestras.
4.2.7.5.- Conectores.
Existe un conjunto de combinaciones de palabras que dan lugar a conjunciones
conjuntivas, se consideran las siguientes: a consecuencia, a distincin de, a fin de, a fin
de que, a lo que parece, a medida que, a menos que, a pesar, a pesar de, ahora bien,
ahora que, al menos, al objeto de, al objeto de que, al parecer, al paso que, antes bien,
as como, as es que, as pues, as y todo, aun cuanto, aunque ms, bien as como, bien
que mal, cada cuanto que, cada y cuanto que, como quiera que, como si, con objeto de,
con objeto de que, con todo, con todo eso, con todo esto, conocer se conoce que, cuanto
ms, cuanto ms que, cuanto y ms que, dado que, de consiguiente, de forma que, de
manera que, de modo que, de suerte que, dejante que, en consecuencia, en demasa, en
inteligencia de que, en la inteligencia de que, en manera que, entre que, ms que,
mientras ms, mientras que, no obstante, o bien como, para que, pese a, por
consecuencia, por consiguiente, por donde, por el consiguiente, por lo menos, por lo
mismo, por manera que, por mucho que, por que, presupuesto que, pues bien, pues que,
puesto que, que hasta, segn y como, segn y conforme, si bien, si ya, siempre que,
siempre y cuando que, supuesto que, tan pronto, tan siquiera, tan y mientras, visto que,
ya que.
- 163 -
Proceso de automatizacin del anlisis sintactico del espaol.
tanto a se como a lo; sin embargo, se ante lo, la, los, las, no ser nunca
objeto directo.
Subordinadas introducidas por de que. Cuando se tiene una oracin
subordinada introducida por el conector de que, la funcin de la subordinada
nunca ser la de circunstancial. Ejemplo "La idea de que somos amigos me
alegra".
El pronombre de relativo como conector subordinante. El pronombre de
relativo puede dar lugar a un ncleo nominal o a un conector subordinante.
Como el conector subordinante tiene como funcin la unin de una
proposicin subordinada, necesita que la sentencia contenga al menos dos
ncleos verbales uno por proposicin.
Acompaantes necesarios. El adyacente debe acompaar a una palabra que
pueda ser ncleo nominal o a otro modificador del ncleo nominal. El
adjetivo como ncleo nominal debe ir acompaado de un presentador que
sustantive su funcin.
La aposicin. Se rechaza la generacin de aposicin se considera
adyacente cuando se genera a partir de un sustantivo que puede tener
funcin de adjetivo.
El verbo auxiliar haber. Cuando aparecen casos como hemos salido en el que
hemos puede considerarse el ncleo verbal y salido un sustantivo, se debe tener en
cuenta que el verbo haber como ncleo siempre debe ir acompaado de un objeto
directo.
El ncleo verbal pasivo. El ncleo de una oracin pasiva est siempre
compuesto por una forma verbal compleja, en la que el auxiliar es siempre el
verbo ser.
El ncleo verbal copulativo. Slo puede generarse a partir de un conjunto
reducido de verbos estar, parecer, permanecer, resultar, hacerse,
seguir,...
- 164 -
Proceso de automatizacin del anlisis sintactico del espaol.
Tabla 3.35
Perfrasis verbales consideradas
acabar de + infinitivo
deber de + infinitivo
dejar de + infinitivo
echarse a + infinitivo
empezar a + infinitivo
estar para + infinitivo
explotar a + infinitivo
haber de + infinitivo
haber que + infinitivo
ir a + infinitivo
llagar a + infinitivo
ponerse a + infinitivo
romper a + infinitivo
tener que + infinitivo
venir a + infinitivo
volver a + infinitivo
- 165 -
Proceso de automatizacin del anlisis sintactico del espaol.
Cuando aparece el adverbio muy, no puede dar lugar por s slo a ningn tipo
de sintagma, pues su funcin es la de modificar el significado de otras
palabras.
Las palabras a y de tienen como posibles funciones la de preposicin y
sustantivo. Cuando se encuentran ante un presentador su funcin es la de
preposicin, y no pueden dar lugar a ningn nuevo smbolo por s solas.
La palabra se puede aparecer ante el verbo sin una funcin concreta dentro
de la oracin; en tal caso, el ncleo verbal se encuentra siempre en tercera
persona.
En oraciones como el pjaro que canta muestra su alegra, que puede
funcionar como adyacente; sin embargo, nunca lo har pospuesto al ncleo
nominal, y en tal caso no puede complementar a pjaro. Lo mismo ocurre
con la palabra no en la oracin como Isabel no nos llame, no la
esperaremos, donde no en ningn caso complementa a Isabel.
Existe un conjunto de palabras que no podrn dar lugar a un sintagma por s
solas. As, las palabras tan y muy no pueden generar un sintagma adverbial
si no van acompaadas de otros elementos. Lo mismo ocurre con algn, un,
unos, unas respecto del sintagma adjetivo.
Cuando existe una ambigedad funcional del tipo adjetivo y sustantivo, tal
que la palabra por s sola en ambos casos d lugar a un smbolo atributo, es
posible descartar el smbolo atributo generado a partir del sustantivo.
Si un adjetivo se encuentra precedido por un presentador slo en el caso
de tratarse de presentador que no pueda aparecer pospuesto al ncleo
nominal, como el artculo determinado no puede dar lugar a un sintagma
adjetivo.
En la oracin te tengo dicho que no vengas tarde a casa, es posible
eliminar la ambigedad de la palabra tarde descartando la opcin verbo
cuando se encuentra tras otro verbo.
El predicativo subjetivo no puede aparecer con verbos copulativos, pues en
tal caso su funcin sera la de atributo.
Si aparece antepuesta una preposicin a un sintagma nominal, el nico
smbolo que puede generarse a partir del sintagma nominal es el sintagma
preposicional correspondiente.
- 166 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 167 -
Proceso de automatizacin del anlisis sintactico del espaol.
23 23
23!
V23,i =
i =1 i =1 (23 i )!
Sin embargo, todas no se pueden dar por lo que no es necesario aadirlas como
reglas; existen combinaciones de diferentes elementos que no pueden aparecer
formando parte de un mismo predicado, como se muestra en la siguiente tabla.
Tabla 3.36
Parejas de smbolos incompatibles en un mismo predicado
atributo atributo
atributo morfema de pasiva
atributo objeto directo
atributo objeto indirecto
atributo predicativo objetivo
atributo predicativo subjetivo
atributo suplemento
complemento agente suplemento
morfema de impersonal morfema de impersonal
morfema de impersonal morfema de pasiva
morfema de impersonal morfema de voz media
morfema de impersonal predicativo subjetivo
morfema de pasiva atributo
morfema de pasiva morfema de impersonal
morfema de pasiva morfema de pasiva
morfema de pasiva morfema de voz media
morfema de pasiva objeto directo
morfema de pasiva objeto indirecto
morfema de voz media morfema de impersonal
morfema de voz media morfema de pasiva
morfema de voz media morfema de voz media
ncleo verbal ncleo verbal
ncleo verbal ncleo verbal copulativo
ncleo verbal ncleo verbal pasivo
ncleo verbal copulativo ncleo verbal
ncleo verbal copulativo ncleo verbal copulativo
ncleo verbal copulativo ncleo verbal pasivo
ncleo verbal pasivo ncleo verbal
ncleo verbal pasivo ncleo verbal copulativo
ncleo verbal pasivo ncleo verbal pasivo
objeto directo atributo
objeto directo morfema de pasiva
objeto indirecto atributo
objeto indirecto morfema de pasiva
predicativo objetivo atributo
predicativo objetivo predicativo objetivo
predicativo objetivo predicativo subjetivo
predicativo subjetivo atributo
predicativo subjetivo morfema de impersonal
predicativo subjetivo predicativo objetivo
predicativo subjetivo predicativo subjetivo
suplemento atributo
suplemento complemento agente
suplemento suplemento
- 168 -
Proceso de automatizacin del anlisis sintactico del espaol.
ciertas caractersticas del predicado. En las reglas en las que aparece el predicado se
encuentra delimitando por el principio o el final el smbolo que genera, o bien es
adyacente a un smbolo de puntuacin. Es por ello que se deben rechazar todas aquellas
combinaciones de smbolos, que tengan como finalidad la posible generacin de
smbolos predicado, tal que alguno de los extremos no es principio o final del smbolo
generado o exista un smbolo de puntuacin adyacente.
Existen casos en los cuales esta condicin puede no cumplirse. Es el caso de la
existencia de oraciones subordinadas, en estos casos antes de rechazar un evento debe
tenerse en cuenta la posibilidad de que se trate de una oracin subordinada, para ello se
verifica la existencia de elementos subordinantes y la existencia de mltiples formas
verbales.
Existe un conjunto de smbolos a los cuales es posible aplicarles reglas similares.
As, la proposicin ya sea coordinada o subordinada debe llevar antepuesto o pospuesto,
segn sea el caso, algn tipo de conector, ya sea subordinante o coordinante. De igual
manera cualquier tipo de oracin que vaya a dar lugar a una de estas proposiciones
debe cumplir estas mismas condiciones. Teniendo en cuenta estas caractersticas es
posible eliminar la generacin de smbolos intermedios, reduciendo la carga del
proceso.
- 169 -
Proceso de automatizacin del anlisis sintactico del espaol.
ncleo nominal si
ncleo verbal si si
ncleo verbal copulativo si si si si
ncleo verbal pasivo si si si
objeto directo si si si si si si si si
objeto indirecto si si si si si si
oracin atributiva si si si si
oracin de suplemento si si si si
oracin exclamativa si
oracin interrogativa si
oracin intransitiva si si si si
oracin pasiva si si
oracin transitiva si si si si si
predicado s si
predicativo objetivo si si si si si
predicativo subjetivo si si si si si
preposicin subordiannte ms presentador si si
preposicin subordinante si si
presentador si si si
proposicin si si si si
proposicin de infinitivo si si
proposicin subordinada si si si si
sintagma adjetivo si si si
sintagma adverbial si si si si
sintagma nominal heterogneo si si si si
sintagma nominal homogneo si si si si
sintagma nominal sustitutivo si si si
sintagma preposicional si si si
subordinada comparativa si si
sujeto si si s si si
suplemento si si si si
vocativo si si si
presentadores antepuestos
presentadores pospuestos
semntica incompatible
smbolos incompatibles
smbolos no permitidos
semntica necesaria
smbolos necesarios
palabras necesarias
proposiciones
otros casos
- 170 -
Proceso de automatizacin del anlisis sintactico del espaol.
adyacente adjetivo
ncleo nominal adjetivo
ncleo verbal adjetivo
ncleo verbal pasivo adjetivo
sintagma adjetivo adjetivo
Se aplican las siguientes reglas:
Simbolos incompatibles. El ncleo verbal es incompatible con la existencia de
otro ncleo verbal, con la de un ncleo verbal copulativo y con la de un ncleo
verbal pasivo. El ncleo verbal pasivo es incompatible con la existencia de un
ncleo verbal, con la de un ncleo verbal copulativo, con la de otro ncleo
verbal pasivo, con la de una oracin atributiva, con la de una oracin de
suplemento y con la una oracin transitiva.
Concordancias. El adyacente debe concordar en gnero y nmero con el ncleo
nominal. El ncleo nominal debe concordar en gnero y nmero con el
adyacente y con el presentador. El ncleo verbal y el ncleo verbal pasivo
deben concordar en nmero y persona con el sujeto.
Casos especiales: Otros casos. El ncleo verbal pasivo. El ncleo verbal
pasivo siempre debe encontrarse en forma compuesta; en el caso de generarse a
partir de un adjetivo debe ir acompaado del auxiliar pasivo ser.
Casos especiales: Otros casos. Acompaantes necesarios. El adyacente debe
acompaar a una palabra que pueda ser ncleo nominal o a otro modificador del
ncleo nominal. El adjetivo como ncleo nominal debe ir acompaado de un
presentador que sustantive su funcin.
Grupo 2.
Las reglas que dan lugar a la ambigedad son:
adyacente adverbio
conector subordinante adverbio
sintagma adverbial adverbio
Se aplican las siguientes reglas:
Palabras necesarias: Otros casos. Cuando el adyacente se genera desde
adverbio requiere que la palabra de partida sea como, ms, menos, no, todo o
toda. Cuando el conector subordiante se genera desde adverbio requiere que la
- 171 -
Proceso de automatizacin del anlisis sintactico del espaol.
Grupos 5 y 6.
Las reglas que dan lugar a la ambigedad son:
construccin comparativa adverbio+ sintagma nominal heterogneo
sintagma adverbial adverbio+ sintagma nominal heterogneo
----------------------------------------------------------------------------
construccin comparativa adverbio + sintagma nominal homogneo
grupo nominal adverbio + sintagma nominal homogneo
sintagma adverbial adverbio + sintagma nominal homogneo
Se aplica la siguiente regla:
- 172 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 173 -
Proceso de automatizacin del anlisis sintactico del espaol.
Grupo 10.
Las reglas que dan lugar a la ambigedad son:
conector conjuncin
conector subordinante conjuncin
Se aplica la siguiente regla:
Palabras necesarias: Otros casos. Cuando el conector subordiante se genera
desde una conjuncin requiere que la palabra de partida sea aunque, con que,
cuando, cuantos, cuantas, para, porque, que o si.
Grupo 12.
Las reglas que dan lugar a la ambigedad son:
ncleo verbal forma verbal compleja
ncleo verbal copulativo forma verbal compleja
ncleo verbal pasivo forma verbal compleja
Se aplican las siguientes reglas:
Simbolos incompatibles. El ncleo verbal es incompatible con la existencia de
otro ncleo verbal, con la de un ncleo verbal copulativo y con la de un ncleo
verbal pasivo. El ncleo verbal copulativo es incompatible con la existencia de
un ncleo verbal, con la de otro ncleo verbal copulativo y con la de un ncleo
verbal pasivo. El ncleo verbal pasivo es incompatible con la existencia de un
- 174 -
Proceso de automatizacin del anlisis sintactico del espaol.
Grupo 13 y 14.
Las reglas que dan lugar a la ambigedad son:
ncleo verbal forma verbal simple
ncleo verbal copulativo forma verbal simple
----------------------------------------------------------------------------
circunstancial gerundio
ncleo verbal gerundio
ncleo verbal copulativo gerundio
Se aplican las siguientes reglas:
Simbolos incompatibles. El ncleo verbal es incompatible con la existencia de
otro ncleo verbal, con la de un ncleo verbal copulativo y con la de un ncleo
verbal pasivo. El ncleo verbal copulativo es incompatible con la existencia de
un ncleo verbal, con la de otro ncleo verbal copulativo y con la de un ncleo
verbal pasivo.
Smbolos necesarios. El ncleo verbal copulativo requiere la existencia de un
atributo.
Casos especiales: Otros casos. El verbo auxiliar haber. Cuando el ncleo
verbal es el verbo haber, debe encontrarse acompaado de un objeto directo.
Casos especiales: Otros casos. El ncleo verbal copulativo. El ncleo verbal
copulativo slo puede generarse a partir de un conjunto reducido de verbos los
copulativos.
Grupo 15.
Las reglas que dan lugar a la ambigedad son:
- 175 -
Proceso de automatizacin del anlisis sintactico del espaol.
Grupo 16.
Las reglas que dan lugar a la ambigedad son:
ncleo nominal infinitivo con pronombre encltico
ncleo verbal infinitivo con pronombre encltico
Se aplican las siguientes reglas:
Simbolos incompatibles. El ncleo verbal es incompatible con la existencia de
otro ncleo verbal, con la de un ncleo verbal copulativo y con la de un ncleo
verbal pasivo.
Concordancias. El ncleo verbal debe concordar en nmero y persona con el
sujeto de la oracin por ser infinitivo debe ser singular y tercera persona.
- 176 -
Proceso de automatizacin del anlisis sintactico del espaol.
Grupo 24.
Las reglas que dan lugar a la ambigedad son:
ncleo verbal participio
ncleo verbal pasivo participio
Se aplican las siguientes reglas:
Simbolos incompatibles. El ncleo verbal es incompatible con la existencia de
otro ncleo verbal, con la de un ncleo verbal copulativo y con la de un ncleo
verbal pasivo. El ncleo verbal pasivo es incompatible con la existencia de un
ncleo verbal, con la de un ncleo verbal copulativo, con la de otro ncleo
verbal pasivo, con la de una oracin atributiva, con la de una oracin de
suplemento y con la una oracin transitiva.
Concordancias. El ncleo verbal y el ncleo verbal pasivo deben concordar en
nmero y persona con el sujeto.
Casos especiales: Otros casos. El ncleo verbal pasivo. Para que se genere un
ncleo verbal pasivo a partir de un participio debe existir el auxiliar pasivo ser.
- 177 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 178 -
Proceso de automatizacin del anlisis sintactico del espaol.
Grupo 32.
Las reglas que dan lugar a la ambigedad son:
conector subordinante preposicin
preposicin subordinante preposicin
No se aplica directamente ninguna regla, aunque muchos de los conflictos se
resuelven en niveles superiores.
Grupo 41.
Las reglas que dan lugar a la ambigedad son:
morfema de impersonal pronombre personal tono
morfema de pasiva pronombre personal tono
morfema de voz media pronombre personal tono
ncleo nominal pronombre personal tono
Se aplican las siguientes reglas:
Palabras necesarias: Los pronombres personales tonos. El morfema de
impersonal y el morfema de pasiva requieren que el pronombre que gener el
pronombre personal tono sea se. El morfema de voz media requiere que el
pronombre que gener el pronombre personal tono sea me o se.
Simbolos incompatibles. El morfema de impersonal es incompatible con la
existencia de otro morfema de impersonal, con la de un morfema de pasiva, con
la de un morfema de voz media, con la de un predicativo subjetivo y con la de un
sujeto. El morfema de pasiva es incompatible con la existencia de un atributo,
con la de un morfema de impersonal, con la de otro morfema de pasiva, con la
de un morfema de voz media, con la de un objeto directo y con la de un objeto
indirecto. El morfema de voz media es incompatible con la existencia de un
morfema de impersonal, con la de un morfema de pasiva y con la de otro
morfema de voz media.
- 179 -
Proceso de automatizacin del anlisis sintactico del espaol.
Grupo 42.
Las reglas que dan lugar a la ambigedad son:
adyacente pronombre de relativo
conector subordinante pronombre de relativo
ncleo nominal pronombre de relativo
Se aplican las siguientes reglas:
Palabras necesarias: Otros casos. Cuando el adyacente se genera desde
pronombre de relativo requiere que la palabra de partida sea cuya, cuyas, cuyo,
cuyos o que.
Casos especiales: Otros casos. El pronombre de relativo como conector
subordinante. Para generar conector subordinante se requiere al menos dos
ncleos verbales.
Grupo 43.
Las reglas que dan lugar a la ambigedad son:
ncleo nominal otro pronombre
presentador otro pronombre
Se aplican las siguientes reglas:
Palabras necesarias: Otros casos. Cuando el presentador se genera desde otro
pronombre requiere que la palabra de partida sea que o qu.
Concordancias. Todo presentador se usa para introducir un ncleo nominal con
el que debe de concordar en gnero y nmero.
Casos especiales: Presentadores pospuestos y presentadores antepuestos. El
smbolo otro pronombre slo aparece antepuesto al ncleo nominal.
Grupo 44.
Las reglas que dan lugar a la ambigedad son:
circunstancial proposicin
complemento preposicional del nombre proposicin
objeto directo proposicin
sujeto proposicin
vocativo proposicin
Se aplican las siguientes reglas:
Smbolos incompatibles. El objeto directo es incompatible con la existencia de
un atributo, con la de un morfema de pasiva, con la de una oracin de
- 180 -
Proceso de automatizacin del anlisis sintactico del espaol.
Grupo 45.
Las reglas que dan lugar a la ambigedad son:
objeto directo proposicin de infinitivo
sujeto proposicin de infinitivo
Se aplican las siguientes reglas:
Smbolos incompatibles. El objeto directo es incompatible con la existencia de
un atributo, con la de un morfema de pasiva, con la de una oracin de
suplemento y con la de una oracin intransitiva. El sujeto es incompatible con la
existencia de un morfema de impersonal.
Smbolos necesarios. El objeto directo requiere la existencia de un ncleo
verbal.
Concordancias. El sujeto debe concordar en nmero y persona con el ncleo
verbal.
Casos especiales: Doble objeto directo. De existir otro objeto directo, se
descarta la generacin de objeto directo a menos que el primero le siga en la
oracin, est generado a partir de un pronombre personal tono y sus ncleos
concuerden en gnero y nmero.
Grupo 46.
Las reglas que dan lugar a la ambigedad son:
adyacente proposicin subordinada
- 181 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 182 -
Proceso de automatizacin del anlisis sintactico del espaol.
----------------------------------------------------------------------------
oracin exclamativa puntuacin + oracin intransitiva +puntuacin
oracin interrogativa puntuacin + oracin intransitiva +puntuacin
----------------------------------------------------------------------------
oracin exclamativa puntuacin + oracin pasiva + puntuacin
oracin interrogativa puntuacin + oracin pasiva + puntuacin
----------------------------------------------------------------------------
oracin exclamativa puntuacin + oracin transitiva + puntuacin
oracin interrogativa puntuacin + oracin transitiva + puntuacin
----------------------------------------------------------------------------
oracin exclamativa puntuacin + sentencia + puntuacin
oracin interrogativa puntuacin + sentencia + puntuacin
Se aplica la siguiente regla:
Casos especiales: Oraciones interrogativas y exclamativas. Este conflicto
siempre se resuelve ya que para generar oracin exclamativa los signos de
puntuacin han de ser las exclamaciones y para generar oracin interrogativa
los signos de puntuacin han de ser las interrogaciones.
Grupo 53.
Las reglas que dan lugar a la ambigedad son:
adyacente sintagma adjetivo
atributo sintagma adjetivo
predicativo objetivo sintagma adjetivo
predicativo subjetivo sintagma adjetivo
Se aplican las siguientes reglas:
Smbolos incompatibles. El atributo es incompatible con la existencia de otro
atributo, con la de un morfema de pasiva, con la de un objeto directo, con la de
un objeto indirecto, con la de una oracin intransitiva, con la de una oracin
transitiva, con la de un predicativo objetivo, con la de un predicativo subjetivo y
con la de un suplemento. El predicativo objetivo es incompatible con la
existencia de un atributo, con la de otro predicativo objetivo y con la de un
predicativo subjetivo. El predicativo subjetivo es incompatible con la existencia
de un atributo, con la de un morfema de impersonal, con la de un predicativo
objetivo y con la de otro predicativo subjetivo.
Smbolos necesarios. El atributo requiere la existencia de un ncleo verbal
copulativo y el predicativo objetivo la de un objeto directo.
- 183 -
Proceso de automatizacin del anlisis sintactico del espaol.
Grupo 54.
Las reglas que dan lugar a la ambigedad son:
atributo sintagma nominal heterogneo
objeto directo sintagma nominal heterogneo
sujeto sintagma nominal heterogneo
Se aplican las siguientes reglas:
Simbolos incompatibles. El atributo es incompatible con la existencia de otro
atributo, con la de un morfema de pasiva, con la de un objeto directo, con la de
un objeto indirecto, con la de una oracin intransitiva, con la de una oracin
transitiva, con la de un predicativo objetivo, con la de un predicativo subjetivo y
con la de un suplemento. El objeto directo es incompatible con la existencia de
un atributo, con la de un morfema de pasiva, con la de una oracin de
suplemento y con la de una oracin intransitiva. El sujeto es incompatible con la
existencia de un morfema de impersonal.
Smbolos necesarios. El atributo requiere la existencia de un ncleo verbal
copulativo y el objeto directo la de un ncleo verbal.
Concordancias. El sujeto debe concordar en nmero y persona con el ncleo
verbal.
Casos especiales: Doble objeto directo. De existir otro objeto directo, se descarta la
generacin de objeto directo a menos que el primero le siga en la oracin, est generado a partir
de un pronombre personal tono y sus ncleos concuerden en gnero y nmero.
Grupo 55.
Las reglas que dan lugar a la ambigedad son:
atributo sintagma nominal homogneo
circunstancial sintagma nominal homogneo
objeto directo sintagma nominal homogneo
sujeto sintagma nominal homogneo
vocativo sintagma nominal homogneo
Se aplican las siguientes reglas:
Simbolos incompatibles. El atributo es incompatible con la existencia de otro
atributo, con la de un morfema de pasiva, con la de un objeto directo, con la de
- 184 -
Proceso de automatizacin del anlisis sintactico del espaol.
Grupo 56.
Las reglas que dan lugar a la ambigedad son:
atributo sintagma nominal sustitutivo
circunstancial sintagma nominal sustitutivo
objeto directo sintagma nominal sustitutivo
objeto indirecto sintagma nominal sustitutivo
sujeto sintagma nominal sustitutivo
Se aplican las siguientes reglas:
Smbolos no permitidos. Cuando el objeto directo o el objeto indirecto se
generan a partir de un sintagma nominal sustitutivo, los posibles ncleos
nominales se limitan a infinitivo, otro pronombre o pronombre personal tono.
Cuando el sujeto se genera a partir de un sintagma nominal sustitutivo, el ncleo
nominal se limita a pronombre personal tnico.
Simbolos incompatibles. El atributo es incompatible con la existencia de otro
atributo, con la de un morfema de pasiva, con la de un objeto directo, con la de
un objeto indirecto, con la de una oracin intransitiva, con la de una oracin
transitiva, con la de un predicativo objetivo, con la de un predicativo subjetivo y
con la de un suplemento. El objeto directo es incompatible con la existencia de
- 185 -
Proceso de automatizacin del anlisis sintactico del espaol.
Grupo 57.
Las reglas que dan lugar a la ambigedad son:
atributo sintagma preposicional
circunstancial sintagma preposicional
complemento adjetivo sintagma preposicional
complemento agente sintagma preposicional
complemento preposicional del nombre sintagma preposicional
objeto directo sintagma preposicional
objeto indirecto sintagma preposicional
suplemento sintagma preposicional
Se aplican las siguientes reglas:
Palabras necesarias: Los sintagmas preposicionales. Algunos smbolos que se
generan a partir de un sintagma preposicional exigen del sintagma que comience
por determinadas preposiciones. El atributo requiere de, desde o para. El
complemento adjetivo requiere de o en. El complemento agente requiere de o
por. El complemento preposicional del nombre requiere de, en, por o sin. El
objeto directo requiere a. El objeto indirecto requiere a o para. El suplemento
requiere a, de, en o por.
- 186 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 187 -
Proceso de automatizacin del anlisis sintactico del espaol.
Grupo 61.
Las reglas que dan lugar a la ambigedad son:
aposicin sustantivo
ncleo nominal sustantivo
Se aplica la siguiente regla:
Casos especiales: Otros casos. La aposicin. Se rechaza la generacin de
aposicin se considera adyacente cuando se genera a partir de un sustantivo
que puede tener funcin de adjetivo.
Grupo 62.
Las reglas que dan lugar a la ambigedad son:
auxiliar verbo
- 188 -
Proceso de automatizacin del anlisis sintactico del espaol.
Tabla 3.38
Resumen de aplicacin de reglas por grupo
1 X X X X
2 X X X
3 X
4 X
5
6
7 X
8 X
9 X
10 X
11 X
12 X X X
13 X X X X
14 X X X X
15 X X X
16 X X
17 X
18 X
19 X
20 X
21 X
22 X
23 X
24 X X
25 X X
26 X X
27 X X
28 X X
29 X X
30 X X
31 X X
32
33 X
34 X
35 X
36 X
37 X
38 X
39 X
40 X
41 X X
42 X X
43 X X X
44 X X X X X
45 X X X X
46 X X X X X
47 X
48 X
49 X
50 X
51 X
52 X
53 X X X
54 X X X X
55 X X X X X
56 X X X X X X
57 X X X X X X
- 189 -
Proceso de automatizacin del anlisis sintactico del espaol.
58 X
59 X
60 X
61 X
62 X
Semntica necesaria
Casos especiales
Concordancias
Figura 3.34
Interpretacin A
- 190 -
Proceso de automatizacin del anlisis sintactico del espaol.
sintagma preposicional
predicado sujeto
oracin intransitiva
Figura 3.35
Interpretacin B
sintagma preposicional
suplemento
oracin intransitiva
Figura 3.36
Interpretacin A
- 191 -
Proceso de automatizacin del anlisis sintactico del espaol.
objeto directo
predicado
oracin intransitiva
Figura 3.37
Interpretacin B
predicado
oracin intransitiva
- 192 -
Proceso de automatizacin del anlisis sintactico del espaol.
Figura 3.38
Interpretacin A
circunstancial de distancia
sujeto predicado
oracin intransitiva
Figura 3.39
Interpretacin B
circunstancial de cantidad
sujeto predicado
oracin intransitiva
Figura 3.40
Interpretacin C
objeto directo
sujeto predicado
oracin transitiva
- 193 -
Proceso de automatizacin del anlisis sintactico del espaol.
900
800
700
Nmero de nodos
600
con desambiguacin
500 funcional local
400 sin desambiguacin
funcional local
300
200
100
0
0 2 4 6 8 10
Nmero de smbolos
Puede verse que el nmero de nodos que se generan durante el proceso de anlisis medida del
costo de los procesos de generacin de rboles disminuye al aplicar la desambiguacin funcional local
y, en general, aumenta con el nmero de smbolos de la sentencia.
- 194 -
Proceso de automatizacin del anlisis sintactico del espaol.
Figura 3.42
Resultados
60
50
Nmero de respuestas
40
con desambiguacin
funcional local
30
sin desambiguacin
funcional local
20
10
0
0 2 4 6 8 10
Nmero de smbolos
- 195 -
Proceso de automatizacin del anlisis sintactico del espaol.
Figura 3.43
Nmero de nodos generados durante el anlisis de texto real
1200
1000
Nmero de nodos
800
600
400
200
0
0 2 4 6 8 10 12 14 16 18
Nmero de smbolos de la oracin
Figura 3.44
Nmero de respuestas generadas durante el anlisis de texto real
180
160
Nmero de respuestas
140
120
100
80
60
40
20
0
0 2 4 6 8 10 12 14 16 18
Nmero de smbolos de la oracin
- 196 -
Proceso de automatizacin del anlisis sintactico del espaol.
Figura 3.45
Influencia de la desambiguacin estructural en la bondad de la desambiguacin funcional
100
80
Bondad media
60
40
20
0
0 2 4 6 8 10 12 14 16 18
Nmero de smbolos de la oracin
Figura 3.46
Influencia de la desambiguacin estructural en el
nmero de combinaciones aceptadas de la desambiguacin funcional
100
Combinaciones aceptadas
80
60
40
20
0
0 2 4 6 8 10 12 14 16 18
Nmero de smbolos de la oracin
- 197 -
Proceso de automatizacin del anlisis sintactico del espaol.
Captulo 3 Apartado 5
Integracin de los procesos de desambiguacin en el
algoritmo de anlisis
5.1.- Introduccin.
Se ha mostrado en captulos anteriores cmo generar los rboles de anlisis y
cmo realizar el proceso de desambiguacin; sin embargo, es importante que estos
procesos se acoplen de forma adecuada para reducir el tiempo de cmputo.
lo
Interpretaciones posibles: sustantivo, pronombre personal tono, artculo determinado
Interpretaciones aceptadas: sustantivo, pronombre personal tono
hizo
Interpretaciones posibles: verbo
Interpretaciones aceptadas: verbo
a
Interpretaciones posibles: sustantivo, preposicin
Interpretaciones aceptadas: sustantivo, preposicin
- 198 -
Proceso de automatizacin del anlisis sintactico del espaol.
escondidas
Interpretaciones posibles: adjetivo, sustantivo
Interpretaciones aceptadas: adjetivo, sustantivo
Opcin 1. Generar los rboles a partir del anlisis morfolgico de las palabras y
filtrar los resultados finales con las combinaciones aceptadas por el
desambiguador. Este mtodo no mejora la velocidad de anlisis pues se generan
todos los rboles posibles y no se aprovechan los resultados del desambiguador
para realizar poda alguna.
Figura 3.49
Opcin 1: Filtrado final con las combinaciones aceptadas
Sentencia
Anlisis
morfolgico
Generacin de
Desambiguacin
rboles de
funcional
representacin
filtrado de rboles
con las
combinaciones
aceptadas
Resultados
- 199 -
Proceso de automatizacin del anlisis sintactico del espaol.
Figura 3.50
Opcin 2: Generacin con las combinaciones aceptadas
Sentencia
Anlisis
morfolgico
Desambiguacin
funcional
Generacin de
rboles de
representacin para
cada combinacin
aceptada
Resultados
- 200 -
Proceso de automatizacin del anlisis sintactico del espaol.
Figura 3.51
Opcin 3: Generacin con comportamientos aceptados y filtrado final con las combinaciones aceptadas
Sentencia
Anlisis
morfolgico
Desambiguacin
funcional
Generacin de
rboles de
representacin
partiendo de las
interpretaciones
aceptadas
filtrado de rboles
con las
combinaciones
aceptadas
Resultados
- 201 -
Proceso de automatizacin del anlisis sintactico del espaol.
Figura 3.52
Opcin 4: Generacin con comportamientos aceptados y filtrado con subsecuencias aceptadas
Sentencia
Anlisis
morfolgico
Desambiguacin
funcional
Generacin de
rboles de
representacin Filtrado con
partiendo de las subsecuencias
interpretaciones
aceptadas
Resultados
- 202 -
Proceso de automatizacin del anlisis sintactico del espaol.
Figura 3.53
Opcin 1: Desambiguacin estructural al final
Sentencia
Anlisis
morfolgico
Desambiguacin
funcional
Generacin de
rboles de
representacin Filtrado con
partiendo de las subsecuencias
interpretaciones
aceptadas
Filtrado por
desambiguacin
estructural
Resultados
- 203 -
Proceso de automatizacin del anlisis sintactico del espaol.
Figura 3.54
Opcin 2: Desambiguacin estructural integrada
Sentencia
Anlisis
morfolgico
Desambiguacin
funcional
Generacin de
rboles de
Filtrado con
representacin Filtrado con
desambiguacin
partiendo de las subsecuencias
estructural
interpretaciones
aceptadas
Resultados
Para para llevar a cabo esta integracin se dividen las reglas de desambiguacin
estructural en dos grupos:
En la generacin de smbolo. Se aplican en el momento de generar el smbolo y
requieren conocer todos los descendientes a partir de los que se ha generado el
smbolo. Las reglas de este grupo son: palabras necesarias, smbolos
necesarios, smbolos necesarios con condicin, semntica necesaria, semntica
incompatible, relaciones ideolgicas entre smbolos, doble objeto directo y
smbolos totales.
Antes de la generacin de smbolo. Pueden ser aplicadas antes del intento de
generacin del smbolo tambin deben ser aplicadas durante la generacin.
Son aquellas en las cuales no siempre es necesario conocer todos los
descendientes del nuevo smbolo. Las reglas de este grupo son: palabras
necesarias, smbolos no permitidos, smbolos incompatibles, concordancias,
doble objeto directo y smbolos totales. En este grupo se introduce tambien la
regla fusin de smbolos.
Algunas de las reglas aparecen en ambos grupos, pues no siempre pueden
aplicarse antes de la generacin del smbolo.
- 204 -
Proceso de automatizacin del anlisis sintactico del espaol.
Smbolo Smbolo
Ms a la izquierda Ms a la derecha
cerrada cerrada
Que se genere una lista de smbolos cerrada en uno de sus lados siempre
ser el izquierdo al usarse slo las coberturas izquierdas. En tal caso, se
aplican las reglas de desambiguacin antes de la generacin de smbolo.
La regla doble objeto directo se aplica si la lista se encuentra cerrada por
la derecha.
La regla palabras necesarias se aplica cuando la lista se encuentra
cerrada por la izquierda.
La regla smbolos totales se aplica si se ha generado una lista tal que su
lmite cerrado coincida con los lmites de la sentencia de anlisis y por el
lado abierto le falte un nico smbolo que cubra una nica palabra.
El resto de las reglas se aplican en cualquier caso.
Tmese como ejemplo la sentencia el coche est en el almacn: a partir de
el coche, se genera un sujeto que origina una lista cerrada por la izquierda
y abierta por la derecha esperando un predicado con vista a una oracin.
En este momento ser posible aplicar las reglas.
- 205 -
Proceso de automatizacin del anlisis sintactico del espaol.
Figura 3.56
Lista de smbolos cerrada slo en un lado
Smbolo Smbolo
Ms a la izquierda Ms a la derecha
cerrada abierta
Que se genere una lista de abierta en ambos lados. Al estar generandose las
listas a partir de la cobertura izquierda este caso no se da pues todas las listas
sern cerradas al menos por la izquierda.
Figura 3.58
Resultados
- 206 -
Proceso de automatizacin del anlisis sintactico del espaol.
20
18
16
Tiempo (segundos)
14
12
10
8
6
4
2
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Nmero de smbolos de la oracin
- 207 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 208 -
Proceso de automatizacin del anlisis sintactico del espaol.
Captulo 4
Aplicaciones desarrolladas
- 209 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 210 -
Proceso de automatizacin del anlisis sintactico del espaol.
Captulo 4 Apartado 1
Introduccin
- 211 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 212 -
Proceso de automatizacin del anlisis sintactico del espaol.
Captulo 4 Apartado 2
Desambiguador Funcional de Sentencias del Espaol:
DeFuSe
2.1.- Introduccin.
La herramienta DeFuSe realiza la desambiguacin automtica de sentencias con
una bondad media de los resultados del 86%. La aplicacin se basa en las caractersticas
de vecindad en el seno de las estructuras locales de la gramtica espaola, y aade una
serie de condiciones de unin concordancias y de prohibiciones en la unin
combinaciones vedadas, como se expres en el apartado 2 del captulo 3.
2.2.- Interfaz.
En la pantalla de la aplicacin que aparece en la figura 4.1 se observa:
- 213 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 214 -
Proceso de automatizacin del anlisis sintactico del espaol.
Figura 4.1
Interfaz para DeFuSe
Ventana de
- 215 -
Proceso de automatizacin del anlisis sintactico del espaol.
Figura 4.2
Interfaz de presentacin de resultados
- 216 -
Proceso de automatizacin del anlisis sintactico del espaol.
Captulo 4 Apartado 3
Analizador Morfo-Sintctico del Espaol: AMoSinE
3.1.- Introduccin.
Esta aplicacin realiza el anlisis sintctico de oraciones del espaol. Se trata de
un motor que integra las aplicaciones de anlisis morfolgico y de desambiguacin
funcional, con los procesos de geneacin de rboles de anlisis sintctico y
desambiguacin estructural.
3.2.- Interfaz.
En la pantalla de la aplicacin aparecen los siguientes elementos:
Texto de entrada.
Zona de resultados. En esta zona aparecen tres botones, que aportan resultados de
diferente ndole.
Botn de anlisis sintctico. Presenta el resultado de cada uno de los
distintos anlisis sintcticos de la oracin.
Botn de desambiguacin funcional. Presenta los resultados de la
desambiguacin funcional de la oracin.
Botn de anlisis morfolgico. Presententa el anlisis morfolgico de
cada una de las palabras de la oracin analizada.
Men. Las opciones del men son:
Opciones. Permite seleccionar qu opciones de desambiguacin se
aplican durante el proceso de anlisis.
- 217 -
Proceso de automatizacin del anlisis sintactico del espaol.
Figura 4.3
Interfaz para AmoSinE
Texto de entrada
Botn de desambiguacin
Botn de anlisis
funcional
Botn de anlisis
- 218 -
Proceso de automatizacin del anlisis sintactico del espaol.
Figura 4.4
Anlisis sintctico
Visualizacin de cada
Lista de interpretaciones
sintcticas encontradas
- 219 -
Proceso de automatizacin del anlisis sintactico del espaol.
Figura 4.5
Desambiguacin funcional
- 220 -
Proceso de automatizacin del anlisis sintactico del espaol.
Figura 4.6
Anlisis morfolgico
- 221 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 222 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 223 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 224 -
Proceso de automatizacin del anlisis sintactico del espaol.
ndice de tablas
- 225 -
Proceso de automatizacin del anlisis sintactico del espaol.
ndice de tablas
- 226 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 227 -
Proceso de automatizacin del anlisis sintactico del espaol.
Bibliografa
Artculos y libros:
[ALV94] Alvar Ezquerra, M. 1994. Diccionario de voces de uso actual. Arco-Libros. Madrid.
[BOS99] Bosque, I., Demonte. V. 1999. Gramtica descriptiva de la lengua espaola. Espasa.
Madrid.
[CLA97] Clave. 1997. Diccionario de Uso del Espaol Actual. Edicin en CD-ROM. SM.
Madrid.
[GER83] Gertjan van Noord. 1983. Reversibility in Natural Language Processing. Tesis
doctoral, Universidad de Utrecht, Holanda.
[GIL98] Gili Gaya, S. 1998. Curso Superior de Sintaxis Espaola. Biblograf, s.a. Barcelona.
[GOM02] Gmez Torredo, Leonardo. 2002. Gramtica didactica del espaol. S.M. Madrid.
[GOM02] Gmez Torredo, Leonardo. 2002. Anlisis sintctico. Teora y prctica. S.M. Madrid.
[GN94] Gnter Neumann. 1994. A Uniform Computational Model for Natural Language
Parsing and Generation. Tesis doctoral, Universidad de Saarland.
[GUT78] Gutirrez Araus, M. L. 1978. Estructuras sintcticas del espaol actual. Sociedad
General Espaola de Librera, S.A. Madrid.
- 228 -
Proceso de automatizacin del anlisis sintactico del espaol.
[LAR96] Larousse. 1996. Gran Diccionario de la Lengua Espaola. Larousse Planeta, s.a.
Barcelona.
[MAR96] Marcos Marn, Francisco A. y otros. 1996. La lengua espaola en las autopistas de la
informacin. Informe sobre el espaol en el entorno multimedia. Gabinete de la Presidencia
del Gobierno, Fundesco (Fundacin para el Desarrollo de la Funcin Social de las
Comunicaciones).
[MOL96] Moliner, M. 1996. Diccionario de Uso del Espaol. Edicin en CD-ROM. Gredos.
Madrid.
[MOZ94] Benito Mozas, Antonio. 1994. Ejercicios de sintaxis. Teora y prctica. EDAF.
[OCT02] Santana Suarez, O.; Perez Aguiar, J.; Losada Garca, L.; Carreras Riudavets, F. 2002.
Hacia la desambiguacin funcional automtica en Espaol. Procesamiento del Lenguaje
Natural, n 28, SEPLN.
[ONV90] Onieva Morales, J. L. 1990. Cmo dominar el anlisis gramatical superior. Playor.
Madrid.
[QUE96] Quesada, Jos F. 1996. Un modelo robusto y eficiente para el anlisis sintctico de
lenguajes naturales mediante rboles mltiples virtuales. Centro Informtico Cientfico de
Andaluca (CICA).
[RAE89] Real Academia Espaola. 1989. Esbozo de una nueva gramtica de la lengua
espaola. Espasa-Calpe. Madrid.
[ROD92] Rodrguez, C.; Rubio, C.; Snchez, A.; Sopea, L. 1992. Herramientas de ayuda a la
redaccin de textos: Un sistema de verificacin lxica, sintctica y estilstica. Voz y Letra,
Tomo III, Volumen 1. Centro de Tecnologa de la lengua-IBM, Sevilla.
[ROD97] Rodrguez Magro, C.; Sopea, L. Villar, C. 1997. Caracterizacin sintctica de los
verbos castellanos para una gramtica en ordendor. Procesamiento del Lenguaje Natural.
Boletn n 7.
- 229 -
Proceso de automatizacin del anlisis sintactico del espaol.
[WES89] Wescoat, Michael T. 1989. Practical Instructions for Working with the Formalism of
Lexical Functional Grammar. MS, Xerox PARC.
[ZAE95] Zaenen, A.; Uszkoreit, H.; Karlsson, F.; Karttunen, L.; Sanfilippo, A.; Pulman, S. G.;
Pereira, F.; Briscoe, T. 1995. Language Analysis and Understanding. Survey of the Art in
Human Language Technology. Captulo 3.
Pginas Web:
- 230 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 231 -
Proceso de automatizacin del anlisis sintactico del espaol.
- 232 -