Está en la página 1de 11

Verbos de soporte y grupos predicativos preposicionales

Paloma Garrido Iñigo, Universidad Rey Juan Carlos

Resumen

Este artículo se inscribe dentro de los trabajos que se están realizando en el Proyecto
de investigación del Plan Nacional de I + D + I, “Tratamiento automático de la
información textual en español: procesamiento léxico, sintáctico y semántico”
(TIC2002-01338), dirigido por el profesor Carlos Subirats de la Universidad
Autónoma de Barcelona.
El objetivo de este proyecto es desarrollar un sistema informático que permita
procesar automáticamente la información textual en español, mediante bases de
conocimiento lingüístico y algoritmos de intersección de autómatas. Las bases de
conocimiento lingüístico están integradas por diccionarios electrónicos, gramáticas y
semánticas electrónicas, convertidos en transductores.
En este artículo queremos presentar un primer estudio de los grupos predicativos
preposicionales (GPpred) y de su formalización en gramáticas electrónicas.

Palabras clave

Sintaxis léxica, grupos predicativos preposicionales, verbos de soporte.

1. El punto de partida de la sintaxis léxica (Subirats, 2001) es la


teoría de los predicados. Aunque tradicionalmente se ha establecido la
idea de que este concepto se identifica con el verbo, un predicado es
aquella unidad que tiene un requerimiento argumental distinto de cero,
es decir, su aparición depende de la entrada previa de otras unidades
léxicas por lo que se diferencia de los argumentos, que no requieren la
concurrencia de otras unidades. Los predicados no verbales (en este
caso, los grupos predicativos preposicionales) se unen a una clase de
verbos semánticamente vacíos que no son ni predicados ni
argumentos, sino marcas de predicado y por lo tanto su significado es
fundamentalmente aspectual. Puesto que sirven sólo de soporte para
estas marcas, se denominan “verbos de soporte”: estar de moda; ser
de armas tomar.
Las propiedades que permiten detectar los predicados locutivos
son las más importantes, ya que el sistema de recuperación del
contenido informativo de un texto parte de la detección de los
predicados para pasar luego a la identificación de las construcciones
sintácticas en las que aparecen y de ahí determinar sus relaciones de
predicación, que son las que vehiculan la información.
Entre gramática léxica y gramática electrónica no existe
ninguna diferencia sustancial. Podríamos decir que son dos caras de la
misma moneda: la gramática léxica sería la propuesta teórica que nos
sirve de marco para poder elaborar una gramática electrónica que sea
sistemática y operativa, de ahí que sea importante que el marco teórico
que sirve para la creación de una gramática electrónica sea igualmente
sistemático y operativo.
Las gramáticas electrónicas formalizan las propiedades
sintácticas léxicamente condicionadas de los predicados,
concretamente:

1) la proyección oracional de las propiedades de dependencia de


los predicados, básicamente, los verbos, los nombres y los adjetivos
predicativos, tanto simples como compuestos (locuciones);
2) las relaciones interoracionales que se pueden establecer entre
dichas proyecciones oracionales.

Si partimos de la base de que el significado está determinado


por las relaciones predicativas y éstas por el requerimiento argumental, y
que las transformaciones no alteran el significado, entonces podemos
decir que el sistema es operativo. Si es así, se puede decir que las
oraciones de base contienen toda la información que se puede transmitir
en una lengua natural. Es entonces cuando podemos hablar de la
comprensión automática de textos, de la información. Es el reto que se
presenta en la teoría de predicados y que aún no está resuelto: poder
pedir información concreta a un ordenador y que éste devuelva
respuestas, crear un mecanismo que pueda tratar y dar información
yendo al corazón de las relaciones de los predicados, que exista un
sistema informático que convierta un texto en sus oraciones de base
correspondientes, porque si hallamos oraciones de base a partir de
derivadas, eso querrá decir que estamos más cerca de las relaciones de
predicación, lo que nos permitirá acceder a la información, puesto que
ésta ya es transparente, como las oraciones de base. Lo que se intenta
hacer, desde un punto de vista lingüístico, es traducir las oraciones de
los textos, que en su mayoría son derivadas, en oraciones de base porque
son las que están más cerca de las relaciones predicativas y eliminan las
ambigüedades.
Gramática léxica y electrónica se combinan de forma que las
propiedades, transformaciones y relaciones de dependencia que se
estudian de cada predicado en la sintaxis léxica, pasen a formar parte
de la gramática electrónica de forma codificada.

2. Veamos cómo funciona este sistema a propósito de los grupos


predicativos preposicionales (GPpred).
En primer lugar se define el objeto de estudio, que en este caso
son los GPpred, es decir, se establece una definición que ayude a
identificarlos. Los grupos predicativos preposicionales están formados
por un verbo de soporte y un grupo conexo inanalizable. El grupo
nominal tiempo del GPpred estar a tiempo en (1) Todavía estoy a
tiempo de coger el tren es un argumento N y, por lo tanto, la
derivación transformacional del segundo argumento oracional de estar
a tiempo queda excluida de entrada, ya que tiempo no puede admitir el
segundo argumento de estar a tiempo en (1) como su propio
argumento, p. ej.: *Coger el tren es un tiempo, en consecuencia, a
tiempo en estar a tiempo constituye una parte conexa de este GPpred,
que no admite un análisis mediante una descomposición sintáctica.
Puede darse el caso de que el grupo nominal de un GPpred
coincida formalmente con un nombre predicativo (Npred) pero esta
coincidencia es puramente morfofonológica y, por lo tanto, no se
traduce en la inducción de propiedades sintácticas: la forma acuerdo
del GPpred estar de acuerdo en (2) Luis está de acuerdo con que se
repita la votación no constituye un Npred dentro de dicho GPpred,
sino que es una forma lexicalizada, que simplemente mantiene una
coincidencia morfofonológica con el Npred acuerdo. Prueba de ello es
que el segundo argumento oracional de estar de acuerdo en (2) no se
puede derivar transformacionalmente mediante una relativización y
una reducción, puesto que la oración de relativo a partir de la cual se
debería poder aplicar la reducción del verbo de soporte no resulta
aceptable: *Luis está de acuerdo, que es que se repita la votación. Por
lo tanto, estar de acuerdo es un predicado cuya proyección lineal es N1
estar de acuerdo con que P2 y en dicho GPpred, de acuerdo
constituye un grupo conexo inanalizable. La lexicalización del
determinante cero y del número singular de acuerdo, p. ej.: *Ana está
de (un + el) acuerdo con que se repita la votación, *Ana está de (E +
unos + los) acuerdos con que se repita la votación, confirma el análisis
de acuerdo como una forma lexicalizada que pertenece al grupo
conexo inanalizable de acuerdo.
Una vez que se ha definido el objeto de estudio, se hace una
lista de todos los elementos que pueden enmarcarse bajo esta
definición, en este caso, una lista de GPpred, lo cual es complicado
porque, mientras que un nombre aparece siempre etiquetado en un
diccionario como N, los GPpred siempre aparecen bajo epígrafes
distintos. La clasificación se hace a mano, a través de la consulta del
diccionario y de la competencia del lingüista que muchas veces
recurre a su experiencia.
Como lo que interesa es el comportamiento sintáctico de estos
predicados y las transformaciones que tienen que ver con ellos, lo que se
hace es apuntar el requerimiento argumental y la proyección lineal de
cada uno. Así se pueden agrupar por clases de dependencia: nivel,
número de argumentos y tipo.

Proyección lineal: SER GPPRED


PRIMER NIVEL
Req. Arg. Proyección lineal GPpred Ejemplo
Pn N1 ser GPpred ser de marca Este pantalón es
de marca.
Pnn N1 ser GPpred de N2 ser a prueba Este chaleco es
a prueba de
balas.

SEGUNDO NIVEL
Req. Arg. Proyección lineal GPpred Ejemplo
Pp que P1 ser GPpred ser de mal gusto Que haya dicho
eso es de mal
gusto.

Proyección lineal: ESTAR GPPRED


PRIMER NIVEL
Req. Arg. Proyección lineal GPpred Ejemplo
Pn N1 estar GPpred estar a régimen Las modelos
siempre están a
régimen.
Pnn N1 estar Gppred de estar a la vista Los informes
N2 estaban a la vista
de todos.
N1 estar GPpred estar en Los alumnos
con N2 contacto estaban en
contacto con sus
profesores.

SEGUNDO NIVEL
Req. Arg. Proyección lineal GPpred Ejemplo
Pp que P1 estar GPpred estar de moda Que la gente se
apunte a clases
de yoga está de
moda.
Pnp N1 estar GPpred de estar al Los alumnos
que P2 corriente estaban al
corriente de que
el profesor
estaba enfermo.
N1 estar GPpred estar de acuerdo Los empleados
con que P2 no estuvieron de
acuerdo con que
se les bajara el
sueldo.
Ppn que P1 estar GPpred de estar en boca Estaba en boca
N2 de todos que Eva
se había operado
el pecho.

2.1. Hecha ya la lista y clasificación, escogemos una clase y


buscamos cuáles son sus propiedades de selección. A cada propiedad
se le asigna un número, de tal manera que obtengamos una relación
cifrada de las formas en que puede aparecer en un entorno oracional.
Son características generales que sirven para todos los predicados de
una misma clase, lo cual no implica que todos los predicados tengan
que cumplir dichas características.
Es importante señalar que las propiedades que interesan en la
gramática léxica son las propiedades léxicamente condicionadas no
redundantes, es decir, que en una gramática léxica no aparecerán
nunca las propiedades definicionales, aquellas que nos han permitido
constituir una clase sintáctica. Por ejemplo, no tiene sentido estudiar la
reducción de oración de relativo (Red ORel) para los adjetivos
predicativos (Apred) porque si no admiten esta propiedad no se pueden
considerar Apred. Por lo tanto, una propiedad que hereda un Apred por el
mero hecho de ser Apred es admitir la Red ORel. Así pues, incluir esta
propiedad en una sintaxis computacional constituye un error conceptual
porque implica no tener claro cuáles son los principios que permiten
estructurar una sintaxis léxica.
Los predicados concretan su significado cuando se integran en
una proyección oracional, que es la que estructura el significado de sus
componentes. Este procedimiento de identificación de predicados nos
permite diferenciar predicados polisémicos. En (3) Los pantalones le
sientan como un tiro a Max y (4) Que Eva no quisiera venir sentó
como un tiro a Max, en (3) sentar como un tiro (‘quedar mal’) es una
locución verbal predicativa (LocVpred), Pnn, cuya proyección lineal
es N1 LocVpred a N2 , mientras que en (4) la proyección lineal de la
LocVpred sentar como un tiro (‘molestar’), Ppn, es que P1 LocVpred
a N2. La posibilidad de relacionar las diferencias semánticas entre
predicados con sus diferencias de proyección lineal permite
sistematizar un procedimiento de identificación de predicados y
facilita el estudio de las propiedades de selección y de transformación,
así como propicia que el análisis sea exhaustivo.

Ejemplo de gramática electrónica

# GPpred 2N que_P1_ estar_GPpred


Propiedades

200 {<estar.V:VAR-1:VAR-2:VAR-3:VAR-4:VAR-5> ( <ADV\1> +


<PALABRA\1>* ) <de/moda>
[&estar/de/moda.GPPRED,VAR-1,VAR-2,VAR-3,VAR-4,VAR-5 | 1
]}
201 que P1 en subjuntivo
Que los padres apunten a los hijos a Tai chi está de moda.

202 Reducción que P1


Que los padres apunten a los hijos a Tai chi está de moda
Apuntar a los hijos a Tai chi está de moda.
203 N1
Los sombreros para caballero ya no están en boga.

204 Pasiva se
Alguien está de moda. → Se está de moda.
{<se><GPPRED\1>[&alguien | 1 &#Pasiva_se#]}

205 Reducción Oración de Relativo


Los restaurantes que están de moda se encuentran en la calle principal.
Los restaurantes de moda se encuentran en la calle principal.

299 Ambigüedad
* no ambigua
0 ambigua

300 Comentarios: No estudiamos la reducción del argumento1 por ser


una
propiedad general.

Con esta lista de propiedades pasamos a estudiar cada uno de


los predicados de la clase y vemos si el predicado acepta esta
propiedad aplicando los signos + y –.
# GPpred 2N que_P1_estar_GPpred {estar/a/la/orden/del/día } { }

$200$ {<estar.V:VAR-1:VAR-2:VAR-3:VAR-4:VAR-5>(<ADV\1>
+ <PALABRA\1>*)
< a/la/orden/del/día >
[&estar/a/la/orden/del/día.GPPRED, VAR-1, VAR-2, VAR-3, VAR-
4, VAR-5 | 1] }

$201$ + 0 { Que te encuentres con algún jefe incompetente está a la


orden del día.}
$202$ + 0 { Pagar con tarjeta está a la orden del día.}

$203$ + 0 {Los despidos improcedentes están a la orden del día.}

$204$ – * { }

$205$ + 0 {Los abusos de poder, muy a la orden del día, no dejan de


sorprenderme.}

$299$ – * { }

$300$ { }

# GPpred 2N que_P1_estar_GPpred {estar/de/moda} { }

$200$ {<estar.V:VAR-1:VAR-2:VAR-3:VAR-4:VAR-5>(<ADV\1>
+ <PALABRA\1>*)
< de/moda >
[&estar/de/moda.GPPRED, VAR-1, VAR-2, VAR-3, VAR-4, VAR-5
| 1] }

$201$ + 0 {Que digan tantas tonterías está de moda.}

$202$ + 0 {Decir una estupidez tras otra está de moda.}

$203$ + 0 {Los sombreros para caballero ya no están de moda.}

$204$ + 0 {Se está de moda cuando se sale todos los días en las
revistas del corazón.}

$205$ + 0 {Los restaurantes de moda se encuentran en la avenida


principal.}

$299$ – * { }

$300$ { }
# GPpred 2N que_P1_estar_GPpred {estar/en/boga} { }

$200$ {<estar.V:VAR-1:VAR-2:VAR-3:VAR-4:VAR-5>(<ADV\1>
+ <PALABRA\1>*)
< en/boga >
[&estar/en/boga.GPPRED, VAR-1, VAR-2, VAR-3, VAR-4, VAR-5 |
1] }

$201$ + 0 {Que digan tantas tonterías está en boga.}

$202$ + 0 {Decir una estupidez tras otra está en boga.}

$203$ + 0 {Los sombreros para caballero ya no están en boga.}

$204$ + 0 {Se está en boga cuando se está de moda.}

$205$ + 0 {Los restaurantes en boga se encuentran en la avenida


principal.}

$299$ – * { }

$300$ { }

En total hemos estudiado 307 GPpred. La clase más productiva es


aquella cuya proyección lineal es N1 ser GPpred, con 153 entradas,
seguida por N1 estar GPpred con 104 entradas.

2.2. Los problemas encontrados a lo largo de este estudio son


numerosos:
2.2.1. GPpred que admiten gradación, cuando esta
característica es propia de los adjetivos predicativos, así en (5) Luis es
más de izquierdas que de derechas.
2.2.2. Aparentes GPpred que en realidad son nombres
predicativos (Npred): existen Npred que tienen un verbo de soporte
ser pero que aceptan la pasiva tener y aparecer con el verbo de soporte
tener. Si consideramos el verbo tener en (7) Luis tiene los ojos azules
y la alternancia Luis es de ojos azules, observamos que en este
ejemplo, tener es un verbo predicativo y puede alternar con la
preposición predicativa de que tiene como verbo de soporte a ser, a la
que se le puede aplicar una Red ORel: Luis, de ojos azules. De ahí que
quepa considerar que tener conserva la propiedad de alternar con la
preposición por lo que aspecto en (8) Es un chico de buen aspecto, es
un Npred que tiene como verbo de soporte real tener, pero que sin
embargo puede aparecer con ser de al que se le ha aplicado una Red
ORel, por lo que en realidad no se trataría de un GPpred ser de buen
aspecto, sino de un Npred introducido por una preposición
predicativa.

2.3. Observamos que en todas las listas de propiedades se


incluye el número 299 para señalar si el predicado puede ser ambiguo o
no. En el caso del GPpred estar a la sombra, un Pn, cuya proyección
lineal es N1 estar GPpred, y que significa ‘estar recluido en la cárcel’,
como en (9) El criminal estará a la sombra varios años, tenemos que
señalar con el signo + esta propiedad puesto que puede aparecer el
siguiente predicado: (10) Los chicos estaban a la sombra y las chicas
al sol, donde estar a la sombra en (10) también es un GPpred, Pn, cuyo
significado es ‘protegerse del sol’. La proyección lineal no siempre es
suficiente para discriminar las propiedades sintácticas de dos
predicados que coinciden en una única forma morfofonológica
polisémica. En algunos casos, pueden tener la misma proyección
lineal y, entonces, se tienen que diferenciar por sus propiedades
sintácticas, en general, propiedades transformacionales. Desde el punto
de vista de la semántica de marcos (frame semantics), lo que sucede
además es que los predicados se distinguen por tener distintos
argumentos conceptuales y, desde esta perspectiva, se podría encontrar
la conexión entre ambos planteamientos (semántico y sintáctico) y esa
conexión es precisamente la que se está estudiando en el proyecto en
el que se inscribe este artículo: crear un corpus con etiquetación
semántica que tenga aplicaciones para el procesamiento semántico
automático de la información textual en español, así como ampliar la
cobertura léxica y desarrollar las aplicaciones informáticas de un
sistema que procesa automáticamente la información léxica y
sintáctica mediante diccionarios y sintaxis computacionales, y
algoritmos de intersección de autómatas.
Bibliografía

FILLMORE, Charles (2001): The FrameNet Project: Tools for Lexicon


Building. <http://framenet.icsi.berkeley.edu/~framenet/book.html>
GARRIDO ÍÑIGO, Paloma (2004): “Grupos predicativos
preposicionales”. Documento electrónico. Barcelona: Laboratorio de
Lingüística Informática. <http://seneca.uab.es/lali>
MONTERO MARTÍNEZ, Silvia (2003): “Estructuración conceptual y
formalización terminográfica de frasemas en el subdominio de la
oncología”. Estudios de Lingüística Española. 19.
<http://elies.rediris.es/elies19>
SUBIRATS RUGGEBERG, Carlos (2001): Introducción a la sintaxis
léxica del español. Madrid: Iberoamericana.
SUBIRATS RUGGEBERG, Carlos & ORTEGA GIL, Marc (2000):
“Tratamiento automático de la información textual en español mediante
bases de información lingüística y transductores”. Estudios de Lingüística
Española. 10. <http://elies.rediris.es/elies10>

También podría gustarte