Documentos de Académico
Documentos de Profesional
Documentos de Cultura
El Espanol Como Lengua Aglutinante y Polisintetica PDF
El Espanol Como Lengua Aglutinante y Polisintetica PDF
Resumen:
En este trabajo se analiza el español coloquial hablado desde el punto de vista de la
tipología morfológica que distingue entre lenguas aislantes, aglutinantes y flexivas. Se
compara el español coloquial espontáneo con lenguas consideradas aislantes como el
chino, aglutinantes como el turco o el euskera y con las lenguas esquimales,
consideradas polisintéticas. La conclusión del trabajo es que el español coloquial es una
lengua tan aglutinante como pueda serlo el turco, el vasco o el yupí. Son las
convenciones ortográficas típicas de las lenguas europeas las que han llevado a los
lingüistas a pensar que hay lenguas aglutinantes y polisintéticas y no polisintéticas. Para
apoyar el análisis presentado en este artículo se recurre a propuestas recientes de Ö Dahl
(2004) y W. J. de Reuse (2009).
Palabras clave: tipología morfológica, morfología del español, aglutinación, polisíntesis
Summary:
In this paper spoken colloquial Spanish is analyzed from the point of view of the
traditional morphological typology that distinguishes isolating, agglutinative and
inflectional languages. Colloquial Spanish is compared with isolating languages such as
Chinese, agglutinative languages such as Turkish or Basque and with the so-called
polysynthetic languages such as the Eskimo languages. It is argued that colloquial
Spanish presents a degree of agglutination comparable to that of Turkish, Basque or
Yupi. The reason why Spanish and other European languages are not usually considered
as agglutinative lies in the fact that linguists rely on the orthographic conventions used
to write these languages. In order to support the arguments given in this paper some
recent proposals and analyses by Ö. Dahl (2004) and W. J. de Reuse (2009) are
discussed and adopted.
Contenido
1. La aglutinación universal
2. El mito de las lenguas aislantes y monosilábicas
3. El turco y el español como lenguas aglutinantes
4. El índice de aglutinación en euskera y en español
5. Caracterización de la palabra natural en la lengua española
6. El español coloquial como lengua polisintética
7. Conclusión: el español como lengua aglutinante y polisintética
1 La aglutinación universal
Al analizar la estructura morfológica de las lenguas del mundo, desde principios
del siglo XIX se viene haciendo una tricotomía entre lenguas aislantes, lenguas
aglutinantes y lenguas flexivas. Un ejemplo de lengua aislante sería el chino o
vietnamita, un ejemplo de lengua aglutinante sería el turco y un ejemplo de lengua
flexiva sería el ruso.
En esta tipología se tiene en cuenta fundamentalmente un factor decisivo: el grado de
fusión de los morfemas con las palabras. En las lenguas flexivas, hay un alto grado de
fusión, de forma que en una palabra latina como hominis ‘a los hombres’ no podemos
asignar los morfemas de dativo, plural y masculino de forma analítica a la terminación
“-is”. Dicho de otra forma, no podemos considerar que las determinaciones
morfológicas dativo + masculino + plural se correspondan de forma biunívoca con cada
uno de los elementos de la sílaba final “-is”. Por ello, se considera que la realización de
esa secuencia de morfemas se lleva a cabo de forma fusionada o sintética.
Cuando observamos la palabra del húngaro que traduce esa palabra latina: embereknek
‘a los hombres’ podemos comprobar fácilmente que al morfema dativo le corresponde
la sílaba nek y que al morfema de plural le corresponde la sílaba ek (en húngaro no hay
morfema de género). Por tanto, a la secuencia morfológica plural + dativo le
corresponde la secuencia ek + nek. De esta manera, obtenemos una bi-univocidad entre
morfema y morfo (realización fónica del fonema).
Como conclusión, vemos que hay dos tipos de lenguas según el grado de fusión en la
realización fonética de los morfemas: las flexivas (fusionantes) y las aglutinantes.
El esquema general es el siguiente:
LEX+M1+M2+M3 L+X+Y+Z
AGLUTINACIÓN
LEX+M1+M2+M3 L+X
FLEXIÓN
H. Reichenbach tiene toda la razón cuando critica, en este pasaje, que se tome como
base la palabra escrita para explicar cómo funcionan realmente las lenguas. Esta crítica
se basa en el hecho de que, en general, los sistemas de escritura son analíticos, de forma
que se separa lo que en la lengua hablada normal se aglutina. He aquí un ejemplo del
español. Lo que habitualmente se pronuncia en la lengua coloquial espontánea como
[matokáo lalotería] se escribe como me ha tocado la lotería: Es decir, se expresa como
una sucesión de cinco elementos lo que en el habla se expresa mediante dos elementos
que aglutinan diversos componentes (tres en el primer caso y dos en el segundo). De
todas formas, en el habla rápida lo que tendríamos sería un solo elemento
[matokàolalotería].
Sería absurdo decir que la expresión aglutinativa del español coloquial que acabo de
citar es una forma vulgar, defectiva o sumaria de la correspondiente forma escrita. El
uso coloquial de las lenguas no se realiza desde la escritura, dado que entonces los
analfabetos y las personas que aún no han aprendido a leer y escribir no podrían hablar.
Pero es claro que esa idea de la primacía de la escritura sobre el habla es imposible de
justificar científicamente. Lo único que podemos decir es que la versión escrita de esta
expresión se deriva de un análisis a posteriori o secundario de carácter analítico de ella.
Por tanto, si decimos que el español no es una lengua aglutinante porque escribimos me
ha tocado la lotería lo que hacemos en realidad es caracterizar, no la lengua española,
sino la forma de escribir esta lengua, la ortografía vigente. Sabemos perfectamente que
la estructura de una lengua natural no está determinada por la estructura del sistema de
escritura que se emplee para transcribirla. Hay lenguas que han cambiado de escritura
sin experimentar ningún cambio lingüístico decisivo.
Es una lengua aislante, porque cada carácter está separado del carácter siguiente
sílaba.
Imaginemos qué ocurriría si las reglas ortográficas del español nos obligaran a separar
las sílabas por espacios en blanco, como ocurre con la escritura china. Entonces la
oración española vista en la sección anterior habría de escribirse de la siguiente manera:
me ha to ca do la lo te ri a
Una vez escrito así, el español resultaría ser, si nos guiamos por la escritura como fuente
exclusiva de conocimiento lingüístico, una lengua monosilábica y aislante tal como
muchos ven el chino. En la ortografía normativa se escribe me ha tocado, pero incluso
esta forma no hace completa justicia a la naturaleza de esta expresión, ya que me y ha
están claramente aglutinados a tocado configurando una única expresión unitaria. Esta
forma escrita aunque más correcta que la que se dispone en sílabas aisladas, no hace
justicia a la aglutinación que se observa en la forma oral espontánea [mátokào].
Tanto el chino como el español son mucho más aglutinantes que lo que se puede
deducir de la escritura que, en ambos casos, falsea las verdaderas unidades de las
lenguas respectivas.
TURCO ESPAÑOL
oda ‘habitación’
odada ‘en la habitación’
odadaki ‘lo que está en la habitación’
odadakiler ‘los que están en la habitación’
odadakilerden ‘de los que están en la habitación’
Desde el punto de vista de las normas ortográficas del turco y del español la impresión
que da esta comparación es que el turco es una lengua aglutinante en la que una palabra
como oda ‘habitación’ puede ir seguida hasta de cuatro morfemas aglutinados:
oda+ da+ ki+ ler+ den. Lo que vemos en la traducción española son sintagmas
compuestos de varias palabras. Por ejemplo, en la traducción de la última palabra, lo
que tenemos es una secuencia de siete palabras ortográficas.
Pero vamos a comparar ahora el turco con el español hablado coloquial espontáneo sin
respetar las reglas ortográficas de la lengua española. Podríamos perfectamente obtener
algo como lo siguiente
de +l + o + s + de + l + a + (a)bitasión
oda + da+ ki+ ler+ den
ÍNDICE DE AGLUTINACIÓN
muy alto de 0,80 a 0,99
alto de 0,60 a 0,79
medio de 0,40 a 0,59
bajo de 0,20 a 0,39
muy bajo de 0,00 a 0,19
El propio Tovar da (Tovar 1981: 196) como índice de aglutinación del euskera 0,63, es
decir, un índice alto y como índice de aglutinación del español 0,06, es decir, un índice
muy bajo. Estos números se obtienen del recuento hecho sobre tres textos breves en
cada una de las lenguas.
Sin embargo, si aplicamos lo que he dicho en las secciones anteriores sobre la necesidad
de erradicar la escritura de las consideraciones tipológicas, los resultados del grado de
aglutinación del euskera y del español pueden variar mucho.
Consideremos, por ejemplo, el índice de aglutinación que se deduce de una expresión
española como las casas, suponiendo una secuencia de cinco unidades morfológicas: l
+ a+ s casa + s, podemos calcular el índice UM/EM como 3/5, dado que hay tres
uniones de elementos morfológicos: l+ a, la+ s y casa+ s. Por tanto, como 3/5 = 0,6
obtenemos un nivel alto de aglutinación. Pero este cálculo está hecho sobre la forma
escrita de esa expresión; en la forma hablada coloquial espontánea tenemos [laskásas],
es decir, un solo elemento y, por tanto tenemos un unión de elementos morfológicos
más, la que se da entre las y casa+ s. Por tanto, ahora el índice es 4/5 = 0,8, con lo cual a
partir de este ejemplo el español cambiaría de grado de aglutinación: pasaría de alto a
muy alto.
Para contrastar los datos de Tovar referidos a las diferencias respecto del índice de
aglutinación entre el euskera y el español, voy a continuación a comparar diez frases del
euskera con sus correspondientes traducciones al español y a partir de ahí voy a
comparar los índices de aglutinación obtenidos para las dos lenguas con el fin de extraer
conclusiones sobre el grado de aglutinación morfológica de ambas lenguas.
Las frases del euskera y sus respectivos análisis las tomo de la gramática de R. de Rijk
(2008) y adopto sin cambiarlos los análisis de sus secuencias morfológicas tal como
figuran en dicha gramática. Al lado de cada frase calculo el índice de aglutinación. En el
caso del español incluimos la forma ortográfica junto con la forma coloquial hablada y
calculo los índices correspondientes.
I
Ni-rekin ez d-u-zu-e gehi-ago lan-ik iza-n-go (De Rijk 2008: 1228) [8/14 = 0,57]
No tend-rás más problema-s con-migo [3/8 = 0,37]
no-tend-rás más-problema-s con-migo [5/8 = 0,62]
II
Ni-k zu z-a-it-u-t maite-ago arraintxo-ek ur-a baino (De Rijk 2008: 1226) [8/15 = 0,53]
Te am-o más que l-o-s pecec-it-o-s a-l agua [7/ 15 = 0,46]
te-am-o más que-l-o-s-pecec-it-o-s a-l-agua [10/15 =0,66]
III
Ber-e irakasle-a adin-a iza-n-go da (De Rijk 2008: 1223) [5/10 = 0,50]
Ser-á tan buen-o como su profesor [2/8 = 0,25]
Ser-á tan-buen-o como su-profesor [4/8 = 0,50]
IV
Beste asko beza-la-ko egun bat (De Rijk 2008: 1219) [2/7 = 0,28]
Un día como tod-o-s l-o-s demás [4/10 = 0,40]
un-día como-tod-o-s l-o-s-demás [6/10 = 0,60]
V
Ni-k gazte-rik gorde-tze-n d-u-t bihotz-a (De Rijk 2008: 1214) [7/12 = 0,58]
Manteng-o mi corazón joven [1/5 = 0,2]
manteng-o mi-corazón joven [2/5 = 0,4]
VI
Daniel-ek ber-e indar guzti-a-z jo-a z-u-en (De Rijk 2008: 1212) [7/ 13 = 0,53]
Daniel le ha pega-do con tod-a su fuerza [2/9 = 0,22]
Daniel le-ha-pega-do con-tod-a su-fuerza [6/9 = 0,66]
VII
Auto-a konpon-du-a d-u-t (De Rijk 2008: 1211) [5/8 = 0,62]
Teng-o el coche arregla-d-o [3/7 = 0,42]
teng-o el-coche arregla-d-o [4/7 = 0,57]
VIII
Ezin-go n-a-i-z mutilzahar geldi-tu (De Rijk 2008: 1201) [5/9 = 0,55]
No ser-é capaz de mantener-me solter-o [3/9 = 0,33]
No-ser-é capaz de-mantener-me solter-o [5/9 = 0,55]
IX
Ezkon-du berri-a n-a-i-z eta ez n-a-i-te-ke j-oa-n (De Rijk 2008: 1194) [11/18 = 0,61]
Me acab-o de casar y no pued-o ir [2/10 = 0,20]
me-acab-o de-casar y-no-pued-o ir [6/10 = 0,60]
X
Asper-tu e-gi-n n-a-iz, bada bakarr-ik utz-i n-a-u-te (De Rijk 2008: 1191) [10/17 = 0,58]
Sí que me h-e aburri-do porque me ha-n deja-do sol-o [5/15 = 0,33]
sí que-me-he-aburri-do porque me-h-a-n-deja-do sol-o [10/ 15 = 0,66]
En el siguiente cuadro vemos los resultados obtenidos en cada una de las diez
expresiones en los tres idiomas: euskera escrito, español escrito y español hablado.
ESPAÑOL ESPAÑOL
EUSKERA ESCRITO HABLADO.
0,57 0,37 0,62
0,53 0,46 0,66
0,5 0,25 0,5
0,28 0,4 0,6
0,58 0,2 0,4
0,53 0,22 0,66
0,62 0,42 0,57
0,55 0,33 0,55
0,61 0,2 0,6
0,58 0,33 0,66
0,535 0,318 0,582
La última de las filas es la media aritmética obtenida. Según esto, el euskera escrito
tiene un índice de aglutinación medio (0,53), el español escrito tiene un índice de
aglutinación bajo (0,31) y el español hablado coloquial tiene un índice de aglutinación
también medio, pero superior al del euskera (0,58).
Para interpretar adecuadamente estos números hay que tener en cuenta que comparamos
el euskera escrito con el español hablado coloquial y esto no es lícito, dado que la
ortografía euskérica tampoco refleja con total fidelidad la lengua coloquial. Por tanto, si
modificáramos la ortografía euskérica (Moreno Cabrera 2007-2008: 207-214), como
hemos hecho con la del español, para ajustarla a la lengua hablada, el índice de
aglutinación obtenido sería idéntico o mucho más parecido aún al del español.
La conclusión que cabe extraer de todo esto es que el español y el euskera tienen un
grado de aglutinación semejante, contra lo que se podría pensar a partir de los datos que
aparecen en el artículo de A. Tovar.
Esta conclusión no es en absoluto sorprendente porque en este artículo defiendo que
todas las lenguas son aglutinantes en una medida similar y que algunas de ellas son
además flexivas o fusionantes en distintos grados.
Quizás no todas estas expresiones sean igual de usuales o normales, pero no obtenemos
en ningún caso secuencias agramaticales tales como las enumeradas en la lista
inmediatamente anterior a ésta.
Por tanto, si queremos vislumbrar cómo son las palabras de la lengua española coloquial
espontánea, lo que podemos denominar palabras naturales, tenemos que renunciar a
considerar como conformadas de tres palabras secuencias ortográficas como los sin
casa. En efecto, esta secuencia en concreto consta de tres palabras ortográficas: los, sin
y casa, pero no le debería ya caber la menor duda a quien esté leyendo estas páginas que
esas tres palabras ortográficas constituyen una única palabra de la lengua española
coloquial espontánea: lossincasa. Alguien podría objetar que, si emitimos esta
expresión en una forma cuidadosa y sosegada podríamos emitirla como tres palabras
independientes. Esto se puede hacer en la lengua coloquial por motivos de énfasis o
insistencia; por ejemplo, en un caso de mala comprensión por parte de nuestros
interlocutores, pero en todo caso sería una forma marcada o excepcional de
pronunciación. Por supuesto y con objetivos similares, podríamos también pronunciar
casa como dos sílabas independientes: ca sa. Esto se puede hacer y a veces se hace
con propósitos de énfasis o de puntualización, pero basta reflexionar un poco para
percatarse de que ello no invalida en modo alguno que casa sea una unidad morfológica
de la lengua natural tanto hablada como escrita (en este caso coinciden ambas formas de
concebir la lengua).
Pero ¿disponemos de algunos criterios para decidir cómo identificar esas palabras
naturales que son unidades de la lengua hablada espontánea? Lamentablemente, los
lingüistas se han dedicado sobre todo a la palabra ortográfica, la que es reconocida en la
ortografía, y se han ocupado muy poco de las unidades de la lengua hablada espontánea.
Voy a considerar ahora las propuestas de un lingüista que nos ha ofrecido algunos
criterios muy interesantes para caracterizar lo que denomino en este artículo palabra
natural; es decir, las unidades máximas con significado que son operativas en la lengua
oral espontánea y que son la base de los procesos de emisión y de interpretación
lingüísticos. Ese lingüista es el sueco Östen Dahl autor de un libro publicado en 2004
sobre la evolución y mantenimiento de la complejidad lingüística (Dahl 2004). En el
capítulo décimo de este libro, el autor investiga el desarrollo y alcance de los procesos
de incorporación, mediante la cual una palabra pasa a formar parte de otra como
elemento, tal como se puede ver en compuestos españoles como sacapuntas o
buscachollos; el primer ejemplo está establecido en la lengua habitual y el segundo
ejemplo se da para mostrar que este proceso es productivo y que se pueden crear nuevos
compuestos por incorporación de forma más o menos libre o espontánea sin que esto
suponga una ruptura del sistema. Observa Dahl que este proceso está severamente
restringido en las diversas lenguas en las que se produce. La incorporación se realiza
solo en ciertas condiciones. Por ejemplo, la palabra incorporada no puede ir provista de
determinantes: no hay sacalaspuntas o buscaloschollos, por ejemplo. La palabra
incorporada tiene un significado genérico y nunca específico como en
*sacaestaspuntas, *buscaaquelloschollos. Para Dahl las restricciones que se imponen a
la incorporación serían debidas al hecho de que hay unos límites generales en la
creación de las posibles unidades máximas de la lengua hablada que constituirían esas
unidades que denomino en este artículo como palabra natural. Estas unidades están
determinadas por lo que Dahl denomina paquetes que son las unidades máximas en las
que puede realizarse de modo eficiente tanto la expresión lingüística por parte de la
persona hablante como la interpretación lingüística por parte de la persona oyente (Dahl
2004: 257-259). Dadas las limitaciones de la memoria de trabajo a corto plazo de los
seres humanos, está claro que esas unidades máximas de producción y procesamiento
lingüísticos en el habla natural no pueden tener una extensión indefinidamente grande,
sino que van estar delimitadas de forma muy precisa para poder realizar con la máxima
eficacia y de acuerdo con las limitaciones de memoria y planificación articulatoria, la
expresión lingüística natural en la lengua coloquial espontánea, caracterizada
precisamente por su automatismo y rapidez.
Para Dahl el paquete es una unidad muy integrada que se pronuncia en un segmento
prosódico que correspondería a una orden única en la producción y a un proceso
unitario en la recepción de las expresiones lingüísticas. Esa integración y las
restricciones de espacio hacen que sea una unidad con una capacidad severamente
limitada para contener elementos significativos.
Las necesidades relativas a la rapidez, el aprovechamiento y la automatización del acto
lingüístico comunicativo le obligan a la persona hablante a introducir en cada paquete o
unidad máxima del habla coloquial el mayor número posible de elementos. Los límites
vienen propiciados tanto por las posibilidades articulatorias de los seres humanos como
por sus posibilidades de procesamiento rápido del lenguaje.
En su libro, Dahl nota tres constricciones fundamentales sobre los paquetes (Dahl 2004:
258), que en este artículo denomino palabras naturales (PN).
1. Las expresiones léxicas referenciales (ELR) no tienen cabida fácil en las palabras
naturales. Una ELR es un sintagma nominal que contiene al menos un elemento
léxico y que tiene una referencia específica. Los nombres propios, por ejemplo, son
ELR típicos; por su parte los pronombres no son ELR porque aunque se usen
referencialmente no son elementos con contenido estrictamente léxico. Por tanto, los
nombres propios son PN autónomas pero los pronombres en general no lo son.
2. Un elemento focalizado (EF) no puede integrarse en una palabra natural, sino que
constituye el mismo una PN completa en sí.
3. Las expresiones dotadas de una estructura interna (EDEI) constituyen en sí
mismas al menos una PN y no se pueden integrar en una PN mayor.
Vamos ahora a ver unos ejemplos de la aplicación de estos principìos propuestos por
Dahl para determinar las posibles PN que se pueden obtener.
Empecemos por la siguiente expresión:
En la lengua oral espontánea coloquial esta expresión se diría, por ejemplo, [María
bèbeté] y, por tanto, constaría de dos PN (María y bebe té). ¿Está en consonancia esto
con los criterios aducidos por Dahl? Lo está completamente. En efecto, María es una
ELR y, por tanto, en sí misma constituye una PN. Por su parte, en bebe té tenemos un
objeto incorporado al verbo. La palabra té es no referencial en este caso y, por tanto, se
puede incorporar el verbo para obtener bebe té. Por consiguiente, bebe se te puede
considerar como una PN máxima, en la que no cabe, por ejemplo, María, por ser un
ELR. Por consiguiente tenemos el siguiente resultado:
Las expresiones con clíticos como selobebe se califican en ocasiones como grupo clítico
(Nespor y Vogel 1994: 169-189) y nunca como palabras naturales, tal como hago aquí,
probablemente por el peso que tiene la tradición ortográfica que, en muchos casos, hace
que los clíticos se escriban separados de la palabra en la que se apoyan necesariamente,
aunque no puedan ser considerados como palabras, en términos de Nespor y Vogel:
“Puesto que lo que es compuesto de algo de tal modo que el todo constituye
más, las letras «b» y «a» no es lo mismo que «ba» […] La sílaba es,
una unidad, no como un montón, sino como una sílaba, y la sílaba no es, sin
Este pasaje de la Metafísica aristotélica es de suma importancia para lo que aquí estoy
tratando. Esta importancia ha sido puesta de relieve por un investigador en los
siguientes términos:
De forma análoga nos enfrentamos con la palabra natural (PN). La palabra natural no es
un mero agregado que surge de añadir elementos aglutinados a la palabra ortográfica, de
manera que en los niños tenemos una aglutinación de los a niños, considerada como la
unidad morfológica adecuada. Es una unidad superior que no se puede reducir a una
mera concatenación de elementos. Dicho de otra manera, losniños es una PN con una
estructuración determinada que no surge de una simple concatenación de elementos,
igual que la sílaba natural pa no es una simple concatenación de dos letras, sino un
fenómeno unitario complejo que no se puede reducir a una simple concatenación.
La idea de que se aglutina los a niños viene de la suposición de que la unidad
morfológica propiamente dicha de la lengua es niños y a esta unidad se le añade un
artículo. Pero el problema es que los y niños son unidades de la lengua escrita que
proceden de un análisis previo por parte de diversas personas o instituciones, que no
obedece a los procedimientos que usan las personas corrientes al hablar. Son unidades
del análisis que se hace de la lengua, pero eso no significa que sean unidades de la
lengua natural. Considerar que en los niños tenemos dos palabras naturales es un
absurdo manifiesto desde el punto de vista de la lengua natural, dado que los no es un
elemento autónomo que se comporte como tal en el habla real.
Hay buenas razones para pensar que existen unidades morfológicas máximas tales como
la PN que estoy caracterizando en este artículo. Estas razones están en las limitaciones y
determinaciones de la naturaleza psico-fisiológica de los seres humanos. La longitud y
complejidad de las PN están necesariamente determinadas por las características
psíquicas y físicas de los seres humanos y tiene que ver con la longitud de lo que
podemos manejar articulatoriamente de forma rápida y automática, como se usan las
lenguas naturales, y de lo que podemos analizar de forma rápida utilizando nuestra
memoria de trabajo a corto plazo, que nos limita de forma severa.
Por esa razón hay una unidad morfológica de las lenguas naturales adaptada
precisamente a esos condicionamientos, que es la PN. Los condicionamientos que dan
lugar a las palabras ortográficas (PO) nada tienen que ver con esos condicionamientos
naturales de la PN, sino que dependen de las habilidades intelectuales de quienes
realizan el análisis y de las tradiciones culturales que les condicionan. Por eso es difícil
que coincidan los conceptos de PO y PN. Y también por esa razón no es legítimo
estudiar las unidades morfológicas de las lenguas naturales sobre la base de las unidades
establecidas de modo convencional para las lenguas escritas, como ocurre normalmente.
17. Neghyaghtughyugumayaghpeteaa
negh-yaghtugh-yug -uma-yagh -pete -aa
comer-ir-querer-pasado-afijo frustrativo-afijo inferencial-3 persona
‘Resulta que quería ir a comerlo pero…’
Pero… ¿Realmente podemos considerar que expresiones como la que acabamos de citar
son unidades de una lengua natural, son palabras naturales? Esta pregunta se la ha hecho
una investigadora de las lenguas indígenas de América del norte. Se trata de M. Mithun
(1996: 138-139). Esta autora cita la siguiente palabra del mohaqués (Mohawk), lengua
iroquesa, obtenida de una persona hablante nativa y que es un tipo de palabra bastante
normal en esta lengua
18. sahuwanhotukwahse’
s-a-huwa-nho-tu-kw-ahse’
de nuevo-PASADO-ella a él- puerta-cerrar-des-para-PERFECTIVO
‘Ella le abrió la puerta de nuevo’
Según Mithun no cabe la menor duda de que esta expresión es una palabra en
mohaqués. Para demostrarlo utiliza los siguientes siete criterios.
En primer lugar, las personas hablantes nativas del mohaqués la consideran
como una unidad, independientemente de que la hayan escrito o no alguna vez
en su lengua.
En segundo lugar, estas expresiones se expresan de forma continua, sin hacer
ninguna pausa entre sus elementos.
En tercer lugar, este elemento no puede ser interrumpido por otros elementos: no
se puede entrometer ningún elemento adicional en la palabra.
En cuarto lugar, los componentes de esa palabra no se reconocen por parte de las
personas hablantes cuando se emiten aisladamente.
En quinto lugar, el orden de los elementos es fijo y no se puede cambiar: si se
cambia el orden, la palabra se vuelve irreconocible.
En sexto lugar, algunos de los morfemas poseen diferente forma según
aparezcan en un lugar u otro de la palabra.
En séptimo lugar, hay un único acento dominante en toda la palabra. Desde el
punto de vista prosódico es una unidad.
19. [eskenóselandào]
[es-ke-no-se-l(o)-a-n-da-o]
Es que no se lo han dado
Esta expresión contiene nueve elementos, dos más que la del mohaqués que analiza
Mithun. ¿Funciona de modo similar a la expresión mohaquesa según los siete criterios
aducidos?
Según el primer criterio, los hablantes deben reconocer esa expresión como
conformando una unidad. No cabe duda de que esto es así, porque toda persona de habla
nativa española identifica esa expresión y la analiza globalmente sin la menor dificultad.
El segundo criterio se aplica también a esta expresión porque se pronuncia de una sola
vez, sin hacer pausas entre sus elementos. Si se hiciera una pausa entre no y se
obtendríamos dos oraciones yuxtapuestas: Es que no. Se lo han dado. Y si hiciéramos
una pausa entre se y lo obtendríamos otras dos oraciones yuxtapuestas: Es que no sé. Lo
han dado. Las segmentaciones: *Esquenoselo. Han dado, *Esqueno. Selo. Han dado,
son imposibles. Por tanto este criterio también se puede aplicar a la palabra española.
El tercer criterio consiste en introducir algún elemento para interrumpir la palabra. Por
ejemplo la expresión adverbial claro. Este adverbio puede aparecer después de es para
obtener Es claro que no se lo han dado, pero entonces obtenemos una construcción
diferente. Si introducimos claro como un parentético: *Es, claro, que no se lo han dado,
la construcción es anómala. Si introducimos claro después de esque: *Es que claro no
se lo han dado la construcción es anómala a no ser que interpretemos claro como
predicado, pero entonces es otra construcción distinta. La única posibilidad es
introducirlo como parentético: Es que, claro, no se lo han dado. Las dos comas indican
precisamente que se está interrumpiendo una unidad y que se trata de un elemento ajeno
a la palabra, que tiene carácter pragmático. No se puede introducir claro después de no,
ni siquiera como parentético: *Es que no claro se lo han dado. Tampoco se puede
introducir después de se: *Es que no se claro lo han dado, ni después de lo; *Es que no
se lo claro han dado, ni después de han: *Es que se lo han claro dado.
Alguien podría objetar que claro nunca puede aparecer dentro de un elemento
derivativo o flexivo de una palabra: *niño-claro-s o *cas-claro-itas. Esto es cierto en
general en el caso de los morfemas flexivos y derivativos; pero en este artículo estoy
manteniendo que la PN, frente a la PO, consta de esos morfemas flexivos y derivativos
más otros elementos aglutinados como los clíticos, que tienen una menor integración
morfológica con el tema lexemático, pues son externos a él. Por tanto, el argumento no
es válido en este caso porque solo vale para una parte de lo que se considera aquí
palabra natural (PN), pero no para toda ella.
El cuarto criterio consiste en el hecho de que algunos de los componentes de esa
expresión no son reconocidos por las personas hablantes cuando se emiten
aisladamente. En el caso que nos ocupa, vimos al hablar sobre el punto segundo
expresiones como esqueno, noselo, lohan, quenose, que no va a ser reconocidas como
unidades lingüísticas por las personas hablantes nativas del español. Este criterio se
cumple perfectamente.
El quinto criterio se cumple también. No podemos cambiar el orden de los elementos si
no queremos obtener auténticos monstruitos morfológicos. He aquí algunos ejemplos:
Es no se que le han dado, Le han no se dado es que, Es dado que no se le han, Han
dado se le es que no y otros muchos más.
El sexto criterio se cumple también cuando observamos que algunos morfemas tienen
distinta forma según su posición, de manera que, en el ejemplo que nos ocupa, lo
aparece simplemente como l seguido de han.
El séptimo criterio también lo cumple la expresión [eskenóselandào], en donde el acento
dominante está en el elemento no. También podría aparecer en el elemento dao:
[eskenòselandáo], dependiendo del énfasis. En cualquier caso el otro elemento que
puede recibir acento lo recibe secundario. ¿Qué ocurriría si en esta expresión hubiera
dos acentos principales, uno en no y otro en dáo? Pues simplemente que estaríamos ante
dos unidades diferentes: Es que no. Se la han dado.
Por consiguiente, los mismos criterios que llevan a decir que la palabra del mohaqués es
una unidad morfológica máxima de la lengua hablada, se pueden aplicar a la unidad
morfológica del español coloquial hablado que acabamos de analizar.
¿Qué consecuencias puede tener esto para la determinación del tipo morfológico al que
pertenece el español hablado coloquial?
En el mismo artículo al que me referí anteriormente, Greenberg (1954: 12) propone un
índice de síntesis para medir la complejidad morfológica de la palabra. Este índice se
obtiene mediante la división M/P donde M es el número de morfemas y P es el número
de palabras. El número más bajo que se podría obtener es 0 si solo hay palabras léxicas
en una lengua y no hay morfemas, es decir si tenemos en un texto supongamos 10
palabras y cero morfemas (todas las palabras son lexemas), tendríamos entonces 0/10 =
0. No existe ninguna lengua de este tipo, ya que todas las lenguas del mundo tienen
elementos morfemáticos; ninguna lengua puede funcionar solo con elementos léxicos.
Hago una interpretación más estricta que la de Greenberg, ya que para este autor los
lexemas cuentan también como morfemas.
A. Tovar también usa este índice (Tovar 1981: 186) y lo define en los mismos términos
que Greenberg, según los cuales en amá-ba-mos hay tres morfemas, entendiendo
morfema como unidad significativa. Sin embargo, aquí considero que amá-ba-mos
consta de solo dos morfemas (ba y mos) más un lexema (ama). Sobre la cuestión de qué
ha de entenderse por palabra Tovar explica lo siguiente:
Este párrafo es muy revelador porque nos indica cómo se utiliza la ortografía para hacer
comparaciones tipológicas, lo cual es nefasto, porque la palabra ortográfica no es una
unidad lingüística natural sino inventada por una determinada tradición cultural. Como
ya hemos visto en las secciones anteriores y como vamos a ver en esta, la utilización de
la PO en vez de la PN supone una grave distorsión de los datos y compromete
gravemente la comparación tipológica.
Tovar (1981: 190) da el siguiente cuadro sobre los grados observables del índice de
síntesis:
ÍNDICE DE SÍNTESIS
muy alto de 2,35 a 2,59
alto de 2,09 a 2,34
medio de 1,83 a 2,08
bajo de 1,58 a 1,82
muy bajo de 1,33 a 1,57
Según esta determinación, las lenguas cuyas palabras tengan una media de menos de un
morfema por palabra tienen un índice de síntesis bajo, a partir de dos morfemas por
palabra, el índice sube de alto a muy alto.
Tovar (1981: 197) toma el dato del índice de síntesis del esquimal de Greenberg, que es
3,72, es decir, un índice altísimo y lo contrasta con el del español, que según su estudio
basado en tres textos españoles, es 1,69. Es decir, mientras que el esquimal tiene según
Greenberg un índice de síntesis altísimo, el español, según Tovar, tiene un índice de
síntesis bajísimo. Es decir, las lenguas esquimales son polisintéticas y el español no lo
es.
Pero voy a mostrar ahora mismo que el origen de esta diferencia tan grande está
precisamente, no en el carácter lingüístico del español, sino en el carácter ortográfico
del sistema utilizado en la ortografía estándar de nuestra lengua. Por consiguiente, voy a
mostrar que lo que tiene un grado bajo de síntesis no es la lengua española hablada, sino
la lengua española escrita según las normas académicas reconocidas institucionalmente.
Para ello, voy a comparar un texto de una lengua de la familia esquimal, el groenlandés,
una variedad inuí. Berge (2009: 191) recoge un texto groenlandés obtenido a finales del
siglo XIX. Aparece a continuación y se consigna al final de él el índice de síntesis.
Egede fue a vigil-ar por l-a noche. Había much-o-s hombre-s situad-o-s
frente a l-a ventana. Un-a noche como de costumbre hab-ía un hombre
delante de l-a casa. L-o sigu-ió pero cuando l-o hab-ía segui-do casi hasta l-a
playa, de repente dej-ó de ver-l-o; hab-ía llega-do hasta allí y no avanz-ó
más. Nunca más se le volvi-ó a ver. [23/58 = 0,39]
Hemos respetado las palabras ortográficas y señalado los morfemas de cada una de esas
palabras. Hay 23 morfemas y 58 palabras, con lo que tenemos un índice de síntesis muy
bajo, que no llega a 1 (0,39). Para situar el español en la graduación dada por Tovar
tenemos que contar los lexemas como morfemas. Si lo hacemos así obtendremos 82/ 58
= 1,4; es decir, obtenemos un grado de síntesis muy bajo.
Pero si en vez de considerar las PO como unidades de la lengua española hablada,
consideramos las PN, es decir las palabras tal como aparecen en el habla coloquial
espontánea, los resultados van a ser radicalmente distintos. He aquí una transcripción
del texto español muchísimo más cercana al español hablado espontáneo que la
realizada anteriormente según las reglas ortográficas vigentes:
F D CPN S
Productividad sí no sí sí
Recursividad no no sí sí
Concatenación necesaria no no sí sí
Orden variable no no sí sí
Interacción sintáctica sí no sí sí
Cambio categorial no sí sí sí
20. Neghyaghtughyugumayaghpeteaa
negh-yaghtugh-yug -uma-yagh -pete –aa
comer-ir-querer-pasado-afijo frustrativo-afijo inferencial-3 persona
‘Resulta que quería ir a comerlo pero…’
La productividad se refiere al hecho de que se pueden obtener estas palabras naturales
como la vista de modo sistemático y abierto. No existen como palabras en una lista
memorizada por las personas hablantes, sino que se crean de forma ocasional. Según
observa de Reuse, en la expresión de 20 solo hay dos elementos obligatorios: negh y –
aa; los demás elementos son opcionales y podrían aparecer o no, con lo cual se pueden
obtener diversas palabras naturales más breves en las que aparecen algunos de los afijos
morfológicos, por lo que se pueden formar treinta palabras diferentes con distintas
combinaciones de afijos (de Reuse 2009: 23).
Consideremos desde este punto de vista la expresión de la lengua española coloquial
que comparábamos con la forma del yupí aducida: eskenoselandao (es que no se lo han
dado, en forma ortográfica). Es evidente que, como en el caso del ejemplo del yupí, es
una palabra natural (PN) de formación ocasional que no parece acertado considerar
como un elemento formado y almacenado en la memoria de las personas hablantes. Por
otro lado, como ocurre en el caso del yupí, la forma andao sería el núcleo obligatorio
desde el punto de vista de la buena formación como PN, los demás elementos son
concatenados de forma opcional. De hecho, podemos también obtener las siguientes
variantes según los elementos que se añadan o se dejen de lado: noandao, nolandao,
noselandao, kelandao, kesalandao, eskelandao, eskeselandao. Todas estas formas son
ocasionales y libremente generadas y procesadas por las personas usuarias de la lengua
española. Por tanto, desde el punto de vista de la productividad, las dos expresiones se
comportan de modo análogo.
En cuanto a la recursividad, De Reuse (2009: 24) ofrece el siguiente ejemplo ilustrativo:
21. iitghesqesaghtiisqaa
itegh-sqe-yaghtugh-sqe–aa.
entrar-pedir-ir-pedir-3persona del singular
‘Lej pidió que lek pidiera entrar’
En este ejemplo, el elemento sqe ‘pedir’ aparece en dos ocasiones, por lo que se está
utilizando recursivamente.
Algo similar podemos ver en algunas PN españolas como, por ejemplo, losdelosniños,
en donde el artículo los aparece en dos posiciones con referencias diferentes, tal como
ocurre en el ejemplo del yupí que aporta De Reuse. Por tanto, en este aspecto las PN del
español se comportan como las PN del yupí.
La concatenación es típica de todas las palabras que estamos viendo en este artículo; por
ello no hace falta ilustrar esta característica de la CPN.
El orden variable lo ilustra de Reuse con los siguientes dos ejemplos del yupí:
22. aananiitkaa
aane -nanigh -utke -aa
salir-dejar de- por ello-ind.3s.3s
‘Ha dejado de salir por ello.’
23. aanutkenanighaa
aane -utke -nanigh -aa
salir-por ello-dejar de-ind.3s.3s
‘Ha dejado de salir por ello
En estas oraciones aparece el morfema utke en dos posiciones diferentes, aunque las
oraciones tienen el mismo significado.
En español coloquial no es infrecuente encontrar este tipo de movilidad. Por ejemplo, si
comparamos el vulgar mesecayó con el culto se me cayó, observamos dos órdenes
alternativos del mismo elemento. También se pueden ver variaciones en el español
coloquial entre, por ejemplo, melodé, frente al estándar démelo para el imperativo.
Respecto a la interacción con la sintaxis, de Reuse (2009: 26) aporta el siguiente
ejemplo de yupí siberiano:
24. atan aangelghiimeng qikmilguuq.
ata -n aange-lghii -meng qikmigh-lgu –uq
padre-posesivo .2s.abs.sg. ser grande-intr.ptcp-mod.sg. perro-tener -ind.3s
‘Tu padre tiene un perro grande’
En este caso vemos que la atribución del adjetivo aange (‘grande’) se aplica a un
elemento que está en el interior de una PN, es decir a qikmigh (‘perro’).
En español también podemos ver casos de interacción la sintaxis, como por ejemplo el
regalo locompré ayer, donde la PN locompré contiene un elemento relacionado con el
objeto el regalo.
El cambio categorial lo aprecia de Reuse (2009: 27) en el siguiente ejemplo del yupí
central siberiano:
25. yughaghvigllangyugtut
yughagh-vig-ghllag-nge -yug –tut
rezar -lugar-grande-adquirir-querer-indicativo 3persona
‘Quieren adquirir una gran iglesia’
Este autor observa que la expresión verbal yughagh- ‘rezar’ cambia categorialmente a
nombre en la forma yughaghvig- ‘iglesia’ y luego, a otro nombre yughaghvigghllag
‘iglesia grande’ y, por último vuelve a convertirse en verbo en yughaghvigghllagnge
‘adquirir una gran iglesia’.
En el ejemplo del español coloquial que vimos al ilustrar la recursividad losdelosniños
también puede verse este cambio categorial: losniños que es un nombre, pasa a
modificador nominal (delosniños) y luego otra vez a nombre (losdelosniños).
Como consecuencia de los análisis precedentes y del concepto de CNP, de Reuse
plantea introducir el concepto de CNP entre los dos procedimientos fundamentales de la
morfología:
Esta introducción supone una modificación sustancial del tipo de morfología clásica a
que aludí al principio de este artículo en los siguientes términos:
Esta conclusión deja abierta la puerta a la idea de que todas las lenguas del mundo son
polisintéticas en mayor o menor grado. Acabamos de ver en esta sección que el español
coloquial, ajeno a las convenciones analíticas de la lengua escrita, es una lengua tan
polisintética como el yupí siberiano central.
REFERENCIAS BIBLIOGRÁFICAS