Está en la página 1de 36

[En José María Santos Rovira (ed.

) Ensayos de Lingüística Hispánica, Faculdade de


Letras: Universidade de Lisboa, 2014, pp. 177-216]

EL ESPAÑOL HABLADO COMO LENGUA


AGLUTINANTE Y POLISINTÉTICA
Juan Carlos Moreno Cabrera
Universidad Autónoma de Madrid

Resumen:
En este trabajo se analiza el español coloquial hablado desde el punto de vista de la
tipología morfológica que distingue entre lenguas aislantes, aglutinantes y flexivas. Se
compara el español coloquial espontáneo con lenguas consideradas aislantes como el
chino, aglutinantes como el turco o el euskera y con las lenguas esquimales,
consideradas polisintéticas. La conclusión del trabajo es que el español coloquial es una
lengua tan aglutinante como pueda serlo el turco, el vasco o el yupí. Son las
convenciones ortográficas típicas de las lenguas europeas las que han llevado a los
lingüistas a pensar que hay lenguas aglutinantes y polisintéticas y no polisintéticas. Para
apoyar el análisis presentado en este artículo se recurre a propuestas recientes de Ö Dahl
(2004) y W. J. de Reuse (2009).
Palabras clave: tipología morfológica, morfología del español, aglutinación, polisíntesis

Summary:
In this paper spoken colloquial Spanish is analyzed from the point of view of the
traditional morphological typology that distinguishes isolating, agglutinative and
inflectional languages. Colloquial Spanish is compared with isolating languages such as
Chinese, agglutinative languages such as Turkish or Basque and with the so-called
polysynthetic languages such as the Eskimo languages. It is argued that colloquial
Spanish presents a degree of agglutination comparable to that of Turkish, Basque or
Yupi. The reason why Spanish and other European languages are not usually considered
as agglutinative lies in the fact that linguists rely on the orthographic conventions used
to write these languages. In order to support the arguments given in this paper some
recent proposals and analyses by Ö. Dahl (2004) and W. J. de Reuse (2009) are
discussed and adopted.

Key words: Morphological typology, Spanish morphology, agglutination, polysynthesis

Contenido
1. La aglutinación universal
2. El mito de las lenguas aislantes y monosilábicas
3. El turco y el español como lenguas aglutinantes
4. El índice de aglutinación en euskera y en español
5. Caracterización de la palabra natural en la lengua española
6. El español coloquial como lengua polisintética
7. Conclusión: el español como lengua aglutinante y polisintética
1 La aglutinación universal
Al analizar la estructura morfológica de las lenguas del mundo, desde principios
del siglo XIX se viene haciendo una tricotomía entre lenguas aislantes, lenguas
aglutinantes y lenguas flexivas. Un ejemplo de lengua aislante sería el chino o
vietnamita, un ejemplo de lengua aglutinante sería el turco y un ejemplo de lengua
flexiva sería el ruso.
En esta tipología se tiene en cuenta fundamentalmente un factor decisivo: el grado de
fusión de los morfemas con las palabras. En las lenguas flexivas, hay un alto grado de
fusión, de forma que en una palabra latina como hominis ‘a los hombres’ no podemos
asignar los morfemas de dativo, plural y masculino de forma analítica a la terminación
“-is”. Dicho de otra forma, no podemos considerar que las determinaciones
morfológicas dativo + masculino + plural se correspondan de forma biunívoca con cada
uno de los elementos de la sílaba final “-is”. Por ello, se considera que la realización de
esa secuencia de morfemas se lleva a cabo de forma fusionada o sintética.
Cuando observamos la palabra del húngaro que traduce esa palabra latina: embereknek
‘a los hombres’ podemos comprobar fácilmente que al morfema dativo le corresponde
la sílaba nek y que al morfema de plural le corresponde la sílaba ek (en húngaro no hay
morfema de género). Por tanto, a la secuencia morfológica plural + dativo le
corresponde la secuencia ek + nek. De esta manera, obtenemos una bi-univocidad entre
morfema y morfo (realización fónica del fonema).
Como conclusión, vemos que hay dos tipos de lenguas según el grado de fusión en la
realización fonética de los morfemas: las flexivas (fusionantes) y las aglutinantes.
El esquema general es el siguiente:

LEX+M1+M2+M3  L+X+Y+Z
AGLUTINACIÓN

LEX+M1+M2+M3  L+X
FLEXIÓN

En la aglutinación, al lexema (LEX) le sigue una secuencia de morfemas (M1 + M2 +


M3) y esto se realiza fonológicamente () a través de la expresión fónica del lexema
(L) seguida de una secuencia de expresiones fónicas (X+Y+Z) que, analíticamente,
realizan cada uno de los morfemas.
En la flexión, al lexema (LEX) le sigue una secuencia de morfemas (M1 + M2 + M3) y
esto se realiza fonológicamente () a través de la expresión fónica del lexema (L)
seguida de una expresión fónica (X) que expresa fonológicamente la secuencia
morfemática de forma sintética.
El concepto de aglutinación que estamos manejando es bastante técnico: se refiere a la
relación bi-unívoca entre una secuencia de morfemas y una secuencia de sílabas.
Sin embargo, existe otro concepto de aglutinación más general que se deriva del
carácter lineal del significante y que consiste en que los elementos lingüísticos se
disponen de forma sucesiva e inmediata en el habla normal espontánea. Este tipo de
aglutinación se da, por consiguiente, en todas las lenguas y podemos denominarla
aglutinación universal.
Este concepto de aglutinación fue perfectamente descrito por un filósofo y lógico que
también se ocupó del estudio de las lenguas naturales. Se trata de Hans Reichenbach
(1891-1953). El siguiente pasaje está extraído de su libro de introducción a la lógica
simbólica, que contiene un amplio estudio sobre la lógica de las lenguas naturales. Es
muy interesante porque pone de manifiesto la influencia nefasta que ha tenido la
escritura en la determinación de la índole de las lenguas naturales, tal como veremos a
continuación:

“La definición gramatical de palabra como un grupo de letras separadas unas


de otras por un intervalo no es satisfactoria: lo que es una palabra en una
lengua puede ser expresado por varias palabras en otra, mientras que las
proposiciones siempre se traducen como proposiciones. La lengua alemana
es conocida por sus largas palabras compuestas, tales como
Eisenbahnknotenpunkt que significa railroad junction [‘cruce ferroviario’]
en inglés. La regla que determina que las palabras ‘rail’ y ‘road’ se escriben
como una palabra, mientras que ‘junction’ se escribe separadamente, es
puramente convencional. La lengua turca, que usa muchos sufijos, a veces
expresa una oración completa en una palabra. Así, la palabra turca
‘alabıleceğim’ es una oración y significa ‘podré comprar’. No deberíamos
olvidar que en todas las lenguas la división entre palabras desaparece más o
menos tan pronto como hablamos, ya que el hablar no hacemos pausas entre
la mayor parte de las palabras (Reichenbach 1947:5).

H. Reichenbach tiene toda la razón cuando critica, en este pasaje, que se tome como
base la palabra escrita para explicar cómo funcionan realmente las lenguas. Esta crítica
se basa en el hecho de que, en general, los sistemas de escritura son analíticos, de forma
que se separa lo que en la lengua hablada normal se aglutina. He aquí un ejemplo del
español. Lo que habitualmente se pronuncia en la lengua coloquial espontánea como
[matokáo lalotería] se escribe como me ha tocado la lotería: Es decir, se expresa como
una sucesión de cinco elementos lo que en el habla se expresa mediante dos elementos
que aglutinan diversos componentes (tres en el primer caso y dos en el segundo). De
todas formas, en el habla rápida lo que tendríamos sería un solo elemento
[matokàolalotería].
Sería absurdo decir que la expresión aglutinativa del español coloquial que acabo de
citar es una forma vulgar, defectiva o sumaria de la correspondiente forma escrita. El
uso coloquial de las lenguas no se realiza desde la escritura, dado que entonces los
analfabetos y las personas que aún no han aprendido a leer y escribir no podrían hablar.
Pero es claro que esa idea de la primacía de la escritura sobre el habla es imposible de
justificar científicamente. Lo único que podemos decir es que la versión escrita de esta
expresión se deriva de un análisis a posteriori o secundario de carácter analítico de ella.
Por tanto, si decimos que el español no es una lengua aglutinante porque escribimos me
ha tocado la lotería lo que hacemos en realidad es caracterizar, no la lengua española,
sino la forma de escribir esta lengua, la ortografía vigente. Sabemos perfectamente que
la estructura de una lengua natural no está determinada por la estructura del sistema de
escritura que se emplee para transcribirla. Hay lenguas que han cambiado de escritura
sin experimentar ningún cambio lingüístico decisivo.

2 El mito de las lenguas aislantes y monosilábicas


Todo lo expuesto en la sección anterior sobre lo absurdo de partir de la escritura
para caracterizar tipológicamente una lengua puede parecer evidente, pero no lo es en
absoluto, dado que durante mucho tiempo se ha caracterizado tipológicamente algunas
lenguas casi exclusivamente a través de su escritura. Un ejemplo de ello es la lengua
china, que se ha concebido como lengua aislante y monosilábica cuando en la realidad
lo que es aislante y monosilábico no es la lengua china sino la escritura china.
Siguiendo lo explicado en la sección anterior, la lengua china natural hablada, como las
demás lenguas del mundo, es aglutinante (con algún caso aislado de afijo fusionante tal
como el sufijo –er, Han, Ma y Lü 2002).
Veamos un ejemplo de cómo se parte de la escritura para caracterizar la lengua china.
En su libro sobre la escritura F. Coulmas (2003: 59) cita la siguiente oración del chino
estándar:

zhongguó zhèjî nián de biànhuá díquè hên dà


‘China ha experimentado ciertamente grandes cambios en los años últimos’
En la escritura china, se separan mediante espacios en blanco cada uno de los caracteres,
independientemente de que formen o no una palabra. De este modo, en la forma escrita
tenemos doce caracteres chinos, pero no hay doce palabras. En efecto, las expresiones
zhongguó ‘China’, zhèjî ‘estos varios’, biánhuà ‘cambio’, díquè ‘ciertamente’ son
palabras compuestas y constituyen unidades morfológicas perfectamente delimitadas y
cohesionadas. Por tanto, en el ejemplo no hay doce palabras. Hay solo siete. Además,
algunos de los elementos que aparecen a través de los caracteres escritos son claramente
morfemáticos y no léxicos: por ejemplo, de es una partícula relacional sin contenido
léxico y jî es una partícula cuantitativa aproximativa que posee diferentes funciones
gramaticales.
La lengua china no se pronuncia como lengua coloquial espontánea separando por
breves silencios todas y cada una de las sílabas tal como sugiere la escritura (dado que
cada carácter chino se corresponde con una sílaba). Cualquiera que haya escuchado una
conversación normal entre sino-hablantes, habrá podido comprobar que las expresiones
que emiten no son un silabeado, sino un continuo fónico con algunas pausas
entonativas, tal como ocurre en las demás lenguas naturales del mundo.
Es cierto que en la lengua china estándar no hay morfología flexiva, pero sí hay  y
mucha morfología derivativa (Packard 2000). Por consiguiente, mantener que la
lengua china es aislante y monosilábica solo puede basarse en la lengua escrita y en
modo alguno en la lengua natural tal como se habla espontáneamente. Se puede
caracterizar la lengua china escrita como monosilábica y aislante, pero la lengua china
hablada no es ni lo uno ni lo otro. La lengua china hablada no es una lengua flexiva
como el ruso o el griego, sino que es una lengua aglutinante, como todas las demás
lenguas del mundo, el ruso y el griego incluidos. Por tanto, obtenemos el esquema
siguiente:

 Es una lengua monosilábica porque a cada carácter chino le corresponde una


Caracterización de la lengua china escrita

 Es una lengua aislante, porque cada carácter está separado del carácter siguiente
sílaba.

y anterior por espacios en blanco independientemente si dos o más caracteres se


corresponden con una única palabra del chino hablado espontáneo.

 No es una lengua flexiva, pero tiene un desarrollado sistema de derivación y


Caracterización de la lengua china hablada espontánea

composición morfológicas (Packard 2000).


 Es una lengua aglutinante, porque en el habla coloquial espontánea los diversos
elementos significativos se aglutinan formando expresiones complejas típicas de
esa habla. En esto el chino es similar a los demás idiomas hablados.

Imaginemos qué ocurriría si las reglas ortográficas del español nos obligaran a separar
las sílabas por espacios en blanco, como ocurre con la escritura china. Entonces la
oración española vista en la sección anterior habría de escribirse de la siguiente manera:

me ha to ca do la lo te ri a

Una vez escrito así, el español resultaría ser, si nos guiamos por la escritura como fuente
exclusiva de conocimiento lingüístico, una lengua monosilábica y aislante tal como
muchos ven el chino. En la ortografía normativa se escribe me ha tocado, pero incluso
esta forma no hace completa justicia a la naturaleza de esta expresión, ya que me y ha
están claramente aglutinados a tocado configurando una única expresión unitaria. Esta
forma escrita aunque más correcta que la que se dispone en sílabas aisladas, no hace
justicia a la aglutinación que se observa en la forma oral espontánea [mátokào].
Tanto el chino como el español son mucho más aglutinantes que lo que se puede
deducir de la escritura que, en ambos casos, falsea las verdaderas unidades de las
lenguas respectivas.

3 El turco y el español como lenguas aglutinantes


Para que podamos comprobar cómo afecta la ortografía a las consideraciones
sobre la aglutinación en las lenguas, comparemos las siguientes palabras del turco
(considerada como lengua aglutinante) proporcionadas por Nespor y Vogel (1994: 142),
con las correspondientes traducciones españolas, tal como se dan en el libro de donde se
extraen los ejemplos:

TURCO ESPAÑOL
oda ‘habitación’
odada ‘en la habitación’
odadaki ‘lo que está en la habitación’
odadakiler ‘los que están en la habitación’
odadakilerden ‘de los que están en la habitación’

Desde el punto de vista de las normas ortográficas del turco y del español la impresión
que da esta comparación es que el turco es una lengua aglutinante en la que una palabra
como oda ‘habitación’ puede ir seguida hasta de cuatro morfemas aglutinados:
oda+ da+ ki+ ler+ den. Lo que vemos en la traducción española son sintagmas
compuestos de varias palabras. Por ejemplo, en la traducción de la última palabra, lo
que tenemos es una secuencia de siete palabras ortográficas.
Pero vamos a comparar ahora el turco con el español hablado coloquial espontáneo sin
respetar las reglas ortográficas de la lengua española. Podríamos perfectamente obtener
algo como lo siguiente

TURCO ESPAÑOL COLOQUIAL INFORMAL


oda [abitasión]’
odada [enlabitasión]
odadaki [lodelabitasión]
odadakiler [losdelabitasión]
odadakilerden [delosdelabitasión]

He realizado algunos cambios respecto a las traducciones dadas en el libro de Nespor y


Vogel, del que están extraídos los ejemplos del turco. Las expresiones españolas
resultantes son perfectamente normales en el habla cotidiana y se pueden hacer
corresponder también con el significado de las expresiones turcas. En la transcripción
he echado mano del seseo, dado que es abrumadoramente mayoritario entre los
hispanohablantes.
Observemos la última expresión del español. Podremos comprobar que está formada
por una secuencia de ocho elementos morfológicos aglutinados (un lexema y siete
morfemas), a saber:

de +l + o + s + de + l + a + (a)bitasión
oda + da+ ki+ ler+ den

Como podemos comprobar, la palabra turca está compuesta de cinco elementos


morfológicos aglutinados (un lexema y cuatro morfemas).
Por tanto, en este caso no cabe la menor duda de que en español es una lengua más
aglutinante que el turco. Esto no significa que el turco y el español sean
morfológicamente iguales, es evidente que no lo son: hay importantes diferencias entre
ellos. Una de las más sobresalientes la acabamos de ver en el ejemplo anterior: la
aglutinación en español es claramente pre-lexemática, es decir, los morfemas aparecen
antes del lexema, mientras que la aglutinación en turco es post-lexemática, es decir, los
morfemas se concatenan pospuestos al lexema. Esta es una de las muchas diferencias
que se podrían apuntar entre la morfología del turco y la del español. Sin embargo,
desde el punto de vista de la aglutinación, el turco y el español son muy similares, tal
como hemos visto. Lo único que nos impide darnos cuenta de ello son las convenciones
ortográficas del español.

4 El índice de aglutinación en euskera y en español


El afamado lingüista Joseph Greenberg publicó en los años cincuenta del siglo
pasado un influyente artículo (Greenberg 1954) en el que se proponía una serie de
índices numéricos para calcular el tipo morfológico de las lenguas. Entre estos índices
está el de aglutinación (Greenberg 1954: 12-13). En este índice se mide el grado de
disposición aglutinativa de los morfemas y lexemas en una lengua. A partir de las
explicaciones proporcionadas por Greenberg en el trabajo citado, propongo la siguiente
manera de calcular el índice de aglutinación de una lengua concreta. Utilizaré la
siguiente fórmula: UM/EM. Por UM entendemos el números de uniones entre
elementos morfológicos (lexemas y morfemas) y por EM el número de elementos
morfológicos (lexemas y morfemas) implicados. Se trata de dividir el número UM por
el número EM. Este número será siempre menor que 1 por la siguiente razón, aducida
por Greenberg en su artículo. Si tenemos una secuencia de dos elementos morfológicos
aglutinados X+Y, entonces UM= 1, es decir, tenemos una unión entre dos elementos
morfológicos y además EM = 2, ya que tenemos dos elementos morfológicos. En este
caso UM/EM = 1/2 = 0’5. Tenemos por tanto, un índice de 0’5 de aglutinación. Si
tenemos un solo elemento morfológico (un lexema sin afijo aglutinado alguno, por
ejemplo), entonces UM= 0 y EM = 1, con lo cual UM/EM = 0/1 = 0. En este caso,
tenemos un índice 0 de aglutinación.
En un artículo en el que se utilizan sistemáticamente los índices numéricos de
Greenberg para comparar diversas lenguas, el lingüista español Antonio Tovar (Tovar
1981) da la siguiente tabla sobre el grado de aglutinación de las lenguas siguiendo el
índice propuesto por J. Greenberg (Tovar 1981: 190):

ÍNDICE DE AGLUTINACIÓN
muy alto de 0,80 a 0,99
alto de 0,60 a 0,79
medio de 0,40 a 0,59
bajo de 0,20 a 0,39
muy bajo de 0,00 a 0,19

El propio Tovar da (Tovar 1981: 196) como índice de aglutinación del euskera 0,63, es
decir, un índice alto y como índice de aglutinación del español 0,06, es decir, un índice
muy bajo. Estos números se obtienen del recuento hecho sobre tres textos breves en
cada una de las lenguas.
Sin embargo, si aplicamos lo que he dicho en las secciones anteriores sobre la necesidad
de erradicar la escritura de las consideraciones tipológicas, los resultados del grado de
aglutinación del euskera y del español pueden variar mucho.
Consideremos, por ejemplo, el índice de aglutinación que se deduce de una expresión
española como las casas, suponiendo una secuencia de cinco unidades morfológicas: l
+ a+ s casa + s, podemos calcular el índice UM/EM como 3/5, dado que hay tres
uniones de elementos morfológicos: l+ a, la+ s y casa+ s. Por tanto, como 3/5 = 0,6
obtenemos un nivel alto de aglutinación. Pero este cálculo está hecho sobre la forma
escrita de esa expresión; en la forma hablada coloquial espontánea tenemos [laskásas],
es decir, un solo elemento y, por tanto tenemos un unión de elementos morfológicos
más, la que se da entre las y casa+ s. Por tanto, ahora el índice es 4/5 = 0,8, con lo cual a
partir de este ejemplo el español cambiaría de grado de aglutinación: pasaría de alto a
muy alto.
Para contrastar los datos de Tovar referidos a las diferencias respecto del índice de
aglutinación entre el euskera y el español, voy a continuación a comparar diez frases del
euskera con sus correspondientes traducciones al español y a partir de ahí voy a
comparar los índices de aglutinación obtenidos para las dos lenguas con el fin de extraer
conclusiones sobre el grado de aglutinación morfológica de ambas lenguas.
Las frases del euskera y sus respectivos análisis las tomo de la gramática de R. de Rijk
(2008) y adopto sin cambiarlos los análisis de sus secuencias morfológicas tal como
figuran en dicha gramática. Al lado de cada frase calculo el índice de aglutinación. En el
caso del español incluimos la forma ortográfica junto con la forma coloquial hablada y
calculo los índices correspondientes.
I
Ni-rekin ez d-u-zu-e gehi-ago lan-ik iza-n-go (De Rijk 2008: 1228) [8/14 = 0,57]
No tend-rás más problema-s con-migo [3/8 = 0,37]
no-tend-rás más-problema-s con-migo [5/8 = 0,62]

II
Ni-k zu z-a-it-u-t maite-ago arraintxo-ek ur-a baino (De Rijk 2008: 1226) [8/15 = 0,53]
Te am-o más que l-o-s pecec-it-o-s a-l agua [7/ 15 = 0,46]
te-am-o más que-l-o-s-pecec-it-o-s a-l-agua [10/15 =0,66]

III
Ber-e irakasle-a adin-a iza-n-go da (De Rijk 2008: 1223) [5/10 = 0,50]
Ser-á tan buen-o como su profesor [2/8 = 0,25]
Ser-á tan-buen-o como su-profesor [4/8 = 0,50]

IV
Beste asko beza-la-ko egun bat (De Rijk 2008: 1219) [2/7 = 0,28]
Un día como tod-o-s l-o-s demás [4/10 = 0,40]
un-día como-tod-o-s l-o-s-demás [6/10 = 0,60]

V
Ni-k gazte-rik gorde-tze-n d-u-t bihotz-a (De Rijk 2008: 1214) [7/12 = 0,58]
Manteng-o mi corazón joven [1/5 = 0,2]
manteng-o mi-corazón joven [2/5 = 0,4]

VI
Daniel-ek ber-e indar guzti-a-z jo-a z-u-en (De Rijk 2008: 1212) [7/ 13 = 0,53]
Daniel le ha pega-do con tod-a su fuerza [2/9 = 0,22]
Daniel le-ha-pega-do con-tod-a su-fuerza [6/9 = 0,66]

VII
Auto-a konpon-du-a d-u-t (De Rijk 2008: 1211) [5/8 = 0,62]
Teng-o el coche arregla-d-o [3/7 = 0,42]
teng-o el-coche arregla-d-o [4/7 = 0,57]

VIII
Ezin-go n-a-i-z mutilzahar geldi-tu (De Rijk 2008: 1201) [5/9 = 0,55]
No ser-é capaz de mantener-me solter-o [3/9 = 0,33]
No-ser-é capaz de-mantener-me solter-o [5/9 = 0,55]

IX
Ezkon-du berri-a n-a-i-z eta ez n-a-i-te-ke j-oa-n (De Rijk 2008: 1194) [11/18 = 0,61]
Me acab-o de casar y no pued-o ir [2/10 = 0,20]
me-acab-o de-casar y-no-pued-o ir [6/10 = 0,60]

X
Asper-tu e-gi-n n-a-iz, bada bakarr-ik utz-i n-a-u-te (De Rijk 2008: 1191) [10/17 = 0,58]
Sí que me h-e aburri-do porque me ha-n deja-do sol-o [5/15 = 0,33]
sí que-me-he-aburri-do porque me-h-a-n-deja-do sol-o [10/ 15 = 0,66]

En el siguiente cuadro vemos los resultados obtenidos en cada una de las diez
expresiones en los tres idiomas: euskera escrito, español escrito y español hablado.
ESPAÑOL ESPAÑOL
EUSKERA ESCRITO HABLADO.
0,57 0,37 0,62
0,53 0,46 0,66
0,5 0,25 0,5
0,28 0,4 0,6
0,58 0,2 0,4
0,53 0,22 0,66
0,62 0,42 0,57
0,55 0,33 0,55
0,61 0,2 0,6
0,58 0,33 0,66
0,535 0,318 0,582

La última de las filas es la media aritmética obtenida. Según esto, el euskera escrito
tiene un índice de aglutinación medio (0,53), el español escrito tiene un índice de
aglutinación bajo (0,31) y el español hablado coloquial tiene un índice de aglutinación
también medio, pero superior al del euskera (0,58).
Para interpretar adecuadamente estos números hay que tener en cuenta que comparamos
el euskera escrito con el español hablado coloquial y esto no es lícito, dado que la
ortografía euskérica tampoco refleja con total fidelidad la lengua coloquial. Por tanto, si
modificáramos la ortografía euskérica (Moreno Cabrera 2007-2008: 207-214), como
hemos hecho con la del español, para ajustarla a la lengua hablada, el índice de
aglutinación obtenido sería idéntico o mucho más parecido aún al del español.
La conclusión que cabe extraer de todo esto es que el español y el euskera tienen un
grado de aglutinación semejante, contra lo que se podría pensar a partir de los datos que
aparecen en el artículo de A. Tovar.
Esta conclusión no es en absoluto sorprendente porque en este artículo defiendo que
todas las lenguas son aglutinantes en una medida similar y que algunas de ellas son
además flexivas o fusionantes en distintos grados.

5 Caracterización de la palabra natural en la lengua española


A partir de lo explicado en la sección anterior podríamos preguntarnos si se
podría dar una descripción más fiel de las unidades que realmente se utilizan de forma
más o menos autónoma en la lengua hablada espontánea, que sea totalmente
independiente de lo establecido por las reglas ortográficas. En el caso del español, una
de las primeras cosas que tendríamos que hacer sería incorporar al sustantivo los
artículos y las preposiciones, de forma que expresiones como lacasa, delacasa,
enlacasa deberían ser consideradas como unidades de la lengua hablada en las que se
observa un grado apreciable de aglutinación. La razón de esto es que ni el artículo, ni la
preposición son elementos autónomos en el habla: siempre aparecen en el habla normal
apoyados en un sustantivo o adjetivo (como en lablanca o deblanco). Por supuesto, en
una expresión como lablanca casa no se ha introducido ningún adjetivo entre la y casa
tal como acostumbran a decir algunos lingüistas y gramáticos para mantener que la
ortografía tiene razón y que la es un elemento separado de casa en una expresión como
lacasa. Lo que pasa es que los adjetivos pueden también servir de apoyo al artículo y a
la preposición en español.
Incluso podemos tener expresiones como lossincasa o lasdecasa, en donde hay
aglutinados un artículo seguido de una preposición ante el sustantivo. La prueba de que
una expresión como lossincasa funciona a todos los efectos como una unidad en el
habla normal es que no se puede deshacer la aglutinación que presenta; por ello, de
entre las expresiones siguientes solo la primera es gramatical en español:

1. los sin casa merecen respeto


2. *los merecen sin casa respeto
3. *los sin merecen casa respeto
4. *los merecen casa sin respeto
5. *sin casa los merecen respeto
6. *sin casa merecen los respeto

Sin embargo, merecen y respeto pueden aparecen en diversos lugares de la oración


siempre que no se destruya la indubitable unidad que representa la expresión los sin
casa, tal como podemos comprobar a continuación:

7. Merecen respeto los sin casa


8. Respeto merecen los sin casa
9. Respeto los sin casa merecen
10. Los sin casa respeto merecen
11. Merecen los sin casa respeto

Quizás no todas estas expresiones sean igual de usuales o normales, pero no obtenemos
en ningún caso secuencias agramaticales tales como las enumeradas en la lista
inmediatamente anterior a ésta.
Por tanto, si queremos vislumbrar cómo son las palabras de la lengua española coloquial
espontánea, lo que podemos denominar palabras naturales, tenemos que renunciar a
considerar como conformadas de tres palabras secuencias ortográficas como los sin
casa. En efecto, esta secuencia en concreto consta de tres palabras ortográficas: los, sin
y casa, pero no le debería ya caber la menor duda a quien esté leyendo estas páginas que
esas tres palabras ortográficas constituyen una única palabra de la lengua española
coloquial espontánea: lossincasa. Alguien podría objetar que, si emitimos esta
expresión en una forma cuidadosa y sosegada podríamos emitirla como tres palabras
independientes. Esto se puede hacer en la lengua coloquial por motivos de énfasis o
insistencia; por ejemplo, en un caso de mala comprensión por parte de nuestros
interlocutores, pero en todo caso sería una forma marcada o excepcional de
pronunciación. Por supuesto y con objetivos similares, podríamos también pronunciar
casa como dos sílabas independientes: ca sa. Esto se puede hacer y a veces se hace
con propósitos de énfasis o de puntualización, pero basta reflexionar un poco para
percatarse de que ello no invalida en modo alguno que casa sea una unidad morfológica
de la lengua natural tanto hablada como escrita (en este caso coinciden ambas formas de
concebir la lengua).
Pero ¿disponemos de algunos criterios para decidir cómo identificar esas palabras
naturales que son unidades de la lengua hablada espontánea? Lamentablemente, los
lingüistas se han dedicado sobre todo a la palabra ortográfica, la que es reconocida en la
ortografía, y se han ocupado muy poco de las unidades de la lengua hablada espontánea.
Voy a considerar ahora las propuestas de un lingüista que nos ha ofrecido algunos
criterios muy interesantes para caracterizar lo que denomino en este artículo palabra
natural; es decir, las unidades máximas con significado que son operativas en la lengua
oral espontánea y que son la base de los procesos de emisión y de interpretación
lingüísticos. Ese lingüista es el sueco Östen Dahl autor de un libro publicado en 2004
sobre la evolución y mantenimiento de la complejidad lingüística (Dahl 2004). En el
capítulo décimo de este libro, el autor investiga el desarrollo y alcance de los procesos
de incorporación, mediante la cual una palabra pasa a formar parte de otra como
elemento, tal como se puede ver en compuestos españoles como sacapuntas o
buscachollos; el primer ejemplo está establecido en la lengua habitual y el segundo
ejemplo se da para mostrar que este proceso es productivo y que se pueden crear nuevos
compuestos por incorporación de forma más o menos libre o espontánea sin que esto
suponga una ruptura del sistema. Observa Dahl que este proceso está severamente
restringido en las diversas lenguas en las que se produce. La incorporación se realiza
solo en ciertas condiciones. Por ejemplo, la palabra incorporada no puede ir provista de
determinantes: no hay sacalaspuntas o buscaloschollos, por ejemplo. La palabra
incorporada tiene un significado genérico y nunca específico como en
*sacaestaspuntas, *buscaaquelloschollos. Para Dahl las restricciones que se imponen a
la incorporación serían debidas al hecho de que hay unos límites generales en la
creación de las posibles unidades máximas de la lengua hablada que constituirían esas
unidades que denomino en este artículo como palabra natural. Estas unidades están
determinadas por lo que Dahl denomina paquetes que son las unidades máximas en las
que puede realizarse de modo eficiente tanto la expresión lingüística por parte de la
persona hablante como la interpretación lingüística por parte de la persona oyente (Dahl
2004: 257-259). Dadas las limitaciones de la memoria de trabajo a corto plazo de los
seres humanos, está claro que esas unidades máximas de producción y procesamiento
lingüísticos en el habla natural no pueden tener una extensión indefinidamente grande,
sino que van estar delimitadas de forma muy precisa para poder realizar con la máxima
eficacia y de acuerdo con las limitaciones de memoria y planificación articulatoria, la
expresión lingüística natural en la lengua coloquial espontánea, caracterizada
precisamente por su automatismo y rapidez.
Para Dahl el paquete es una unidad muy integrada que se pronuncia en un segmento
prosódico que correspondería a una orden única en la producción y a un proceso
unitario en la recepción de las expresiones lingüísticas. Esa integración y las
restricciones de espacio hacen que sea una unidad con una capacidad severamente
limitada para contener elementos significativos.
Las necesidades relativas a la rapidez, el aprovechamiento y la automatización del acto
lingüístico comunicativo le obligan a la persona hablante a introducir en cada paquete o
unidad máxima del habla coloquial el mayor número posible de elementos. Los límites
vienen propiciados tanto por las posibilidades articulatorias de los seres humanos como
por sus posibilidades de procesamiento rápido del lenguaje.
En su libro, Dahl nota tres constricciones fundamentales sobre los paquetes (Dahl 2004:
258), que en este artículo denomino palabras naturales (PN).

1. Las expresiones léxicas referenciales (ELR) no tienen cabida fácil en las palabras
naturales. Una ELR es un sintagma nominal que contiene al menos un elemento
léxico y que tiene una referencia específica. Los nombres propios, por ejemplo, son
ELR típicos; por su parte los pronombres no son ELR porque aunque se usen
referencialmente no son elementos con contenido estrictamente léxico. Por tanto, los
nombres propios son PN autónomas pero los pronombres en general no lo son.

2. Un elemento focalizado (EF) no puede integrarse en una palabra natural, sino que
constituye el mismo una PN completa en sí.
3. Las expresiones dotadas de una estructura interna (EDEI) constituyen en sí
mismas al menos una PN y no se pueden integrar en una PN mayor.

Vamos ahora a ver unos ejemplos de la aplicación de estos principìos propuestos por
Dahl para determinar las posibles PN que se pueden obtener.
Empecemos por la siguiente expresión:

12. María bebe té

En la lengua oral espontánea coloquial esta expresión se diría, por ejemplo, [María
bèbeté] y, por tanto, constaría de dos PN (María y bebe té). ¿Está en consonancia esto
con los criterios aducidos por Dahl? Lo está completamente. En efecto, María es una
ELR y, por tanto, en sí misma constituye una PN. Por su parte, en bebe té tenemos un
objeto incorporado al verbo. La palabra té es no referencial en este caso y, por tanto, se
puede incorporar el verbo para obtener bebe té. Por consiguiente, bebe se te puede
considerar como una PN máxima, en la que no cabe, por ejemplo, María, por ser un
ELR. Por consiguiente tenemos el siguiente resultado:

13. María bebe té


Tres palabras ortográficas (PO): María, bebe y té
Dos palabras naturales (PN): María¸y bèbeté

¿Qué ocurriría si hiciéramos la palabra te focal? Ocurriría que automáticamente té


habría de salir de la PN en la que está para constituir una PN en sí misma. De este
modo, obtendríamos la expresión María bebe TE, en la que las letras mayúscula
muestran que el término te está focalizado en la oración. Este proceso de focalización se
puede expresar mediante estructura sintácticas especiales como las perífrasis de relativo
de las que lo que María bebe es té, sería un ejemplo relacionado con el análisis que
estamos viendo en este páginas. Por tanto, en el caso de María bebe TE observamos que
el número de PN (tres) coincide con el número de palabras ortográficas (PO), tres en
ambos casos.
Pasemos ahora a una expresión como María se lo bebe, en la que tenemos cuatro PO.
En el habla coloquial espontánea esta expresión se pronuncia como [maría selobébe]. Es
decir, como dos PN. La expresión [selobébe] se atiene perfectamente a los criterios de
Dahl, puesto que consta de dos elementos referenciales; se y lo, que no son ELR: tienen
contenido gramatical pero no lo tienen léxico. Por consiguiente, esta expresión puede
ser caracterizada perfectamente como una PN. De forma esquemática:
14. María se lo bebe
Cuatro PO: María, se, lo, bebe.
Dos PN: María, selobebe

Las expresiones con clíticos como selobebe se califican en ocasiones como grupo clítico
(Nespor y Vogel 1994: 169-189) y nunca como palabras naturales, tal como hago aquí,
probablemente por el peso que tiene la tradición ortográfica que, en muchos casos, hace
que los clíticos se escriban separados de la palabra en la que se apoyan necesariamente,
aunque no puedan ser considerados como palabras, en términos de Nespor y Vogel:

“Debe advertirse, no obstante, que considerar estos clíticos palabras


independientes iguales a cualquier otra palabra de la lengua, no deja de ser
problemático, dado que los clíticos manifiestan dependencias fonológicas
bien conocidas que no comparten con otros elementos. En concreto, nunca
pueden aparecer solos; esto es, no pueden ser el único elemento de un
enunciado. Además, no pueden recibir acento contrastivo.” (Nespor y Vogel
1994: 173)

Es interesante la última de las observaciones, que hace referencia al acento contrastivo.


Acabamos de ver que uno de los criterios propuesto por Dahl para que un elemento no
pueda pertenecer a un paquete o palabra natural compleja es precisamente que no pueda
estar dotado de acento contrastivo o focal.
Consideremos ahora la expresión María se bebe el té. Estamos antes cinco PO, pero
observamos que la forma habitual de pronunciación de esta expresión es [maría sebébe
elté], con lo que tenemos solo tres PN. La cuestión clave aquí es que el té no cabe
dentro de la PN sebebe porque es una ELR, es decir, es una expresión referencial léxica
pues el artículo le da la referencialidad que le faltaba antes al sustantivo sin
determinante té. De este modo tenemos:

15. María se bebe el té


Cinco PO: María, se, bebe, el y té.
Tres PN: María, sebebe, elté

Consideremos ahora la expresión María bebe te y café. En este caso, siguiendo el


criterio EDEI de Dahl, no podríamos incluir te y café dentro del paquete de bebe, dado
que presenta una estructuración interna debido a una regla de conjunción. Por ello
tendríamos la siguiente situación:

16. María bebe te y café


Cinco PO: María, bebe, te, y café
Tres PN: María, bebe, téycafé

Según Dahl, su concepto de paquete se podría concebir como la unidad morfológica


máxima, en palabras de este autor:

“Aunque paquete no coincide con la noción tradicional de palabra, se puede


decir que un paquete representa la máxima palabra posible. Esto es, los
elementos de un paquete pueden en principio integrarse en una palabra, pero
las palabras no van más allá habitualmente de un paquete.” (Dahl 2004:
258).

Por tanto, cuando hablamos de PN estamos hablando de una unidad máxima de la


lengua hablada, que está constreñida por los límites impuestos por los procesos de
articulación y de procesamiento lingüísticos. Estos límites son iguales para todos los
seres humanos y, por tanto, para todas las lenguas. Por consiguiente, lo que esperamos
encontrar es que las PN tengan en general una longitud y una complejidad similares en
todas las lenguas del mundo.
Es curioso que la lingüística tradicional se haya ocupado muy poco de averiguar cuáles
son las unidades de la lengua hablada y se haya limitado a estudiar las unidades
lingüísticas tal cual aparecen en la escritura, según unas convenciones ortográficas
tradicionales. Esta despreocupación va contra una de las ideas fundamentales de la
lingüística contemporánea: la consideración de la lengua hablada o señada como
elemento primordial del análisis lingüístico, dado que la escritura no es otra cosa que
una adición cultural que, a diferencia con lo que ocurre respecto de la lengua hablada o
señada, no es universal y, por tanto, no puede figurar como núcleo básico en las
investigaciones sobre las lenguas naturales.
Es lógico que las personas expertas en morfología realicen una labor analítica que les
lleva a buscar cuáles son las unidades significativas mínimas de la primera articulación
del lenguaje, en términos de A. Martinet. Pero no tiene mucho sentido mantener que las
unidades que identifican a través de su actividad analítica sean unidades de la lengua
natural. Esto se ve muy bien en el caso de la fonología. Los fonemas se deducen
analíticamente a través de análisis científicos realizados de forma sólida, tales como el
de N. Trubetskoy en sus principios de fonología, por ejemplo. Pero los fonemas no son
una unidad de la lengua natural: las expresiones lingüísticas naturales no son ni
articulatoriamente ni perceptualmente sucesiones de fonemas. Pero sí que existe una
unidad natural, la sílaba, que es la que da cuenta de las expresiones tal como se
construyen y perciben. Pero algo crucial es que una sílaba no es una sucesión de
fonemas en modo alguno, sino un todo integrado y dotado de una estructura que es
cualitativamente distinto de una mera sucesión de fonemas. Este extremo fue notado
nada menos que por Aristóteles en su Metafísica:

“Puesto que lo que es compuesto de algo de tal modo que el todo constituye

más, las letras «b» y «a» no es lo mismo que «ba» […] La sílaba es,
una unidad, no como un montón, sino como una sílaba, y la sílaba no es, sin

ciertamente, algo, no es solo las letras, la vocal y la consonante, sino además


algo distinto. […] Parecería, pues, que se trata de algo, y que no es un
elemento, y que es la causa […] de que esto sea una sílaba. Y puesto que
algunas cosas no son entidades y, por su parte, las que son entidades están
constituidas según la naturaleza y por naturaleza, parecería que la entidad es
esa naturaleza que no es elemento sino principio.” (Aristóteles, Metafísica,
VII 1041b 11-31, versión española de Tomás Calvo Martínez, Madrid:
Gredos, 1994, páginas 340-341).

Este pasaje de la Metafísica aristotélica es de suma importancia para lo que aquí estoy
tratando. Esta importancia ha sido puesta de relieve por un investigador en los
siguientes términos:

“En este importante fragmento del pensamiento aristotélico se expone su


teoría de la causa formal como aquello que establece la naturaleza de una
entidad y que no es un elemento sino un principio explicativo de que la
esencia de muchos elementos compuestos no pueda entenderse como la
simple suma de sus componentes sino como ‘algo distinto’, como algo más.
Para aclarar lo que quiere decir utiliza el caso de la sílaba como ejemplo de
composición de elementos cuya naturaleza y funcionamiento no puede
analizarse como simple concatenación de una clase determinada de sonidos
sino como una combinación que responde a una causa formal, a un principio
que da el valor de sílaba a una secuencia fónica.” (González Pereira 2011:
180).

De forma análoga nos enfrentamos con la palabra natural (PN). La palabra natural no es
un mero agregado que surge de añadir elementos aglutinados a la palabra ortográfica, de
manera que en los niños tenemos una aglutinación de los a niños, considerada como la
unidad morfológica adecuada. Es una unidad superior que no se puede reducir a una
mera concatenación de elementos. Dicho de otra manera, losniños es una PN con una
estructuración determinada que no surge de una simple concatenación de elementos,
igual que la sílaba natural pa no es una simple concatenación de dos letras, sino un
fenómeno unitario complejo que no se puede reducir a una simple concatenación.
La idea de que se aglutina los a niños viene de la suposición de que la unidad
morfológica propiamente dicha de la lengua es niños y a esta unidad se le añade un
artículo. Pero el problema es que los y niños son unidades de la lengua escrita que
proceden de un análisis previo por parte de diversas personas o instituciones, que no
obedece a los procedimientos que usan las personas corrientes al hablar. Son unidades
del análisis que se hace de la lengua, pero eso no significa que sean unidades de la
lengua natural. Considerar que en los niños tenemos dos palabras naturales es un
absurdo manifiesto desde el punto de vista de la lengua natural, dado que los no es un
elemento autónomo que se comporte como tal en el habla real.
Hay buenas razones para pensar que existen unidades morfológicas máximas tales como
la PN que estoy caracterizando en este artículo. Estas razones están en las limitaciones y
determinaciones de la naturaleza psico-fisiológica de los seres humanos. La longitud y
complejidad de las PN están necesariamente determinadas por las características
psíquicas y físicas de los seres humanos y tiene que ver con la longitud de lo que
podemos manejar articulatoriamente de forma rápida y automática, como se usan las
lenguas naturales, y de lo que podemos analizar de forma rápida utilizando nuestra
memoria de trabajo a corto plazo, que nos limita de forma severa.
Por esa razón hay una unidad morfológica de las lenguas naturales adaptada
precisamente a esos condicionamientos, que es la PN. Los condicionamientos que dan
lugar a las palabras ortográficas (PO) nada tienen que ver con esos condicionamientos
naturales de la PN, sino que dependen de las habilidades intelectuales de quienes
realizan el análisis y de las tradiciones culturales que les condicionan. Por eso es difícil
que coincidan los conceptos de PO y PN. Y también por esa razón no es legítimo
estudiar las unidades morfológicas de las lenguas naturales sobre la base de las unidades
establecidas de modo convencional para las lenguas escritas, como ocurre normalmente.

6 El español coloquial como lengua polisintética


El concepto de lengua polisintética se reserva para aquellos idiomas que
presentan un alto grado de síntesis en sus unidades morfológicas. El término fue
inventado en 1816 por P. S. Duponceau para una carta dirigida a John Heckewelder
(Mithun 2009: 3) en la que se refiere a la lengua groenlandesa como formada según un
modelo polisintético. Según Duponceau (Mithun 2009: 4) la construcción polisintética
se caracteriza porque un gran número de ideas se comprime en un mínimo número de
palabras utilizando la composición morfológica y mediante el verbo, en el que sus
diversas formas flexivas no solo expresan la acción principal sino el número más amplio
posible de ideas y objetos conectados con ellas. A partir de entonces los lingüistas hacen
referencia para ilustrar la polisíntesis a las complejas palabras de algunas lenguas
amerindias y de otros continentes en las que se incluyen muchos afijos y que a veces se
traducen a otras lenguas con oraciones completas, por lo que en alguna ocasión se las ha
denominado palabras holofrásticas.
La familia esquimal de lenguas es considerada por los lingüistas como una de las que
manifiesta más polisíntesis. He aquí un ejemplo del yupí siberiano, una lengua de esta
familia (de Reuse 2009: 23):

17. Neghyaghtughyugumayaghpeteaa
negh-yaghtugh-yug -uma-yagh -pete -aa
comer-ir-querer-pasado-afijo frustrativo-afijo inferencial-3 persona
‘Resulta que quería ir a comerlo pero…’

Pero… ¿Realmente podemos considerar que expresiones como la que acabamos de citar
son unidades de una lengua natural, son palabras naturales? Esta pregunta se la ha hecho
una investigadora de las lenguas indígenas de América del norte. Se trata de M. Mithun
(1996: 138-139). Esta autora cita la siguiente palabra del mohaqués (Mohawk), lengua
iroquesa, obtenida de una persona hablante nativa y que es un tipo de palabra bastante
normal en esta lengua

18. sahuwanhotukwahse’
s-a-huwa-nho-tu-kw-ahse’
de nuevo-PASADO-ella a él- puerta-cerrar-des-para-PERFECTIVO
‘Ella le abrió la puerta de nuevo’

Según Mithun no cabe la menor duda de que esta expresión es una palabra en
mohaqués. Para demostrarlo utiliza los siguientes siete criterios.
 En primer lugar, las personas hablantes nativas del mohaqués la consideran
como una unidad, independientemente de que la hayan escrito o no alguna vez
en su lengua.
 En segundo lugar, estas expresiones se expresan de forma continua, sin hacer
ninguna pausa entre sus elementos.
 En tercer lugar, este elemento no puede ser interrumpido por otros elementos: no
se puede entrometer ningún elemento adicional en la palabra.
 En cuarto lugar, los componentes de esa palabra no se reconocen por parte de las
personas hablantes cuando se emiten aisladamente.
 En quinto lugar, el orden de los elementos es fijo y no se puede cambiar: si se
cambia el orden, la palabra se vuelve irreconocible.
 En sexto lugar, algunos de los morfemas poseen diferente forma según
aparezcan en un lugar u otro de la palabra.
 En séptimo lugar, hay un único acento dominante en toda la palabra. Desde el
punto de vista prosódico es una unidad.

Analizaremos ahora una expresión de la lengua española coloquial informal parecida a


la del mohaqués y le aplicaremos los siete criterios para comprobar si se trata de una
unidad morfológica máxima de la lengua española hablada, es decir, de una palabra
natural. La expresión es la siguiente e indico además la forma ortográfica estándar:

19. [eskenóselandào]
[es-ke-no-se-l(o)-a-n-da-o]
Es que no se lo han dado

Esta expresión contiene nueve elementos, dos más que la del mohaqués que analiza
Mithun. ¿Funciona de modo similar a la expresión mohaquesa según los siete criterios
aducidos?
Según el primer criterio, los hablantes deben reconocer esa expresión como
conformando una unidad. No cabe duda de que esto es así, porque toda persona de habla
nativa española identifica esa expresión y la analiza globalmente sin la menor dificultad.
El segundo criterio se aplica también a esta expresión porque se pronuncia de una sola
vez, sin hacer pausas entre sus elementos. Si se hiciera una pausa entre no y se
obtendríamos dos oraciones yuxtapuestas: Es que no. Se lo han dado. Y si hiciéramos
una pausa entre se y lo obtendríamos otras dos oraciones yuxtapuestas: Es que no sé. Lo
han dado. Las segmentaciones: *Esquenoselo. Han dado, *Esqueno. Selo. Han dado,
son imposibles. Por tanto este criterio también se puede aplicar a la palabra española.
El tercer criterio consiste en introducir algún elemento para interrumpir la palabra. Por
ejemplo la expresión adverbial claro. Este adverbio puede aparecer después de es para
obtener Es claro que no se lo han dado, pero entonces obtenemos una construcción
diferente. Si introducimos claro como un parentético: *Es, claro, que no se lo han dado,
la construcción es anómala. Si introducimos claro después de esque: *Es que claro no
se lo han dado la construcción es anómala a no ser que interpretemos claro como
predicado, pero entonces es otra construcción distinta. La única posibilidad es
introducirlo como parentético: Es que, claro, no se lo han dado. Las dos comas indican
precisamente que se está interrumpiendo una unidad y que se trata de un elemento ajeno
a la palabra, que tiene carácter pragmático. No se puede introducir claro después de no,
ni siquiera como parentético: *Es que no claro se lo han dado. Tampoco se puede
introducir después de se: *Es que no se claro lo han dado, ni después de lo; *Es que no
se lo claro han dado, ni después de han: *Es que se lo han claro dado.
Alguien podría objetar que claro nunca puede aparecer dentro de un elemento
derivativo o flexivo de una palabra: *niño-claro-s o *cas-claro-itas. Esto es cierto en
general en el caso de los morfemas flexivos y derivativos; pero en este artículo estoy
manteniendo que la PN, frente a la PO, consta de esos morfemas flexivos y derivativos
más otros elementos aglutinados como los clíticos, que tienen una menor integración
morfológica con el tema lexemático, pues son externos a él. Por tanto, el argumento no
es válido en este caso porque solo vale para una parte de lo que se considera aquí
palabra natural (PN), pero no para toda ella.
El cuarto criterio consiste en el hecho de que algunos de los componentes de esa
expresión no son reconocidos por las personas hablantes cuando se emiten
aisladamente. En el caso que nos ocupa, vimos al hablar sobre el punto segundo
expresiones como esqueno, noselo, lohan, quenose, que no va a ser reconocidas como
unidades lingüísticas por las personas hablantes nativas del español. Este criterio se
cumple perfectamente.
El quinto criterio se cumple también. No podemos cambiar el orden de los elementos si
no queremos obtener auténticos monstruitos morfológicos. He aquí algunos ejemplos:
Es no se que le han dado, Le han no se dado es que, Es dado que no se le han, Han
dado se le es que no y otros muchos más.
El sexto criterio se cumple también cuando observamos que algunos morfemas tienen
distinta forma según su posición, de manera que, en el ejemplo que nos ocupa, lo
aparece simplemente como l seguido de han.
El séptimo criterio también lo cumple la expresión [eskenóselandào], en donde el acento
dominante está en el elemento no. También podría aparecer en el elemento dao:
[eskenòselandáo], dependiendo del énfasis. En cualquier caso el otro elemento que
puede recibir acento lo recibe secundario. ¿Qué ocurriría si en esta expresión hubiera
dos acentos principales, uno en no y otro en dáo? Pues simplemente que estaríamos ante
dos unidades diferentes: Es que no. Se la han dado.
Por consiguiente, los mismos criterios que llevan a decir que la palabra del mohaqués es
una unidad morfológica máxima de la lengua hablada, se pueden aplicar a la unidad
morfológica del español coloquial hablado que acabamos de analizar.
¿Qué consecuencias puede tener esto para la determinación del tipo morfológico al que
pertenece el español hablado coloquial?
En el mismo artículo al que me referí anteriormente, Greenberg (1954: 12) propone un
índice de síntesis para medir la complejidad morfológica de la palabra. Este índice se
obtiene mediante la división M/P donde M es el número de morfemas y P es el número
de palabras. El número más bajo que se podría obtener es 0 si solo hay palabras léxicas
en una lengua y no hay morfemas, es decir si tenemos en un texto supongamos 10
palabras y cero morfemas (todas las palabras son lexemas), tendríamos entonces 0/10 =
0. No existe ninguna lengua de este tipo, ya que todas las lenguas del mundo tienen
elementos morfemáticos; ninguna lengua puede funcionar solo con elementos léxicos.
Hago una interpretación más estricta que la de Greenberg, ya que para este autor los
lexemas cuentan también como morfemas.
A. Tovar también usa este índice (Tovar 1981: 186) y lo define en los mismos términos
que Greenberg, según los cuales en amá-ba-mos hay tres morfemas, entendiendo
morfema como unidad significativa. Sin embargo, aquí considero que amá-ba-mos
consta de solo dos morfemas (ba y mos) más un lexema (ama). Sobre la cuestión de qué
ha de entenderse por palabra Tovar explica lo siguiente:

“El difícil problema de definir la unidad «palabra» lo resolveremos


pragmáticamente con el uso ortográfico (con evidentes contradicciones,
como díganos/nos diga).” (Tovar 1981: 186)

Este párrafo es muy revelador porque nos indica cómo se utiliza la ortografía para hacer
comparaciones tipológicas, lo cual es nefasto, porque la palabra ortográfica no es una
unidad lingüística natural sino inventada por una determinada tradición cultural. Como
ya hemos visto en las secciones anteriores y como vamos a ver en esta, la utilización de
la PO en vez de la PN supone una grave distorsión de los datos y compromete
gravemente la comparación tipológica.
Tovar (1981: 190) da el siguiente cuadro sobre los grados observables del índice de
síntesis:

ÍNDICE DE SÍNTESIS
muy alto de 2,35 a 2,59
alto de 2,09 a 2,34
medio de 1,83 a 2,08
bajo de 1,58 a 1,82
muy bajo de 1,33 a 1,57
Según esta determinación, las lenguas cuyas palabras tengan una media de menos de un
morfema por palabra tienen un índice de síntesis bajo, a partir de dos morfemas por
palabra, el índice sube de alto a muy alto.
Tovar (1981: 197) toma el dato del índice de síntesis del esquimal de Greenberg, que es
3,72, es decir, un índice altísimo y lo contrasta con el del español, que según su estudio
basado en tres textos españoles, es 1,69. Es decir, mientras que el esquimal tiene según
Greenberg un índice de síntesis altísimo, el español, según Tovar, tiene un índice de
síntesis bajísimo. Es decir, las lenguas esquimales son polisintéticas y el español no lo
es.
Pero voy a mostrar ahora mismo que el origen de esta diferencia tan grande está
precisamente, no en el carácter lingüístico del español, sino en el carácter ortográfico
del sistema utilizado en la ortografía estándar de nuestra lengua. Por consiguiente, voy a
mostrar que lo que tiene un grado bajo de síntesis no es la lengua española hablada, sino
la lengua española escrita según las normas académicas reconocidas institucionalmente.
Para ello, voy a comparar un texto de una lengua de la familia esquimal, el groenlandés,
una variedad inuí. Berge (2009: 191) recoge un texto groenlandés obtenido a finales del
siglo XIX. Aparece a continuación y se consigna al final de él el índice de síntesis.

Egede pigaar-tar-luni unnu-u-giar-toq angu-rpassuit igalaa-p silat-aanut pi-


sa-ler-mata ilaani unnua-mi aasiit, ataaseq silatangiu-mmat malik-kaluar-
sima-q-aa angu-ngajal-lugu-gooq sissa-mut tammaa-gamiuk killiga-lugu-
gooq takku-toq-qa-ssaar-poq. [28/18 = 1,55]

En este texto de la lengua oral encontramos 28 morfemas y dieciocho palabras, con lo


cual obtenemos un índice de síntesis de 1,55; es decir, de un morfema y medio por
palabra. Si contáramos también los lexemas como morfemas, entonces tendríamos 46 y
el índice sería 45/18 = 2,5, con lo que, según la tabla de Tovar, el groenlandés tiene un
nivel muy alto de síntesis y es por consiguiente una lengua polisintética.
Vamos a usar para la comparación, la traducción al español escrito de este texto

Egede fue a vigil-ar por l-a noche. Había much-o-s hombre-s situad-o-s
frente a l-a ventana. Un-a noche como de costumbre hab-ía un hombre
delante de l-a casa. L-o sigu-ió pero cuando l-o hab-ía segui-do casi hasta l-a
playa, de repente dej-ó de ver-l-o; hab-ía llega-do hasta allí y no avanz-ó
más. Nunca más se le volvi-ó a ver. [23/58 = 0,39]

Hemos respetado las palabras ortográficas y señalado los morfemas de cada una de esas
palabras. Hay 23 morfemas y 58 palabras, con lo que tenemos un índice de síntesis muy
bajo, que no llega a 1 (0,39). Para situar el español en la graduación dada por Tovar
tenemos que contar los lexemas como morfemas. Si lo hacemos así obtendremos 82/ 58
= 1,4; es decir, obtenemos un grado de síntesis muy bajo.
Pero si en vez de considerar las PO como unidades de la lengua española hablada,
consideramos las PN, es decir las palabras tal como aparecen en el habla coloquial
espontánea, los resultados van a ser radicalmente distintos. He aquí una transcripción
del texto español muchísimo más cercana al español hablado espontáneo que la
realizada anteriormente según las reglas ortográficas vigentes:

Egede fue-a-vigil-ar por-l-a-noche. Había much-o-s-hombre-s situad-o-s


frente-a-l-a-ventana. Un-a-noche como-de-costumbre hab-ía un-hombre
delante-de-l-a-casa. L-o sigu-ió pero-cuando l-o-hab-ía segui-do casi-hasta-l-
a-playa, de-repente dej-ó-de-verl-o; hab-ía-llega-do hasta-allí y-no-avanz-ó
más. Nunca-más se-l-e-volvi-ó a-ver. [45/ 27 = 1,66]

Si no contamos los lexemas como morfemas, obtenemos un índice de 1,66. Para


encontrar la equivalencia de esta cifra con la de la tabla de Tovar, hay que contar
también los lexemas, con lo cual el índice habría que calcularlo a través de la división
82/27 = 3,03. El resultado que obtenemos es realmente sorprendente: el español tiene un
índice de síntesis considerablemente mayor que el del groenlandés (2,5), lo cual sitúa al
español hablado entre las lenguas polisintéticas.
Este resultado muestra lo mucho que afecta la ortografía a la comparación y tipología de
las lenguas. En este caso, como en los demás, no es metodológicamente correcto
comparar un texto oral como el del groenlandés con un texto escrito como el de la
primera traducción que se ha dado del texto groenlandés. No lo es porque lenguas como
el groenlandés y la mayor parte de las lenguas esquimales y de muchas otras familias
del mundo no tienen tradición escrita y los lingüistas que han transcrito esas lenguas
han intentado atenerse a lo que escuchaban y no a ningún modelo ortográfico de la
lengua. Por eso, estos textos de lenguas no europeas deben ser comparados no con
textos escritos de las lenguas europeas, sino con textos orales de ellas, si es que
queremos hacer una comparación mínimamente coherente.
De todas formas, el lingüista que hace una transcripción de un texto oral del esquimal o
de cualquier lengua de otra familia lingüística sin tradición escrita, está condicionado al
hacer dicha transcripción por las convenciones ortográficas de su propia lengua. Esto
puede llevarle a que si, por ejemplo, identifica un elemento de la lengua que transcribe
como una preposición pueda llegar a escribir ese elemento separado del elemento a que
dicha preposición afecta, por influencia del sistema ortográfico de su propia lengua.
Esta circunstancia, que puede pasar inadvertida en más de una ocasión, puede ser la
responsable de que, en el caso que hemos visto, el español hablado resulte ser una
lengua más polisintética que el propio esquimal. Es posible que la inercia ortográfica del
lingüista o del estudioso que ha realizado la transcripción haya hecho algunas
separaciones que no se producen en el habla. De aquí podría surgir el sorprendente
resultado que hemos obtenido en el pequeño pasaje analizado. Esto ya lo observamos en
la sección anterior al comparar el euskera y el español. Si comparamos el español
hablado espontáneo con el euskera escrito estándar, tendremos también unos resultados
sesgados ya que, como hice notar, el euskera escrito estándar tampoco refleja con total
fidelidad el euskera hablado realmente.
Convendría preguntarse si estamos, al describir las lenguas esquimales, ante un tipo de
lengua polisintética diferente de otros tipos lingüísticos o bien estamos ante la
explotación de un procedimiento que existe en todas las lenguas del mundo y que cada
una de ellas aprovecha en mayor o menor medida. Ese procedimiento ha sido
identificado y estudiado por W. J. de Reuse (2009) quien lo ha denominado
concatenación productiva no flexiva (CPN) (productive noninflectional concatenation,
PNC). Este autor (de Reuse 2009: 22) propone la siguiente tabla en donde se compara la
CPN con la flexión (F), la derivación (D) y la sintaxis (S).

F D CPN S
Productividad sí no sí sí
Recursividad no no sí sí
Concatenación necesaria no no sí sí
Orden variable no no sí sí
Interacción sintáctica sí no sí sí
Cambio categorial no sí sí sí

De Reuse analiza, para ilustrar la primera propiedad, el ejemplo 17 de yupí central


siberiano que hemos visto antes y que repito aquí para facilitar la lectura:

20. Neghyaghtughyugumayaghpeteaa
negh-yaghtugh-yug -uma-yagh -pete –aa
comer-ir-querer-pasado-afijo frustrativo-afijo inferencial-3 persona
‘Resulta que quería ir a comerlo pero…’
La productividad se refiere al hecho de que se pueden obtener estas palabras naturales
como la vista de modo sistemático y abierto. No existen como palabras en una lista
memorizada por las personas hablantes, sino que se crean de forma ocasional. Según
observa de Reuse, en la expresión de 20 solo hay dos elementos obligatorios: negh y –
aa; los demás elementos son opcionales y podrían aparecer o no, con lo cual se pueden
obtener diversas palabras naturales más breves en las que aparecen algunos de los afijos
morfológicos, por lo que se pueden formar treinta palabras diferentes con distintas
combinaciones de afijos (de Reuse 2009: 23).
Consideremos desde este punto de vista la expresión de la lengua española coloquial
que comparábamos con la forma del yupí aducida: eskenoselandao (es que no se lo han
dado, en forma ortográfica). Es evidente que, como en el caso del ejemplo del yupí, es
una palabra natural (PN) de formación ocasional que no parece acertado considerar
como un elemento formado y almacenado en la memoria de las personas hablantes. Por
otro lado, como ocurre en el caso del yupí, la forma andao sería el núcleo obligatorio
desde el punto de vista de la buena formación como PN, los demás elementos son
concatenados de forma opcional. De hecho, podemos también obtener las siguientes
variantes según los elementos que se añadan o se dejen de lado: noandao, nolandao,
noselandao, kelandao, kesalandao, eskelandao, eskeselandao. Todas estas formas son
ocasionales y libremente generadas y procesadas por las personas usuarias de la lengua
española. Por tanto, desde el punto de vista de la productividad, las dos expresiones se
comportan de modo análogo.
En cuanto a la recursividad, De Reuse (2009: 24) ofrece el siguiente ejemplo ilustrativo:

21. iitghesqesaghtiisqaa
itegh-sqe-yaghtugh-sqe–aa.
entrar-pedir-ir-pedir-3persona del singular
‘Lej pidió que lek pidiera entrar’

En este ejemplo, el elemento sqe ‘pedir’ aparece en dos ocasiones, por lo que se está
utilizando recursivamente.
Algo similar podemos ver en algunas PN españolas como, por ejemplo, losdelosniños,
en donde el artículo los aparece en dos posiciones con referencias diferentes, tal como
ocurre en el ejemplo del yupí que aporta De Reuse. Por tanto, en este aspecto las PN del
español se comportan como las PN del yupí.
La concatenación es típica de todas las palabras que estamos viendo en este artículo; por
ello no hace falta ilustrar esta característica de la CPN.
El orden variable lo ilustra de Reuse con los siguientes dos ejemplos del yupí:

22. aananiitkaa
aane -nanigh -utke -aa
salir-dejar de- por ello-ind.3s.3s
‘Ha dejado de salir por ello.’

23. aanutkenanighaa
aane -utke -nanigh -aa
salir-por ello-dejar de-ind.3s.3s
‘Ha dejado de salir por ello

En estas oraciones aparece el morfema utke en dos posiciones diferentes, aunque las
oraciones tienen el mismo significado.
En español coloquial no es infrecuente encontrar este tipo de movilidad. Por ejemplo, si
comparamos el vulgar mesecayó con el culto se me cayó, observamos dos órdenes
alternativos del mismo elemento. También se pueden ver variaciones en el español
coloquial entre, por ejemplo, melodé, frente al estándar démelo para el imperativo.
Respecto a la interacción con la sintaxis, de Reuse (2009: 26) aporta el siguiente
ejemplo de yupí siberiano:
24. atan aangelghiimeng qikmilguuq.
ata -n aange-lghii -meng qikmigh-lgu –uq
padre-posesivo .2s.abs.sg. ser grande-intr.ptcp-mod.sg. perro-tener -ind.3s
‘Tu padre tiene un perro grande’

En este caso vemos que la atribución del adjetivo aange (‘grande’) se aplica a un
elemento que está en el interior de una PN, es decir a qikmigh (‘perro’).
En español también podemos ver casos de interacción la sintaxis, como por ejemplo el
regalo locompré ayer, donde la PN locompré contiene un elemento relacionado con el
objeto el regalo.
El cambio categorial lo aprecia de Reuse (2009: 27) en el siguiente ejemplo del yupí
central siberiano:
25. yughaghvigllangyugtut
yughagh-vig-ghllag-nge -yug –tut
rezar -lugar-grande-adquirir-querer-indicativo 3persona
‘Quieren adquirir una gran iglesia’
Este autor observa que la expresión verbal yughagh- ‘rezar’ cambia categorialmente a
nombre en la forma yughaghvig- ‘iglesia’ y luego, a otro nombre yughaghvigghllag
‘iglesia grande’ y, por último vuelve a convertirse en verbo en yughaghvigghllagnge
‘adquirir una gran iglesia’.
En el ejemplo del español coloquial que vimos al ilustrar la recursividad losdelosniños
también puede verse este cambio categorial: losniños que es un nombre, pasa a
modificador nominal (delosniños) y luego otra vez a nombre (losdelosniños).
Como consecuencia de los análisis precedentes y del concepto de CNP, de Reuse
plantea introducir el concepto de CNP entre los dos procedimientos fundamentales de la
morfología:

“Una consecuencia de aceptar el CNP como una rasgo caracterizador de la


polisíntesis es una visión ‘trinitaria’ de la morfología. En vez de distinguir
entre flexión y derivación, ahora hay que diferenciar entre morfología
flexiva, CNP y derivativa. Así que la CNP es un tipo de morfología, al
mismo nivel que la flexión y derivación.” (de Reuse 2009: 27)

Esta introducción supone una modificación sustancial del tipo de morfología clásica a
que aludí al principio de este artículo en los siguientes términos:

“Otra consecuencia de este punto de vista es que no existe el ‘tipo lingüístico


polisintético. Las lenguas denominadas ‘polisintéticas’ son idiomas con un
uso grande o notable de la CNP. La diferencia entre las lenguas polisintéticas
y no polisintéticas es, pues, de tipo cuantitativo, no cualitativo.” (de Reuse
2009: 28).

Esta conclusión deja abierta la puerta a la idea de que todas las lenguas del mundo son
polisintéticas en mayor o menor grado. Acabamos de ver en esta sección que el español
coloquial, ajeno a las convenciones analíticas de la lengua escrita, es una lengua tan
polisintética como el yupí siberiano central.

7 Conclusión: el español como lengua aglutinante y polisintética.


En este artículo he examinado los supuestos tipos lingüísticos aglutinante y
polisintético desde el punto de vista de las lenguas habladas espontáneas, entre ellas el
español coloquial. Primero, he puesto de manifiesto que existe una clara diferencia
lingüística entre los idiomas flexivos y no flexivos, o de flexión reducida. Por ejemplo,
el ruso tanto escrito como hablado en su forma coloquial es una lengua claramente
flexiva, frente al inglés escrito y hablado que es una lengua muy poco flexiva o el chino
escrito, que es una lengua no flexiva y el chino hablado, en el que hay unos pocos
indicios aislados de fusión morfológica. Por tanto, sí parece lícito distinguir las lenguas
flexivas de las no flexivas, tanto en el nivel de la lengua hablado como en el de la
lengua escrita.
He explicado, sin embargo, que los conceptos de lengua aislante, monosilábica y
aglutinante están fuertemente influidos por la lengua escrita. En cuanto a los dos
primeros tipos, de los que me he ocupado en la segunda sección del presente artículo, he
mostrado que su postulación se basa exclusivamente en el análisis de la lengua escrita;
respecto del tercero, la aglutinación, he intentado mostrar que la diferencia entre lenguas
aglutinantes y no aglutinantes está en una gran medida determinada también por la
lengua escrita. En general, la lengua escrita es mucho más analítica que la lengua
natural, es decir, la hablada. Por eso, la escritura no recoge el hecho de que el habla
coloquial normal espontánea es muy aglutinante y, por ello, considera como
aglutinantes propiamente hablando algunas lenguas cuyas convenciones ortográficas
dejan pasar de forma más clara ese carácter aglutinante universal. Como conclusión,
cabe decir que la aglutinación es una de las características fundamentales de todas las
lenguas habladas naturales y no de un determinado tipo de lenguas.
En las secciones tercera y cuarta de este artículo he analizado con más detalle la idea de
que hay lenguas de tipo aglutinante, como el turco, el húngaro, el finés o euskera.
Concretamente, en la sección cuarta he analizado críticamente los resultados relativos al
índice de aglutinación del euskera comparado con el del español. Mediante una serie de
ejemplos, he intentado mostrar que esos resultados están significativamente sesgados
por la representación gráfica normativa de las lenguas consideradas y que si corregimos
la fuente del problema, los índices de aglutinación que obtenemos del euskera y del
español son significativamente similares.
En la sección quinta, he expuesto un concepto de palabra que no se basa en la palabra
escrita y, por tanto, en las convenciones ortográficas, sino en la palabra oral como
unidad máxima de organización de las acciones de producción y procesamiento de la
información en las lenguas naturales. He analizado una propuesta concreta para
caracterizar lingüísticamente esa unidad máxima, que denomino palabra natural.
La sección sexta se dedica a examinar el tipo lingüístico denominado polisintético. Se
analizan varias palabras-oración del yupí siberiano central, una lengua esquimal, y los
índices de síntesis propuestos para el esquimal y el español. Vuelvo a mostrar que esos
índices de síntesis se obtienen a partir de unos datos sesgados por las reglas ortográficas
del español. Si se corrige ese sesgo, se llega a la inequívoca conclusión que el español
coloquial hablado informal es tanto o más polisintético que el yupí y otras lenguas
consideradas tradicionalmente como pertenecientes a este supuesto tipo lingüístico, tal
como muestro detenidamente en esa sección al comparar un breve texto groelandés, otra
lengua de la familia esquimal, con su traducción española.
Examino también una propuesta reciente en la que se mantiene que tanto las lenguas
esquimales como las demás lenguas del mundo, incluido, claro es, el español, conocen
un procedimiento morfológico denominado concatenación productiva no flexiva que
hace posible que todas las lenguas del mundo puedan calificarse como polisintéticas,
siendo las diferencias entre ellas de grado respecto de este parámetro. Por tanto, no
existe el tipo polisintético de lengua y, además, todas las lenguas del mundo son tanto
aglutinantes como polisintéticas en mayor o menor grado.
Las conclusiones de este trabajo se basan en un postulado esencial de la lingüística
contemporánea: las lenguas habladas o señadas espontáneas han de ser la materia prima
fundamental de los datos y hechos lingüísticos; las lenguas escritas son derivadas de las
primeras y no pueden constituir la base probatoria definitiva para la caracterización del
lenguaje humano. Por tanto, si vemos una característica que se da solo en la lengua
escrita y no se da en la lengua hablada espontánea, entonces esa característica no puede
ser utilizada para caracterizar las lenguas naturales tal como aparecen en toda
comunidad humana, conozca o no la escritura. La escritura es una elaboración cultural
realizada a partir de la lengua natural y constituye un aspecto de lo que denomino
lengua cultivada. Sería absurdo estudiar las lenguas del mundo a través de las
respectivas formas poéticas, mágicas, rituales o religiosas de cada una de ellas. Todas
las comunidades humanas conocen variedades artificialmente modificada de sus lenguas
naturales, que se usan para fines como los que acabo de enumerar. Se trata de lo que
llamo lenguas cultivadas (Moreno Cabrera 2011, 2013). Dado que las lenguas
cultivadas, entre las que se encuentran las lenguas estándar escritas de algunas
sociedades occidentales y orientales, se obtienen mediante modificaciones
culturalmente determinadas de ciertos aspectos de las lenguas naturales espontáneas, no
es lícito metodológicamente caracterizar las lenguas naturales mediante las formas,
reglas y procesos que son propios de las lenguas cultivadas.
Las normas ortográficas vigentes en una comunidad idiomática son precisamente de
carácter cultural, no natural y, por tanto, no deberían formar parte ni tener repercusión
alguna en el estudio de las lenguas naturales, dado que no sirven para caracterizar las
propiedades, reglas y procesos de dichas lenguas naturales.
Sin embargo, la influencia de las convenciones ortográficas es tan grande entre los
lingüistas que incluso se respetan en aquellos estudios explícitamente dedicados a la
lengua coloquial espontánea, que no se basa ni se puede pasar en las convenciones
ortográficas de una lengua. Un ejemplo de esto, entre los muchísimos que pueden
aportarse, lo tenemos en un estudio de un corpus de referencia integrado de las lenguas
romances habladas, denominado C-ORAL-ROM (Cresti y Moneglia 2005). Todos los
ejemplos de frases extraídos de este corpus se dan siguiendo las normas ortográficas de
cada lengua analizada. He aquí unos ejemplos:

español: la moto de mi abuelo (Cresti y Moneglia 2005: 153)


italiano: passiamo ad un altro argomento / via (Cresti y Moneglia 2005: 103)
francés: il est malade quoi (Cresti y Moneglia 2005: 118)
portugués. Ana lembrou a mãe da sua consulta médica (Cresti y Mioneglia 2005: 185)

En estas expresiones, extraídas del corpus de referencia de las lenguas habladas


coloquiales de cuatro lenguas europeas, se transcriben expresiones de ese corpus
utilizando las convenciones ortográficas de cada una de las lenguas implicadas. Esto
supone falsear claramente los datos empíricos, ya que puedo afirmar con rotundidad que
en ninguno de los cuatro ejemplos que acabo de mencionar las personas que los
emitieron hicieron las pausas que sugieren los espacios en blanco que hay entre las
palabras ortográficas que aparecen, de modo que la persona galo-hablante es seguro que
no pronunció ilt est malade haciendo sendas pausas después de il y después de est, la
persona hispanohablante es seguro que no hizo una pausa entre la y moto tal como
sugiere la transcripción del ejemplo, la persona italiano-hablante no hizo la pausa
sugerida por la escritura entre ad, un y altro y la persona luso-hablante seguro que no
hizo las pausas sugeridas por la ortografía al emitir a mãe da sua, ni, por supuesto,
pronunció nada que se pueda transcribir como una “a” mayúscula (el nombre propio
Ana). Todas estas transcripciones sugieren unidades y agrupaciones que no son propias
de la lengua hablada espontánea sino de la lengua escrita. Por consiguiente, al hacer
estas transcripciones se están desvirtuando gravemente los datos del corpus oral y, por
tanto, se está induciendo a conclusiones equivocadas sobre cómo es y cómo opera la
lengua hablada coloquial espontánea: no sabemos a ciencia cierta qué unidades son
operativas en la lengua natural hablada espontánea. Lo que sí es seguro es que no son
las unidades reconocidas en las normas ortográficas. Entonces, ¿por qué recurrir a estas
normas cuando se está precisamente estudiando la lengua coloquial hablada y no la
lengua estándar escrita?
No hay justificación científica plausible de este proceder. ¿Qué inconveniente hay para
transcribir la moto como lamoto? Evidentemente, ninguno, sobre todo cuando se trata
de un estudio de la lengua coloquial hablada. Pero la cuestión es más grave aún, porque
precisamente una de las pocas cosas en las que se han puesto de acuerdo todos los
lingüistas de modo universal es precisamente en la transcripción del habla mediante el
Alfabeto Fonético Internacional (AFI, IPA 1999). La utilización del AFI en la
investigación lingüística debería ser imprescindible, dado que como las normas
ortográficas de las diversas lenguas que se escriben son diferentes y no todas son
conocidas por todos los lingüistas (¿cuántos lingüistas conocen, por ejemplo, las normas
ortográficas del húngaro o del vasco?), la única manera de no crear malos entendidos o
interpretaciones equivocadas de los datos es renunciado a las ortografías de las lenguas
que se escriben y recurriendo a la convención universalmente aceptada del AFI. Esto
podría ser opcional cuando se trata la lengua escrita, pero debería ser obligatorio cuando
lo que estudiamos es la lengua oral. Además, existen diversos niveles de transcripción
fonética de las expresiones: hay transcripciones más anchas y más estrechas que se
pueden ajustar fácilmente a los propósitos que se persigan en cada caso. Por ejemplo, en
el caso de la expresión española la moto, bastaría una transcripción ancha como
[lamóto] sin necesidad de incluir más detalles fonéticos que en el uso que se hace de
este ejemplo no vienen al caso.
Podría parecer que esta cuestión de la transcripción de las expresiones es menor o
secundaria y que no afecta nada esencial de la tarea investigadora lingüística. Sin
embargo, he intentado demostrar en este artículo que la utilización de las convenciones
ortográficas normativas para transcribir los ejemplos de las diversas lenguas tiene
efectos muy perniciosos en la disciplina de la tipología lingüística (Moreno Cabrera
2008). De hecho, la clasificación tipológica en lenguas aislantes, aglutinantes y flexivas
se basa casi exclusivamente en la lengua escrita y, tal como he razonado en este trabajo,
dado que no existen los tipos aislante y aglutinante, todas las lenguas del mundo, en el
nivel oral espontáneo, son claramente aglutinantes. El término polisintético como
caracterizador de un supuesto tipo lingüístico tampoco es acertado, dado que, desde el
punto de vista de la lengua hablada espontánea, una lengua no considerada polisintética
como el español, lo es tanto como las lenguas esquimales, consideradas desde hace
mucho tiempo como el paradigma de este tipo de idiomas.
La conclusión que extraigo de estas páginas puede parecer muy espectacular pero en
realidad es casi una obviedad. La conclusión consiste en mantener que el español
coloquial es una lengua aglutinante (como el vasco o el turco) y polisintética (como las
lenguas esquimales, algonquinas o iroquesas). Pero esto es realmente decir muy poco,
porque todas las lenguas habladas del mundo son aglutinantes y polisintéticas en mayor
o menor medida.

REFERENCIAS BIBLIOGRÁFICAS

Berge, A. (2009) “Tracking Topics. A comparison of topic in Aleut and Greenlandic


discourse”, en Mahieu y Tersis 2009: 185-200.
Coulmas, F. (2003) Writing Systems. An introduction to their linguistic analysis. Cambridge:
Cambridge University Press.
Cresati, E. y M. Moneglia (2005) C-ORAL-ROM. Integrated Reference Corpora for Spoken
Romance Languages. Amsterdam: John Benjamins.
Dahl, Ö (2004) The Growth and Maintenance of Linguistic Complexity. Amsterdam:
John Benjamins.
de Reuse, W. J. (2009) “Polysynthesis as a typological feature: An attempt at a
characterization from Eskimo and Athabaskan perspectives” en Mahieu y Tersis
2009: 19-34.
de Rijk, R. P. G. (2008) Standard Basque. A Progressive Grammar. Cambridge, Mass.:
The MIT Press.
González Pereira, M. (2011) Signo léxico y signo gramatical en la antigüedad clásica.
Raíces históricas de una distinción lingüística. Lugo: Axac.
Greenberg, J. (1954) “A Quantitative approach to the Morphological Typology of
Language”, en K. Denning y S. Kemmer (eds.) On Language. Selected Writings
of Joseph H. Greenberg, Stanford: Stanford University Press, 1990: 3-25.
Han, J., J. Ma y X. Lü (2002) Chinese –er suffixed words without tears. Pekín:
Universidad de Pekín.
IPA (1999) Handbook of the International Phonetic Association. A guide to the use of
the Internationl Phonetic Alphabet. Cambridge: Cambridge University Press.
Mahieu, M.-A. y N. Tersis (eds.) (2009) Variations on Polysynthesis. The Eskaleut
Languages. Amsterdam: John Benjamins.
Mithun, M. (1996) “Overview of general characteristics”, en I. Goddard (ed.) Handbook
of North American Indians. Vol 17. Languages. Washington: Smithsonian
Institution, 1996: 137-157.
Mithun, M. (2009) “Polysynthesis in the Arctic” en Mahieu y Tersis 2009: 3-18.
Moreno Cabrera, J. C. (2007-2008) “Sobre la complejidad y dificultad de las lenguas. El
caso del euskera” en Revista de Lenguas y Literaturas catalana, gallega y
vasca” XIII, UNED, 2007-2008: 199-216.
Moreno Cabrera, J. C. (2008) “The Written Language Bias in Linguistic Typology”,
Cuadernos de lingüística XV IUOG, 2008: 117-137
Moreno Cabrera, J. C. (2011) “Diversidad lingüística y diversidad cultural. Tipología,
evolución y complejidad”, en J. J. Martos, L. Trapassi, I. García y V. M. Borrero
(eds.) Diálogos interculturales: lenguas, literaturas y sociedad. Barcelona:
Anthropos, 2011: 11-41.
Moreno Cabrera, J. C. (2013) Cuestiones clave de la lingüística. Madrid: Síntesis.
Nespor, M. e I. Vogel (1994) La prosodia. Madrid: Visor Distribuciones.
Packard, J. L. (2000) The Morphology of Chinese. A Linguistic and Cognitive
Approach, Cambridge: Cambridge University Press.
Reichenbach, H. (1947) Elements of Symbolic Logic, New York, Dover.
Tovar, A. (1981) “Comparación: léxico-estadística y tipología”, en A. Tovar Estudios
de Tipología Lingüística. Sobre el euskera, el español y otras lenguas del Viejo y
el Nuevo Mundo. Madrid: Istmo, 1997: 173-204.

También podría gustarte