Está en la página 1de 28

Algodoncillo, Sucre 1995

Fotografa, 1937 x 2566 pixeles

Clasificacin de textos especializados


a partir de su terminologa*1
Mg. Ricardo Guantiva Acosta**
Dr. M. Teresa Cabr Castellv***
Dr. Josep M. Castell Lidon****
El artculo clasica textos en niveles de especializacin, a partir de la tipologa lingstica de las
unidades terminolgicas y su densidad dentro del texto especializado. Para ello revisamos algunos
conceptos bsicos de la lingstica textual en el marco de la comunicacin especializada (texto
general y texto especializado), para establecer las diferencias de registros comunicativos. Tambin
revisamos la nocin de unidad terminolgica, tomando como marco la teora comunicativa de la terminologa (TCT). En cuanto a los materiales empricos, trabajamos con un corpus textual en relacin
con el tema genoma humano, clasicado en niveles de especializacin. Asimismo, presentamos,
de manera muy sucinta, el tratamiento informtico de los textos, para hacer la extraccin y deteccin de
la terminologa contenida en ellos y, mediante el uso de un programa estadstico, presentamos los
resultados discriminantes para la clasicacin de textos en niveles de especializacin.
Palabras clave: textos especializados, terminologa, lingstica textual, unidades terminolgicas,
comunicacin especializada
This article deals with the classication of specialized texts based on the linguistic typology of terminology units and their density within the texts. With this in mind, we review some basic concepts of
text linguistics in the context of specialized communication (general texts and specialized texts) in
order to establish the differences between communicative registers. We also examine the concept
of terminology unit, using the Communicative Theory of Terminology (CTT). In terms of the materials
used, we worked with a text related to the topic of human genome, classied into different levels of
specialization. To this respect we also offer a brief description of the computer analysis carried out
in the extraction and detection of the terminology units within the texts, and we present the results,
classifying the texts into different levels of specialization.
Key words: specialized texts, terminology, textual linguistics, terminology units, specialized communication
Cet article classe des textes en niveaux de spcialisation selon la typologie linguistique des units
terminologiques et de leur densit dans le texte spcialis. Cest pourquoi nous revenons sur certains
concepts fondamentaux de la linguistique textuelle dans le cadre de la communication spcialise

* Recibido: 19-11-07 / Aceptado: 01-03-08


1 Proyecto de tesis doctoral dirigida por la doctora M. Teresa Cabr Castellv y por el
doctor Josep M. Castell Lidon, del Institut Universitari de Lingstica Aplicada (IULA)
de la Universitat Pompeu Fabra en Barcelona, Espaa.

kala, revista de lenguaje y cultura


Vol. 13, N. 19 (ene.-jun., 2008)

15

Mg. Ricardo Guantiva Acosta, Dr. M. Teresa Cabr Castellv, Dr. Josep M. Castell Lidon
(texte gnral et texte spcialis), an dtablir les diffrences de registres communicatifs. Nous
revoyons galement la notion dunit terminologique dans le cadre de la Thorie Communicative
de la Terminologie (TCT). En ce qui concerne le matriel empirique, nous travaillons partir dun
corpus textuel sur la question du gnome humain du point de vue des niveaux de spcialisation. Nous
proposons galement une brve prsentation du traitement de texte informatique pour en extraire
et y dtecter la terminologie, et grce lutilisation dun programme statistique, nous prsentons les
rsultats discriminatoires pour la classication de textes en niveaux de spcialisation.
Mots cls: textes spcialiss, terminologie, linguistique textuelle, units terminologiques, communication spcialise

16

kala, revista de lenguaje y cultura


Vol. 13, N. 19 (ene.-jun., de 2008)

Clasificacin de textos especializados a partir de su terminologa

1. INTRODUCCIN

a comunicacin especializada o los discursos profesionales reejan el


vasto desarrollo de la sociedad actual. Prueba de ello son los avances o
desarrollos tanto en la ciencia como en la tecnologa a partir de la proliferacin
de publicaciones diversas con un alto uso predominante de terminologa especca. Situarse en cualquiera de estos dos campos implica informarse sobre
dichos avances, lo que representa, igualmente, conocer y dominar las distintas
denominaciones que pueden darse a un mismo objeto o ente de conocimiento.
As pues, para que un proceso comunicativo especializado cumpla su propsito
de transmitir informacin o conocimiento especializado, hace falta que los
interlocutores conozcan de antemano cules son las condiciones necesarias
para que el intercambio de referentes de conocimiento sea efectivo.
Los factores relevantes como el emisor, el destinatario, el tema, la situacin
comunicativa, entre otros, llevan a establecer tipos de comunicacin especializada, entendida como el proceso mediante el cual se imparte o comparte
conocimiento especializado; por ejemplo, la comunicacin que se da entre un
par de especialistas en algn campo de conocimiento no implica mayor esfuerzo
cognitivo en cuanto al uso de terminologa especfica, caso contrario cuando
se quiere hacer entre un especialista y el pblico en general.
Por tanto, la transmisin del conocimiento especializado admite una gradacin,
susceptible de ser descrita mediante las unidades lingsticas que intervienen
en el texto. La comunicacin especializada responde a la propiedad de la adecuacin, en funcin de la cual las condiciones de produccin y recepcin de los
textos vienen dadas por el contexto comunicativo (estrategias comunicativas),
lo que representa la produccin de textos especializados como el medio natural
de la terminologa, de acuerdo con las condiciones pragmticas que impulsan
la produccin de este tipo de textos.
El objeto de anlisis de este artculo son los diferentes niveles de especializacin
textual mediante los cuales puede transmitirse el conocimiento. Esta distribucin
de niveles de especializacin es lo que se conoce como variacin vertical del

kala, revista de lenguaje y cultura


Vol. 13, N. 19 (ene.-jun., de 2008)

17

Mg. Ricardo Guantiva Acosta, Dr. M. Teresa Cabr Castellv, Dr. Josep M. Castell Lidon

discurso (Hoffmann, 1998: 62) y viene determinada tanto por la cantidad de


informacin compartida entre los interlocutores como por la finalidad del texto.
De ah la distincin entre: 1) el discurso especializado (con distintos grados de
especializacin), dirigido a los especialistas; 2) el discurso de tipo didctico,
orientado al personal en formacin, y 3) el discurso de carcter divulgativo,
enfocado al pblico general.
Estos distintos niveles de competencia reflejan el mayor o menor uso de terminologa y la forma como ella recorre los textos. De este modo, pretendemos observar
de qu manera la comunicacin especializada requiere que la terminologa se
adapte a cada uno de estos niveles de especializacin discursiva.
Para lograr este objetivo propuesto, partimos del supuesto de que el clculo de la
densidad terminolgica debe tener en cuenta tanto la frecuencia de las unidades
terminolgicas como su naturaleza lingstica. Consideramos que estos factores
permiten diferenciar y, por tanto, clasificar textos, mediante niveles de especializacin, dado que, en la configuracin del conocimiento de un mbito o campo
de especialidad, el lxico contribuye a la caracterizacin de textos.
As pues, esperamos que el resultado de este anlisis permita establecer las diferencias entre textos de diferentes niveles de especializacin, lo que representara
un mejor conocimiento de la gnesis y la articulacin de los textos especializados
como variedades funcionales o registros (variacin vertical).
En este artculo revisamos algunos conceptos bsicos de cara a la comprensin de
la produccin textual en el marco de la comunicacin especializada. Por un lado,
repasamos las nociones de texto general y texto especializado, para establecer las
diferencias de registros comunicativos; y, por otro, la nocin de unidad terminolgica, tomando como marco la teora comunicativa de la terminologa (TCT) (Cabr,
1999: 2003). En cuanto a los materiales empricos, trabajamos con un corpus textual
en relacin con el tema genoma humano, clasificado en niveles de especializacin.
Asimismo, presentamos, de manera muy sucinta, el tratamiento informtico de los
textos, para hacer la extraccin y deteccin de la terminologa contenida en ellos
y, mediante el uso de un programa estadstico, mostramos los resultados discriminantes para la clasificacin de textos en niveles de especializacin.

18

kala, revista de lenguaje y cultura


Vol. 13, N. 19 (ene.-jun., de 2008)

Clasificacin de textos especializados a partir de su terminologa

2. CONCEPTOS BSICOS
2.1. El texto general
La nocin de texto ha sido discutida ampliamente en el mbito de la lingstica
textual. El texto es una unidad comunicativa, resultado de la actividad lingstica
mediante la cual se transfieren significados. Dado su carcter pragmtico, el emisor
de un texto tiene en cuenta la intencin comunicativa circunscrita a un contexto
de situacin y produccin (Bernrdez, 1982: 82; Castell, 1992: 49-53; Van Dijk,
1980: 9-17; 1989: 13-30; 1993: 29-46; Eggins y Martin, 2000: 335-370).
Para Beaugrande y Dressler,
[] el texto es un acontecimiento comunicativo que cumple siete normas de
textualidad o principios constitutivos: a) cohesin: dependencias gramaticales, b)
coherencia: relaciones conceptuales, c) intencionalidad y modalidad: la actitud
del productor del texto, d) aceptabilidad: la actitud del que recibe el texto, e)
informatividad, f) situacionalidad y g) intertextualidad (1997: 35-47).

Ciapuscio propone que los textos deben considerarse como


[] recursos primordiales de constitucin del conocimiento, cuyas formas,
estructuras, contenidos, funcionalidades, etc., responden a desarrollos socio-culturales
y, por tanto, ms all de los sistemas lingsticos particulares, pueden exhibir en los
niveles ms globales (gneros, estilos, etc.) caractersticas especficas debidas a la
sociedad o comunidad particular en que son construidos y empleados (2003: 23).

Las nociones de texto nos dejan entrever que trabajamos con unidades comunicativas de carcter lingstico. stas son herramientas clave de todo
proceso de interaccin social en el que convergen significados, intenciones y
situaciones comunicativas concretas, para representar el conocimiento general
de una sociedad.
2.2. El texto especializado
La nocin de texto especializado lleva a la distincin entre el lenguaje general
y lenguaje especializado. Con el primer trmino se alude al conjunto de reglas

kala, revista de lenguaje y cultura


Vol. 13, N. 19 (ene.-jun., de 2008)

19

Mg. Ricardo Guantiva Acosta, Dr. M. Teresa Cabr Castellv, Dr. Josep M. Castell Lidon

lingsticas que utilizan los individuos para comunicarse y, con el segundo,


al conjunto de todos los recursos lingsticos que se utilizan en un mbito comunicativo (la temtica, el tipo de interlocutores, la situacin comunicativa,
la intencin del emisor, etc.) para garantizar la comprensin entre las personas
que trabajan en este mbito (Kocourek, 1982; Arntz y Picht, 1995; Sager, 1993;
Schrder, 1991; Hoffmann, 1998a; Cabr, 1999; Ciapuscio, 2003).
Para Baldinger
[] los lmites entre el lenguaje especializado y la lengua comn son fluidos tanto
desde el punto de vista individual, social y geogrficos, como desde el general: esto
significa que entre los tres crculos se produce un constate proceso de compensacin
en ambas direcciones puesto que los tres crculos pueden coincidir en un mismo
individuo (1952: 90, citado en Arntz y Picht, 1995: 30).

Para Kocourek (1982: 10), un texto especializado tiene una doble lectura: por
un lado, la perspectiva semitica considera el lenguaje especializado como un
sistema de transmisin e intercambio de informacin que emplea diversos cdigos simultneamente; y por otro, la perspectiva lingstica centra la atencin
en la prioridad comunicativa del lenguaje. Desde esta perspectiva,
[] les textes spcialiss sont-ils lexpression concrte de la connaissance
approfondie dans le domaine, ils signifient cette connaissance; leur contenu cest
la connaissance approfondie que les spcialistes peuvent communiquer au public
restreint de leurs pairs. Signification cest communication virtuelle, communication
cest transmission de la connaissance signifie (Kocourek, 1982: 33).

Para la teora de los sublenguajes


[] el texto especializado es el instrumento o el resultado de la actividad
comunicativa ejercida en relacin con una actividad socioproductiva especializada
(Hoffmann, 1998b: 77).

El texto especializado se caracteriza a partir de la unidad estructural, que constituye


el conjunto de sus oraciones coherentes de tipo pragmtico, sintctico y semntico.
Por tanto, dada su estructura comunicativa compleja, el texto est sujeto a factores
como: 1) la intencin comunicativa del autor y la estrategia comunicativa que se

20

kala, revista de lenguaje y cultura


Vol. 13, N. 19 (ene.-jun., de 2008)

Clasificacin de textos especializados a partir de su terminologa

deriva de ella; 2) el destinatario con actitud expectante, y 3) el lxico, determinado


por el uso especfico de terminologa que puede presentar grados de opacidad,
de especializacin y variacin expresiva (Cabr, 1999: 156-159).
Para Ciapuscio
[] los textos especializados son productos predominantemente verbales de registros
comunicativos especficos, registros que son definidos por los usuarios de los textos,
las finalidades y las temticas. Los textos especiales se refieren a temticas propias
de un dominio de especialidad y responden a convenciones y tradiciones retricas
especficas. Los factores funcionales, situacionales y temticos tienen su correlato en
el nivel de la forma lingstica, tanto en la sintaxis como en el lxico (2003: 30).

Las propuestas anteriores coinciden en sealar que el texto especializado es un


producto de naturaleza lingstica, que combina simultneamente cdigos diversos
para representar la realidad de un mbito de especialidad. Esta representacin est
sujeta a factores sociopragmticos que enmarcan al texto e inciden en su tipologa.
Algunos de estos factores son: 1) la temtica; 2) el tipo de interlocutor, y 3) el tipo
de situacin comunicativa, condicionada por el tipo de registro empleado.
El texto especializado, como registro comunicativo especfico, puede articular
su contenido de formas condicionadas por los factores sociopragmticos, lo que
conduce a la variacin discursiva.
2.3. La variacin discursiva
La nocin de variacin de un texto (general o especializado) est relacionada
con la propiedad de adecuacin, por la cual el texto se acopla al contexto. El
contexto es el campo de cultivo a partir del cual se genera el texto. En este proceso de creacin intervienen factores funcionales, situacionales y temticos, que
generan registros, tipos o clases de textos necesarios para la comunicacin y
gneros textuales.
Registro, tipo y gnero textuales
La nocin de registro permite desarrollar, para este trabajo, la nocin de variacin vertical en el texto especializado, pues sta

kala, revista de lenguaje y cultura


Vol. 13, N. 19 (ene.-jun., de 2008)

21

Mg. Ricardo Guantiva Acosta, Dr. M. Teresa Cabr Castellv, Dr. Josep M. Castell Lidon

[] es a la vez muy simple y muy importante: se refiere al hecho de que la lengua


que hablamos o escribimos vara de acuerdo con el tipo de situacin. [...] La nocin
de registro constituye as una forma de prediccin: dado que conocemos la situacin
(el contexto social de utilizacin del lenguaje), podemos predecir mucho respecto
del lenguaje que se producir con probabilidades razonables de estar en lo cierto
(Halliday, 1994: 46-47).

Los registros responden a formas lingsticas determinadas, condicionadas por


funciones comunicativas concretas. Cada una de las caractersticas de los registros
admiten una gradacin con lmites imprecisos, lo que origina que un texto pueda
ser ms o menos especfico o ms o menos formal. Los registros orientan tanto al
emisor en la produccin de los textos (adecuacin al medio y a su interlocutor),
como al receptor (creacin de conjunto de expectativas en funcin del tipo de texto
que est dispuesto a interpretar). Estos factores intervienen en las condiciones de
produccin del texto y en la configuracin de su forma lingstica final.
Los elementos de la realidad contextual que conforman los registros pueden
agruparse en tres apartados:
1. El campo (tema): se reere al marco institucional en el que se produce un
trozo de lenguaje e incluye no slo el tema de que se trata, sino tambin
la actividad del hablante o del participante en un determinado marco. El
campo permite, para nuestro caso, la distincin entre temtica general
(campos diversos de estudio) y temtica especializada (grados o niveles
de abstraccin o especializacin con un nico campo).
2. El tenor (la relacin interpersonal entre los interlocutores): permite la relacin emisor-receptor, a partir del grado de formalidad o de especializacin
textual y del propsito o intencin del autor del texto, de acuerdo con un
objetivo determinado: informar, argumentar, etc.
3. El modo (el canal de produccin, transmisin y recepcin del texto):
establece el medio a travs del cual se emite, se transmite y se recibe el
mensaje, y tambin determina las condiciones de produccin de los textos
(Halliday, 1994: 49).
En cuanto a las nociones de tipo y gnero discursivos, Ciapuscio plantea que
[] el trmino gnero discursivo ha perdurado especialmente en la lingstica
francesa. [] la revista Langue Franaise [] distingue explcitamente entre

22

kala, revista de lenguaje y cultura


Vol. 13, N. 19 (ene.-jun., de 2008)

Clasificacin de textos especializados a partir de su terminologa

gneros y tipos discursivos. El gnero discursivo se relaciona con una dimensin


histrico-cultural ms general, que incluye la competencia sobre tipos discursivos;
estos ltimos hacen referencia a una dimensin estrictamente lingstica.
En el marco de la lingstica del texto, los trminos que se utilizan son tipo y
clase textual. Heinemann y Viehweger (1991) subrayan el gran consenso que se
comprueba en las publicaciones lingstico-textuales: clase textual se aplica hoy a
estratificaciones empricas, tal cual son realizadas por los miembros de una comunidad
lingstica, es decir, clasificaciones cotidianas que pueden mencionarse por medio de
determinados lexemas condensadores del saber sobre una determinada clase textual:
por ejemplo, esto es un cuento, esto es un chiste, esta es una descripcin, esto
es un dilogo, etc. Por el contrario, tipo textual se concibe como una categora ligada
a una teora para la clasificacin cientfica de los textos. Por lo tanto, los hablantes
de una comunidad tienen un saber sobre las clases textuales o un saber sobre las
estructuras globales, pero no un saber sobre los tipos textuales (1994: 25).

As, pues, asumimos que el tipo textual alude, principalmente, a la estructura


organizativa del texto, siguiendo una clasificacin terica, y que el gnero
textual se refiere a la representacin de la competencia lingstica de los hablantes, en trminos de produccin de textos.
La nocin de variacin vertical
La variacin en el texto, referida a los elementos de registro (campo, tenor y
modo), se establece a partir de dos tipos: 1) la variacin horizontal: determinada por la temtica, y 2) la variacin vertical: determinada por el grado o
nivel de especializacin (Hoffmann, 1998a: 62-69).
El elemento diferenciador de la variacin vertical es el lxico, representado por
un nmero mayor de unidades terminolgicas. Este uso especfico de lxico
especializado permite la precisin en el lenguaje a partir del perfeccionamiento
del conocimiento, lo que conlleva a establecer niveles de comunicacin especializada, desde el plano concreto hasta el abstracto, desde el plano particular
hasta el general.
De acuerdo con la propuesta de Wichter (1994, citado por Ciapuscio, 2003:
36-37) sobre lexicologa de la verticalidad, el lxico es el bagaje o la suma de
conocimientos que atesora una comunidad. Dentro de esta escala imaginaria que

kala, revista de lenguaje y cultura


Vol. 13, N. 19 (ene.-jun., de 2008)

23

Mg. Ricardo Guantiva Acosta, Dr. M. Teresa Cabr Castellv, Dr. Josep M. Castell Lidon

supone la distribucin vertical del lxico, el punto ms alto de la verticalidad lo


ocupan los expertos en una disciplina especfica, y el punto ms bajo, los legos.
El objetivo de la lexicologa vertical consiste en describir, analizar y explicar
el vocabulario de expertos y legos, a partir de la distribucin en los distintos
niveles de especializacin.
La variacin vertical del lxico permite una aproximacin a las competencias
comunicacionales de los diferentes tipos de usuario. Desde esta perspectiva,
personas y textos son fuentes potenciales para la investigacin de la lexicologa vertical.

3. EL LXICO ESPECIALIZADO
La nocin y tipos de unidades terminolgicas, tomando como marco terico
la teora comunicativa de la terminologa (TCT) (Cabr, 1999: 2003), y la nocin de densidad lxica (densidad terminolgica para este trabajo) propuesta
por Halliday (1987, citado por Martn, 2003: 160), quien la ha definido como
la proporcin de elementos lxicos con relacin a la totalidad del discurso,
permiten el anlisis del texto especializado.
3.1. La unidad terminolgica
El estatus cientfico de la terminologa proviene de una larga tradicin sobre
estudios basados en datos terminolgicos pertenecientes a distintos mbitos del
conocimiento. El referente histrico clsico sobre los inicios de la terminologa es
el trabajo de Wster (1998), conocido como la teora general de la terminologa
(TGT). Para ste, el objeto de la terminologa son los conceptos y las relaciones
entre ellos. No obstante, dada la repercusin que ha tenido la TGT,
[] las posiciones crticas no la invalidan como teora, sino que simplemente
subrayan su limitacin conceptual y funcional y su falta de generalizacin, lo que
la hacen devenir insuficiente para explicar las unidades terminolgicas en toda
amplitud (Cabr, 1999: 114).

Bajo estas condiciones, se reorienta la teora de la terminologa hacia la consolidacin de un nuevo modelo terico ms flexible y de carcter multidisciplinar:

24

kala, revista de lenguaje y cultura


Vol. 13, N. 19 (ene.-jun., de 2008)

Clasificacin de textos especializados a partir de su terminologa

la teora comunicativa de la terminologa (TCT) o teora de las puertas (Cabr,


1999, 2002, 2003). El objetivo principal de la TCT es la descripcin y explicacin de las unidades terminolgicas in vivo, es decir, la descripcin real de los
trminos en sus contextos naturales de aparicin: los textos especializados.
Para llevar a cabo este trabajo, la TCT incorpora un anlisis multidimensional
de la unidad terminolgica, que integra tres enfoques: el cognitivo (el concepto), el lingstico (el trmino) y el comunicativo (la situacin), bajo el supuesto de
que la naturaleza de estas unidades, as como su funcin, comparte muchas de las
caractersticas de las unidades de la lengua general.
Las unidades terminolgicas o trminos designan los conceptos propios de un
mbito de conocimiento o de especialidad. El tratamiento que reciben estas
unidades se determina a partir de los factores externos e internos de la comunicacin especializada, lo que posibilita su mayor o menor presencia en el
discurso especializado. El carcter polidrico de las unidades terminolgicas
comporta un doble valor significativo para la terminologa: por un lado, son
unidades lxicas o palabras, en tanto forman parte del lenguaje natural, y por
el otro, son unidades terminolgicas que, bajo las condiciones semnticas y
pragmticas, obligan a la especificacin entre estos dos tipos de unidades.
El conjunto de unidades especializadas est determinado por: 1) las unidades de
conocimiento especializado (UCE), unidades de distinto nivel descriptivo que
transmiten un tipo de conocimiento especfico (condiciones cognitivas y semnticas), bajo un uso restringido en el discurso (condiciones pragmtico-discursivas);
y 2) las unidades terminolgicas (UT), unidades lxicas con un valor semntico
especfico (valor especializado), asociado a un mbito que consolida la estructura
conceptual del dominio del que forman parte (Cabr y Estop, 2005: 78-83).
As, pues, siguiendo a Cabr y Estop, las UCE y, en concreto, las UT, pueden
clasificarse de acuerdo con diferentes criterios:
1. El sistema al que pertenecen: las UCE o UT pueden ser unidades del lenguaje natural o pertenecer a una gran multiplicidad de sistemas articiales.
Por ejemplo: gen, cultivar, antisuero; AC, A, K, H20.
kala, revista de lenguaje y cultura
Vol. 13, N. 19 (ene.-jun., de 2008)

25

Mg. Ricardo Guantiva Acosta, Dr. M. Teresa Cabr Castellv, Dr. Josep M. Castell Lidon

2. La estructura: desde el punto de vista interno, las UCE o UT pueden coincidir con morfemas, con unidades lxicas, simples, derivadas y compuestas,
con sintagmas, ya sean terminolgicos o fraseolgicos, o con oraciones
(que son muy escasas). Por ejemplo: -itis, -genia; clula, caldo; cortar
enzimas, alteracin cromosmica; el ADN cromosmico permanece doblemente enhebrado.
3. El proceso de gramaticalizacin: las UCE lxicas o UT pueden pertenecer
a cuatro categoras gramaticales: nominal, verbal, adjetival y adverbial.
Por ejemplo: almidn, adenina; alogentico, antiviral; cultivar, clonar;
biolgicamente, por va oral.
3.2. La densidad terminolgica
Para describir el proceso de cmo operan las UT en los contextos comunicativos
especializados y dar cuenta de su mayor o menor presencia, se propone este
estudio sobre la densidad de estas unidades dentro de los textos, a la hora de
distinguir entre diferentes niveles o grados de especializacin.
Los estudios de la densidad lxica trabajan sobre la base de muestras textuales
de distintos mbitos, autores, idiomas, etc., lo que permite discriminar textos de
forma automtica, a partir de las relaciones matemticas entre types (formas)
y tokens (ocurrencias), que constituyen un modelo de regresin adecuado que
puede ayudar a diferenciar tipos de texto (Cantos, 2000: 74-80. Castell, 2002:
183-184; Martn, 2003: 159-161).
El concepto de densidad terminolgica hace referencia al nmero de UT en
relacin con el nmero total de unidades lxicas contenidas en un texto especializado. Esta conjuncin de unidades est condicionada por los interlocutores de
la comunicacin y el nivel de especializacin del discurso (la variacin vertical).
Desde esta perspectiva, las lneas de trabajo tienen que ver con procesos para
la extraccin terminolgica, entre los cuales destaca la densidad de trminos,
entendida como la medicin del promedio de trminos por frase o prrafo,
mediante la seleccin previa de un corpus con marcaje estructural, as como
la definicin de qu palabras pueden tener valor especializado (Yzaguirre,
1996: 69-71; Cabr, 1999).

26

kala, revista de lenguaje y cultura


Vol. 13, N. 19 (ene.-jun., de 2008)

Clasificacin de textos especializados a partir de su terminologa

4. EL CORPUS Y LA METODOLOGA
El corpus textual especializado para esta investigacin est constituido por un
conjunto de textos escritos en espaol, que corresponden a un mbito temtico
del Corpus Tcnic del IULA:2 el genoma humano. La seleccin de este mbito
dentro del corpus est determinada por un doble propsito. Por un lado, la gran
acogida de este nuevo mbito temtico en la medicina y el gran nmero de
publicaciones recientes en relacin con l; y, por otro, la variedad de niveles
de especializacin a travs de los cuales se ha tratado el tema, debido al gran
inters que ha despertado en la sociedad.
4.1. El corpus textual
Para la seleccin de los textos que constituyen el corpus de este estudio, se han tenido
en cuenta dos criterios: los externos 1) los interlocutores (emisor-receptor) y 2)
el tipo y el gnero textual (tipos: textos descriptivos, informativos; gneros: tesis,
libros de texto, artculos de divulgacin, etc.); y los internos 1) la valoracin
realizada por especialistas,3 a partir del tratamiento que se hace del tema y 2) el
uso de terminologa segn el tipo de interlocutor (vase tabla 1).
Tabla 1. Niveles de especializacin
Nivel
Alto

Medio
Bajo

Interlocutores
De especialista a especialista
De especialista a aprendiz de especialista
De especialista a pblico general o lego

Muestras de textos
Tesis doctorales
Manuales de texto, artculos cientcos
Artculos de carcter divulgativo

2 El Corpus Tcnico del IULA (Bwananet, s. f.) recopila textos escritos en cinco lenguas
diferentes (cataln, espaol, ingls, francs y alemn) de las reas de especialidad de la
economa, el derecho, el medio ambiente, la medicina y la informtica. El corpus comprende,
adems, documentos paralelos, con el objetivo de facilitar estudios de traduccin, as como el
anlisis de los datos lingsticos, a n de poder establecer las leyes que rigen el comportamiento
de cada lengua en cada rea (Cabr y Bach, 2004: 173; Bach et al., 1997: 6-11).
3 Los doctores Fernando Girldez y Jos Francisco Aramburu (miembros de la Unidad de Biologa
del Desarrollo de la Universitat Pompeu Fabra) colaboraron en la determinacin de los niveles
de especializacin de los textos del corpus constituido para esta investigacin.

kala, revista de lenguaje y cultura


Vol. 13, N. 19 (ene.-jun., de 2008)

27

Mg. Ricardo Guantiva Acosta, Dr. M. Teresa Cabr Castellv, Dr. Josep M. Castell Lidon

El corpus de referencia para el estudio piloto consta de nueve textos (muestras


de textos), entre los cuales hay tesis doctorales, manuales de textos y artculos
tanto cientficos como de carcter divulgativo, con un total de 41.418 palabras.
La longitud de cada uno de stos es de cinco mil palabras por muestra. Adems,
son textos escritos en espaol, tanto originales como traducciones. Estos textos
forman parte del Corpus Tcnic del IULA y estn clasificados en el mbito
temtico del genoma humano. Este mbito se divide, a la vez, en los siguientes
subdominios temticos: estructura interna (EI), con 51 textos; investigacin
gentica (RG), con 10; ingeniera gentica (EG), con 7; enfermedades (MA),
con 2; ciencias biolgicas (CB), con 2, y farmacogenmica (FA), con 1.
En cuanto a la distribucin de los textos del corpus de referencia, ste contiene
tres textos por cada uno de los tres niveles de especializacin propuestos, lo
que forma tres subcorpus (nivel alto: a, b, c; medio: d, e, f; y bajo: g, h, i), para
un total de nueve textos.
El primer grupo de textos (nivel alto) recoge tres muestras de tesis doctorales
sobre algn aspecto del genoma humano, en cuanto a su descripcin y aplicacin; el segundo grupo (nivel medio) corresponde a manuales universitarios
y revistas de investigacin clnica, y el tercero (nivel bajo) contiene muestras
de artculos de carcter divulgativo (vase tabla 2).
Tabla 2. Corpus textual de anlisis del estudio piloto
Niveles de especializacin
Alto

Subtotal
palabras

Medio

Bajo

Subcorpus

Palabras

Subcorpus

Palabras

Subcorpus

Palabras

a
b
c

3.001
10.365
10.324

d
e
f

3.738
1.799
4.179

g
h
i

2.160
3.138
2.714

23.690

9.716

8.012

Total
palabras

41.418

El clculo promedio de palabras por textos y por niveles de especializacin


difiere, porque los textos seleccionados contienen una o tres muestras de cinco

28

kala, revista de lenguaje y cultura


Vol. 13, N. 19 (ene.-jun., de 2008)

Clasificacin de textos especializados a partir de su terminologa

mil palabras. Para el momento de hacer este trabajo no habamos reestructurado


el corpus de referencia con el total de palabras descrito anteriormente.
Para describir la incidencia de los tipos de unidades y la densidad terminolgica en la clasificacin de textos en niveles de especializacin (NE),
presentamos el estudio piloto, el cual consta de dos partes: 1) la seleccin de
siete variables lingsticas; y 2) el anlisis discriminante a partir del programa
Statgraphics.
En cuanto a la primera parte, se recogen los nueve textos del corpus clasificado
en niveles de especializacin. Para cada texto se han aplicado siete variables,
que corresponden a patrones sintcticos diferentes de unidades terminolgicas: nombre [N], adjetivo [Adj], verbo [V], adverbio [Adv], siglas [SG] y
unidades lexicalizadas o sintagmticas [N+P+N] o [N+Adj+N+N]. Cada
variable recoge la informacin siguiente: total de types (nmero de unidades
terminolgicas) y total de tokens (nmero total de ocurrencias). En segundo
lugar, para la determinacin de la distincin entre unidades terminolgicas
y unidades lxicas, han intervenido las tres herramientas con las que se ha
trabajado el corpus.
En aquellos patrones en los que las herramientas de extraccin y deteccin
muestran todava muy poca robustez para el reconocimiento de unidades
(patrones del tipo [N+P+N], [V] y [Adv]), se ha utilizado Bwananet como
herramienta complementaria para hacer bsquedas sobre el conjunto de
documentos seleccionados. Asimismo, para cada uno de los patrones dentro
de cada texto, se presenta el clculo de la densidad media. Dicho clculo se
obtiene dividendo el nmero total de unidades terminolgicas reconocidas
dentro del texto entre el nmero total de unidades lxicas. El clculo se aplica
tanto a los types como a los tokens, con el objetivo de utilizar estos resultados
en el anlisis discriminante aplicado a los resultados.
En cuanto a la segunda parte, la aplicacin del anlisis discriminante4 a los datos,
se toman los types en cada una de las variables trabajadas. La densidad media
4 Este anlisis se hace con base en el paquete estadstico Statgraphics Plus (2002), lo que
permite llevar a cabo las acciones siguientes: 1) realizar un estudio descriptivo de una

kala, revista de lenguaje y cultura


Vol. 13, N. 19 (ene.-jun., de 2008)

29

Mg. Ricardo Guantiva Acosta, Dr. M. Teresa Cabr Castellv, Dr. Josep M. Castell Lidon

detectada para cada una de ellas en los tres niveles de especializacin, sirve
para determinar qu variables son las que intervienen de manera ms clara a
la hora de distinguir entre los diferentes grados o niveles de especializacin.
Para realizar el anlisis discriminante se ejecutan algunas etapas previas, entre
las que se incluyen las siguientes:
1. Seleccin de la variable dependiente (niveles de especializacin) y de
la variable independiente (el tipo de unidades terminolgicas, en cuanto
a su categora gramatical dentro de los textos).
2. Determinacin del comportamiento de cada variable, es decir, cada una
de las unidades terminolgicas monolxicas o polilxicas, para distinguir
los conceptos de poblacin (el corpus de referencia) e individuos (los
nueve textos clasicados en niveles de especializacin).
3. Denicin del tamao de la muestra textual: la muestra debe ser representativa en relacin con las variables denidas para el anlisis discriminante.
La representatividad hace referencia al grado en el que una muestra incluye
un rango pleno de variabilidad en una poblacin (Biber, 1993: 243).
4.2. Procesamiento y extraccin de los trminos
Una vez constituido el corpus textual, se procede a la deteccin5 y extraccin6
de las unidades terminolgicas, para su anlisis. Aqu se utilizan tres herramientas, diseadas en el IULA:
1. Yate (Yet another Term Extractor) es un sistema de extraccin de candidatos a trminos nominales (CAT) en los textos de medicina que han sido
procesados previamente con las herramientas del Corpus Tcnic del IULA,
diseado por Vivaldi (2003a).
o varias variables, a partir de un conjunto de caractersticas precisas; 2) trabajar con
modelos de distribucin de probabilidad, y 3) realizar descripciones para parmetros
como la media, la varianza o proporciones.
5 Reconocimiento de trminos (previamente validados como tales) en un texto.
6 Localizacin de candidatos a trminos nominales dentro del texto.

30

kala, revista de lenguaje y cultura


Vol. 13, N. 19 (ene.-jun., de 2008)

Clasificacin de textos especializados a partir de su terminologa

2. Bwananet (s. f.) es la herramienta general desarrollada por Vivaldi dentro


del marco de diferentes proyectos del IULA para la interrogacin del Corpus Tcnic. Esta herramienta permite hacer bsquedas sobre el conjunto
de documentos seleccionados.
3. Mercedes es un sistema de reconocimiento de unidades terminolgicas,
compuesto por dos mdulos: un programa de reconocimiento y un mdulo
de referencia terminolgica. Esta herramienta ha sido desarrollada especcamente para reconocer trminos del genoma humano en espaol, cataln e
ingls, y es fcilmente adaptable a cualquier otro dominio (Vivaldi, 2003b).
De acuerdo con las caractersticas descritas para estas herramientas, su aplicacin al corpus permitir obtener:
1. Un subcorpus de unidades candidatas a trmino de base monolxica nombre [N], adjetivo [Adj], verbo [V], adverbio [Adv], siglas [SG]) y polilxica nombre+preposicin+nombre [N+P+N] o unidades que responden
a patrones como [N+Adj+N(nombre)+N(nombre), etc.] (Yate).
2. Un subcorpus de unidades lxicas, tanto generales como especializadas,
en funcin de patrones de bsqueda compleja (Bwananet).
3. Un subcorpus de UT de base monolxica y polilxica (Mercedes).
En cuanto al anlisis de los subcorpus de las UT obtenidas a partir de la integracin de las herramientas de extraccin y deteccin, se tienen en cuenta los
aspectos siguientes:
1. Descripcin de las UT en relacin con la unidad lxica de la lengua general,
lo que permite dar cuenta de su naturaleza lingstica (aspectos morfolgicos y sintcticos).
2. La incidencia de las unidades terminolgicas en la distincin de niveles
de especializacin, a partir de la distribucin de frecuencias (frecuencia
absoluta, relativa y clculo promedio de unidades), el anlisis discriminante,7 y la densidad terminolgica.
7 El anlisis factorial discriminante (AFD) es un mtodo de anlisis estadstico que permite
clasicar individuos a partir de variables cuantitativas. Este anlisis tambin posibilita

kala, revista de lenguaje y cultura


Vol. 13, N. 19 (ene.-jun., de 2008)

31

Mg. Ricardo Guantiva Acosta, Dr. M. Teresa Cabr Castellv, Dr. Josep M. Castell Lidon

5. RESULTADOS
En este apartado presentamos los resultados obtenidos a partir del tratamiento
del corpus textual de referencia, tal como lo hemos indicado en 4.1 y 4.2.
El valor de types de la variable [N] en cada uno de los niveles de especializacin
refleja un resultado gradual (vase tabla 3).
Tabla 3. Valor de types de las unidades terminolgicas
Patrones (%)
NE

[N]

[N+Adj]

[N+P+N]

[V]

[Adv]

[SG]

Alto

0,37

0,54

0,47

0,18

0,02

0,87

Medio

0,30

0,24

0,52

0,16

0,07

0,95

Bajo

0,23

0,17

0,37

0,06

0,02

1,0

Estos resultados permiten evidenciar que las unidades terminolgicas de base


nominal ([N]) representan un porcentaje considerable a la hora de transmitir el
conocimiento especializado de un mbito temtico. Por tanto, este conjunto de
unidades terminolgicas corresponde al grupo de unidades ms significativo, en
relacin con las dems que constituyen esta tabla de resultados.
El valor de types para la variable [N+Adj], en cada uno de los niveles de especializacin, tambin refleja un resultado gradual. No obstante, se ha de tener presente
que, a pesar de obtener este resultado gradual, la deteccin de este conjunto de
unidades representa un problema, pues los diccionarios del programa Mercedes
no cuentan con la suficiente capacidad para reconocer el mayor nmero posible
de estas unidades.
predecir o determinar la pertenencia de individuos a un grupo, en funcin de los valores
obtenidos en las variables denidas. Para abordar este anlisis discriminante se utiliza el
programa Statgraphics Plus, para la manipulacin de datos en una hoja de clculo con
diferentes funciones, con el n de generar, transformar y recodicar dichos datos (vase
StatGraphics. Tutorial, s. f.).

32

kala, revista de lenguaje y cultura


Vol. 13, N. 19 (ene.-jun., de 2008)

Clasificacin de textos especializados a partir de su terminologa

En cuanto a las variables [V], [Adv], [SG] y [N+P+N] en los tres niveles de
especializacin, el valor de types obtenido es heterogneo, dado que para el
reconocimiento de este tipo de unidades se ha utilizado nicamente la herramienta de consulta general Bwananet, pues tanto el Yate como el Mercedes
no las reconocen y los resultados no corresponden con el nivel especializado
definido.
El anlisis discriminante permite desarrollar una serie de funciones discriminantes, que pueden ayudar a predecir el grado o nivel de especializacin,
basado en los valores de otras variables cuantitativas. Se utilizaron nueve textos
para diferenciar entre los tres niveles de especializacin. Se introdujeron dos
variables [N] y [N+Adj] (vase tabla 4).
Tabla 4. Funcin discriminante entre [N] y [N+Adj]
Variables
Corpus
P-valor

Dependiente
Independiente
Nmero de textos
Nmero de poblacin
UT [N]
UT [N+Adj]

Nivel de especializacin
UT [N] y UT [N+Adj]
9
3 grupos (alto, medio y bajo)
types: 0,0233
types: 0,5111

La funcin discriminante con P-valor8 inferior a 0,05 es estadsticamente significativa, con un 95% de nivel de confianza, de acuerdo con los parmetros
del programa estadstico empleado.
En la figura 1 se observa cmo el valor de [N] discrimina claramente los tres
niveles de especializacin de acuerdo con el P-valor obtenido. Los tres textos
del nivel de especializacin bajo (o) se agrupan en el margen izquierdo del
grfico, mientras que los textos del nivel de especializacin alto () se agrupan
en el margen derecho. Los textos del nivel de especializacin medio (x) se
agrupan entre los dos niveles anteriores.

8 Es una nota promedio de nivel de signicacin emprico a partir del valor estadstico del
contraste entre las variables analizadas.

kala, revista de lenguaje y cultura


Vol. 13, N. 19 (ene.-jun., de 2008)

33

Mg. Ricardo Guantiva Acosta, Dr. M. Teresa Cabr Castellv, Dr. Josep M. Castell Lidon

En cuanto a las dems variables, [V], [Adv], [SG] y [N+P+N], los resultados
obtenidos tras la comparacin con la [N] no son heterogneos, porque el Pvalor no corresponde con variables discriminantes (vase tabla 5).
Tabla 5. Funcin discriminante entre [N] y [V], [Adv], [SG],
[N+Adj], [N+P+N]
UT
P-V

[N] - [V]
0,0188

0,3308

[N] - [Adv]
0,0439

0,8472

[N] - [SG]
0,0351

0,7326

[N] [N+Adj]

[N] - [N+P+N]

0,0233

0,0715

0,5111

0,6534

Figura 1. Funcin discriminante entre [N] y [N+Adj o NJ]

6. CONSIDERACIONES FINALES
El estudio preliminar sobre la clasificacin de textos en niveles de especializacin a partir del anlisis de los tipos de unidades terminolgicas, as como
de la densidad terminolgica, conduce a las siguientes consideraciones: en
relacin con los criterios de seleccin del corpus textual, stos se adecuan a las
caractersticas propuestas para cada uno de los niveles de especializacin.
Para la extraccin y deteccin de los distintos tipos de unidades terminolgicas,
en trabajos posteriores, deber tenerse en cuenta que:

34

kala, revista de lenguaje y cultura


Vol. 13, N. 19 (ene.-jun., de 2008)

Clasificacin de textos especializados a partir de su terminologa

1. Las unidades terminolgicas plenamente reconocidas por las tres herramientas de explotacin del corpus son las unidades monolxicas con valor
nominal [N].
2. Para la deteccin de las unidades terminolgicas monolxicas [V], [Adv]
y [SG], se ha utilizado tan slo una de las tres herramientas propuestas
(Bwananet), pues de momento este tipo de unidades no las trabajan los
otros dos programas con los que se interroga el corpus.
3. Pese a que las unidades terminolgicas polilxicas [N+Adj] y [N+P+N]
tienen un nmero altamente representativo en cada uno de los subcorpus
de anlisis (nivel alto, medio y bajo), los resultados obtenidos son escasos,
debido a la limitacin que supone el hecho de que los diccionarios del
programa Mercedes no contengan demasiadas unidades terminolgicas
correspondientes a este patrn. Para poder llevar a cabo la investigacin
propuesta, ser necesario alimentar los diccionarios del programa con
unidades que vayan ms all del patrn [N] y [N+Adj].
En cuanto al nmero y tipos de unidades terminolgicas de cada uno de los subcorpus seleccionados para el estudio preliminar, ha de tenerse en cuenta que:
1. La unidad terminolgica ms representativa en los tres niveles de especializacin, tanto cualitativa como cuantitativamente, es la unidad monolxica
con valor nominal. Este hecho permite corroborar que esta unidad es la
ms prototpica para la representacin del campo conceptual de un mbito
especializado.
2. Para el grupo de unidades terminolgicas polilxicas [N+Adj] y [N+P+N],
aunque adquieren un valor signicativo en los tres niveles de especializacin, los resultados obtenidos reejan los problemas de deteccin para
estos patrones, lo que hace ms difcil precisar su cuanticacin.
El anlisis preliminar sobre la densidad terminolgica, en relacin con el anlisis discriminante propuesto, implica que:
1. La unidad terminolgica que mejor permite diferenciar o discriminar textos,
segn niveles de especializacin, es la unidad monolxica nominal [N].
Este hecho permite considerar que, para el anlisis del corpus total, este

kala, revista de lenguaje y cultura


Vol. 13, N. 19 (ene.-jun., de 2008)

35

Mg. Ricardo Guantiva Acosta, Dr. M. Teresa Cabr Castellv, Dr. Josep M. Castell Lidon

grupo de unidades debe ser el ms representativo, en comparacin con las


dems unidades terminolgicas propuestas.
2. A partir de la comparacin de los resultados obtenidos para el P-valor, es
posible replantear el anlisis de los diferentes tipos de unidades terminolgicas, en relacin con el nmero de variables propuestas.
En la medida en que el desarrollo de este trabajo arroje los resultados de la extraccin, la deteccin y el anlisis de las unidades terminolgicas, se comprobar
si las estrategias utilizadas son aplicables a diferentes mbitos de la lingstica
aplicada. Por ejemplo, estrategias de seleccin o legibilidad de textos para la
enseanza de lenguas con propsitos especficos, criterios para la clasificacin
en niveles de especializacin de los textos del Corpus Tcnic del IULA, etc.

BIBLIOGRAFA
Arntz, R. y Picth, H. (1995). Introduccin a la terminologa. [Traduccin al espaol de A. Irazazbal et al.]. Madrid: Fundacin Germn Snchez Ruiprez, Pirmide, Biblioteca del libro.
Bach, C., Saur, R., Vivaldi, J. y Cabr, M.T. (1997). El corpus de lIULA: descripci. [El
corpus del IULA: descripcin]. Srie de Informes, 17. Barcelona: Universitat Pompeu Fabra,
Institut Universitari de Lingstica Aplicada.
Beaugrande, R. y Dressler, W. (1997). Introduccin a la lingstica del texto. [Traduccin al
espaol de S. Bonilla]. Barcelona: Ariel.
Bernrdez, E. (1982). Introduccin a la lingstica del texto. Madrid: Espasa-Calpe.
Biber, D. (1993). Representativeness in Corpus Design. En: Literary & Linguistic Computing
8 (4), 243-257. UK: Oxford University Press.
Bwananet (s. f.). Herramienta de consulta general para la interrogacin del Corpus Tcnic del
IULA. Bwananet. Recuperado 1. de diciembre, 2007, de http://bwananet.iula.upf.edu
Cabr, M.T. (1999). La terminologa. Representacin y comunicacin. Elementos para una
teora de base comunicativa y otros artculos. (Srie Monograes 3). Barcelona: Universitat
Pompeu Fabra / Institut Universitari de Lingstica Aplicada.
_ (2002). Terminologie et linguistique: La thorie des portes. En Terminologies nouvelles. Terminologie et diversit culturelle 21, 10-15. En R. Folguer (Trad.), Terminologa y lingstica:
la teora de las puertas. Estudios de Lingstica Espaola, 16. Recuperado 8 de abril, 2006,
de http://elies.rediris.es/elies16/Cabre.html
_ (2003). Theories of terminology. Their description, prescription and explanation. En Terminology, 9 (2), 163-200.

36

kala, revista de lenguaje y cultura


Vol. 13, N. 19 (ene.-jun., de 2008)

Clasificacin de textos especializados a partir de su terminologa

Cabr, M. T. y Bach, C. (2004). El Corpus Tcnic del IULA: corpus textual especializado plurilinge. En PANACE@ V, 16, 173-176. Recuperado 5 de noviembre, 2006 (actualizado 24 de
marzo, 2008) de http://www.medtrad.org/panacea/PanaceaPDFs/Panacea16_Junio2004.pdf
Cabr, M. T y Estop, R. (2005). Unidades de conocimiento especializado: caracterizacin y
tipologa. En Cabr, M. T.y Bach, C. (Eds.), Coneixement, llenguatge i discurs especialitzat.
[Conocimiento, lenguaje y discurso especializado]. Srie Monograes 7. (pp.78-83). Barcelona:
Universitat Pompeu Fabra, Institut Universitari de Lingstica Aplicada.
Cantos, P. (2000). Investigating type-token regression and its potential for automated text discrimination. En: Cantos, P. y Snchez, A. (Eds.), Corpus-based Research in English Language
and Linguistics (pp. 71-92). Monogrco. Cuadernos de Filologa Inglesa. Murcia: Servicio
de Publicaciones de la Universidad de Murcia.
Castell, J. M. (1992). De la frase al text. Teories de ls lingstic. [De la frase al texto. Teoras
del uso lingstico]. (pp. 49-53). Barcelona: Empries.
_ (2002). La complexitat lingstica en el discurs oral i escrit: densitat lxica, composici oracional i connexi textual. [La complejidad lingstica en el discurso oral y escrito: densidad
lxica, composicin oracional y conexin textual]. Tesis doctoral. Universitat Pompeu Fabra.
Recuperado 16 de julio, 2007 de http://www.tdx.cesca.es/TDX-0311102-134928/index.html
Ciapuscio, G. (1994). Tipos textuales. Buenos Aires: Ocina de Publicaciones Ciclo Bsico
Comn, Universidad de Buenos Aires.
_ (2003). Textos especializados y terminologa. Barcelona: Institut Universitari de Lingstica
Aplicada, Universitat Pompeu Fabra.
Eggins, S. y Martin, J.R. (2000). Gneros y registros del discurso. En Van Dijk, T. A. (Ed.) El
texto como estructura y como proceso. Estudios del discurso: Introduccin multidisciplinaria
(pp. 335-370). Barcelona: Gedisa / SAP.
Guantiva, R. (2005). Terminologa y variacin vertical: clasicacin de textos en niveles de
especializacin a partir del anlisis del tipo y de la densidad de las unidades terminolgica.
Proyecto de tesis doctoral no publicado, Institut Universitari de Lingstica Aplicada, Universitat
Pompeu Fabra, Barcelona, Espaa.
Halliday, M. (1994). El lenguaje como semitica social. La interpretacin social del lenguaje
y del signicado [Traduccin al espaol de Fondo de Cultura Econmica, Mxico]. Colombia:
Fondo de Cultura Econmica.
Hoffmann, L. (1998a). Caracterstiques dels llenguatges despecialitat. (Trad., al cataln) [Caractersticas de los lenguajes de especialidad]. En Brumme, J. (Ed.), Llenguatges despecialitat.
Selecci de textos. [Lenguajes de especialidad. Seleccin de textos] (pp.21-69) Barcelona: Institut
Universitari de Lingstica Aplicada.
. (1998b). Conceptes bsics de la lingstica dels llenguatges despecialitat. (Trad., al cataln),
[Conceptos bsicos de la lingstica de los lenguajes de especialidad]. En Brumme, J. (Ed.),
Llenguatges despecialitat. Selecci de textos. [Lenguajes de especialidad. Seleccin de textos]
(pp.71-78). Barcelona: Institut Universitari de Lingstica Aplicada.

kala, revista de lenguaje y cultura


Vol. 13, N. 19 (ene.-jun., de 2008)

37

Mg. Ricardo Guantiva Acosta, Dr. M. Teresa Cabr Castellv, Dr. Josep M. Castell Lidon

Kocourek, R. (1982). La langue franaise de la technique et de la science. Vers une linguistique


de la langue savante. Wiesbaden: Oscar Brandstetter.
Martn, P. (2003). Anlisis contrastivo de los componentes estructurales y gramaticales de los
resmenes de los artculos cientcos. Revista Espaola de Lingstica (RIEL), 33 (1), 153-183.
Sager, J. C. (1993). Curso prctico sobre el procesamiento de la terminologa. Madrid:
Pirmide.
Schrder, H. (1991). Linguistic and text-theoretical research on languages for special purposes.
A thematic and bibliographical guide. En Schrder, H. (Ed.), Subject-oriented Texts. Languages
for Special Purposes and Text Theory (pp. 1-49). Berlin-New York: De Gruyter / Walter.
Statgraphics Plus, versin 5.1. (2002). Edicin en espaol CD-ROM. EE.UU.: M & INC.
Statgraphics. El programa Statgraphics. [Versin electrnica] Recuperado 15 de noviembre,
2004 de http://www.etsii.upm.es/ingor/estadistica/docencia/prac2000/prac2001.pdf
Statgraphics Plus. Clsico de los programas estadsticos en castellano. Addlink. Recuperado
17 de noviembre, 2006 de http://www.addlink.es/productos.asp?pid=138.
Statgraphics. Tutorial (s. f.). Como puede ayudarte STATGRAPHICS PLUS en tus investigaciones, clculos e informes? Statgraphics. Recuperado 10 de noviembre, 2006 de http://www.
statgraphics.net/Recursos/CPASPICI.htm#Indice
Van Dijk, T.A. (1980). Estructuras y funciones del discurso. Una introduccin a la lingstica
del texto y a los estudios del discurso. (pp.9-17). Madrid: Siglo XXI.
_ (1989). La ciencia del texto. [Traduccin al espaol de Hunzinger, S.]. (pp.13-30). Barcelona: Paids Ibrica.
_ (1993). Texto y contexto, semntica y pragmtica del discurso. [Traduccin al espaol de
Moyano, J.]. (pp. 29-46). Madrid: Ctedra-Lingstica.
Vivaldi, J. (2003a). Sistema de extraccin de candidatos a trminos YATE. Manual de utilizacin (1. versin). Barcelona: Institut Universitari de Lingstica Aplicada, Universitat
Pompeu Fabra.
. (2003b). Sistema de reconocimiento de trminos MERCEDES. Manual de utilizacin (2.
versin). Barcelona: Institut Universitari de Lingstica Aplicada, Universitat Pompeu Fabra.
Wster, E. (1998). Introduccin a la teora general de la terminologa y a la lexicografa terminolgica. Barcelona: Institut Universitari de Lingstica Aplicada, Universitat Pompeu Fabra.
Yzaguirre, L. de. (1996). Ingeniera lingstica y terminologa. En Terminmetro. Monogrco:
La Terminologa en Espaa (pp. 69-71). Pars: Unin Latina-IULA.

LOS AUTORES
**Ricardo Guantiva Acosta es Magster en Lingstica Espaola del Instituto
Caro y Cuervo y profesor de lingstica general de la Universidad de Bogot
Jorge Tadeo Lozano. Correo electrnico: ricardo.guantiva @upf.edu

38

kala, revista de lenguaje y cultura


Vol. 13, N. 19 (ene.-jun., de 2008)

Clasificacin de textos especializados a partir de su terminologa

***M. Teresa Cabr Castellv es doctora en filologa catalana y catedrtica en


lingstica aplicada de la Facultad de Traduccin e Interpretacin de la Universitat Pompeu Fabra. Correo electrnico: teresa.cabre @upf.edu
****Josep M. Castell Lidon es doctor en lingstica, profesor de la Facultad
de Humanidades, rea Filologa Catalana y miembro del IULA de la Universitat
Pompeu Fabra. Correo electrnico: josep.castella @upf.edu

kala, revista de lenguaje y cultura


Vol. 13, N. 19 (ene.-jun., de 2008)

39