Está en la página 1de 14

Herramientas para el trabajo terminolgico

en la traduccin especializada

Esta obra est bajo una Licencia Creative Commons Atribucin-NoComercial-SinDerivar 4.0 Internacional. Autora: Iria da Cunha Fanego.

NDICE
1.

Introduccin ................................................................................................................................. 5

2.

Extractores de terminologa ......................................................................................................... 5

3.

Gestores de corpus y terminologa .............................................................................................. 9

4.

Actividad: prctica con un gestor terminolgico ....................................................................... 10

5.

Solucionario................................................................................................................................ 13

6.

Bibliografa ................................................................................................................................. 14

1. Introduccin
Como se ha visto en Tema 2, el empleo de terminologa es una de las caractersticas principales de los textos
especializados de cualquier mbito. El traductor debe ser capaz de detectar los trminos en el texto origen
para despus encontrar equivalentes satisfactorios de dichos trminos en la lengua meta. Adems de las
memorias de traduccin, que son de gran utilidad para ahorrar tiempo y agilizar el trabajo, otros recursos
que pueden resultar tiles al traductor de textos especializados son los extractores de terminologa, y los
gestores de corpus y terminologa. En los siguientes apartados veremos algunos ejemplos de estos dos tipos
de sistemas, para finalmente realizar una actividad prctica con uno de estos recursos.

2. Extractores de terminologa
Tal como se afirma en Oliver (2016: 128), la extraccin automtica de terminologa es un proceso por el
que se detecta una serie de candidatos a unidades terminolgicas a partir de un texto o un conjunto de
textos. Este proceso puede realizarse por medio de mtodos estadsticos y lingsticos (Cabr, Estop y
Vivaldi, 2011; Pazienza, Pennacchiotti y Zanzotto, 2015). Oliver (2016) resume en qu se basa cada uno de
estos mtodos de la siguiente manera:

Mtodos estadsticos: la extraccin de trminos se realiza a partir de sus propiedades estadsticas


(la caracterstica ms habitual es la frecuencia de aparicin).

Mtodos lingsticos: la extraccin de trminos se realiza a partir de sus propiedades lingsticas


(habitualmente, sus propiedades morfosintcticas).
A menudo tambin se habla de mtodos hbridos, que combinan mtodos estadsticos y mtodos

lingsticos. (Oliver, 2015: 129)


Es importante recalcar que los resultados ofrecidos por estos sistemas automticos de extraccin de
terminologa deben ser validados manualmente por especialistas (lingistas, traductores, expertos del
mbito especializado, etc.). Estos sistemas pueden ofrecer algunos errores y es imprescindible, por tanto,
una revisin manual detallada.
A continuacin se ofrecen dos ejemplos de sistemas de extraccin de candidatos a trminos a partir de
corpus textuales, que pueden resultar tiles para el trabajo del traductor de textos de mbitos
especializados. Se incluye el nombre del sistema, un enlace a la web desde la cual se puede acceder al
sistema en lnea, una breve descripcin del recurso y algunas capturas de pantalla del mismo.

YATE
http://eines.iula.upf.edu/cgi-bin/Yate-on-the-Web/yotwMain.pl
Este sistema es un extractor de candidatos a trmino a partir de textos especializados de los mbitos de la
medicina, la economa y la genmica, escritos en espaol o en cataln. Puede utilizarse en lnea de manera
gratuita. Utiliza una combinacin de estrategias lingsticas y estadsticas para detectar unidades
terminolgicas con tres de las estructuras ms frecuentes en estas dos lenguas:

Nombre.

Nombre + adjetivo.

Nombre + preposicin + nombre.

Esta es la pgina inicial del sistema:

A continuacin mostramos un ejemplo de los resultados obtenidos al buscar la estructura nombre en un


texto mdico en espaol (sobre la celiaqua). A la izquierda se ofrece la lista de trminos obtenidos y a la
derecha la informacin asociada a cada trmino, con sus respectivos contextos (en este caso, del trmino
gluten):

TermoStat Web 3.0


http://olst.ling.umontreal.ca/~drouinp/termostat_web/
Este sistema es un extractor de candidatos a trmino a partir de textos especializados de cualquier mbito
escritos en espaol, ingls, francs, italiano y portugus. Puede utilizarse en lnea de manera gratuita,
registrndose previamente. Utiliza una combinacin de estrategias lingsticas y estadsticas para detectar
unidades terminolgicas de cuatro categoras gramaticales:

Adjetivos.

Adverbios.

Nombres.

Verbos.

Asimismo, el sistema permite buscar trminos polilxicos con mltiples estructuras, como por ejemplo las
siguientes:

Nombre + adjetivo.

Nombre + preposicin + nombre.

Nombre + preposicin + nombre + adjetivo.

Esta es la pgina preliminar en la que el usuario debe registrarse:

A continuacin ofrecemos la pantalla inicial del sistema de extraccin de trminos:

Finalmente mostramos un ejemplo de los resultados obtenidos al realizar la misma bsqueda que en YATE:

3. Gestores de corpus y terminologa


Segn Mesa-Lao (2008), la gestin terminolgica incluye diversas actividades que van desde el vaciado de
terminologa o la extraccin hasta la creacin y validacin de terminologa, pasando por la clasificacin, el
almacenamiento, la recuperacin y el intercambio. A continuacin se ofrece un ejemplo de sistema de
gestin de corpus y terminologa, que puede resultar til para el trabajo del traductor de textos de mbitos
especializados. Se incluye el nombre del sistema, un enlace a la web desde la cual se puede acceder al
sistema en lnea, una breve descripcin del mismo y una captura de pantalla de la interfaz. Con este sistema
se realizar la actividad incluida en el apartado 4. Para un listado muy completo de gestores de
terminologa, recomendamos la publicacin de Mesa-Lao (2008).
Terminus
http://terminus.iula.upf.edu
Terminus es una estacin de trabajo para la terminologa, que integra la gestin de corpus y de terminologa. Permite crear y gestionar grupos de trabajo, e incluye la cadena completa del trabajo terminogrfico
individual y en equipo: bsqueda, constitucin y exploracin de corpus textuales, extraccin de trminos,
9

gestin de glosarios y proyectos, creacin y mantenimiento de bases de datos y edicin de diccionarios. El


sistema puede usarse en lnea y es de pago a travs de diferentes tipos de licencia. Sin embargo, cuenta
con una versin demo que permite al usuario acceder al sistema durante 30 das. A continuacin se ofrece
una captura de pantalla de la pgina inicial:

4. Actividad: prctica con un gestor terminolgico


Por lo general, suele decirse que un recurso terminolgico (diccionario, glosario, vocabulario, lxico, base de
datos terminolgicos, etc.) puede ser monolinge, bilinge o plurilinge. En primer lugar, en los
recursos monolinges, los trminos y la informacin asociada a ellos (categoras gramaticales, variantes,
definiciones, contextos, colocaciones, etc.) aparecen en una nica lengua. En segundo lugar, en los recursos
bilinges, todos los trminos y todas las informaciones relacionadas con los trminos aparecen en las dos
lenguas (por ejemplo, se incorporan contextos en las dos lenguas). En tercer lugar, en los recursos
plurilinges, el caso es similar a los recursos bilinges, pero se aaden ms lenguas. El recurso ms utilizado
por el traductor de textos especializados es un tipo especial de recurso terminolgico denominado
monolinge con equivalentes. Este tipo de recurso incorpora los trminos principales y las informaciones
asociadas a ellos en una sola lengua, pero adems incluye los equivalentes de esos trminos en otra(s)
lengua(s). En esta actividad realizaremos un simulacro de glosario terminolgico monolinge en ingls con
equivalentes en espaol. Como avanzamos en el apartado 2, en esta actividad se trabajar con el gestor de
corpus y terminologa Terminus.
10

Para ello, lo primero que debe hacerse es acceder al siguiente sitio web: http://terminus.iula.upf.edu.
Antes de comenzar, es necesario leer detalladamente las instrucciones de uso del sistema, que se encuentran disponibles en lnea: http://terminus.iula.upf.edu/terminus2.0//PDF/instruccions_terminus2.0_Es.pdf .
A continuacin, cada estudiante debe registrarse como usuario de la versin demo (NOTA IMPORTANTE:
esta versin demo solo podr emplearse durante 30 das):

En esta actividad deben seguirse los siguientes pasos:


1. Elegir un mbito especializado (ej. medicina, derecho) y un tema especfico dentro de dicho mbito
(ej. celiaqua, ley de extranjera).
2. Buscar en Google Acadmico tres textos especializados en ingls que traten de dicho tema.
3. A continuacin, entrar en el sistema Terminus. Es importante destacar que en esta actividad no se
explotarn todas las opciones del sistema, sino que se trabajar nicamente con algunas de ellas. Es
necesario seguir los siguientes pasos (para ello es imprescindible ir siguiendo las instrucciones de
uso del sistema mencionadas ms arriba):
3.1. Crear un proyecto en la seccin Proyectos.
3.2. Crear un glosario en la seccin Glosarios.
3.3. Subir los tres textos en ingls seleccionados en la seccin Documentos > Declarar un
documento.
11

3.4. Agrupar los tres textos en un corpus en la seccin Corpus > Crear corpus.
3.5. Realizar la extraccin de candidatos a trminos en ingls del corpus, usando nicamente el
mtodo de anlisis denominado Extraccin de n-gramas en la seccin Anlisis.
3.6. Seleccionar 4 trminos en ingls del corpus que estn estrechamente relacionados con el tema
elegido para el glosario. Los trminos deben tener la siguiente estructura:
a) Un trmino monolxico con categora gramatical nombre.
b) Un trmino monolxico con categora gramatical verbo.
c) Un trmino polilxico con la estructura nombre + preposicin + nombre.
d) Un trmino polilxico con la estructura adjetivo + nombre.
3.7. Crear una ficha terminolgica para cada uno de los 4 trminos en la seccin Trminos > Nuevo
trmino. Cada ficha terminolgica debe incluir las siguientes informaciones:
Trmino en ingls.
Categora gramatical del trmino.
Fuente del trmino (referencia bibliogrfica de uno de los textos del corpus en el que aparezca el trmino).
Definicin en ingls extrada de algn recurso terminolgico o texto especializado sobre el
mbito del glosario.
Fuente de la definicin (referencia bibliogrfica del diccionario o texto de donde se ha extrado la definicin).
Contexto (una oracin del corpus en la que aparezca el trmino).
Fuente del contexto (referencia bibliogrfica del texto del corpus de donde se ha extrado el
contexto).
Trmino equivalente en espaol extrado de algn recurso terminolgico o de algn texto
en espaol sobre el mbito del glosario.
Categora gramatical del trmino equivalente.
Fuente del equivalente (referencia bibliogrfica del recurso terminolgico o texto de donde
se ha extrado el equivalente).
Remisiones opcionales. En caso de incluirse alguna remisin, tambin debe incorporarse en
la ficha su categora gramatical, el tipo de remisin (sinnimo, sigla, etc.) y la fuente (recurso terminolgico o texto).

12

Este es el aspecto de la interfaz de edicin de una ficha terminolgica en Terminus:

3.8. Finalmente, una vez creadas las 4 fichas terminolgicas, exportarlas en un nico documento
PDF en la seccin Bsqueda de trminos y exportacin.

5. Solucionario
Como el glosario de cada estudiante ser diferente en funcin del tema escogido, es imposible ofrecer un
solucionario completo de esta actividad. Sin embargo, ofrecemos aqu como modelo una ficha
terminolgica (del trmino celiac disease, del mbito mdico) creada con Terminus, que incluye las
categoras mencionadas en el apartado 4.

13

6. Bibliografa
Cabr, M. T.; Estop, R.; Vivaldi, J. (2001). "Automatic term detection: a review of current systems". En Bourigault, D.;
Jacquemin, C.; LHomme, M.-C. (ed.). Recent Advances in Computational Terminology. 53-87. msterdam;
Philadelphia: John Benjamins.
Oliver, A. (2016). Herramientas tecnolgicas para traductores. Barcelona: Editorial UOC.
Pazienza, M. T.; Pennacchiotti, M.; Zanzotto, F. M. (2005). Terminology extraction: an analysis of linguistic and
statistical approaches. StudFuzz 185. 255-279.

14