Está en la página 1de 9
Traduccién automatica Por Mariana Rial en os aitimos afios, la traduccion automatica s¢ ha transformadc fags ms vradentes en el Ambito de la traduccién, Si ion so ttn rata uno de los ras reonologia ave jos expertos investigan desde hace bastante, toy on 108 vances fi a ne se han logrado en ol ditimo tiempo Havan a sumbantgars ol fro de traduecién. Hay quiones postulan quo raatigten a rica et final de 18 profesién, miontras quo otros aseguran qu peranen san jotesionles jamés podrin sor sustituidos, En algunos vouon incl tormpara [a resistencia de 10s Gradlctores elite teinologis con lla fedelenae corr ante as herramientas de traduccion selstlda por computadora (TAC), qua ii en con ample aeaptacion. Casi odos los ivoluerados an alata de hoy eecion pareceran tener una opinion al respecte, pero cunt piece la Mente sobre fe traduocién automética? En esta zocclén, Intentaromos abor {jr el tema para brindar una perspectiva general que nos permita luego eee dor ibn informada al respect, ras conocer algo sobre su historia, sbi ea diferentes tipos de traduccion automatica disponibles y sobre su vinculacién con [a labor del traductor. para comenzar, es necesario dejar en claro a qué nos referimos con ol término tra- cieién automatica. La definicion que encontramos en Wikipedia os la siguiente: «La traduccion automatica (TA), también llamada MT (dl inglés Machine Translation), oun area de Ia lingiistica computacional quo investiga el uso de software para taducir texto 0 habla de un lenguaje natural a otro». A partir de esta definicién, queda clara la distinoién entre traduccion automitica, donde ol trabajo de traduc- dion es hecho exclusivamente por una maquina, ¥ traduccion asistida por com- putadora, es decir, la traduccién realizada por una persona con la asistencia de herramientas de software, como las memorias de traduccion. Ya hecha esta distincién, resulta interesante notar due, mientras que las herra- mientas TAC son una incorporacion relativamente reciente en una profesién que tiene siglos de historia, la traduccion automstica es algo que llama la atencion de los expertos informéticos desde una etapa temprane de a computacion, como veremos a continuacion. 13. 1. Origenes y evolucién de la traduccion automatica ferentes idiomas ha pro- isten ideas sobre diccio- de la informatica, estas La idea de salvar las dificultades de comunicacion entre dif ocupado a humanidad por siglos, y va desde el sigio xi harioe amevdnicos» e idiomas universales. Con fa llegada ideas poco a poco se pusieron en practica. if automatica- a traduci tras lo software que pudier: fo los cuarenta, Los primeros intentos por desarrollar mente de un idioma a otro datan de fines de 1a década d Escaneado con CamScanner ay cual so habia Fogrado un importante 0 durant jtadora. Segunda Guerra Mundie eo a compu avn an lance? juccién automética en ol Ins. 5 Unidos ¥, para 1954, ya se Ilo conjunto entre IBM y ta acotado, con solo seis ro- cabulario, cuyo resultado as de sesenta oraciones del ruso al marcé un hito on la ovolucion do ta sions impulsadas por la necosidad 5 primoros sistemas corres- mente a la traduccién entre i pre trad - ramera contoranci 50 pr fa primera reg (MT) do Estado oun dosarrol un sistema En 1952, se cele tituto Tecnolégico habia logrado hace! Universidad de Geo! glas gramaticales yd fue la traduccidn toalment© inglés. A pesar de ser lim! ad traduccion automatica y atrajo O° militar de descifrar mensajes enemigos. De Ne pondientes a este periodo estan destinados P! inglés y ruso. la primer rgetown. S joscientos cincu automal fo, este sistema andes inve! De hecho, 10 incipal incuenta tica de mé fa de los sesenta usaban tres tipos de delo con una «lengua intermedian ar- ‘1 pasaje del texto original a la lengua sevengua de destino. El segundo método implicaba pera transformarlo en una version simplificada y val se generaba la traduccion en el idioma meta. arrollados hasta la décad 19 se basaba en un m« dos pasos: Los programas des: meétodos. El primer tificial. Consistia entonces en intermedia y, luego, de alli a un analisis del texto de origen sin ambigiedades a partir de la cl n directan. Es decir, un sistema basado en reglas de programacién para el pasaje entre un Par especifico de idiomas, con un grado minimo de andlisis sintactico y reorganizacién de los componentes. Por supuesto, este enfoque tenia grandes limitaciones para comprender contexto y, cumado a las restringidas capacidades informaticas de la época, resultaba lento y poco rentable. Hacia mediados de la década de los sesenta, la idea de que habia tuna barrera semantica muy dificil de sortear, por lo que siempre se necesitaria un trabajo intenso de revisién posterior, Ilevé a una disminucién del financiamiento de las investigaciones sobre el tema. Es entonces cuando el centro de la investiga- cién sobre traduccion automatica se desplaza hacia nuevos puntos, como Canada y Europa y, posteriormente, Japén. En estas regiones, el principal impulso prove- nia de las politicas biculturales (en el caso de Canada) y el desarrollo de la Union Eropen, situaciones que obligaban a un intercambio intenso de informacién mul- El tercer método era el de «traduccid Es a partir aa eee sas cee que surgen los sistemas de uso comercial, fue uno de los pioneros, E eae nee) . Este programa de traduccion di- r que sus predeceso: i i aaa ia : res gracias a una mej i eee 2 su adapta, se instalé en agencias como la cece s i Ee oll peace ° A Organismo Internacional de cnergia Até- Hacia la década de I epee aad : 7 Mot le y Xero: ochent, el ercimiento do asociaciones multnaconales on 272 Escaneado con CamScanner como la Organizacidn Panamericana do ta Salud (OPS) y ta oxpansién intornacional de las grandes empresas renovaron ol interés on ostas tocnologias. Esta década d favo marcada por proyectos importantes do la «sogunda gonoracidnm do sistomas que fueron incorporando reglas estructurales mas complojas, datos ostadisticos y distincién entre casos gramaticales. Algunos de los proyectos mas dostacados de Geta etapa son GETA-Ariane (dol grupo de Gronoblo), Mu (Universidad de Kyoto), SUSY (Saarbriicken) y Eurotra (Union Europea). El gran quiebre teérico Mega en 1990, cuando so comionza a evaluar ol método conocido como «estadistico», que se basa en ol anélisis de corpus do toxtos tra- Gucidos previamente y es el mas explorado on ta actualidad. Uno do los primeros ejemplos es el sistema Candide, resultado de los estudios llevados a cabo por IBM a partir de los textos en francés y en inglés de los debates del Parlamento canadiense. La gran diferencia del sistema ostadistico es que no incorpora reglas lingiisticas, sino que se basa en la comparacién do un corpus bilingiie para llegar aconclusiones meramente estadisticas. En las tiltimas dos décadas, se aceleré el ritmo de la expansion de los sistemas de traduccion automatica gracias a la adopcién en empresas multinacionales y entidades gubernamentales de los sistemas basados on Systran, Logos, METAL y ATLAS. A partir de la globalizacién y Ia necesidad de llevar nuevos productos diferentes mercados casi simultaneamente, el campo de la localizacién de software fue uno de los grandes impulsores de estos programas. A su voz, los avances tecnolégicos fueron permitiondo la creacién de sistemas aptos para PC, como PC-Translator y Power Translator, también basados en el motor basico de systran, @ incluso sistemas de cédigo abierto como Moses. La llegada y expansién de internet dio lugar a un marcado crecimiento de la de- manda de servicios de traduccién, tanto para grandes empresas y organismos como para usuarios de menor escala. La web genera un flujo de contenido cada vez mayor, con informacién proveniente de diferentes paises y en diferentes idio- mas, siempre con la posibilidad de difusidn internacional, La traduccion de texto es una parte més de la comercializacién internacional de productos y servicios ¥, como en tantos otros aspectos, también se busca lograr el mayor rendimiento al menor costo posible. Elclaro incremento en la capacidad de procesamiento informatico favorece el ana- lisis de volimenes enormes de contenido a gran velocidad, condicion necesaria para los sistemas estadisticos de hoy, como Google Translate. A su vez, la cantidad de texto publicado en internet ofrece un corpus casi inagotable y sumamente va- lioso para los sistemas estadisticos, cuyo funcionamiento se vera en detalle en la préxima seccién. No obstante, en la actualidad, solo un pufiado de empresas usan traduccién automatica estadistica en sistemas comerciales; algunos ejemplos son Asia Online, Google o Microsoft. Esta facilidad para llevar la traduccién automatica gis. =a Escaneado con CamScanner nal también perm ide las grandes em de las herramien ala computadora perso! ya no solo en el ambito les independientes a traves tas les de sistemas de 13. 2. Variedad: dos grandes procesat ¥ emas basados en Translate) xto en los idiomas de las (como Systran) ¥ generar te: reg! En la actualidad, podemos hablar de tn funcién del método que aplican Para origen y de destino. Se trata de los sist los sistemas estadisticos (com? Google sada en reglas, esta compuesta Je un conjunto de diccionarios gilistica que se carga morfolégicas y scion automatica ba: traduccion a partir de un © '¢, Esta informacion lin "; regularidades semanticas, La primera categoria, la traduc .s que generan una maticales y lingiiistica incipale: por sistema y reglas grat en el sistema abarca las pri sintacticas del idioma. en si tiene varios pasos. Primero, el mn que debe traducir para determinar verbos, sustantivos, etcétera. | motor de traduccion El funcionamiento del ites de la oracio sistema analiza los componen' su categoria gramatical, es decir, si son articulos, Luego, obtiene cierta informacion ‘sintactica, como el tiempo verbal o la funcién de determinados términos dentro de la frase. "A continuacion, se exploran los diccio- narios del sistema para obtener los terminos ea) alentes en el idioma de destino se reorganizan los componentes de ‘acuerdo con las reglas del idio- y, por ultimo, ma meta. visan las traducciones generadas para iden- tificar patrones de errores del sistema. A continuacion, es posible ajustar el com- portamento de las reglas y refinar los términos del diccionario part adecuarlos a eorrvea eepeeifica, En este paso también se pueden incorporar reglas especiticas para ciertas irregularidades del idioma. No obstante, se trata de un proceso lento y relativamente complejo. Después de las pruebas iniciales, se re Fr san rst rept pace, reas sos, bastante «artificial», aunque gramaticaimer eee sei aha Is y a nte correcto y comprensible. Por este motivo, este tipo de tecnologia implica un trabajo intenso de posedicién o correccio del texto generado automaticamente. La ventaja que presenta respect de | ae ie coin es que se puede aplicar a campos para los Pasics po hey rnateril a pire ie ne las desventajas, el trabajo manual de creacion elie ee ay d 4 generaién de diccionarios (si se desea usar uno mas eer iempo y requiere la contratacion de personas con un iv pecializado del idioma y programadores, lo cual eleva los costos. ae Escaneado con CamScanner La traduccién automatica estadistica es el enfoque adoptado por la mayoria de los sistemas de traduccion automatica mas recientes y, en lugar de partir de un conjunto de reglas gramaticales, se basa en el analisis de textos paralelos previa- Mente traducidos. El sistema analiza un corpus de texto bilingiie (en los idiomas de origen y de destino) y monolingiie (solo en el idioma de destino) para extraer datos estadisticos a partir de la deteccién de las variables mas frecuentes en el texto y las Geincidencias entre ambos idiomas. Estos datos le permiten generar sus propias estadisticas, a partir de las cuales el motor define qué traducci6n es la mas proba- ble para un segmento del texto de origen en funcién de una serie de algoritmos. En este método, la unidad de analisis es una secuencia de palabras, que no siem- pre coincide con las estructuras gramaticales, en lugar del término, por lo que suele tener una mayor precision semaéntica. La incorporacion del contexto cercano es una de las ventajas de estos sistemas, que ademés generan textos con un nivel de fluidez claramente superior a los sistemas basados en reglas. Una de las des- ventajas de estos sistemas es la falta de predictibilidad de las traducciones, que exige una mayor atencién cuando se revisa el texto en un paso de posedicién, ya que la aparente fluidez de la traduccién obtenida a veces puede enmascarar estos errores inesperados. Otra de las grandes desventajas de estos sistemas, al menos para ciertos casos de uso, es que se necesita un volumen enorme de textos tradu- cidos previamente (entre doscientas mil y quinientas mil unidades de traduccion) para alimentar el motor de anilisis, lo cual limita su viabilidad para algunas areas tematicas o combinaciones de idiomas poco frecuentes. También existen sistemas hibridos donde se combinan técnicas de traduccién au- tomatica estadistica y basada en reglas para lograr un mejor resultado. Los desa- rrollos mas recientes se acercan a la traduccion automatica basada en la sintaxis. Estos métodos cuentan con un sistema de reglas que les permiten realizar un ana- lisis gramatical de las frases y aplicar la traduccién en funcion de este anélisis, que es bastante mas complejo y lento que la traduccion por reglas. En general, se aplica este enfoque combinado con los otros dos tipos de traduccién automatica. Por ejemplo, se puede aplicar primero un motor basado en reglas y luego un siste~ ma estadistico para hacer algunas modificaciones. Otra forma de sistema hibrido implica el preprocesamiento del texto a partir de regias para luego aplicar el motor estadistico a las unidades organizadas por el sistema de reglas. A continuacion, se pueden volver a usar reglas para un posprocesamiento del texto obtenido. Otra forma de categorizar los sistemas de traduccion automatica se basa en su es- pecificidad, es decir, entre sistemas genéricos y personalizados. Los sistemas gené- ricos son aquellos que no han sido adaptados para un campo especifico, tales como. Google Translate o Microsoft Translator. Se trata de sistemas que pueden resultar tiles para tener una idea general del contenido de un texto, pero pueden exigir mu- cho trabajo de revision si se desea usarlos en campos mas especificos. Escaneado con CamScanner s 0 estadisticos, son aque- '¢ en particular. Esta perso- ios especificos 0 recabar y preparar el motor estadistico- El resultado de rtinente que el de los sistemas raparacion del motor de traduccion a de tiempo y dinero que demanda olucién que resulta rentable n cantidades considera- asados en regla a sean bi : eee ara un client ‘enun tema oP iccionarios y glos ra alimentar 4s adecuado y Pe! Los sistemas perso! los adaptados para trabajar nalizacién implica generar di textos bilingiies ¥ monolingtes pa estos sistemas suele ser mucho me genéricos, pero implica un trabajo intenso Ker y ajustes posteriores. Debido ala gran invert vietar con un sistema personalizado, se trate Cob principalmente para las grandes empresas que cue bles de texto para traducir regularmente- 413. 3. Vinculo con herramientas de traduccién asistida duccién automatica ha despertado la To largo de su historia, y el mundo de la traduccion profesional no es la excepcion. Es asi que en las versiones més recientes de las principales herramientas de traduccion asistida se ha incorporado la posibilidad de utilizar traduccién automatica, ya sea como complementos pagos ° gratuitos, que funcionan de la misma forma que una memoria de traduccién. A continuacién, haremos un breve repaso de la integracion en cada herramienta. 10, el estudio de la tra Como ya hemos atencion de diversos sectores a SDL Trados Studio: las opciones que ofrece son Google Translate, traduccién auto- matica de SDL, comunidad de SDL BeGlobal y SDL Language Cloud. ‘memo0: las opciones de traduccién automatica incluidas en memoQ son Google MT, iTranslate4.eu, Let’s MT, Microsoft MT, Systran MT, KantanMT y CrossLang Gateway. Se trata de servicios por suscripcién, que generalmente ofrecen una ver- sién de prueba con una limitacién mensual. Wordfast Pro: la version completa ofrece opciones similares a las de SDL Trados Studio, como Google Translate y Microsoft Translate, y a diferencia de los demas programas incluye WorldLingo. 13. 4. E1 traductor profesional y la traduecin automética Ante el i posisonee autres si quieren o pueden aprovechar esta tecnologia y como EI primer paso para respo! " @ Se propone para ella desde diferentes sectores. Ponder a estas preguntas es comprender de qué se trata realmente, afin de no dej q no dejarse llevar i ‘ or los sti ; que se difunden sobre esta tecnologia pepe ative come negate on 276 Escaneado con CamScanner Una idea difundida es que todos los sistemas de traduccion automatica arrojan resultados incomprensibles 0 graciosos, como las versiones gratuitas de algunos servicios en linea, pero este, como vimos anteriormente, es un concepto equivo- cado. Los sistemas publicos son apenas la punta del iceberg. Los motores de tra- duccién automatica mas avanzados son mas complejos y no apuntan a un publico general que quiere usarlos gratuitamente para comprender el contenido de un sitio web, sino a las empresas dispuestas a invertir dinero en preparar y adaptar un sistema de traduccion especialmente de acuerdo con sus requisitos. Esta clara me- joradela calidad tampoco significa que se haya logrado la traduccion automatica infalible, pero es importante no subestimar el posible alcance y la utilidad de estos sistemas para casos determinados. Por lo tanto, la idea de que la traduccién auto- matica jamas ofrece resultados Utiles es un preconcepto que es necesario erradicar para comprender frente a qué nos encontramos y sus posibles implicancias. Los sistemas de traduccién automatica mas complejos estan destinados a las grandes empresas que generan un volumen considerable de contenido y deben traducirlo a varios idiomas. Son estos clientes quienes suelen estar dispuestos a invertir lo necesario en adaptar los sistemas de traduccién y también a adaptar su propio proceso de redaccién del material original. Este es un punto clave para mejorar el resultado de la traduccién automatica y que se debe tener en cuenta al evaluar la utilidad de estos sistemas para cada traduccion. Por ejemplo, para aprovechar al maximo la traduccién automética se sugiere usar oraciones simples y cortas, no usar varios sindnimos para un mismo referente, evitar expresiones idiomaticas, evitar los pronombres y mantener un uso uniforme de mayusculas y abreviaturas, condiciones que no siempre se cumplen en el material fuente. Todas estas limitaciones dejan en claro que no cualquier texto es apto para la traduccion automitica, al menos si el objetivo es obtener un resultado que requiera un minimo trabajo de correccién. Los grandes usuarios de los sistemas de traduccién automatica suelen compren- der que el texto traducido automaticamente no tendré la misma calidad que un texto traducido por una persona, y el cliente elige resignar calidad para reducir los costos. En las empresas que usan este proceso con seriedad, se suelen des- tinar a la traduccién automatica solo algunos materiales, como guias del usuario © ayuda de software, mientras que otros tipos de contenido, como los acuerdos legales o el material publicitario, siguen en manos de traductores profesionales. Es decir, aceptan la importancia de contar con traductores, lingilistas 0 correctores en diferentes partes del proceso, como la adaptacion de las reglas gramaticales, la creacién y revision de diccionarios, y la posterior revision del texto. Y es en estos puntos del proceso donde pueden insertarse los traductores. La revisi6n del texto producido por un motor de traduccién automatica se denomi- na posedicién y es una de las nuevas capacidades que algunas empresas buscan en los traductores con los que trabajan. La posedicion consiste en revisar el texto OTF so: Escaneado con CamScanner j Jas correcciones indispensables para obtene i maticamente y hacer io si ieee preocupacion porque sea repetitive o no sug. un texto «comprensible», sin mayor ne totalmente natural. como poseditor, hay varios puntos que deberian tipo de trabajo. El primero, de naturaleza practica, Jaras respecto de la calidad esperada, ya que de traduccion automatica en linea tambien to. Es asi como han surgido empresas genérico para ahorrarse el costo de En cuanto a la tarea del traducto analizarse ala hora de aceptar est! es la necesidad de establecer reglas cl la difusion de los sistemas generales de ha abierto la puerta al mero aprovechamien i n sistema que simplemente pretenden usar un sist pare s la traduccién y luego pagar un precio infimo por una edicion, pero siempre con et objetivo de obtener un texto de calidad optima. El segundo tema, como en cualquier relacién comercial, es establecer honorarios justos para el trabajo. El método aplicado para presupuestar un encargo de pose- dicién puede variar, pero es habitual que se pague por hora, ya que el ritmo de trabajo dependerd de la cantidad de correcciones que requiera el texto. El tercer tema, nada menor, es reflexionar sobre qué funcién queremos desem- pefiar en el mejoramiento de las tecnologias de traduccién automatica. Los textos poseditados generalmente sirven para realimentar los sistemas de traduccion y asi mejorar el rendimiento futuro, por lo que cada vez es menos necesaria la tarea de posedicién. Es decir, podria tratarse de una nueva puerta que se abre hoy, pero que podria ir cerrandose progresivamente en el futuro. Mas alla del uso «a gran escala» de la traducci6n automatica, también es posible evaluar si como traductores podemos aprovechar esta tecnologia para nuestra la- bor diaria, Como se desprende de la primera parte de esta seccién, la evolucion histérica de la traduccién automatica deja en claro que no se trata de una tecnolo- gia pensada originalmente para la labor del traductor. Todo lo contrario, se plantea como un sustituto. No obstante, esto no significa que no pueda resultar util para un traductor independiente en casos especificos. Como se ha comentado anteriormente, la ultima tendencia en las herramientas de traduccion asistida es vincular el entorno de traduccion con sistemas de traduccién automatica. De esta forma, ademas de las sugerencias provenientes de la memoria de traduccién que se esta usando, también se presentan segmentos obtenidos a través del motor de traduccion automatica. Ahora bien, debemos prestar atencin a un aspecto clave de los sistemas en la nube, como Google Translate o Let’s MT, que es la privacidad. En general, estos servicios (especialmente si son gratuitos) estan sujetos a condiciones de uso que pueden implicar una cesién de derechos sobre el contenido que se procesa en ellos y opciones de configuracién predeterminadas que suelen impulsar el uso compartido de nuestras memorias y diccionarios. Como con cualquier servicio ~ 770 Escaneado con CamScanner an ta nubo, dobamos prostar atanclin 1 fa latea chica pare auagurarnos dno or nqir eualqulor acuordo da confidencialidad que pudiora ragir nuaetra turaa, o1ro de los factoros rolovantos para analizar la utlidad do ta traduccidn autonnaticn 99 ol tipo do toxto que se dobe traducir, Tal como #6 explicd anteriormente, loo ‘eidn automatica funcionan mojor cuando ol texto que a6 intro- simplo y con un estilo uniforme, Cuando racibimos para traducir ciOn u ortogratia, sistemas do tradu duco os repotitivo, fextos quo no tienen una calidad éptima, con errores de puntu tieo dispar do mayiwsculas y mindsculas, entre otras condiciones, ot rast Ia traduecién sord do manor calidad, ya quo ol sistema earace do la capacidad para taconocor un error, por simplo que sea. En consecuencia, al trabajo de correccion ford mucho més intonso, Asimismo, si la calidad acordada con 6! cliente o8 la car fidad final habitual (diferente do aquolla que s0 espera on la posodicion), también so roquiere un mayor trabajo do revisidn para que ol texto resulte natural y acorde a las particularidades estilisticas de cada encargo. Por lo tanto, cabe recordar que fos cdlculos de produccién diaria que suelon publicitarse para los sistemas de tra- duccién automatica probablemente estén lojos do nuestra realidad. Seguramente no sea necesario reescribir cada uno de los segmentos, como a veces se afirma, poro si haco falta una adaptacién y correccién de estilo y terminologia bastante mas profunda que para una posodicidn cuyo tinico objetivo os lograr un texto que solo sea «comprensible». ado de En conclusion, es un hecho que la traduccién automatica esta entre nosotros y disputa torrono en espacios quo antes eran patrimonio exclusivo de los profesio- nalos, Esta lojos de ser el sistema perfecto que sus impulsores describen, pero si ha encontrado su lugar en dmbitos muy especificos. A partir de su inclusion como alternativa dentro de las herramientas de traduccion que usamos cotidianamente, esta al alcance de la mano de cualquier traductor. La decision de incorporarla en algun punto de nuestro trabajo depende de una serie de preguntas, tanto de indo- le practica (para qué toxto?, Zqué sistema conviene?) como éticas (acuerdos de privacidad, mejoramiento de sistemas de terceros), Lo que queda claro es que es conveniente mantenerse al tanto de esta realidad y estar atentos para tomar una decision informada y acorde a cada caso. Escaneado con CamScanner

También podría gustarte