Está en la página 1de 13

Apuntes:

guía de posedición (IMPORTANTE)


https://webgate.ec.europa.eu/
Traductor profesional 2.000-3.000 palabras al día
BLEU – importante
MULTITRAIN – Traducción automática para todo (leer capítulo 2: Human machine translation)
TAO: Traducción Automática
- TA: Traducción Automática
- MT: Memoria de Traducción (Translating Memory)
- BDT:
CAT – CAT TOOLS (Computer Aid Translation)
API – Application Programming Interface
Durante los últimos 10 años, se investigó con inconvenientes propios de los ordenadores, se
estudiaban las lenguas a nivel morfológico y posteriormente sintáctico, Traducción automática
1966 – Las productoras detrás de los traductores quisieron tener un comité asesor: el informe
ALPAC. Estableció que la traducción automática era más lenta, de peor calidad. Por lo tanto, las
inversiones cayeron, se decidió no invertir tanto en la traducción automática, beneficiando a los
traductores, invirtiendo en los años 60-70 en otras ayudas y herramientas de traducción:
diccionarios, glosarios, etc.
Años 70 – surgen dos sistemas de traducción automática:
En Estados Unidos estaban interesados en traducir ruso-inglés. En 1970 aparece SISTRA, un
proyecto de traductor automático muy importante, y posteriormente METEO, el último fue un
éxito ya que era un sistema para traducir partes meteorológicos, un proyecto de la universidad
Montreal (inglés-francés), tenías características que ayudaban a la traducción:
Vocabulario y sintaxis bien definido y limitado, al ser un campo tan pequeño, el resultado fue un
éxito (vocabulario preciso, escasa sintaxis…)
Años 80- se desarrolla la INTERLINGUA, un cambio considerable ya que antes estaban los
recursos de traducción directa que estaban solo preparados para traducir solo entre dos lenguas.
La INTERLINGUA se consideraba como traductor multilingüe, funciona como un puente de
lenguas, compone una recreación del sentido de la frase en lengua origen para que posteriormente
la puedan adaptar todas las lenguas de destino para componer una frase en su idioma.
The house is red --- x x x x x x (codificación) ---- lengua destino
A través de la codificación se obtienen buenos resultados en lengua destino. Se modifica y adapta
la morfología y sintaxis a la frase destino. La evaluación de los sistemas basado en Interlingua:
Una pirámide morfología<sintaxis<léxico
Reglas y TA basada en ejemplos: Se desarrolló la traducción automática basada en reglas (Utiliza
los conocimientos y características propias de una lengua: su morfología, sintaxis… y de la
lengua destino para elaborar las traducciones de las frases… se tiene en cuenta si una palabra
tiene función específica, es un verbo, su género, etc) y ejemplos, este último es el germen de la
traducción lingüística. Los ejemplos son ejemplos de traducciones interpretadas por humanos en
corpus enormes de traducción, posteriormente llamado traducción estadística, al componerse de
ejemplos, se basan en valoraciones estadísticas y las distintas opciones posibles. Estas eran más
naturales, pero pueden no ser del todo fieles a la realidad. En los años 90 se desarrolló la
traducción estadística…
Durante el 2010 se generaron traductores de código abierto, basados en reglas (Apertium, Moses,
este último en vez de basarse en reglas se basa en sistemas estadísticos), en 2015 está la
traducción automática neuronal: aprendizaje de máquina e inteligencia artificial en la traducción,
se trata de mejorar la traducción a través del input (propuestas) de sus usuarios.
¿Para qué sirve la traducción automática? Los traductores automáticos funcionan a nivel frase,
por fragmentos. No sirve para sustituir al traductor, buscamos generar documentación
comprensible en periodos de tiempo más cortos, para abordar distintos documentos multilingües
de internet. Se usa para:
- Comunicación interna
- Atención al cliente y foros
- Contenido perecedero
- Contenido de poca relevancia: textos sin contenido político, periodístico, médico (una mala
traducción no implica consecuencias desastrosas): opiniones en página web, opiniones de
clientes, opiniones en google.
- Versión preliminar para poseditar
Tipos de traducción automática:
- Traducción automática basada en reglas (Rule-based Machine Translation): RBMT
- Traducción automática estadística: no usa reglas (no sabe de gramática), simplemente usa
información recogida en enormes corpus de traducciones usando cálculos estadísticos para
calcular la correspondencia de una frase en la lengua término
- Traducción automática híbrida: Mix de ambas técnicas
- Traducción automática neuronal: Aplica reglas de la inteligencia artificial, mayor calidad de
resultado, capaz de aprender y mejorar sus resultados con el uso. Esto no sucedía con su
antecesor, que sentó las bases de esta traducción, la traducción automática estadística, incapaz de
aprender ni mejorar con el tiempo. Es decir, la traducción neuronal es la estadística mejorada y
evolucionada, puede no sólo recoger la información sin aprender ni mejorar (estadística) sino
aprender de ella y mejorar cada vez más los resultados (neuronal)

Las memorias de traducción: Una base de datos lingüística que almacena traducciones para poder
usarlas en un futuro. Guardan segmentos de textos en lengua origen y lengua meta. Una memoria
de traducción es bilingüe (pares de idiomas).

27/09/2023
-Incrustamiento de palabras/encaje léxico -en un eje tridimensional se sitúan los
conceptos/palabras, a partir de los motores de traducción de corpus se alimentan de bases de datos
en este espacio tridimensional. El traductor, sin poder saber el significado de cada una, las
enumera y sitúa junto a otras palabras que están cercadas a esta en los textos de los corpus de los
que se alimenta el traductor (su almacenamiento).
Apple y tree están cerca siguiendo el almacenamiento según los corpus (que son finitos).
Se hace la traducción en función de los conceptos y palabras que se encuentren más cerca de la
palabra a traducir (campos de textos paralelos donde se almacena las palabras traducidas de cada
uno, según parentesco entre ellas). Estimando así una traducción lo más equivalente posible
según las familias de palabras (es decir, la cercanía en significado de cada una de ellas)
Los motores de traducción automática son los propios programas de traducción.

Tema 2
Relación con el ordenador:
Alt + windows - cambiar de ventana (chrome, ppt, word, etc.)
La tecla de página (tecla entre windows y control) - es el botón derecho básicamente [muestra
todas las posibles acciones que podemos hacer en un programa]
Calpro -
ergonomía - ciencia que estudia la adecuación de las máquinas a nuestro puesto de trabajo.
un teclado que nos de todas las opciones posibles (teclado numérico, independiente, regulable)
Tenemos que tener en cuenta 5 cosas:
- monitor
- teclado [cherry kc 1000 sc] y ratón
- mobiliario [la silla, la pantalla y el teclado son imprescindibles para una buena traducción]
- postura
- ambiente de trabajo (música)
Tener el foco de luz perpendicular a la pantalla (que la luz entre a la derecha)
Técnica pomodoro (25 minutos trabajando sin distracciones + 5 min de descanso)
teclados mecánicos (independiente de la pantalla)
- lavar las manos con agua fría
- el ratón hay que usarlo lo menos posible (usar principalmente el teclado)
Atajos de teclado:
control+mayús+v (copiar sin formato)
descargar extension chrome
mailinator (para que no te envíen spam al correo)
Activar las extensiones de archivo en la vista carpeta formatos de archivo. – Como activar:
Archivos<Documentos<vista (extensiones de nombre de archivos [tic])
- Anteriormente formato .doc o .rdx
- Ahora puede ser cualquier formato
02.10.2023

Archivos comprimidos (.tar, .zip, .rar) – interesa comprimir los archivos; pesan menos y tardan
menos en descargarse/subirse/mandarse.

Cambiar archivos y formatos(.doc, .pdf…) – archivo guardar como< cambiar formato.

Captura de pantalla - control + impr

Para mandar la captura de pantalla se debe pegar (control+v); en word o en cualquier sitio.

El correo profesional se usa solo para trabajar. Usar un dominio profesional y propio (no usar
gmail), nombresyapellidos@dominioprofesional.es

Para registrarse a páginas y cualquier sitio web usar mailinator (para no llenar el correo de
basura).

Los archivos tirados a la papelera de reciclaje no se borran, está en el disco duro solo que no
lo vamos a ver. No podemos perder el contenido del ordenador. Existen sistemas de backup para
los archivos borrados.

Atajos de teclado de windows (con la tecla windows)

Windows + D (para ir al escritorio)

Windows + E (buscador de archivos)

Windows +/- (aumentar/reducir tamaño)

Windows + H (dictado de inteligencia artificial)

Windows + Tab (cambiar de pestañas ordenador)

Control + Tabs (cambiar de pestañas google)

Control F4 (cerramos todo, no se meten virus al no hacer clic a nada)

Control + E (selección de todo el texto)

SE ROMPE EL ORDENADOR

Copia de seguridad en disco duro externo

Sistemas copias de seguridad - mega.io

Recopilar archivos borrados - Recuva


04.10.2023

Omega T 6.0.0 (Formato usado)

Trados Studios 2021 (Formato usado)

Resumen de informática básica Tema 2 (IMPORTANTE)

Sistema operativo se dedica a distribuir los recursos del ordenador a las distintas aplicaciones.
Unidades de almacenamiento

El ordenador es una máquina que opera y almacena datos, los datos que almacena viene de las
unidades de entradas o periféricos de entrada. Como pueden ser, el puerto (interfaz de entrada o
salida), se pueden conectar tanto un altavoz (interfaz de salida) como un ratón,teclado,escáner
(interfaz de entrada, estos son todos aquellos elementos externos a la cpu (unidad central de
procesos) que se usan junto al ordenador, dependen de él).

La unidad aritmética es la que hace el procesamiento de datos (realiza las operaciones que le
pedimos al ordenador).

De derecha superior a izquierda inferior.

1. Unidades de almacenamiento auxiliar (lector de rom o de dvd)/ 2. Fuente de


alimentación/ 3. Procesador/ 4. Placa base (ranuras/slots de ampliación:
tarjetas de video/audio…)/ 5. Disco duro (magnético) “hdm”.

3. Procesador 2. Fuente de 1. Unidad de


alimentación almacenamiento auxiliar

4. Placa base 5. Disco duro


Macroinstrucciones: serie de operaciones en cadena a las que le asignamos un botón, estas se
pueden programar con un lenguaje de programación. Office nos ofrece la posibilidad de poder
programar sin que sepamos con un sistema de grabación.

Trados en un origen se planteó como una macro igual que word, corría dentro del entorno de
Word.

XSL (lenguaje indispensable para texto) SI / XLS (extensión de archivo) NO

Foros especializados - Institución ProZ (espacio de encuentro entre traductores y clientes)/


TranslatorsCafe

TMX - Translation memory Exchange (formato estándar de las memorias de traducción)

LISA (todas las memorias de traducción tenían que ser compatibles entre sí). Todas las memorias
tienen su propio formato nativo, podemos convertirlo a formato tmx)

Alineador - Programa que permite alinear un texto y su traducción,de forma que los segmentos de
ambos queden enlazados.

¿Cómo funciona una memoria de traducción? La aplicación identifica un nivel de similitud entre
el segmento origen y los segmentos disponibles en la memoria de traducción y facilita una
traducción de forma automática o tras la confirmación del usuario

Fuzzy match - Un segmento de la memoria de traducción que se corresponde parcialmente al


texto original

Recuento de palabras- WebBudget

El contador de palabras de Word a veces se equivoca, no es capaz de filtrar lo que es texto


traducible de lo que no lo es. Word no es una aplicación fiable para facturar ni presupuestar.

Algunos programas fiables para hacer una estimación son:

- Anycount (uso simple, puede leer muchos formatos, gratuito)


- WebBudget (más profesional, FreeBudget es gratis)

El cliente nos paga según las palabras del texto origen, NO meta.

Una macro es un conjunto de acciones que se graban en el ordenador que se quedan ya grabadas
para posteriores trabajos.
La macro se graba realizando las acciones y después se para la grabación, estas están
vinculadas a una plantilla.
^& - reemplazar con lo que pone arriba (para contar cuantas veces se repite el término, no se
reemplaza)
MACRO – VISTA<MACRO<GRABAR UNA MACRO
Control + I – buscar y reemplazar (editar)
Facturas de Excel
Sin facturas no se cobra
.xlsx
Excel es un libro compuesto por varias hojas [parte inferior de la tabla de excel (hoja 1, 2,
etc.)]
El iva va a la hacienda, se puede desgravar el 21% si lo usamos para nuestro trabajo

multiplicar: *
división: /
sumar: +
restar: -

Memorias de traducción 18-10-2023

.TMX
Alinear
Importar formatos externos
Traducir

- Bilingües y partidas en segmentos


Los segmentos van en pareja de lenguas, una memoria de traducción es un archivo bilingüe, los
programas tratan cada variante dialectal con idiomas distintos. Nos lleva años tener una
memoria de traducción amplia y extensa. Existen formatos compatibles con las memorias de
traducción:
Deben tener una estructura de campo o formato de campo, fijándonos en tmx, el formato de
traducción por antonomasia.
Los programas tienen formatos nativos (como por ejemplo Trados).
Podemos usar cualquier archivo .tmx para alimentar nuestra memoria de traducción, estos
archivos son memorias de traducción específicas de un campo determinado. Las memorias de
traducción son temáticas, no queremos mezclar una memoria de traducción de automóvil con
otra de medicina, son campos distintos, aunque poder se pueden usar los dos (en ámbito de
medicina/pediatría para un texto se pueden usar ambas memorias). las memorias en formato
nativo se pueden exportar a formato .tmx para poder compartirla.
Alinear
Si tenemos dos textos, uno en español y otro en inglés (dirección de traducción a inglés),
podemos alinearlos para alimentar la memoria de selección. Alinear es decirle a un programa
que alimente la memoria de selección. Es decir, si dos textos son traducidos fuera de un entorno
de traducción, se procesan en el programa y se ve la correspondencia de los elementos.

SDL Trados Studio

perfil predeterminado
no queremos sus ejemplos
alinear documentos (los dos círculos)
- Abrir alineación (si ya tenemos hecha la alineación)
- Alinear varios archivos (alinear paquetes de archivos en dos idiomas de una sola vez)
- Alinear una única combinación de idiomas (alinear un único par de archivos, es decir un
texto en español y otro en inglés, el que vamos a usar hoy)
Se le da al botón de crear (para crear la memoria de traducción, ya que no tenemos ninguna
(nueva memoria de traducción basada en archivos) (usamos la forma rápida *algo así no he
escuchado*)
Nombre - TranslationTechnologyENUK_ESES (ENUK - ingles united kingdom… ESES -
español españa)
ubicación - todas las memorias de traducción deben estar en un mismo sitio
Combinación de idiomas (idioma origen-idioma destino) (English United Kingdom - Spanish
International Sort)
Buscar archivo origen (archivo para alinear EN)
archivo destino (archivo para alinear ES)

sdalign
1- .sdltm
2- .docx en/es

TMX
son archivos de intercambio de memorias de traducción, las memorias de traducción disponibles
en la red son siempre .tmx. A su vez, es el formato que usan en los software libres. Se debe
guardar la memoria de traducción, y posteriormente, si quieres el archivo alineación (no es
necesario) al final lo vas a acabar borrando porque no te va a hacer falta cuando se haya
exportado la memoria de traducción con la alineación correspondiente. VAMOS A TRADUCIR
CON TRADOS.
Metadato: toda aquella información adicional que ayuda a utilizar una herramienta… en Trados
(Alineación, selección de idioma origen y destino, etc.). Trados traduce automáticamente
(pretraduce) segmentos que están almacenados ya en la memoria de traducción

Funciones y programas de accesorios. Trados tiene herramientas bastante complejas para el


usuario.
1- Programas o accesorios auxiliares que ofrece, con Omega T no se puede ver las memorias de
traducción pero con Trados si
2- Algoritmo de búsqueda, núcleo de Trados… así como la velocidad de búsqueda.
3- La interfaz visual. Las herramientas de software libres suelen ser feas y simples, las de pago
son más bonitas y complejas. (Trados tiene opción local y en la nube)

control + , (para insertar fichas, símbolos, etc… del elemento origen)


Guardar como destino… en carpeta memorias de traducción

Crear un proyecto e introducir la memoria de traducción (guardarla en la carpeta de memorias)


Para traducir más de un archivo en Trados necesitamos crear un proyecto nuevo de archivos
[arrastrar archivos para traducirlos o examinar equipo<Crear nuevo proyecto(para más de un
archivo), es local por defecto]

se pueden fusionar los docs (para no tener que ir viéndolos uno a uno) – se convierten a .xliff
(formato al que trados convierte los archivos para poder trabajarlos en su interfaz, la de trados…
después se exportan al formato de partida)

Crear nuevo proyecto: recursos de traducción


memorias de traducción<utilizar proveedores de traducción distintos para esta combinación de
idiomas<utilizar memoria de traducción (examinar)
– Finalizar (no tenemos bases terminológicas ni nada más, cerramos después de los recursos)
vista: archivos

20-11-2023
Trados puede generar un diccionario autosuggest para crear una memoria de traducción en
formato .tmx… es decir el programa Trados convierte la memoria de traducción en diccionario
autosuggest.
Para crear un diccionario autosuggest nos vamos a la vista memoria (crear diccionario
autosuggest…)

(Para seleccionar la memoria tmx… examinar< desplegable de formatos< .tmx)

Cómo importar una memoria .tmx a Trados:


Al lado de abrir memoria de traducción está (importar/exportar memoria) [debemos seleccionar
una memoria de traducción para que salgan los botones importar/exportar memoria]

importar<agregar archivo (se va a guardar en la memoria activa de traducción [la que se


selecciona])<...opciones de importación:campos activos (ignorarlos)<(elige la opción que más
se adecue *tres opciones* se coge la primera opción (opción predeterminada)... opciones de
importación generales – aplicar valores de campo<editar (no se marca ningún cuadrante de los
tres)<si los segmentos de destino varían

bombilla (digame lo que desea hacer) — base de datos terminológicas<nueva base de datos
basada en archivos
base de datos terminológicas — .sdltb

Tema 4
documentos etiquetados de lenguaje de marcas .html (presenta información de una forma
determinada, según sus etiquetas *se usó para hacer las primeras páginas web, los
navegadores están escritos con .html*)/.xml (estructura la información… como una
estructura de base de datos)
El lenguaje de marcado no es igual que los lenguajes de programación
Los lenguajes de marcado son también artificiales con el fin de organizar, acotar o especificar
cómo debe presentarse una información. No da instrucciones a la información (lenguajes de
programación), sino que presenta la información (lenguaje de marcado)
Hay dos versiones de .html (4 y 5)

El lenguaje de marcado pretende acortar la información (head “títulos”, body “párrafos, cuerpo
del texto”)
Software para navegar por internet – navegador (browser) [chrome, mozilla]
Los lenguajes de programación son artificiales de la lengua natural, las lenguas artificiales son
lenguas creadas para una cierta tarea… sirven para dar instrucciones al ordenador.
.html etiquetas – <title> </head>...

El atributo son textos traducibles dentro de una etiqueta, sirven para que la etiqueta se
comporte de un modo u otro. A veces el texto puede estar dentro de las etiquetas…
En la imagen superior el texto está fuera de las etiquetas, está entre ellas pero no dentro de ellas.
Para traducir los atributos (texto alternativo, los textos que salen al poner el ratón en una
imagen) “temporada navideña”... esto se tendría que traducir a los distintos idiomas

este texto alternativo se muestra entre comillas en las propiedades de la página… se


traduce el texto entre comillas “red”... etc

HTML – Segundo_ES (11.12.23)


Para ver el código html; botón derecho (inspeccionar) – al no tener etiqueta *body* no tiene
ningún contenido que se muestre en la página… la mayor cantidad de contenido traducible están
en body, pero pueden estar en lenguaje script, título, cabecera… etc.

El lenguaje de script no es visible directamente por el usuario, pueden contener cadenas


textuales que necesitan ser traducidas, el archivo (segundo _es) solo sirve para establecer la
forma de la página y otro contenido que pueda ser traducible, aunque no sea visible.
Las etiquetas META no son visibles para el usuario y pueden tener contenido traducible

El valor variable de los atributos son los fragmentos entre paréntesis morados “locality”,
“stylesheet”

Las etiquetas tienen muchos atributos distintos y estos determinan qué valor tiene la etiqueta
etiqueta meta atributo name valor de atributo “description” language(lang) “es(español)”
contenido de la etiqueta content contenido del sitio web “sitio web de cursos guay…”

etiqueta estructura: interna, etiqueta en linea:externa

p/ – parrafo

traducimos los valores de los atributos que se vean en pantalla (la imagen izquierda)

.xml – lenguaje de marcado extensible


En Omega T

Control + U para guardar en memoria de traducción


Control + I coger segmento de la memoria
Control + mayus + G creamos nuevo termino en el glosario
Control + F busqueda de concordancias
Control + Y rehacer
Control + D crear documentos traducidos
Control + Mayus + D para crear solo documento traducido seleccionado
Control + Mayus + R copiar segmento origen en destino
Control + N crear nuevo proyecto
Control + O abrir proyecto antiguo
Control + L carpetas de archivo de un proyecto

Contar palabras – herramientas<estadísticas<estadísticas por archivo

Traducción automática con Omega T— pestaña Opciones

También podría gustarte