Está en la página 1de 3

Micro-Mooc Integración de traducción automàtica neuronal en proyectos de

traducción con MTUOC - Anexo 2. Instalación y configuración de servidores MTUOC

1. Introducción
En este anexo se explica como descargar, instalar y configurar un motor MTUOC. Estas instrucciones sirvern
tanto si trabajas con una máquina virtual como si trabajas en un entorno Linux. Si quieres trabajar con una
máquina virtual Virtual Box con todo lo necesario para ejecutar Marian puedes utilizar: http://lpg.uoc.edu/MTUOC/
MTUOC-Marian-Server-20.04.ova. Si utilizas esta máquina virtual, cuando la importes y la pongas en marcha
verás esta pantalla de inicio:

Para entrar en el sistema recuerda que el nombre de usuario es mtuoc y la contraseña también es mtuoc.

2. Descarga e instalación de un motor MTUOC


Recuerda que puedes encontrar motores MTUOC libres disponibles en http://lpg.uoc.edu/MTUOC/. Los archivos
zip son motores completos que se pueden instalar en un entorno Linux. Si utilizas la máquina virtual tendrás todos
los prerequisitos instalado para poder ejecutar servidores MTUOC que utilicen Marian.

Para descargar una máquina virtual se puede utilizar la instrucción wget, por ejemplo si queremos descargar el
motor http://lpg.uoc.edu/MTUOC/MTUOC-00-generic-S2SSPGA-eng-cat.zip podemos escribir:

wget http://lpg.uoc.edu/MTUOC/MTUOC-00-generic-S2SSPGA-eng-cat.zip

Y se inicia la descarga:

Page 1 / 3 - last modified by Antoni Oliver on 2020/10/08 11:27


Micro-Mooc Integración de traducción automàtica neuronal en proyectos de
traducción con MTUOC - Anexo 2. Instalación y configuración de servidores MTUOC

Una vez la descarga finalice podemos descomprimir la carpeta escribiendo:

unzip MTUOC-00-generic-S2SSPGA-eng-spa.zip 

Una vez descomprimida vamos a la carpeta que se ha generado:

cd MTUOC-00-generic-S2SSPGA-eng-spa

Y aquí podemos poner en marcha el motor, pararlo y configurarlo.

3. Configuración del servidor MTUOC


Toda la configuración del servidor se realiza mediante un archivo de configuración en formato yaml. Por defecto
este archivo se llama config-server.yaml, pero, como veremos más adelante, puede tener cualquier otro nombre.
Puedes editar el archvio config-server.yaml haciendo:

nano config-server.yaml

A continuación mostramos algunos fragmentos de este archivo y marcamos partes en negrita que
comentaremos más adelante.

MTUOCServer:
  verbose: True
  restore_tags: True
  #filename or None
port: 8000
  type: ModernMT
  #one of MTUOC, Moses, ModernMT, OpenNMT, NMTWizard
  MTengine: Marian
  startMTEngine: True
  #one of Marian, OpenNMT, Moses, ModernMT
  #one of True, False
  ONMT_url_root: "/translator"

Preprocess:
  #these are used by all engines except ModernMT
  type: SentencePiece
  #one of SentencePiece NMT SMT custom
  #these are for all
  sl_lang: en
  tl_lang: es
  sl_tokenizer: MTUOC_tokenizer_eng
  tl_tokenizer: MTUOC_tokenizer_cat

Page 2 / 3 - last modified by Antoni Oliver on 2020/10/08 11:27


Micro-Mooc Integración de traducción automàtica neuronal en proyectos de
traducción con MTUOC - Anexo 2. Instalación y configuración de servidores MTUOC

  #these are for sentencepiece


  sp_model_SL: spmodel.model
  sp_model_TL: spmodel.model
  #this are for NMT and SMT
  tcmodel: tc.en
  #this is for NMT
  bpecodes: codes_file
  joiner: "@@"
  bos_annotate: False
  eos_annotate: False
  #if no subwords used state None
MarianEngine:
ip: localhost 
port: 8080
  type: GPU
  model: model.npz
  vocab_sl: vocab-en.yml
  vocab_tl: vocab-ca.yml
  min_len_factor: 0.5

En la sección MTUOCServer podemos ver que el servidor se va poner en marcha en el puerto 8000 y es de
tipo ModernMT. Si quieres modificar estos parámetros símplemente tienes que editarlo. Para este ejercicio ponlo
en el puerto 8005 y de tipos Moses.

En la sección MarianEngine vemos que el servidor se pone en marcha en el mismo servidor (localhost) y en el
puerto 8080. Cambia el puerto a 8085. Como ves en el ejemplo el servidor se pondrá en marcha en modo GPU,
pero como que no disponemos de unidad GPU, tendremos que cambiarlo a CPU.

Una vez realizados estos cambios, podemos poner en marcha el servidor haciendo:

python3 MTUOC-server.py

Cuando finaliza la carga de los modelos y la puesta en marcha de los servidores. aparecerá el siguiente
mensaje:

En este momento el servidor ya estará disponible en la IP y puertos indicados.

Page 3 / 3 - last modified by Antoni Oliver on 2020/10/08 11:27

También podría gustarte