Está en la página 1de 6

Incubacin de dos sistemas de traduccin automtica espaol-quechua y espaol-aymara, basado en la plataforma de cdigo abierto apertium.

Resumen: En ste paper se presenta una alternativa de implementacin de traduccin automtica para pares de lenguas espaol-quechua y espaol-aymara basado en Apertium una plataforma de cdigo abierto. Las lenguas quechua y aymara son parientes pertenecientes a las lenguas aglutinantes que expresan conceptos y relaciones gramaticales mediante la adicin de sufijos esto permite trabajar de la misma manera en su anlisis morfolgico de estas lenguas, en cambio el idioma espaol es diferente al ser considerado como una lengua flexiva de tipo fusional. Apertium ha sido creado inicialmente para pares de lenguas emparentadas, sin embargo ha evolucionado para tratar con pares de lenguas ms divergentes como ingles-catalan. Por lo que en esta investigacin se pretende mostrar la viabilidad de crear sistemas de traduccin automtica con lenguas nativas que son aglutinantes y el espaol respectivamente, teniendo como anlisis los pares de lenguas en la traduccin espaol-quechua y espaol-aymara cada par como divergentes. Como experimento se incuba dos sistemas: El sistema de traduccin automtica del quechua y espaol (apertium-es-qve), y el sistema de traduccin automtica del espaol y aymara (apertium-es-qve), tambin se explica la reutilizacin de los datos lingsticos de pares de lenguas implementadas con esta plataforma para crear nuevos pares de lenguas. Abastract: In this paper presents an alternative implementation of automatic translation language pairs Spanish-Quechua and Spanish-Aymara based on "Apertium" open source platform. The Quechua and Aymara are relatives belongs to the agglutinative languages concepts and relationships expressing grammatical suffixes by adding this to work the same way in the morphological analysis of these languages, however the Spanish language is different to be considered as an inflected language fusional type. Apertium has been created initially for pairs of related languages, however, has evolved to deal with more divergent language pairs such as English-Catalan. So in this research is to show the feasibility of automatic translation systems are binders native languages and Spanish respectively, with the pairs analysis in translation languages Espaol-Quechua and Spanish-Aymara each pair as divergent. As an experiment incubated two systems: automatic translation system Spanish and Quechua (apertium-es-qve) and the automatic translation system Spanish and aymara (apertium-es-ayr) also explains the reuse of linguistic data pairs of languages implemented using this platform to create new language pairs. Palabras claves: Quechua, Aymara, Aimara, Apertium, plataforma de Traduccin Automtica, Traductor Automtico Basado en Reglas, Cdigo Abierto.

1.

Introduccin

En este mundo globalizado, de mltiples culturas e idiomas, los traductores automticos como aplicacin del procesamiento de lenguaje natural han aportado significativamente en la interaccin de culturas permitiendo al ser humano comprender e interrelacionarse con sus semejantes, mediante la traduccin de textos o habla de un lenguaje natural a otro. Sin embargo, dichos avances como los traductores automticos poco trascienden todava en las culturas Quechua y Aymara. Por lo que en este paper se describe cmo crear sistemas de traduccin automtica entre espaol-quechua y espaol-aymara, mostrando las etapas de la incubacin de los dos sistemas, as mismo la creacin de los diccionarios como su manipulacin de los datos lingsticos, compilacin de los mismos y la prueba de adaptabilidad mediante el anlisis morfolgico. Est organizado de la siguiente manera: en la seccin 2 Teora de dominio y trabajos previos, en la seccin 3 Ingeniera de traduccin por transferencia de Apertium, en la seccin 4 experimentos y resultados y en la seccin 5 Conclusiones y trabajos futuros.

raz, formando palabras largas cada sufijo tiene su valor formativo y semntico. Quechua, una lengua muy diferente de las lenguas asiticas [ANNETTE09]. 2.1.1 Quechua (QVE) Quechua recibe el cdigo QUE segn ISO 639-3 y SIL International (Summer Institute of Linguistics) es una macro lengua con una poblacin hablante de ms de 9'000,000 distribuidos en los pases Per, Argentina, Ecuador, Chile y Bolivia, es lengua co-oficial en Per. Quechua del Este de Apurmac con cdigo QVE lengua andina hablada por ms de 200,000 en la Regin Apurmac tomada esta variante para este experimento. La lengua quechua se alinea para las traducciones con las lenguas como el Espaol [ANNETTE12]. 2.1.2 Aymara (AYR) Aymara central con cdigo AYR, segn ISO 639-3 y SIL International, es una lengua andina hablada por 2'000,000 personas aproximadamente, recibe su nombre de la nacin colla y es co-oficial con el castellano en Per y Bolivia. La lengua aymara se extiende en Per en los departamentos de Puno, Moquegua, Tacna, Arequipa (migrantes) Lima (Yauyos, Tupe, Cachuy); en Bolivia en los departamentos de Oruro, La Paz, Potos, Cochabamba, Chuquisaca, Beni, Pando, Santa Cruz, y Tarija; en Chile se habla en las regiones de Tarapac y Antofagasta; en Argentina (migrantes en Jujuy, Salta) [UANC03].

2.
2.1.

Teora de dominio y trabajo previos


Lengua quechua, aymara y el idioma espaol

Ambas lenguas pertenecen al tipo aglutinante, donde las relaciones gramaticales se expresan mediante elementos formativos denominados sufijos que se aglutinan a una

2.1.3 Idioma Espaol (ES) Es una lengua flexiva de tipo fusionante, hablado en diferentes pases con 60'000,000 hablantes de acuerdo al SIL International, pertenece a las familias indoeuropeo, itlico y ibero-occidental, con cdigo ES de acuerdo ISO 639-1 y SPA de acuerdo ISO 639-3 segunda lengua del mundo por el nmero de personas que tienen como lengua materna. 2.2. Traduccin Automtica (TA) Es una aplicacin de Procesamiento de Lenguaje Natural, tambin considerada como rea de la lingstica computacional que investiga el uso de software para traducir texto o habla de un lenguaje natural a otro. El traductor automtico debe analizar el texto original, interrelacionar con la situacin referida y como resultado debe encontrar el texto correspondiente en el lenguaje destino [RUSE04 p. 965]. Modelo de traductores automticos
Traductor Automtico

El proceso de transferencia convierte esta ltima representacin (ligada an al idioma original) a una representacin al mismo nivel de abstraccin pero ligada al lenguaje objetivo. Estas dos representaciones son las llamadas normalizadas o intermedias. A partir de aqu el proceso se invierte: los componentes sintcticos generan una representacin del texto y finalmente se genera la traduccin, modelo usado por la plataforma de cdigo abierto Apertium.

3.

Ingeniera de traduccin de Apertium

Apertium es una plataforma de traduccin automtica de cdigo abierto desarrollado por el grupo Transducens de la Universitat d'Alacant Espaa, basado en reglas, cuya arquitectura usa transductores de estados finitos para el procesamiento lxico, modelos ocultos de Markov para la desambiguacin lxica y procesamiento de patrones basado en estados finitos para la transferencia estructural, actualmente esta plataforma de traduccin automtica ha permitido implementar y en poner en marcha a ms de 35 pares de lenguas como sistemas de traduccin automtica [TRNSDUCENS05] La plataforma proporciona: un ingenio de traduccin independiente de las lenguas, herramientas para gestionar los datos lingsticos necesarios para construir un sistema de traduccin automtica para un par de lenguas dado. Plataforma con siguientes componentes: lttoolbox, apertium, apertium-lex-tools, OpenFST, Foma, HFST3 y vislcg3 (www.apertium.org) Mdulos del sistema de traduccin automatica de Apertium
Texto origen Desformateador Analizador morfolgico Desambigador categorial Transferencia lxica Transferencia estructural

Basado en reglas

Basado en corpus

Directo Transferencia Interlinga

Estadstica Basados en ejemplos

Fuente: Martin Wolk Basada en reglas, realiza transformaciones a partir del texto del idioma original reemplazando palabras por su equivalente en el idioma objetivo de traduccin. En cambio la traduccin basada en datos o corpus, realiza anlisis de muestras reales en sus respectivas traducciones entre el par idiomas, mientras mayor cantidad de textos traducidos se tenga mejores resultados se obtiene. 2.2.1 Traductor automtico basada en reglas Establece tres enfoques principales: los enfoques directos, los de interlingua y los de transferencia (sintctica y semntica).
Intelingua
ne Ge in rac

Reformateador

Postgenerador

Generador morfolgico

lis is

Texto traducido

An

Transferencia

Directa Texto origina a traducir Texto traducido al idioma objetivo

Fuente: Arquitectura plataforma Apertium

modular

construido

por

la

Fuente: [DIAZSA] 2.2.2 Traduccin automtica por transferencia Modelo en la cual el texto original se analiza morfolgica y sintcticamente, obteniendo como resultado una representacin sintctica superficial. Esta representacin se transforma a continuacin en otra ms abstracta que hace especial nfasis en aspectos relevantes para el proceso de traduccin e ignora otro tipo de informacin.

3.1 El desformateador.- Encapsula las cadenas de texto en bloques de formato o superblancos poniendo delimitadores [ ] cada una de estas cadenas encapsuladas son tratadas como un blanco <b> </b>. Los tipos de de bloques o superblancos: bloques de formato o superblancos no vacos, bloques de formato con referencia a archivo externo o supperblancos extensos y bloques de formato vacos. 3.2. El analizador morfolgico Segmenta el texto en formas superficiales (FS) (las unidades lxicas tal como se presentan en los textos) y

entrega para cada FS una o mas formas lxicas (FL) consistentes en un lema (forma base usada en los diccionarios clsicos), la categora lxica (nombre, verbo, preposicin, etc.) y la informacin de flexin morfolgica (nmero, gnero, persona, tiempo, etc.). Las unidades lxicas de mas de una palabra (multipalabras) son tratadas como formas lxicas individuales y, segn su naturaleza, reciben un tratamiento especfico, al recibir como entrada el texto del mdulo anterior, el analizador morfolgico proporciona como salida el texto resultante. Donde cada forma superficial es analizada como una o mas formas lxicas. As, es analizada como una FS con lema ser, mientras que una recibe tres anlisis: lema un, determinante indefinido femenino singular; lema unir, verbo en presente de subjuntivo, 1a persona del singular, y lema unir, verbo en presente de subjuntivo, 3a persona del singular. Este mdulo se genera a partir de un diccionario morfolgico para la lengua origen (LO). En esta investigacin se utiliza HFST (Helsinki Finite-State Transducer Toolkit) tambin software de cdigo abierto como herramienta para anlisis morfolgico, desarrollado por Xerox finite-state, incluye LEXC lenguaje de alto nivel para especificar lexicones y TWOLC lenguaje de alto nivel para escribir reglas de fonologa y morfologas [KENNETH02]. 3.3. El desambiguador lxico categorial El desambiguador lxico categorial est basado en modelos ocultos de Markov de primer orden. Los estados del modelo de Markov representan categoras gramaticales y los observables son clases de ambigedad, esto es, conjuntos de categoras gramaticales, analiza una palabra ambigua de acuerdo con su contexto; por ejemplo la palabra ambigua forma superficial en quechua urqu en espaol tiene dos significados cerro como nombre y macho como indicador de gnero. El desambiguador proporciona a su salida etiquetas finas como las del analizador morfolgico, de hecho, en ocasiones, puede suceder que el analizador morfolgico entregue, para una palabra dada, dos o ms etiquetas finas que pueden agruparse bajo una misma categora: por ejemplo en espaol la palabra cante puede ser la 1a o la 3a persona del presente de subjuntivo del verbo cantar las dos etiquetas finas: verbo<vblex> primera persona<prs><p1> singular<sg> y verbo<vblex> tercerca persona<prs><p3> singular<sg>. 3.4 El mdulo transferencia lxica El mdulo de transferencia lxica, que gestiona un diccionario bilinge y es invocado por el mdulo de transferencia estructural, lee cada FL en LO y entrega la FL correspondiente en lengua meta (LM). El diccionario contiene un nico equivalente para cada forma lxica de la LO; esto significa que no se realiza ningn tipo de tratamiento de la polisemia, las multipalabras son traducidas como una unidad.
<l>t'anta</l><r>pan</r> <l>wasi</l><r>casa</r>

<l>hatun</l><r>grande</r> <l>musuq</l><r>nuevo</r>

3.5 El mdulo de transferencia estructural Detecta y trata patrones de palabras (sintagmas) que exigen un tratamiento especial por causa de las divergencias gramaticales entre las lenguas tales como: cambios de gnero, nmero, reordenamientos, cambios preposicionales etc. a) Chunker.- Identifica los segmentos, realiza la traduccin palabra por palabra, as como ciertas operaciones de reordenamiento y propagacin de informacin morfosintctica dentro del segmento (por ejemplo, para establecer la concordancia). Adems, crea los segmentos para que sean tratados por el mdulo siguiente. El chunker tiene la opcin de funcionar como nico mdulo en un sistema de transferencia sintctica superficial. Ello se controla mediante un atributo del elemento <transfer>. b) Interchunk.- Este mdulo recibe los segmentos construidos por el chunker y permite reordenarlos, modificar la informacin sintctica asociada a cada segmento y, finalmente, imprimir los segmentos en el orden nuevo y con las caractersticas nuevas en la salida, creando segmentos nuevos si es necesario. c) Postchunk.- Este mdulo recibe los segmentos modificados por el interchunk y realiza tareas finales de modificacin de las palabras contenidas en cada segmento y de impresin del texto contenido en los segmentos en el formato que acepta el generador. El objetivo de este mdulo es permitir la manipulacin y la relacin de patrones de patrones de palabras, se pretende que haya un tratamiento ms adecuado de todas las transformaciones que se requieren para traducir de una lengua a otra. 3.6 El generador morfolgico Genera a partir de la forma lxica en lengua meta una forma superficial flexionada adecuadamente. El resultado para la frase de ejemplo sera: wasiyki: wasi<n><px2sg><nom> wasiykiman: wasi<n><px2sg><dat> 3.7 El portgenerador Realiza algunas operaciones ortogrficas en LM tales como contracciones y apostrofaciones, y que es generado a partir de un archivo de reglas de transformacin con un formato similar al de los diccionarios anteriores. 3.8 El reformateador Reintegra la informacin de formato original al texto traducido similar al mdulo desformateador

4.

Experimentos y Resultados

4.1. Incubacin de los sistemas de traduccin 4.1.1 Creacin de diccionarios monolinges.especificando en el archivo.lexc compatible con HFST para cada lengua.

Diccionario monolinge QVE apertium-es-qve.lexc

Diccionario monolinge AYR Significado apertium-es-ayr.lexc

izquierda la transferencia de la lengua quechua al idioma espaol.


Diccionario bilinge espaol-quechua apertium-es-qve-es-dix <sdefs> <sdef n="n" c="Nombre"/> <sdef n="adj" c="Adjetivo"/> <sdef n="prn"c="Prnombre"> <sdef n="adv" c="Adverbio/> <sdef n="vblex" c="Verbo"/> <sdef n="sg" c="Singular"/> <sdef n="pl" c="Plural"/> <section id="NOMBRES"> <l>t'anta</l><r>pan</r> <l>wasi</l><r>casa</r> <section id="ADJETIVOS"> <l>hatun</l><r>grande</r> <l>musuq</l><r>nuevo</r> Diccionario bilinge espaol-aymara apertium-es-ayr-es-dix <sdefs> <sdef n="n" c="Nombre"/> <sdef n="adj" c="Adjetivo"/> <sdef n="prn" c="Prnombre"/> <sdef n="adv" c="Adverbio/> <sdef n="vblex" c="Verbo"/> <sdef n="sg" c="Singular"/> <sdef n="pl" c="Plural"/> <section id="NOMBRES"> <l>t'anta</l><r>pan</r> <l>uta</l><r>casa</r> <section id="ADJETIVOS"> <l>jach'a</l><r>grande</r> <l>machaqa<l><r>nuevo</r>

Definicin de smbolos (categoras gramaticales) %<n%> %<adj%> %<prnp%> %<adv%> %<vblex%> %<m%> %<sg%> %<pl%> otros Nombres ; Adjetivos ; PrnPersonales ; Adverbios ; Verbos ; otros Lexicon Plural %<pl%>:%>kuna N-FLEX-Incl ; LEXICON Caso %<acc%>:%>ta %<abl%>:%>manta LEXICON Posv %<px1sg%>:y Otros Lexicon Nombres wasi:wasi N ; t%'anta:t%'anta N ; Lexicon Adjetivos hatun:hatun ADJ; musuq:musuq ADJ; Lexicon PrnPerson nuqa:nuqa PRNP; Lexicon Advervio may:may ADV; Lexicon verbos mikhuy:mikhu V; munay:muna V; otros %<n%> %<adj%> %<prnp%> %<adv%> %<vblex%> %<m%> %<sg%> %<pl%> otros Nombres ; Adjetivos ; PrnPersonales; Adverbios ; Verbos ; otros Lexicon Plural %<pl%>:%>naka N-FLEX-Incl ; LEXICON Caso %<acc%>:%>ru %<abl%>:%>ta LEXICON Posv %<px1sg%>:na Otros Lexicon Nombres uta:uta N ; t%'anta:t%'anta N ; LexiconAdjetivos jach'a:jach'a ADJ machaqa:machaqa LexiconPrnPerson naya:naya PRNP; Lexicon Advervio kawkina:kawkin Lexicon verbos manq'ana:manq'a munaa:muna V otros ! nombre ! adjetivo ! pronombre ! advervio ! verbo ! masculino ! singular ! plural !Nombres !Adjetivos !PronombresP !Adverbios !Verbos ! plural s ! acusativo a ! ablativo (desde, de) ! posesivo 1ra persn singular ... Significado !casa !pan !grande !nuevo !yo !dnde !comer !querer ...

Definicin de smbolos (categoras gramaticales)

Lexicon root (secciones del diccionario)

Traduccin de races por secciones

Morfologa (aglutinaciones mediante sufijos)

Lexicon PrnPerson <l>nuqa</l><r>yo</r> Lexicon Advervio


<l>may</l><r>dnde</r>

Lexicon PrnPerson
<l>naya</l><r>yo</r>

Lexicon Advervio
<l>kawkina</l><r>dnde</r>

Lexicon verbos

Lexicon verbos

<l>mikhuy</l><r>comer</r> <l>manq'aa</l><r>comer</r> <l>munay</l><r>querer</r> <l>munaa</l><r>querer</r>

4.1.3 Explicacin de otros datos lingsticos del par de lenguas espaol-quechua mediante ficheros apertium-es-qve.qve.twol.- Reglas de morfologa compatible con HFST. apertium-es-qve.qve-es.rlx.- Reglas de desambiguacin al diccionario monolinge del quechua, basado en VISLG3. Apertium-es-qve-es.tsx.- Reglas de desambiguacin al diccionario monolinge espaol con apertium-lextools apertium-es-qve.qve-es.lrx.- Reglas de desamgiguacin al diccionario bilinge del par espaol-quechua. Apertium-es-qve-qve-es.t1x.- Reglas de transferencia estructural chunker del quechua hacia espaol. Apertium-es-qve-qve-es.t2x.- Reglas de transferencia estructural interchunk del quechua hacia espaol. Apertium-es-qve-qve-es.t3x.- Reglas de transferencia estructural postchunk del quechua hacia espaol. Apertium-es-qve-es-qve.t1x.- Reglas de transferencia estructural chunker del espaol hacia quechua. Apertium-es-qve-qve-es.t2x.- Reglas de transferencia estructural interchunk del espaol hacia quechua. Apertium-es-qve-qve-es.t3x.- Reglas de transferencia estructural postchunk del espaol hacia quechua. 4.1.4 Explicacin de otros datos lingsticos del par de lenguas espaol-aymara mediante ficheros apertium-es-ayr.ayr.twol.Reglas de morfologa compatible con HFST. apertium-es-ayr.ayr-es.rlx.- Reglas de desambiguacin al diccionario monolinge aymara, basado en VISLG3. Apertium-es-ayr-es.tsx.- Reglas de desambiguacin al diccionario monolinge espaol con apertium-lextools.

Fijando lexicones definidos en root

El diccionario monolinge espaol apertium-es-qve-es.dix se reutiliza de otro par de lenguas que sea estable y en funcionamiento, en este caso se ha tomado del par ingles-espaol. 4.1.2 Diccionarios bilinges.- Se asigna cada forma (palabra raz) lxica de la Lengua origen que corresponde a cada forma lxica de la Lengua meta, de cada diccionario bilinge se obtienen dos productos segn el sentido en el que el sistema los lea: ledos de izquierda a derecha se obtiene el mdulo de transferencia lxica del idioma espaol a la lengua quechua, y ledos de derecha a

apertium-es-ayr.ayr-es.lrx.- Reglas de desamgiguacin al diccionario bilinge del par espaol-aymara. Apertium-es-ayr-ayr-es.t1x.- Reglas de transferencia estructural chunker del aymara hacia espaol. Apertium-es-ayr-ayr-es.t2x.- Reglas de transferencia estructural interchunk del aymara hacia espaol. Apertium-es-ayr-ayr-es.t3x.- Reglas de transferencia estructural postchunk del aymara hacia espaol. Apertium-es-ayr-es-ayr.t1x.- Reglas de transferencia estructural chunker del espaol hacia aymara. Apertium-es-ayr-ayr-es.t2x.- Reglas de transferencia estructural interchunk del espaol hacia aymara. Apertium-es-ayr-ayr-es.t3x.- Reglas de transferencia estructural postchunk del espaol hacia aymara. 4.1.5 Compilacin del sistema TA apertium-es-qve Compilando el diccionario morfolgico espaol #lt-comp lr apertium-es-qve.es.dix es-qve.automorf.bin Dando formato con foma a apertium-es-qve.qve.lexc #hfst-lexc --format foma \ apertium-es-qve.qve.lexc qve.lexc.hfst Formato foma para apertium-es-qve.qve.twol #hfst-twolc --format foma apertium-es-qve.qve.twol -o\ qve.twol.hfst Composicin lexc y twol #hfst-compose-intersect -1 qve.lexc.hfst -2 qve.twol.hfst\ -o qve.hfst Compilando diccionario morfolgico quechua #hfst-invert qve.hfst | hfst-fst2fst -O -o\ qve-es.automorf.hfst Compilando diccionario bilinge espaol-quechua #lt-comp rl apertium-es-qve.es-qve.dix es-qve.autobil.bin Compilando diccionario bilinge quechua-espaol #lt-comp lr apertium-es-qve.es-qve.dix qve-es.autobil.bin Compilando diccionario de auto-generacin es-qve #hfst-fst2fst -O qve.hfst -o es-qve.autogen.hfst Compilando diccionario de auto-generacin qve-es #lt-comp rl apertium-es-qve.es.dix qve-es.autogen.bin Compilando reglas de desambiguacin al diccionario monolinge quechua #cg-comp apertium-es-qve.es-qve.rlx es-qve.rlx.bin Compilando reglas de transferencia estructural es-qve #apertium-preprocess-transfer\ apertium-es-qve.es-qve.t1x es-qve.t1x.bin #apertium-preprocess-transfer\ apertium-es-qve.es-qve.t2x es-qve.t2x.bin #apertium-preprocess-transfer\ apertium-es-qve.es-qve.t3x es-qve.t3x.bin Compilando reglas de transferencia estructural qve-es #apertium-preprocess-transfer\ apertium-es-qve.qve-es.t1x qve-es.t1x.bin #apertium-preprocess-transfer\ apertium-es-qve.qve-es.t2x qve-es.t2x.bin #apertium-preprocess-transfer\ apertium-es-qve.qve-es.t3x qve-es.t3x.bin 4.1.6 Compilacin del sistema TA apertium-es-ayr Compilando el diccionario morfolgico espaol #lt-comp lr apertium-es-qve.es.dix es-qve.automorf.bin Dando formato con foma a apertium-es-qve.qve.lexc #hfst-lexc --format foma \

apertium-es-qve.qve.lexc qve.lexc.hfst Formato foma para apertium-es-qve.qve.twol #hfst-twolc --format foma apertium-es-qve.qve.twol -o\ qve.twol.hfst Composicin lexc y twol #hfst-compose-intersect -1 qve.lexc.hfst -2 qve.twol.hfst\ -o qve.hfst Compilando diccionario morfolgico quechua #hfst-invert qve.hfst | hfst-fst2fst -O -o\ qve-es.automorf.hfst Compilando diccionario bilinge espaol-quechua #lt-comp rl apertium-es-qve.es-qve.dix es-qve.autobil.bin Compilando diccionario bilinge quechua-espaol #lt-comp lr apertium-es-qve.es-qve.dix qve-es.autobil.bin Compilando diccionario de auto-generacin es-qve #hfst-fst2fst -O qve.hfst -o es-qve.autogen.hfst Compilando diccionario de auto-generacin qve-es #lt-comp rl apertium-es-qve.es.dix qve-es.autogen.bin Compilando reglas de desambiguacin al diccionario monolinge quechua #cg-comp apertium-es-qve.es-qve.rlx es-qve.rlx.bin Compilando reglas de transferencia estructural es-qve #apertium-preprocess-transfer\ apertium-es-qve.es-qve.t1x es-qve.t1x.bin #apertium-preprocess-transfer\ apertium-es-qve.es-qve.t2x es-qve.t2x.bin #apertium-preprocess-transfer\ apertium-es-qve.es-qve.t3x es-qve.t3x.bin Compilando reglas de transferencia estructural qve-es #apertium-preprocess-transfer\ apertium-es-qve.qve-es.t1x qve-es.t1x.bin #apertium-preprocess-transfer\ apertium-es-qve.qve-es.t2x qve-es.t2x.bin #apertium-preprocess-transfer\ apertium-es-qve.qve-es.t3x qve-es.t3x.bin 4.2. Resultados del experimento 4.2.1 Anlisis morfolgico de quechua #echo "wasi" | hfst-lookup qve-es.automorf.hfst wasi: wasi<n><nom> # echo "wasiyki" | hfst-lookup qve-es.automorf.hfst wasiyki: wasi<n><px2sg><nom> # echo "wasiykiman" | hfst-lookup qve-es.automorf.hfst wasiykiman: wasi<n><px2sg><dat> # echo "wasiykimanta" | hfst-lookup qve-es.automorf.hfst wasiykimanta: wasi<n><px2sg><abl> # echo "wasiykikunamanta" \ | hfst-lookup qve-es.automorf.hfst wasiykikunamanta: wasi<n><px2sg><pl><abl> 4.2.2 Anlisis morfolgico de aymara #echo "uta" | hfst-lookup qve-es.automorf.hfst uta : uta<n><nom> # echo "utama" | hfst-lookup qve-es.automorf.hfst utama: uta<n><px2sg><nom> # echo "utamaru" | hfst-lookup qve-es.automorf.hfst utamaru: uta<n><px2sg><dat> # echo "utamatwa" | hfst-lookup qve-es.automorf.hfst utamatwa: uta<n><px2sg><abl> # echo "utanakamatwa" \ | hfst-lookup qve-es.automorf.hfst

utanakamatwa uta<n><px2sg><pl><abl> 4.2.3 Traduccin de algunas palabras Traduciendo quechua a espaol #echo "wasi" | apertium -d . qve-es casa #echo "wasiyki" | apertium -d . qve-es tu casa #echo "wasiykiman" | apertium -d . qve-es a tu casa #echo "wasiykimanta" | apertium -d . qve-es de tu casa #echo "wasiykikunamanta" | apertium -d . qve-es de tus casas #echo "musuq wasiyki" | apertium -d . qve-es tu casa nueva 4.2.4 Traduciendo espaol a quechua # echo "casa" | apertium -d . es-qve wasi # echo "esta casa" | apertium -d . es-qve kay wasi #echo "esta casa nueva" | apertium -d . es-qve kay wasi musuq 4.2.5 Traduciendo aymara a espaol #echo "uta" | apertium -d . qve-es casa #echo "utama" | apertium -d . qve-es tu casa #echo "utamaru" | apertium -d . qve-es a tu casa #echo "utamatwa" | apertium -d . qve-es de tu casa #echo "utananakamatwa" | apertium -d . qve-es de tus casas #echo "machaqa utama" | apertium -d . qve-es tu casa nueva 4.2.6 Traduciendo espaol a aymara # echo "casa" | apertium -d . es-qve uta # echo "esta casa" | apertium -d . es-qve ka uta #echo "esta casa nueva" | apertium -d . es-qve kay machaqa uta

apertium-es-qve y apertium-es-ayr son funcionales y se ajustan a la plataforma de cdigo abierto Apertium, an cuando son divergentes los pares entre los tipos flexiva-fusionante (espaol) y aglutinantes (quechua y aymara), esto ha sido factible mostrando su anlisis morfolgico con las herramientas de HFST. 5.2. Trabajos futuros Implementar los diccionarios monolinges, diccionarios bilinges, reglas de desambiguacin y reglas de transferencia estructural para cada sistema de traduccin incubado apertium-es-qve y apertium-es-ayr la cual permitira poner en marcha los dos sistemas de traduccin automtica. Crear otros sistemas de Traduccin reutilizando datos lingsticos existentes, estos nuevos pares ms cercanos podran ser espaol-quechuaAyacucho, espaol-quechuaHuanca otros. Se podra experimentar sistemas de traduccin automtica para pares parentadas como quechua-aymara. Crear sistemas de traduccin automtica para con otros pares de lenguas nativas de latinoamrica. Referencias bibliogrficas [ANNETTE12] Annete Rios, Martin Wokl. Parallel Treebanking Spanish-Quechua.2012, Linguistic Issues in Language Technology LiLT. [ANNETTE09] Annete Rios, Martin Wokl. A Quechua-Spanish Parallel Treebank. 2009. University of Zurich Zurich Open Repository and Archive. [CERR00] CERRN PALOMINO, Rodolfo. Lingstica Aimara. Lima, 2000. [DIAZSA07] Daz de Ilarraza, A. Mayor and K. Sarasola. Reutilizacin de recursos lingsticos en la construccin de un sistema de TA ingls-euskara.2007 [LAYME] LAYME PAIRUMANI Felix,. Diccionario Biling: Aymara Castellano. Tercera Edicin. Bolivia Consejo Educativo Aymara (CEA) 2004. [KENNETH02] Kenneth R. Beesly y Lauri Karttunen. Finite-State Morphology Xerox Tools and Techniques. 2002. [RUSE04] RUSELL, Stuart y NORVIG, Meter. Inteligencia Artificial un enfoque moderno. Segunda Edicin. Madrid. Pearson Educacin S.A. 2004. [TRNSDUCENS05] Group Transducens Department de Llenguatges i Sistemes Informtics Universidad d'Alacant. Apertium, una Plataforma de Cdigo Abierto Para el Desarrollo de Sistemas de Traduccin Automtica. [UANC03] UANCV (Universidad Andina Nstor Cceres Velsquez). Morfologa Contrastiva Quechua/Aymara/Castellano. Escuela de Postgrado de la, Segunda Especializacin en Educacin Bilinge Intercultural. Per: Juliaca. 2003.

5.

Conclusiones y trabajos futuros

5.1 Conclusiones Mediante la investigacin se ha explorado la ingeniera de traduccin automtica de Apertium, permitiendo incubar dos sistemas apertium-es-qve y apertium-es-ayr, la creacin y manipulacin de los datos lingsticos son sencillos, su compilacin son secuencias del shell de linux manejables. Los sistemas de traductor automtico

También podría gustarte