Está en la página 1de 3

ETAPAS DEL PROCESO LEXICOGRÁFICO DIGITAL

1.3. Herramientas informáticas

-Sobre el formato
Lo primero que debe tenerse en cuenta es que el formato estándar para la creación de
diccionarios es, sin lugar a dudas, el XML. No obstante, aun no existe un estándar para
el DTD1 lo suficientemente generalizado.
En el apartado de "estándares", se reseñan tres estándares: LMF, OLIF y XDXF.
Seguramente habrá otros más, pero menos utilizados.
Desde un punto de vista teórico, el estándar más robusto es el LMF, pero no cuenta con
software que le dé respaldo. En este sentido, le lleva ventaja OLIF y sobre todo el XDXF,
que tiene muchos diccionarios, pero algunos de ellos de calidad muy baja.
Así pues, el diccionario que nos propongamos llevar a cabo tendrá una estructura XML
con DTD que dependerá más bien del programa informático con que se confeccione o, si
este no la proporciona, un DTD propio.

-Sobre el software (DE ESTO VA LA PRÁCTICA)


El mejor programa para crear un diccionario a partir de cero es TshwaneLex. El principal
problema es el costo.
En este sentido, si no se obtienen fondos, deberá utilizarse LexiquePro, que es la segunda
opción. Su principal ventaja es que permite la exportación de los datos tanto en papel
como en HTML. Es decir, permite generar el diccionario en los dos formatos que se ha
propuesto la investigación.
El uso de otras herramientas como Toolbox, FLEx o WeSay se descarta precisamente
porque luego habría que importar los datos a LexiquePro para generar el diccionario.
Toolbox además no trabaja con XML. En este sentido es mejor FLEx, pero esta potente
herramienta es útil si el diccionario se generara a partir de texto.
Dado el éxito que está teniendo la computación en la nube, habría que agregar que existen
ya dos sistemas que permiten el trabajo en línea: Lexus y Mātāpuna. La principal ventaja

1
Una Definición de Tipo de Documento: es una descripción de estructura y sintaxis de
un documento XML o SGML.
de ambos sistemas es que permiten el trabajo colaborativo, característica que también
encontremos en WeSay, que no corre en línea.
No obstante, utilizar dichos sistemas implica asociarse a un modelo de trabajo en
particular y, además, perder el resguardo de los datos obtenidos. Por lo tanto, no parecen
ser una buena opción de momento.
WOLF es el que vamos a tratar en la práctica.

1.4. Procedimientos
La lista de palabras puede obtenerse mediante cuatro procedimientos:

 Traducción de una lista de palabras de la lengua franca, en este caso el español, a la


lengua indígena. Este tipo de técnica no es muy aconsejable, sobre todo porque las
listas de palabras basadas en lenguas europeas no representan la realidad cultural de
los pueblos indígenas, prueba de ello es que muchas palabras del “vocabulario básico”
no tiene un equivalente en la lengua indígena.
 Educción (elicitation) de palabras de informantes indígenas. En estos casos, el
informante indígena elabora un conjunto de las palabras de acuerdo con su
competencia lingüística. Normalmente, esta técnica opera a través del uso de
dominios semánticos como los colores, los vegetales, etc.
 Extracción de listas de palabras de un determinado corpus. La principal ventaja de
esta técnica es que provee palabras en su contexto natural, pero tiene el problema de
abarcar solo una parte muy pequeña del léxico de una lengua.
 Observación participante. En este caso, se obtiene las palabras escuchando a los
hablantes en situaciones que normalmente están fuera de control del investigador. Es
muy útil para recoger expresiones momentáneas.

1.5. Elaboración del diccionario

Después de realizar el trabajo de recolección, revisión y sistematización de la


información, se conformará un corpus lingüístico mediante una base de datos electrónica
organizada mediante una plantilla XML.
Un corpus electrónico proporciona al lingüista la posibilidad de identificar y detallar
aquello qué es útil para la investigación. Dado que todos los archivos en formato digital
son modificables y de fácil manejo, se podrá actualizar, siempre que sea necesario, el
significado de las entradas léxicas o terminológicas.
Luego, por medio de una XSLT u "hoja de estilo" se puede generar un diccionario en
doble formato, es decir, tanto en papel como en soporte electrónico.
En el caso de que el formato sea electrónico, el XSLT permitirá transformar los datos a
HTML. Claro está, si se desea tener la opción de "búsqueda", deberá escribirse una
aplicación para tal efecto.
Si en cambio lo que se desea es un diccionario en papel, a través de un documento XSL-
FO puede generarse un RTF o un PDF.

1.6. Presentación del diccionario


Obviamente, la investigación culminará con la publicación del diccionario. Una vez que
se cuente con este texto, deben realizarse diferentes talleres con el público destinatario
con el fin de socializar el producto final. Además, debe procurarse diseñar estrategias
didácticas de uso del diccionario y probarlas en las escuelas indígenas con el fin de
determinar su efectividad.
Esta fase, que es sumamente importante, suele obviarse.

También podría gustarte