Está en la página 1de 9

El Archivo de lenguas de la ENAH (ARLENAH): antecedentes, repositorio digital y

documentación.

Por Edgar Uriel Domínguez, Karyn Galland y Octavio González Guadarrama1

Para diversas disciplinas clásicas, como la lingüística, la etnología y la historia, al igual que
fronterizas, tales la sociolingüística, la etnomusicología y las etnociencias en general, un acervo
de lenguas proporciona una base documental para numerosos estudios en torno a las sociedades
y culturas étnicas. Podemos mencionar, sólo a título de ejemplo, desde la lingüística comparada y
la tipología, hasta la fonología, la morfología y sintáctica de las lenguas, pasando por los análisis
de contacto entre culturas y lenguas y los estudios sobre mitología y rituales, o bien adquisición de
lenguaje. Además de apuntar hacia un necesario conocimiento multidisciplinario, los registros de
la oralidad en el difícil e inseguro contexto actual de las investigaciones antropológicas se han
vuelto aún de mayor importancia. Crear un archivo de lenguas contribuye así, en lo general, al
reconocimiento de las distintas fuentes, escritas y orales, de las ciencias antropológicas.

Antecedentes

En años anteriores, se había buscado ya recuperar una función social del Instituto Nacional de
Antropología e Historia (INAH), a saber de la protección, cuidado y difusión del patrimonio cultural
intangible y particularmente de las lenguas nativas nacionales. Es así como se conformó, con
varios lingüistas que participaban activamente en el Instituto Nacional de Lenguas Indígenas
(INALI), el Cuerpo Académico de Documentación Lingüística. Éste impulsó, a su vez, la formación
del Laboratorio de Lingüística y el proyecto de Documentación de Lenguas Nacionales cuya labor
fundamental ha sido apoyar la formación y vinculación de los estudiantes de la Escuela Nacional
de Antropología e Historia (ENAH) en esta tarea. A pesar de incluir entre sus objetivos principales,
acrecentar el archivo de lenguas del laboratorio, no se contaba en realidad con los datos
necesarios para cumplir con tal propósito.

Como labor paralela aunque desvinculada cabe mencionar, igualmente, las tareas realizadas por
el Departamento de Lenguas de la escuela. Por otro lado, se han desarrollado, a lo largo de los
años en la ENAH distintas investigaciones vinculadas directa o indirectamente con las lenguas
nativas, dentro de las Líneas de investigación, materias obligatorias y optativas, y en particular los
Proyectos de Investigación Formativa (PIF) que se imparten. En estos últimos, que llegan a
trabajar en diferentes regiones multiculturales del país e incluso de América Latina, se recoelctan
ricos materiales etnográficos, históricos y lingüísticos. Se han producido así materiales dentro de

1
Escuela Nacional de Antropología e Historia, México D.F. edgar_uriel84@yahoo.com.mx, karyngalland@gmail.com,
octa.loons@gmail.com
los campos de la antropología y la literatura, la medicina tradicional, las ritualidades, el
pensamiento simbólico, el discurso y la semiótica de la cultura, la tradición oral, las escrituras
antiguas en relación con los pueblos indios en la Nueva España, las instituciones, los archivos
históricos en México, la cosmovisión, la escritura y la imagen de Mesoamérica, entre otros. A
estos antecedentes, es importante añadir las investigaciones lingüísticas realizadas dentro de los
Centros INAH.

Los estudios realizados en general en el seno de la ENAH y el INAH se han logrado gracias a los
esfuerzos individuales y colectivos de investigadores y estudiantes, sin contar sin embargo con
una política institucional sobre lenguas en cuanto a la recolección, compilación, resguardo y
accesibilidad de los datos, ni sobre el aprendizaje y enseñanza de estas lenguas para su uso
metodológico en el trabajo de campo en zonas con hablantes de lenguas nativas. Estaba claro
que todos los materiales producidos en ambas instituciones necesitaban de un espacio de
sistematización y apoyo.

Por otro lado, lingüistas y antropólogos han producido durante décadas grabaciones en idiomas
nativos usando los medios disponibles en el momento, desde las cintas magnéticas de doble
carrete de los cincuenta pasando por las pequeñas grabadoras de mini-discos hasta las digitales
de hoy. Estos materiales enfrentan evidentes problemas de acceso, además de los siempre
existentes riesgos de extravío o pérdida por incendio, inundación, etcétera. Por ello, al nivel
internacional, los procesos de digitalización y almacenamiento han sido fundamentales, ya que los
formatos digitales estándares son fáciles de utilizar y compatibles con programas comunes de
reproducción, análisis y copia de discursos y música.

A esta tarea emprendida en distintas latitudes, una institución como la ENAH tenía la obligación de
sumarse y quedaba como tarea importante, por estar involucrada en todas sus disciplinas con
hablantes de lenguas nativas, la creación de un archivo de lenguas que beneficiaría a los
profesores, investigadores, estudiantes, hablantes y cualquier persona interesada en la consulta
de los materiales disponibles; sin hablar de los aportes para la institución. En efecto, al brindar
seguridad sobre los datos, su accesibilidad con base en una ética clara y la consulta con fines de
investigación, enseñanza y difusión cultural, se desdibujaba con ello una estrategia para cumplir
con las normas de prácticas de campo, que solicitan a los profesores y estudiantes entregar copia
de todos los productos derivados de la investigación realizada en prácticas de campo, de manera
que se puedan utilizar para fines académicos y culturales.
El proyecto del Archivo de Lenguas de la ENAH

Es así cómo, a inicios del año 2012, se presentó ante el INAH un proyecto de creación de un
Archivo de Lenguas de la ENAH (ARLENAH), con los siguientes objetivos generales: proporcionar
una plataforma que organizara, sistematizara y acumulara información sobre lenguas, para
ponerlas a disposición de estudiantes, investigadores y público en general, y como herramienta de
custodia, difusión e investigación de los materiales socio-lingüísticos que producen en las
diferentes regiones lingüísticas en donde realizan sus actividades. Finalmente, fomentar que la
ENAH, como escuela nacional, pudiera ofrecer a las diferentes comunidades lingüísticas
interesadas, una herramienta eficiente y que diera certeza a los depositantes sobre la seguridad y
buen uso de los datos.

Se planteó, precisamente, crear un archivo de las lenguas nativas en México para preservar y
garantizar la conservación a largo plazo de los archivos de audio y video en o sobre lenguas
nativas de México; garantizar la accesibilidad y consulta de los datos para un uso social y
académico ético; y vincular el archivo con otros a nivel nacional e internacional. En segundo lugar,
se programó delimitar una política de accesibilidad de los datos de los hablantes de lenguas
nativas, sus comunidades y los investigadores y estudiantes que las recolectan, en primer lugar
generando una política clara para los depositantes de archivos en lenguas nativas y, en segundo
lugar, fomentando una vinculación administrativa y académica entre los distintos sectores de la
institución. En tercer lugar, se asentó delinear una política lingüística sobre lenguas nativas en
México en tanto Escuela Nacional de Antropología e Historia al definir una postura institucional en
torno a esta política lingüística, participar en una discusión con otras instituciones nacionales al
respecto y dar una base de discusión y acción para proyectos políticos y sociales. Finalmente, se
propuso generar espacios de enseñanza-aprendizaje de las lenguas nativas en la ENAH para los
estudiantes, investigadores y profesores que realizan su investigación en zona de hablantes de
lenguas nativas, que requieren de su conocimiento para estrategias comunicativas, llevan a cabo
un análisis de alguna o varias lenguas nativas y poseen como lengua materna una lengua nativa.

Con base en lo anterior, se determinaron cuatro fases del proyecto. La primera, que se lleva a
cabo desde el año 2012, ha consistido en elaborar una normatividad institucional de la política de
accesibilidad y derechos de autoría de los datos lingüísticos para los hablantes de las lenguas,
sus comunidades y los investigadores, con reglas y pautas claras para la producción y entrega de
materiales. La discusión académica y técnica compleja con otras instituciones que se ha abierto,
sin contar con la cuestión administrativa, conlleva que aún no se ha concluido esta etapa. Sin
embargo, de ello derivó la creación en julio del 2012 de la Red de Archivos de Lenguas México
(RALMEX) que nos reúne en esta publicación. En esta misma fase, se terminó el diagnóstico
documental de los materiales de la escuela, con su compilación y digitalización. Por último, se
buscó crear la plataforma web en donde se pudieran subir estos archivos digitalizados en el
Laboratorio de Lingüística y al conseguir finalmente un servidor propio de la institución en el
primer semestre del año 2013, se dio un fuerte impulso a la creación del repositorio digital que se
describe a continuación.2

Repositorio digita3

El Archivo de Lenguas de la ENAH (ARLENAH) debe proporcionar una plataforma en forma de


repositorio digital, es decir, conjunto de servicios de Internet centralizados (Hardware y Software),
creados para organizar, gestionar, preservar y ofrecer acceso libre a los datos. Actualmente, el
Software Libre aporta las principales soluciones para la implementación de un repositorio digital.
Estas herramientas han surgido en entornos corporativos y proyectos de investigación con
financiamiento de instituciones públicas y privadas. Además cuentan con equipos de desarrollo de
software estables.

En el proyecto ARLENAH se decidió evaluar una serie de funciones para poder elegir y usar una
de estas plataformas libres, las funciones fueron:
 Contener documentos en distintos formatos de audio, video y texto.
 Ingresar metadatos personalizados.
 Proporcionar seguridad para el contenido.
 Soportar un proceso estándar de:
 Depósito.
 Revisión.
 Publicación.
 Preservación.
 Búsqueda.
 Navegación.

Una vez verificadas estas funciones y adicionando características como la documentación de la


plataforma y las actualizaciones disponibles de la misma, así como la compatibilidad con el
hardware disponible para el proyecto se eligió Dspace, un software de código abierto que
proporciona organización para capturar y describir material digital usando módulos de envío con
una variedad de opciones. El sistema permite distribuir informaciones vía web de manera que

2
A lo largo del proceso se sumó a nuestra labor el Laboratorio de Análisis y Documentación Lingüística de la
Dirección de Lingüística del INAH (LADLI-DL). Como se presenta un artículo al respecto en esta compilación, no
ahondaremos más aquí sobre el mismo.
3 La información de este apartado proviene de: http://www.ru.tic.unam.mx:8080/bitstream/DGTIC/81872/1/ Manual%
20DSpace%20r.pdf.
puedan ser recuperadas mediante búsquedas, así como almacenar y preservar objetos digitales
por periodos largos de tiempo.

DSpace ha sido instalado y está siendo utilizado en más de 800 instituciones a lo largo y ancho
del mundo, según la web oficial4. La primera versión de DSpace fue liberada en noviembre de
2002, siguiendo un esfuerzo conjunto por los desarrolladores del MIT y HP Laboratorios en
Cambridge, Massachusetts.

Después de una implementación inicial donde se documentó la instalación de sistema efectivo


para ARLENAH, la tarea principal ha sido entender las relaciones entre las entidades
predeterminadas que Dspace ofrece para la creación de repositorios digitales (ver Diagrama p.6).
Dspace distingue varios tipos de entidades que son representados como objetos en una base de
datos. Estos objetos pueden describirse como entidades independientes con propiedades
específicas y que representan:

 Bitstream: un archivo específico subido al sistema DSpace.


 Bundle: un grupo de archivos que componen un paquete.
 Item: un Bundle acompañado de metadatos. Estos metadatos hacen posible la
organización y búsqueda de recursos.
 Colección: grupos de Items relacionados.
 Comunidad: un grupo de colecciones que comparte un tema en común. Típicamente
corresponde a una investigación, laboratorio o grupo de trabajo.
 E-person: los usuarios con diferentes roles en Dspace.

Cada uno de estos elementos es identificado con una clave o ID que Dspace asigna para
organizar su estructura interna. En realidad, este ID no siempre es útil para el usuario final, sin
embargo sí lo es para el administrador y las tareas que éste realiza en el sistema. Para el
funcionamiento de ARLENAH algunas, de estas entidades tienen funciones particulares y recibirán
nombres especiales:

 Comunidad: estará formada por un grupo de investigadores que trabajan en un proyecto


específico. La comunidad lleva el nombre del proyecto o del trabajo del investigador. La
comunidad puede tener sub-comunidades que funcionan igual que las comunidades pero
que se utilizan cuando se requiere definir una extensión o especialización de la comunidad
mayor (León Betanzos).

4 http://registry.duraspace.org/registry/dspace
 Colección: en el caso del ARLENAH las colecciones llevan el nombre de la lengua. Por lo
tanto si el proyecto abarca más de una lengua o diversas variedades de lenguas existirá
una colección por cada una de ellas. Una colección no puede contener otras colecciones y
debe estar contenida siempre dentro de una comunidad. Si la comunidad desaparece del
repositorio también lo hará la colección (León Betanzos).
 E-person: existirán tres grupos de usuarios con diferentes privilegios, a saber el
Administrador de comunidad, los Remitentes y los Visores. Un usuario puede pertenecer a
un grupo diferente por cada comunidad en la que esté asociado (León Betanzos).

Actualmente los miembros del proyecto están estableciendo las plantillas de metadatos
pertinentes que ayuden a facilitar el control sobre los recursos y, a su vez, brinden al usuario
información importante sobre el material que consultan. Algunos de estos metadatos serán
obligatorios y deberán ser proporcionados por los remitentes como requisito de publicación,
mientras otros tendrán carácter optativo. A su vez se está revisando el flujo de datos para la
validación y verificación de los ítems y bitstreams enviados por los remitentes. Este flujo de datos
incluye los permisos que los diferentes tipos de usuarios tienen sobre el uso de la información
disponible para consulta. Por último, pero no menos importante, es necesario personalizar la
imagen del repositorio para que sea intuitivo y fácil de usar para cualquier tipo de usuario, desde
el que no tiene experiencia en búsquedas sobre sitios especializados como ARLENAH hasta los
usuarios con amplia experiencia en Internet.

A lo largo de este trabajo, ARLENAH ha tomado en cuenta los problemas que han sido planteados
por las instituciones que tienen acervos lingüísticos digitales. En cuanto a su funcionamiento, cabe
resaltar tres cuestiones fundamentales: 1) ¿Quién provee el material al acervo? 2) ¿Quién usa o
consulta el acervo digital? Y 3) ¿Quién se encarga de la organización de la información digital?

Se debe resolver en primer lugar, con respecto de estas tres cuestiones, los roles que se
necesitan asignar a los diversos agentes. En este caso tomamos el nombre genérico de E-person
para cada uno. Aunque un acervo digital debe ser lo más neutro posible, en el sentido de que la
organización y estructura de la información que contiene sea de carácter universal y se acerque a
los estándares internacionales, es sabido que los distintos roles que ocupan una o varias E-person
“pueden generar expectativas encontradas” (Trilsbeek y Wittenburg 2007: 360).

Por otro lado, debemos tener en cuenta los problemas que subyacen a los objetos almacenados,
que serán denominados Bitstream y que representan archivos específicos subidos al sistema
DSpace a saber: 1) los objetos almacenados cambian; 2) permiten la acumulación de información;
3) y deben ser accesibles. (Trilsbeek y Wittenburg 2007:361)

Los problemas 1) y 2) se refieren al tipo de organización que se tendrá dentro del archivo, es decir,
si ARLENAH es un acervo abierto o un acervo cerrado. Por acervo abierto, se entenderá aquel
acervo que le permita a una E-person modificar algún Bitstream depositado en la plataforma y que
esta modificación tenga como consecuencia el aumento o disminución del tamaño del Bitstream.
Mientras que un acervo cerrado, conllevaría la imposibilidad de que cualquier E-person modifique
algún Bitstream depositado en el acervo lingüístico. Por el momento el ARLENAH sólo estará
funcionando como un acervo cerrado.

Un tercer problema concierne a las E-person que quieren depositar algún Bitstream asociado a
otro ya depositado, lo que dará entonces lugar a un Bundle, mismo que representa un grupo de
archivos que componen un paquete. Aquí el problema común que se plantea en la creación y
gestión de un acervo lingüístico, de las relaciones entre los recursos, está resuelto con la
categoría de Bundle. El siguiente cuadro nos permite ver qué relación existe entre una grabación y
una transcripción dentro del acervo5:

5
NHV = código de la lengua; ISO 001= número de depósito; R001= recurso dentro del Bundle; .mp3 = tipo de archivo
Finalmente, respecto de la conservación de los archivos a largo plazo, Trilsbeek y Wittenburg,
(2007: 371) señalan tres factores importantes: “1) utilizar, siempre que sea posible, una
representación de datos no comprimida y de alta calidad; 2) asegurar que los principios de
codificación sean sencillos y estén bien documentados; 3) procurar que el estándar de codificación
no esté patentado”.

Los retos de ARLENAH

Consolidado el repositorio digital y la normatividad de acceso correspondiente, el ARLENAH


deberá en su segunda fase, definir explícitamente, un modelo de política lingüística acorde con la
normatividad nacional e internacional en la materia. Esta política tenderá, por la naturaleza de la
institución, a dirigirse hacia el fortalecimiento, rescate, valoración, investigación, difusión y
desarrollo de las lenguas indígenas que la Ley de derechos lingüísticos de los pueblos indígenas
reconoce ya como lenguas nacionales. De esta forma, la ENAH podría posicionarse como un
espacio para construir una nueva política lingüística nacional.

Una tercera fase del proyecto se vincularía, idealmente, con el uso y difusión de los datos del
archivo, a saber la construcción de un método de enseñanza-aprendizaje de lenguas nativas en el
seno de la escuela en colaboración con la misma comunidad hablante, entre otras posibilidades.
Cabe señalar que por medio de las Tecnologías de la Información y la Comunicación (TIC) se
están desarrollando importantes modelos de enseñanza de lenguas.

La ENAH como institución garante de la protección del patrimonio cultural de la nación, podría
constituirse así, a largo plazo, en referente nacional sobre enseñanza y desarrollo de espacios
sociales y culturales que dignifiquen a las lenguas nacionales. Ya el futuro nos dirá cómo enfrentar
los obstáculos de índole político, económico, administrativo, entre muchos otros, que siempre
surgen en el camino y que realmente no son menores.

Fuentes de consulta
Himmelmann J. G., Mosel U., Haviland J. B., Bases de la documentación lingüística, México,
INALI, 2007.
León Betanzos, G.A., Manual para administración y uso de D-Space, sin referencia.
Trilsbeek P. y Wittenburg P., “Los acervos lingüísticos digitales y sus desafíos”, en Himmelmmann
et. al., 2007, p. 359-385.
http://tools.jiscinfonet.ac.uk/downloads/repositories/digital-repositories.pdf
http://dspace.mit.edu/bitstream/handle/1721.1/26698/Barton_2004_Creating.pdf?sequence=1
http://www.ru.tic.unam.mx:8080/bitstream/DGTIC/81872/1/Manual%20DSpace%20r.pdf
http://registry.duraspace.org/registry/dspace
http://www.ethnologue.com

También podría gustarte