Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CONTENIDO TEMÁTICO
Unidad 4: Los Tesauros
Programa Ciencia de la Información y la Documentación,
Bibliotecología y Archivística
Lenguajes, análisis y recuperación de la información
I. Concepto
Ana María Martínez Tamayo y Paola Verónica Mendes en su libro Diseño y desarrollo de
tesauros (2015) proponen el siguiente marco de referencia para este concepto:
Como todos los SOC (Sistema de Organización del Conocimiento), un tesauro impone una
cierta concepción del mundo, de acuerdo con el dominio que trata, los usuarios a los que
está dirigido, la lengua en que se elabora, la cultura de una región, país, grupo étnico u
organismo del que procede.
• El vocabulario controlado:
El tesauro, en cuanto SOC, consta de un vocabulario controlado formado por un conjunto
de términos y nombres propios que designan, respectivamente, conceptos generales e
individuales. En el vocabulario de un tesauro se elimina toda sinonimia y homonimia, con
el fin de aportar consistencia a la recuperación.
Si bien las normas y los manuales para el diseño y desarrollo de tesauros incluyen
recomendaciones respecto de la redacción de los términos y nombres propios, es
importante tener en cuenta que el elemento esencial del vocabulario de un tesauro es el
concepto y no el término o el nombre que lo designa, ya que estos últimos pueden variar,
pero no el concepto que debe definirse con precisión.
La relación asociativa es aquella que se establece entre dos conceptos, pero que no es ni
equivalente ni jerárquica.
Lenguajes, análisis y recuperación de la información
Un tesauro debe presentar las tres relaciones de modo explícito y recíproco; si carece de
alguna de ellas no es un tesauro.
Orden sistemático:
Los conceptos del tesauro se ordenan formando un orden sistemático o clasificado. El
orden sistemático es una característica del tesauro que hace evidente el sistema de
conceptos del dominio y sitúa cada concepto en ese contexto, de modo similar al esquema
de un sistema de clasificación.
La norma ISO 25964 recomienda tres posibles formas de construir el orden sistemático:
a) por disciplinas o campos temáticos, b) por facetas y c) por facetas bajo disciplinas o
campos temáticos.
• Sintaxis poscoordinada:
El tesauro es un SOC desarrollado especialmente para la indización poscoordinada, es
decir, los términos y los nombres propios se almacenan en el registro bibliográfico o
metadatos sin un orden de cita o de mención predefinido y son coordinados por el usuario
en el momento de la recuperación. Esta característica también establece una diferencia
entre el tesauro y las listas de epígrafes que son precoordinadas.
Sin embargo, no podemos evitar que surja una duda: ¿la especialización es realmente una
característica del tesauro o no se ha presentado la oportunidad de desarrollar un tesauro
universal?
Por un lado, desarrollar un tesauro es una iniciativa costosa; por otro lado, existen SOC
universales que con periódicas actualizaciones han dado solución a las bibliotecas
generales o similares. Entonces, es posible que no se haya planteado la necesidad de
construir un tesauro general o enciclopédico, lo cual no significa que no se pueda hacer.
De hecho, las experiencias de interoperabilidad entre tesauros que se han llevado a cabo
desde hace varias décadas, de alguna manera reflejan la necesidad de contar con tesauros
más generales en cuanto a su alcance temático (Martínez Tamayo et al., 2011b).
a. Tipología
Un macrotesauro es un tesauro de cobertura temática amplia, que suele tener un bajo nivel
de especificidad, mientras que un microtesauro es un tesauro dedicado a un campo de
conocimiento restringido, con un alto nivel de especificidad (Barité et al., 2013). Un
macrotesauro puede actuar como paraguas para interconectar varios microtesauros, de
modo tal que los temas generales sean indizados por el macrotesauro y los específicos
por alguno de los microtesauros.
Lenguajes, análisis y recuperación de la información
Un tesauro de búsqueda es un tesauro que intenta asistir al usuario final durante la etapa
de recuperación, aun cuando el sistema de información se maneje solo con lengua natural,
para lo cual sugiere las posibles relaciones de equivalencia, jerarquía y asociación
(Aitchison et al., 2000; Bates, 1986, 1989). Un tesauro común, que se utiliza para la
indización, puede usarse también como tesauro de búsqueda.
b. Relaciones jerárquicas
Ejemplo:
reptiles serpientes
TE serpientes TG reptiles
Las normas y manuales citados permiten, de manera opcional, indicar en todos los
términos preferentes el término tope, es decir, el concepto más genérico de una cadena
de conceptos (Barité et al., 2013). En un tesauro facetado, el término tope es la faceta de
primer nivel. En España y en Cuba el término tope se conoce como término cabecera
(AENOR, 1990; Oficina Nacional de Normalización, 2000). La etiqueta del término tope es
TT. En el siguiente ejemplo, los términos preferentes muebles de oficina, escritorios,
escritorios gerenciales y escritorios secretariales comparten un mismo TT muebles:
muebles
TE muebles de oficina
TE muebles del hogar
muebles de oficina
TT muebles
TG muebles
TE escritorios
TE mesas
escritorios
TT muebles
Lenguajes, análisis y recuperación de la información
TG muebles de oficina
TE escritorios gerenciales
TE escritorios secretariales
escritorios gerenciales
TT muebles
TG escritorios
escritorios secretariales
TT muebles
TG escritorios
Todos los términos preferentes y las formas autorizadas del nombre deben tener, al menos,
una relación jerárquica. Si carecen de una relación jerárquica, se denominan términos
huérfanos. Un tesauro no debe tener ningún término huérfano.
De acuerdo con la norma ISO 25964, hay cuatro tipos de relación jerárquica, que se
describen a continuación (ISO, 2011).
Prueba de la relación jerárquica género-especie: Algunos motores son eléctricos, pero todos los
motores eléctricos son motores. Por lo tanto, motores es el género y motores eléctricos la
especie.
Aunque no es obligatorio, se puede agregar a la etiqueta de esta relación una letra G para
indicar que es una relación género-especie. En este caso sería TGG (término genérico
género-especie) y TEG (término específico género-especie). Por ejemplo:
ventrículos corazón TE
TG corazón ventrículos
o Lugares geográficos
Chubut Argentina
TG Argentina TE Chubut
Trelew Chubut
TG Chubut TE Trelew
Lenguajes, análisis y recuperación de la información
oncología TG medicina TE
medicina oncología
oncohematología oncología
TG oncología TE oncohematología
o Estructuras sociales
facultades TG universidades
universidades TE facultades
parroquias TG diócesis TE
diócesis parroquias
También aquí se puede agregar a la etiqueta de esta relación una letra P para indicar que
es una relación todo-parte. En este caso sería TGP (término genérico partitivo) y TEP
(término específico partitivo). Por ejemplo:
La norma internacional ISO 25964 establece que la etiqueta opcional para la relación
jerárquica enumerativa es BTI/NTI broader term (instantial), narrower term (instantial), pero
las normas española, argentina y otras latinoamericanas vigentes no la han contemplado
todavía (AENOR, 1990; Oficina Nacional de Normalización, 2000; ICONTEC, 1998; IRAM,
1983). En 2013 el Subcomité de Documentación del IRAM aprobó las etiquetas TGE/TEE
(término genérico enumerativo y término específico enumerativo) para la norma IRAM-ISO
25963 que se encuentra en curso y así se usan en esta obra. Por ejemplo:
• Relación polijerárquica
Es la relación que se establece entre un término preferente y dos o más términos
genéricos, según el ejemplo que se muestra en la parte inferior.
Lenguajes, análisis y recuperación de la información
Ejemplo de una relación polijerárquica. El término preferente órganos tiene en este caso dos
términos genéricos: instrumentos de viento e instrumentos de teclado. Es, por tanto, una relación
polijerárquica.
Una discusión sobre este tema se puede encontrar en el artículo de Miller (1997).
c. Relaciones asociativas
Es una asociación conceptual entre dos términos preferentes o formas autorizadas del
nombre, que no se puede considerar como una relación de equivalencia ni como una
Lenguajes, análisis y recuperación de la información
aviadores TR aviones TR
aviones aviadores
La relación asociativa ofrece una gran libertad para relacionar los conceptos representados
en el tesauro y su potencial ha sido valorado por diversos autores (Tudhope et al., 2001).
Las normas y manuales publicados en el siglo pasado señalaban dos tipos de relación
asociativa: la intracategoría y la intercategoría. Esta diferencia ha sido eliminada en la
nueva norma internacional ISO 25964.
Esta norma internacional brinda, sin pretensión de ser exhaustiva, algunas orientaciones
para establecer las relaciones asociativas.
administración TR administradores TR
administradores administración
fotoduplicación fotocopias
TR fotocopias TR fotoduplicación
construcción TR viviendas TR
viviendas construcción
curación TR enfermos TR
enfermos curación
compra proveedores TR
TR proveedores compra
Lenguajes, análisis y recuperación de la información
aluminio maleabilidad
TR maleabilidad TR aluminio
vino TR color
color TR vino
Un artefacto y sus partes, cuando estos no califican para una relación jerárquica todoparte.
Por ejemplo:
bicicletas manubrios
TR manubrios TR bicicletas
gestión planificación
TR planificación TR gestión
farmacodependencia fármacos
TR fármacos TR farmacodependencia
plagas plaguicidas
TR plaguicidas TR plagas
infecciones TR antibióticos
antibióticos TR infecciones
voltaje voltio
TR voltio TR voltaje
mulas TR burros
burros TR mulas
Un término preferente puede tener todas o algunas de las relaciones semánticas aquí
descritas. Por ejemplo:
papas UP
patatas
TT tubérculos
TG tubérculos comestibles
TE papas amarillas
papas coloradas
papas negras
papines TR puré de
papas patatas
USE papas
Lo mismo sucede con las formas autorizadas del nombre. Por ejemplo: