Está en la página 1de 7

Apuntes sobre Tesauros

(Basados en la bibliografía utilizada en Curso de Capacitación Actualización de Procesos


Técnicos –CENDIE-2008)

Tesauro: Lenguaje documental controlado de estructura combinatoria, es una de las herramientas


más utilizadas en la actualidad en el procesamiento de información.
Un tesauro es un lenguaje de indización controlado, organizado formalmente para hacer
explícitas las relaciones, a priori, entre conceptos (UNE-50-106-90).
Está constituido por un conjunto de términos, descriptores y no descriptores, (unidades
léxicas) y un sistema de relaciones que define su contenido semántico, (relaciones semánticas entre
las unidades léxicas)
Los objetivos del tesauro se enfocan hacia dos tipos de uso:
• Indización de documentos.
• Recuperación de información.

La norma ISO 2788/1986 da las pautas para la construcción y utilización de tesauros.


Dicha norma especifica que los tesauros son:
􀂾Herramientas de control terminológico que traducen el lenguaje natural, en el cual están
los documentos, al lenguaje documental o controlado del tesauro.
􀂾Listado controlado y dinámico de términos y de las relaciones semánticas y jerárquicas
que éstos guardan entre sí, aplicable a un campo específico del conocimiento.

Nosotros consideraremos como definición la aportada por Naumis Peña:

“Tesauro es un sistema de clasificación temática o facetada, cuya estructura básica está


conformada por una relación de descriptores que representan o describen autoridades o
contenidos temáticos, mediante unidades lingüísticas, semánticas y sus relaciones, extraídas
del lenguaje formal de una disciplina o área específica del conocimiento.”

Otras DEFINICIONES…
Alan Gilchrist en el libro que ha publicado en el año 1987, “Thesaurus construction” define
tesauro como “Vocabulario de lenguaje controlado de indización, organizado formalmente, de forma
que las relaciones entre conceptos se establezcan a priori, para ser usado en sistemas de
recuperación de información, sean éstos bases de datos, índices impresos o catálogos.”
Para Emilia Currás tesauro es “Un lenguaje especializado, normalizado, post-coordinado,
usado con fines documentarios, donde los elementos lingüísticos que lo componen
(términos, simples o compuestos) se hallan relacionados entre sí sintáctica y
semánticamente”

Según la UNESCO los tesauros son “Vocabularios coordinados y dinámicos de términos


relacionados de manera semántica y genérica que cubren ampliamente una esfera dada de
conocimientos”
Amat Noguera lo define como un diccionario que muestra la equivalencia entre los términos
o expresiones del lenguaje natural y aquellos términos normalizados procedentes del
lenguaje documental, así como las relaciones semánticas que existen entre los términos.
Coll-Vinet define el tesauro como una compilación de palabras y frases que muestran sus
sinónimos, sus jerarquías y otras dependencias, y cuya función es suministrar un
vocabulario normalizado para la recuperación y almacenamiento de la información.
García Gutiérrez y Lucas Fernández dicen que es un dispositivo léxico que correlaciona
los mensajes humanos y documentales con los objetivos:
- servir de base terminológica representante de un campo científico determinado.
- dinamizar la comunicación de entrada y salida en el hombre y en la propia base de datos.
Del conjunto de definiciones se desprende que:
􀂙un tesauro es un vocabulario controlado para representar de manera unívoca el contenido de los
documentos y de las preguntas, así como para ayudar al usuario en el tratamiento de la
información
􀂙Un tesauro es un lenguaje documental, un vocabulario controlado dotado de relaciones que son
las que le distinguen de otros instrumentos terminológicos y le proporcionan la categoría de
lenguaje.

PARTES / ESTRUCTURA
Las partes de un Tesauro
Introducción
Tabla de contenido
Justificación
Prólogo Cobertura (temática)
Introducción Normas (en las q’ se basa)
Instrucciones de uso
Cuerpo de la Obra
Parte alfabética (donde están los descriptores)
Parte sistemática (temática) (parte 1 y facetas)
Parte gráfica
Partes auxiliares

KWOC
Índices Permutados KWIC

Bibliografía

1. Introducción

En la introducción del Tesauro se detallan los siguientes ítems:

• Teoría general de los lenguajes documentales y específicamente de Tesauro


• Utilidad, finalidad de la realización del mismo
• Área del conocimiento o de la ciencia que abarca
• Metodología seguida para su construcción
• Instituciones u organismos que intervinieron en su realización
• Sistemas automatizados utilizados para la elaboración
• Principios seguidos en la colecta de términos. Si estuvo basada en tesauros anteriores, base de
datos de bibliotecas o centros de documentación, etc.
• Normas internacionales seguidas en su construcción
• Indicaciones de uso
• Actualizaciones pautadas
• Bibliografía utilizada

2. Cuerpo de la obra

La presentación de un tesauro puede ser:

o Alfabética: el descriptor en su contexto (con las relaciones semánticas) se ordena


alfabéticamente. Facilita la entrada en el tesauro por la primera palabra significativa de
descriptores y no descriptores y que expresa las relaciones del vocabulario,

o Sistemática: Los descriptores se ordenan por campo semántico. NO contiene los no


descriptores.
o Gráfica: se ordenan los términos gráficamente consiguiéndose una mayor comprensión de las
relaciones dentro de una misma familia. Las formas más usuales son: arborescente,
cuadriculada, espiral, recuadros interconectados.

3. Índices permutados

o Indice kwic (keyword in context) La palabra que se está ordenando alfabéticamente del
descriptor, aparece jerarquizada de alguna manera, por ejemplo en negrita y en una posición
fija, precedida y seguida por el resto del descriptor.

síndrome de abstinencia
abuelos
abusos sexuales

o Indice kwoc (keyword out of context) Las palabras que se ordenan alfabéticamente aparecen
como un encabezamiento en línea separada. Bajo cada encabezamiento aparece la totalidad
de descriptores que contienen dicha palabra.

Cuidado
Cuidado del niño
Cultura
Cultura
Cultura urbana

ELEMENTOS CONSTITUTIVOS DE UN TESAURO

o Unidades léxicas
títulos que encabezan los conjuntos
descriptores,
no-descriptores,
descriptores auxiliares

o Relaciones semánticas entre dichas unidades


pertenencia
equivalencia ínterlingüística
equivalencia semántica intralingüística
jerárquica
asociación

Unidades léxicas

Un tesauro puede incluir varias categorías de unidades léxicas:


1. Los títulos que encabezan los conjuntos, en el interior de los cuales se agrupan los
términos: campos semánticos (Temas) o naturaleza de los términos (Facetas). NO se
utilizan para indizar los documentos ni las consultas SOLO agrupan descriptores
2. los descriptores, término (palabra o expresión) que se ha escogido de un conjunto de
sinónimos, cuasi sinónimos y términos emparentados para representar de manera
unívoca un concepto. También llamados términos referentes.
3. los no-descriptores, llamados también términos equivalentes o términos no preferentes:
son sinónimos o cuasi sinónimos de los descriptores. NO se utilizan para indizar los
documentos ni para las consultas, reenvía a 1 ó 2 descriptores que se deben utilizar.
Están incluidos dentro de un tesauro y ligados a un descriptor por una relación de
equivalencia, sirven para facilitar el acceso al usuario
4. descriptores auxiliares, se utilizan en combinación con descriptores libres para formar
los descriptores compuestos. Existen en algunos tesauros, casi todos son unitérminos,
con un sentido poco preciso (INFLUENCIA, FACTOR, REPARTO.) NO se los incorpora
dentro de un tema específico por la imprecisión de su significado
o Identificador: Recibe diferentes acepciones
o Palabra aislada, transición de palabra clave a descriptor
o Antiguos descriptores en desuso
o Palabra que identifican lugares o fechas relevantes
Ejemplos:
Consejo de Europa
UNESCO
Nicaragua

Relaciones semánticas

Un tesauro contiene las siguientes relaciones semánticas


o pertenencia a un grupo, entre descriptores y temas o facetas a los que pertenecen esos
descriptores. Es la relación asimétrica entre un descriptor y el campo semántico al que ha
sido vinculado y le permite al usuario situar el campo semántico al que pertenece el
descriptor y remitirse a ellos para buscar otros descriptores
o equivalencia interlingüística entre descriptores, designan el mismo concepto o el equivalente
en 2 o más lenguas .Relación bi-unívoca y simétrica entre descriptores de 2 o más lenguas
diferentes que representan el mismo concepto o un concepto similar, permitiendo indicar los
documentos en una o varias lenguas, formular consultas en la lengua del usuario y recuperar
documentos independientemente de cual sea la lengua
o equivalencia intralingüística entre descriptores (término preferente) y no descriptores (término
no preferente) y viceversa dentro de la misma lengua. Relación asimétrica entre un descriptor
y un no descriptor que expresa un concepto único y que serán indizados de manera unívoca
por el descriptor, eliminando al máximo silencios y ruidos. De las variadas denominaciones
con que puede ser representado un concepto, se selecciona una, que será el término con
valor de descriptor y las otras formas posibles, consideradas sinónimos, son descartadas
como puntos de acceso en la indización y recuperación. Las notaciones más habituales para
representar esta relación son: UP/UF (usado por) y USE.

o Sinonimia
Ej.: ENSEÑANZA MEDIA ENSEÑANZA SECUNDARIA
USE ENSEÑANZA SECUNDARIA UF ENSEÑANZA MEDIA

o Casi-sinonimia
Ej.: ENSEÑANZA VOCACIONAL ENSEÑANZA PROFESIONAL
USE ENSEÑANZA PROFESIONAL UF ENSEÑANZA VOCACIONAL

o Antónimos
Ej,: INEFICIENCIA
USE EFICIENCIA

o jerárquica entre descriptores de la misma lengua. Relación asimétrica entre dos descriptores
de los que uno es superior a otro y se utilizan en la indización de los documentos para
escoger los descriptores más específicos, eliminando ruidos en la búsqueda. Permite formular
consultas en distintos niveles jerárquicos
Notación: Término tope: TT / TGG
Término genérico: BT / TG
Término específico: NT / TE

Ej. Término genérico ESCUELAS


Término específico NT ESCUELAS RURALES
Ej. Término específico ESCUELAS RURALES
Término genérico BT ESCUELAS
o asociación, entre descriptores de la misma lengua. Relación simétrica entre 2 descriptores
que designan conceptos y son susceptibles de evocarse mutuamente por asociación de
ideas, aportan ayuda para la búsqueda documental gracias a los distintos puntos de vista.
Notación: RT / RT: Término relacionado
Ej. EXAMEN CALIFICACIONES
RT CALIFICACIONES RT EXAMEN

Notas de alcance
Denominada nota de aplicación o nota explicativa. Su objetivo es brindar información adicional sobre
el descriptor, también puede explicitar el significado o alcance conceptual del mismo.
Notación: SN / NA

NOTACIONES DE LAS RELACIONES SEMÁNTICAS

Nota de aplicación NA SN Scope note


Nota explicativa
Indica el descriptor -Término preferente- USE USE Use
Se elige entre varios términos sinónimos.
Indica el término equivalente UP UF Use for
-no preferente-
Término cabecera. TC TT Top Term
Se aplica a los términos que identifican el
nombre de la clase más amplia a la que
pertenece el concepto específico.
Término genérico TG BT Broader term
Término específico TE NT Narrower term
Término relacionado TR RT Related term

PRESENTACION DE UN DESCRIPTOR EN SU CONTEXTO

Centros de educación preescolar 1977

Preschool centres

Centre préscolaire

UF Salas cuna

SN Instalaciones educacionales para niños


en edad preescolar que pueden incluir
servicios familiares y sanitarios.

BT Instituciones educacionales

NT Escuelas de párvulos

RT 311

INDICE PERMUTADO – KWIC

ancianos abandonados
niños abandonados
aberración cromosómica (ND)
USE: cromosomopatías
régimen abierto
abogados
colegio oficial de abogados (ND)
USE: colegios profesionales
aborto
aborto legal
absentismo escolar
absentismo laboral
síndrome de abstinencia
abuelos
abusos sexuales
accesibilidad
accesibilidad en el transporte
accesibilidad en el urbanismo
accesibilidad en la vivienda
accesibilidad en los edificios públicos
acceso a la cultura
acceso a la educación
acceso a la información
acceso al empleo
accidentes
accidentes de tráfico
accidentes en el hogar
accidentes laborales
prevención de accidentes
programa de acción comunitario (ND)
ACNUR
familia acogedora
centros de acogida
niños acogidos
acogimiento familiar
acoso sexual

INDICE PERMUTADO – KWOC

Cuestionarios
Cuestionarios 203
Cuestiones
Cuestiones morales 100
Cuidado
Cuidado del niño 126
Cultura
Cultura 130
Cultura urbana 130
Oficina Regional de Cultura de la UNESCO para América Latina y el Caribe 851
Cultural
Agente de extensión cultural 440
Aislamiento cultural 130
Ambiente cultural 550
Desventaja cultural 130
Extensión cultural 382
Extensión cultural de las bibliotecas 382
Extensión cultural urbana 382
Intercambio cultural 130
Medio cultural 130
Culturales
Actividades culturales 537
Aspectos culturales 561
Centros culturales 310
Desfavorecidos culturales 402
Factores culturales 285
Interrelaciones culturales 130
Políticas culturales 130
Cuota
Sistema de cuota 205
Curiosidad
Curiosidad 561
Cursillos
Cursillos e especialización 334
Cursillos de iniciación 351
TESAUROS EN LINEA
En los últimos tiempos la ciencia de la información incorporó el impacto que significó Internet
y sus tecnologías asociadas. Los cambios tecnológicos derivados están conduciendo a una
progresiva informatización en la representación y recuperación de la información afectando los
recursos de información, las herramientas de representación y recuperación.
En este contexto de creciente digitalización, son diversas las herramientas de representación
y recuperación de información que se deben estudiar; sistemas de clasificaciones, bases de datos,
tesauros, mapas conceptuales, redes semánticas, listas de encabezamientos, ontologías entre otros.
Dentro de este amplio espectro de herramientas de representación y recuperación de información
son los tesauros en línea los que vamos a observar en esta oportunidad.
Desde esta perspectiva López-Huertas (1997), De la Cueva Martín (2000), Shiri y Revie
(2000) y Qin y Paling (2001) entre otros, han empezado a perfilar los aportes del entorno digital a los
tesauros, que podemos resumir:
􀀹Se enriquece la funcionalidad de la estructura del tesauro por la hipertextualidad. Se
establecen hipervínculos entre todos los elementos estructurales, descriptores, no
descriptores, notas de alcance, etc. y también entre las partes del tesauro.
􀀹Se reduce el costo de actualización y mantenimiento. Por la creciente informatización de los
procesos de construcción y el progresivo abandono del soporte papel.
􀀹Se integra al usuario en el proceso de creación, gestión y optimización de los tesauros por
diferentes estrategias que permiten elaborar herramientas que tengan en cuenta los
requerimientos del usuario y descartar su construcción como simples estructuras teóricas.
􀀹Se pueden aplicar medidas de reutilización en el momento de planificar y construir el tesauro
para aprovechar la información conceptual y lingüística ya generada por otros recursos. Ítem
clave que permite el enriquecimiento a nivel estructural del tesauro en línea y posibilita el
incremento de la amigabilidad de estas herramientas para el usuario final.

También podría gustarte