Documentos de Académico
Documentos de Profesional
Documentos de Cultura
--
Valencia : Universitat de Valencia, 1995. -- Cap. I, II, III.
Capítulo I
¿Por qué el control del vocabulario?
∗
Aunque thesaurus se utiliza universalmente y conceptualmente es más preciso que tesauro, empleamos este último término debido
a su uso general, tras la publicación de la norma UNE 50-106-90, en los textos en castellano sobre el tema (N. del T.)
Las fases de la salida del sistema (output) son muy similares a las que se dan en la entrada.
Los usuarios realizan diferentes peticiones al centro de documentación y los documentalistas
preparan estrategias de búsqueda para esas peticiones. Resulta oportuno considerar también en
la preparación de las estrategias de búsqueda las fases de análisis conceptual y de traducción. La
primera fase implica un análisis de la petición para determinar lo que realmente busca el usuario
y la segunda consiste en la traducción del análisis conceptual al vocabulario del sistema. El
análisis conceptual de la petición, traducido al lenguaje del sistema, es la estrategia de
búsqueda, que puede considerarse como una representación de la petición, del mismo modo que
el registro de indización puede contemplarse como una representación del documento. La única
diferencia es que en aquélla normalmente existe «lógica» (es decir, se especifican un cierto
número de relaciones lógicas entre los términos), mientras que en el registro de indización las
relaciones lógicas entre los términos estarán más implícitas que explícitas.
Una vez terminada la estrategia de búsqueda se «compara» de algún modo con las
representaciones de los documentos de la base de datos. Esto puede hacerse mediante un fichero
manual, índices impresos, microfilm, cinta magnética o disco. En la actualidad, la búsqueda
puede hacerse online, desde un terminal en una biblioteca, aunque la base de datos esté a cientos
o miles de kilómetros de distancia. Las representaciones de los documentos que se ajustan a la
estrategia de búsqueda, es decir, que satisfacen los requerimientos lógicos de la búsqueda, son
recuperadas de la base de datos y ofrecidas al usuario de forma impresa o por pantalla. El
proceso acaba cuando el usuario queda satisfecho con los resultados de la búsqueda. En algunos
casos esto puede consistir en el convencimiento de que no hay nada en la base de datos que se
ajuste a sus necesidades.
La figura 1 indica con claridad el papel central que juega el vocabulario en un sistema de
recuperación de la información. Los indizadores tienen que utilizar los términos de este
vocabulario para representar las materias de los documentos. En las estrategias de búsqueda se
utilizarán los mismos términos para la interrogación a la base de datos. Podemos hacernos una
idea de lo que podría ocurrir si el sistema funcionara sin control del vocabulario examinando la
lista de términos de la figura 2. Puede considerarse que todos ellos (y la lista no es completa)
tienen algo que ver con el proceso de «unión» (de materiales como los metales y los plásticos).
La lista contiene una amplia variedad de tipos de términos: algunos (como conexión, soldadura
fuerte, encolado) representan procesos de unión; otros (como planchas y hojas) representan
cosas que pueden ser unidas; otros representan tipos de uniones (aglomerados, soldadura); y
otros se refieren a sustancias (aleaciones, colas) o instrumentos (soldadores, varillas soldadoras),
propiedades de materiales o uniones (fragilidad, resistencia) o procesos que pueden afectar a las
uniones (corrosión, deterioro, etc.).
articulaciones (anatómicas)
El mayor problema posiblemente sea que en una lista alfabética los términos con
significados cercanos aparecerán separados. Aunque sea improbable que alguien plantee una
búsqueda sobre cada aspecto del tema unión, sí es posible que alguien quiera recuperar toda la
información relativa a algún tipo de unión, como unión por adherencia. El orden alfabético va a
separar muchos términos relacionados con esa materia: adhesivos, aglomerantes, cementos,
colas, gomas, etc. Sería útil para el que busca información que todos los términos con
significados relacionados estuvieran unidos de algún modo, como en el siguiente ejemplo:
En el diagrama se puede observar que están representados dos tipos de relaciones. Uno es
la relación permanente entre una cosa y tipos de esa cosa (entre un género y sus especies):
fractura y rotura son siempre tipos de averías. El otro tipo de relación es más transitorio; por
ejemplo, el proceso de avería puede estar inducido por otros procesos como corrosión y fatiga e
influido por propiedades físicas como resistencia y tenacidad. A la relación genérica permanente
a veces se la conoce como relación paradigmática o relación a priori, mientras que a la relación
más transitoria (la avería puede estar ocasionada por la corrosión, pero no siempre se debe a ella
ni la corrosión conduce siempre a una avería) en ocasiones se la llama relación sintagmática o a
posteriori.
Los ejemplos vistos, basados en los términos de la figura 2, demuestran claramente los
objetivos del control del vocabulario en un sistema de recuperación de la información. Estos
objetivos pueden resumirse en:
La indización tiende a ser más consistente cuando el vocabulario utilizado está controlado.
Será más probable que los indizadores estén de acuerdo sobre los términos necesarios para
representar una determinada materia, si éstos son seleccionados de una lista previa que si
pueden utilizar cualquier término. Lo mismo ocurre en el proceso de búsqueda: será más fácil
identificar los términos apropiados a una necesidad de información si son seleccionados de una
lista determinada. Por lo tanto, el vocabulario controlado facilita la coincidencia entre el
lenguaje de los indizadores y el de los usuarios que hacen la búsqueda.
Un vocabulario controlado no necesita más que un limitado conjunto de términos que
puedan ser utilizados por el indizador y el usuario. Sin embargo, normalmente los términos
están sujetos a algún tipo de estructura para que aquellos que tienen significados cercanos
aparezcan juntos o relacionados de alguna forma. Ello ayudará, tanto al indizador como al
usuario que hace la búsqueda, a poder seleccionar los términos más adecuados para representar
una determinada materia. Y, aún más importante, ayudará al usuario a identificar todos los tér-
minos necesarios para realizar una búsqueda amplia sobre alguna materia.
Capítulo II
Sistemas precoordinados y postcoordinados
Clasificaciones abiertas
Clasificaciones cerradas