Está en la página 1de 14

Descripción normalizada

Unidad 4 - Puntos de acceso y recuperación de la información

Introducción

Para entender el vínculo entre las necesidades de información de los usuarios y el trabajo de análisis y
descripción realizado previamente por los archivistas, vamos a presentar brevemente el concepto de
recuperación de la información, su aplicación en otras ciencias afines y su incorporación a la archivística.

Luego, vamos a abordar algunas cuestiones vinculadas con la construcción de puntos de acceso normalizados
que van a acompañar a las descripciones elaboradas para garantizar y facilitar el acceso de los usuarios a los
fondos documentales.
4.1 Recuperación de la información

4.1.1. Concepto de recuperación de la información

El concepto de recuperación de la información surgió a mediados del siglo pasado en el ámbito


de la documentación. El programador y científico de la información estadounidense, Calvin N.
Mooers, fue quien acuñó el término y estableció que “la recuperación de la información
abarca los aspectos intelectuales de la descripción de información y su especificación
para la búsqueda, y también cualquier sistema, técnica o máquina que se utilice para
llevar a cabo la operación.” (Mooers, 1951, como se citó en Salvador Oliván, 2008).

Durante la segunda mitad del siglo XX y lo que va del siglo XXI, la documentación, la informática y la
bibliotecología, entre otras ciencias, se ocuparon de estudiar diversos aspectos teóricos y prácticos vinculados
con la recuperación de la información, como los modelos de bases de datos, los sistemas de almacenamiento, la
inteligencia artificial, los lenguajes de programación, el diseño de interfaces, la indización, el análisis documental,
etc.

Desde el campo de la ciencia de la documentación, Salvador Oliván (2008) define a la recuperación


de la información como:

Aquella disciplina que se ocupa de la aplicación del conjunto de técnicas, métodos y


actividades para buscar, localizar y recuperar de una manera eficiente en los diversos
SRI(1) la información relevante que requiere el usuario y satisfacer así su necesidad de
información. (p. 131)

Con respecto a la archivística, Ramón Martín Suquía (2001) sostiene que “el análisis de las diferentes formas y
medios de recuperación de la información disponible en un servicio de archivo no ha merecido en los manuales
‘clásicos’ de archivística un estudio individualizado.” (p. 47). Por otro lado, en ninguno de los glosarios de las
cuatro normas de descripción del Consejo Internacional de Archivos aparece la definición de este concepto. Sin
embargo, en las últimas décadas, la recuperación de la información se volvió un aspecto de estudio ineludible
para los archivistas.

4.1.2. Proceso de recuperación de la información

Siguiendo el esquema propuesto por Salvador Oliván (2008, pp.19-20), el proceso básico de
recuperación de la información incluye las siguientes etapas:

1. Necesidad de información detectada por un usuario


2. Expresión de la necesidad en lenguaje natural (consulta)
3. Traducción al lenguaje del sistema de recuperación de la información (estrategia de búsqueda)
4. Introducción de las sentencias de búsqueda en el sistema (ej: términos del lenguaje controlado +
operadores booleanos)
5. Presentación de los resultados
6. Consulta y evaluación de los resultados por parte del usuario
7. Satisfacción de la necesidad o nueva estrategia de búsqueda
Para que todo este proceso tenga lugar, primero, alguien tiene que haber ingresado al sistema, la información en
forma estructurada. Esto quiere decir que las posibilidades de búsqueda y recuperación van a estar
condicionadas por la calidad del análisis y de las representaciones realizadas por el archivista y por las
herramientas que el archivo ofrezca para que los usuarios puedan recuperar la información que necesitan. Como
señala Suquía (2001).

La eficacia en la recuperación de la información en los archivos es el resultado de un contraste. El


contraste entre la suma final de las decisiones tomadas en el proceso de descripción por parte del
gestor de información, el archivero, y la suma final de las decisiones tomadas por el usuario en el
momento de hacer la consulta. (p. 52)

Si repasamos el esquema vamos a encontrar que se hace referencia a diferentes lenguajes y traducciones. El
primer lenguaje es el natural, utilizado por el usuario al realizar la consulta. Luego tiene lugar la primera
“traducción” ya que es necesario encontrar términos equivalentes dentro del lenguaje controlado ingresado al
sistema. El paso siguiente implica una nueva transformación ya qué hay que construir la sentencia de búsqueda,
una ecuación que va a tener una estructura determinada según el modelo de recuperación del sistema.

4.1.3. Modelo booleano de recuperación de la información

Si bien existen varios modelos de recuperación de la información (booleano, vectorial, probabilístico, etc.), el
más utilizado en los sistemas de recuperación de la información es el modelo booleano, que está basado en la
clásica teoría de conjuntos. En este modelo, los documentos están representados por términos del lenguaje
controlado y las búsquedas se realizan con ecuaciones que pueden tener un solo término o varios términos,
relacionados entre sí por operadores lógicos o booleanos. Los operadores son nexos que indican relaciones entre
los términos y permiten ampliar o limitar las búsquedas. Los más conocidos son AND, OR y NOT.

AND (Y): intersección

Recupera los registros que contienen todos los términos especificados .

OR (+): unión

Recupera los registros que contienen por lo menos uno de los términos
especificados.
NOT (-): exclusión

Recupera los registros que contienen el primer término especificado, pero no el


segundo.

Lectura obligatoria (Semana 9)


Suquía, R. M. (2001). Sistemas de recuperación de la información en los archivos: un análisis de
situación y perspectivas. En Lligall: revista catalana d'Arxivística, (17), pp.47-72

(1) Sistemas de Recuperación de la Información


4.2. Puntos de acceso normalizados

Como vimos en el apartado anterior, uno de los factores que determinan el éxito o el fracaso de la recuperación
de la información está vinculado con la manera en que se realiza el trabajo de análisis y representación
documental. Llanes Padrón (2016) señala que “La identificación y recuperación de la información archivística va a
depender, en gran medida, de la asignación adecuada de puntos de acceso en las descripciones.” (p. 125). En
ese sentido, la normalización de puntos de acceso es un aspecto central a tener en cuenta.

El glosario de la ISAAR(CPF) define al concepto de punto de acceso como: “Nombre,


término, palabra clave, frase o código que se puede utilizar para buscar, identificar y
localizar descripciones archivísticas, incluye los registros de autoridad.” (Consejo
Internacional de Archivos, 2004, p. 12).

Si bien las normas internacionales de descripción archivística contemplan la creación, el control y la utilización de
puntos de acceso en las descripciones, al ser normas de carácter general, no aportan indicaciones específicas
sobre la manera de elaborar esos puntos de acceso.

La mayoría de los elementos de descripción que figuran en un registro de autoridad según la norma ISAAR(CPF)
pueden utilizarse como puntos de acceso a la descripción. Dentro de cada país o comunidad lingüística deben
desarrollarse las reglas o convenciones para la normalización de los puntos de acceso. También pueden
desarrollarse en el mismo marco los vocabularios a utilizar o las convenciones a seguir para crear y seleccionar el
contenido de estos elementos. (Consejo Internacional de Archivos, 2004, p. 14).

En las últimas décadas, en diferentes países y regiones se han publicado reglas para la creación de puntos de
acceso vinculados a personas, familias, instituciones y lugares; o se han incluido dentro de las normas de
descripción general, capítulos dedicados a su elaboración. De esta manera, las tareas de indización mediante
lenguaje controlado (listas de descriptores o tesauros) y las de control de autoridades, se incorporan al trabajo
de normalización diario realizado por los archivistas. A continuación, presentamos un cuadro que refleja el
panorama normativo internacional:

Año País/Región Norma Institución / Puntos de


Organismo acceso
1997 Reino Rules for the Construction of Personal, Place and National Council of Personas
Unido Corporate Names (RCPPCN) Archives Instituciones
Lugares
2004 EEUU Part III: Forms of Names. En: Describing Archives: A Society of American Personas
Content Standard, Archivists Familias
(DACS) 1ª. ed. Instituciones
Lugares
2006 Castilla y II Parte: Puntos de Acceso y Control de Autoridades. Junta de Castilla y Personas
León, En: Manual de Descripción Multinivel León. Consejería de Familias
España Cultura y Turismo Instituciones
Lugares
2007 Portugal III Parte: Escolha e construção de pontos de acesso Direcção Geral de Personas
normalizados. En: Orientações para la Descrição Arquivos Familias
Arquivística (ODA) Instituciones
Lugares
2008 Canadá Part II: Headings and References. En: Rules for Bureau of Canadian Personas
Archival Description (RAD2) Archivists Familias
Instituciones
Lugares
2010 España Norma para la elaboración de puntos de acceso Subdirección General Personas
normalizados de instituciones, personas, familias, de los Archivos Familias
lugares y materias en el sistema de descripción Estatales del Instituciones
archivística de los Archivos Estatales (NEPAN) Ministerio de Cultura Lugares
Materias

Lectura obligatoria (Semana 10)


Llanes Padrón, D. (2016). La Descripción Archivística en los Tiempos Posmodernos: Conceptos,
Principios y Normas. Cultura Académica. (pp.125-135)
4.3 Registro y control de autoridades

La norma ISAAR (CPF) define el concepto de registro de autoridad como la “Forma autorizada del nombre,
combinada con otros elementos informativos que permiten identificar y describir la entidad
mencionada y que pueden también remitir a otros registros de autoridad relacionados” (Consejo
Internacional de Archivos, 2004, p.12).

En la unidad II ya nos ocupamos de los objetivos de esta norma y de su estructura. En esta unidad nos vamos a
centrar en algunos aspectos prácticos que debemos tener en cuenta a la hora de generar los registros de
autoridad que van a convertirse en puntos de acceso autorizados.

En primer lugar, es importante aclarar que la creación de los registros de autoridad implica un trabajo de
investigación y consulta de fuentes internas y externas, ya que uno de los objetivos principales es aportar el
contexto de producción de los documentos que componen el fondo. Como señala Lafuente Urien:

La información sobre el contexto archivístico es algo consustancial a la teoría y la práctica archivística, el


conocimiento de los productores (en su concepto más amplio, como autores, recopiladores, acumuladores o
creadores de fondos) es uno de los pilares de la archivística: que es la expresión misma de los principios de
Respect des fonds y del principio de procedencia (provenance). Conocer el nombre del productor, es algo
esencial. No se concibe o no se puede entender un fondo, un documento de archivo, sin conocer su contexto de
creación: quien crea el documento, que tipo de funciones o roles permiten el proceso de creación, sus
actividades asociadas.

La ISAAR (CPF) nos va a ofrecer entonces la estructura de áreas y campos para volcar toda la información
vinculada a las autoridades (persona, familia o institución), pero será necesario además adoptar unas normas de
contenido que nos permitan controlar la forma en que se ingresan esos datos. La consistencia de este trabajo no
sólo va a facilitar la consulta y recuperación de la información, sino también el intercambio de los registros entre
diferentes instituciones archivísticas.

Ejemplo:

Estamos trabajando en la descripción general de un fondo aplicando las ISAD(G). Cuando llegamos al Área de
contexto, la norma nos pide consignar el nombre del productor en forma normalizada. Ese es el momento en el
que un elemento de un registro de la ISAD (G) se vincula con uno de la ISAAR (CPF).
Entonces tenemos que acceder al fichero de autoridades, que no es más que el conjunto de registros de
autoridad dados de alta en nuestro sistema.

Si la persona, familia o institución productora ya tiene un registro de autoridad creado solo tenemos que
asignarlo a la descripción.

Si no existe el registro de autoridad para ese productor, debemos crearlo siguiendo la estructura de la ISAAR
(CPF) y las normas de contenido adoptadas por nuestra institución.

La ISAAR (CPF) dentro del Área de identificación nos pide que registremos la forma normalizada del nombre de la
entidad que estamos describiendo con el objetivo de “Crear un punto de acceso normalizado que identifique de
manera unívoca a una institución, persona o familia.”

Independientemente de la norma de contenido que utilicemos, cada persona, institución o familia, puede tener
una sola forma autorizada del nombre. Si creamos puntos de acceso con variantes de nombre para una misma
persona, institución o familia, y los asignamos de forma indistinta a las descripciones, vamos a generar un
problema a la hora de recuperar la información. Y eso significa que el control de autoridades no se realizó en
forma correcta.

Por ejemplo, vamos a usar la Norma para la elaboración de puntos de acceso normalizados de instituciones,
personas, familias, lugares y materias en el sistema de descripción archivística de los Archivos Estatales (NEPAN)
para crear un punto de acceso de una persona cuyo nombre completo es José Antonio Pérez, pero también
aparece en algunas fuentes de información como José Pérez y como José A. Pérez.

La norma dice:

2.4.1 Regla general

Cada persona sólo puede tener una Forma autorizada de nombre. Cualquier otra manera de
nombrarla se podrá recoger en Otra(s) forma(s) del nombre.

En consecuencia, se ha de elegir un único punto de acceso normalizado para cada persona. Esté
será el nombre legal u oficial completo de la persona, aun cuando utilice mas de un nombre o
diferentes formas de un mismo nombre. Siempre que sea posible, se registrará el nombre
completo: nombre(s) y apellido(s), siendo el elemento inicial del punto de acceso normalizado el
apellido o apellidos. (España. Subdirección General de los Archivos Estatales, 2010, p.38)

El registro de autoridad quedará así:

Este ejemplo es muy sencillo, pero la norma contempla otras cuestiones vinculadas con la elección y
construcción de los puntos de accesos para personas como:

las fórmulas de tratamiento o títulos de cortesía,


el uso de abreviaturas,
los apellidos precedidos de preposiciones,
los títulos nobiliarios
los apodos, sobrenombres o seudónimos,
los cambios de nombres, etc.

Lo mismo sucede con las familias y con las instituciones, la norma propone reglas generales y específicas para
unificar los criterios de elección y construcción de esos puntos de acceso.

Por último, hay que tener en cuenta que no todas las normas para crear puntos de acceso de personas, familias
e instituciones manejan los mismos criterios, por eso es importante, antes de empezar a trabajar en la
descripción seleccionar la norma a utilizar. La ISAAR (CPF) dentro del Área de control ofrece un campo para
indicar las reglas o convenciones utilizadas.

Lectura obligatoria (Semana 10)

Lafuente Urien, A., y Muriel Hernández, S. (2014): Control de autoridades y puntos de acceso en el
Portal de Archivos Españoles (PARES). Madrid: Ministerio de Educación Cultura y Deporte.

Lectura recomendada

Bonal Zazo, J. L., Generelo Lanaspa, J. J. y Travesí de Diego, C. (2006). Manual de descripción
multinivel: propuesta de adaptación de las normas internacionales de descripción. Junta de Castilla
y León.

España. Subdirección General de los Archivos Estatales. (2010). Norma para la elaboración de
puntos de acceso normalizados de instituciones, personas, familias, lugares y materias en el sistema
de descripción archivística de los Archivos Estatales. Ministerio de Cultura.

Lafuente Urien, A. (2018). En torno al nombre del productor: concepto de autoridad archivística, de
las ISAAR-CPF al RIC. En Boletín ANABAD, 68 (3-4), pp. 134-147.
4.4. Indización. Tesauros. Descriptores

4.4.1 Indización

La indización es la técnica que permite identificar y seleccionar términos que sirvan para
representar el contenido de los documentos y en el caso de los archivos también el contexto.
Para realizar la tarea de indizar es necesario extraer los términos de un lenguaje documental.
Según el control ejercido sobre el vocabulario, estos lenguajes documentales pueden ser libres
o controlados.

Antonia Heredia Herrera (1991) señala que:


Los lenguajes documentales son generados principalmente a partir del análisis de los documentos, ya que la
finalidad que persiguen es el control y manipulación de los mensajes (contenido) para satisfacer las potenciales
demandas. Son normalizados y a la vez normalizadores y nos ayudan no sólo en el análisis sino en la búsqueda.
Son válidos para el indizador y para los usuarios: Pueden ser libres (a posteriori), por ejemplo un índice, o
controlados (a priori) como el tesauro. Se componen de listas de términos (descriptores) que forman el
vocabulario y de una relación o gramática que los dinamiza otorgándoles categoría de lenguaje. (p. 395)

Entre los problemas que presentan los lenguajes documentales libres (listas de palabras clave tomadas del
lenguaje natural) se encuentra la sinonimia y la homonimia. Ambos problemas afectan a la recuperación de la
información ya que dan lugar a ambigüedades e imprecisiones. 

Entre los lenguajes controlados podemos encontrar las clasificaciones universales, las listas de encabezamientos
de materia, y los tesauros. Lo que diferencia a un tesauro de una lista de términos autorizados son las relaciones
(equivalencia, jerarquía, asociación) que se establecen entre sus los términos. La potencia de los tesauros para
recuperar información está dada por la posibilidad de combinar varios descriptores en las búsquedas.

4.4.2 Tesauros y descriptores

El Diccionario de terminología archivística define al termino Tesauro como “Vocabulario controlado de


términos organizados mediante relaciones y dependencias jerárquicas o de cualquier otro tipo, cuya
finalidad es facilitar el almacenamiento y la recuperación de la información.” (Subdirección General de
Archivos Estatales de España, 1995)

Los tesauros pueden ser generales o especializados en una o varias áreas del conocimiento. Pueden además ser
monolingües o multilingües según las lenguas utilizadas. La construcción y el mantenimiento de un tesauro es un
esfuerzo muy grande que no todas las instituciones están en condiciones de afrontar. Ramón Suquía (2001)
señala que “se debe tener en cuenta la posibilidad de aprovechar tesauros implantados en otros servicios como
fuente para el control del lenguaje.” (p. 59)

Con respecto a la estructura, los tesauros por lo general contienen:

Descriptores o términos preferentes: son los términos aceptados para la indización.


Ejemplo: COOPERACIÓN INTERNACIONAL

No descriptores (UP): son términos que presentan un alto grado de sinonimia con respecto a los
términos preferentes. No pueden utilizarse para la indización, pero están incluidos en el tesauro y remiten
a un término preferente. Expresan una relación de equivalencia.
Ejemplo: Ayuda internacional → COOPERACIÓN INTERNACIONAL

Términos genéricos (TG): son términos preferentes que permiten ampliar el campo de búsqueda.
Expresan una relación jerárquica ascendente.
Ejemplo: POLÍTICA INTERNACIONAL

Términos específicos (TE):  son términos preferentes que permiten especificar el campo de búsqueda.
Expresan una relación jerárquica descendente.
Ejemplo: AYUDA HUMANITARIA

Términos relacionados (TR): son términos preferentes que presentan algún vínculo (por asociación de
ideas) con el término seleccionado. Expresan una relación asociativa.
Ejemplo: ORGANIZACIÓN INTERGUBERNAMENTAL

Nota de alcance (NA): son notas que permiten esclarecer el significado de un concepto para evitar
ambigüedades.
Ejemplo: COOPERACIÓN INTERNACIONAL. Toda forma de cooperación a escala internacional.

Equivalente lingüístico (EL): indica el término que designa al mismo concepto en otro idioma.
Ejemplo: COOPÉRATION INTERNATIONALE (francés)

Los tesauros suelen presentar los términos y sus relaciones en orden alfabético y jerárquico. En algunos casos
también se incluyen mapas conceptuales o diagramas.

Presentación alfabética: todos los términos (descriptores y no descriptores) aparecen ordenados


alfabéticamente y a continuación se encuentran las relaciones y las notas.

Presentación sistemática o jerárquica: Los descriptores aparecen ordenados por temas o grupos, y dentro de
estos según las relaciones jerárquicas (de lo general a lo específico).
Lectura obligatoria (Semana 11)
Heredia Herrera, A. (1991). Archivística general: teoría y práctica. Diputación Provincial de Sevilla.
(pp. 392-411)

Lectura recomendada
Santos Canalejo, E. C. de. (1997). La indización en la recuperación de la información. En Lligall:
revista catalana d'Arxivística, (12).
Referencias bibliográficas

Bonal Zazo, J. L., Generelo Lanaspa, J. J. y Travesí de Diego, C. (2006). Manual de descripción multinivel:
propuesta de adaptación de las normas internacionales de descripción. Junta de Castilla y León.
https://archivoscastillayleon.jcyl.es/web/es/area-profesional/manual-descripcion-multinivel.html

España. Subdirección General de los Archivos Estatales. (2010). Norma para la elaboración de puntos de
acceso normalizados de instituciones, personas, familias, lugares y materias en el sistema de descripción
archivística de los Archivos Estatales. Ministerio de Cultura.

Heredia Herrera, A. (1991). Archivística general: teoría y práctica. Diputación Provincial de Sevilla.

Lafuente Urien, A. (2018). En torno al nombre del productor: concepto de autoridad archivística, de las
ISAAR-CPF al RIC. En Boletín ANABAD, 68 (3-4), pp. 134-147.

Lafuente Urien, A., y Muriel Hernández, S. (2014). Control de autoridades y puntos de acceso en el Portal
de Archivos Españoles (PARES). Madrid: Ministerio de Educación Cultura y Deporte.

Llanes Padrón, D. (2016). La Descripción Archivística en los Tiempos Posmodernos: Conceptos, Principios
y Normas. Cultura Académica.

Salvador Oliván, J.A. (2008). Recuperación de la información. Alfagrama.

Santos Canalejo, E. C. de. (1997). La indización en la recuperación de la información. En Lligall: revista


catalana d'Arxivística, (12).

Suquía, R. M. (2001). Sistemas de recuperación de la información en los archivos: un análisis de situación


y perspectivas. En Lligall: revista catalana d'Arxivística, (17).

España. Subdirección General de los Archivos Estatales (1995). Tesauro. En Diccionario de Terminología
archivística. Ministerio de cultura.
https://www.culturaydeporte.gob.es/cultura/areas/archivos/mc/dta/diccionario.html

También podría gustarte