Está en la página 1de 7

ANÁLISIS Y RECUPERACIÓN

DE INFORMACIÓN DOCUMENTAL

Introducción

Las actividades relacionadas con el análisis y la recuperación de


información, han derivado de la constante batalla del hombre por dominar el
medio ambiente que lo rodea o, por lo menos, evitar ser destruido por fuerzas
externas. Esta lucha se traduce en una continua necesidad de tomar
decisiones. Sin duda, la calidad de una decisión depende, fundamentalmente,
de la capacidad para resolver problemas de quien toma las decisiones, pero,
por lo menos inicialmente, depende también de la calidad y la relevancia de la
información reunida para enfrentar el problema. Por lo tanto, el hombre
necesita acumular y organizar información relacionada con experiencias y
logros pasados.
En las últimas décadas ha habido gran énfasis en la “recuperación de
información”, particularmente introduciendo el uso de computadores, debido
básicamente a cuatro factores interrelacionados:
1) Cambios en la escala del tiempo: El tiempo disponible para
reunir información necesaria para la toma de decisiones y el control,
se ha reducido drásticamente. Esto se debe a que cada día es mayor
la fuerza con que la actividad competitiva, la acción internacional, y
los cambios en la opinión pública, pueden deteriorar situaciones
económicas, sociales y políticas.
2) Cambios en la cantidad de la información disponible: Se ha
producido un aumento dramático en la cantidad de información
libremente disponible, vale decir, publicada de una forma u otra. Esto
ha llevado a hablar de la “explosión de la información” en las décadas
del 60 y 70, y de la “explosión de la publicación” en la década
siguiente. Esta última expresión se refiere al hecho de que un mismo
trabajo es publicado en diversas fuentes con cambios mínimos o sin
cambios. Esta situación tiene tres dimensiones de frustración:

1
 La imposibilidad del individuo de leer y recordar toda la
literatura que, razonablemente, podría serle útil más
tarde.
 La imposibilidad económica de los individuos o de sus
organizaciones, de procesar, para una posterior
recuperación, la literatura posiblemente pertinente.
 Lo inadecuado de las metodologías y herramientas
bibliotecarias tradicionales para manejar en forma
efectiva, en la identificación de la información pertinente
a un problema dado, respondiendo a requerimientos
individuales.
3) Cambios en la naturaleza de los requerimientos de
información: La complejidad creciente de los problemas de una
sociedad, consecuentemente, ha significado que la información que
se requiere pertenece a una gran variedad de campos, lo que lleva a
tener que buscar y reunir información de las más diversas fuentes.
4) Cambios en la importancia de las fuentes de información:
El creciente internacionalismo de las organizaciones industriales,
educacionales y políticas, ha significado un mayor énfasis en la
información para la toma de decisiones provenientes de fuentes y
áreas geográficas no consideradas importantes anteriormente.

Como resultado d estos cambios, se han propuestos y desarrollado


nuevas herramientas, nuevos sistemas de comunicación y nuevos medios de
diseminación. Cabe decir, sin embargo, que, aunque cada innovación ha
aliviado antiguos problemas, a su vez ha creado otros nuevos.
El uso de computadores y la consiguiente creación de grandes bases de
datos bibliográficos, ha requerido de una indización cada vez más precisa y
detallada, lo que ha elevado los costos del análisis de los documentos. Esto, a
su vez, ha significado la creación de grandes sistemas cooperativos y
centralizados. Pero, como la centralización no siempre ha resultado eficiente,
se han desarrollado centros de información altamente especializados en un
intento de mejorar algunas de sus limitaciones.

2
La rapidez del procesamiento del computador ha sugerido la opción de
ahorrar en indización y realizar búsquedas en texto libre, no sólo en los
resúmenes sino también en el texto completo. Esto que pudiera aparecer la
panacea, tiene grandes limitaciones y termina encareciendo la búsqueda.
La moderna tecnología de las comunicaciones ofrece la opción de
transmitir información en la forma de datos, de voces, de imágenes. Además,
usando esta tecnología, los recursos de información de diferentes
organizaciones pueden compartirse, al permitir la consulta remota a través de
un apropiado sistema de redes y el uso de computadores de tiempo
compartido. Así, podamos contemplar a un usuario sentado frente a una
terminal remota interactuando en tiempo real con una multiplicidad de fuentes
de información. Sin embargo, el traslado de la teoría de la práctica, ha
significado gran cantidad de esfuerzo y obstáculos que salvar, no sólo desde el
punto de vista computacional, sino también desde el punto de vista de los
vocabularios, de las políticas de indización, del comportamiento de los usuarios
ante la búsqueda, y de la formación de los bibliotecarios y otros especialistas
en información, sólo para mencionar algunos aspectos involucrados.
La presión por una profundización en el análisis temático de los
documentos se ha hecho evidente a medida que crece la cantidad y la
diversificación del material publicado, llegando al punto en que los sistemas
tradicionales de clasificación e indización ya no son capaces de entregar los
resultados esperados, en términos de precisión, relevancia y limitaciones de
cantidad, ante una búsqueda en particular. Esto, a su vez, requiere una
especificación precisa de las solicitudes del usuario, demandando
entrenamiento para este usuario y especialización para el operador del
sistema.
Este libro intenta entregar los aspectos básicos que necesita dominar un
profesional para participar en sistemas modernos de análisis y recuperación de
información documental, y ha sido escrito procurando entregar un enfoque
unificado y sistemático del tema.
La tesis básica de este trabajo, es que la recuperación de información
es parte de un complejo sistema de comunicación existente entre los autores
de la información contenida en los documentos y los usuarios de tal
información. Entonces, el papel principal de los trabajadores de información, es

3
planificar, diseñar, crear y desarrollar canales o puentes para esta
comunicación. Por lo tanto, su preocupación primaria es la organización de la
información para que pueda ser recuperada.
El análisis y la recuperación de información son procesos totalmente
relacionados e interdependientes. Sin embargo, con el propósito de
sistematizar, y en cierto modo simplificar, los diferentes temas que serán
tratados en este libro, la temática ha sido dividida en dos partes bien precisas:
el “análisis de información”, vale decir, la indización, la preparación de
resúmenes, codificación, y otros procedimientos que se realizan con la
información que llega al sistema, y la “recuperación de información”, que son
los procedimientos que se realizan para encontrar la información que ha sido
analizada y almacenada.
Aun cuando gran parte de los temas que se discutirán aquí son
extrapolables a otras situaciones, dentro del contexto de este libro, al hablar de
sistemas de información, nos estamos refiriendo, concretamente, a sistemas de
información documental o bibliográfica.
Es importante destacar, además, que el análisis estará en los aspectos
intelectuales, por sobre los mecanismos, de los diferentes procesos que se
realizan en una unidad de información con el propósito de crear una
herramienta capaz de conectar la información contenida en una colección de
documentos con las consultas de un potencial usuario. A esta herramienta la
llamaremos, genéricamente, archivo de búsqueda.
Este archivo de búsqueda es el dispositivo que permite almacenar la
información relativa a una colección de documentos, y donde, posteriormente,
es posible buscar a fin de recuperar los documentos que sean relevantes frente
a una consulta o pregunta específica.
Nos hemos referido al análisis y la recuperación de información, como
acciones que se realizan dentro de un Sistema de Información. Utilizamos la
expresión “sistema” queriendo significar un conjunto de operaciones
interconectadas, una secuencia de acciones realizadas por, con o sobre un
conjunto de componentes interactuantes.
El diseño, el desarrollo, la operación y la evolución de los sistemas de
recuperación de información, necesitan del enfoque sistemático. Dicho en
otras palabras, sus operaciones y componentes deben ser vistos como un todo

4
y, a la vez, en cada una de sus partes y detalles. El enfoque sistémico significa
reconocer que en un sistema el cambio o modificación de una variable o
componente afectará a una o más de las restantes variables o, en algunos
casos, al total de ellas.
Esta característica de los sistemas es particularmente cierta cuando se
trata del análisis y recuperación de información. Así, las políticas, metodologías
y procedimientos utilizados en el análisis de los documentos, afectarán
directamente los resultados de la búsqueda de información en la etapa de
recuperación.
Un sistema de información, como sería una biblioteca, un centro de
documentación, una base de datos bibliográficos, etc., desde el punto de vista
del análisis y recuperación de información, es un fenómeno complejo que
abarca, fundamentalmente, cuatro componentes:

a) Documentos: Dentro del contexto de un sistema de


recuperación de información, se entiende por documento, cualquier
registro del conocimiento susceptible de ser descrito y analizado para
su posterior recuperación y uso (libro, capítulo de un libro, artículo de
revista, colección de varios volúmenes, tesis, película, fotografía,
etc.).
b) Una breve descripción o perfil de los documentos y de las
preguntas o consultas que lleguen al sistema.
c) Un mecanismo que permita confrontar esas descripciones
(de los documentos y de las preguntas), en busca de una
coincidencia.
d) Personas. Las personas involucradas en cualquier sistema de
recuperación de información, son de dos tipos:
 Personal de la unidad u operadores del sistema, que son
quienes describen, resumen y/o indizan los documentos que
ingresan. Mantienen un archivo de búsqueda con las
descripciones de los documentos y exploran o buscan en tal
archivo.
 Los usuarios que son quienes plantean preguntas o consultas
al sistema.

5
La figura 1 muestra un diagrama que es una adaptación del que aparece
en un libro publicado por Lancaster en el año 1968 1. Aquí se intenta resumir las
actividades básicas de análisis y recuperación que suelen darse en cualquier
sistema de información. Muestra con extraordinaria claridad la idea de
confrontación de perfiles, de documentos y de preguntas, en busca de
coincidencia, que ya hemos mencionado.

1
LANCASTER, F. Wilfrid. Information Retrieval Systems. New York, John Wiley, 1968, p. 4

6
ENTRADA (Input)

DOCUMENTOS

Análisis de contenido

Vocabulario
Análisis y documentos controlado

Traducción del análisis


conceptual a términos de
indización.

Documentos Perfiles de
documentos

Documentos solicitados
Almacén
ARCHIVOS DE
BUSQUEDA
al almacenamiento (bases de datos)

Vocabulario Traducción de análisis Perfil de


controlado conceptual a términos pregunta

Análisis de contenido

PREGUNTA

SALIDA (Output)

Fig. 1. La recuperación de información.

En: Análisis y recuperación de información documental / Maria Texia, Iglesias Maturana.


– Santiago de Chile : Instituto Profesional de Santiago, 1992. p. 1 – 7