Está en la página 1de 48

Baeza-Yates, R.-Ribeiro-Neto, B. Modern information retrieval. Addison Press: New York, 1999.

Capítulo 10:
Interfaces de usuario y visualización
Trad. de Ana Sanllorenti

10.1 Introducción

Este capítulo discute las interfaces de usuario para la comunicación entre usuarios humanos que
buscan información y los SRI. La búsqueda de información es un proceso impreciso. Cuando los
usuarios se acercan a un sistema de acceso a información, tienen a menudo sólo una comprensión
difusa acerca de cómo pueden lograr su propósito. Por lo tanto, la interfaz de usuario debería
ayudarlo a comprender y expresar su necesidad de información. También debería ayudarlo a
formular sus consultas, seleccionar entre las distintas fuentes de información disponible,
comprender los resultados de la búsqueda, y seguir el progreso de su búsqueda.

La interfaz hombre-computadora es menos comprendida que otros aspectos del la RI, en parte
porque los seres humanos son más complejos que las computadoras, y sus motivaciones y
conductas son más difíciles de medir y caracterizar. Como el área está cambiando rápidamente, la
discusión en este capítulo enfatizará desarrollos recientes más que conocimientos ya establecidos.

Primero se delineará el lado humano del proceso de búsqueda de información y luego se focalizarán
los aspectos de este proceso que puede ser mejor soportados por la interfaz de usuario. La discusión
se encaminará hacia la práctica y tecnología actuales, las propuestas recientes de ideas innovadoras
y las sugerencias para futuras áreas de desarrollo.

La sección 10.2 presenta los principios del diseño para la interacción hombre-computadora e
introduce nociones relacionadas con la visualización de información. La sección 10.3 describe los
modelos de búsqueda de información pasados y presente. Las siguientes cuatro secciones describen
el soporte de la interfaz de usuario para comenzar el proceso de búsqueda, para la especificación de
la consulta, para ver los resultados recuperados en contexto y para la retroalimentación interactivo
por relevancia. La sección 10.8 describe las técnicas de interfaz de usuario que apoyan el proceso de
acceso a la información como un todo. La sección 10.9 especula sobre futuros desarrollo y la
sección 10.10 provee sugerencias para otras lecturas. La figura 10.1 presenta el flujo de los
contenidos de los capítulos.

Introducción

Bases de la interacción
Hombre-computadora

El proceso de acceso a la
información

Los puntos de partida

La especificación de la
consulta

Contexto

1
Juicios de relevancia

Soporte de la interfaz

Conclusiones

Figura 10.1 Contenidos de este capítulo

10.2 Interacción Hombre – Computadora

¿Qué es lo que hace efectiva la interfaz hombre .- computadora? Ben Schneiderman, un experto,
escribe [725, p.10]:

“Bien diseñados, los sistemas de computadora efectivos generan sensaciones positivas de éxito,
competencia, dominio y claridad en la comunidad usuaria. Cuando un istema interactivo está bien
diseñado, la interfaz casi desaparece, permitiendo al usuario concentrarse en su trabajo, exploración
o placer”.

Como pasos hacia el logro de esas metas, Schneiderman lista los principios para el diseño de
interfaces de usuario. Los particularmente importantes para el acceso a la información, incluyen:
proveer retroalimentación informativa, permitir acciones inversas sencillas, soportar control interno
(internal locus of control) , reducir la carga de la memoria de trabajo, y proveer interfaces
alternativas para usuarios iniciales y expertos. Cada uno de estos principios debería ser instanciado
de forma diferente en cada aplicación particular de la interfaz. En adelante discutimos estos
principios que son de especial interés para los sistemas de acceso a la información.

10.2.1 Principios del Diseño

Ofrecer retroalimentación informativa: Este principio es especialmente importante para las


interfaces de acceso a la información. En este capítulo veremos las ideas actuales acerca de cómo
proveer a los usuarios con retroalimentación acerca de las relaciones entre la especificación de su
consulta y los documentos recuperados, acerca de las relaciones entre los documentos recuperados,
y acerca de las relaciones entre los documentos recuperados y los metadatos que describen las
colecciones. Si el usuario tiene control sobre cómo y cuándo se provee la retroalimentación,
entonces el sistema provee un control interno (internal locus of control)

Reducir la carga de memoria de trabajo: El acceso a la información es un proceso iterativo, cuyas


metas cambian a medida que la información es encontrada. Una manera clave en que las interfaces
de acceso a la información pueden ayudar en mantener la memoria, es proveer mecanismos para
guardar rastros de las elecciones realizadas durante el proceso de búsqueda, permitiendo a los
usuarios retornar a las estrategias abandonadas temporariamente, saltar de una estrategia a la
siguiente, y retener información y contexto a lo largo de las sesiones de búsqueda. Otro dispositivo
para ayudar a la memoria es proveer información revisable que sea relevante en la etapa corriente
del proceso de acceso a la información. Esto incluye sugerencias de términos relacionados o de
metadatos, y puntos de partida de búsquedas que incluyan listas de fuentes y listas de temas.

Proveer interfaces alternativas para usuarios iniciales y expertos: Un punto de tensión importante
en el diseño de interfaces de usuarios es el de la simplicidad versus potencia. Las interfaces simples
son fáciles de aprender, a expensas de menor flexibilidad y a veces uso menos eficiente. Las
interfaces poderosas permiten a un usuario conocedor hacer más y tener más control sobre la

2
operación de la interfaz, pero pueden consumir más tiempo para ser aprendidas e imponen un
esfuerzo de memoria para las personas que usan el sistema de forma intermitente. Una solución
común es usar una técnica con un “andamio de apoyo” (scaffolding). Se presenta al usuario inicial
una interfaz simple que puede ser aprendida rápidamente y que provee la funcionalidad básica de la
aplicación, pero que es restringida en cuanto a potencia y flexibilidad. Se ofrecen interfaces
alternativas para usuarios más experimentados, permitiendo más control, más opciones y más
características, o eventualmente modelos de interacción completamente diferentes. Los buenos
diseños de interfaces proveen puentes intuitivos entre las interfaces simples y las avanzadas.

Las interfaces de acceso a la información deben enfrentar la dificultad del equilibrio entre la
simplicidad y la potencia. Una de esas dificultades es la cantidad de información que se muestra
acerca de los trabajos del sistema de búsqueda. Los usuarios nuevos de un sistema o de una
colección pueden no saber demasiado acerca del sistema o del dominio asociado con la colección,
como para hacer elecciones entre características complejas. Pueden no saber cómo pesar o valorar
los términos, o, en el caso de retroalimentación por relevancia, no saber cuáles serían los efectos de
la revaloración de los términos. Por otra parte, los usuarios que han trabajado con un sistema
probablemente sean capaces de elegir entre términos sugeridos para agregar a su consulta mayor
información. Determinar cuánta información se debe mostrar al usuario es una de las decisiones
principales en el diseño de interfaces de acceso a la información.

10.2.2 El rol de la visualización

Las herramientas del diseño de interfaces de computadora son familiares para la mayoría de los
usuarios de hoy: ventanas, menúes, íconos, cajas de diálogos, etc. Estos recursos hacen uso de
despliegue de mapas de bits y gráficos para proveer una interfaz más accesible que las
visualizaciones basadas en comandos. Un área menos familiar pero en crecimiento es la de la
visualización de la información, que intenta proveer representaciones visuales de espacios de
información muy grandes.

Los seres humanos están acostumbrados a las imágenes y a la información visual. Los cuadros y los
gráficos puede ser cautivantes si están bien diseñados. Una representación visual puede comunicar
algunas clases de información mucho más rápida y efectivamente que cualquier otro método.
Consideremos la diferencia entre la descripción escrita de la cara de una persona y su fotografía, o
la diferencia entre una tabla de números que contienen una correlación y un gráfico que representa
la misma información.

La aparición creciente de rápidos procesadores de gráficos y de monitores de color de alta


resolución incrementa el interés en la visualización de información. La visualización científica, una
rama en rápido avance, mapea fenómenos físicos en representaciones de dos o tres dimensiones. Un
ejemplo de este tipo de visualización es la imagen color de patrones de picos y valles en el suelo del
océano; esto provee una vista de fenómenos físicos que actualmente la fotografía no puede cubrir.
La imagen se construye a partir de datos que representan los fenómenos subyacentes.

La visualización de información abstracta es más difícil y la visualización de información


representada textualmente constituye un desafío. El lenguaje es nuestro principal medio de
comunicación para las ideas abstractas, para las cuales no hay manifestaciones físicas obvias.
¿Cómo luciría un cuadro que describiera negociaciones en las que una parte demandara concesiones
en políticas ambientales mientras que otra parte requiriera su refuerzo?

A pesar de las dificultades, los investigadores están intentando representar aspectos del proceso de
acceso a la información utilizando técnicas de visualización de la información. Además de usar

3
iconos y resaltadores de color, las principales técnicas de visualización de información incluyen
pintado (brushing) y linking, paneo y zoom, foco – más – contexto, lentes mágicos, y el uso de
animación para retener el contexto y ayudar a hacer visible la información oculta. Estas técnicas
soportan uso dinámico e interactivo. La interactividad parece ser una propiedad especialmente
importante para visualizar información abstracta, a pesar de que no ha tenido un rol destacado en la
visualización de información científica.

El pintado (brushing) y linking refieren a la conexión de dos o más vistas de los mismos datos, de
modo tal que un cambio en la representación de una vista afecta la representación en las demás. Por
ejemplo, imaginemos un vista que consiste en dos partes: un histograma y una lista de títulos. El
histograma muestra, para un conjunto de documentos, cuántos documentos fueron publicados cada
año. La lista de títulos muestra los títulos de los documentos correspondientes. El pintado
(brushing) y linking permitiría al usuario asignar un color, por ejemplo rojo, a una barra del
histograma, lo que causaría que también se pintaran de rojo los títulos de la lista correspondientes al
año pintado en el histograma.

El paneo y el zoom refieren a acciones de una cámara móvil que puede barrer de lado a lado una
escena (paneo) o acercarse y alejarse para conseguir una vista más amplia o más focalizada (zoom).
Por ejemplo, el agrupamiento de textos puede ser usado para mostrar una vista de los principales
temas en una colección de documentos (Figures 10.7 y 10.8). El zoom puede ser usado para
acercarse, y mostrar los documentos individuales como íconos, y aún más cerca para ver el texto
asociado con un documento individual.

En la utilización del zoom, cuanto más visibles son los detalles de un ítem en particular, menos
puede verse sobre los ítems que lo rodean. Foco – más – contexto se usa para aliviar en parte este
efecto. La idea es agrandar una porción de la vista –el foco de la atención- mientras se encogen los
objetos circundantes. Cuanto más lejos está un objeto del foco de atención, aparece de modo más
pequeño, como el efecto que produce un lente ojo de pescado.

Los lentes mágicos son ventanas transparentes directamente manipulables que, cuando se
superponen sobre otros tipos de datos, causan una transformación a ser aplicada a los datos
subyacentes que entonces cambian su apariencia (ver Figura 10.13). Una aplicación de los lentes
mágicos es para el dibujo de tareas. La mano izquierda puede usarse para posicionar un lente de
color sobre un objeto. La mano derecha se utiliza para cliquear sobre el lente, lo que causa la
transformación del color del objeto subyacente al especificado por el lente.

Adicionalmente, hay un gran número de métodos gráficos para representar árboles y jerarquías,
algunos de los cuales usan animación para desplegar nodos que también pueden ser ocultados.

A veces es útil combinar estas técnicas en un nivel de la interfaz que denominamos vista general
más detalles. En una ventana se muestra una vista general, como una tabla de contenido de un
manual grande. Un clik en en un capítulo, en una acción de linking produce la aparición del texto
del capítulo en otra ventana (Ver Fig. 10.19). El paneo y el zoom o el foco más contexto pueden ser
usados para cambiar la vista del contenido en la ventana general.

10.2.3 Evaluación de sistemas interactivos

Desde el punto de vista del diseño de la interfaz de usuario, las personas tienen muy diferentes
habilidades, preferencias y predilecciones. Las diferencias importantes incluyen habilidad espacial
relativa y memoria, habilidades de razonamiento, aptitud verbal y diferencias de personalidad. La
edad y las diferencias culturales pueden contribuir a aceptar o rechazar técnicas de interfaz. Una

4
innovación de la interfaz puede ser útil y plancentera para algunos usuarios, y extraña para otros.
Por tanto, el diseño de software debería permitir flexibilidad en el estilo de interacción, y considerar
que las nuevas características no serán igualmente útiles para todos los usuarios.

Un importante aspecto de la interacción hombre – computadora es la metodología de evaluación de


las técnicas de interfaz de usuario. Las medidas de acierto y precisión han sido ampliamente
utilizadas para comparar los resultados de sistemas no interactivos, pero son menos apropiadas para
evaluar sistemas interactivos. Las evaluaciones estándares enfatizan altos niveles de acierto; en
TREC (Text Retrieval Conferences, foros destinados a promover la investigación en Recuperación
de Información para grandes colecciones de texto) los sistemas de tareas son comparados para ver
cómo retornan los principales 1000 documentos (Cap.3). Sin embargo, en muchos sistemas
interactivos los usuarios requieren sólo unos pocos documentos relevantes y no les importa el
acierto alto. La métrica útil sobre acierto y precisión incluye: tiempo requerido para aprender el
sistema, tiempo requerido para conseguir las metas de cada tarea, tasas de error, y retención del uso
del la interfaz en el tiempo. En este capítulo se muestran resultados empíricos de estudios de
usuarios.

Los datos empíricos que implican a los usuarios son el tiempo consumido y la dificultad para
extraer conclusiones. Esto se debe en parte a la variación de las características de los usuarios y sus
motivaciones, y enparte al amplio alcance de las actividades de acceso a la información. Los
estudios psicológicos formales sólo han cubierto conclusiones específicas en contextos muy
restringidos. Por ejemplo, cantidades tales como el tiempo que toma al usuario seleccionar un ítem
de un menú en varias condiciones. Pero en cambio es difícil cuantificar las variaciones en el
comportamiento de la interacción para tareas complejas de acceso a información. Nielsen [605]
invoca un enfoque de evaluación más informal (llamada evaluación heurística).

10.3 El proceso de acceso a la información

Una persona involucrada en un proceso de búsqueda de información tiene una o más metas en su
mente y utiliza un sistema de búsqueda como herramienta para lograrlas. Las metas requeridas para
el acceso a información pueden ser muy variadas, desde encontrar un plomero hasta encontrar
información sobre un competidor comercial, desde escribir un artículo académico hasta realizar una
investigación para realizar una demanda por fraude.

Para lograr esas metas se llevan a cabo las tareas de acceso a la información. Estas tareas abarcan
un amplio espectro que va desde hacer preguntas específicas hasta investigar un tópico de forma
exhaustiva. En un estudio llevado a cabo por analistas de negocios [614] se encontraron tres tipos
principales de tareas de búsqueda: monitoreo de un tópico conocido a lo largo de un tiempo (tal
como investigar las actividades de la competencia cada cierto tiempo); seguir un plan de series
específicas de búsqueda para lograr una meta en particular (tal como mantenerse actualizado sobre
prácticas de negocios exitosas), y explorar un tópico de un modo indirecto (tal como cuando se
logra saber acerca de una industria no conocida). A pesar de que las metas difieren, hay un núcleo
común de componentes alrededor de la búsqueda de información.

10.3.1 Modelos de interacción

En general se asume que en el proceso de acceso a la información se da un ciclo de interacción que


consiste en la especificación de la consulta, la recepción y el análisis de los resultados; luego se
finaliza el proceso o se reformula la consulta y se repite el proceso hasta que se encuentra un
conjunto considerado perfecto [700,726]. Más detalladamente, el proceso puede ser descripto de
acuerdo a la siguiente secuencia de pasos (ver Figura 10.2):

5
1) Comienzo con una necesidad de información
2) Selección de un sistema y de una colección en los que buscar
3) Formular la consulta
4) Enviar la consulta al sistema
5) Recibir los resultados en forma de ítems de información
6) Revisar, evaluar e interpretar los resultados
7) Finalizar o
8) Reformular la consulta e ir al paso 4

Este modelo simple de interacción (utilizado por los motores de búsqueda en la Web) es el que
utilizan la mayoría de los que buscan información en la actualidad. Este modelo no toma en
consideración que muchos usuarios se disgustan ante una gran lista de resultados desorganizados
que no refieren directamente a sus necesidades de información. También incluye un supuesto: la
necesidad de información del usuario es estática y el proceso de búsqueda de información es una
sucesión de refinamientos de una consulta hasta que se recupera todos y sólo los documentos
relevantes a la necesidad de información original.

Necesidad de
información

Consulta

Enviar al
sistema

Recibir los
resultados

Reformular
Evaluar los
resultados

Si

No
Satisfacció
n?

Fin

Figura 10.2 Diagrama simplificado del modelo estándar del proceso de acceso a la información

6
En realidad, los usuarios aprenden durante el proceso de búsqueda. Ellos revisan la información,
leen los títulos en los resultados, leen los documentos recuperados, ven las listas de tópicos
relacionados con los términos de búsqueda, y navegan por los sitios Webs relacionados por
hipervínculos. El advenimiento de los hipervínculos como parte central del proceso de búsqueda de
información, hace imposible ignorar el rol de la revisión (scanning) y de la navegación como partes
del mismo proceso. En particular, y mucho más que en las búsquedas bibliográficas hoy es muy
común que se intenten aproximaciones utilizando los hipervínculos de la Web, en la espera de
encontrar una página útil luego de algunos saltos por diferentes sitios o páginas.

Ese modelo también subestima la interacción que tiene lugar cuando el usuario revisa términos
sugeridos como resultado de un proceso de retroalimentación por relevancia, revisa una estructura
de tesauro, o visualiza esquemas temáticos de una colección de documentos. Ese modelo tampoco
valora suficientemente el rol de la selección de fuentes que está adquiriendo creciente importancia
desde que hay disponibles miles de colecciones de información.

Por estas razones, a pesar de que es útil para describir las bases del proceso de acceso a la
información, está siendo muy criticado [65,614,105,365,192]. Bates [65]propone el modelo
”recoger granos” (“berry-picking”), que contiene dos puntos principales. El primero es que, como
resultado de la lectura y aprendizaje a partir de la información encontrada en el proceso de
búsqueda, continuamente cambian tanto la necesidad de información del usuario como la
formulación de las consultas. La información encontrada en un punto de la búsqueda puede
producir un cambio no previsto de dirección de la misma. La meta original puede lograrse de forma
parcial y cambiar la prioridad de una meta en relación con otra. Esto contradice el supuesto de que
la necesidad de información del usuario permanece inamovible durante el proceso de búsqueda. El
segundo punto de este modelo es que las necesidades de información del usuario no son satisfechas
por un único conjunto final de documentos recuperados, sino por una serie de selecciones y bits de
información encontrados a lo largo del proceso. Esto contradice el supuesto de que la principal meta
de un proceso de búsqueda es encontrar el conjunto perfecto de documentos que satisfacen la
necesidad original de información.

El modelo “berry-picking” está respaldado por una cantidad de estudios observacionales [236,105]
incluyendo los de O´Day y Jeffries [614]. Ellos encuentran que el proceso de búsqueda de
información consiste en una serie de búsquedas interconectadas pero diversas sobre un tema base.
También encuentran que los resultados de una búsqueda tienden a plantear nuevas metas y producen
cambios de dirección de la búsqueda, pero esto se va produciendo en etapas. También plantean que
el principal valor de una búsqueda reside en el aprendizaje acumulado y en la adquisición de
información que se produce durante el proceso, más que en el conjunto de resultados finales.

En consecuencia, una interfaz de usuario para el acceso a la información debería permitir a los
usuarios cambiar sus metas y ajustar sus estrategias de acuerdo con estos cambios. Puede ocurrir
que un usuario encuentre un disparador que produzca un cambio temporario de estrategia, quizás
para retornar más tarde a la actividad inicial. Una consecuencia de estas observaciones es que la
interfaz debería permitir dejar y seguir rastros de las actividades realizadas. Esto puede lograrse en
parte mediante recursos para grabar el progreso de la estrategia y almacenar, encontrar y volver a
cargar los resultados intermedios. También debería permitir el seguimiento de varias estrategias de
forma simultánea.

La interfaz de usuario debería contener formas de monitorear el estado de la estrategia en relación


con las tareas que está realizando el usuario y con las metas que se ha propuesto. Una de las
maneras puede ser a través de un análisis de costo / beneficio. Estos análisis suponen que en

7
cualquier punto del proceso de búsqueda, el usuario persigue la estrategia que tiene la mayor
expectativa de utilidad. Si, como consecuencia de alguna elección táctica, otra estrategia se presenta
como de mayor utilidad, la anterior será temporaria o permanentemente abandonada a favor de la
nueva.

Hay algunas teorías que contrastan el browsing, el realizar consultas, el navegar y el revisar
(browsing, querying, navigating y scanning). Nosotros asumimos que el usuario revisa una
estructura de información, sea en títulos, términos de tesauros, hipervínculos, categorías, o el
resultado de clustering (agrupamiento automático), y entonces o selecciona un ítem para algún
propósito (lectura en detalle, para usarlo como input de otra consulta, para navegar a otra página), o
formula una consulta (utilizando algunas palabras o seleccionando categorías). En ambos casos, se
hace visible para su revisión un nuevo conjunto de información. Las consultas tienden a producir
colecciones de información que no habían sido reunidas con anterioridad, mientras que la selección
de categorías recupera información que había sido previamente compuesta u organizada. La
navegación se refiere al seguimiento de una cadena de links, con alguna meta en particular, en una
secuencia de operaciones de revisión y selección. El browsing se refiere a una exploración no
dirigida y casual, de estructuras de información. Usualmente es realizada en forma conjunta con
selecciones, a pesar de que pueden realizarse consultas para crear subcolecciones sobre las que
realizar un posterior browsing. Un aspecto importante del proceso de interacción es que la salida
producto de una acción debería poder ser utilizada fácilmente como entrada en el paso siguiente.

10.3.2 Las partes no-búsqueda en el proceso de acceso a la información

El estudio O´Day y Jeffries [614] halló que la búsqueda de información es sólo una parte del
proceso de trabajo completo que realizan las personas. Durante las sesiones de búsqueda se realizan
diferentes clases de trabajo con la información recuperada, por ejemplo leer, anotar y analizar. Esos
autores analizaron los pasos de análisis en mayor detalle, encontrando que el 80 % del trabajo puede
clasificarse en seis tipos principales: encontrar tendencias, hacer comparaciones, agregar
información, identificar conjuntos críticos, valorar, e interpretar. El 20 % restante consiste en
realizar referencias cruzadas, sumarizar, encontrar visualizaciones evocativas para los informes, y
otras actividades misceláneas. El trabajo de Russell et al [690] “Sensemaking” (construcción de
sentido) presenta el trabajo de información como un proceso en el que la recuperación de
información es sólo una pequeña parte. Ellos observan que la mayor parte del esfuerzo realizado en
Sensemaking se encuentra en la síntesis de una buena representación, o en las vías de pensamiento
acerca de algo. Describen el proceso de formular y cristalizar los conceptos importantes para una
tarea dada.

A partir de estas observaciones es conveniente dividir el proceso completo de acceso a la


información en dos componentes principales: búsqueda y recuperación, y análisis y síntesis de los
resultados. Las interfaces de usuario deberían permitir combinar ambos tipos de actividad. Sin
embargo, el análisis / síntesis son actividades que pueden ser hechas con independencia de la
búsqueda de información, y nos parece útil hacer una distinción entre ambos tipos de actividades.

10.3.3 Primeros Estudios de Interfaces

La mayor parte de la literatura sobre el comportamiento de la búsqueda de información hombre –


computadora, se relaciona con los intermediarios de información que usan sistemas en línea que
consisten en registros bibliográficos [546,707,104], a veces con costos valorados por unidad de
tiempo. Desafortunadamente, muchos de los supuestos de estos estudios no reflejan las condiciones
del acceso moderno a la información [335,222] Las diferencias son:

8
 Actualmente el texto buscado es a menudo texto completo y no citas bibliográficas. Como los
usuarios tienen acceso al texto completo, más que a sustitutos de los documentos, es más
probable que las búsquedas simples encuentren respuestas relevantes como parte del procesos
de búsqueda.
 Los sistemas modernos usan ranking estadístico (que son más efectivos cuando se dispone de
texto completo y de abstracts, que cuando se trata de citas), mientras que la mayoría de estos
estudios se realizaron sobre sistemas booleanos.
 La mayoría de las búsquedas actuales son realizadas por usuarios finales, más que por
profesionales intermediarios, que era el foco de los tempranos estudios.
 Hoy hay disponibles decenas de miles de fuentes en línea y en red, y muchos están relacionados
por hipervínculos, a diferencia de las colecciones separadas pertenecientes a diferentes
servicios. Los primeros estudios generalmente usaron sistemas en los que cambiarse de una
colección a otra requería un conocimiento y tiempo considerable.
 Finalmente, muchos usuarios tienen acceso a muestras de mapas de bits que permiten la
manipulación directa, o pueden llenar formularios. La mayoría de los estudios tempranos y de
los sistemas bibliográficos se implementaron con comandos en línea, que requerían una sintaxis
y no tenían formas para mostrar el contexto.

A pesar de estas diferencias significativas, algunas estrategias generales de búsqueda de


información parecen mantener su valor a través de los diferentes sistemas. Por otra parte, si bien los
sistemas modernos ha resuelto muchos de los problemas de los primeros OPACs, también han
introducido nuevos problemas.

10.4 Puntos de partida

Las interfaces de usuario deben proveer a los usuarios con buenas formas para iniciar su trabajo.
Una pantalla vacía o un formulario en blanco no ayudan al usuario a decidir cómo iniciar el proceso
de búsqueda. Por lo general un usuario no comienza con una detallada expresión de su necesidad de
información. Los estudios muestran que los usuarios tienden a comenzar con consultas muy breves,
analizan el resultado, y luego modifican las consultas en un ciclo de retroalimentación incremental.
La consulta inicial puede ser vista como una prueba para ver los resultados y a partir de allí hacerse
una idea de cómo reformular la consulta. En consecuencia, una tarea de la interfaz de acceso a la
información, es ayudar a los usuarios a seleccionar las fuentes y colecciones en las que buscar
información.

Por ejemplo, hay muchas fuentes de información asociadas con el tema cáncer, y son muchas las
clases de información que un usuario podría querer conocer acerca del tema. Mediante una correcta
guía al usuario, este podría resolver el problema inicial de la formulación. La búsquedas
bibliográficas tradicionales suponen que el usuario comienza mirando una lista de nombres de
fuentes y elige en cuáles colecciones buscar; en cambio los motores de búsqueda en la Web
eliminan las diferencias entre fuentes y arrojan al usuario en medio de un sitio Web con poca
información acerca de la relación entre ese acierto de la búsqueda y el resto de la colección. En
ninguno de los dos casos la interfaz disponible es demasiado útil.

En esta sección presentaremos cuatro tipos de puntos de partida: listas, vistas generales (overviews),
ejemplos, y selección automática de fuentes.

10.4.1 Listas de colecciones

9
Los sistemas en línea típicos, como LEXIS-NEXIS requieren que los usuarios comiencen una
búsqueda con una revisión de una larga lista de nombres de fuentes y supongan cuáles serán de
interés. Generalmente se provee poca información en línea sobre el contenido de estas fuentes (ver
Figura 10.3). Si el usuario no es satisfecho con los resultados de una colección, tiene que
redireccionar su búsqueda en otra dirección (colección).

Los usuarios habituales aprenden qué conjuntos de fuentes les son útiles para sus dominios de
interés, ya sea a través de la experiencia, la capacitación formal, o por recomendaciones de sus
colegas. Las fuentes más utilizadas pueden registrarse en listas de favoritos en la Web. Existen
investigaciones que exploran el mantenimiento de perfiles de información personalizados para
usuarios o grupos de trabajo, basados en las clases de información que han utilizado anteriormente.
[277]

Figura 10.3 Pantalla de selección de LEXIS-NEXIS

Sin embargo, cuando los usuarios quieren buscar fuera de sus dominios de especialidad, no es
suficiente una lista de fuentes familiares. Los buscadores de información profesionales, como los
bibliotecarios, aprenden a través de la experiencia y años de entrenamiento, cuáles fuentes son
apropiadas para diferentes necesidades de información. La naturaleza restrictiva de las interfaces
tradicionales desalienta la exploración y descubrimiento de nuevas fuentes. Recientes
investigaciones han ideado diferentes mecanismos para ayudar a la comprensión del contenido de
las colecciones como forma de iniciar una búsqueda.

10.4.2 Vistas generales

10
¿Como puede comenzar un usuario que se enfrenta con un conjunto grande de colecciones de
texto?. Una posibilidad es analizar una vista general del contenido de las colecciones. Tal vista
general puede mostrar los dominios temáticos representados en la colección, para ayudar al usuario
a seleccionar o eliminar fuentes. Una vista general puede ayudar a los usuarios a comenzar,
dirigiéndolos hacia “barrios” temáticos generales, después de lo cual pueden recorrer usando
descripciones más detalladas. Shneiderman [724] propone un modelo de interacción en el cual el
usuario comienza con una vista general de la información con la que va a trabajar, luego panea
(recorre panorámicamente) y realiza zooms para encontrar áreas de interés potencial, y entonces
mira los detalles. El proceso se repite tantas veces como sea necesario.
En esta subsección se presentan tres tipos de vistas generales. La primera es la muestra y
navegación de una jerarquía de categorías temáticas asociada con los documentos de una colección.
El segundo tipo lo constituyen las vistas generales construidas de forma automática, generalmente
elaboradas mediante técnicas de clustering sobre los textos de los documentos. El tercer tipo de
vista general es el que se crea mediante la aplicación de variantes del análisis de co-citación sobre
conexiones o vínculos entre diferentes entidades en una colección. Otra clase de vistas generales
son las que, por ejemplo, muestran representaciones gráficas de estanterías o pilas de libros [681,
46]

Vistas generales de categorías o directorios

Hoy existen grandes colecciones en línea de colecciones de textos a los que se les han asignado
etiquetas con categorías temáticas. Los sistemas bibliográficos tradicionales han asignado por
décadas encabezamientos de materia a los libros y otros documentos [752]. MEDLINE, una
colección de artículos biomédicos utiliza el Medical Subjects Headings, que contiene
aproximadamente 18.000 categorías [523]. Las Association for Computing Machinery (ACM)
desarrolló una jerarquía de aproximadamente 1.200 categorías (palabras clave) (http://
www.acm.org/class/). Yahoo [839] organiza las páginas Web en una jerarquía de miles de
categorías.

La popularidad de Yahoo y de otros directorios Web sugiere que las categorías organizadas
jerárquicamente son puntos de partida útiles para los usuarios que buscan en a Web. Esta
popularidad puede reflejar una preferencia respecto de comenzar con un inicio lógico, o puede
también denotar el deseo de evitar tener que pensar qué palabras debería ser utilizadas para
recuperar la información deseada. (También puede reflejar el hecho de que los servicios con
directorios intentan mejorar la calidad de algunos sitios Web).

El significado de las etiquetas de categorías difiere entre las distintas colecciones. La mayoría están
diseñadas para ayudar a organizar los documentos y en la especificación de las consultas.
Desafortunadamente, los usuarios de los catálogos bibliográficos en línea raramente utilizan los
encabezamientos de materia disponibles [335, 222]. Hancock-Beaulieu y Drabenstott y Weller,
entre otros, han planteado la pobreza de las interfaces basadas en comandos, para proveer ayuda en
la selección de etiquetas temáticas y requerir de los mismos la revisión de largas listas alfabéticas.
Aún en las interfaces gráficas de la Web, encontrar el lugar adecuado con una jerarquía de
categorías puede ser una tarea que insuma mucho tiempo, y una vez que ha sido encontrada la
colección usando ese tipo de representación, se requiere un medio alternativo para buscar en el sitio
mismo.

La mayoría de las interfaces que presentan de modo gráfico categorías jerárquicas lo hacen
asociando los documentos a la categoría a la que han sido asignados. Por ejemplo, al clikear en una
categoría en Yahoo, se despliega la lista de documentos que han sido asignados a esa etiqueta de

11
categoría. Conceptualmente, el documento es almacenado con esa etiqueta. Para utilizar la lista de
categorías para realizar búsquedas en Yahoo, el usuario debe elegir la que considere más apropiada
para contener referencias de su interés temático. Una elección incorrecta requiere que vuelva atrás y
trate nuevamente, recordando qué páginas contienen qué información. Si la información deseada se
encuentra en un nivel muy específico de la jerarquía, o no está disponible, esto se convierte en un
proceso muy largo y probablemente frustrante. Como conceptualmente los documentos están
almacenados “dentro” de las categorías, los usuarios no pueden crear consultas basadas en la
combinación de categorías.

Figura 10.4 La interfaz MesHBrowse para ver jerárquicamente las etiquetas de categorías

Es difícil diseñar una buena interfaz que integre la selección de categorías dentro de la
especificación de la consulta, en parte porque la visualización de jerarquías de categorías ocupa
gran cantidad de espacio en la pantalla. Por ejemplo, Internet Gratefull Med
(http://igm.nlm.nih.gov:80/) es un servicio Web que permite una integración de las búsquedas con
visualización y selección de categorías MeSH. Después que el usuario tipea el nombre de una
categoría, se despliega una larga lista de opciones en una página. Para ver más información acerca
de una categoría, el usuario selecciona un link (por ejemplo Radiation Injuries, Lesiones por
Radiación). Esto produce que desaparezca el contexto de la consulta y que aparezca una nueva
página Web que muestra los ancestros del término y sus descendientes inmediatos. Si el usuario
intenta ver los hermanos del término padre (Wound and Injuries, Heridas y Lesiones), aparece una
nueva página que cambia otra vez el contexto. Al volver a la consulta, desaparece la ilustración de
las categorías.

El sistema MeSHBrowse [453] permite entonces que sólo se muestre el subconjunto relevante de la
jerarquía, haciendo más fácil el browsing de una jerarquía total muy extensa. La interfaz tiene las
limitaciones de espacio inherentes a las visualizaciones de jerarquías bidimensionales y no provee
mecanismos para buscar en una colección de documentos subyacente. Ver Figura 10.4.

El sistema HiBrowse [646] representa metadatos de categorías de un modo más eficiente,


permitiendo a los suarios desplegar varios subconjuntos diferentes de metadatos de categorías
simultáneamente. El usuario primero selecciona qué tipo de atributos (o facetas, como se llaman los

12
atributos en este sistema) va a visualizar. Por ejemplo, el usuario puede elegir primero ‘ physical
disease’ (enfermedad física) como valor para la faceta Disease (Enfermedad). Las categorías que
aparecen un nivel por debajo se muestran junto con el número de documentos que contiene cada
categoría. El usuario puede entonces seleccionar otro tipo de atributos Therapy and Groups (by
age), Terapia y grupos (por edad). Se muestran los números de documentos que contienen atributos
de los tres tipos. Si ahora el usuario selecciona un refinamiento de una de las categorías, tal como el
valor ‘child’ (‘niño’) del atributo Grupos, entonces se muestra el número de documentos que
contienen los tres tipos de facetas seleccionadas. Al mismo tiempo, se actualiza el número de
documentos que contienen las subcategorías que se encuentran bajo ‘physical desease’,
(‘enfermedad física’) y ‘therapy (general)’, (‘terapia (general)) para reflejar esta especificación. Ver
Figura 10.5. Un problema con el sistema HiBrowse es que requiere que el usuario navegue a través
de la jerarquía de categorías, más que la especificación directa de las consultas. En otras palabras, la
especificación de la consulta no está estrechamente asociada con la visualización de las categorías.
Como solución a alguno de estos problemas, se describe la interfaz Cat-a-Cone en la sección 10.8

Figura 10.5 La interfaz HiBrowse para la visualización de etiquetas de categorías jerárquicamente


y de acuerdo con facetas

Vistas generales de colecciones, construidas automáticamente

Muchos intentos de mostrar vistas generales de información se han focalizado en la extracción


automática de los temas más generales comunes que aparecen en la colección. Estos temas se
derivan a través del uso de métodos de análisis automático, generalmente variantes del clustering de
documentos. El clustering organiza documentos en grupos basados en algún criterio de similaridad;
los centroides de los clusters determinan los temas en la colección.

13
El paradigma de browsing Scatter/Gather (dispersar, reunir)[203,202] agrupa documentos en grupos
temáticamente coherentes, y presenta al usuario sumarios textuales descriptivos. Los sumarios
consisten en términos temáticos que caracterizan cada cluster, y un conjunto de títulos típicos que
aluden al contenido del cluster. Informado a través de los sumarios, el usuario puede seleccionar un
subconjunto de clusters que le parecen de interés, y volver a hacer un cluster con su contenido
(reclustering). De este modo el usuario puede examinar el contenido de cada subcolección refinando
los detalles. El reclustering se efectúa en el momento; diferentes temas se producen dependiendo de
los contenidos en la subcolección en la que se aplica el clustering. La elección del algoritmo de
clustering influye en qué cluster se obtiene, pero ningún algoritmo se ha mostrado particularmente
mejor que otro cuando se produce el mismo número de clusters. [816]

Un estudio de usuarios [640] mostró que el uso de Scatter/Gather en una colección grande de textos
expresa algo del contenido y estructura del corpus. Sin embargo, este estudio también mostró que el
uso de Scatter/Gather sin una facilidad de búsqueda era menos efectivo que una búsqueda por
similaridad estándar. Esto es, las personas que podían navegar solamento (no buscar), en una
estructura jerárquica de clasters que cubría la colección completa, encontraban menos documentos
relevantes que las personas que podían escribir una consulta y revisar a través de los resultados
recuperados.
Es posible integrar Scatter/Gather con tecnología de búsquedas convencionales aplicando clustering
a los resultados de una consulta para organizar los documentos recuperados (ver Figura 10.6). Una
experiencia offline [359] mostró que el clustering puede ser más efectivo si se utiliza de esta
manera. El estudio encontró que los documentos relevantes a la consulta tendían a estar
principalmente en uno o dos de los cinco clusters, si los clusters eran generados a partir de los
documentos recuperados rankeados al principio. El estudio también mostró que el acierto y la
precisión eran más altos en el mejor cluster que en todos los resultados como un todo. La
consecuencia es que un usuario puede emplear tiempo mirando el contenido de un cluster con la
más alta proporción de documentos relevantes, y al mismo tiempo evitar aquellos clusters que
contienen muchos documentos no relevantes.

Es probable que los temas generales puedan extraerse mediante el clustering, pero la naturaleza
automática del clustering puede resultar en una visualización de tópicos de diferentes niveles de
descripción. Por ejemplo, con un clustering en una colección de documentos sobre computación,
pueden resultar clusters que contengan documentos acerca de inteligencia artificial, teoría de la
computación, gráfica computacional, arquitectura computacional, lenguajes de programación,
gobierno, aspectos legales. Los últimos dos temas son más generales que los demás ya que son
tópicos que están fuera del alcance de las ciencias de la computación.

14
Figura 10.6 Visualización de los resultados de la recuperación con clustering en Scatter / Gather

Scatter / Gather muestra una representación textual de los cluster de documentos. Los
investigadores han desarrollado varios enfoques para mapear documentos en un espacio documental
que puede ser en dos dimensiones en la que cada documento es representado como un icono o un
glifo (glyph), o en un espacio abstracto de dos dimensiones. Las funciones para transformar los
datos en el espacio dimensional más bajo (o inferior) difieren, pero el efecto red consiste en que
cada documento es ubicado en un punto representado en el espacio . Los usuarios pueden detectar
temas o clusters en los grupos de signos o glifos. Entre los sistemas que utilizan este tipo de
visualización gráfica se incluye a BEAD [156], Galaxy of News [671], y ThemeScapes [821]. La
visualización de ThemeScapes presenta una representación tridimensional en el resultado del
clustering (ver Figura 10.7). El sistema hace uso de un “espacio negativo” para enfatizar las áreas
de concentración donde aparecen los clusters. Otros sistemas muestran de modo jerárquico la
similaridad inter-documental [529,14], mientras que otros muestran los documentos recuperados en
redes basadas en similaridad inter-documental [262,761].

El algoritmo de mapa de características de Kohonen ha sido utilizado para la creación de mapas que
caracterizan gráficamente el contenido total de una colección de documentos [520,163] (ver Figura
10.8). Las regiones del mapa en dos dimensiones varían en medida y forma de acuerdo con la
frecuencia de los documentos asignados a los temas correspondientes que aparecen en la colección.
Las regiones se caracterizan por palabras simples o frases y la adyacencia de regiones refleja
relaciones semánticas de los temas de la colección. Al mover el cursor sobre una región, parecen en
una ventana de tipo pop-up los títulos de los documentos que se asocian más cercanamente con la
región marcada. Los documentos pueden ser asociados con más de una región.

15
Figura 10.7 Vista general en tres dimensiones basada en clustering de documentos [821]

Evaluación de Vistas generales Gráficas

A pesar de su apariencia intuitiva, las vistas generales de grandes espacios documentales deben
todavía demostrar que son útiles y comprensibles para los usuarios. De hecho, hay evaluaciones que
proveen evidencias negativas al respecto. Un estudio encontró que para usuarios no expertos el
resultado del clustering era difícil de usar, y que las presentaciones gráficas (por ejemplo,
representar cluster con círculos y líneas que conectan los documentos, eran más difíciles que las
representaciones textuales (por ejemplo, mostrar títulos y palabras temáticas como en Scatter /
Gather), porque el contenido de los documentos es difícil de representar sin la lectura de algún
texto. [443]

Otro estudio reciente compara el mapa Kohonen con una tarea de browsing en Yahoo [163]. En una
de las tareas se les pidió a los usuarios que encontraran una página Web interesante en la categoría
Entretenimientos de Yahoo y una organización de la mismas páginas Web en un mapa Kohonen. El
experimento varió según los usuarios comenzaban en Yahooo o en el mapa gráfico. Después de
completar las tareas de browsing, los usuarios debían intentar repetir el browsing utilizando la otra
herramienta. En las personas que comenzaron con el mapa Kohonen, 11 de 15 encontraron un
página interesante en diez minutos. Ocho de ellas fueron capaces de encontrar la misma página
usando Yahoo. En los usuarios que comenzaron con Yahoo, 14 de 16 encontraron páginas
interesantes. Sin embargo, sólo dos de 14 pudieron encontrar la página en la visualización gráfica.
Esto constituye una fuerte evidencia contra la navegabilidad de esta última y sugiere que la simple
vista de etiquetas de Yahoo es más útil. Sin embargo, el mapa puede ser más útil si el sistema es
modificado para integrar el browsing con la formulación de la búsqueda.

16
Figura 10.8 Vista general en dos dimensiones creada utilizando el algoritmo de mapeo de
características Kohonen, sobre páginas Web, sobre el tema Entretenimiento [163

Las personas prefirieron algunos aspectos de la representación en mapa. En particular algunos


mencionaron la facilidad de saltar de un área a la otra sin tener que ir hacia atrás o hacia delante
como se requiere en Yahoo; otros mencionaron el hecho de que los mapas tienen viarios niveles de
granularidad. Las personas que participaron también expresaron su disconformidad con algunos
aspectos de las visualizaciones. Algunos usuarios mencionaron el deseo de una organización
jerárquica visible, otros la función de realizar zoom en un área para obtener más detalles, y otros
manifestaron su disgusto por tener que mirar en el mapa completo para encontrar un tema, deseando
en cambio una lista alfabética. Muchos encontraron que las etiquetas de una única palabra eran
confusas o ambiguas. Por ejemplo “BILL” podía interpretarse como el nombre de una persona,
además de cómo “Cuenta” en idioma inglés.

Los autores concluyen que esta interfaz es más apropiada para un browsing casual más que para una
búsqueda. En general, las vistas generales producidas de modo automático son más útiles para dar
al usuario una idea general de la clase de información que puede ser encontrada en una colección de
documentos, pero generalmente no es tan útil en un proceso de acceso a la información.

17
Clustering de co-citaciones para Vistas Generales

El análisis de citas ha sido largamente reconocido como forma de mostrar una vista general de los
contenidos de una colección [812]. La principal idea es determinar la localización de documentos
basándose en patrones de co-citación. Hay diferentes modos de determinar patrones de citación: un
método es medir la frecuencia en la que dos artículos son citados conjuntamente por un tercero.
Otra alternativa es reunir dos artículos que citan el mismo tercer artículo. En ambos casos existe el
supuesto de que los artículos apareados comparten algunos elementos. Después de construir una
matriz de co-citaciones, los documentos son reunidos (clustered) en base a la similaridad de sus
patrones de co-citación. Los clusters resultantes son interpretados para indicar los temas dominantes
en la colección. El clustering puede focalizarse en los autores de los documentos más que en su
contenido, para identificar autores centrales en un campo. Esta idea ha sido implantada
recientemente en documentos Web en el Referral Web Project [432]. La idea también fue aplicada a
páginas Web usando una estructura de vínculos Web para identificar los principales tópicos
temáticos en páginas Web [485, 639]. Una idea similar se utilizó para identificar páginas que
funcionaban como buenos puntos de partida en tópicos particulares (llamadas “páginas autoridad”,
“authority pages”, por Kleinberg [444].

10.4.3 Ejemplos, Diálogos y Expertos (Wizards)

Otra forma de ayudar a los usuarios a comenzar es con un ejemplo de interacción con el sistema.
Esta técnica también se conoce como recuperación por reformulación. Una versión de esta idea se
encuentra en el sistema Rabbit [818] que provee representaciones gráficas para ejemplos de
consultas en bases de datos. Se muestra un marco general para una consulta y el usuario lo modifica
para describir lo que quiere. El sistema muestra un ejemplo de la clase de información disponible
que se corresponde con esta descripción. Por ejemplo, si un usuario busca en una base de datos de
productos de computación e indica su interés en discos, se recupera un ejemplo de un ítem con los
descriptores correspondientes a discos en su lugar. El usuario puede usar o modificar los
descriptores visualizados e iterar el procedimiento.

La idea de recuperación por reformulación se ha extendido al dominio del desarrollo de las


interfaces de usuario [581] y de la ingeniería de software [669]. El sistema Helgon [255] es una
variante moderna de esta idea aplicada la las bases de datos bibliográficos. En Helgon, el usuario
entra navegando una jerarquía de tópicos desde los cuales selecciona ejemplos estructurados, de
acuerdo con su interés. Pero los usuarios tuvieron problemas con la organización de la jerarquía y
encontraron tedioso el uso de los ejemplos. Este resultado subraya una dificultad con los ejemplos y
diálogos: conseguir que el usuario inicie con el diálogo correcto o el ejemplo correcto es un
problema de búsqueda en sí mismo [492,449].

Una variante más dinámica de este tema es el diálogo interactivo. Las interfaces basadas en el
diálogo has sido exploradas desde hace mucho tiempo, en un intento de imitar la interfaz humana de
un intermediario, por ejemplo un bibliotecario referencista. Oddy trabajó tempranamente en el
sistema THOMAS, que proveía una sesión de preguntas y respuestas con una interfaz de comandos
[615]. Más recientemente, Belkin et al. Definieron modelos de interacción más elaborados [75], a
pesar de que no han sido probados empíricamente.

La interfaz del sistema DLITE usa un diálogo de contexto-más-foco (focus-plus-context) como


forma de familiarizar a los usuarios con las secuencias normalizadas de operaciones con el sistema.
Al comienzo se muestra una vista de todos los pasos del diálogo en una lista. El usuario puede
expandir la explicación de cualquier paso individual mediante un click en su descripción. También

18
puede expandir el diálogo completo para ver qué preguntas son las que siguen, y cerrarlo para
focalizarse en la tarea corriente.

Una forma más restrictiva del diálogo que se ha difundido bastante en los productos comerciales es
el del Experto (Wizard). Esta herramienta ayuda a los usuarios en tareas de tiempo limitado, pero no
intenta enseñar todo el proceso requerido para completar las tareas. El Experto presenta un camino
paso a paso, que el usuario puede seguir para realizar un trabajo [636]. Un estudio reciente [145]
encontró que los expertos son útiles para metas que requieren muchos pasos, para usuarios que
carecen de conocimiento suficiente (por ejemplo un propietario de un restaurante instalando un
software para la contabilidad de su negocio), y cuando los pasos deben ser completados en una
secuencia fija. Las propiedades de los Expertos incluyen el permitir a los usuarios volver a correr el
Experto y modificar su trabajo anterior, mostrar una vista general de las funciones, y proveer
descripciones comprensibles para hacer las elecciones correctas. Los Expertos no son útiles cuando
la interfaz no resuelve un problema de forma efectiva, cuando la meta es enseñar al usuario cómo
usar la interfaz y cuando el Experto no ha sido probado.

Una visita guiada (guided tour) conduce al usuario a través de una secuencia de elecciones de
navegación a través de vínculos de hipertexto, presentando los nodos en un orden lógico. En un tour
dinámico, sólo se muestran los nodos relevantes [329]. Una aplicación reciente de es el proyecto
Walden Paths que permite a docentes definir caminos útiles para el entrenamiento, a través de
páginas Web [289]. Este enfoque no ha sido utilizado demasiado en el proceso de acceso a la
información, pero puede ser una dirección interesante para familiarizar al usuario con estrategias de
búsqueda en grandes sistemas de hipervínculos.

10.4.4 Selección automática de fuentes

Las interfaces que ayudan al usuario a elegir las fuentes de información más apropiadas son una
amplia área de investigación. Requiere extraer la necesidad de información de los usuarios y
comprender cuales necesidades pueden ser satisfechas por cuáles fuentes. Un ambicioso proyecto es
construir un modelo de la fuente y de la necesidad de iinformación del usuario y tratar de
determinar cómo se corresponden mejor. Esto se intenta con el uso de sistemas de modelado
(modelling systems) y sistemas de tutoreo inteligente, aplicado a dominios generales [204,814] y a
sistemas de ayuda en línea [378].

Una alternativa simple es crear una representación del contenido de las fuentes de información y
corresponder esta representación contra la especificación de la consulta. Esta aproximación es la
que se utiliza en GIOSS, un sistema que intenta determinar la mejor base de datos bibliográfica para
enviar un pedido de búsqueda, basada en los términos de la consulta [765]. El sistema usa un
análisis simple de las frecuencias combinadas de las palabras de la consulta en las colecciones
disponibles. El sistema SavySearch [383]lleva esta idea un paso más allá, usando acciones que
realizan los usuarios después de una consulta para decidir cómo incrementar o disminuir el ranking
de un motor de búsqueda para una consulta en particular (ver también Capítulo 13).

Otra posibilidad para la selección automática de fuentes es enviar una consulta a múltiples fuentes y
combinar los resultados de alguna manera. Esto es lo que realizan muchos metabuscadores en la
Web. Un área activa de investigación actual es cómo combinar los resultados de forma efectiva, y se
conoce en algunos casos como fusión de la colección [63,767,388].

10.5 La especificación de la consulta

19
Para formular una consulta el usuario debe seleccionar una colección, metadatos o conjuntos de
información, contra los que debe ser equiparada la consulta. Y debe especificar palabras, frases,
descriptores u otra clase de información que pueda ser comparada con la información en las
colecciones. Como resultado, el sistema crea un conjunto de documentos, metadatos u otro tipo de
información que se corresponden con la especificación de la consulta en alguna forma y muestra los
resultados al usuario.

Shneiderman [725] identifica cinco estilos primarios de interacción hombre – computadora. Son:
lenguaje de comandos, llenado de formularios, selección de menúes, manipulación directa y
lenguaje natural. (Esta lista omite modalidades no visuales como el audio). Cada técnica ha sido
usada en la especificación de interfaces y tienen ventajas y desventajas, que se describen más
adelante en el contexto del la especificación de las consultas booleanas.

10.5 1 Búsquedas booleanas

En los sistemas modernos de acceso a la información el proceso de correspondencia generalmente


emplea un algoritmo de ranking estadístico. Sin embargo, hasta los más recientes sistemas
comerciales de texto completo y la mayoría de los sistemas bibliográficos soportan solamente
consultas booleanas. Por lo tanto, el foco de muchos estudios de acceso a la información se refieren
a los problemas que tienen los usuarios para especificar las consultas booleanas.
Desafortunadamente, los estudios han mostrado que los usuarios tienen enormes dificultades para
especificar este tipo de búsquedas y que generalmente tienen expectativas incorrectas acerca de los
resultados [111,322,841].

Las búsquedas booleanas son problemáticas por varias razones. Una de ellas es que la mayoría de
las personas encuentran la sintaxis básica poco intuitiva. Las personas de habla inglesa suponen que
la semántica cotidiana está asociada con los operadores booleanos AND y OR. Para usuarios
inexpertos, usar el AND implica ampliar el alcance de una consulta, porque se están pidiendo varias
clases de información. Por ejemplo “perros y gatos” puede ser interpretado como un pedido de
documentos acerca de perros y de documentos acerca de gatos, más que documentos acerca de los
dos tópicos a la vez, que es lo que corresponde al operador AND. “Té o café” puede implicar una
elección mutuamente excluyente en el lenguaje cotidiano. Y no es así en el operador lógico OR.
Esta clase de problemas conceptuales está bien documentada [111,322,558,841]. Además, la
mayoría de los lenguajes de consulta que incorporan operadores booleanos también requieren el uso
de sintaxis compleja para otra clase de conectores y para metadatos descriptivos. La mayoría de los
usuarios no están familiarizados con el uso de paréntesis ni con las nociones de la precedencia de
operadores.

Para servir a una audiencia masiva que posee poca experiencia de especificación de consultas, los
diseñadores de los motores de búsqueda de la Web han tenido en cuenta aproximaciones más
intuitivas para la especificación de las consultas. Más que forzar a los usuarios a especificar
combinaciones complejas de ANDs y Ors, permiten la selcción de maneras simples de combinar
términos de consulta, incluyendo expresiones como “todas las palabras” (lo que ubica todos los
términos en una conjunción, AND) y “cualquiera de las palabras” (lo que las ubica en una
disyunción, OR).

Otra solución basada en la Web es permitir especificación de consultas basadas en la sintaxis para
proveer una sintaxis más simple o intuitiva. El prefijo / operador “+” ganó un uso muy amplio como
especificador de la obligatoriedad de una palabra en el motor de Altavista. Desafortunadamente, los
usuarios pueden pensar erróneamente que funciona como el operador AND y entonces suponer que

20
“gatos + perros” recuperará solamente los artículos que contienen ambos términos, cuando en
realidad la consulta requiere perro y deja a gato como opcional.

Otro problema con los sistemas puramente booleanos es que no rankean los documentos
recuperados de acuerdo con su grado de correspondencia con la consulta. En un marco booleano un
documento satisface o no satisface la consulta. Los sistemas comerciales realizan un orden con los
documentos de acuerdo con algún tipo de metadato, por ejemplo, el orden cronológico. Los
sistemas basados en la Web generalmente ordenan los resultado de las consultas booleanas
utilizando algoritmos estadísticas y heurística específica de la Web.

10.5.2 Desde las líneas de comandos a los formularios y los menúes

Junto con las confusiones acerca del significado lógico del AND y del OR, otra parte del problema
con la especificación de las consultas en sistemas booleanos bibliográficos es la arbirtrariedad de la
sintaxis y la falta de contexto de las interfaces. Típicamente, debe tipearse algo como lo siguiente:

COMANDO ATRIBUTO valor { OPERADOR BOOLEANO ATRIBUTO valor}*

Ejemplos:

FIND PA darwin AND TW species OR TW descent

(ENCUENTRE en autor el valor darwin AND en el título el valor especies OR en el título el valor
descendencia)

FIND TW Mt St. Helens AND DATE 1981

(ENCUENTRE en el título el valor Mt St. Helens AND en fecha el valor 1981)

(estos ejemplos fueron extraídos de la sintaxis de la interfaz telnet del sistema Melvyl de la
Universidad de California [526]). El usuario debe recordar los comandos y los nombres de los
atributos, que son fácilmente olvidables entre usos del sistema. Y este problema se hace más grave
porque comandos y nombres de atributos cambian entre diferentes sistemas.
La nueva versión Web del sistema Melvyl provee formularios y menúes de modo que el usuario ya
no tiene que recordar los nombres y tipos de atributos disponibles (http://www.melvyl.ucop.edu/).
Los usuarios seleccionan tipos de metadatos de listas y se muestran de modo explícito los atributos,
permitiendo su selección como una alternativa de especificación. Por ejemplo, el campo “tipo de
búsqueda” se encuentra junto a un formulario de entrada en el cual los usuarios pueden ingresar
palabras clave y la elección entre los operadores AND y NOT se encuentra junto a la lista de tipos
de documentos disponibles. Sólo los metadatos asociados a una colección en particular se muestran
en el contexto de esa búsqueda. Desafortunadamente, el sistema puede hacer búsquedas en una base
de datos por vez. Sin embargo, provee una facilidad para aplicar una búsqueda ejecutada
previamente a una nueva base de datos. Ver Figura 10.9.

Este sistema también permite la retención del contexto entre búsquedas, almacenando los resultados
anteriores en tablas y realizando hipervínculos de estos resultados con las listas que contienen la
información bibliográfica recuperada. Los usuarios pueden modificar cualquiera de las consultas
anteriores marcando un cuadro que se encuentra junto al registro de la consulta. La visualización
gráfica hace explícitas e inmediatas muchas de las opciones del sistema que serían difíciles de
retener en la versión con comandos.

21
Estas visualizaciones son una mejora sobre las interfaces de comandos, pero no resuelven todos los
problemas. Por ejemplo, un formulario en blanco no es mucho mejor porque no provee al usuario
con ayudas sobre que clase de términos podría ingresar.

Figura 10.9 Vista de una especificación de consulta en la versión Web del catálogo bibliográfico
Melvyl.

10.5.3 Consultas facetadas

Otro problema con las consultas booleanas es que tienden a dar resultados o demasiados grandes
(porque los usuarios incluyen muchos términos en una disjunción, o vacíos (porque los usuarios
utilizan muchos términos en intersección). Este problemas sucede porque no se conocen los
contenidos de la colección o el rol de los términos en esa colección.

Una estrategia común para enfrentar este problema, empleado en sistemas con interfaces de
comandos como DIALOG, es hacer una serie de consultas cortas, ver el número de documentos que
se recupera en cada una de ellas, y combinar esas consultas, lo que produce un número razonable de
resultados. Por ejemplo, en DIALOG cada consulta produce un conjunto de documentos que se
identifica por un número. Antes que ver los títulos mismos, DIALOG muestra cada número de
conjunto con la cantidad de documentos resultantes en cada uno. Luego pueden verse los títulos de
los documentos solicitándolos con el número de conjunto. A su vez, la combinación entre conjuntos
también puede hacerse utilizando ese número de conjunto.

Este tipo de formulación de consultas se denomina consulta facetada, para indicar que la consulta
se divide en tópicos o facetas [553,348]. Por ejemplo, una consulta sobre drogas para la prevención
de la osteoporosis puede consistir en tres facetas:

(osteoporosis OR ´pérdida ósea’)


(drogas OR ´productos farmacológicos´)
(prevención OR cura)

En este caso el usuario quiere encontrar documentos que contengan a la vez los tres tópicos, con lo
que se unirían en AND.
Una técnica para dar un orden a los resultados de consultas booleanas es lo que se llama ranking
post-coordinado o nivel de quorum [700]. Según este enfoque los documentos se rankean de
acuerdo con el subconjunto de términos de consulta que contienen. Dada una consulta sobre

22
“gatos”, “perros”, “peces” y “ratones”, el sistema debería rankear primero un documento con al
menos una ocurrencia de perros, gatos y peces, antes que un documento que contenga 30
ocurrencias de gatos y ninguna de los otros términos.

Una combinación de las consultas facetadas y el ranking de quorum podría mostrar una lista de
líneas de entrada. Los usuarios entran un tópico por línea, en el que se escriben una lista de términos
relacionados semánticamente, que tienen valor equivalente y que son combinado en una disjunción
(OR). Como resultado, los documentos que contienen por lo menos un término de cada faceta son
rankeados antes que los documentos que contienen sólo términos de una de las facetas.

Esta idea puede ser extendida un poco más allá, permitiendo a los usuarios asignarle un peso a cada
faceta, o asignándolo por defecto: la faceta que el usuario listó primero tendrá el peso más alto, la
segunda menos peso y así sucesivamente.

10.5.4 Aproximaciones gráficas para la especificación de las consultas

Las interfaces de manipulación directa constituyen una alternativa a la sintaxis de comando. Las
propiedades de la manipulación directa son [725]: 1) representación continua del objeto de interés;
2) acciones físicas o presión de botones en lugar de una sintaxis compleja; 3) operaciones
incrementales, rápidas y reversibles cuyo impacto sobre el objeto de interés se ve inmediatamente.
Estas interfaces generalmente provocan el entusiasmo de los usuarios y por esta razón vale explorar
su utilización. A pesar de que tienen inconvenientes, son más fáciles de usar que otros métodos, en
muchos contextos.

23
Figura 10.10 Sistema VQuery para visualización de Diagramas de Venn, y especificación de
consultas booleanas

Para simplificar la especificación de la sintaxis booleana se han desarrollado muchas variaciones de


interfaces gráficas, estáticas o directamente manipulables. Los estudios de usuarios han revelado
que estas interfaces son más efectivas que las de comandos. Ejemplos son el Sistema VQuery para
visualización de Diagramas de Venn, y especificación de consultas booleanas, por el que aparecen
círculos representando a cada término de búsqueda y la intersección de círculos indica el operador
AND con los términos. Este sistema tiene el inconveniente de que es limitado en la complejidad de
la consulta. (Figura 10.10).

... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...

10.5.5 Frases y proximidad

En general la proximidad de la información puede ser bastante efectiva para mejorar la precisión de
las búsquedas. En la Web, la diferencia entre una consulta de palabra única y otra de una frase
exacta de dos palabras puede significar la diferencia entre una cantidad inmanejable de documentos
y una lista corta de documentos relevantes.

24
Se han desarrollado un gran número de métodos para especificar frases. En la sintaxis del sistema
LEXIS/NEXIS, para indicar la proximidad entre dos términos se requiere indicar el rango de
proximidad con un operador en el medio. Por ejemplo, “casa w/3 blanca” significa: casa y blanca
con tres palabras en el medio, con independencia de su orden. La proximidad exacta de frases se
especifica escribiendo una palabra junto a la otra, separadas de un espacio. Un método común en
algunos motores de búsqueda de la Web para este mismo propósito es encerrar las palabras entre
comillas.

La desventaja de estos métodos que requieren la correspondencia exacta de la frase, es que puede
ser común el caso de que entre las palabras buscadas puede haber otras, aunque sean pocas. Por
ejemplo, en la mayoría de los casos el usuario quiera “presidente” y “Lincoln” como palabras
adyacentes, pero también quiere recuperar “Presidente Abraham Lincoln”. Otro aspecto a
considerar es si el sistema utiliza algún tipo de stemming para los términos incluidos en la frase. La
mejor solución es permitir al usuario que especifique una frase exacta, pero tratarla como si hubiera
solicitado esas palabras con un pequeño rango de proximidad [174]. También se ha demostrado que
una combinación de ranking de quorum de consultas facetadas, con la restricción de que las facetas
aparezcan en un pequeño rango de proximidad, puede mejorar en mucho la precisión de los
resultados [356,566].

10.5.6 Lenguaje Natural y Consultas en Texto Libre

Los algoritmos de ranking estadístico tienen la ventaja de permitir a los usuarios la especificación
de consultas de un modo natural, sin tener que pensar acerca de operadores booleanos u otros
operadores. Pero tienen el inconveniente de brindar al usuario menos retroalimentación y control
acerca de los resultados. Generalmente el resultado de un ranking estadístico es la lista de
documentos asociados a un puntaje, probabilidad o porcentaje al lado de cada título. A los usuarios
se les da poca información acerca de cuál es la razón del ranking y que rol juegan los términos de
consulta en el ranking.

Una estrategia de búsqueda que puede ayudar con este particular problema es la especificación de la
“mandatoriedad” de algunos términos de la consulta en lenguaje natural. Esto permite al usuario
controlar que términos son considerados importantes, más que delegar en el algoritmo de ranking la
ponderación de los términos. Pero para especificar esta característica para los términos de búsqueda
es necesario conocer el modo de uso de comandos particulares.

La discusión anterior supone que una consulta en lenguaje natural escrita por el usuario es tratada
como una bolsa de palabras, con las palabras vacías removidas con el propósito de buscar la
correspondencia con los documentos. Sin embargo, algunos sistemas intentan analizar
sintácticamente las consultas en lenguaje natural para extraer conceptos y hacerlos corresponder con
los conceptos en la colección de textos. [399,552,748].

De modo alternativo, puede usarse la sintaxis de una pregunta en lenguaje natural para intentar
responder a la pregunta. Un ejemplo es el sistema Murax [463] determina a partir de la sintaxis de
una pregunta si el usuario está preguntando por una persona, lugar o fecha. Luego intenta encontrar
oraciones en artículos de una enciclopedia, que contengan las frases nominales que aparecen en la
pregunta. Esto se realiza ya que es probable que esas oraciones contengan la respuesta a la pregunta.
Por ejemplo, hecha la pregunta ¿Quién fue el ganador novelista del Premio Pulitzer, que se postuló
como alcalde de la Ciudad de Nueva York?, el sistema extrae las frases nominales: “Premio
Pulitzer”, “novelista ganador”, “Alcalde”, “Ciudad de Nueva York”. Luego busca nombres propios
que representen a personas (Ya que “Quién” indica a una persona), y encuentra, entre otras, las
siguientes oraciones:

25
Los ejércitos de la noche (1968), narración personal sobre la marcha de la paz en el
Pentágono, en 1967, Mailer ganó el Premio Pulitzer y el Premio Nacional del Libro.

En 1969 Mailer se postuló sin éxito como candidato independiente como alcalde de la
Ciudad de Nueva York.

Estas dos oraciones vinculan y reúnen las frases nominales relevantes, y el sistema deduce del título
del artículo que contiene las dos oraciones, que Norman Mailer es la respuesta.

Otra aproximación a la respuesta automática de preguntas es el sistema que encuentra FAQ


(Frequently Asked Questions), buscando la correspondencia de preguntas en varios tópicos [130].
El sistema utiliza una búsqueda standard para encontrar archivos FAQ para las preguntas realizadas.

Un enfoque menos automático para responder a preguntas puede ser encontrado en al sistema
AskJeeves [34]. Este sistema hace uso de sitios Web y los hace corresponder con un conjunto
predefinido de tipos de preguntas. La consulta del usuario es primero equiparada respecto de los
tipos de preguntas. El usuario selecciona la frase más apropiada que se ajuste a su pregunta esta
nueva frase el linkeada para sugerir sitios Web. Por ejemplo, la pregunta “ ¿Quién es el líder en
Sudan? se mapea con el tipo de pregunta “¿Quién es el jefe del Estado de X?”, donde la variable es
reemplazada, a través de una lista de elecciones posibles, por Sudan en este caso. Esto es linkeado a
una página Web que tiene los actuales jefes de Estado. La pregunta también se envía a motores de
búsqueda estándar.

10.6 Contexto

Esta sección presenta las técnicas de algunas interfaces para ubicar un conjunto corriente de
documentos en el contexto de otro tipo de información, con el objetivo de hacerlo más
comprensible. Estas técnicas incluyen la muestra de relaciones entre los documentos y los términos
de consulta, vistas generales de la colección, metadatos descriptivos, estructura de hipervínculos,
estructura de los documentos, y otros documentos en el conjunto.

10.6.1 Sustitutos de los documentos

La forma más común de mostrar los resultados de una consulta es listar información acerca de los
documentos en un orden de relevancia en relación con la consulta. Alternativamente, en un ranking
puro booleano, los documentos se listan de acuerdo con atributos de metadatos, como or ejemplo, la
fecha. Típicamente, una lista de documentos consiste en los títulos de los documentos y un
subconjunto de metadatos importantes como la fecha, fuente y largo del artículo. En un sistema con
ranking estadístico, puede mostrarse un puntaje o porcentaje junto al título, que indica un grado de
correspondencia o probabilidad de relevancia. Esta clase de información es llamada sustituto del
documento. Ver Figura 10.14 [824].

Algunos sistemas permiten al usuario la elección entre una visualización breve y otra detallada de
los documentos. La vista detallada contiene generalmente un sumario o resumen. En los sistemas
bibliográficos, se ve el autor o el servicio de resúmenes. Los motores de búsqueda de la Web
generan extractos automáticos, a partir de las primeras líneas del texto en la página Web.

En muchas interfaces, clikear el título del documento o su representación en un icono, produce una
vista del documento mismo, ya sea en una nueva ventana o en reemplazo de la lista de resultados.

26
(En los sistemas bibliográficos tradicionales, el texto completo no se encontraba disponible en línea
y sólo podía verse el registro bibliográfico).

Figura 10.14 Un ejemplo de una lista rankeada de títulos y otros sustitutos de documentos [824]

10.6.2 Aciertos de los términos de la consulta, dentro del contenido del documento

En los sistemas en los que el usuario puede ver el texto completo de un documento recuperado, es
útil resaltar las apariciones de los términos o descriptores que se corresponden con aquéllos que se
utilizaron en la consulta. Esto se realiza a través de la utilización de otro color para destacar esas
palabras y tiene por finalidad ayudar al usuario a ubicar las partes del texto más relevantes para su
consulta. [481,542, 52].

KWIC

Una facilidad relacionada con el resaltar son los sustitutos de documentos del tipo palabras clave en
contexto (keyword-in-context, KWIC). Se extraen del texto del documento fragmentos de
oraciones, oraciones completas, o grupos de oraciones que contienen los términos de consulta, que
se presentan junto con otras partes de los sustitutos de los documentos como el título o el resumen.
Debe notarse que una lista KWIC es diferente de un resumen. Un resumen sumariza los principales
temas del documento pero puede no contener referencias a los términos de la consulta. Un extracto
KWIC muestra las oraciones que sumarizan las formas en que los términos de búsqueda son
utilizados en el documento. Esta muestra puede mostrar no sólo qué subconjuntos de los términos
de consulta aparecen en los documentos recuperados, sino también el contexto en el que aparecen.

Al respecto deben tomarse decisiones sobre cuántas y cuáles líneas de texto deben mostrarse.
Algunos estudios han mostrado que los mejores fragmentos a mostrar son los primeros bajo el título
inicial y aquéllos que contienen el mayor conjunto de términos de búsqueda [464]. Si los usuarios
han especificado cuáles términos son más importantes respecto de otros, entonces los fragmentos

27
que contengan términos importantes deberían ser mostrados antes que los que contienen los menos
importantes. Sin embargo, con el fin de mantener la coherencia de los extractos, las oraciones
seleccionadas deberían mostrarse en el orden original del documento que los contiene.

La facilidad de tipo KWIC no suele utilizarse en la muestra de resultados en la Web, lo más


probablemente porque para ello el sistema debe tener una copia del documento original de la cual
extraer las oraciones que contienen los términos de búsqueda. Los motores de búsqueda Web en
general sólo retienen los índices sin la información de la posición de los términos.

TileBars (Barras de baldosas)


En estas interfaces los usuarios ingresan una consulta en formato facetado, un tópico por línea.
Después que el sistema recupera documentos (utilizando un algoritmo de ranking estadístico o por
quorum), se muestra un gráfico de barras por cada título de documento recuperado, en el que puede
verse el grado de correspondencia para cada faceta. Las Tile Bars ilustran en un vistazo qué pasajes
de cada artículo contienen qué tópicos y la frecuencia con que es mencionado ese tópico (los
cuadrados más oscuros representan una correspondencia más frecuente).

Cada documento se representa por una barra rectangular. La Figura 10.15 muestra un ejemplo. La
barra se subdivide en filas que se corresponden con la facetas de la consulta. En el ejemplo, la fila
superior de cada TileBar corresponde a “osteoporosis”, la segunda fila a “prevención” y la tercera a
“investigación”. La barra también se subdivide en columnas, y cada columna representa un pasaje
del documento. Los aciertos que se superponen en la misma página probablemente indican un
documento relevante, más que los aciertos dispersos a través del documento [356].

La oscuridad de cada cuadrado corresponde al número de veces que los términos de la consulta
aparecen en ese segmento del texto, por lo que cuanto más oscuro es un cuadrado, indica que tiene
mayor número de aciertos.

Figura 10.15 Ejemplo de visualización de resultados recuperados en una interfaz TileBar

... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...

10.6.3 Aciertos de los términos de la consulta, entre los documentos

28
Se han desarrollado otras ideas de visualización para mostrar información de tipo diferente acerca
de las relaciones entre los términos de consulta y los documentos recuperados. Más que mostrar
cómo aparecen los términos de búsqueda en los documentos individuales (como lo hacen las
interfaces KWIC y la TileBars), estos sistemas muestran una vista general o sumario de los
documentos recuperados de acuerdo con los diferentes subconjuntos de términos de búsqueda que
contienen. Las siguientes subsecciones describen variaciones de esta idea.

Figura 10.17 Muestra de resultados en el sistema InfoCrystal

InfoCrystal

El sistema InfoCrystal muestra cuántos documentos contiene cada subconjunto de términos de


consulta [738]. Esto libera al usuario de la necesidad de especificar los operadores AND y NOT, ya
que muestra las posibles combinaciones entre los términos que aparecen en los documentos. El
sistema InfoCrystal permite la visualización de todas las posibles relaciones entre N “conceptos”
especificados por el usuario (aunque una indicación de más de cuatro términos de búsqueda produce
un resultado gráfico difícil de comprender). En una extensión del paradigma de los diagramas de
Venn, este sistema muestra el número de documentos recuperados que tienen cada posible
subconjunto de los N conceptos. La Figura 10.17 muestra los resultados de una consulta de cuatro
términos llamados A, B, C, y D. El diamante central indica que sólo un documento contiene los
cuatro términos de búsqueda. El triángulo marcado con “12” indica que se encontraron 12
documentos que contienen los atributos A, B y D, etc.

29
Figura 10.18 Ejemplo de la visualización de resultados en VIBE

VIBE y Lyberworld

VIBE [452] y Lyberworld [363] son presentaciones gráficas que operan sobre principios similares.
En ellos los términos de consulta se ubican en un espacio gráfico abstracto. Después de la búsqueda,
se crean iconos que indican cuántos documentos contiene cada subconjunto de términos de
consulta. El estado del subconjunto de cada grupo de documentos se indica a través de la ubicación
del icono. Por ejemplo, en el sistema VIBE un conjunto de documentos que contiene tres de los
cinco términos de búsqueda se muestra en un eje que conecta esos tres términos, en un punto a
mitad de camino entre las representaciones de los tres términos en cuestión (Ver Figura 10.18).
Lyberworld presenta esta idea en tres dimensiones.

... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...

10.6.4 Superbook: Contexto vía Tabla de Contenidos

El sistema Superbook [481, 229, 230] utiliza la estructura de un gran documento para mostrar los
aciertos de términos de búsqueda en su contexto. Para un libro o un manual, se muestra la Tabla de
Contenido en la parte izquierda de la pantalla, y a la derecha se ve el texto completo de la página o
sección. El usuario puede manipular la tabla de contenido para expandir o contraer la vista de las
secciones y subsecciones. Se utiliza un mecanismo foco-más-contexto para expandir el área de las
secciones que se están viendo y comprimir las anteriores.

30
Figura 10.19 La interfaz SuperBook para mostrar los resultados en un manual en contexto

Después de que el usuario especifica una consulta en el libro, se muestran los resultados en el
contexto de la jerarquía de la Tabla de Contenidos. (Ver Figura 10.19). Las secciones que contienen
aciertos se agrandan y las demás se achican. Los términos de búsqueda que aparecen en los títulos
de capítulos o secciones se resaltan. Cuando el usuario selecciona una página desde la Tabla de
contenido, aparece la página misma en la parte derecha de la pantalla, con los términos de consulta
resaltados.

10.6.5 Categorías para dar contexto al conjunto de resultados

En la sección 10.4 vimos el uso de categorías o directorios para proveer vistas generales del
contenido de la colección de textos. También pueden utilizarse metadatos referidos a categorías para
ubicar los resultados de una consulta en contexto.

Por ejemplo, en su versión original el SuperBook permitía la navegación en un documento


altamente estructurado, como un manual. El proyecto CORE extendió esta idea principal a una
colección de 1000 artículos a texto completo sobre química. Un estudio demostró su superioridad
respecto de un sistema de búsqueda estándar, en varios tipos de tareas [228]. Como no hay
disponible una tabla de contenidos para toda la colección, el contexto se logra ubicando a los
documentos en una jerarquía de categorías que contiene los términos relevantes de la química.
Cuando se selecciona una categoría, se listan los documentos asignados a la misma, para ver
mayores detalles. Todas las categorías se organizan en una jerarquía, proveyendo una vista
jerárquica de la colección.

Otro proyecto que usa categorías predefinidas para dar contexto a los resultados es el sistema
DynaCat [650]. Este sistema organiza los documentos recuperados de acuerdo con tipos de
categorías, seleccionadas de la taxonomía MESH. DynaCats comienza con un conjunto de tipos de
consultas que se conocen como útiles una población de usuarios y una colección dada. Un tipo de
consulta puede comprender a varias consultas. Por ejemplo, el tipo de consulta “Efectos adversos
del tratamiento” cubre consultas como “¿Cuáles son las complicaciones de una mastectomía?”, o
“¿Cuáles son los efectos colaterales de la aspirina?”. Los documentos están organizados de acuerdo
con un conjunto de criterios asociados con cada tipo de consulta. Estos criterios especifican qué

31
tipos de categorías son aceptables para organizar los documentos y cuáles deben ser omitidas de la
visualización. Una vez que las categorías han sido asignadas a los documentos recuperados, se
forma una jerarquía basada en el lugar que las categorías tienen en el MeSH.

Figura 10.20 La interfaz DynaCat para visualizar categorías que se corresponden con los tipos de
consultas

La Figura 10.20 muestra los resultados de una consulta sobre prevención del cáncer de mama. La
interfaz se distribuye en tres ventanas. La ventana superior muestra la consulta del usuario y el
número de documentos encontrados. La ventana de la izquierda muestra los dos primeros niveles de
las categorías, proveyendo una vista organizada de los resultados. La ventana derecha muestra todas
las categorías de la jerarquía y los títulos de los documentos que pertenecen a esas categorías.

... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...

10.6.6 Uso de hipervínculos para organizar resultados de la recuperación

A pesar de que los autores del SuperBook lo describen como un sistema de hipertexto, es mejor
pensar en él como un medio de mostrar los resultados de una búsqueda en el contexto de una
estructura que los usuarios pueden ver y comprender de una vez. El componente hipertextual no es
mencionado como la parte más exitosa de su diseño. De hecho, parece ser la causa de uno de los
principales problemas de la versión revisada del sistema: los usuarios tienden a extraviarse de las
páginas que están leyendo, lo que causa una pérdida de tiempo.

Esta especie de extravío puede ocurrir en parte porque SuperBook usa una clase de hipertexto no
estándar, en el cual cualquier palabra es vinculada automáticamente a las ocurrencias de la misma
palabra en otras partes del documento. Hoy, los sistemas de hipervínculos y el hipertexto en la Web
discriminan mucho más el uso de las conexiones de hipervínculos (en parte porque son generadas
por autores más que automáticamente). En un estudio se mostró que los usuarios forman mejores
modelos mentales en un sistema de hipertexto pequeño organizado jerárquicamente, que en sistemas

32
que permiten un acceso más flexible [226]. Se han investigado abundantemente los problemas
relacionados con la navegación en hipertexto [181, 551, 440, 334].
Más recientemente se ha utilizado información hipertextual para dar contexto a los resultados de las
búsquedas. A continuación se describen algunos de estos trabajos.

Cha-Cha: SuperBook en la Web

El sistema de búsqueda intranet Cha-Cha [164] extiende la idea de SuperBook a una gran y
heterogéneo sitio Web. La Figura 10.21 muestra un ejemplo. Este sistema difiere del SuperBook en
varios aspectos. En la mayoría de los sitios Web no existe una verdadera tabla de contenidos o
estructura de categorías, y una intranet como las que podemos encontrar en grandes universidades o
corporaciones generalmente no están organizadas por una unidad central. El Cha-Cha utiliza la
estructura de vínculos presente en el sitio para crear lo que se intenta como una organización
significativa sobre el caos subyacente. Después que el usuario ha ingresado una consulta, se
registran los caminos más cortos desde la página raíz a cada uno de los aciertos de búsqueda. Se
selecciona un subconjunto de estos atajos para mostrarlos como una jerarquía, de modo que cada
acierto se muestra una sola vez. Si el usuario utiliza el término “centro médico” en lugar de “centro
de salud”, y “médico” aparece como término en un documento en la página Web del centro de
salud, aparecerá la home page de este centro, así como aciertos más específicos. La organización
que produce este método es sorprendentemente comprensible en el sitio de la UC Berkeley.

... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...

Figura 10.21 La interfaz Cha-Cha mostrando los resultados de una búsqueda intranet, ante la
consulta por “medical center” [164

Mapuccino: Presentación gráfica de una estructura de vínculos

El sistema Mappucino (anteriormente WebCutter) [527] permite pedir una consulta sobre un
particular sitio Web. El sistema recorre el sitio en tiempo real, chequeando cada página encontrada
para verificar su relevancia con la consulta. El subconjunto del sistio Web que ha sido recorrido se
presenta gráficamente en una vista de nodos y links (ver Figura 10.22). Este tipo de vista no provee
al usuario información acerca del contenido de las páginas, pero muestra su estructura de vínculos.

33
Figura 10.22 Ejemplo de un subconjunto Web visualizado por el sistema Mapuccino

10.6.7 Tablas

La visualización tabular es otra forma de mostrar las relaciones entre los documentos recuperados.
un ejemplo de este enfoque es el sistema Envision [273]: permite al usuario organizar los
resultados de acuerdo con algunos metadatos como autor o fecha, y utiliza gráficos para mostrar en
cada celda los valores de los atributos asociados con los documentos (ver Figura 10.23). El color, la
forma y el tamaño de los iconos se utilizan para mostrar el grado de relevancia, el tipo de
documento y otros atributos.

34
Figura 10.23 La visualización tabular Envision para organizar gráficamente documentos
recuperados [270]

10.7 Utilización de Juicios de Relevancia

Una parte importante del proceso de acceso a la información es la reformulación de las consultas, y
una técnica efectiva para esta reformulación es la retroalimentación por relevancia. En su forma
original, la retroalimentación por relevancia se refiere al ciclo de interacción en el que el usuario
selecciona un pequeño conjunto de documentos que aparece como relevante para una consulta, y el
sistema entonces utiliza características derivadas de esos documentos relevantes seleccionados para
revisar la consulta original. Esta consulta revisada se ejecuta y se recupera un nuevo conjunto de
documentos. Los documentos del conjunto original pueden aparecer en los nuevos resultados,
aunque probablemente en otro orden de ranking. La retroalimentación por relevancia en su forma
original ha sido mostrado como efectivo mecanismo para mejorar los resultados en muchos estudios
[702, 343, 127].

La retroalimentación por relevancia plantea decisiones de diseño importantes, incluyendo cuáles


operaciones deben ser realizadas automáticamente por el sistema y cuáles por el usuario. Bates
discute ese punto en detalle [66], afirmando que a pesar del énfasis de los sistemas modernos en
tratar de automatizar el proceso completo, es preferible un enfoque intermedio en el que el sistema
ayuda a automatizar la búsqueda a un nivel estratégico. Bates sugiere una analogía con las cámaras
fotográficas automáticas versus las manuales. En algunas ocasiones es apropiado un método rápido

35
que requiere poco entrenamiento. En otras ocasiones, el usuario requiere tener más control sobre la
máquina.

10.7.1 Interfaces estándar para retroalimentación por relevancia

Una interfaz estándar para retroalimentación por relevancia consiste en una lista de títulos con un
lugar junto a cada titulo para que el usuario pueda marcar los documentos relevantes. Dependiendo
del sistema los documentos no marcados pueden entenderse como no relevantes o como que no se
ha emitido opinión sobre ellos. Otra opción es proveer la elección entre opciones: relevante o no
relevante. En algunos casos los usuarios pueden indicar un valor en una escala de relevancia [73].

Después de que el usuario ha realizado sus juicios de relevancia sobre un conjunto y emite una
nueva búsqueda el sistema puede revalorar automáticamente la consulta y re-ejecutar la búsqueda, o
generar una lista de términos para que el usuario seleccione y mejorar la consulta original. (Ver
Figura 10.25, en el original en inglés).

Después de que la consulta es re-ejecutada, se muestra una nueva lista de títulos. Puede ser útil
retener las marcas en los documentos que el usuario ya juzgó. Una difícil decisión de diseño
consiste en si deben mostrarse o no los documentos que el usuario ya revisó, al principio de la lista.
Mostrar repetidamente el mismo conjunto de documentos al principio puede molestar al usuario que
está intentando crear un conjunto mayor de documentos relevantes. Pero, al mismo tiempo, esto
puede servir como retroalimentación indicando que la consulta revisada no baja de categoría a estos
documentos que ya han sido encontrados especialmente relevantes. Una solución es mantener una
ventana separada que muestra los rankings de aquellos documentos que no han sido recuperados o
rankeados previamente. Otra solución es utilizar letras más pequeñas o de otro color para los títulos
de los documentos que ya fueron vistos.

Los motores de búsqueda en la Web han adoptado la terminología “more like this” (más
documentos como éstos), como forma simple de indicar que el usuario està solicitando documentos
similares a uno que ha seleccionado. Esta interacción de “un click” es más simple que el diálogo
estándar de retroalimentación por relevancia, que requiere que el usuario evalúe y marque un
pequeño conjunto de documentos y que luego vuelva a pedir un ranking. Desafortunadamente, en la
mayoría de los casos se requieren muchos juicios de relevancia para que la retroalimentación por
relevancia funcione bien. Aalbersberg propone un retroalimentación por relevancia incremental que
trabaja con sólo un documento relevante por vez.

10.7.2 Estudios de Interacción de Usuario, en los sistemas con retroalimentación por


relevancia

La retroalimentación por relevancia estándar supone que el usuario se involucra en la interacción


especificando los documentos relevantes. En algunas interfaces los usuarios también pueden
seleccionar términos para agregar a la consulta. Sin embargo, esto complica la revaloración y el re-
ranking de los documentos.

Un estudio reciente estudia en qué medida es beneficioso que el usuario controle el proceso de
retroalimentación. Koneman y Belkin [448] testearon cuatro casos diferentes enel proceso de
retroalimentación por relevancia [772]:

Control: No hay retroalimentación por relevancia; las personas sólo podían reformular la búsqueda
por sí mismos.

36
Opaco: Las personas simplemente seleccionan documentos relevantes y luego ven los rankings
revisados.
Transparente: Las personas podían ver cómo el sistema reformulaba las consultas (esto es, ver qué
términos eran agregados) y los rankings revisados.
Penetrable: El sistema es detenido a mitad de camino en el proceso de re-ranking. Se muestra a las
personas los términos que el sistema habría usado para la reformulación opaca y la transparente. Las
personas entonces seleccionan cuáles términos desean agregar a la búsqueda. Luego el sistema
presenta los rankings revisados.

Las 64 personas que participaron fueron mucho más efectivas (midiendo la precisión en los
primeros 5, primeros 10, primeros 30 y primeros 100 documentos) con retroalimentación por
relevancia que sin él. El grupo Penetrable logró resultados significativamente mejores que el de
Control, mientras que Opaco y Transparente se situaron en el medio. Los tiempos de búsqueda no
difirieron significativamente, pero sí hubo diferencias en el número de iteraciones de la
retroalimentación. Las personas del grupo Penetrable requirieron mucho menos iteraciones para
lograr mejores resultados (un promedio de 5.8 ciclos en el grupo Penetrable, 8.2 ciclos en el grupo
Control, 7.7 ciclos en el Opaco y sorprendentemente, el grupo Transparente requirió 8.8 ciclos de
promedio). El número promedio de documentos marcados como relevantes osciló entre 11 y 14 para
las tres condiciones. Todas las personas prefirieron la retroalimentación por relevancia sobre los
sistemas que no lo tienen, y varios señalaron que preferían una aproximación laxa en la que se les
sugiriera términos, antes que pensarlos por sí mismos.

... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...

10.7.3 Extrayendo Información Relevante del Trasfondo

El retroalimentación por relevancia estándar se propone para mejorar las consultas o construir un
perfil de los pasos en una consulta. Investigaciones recientes ha comenzado el desarrollo de
sistemas que monitorean los progresos y la conducta de los usuarios a lo largo de períodos de
interacción con la intención de predecir qué documentos o acciones probablemente querrá el
usuario en el futuro. Estos sistemas se llaman asistentes semiautomáticos o agentes, y a menudo
utilizan técnicas de aprendizaje por máquina [565]. Algunos de estos sistemas requieren input
explícito del usuario en forma de declaración de metas [406] o juicios de relevancia [629], mientras
que otros intentan hacer inferencias a partir de las acciones realizadas por los usuarios.

Un sistema desarrollado por Kozierok y Maes [460, 536] hace predicciones sobre cómo
manipularán los usuarios mensajes de correo electrónico (en qué orden los leerán, dónde los
archivarán) y sobre cómo organizarán encuentros en un administrador de calendario. El sistema
registra en una base de datos lo que los usuarios van haciendo y considera relevante. Después de
una acumulación suficiente de datos, el sistema usa el método del vecino más próximo [743] para
predecir las acciones del usuario basándose en la similaridad de la situación corriente con respecto a
situaciones anteriores. Por ejemplo, si el usuario casi siempre guarda los mensajes de una persona
en particular en un determinado archivo, el sistema ofrece automáticamente repetir la acción frente
a la misma situación [536]. El sistema integra el aprendizaje del retroalimentación implícito y
explícito del usuario. Si el usuario ignora la sugerencia del sistema, el sistema trata esto como
retroalimentación negativo y lo incorpora. Después de algunas predicciones incorrectas el sistema
pregunta al usuario de modo de ajustar las predicciones. Finalmente, el usuario puede entrenar
explícitamente al sistema presentando ejemplos hipotéticos de pares de acciones que podría realizar.

Otro sistema, Syskill y Webert [629] intenta aprender a utilizar perfiles de usuario basados en
juicios de relevancia explícitos sobre páginas exploradas mientras se realiza browsing en la Web. En

37
cierto sentido, esto se parece al retroalimentación por relevancia estándar, excepto que los juicios
del usuario son retenidos a lo largo de las sesiones y también difiere el modelo de interacción:
cuando el usuario revisa una nueva página Web los vínculos sobre la página son anotados
automáticamente, sean o no sean relevantes para el interés del usuario.

Letizia [518] es un sistema relacionado, trae a la atención del usuario un porcentaje de los próximos
movimientos disponibles que más probablemente sean de su interés, dadas las acciones anteriores
del usuario. Bajo pedido, Letizia provee recomendaciones para acciones ulteriores por parte del
usuario, generalmente en forma de sugerencias de vínculos a seguir. El sistema monitorea el
comportamiento del usuario mientras navega y lee páginas Web, y en forma paralela evalúa los
vínculos alcanzables desde la página corriente. De ese modo, el grabar una página como favorito se
toma como una evidencia positiva en relación con la página marcada, y los vínculos dejados de lado
se toma como acciones negativas para la información alcanzable a través de esos vínculos. Los links
seleccionados pueden indicar evidencia positiva o negativa, dependiendo del tiempo que el usuario
utiliza en su revisión y si la decisión de dejar rápidamente una página no es revisada más tarde.
Adicionalmente, la evidencia del interés del usuario debe persistir durante la sesión de browsing. El
sistema utiliza una estrategia de búsqueda y heurística para determinar cuáles páginas recomendar.

... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...

10.7.4 Juicios de relevancia grupal

En forma reciente se ha manifestado mucho interés en usar juicios de relevancia de un número


importante de diferentes usuarios para rankear información de interés general [672]. Algunas
variantes de este enfoque de recomendación social utilizan la similaridad de juicios de relevancia
exclusivos de personas con similares intereses. Esto se ha encontrado como altamente efectivo para
evaluar información en la que el gusto juega un rol importante, tal como recomendaciones de
películas y de música. Más recientemente se ha combinado juicios de relevancia grupales con
información de contenido [64]-

10.8 Ayuda para el proceso de búsqueda desde la Interfaz

El diseñador de la interfaz debe tomar decisiones acerca de cómo organizar varias clases de
información en la pantalla y cómo estructurar las posibles secuencias de interacciones. Este es un
problema serio en una actividad compleja como el acceso a la información. En esta sección
presentamos las opciones de diseño para el despliegue de información en sistemas de información
complejos, e ilustramos las ideas con ejemplos de interfaces existentes. Comenzamos con la
discusión de interfaces muy simples, aquellas utilizadas para búsquedas de cadenas de caracteres y
progresamos hacia interfaces multiventanas y espacios sofisticados de trabajo. Luego continúa una
discusión de la integración de la exploración, selección y realización de consultas en interfaces de
acceso a la información, y concluimos con las ayudas de interfaces para retener la historia del
proceso de búsqueda.

10.8.1 Interfaces para correspondencia de cadenas de caracteres (string matching)

Una necesidad común y simple de búsqueda necesita una operación “encontrar”, generalmente
ejecutada sobre el contenido de un documento que se está viendo. Generalmente esta función no
produce una salida rankeada, ni permite combinaciones booleanas de términos: la principal
operación es una correspondencia simple de caracteres (sin capacidad para expresiones regulares).
En forma típica, se crea una ventana para ese propósito especial, que contiene pocos y simples
controles (por ej. Coincidir mayúsculas y minúsculas, y búsquedas hacia delante y hacia atrás) El

38
usuario tipea la cadena buscada en un formulario de entrada y las cadenas que se corresponden se
resaltan en el texto del documento (ver Figura 10.26).

Figura 10.26 Ejemplo de una interfaz simple para correspondencia de cadenas de caracteres, del
Netscape Communicator 4.05

El grado siguiente de complejidad es la función “encontrar” aplicada a pequeñas colecciones, como


archivos en el disco rígido de una computadora personal, o en la lista histórica de un navegador
Web. Este tipo de función también se implementa como correspondencia simple de cadenas de
caracteres. Como en el caso anterior, los controles y configuraciones de parámetros se muestran
arriba de una ventana especial de búsqueda y las opciones se establecen a través de marcado y de
formularios de entrada. La diferencia en estos casos es que se muestra una lista de resultados (ver
Figura 10.27/.

Figura 10.27 Ejemplo de correspondencia de cadenas de caracteres con una lista de resultados, en
este caso, la historia de las páginas Web recientemente visitadas, del Netscape Communicator 4.05

Estas interfaces simples pueden ser mejoradas aumentando su funcionalidad para ayudar a formular
la consulta inicial. Los errores de tipeo son la principal causa de resultados vacíos. Puede ser útil
una función de control de ortografía que sugiera alternativas para los términos de consulta que
tienen baja frecuencia en la colección. Otra opción es sugerir términos de un tesauro asociados con
los términos de consulta. Generalmente esta clase de información se muestra después de que ha sido
entrada la consulta y han sido recuperados los documentos, pero una alternativa es proveer esta
información cuando el usuario entra la consulta, en forma de una vista previa de la misma.

10.8.2 Administración de Ventanas

39
Para las tareas de búsqueda más complejas que la de correspondencia de caracteres, el diseñador de
la interfaz debe decidir cómo desplegar las varias opciones y tipos de información.

Como se discutió más arriba, los sistemas bibliográficos tradicionales utilizan interfaces basadas en
comandos o menúes. Cuando el sistema responde a un comando el resultado nuevo oculta lo
anterior, exigiendo que el usuario recuerde el contexto. Por ejemplo, el usuario puede ver solamente
un nivel de una jerarquía temática por vez, y debe dejar de ver esta presentación temática para ver la
consulta o ver los documentos.

En las interfaces gráficas modernas el sistema de ventanas puede utilizarse para dividir
funcionalmente las diferentes vistas, que pueden observarse de modo simultáneo [582]. En los
sistemas de acceso a la información, a menudo es útil vincular la información de una ventana con la
información de la otra, por ejemplo, vincular documentos con su posición en la Tabla de
Contenidos, como el SuperBook. Los usuarios pueden también usar la selección para cortar y pegar
información de una ventana en la otra, por ejemplo, copiar una palabra de una vista del tesauro y
pegarla en el formulario de especificación de la consulta.

Cuando se ordena información en ventanas, el diseñador debe elegir entre una vista monolítica, en
la que todas las ventanas están dispuestas en posiciones predefinidas y son vistas simultáneamente,
ventanas “armables”, y ventanas superpuestas.

Las interfaces de tipo monolítico tienen varias ventajas. Permiten al diseñador controlar la
organización de las varias opciones, hacen que toda la información sea vista simultáneamente, y
ubica las características en posiciones familiares, haciendo que sean fáciles de encontrar. Pero
también tienen desventajas. Generalmente trabajan mejor si ocupan la pantalla completa, y esto se
encuentra limitado por la cantidad de espacio disponible en la pantalla [644].

Un problema común en cualquier tipo de interfaz de acceso a la información es el de cuántas clases


de información puede mostrarse de una vez. Los sistemas de acceso a la información siempre deben
reservar espacio para el área de visualización del texto, y esto lleva una proporción importante del
espacio de la pantalla para que el texto sea legible. Una buena disposición, gráficos y el tamaño de
las letras pueden mejorar estas situaciones.

Las ventanas superpuestas brindan flexibilidad en la organización, pero rápidamente pueden


convertirse en una visualización abigarrada y desorganizada. Los investigadores han observado que
parte importante de la actividad del usuario consiste en el movimiento entre una ventana y otra.
Bannon et al. [54] define la noción de espacio de trabajo –el agrupamiento de conjuntos de
ventanas funcionalmente referidas a alguna actividad o meta- con el fundamento de que esta clase
de organización se corresponde más cercanamente con la estructura de metas del usuario que con
ventanas individuales [96]. Card et al. [140] encontraron que el uso de ventanas debería ser
categorizado de acuerdo con un modelo de “conjunto de trabajo”. Revisaron las relaciones entre las
demandas de la tarea y el número de ventanas en uso, y encontraron que el mayor número de
ventanas en uso se producía cuando los usuarios transitaban de una tarea a otra.

Basados en estas y otras observaciones, Henderson y Card [420] construyeron un sistema que
intenta facilitar a los usuarios moverse entre múltiples espacios de trabajo virtuales [96]. El sistema
usa una metáfora espacial de tres dimensiones, donde cada espacio de trabajo es una “habitación”, y
la transición entre uno y otro se realiza mediante “puertas” virtuales. En este cambio los usuario
pueden cambiar de un contexto al otro. En cada contexto de trabajo, los programas de aplicación y
los archivos de datos que están asociados con ese contexto se hacen visibles y disponibles para su
apertura y uso. La noción de espacio de trabajo de este modo enfatiza la importancia de que las

40
sesiones de trabajo persisten a través del tiempo. Los usuarios deberían poder dejar una habitación
dedicada a una tarea, trabajar en otra tarea, y tres días después volver a la primera habitación y ver
todas las aplicaciones en el mismo estado que las dejaron. Esta noción de vincular aplicaciones y
datos para cada tarea ha sido ampliamente adoptado en los programas operativos que utilizan
ventanas.

... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...

10.8.3 Ejemplos de Sistemas

Las siguientes secciones describen el despliegue de información y los enfoques empleados en varias
interfaces de modernas de acceso a la información.

InfoGrid

Es un ejemplo de despliegue monolítico ,[667]. En él se asume que la visualización se divide en un


lado izquierdo y uno derecho (ver Figura 10.28). El lado izquierdo a su vez se subdivide en un área
superior que contiene formularios de entrada estructurados para especificar las propiedades de la
consulta, una columna de controles con iconos limitando el lado izquierdo, y un área para retener
documentos de interés en la parte inferior. El área central principal se utiliza para ver los resultados
recuperados, o representaciones reducidas de los documentos originales, o organizaciones derivadas
de los documentos, tales como clusters Scatter / Gather. Los usuarios pueden seleccionar
documentos desde esta área y almacenarlos en el área inferior, o verlos en el lado derecho. La
mayor parte del lado derecho es utilizada para ver documentos seleccionados. El área inferior a la
visualización del documento se destina a mostrar gráficamente la historia de las interacciones
anteriores.

Parámetros de búsqueda Hoja de Panel de control


propiedades
Subconjunto
Panel Imágenes Texto Tabla de la TOC
de del de
control reducidas documento Contenidos
(TOC) Texto
Area de retención Pasos de Parámetros de del
búsqueda búsqueda documento

Figura 10.28 Diagramas de distribución monolítica para interfaces de acceso a la información

Los diseñadores deben decidir qué tipos de información mostrar en la vista primaria. Si InfoGrid
fuera usada en una visualización pequeña, o el área de visualización de documentos o el área de los
resultados deberían ser mostrados en una ventana pop-up superpuesta; de otro modo el usuario
tendría que moverse entre dos vistas. Si el sistema sugiriera términos para retroalimentación por
relevancia, una de las vistas existentes debería ser suplantada con esta información o debería usarse
una ventana pop-up para mostrar los términos candidatos. El sistema no provee información
detallada para la selección de fuentes, a pesar de que esto podría conseguirse fácilmente con un
menú pop-up en el panel de control.

SuperBook

41
La disposición de InfoGrid es similar a la de SuperBook (ver sección 10.6). La principal diferencia
es que SuperBook retiene la vista tipo Tabla de Contenido en el panel principal izquierdo, junto con
la indicación de cuántos documentos que contienen aciertos de búsqueda aparecen en cada nivel de
la Tabla. El principal panel del lado derecho, como en InfoGrid, se utiliza para ver los documentos
seleccionados. La formulación de la consulta se realiza justo debajo de la vista de la Tabla de
Contenido. Los términos relacionados con la consulta del usuario también se muestran en esta
ventana. Las imágenes grandes aparecen en ventanas pop-up superpuestas.

La disposición SuperBook es el resultado de varios ciclos de diseño iterativo [481]. Las versiones
anteriores usaban ventanas superpuestas en lugar de una vista monolítica. La nueva caja de texto
tiene su propio conjunto de botones que permiten a los usuarios saltar a las ocurrencias de palabras
resaltadas en otros documentos o a la Tabla de Contenidos. SuperBook fue rediseñado después de
varios estudios experimentales [530, 532] que mostraron que los usuarios eran más eficientes si se
les daba pocos pero bien elegidos pasos de interacción. Un estudio reciente encontró que a pesar de
que los usuarios son más eficientes con una interfaz flexible, prefieren sin embargo una interfaz más
rígida pero más predecible [801]. Los diseñadores también consideraron lo registrado en los logs de
interacciones de los usuarios. Antes del rediseño, los usuarios tenían que elegir ver la frecuencia
total de un acierto, mover el mouse a la ventana de la Tabla de Contenidos, clickear el botón y
esperar la actualización de los resultados. Como se observó que este patrón ocurría con frecuencia,
el nuevo sistema ejecuta automáticamente esta secuencia de acciones inmediatamente después que
es ejecutada una búsqueda.

Los diseñadores de SuperBook también intentaron que la intefaz corriera en pantallas más
pequeñas. El rediseño hace uso de ventanas pequeñas y superpuestas.

DLITE

El sistema [193, 192] divide la funcionalidad en dos partes: control del proceso de búsqueda y
muestra de los resultados. La parte de control es una vista de manipulación directa gráfica con
animación (ver Figura 10.29). Las consultas, fuentes, documentos y grupos de documentos
recuperados se representan como objetos gráficos. El usuario crea una consulta llenando los campos
editables en un objeto constructor de consultas. El sistema manufactura un objeto de consulta, que
es representado por un pequeño icono que puede ser arrastrado hasta una representación icónica de
un conjunto de servicios de búsqueda. Si el servicio esta activo, responde creando un objeto
conjunto vacío de resultados al que le agrega la consulta. El conjunto de resultados recuperados se
representa con un círculo y los documentos recuperados se representan con iconos distribuidos en el
interior del perímetro del círculo. Los documentos pueden ser arrastrados desde este círculo y
llevados hacia otros servicios, como un sumarizador de documentos o un traductor. Mientras tanto,
el usuario puede hacer una copia del icono de la consulta y arrastrarla a otro servicio de búsqueda.
Las consultas pueden ser almacenadas y reutilizadas más tarde.

42
Figura 10.29 La interfaz DLITE [193]

Una arquitectura de interfaz flexible libera al usuario de la restricción de los comandos. Por otra
parte, provee guías para ayuda al usuario a comenzar, brinda orientaciones para los procedimientos
válidosy previene de los errores. La parte gráfica de DLITE hace uso de la animación para guiar al
usuario.

DLITE usa una ventana Web separada para mostrar información detallada sobre los documentos
recuperados, como las citas bibliográficas y el texto completo. Esta ventana también se utiliza para
mostrar resultados clusters Scatter / Gather y permitir a los usuarios seleccionar los documentos
para un retroalimentación por relevancia. De ese modo DLITE separa la parte de control del
proceso de acceso a la información de la parte de revisión y lectura. Esta separación permite una
construcción reutilizable de las consultas, y al mismo tiempo permite una vista legible de los
documentos y las relaciones entre los mismos. La selección que se realice en la vista, se vincula con
la parte gráfica de control, de modo que un documentos revisado en la vista puede ser utilizado
como parte de una consulta en el constructor de consultas.

DLITE también incorpora la noción de espacio de trabajo, o “centro de trabajo”, como se lo


denomina en ese sistema. Se crean diferentes espacios de trabajo para diferentes tipos de tareas. Por
ejemplo, un espacio de trabajo para comprar software puede ser equipado con iconos que
representen fuentes de revisión de software y buenos sitios Web para buscar información sobre
precios.

SketchTrieve

El principio subyacente a esta interfaz [365] es la concepción del acceso a la información como un
proceso informal, en el que ideas a medio terminar y caminos parcialmente explorados pueden
retenerse para un uso posterior. Los resultados pueden ser combinados mediante operaciones sobre
objetos gráficos. Como se observó que los usuarios utilizan la disposición física de la información
en una hoja para organizar esa información [584, 722]. Esto motivó a los diseñadores del

43
SketchTrieve para permitir a los usuarios que organicen los resultados de las búsquedas de modo de
facilitar su comparación y recombinación (Ver Figura 10.30).

... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...

Figura 10.30 La interfaz SketchTrieve [365]

... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...

10.8.4 Retención de la historia de la búsqueda

La sección 10.3 presentó las estrategias de búsqueda de información y los comportamientos que han
sido observados por los investigadores en este campo. Esta discusión sugiere que la interfaz del
usuario debería mostrar cuáles son las opciones disponibles en un punto dado, tanto como qué
movimientos se han realizado anteriormente, tácticas de corto y de largo plazo respecto de
estrategias para el uso de los términos, y permitir al usuario anotar las decisiones tomadas y la
información encontrada durante todo el proceso. Los usuarios deberían ser capaces de reunir
diferentes sesiones de búsqueda, grabar partes de una sesión, acceder y modificar flexiblemente
todas ellas. También hay un interés creciente por incorporar la información sobre el uso y las
preferencias personales tanto en la formulación de las consultas como en el uso de los resultados de
una búsqueda [277].

En general estas estrategias no están bien aplicadas en las interfaces actuales; sin embargo se han
introducido algunos mecanismos en ese sentido. En particular son útiles los mecanismos para
retener la historia de las búsquedas. Usualmente estos mecanismos consisten en ver una lista de
comandos que fueron ejecutados anteriormente, En desarrollos más recientes, se ha introducido la
historia de la búsqueda en forma gráfica, grabando tanto las secuencias de comandos como los
resultados obtenidos. Kim y Hirtle [440] presentan un sumario de los mecanismos de presentación
de historia de la búsqueda en forma gráfica. En forma reciente, una interfaz gráfica que muestra la
historia del acceso a páginas Web en una estructura jerárquica, permite ahorrar tiempo cuando se
vuelve a visitar los páginas accedidas anteriormente. [370].

44
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...

10.8.5 Integración de la revisión, la selección y la realización de las consultas

En general, las interfaces de usuario para el acceso a la información no son buenas en soportar las
secuencias de movimientos desde una operación a la otra. Aún algo tan simple como tomar la salida
de los resultado de una consulta y usarlos como entrada para otra consulta no está bien resulto.

Hertzum y Frkjaer [368] encontraron que los usuarios prefieren una integración de la revisión y la
especificación de las consultas en las interfaces. Sin embargo, no observaron mejores resultados en
tales interacciones. La hipótesis de estos autores es que si la interacción es demasiado libre se
producen acciones erróneas, y que la interacción entre dos modos diferentes requiere más guía.
Sugieren que se necesita más flexibilidad pero también límites.

Hay excepciones. La nueva versión Web del sistema Melvyl provee formas de tomar la salida de
una consulta y modificarlas más tarde para su re-ejecución (ver Figura 10.32). El sistema DLITE y
su concepto de habitaciones permite el almacenamiento y reutilización de estados previos. Sin
embargo, estos sistemas no integran bien el proceso general con la revisión y la selección de
información desde estructuras auxiliares.

Figura 10.32 Vista de la revisión de la historia de la búsqueda en la versión Web del catálogo
bibliográfico Melvyl

La interfaz Cat-a-Cone integra la consulta y el browsing de una extensa jerarquía de categorías y


sus colecciones de texto asociadas. El sistema prototipo utiliza la animación en tres dimensiones del
Information Visualizer [144] (ver Figura 10.33). Un componente clave de la interfaz es la
separación de la representación gráfica de la jerarquía de categorías de la representación gráfica de
los documentos. Esta separación permite una interacción flexible y fluida entre el browsing y la
búsqueda, y entre las categorías y los documentos. También provee un mecanismo por el que un
conjunto de categorías asociadas a un documento puede ser visto junto con su contexto jerárquico.

Otra componente clave del diseño es la asignación de un estatus muy importante a la representación
del contenido de texto. Los documentos recuperados son almacenados en una representación
animada de un libro en tres dimensiones [144] que permite una visualización compacta de un
número moderado de documentos. Asociado a cada documento recuperado hay una página de

45
vínculos a la jerarquía de categorías y una página de texto que muestra los contenidos del
documento.

El sistema permite diferentes puntos de partida. Los usuarios pueden comenzar tipeando el nombre
de una categoría y mirar qué partes de la jerarquía de categorías se corresponde. Por ejemplo, la
Figura 10.34 muestra el resultado de una búsqueda sobre “Radiación” en los términos del MeSH.
La palabra aparece bajo cuatro encabezamientos principales (Ciencias físicas, Enfermedades,
Diagnóstico y Ciencias Biológicas). Se muestra entonces por qué “Radiación” aparece bajo
Enfermedades (como parte de una rama sobre accidentes ocupacionales). Ahora el usuario puede
seleccionar uno o más de estas categorías como entradas de la especificación de la consulta.

Figura 10.33 La interfaz Cat-a-Cone que integra la revisión de categorías y de documentos con la
búsqueda [358]

Otra forma en que el usuario puede comenzar es tipeando una consulta en texto libre. Esta consulta
es equiparada con la colección. Los documentos relevantes son recuperados y ubicados en un
formato de libro. Cuando el usuario “abre” el libro de un documento recuperado, se muestran las
partes de la jerarquía de categorías en la representación jerárquica. De ese modo, se muestran varias
categorías simultáneamente, en su contexto. Esta interfaz combina la manipulación de extensos y
complejos metadatos, puntos de partida, revisión y realización de consultas en una misma interfaz.
También permite una retroalimentación por relevancia mediante la sugerencia de categorías
adicionales que están relacionadas con los documentos que han sido recuperados.

46
Figura 10.34 Interfaz Cat-a-Cone: puntos de partida para buscar en las categorías [358]

... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...

10.9 Tendencias y temas de investigación

La importancia de la interacción hombre computadora está recibiendo un creciente reconocimiento


en el campo de la informática [587]. Como debería ser evidente a partir de los contenidos de este
capítulo, el rol de la interfaz del usuario en el acceso a la información ha recibido muy
recientemente la atención que merece. Se espera que la investigación en esta área crezca
rápidamente, especialmente por la expansión de la Web. La Web ha hecho repentinamente
disponibles en forma global a grandes cantidades de información, produciendo un interés creciente
por el problema del acceso a la información. Esto ha llevado a la creación de nuevos paradigmas de
acceso a la información., tales como el uso innovador de la retroalimentación por relevancia tal
como se ve en la interfaz Amazon.com. Como la Web provee una interfaz independiente de
cualquier plataforma, se espera que las inversiones en el diseño de mejores interfaces tengan un
gran impacto a nivel de la población.

Otra tendencia que puede preverse es un interés creciente en la organización y búsqueda en


colecciones de información personal. Muchos investigadores están proponiendo que en el futuro la
vida completa de una persona sería registrada utilizando multimedia. Una motivación para esta
posibilidad es habilitar la búsqueda de todo lo que una persona ha hecho o escrito. Otra motivación
es permitir las búsquedas utilizando nexos contextuales, tales como “encuentre el artículo que yo
estaba leyendo en el encuentro que tuve el 1º. de julio con María y Pedro”.

47
También hay un interés creciente en identificar el comportamiento de individuos y grupos, tanto
para evaluar la calidad de los ítems de información como para sugerir puntos de partida para la
búsqueda. Los sistemas que recomiendan crecerán en diversidad e importancia. Las interfaces de
usuario necesitarán guiar a los usuarios a ítems recomendados apropiados basados en sus
necesidades de información.

El campo de la visualización de la información necesita algunas nuevas ideas sobre cómo disponer
espacios de información grandes y abstractos, de forma intuitiva. Hasta que eso suceda el rol de la
visualización de información estará confinada a proveer vistas generales temáticas y mostrar
grandes jerarquías de categorías en forma dinámica.

48

También podría gustarte