Está en la página 1de 32

2

Introducción.........................................................................................................5

Internet................................................................................................................ 5

Internet como recurso informativo....................................................................5

La red y su uso por parte del profesional de la comunicación.........................6

Criterios de selección de información..................................................................9

La búsqueda en Internet..................................................................................9

Espacios básicos en el universo Internet.......................................................10

Proceso de búsqueda y recuperación de información...................................11

Identificación de la necesidad de información................................................12

Tipo de necesidad de información.................................................................13

Cómo buscar información..............................................................................14

Ruido documental..........................................................................................15

Silencio documental.......................................................................................15

Tipos de búsquedas.......................................................................................15

Búsqueda por comandos............................................................................15

Interfaz gráfica............................................................................................16

Búsqueda por índices.................................................................................17

Operadores y facilidades de búsqueda..........................................................17

Operadores booleanos 18

Operadores de adyacencia o proximidad....................................................................................19

c) Operadores de comparación..................................................................20

Enmascaramiento y truncamiento...............................................................................................20

Sistemas de Recuperación de Información (SRI)..........................................21

Tipología de recursos digitales.......................................................................22


Directorios......................................................................................................26 3

Motores de búsqueda....................................................................................27

Componentes del motor de búsqueda...........................................................27

Los metabuscadores......................................................................................28

Compiladores de buscadores........................................................................29

Referencias bibliográficas..................................................................................30
1

En esta lectura se desarrollarán los siguientes temas:

Internet

Criterios de selección de información

Sistemas de Recuperación de Información (SRI)

"Si pretendemos lograr resultados nunca antes alcanzados, debemos esperar


usar métodos nunca antes intentados".

Sir Francis Bacon (1561-1626)


2

En esta unidad desarrollaremos la función de la red de redes, Internet, como


recurso informativo en la documentación. Para ello veremos los criterios de
selección de los datos y la forma de buscarlos y administrarlos utilizando los
sistemas de recuperación de información.

Como recurso informativo, Internet es similar a una biblioteca sin libros que
recoge la má s variopinta informació n de todo el mundo. Es la nueva
biblioteca
de . Se está en el camino de coleccionar digitalmente todo el
Alejandriá
conocimiento humano y de hacerlo llegar a todo tipo de personas. En esta
1
biblioteca universal, caben tambié n los documentos preexistentes. Para poder
usar esta mezcla de recursos, las bibliotecas deberá n olvidar la dependencia
de cualquier soporte, pues lo que les interesa es satisfacer las demandas, y
esto se logra con la selecció n y difusió n adecuadas de los recursos de
acuerdo con sus
contenidos. Se alcanza así la auté ntica cooperació n internacional al momento de
crear y de intercambiar tanto los registros bibliográ ficos como los
originales multimedia (Moreiro, 2006).

La apertura de los depó sitos de informació n a la web ha facilitado el acceso a


los documentos completos y a todo tipo de informació n:

las puertas de la ciencia son mayores para los especialistas pero,


tambié n, para el pú blico en general, pues resulta relativamente sencillo
y barato acceder a toda informació n situada en la red;
el conocimiento y los datos se comunican con mayor rapidez; y
el intercambio de ideas y el flujo de informació n entre los especialistas
es má s fá cil. Ademá s, no existen restricciones para que cualquier
persona coloque toda la informació n que estime conveniente en la red
(Moreiro, 2006).

En contraposición a las unidades documentales tradicionales en las que los


fondos que las componen han sido cuidadosamente seleccionados (también en
el caso de los archivos cuya selección es casi todo lo que produce una
organización), Internet recoge todos aquellos materiales que los productores
quieran publicar y constituye un enorme depósito de información y
documentación que, sin embargo, carece de homogeneidad y debe ser
manejado con cautela (Ferran & Pérez-Montoro, 2009).
La publicación de contenidos en la Red está abierta a todo el mundo; basta con
1
querer decir algo, tener nociones de HTML, XML u otro lenguaje de marcado –o
incluso un editor que «marque» el lenguaje de forma automática–, disponer de
un programa de transferencia de ficheros y espacios en un servidor para alojar
allí las páginas web creadas. Estos requisitos que son accesibles para mucha
gente, son los únicos filtros para poner información en la red (Giménez, 2007).

La libertad y la facilidad de publicar convierten a la Red en el mayor depósito de


información del mundo. Allí podemos encontrar casi cualquier cosa que se nos
ocurra: desde un artículo científico más riguroso hasta directorios para
encontrar a los antiguos amigos del colegio; desde la información ofrecida por
los gobiernos del todo el mundo hasta la página personal del vecino de
enfrente, la colección de imágenes de Copa América o las canciones de
nuestro grupo favorito. Y la variedad no solo se refiere a las materias
abordadas o al tratamiento que se da a la información (riguroso o superficial,
profesional o lúdico, etc.), sino también a los formatos (texto, imagen, vídeo,
sonido, etc.) o a los idiomas de los contenidos. Esta variedad nos aporta
tantas ventajas como inconvenientes. Potencialmente, podremos encontrar
toda la información que nos interese, pero habrá que aprender a buscar, a
encontrar y a discernir la información de calidad del resto de informaciones de
la Red (Cordó n & Aré valo, 2016).

Ante una heterogeneidad temática y cualitativa como esta ¿cómo encontrar


justo aquella información que buscamos? ¿Cómo distinguir la información de
calidad de informaciones superficiales o infames? ¿Cómo evaluar los distintos
recursos electrónicos que nos ofrece la Red?

Estas preguntas cobran especial importancia cuando se trata de utilizar Internet


en un contexto profesional. Trabajar con información veraz, fiable, consistente y
actualizada se transforma en una exigencia ineludible en cualquier profesión,
aunque en el campo de la Comunicación adquiere una relevancia notable, en
tanto en cuanto el público destinatario de los mensajes es amplio y, por tanto, el
comunicador debe sentirse responsable de aquello que cuenta. Además, en la
actividad periodística, el factor tiempo es crítico: se trabaja contrarreloj, se
1
persiguen las primicias y se intenta informar antes que el resto de los medios, lo
que en ningún caso debe implicar una falta de comprobación y contrastación de
las informaciones (Ferran & Pérez-Montoro, 2009).

Por ello, por el contexto en el que se desarrolla la actividad del comunicador, es


necesario que el usuario especializado de la Red conozca la constitución de la
misma, sepa sacar partido a los distintos servicios de la Red, maneje las
herramientas de búsqueda adecuadamente, conozca las fuentes de información
especializadas –desechando la idea de que en «Google se encuentra todo»2– y
tenga unos sólidos criterios de evaluación para poder seleccionar información.

De esta forma, cada usuario navegará solo la parte de la Red que le interese,
sin acceder o evitando las informaciones poco serias o insustanciales, sin
perder el horizonte al que quiere llegar, teniendo muy claro lo que quiere
encontrar y para qué, y evitando perderse en los mares de datos que están
dispersos en Internet (Giménez, 2007).
9

Uno de los primeros impulsos cuando se siente una necesidad de información


es recurrir a alguno de los buscadores que existen en Internet para satisfacerla.
Aunque en muchas ocasiones este recurso es suficiente, es preciso tener en
cuenta que ni está todo lo que es, ni es todo lo que está , es decir, que hay
mucha información importante que no aflora en las búsquedas
convencionales y que mucha de la que aparece únicamente aporta ruido y
confusión (Argudo & Pons,
2013).

Una búsqueda sencilla en la Red puede dar como resultado miles y miles de
páginas que no podemos llegar a examinar y que, mayoritariamente, dejamos
de lado, accediendo solo a unas cuantas. Y normalmente accedemos solo a
aquellas que aparecen en la primera o en la segunda página de resultados de
un buscador (Cordó n & Aré valo, 2016).

La pregunta que debemos formularnos es ¿por qué obtenemos unos resultados


antes que otros? ¿Cómo efectúan las búsquedas los motores? ¿Qué criterios
se utilizan para la ordenación de resultados?

La respuesta no es sencilla. Los buscadores utilizan complejos algoritmos para


determinar la mayor o menor importancia de un recurso sobre un tema
determinado.

Estos algoritmos tienen en cuenta, por ejemplo, si la palabra clave que hemos
indicado está incluida en lugares significativos del recurso digital (título o URL)
o si está incluida en la descripción de contenido que hacen los productores
del recurso digital; una vez tenidos en cuenta esos criterios, se calcula
también cuántas veces es citado un determinado recurso digital por otras
páginas web,
ya que un gran número de enlaces a ese recurso puede indicar relevancia del 10
mismo o preponderancia frente a otros (Giménez, 2007).

Tales algoritmos demuestran a menudo su efectividad, ya que en las primeras


páginas de resultados nos dan acceso a los recursos que buscábamos. Sin
embargo, es necesario saber que los productores de páginas web y, sobre todo,
los responsables de márketing y de publicidad de las empresas conocen
profundamente el funcionamiento de esos algoritmos y «juegan» con ellos. Así,
en los últimos años, han surgido muchas empresas dedicadas a mejorar la
visibilidad de las páginas web de sus clientes, a conseguir un mejor
posicionamiento de las mismas entre los resultados de búsqueda e incluso a
anunciarse cada vez que un usuario teclea en un buscador una determinada
palabra (Moreiro, 2006).

En teoría, si una página es muy enlazada, quiere decir que es relevante en un


determinado tema. Pero hay maneras de conseguir que la web más popular no
sea realmente la más relevante, sino la más enlazada de una manera artificial.

Y es necesario tener en cuenta este fenómeno para considerar que no


siemprelos resultados de búsqueda que obtenemos son los más interesantes
para nosotros (Giménez, 2007).

Para entender esta cuestión es preciso conocer los tres espacios básicos que
podemos distinguir en el universo Internet (Cordó n & Aré valo, 2016):

Internet global:

Red de información libre y gratuita que es accesible mediante la interconexión


de ordenadores. La forma de acceso se realiza mediante programas
navegadores, chats, mensajería o intercambio (FTP, P2P).
Internet invisible: 11

Información que está disponible en Internet pero que únicamente es accesible a


través de páginas generadas dinámicamente tras realizar una consulta en una
base de datos. Es inaccesible mediante los procesos habituales de recuperación
de la información que realizan buscadores, directorios y agentes de búsqueda.

Internet oscuro:

Los servidores o hots que son totalmente inaccesibles desde nuestro


ordenador, básicamente porque cubren zonas restringidas con fines de
seguridad nacional y militar. Otros motivos son la configuración incorrecta de
routers, servicios de cortafuegos y protección, servidores inactivos, etc. (Cordó
n & Aré valo, 2016).

El tipo de información que encontramos en la Internet invisible puede ser:

Bases de datos: los buscadores solo proporcionan acceso a la página


de inicio porque las restantes son dinámicas.
Documentos en formato pdf, word...: los motores de búsquedas
fueron creados sólo para localizar e indizar páginas html, aunque
actualmente Google indiza documentos en formato pdf, doc, xml...
Páginas web que no son indizadas por los motores de búsqueda
porque se excluyen ellas mismas a través de un protocolo de exclusión.
Sitios web que necesitan contraseña: los motores de búsqueda no
pueden acceder al contenido de estas páginas.

El proceso de búsqueda de información está formado por unas fases muy


claramente establecidas (Ferran & Pérez-Montoro, 2009):
primero hay que definir las necesidades de información y traducirlas
en 12
términos de búsqueda (ver apartado identificación de la necesidad de
información),
hay que identificar las fuentes de información que nos permitirán
localizar la información que mejor responda a las necesidades de
información (ver apartado identificación de las fuentes de información).
después, se tienen que analizar las opciones de búsqueda del sistema
de localización de la información e introducir la ecuación de búsqueda
que se corresponde con la necesidad de información (ver apartado
análisis de las opciones de búsqueda del sistema)
por último hay que seleccionar y evaluar la información recuperada,
y valorar la necesidad de redefinir la búsqueda y recomenzar el
proceso (ver apartado selección y evaluación de la información).

Siempre que intentamos localizar los documentos pertinentes que contienen la


información necesaria para poder satisfacer una necesidad de información, el
primer paso que tenemos que dar es identificar y tener claro qué tipo de
necesidad de información tenemos (Argudo & Pons, 2013).

Identificar el tipo de necesidad de información no es una cuestión superflua o


secundaría. El tipo de necesidad de información determinará cosas tan
importantes como la estrategia de localización, la elección del sistema de
localización (un sistema de navegación o uno de interrogación) o también el tipo
de fuentes o documentos que necesitamos para poder satisfacerla
adecuadamente (Cordó n & Aré valo, 2016).

Cuando un usuario tiene un problema que puede resolver localizando una


información determinada, acostumbra a presentar uno de los siguientes tipos de
necesidad de información: una necesidad de información concreta, una
necesidad de información orientada a problemas, una necesidad de información
13
exploratoria o una necesidad de información sobre búsquedas previas (Giménez,
2007).

Una necesidad de información concreta (NIC) (o búsqueda del ítem


conocido) es un problema de información que presenta unos límites temáticos
bien definidos. Es una necesidad de información que se puede formular o
expresar de una forma exacta y que acostumbra a poder satisfacerse a partir
de una única respuesta o ítem de información (Argudo & Pons, 2013).

Una necesidad de información orientada a problemas (NIOP) (o búsqueda


exhaustiva) es un problema de información que no acostumbrar a presentar
unos límites temáticos bien definidos, no sabemos exactamente cuándo se
encuentra satisfecha o cuándo necesitamos todavía más información para
acabar de satisfacerla. Es una necesidad de información que no se puede
formular o expresar de una forma exacta y que no acostumbra a poder
satisfacerse a partir de una única respuesta o ítem de información, sino que
se hace mediante la agregación de diferentes ítems de información (no se
sabe exactamente cuántos) (Argudo & Pons, 2013).

Una necesidad de información exploratoria (NIE) (o búsqueda exploratoria)


es un problema de información que se produce cuando se busca una respuesta
útil (no estamos totalmente seguros de que la escogida sea la más adecuada)
dentro de un conjunto de respuestas localizadas previamente (Argudo & Pons,
2013).

Una necesidad de información sobre búsquedas previas (NIBP) (o


recuperación de una búsqueda) es un problema de información que se
acostumbra a satisfacer volviendo a localizar una información que ya habíamos
14
localizado anteriormente (Argudo & Pons, 2013).

Bases de datos y motores de búsqueda comparten muchas de las técnicas de


recuperación de información que se han venido aplicado desde que
comenzaron a desarrollarse las primeras bases de datos.

Iniciar una búsqueda de información conlleva elegir las fuentes de información


más adecuadas y desarrollar una buena estrategia de búsqueda que facilite la
recuperación de información pertinente. Se entiende por estrategia de
búsqueda el conjunto de pasos que un usuario ha de dar para encontrar la
información que necesita: elegir los términos de búsqueda y los operadores
que representan de forma sintética su necesidad informativa y sacar el máximo
partido a las distintas opciones de búsqueda que ofrezca la base de datos o
el buscador (Giménez, 2007).

Diseñar una estrategia de búsqueda adecuada pasa por conocer los distintos
tipos de búsquedas con los que podemos encontrarnos y las técnicas básicas
de recuperación de la información. Con ello, se conseguirá obtener
eficazmente información deseada y se evitarán –si no total, al menos,
parcialmente – dos fenómenos habituales y poco deseables entre los usuarios
menos habituados a diseñar estrategias válidas: el ruido y el silencio
documental (Cordó n & Aré valo,
2016).
15

Se produce ruido documental cuando realizamos una búsqueda y obtenemos


no solo la información pertinente, sino también información no relevante, es
decir, cuando recuperamos más información de la deseada. Para que no se
produzca ruido documental hay que afinar mucho la estrategia de búsqueda y
para ello se utilizan los operadores booleanos, que se examinan un poco
más adelante (Ferran & Pérez-Montoro, 2009).

Por el contrario, se produce silencio documental cuando al efectuar una


búsqueda obtenemos resultados válidos, pero nos faltan otros que serían
pertinentes, pero que no han salido por algún defecto en la estrategia de
búsqueda diseñada. Ocurre cuando un mismo concepto puede expresarse con
más de un término o de una expresión, es decir, con los sinónimos. Una de las
fórmulas que evitan el silencio documental es utilizar dos o más expresiones de
búsqueda simultáneamente (Cordó n & Aré valo, 2016).

Existen tres modos fundamentales de interrogar una base de datos.

Originalmente, antes del desarrollo de los entornos gráficos tan cercanos y tan
fáciles de utilizar para el usuario, la consulta de bases de datos se hacía
mediante una búsqueda por comandos. A partir de una pantalla en blanco, el
usuario debía introducir una sentencia de búsqueda compuesta por comandos
16
(órdenes que se le dan al ordenador), términos de búsqueda (palabras por las
que el usuario quiere buscar) y operadores que marcan las relaciones entre
distintos términos de búsqueda (Giménez, 2007).

Realizar una búsqueda de este tipo requiere un buen conocimiento del sistema
y de las técnicas de recuperación de información. Aunque este modelo de
búsqueda es utilizado solo por usuarios expertos y por los gestores de las
bases de datos, la mayor parte de estas ya disponen de formularios de
búsqueda, mucho más intuitivos para el usuario y accesibles incluso para
aquellos que nunca han interrogado una base de datos. No obstante,
internamente e independientemente de que cuenten con un formulario de
búsqueda, las bases de datos funcionan con este tipo de comandos (Moreiro,
2006).

Con el objetivo de acercar las búsquedas a todo tipo de usuarios y de


simplificar el proceso de interrogación de una base de datos se crearon
interfaces gráficas que incorporan formularios sencillos para la consulta. Las
interfaces son las pantallas interpuestas entre la base de datos y el usuario,
es decir, las pantallas con las que el usuario interactúa y mediante las cuales
pretende facilitarse el trabajo de recuperación de información (Argudo & Pons,
2013).

Esta búsqueda guiada, mediante formularios o menús, es aquella en la que se


presenta al usuario una interfaz gráfica pensada especialmente para la
búsqueda de información. Muestran una serie de campos por los que se puede
buscar y al lado de cada uno de ellos existe un espacio en blanco para
que el usuario introduzca el/los término/s de búsqueda; además, suelen
incorporar menús desplegables para facilitar la utilización de operadores o,
incluso, la introducción del valor de un campo. Es el caso de los campos tipo
de documento, soporte, lengua del documento, biblioteca y país de
usuario debía introducir una sentencia de búsqueda compuesta por comandos
16
publicación del formulario que se
muestra a continuación, para los que está previsto que el usuario escoja el valor
17
por el que quiere buscar (libro, CD, vídeo, etc.) (Cordó n & Aré valo, 2016).

En esta búsqueda, el usuario no ha de teclear los términos por los cuales quiere
buscar, sino que le pide al sistema que le muestre los índices, es decir, las
listas de autores, de materias o de títulos que componen el conjunto
documental de la base de datos.

Estos listados alfabéticos permiten que el usuario elija el término de búsqueda


según lo que ve en pantalla, que se corresponde exactamente con el contenido
de la base de datos (Ferran & Pérez-Montoro, 2009).

Para poder diseñar una buena estrategia de búsqueda, es preciso conocer


aquellos elementos que nos ayudan a afinar la definición de nuestra necesidad
informativa. A continuación, se describen los distintos tipos de operadores que
se pueden utilizar en una estrategia, es decir, aquellos elementos que marcan
relaciones entre los términos de búsqueda y que permiten, de esa manera,
indicarle al sistema qué es exactamente lo que queremos recuperar. Son
opciones de búsqueda que podemos encontrar casi en cualquier base de datos
documental y en los motores de búsqueda (estos suelen incorporarlas en sus
páginas de búsqueda avanzada) (Giménez, 2007).
18

Basados en el álgebra de Boole, son palabras que permiten seleccionar


conjuntos de documentos en función de las necesidades informativas del
usuario. Los operadores booleanos se utilizan para combinar términos de
búsqueda. Los más utilizados son:

De unión (O, OR, OU): permite recuperar documentos que tengan uno u otro
elemento de los que indica el usuario. Por ejemplo, para obtener documentos
que traten de literatura o de cine, es decir, de cualquiera de las dos materias,
utilizaríamos la siguiente estrategia de búsqueda: literatura OR cine.

De intersección (Y, AND, ET): permite recuperar documentos que contengan


dos o más elementos de búsqueda simultáneamente. Por ejemplo, para obtener
documentos que traten de la convergencia del cine y de la literatura, es decir,
de las dos materias a la vez, utilizaríamos la estrategia de búsqueda: literatura
AND cine.

De exclusión (NO, NOT, SAUF): permite recuperar documentos que contengan


un elemento de búsqueda, pero no el otro. Se utiliza para eliminar documentos
que, aun estando relacionados con el tema, autor, etc. que interesa al usuario,
no son relevantes para una necesidad concreta de información. Por ejemplo,
para obtener documentos que traten de literatura pero que no tengan ninguna
relación con el cine, utilizaríamos la estrategia de búsqueda: literatura NOT
cine.

Para búsquedas más concretas, se pueden utilizar varios operadores de este u


otro tipo. Para ello, se diseñan estrategias anidadas, en las que se combinan
distintos términos de búsqueda y distintos operadores, indicando al sistema con
paréntesis en qué orden debe efectuar la búsqueda (Giménez, 2007).

Las pantallas de búsqueda avanzada de los buscadores evitan que el usuario


teclee el operador. En su lugar, permiten que el usuario introduzca dos o más
términos de búsqueda y que luego seleccione en un desplegable el tipo de
combinación que quiere que haya entre ellos: «cualquiera de las palabras» 19
(equivale a «o»), «todas las palabras» (equivale a «y») y «sin las palabras»
(equivale a «no») (Cordó n & Aré valo, 2016).

Permiten buscar dos o más términos en un conjunto de documentos, siempre y


cuando aparezcan próximos. Estos operadores facilitan la recuperación de
información relacionada con la que el usuario está buscando, al mismo
tiempo
que evita recuperar aquellos documentos en los que aparezcan los distintos
términos de búsqueda, pero tan distantes entre sí que no tengan relación
alguna con el tema de interés del usuario.

También se consideran adyacentes los términos que aparezcan separados por


«palabras vacías» (es decir, sin contenido semántico) o por caracteres se-
paradores. Por ejemplo, al realizar una búsqueda como «tribunal justicia», se
recuperarán documentos en los que aparezca «tribunal de justicia».

La adyacencia está implícita muchas veces en los motores de búsqueda, de


manera que sin introducir operador alguno y sin señalar ninguna opción, se
recuperarán, en primer lugar, aquellos documentos en los que aparezcan los
términos juntos (Ferran & Pérez-Montoro, 2009).

Los operadores de proximidad, por su parte, permiten recuperar términos de


búsqueda asociados, pero que no aparecen juntos necesariamente.

La mayoría de los buscadores disponen de la opción de búsqueda por frase


exacta, que es una modalidad de adyacencia, referida a varias palabras
(Giménez, 2007).
20

Se utilizan para recuperar información de los campos numéricos de una base


de datos. Son los siguientes: mayor (>), menor (<), mayor o igual (≥), menor o
igual (≤) o igual (=).

En algunas bases de datos periodísticas, se utilizan otros operadores como los


dos puntos (..) o el guion (-) que tienen una misión similar a los anteriores. En
este caso, lo que posibilitan estos denominados «operadores numéricos» es
recuperar información producida en un intervalo de tiempo determinado
(Giménez, 2007).

Ambos se basan en la utilización de un carácter comodín para sustituir uno o


varios caracteres de un término de búsqueda.

El enmascaramiento o mascara es un símbolo [normalmente la interrogación


(?), pero a veces también la admiración (!) o la barra inclinada (/)] que se sitúa
en el término de búsqueda en sustitución de uno o ningún carácter. Se utiliza
en los
casos en los que el usuario desconoce la grafía exacta de una palabra. por
Así,́
ejemplo, si quisiéramos recuperar documentos de México, pero no supiéramos
si se utiliza siempre con J o hay casos en los que se escribe con X,
introduciríamos el término de búsqueda de la siguiente manera: México.
Así,́ recuperaría tanto los de Méjico como los de México (Argudo & Pons, 2013).

El truncamiento, simbolizado normalmente con el asterisco (*), permite sustituir


más de un carácter y es muy útil cuando se tratan de recuperar términos que
tienen una misma raíz. La utilización del truncamiento simplifica la búsqueda de
plurales, sufijos y prefijos y elimina la necesidad de escribir todas las variantes
de una palabra. Se puede utilizar al principio y al final de una palabra. Por
ejemplo, para encontrar documentos relacionados con la tecnología se podría 21
buscar *tecnol* y se recuperarían documentos sobre pretecnologiá ,
pretecnoló gico, tecnología, tecnólogo, tecnológico, tecnológicos, etc (Moreiro,
2006).

Conocer un sistema de recuperación de información y la forma adecuada de


hablar con él implica conocer sus características principales, que se pueden
agrupar en tres aspectos o componentes básicos (Argudo & Pons, 2013):

Qué información existe en la base de datos del sistema: de qué tipo


es, cuáles son los objetos de información que podemos encontrar.
Cómo funciona el programa informático específico de recuperación
de información del sistema: qué opciones de búsqueda permite y cómo
hay que usarlas.
Qué tratamiento ha recibido la información y cómo está representada
en la base de datos del sistema: qué datos hay en relación con cada
objeto de información recopilado.

Todo esto es importante con relación al proceso de búsqueda porque nos


indica, por ejemplo, que para buscar un artículo de revista especializada no
podemos acudir a un catálogo de biblioteca pública, ya que en dicho sistema
sólo podremos buscar las revistas completas, pero no los artículos que éstas
contienen. Para encontrar un artículo de revista especializada debemos acudir
a una base de datos bibliográfica especializada. Un problema habitual en
muchos procesos de búsqueda de información es pedir una información a un
sistema que no contiene ese tipo de objeto de información (Argudo & Pons,
2013).
22

Se puede decir que los recursos digitales son las unidades que conforman la
red, sus divisiones, y se pueden clasificar en dos grandes grupos: fuentes de
información (revistas, bases de datos, sedes web, etc.) y servicios (blogs,
motores de búsqueda, listas de discusión, etc.) (Cordó n & Aré valo, 2016).

Existen muchos tipos distintos de recursos digitales también distintos y


conviene distinguirlos para saber qué tipo de información encontraremos en
cada uno de ellos. La información de una sede web empresarial no será, ni
en forma ni en
contenido, parecida a la que se puede encontrar en una base de datos de
empresas ni esta familiar a un artículo científico sobre gestión empresarial.
Conocer la tipología de recursos ayudará a orientarse mejor en la red y
a
seleccionar mejor (Ferran & Pérez-Montoro, 2009).

Algunos recursos digitales, como los portales o las sedes institucionales o


empresariales, integran a su vez distintos tipos de recursos (bases de datos,
revistas electrónicas, etc.).

La siguiente relación muestra algunos de los recursos más habituales de la Red


y establece una definición para cada uno de ellos, aunque en ocasiones las
fronteras entre unos y otros son difusas (Giménez, 2007).

Sede Web Institucional: conjunto de páginas web producidas por una


institución, normalmente de carácter público (Ministerios, Municipalidades, etc.),
en las que se aporta información sobre la propia institución y la actividad que
realiza.

Sede Web empresarial: conjunto de páginas web producidas y mantenidas por


una empresa privada en las que se aporta información sobre la misma y sobre
su actividad. En ocasiones, esta información va acompañada de publicidad
sobre productos o servicios generados por la empresa o, incluso, con la venta
de los mismos a través de comercio electrónico. En este caso se puede
hablar de
sedes web comerciales definidas por el conjunto de páginas web producidas
23
por una empresa en la que se desarrolla algún tipo de actividad comercial
(comercio electrónico).

Sede web académica: conjunto de páginas web producidas y mantenidas por


una institución dedicada a la investigación o a la docencia (Universidades,
centros escolares, centros de enseñanza secundaria, incluso centros de
investigación), en las que se ofrece información sobre la institución y sobre la
actividad que desarrolla.

Revistas electrónicas: publicaciones periódicas en formato electrónico que los


textos completos de los artículos o, en su defecto, los sumarios de los distintos
números junto con los resúmenes de los artículos. La Red acoge gran cantidad
de revista divulgativas, científicas, técnicas, etc.

Directorios: recursos que aportan información de identificación o localización


de personas, instituciones, empresas, etc. Suelen tomar forma de bases de
datos, permitiendo así́ que el usuario recupere información mediante la
utilización de campos.

Listas de discusión: Se trata de un servicio de Internet a través del cual un


conjunto de personas se comunica a través de correo electrónico, con la
peculiaridad de que, además de poder mandarse mensajes individualizados
entre ellas, tienen la posibilidad de enviarlos simultáneamente a la totalidad de
los componentes de la misma, gracias a la utilización de un software de envió
simultáneo de mensajes.

Guías de recursos de Internet: recopilación de direcciones (URLs), en


ocasiones acompañadas de descripciones, de páginas o sedes web de interés.
Las guías de recursos suelen estar especializadas en un tema y adoptan
formas distintas: pueden presentar descripciones y análisis de cada dirección
reseñada, pueden presentar los recursos clasificados por materia, pueden
calificar la calidad o el interés de cada recurso (bueno, muy bueno, etc.).
Anillo temático: es un tipo de guía de recurso de Internet, en la que todos los
24
recursos están unidos entre sí mediante una estructura circular. Todos los
recursos tratan de un mismo tema y en cada uno de ellos, existen «botones de
acción» que permiten circular por el anillo, acudiendo al recurso anterior, al
posterior, etc.

Portal horizontal: recurso digital cuyo objetivo es englobar el mayor número de


recursos de información a través de Internet para favorecer la colaboración y el
intercambio de ideas, productos, etc. Están orientados al ocio y al
entretenimiento y pueden incluir ciertas noticias de actualidad y contenidos con
una cierta perspectiva periodística. Se denominan «horizontales» porque
abarcan distintas materias, son generalistas. Se diferencian de otro tipo de
recursos por la variedad de las informaciones ofrecidas y por la posibilidad de
que el usuario interactúe con el sistema a través de la participación en foros,
chat, etc.

Portal vertical (o comunidad virtual): Se puede definir como un portal


horizontal, con la diferencia de que los portales verticales están especializados
en una materia. Su objetivo es proporcionar información y servicios a un
conjunto de usuarios con intereses temáticos similares (Giménez, 2007).

Colecciones (de software, imágenes, mapas, archivos de sonido, videos,


archivos de webcams, etc.): Son páginas o depósitos en Internet que
recopilan documentos de distintos tipos (textuales, gráficos, sonoros,
audiovisuales, etc.) relativos a uno o varios temas.

Blog o bitácoras: diarios personales, profesionales o colectivos que se


publican en la Red. Mediante un sistema de edición sencillo, un usuario o
grupo de ellos, puede publicar comentarios sobre un determinado tema con la
periodicidad que desee. Una reseña de un libro, la recomendación de un
enlace de interés, el relato de algo ocurrido, etc. son algunos de los
contenidos habituales de los blogs. Muchos medios de comunicación
incorporan blogs de periodistas o escritores colaboradores.
Bases de datos bibliográficas o documentales: conjunto de informaciones
25
estructuradas en registros. Cada registro representa a un documento: un libro,
un artículo, una fotografía, un vídeo, etc. Y cada registro está formado por
distintos campos: título del documento, autor, materias o descriptores, resumen,
etc. Las bases de datos bibliográficas suelen ofrecer los datos bibliográficos de
cada documento y, en ocasiones, el texto completo de los mismos.

Índices temáticos o directorios temáticos, motores de búsqueda o


buscadores, metabuscadores y multibuscadores: herramientas de
búsqueda en Internet que recuperan información con tecnologías y criterios
distintos. Tanto los índices temáticos (también denominados «directorios
temáticos») como los motores de búsqueda (también denominados
«buscadores»), los compiladores de buscadores y los metabuscadores son
recursos digitales que nacen en y para la red y que han sido ideados
específicamente para localizar información en Internet. Las páginas de los
buscadores y de los directorios temáticos se han ido transformando
paulatinamente, aunque en distintas direcciones.

La mayor parte de las páginas de Internet (sedes web comerciales,


académicas, institucionales, etc.) incorporan un motor de búsqueda
interno que permite recuperar información dentro de ese sitio web, pero no
en toda la Red. Estas páginas no deben confundirse en absoluto con las
herramientas de búsqueda propias de la Red (índices o motores) que
rastrean la totalidad de la Red y recuperan información de múltiples páginas
diferentes (Giménez, 2007).

En cierto sentido, se podría decir que tanto los directorios como los buscadores
y metabuscadores son grandes bases de datos, en el sentido de que los tres
recogen un conjunto «limitado» de recursos digitales de la Red. Sin embargo,
presentan algunas diferencias como las que se describen a continuación
(Moreiro, 2006).
26

Los directorios recopilan un conjunto limitado de recursos digitales en la Red,


seleccionados y analizados por analistas de información, webmasters y robots
de búsqueda, y clasificados en categorías y subcategorías temáticas. Es decir,
la información es limitada y el conjunto documental está acotado (no hay ni
motores de búsqueda ni directorios que analicen la totalidad de la Red). Sin
embargo, el usuario no recupera información a través de campos, sino a través
de las categorías temáticas. Y, además, el resultado conseguido no es un
registro completo (bibliográfico o de otro tipo) en el que se aporte una
descripción formal y de contenido del recurso, sino tan solo la URL de los
recursos recuperados, y en ocasiones, una breve descripción y una valoración
crítica.

Los directorios son las herramientas de búsqueda más adecuadas cuando no


se conoce muy bien el tema por el que se va a buscar o cuando no se sabe
muy
bien qué es lo que se puede encontrar de él en la Red. El hecho de que
los recursos estén clasificados temática y jerárquicamente (desde las materias
más generales a las más particulares) permite al usuario conocer los posibles
temas
relacionados con su necesidad informativa de origen. La subdivisión temática
muestra los temas relacionados, y el usuario no tiene más que ir seleccionando
entre las distintas materias que se le van mostrando (Argudo & Pons, 2013).

Cabe señalar la polivalencia de los términos índice y directorio. Directorio es


aquella fuente de información que proporciona datos de localización de
personas, empresas, instituciones, etc. Por extensión, el término se puede
aplicar a Internet, ya que un directorio temático, lo que hace es indicar dónde se
encuentran los recursos de la categoría temática que estamos buscando (dan
datos de localización de un conjunto de recursos digitales). Igualmente, si se
atiende a la función que cumple el índice de un libro, esto es, relacionar los
contenidos e indicar en qué páginas del libro se encuentran, se
entiende
entonces que el término se aplique también a los directorios temáticos en
Internet, puesto que están «indicando» donde se encuentra el recurso. Por tanto,
ambos términos son perfectamente válidos para designar a estas herramientas
27
de búsqueda en Internet (Cordó n & Aré valo, 2016).

Los motores de búsqueda son herramientas de búsqueda de información en la


Red más potentes que los directorios. Sirven para localizar informaciones
concretas. Por tanto, cuando un usuario, a priori, tiene bien definida su
necesidad informativa, suele ser más útil un motor de búsqueda que un
directorio.

Un motor de búsqueda está compuesto por cuatro elementos básicos


(Giménez, 2007):

Un robot de búsqueda, que es el programa encargado de explorar la


Red (saltando de unos enlaces a otros) y de localizar recursos digitales.
Todos los recursos localizados van siendo analizados por un programa
de indización automática que se ocupa de describir la información
contenida en esos recursos, con las limitaciones inherentes a los
procesos automatizados.
Una vez indizados, los recursos son digitales se van almacenando
en enormes bases de datos.
Estas bases de datos son consultadas por los usuarios a través de
una interfaz o formulario de búsqueda.

De todo lo expuesto, se deriva que un motor de búsqueda no es solo una base


de datos, sino que esta es un componente básico de dicho motor de búsqueda.
Puesto que el proceso de obtención de recursos digitales está automatizado,
las
bases de datos de los motores son, consecuentemente, mucho más
voluminosas 1
que las que componen los directorios temáticos.

La mayor parte de las herramientas de búsqueda actuales combinan distintas


tecnologías para la recuperación de información, convirtiéndose en una
«multiherramienta». En la actualidad, gran parte de las herramientas de
búsqueda en Internet son híbridas, en la medida en que incorporan distintos
métodos y utilidades de recuperación de información, aunque, indudablemente,
la opción más desarrollada y más atractiva para los usuarios es el buscador.

Los metabuscadores son herramientas que trabajan simultáneamente con


varios buscadores a la vez. El usuario formula una consulta, escribiendo uno o
varios términos en la casilla de búsqueda, y el metabuscador remite esa
consulta a los distintos buscadores con los que trabaja habitualmente,
recoge los distintos resultados obtenidos de cada buscador y se los ofrece al
usuario de una manera agrupada. Este proceso evita que el usuario deba
entrar en cada uno de los buscadores y realizar la búsqueda tantas veces
como buscadores quiera consultar (Moreiro, 2006).

El metabuscador permite formular una consulta a varios buscadores


simultáneamente utilizando un único interfaz de búsqueda. Además, suele
indicar aquellos motores de búsqueda con los que trabaja. Asimismo, para cada
recurso digital recuperado por un metabuscador, se indica de qué buscador en
concreto se ha obtenido.
1

Los compiladores de buscadores tienen apariencia de directorios o índices


temáticos. Sin embargo, no recogen recursos digitales en general, sino que
solamente recopilan herramientas de búsqueda especializadas en las distintas
materias. Bajo las distintas categorías y subcategorías temáticas que ofrece un
compilador de buscadores, el usuario solo encontrará recursos de Internet que
le ayuden a encontrar información de su interés (Giménez, 2007).
2

Argudo, S., & Pons, A. (2013). Mejorar las bú squedas de informació n.
Barcelona: Editorial UOC.

Cordó n, J., & Aré valo, J. (2016). Las nuevas fuentes de informació n: la bú
squeda informativa, documental y de investigació n en el á mbito digital.
Madrid: Difusora Larousse - Editorial Tecnos.

Ferran, N., & Pérez-Montoro, M. (2009). Búsqueda y recuperación de la


información. Barcelona: Editorial UOC.

Giménez, E. (2007). Manual de documentación para comunicadores (2a. ed.).


Navarra: EUNSA.

También podría gustarte