Está en la página 1de 7

Uso de los principales operadores lgicos para

bsquedas especializadas en internet


Hay dos tipos principales de buscadores en la Web:

los Directorios o ndices temticos (tambin conocidos como directorios, catlogos o


buscadores por categoras)
los Motores de bsqueda (o buscadores por contenido).
Descubrimiento Representacin Representacin Presentacin de
de recursos
del contenido de la consulta los resultados
Clasificacin
manual
Pginas creadas
Lo realizan las
Poco exhaustivos,
Directorios
Implcita
antes de la
personas
muy precisos.
(navegacin
consulta.
por categoras)
Principalmente
de
forma
Explcita
Pginas creadas
Motores automtica por
(palabras clave, dinmicamente Muy exhaustivos,
de
medio
de
operadores,
en
cada poco precisos
bsqueda robots
etc.)
consulta.
Indizacin
automtica

Directorios y Motores de bsqueda son las principales herramientas de bsqueda en la Web.


Sin embargo, tambin existen otro tipo de herramientas que funcionan como intermediarios en
la recuperacin de informacin, ya que actan como interfaz nico a mltiples motores de
bsqueda. Se trata de los multibuscadores y metabuscadores que no son buscadores en s
mismos aunque se basen en ellos y su interfaz suele ser similar a la de los ndices temticos o
motores de bsqueda. Estas herramientas no buscan por s mismas, sino que limitan a pedir a
otros que busquen por ellos.
Podemos distinguir:

multibuscadores
metabuscadores

Los multibuscadores se limitan a colocar en una pgina web una lista con los buscadores ms
comunes y con una ventana de texto para poder enviar la cadena de bsqueda introducida por
el usuario a cada uno de ellos. Tambin pueden enviar la cadena de bsqueda a una serie de
motores de bsqueda e ndices temticos previamente definidos. Una vez realizada la consulta
a los buscadores prefijados, el multibuscador devolver la informacin de todos los enlaces
encontrados. Con la utilizacin de multibuscadores, el usuario se evita tener que ir de buscador
en buscador hasta encontrar la informacin deseada. El usuario elige los buscadores que quiere
utilizar y desde all realiza su consulta que ofrecer las respuestas buscador por buscador. La
nica ventaja es la posibilidad de consultar un gran nmero de buscadores partiendo de una
nica pgina. La exhaustividad primar sobre la precisin, ya que el usuario encontrar un gran
nmero de enlaces y muchas pginas repetidas. Un buen ejemplo de multibuscador es el
ofrecido por CyberJournalist: http://cyberjournalist.ourtoolbar.com/xpi

Ejemplo de multibuscador: Busca, busca.


http://www.geocities.com/SiliconValley/Vista/7673/
Los metabuscadores tambin permiten buscar en varios buscadores al mismo tiempo. Los
metabuscadores no almacenan las descripciones de pginas en sus bases de datos, sino que
contienen los registros de los motores de bsqueda y la informacin sobre ellos, adecuando su
expresin a los diferentes motores para remitir la consulta a los motores. Una vez que reciben

la respuesta, la remiten al usuario no directamente, sino tras realizar un filtrado de los


resultados. Este filtrado consiste en eliminar y depurar los enlaces repetidos y en ordenar los
enlaces. Adems, slo aparecer un nmero limitado de enlaces, los que se consideren ms
importantes. Los ms repetidos ocuparn los primeros puestos ya que el metabuscador
considerar que son los ms relevantes por estar dados de alta en mayor nmero de
buscadores. Se trata de herramientas muy tiles, el nico problema es que, por lo general, no
permiten realizar bsquedas tan avanzadas como en un motor de bsqueda, con lo que las
consultas tienen que ser generales y no se puede buscar en profundidad.
http://www.uc3m.es/uc3m/gral/IT/1metabuscadores.htm
Un metabuscador es un verdadero programa que pueden actuar bien integrado en la propia
WWW como el caso de MetaCrawler o Buscopio, o bien como un programa autnomo, como
Copernic, una pequea herramienta de software que se instala en el ordenador y permite hacer
bsquedas en varios buscadores a la vez. Existen incluso metabuscadores especializados en
determinadas materias: noticias, bibliotecas, diccionarios, blogs, software, etc; otros que
permiten bsquedas multilinges, e incluso algunos permiten personalizar las bsquedas con
los buscadores elegidos.
Copernic Agent Personal
(http://www.copernic.com/en/products/agent/download.html): permite el
acceso a la Web invisible, utiliza ms de 1200 buscadores y permite crear las propias bsquedas
por categoras. Incluye adems otra herramienta llamada GuruNet (http://www.gurunet.com/)
que permite, con un solo clic, acceder a informacin contextual dando acceso a ms de 100
enciclopedias, diccionarios y anuarios.
Sin duda, uno de los ms conocidos y potentes multibuscadores es MetaCrawler, que permite
buscar en Google, AltaVista, Excite, Infoseek, Yahoo, WebCrawler y Lycos al mismo tiempo,
mostrando todos los resultados de forma conjunta y por orden de importancia. MetaCrawler
tambin permite la utilizacin de operadores booleanos y acotaciones geogrficas. Adems de
buscar en la Web, permite bsquedas en grupos de noticias y ofrece el servicio MiniCrawler,
una pequea ventana flotante que permite realizar bsquedas rpidas en MetaCrawler desde
cualquier punto en que nos encontremos. Pero existen otros muchos multibuscadores, he aqu
un ejemplo:
Biwe: Busca simultneamente en los principales
buscadores. http://www.biwe.com

Buscamultiple: http://www.buscamultiple.com/
Dogpile: Busca simultnea o separadamente en
Google,
Yahoo,
MSN
y
Ask
Jeeves.
http://www.dogpile.com/
ixquick: Busca simultneamente en los motores de
bsqueda ms comunes: Google, AltaVista, Yahoo, Ask
Jeeves,
OpenDirectory,
MSN,
etc.
http://www.eu.ixquick.com/
Info.com: Busca separada o simultneamente en
Google,
Yahoo,
MSN
Ask
Jeeves. http://www.info.com/
Mamma: Busca simultneamente en varios
buscadores. http://www.mamma.com/
Metacrawler: Busca simultneamente en Google,
AltaVista, WebCrawler, Lycos, Yahoo, Looksmart, MSN,
etc. http://www.metacrawler.com/
Monster Crawler: Busca simultneamente en Yahoo,
MSN, AltaVista, FastSearch y OpenDirectory.
http://monstercrawler.com/
StartingPoint: Busca simultneamente en Ask Jeeves,
Excite, Google, Looksmart, Lycos, MSN, Yahoo y
Northern Light. http://www.stpt.com/
Directorios o ndices temticos
Los directorios son listas de recursos organizados por categoras temticas que se estructuran
jerrquicamente en un rbol de materias que permite visualizar los recursos descendiendo
desde los temas ms generales situados en las ramas superiores, a los temas ms especficos
situados en las ramas inferiores. Las categoras ofrecen una lista de enlaces a las pginas que
aparecen referenciadas en el buscador. Cada enlace tambin ofrece una breve descripcin de
su contenido. As pues, los directorios o ndices se estructuran por temas o categoras
principales que, a su vez, contienen otras subcategoras, y as sucesivamente hasta que al final
se ofrecen enlaces directos a otras pginas o recursos de Internet.

Ejemplo de ndice temtico: Directorio web de AltaVista http://www.altavista.com/dir/


El ndice o Directorio permite acceder a los recursos referenciados por medio de 2 sistemas:

navegando a travs de la estructura de las categoras temticas


buscando por palabras clave sobre el conjunto de referencias del buscador o sobre una
categora concreta

Los ndices o Directorios se componen de 2 partes:

Una base de datos que contiene las pginas de los sitios registrados
Una estructura jerrquica que facilita la consulta a la base de datos

Sin embargo, la formacin de un directorio presenta graves problemas ya que slo listan una
pequea parte de los documentos existentes y no suelen estar actualizados. Adems, la
clasificacin y categorizacin requieren una intervencin manual y en muchos casos, debido a la
heterogeneidad de los temas tratados, algunas pginas presentan problemas de categorizacin
ya que los ndices suelen mantener su base de datos de forma manual.

La inclusin en un directorio puede hacerse mediante registro del autor o editor de la pgina,
definiendo las palabras clave con las que se quiera identificarlo u optimizando el propio diseo
de la pgina a travs de metadatos para que pueda ser indexada de forma automtica.
Motores de bsqueda
La diferencia fundamental entre un ndice y un motor de bsqueda es que mientras los ndices
mantienen su base de datos manualmente, utilizando para la inclusin de las direcciones a
sus empleados o a los propios internautas que dan de alta sus pginas, los motores de
bsqueda emplean para ello un robot de bsqueda. Estos robots no son otra cosa que potentes
programas que se dedican a recorrer la Web automticamente recopilando e indizando todo el
texto que encuentran, formando as enormes bases de datos en las que luego los internautas
hacen sus bsquedas mediante la inclusin de palabras clave. Los robots recorren los distintos
servidores de forma recursiva, a travs de los enlaces que proporcionan las pginas que all se
encuentran, descendiendo como si de un rbol se tratara a travs de las distintas ramas de cada
servidor. Luego, peridicamente, visitarn de nuevo las pginas para comprobar si ha habido
incorporaciones o si las pginas siguen activas, de modo que su base de datos se mantenga
siempre actualizada. Adems, estas actualizaciones se realizarn de forma inteligente,
visitando con ms asiduidad aquellos servidores que cambien ms a menudo, como por
ejemplo los de los servicios de noticias.
Y esa es la principal ventaja de los motores de bsqueda frente a los ndices temticos: la gran
cantidad de informacin que recogen y la mayor actualizacin de sus bases de datos. Adems,
estos robots permiten a los creadores de las pginas web la inclusin de metatags o etiquetas
en lenguaje HTML (entre las cuales pueden incluirse metadatos normalizados tipo Dublin Core)
para resumir los contenidos de sus pginas y para incluir las palabras claves que las definan.
Mediante los metadatos y las etiquetas, los motores de bsqueda podrn indizar las pginas
web de forma correcta.
Por el contrario, la ventaja de los Directorios frente a los motores radica en la mayor precisin y
un menor ruido, aunque son menos exhaustivos que los motores de bsqueda, ya que se
obtienen menos resultados.
Los motores de bsqueda no son otra cosa que enormes bases de datos generadas como
resultado de la indexacin automtica de documentos que han sido analizados previamente en
la Web. Recogen documentos en formato HTML y otro tipo de recursos. Esta tarea la lleva a
cabo un programa denominado crawler (robot) que rastrea la red explorando todos los
servidores, o limitndose a ciertos servidores siguiendo un criterio temtico, geogrfico o
idiomtico.

La posterior recuperacin se lleva a cabo gracias a la gestin de esta enorme base de datos que
permite diferentes tipo de consulta y ordena los resultados por relevancia, dependiendo de la
estrategia de consulta. Los motores son ms exhaustivos en cuanto al volumen de pginas, pero
son menos precisos ya que no interviene la indexacin humana.

Existen un gran nmero de motores de bsqueda y cada uno presenta diferencias en cuanto al
volumen de pginas indexadas, la interfaz, el lenguaje de consulta, el algoritmo de clculo de
relevancia, etc. Todas ellas son causa de que, ante una bsqueda, cada motor presente
resultados diferentes.

También podría gustarte