Documentos de Académico
Documentos de Profesional
Documentos de Cultura
multibuscadores
metabuscadores
Los multibuscadores se limitan a colocar en una pgina web una lista con los buscadores ms
comunes y con una ventana de texto para poder enviar la cadena de bsqueda introducida por
el usuario a cada uno de ellos. Tambin pueden enviar la cadena de bsqueda a una serie de
motores de bsqueda e ndices temticos previamente definidos. Una vez realizada la consulta
a los buscadores prefijados, el multibuscador devolver la informacin de todos los enlaces
encontrados. Con la utilizacin de multibuscadores, el usuario se evita tener que ir de buscador
en buscador hasta encontrar la informacin deseada. El usuario elige los buscadores que quiere
utilizar y desde all realiza su consulta que ofrecer las respuestas buscador por buscador. La
nica ventaja es la posibilidad de consultar un gran nmero de buscadores partiendo de una
nica pgina. La exhaustividad primar sobre la precisin, ya que el usuario encontrar un gran
nmero de enlaces y muchas pginas repetidas. Un buen ejemplo de multibuscador es el
ofrecido por CyberJournalist: http://cyberjournalist.ourtoolbar.com/xpi
Buscamultiple: http://www.buscamultiple.com/
Dogpile: Busca simultnea o separadamente en
Google,
Yahoo,
MSN
y
Ask
Jeeves.
http://www.dogpile.com/
ixquick: Busca simultneamente en los motores de
bsqueda ms comunes: Google, AltaVista, Yahoo, Ask
Jeeves,
OpenDirectory,
MSN,
etc.
http://www.eu.ixquick.com/
Info.com: Busca separada o simultneamente en
Google,
Yahoo,
MSN
Ask
Jeeves. http://www.info.com/
Mamma: Busca simultneamente en varios
buscadores. http://www.mamma.com/
Metacrawler: Busca simultneamente en Google,
AltaVista, WebCrawler, Lycos, Yahoo, Looksmart, MSN,
etc. http://www.metacrawler.com/
Monster Crawler: Busca simultneamente en Yahoo,
MSN, AltaVista, FastSearch y OpenDirectory.
http://monstercrawler.com/
StartingPoint: Busca simultneamente en Ask Jeeves,
Excite, Google, Looksmart, Lycos, MSN, Yahoo y
Northern Light. http://www.stpt.com/
Directorios o ndices temticos
Los directorios son listas de recursos organizados por categoras temticas que se estructuran
jerrquicamente en un rbol de materias que permite visualizar los recursos descendiendo
desde los temas ms generales situados en las ramas superiores, a los temas ms especficos
situados en las ramas inferiores. Las categoras ofrecen una lista de enlaces a las pginas que
aparecen referenciadas en el buscador. Cada enlace tambin ofrece una breve descripcin de
su contenido. As pues, los directorios o ndices se estructuran por temas o categoras
principales que, a su vez, contienen otras subcategoras, y as sucesivamente hasta que al final
se ofrecen enlaces directos a otras pginas o recursos de Internet.
Una base de datos que contiene las pginas de los sitios registrados
Una estructura jerrquica que facilita la consulta a la base de datos
Sin embargo, la formacin de un directorio presenta graves problemas ya que slo listan una
pequea parte de los documentos existentes y no suelen estar actualizados. Adems, la
clasificacin y categorizacin requieren una intervencin manual y en muchos casos, debido a la
heterogeneidad de los temas tratados, algunas pginas presentan problemas de categorizacin
ya que los ndices suelen mantener su base de datos de forma manual.
La inclusin en un directorio puede hacerse mediante registro del autor o editor de la pgina,
definiendo las palabras clave con las que se quiera identificarlo u optimizando el propio diseo
de la pgina a travs de metadatos para que pueda ser indexada de forma automtica.
Motores de bsqueda
La diferencia fundamental entre un ndice y un motor de bsqueda es que mientras los ndices
mantienen su base de datos manualmente, utilizando para la inclusin de las direcciones a
sus empleados o a los propios internautas que dan de alta sus pginas, los motores de
bsqueda emplean para ello un robot de bsqueda. Estos robots no son otra cosa que potentes
programas que se dedican a recorrer la Web automticamente recopilando e indizando todo el
texto que encuentran, formando as enormes bases de datos en las que luego los internautas
hacen sus bsquedas mediante la inclusin de palabras clave. Los robots recorren los distintos
servidores de forma recursiva, a travs de los enlaces que proporcionan las pginas que all se
encuentran, descendiendo como si de un rbol se tratara a travs de las distintas ramas de cada
servidor. Luego, peridicamente, visitarn de nuevo las pginas para comprobar si ha habido
incorporaciones o si las pginas siguen activas, de modo que su base de datos se mantenga
siempre actualizada. Adems, estas actualizaciones se realizarn de forma inteligente,
visitando con ms asiduidad aquellos servidores que cambien ms a menudo, como por
ejemplo los de los servicios de noticias.
Y esa es la principal ventaja de los motores de bsqueda frente a los ndices temticos: la gran
cantidad de informacin que recogen y la mayor actualizacin de sus bases de datos. Adems,
estos robots permiten a los creadores de las pginas web la inclusin de metatags o etiquetas
en lenguaje HTML (entre las cuales pueden incluirse metadatos normalizados tipo Dublin Core)
para resumir los contenidos de sus pginas y para incluir las palabras claves que las definan.
Mediante los metadatos y las etiquetas, los motores de bsqueda podrn indizar las pginas
web de forma correcta.
Por el contrario, la ventaja de los Directorios frente a los motores radica en la mayor precisin y
un menor ruido, aunque son menos exhaustivos que los motores de bsqueda, ya que se
obtienen menos resultados.
Los motores de bsqueda no son otra cosa que enormes bases de datos generadas como
resultado de la indexacin automtica de documentos que han sido analizados previamente en
la Web. Recogen documentos en formato HTML y otro tipo de recursos. Esta tarea la lleva a
cabo un programa denominado crawler (robot) que rastrea la red explorando todos los
servidores, o limitndose a ciertos servidores siguiendo un criterio temtico, geogrfico o
idiomtico.
La posterior recuperacin se lleva a cabo gracias a la gestin de esta enorme base de datos que
permite diferentes tipo de consulta y ordena los resultados por relevancia, dependiendo de la
estrategia de consulta. Los motores son ms exhaustivos en cuanto al volumen de pginas, pero
son menos precisos ya que no interviene la indexacin humana.
Existen un gran nmero de motores de bsqueda y cada uno presenta diferencias en cuanto al
volumen de pginas indexadas, la interfaz, el lenguaje de consulta, el algoritmo de clculo de
relevancia, etc. Todas ellas son causa de que, ante una bsqueda, cada motor presente
resultados diferentes.