Está en la página 1de 6

Las mejores herramientas

E
xisten diferentes tipos de herramientas de bsqueda de informacin en
Internet. Cada una de ellas funciona de una manera diferente y tiene su
propio propsito y su alcance. Aqu nos referiremos a: buscadores,
metabuscadores, directorios, guas y software especializado.

Buscadores:
Los buscadores o motores de bsqueda utilizan tipos de software
especiales que localizan e indexan, en forma automtica, las pginas Web y
adems todos los documentos referenciados en ellas.
Un buscador est compuesto por cuatro componentes bsicos:
un robot,
un motor de indexacin,
los ndices
un motor de bsqueda.
El robot, tambin llamado spider, es un programa que se encarga de
recorrer la Web obteniendo informacin relevante, de cada una de las
pginas que visita.
Una vez obtenida la informacin de la pgina, debe ser analizada y
condensada, para su organizacin y su posterior presentacin a los
usuarios. Esta tarea la realiza el denominado motor de indexacin.
La indexacin puede efectuarse por palabras claves, que es la forma ms
comn, o por conceptos. En el caso de hacerlo por palabras claves, algunos
buscadores indexan todo el texto del documento, a excepcin de los
artculos, preposiciones y otros trminos denominados palabras vacas.
Otros motores de bsqueda se limitan a incluir en la indexacin a las
palabras que ms se repiten, o priorizan los trminos que se encuentran en
el ttulo, la URL, las cabeceras, los enlaces, los primeros prrafos y adems,
las palabras claves incluidas en las etiquetas o tags.
Para facilitar la bsqueda, en la informacin recolectada, se utilizan
estructuras de datos denominadas "ndices o ficheros inversos",
mediante los cuales se asocia una palabra a una lista de documentos
relacionados con ella.
El motor de bsqueda es el encargado de procesar las consultas recibidas
por los usuarios, para lo cual recorre los ndices inversos buscando los
trminos relacionados con la consulta y obteniendo

los identificadores de los documentos. Finalmente los ordena


jerrquicamente y presenta al usuario los resultados obtenidos.
Este tipo de herramienta, realiza sus bsquedas en sus propios ndices, no lo
hace directamente sobre la Web. Esto implica, que los buscadores, solo
pueden recuperar una muy pequea parte de todo lo que realmente
hay en Internet. Es importante sealar que los motores de bsqueda se
diferencian entre s por diferentes caractersticas como: el volumen y la
frecuencia de indexacin y el ordenamiento que hacen de la informacin
encontrada para su presentacin.
Entre los buscadores ms importantes se encuentran:
Google (http://www.google.com.ar): el ms utilizado.
Lycos (http://www.lycos.com/): un portal web que
incluye un buscador que surgi como un proyecto de desarrollo de un motor
de bsqueda.
Bing (http://www.bing.com/): anteriormente Live Search, Windows Live
Search y MSN Search, es un buscador Web de Microsoft.
Otros buscadores:
DuckduckGo (https://duckduckgo.com/): un motor de bsqueda
establecido en Valley Forge, Pensilvania, USA, que utiliza la informacin de
sitios de origen pblico con el objetivo de aumentar los resultados
tradicionales y mejorar la relevancia. Se promociona como un motor de
bsqueda con mucha privacidad (no almacena nuestros datos de registro) y
que nos muestra los mejores resultados descartando todo el spam y el ruido
informativo.
Yahoo buscador (https://es.search.yahoo.com/)
Actividad sugerida: Realiza la misma bsqueda en los distintos
buscadores sugeridos y compara los resultados obtenidos.
Metabuscadores Los metabuscadores son buscadores en
buscadores, es decir, son servidores web que realizan bsquedas en los
ndices de un gran nmero de buscadores y/o directorios, eliminan las
duplicaciones y nos presentan un resumen de los resultados obtenidos,
ordenados por relevancia y, en algunos casos, nos indican cul ha sido el
buscador de origen de dicha informacin. Cada uno de los motores de
bsqueda de los metabuscadores funciona de una manera distinta, aunque
existe un proceso interno comn a todos ellos.

Los pasos en el funcionamiento de un metabuscador son los siguientes:


El usuario realiza su peticin al metabuscador.
El metabuscador da formato a dicha peticin de acuerdo a la interfaz de
cada uno de los buscadores y les pasa la solicitud.
Los buscadores realizan la bsqueda utilizando sus medios habituales a
partir de los sitios web en Internet.
stos devuelven la informacin obtenida al metabuscador, el cual analiza
los datos.
El metabuscador organiza la informacin de acuerdo a los criterios del
mismo y se la muestra al usuario.
Podra decirse entonces que el metabuscador aporta resultados
seleccionados y ordenados mediante puntos de vista distintos y su ventaja
principal es que ampla el mbito de las bsquedas que realizamos.
Tengamos en cuenta que cada buscador utiliza su propia estrategia a la hora
de recoger la informacin y ordenar los resultados de las bsquedas, por lo
que las pginas de mayor relevancia en un buscador no tienen por qu
coincidir con las del resto.
Entre los metabuscadores ms importantes se encuentran:
Metacrawler (http://www.metacrawler.com/) / Zoo (http://www.zoo.com/)
Metacrawler fue uno de los primeros metabuscadores disponibles para los
usuarios. La empresa denominada Go2Net duea de su franquicia fue
comprada por InfoSpace o Blucora y desde marzo redirecciona a
http://www.zoo.com/(nuevo nombre e imagen del metabuscador). Pero si se
siente nostalgia todava es posible acceder al original en el Reino Unido:
http://www.metacrawler.co.uk/
iBoogie (http://www.iboogie.com/) Realiza bsquedas organizadas en
cluster (conjuntos o conglomerados de ordenadores unidos entre s
normalmente por una red de alta velocidad y que se comportan como si
fuesen una nica computadora) y tiene un motor muy potente. Adems,
permite aadir pestaas solicitando buscar en bases de datos concretas que
tienen a disposicin del usuario y posee una bsqueda avanzada
(http://iboogie.com/advanced_web.asp)
Ixquick (http://www.ixquick.com/esp/) El primer metabuscador que se
ocup de proteger la privacidad de los usuarios sin

registrar su proceso de bsqueda y su direccin de IP.


Dogpile (http://www.dogpile.com/) Es un metabuscador que retorna las
bsquedas desde los motores About, Ask.com, FinWhat, Google, LookSmart,
MSN Search, Teoma, Yahoo!, Bing y otros buscadores populares, incluyendo
de audio y video.
Actividad sugerida: Realiza la misma bsqueda en los distintos
metabuscadores sugeridos y compara los resultados obtenidos.

Directorios
Los directorios, tambin denominados buscadores temticos, organizan la
informacin por medio de categoras y sub-categoras que registran las
direcciones (URL) y una pequea descripcin de los diferentes sitios que han
sido indexados.
Son organizados en forma manual a partir del registro de sitios por parte de
sus autores, y de un proceso posterior de seleccin y categorizacin
jerarquizada por parte de los editores.
Entre los directorios ms importantes se encuentran:
Yahoo (http://ar.search.yahoo.com/) El equipo de Yahoo! se encargan de visitar,
analizar y evaluar los sitios web y organizarlos segn su contenido en categoras y/o
subcategoras, como por ejemplo Educacin y Formacin, Salud, Gastronoma,
Viajes, etc... como si de una gran biblioteca virtual se tratase. Las categoras del
Directorio van de lo general a lo ms especfico.
DMOZ (http://www.dmoz.org/World/Espaol/) El Open Directory Project (ODP),
tambin conocido como DMoz (por directory.mozilla.org su nombre de dominio
original) es un proyecto colaborativo multilinge, en el que editores voluntarios
listan y categorizan enlaces a pginas web.
Cualquier persona puede sugerir un enlace en una categora determinada, que
luego ha de ser aprobada por un editor
El proyecto est dividido en varias ramas segn el idioma, y las categoras de
pginas se organizan jerrquicamente dentro de cada una de las ramas.
Portal SEO (http://www.portal-seo.com/directorio- web.php) Dedicado al SEO

(Search Engine Optimization) es decir al posicionamiento en buscadores


u optimizacin en motores de bsqueda, un proceso que busca
mejorar la visibilidad de un sitio web en los resultados orgnicos de los
diferentes buscadores.

Excite (http://www.excite.com/) Es una coleccin de sitios y servicios web,


lanzado en diciembre de 1995. Ofrece una gran variedad de contenido, incluyendo
un portal de Internet que muestra noticias y el tiempo, etc., incluye adems un
motor de bsqueda, un servicio de correo electrnico basado en la web, mensajera
instantnea, cotizaciones de bolsa, y una pgina de inicio personalizable por el
usuario.

Muchos buscadores incluyen adems un sistema de navegacin en forma de


directorio y por otra parte, algunos directorios complementan sus resultados
con los de una bsqueda en un buscador. Pero es importante realizar una
distincin entre estos dos tipos de herramientas de bsqueda de
informacin, ya que, se organizan y funcionan de diferente manera.
Actividad sugerida: Realiza bsquedas temticas empleando
diferentes directorios.

Guas
Las guas temticas estn conformadas por pginas de recursos web
organizadas por reas del dominio de diversos especialistas y entidades
acadmicas que asumen la tarea de elaborarlas.
Por lo general incluyen algn mecanismo de bsqueda en sus pginas o en
el sitio en general. Estos directorios anotados suelen ser de gran calidad ya
que la seleccin de recursos, es muy cuidadosa y su actualizacin,
frecuente.
Visualiza la siguiente presentacin para ampliar la informacin:
Guas temticas
http://goo.gl/8tDn1i
Algunas guas son desarrolladas por Universidades y Bibliotecas, como por
ejemplo:
Universidad de Almera. Biblioteca Nicols Salmern: Guas Temticas
http://goo.gl/F4AlNa
"Las guas temticas recogen los recursos de informacin disponibles en la
Biblioteca agrupados en diferentes categoras: bases de datos, revistas
electrnicas, revistas en papel, libros impresos, e-books, tesis y proyectos."
Universidad Carlos III de Madrid. Biblioteca: Guas de recursos
http://goo.gl/vht1rP
"En estas guas encontrars fuentes y recursos de informacin, tanto de la
Biblioteca como una seleccin de recursos externos de inters."

Universidad de Sevilla. Biblioteca. Guas: Herramientas y guas para


encontrar y gestionar la informacin: Guas de la BUS http://goo.gl/nSt3JJ
"...podrs encontrar consejos para elaborar trabajos acadmicos,
estrategias y formas de localizar libros, patentes, pelculas..., recursos de
informacin clasificados por temas, instrucciones para el manejo de
gestores bibliogrficos, y mucho ms."
Universidad de Alicante. Biblioteca: Guas temticas http://goo.gl/OyScXJ
En ciertas ocasiones, varias instituciones se asocian para la elaboracin
cooperativa de estas guas.
Un ejemplo es la Biblioteca Virtual WWW (The WWW Virtual Library)
http://vlib.org/
Actividad sugerida: Realiza bsquedas en algunas de las guas
sugeridas.
Software especializado
Para mejorar las bsquedas en la Web puede utilizarse software
especializado. Estos agentes auxiliares se instalan en nuestra PC y operan
junto a los navegadores aadindoles ciertas funcionalidades, como el
manejo de conceptos para la recuperacin de la informacin. Un agente de
bsqueda es un programa que, imitando el comportamiento de una persona
y actuando de forma autnoma, recorre automticamente internet
aprovechando la estructura de enlaces de la web. Un agente de bsqueda
puede recuperar un documento en particular, o utilizar algn algoritmo de
bsqueda que permita recuperar distintos documentos de la web a los que
se hace referencia en un documento fuente u origen, o conforme a unos
criterios predefinidos anteriormente por sus usuarios.
Un agente de bsqueda puede realizar diversas funciones como:
- Realizar consultas con una velocidad y en un conjunto de fuentes mucho
mayor que el posible para un usuario humano.
- Informar de las actualizaciones que se producen en los sitios web que son
de inters.
- Agilizar las descargas que se realizan de internet.
- Eliminacin de correo basura o spam
- Bsqueda de noticias conforme a las preferencias.
Un ejemplo es Copernic Agent, una herramienta realmente til que permite la bsqueda
selectiva en mltiples fuentes y la clasificacin mediante potentes herramientas de anlisis. Que
si bien an est disponible para su descarga, ya no brinda soporte a los usuarios desde su sitio.

También podría gustarte