Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Bus C Adores
Bus C Adores
Buscar, y encontrar,
información en la Web
41
Conociendo y clasificando los buscadores
Sin lugar a dudas, la Web es en la actualidad el mayor
conglomerado de información que existe en el mundo. Prácticamente
cualquier tema, desde los más usuales e importantes, hasta los más
exóticos e intrascendentes, tienen su lugar en la Web.
Según estimaciones de organismos que estudian la evolución de
Alejandría, Biblioteca de,
biblioteca de la antigüedad,
la Web, aproximadamente 3300 millones de páginas web,
que se consideraba tenía la conteniendo más de 1 billón y medio de palabras, conforman un
más grande colección de espacio sólo comparable a la famosa "biblioteca total" que alguna
libros del mundo antiguo. vez pensara Jorge Luis Borges en "El jardín de los senderos que se
Fundada por el rey egipcio bifurcan". Internet es, en los tiempos modernos, lo que la Biblioteca
Tolomeo I Sóter, en la de Alejandría fue en la Antigüedad.
ciudad de Alejandría, fue Si a esto le sumamos un crecimiento que se duplica
ampliada por su hijo aproximadamente cada tres meses, seguramente un usuario
Tolomeo II Filadelfo a desprevenido se sentirá abrumado ante tal magnitud de datos.
principios del siglo III a.C.
Bajo el reinado de Tolomeo
Con el objeto de ordenar, clasificar y así localizar los temas que
II, la biblioteca principal, en interesan a los usuarios, dentro de esa gigantesca maraña de
el Museo de Alejandría, al información, se han desarrollado ciertos mecanismos automatizados
parecer contenía cerca de de búsqueda (o "buscadores de información") que en cuestión de
500.000 volúmenes o rollos, segundos encuentran y presentan al usuario la información solicitada
mientras un anexo en el por el mismo.
templo de Serapis (el Para realizar tan compleja tarea, imposible para cualquier ser
Serapeion) contenía humano, los buscadores utilizan un tipo de software denominado
aproximadamente "spiders" ("arañas"). Éstas se deslizan a través de toda la Web
43.000 volúmenes.
Según la leyenda, la
(recordemos que su traducción es, justamente, "telaraña") visitando
Biblioteca fue destruida por millones de páginas y registrando sus direcciones en grandes bases
el fuego en tres ocasiones: de datos. A partir de allí, algunos buscadores envían "robots" a cada
en el 272 d.C. por orden del una de estas direcciones, los cuales se encargan de almacenar el
emperador romano texto de dichas páginas.
Aureliano; en el 391, cuando En rigor, tanto spiders (arañas), robots, y wanderers (viajeros,
el emperador Teodosio I la vagabundos) son palabras que se usan indistintamente, y sirven para
arrasó junto a otros edificios calificar a la clase de programas que recorren la Web recolectando
paganos, y en el 640 por los algún tipo de información sobre cada lugar visitado (por ej. título,
musulmanes bajo el mando
del califa Omar I
texto, imágenes, etc.). El "viaje" del robot continúa con la visita a las
páginas que han sido referenciadas por ésta, y así sucesivamente.
(c. 581-644).
En la actualidad existen aproximadamente unos 3700 buscadores
Enciclopedia Microsoft
de información, de los cuales el 10 % pertenece al ámbito de
Encarta 98 © Latinoamérica.
Obviamente, no todos los buscadores de información son iguales,
ni tienen las mismas potencialidades.
43
a) los Directorios Temáticos, que organizan y clasifican la
información que disponen sus bases de datos en forma jerárquica y
estructurada en temas y subtemas, de modo tal que el usuario puede
"sumergirse" desde un tema general hasta llegar al cual le interese, y
desde allí acceder a las páginas que contienen información relativa al
tema en cuestión; y
b) las búsquedas por Palabras Clave, que se encargan de
rastrear toda la información disponible sobre el tópico solicitado en la
base de datos disponible. En algunos buscadores, este sistema
también es complementado por índices temáticos como los del punto
a).
1) Google
Buscador por palabras y de imágenes, y Directorio temático.
http://www.google.com Versión original en inglés
Versión en español dentro de
Preferencias.
44
La innovadora tecnología de búsqueda de Google lo diferencian
de las máquinas de búsqueda de primera generación. En vez de usar
sólo un término o una tecnología de metabúsqueda, Google se basa
en la tecnología PageRank, un sistema de clasificación de páginas
web desarrollado por sus fundadores, Larry Page y Sergey Brin, en la
Universidad de Stanford en 1998, lo que asegura que los resultados
más importantes se muestran primero.
Búsqueda básica
Para ingresar una consulta en Google, simplemente se deben
tipear algunas palabras descriptivas y presionar la tecla Enter para
ver la lista de resultados relevantes.
Google también prefiere las páginas en las que los términos
buscados están cerca unos de otros.
Las búsquedas Google no distinguen entre mayúsculas y
minúsculas. Todas las letras, independientemente de como estén
escritas, se consideran minúsculas. Por ejemplo, buscar: "América",
"AMERICA" o "aMEricA" generará los mismos resultados.
Las búsquedas Google en español en forma predeterminada no
distinguen los acentos diacríticos, diéresis ni la letra eñe. Es decir,
[América] y [America] encontrarán las mismas páginas.
Acotar la búsqueda
• Consejos generales: Puesto que Google sólo encuentra las
páginas web que contienen todas las palabras de la consulta,
para acotar la búsqueda basta con agregar más palabras a los
términos de búsqueda que ya se han ingresado. Al agregar más
palabras, los resultados contendrán un subconjunto específico de
las páginas devueltas por la consulta inicial que era "demasiado
amplia".
• Exclusión de palabras: Se puede excluir una palabra de la
búsqueda colocando un signo menos ("-") inmediatamente antes
del término que se quiere excluir.
• Búsqueda de frases: Google permite buscar frases agregando
comillas. Las palabras entre comillas dobles ("Organización de los
Estados Americanos") aparecerán juntas en todos los documen-
tos encontrados.
45
Cómo interpretar los resultados
1. Búsqueda Avanzada
Muestra una página que permite acotar la búsqueda si es
necesario.
2. Preferencias
Muestra una página que permite configurar las preferencias
de búsqueda, incluyendo el número predeterminado de
resultados por página, el idioma de la interfaz.
3. Consejos útiles para las búsquedas
Muestra información que ayudará a acotar la búsqueda.
4. Ventana de búsqueda
Lugar para escribir algunas palabras descriptivas de la
búsqueda. Se debe presionar Enter o haga clic en el botón de
Búsqueda en Google para ver la lista de resultados
relevantes.
5. Barra de estadísticas
Proporciona una descripción de la búsqueda e indica el
número de resultados encontrados, así como el tiempo que
llevó completar su búsqueda.
6. Título de la página
La primera línea del resultado es el título de la página web
encontrada. A veces, en vez del título aparecerá una URL, lo
que significa que la página no tiene título, o que Google no ha
indexado el contenido completo de esa página.
7. Texto debajo del título
Este texto es un resumen de la página devuelta con los
términos de búsqueda resaltados. Estos fragmentos permiten
ver el contexto en que los términos aparecen en la página,
antes de hacer clic en el resultado.
8. URL del resultado
Es la dirección en la Web del resultado encontrado.
9. Páginas similares
Cuando se selecciona el vínculo “Páginas similares” para un
resultado en particular, Google busca automáticamente
páginas en la Web que estén relacionadas con este
resultado.
10. Resultado jerarquizado
Cuando Google encuentra más de un resultado en el mismo
sitio web, muestra primero el más relevante y las otras
páginas relevantes del mismo sitio web aparecen
escalonadas debajo de él.
46
Capacidades espaciales
Google también dispone de dos posibilidades muy interesantes
asociadas a sus búsquedas:
Búsqueda de imágenes
La búsqueda de imágenes Google es la más extensa de la Web,
con aproximadamente 400 millones de imágenes indexadas y
disponibles para ser vistas. Se puede acceder a la búsqueda de
imágenes, desde http://images.google.com (o desde la solapa
“Imágenes”) y luego ingresar una búsqueda en la ventana
correspondiente. En la página de resultados, simplemente se debe
pulsar sobre la imagen pequeña para ver una versión más grande de
la imagen, así como la página web donde está ubicada.
47
Búsqueda por Directorio
El Directorio Google se conforma con una colección de sitios
seleccionados por más de veinte mil redactores voluntarios. A esta
colección de sitios, Google aplica su tecnología "PageRank" para
clasificar los sitios por orden de importancia. Barras horizontales, que
aparecen al lado de cada página Web, indican la importancia de la
página calculada por el “PageRank”. Esta manera distintiva de
clasificar los sitios web permite presentar primero las páginas con
más alta calidad en cualquier categoría del Directorio Google.
Mientras que las búsquedas corrientes por palabras son quizás la
manera más rápida de encontrar información sobre un tema
específico, el Directorio Google es particularmente útil cuando no se
está seguro de cómo refinar una búsqueda desde una categoría más
amplia. El Directorio permite entender las relaciones entre diferentes
temas de un área específica y al mismo tiempo puede sugerir
términos útiles para realizar una búsqueda. Además, el Directorio
puede dar una idea de cuan extensa es cierta categoría, como por
ejemplo, el número de universidades que hay en Brasil.
Cuando se efectúa una búsqueda en el Directorio Google, sólo la
categoría en la que se encuentra en ese momento será buscada.
Esto es particularmente útil cuando se trata de restringir una
búsqueda a un tema o campo específico.
Google
es un juego de palabras con el
término "googol", acuñado por
Milton Sirotta, sobrino del
matemático norteamericano
Edward Kasner, para referirse
al número representado por un
1 seguido de 100 ceros. El uso
del término por parte de
Google refleja la misión de la
compañía de organizar la
inmensa cantidad de
información disponible en la
web y en el mundo.
2) Yahoo!
Directorio temático con buscador.
http://www.yahoo.com Versión original en inglés
http://espanol.yahoo.com Versión en español.
48
Yahoo! es quizá el buscador temático más conocido en Internet.
Desarrollado en abril de 1994 por dos estudiantes de la Universidad
de Stanford, David Filo y Jerry Yung, Yahoo! es mantenida
actualmente en forma artesanal por una legión de personas que se
encargan de catalogar los cientos de miles de páginas que reciben
diariamente.
La forma de recorrer "el árbol jerárquico" de las categorías de
Yahoo! consiste en ir marcando, en forma sucesiva, la palabra en la
que se supone a priori, se encuentra el tema a buscar.
49
La otra forma de buscar en Yahoo! es, simplemente, tipeando
palabras clave, tras lo cual Yahoo! buscará en las tres secciones de
su base de datos para encontrar los documentos que se
correspondan con estas palabras.
Las tres secciones son:
3) Altavista
Buscador por palabras con directorio temático.
http://www.altavista.com Versión original en inglés
http://es-es.altavista.com/ Versión en español
50
páginas, y es solicitada para consultas en el orden de los setenta
millones de accesos diarios.
El sistema de indexación de Altavista recopila los textos completos
de todos los sitios visitados, con lo cual es muy efectivo a la hora de
encontrar palabras no tan comunes, o que generalmente no se
encuentran en los títulos de los documentos. Es muy usual, al
emplear este buscador, que ciertas búsquedas arrojen resultados
como: "20.780 documentos encontrados", lo cual como puede
apreciarse a priori indica una enorme cantidad de información no
relevante al tema y/o desproporcionada para el manejo por parte de
una persona.
A tal efecto, Altavista dispone de técnicas que el usuario puede
emplear en consultas "simples" o "avanzadas" que posibilitan un
acotamiento en la búsqueda.
En las búsquedas "simples" Altavista permite acompañar la intro-
ducción de la palabra o palabras clave con signos que mejoran los
resultados de la consulta.
Por ejemplo:
51
una mayor cantidad de referencias si se introduce también "dolphins".
En la “Búsqueda avanzada", Altavista permite el empleo de
operadores binarios como and (y), or (o), near (cercano) y el
operador not (no) para combinar palabras y frases y acotar la
búsqueda.
Ejemplos:
4) Wisenut
Buscador por palabras. En inglés.
http://www.wisenut.com
52
En la siguiente búsqueda (“e-Learning”), Wisenut encontró 187241
documentos. Sin embargo, también armó una lista con 14 tópicos
que, efectivamente, están relacionados con e-Learning, lo cual
permite encontrar más fácilmente los resultados.
5) Terra Lycos
Buscador con directorio temático.
http://www.terra.com Versión en español para USA
http://www.terra.es Versión en español para España
Hay versiones para cada país de Latinoamérica
6) WebCrawler
Metabuscador con directorio temático. En inglés.
http://www.webcrawler.com
53
7) Teoma
Buscador por palabras. En inglés.
http://www.teoma.com
Otro buscador por palabras nuevo, con una forma muy particular
de entregar los resultados, que se basa en un ranking denominado
Subject-Specific Popularity, que evalúa el número de páginas que
referencian a un sitio, y no solamente la cantidad de visitantes que
tiene. De esta manera, Teoma presenta los sitios hallados divididos
en tres categorías: 1) Results, de acuerdo a la popularidad de los
sitios y los links de otras páginas hacia los mismos; 2) Refine, con
palabras que llevan a acotar la búsqueda; y 3) Resources, que son
fuentes de información recomendadas por expertos.
8) Hot Bot
Buscador por palabras. En inglés.
http://www.hotbot.com
54
desplegables, Hot Bot permite al usuario la introducción de
operadores que hacen la búsqueda más acotada.
Las opciones que permite elegir son:
55
9) MetaCrawler
Metabuscador. En inglés.
http://www.metacrawler.com
56
• Señas (http://www.combios.net/senyas)
ñ Directorio temático.
• Mundivia (http://www.vindio.com)
Directorio temático, buscador.
é • Trovator (http://trovator.combios.es)
Buscador.
í
• Latin World (http://www.latinworld.com)
Buscador.
ó • MIBI (http://www3.uniovi.es/cgi-bin/wwwwais-mibi)
Metaíndice.
ú • CiberCentro (http://www.cibercentro.com)
Directorio por países.
¿
• Lanic (http://lanic.utexas.edu/la/region/indexesp.html)
Información por país.
• BuscaPique (http://www.buscapique.com)
¡
Buscador y directorio por países
57
ARGENTINA
Grippo (http://www.grippo.com)
Ubbi (http://www.ubbi.com)
Brújula (http://www.brujula.com.ar)
DNA (http://dna.com.ar)
Todoar (http:77www.todoar.com.ar)
Radar (http:www.radar.com.ar)
BOLIVIA
Bolivian (http://www.bolivian.com )
Enlaces Bolivia (http://www.enlacesbolivia.net/default.asp)
Bolivianet.com (http://www.bolivianet.com)
COLOMBIA
Conexiones Colombianas (http://www.conexcol.com)
La Lupa (http://www.lalupa.com)
Qué Hubo (http://www.quehubo.com)
Ubicar (http://www.ubicar.com)
COSTA RICA
Directorio Virtual - (http://www.2000.co.cr/)
TicoSEARCH (http://www.ticosearch.com)
CUBA
Cubaweb (http://www.cubaweb.cu)
Latin World- Cuba
(http://www.latinworld.com/caribe/cuba/esindex.html)
CHILE
Antena (http://www.antena.cl)
Huifa (http://www.huifa.cl/)
ChileBusca (http://www.chilebusca.cl/)
ECUADOR
Mande (http://www.mande.com.ec)
EL SALVADOR
Buscaniguas (http://www.buscaniguas.com.sv)
Cipotes (http://www.cipotes.com/)
Guanacos (http://www.nortropic.com/guanacos/guanabu.html)
ESPAÑA
Apali! (http://www.apali.com/)
Eureka (http://www.eureka.creativeweb.es/index_c.html)
El índice (http://www.eureka.creativeweb.es/index_c.html)
Hispavista (http://www.hispavista.com/)
Jopinet (http://www.jopinet.com/index.asp)
Ozú.com (http://ozu.ozu.es/index.html)
Sol (http://www.sol.es/)
EnlaWeb (http://www.enlaweb.com/)
Navegalia (http://www.navegalia.com/portal.html)
GUATEMALA
Terra Guatemala (http://www.terra.com.gt/)
HONDURAS
In Honduras (http://www.in-honduras.com/)
58
MÉXICO
Adnet (http://www.adnet.com.mx)
Iguana (http://www.iguana.com.mx)
MéxicoGlobal (http://www.mexicoglobal.com)
México Web Guide (http://www.yellow.com.mx)
Mexonline (http://www.mexonline.com/websites.htm)
Universidad Autónoma de México
(http://serpiente.dgsca.unam.mx/Temas/busca.html)
NICARAGUA
Terra Nicaragua (http://www.terra.com.ni/)
PANAMÁ
Terra Panamá (http://www.terra.com.pa/)
PARAGUAY
Yagua (http://www.yagua.com/)
PERÚ
Accesoperú (http://accesoperu.com/)
Yachay (http://www.yachay.com/)
NazcaNet (http://www.nazcanet.com/)
Perú-info (http://peru-info.com/)
Perú.com (http://www.peru.com/)
Oh Perú (http://www.ohperu.com/)
PUERTO RICO
Wepa (http://wepa.com)
REPÚBLICA DOMINICANA
Consigalo (http://www.consigalo.com/)
Aguaita (http://www.aguaita.com)
Uuepa (http://www.rubycom.com/uuepa)
URUGUAY
Uruguay Total (http://us.uruguaytotal.com)
Uruguay.Com (http://www.uruguay.com/index.html)
El Timon (http://www.eltimon.com)
VENEZUELA
Auyantepui (http://www.auyantepui.com/)
InfoGuía Web (http://www.infoguiaweb.com/)
Yuada (http://www.yuada.com.ve)
59
difundido en esta categoría, y cuya versión básica es totalmente
gratuita (y en español) y se puede bajar desde su sitio web en:
http://www.copernic.com
60