Un motor de bsqueda, tambin conocido como buscador, es un sistema
informtico que busca archivos almacenados en servidores web gracias a su spider (tambin llamado araa web). Un ejemplo son los buscadores de Internet (algunos buscan nicamente en la web, pero otros lo hacen adems en noticias, servicios como Gopher, FTP, etc.) cuando se pide informacin sobre algn tema. Las bsquedas se hacen con palabras clave o con rboles jerrquicos por temas; el resultado de la bsqueda Pgina de resultados del buscador es un listado de direcciones web en los que se mencionan temas relacionados con las palabras clave buscadas. Como operan de forma automtica, los motores de bsqueda contienen generalmente ms informacin que los directorios. Sin embargo, estos ltimos tambin han de construirse a partir de bsquedas (no automatizadas) o bien a partir de avisos dados por los creadores de pginas (lo cual puede ser muy limitante). Los buenos directorios combinan ambos sistemas. Hoy en da Internet se ha convertido en una herramienta rpida y eficiente para la bsqueda de informacin, para ello han surgido los buscadores que son un motor de bsqueda que nos facilita encontrar informacin rpida de cualquier tema de inters, en cualquier rea de las ciencias, y de cualquier parte del mundo. Qu es un buscador o motor de bsqueda La herramienta que todos deben utilizar Uno de los aspectos claves para entender el posicionamiento natural es aprender la lgica con la que funciona un buscador, o tambin llamado motor de bsqueda. Es un software o sistema informtico en Internet que se encarga de localizar sitios web que estn relacionados con un trmino de bsqueda. Estos trminos de bsqueda, denominados como palabras clave o keywords, son rastreados por las araas que el sistema emplea para as clasificar la informacin en listados de pginas web en las que se encuentren dichas palabras.
Estas araas o web crawler, buscan la informacin solicitada en forma
automtica y sistematizada; muchas veces en la web, otras en noticias y servicios Gopher o FTP. A menudo, son relacionados con los directorios web, pero dada la propiedad de automatizacin en la bsqueda de informacin que poseen los buscadores, estos son ms giles y contienen mayor volumen de datos. Contrario a lo que sucede con los directorios, los cuales son realizados de manera no automatizada y por avisos ofrecidos por los propios anunciantes de las pginas web. Dada la basta red de informacin que alberga hoy en da Internet, la utilizacin de buscadores o motores de bsqueda, se ha hecho muy importante. Desde Wandex, el primer buscador desarrollado por Mattew Gray, Lycos, Excite, Altavista, Naver, entre otros; hasta los ms populares actualmente: Google y Yahoo, los buscadores siempre han contribuido a la bsqueda de datos. Por eso, la importancia de aparecer en uno de ellos. Google posee en general 7.200 millones de visitas diarias, convirtindose actualmente en el ms popular a nivel mundial; sin embargo, en algunos pases asiticos como Corea del Sur y China, el buscador Naver posee el primer lugar. En Espaa, Bing, de Microsoft, ayuda a buscar de manera sencilla y fcil cualquier tipo de informacin en la red. RTBot es un buscador que clasifica los resultados en categoras; estas categoras son Wikipedia, videos, Twiiter, documentos, blobgs y noticias; DuckDuckGo es un motor de bsqueda cuya finalidad es la de respetar la privacidad del usuario puesto que no recoge informacin de este que lo pueda delatar; Yacy, cuya funcionalidad es la de tambin poder funcionar para Intranet. Yahoo, entre los ms populares, cuya consigna es que te ayuda encontrar exactamente lo que buscas; Foofind, que adems de encontrar enlaces, escanea servidores de descargas directas; CCSearch, cuya finalidad es conseguir contenido con licencia Creative Commons; Baidu, es en idioma chino y tiene la particularidad de adems de encontrar enlaces como los otros buscadores, consigue archivos en MP3, WMA y SWF. Blekko, que se caracteriza por usar etiquetas en sus bsquedas para as restringir an ms los resultados; Altavista,
que incluye traductor, buscador de personas y comparador de precios en
diferentes productos y WotBox, para bsqueda geogrfica. En general, los buscadores o motores de bsqueda se han convertido hoy da en una herramienta primordial y eficaz al momento de conseguir informacin en Internet. Casi el 100 por ciento de la informacin se consigue a travs de estas herramientas. Algunos lo hacen de manera simple y otras ms complejas, todo depender de la necesidad de cada usuario. Motor de bsqueda Un motor de bsqueda (tambin llamado Searchbot) es una herramienta hardware y software que indexa pginas Web para que se puedan buscar a travs de palabras claves en un formulario de bsqueda. Cmo funciona un motor de bsqueda? Los robots o spiders (un tipo de software) recorren la Web indexando su contenido dentro enormes de bases de datos que se pueden consultar. Como ningn motor de bsqueda puede abarcar todas las pginas en un slo da (generalmente todo el proceso tarda varias semanas), cada motor adopta su propia estrategia para calcular la frecuencia de actualizacin de los sitios. Cmo usar un motor de bsqueda Cuando el usuario de un motor de bsqueda llena el formulario, elige las palabras a buscar (y a veces aquellas que no se van a buscar) con la ayuda de un operador booleano como puede ser "y", "o", y "no" (simbolizados por +, - y otros). La solicitud se enva al motor de bsqueda. El motor busca en sus bases de datos cada una de estas palabras y luego delimita la bsqueda quitando las pginas que no coinciden con el criterio. A continuacin, reenva una lista de vnculos de las pginas incluyendo el comienzo del texto de la pgina, texto especificado por el creador de la pgina con unas etiquetas especiales llamadas metatags, e incluso un extracto de la pgina que contiene las palabras que se estaban buscando.
Estas respuestas se clasifican por relevancia segn el criterio del motor de
bsqueda, por ejemplo, el porcentaje de palabras que coinciden con la bsqueda, la densidad de las palabras claves (la cantidad de veces que stas aparecen en la pgina), etc. Motor de metabsqueda Un "motor de metabsqueda" es una herramienta de bsqueda que utiliza los resultados de muchos otros motores de bsqueda. Clasificacin Se pueden clasificar en dos tipos: ndices temticos: Son sistemas de bsqueda por temas o categoras jerarquizados (aunque tambin suelen incluir sistemas de bsqueda por palabras clave). Se trata de bases de datos de direcciones Web elaboradas "manualmente", es decir, hay personas que se encargan de asignar cada pgina web a una categora o tema determinado. Motores de bsqueda: Son sistemas de bsqueda por palabras clave. Son bases de datos que incorporan automticamente pginas web mediante "robots" de bsqueda en la red. Los elementos de un motor de bsqueda Hemos estado recopilando informacin sobre los motores de bsqueda, sobre todo en lo que se refiere a los diferentes trminos que suelen recibir los robots de bsqueda. Seguro que os resulta interesante saber algo mas sobre estas herramientas que utilizamos da a da. Son tres los elementos que componen un motor de bsqueda: 1. Interfaz Es la pgina Web a la que accede el usuario. En ella se establece el tipo de bsqueda. Hay dos tipos : Formularios: Se presenta una pgina con formularios en los que se introducen las palabras claves de bsqueda relacionadas con el tema que nos interesa, junto con la lgica a emplear. Con Directorios: Adems de contar con formularios, estructuran la informacin jerrquicamente por materias. Para
encontrar la informacin hay que ir descendiendo por el rbol
desde los temas ms generales hasta los ms especficos. 2. Base de datos textual ndice de palabras, frases y datos asociados con la direccin de pginas Web (URL) , programas, ficheros, etc. La informacin se da de alta y de baja, pero siempre dejando una referencia para que despus, quien busque un tema relacionado, pueda encontrar la direccin y un pequeo resumen de lo que contiene. 3. Robot Programa de ordenador que est diseado para recorrer de forma automtica, la estructura hipertexto de la Web con el fin de llevar a cabo una o varias de las siguientes funciones: Anlisis estadstico: Miden el crecimiento de la Web, nmero de servidores conectados, etc. Mantenimiento de la estructura hipertextual de la World Wide Web: Verificando la correccin de los enlaces entre documentos y eliminando o guardando informacin de los denominados "enlaces muertos" (dead links), es decir, pginas Web que ya han desaparecido. Duplicacin de directorios Ftp (Mirrors): Incrementando su utilidad a un nmero mayor de usuarios. Creacin automtica de bases de datos textuales a partir de los documentos html distribuidos por los distintos servidores. Debido a que cada robot est programado para buscar en la Red de diferente forma, la informacin almacenada en cada base de datos puede ser diferente. Los trminos robots, spiders, Wanderers, knowbots, webcrawlers y web scanners suelen considerarse sinnimos, aunque es posible encontrar matizaciones, como la recogida por Michael Berns quien distingue entre Spiders, Knowbots y Wanderers.
Spiders (Araas): Crean bases de datos tomando como referencia los
distintos nexos que configuran la estructura hipertexto de la Red. Knowbots: Robots programados para localizar referencias hipertexto dirigidas hacia un documento, servidor, etc., en particular. Este tipo de
robots permite evaluar el impacto de las distintas aportaciones que
engrosan las distintas reas de conocimiento presentes en la Red. Wanderers (Vagabundos): Robots encargados de la medicin del crecimiento de la Web. Otra matizacin interesante es la aportada por Martijn Koster , quien entiende como sinnimos los trminos robots, spiders y webcrawlers, a los que aade el trmino Worms (Gusanos): Robots encargados de tareas de duplicacin (creacin de Mirrors). Por ltimo, hay otro trmino que es importante no olvidar, los WebAnts (Hormigas): Conjunto de robots fsicamente alejados que cooperan para la consecucin de distintos objetivos. Por ejemplo, compartiendo los resultados obtenidos para asegurarse de no duplicar esfuerzos.