Motores de Busqueda

MOTORES DE BUSQUEDA
Un motor de búsqueda o buscador es, en términos generales, un sistema

encargado de buscar archivos almacenados en los servidores web.
Para encontrar tales archivos, los buscadores recurren a la identificación de la

palabra clave empleada por la persona que realiza la búsqueda y, como
resultado, el usuario obtiene una lista de enlaces que direccionan a sitios web
en los que se mencionan los temas relacionados a la palabra clave.
TIPOS DE BUSCADORES
Los motores de búsqueda se clasifican principalmente en 3 tipos:
 Buscadores jerárquicos
 Directorios
 Metabuscadores
Buscadores jerárquicos
Este tipo de buscadores son interfaces de interrogación textual. Revisan las

bases de datos de las páginas web a través de sus arañas y estas recopilan la
información sobre los contenidos compatibles con la búsqueda del usuario. Una
vez realizan la consulta, clasifican los resultados por la relevancia respecto a la
búsqueda concreta y según el historial de navegación que tenga el usuario.
Directorios
Los buscadores del tipo directorio son enlaces de páginas que se agrupan por
categorías. Son muy sencillos, pero requieren de un soporte humano y de
continuo mantenimiento para funcionar.
Estos buscadores no recorren los sitios ni almacenan los contenidos, solo

agrupan enlaces por categorías y se organizan por fecha de publicación y no
por relevancia o concordancia con una búsqueda hecha por el usuario.
Un ejemplo de este buscador es Open Directory Project, también conocido
como Dmoz.
Metabuscadores
Estas interfaces funcionan haciendo reenvíos de las búsquedas a varios

motores al mismo tiempo. Es decir, remiten la consulta a otros sitios para
analizar los resultados que estos presentan, para así, ampliar la margen de los
mismos resultados, presentar sus propias conclusiones y ordenar los enlaces
de acuerdo con el orden definido por el sistema estructural del metabuscador.
Un ejemplo de metabuscador es Dogpile.
Cuántos motores existen
Existen cientos de buscadores a nivel mundial.
Entre ellos se encuentran:
 Google
 Yahoo!
 Bing
 Ask
 AOL
 Go
 Live
 Snap
 AURA!
 Duck duck go
 MSN Search
 Yippi
 Boing
 Dumbfine
 GoYams
 MetaGlossary
 PlanetSearch
 SearchTheWeb2
 Terra
 Web 2.0
HISTORIA DE LOS MOTORES DE BÚSQUEDA
Los motores de búsqueda surgieron a principios de los 90 debido a la

necesidad de organizar, clasificar y gestionar la información del internet ya que
cada vez más surgían nuevos sitios web llenos de contenido.
 El primer buscador fue Wandex, que surgió en 1993 como un proyecto

de la World Wide Web.
 El mismo año surgió Aliweb, que existe hasta hoy y que en 1994 fue
lanzado como un índice durante la Primera Conferencia Mundial de
World Wide Web.
 En 1994 nació WebCrawler, hoy conocido como metabuscador. Surgió
como un proyecto universitario que permitía una búsqueda por palabras
en cualquier sitio web. Fue vendido a AOL a mediados del 95.
 Este mismo año surgió el famoso Lycos que tuvo una gran popularidad
en los 90, llegando a ser la página más visitada en 1999. Fue la primera
a usar el CPM. Actualmente pertenece a la empresa española Terra.
 Este año también surgió Excite! con el objetivo de mejorar la forma de
búsqueda.
 En 1995 nació Altavista, uno de los buscadores más populares gracias a
su búsqueda multi lengua y por permitir búsquedas multimedia. En el
año 2003 fue vendida para Yahoo! que también surgió como directorio
web este mismo año.
 Actualmente Yahoo! ha pasado por varias alteraciones ya que ahora usa
su propio motor de búsqueda debido a su fusión con Altavista e Inktomi
que nació en 1996, que también fue comprada por Yahoo! en el 2003.
 Google nació en 1997 y a partir del 2000 se transformó en el principal
motor de Búsqueda de Yahoo!, contaba con un poderoso algoritmo
llamado PageRank, que analizaba la relación entre las páginas web.
 En el 2007 surgió Ask, el primer buscador comercial del tipo pregunta-
respuesta.
 En el 2009 surge Bing, trayendo como meta, organizar las búsquedas
con el fin de que navegar sea más fácil para el usuario.
PRINCIPALES BUSCADORES
Google
El mayor buscador, el más conocido de todos. Aunque con existencia previa,

adquirió su éxito a mediados del 2001 y su concepto se basa en el uso de
PageRank, el cual tiene como premisa, que las páginas que son más
deseadas, estén enlazadas, en mayor cantidad, a otras páginas.
Basa su proceso de búsqueda en encontrar la importancia y concordancia de

los contenidos hallados en la web, con respecto a las palabras que usa el
usuario. Para hacer el filtro, Google usa los diferentes algoritmos para
determinar el orden de aparición de los sitios.
Bing
Es el segundo motor de búsqueda a nivel mundial. Es el sistema de búsqueda
nativo por el cual los nuevos dispositivos de Microsoft utilizan, a partir de
Windows 8.
Yahoo!
Yahoo Search fue lanzado en el 2004, y más que un buscador, se puede

considerar como un portal web, gracias a que ofrece el servicio de búsquedas
web, de correo electrónico, de noticias, de tienda, agencia de viajes, juegos,
entretenimiento, entre otros.
Duck duck Go
Es muy similar a Google, no obstante, su forma de presentar los resultados no
se centra en la importancia de la página de acuerdo a la información del
contenido, sino que ofrece la mejor respuesta a la pregunta que se formule,
aunque provenga de un sitio que no esté bien posicionado.
MSM Search
Para hacer frente tanto a Google como a Yahoo! ha surgido MSN Search. Un
servicio en que las búsquedas se hacen de manera fácil y rápida, con la adición
de que cuenta con otros servicios como el correo de Hotmail y noticias.
LA INTELIGENCIA ARTIFICIAL Y LOS MOTORES DE BUSQUEDA
Cada vez son más comunes los motores de búsqueda de Internet en los que lo
que se quiere encontrar no son páginas web sino personas. Los portales de
empleo o de búsqueda de pareja son buenos ejemplos. El empleo de la
inteligencia artificial en estos motores puede favorecer patrones
discriminatorios, aprendidos por algoritmos que no están programados para
compensar o corregir prejuicios humanos.
El investigador Carlos Castillo, director de la Unidad de Data Science del centro

tecnológico catalán Eurecat, pone como ejemplo el caso de un portal de
empleo y explica que “si hay 100 perfiles de hombres y mujeres igualmente
cualificados y en los primeros resultados del buscador solo aparecen hombres,
tenemos un problema”.
Combatir la discriminación por sexo, raza, edad o cualquier otro motivo en las
búsquedas en Internet es uno de los grandes retos de los científicos. Hay
diversas maneras de afrontarlo, aunque este ámbito de investigación todavía
está en sus inicios.
Los métodos para corregir la discriminación pueden hacerse en bloque, es

decir, corrigiéndola para grupos enteros de personas, o bien individuo a
individuo. Y se pueden aplicar antes de procesar los datos, introduciendo
información no sesgada en el algoritmo; a posteriori, corrigiendo la lista
obtenida; y lo más difícil, creando un algoritmo que sea no discriminatorio, o
que lo sea lo mínimo posible (porque siempre va a tener cierta parcialidad, al
ser humanos quienes lo diseñan). Presentamos a continuación algunos de los
métodos más usados.
Reordenar los resultados en pequeños subgrupos
En este caso el reordenamiento se hace ítem a ítem. En concreto, divide la lista

de resultados en pequeños subgrupos, y compara la proporción del grupo
“protegido” (mujeres, personas mayores, etcétera) con la proporción de ese
mismo grupo dentro del ránking general. Si, por ejemplo, en el top 5 de la lista
hay solo una mujer, mientras que en los 40 resultados de la búsqueda hay un
40% de mujeres, el algoritmo coge un perfil de mujer posterior al puesto quinto
y lo recoloca para que el porcentaje femenino en el top 5 sea más parecido al
porcentaje de la lista completa, y así sucesivamente.
Es el sistema que utiliza el proyecto FA*IR, creado por un equipo de la Unidad

de Data Science de Eurecat, la Universidad Pompeu Fabra de Barcelona y la
Universidad Técnica de Berlín. El algoritmo corrige a posteriori la discriminación
en la búsqueda de personas online por razones de género, procedencia o
apariencia física.
Los científicos han utilizado datos de ofertas de empleo, de reincidencia de

presos y de rankings de admisión a universidades para detectar patrones de
discriminación. Con ellos, han creado un algoritmo de búsqueda que incorpora
“un mecanismo de acción positiva” para “reorganizar los resultados y evitar la
discriminación sin afectar la validez del ranking”, explica Castillo, uno de los
artífices del proyecto. Eso sí, matiza, “no hace cambios radicales, y la
reordenación se hace entre perfiles similares. En cierto modo deshace
empates”.
El proyecto FA*IR ha sido uno de los ganadores de las becas de 50.000 euros
que otorga anualmente la comunidad internacional Data Transparency Lab –
promovida por Telefónica, Mozilla y el MIT, entre otros-, que fomenta la
transparencia y la protección de los datos en Internet.
El objetivo de los investigadores ahora es desarrollar una “herramienta de

búsqueda justa” (que directamente da una lista no discriminatoria), basada en
el algoritmo ya diseñado (que corrige los sesgos a posteriori). Ninguna
empresa u organización utiliza aún el algoritmo diseñado, y precisamente el
objetivo es desarrollar el nuevo como software libre dentro de un paquete de
software conocido para que cualquier entidad pueda usarlo.
Eliminar el “impacto dispar”
El “impacto dispar”, un concepto de la legislación laboral de EE UU, es el

diferente efecto que produce un mismo algoritmo sobre grupos distintos de
personas. Se diferencia del “trato dispar” en que este es intencionado y directo,
mientras que el impacto dispar es indirecto. Puede producirse aunque no haya
discriminación como tal; de hecho, ocurre cuando se trata a todo el mundo de
la misma forma. Por ejemplo, en el caso de las pruebas físicas para los
bomberos, que perjudican a las mujeres. Eso sí, para que se considere
“impacto dispar” no puede haber una relación directa entre la prueba y el
correcto desempeño laboral.
El método consiste en “reparar” a posteriori las puntuaciones del grupo

protegido (el que está discriminado) para que estén distribuidas de la misma
forma que las del grupo no protegido. Es la técnica diseñada por el equipo de
Suresh Venkatasubramanian, profesor de Informática de la Universidad de
Utah (EE UU). Su grupo, cuenta, ha hablado con algunas entidades
interesadas en aplicar el método, pero ninguna ha llegado a utilizarlo.
Introducir restricciones proequidad

Según la regla del 80%, establecida en la legislación laboral estadounidense,
se puede considerar que hay discriminación, de género en este caso, cuando la
ratio mujeres candidatas/mujeres seleccionadas es menos de un 80% de la
ratio hombres candidatos/hombres seleccionados. Es decir, si se seleccionan
muchas menos mujeres que hombres en proporción a los candidatos que había
de cada sexo.
Las restricciones proequidad pretenden garantizar que se cumple esa regla del
80% en categorías absolutas, como hombre/mujer. En otras que tienen valores
continuos, como el peso corporal o la edad, la idea es que no haya una
correlación entre los candidatos seleccionados y esa característica.
Un sistema creado por un grupo del Instituto Max Planck de Sistemas de

Software (Kaiserlautern, Alemania), en el que hay una española, Isabel Valera,
introduce las restricciones matemáticas en el periodo de entrenamiento o
aprendizaje del algoritmo (cuando se le introducen búsquedas ya realizadas
para que tome ejemplo), de modo que cuando este se aplica no analiza datos
sensibles como el género o la raza.

Motores de Busqueda

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Motores de Busqueda

Cargado por

Copyright:

Formatos disponibles

MOTORES DE BUSQUEDA

Un motor de búsqueda o buscador es, en términos generales, un sistema

Para encontrar tales archivos, los buscadores recurren a la identificación de la

Los motores de búsqueda se clasifican principalmente en 3 tipos:

Este tipo de buscadores son interfaces de interrogación textual. Revisan las

Estos buscadores no recorren los sitios ni almacenan los contenidos, solo

Estas interfaces funcionan haciendo reenvíos de las búsquedas a varios

Un ejemplo de metabuscador es Dogpile.

Cuántos motores existen

Existen cientos de buscadores a nivel mundial.

Entre ellos se encuentran:

HISTORIA DE LOS MOTORES DE BÚSQUEDA

Los motores de búsqueda surgieron a principios de los 90 debido a la

 El primer buscador fue Wandex, que surgió en 1993 como un proyecto

El mayor buscador, el más conocido de todos. Aunque con existencia previa,

Basa su proceso de búsqueda en encontrar la importancia y concordancia de

Yahoo Search fue lanzado en el 2004, y más que un buscador, se puede

LA INTELIGENCIA ARTIFICIAL Y LOS MOTORES DE BUSQUEDA

El investigador Carlos Castillo, director de la Unidad de Data Science del centro

Los métodos para corregir la discriminación pueden hacerse en bloque, es

Reordenar los resultados en pequeños subgrupos

En este caso el reordenamiento se hace ítem a ítem. En concreto, divide la lista

Es el sistema que utiliza el proyecto FA*IR, creado por un equipo de la Unidad

Los científicos han utilizado datos de ofertas de empleo, de reincidencia de

El objetivo de los investigadores ahora es desarrollar una “herramienta de

Eliminar el “impacto dispar”

El “impacto dispar”, un concepto de la legislación laboral de EE UU, es el

El método consiste en “reparar” a posteriori las puntuaciones del grupo

Introducir restricciones proequidad

Un sistema creado por un grupo del Instituto Max Planck de Sistemas de

También podría gustarte