Está en la página 1de 8

2/11/2022

Motores de Búsqueda
Dr. Oscar Romel Alcántara Moreno

Vídeo

1
2/11/2022

Motores de búsqueda
• Sistemas que organizan y distribuyen la información producida en la
red a los usuarios que expresan sus dudas a partir de palabras clave
(keywords).

• Sistema que recopila la información disponible en los servidores web


y la distribuye a los usuarios por medio del proceso de crawling.

• Palabras clave: término responsable de promover el intercambio de


información entre las páginas web y los usuarios.

Recuperación de la Información (Information


Retrieval -IR)
• Proceso de representación, almacenamiento, organización y acceso a
elementos de información.

• La recuperación de datos clásica busca obtener todos los objetos que


satisfacen condiciones claramente de definidas (como las de las
expresiones regulares).

• La IR trata con texto en lenguaje natural que no está siempre bien


estructurado y es naturalmente ambiguo.

• En un sistema de IR los objetos recuperados pueden ser imprecisos y los


pequeños errores normalmente no tienen importancia.

2
2/11/2022

Generaciones en la Recuperación de
Información (IR)
• La primera generación: Consistía en una automatización de las tecnologías
previas (sistemas de tarjetas y similares). Permitía las búsquedas por autor
y por título.

• En la segunda generación se amplían las funcionalidades de búsqueda con


añadidos como poder buscar por asuntos, palabras clave y en general
permitiendo consultas más complejas.

• La tercera generación (la actual) se centra en mejorar las interfaces


gráficas, capacidades de hipertexto, arquitecturas de sistema abiertos.

Revolución de los buscadores:


INTERNET: amo de la información

• El acceso a las fuentes de información se ha abaratado.

• Los avances en tecnología han conseguido que se dispare el acceso a


las redes de información: Cualquier fuente de información está
disponible sin importar la distancia geográfica y de forma rápida.

• La facilidad que tiene el usuario para colgar en la red cualquier


información que considere interesante: expansión de la Web.

3
2/11/2022

Estructura básica de un buscador web


• Sistema para obtener información: Crawlers.

• Modulo para generar índices:


Analiza los documentos extrayendo determinada información clave que se usará para poder buscar
de forma rápida sobre todo el volumen de datos almacenados. Lista invertida.

• Sistema de consultas: El usuario puede lanzar consultas para recuperar información del
sistema.

• Módulo de puntuación (Ranking): puntúa los documentos recuperados de acuerdo a


criterios de relevancia.

• Sistema de feedback: los usuarios refinan la consulta.

Vídeo

https://www.youtube.com/watch?v=0q5ygrtFtrA

4
2/11/2022

Estructura básica de un buscador web

Proceso de IR Distribuida

El broker
El broker
Llega una selecciona los Se evalúa la
envía la query Se combinan
consulta al nodos que van query en
a los nodos resultados
sistema a encargarse paralelo
seleccionados
de la query.

Broker: Conjunto de máquinas, se encarga de reenviar las consultas a los ranker.


Query: Consulta

5
2/11/2022

¿Cuántos Motores de búsqueda conoces?


• Google • Boing
• Yahoo! • Dumbfine
• Bing • GoYams
• Ask • MetaGlossary
• AOL • PlanetSearch
• Live • SearchTheWeb2
• Snap • Terra
• AURA! • Web 2.0
• Duck duck go • Etc.
• MSN Search
• Yippi • Altavista

Buscadores más usados

6
2/11/2022

Mecanismo de indización y la función de


relevancia
Algoritmo Localización-Frecuencia: utilizado para la indización de los textos
rastreados y para el calculo de relevancia en respuesta a la búsqueda.

• El crawler:
• Encuentra la información
• Crea un índice con la información esencial de la página web.
• Se almacena en su base de datos.
• La información únicamente será mostrada cuando realicemos una búsqueda en el motor.

• En relación a la calidad dependerá:


• Del tipo de petición que se haga.
• Del motor de búsqueda.
• Del algoritmo. Entre mejor o peor sea el algoritmo dependerá también la calidad de los
resultados mostrados por el buscador.

Google My Business

https://www.youtube.com/watch?v=Df4INIKVKu4

7
2/11/2022

Reto:

• Configurar Google My Business para la empresa y presentarlo la


siguiente sesión.

También podría gustarte