Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Google no garantiza que rastree, indexe o sirva tu página, aunque cumpla las Directrices
básicas de la Búsqueda de Google (/search/docs/essentials).
https://developers.google.com/search/docs/fundamentals/how-search-works 1/5
15/11/22, 8:42 Guía detallada sobre cómo funciona la Búsqueda de Google | Centro de la Búsqueda de Google | Documentación | Google D…
datos.
Rastreo
La primera fase trata de averiguar qué páginas hay en la Web. Como no hay ningún registro
central con todas las páginas web, Google tiene que buscar constantemente páginas
nuevas y actualizadas, y añadirlas a nuestra lista de páginas conocidas. Este proceso se
denomina "descubrimiento de URL". Algunas páginas las conocemos porque Google ya las
ha visitado. Otras, en cambio, las encontramos siguiendo enlaces de páginas conocidas
que nos llevan a ellas; por ejemplo, una página principal, como la página de una categoría o
un enlace a una nueva entrada de blog. También se descubren otras páginas cuando envías
una lista de páginas (un sitemap (/search/docs/crawling-indexing/sitemaps/overview)) para que
Google las rastree.
Una vez que Google descubre la URL de una página, puede visitarla (o "rastrearla") para
averiguar qué contiene. Utilizamos una enorme cantidad de ordenadores para rastrear
miles de millones de páginas de la Web. El programa encargado de obtener este contenido
es el robot de Google (/search/docs/crawling-indexing/googlebot), también denominado robot,
bot o araña. El robot de Google determina mediante algoritmos qué sitios deben rastrearse,
con qué frecuencia tiene que hacerse y cuántas páginas hay que obtener de cada uno de
ellos.
Los rastreadores de Google (/search/docs/crawling-indexing/overview-google-crawlers)
también están programados para no rastrear sitios demasiado rápido y así evitar
sobrecargarlos.
Este mecanismo se basa en las respuestas del sitio (por ejemplo, los
errores HTTP 500 significan "lentitud"
(/search/docs/crawling-indexing/http-network-errors#http-status-codes)) y en los ajustes de Search
Console (https://support.google.com/webmasters/answer/48620).
Sin embargo, el robot de Google no rastrea todas las páginas que ha descubierto. Puede
que el propietario del sitio web inhabilite el rastreo
(/search/docs/crawling-indexing/robots/robots_txt#disallow) de algunas páginas, o puede
también que no se pueda acceder a otras páginas sin antes tener que iniciar sesión en el
sitio. Además, algunas páginas pueden ser una versión duplicada de otras páginas
rastreadas anteriormente (/search/docs/crawling-indexing/consolidate-duplicate-urls).
Por
ejemplo, se puede acceder a muchos sitios mediante la versión con www
(www.example.com) y sin www (example.com) del nombre de dominio, aunque el contenido
sea idéntico en ambas versiones.
https://developers.google.com/search/docs/fundamentals/how-search-works 2/5
15/11/22, 8:42 Guía detallada sobre cómo funciona la Búsqueda de Google | Centro de la Búsqueda de Google | Documentación | Google D…
Durante el rastreo, Google renderiza la página y ejecuta el código JavaScript que encuentre
(/search/docs/crawling-indexing/javascript/javascript-seo-basics#how-googlebot-processes-javascript)
mediante una versión reciente de Chrome, similar a la forma en que tu navegador renderiza
las páginas que visitas.
El renderizado es importante porque los sitios web suelen usar
JavaScript para añadir contenido a la página, por lo que es posible que Google no lo
detecte si no se renderiza.
El rastreo depende de si los rastreadores de Google pueden acceder al sitio o no. Algunos
problemas habituales que puede tener el robot de Google a la hora de acceder a sitios son
los siguientes:
Problemas de red
(/search/docs/crawling-indexing/http-network-errors#network-and-dns-errors)
Indexación
Después de descubrir una página, Google intenta interpretar su contenido. Esta fase se
denomina "indexación" e incluye el procesamiento y el análisis del contenido textual, así
como de las etiquetas y los atributos de contenido importantes, como elementos <title>
(/search/docs/appearance/title-link), atributos "alt", imágenes
(/search/docs/appearance/google-images), vídeos (/search/docs/appearance/video) y más.
Google también recoge señales sobre la página canónica y su contenido, que se puede
usar en la siguiente fase, en la que servimos la página en los resultados de búsqueda. Entre
estas señales, se incluyen el idioma de la página, el país en el que se encuentra el
contenido, la usabilidad de la página, etc.
https://developers.google.com/search/docs/fundamentals/how-search-works 3/5
15/11/22, 8:42 Guía detallada sobre cómo funciona la Búsqueda de Google | Centro de la Búsqueda de Google | Documentación | Google D…
La indexación también depende del contenido de la página y de sus metadatos. Estos son
algunos de los problemas de indexación más habituales:
No aceptamos pagos para mejorar el posicionamiento de páginas web; esta clasificación se hace
automáticamente.
Cuando los usuarios introducen sus consultas, nuestro sistema busca en el índice páginas
que coincidan con ellas y devuelve los resultados que consideramos más relevantes y de
mayor calidad. Para determinar esta relevancia, el sistema tiene en cuenta cientos de
factores, como la ubicación, el idioma y el dispositivo del usuario (ordenador o teléfono).
Por ejemplo, si un usuario de Barcelona busca "talleres de reparación de bicicletas",
obtendrá resultados diferentes a los de los usuarios de Hong Kong que hagan la misma
consulta.
Puede que en Search Console se indique que una página está indexada, pero no se muestra
en los resultados de búsqueda.
Esto puede deberse a los siguientes motivos:
https://developers.google.com/search/docs/fundamentals/how-search-works 4/5
15/11/22, 8:42 Guía detallada sobre cómo funciona la Búsqueda de Google | Centro de la Búsqueda de Google | Documentación | Google D…
Except as otherwise noted, the content of this page is licensed under the Creative Commons Attribution 4.0
License (https://creativecommons.org/licenses/by/4.0/), and code samples are licensed under the Apache
2.0 License (https://www.apache.org/licenses/LICENSE-2.0). For details, see the Google Developers Site
Policies (https://developers.google.com/site-policies). Java is a registered trademark of Oracle and/or its
affiliates.
https://developers.google.com/search/docs/fundamentals/how-search-works 5/5