Está en la página 1de 3

El término Google tiene origen en la matemática, google viene de googol, que es el

número 10100, es decir, el dígito 1 seguido de cien ceros. El googol tiene poca utilidad, sólo
para explicar la diferencia entre un gran número y el infinito, y debido a su magnitud, los
fundadores de Google decidieron adaptar el término para dar nombre a su empresa.
(un uno seguido de cien ceros).

Etimológicamente, Google sería un número gigante que representa una cantidad de


información, aparentemente infinita. De hecho, no existe ningún elemento del universo en
una cantidad tan grande como un "Googol": ni estrellas, ni partículas de polvo, ni siquiera
átomos.

El término googol o gúgol existe desde 1938, cuando el matemático Edward Kasner le
pidió a su sobrino de 9 años que creara un nombre para un número inmensamente
grande.

Google es una empresa multinacional estadounidense especializada en servicios y


productos relacionados con software, Internet, dispositivos electrónicos y otras
tecnologías. Google aloja y desarrolla una serie de productos y servicios basados en
Internet y la mayor parte de sus ingresos se genera a través de la publicidad de AdWords.

Google es una compañía estadounidense fundada en septiembre de 1998 cuyo producto


principal es un motor de búsqueda creado por Larry Page y Sergey Brin. El término
suele utilizarse como sinónimo de este buscador, el más usado en el mundo.

Su principal producto, que lleva el mismo nombre de la compañía, es el motor de


búsqueda más popular que existe, cuya función es brindar a los usuarios acceso a
listados de páginas web y referencias de distinto tipo, como una forma de facilitar su
recorrido del vasto mundo de la Internet.

¿Cómo funciona Google?

Desde que se introduce el término en la caja de búsqueda hasta que se consiguen los
resultados, un proceso que normalmente no toma más que un par de segundos, tienen
lugar los siguientes procesos en el buscador de Google:

 Gateo (crawling) e indexación. La primera etapa de la búsqueda consiste en la


revisión de la enorme cantidad de páginas web que hay (aproximadamente unos
30 billones), contrastando con sus índices la presencia de la palabra clave
proporcionada por el usuario.
 Algoritmos y fórmulas. Una vez seleccionados los resultados, que permiten
ordenar y jerarquizar los resultados en base a los términos provistos por el
usuario. Este algoritmo es capaz de sugerir búsquedas, ofrecer resultados
paralelos e incluso corregir al usuario si sospecha que hubo algún error en la
escritura de la palabra clave.
 Eliminación del SPAM. Dado que numerosos resultados pertenecerán a sitios
inseguros, ilegales o poco relevantes, Google aplica filtros especializados que le
permiten deshacerse de los resultados poco convenientes y centrar su búsqueda
en la información más probable.

Google se ejecuta a través de más de un millón de servidores en los centros de datos de


todo el mundo, y procesa más de mil millones de solicitudes de búsqueda y veinte
petabytes de datos generados por los usuarios cada día.

o El primer paso del proceso que permite al buscador de Google ofrecer los mejores
resultados a los usuarios es el rastreo de los cientos de miles de millones de
páginas web disponibles en Internet, lo que le permite organizar la información y
los contenidos públicos en el índice de la búsqueda. 
o , Google utiliza unos programas informáticos llamados rastreadores web
para encontrar portales de acceso público. Los rastreadores analizan el
contenido de las páginas para ver qué ha cambiado respecto a versiones
anteriores, y también siguen los enlaces que contienen para descubrir nuevas
páginas y detectar los links rotos u obsoletos.
o Para obtener los resultados de una búsqueda concreta, Google cuenta con
sistemas de clasificación formados por un conjunto de algoritmos que analizan qué
es lo que quieres encontrar para determinar la información que el buscador debe
mostrarte en los resultados. 
o A la hora de seleccionar los resultados, en primer lugar los algoritmos de Google
analizan las palabras clave que ha introducido 
o los algoritmos evalúan la cantidad de veces que aparecen las palabras clave en la
página, el lugar en el que se encuentran (encabezado, título, cuerpo del texto, etc.)
y otras pistas que indiquen si el contenido de la página es relevante para el
usuario.
o
o

Rastreo

El rastreo es el proceso mediante el cual el robot de Google visita páginas nuevas y


actualizadas para añadirlas al índice de Google.

Utilizamos una enorme cantidad de ordenadores para obtener (o "rastrear") miles de


millones de páginas de la Web. El programa encargado de recuperar este contenido es el
robot de Google, también conocido simplemente como robot o araña. El robot de Google
determina mediante algoritmos qué sitios web deben rastrearse, con qué frecuencia tiene
que hacerse y cuántas páginas hay que obtener de cada uno de ellos.

El proceso de rastreo de Google empieza con una lista de URLs de páginas web
generada a partir de rastreos anteriores que se amplía con los datos de sitemaps que nos
envían los webmasters. Cuando el robot de Google visita páginas, encuentra los enlaces
que contienen y los añade a la lista de páginas para rastrear. Los sitios web nuevos, los
cambios en los que ya conocemos y los enlaces obsoletos se detectan y se utilizan para
actualizar el índice de Google.

Rastreo principal y secundario


Al rastrear sitios web, utilizamos dos rastreadores diferentes: uno de móviles y otro de
ordenadores. 

Indexación

El robot de Google procesa todas las páginas que rastrea para entender su contenido.
Además del contenido textual, procesa la información incluida en etiquetas y atributos de
contenido importantes, como las etiquetas <title>, los atributos "alt", las imágenes, los
vídeos, etc. Aunque el robot de Google puede analizar muchos tipos de contenido, no
puede analizarlos todos, incluido el de algunos archivos de rich media.

Una vez rastreada una página, pero antes de indexarla, determinamos si es una versión
duplicada o canónica de otra. Si consideramos que la página es un duplicado, se
rastreará con mucha menos frecuencia. Las páginas similares se agrupan en un
documento, que es un grupo de al menos una página en el que se incluye la página
canónica (la más representativa del grupo) y los duplicados que se hayan encontrado. Los
duplicados pueden ser simplemente URL alternativas para llegar a una misma página o
versiones alternativas para móviles u ordenadores.

Google no indexa ninguna página que contenga una directiva noindex, ya sea en su


encabezado o en una etiqueta. Sin embargo, para respetar esta directiva, primero tiene
que poder verla; por tanto, si una página está bloqueada por un archivo robots.txt,
requiere iniciar sesión o está bloqueada de algún otro modo, es posible que la acabemos
indexando aunque no la hayamos visitado.

También podría gustarte