Está en la página 1de 2

Todos los das se hacen bsquedas en Internet, y desde hace ms de una dcada Google es la herramienta preferida para buscar

prcticamente cualquier cosa. Quiz alguna vez te hayas preguntado qu pasa detrs de bambalinas, entre el momento que presionas "enter" en tu teclado y te aparece una lista de opciones (usualmente es una cuestin de fracciones de segundo). Las listas que se te presentan como resultados usualmente incluyen mucho ms contenido del que hubieras credo, incluyendo ligeras correcciones en tu ortografa o sugerencias de lo que quiz quisiste decir. Por ejemplo, para una bsqueda sencilla, como "Internet bsico", Google regresa en aproximadamente 0.27 segundos, con ms de 34 millones de resultados. S, millones. Cmo es que ocurre esta magia? Qu es lo que permite que se tengan tantos resultados, y con tantas combinaciones de esas dos palabras? A grandes rasgos, Google explica cmo ocurren las bsquedas haciendo referencia a tres pasos bsicos: 1. Rastreo e indexacin.- Google navega continuamente en Internet, haciendo lo que se llama el rastreo, que bsicamente es seguir enlaces de una pgina a otra. Google entonces ordena a las pginas que va encontrando en base a su contenido y otros elementos, para despus organizarla y almacenarla en un ndice (el ndice), que, de acuerdo a datos publicados por Google, llega a tener un tamao de ms de 100 millones de gigabytes (puedes ver cunto es esto en Wolfram-Alpha, en esta pgina de resultados).

2. Algoritmos.- Google desarrolla programas y frmulas que hacen posible entregarte resultados relevantes a lo que buscas. Cuando haces una bsqueda, se ponen en marcha diversos algoritmos con el fin de interpretar qu es exactamente lo que ests buscando. Dichos algoritmos son continuamente revisados y mejorados, e incluyen cosas como mtodos de bsqueda, autocompletado, interpretacin de la consulta, uso de sinnimos, ortografa, entre otros. Basndose en los resultados que los estos algoritmos arrojan, se utiliza el ndice para obtener documentos que se consideran relevantes para tu consulta. Estos resultados an no son los que se te presentan. El siguiente paso es que los resultados se pasan por un proceso de clasificacin, el cual considera cerca de doscientos factores diferentes, como por ejemplo, edad de las publicaciones, contexto y filtro de safe search. Despus del proceso de clasificacin, los resultados estn listos para serte presentados.

3. Eliminar SPAM.- Google hace un esfuerzo importante por eliminar spam de los resultados que te brinda, y lleva a cabo un proceso de revisin de documentos, que se hace tanto de forma automtica como manual. De entre los tipos de spam que filtran, se encuentran: textos ocultos o uso excesivo de palabras clave, enlaces engaosos, pginas con contenido o enlaces a spam, redireccin de pginas, enlaces engaosos o manipuladores, contenido sin fondo o sin valor y dominios sin usar, entre otros. Google le manda un aviso a los propietarios de las pginas que son identificadas como spam, y as permitirles hacer cambios para que sus pginas sean integradas en bsquedas que se hagan en el futuro.

También podría gustarte