Está en la página 1de 6

14/11/2011

Introduccin

Cmo funciona un buscador? La verdad sobre los motores de bsqueda

La red est cambiando nuestros hbitos de trabajo y cada vez tiene una presencia ms ubicua en nuestras vidas. La principal herramienta de marketing de esta nueva son los buscadores: cuando alguien necesita informacin, acude a Internet y utiliza un buscador. Pero, cmo funciona un buscador? qu tenemos que hacer para asegurarnos de que nos encuentran?

Los buscadores de antes

Cmo funcionan ahora los buscadores? Ahora son ndices automticos de pginas web:
Una araa (un pequeo programa que se mueve por la red) visita tu pgina web La araa lee el contenido de tu pgina web La araa lleva toda la informacin a una central, donde un sistema la procesa y la almacena. El sistema crea un ndice con las palabras que utilizas en tu web y las ordena por relevancia. El sistema intenta descubrir si eres una buena pgina o no (comprueba cuanta gente recomienda tu web). Cuando alguien realiza una bsqueda, y el sistema muestra todas las webs que contienen la palabra o frase buscada.

Los buscadores anteriores a Google (salvo Altavista), eran directorios de pginas web. Esto significa lo siguiente: T debas dar de alta tu pgina web en el directorio. Debas indicar por qu palabras clave deseabas ser encontrado. T redactabas la definicin de tu pgina web. ... Y cuando alguien buscaba una palabra que estaba incluida en tus palabras clave o en tu definicin, el buscador mostraba tu pgina.

... Y muestra los resultados en funcin de un algoritmo.

14/11/2011

Esta presentacin tratar los siguientes puntos:

Las araas

Cmo nos encuentra por primera vez una araa? Cmo una araa puede navegar por nuestras pginas? Cmo podemos evitar que una araa navegue por nuestras pginas, si no deseamos ser indexados? Una vez estamos indexados, cmo podemos mejorar nuestra posicin en el listado de resultados?

Hay muchsimas araas navegado constantemente por la red Controlando las 5 principales tenemos el 90% de las araas controladas. Google Bot (Google) Slurp (Yahoo) Scooter (Altavista) Fast (webs privades) Teoma (Ask Jeeves)

64.68.82.14 - - [03/Aug/2003:14:26:11 +0800] "GET / HTTP/1.0" 200 2225 "-" "Googlebot/2.1 (+http://www.googlebot.com/bot.html)" 200.46.132.9 - - [03/Aug/2003:15:54:29 +0800] "GET / HTTP/1.1" 200 2225 "-" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; .NET CLR 1.0.3705)" 200.46.132.9 - - [03/Aug/2003:15:54:29 +0800] "GET /icons/i/1line.gif HTTP/1.1" 200 76 "http://solocine.com/" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; .NET CLR 1.0.3705)" 200.46.132.9 - - [03/Aug/2003:15:54:30 +0800] "GET /icons/i/1bg.gif HTTP/1.1" 200 3023 "http://solocine.com/" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; .NET CLR 1.0.3705)" 200.46.132.9 - - [03/Aug/2003:15:54:35 +0800] "GET /images/logo3_luz_roja_2.jpg HTTP/1.1" 200 47843 "http://solocine.com/" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; .NET CLR 1.0.3705)" 64.68.85.10 - - [03/Aug/2003:16:37:05 +0800] "GET /robots.txt HTTP/1.0" 404 128 "-" "Googlebot/2.1 (+http://www.googlebot.com/bot.html)" 64.68.85.10 - - [03/Aug/2003:16:37:06 +0800] "GET / HTTP/1.0" 200 2225 "-" "Googlebot/2.1 (+http://www.googlebot.com/bot.html)" 62.57.10.48 - - [03/Aug/2003:20:32:10 +0800] "GET / HTTP/1.1" 200 2225 "http://www.montilla.com/" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)" 62.57.10.48 - - [03/Aug/2003:20:32:11 +0800] "GET /icons/i/1line.gif HTTP/1.1" 200 76 "http://www.solocine.com/" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)" 62.57.10.48 - - [03/Aug/2003:20:32:11 +0800] "GET /icons/i/1bg.gif HTTP/1.1" 200 3023 "http://www.solocine.com/" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)" 62.57.10.48 - - [03/Aug/2003:20:32:12 +0800] "GET /images/logo3_luz_roja_2.jpg HTTP/1.1" 200 47843 "http://www.solocine.com/" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)

Cmo hacer llegar una araa a nuestra pgina web?


O bien conseguimos que nuestra pgina aparezca en el listado de la araa (acudiendo a un buscador y pulsando sobre Add URL) O bien llega a nuestra pgina a travs de un enlace en otra pgina web.

Add URL

Submit Your Site

Estos son los rastros de lo que est pasando por nuestras mquinas: los Logs. Aqu puedes ver el paso de las araas por tu web. Programas de anlisis como WebTrends o LiveStats, analizan los logs de las pginas web y muestran estadsticas de toda la actividad.

Las dos formas de atraerlas son igual de buenas.

14/11/2011

Una vez tenemos a la araa dentro

Cmo puedo saber cuntas pginas tengo indexadas?


Existe un comando en Google que te permite saber cuantas pginas tienes indexadas. Este mismo comando suele funcionar en otros buscadores: Escribe en la cajita buscadora: Site:www.pagina.com
(Vigila no escribas un espacio entre site: y la URL, no funcionara)

Debemos asegurarnos de que puede navegar por todas nuestras pginas, para que el buscador que las ha enviado pueda indexarnos bien. Las araas no pueden pasar a travs de enlaces que estn:

Escritos en Javascript Dentro de Flash Dentro de Pop Ups (Algunas araas) Botones

Esta bsqueda te mostrar el nmero de pginas que Google tiene indexadas para una URL en concreto. Si deseas saber cuantas pginas de una URL en concreto contienen una palabra en determinado, la bsqueda puedes hacerla as: Site:www.pagina.com palabra que buscas

Qu tengo que hacer si no quiero que una araa entre en mi pgina web?

El protocolo de exclusin de robots es respetado por la mayora de araas.

Ya estamos indexados y ahora qu?


Ahora, debes luchar para estar en las primeras posiciones de los resultados de bsqueda!!!

Cmo funciona el protocolo de exclusin?


Antes de empezar a escanear una pgina, las araas acuden siempre a la pgina robots.txt de tu pgina web, y buscan en ella qu partes de la web se pueden escanear y quienes pueden hacerlos.

Si no tienes una pgina robots.txt, deberas crear una en blanco y colgarla en tu web. Si hay alguna parte de tu web que no deseas que se escanee, indcalo en esta pgina.

14/11/2011

Los Algoritmos

El Algoritmo de Google

(Simplificando...) Est formado por 2 algoritmos:

Cada buscador tiene sus propios algoritmos de ordenacin. Los algoritmos son secretos, pero con tiempo y paciencia, puedes llegar a conocer qu factores intervienen en l y en qu orden de importancia lo hacen.

El de PageRank El de Relevancia
Larry Page y Sergey Brin, fundadores de Google
(Page Rank = Ranking de Larry Page)

El PageRank
La lgica del PageRank y otros algoritmos que tienen en cuenta la popularidad de una web, es la siguiente:

Es un conjunto de algoritmos que tienen por finalidad asignar un valor numrico a las pginas web segn el nmero de veces que otras pginas las recomienden y segn el PageRank que tengan estas pginas.

Una pgina con un buen contenido es referenciada por otras pginas. Algunas pginas son a su vez buenas pginas porqu estn referenciadas por terceras pginas y porqu son buenas referenciadoras..

14/11/2011

Cmo puedo aumentar mi PageRank?

El Algoritmo de Relevancia

Necesitas aumentar el nmero de enlaces en webs de terceros que recomiendan tu pgina web. Necesitas conseguir que te enlacen pginas web que tengan el PageRank alto. Necesitas conseguir enlaces en pginas web donde no haya muchos otros enlaces. El valor del tuyo queda dividido por el nmero total de enlaces que salen de esa pgina web. Para conocer el PageRank de una pgina, debes tener instalada la barra de Google. En ella se muestra mientras navegas qu PR tiene la pgina que visitas.

Este algoritmo tiene en cuenta los siguientes factores: Relevancia de la palabra en el contexto general de pginas indexadas: en cuantas pginas de nuestra web, aparece esta palabra (en forma de
densidad: nm/total pg.)

Relevancia de la palabra en cada una de las pginas.

La relevancia

Consejos para mejorar nuestro posicionamiento:

Tiene en cuenta la densidad de los caracteres que forman esa palabra, en las diferentes partes de una pgina web: Densidad en la URL Densidad en el Titulo de la pgina (<title>) Densidad en la descripcin Densidad en cabeceras (H1,H2, etc...) Densidad en el nombre de enlaces Densidad en palabras en negrita Densidad en textos alternativos (ALT) ...

Conseguir que las araas entren en todas y cada una de nuestras pginas. Conseguir que otras pginas web recomienden la nuestra. (Ideal si tienen un PR alto, si no tienen mucho enlaces, y si adems lo hacen utilizando una palabra de las que deseamos posicionar) Conseguir que las palabras por las que deseamos posicionarnos ocupen lugares importantes en nuestra web, y lo hagan con una densidad elevada.

14/11/2011

Consejos de ltima hora

Herramientas de trabajo imprescindibles (gratuitas) La barra de Google Simulador de araa:


http://www.gritechnologies.com/tools/spider.go

No olvides que tu pgina web tiene que estar orientada a las personas, no a los buscadores. El peso de la navegabilidad y de la usabilidad general de la pgina, cuando la disees, debe ser mayor que el peso de la correcta la indexacin. Las pginas se crean para las personas, no para las mquinas. No hagas trampas. La gente de Google las conoce todas, as que haciendo trampas, lo nico que consigues es arriesgarte a que te penalicen o te expulsen de Google.

Analizador de Densidades:
http://www.searchengineworld.com/cgi-bin/kwda.cgi

Analizador de popularidad:
http://www.marketleap.com/publinkpop/

Analizador de indexacin en los principales motores de bsqueda :


http://www.marketleap.com/siteindex/default.htm

Otra herramienta de trabajo imprescindible HBX


HBX te proporciona estadsticas de todos los parmetros de tu web: Te indica qu araas estn indexando tu pgina, cunto trfico te traen, qu palabras son las que tus usuarios buscan, y cientos de parmetros ms. Adems, te ayuda a mejorar los ratios de conversin de usuario a cliente ya que proporciona informes avanzados con los que podrs realizar un seguimiento exhaustivo de todos los procesos de navegacin de tu pgina web y te ayudar eliminar cuellos de botella.

Si deseas informacin complementaria o deseas conocer mejor qu servicios puede ofrecerte alt64 para mejorar la eficiencia de tu pgina web, no dudes en contactarnos: alt64 Digital, S.L. Avda. Corts Catalanes, 7 08173 Sant Cugat del Valls - Barcelona http://www.alt64.com info@alt64.com

Ms informacin acerca de HBX >> alt64.com