Está en la página 1de 4

PageRank

1 Algoritmo
C
34.3%

B
38.4%

A
3.3%

El algoritmo inicial del PageRank lo podemos encontrar


en el documento original donde sus creadores presentaron
el prototipo de Google: The Anatomy of a Large-Scale
Hypertextual Web Search Engine":[2]

F
3.9%

D
3.9%

PR(A) = (1 d) + d

E
8.1%

1.6%

PR(i)
i=1 C(i)

Donde:

1.6%
1.6%

PR(A) es el PageRank de la pgina A.

1.6%
1.6%

d es un factor de amortiguacin que tiene un valor


entre 0 y 1.

Google ordena los resultados de la bsqueda utilizando su propio


algoritmo PageRank. A cada pgina web se le asigna un nmero
en funcin del nmero de enlaces de otras pginas que la apuntan, el valor de esas pginas y otros criterios no pblicos.

PR(i) son los valores de PageRank que tienen cada


una de las pginas i que enlazan a A.
C(i) es el nmero total de enlaces salientes de la pgina i (sean o no hacia A).

PageRank es una marca registrada y patentada[1] por


Google el 9 de enero de 1999 que ampara una familia de
algoritmos utilizados para asignar de forma numrica la
relevancia de los documentos (o pginas web) indexados
por un motor de bsqueda. Sus propiedades son muy discutidas por los expertos en optimizacin de motores de
bsqueda. El sistema PageRank es utilizado por el popular motor de bsqueda Google para ayudarle a determinar
la importancia o relevancia de una pgina. Fue desarrollado por los fundadores de Google, Larry Page (apellido,
del cual, recibe el nombre este algoritmo) y Sergey Brin,
en la Universidad de Stanford mientras estudiaban el posgrado en ciencias de la computacin.

Algunos expertos aseguran que el valor de la variable d


suele ser 0,85. Representa la probabilidad de que un navegante contine pulsando links al navegar por Internet
en vez de escribir una url directamente en la barra de
direcciones o pulsar uno de sus marcadores y es un valor establecido por Google. Por lo tanto, la probabilidad
de que el usuario deje de pulsar links y navegue directamente a otra web aleatoria es 1-d.[3] La introduccin del
factor de amortiguacin en la frmula resta algo de peso
a todas las pginas de Internet y consigue que las pginas que no tienen enlaces a ninguna otra pgina no salgan
especialmente beneciadas. Si un usuario aterriza en una
pgina sin enlaces, lo que har ser navegar a cualquier
otra pgina aleatoriamente, lo que equivale a suponer que
una pgina sin enlaces salientes tiene enlaces a todas las
pginas de Internet.

PageRank confa en la naturaleza democrtica de la web


utilizando su vasta estructura de enlaces como un indicador del valor de una pgina en concreto. Google interpreta
un enlace de una pgina A a una pgina B como un voto,
de la pgina A, para la pgina B. Pero Google mira ms
all del volumen de votos, o enlaces que una pgina recibe; tambin analiza la pgina que emite el voto. Los votos
emitidos por las pginas consideradas importantes, es
decir con un PageRank elevado, valen ms, y ayudan a
hacer a otras pginas importantes. Por lo tanto, el PageRank de una pgina reeja la importancia de la misma
en Internet.

La calidad de la pgina y el nmero de posiciones que


ascienda se determina por una votacin entre todas las
dems pginas de la World Wide Web acerca del nivel de
importancia que tiene esa pgina. Un hiperenlace a una
pgina cuenta como un voto de apoyo. El PageRank de
una pgina se dene recursivamente y depende del nmero y PageRank de todas las pginas que la enlazan.
Una pgina que est enlazada por muchas pginas con
un PageRank alto consigue tambin un PageRank alto.
Si no hay enlaces a una pgina web, no hay apoyo a esa
pgina especca. El PageRank de la barra de Google va
de 0 a 10. Diez es el mximo PageRank posible y son
1

5 BIBLIOGRAFA

muy pocos los sitios que gozan de esta calicacin, 1 es


la calicacin mnima que recibe un sitio normal, y cero
signica que el sitio ha sido penalizado o an no ha recibido una calicacin de PageRank. Parece ser una escala
logartmica. Los detalles exactos de esta escala son desconocidos. En los ltimos tiempos Google est tratando
de mantener un poco privado su PageRank para evitar
manipulaciones, pero existen sitios donde se puede comprobar el PageRank.[4]
Una alternativa al algoritmo PageRank propuesto por Jon
Kleinberg, es el algoritmo HITS.

1. semana de mayo de 2012


1. semana de febrero de 2012
2. semana de noviembre de 2011
4. semana de junio de 2011
3. semana de enero de 2011[6]
1. semana de abril de 2010
4. semana de diciembre de 2009
4. semana de octubre de 2009

1.1

Manipulacin

Debido a la importancia comercial que tiene aparecer entre los primeros resultados del buscador, se han diseado mtodos para manipular articialmente el PageRank
de una pgina. Entre estos mtodos hay que destacar el
spam, consistente en aadir enlaces a una cierta pgina
web en lugares como blogs, libros de visitas, foros de Internet, etc. con la intencin de incrementar el nmero de
enlaces que apuntan a la pgina.
A principios del 2005 Google implement un nuevo atributo para hiperenlaces rel="nofollow como un intento
de luchar contra el spam. De esta forma cuando se calcula el peso de una pgina, no se tienen en cuenta los links
que tengan este atributo.

4. semana de mayo de 2009


4. semana de marzo de 2009
4. semana de diciembre de 2008
3. semana de octubre de 2008
4. semana de julio de 2008
4. semana de mayo de 2008
2. semana de marzo de 2008
2. semana de enero de 2008
4. semana de octubre de 2007
4. semana de abril de 2007

Antecedentes

PageRank ha tomado su modelo del Science Citation Index (SCI) elaborado por Eugene Gareld para el Instituto
para la Informacin Cientca (ISI) en los Estados Unidos
durante la dcada del 50. El SCI pretende resolver la asignacin objetiva de mritos cientcos suponiendo que los
investigadores cuyo factor de impacto (nmero de publicaciones y/o referencias bibliogrcas en otros trabajos
cientcos) es ms alto, colaboran en mayor medida con
el desarrollo de su rea de investigacin. El ndice de citacin es un elemento determinante para seleccionar qu
investigadores reciben becas y recursos de investigacin.

ltimas actualizaciones del PageRank

Las actualizaciones del PageRank tienen lugar algunas


veces al ao, y tardan varios das en completarse. Aqu se
pueden ver las fechas de actualizaciones del Pagerank.[5]
1. semana de diciembre del 2013
1. semana de noviembre de 2012
1. semana de agosto de 2012

3. semana de enero de 2007


2. semana de octubre de 2006
2. semana de julio de 2006

4 Vase tambin
Google
Motor de bsqueda
Pgina de resultados del buscador
Posicionamiento en buscadores

5 Bibliografa
Langville, Amy N.; Meyer, Carl D. (2006). Googles
PageRank and Beyond: The Science of Search Engine
Rankings. Princeton University Press. ISBN 0-69112202-4.
Page, Lawrence; Brin, Sergey; Motwani, Rajeev
y Winograd, Terry (1999). The PageRank citation
ranking: Bringing order to the Web.

3
Richardson, Matthew; Domingos, Pedro (2002).
The intelligent surfer: Probabilistic combination of
link and content information in PageRank. Proceedings of Advances in Neural Information Processing
Systems 14.
Cheng, Alice; Friedman, Eric J. Manipulability of
PageRank under Sybil Strategies. Proceedings of
the First Workshop on the Economics of Networked
Systems (NetEcon06).
Altman, Alon; Tennenholtz, Moshe. Ranking Systems: The PageRank Axioms. Proceedings of the
6th ACM conference on Electronic commerce (EC05).

Referencias

[1] http://www.google.com/patents?vid=6285999
[2] The Anatomy of a Large-Scale Hypertextual Web Search
Engine (en ingls)
[3] Sergey Brin y Lawrence Page (1998). The anatomy of a
large-scale hypertextual Web search engine (Seccin 2.1.1
Description of PageRank Calculation). p. 107-117.
[4] Comprobar el PageRank
[5] Page-Rank.es. Historial de actualizacin de PageRank.
[6] Barry Schwartz. First Google Toolbar PageRank Update
Of 2011.

Enlaces externos
Method for node ranking in a linked database: la patente originaria de PageRank.
The Anatomy of a Large-Scale Hypertextual Web
Search Engine: el prototipo de Google

8 TEXT AND IMAGE SOURCES, CONTRIBUTORS, AND LICENSES

Text and image sources, contributors, and licenses

8.1

Text

PageRank Fuente: http://es.wikipedia.org/wiki/PageRank?oldid=80409944 Colaboradores: Sabbut, Ecemaml, Richy, Tuks, WhisKiTo,


Wikier~eswiki, Caos, Argotide, Taichi, Emijrp, Rembiapo pohyiete (bot), Magister Mathematicae, Orgullobot~eswiki, RobotQuistnix, Valadrem, Unf, Alhen, Superzerocool, Chobot, Amads, FlaBot, Maleiva, .Sergio, YurikBot, KnightRider, Malekov, FedericoMP, Leitzaran,
Mouse~eswiki, Tomatejc, Alexav8, CarlosBenito, Davius, Antur, Montgomery, Thijs!bot, Alvaro qc, Beetstra, Kasador one, Botones, Isha,
Endermuabdib, JAnDbot, Jugones55, Kved, Micherry~eswiki, Muro de Aguas, TXiKiBoT, Dxysta, Gacq, Netito777, Rei-bot, Idioma-bot,
Jmvkrecords, Hostingresellerbuscohosting, AlnoktaBOT, Cinevoro, Technopat, Dwaynemac, Matdrodes, Lucien leGrey, Graneuro, SieBot,
PaintBot, Loveless, Macarrones, BOTarate, Eduardo mouta, Ken123BOT, Xulux, El bot de la dieta, Davape9, Mafores, Carlinhos1976,
Tirithel, Mutari, Javierito92, HUB, Nicop, Farisori, Veon, Pan con queso, Jpgrr, Frei sein, SilvonenBot, UA31, AVBOT, Sbelza, Angel
GN, Repapaz, Luckas-bot, Vtescandell, Billinghurst, Abizzocchi, ArthurBot, SuperBraulio13, Impreosoa, Carne de res, Xqbot, Milanesanapolitana, Supermilanesa, Calculadoracientica, -Erick-, Ahedom, Catwikicat, MauritsBot, X7q, AstaBOTh15, TiriBOT, MAfotBOT,
MondalorBot, LeonardoN-NPI, TobeBot, Halfdrag, PatruBOT, Phantasia~eswiki, Savh, Petete21, J. A. Glvez, Grillitus, ElTeq, JackieBot, Jcaraballo, Mr.Technology, Kasirbot, MerlIwBot, KLBot2, Renly, Dec-iluminacion, Jumasa, Sorin Cojocaru, MaKiNeoH, Sabilla27,
JoseTaboexa, ZonaSEO, JhonnyAlvarez y Annimos: 185

8.2

Images

Archivo:PageRanks-Example.svg Fuente: http://upload.wikimedia.org/wikipedia/commons/f/fb/PageRanks-Example.svg Licencia:


Public domain Colaboradores: en:Image:PageRanks-Example.jpg. Inspired in File:PageRank-hi-res.png. Artista original: en:User:345Kai,
User:Stannered

8.3

Content license

Creative Commons Attribution-Share Alike 3.0

También podría gustarte