Documentos de Académico
Documentos de Profesional
Documentos de Cultura
2012 07 29 Google Corrientes PDF
2012 07 29 Google Corrientes PDF
Carlos D’Andrea
Carlos D’Andrea
El Álgebra Lineal detrás de Google
Facultad de Matemáticas
Universidad de Barcelona
Licenciatura en Matemática
Master en Matemática Avanzada
Doctorado en Matemática
Otros masters y doctorados
Ingenieria Informática
Carlos D’Andrea
El Álgebra Lineal detrás de Google
Programa de Álgebra Lineal
(Ingeniería Informática)
Polinomios
Números complejos
Sistemas lineales de ecuaciones
Matrices
Espacios vectoriales
Subespacios, transformaciones lineales, etc, etc, etc.
Valores y vectores propios – Diagonalización
Carlos D’Andrea
El Álgebra Lineal detrás de Google
¿Para qué nos hacen estudiar todo esto???
Carlos D’Andrea
El Álgebra Lineal detrás de Google
Álgebra Lineal en la Informática
Programación gráfica
Teoría de grafos (redes sociales,...)
Elaboración eficiente de filtros
Inteligencia artificial
Visión por ordenador
...
Carlos D’Andrea
El Álgebra Lineal detrás de Google
¡Todo esto lo verán después!
Carlos D’Andrea
El Álgebra Lineal detrás de Google
El álgebra lineal detrás de
Carlos D’Andrea
El Álgebra Lineal detrás de Google
Una gran familia
Carlos D’Andrea
El Álgebra Lineal detrás de Google
Google’s got Talent
Carlos D’Andrea
El Álgebra Lineal detrás de Google
¿Cómo se diseña un buscador de internet?
Es un problema de ingeniería matemática:
1 un buen conocimiento del contexto
2 un modelo matemático que lo explique
3 una cuidadosa y eficiente implementación
Carlos D’Andrea
El Álgebra Lineal detrás de Google
Trabajo básico de un buscador de internet
“Censar” las páginas de internet de acceso público
Indexar los datos censados de acuerdo a su importancia con
respecto a las palabras claves
Ordenar estos datos de acuerdo a su importancia con
respecto a las palabras claves
Carlos D’Andrea
El Álgebra Lineal detrás de Google
¡También se requiere resistencia a la
manipulación!
Carlos D’Andrea
El Álgebra Lineal detrás de Google
El algoritmo “PageRank”
Carlos D’Andrea
El Álgebra Lineal detrás de Google
El modelo “PageRank”
El universo de páginas de internet públicas es un gran grafo
dirigido donde
cada página web es un nodo
hay una arista orientada entre páginas que citan a otras
páginas
Carlos D’Andrea
El Álgebra Lineal detrás de Google
La “importancia” de una página web
Es alta si
la citan muchas páginas
La citan páginas “importantes”
Carlos D’Andrea
El Álgebra Lineal detrás de Google
“Postulado” PageRank
Carlos D’Andrea
El Álgebra Lineal detrás de Google
El álgebra lineal entra en acción
M es la matriz de adyacencia del grafo de las páginas de
internet
Mt · x = λ · x
Carlos D’Andrea
El Álgebra Lineal detrás de Google
¡Vectores y valores propios!
Mt · x = λ · x
λ es la constante de proporcionalidad ↔ un valor propio de
Mt
x = (x1 , x2 , . . . , xN ) es el vector de “importancias” de las
páginas censadas ↔ un vector propio de Mt (asociado a λ)
Carlos D’Andrea
El Álgebra Lineal detrás de Google
Todo muy bonito, pero...
¿Por qué debería tener valores propios reales Mt ?
¿Cual de ellos elijo?
¿Por qué habría de haber vectores propios todos positivos?
¿Algún tipo de unicidad???
Carlos D’Andrea
El Álgebra Lineal detrás de Google
Teorema 1 (Perron, 1907)
Carlos D’Andrea
El Álgebra Lineal detrás de Google
Pero...
Nuestra matriz M está MUY lejos de ser positiva
¿Qué hacemos?
Carlos D’Andrea
El Álgebra Lineal detrás de Google
Teorema 2 (Frobenius, 1908–192)
Supongamos que M tiene entradas no negativas y además es
irreducible. Entonces
existe un valor propio simple λ > 0 tal que Mt · x = λ · x, con
x > 0;
este valor propio es mayor o igual, en módulo, que todos los
demás valores propios de la matriz;
cualquier otro vector propio positivo de Mt es un múltiplo
escalar de x
Carlos D’Andrea
El Álgebra Lineal detrás de Google
Matrices irreducibles
Carlos D’Andrea
El Álgebra Lineal detrás de Google
Matrices irreducibles = grafos “fuertemente”
conexos
Carlos D’Andrea
El Álgebra Lineal detrás de Google
¿Es el grafo de internet fuertemente conexo?
“Perturbamos” la matriz M
c M + (1 − c)U 7→ M
donde
c es un parámetro entre 0 y 1 (cgoogle ≈ 0, 85)
1 1 1
N N ... N
U = ... ... .. ..
. .
1 1 1
N N ... N
Carlos D’Andrea
El Álgebra Lineal detrás de Google
Del existencialismo al Cálculo
No se necesitan
Polinomios característicos
Cálculos de raíces
Descomposición en subespacios invariantes
¡Álgebra Lineal Numérica!
Carlos D’Andrea
El Álgebra Lineal detrás de Google
Método de las potencias (usado por Google)
Carlos D’Andrea
El Álgebra Lineal detrás de Google
La misma idea para otros problemas
Carlos D’Andrea
El Álgebra Lineal detrás de Google
Googleπlogo
Carlos D’Andrea
El Álgebra Lineal detrás de Google
¿Qué hemos aprendido hoy?
Carlos D’Andrea
El Álgebra Lineal detrás de Google
Para saber más
Carlos D’Andrea
El Álgebra Lineal detrás de Google
Muchas gracias
http://atlas.mat.ub.es/personals/dandrea
Carlos D’Andrea
El Álgebra Lineal detrás de Google