Documentos de Académico
Documentos de Profesional
Documentos de Cultura
profundo
de Google
BERT para
responsables
de marketing
Índice
Maecenas ac turpis blandit, pretium nunc eu
7 Modelos de procesamiento de
lenguajes naturales antes de BERT
— 23
1
¿Cuáles son los
cambios de
algoritmo de Google
antes de BERT?
→ Google Panda (2011): algoritmo que detecta y penaliza las páginas con
contenidos duplicados, mientras que favorece a aquellas con contenidos
originales y con un uso correcto de las palabras clave.
→ Google Penguin (2012): algoritmo que detecta y penaliza las páginas con
backlinks de baja calidad, mientras que favorece a las que vinculan links
hacia páginas externas con contenidos valiosos.
→ Google Pigeon (2014): algoritmo que prioriza en las SERP a los websites
locales cuando la intención de búsqueda de un usuario es sobre una
zona geográfica específica.
→ Google Fred (2017): algoritmo que detecta y penaliza los sitios web que
tienen contenidos de poco valor y diseñados especialmente para gene-
rar dinero por publicidad con métodos distintos a Google AdSense.
Primero, veremos los aspectos más interesantes para los profesionales del
marketing. Luego, veremos los detalles técnicos que más interesan a desa-
rrolladores y especialistas de IT.
— 6 Google BERT para responsables de marketing
¿Cómo funciona y por qué está revolucionando el SEO?
2
¿Qué es BERT
de Google?
3 ¿Cómo afecta el
modelo BERT al SEO
y qué podemos
hacer?
En promedio, existen 200 factores que Google tiene en cuenta para clasifi-
car las páginas web en las SERP, pero no todos ellos están relacionados con
el análisis del contenido textual. Por ejemplo, en 2018, Google anunció que
sus algoritmos comenzarían a evaluar la velocidad de carga de las pági-
nas como factor de clasificación. En estos casos, la herramienta PageSpeed
Insights se convierte en un gran apoyo para saber dónde, cómo y por qué
debemos optimizar nuestro website, con el objetivo de ganar mejores posi-
ciones en los resultados de búsqueda.
Por tanto, crear una página optimizada a nivel SEO para BERT implica que
tengamos en cuenta una serie de aspectos para facilitarle a los algoritmos
el que puedan establecer una rápida relación entre nuestros contenidos y
las intenciones de búsqueda de los usuarios. Esto es porque, en principio,
BERT solo analiza las consultas, no las páginas indexadas.
Aunque, precisamente por ello, mejorar los contenidos en las páginas web es
fundamental para asegurarnos de que estas ganen valor ante Google para
ser asociadas de forma relevante con ciertas intenciones de búsqueda.
4
¿Por qué BERT
es importante
para los resultados
de búsqueda?
En este sentido, BERT es el último avance de Google que más impacta tan-
to a la clasificación de contenidos en las SERP como a la generación de
fragmentos destacados. Así, los resultados de búsqueda se vuelven más
prácticos y eficientes para los usuarios, dando origen incluso a fenómenos
como el zero click.
— 13 Google BERT para responsables de marketing
¿Cómo funciona y por qué está revolucionando el SEO?
Como verás, ante una intención de búsqueda muy específica, Google arroja
un resultado en modo de fragmento que contiene también una respuesta
muy específica. Así, los usuarios no tienen la necesidad de realizar ningún clic
(zero click) para visitar una página web que intente responder a la consulta.
De este modo, términos como: ante, con, desde, durante, entre, hacia, para,
sobre... se vuelven esenciales para darle contexto a las keywords. Con esto,
Google mejora significativamente la comprensión de las búsquedas realiza-
das y el orden de aparición en las SERP de los contenidos indexados.
Sin embargo, esto no significa que debamos empezar a tratar las preposiciones
como palabras clave. ¡Mucho cuidado con ello! El uso inadecuado de cualquier
elemento lingüístico le resta naturalidad a los contenidos, lo cual ya es fácil-
mente reconocible por Google mediante BERT y otros métodos de análisis.
— 15 Google BERT para responsables de marketing
¿Cómo funciona y por qué está revolucionando el SEO?
5
¿Por qué BERT es
un aliado y
no un enemigo
de los profesionales
del marketing?
Las actualizaciones en los algoritmos de Google suelen traer como conse-
cuencia que muchos websites pierden sus posiciones en los resultados de
búsqueda. Sin embargo, de manera lógica, así como hay sites que bajan, hay
otros que suben. BERT no es la excepción, esta actualización ha causado y
seguirá causando importantes cambios de posicionamiento en las SERP.
Ejemplos de resultados de
Google con el algoritmo BERT
Antes de BERT, la preposición “to” en la frase “2019 brazil traveler to usa need
a visa” era ignorada por el algoritmo, con lo cual el resultado de búsqueda se
relacionaba con que los ciudadanos estadounidenses pueden viajar a Brasil
sin una visa. Después de BERT, el algoritmo le otorga valor a la preposición
“to” y gracias a esta es capaz de entender el sentido de la oración, con lo
cual ahora el resultado de búsqueda se relaciona con viajeros brasileños que
quieren viajar a EE.UU., y desean obtener información sobre la visa.
Como vemos, los cambios en los resultados de búsqueda son bastante sig-
nificativos. Sin embargo, aún le queda a Google un largo camino por recorrer.
6
¿Cómo funciona el
natural language
processing (NLP) en
BERT?
Sin embargo, aunque BERT hace referencia a una actualización en los algorit-
mos de Google, lo cierto es que este sistema es algo completamente aparte
de dichos algoritmos.
Tal como explica Dawn Anderson en su extenso trabajo sobre el Natural Lan-
guage Understanding (NLU) en BERT y otros modelos, el Bidirectional Enco-
der Representations from Transformers es el primer sistema de aprendizaje
no supervisado y profundamente bidireccional para el preentrenamiento de
modelos de NLP.
Este sistema puede ser utilizado para múltiples tareas de natural language
processing, por ejemplo:
7
Modelos de
procesamiento de
lenguajes naturales
antes de BERT
Funcionamiento de Word2vec
Fuente: Towards Data Science
— 24 Google BERT para responsables de marketing
¿Cómo funciona y por qué está revolucionando el SEO?
Luego, para resolver el problema de la polisemia dentro del campo del NLP,
se desarrolló el modelo del lenguaje ELMo. En este modelo el vector de cada
palabra se genera según su contexto dentro de cada frase específica. Por
tanto, la representación de las palabras ya comienza a contextualizarse de
manera efectiva.
ULMFiT, por su parte, es un framework mucho más avanzado que puede en-
trenar modelos de lenguaje con muchos menos datos que los acostumbra-
dos y aun así brindar excelentes resultados en múltiples tareas de clasifica-
ción de contenidos.
Por otro lado, se encuentra RoBERTa, un modelo creado por el equipo de Fa-
cebook Artificial Intelligence, basado en BERT pero desarrollado sobre el siste-
ma PyTorch. Según el RoBERTa paper, este modelo supera a BERT en las tareas
MNLI, QNLI, RTE, STS-B y RACE.
Sin embargo, aunque existan nuevos modelos más potentes y eficientes como
Lite BERT (ALBERT) y RoBERTa, debemos tener en cuenta que BERT sigue siendo
el sistema implementado sobre los algoritmos de Google Search. Por tanto, en
cuanto a clasificación de contenidos en las SERP se trata, no podemos hablar
de “sucesores de BERT”, ya que los nuevos avances open source se centran
en otras áreas de aplicación.
— 26 Google BERT para responsables de marketing
¿Cómo funciona y por qué está revolucionando el SEO?
Según el BERT paper, este sistema ha sido preentrenado utilizando 2.500 mi-
llones de palabras de Wikipedia (en inglés) más un dataset de libros de 800
millones de palabras, dicho dataset fue “Aligning Books and Movies: Towards
story-like visual explanations by watching movies and reading books”.
Gracias a ello, este modelo preentrenado se puede ajustar con una única
capa de salida adicional para crear nuevos modelos capaces de procesar
múltiples tareas de Natural Language Processing.
8
¿La actualización
BERT del algoritmo
funciona en
español?
Por ello, te obsequiamos con los siguientes recursos que te serán bastante úti-
les para mejorar tus técnicas de posicionamiento. Elige el que mejor se adap-
te a tus necesidades:
→ Los secretos del SEO para ocupar las primeras posiciones en los buscadores.
SO L I C I TA U N A L L A M A DA