Documentos de Académico
Documentos de Profesional
Documentos de Cultura
automática de contenidos en el
posicionamiento SEO
Proposal of the methodology oriented to the
automatic generation of content in SEO positioning
Jorge Lira Camargo María Elena Campos Miranda
Facultad de Ingeniería de Sistemas, Facultad de Ingeniería de Sistemas,
Universidad Nacional Federico Villareal Universidad Nacional Federico Villareal
Lima, Perú Lima, Perú
jlira@unfv.edu.pe mcamposm@unfv.edu.pe
Resumen — Este documento electrónico se detallará las formas This research collects good practices and proposes a model
necesarias para poder hacer un prototipo capaz de posicionar las oriented towards natural language processing (NLP) through deep
páginas web de las empresas (posicionamiento SEO), a través de learning, incorporating a methodology to implement it in all types
la aplicación de Procesamiento de Lenguaje Natural y Aprendizaje of organization and improve the objectives and strategies of the
Profundo. Esta investigación recoge buenas prácticas y propone marketing process, as well as generate results. that benefit these
un modelo orientado hacia el procesamiento del lenguaje natural companies in terms of attracting new customers. For the
(PLN) mediante aprendizaje profundo, incorporando una development of the new model, some tools such as sitemap, Google
metodología para implementarlo en todo tipo de organización y Cloud tools, among others, are incorporated. This methodology
mejorar los objetivos y estrategias del proceso de mercadeo, así begins with the identification of information left by users when
como también, generar resultados que beneficien a dichas generating an internet search and leads to the generation of
empresas en cuanto a la captación de nuevos clientes. Para el automatic and precise content, generating a type of deep learning
desarrollo del nuevo modelo se incorporan algunas herramientas so that better results are issued more accurately.
tales como sitemap, herramientas de Google Cloud, entre otros.
Dicha metodología inicia con la identificación de información que Keywords - Procesamiento de Lenguaje Natural (PNL); SEO; Deep
dejan los usuarios al momento de generar una búsqueda en learning; Neural Network, Methodology.
internet y desemboca en la generación de contenidos automáticos
y precisos, generándose un tipo de aprendizaje profundo para que I. INTRODUCCIÓN
cada vez se emitan mejores resultados de manera más exacta.
Desde el inicio de las computadoras se ha tenido el deseo que
Palabras Clave – Procesamiento de Lenguaje Natural (PLN); SEO;
estas puedan comprender el lenguaje humano, lograr ese
Aprendizaje profundo; Red Neuronal, Metodología
objetivo es un desafío muy grande, ya que varias palabras son
Abstract — This electronic document will detail the necessary similares pero tiene diferente significado incluso en un solo
forms to be able to make a prototype capable of positioning the idioma donde hay variaciones; así se le alimente a la
web pages of companies (SEO positioning), through the computadora con un diccionario digital sería un gran desafío
application of Natural Language Processing and Deep Learning. para ella, esto conduce a buscar una solución que combine la
Authorized licensed use limited to: Shirley Soto Maldonado. Downloaded on July 22,2022 at 02:59:40 UTC from IEEE Xplore. Restrictions apply.
lingüística con la informática que vendría a ser: el datos, así como también el lenguaje natural que utilizan las
procesamiento del lenguaje natural (PLN); este aprendizaje personas al hacer una búsqueda por internet. Para ello es factible
automático crea algoritmos que permite a las computadoras utilizar una metodología paso a paso que encamine a las
realizar distintas funciones en vez de ser programadas por una organizaciones hacia el posicionamiento web, dejando de ser
persona. Hoy en día hay muchas aplicaciones que son conocidas simples palabras para convertirse en conceptos, volviéndose los
que tienen este tipo de aprendizaje automático, como Alexa de buscadores en máquinas de aprendizaje, por eso es necesario
Amazon, búsqueda de Google, corrector ortográfico de conocer y aplicar técnicas de posicionamiento SEO semántico.
Microsoft, etc.
La problemática expuesta advierte que, se debe optar por una
Las empresas en la actualidad se destacan porque no estrategia o ambas para que un sitio web empiece a recibir
necesariamente necesitan de una tienda física para poder visitas, un posicionamiento web deficiente incrementa la
competir en el mercado, estás solo necesitan de un entorno web posibilidad de fracaso de un sitio web.
agradable y accesible para sus posibles clientes. Pero al haber III. DESCRIPCIÓN DEL PROBLEMA
un sin número de páginas web surge la duda si las páginas de
estas empresas serán visibles cuando un cliente busque en la Las empresas de hoy en día que deseen darse a conocer en
web algo relacionado a su industria. Por lo que, las un ámbito global piensan en la creación de su sitio web, pero no
organizaciones deberán implementar estrategias que les toman en cuenta que los usuarios o futuros clientes potenciales
permitan competir en el entorno web. La metodología propuesta al no conocer el nombre de la empresa o su dirección web,
presenta una solución a dicho problema, ya que integra utilizarán los motores de búsqueda haciendo referencia a
herramientas tecnológicas como uso de Procesamiento de palabras clave, para que, en base a éstas, los buscadores
Lenguaje Natural (PLN) y/o Aprendizaje profundo, las cuales, presenten los SERP’s o las páginas resultantes de la búsqueda.
deberán ser tomada en cuenta por aquellas empresas que Si el sitio Web no cuenta con posicionamiento u optimización
quieren que sus páginas web se posicionen entre los primeros de motores de búsqueda, éste no va a ser visto en los primeros
resultados de la búsqueda. resultados de los SERP’s, tomando en cuenta que generalmente
los usuarios visitan los 5 primeros resultados, ocasionando que
Bajo este contexto, esta breve presentación tiene como objetivo el sitio web no obtengan la cantidad de visitas esperadas.
poder explicar acerca del PLN y definiciones relacionadas,
Existen muchas páginas web que no toman en cuenta los
cómo será empleado en nuestro proyecto de investigación, qué
contenidos que publican, siendo de baja calidad, es decir puede
beneficios traerá implementarlo a las PYMES y una conclusión
haber contenido pobre, duplicado o no actualizado, así como
del equipo. también los tiempos de carga, el peso de dichas páginas, el
tiempo de los usuarios que navegan en el sitio web, el abuso de
II. PLANTEAMIENTO DEL PROBLEMA
palabras clave meta, todo esto repercute en la calidad del sitio y
por ende en su posicionamiento en los motores de búsqueda.
Hoy en día las empresas de Latinoamérica sufren una
desventaja competitiva al no tener un conocimiento amplio También existe el problema que muchos sitios generan
sobre la utilización de herramientas tecnológicas en pleno siglo mucho spam y uso de técnicas no apropiadas para engañar a los
21. “La historia del posicionamiento en buscadores va buscadores, técnicas conocidas como Black Hat, Además
íntimamente ligado al crecimiento de internet, en este contexto existen sitios web que comparten piratería descargable,
es que emerge una industria y sector de empresas dedicadas al provocando que los buscadores los penalicen enviándolos a las
posicionamiento en buscadores que se encargan de estudiar, últimas posiciones de los SERP’s y afectando su tráfico hacia
planificar y aplicar estrategias alrededor de cuestiones que ellos. Los buscadores hoy en día están mejorando su precisión
afectan al posicionamiento en los buscadores. Dentro de estas de búsqueda para generar resultados más relevantes,
metodologías resalta SEO (Search Engine Optimization), que enfocándose en búsquedas semánticas ocasionando que
basado en una serie de técnicas tiene por objetivo lograr el continuamente se deban de mejorar las técnicas de
posicionamiento de un sitio en los buscadores”. Declara Maribel posicionamiento web.
Carmen Urquiza Abril, (2016) en su obra “Propuesta para
incrementar la visibilidad de un sitio web aplicando técnicas de
posicionamiento que permitan mejorar el ranking en los IV. FORMULACIÓN DEL PROBLEMA
resultados de búsqueda de Google.”
Las actividades en el posicionamiento en buscadores se
Por lo cual, es importante que los sitios web tomen en cuenta desarrollan de forma manual, sin control ni organización, esto
que los buscadores como Google cada vez cambian sus significa que el trabajo no se realiza eficientemente, dificultando
algoritmos de búsqueda, interpretando la información de una y en algunos casos impidiendo el cumplimiento de los objetivos
manera más natural, y mostrando información cada vez más de posicionamiento (como el aumento de visitas en un sitio
pertinente y precisa a las búsquedas de los usuarios, realizando web). Dado este problema es necesario establecer una
búsquedas semánticas, es decir ya no es suficiente identificar metodología de trabajo para gestionar estas actividades, y con la
palabras clave y relacionarlas a la búsqueda, sino que los ayuda de herramientas informáticas, automatizar estos procesos.
buscadores deben entender de qué manera están relacionados los
Authorized licensed use limited to: Shirley Soto Maldonado. Downloaded on July 22,2022 at 02:59:40 UTC from IEEE Xplore. Restrictions apply.
De esta manera se estaría brindándole un beneficio a las [3] De acuerdo con el estudio “Readaptarse para crecer: el
empresas, al utilizar de esta metodología. impacto en las pymes peruanas a un año de la pandemia”,
elaborado por Microsoft, el trabajo remoto se constituyó en el
principal cambio para las pymes (48%). Consideran que la
principal ventaja de esta modalidad fue la adquisición de nuevas
habilidades y que les permitió una mejor colaboración con sus
A. Problema General
compañeros y clientes. En contraste, opinan que la principal
¿Cómo las pymes podrían posicionarse como primeros lugares desventaja fue el incremento de reuniones dentro del horario
en los buscadores de Internet utilizando una metodología que laboral, de acuerdo con informe publicado en el Diario “El
esté orientada a la generación automática de contenidos en el Peruano”.
posicionamiento SEO?
[4] El estudio “Readaptarse para crecer: el impacto en las pymes
B. Problema Específico
peruanas a un año de la pandemia”, muestra como la aplicación
(1) ¿Qué requisitos son imprescindibles para llevar a cabo está de tecnología en estos negocios mejoró sus operaciones. La
metodología orientada a la generación automática de contenidos mayoría de los emprendimientos indicó que pudieron
en el posicionamiento SEO en un tema de necesidad de reactivarse capacitándose en nuevas habilidades,
marketing para las pymes? (2) ¿Cuáles son las consideraciones automatizando procesos, aplicando marketing digital e incluso
de posicionamiento web que se deberían tomar en cuenta para trabajo remoto. Para un 48% de pymes el cambio aplicado más
incrementar la visibilidad de un sitio web? (3) ¿En qué se basan grande fue el trabajo remoto.
los motores de búsqueda para presentar los primeros enlaces en
las páginas de resultados? [5] el artículo, se presenta una herramienta que facilita la
asignación semi automática de palabras claves a documentos
V. ESTADO DEL ARTE web. Para ello se describen de forma sintética las características
y prestaciones de la herramienta a desarrollar, además de
En [1] el articulo revisa metódicamente la literatura sobre el analizar las bases de datos que la justifican. Por último, esta
aprendizaje profundo para el procesamiento del lenguaje investigación planteada explorar las posibilidades de la
natural (PLN) en el ámbito clínico, proporcionando un análisis automatización en la asignación de palabras claves,
cuantitativo para un mayor alcance. También se refiere que las acompañados con procedimientos sencillos basados en la
publicaciones clínicas de PLN aumentaron más del doble cada recuperación de información, posicionamiento en buscadores y
año gracias al uso de Aprendizaje profundo (AP), hasta 2018. las ciencias de la comunicación.
La mayoría de las contribuciones eran variantes metodológicas
o aplicaciones, pero el 20.8% eran métodos nuevos de algún [6] el documento, se ha analizado cómo mejorar la metodología
tipo. Este análisis muestra la creciente aceptación del para el modelo de recuperación de información y generación
aprendizaje profundo como línea de base para la investigación automática de contenidos, comenzando mediante el rastreo
en PLN y de la PLN basada en AP en la comunidad médica. Se web, e indexación de la información, luego la generación del
puede decir que se llegaron a corroborar varias asociaciones procesamiento de información utilizando el lenguaje natural y
comunes, mientras que otras fueron sorprendentemente desembocará en la muestra de resultados relevantes para los
matizadas. En conclusión, el aprendizaje profundo aún no ha usuarios, con la finalidad de que se aplique un aprendizaje
sido utilizado del todo en la PLN clínica y está creciendo profundo sobre dichos resultados, y aprender de ellos separando
rápidamente. frase o palabras clave. Aporta un aprendizaje principal en el
diseño e implementación de un modelo que permita el
En [2] Permite la conversión de texto libre en datos procesamiento de información y generación de resultado
estructurados. Las innovaciones recientes en la tecnología de
relevante mediante posicionamiento SEO, con el objetivo de
aprendizaje profundo proporcionan un mejor rendimiento de la
profundizar en las características más relevantes del
PLN. Nuestro objetivo era estudiar los fundamentos de la PLN
procesamiento del lenguaje natural.
de aprendizaje profundo y revisar la investigación relacionada
con la radiología. Las aplicaciones de PLN de aprendizaje
[7] El trabajo tiene por objetivo proponer un modelo SEO para
profundo en radiología incluyen el marcado de diagnósticos
de tal manera aplicarlo como solución en el posicionamiento de
como embolias pulmonares y fracturas, el etiquetado de
buscadores. SEO constituye un conjunto de técnicas y métodos
recomendaciones de seguimiento y la selección automática de
de optimización de un sitio web con la finalidad de que pueda
protocolos de imágenes. Los modelos de PLN de aprendizaje
ser más accesible para los buscadores, mejorando su posición
profundo funcionan igual o mejor que los modelos tradicionales
en los resultados de los busca- dores para un determinado tipo
de PLN. La investigación de la PLN en la radiología intenta
de consulta, atrayendo más visitas (personas) y con eso tener
familiarizarse con esta tecnología la cual puede ayudar cambios
más posibilidades de vender el producto o servicio que se oferta
próximos de su campo.
en dicho sitio web. Pues en la actualidad internet es un medio
de comunicación global que ofrece muchas ventajas, siendo los
buscadores las herramientas que deben ser aprovechadas al
Authorized licensed use limited to: Shirley Soto Maldonado. Downloaded on July 22,2022 at 02:59:40 UTC from IEEE Xplore. Restrictions apply.
máximo por las empresas y negocios para lograr mayor A. Objetivo General
presencia en internet. y para poder lograr esto se debe establecer
Posicionar a la página web de la empresa (SESU) entre
un modelo SEO que organice estructuradamente todas las
los primeros resultados de los motores de búsqueda tras la
acciones, tareas y actividades necesarias para hacer competitivo
aplicación del PLN y la implementación piloto de una
un sitio web, luego aplicar la teoría planteada por el modelo y
metodología paso a paso.
para finalmente evaluar los resultados obtenidos.
B. Objetivos Específicos
[8] De acuerdo con el trabajo, éste tiene como finalidad poder
(1) Aportar una nueva metodología que utiliza tecnologías
ayudar a las micro, pequeñas y medianas empresas en
emergentes como el PLN para mejorar el mercadeo de la
posicionar sus páginas web mediante una propuesta
PYMES; (2) Definir mejores estrategias de marketing y
metodológica tras el fuerte impacto de la transformación digital.
satisfacer las necesidades de los clientes para obtener
Además, se invita a que este tipo de organizaciones puedan
ventajas competitivas que posicione a la empresa entre los
hacer un cambio en su arquitectura de negocios para adaptarse
primeros puestos de su rubro. (3) Aumentar el tráfico de
a los procesos tecnológicos mediante la incorporación de
búsqueda o número de visitas de la página web en un 20%.
tecnologías emergentes.
(4) Utilizar herramientas informáticas para desarrollar las
actividades SEO de un proceso de posicionamiento en
[9] De acuerdo con el trabajo, hoy en día se usan los buscadores
buscadores.
de Internet para absolutamente todo. No solamente para
productos y servicios online, sino para la localización de estos VIII. METODOLOGÍA
de forma local. Las búsquedas por voz están y seguirán
revolucionando la forma en la que buscas por Internet. Y esto,
Se toma de referencia para la implementación de la
por ahora, está teniendo grandes beneficios en la SEO local.
metodología, el modelo planteado en el artículo [8]
Esta forma de posicionamiento se centra en las empresas
“Implementing Step-by-Step of a methodology to position ther
locales, aquellas que quieren atraer a un público en concreto y
services of theSMEs in the Google Search Platform”. Los
que va a depender de la ubicación. Además, habla de que casi
autores son: Jorge Lira Camargo, Ivan Crispin Sanchez , Zoila Rosa
un 40% de las búsquedas que se realizan son locales y que 4 de Lira Camargo, Giancarlo Sanchéz Atuncar , Luis Lira Camargo and
cada 5 personas/usuarios buscan información local, más Celso Concha del Castillo.
concretamente en los dispositivos móviles.
[10] De acuerdo con el trabajo, con la llegada del internet las A. Metodología paso a paso
personas han cambiado la manera de comunicarse, las formas
de hacer negocios y de operar las empresas, pues la Con la finalidad de poder cumplir con los objetivos planteados
globalización exige mantenerse en constante evolución. Así, se procederá a dar un estudio más profundo sobre
con el auge que tiene el comercio electrónico a nivel procesamiento de lenguaje natural para poder analizar y
internacional y del uso de las tecnologías de información y procesar la información semántica dentro de la web, así como
comunicación (TIC), las pymes las intentan adoptar con el fin también técnicas que permitan recolectar información relevante
de aprovechar las ventajas que éstas les aportan. para el usuario.
B. Modelo
VI. JUSTIFICACIÓN DE LA INVESTIGACIÓN El modelo planteado consta de tres fases principales (rastreo de
El internet es un lugar muy competitivo, todos los sitios web páginas web, Procesamiento de lenguaje natural y
ofrecen información de diversos tipos; buscando personas que Presentación) estás permitirán identificar las necesidades de un
se vuelvan seguidores de un sitio web por la información, los usuario de acuerdo con las consultas realizadas en el buscador,
productos o servicios que ofrece. En tal sentido, a partir de los esto se dará mediante el procesamiento, la selección y por
aportes del estado del arte, se tuvieron los elementos necesarios último la visualización de la información solicitada. Lo cual es
parar implementar el modelo propuesto, orientando a las un modelo computacional.
empresas seleccionadas lograr la visibilidad en el motor de
búsqueda implementando estrategias de posicionamiento web C. Fases para el procesamiento del lenguaje natural
que se mostrará en la metodología y que con el uso de la
herramienta “Sitemap”, logar un entorno competitivo. Por El modelo para la implementación del procesamiento del
último, a través de la implementación de la metodología, lograr lenguaje natural comprende las siguientes fases: (1) Rastreo de
el posicionamiento de la empresa SESU y poder obtener una páginas web; (2) Análisis de información de las páginas web;
ventaja competitiva ante las demás empresas y ser sobresaliente (3) Almacenamiento de información relevante; (4)
en el mercado laboral. Procesamiento del lenguaje natural; (5) Generación de
contenidos a través de Aprendizaje Profundo; (6) Visualización
VII. OBJETIVOS DE LA INVESTIGACIÓN
Authorized licensed use limited to: Shirley Soto Maldonado. Downloaded on July 22,2022 at 02:59:40 UTC from IEEE Xplore. Restrictions apply.
de la información. Fig. 1 muestra la relación entre todas las contenido según el contexto mediante la utilización de una
fases. ontología general y otra específica de acuerdo con la categoría
de la página web. Como herramienta para realizar el
procesamiento de información se emplea Google Analytics que
utiliza diferentes técnicas y algoritmos para extraer el
conocimiento implícito de las páginas web. Ver Fig.3.
Authorized licensed use limited to: Shirley Soto Maldonado. Downloaded on July 22,2022 at 02:59:40 UTC from IEEE Xplore. Restrictions apply.
Fig. 7 Visualización de Información
Fig. 5 Procesamiento del Lenguaje Natural
Authorized licensed use limited to: Shirley Soto Maldonado. Downloaded on July 22,2022 at 02:59:40 UTC from IEEE Xplore. Restrictions apply.
REFERENCIAS BIBLIOGRÁFICAS [6 ]Hubert Vitres Sala, Paúl Rodríguez Leyva, Juan Pedro Febles, Vivian
Estrada Sentí, “Procesamiento semántico de información en Sistemas de
Recuperación de Información”, pp. 0-1, 2018, doi: ISSN 2227-1899
[1] Stephen Wu, School of Biomedical Informatics, "Aprendizaje profundo en (versión electrónica, Revista).
el Procesamiento de Lenguaje Natural clínico: Una revisión metódica", [7] Carlos Luis García Soria, Roberto Francisco Calmet Agnelli,
Diciembre, pp.1-27, 2019,doi:10.1093/jamia/ocz200. “Posicionamiento en buscadores aplicando un modelo SEO”, pp. 1-37,
[2] Stephen Wu, Kirk Roberts, Surabhi Datta, Jingcheng Du, Zongcheng Ji, 2011, doi: ISSN 1816-3823 (versión electrónica, Revista).
Yuqi Si, Sarvesh Soni, Qiong Wang, Qiang Wei, Yang Xiang, Bo Zhao y [8] Jorge Lira Camargo, “STEP-BY-STEP IMPLEMENTATION TO
Hua Xu "Aprendizaje profundo para el procesamiento del lenguaje natural POSITION SMALL BUSINESS SERVICES ON GOOGLE SEARCH
en radiología: fundamentos y una revisión sistemática", Published: 03 ENGINE”, pp. 1-11, 2022.
December 2019.
[9] Cintia Cano Pareja, "¿Por qué debes implementar el seo local en pymes?
[3] Víctor Lozano, “Pymes y tecnología: binomio para acelerar la recuperación ¿Cuáles son los beneficios?", Hypertext.net, 16-05-2018, Revista Digital
económica”, Marzo, pp. 0-1, 2021, doi: Revista “Andina: Agencia Peruana Inesem
de Noticias”.
[10] Juan Manuel Vega Arellano, Salvador Abraham Romero Rubio, Gregorio
[4] Redacción RPP, “SNI: Decisión del Gobierno de no aplicar salvaguarda a Guzmán Lares, “MARKETING DIGITAL Y LAS FINANZAS DE LAS
importaciones afecta a cerca de 100,000 mypes” Publicado 24 de febrero PYMES”, RITI Journal, Vol. 6, 12 (Julio-Diciembre 2018), “Facultad de
del 2021, pp. 0-1, (fuente: Andina). Contaduría y Administración Culiacán, Universidad Autónoma de Sinaloa,
[5] Mari Vallez (Universitat Oberta de Catalunya, Universitat Pompeu Fabra) , México”
Cristòfol Rovira (Universitat Pompeu Fabra) , Lluís Codina (Universitat
Pompeu Fabra) y Rafael Pedraza (Universitat Pompeu Fabra),
“Procedimientos para la extracción de palabras clave de páginas web
basados en criterios de posicionamiento en buscadores”, Hypertext.net,
2010, n. 8.
Authorized licensed use limited to: Shirley Soto Maldonado. Downloaded on July 22,2022 at 02:59:40 UTC from IEEE Xplore. Restrictions apply.