1 en Es PDF

Revista de la Universidad King Saud - Informática y Ciencias de xxx (2018) xxx-xxx
listas de contenidos ofrecidos en ScienceDirect
Revista de la Universidad King Saud - Informática

y Ciencias de la Información
Página principal de la revista: www. sciencedi rect .com
Un enfoque inteligente para el diseño de comercio electrónico metasearch y utilizando el sistema de
clasificación analítica de grandes datos de próxima generación
dheeraj Malhotra ⇑ , OP Rishi

Departamento de Ciencias de la Computación e Informática, Universidad de Kota, Kota, Rajasthan 324 005, India
información del artículo resumen
Historia del artículo: El propósito de esta investigación es explorar diversas limitaciones de los sistemas de búsqueda y clasificación de la página convencionales en un entorno de
Recibido el 18 de de octubre de 2017 comercio electrónico. El objetivo principal es ayudar a los clientes a tomar una decisión de compra en línea, proporcionando página de orden de clasificación
Revisado 22 de de febrero de 2018 Aceptado
personalizada de los enlaces de la web de comercio electrónico en respuesta a la pregunta E-Commerce mediante el análisis de las preferencias de los clientes y el
el 28 de de febrero de 2018 Disponible en
comportamiento de navegación. Este trabajo de investigación primero emplea una revisión de la literatura sabia ordenada y categoría. Los hallazgos revelan que
línea xxxx
los sistemas convencionales de búsqueda no han evolucionado para apoyar el análisis de grandes datos como lo requiere la moderna entorno de comercio
electrónico. Este trabajo tiene como objetivo desarrollar y poner en práctica la segunda generación HDFS- MapReduce página innovador algoritmo de clasificación
palabras clave:
basado, es decir Relevancia vectorial (RV) algoritmo. Esta investigación equipa al cliente con una herramienta de metabúsqueda robusta, es decir, IMSS-AE a
E-Commerce ranking de páginas web herramienta de
entender fácilmente los requisitos de búsqueda personalizados y preferencias de compra de los clientes. El enfoque propuesto también puede satisfacer todos los
IMSS-AE
parámetros críticos tales como escalabilidad, soporte de fallo parcial, extensibilidad como se espera de los sistemas de procesamiento de datos grandes de
página RV algoritmo de clasificación de segunda generación
análisis de datos grandes Hadoop MapReduce-graduación de próxima generación. Una extensa y exhaustiva evaluación experimental muestra la e fi ciencia y la efectividad de la propuesta de la página RV algoritmo de
la página personalizada clasificación y una herramienta de IMSS-AE por encima de otros motores de búsqueda populares.
2018 los autores. Producción y hospedaje por Elsevier en nombre de la Universidad Rey Saud. Este es un artículo de acceso abierto bajo la
licencia CC BY-NC-ND licencia ( http://creativecommons.org/licenses/by-nc-nd/4.0/ ).
1. Introducción depende principalmente de los motores de búsqueda convencionales como Google, Bing para hallar un
sitio web de comercio electrónico adecuado. Sin embargo, cuando diferentes usuarios buscar en la
En esta era moderna de grandes volúmenes de datos, la actividad comercial se modi fi có misma consulta de comercio electrónico, incluso un motor de búsqueda más avanzada y popular
mucho debido a un enorme crecimiento en los sitios web de compras en línea, también conocidos recupera el mismo resultado como se comenta por Gómez-Nieto et al. (2014) . Por lo tanto,
como e-tailers. Los nuevos clientes de edad prefieren realizar sus compras a través de estos portales independientemente de los antecedentes y gustos del cliente personalizado de la presentación de la
en línea debido a diversas atracciones en países como India, como la disponibilidad fácil y barato de consulta como la mayoría de los modernos motores de búsqueda tienden a devolver los resultados
Internet. La razón principal es la intensa competencia entre las telecomunicaciones, por ejemplo, La mediante la interpretación de la consulta de comercio electrónico de varias maneras posibles. Por otra
dependencia Jio membresía Prime ofrece el uso gratuito de datos de Internet libre durante tres parte, si la consulta es ambigua o incompleta, entonces la situación será aún peor, ya discutida por Malhotra
meses para todos sus usuarios en los cargos nominales. Algunas de las otras razones incluyen y Verma (2013) . Por ejemplo, para la consulta de búsqueda de comercio electrónico incompleta ''Galaxia ”,
devolución de dinero lucrativo y vuelve fácil y sin deducir los gastos de envío de portales como Paytm, Automático
algunos clientes pueden estar interesados en enlaces para comprar un nuevo Samsung galaxia teléfono
en funciones regulares de tipo de entrega de los sitios de comercio electrónico como Flipkart, móvil de la serie, mientras que otro cliente puede estar interesado en la búsqueda de enlaces para la
Amazon, y otros minoristas electrónicos. Por otra parte, la búsqueda de un sitio web de comercio reserva en línea de boletos para una película Guardianes de la Galaxy Vol. 2. Por lo tanto, existe una
electrónico adecuado para satisfacer mejor las necesidades de compra del cliente no es tan fácil ya necesidad urgente de sistema de búsqueda personalizada de comercio electrónico. El personalizado
que los clientes son systemmay modificar la consulta de búsqueda del comercio electrónico mediante el seguimiento de las
preferencias del cliente mediante el mantenimiento de su / su per fi l, preferencias de búsqueda a través
de historial de navegación, etc. durante un período y los resultados en el orden correcto de la
clasificación con enlaces de salida relevantes del cliente en la parte superior para volver satisfacer mejor
las necesidades del cliente (Ver Fig. 1).
⇑ Autor correspondiente.
Dirección de correo electrónico: dheerajmalhotra4@gmail.com (D. Malhotra). La revisión por
pares bajo la responsabilidad de la Universidad Rey Saud.
los datos de comercio electrónico está aumentando de forma explosiva en la escala de terabytes
Producción y hospedaje por Elsevier (TB) a petabytes (PB) sobre una base diaria debido a la continua
https://doi.org/10.1016/j.jksuci.2018.02.015
1319-1578 / 2018 los autores. Producción y hospedaje por Elsevier en nombre de la Universidad Rey Saud. Este es un artículo de acceso abierto bajo la licencia
CC BY-NC-ND licencia ( http://creativecommons.org/licenses/by-nc-nd/4.0/ ).
Por favor citar este artículo en prensa como: Malhotra, D., Rishi, OP Un enfoque inteligente para el diseño de comercio electrónico metasearch y sistema de clasificación utilizando análisis de datos grandes de próxima
generación. Revista de la Universidad King Saud - Informática y Ciencias de la Información (2018), https://doi.org/10.1016/j.jksuci.2018.02.015
2 D. Malhotra, OP Rishi / Revista de la Universidad King Saud - Informática y Ciencias de xxx (2018) xxx-xxx
Figura 1. Prioridad de sitios web Determinación de Verma et al., (2015).
aumento de la WWW trá fi co. Por ejemplo, para comprar un artículo en la web, un cliente puede puede ser utilizado para el despliegue e fi ciente de grandes volúmenes de datos avanzado sistema web de comercio
explorar muchos sitios web para tener transacciones de comercio electrónico satisfactoria que no electrónico basados en la clasificación.
sólo proporciona el producto de marca de alta calidad, sino también en el mejor precio posible con El objetivo general de este trabajo de investigación es ayudar al cliente a facilitar la búsqueda y
descuento o máximo efectivo billetera. Por lo tanto, como resultado, muchos de los portales de clasificación correctamente sitios web de comercio electrónico para comprar productos auténticos a
compras en línea conseguir grandes volúmenes de datos en base diaria como Amazonas o precios realmente, así como para ayudar a los minoristas electrónicos en la optimización de la
estructura de sus sitios web para tomar ventaja sobre sus competidores.
Paytm centro comercial portal de comercio electrónico basado en Android, que maneja alrededor de
un millón de registros de transacciones del cliente de forma regular, lo que resulta en muchos TB de
datos generados sobre una base diaria. Estos datos excesiva en línea generada se conoce
2. Revisión de la literatura
comúnmente como " Big Data'
con énfasis en los valores altos de varios populares de V, es decir, del valor, de velocidad, de la
Avanzar en la búsqueda adaptativa E-Commerce es una búsqueda personalizada para su
variedad, veracidad y Volumen. grandes volúmenes de datos pueden definirse como una colección de
recuperación y clasificación de los sitios web de comercio electrónico pertinentes mediante el uso de
un gran número de conjuntos de datos, la velocidad de los datos entrantes antes de la transformación,
tecnologías de avanzada como la web semántica, redes neuronales. El mecanismo de búsqueda
los datos de salida después del procesamiento y la gama de fuentes de datos están más allá de las
personalizada requiere análisis de grandes volúmenes de datos para recuperar las reglas de asociación
capacidades de los sistemas de bases de datos relacionales convencionales para el procesamiento y
útiles a partir de los datos en texto, imágenes o vídeos de formato como disponibles en las redes sociales
manejo. Verma y Singh (2017a, b) propuesto que ' Big Data' constar de muchos patrones útiles en forma
y el historial de compras de varios clientes para recuperar especí fi co cliente web de comercio electrónico
de reglas de asociación, que nunca se extraen y, por tanto avanzados análisis de datos grandes se
clasificación de patrones e fi ciente. Hay diferentes tipos de sistemas de búsqueda personalizada
requiere para explorar estos patrones ocultos. Estos patrones son útiles para los sitios web de comercio
tradicionales como se discute en la literatura.
electrónico. E-Tailer puede utilizar estos patrones para el análisis de la cesta de mercado y por lo tanto
aumentar las ventas mediante la extracción de patrones de compra favoritos de los clientes, e fi ciente y
gestión de inventario fácil de evitar situaciones como exceso o fuera de stock mediante la identificación
de las tendencias de compra significativos para un producto especí fi ca de varias fuentes tales como el 2.1. Revisión de los métodos de búsqueda basados hipervínculo adaptativo
análisis de tendencias en medios sociales. Un vendedor de la mercancía en línea se puede utilizar una
gran herramienta de análisis de datos para analizar los múltiples mensajes en las redes sociales como Instagram, En general, las aplicaciones de comercio electrónico emplean la personalización hipervínculo
Facebook. Las imágenes de las celebridades populares que son los más compartidos / gustado más para ayudar al cliente mediante la recomendación de sitios web de comercio electrónico que son más
recientemente para determinar la última moda de material de vestir y por lo tanto pueden pedir más de relevantes según lo determinado por la retroalimentación obtenida a través de su / su historial de
stock para vestidos similares para satisfacer rápidamente la creciente demanda del mercado. compras y calificaciones explícitas o implícitas. Se supone que los consumidores que dieron
puntuaciones similares a los productos relacionados tienen preferencias similares y, en consecuencia
algoritmo de recomendar varios enlaces a sitios web a los usuarios que son más populares en la
categoría similar según lo determinado por los clientes anteriores. portales de comercio electrónico /
sitios web como PaytmMall, Myntra utiliza la personalización hipervínculo para ayudar a sus clientes
análisis de la cesta usando análisis de datos grandes para la clasificación de los sitios web de en la búsqueda, la clasificación y la compra de productos apropiados. Aoki et al., (2015) discutió la
comercio electrónico se puede lograr fácilmente mediante el uso de marco, que es robusta y escalable y arquitectura del sistema de índice Web (WIX) para la generación de hipervínculo que se puede
es una plataforma de código abierto para el procesamiento ef fi ciente de grandes volúmenes de datos utilizar para insertar enlaces a páginas web de sustitución de palabras clave como por la elección del
a base de comercio electrónico -RVMap-Reducir. clúster Hadoop se caracteriza por algunas máquinas cliente. Esto, a su vez, reducirá su / su carga de pasar por todos los enlaces de la web producidos en
paralelas que pueden almacenar fácilmente y procesar grandes conjuntos de datos, un número resultados del motor de búsqueda. Sin embargo, si hay varios enlaces de la web se pueden asociar
significativo de clientes puede someter fácilmente a sus procesos de clúster Hadoop distribuido desde con una palabra clave, entonces relevancia cómputo lleva tiempo, que es la principal limitación del
diferentes lugares. Mapa -Reducir es un modelo de programación simplificada que se puede utilizar sistema propuesto. Alam y Sadaf (2015) discutió que ir a buscar la información fi significativo de
para procesar grandes volúmenes de datos en el cluster Hadoop con la ayuda de las funciones WWW es moderadamente difícil. Los modernos motores de búsqueda pueden volver bastante
primarias conocidas como mapa y reduce a procesar grandes volúmenes de datos en (Valor Llave,)
Formato de par. Hadoop y Mapa - Reducir la plataforma de computación basado en la nube
D. Malhotra, OP Rishi / Revista de la Universidad King Saud - Informática y Ciencias de xxx (2018) xxx-xxx 3
un gran número de páginas web en respuesta a la pregunta del usuario, y el resultado se convierte en satisfacer fácilmente las necesidades del usuario. Cacheda et al., (2011) sugerido un método e fi
inmanejable e irrelevante si la consulta es errónea ya que los motores de búsqueda de propósito ciente para fi ltrado de colaboración basada en las diferencias entre los clientes y los productos en
general recuperan documentos consiguientes a todos los posibles significados de una consulta. lugar de en base a sus similitudes. Sugirieron últimas métricas, GPIM y de gestión global para
Discutieron heurística mecanismo de búsqueda para extraer un grupo de las páginas para ayudar al calcular la exactitud de la predicción para personalizar web y predicción sesgada no deseada del
usuario en la localización de su / sus datos sea necesario sin esfuerzo. Se trabajó a cabo signi fi sistema de recomendación. Se llevaron a cabo una comparación detallada entre varios algoritmos de
etiqueta de clúster no puede desde el título de varios documentos que comparten similares mediante fi ltrado de colaboración para diferenciar sus fortalezas y debilidades en diversas condiciones. Guy et
el uso de hipervínculos algoritmo Apriori. Sin embargo, la utilidad del método propuesto utilizando sólo al., (2010) , Sugirió que los sistemas de recomendación puede ser combinado en los motores de
la información del título no está garantizado en los conjuntos de datos heterogéneos. Verma et al., búsqueda de la aplicación de búsqueda personalizada. También discutieron que la experiencia del
(2015) desarrollada algoritmo de ranking de la página SNEC basados en diferentes tecnologías usuario es más importante que el rendimiento de los sistemas de recomendación. Jung et al., (2004) ,
inteligentes, como las redes neuronales arti fi ciales y web semántica. En este trabajo, habíamos Discutido un siervo prototipo desarrollado para una biblioteca universitaria. Este sistema aprende del
discutido herramienta prioridad página web para facilitar la evaluación de E-Commerce consultas de usuario con respecto a la relevancia del documento correspondiente a una consulta de búsqueda.
búsqueda y obtener la clasificación correspondiente de sitios web de comercio electrónico. La Motiva al cliente que introduzca consultas significativas y no ambigua y luego pide calificaciones
herramienta propuesta puede ser utilizado para obtener el sitio web de comercio electrónico explícitas de los resultados de búsqueda para medir el nivel hasta el cual podría satisfacer los
clasificación correcta sobre sus sitios web de la competencia e fi temente. Sin embargo, como se requisitos del sistema del usuario. Sin embargo, el éxito del sistema propuesto depende del hecho de
discute en el trabajo futuro de este trabajo, vamos a incorporar diversas capacidades en nuestra que la facilidad con que puede obligar al usuario que proporcione las votaciones. Por lo tanto, se
herramienta de IMSS-AE propuesto actualmente como página de velocidad de carga, búsqueda requiere una amplia investigación para la utilización de los sistemas de recomendación como un
basada en la imagen, la comparación de seguridad para clasificar los sitios web de comercio sistema de búsqueda personalizada.
electrónico como lo requiere la moderna al cliente día. Por lo tanto, se propone el algoritmo y la
herramienta en presente trabajo de investigación es una mejora del algoritmo y el sitio web
herramienta de determinación de prioridad SNEC publicado previamente.
2.4. Revisión de los métodos de búsqueda basados en la retroalimentación de relevancia contextual
2.2. Revisión de los métodos de búsqueda basados en la personalización de contenido Los sistemas contextuales utilizan los datos implícitos y explícitos de usuario para desarrollar una
base de conocimiento contextual a través de la recopilación de diferentes contextual cliente per fi les. Limbu
personalización de contenidos en Internet se refiere al proceso de mostrar contenido diferente a et al., (2006) sugerido modi fi cación / expansión de consultas para revelar adecuadamente el interés
los diferentes clientes en el mismo portal / página web. Sugiyama et al., (2004) explicaron que los del usuario y por lo tanto para obtener resultados de búsqueda personalizados contextualmente. El
sitios como yahoo presentar la información relevante para los usuarios en las que son probablemente enfoque propuesto ef fi cientemente mejora diversos criterios de búsqueda como recuerdo y la
más interesados. Usuarios / clientes pueden especificar las pestañas de su / su elección en este tipo precisión mediante la ampliación de la consulta incompleta / ambigua apropiadamente utilizando el
de sitios web que pueden incluir películas de Bollywood / Hollywood, noticias, actualizaciones de enfoque diccionario de sinónimos y mediante la adición de palabras clave meta
moda, forecasting- signo solar / tiempo. Los usuarios pueden construir su esquema de página
favorita según sus necesidades en los portales de contenido personalizado. Sin embargo, tales a la consulta de búsqueda, respectivamente.
sistemas generalmente adolecen de diversas limitaciones como constante esfuerzo por parte del Tanapaisankit et al., (2012) sugerido un modelo de búsqueda personalizada, la consulta en Contexto
usuario es un requisito ya que tales sistemas son directamente dependientes de las entradas del (QIC) que mejora la consulta de búsqueda mediante la inclusión de las preferencias del usuario y por
usuario. Por otra parte, estos portales no pueden adaptarse automáticamente a las cambiantes lo tanto la clasificación de resultados de búsqueda con el contexto de enriquecimiento para reducir el
necesidades del usuario, a menos que él / ella de forma explícita modificar sus preferencias número de resultados de búsqueda contextualmente inexactas. El modelo propuesto puede ser
previamente registrados. Kuppusamy y Aghila (2014) propuesto para todo uso CaSePer, una implementado, permitiendo términos de consulta de búsqueda con múltiples significados para ser
arquitectura de detección de cambio adaptativo página web para ayudar a los usuarios que navegan ponderados hacia contextos correctos. Vinay et al., (2005) compararon tres tipos diferentes de
con frecuencia un sitio web específico y están preocupados por conocer los cambios más recientes algoritmos de retroalimentación basado relevancia de contexto mediante el empleo de procedimiento
en lugar de considerar el contenido completo de los sitios web de las visitas repetidas. Este modelo de las pruebas de destino y experimentalmente establecido que el algoritmo bayesiano es más e fi
requiere ser adaptado como un sistema de registro personal a medida. Por otra parte, se requiere ciente de RSJ y algoritmos Rocchio. También exploraron que los modernos motores de búsqueda no
que el experimental e fi ciencia de un sistema de búsqueda tales ser evaluado. ofrecen la opción de Relevancia de votos y por lo tanto los usuarios son a menudo insatisfechos con
los resultados devueltos y están obligados a modificar su consulta para obtener resultados relevantes
manualmente.
2.3. Revisión de los métodos de búsqueda basados en sistema de recomendación 2.5. Examen de las tecnologías inteligentes basados en métodos de búsqueda
En esta era actual de grandes volúmenes de datos, existe una necesidad surgido del sistema de Singh y Vélez (2014) discutido el modelo de un motor de búsqueda para buscar Simha
recomendación para hacer frente a explosión de la información en la web. competente a través de diferentes plataformas en la nube para datos no estructurados y
WASID y Kant (2015) discuten los sistemas de recomendación que podrían ayudar a los usuarios estructurados utilizando backend elástico motor de búsqueda. También examinaron la significación
sugiriendo material de entretenimiento como juegos, ofertas de compras para hacer uso e fi ciente de de los procesos diseñados con cautela tales como extracción, transformación y carga de datos al
su habitual tiempo de búsqueda en la web. Sugirieron una técnica conocida como optimización de indexar grandes. Malhotra (2014) exploró ese enorme tamaño de la web y la interferencia de SEO
enjambre de partículas para determinar las prioridades de los distintos usuarios y en consecuencia lleva a di fi cultad en la recuperación de información valiosa de Internet a través de motores de
para presentar recomendaciones personalizadas para un usuario específico. También sugirieron búsqueda. Sin embargo, una red neuronal artificial puede ser fi e fi ciente capacitado para brindar
diferentes técnicas fi ltrado utilizables por sistema de recomendación, es decir, demográfica ltrado fi, mejores resultados de búsqueda mediante la implementación de aprendizaje supervisado. Zhang et
colaboración ltrado fi, basado en el contenido ltrado fi y técnicas de fi ltrado híbridos para al., (2012) discutido marco semántico de búsqueda ++ basado en la nube para proporcionar los
personalización basada en web. Adamopoulos (2014) probabilístico propuesto Barrio acercarse a la resultados de las redes sociales. Se exploró el fracaso de los motores de búsqueda de propósito
conquista de los problemas habituales de desarrollo del método de K vecino más cercano. Ellos general para establecer las relaciones entre los objetos, las personas y las páginas web de diversos
discuten el concepto de inesperado en los sistemas de recomendación populares para portales de redes sociales tales como Facebook, Instagram, Twitter. Wang et al., (2011)
propone una metodología para la optimización de motor de búsqueda basado en la retroalimentación También fi NDS complicado para estructurar sus sitios web de comercio electrónico adecuada
del cliente que puede ser redes neuronales ciales implícitas o explícitas y arti fi y por lo tanto su uso para sobrevivir en esta era moderna de la intensa competencia.
en la implementación de la página web no sesgada modelo de clasificación.
sistemas de clasificación de sitios web convencionales no se centran en aspectos esenciales como
es requerido por los sistemas de gestión de datos grandes. Estas características incluyen soporte
3. La motivación fracaso, la infraestructura y la aplicación parcial de la escalabilidad, la recuperación de componentes,

recuperación de datos y la capacidad de responder en tiempo real a medida que necesitan los
La gran repositorio de datos en la web puede ser denominado como grandes volúmenes de sistemas modernos de metabúsqueda o motores de búsqueda para buscar en la época actual de
datos. En la situación actual, que a veces se hace muy difícil para un cliente para buscar grandes volúmenes de datos como se comenta por Tsai et al., (2015) . los motores de búsqueda
correspondiente página web de comercio electrónico en Internet fácilmente. Una de las medidas tradicionales suelen realizar menos semántica página proceso de clasificación en relación con conteo
temporales comúnmente seguido es el uso de un popular motor de búsqueda como Google. Sin de frecuencia de palabras clave, la proximidad entre el sitio web candidato y consulta de comercio
embargo, como se discute en la literatura, ninguno de los motores de búsqueda puede resolver electrónico. Las consultas que pueden ser interpretadas en diversos contextos son susceptibles de
completamente un problema de recuperación ya que ningún motor de búsqueda de artículos lata producir resultados inesperados, y el usuario termina ya sea con la porción muchos enlaces a
toda la información disponible en la web. Bo y Yang-Mei (2014) discuten que la mayoría de los páginas web y, a veces ni siquiera un solo enlace en la salida.
motores de búsqueda convencionales sufren de varias limitaciones, como la indexación incompleta,

baja precisión, rango de página SEOmanipulated, bajo el recuerdo. Por otra parte, un motor de
búsqueda convencional presenta la misma consecuente salida a la misma consulta, a pesar de los
requerimientos actuales o preferencias personalizadas de cliente enviar la consulta como se comenta
por Rasekh (2015) . Este enfoque no es adecuado para los clientes con un conjunto diferente de los El trabajo de investigación propuesto se centra en abordar los problemas anteriormente
requisitos. Tomemos un ejemplo, una búsqueda del cliente femenino o masculino de '' compra en mencionados que se enfrentan los diferentes grupos de interés a saber. E-minoristas, usuarios finales y
línea de la correa”en un motor de búsqueda convencional. El cliente obtendrá el mismo rango de desarrolladores de motores de búsqueda. El problema de investigación puede resumirse de desarrollar
varios enlaces web que aparece en la salida sin ninguna consideración al hecho de que uno de los un metabuscador personalizado para el beneficio de todos los interesados. Por otra parte, el enfoque
clientes suelen hacer consultas para productos destinados para damas y otro para hombres. Por lo propuesto va a superar las restricciones de la minería de datos enfoques tradicionales para extraer
tanto, a ser posible, la consulta de búsqueda debe ampliarse de forma intermedia a '' compra en línea útiles enlaces de la web de comercio electrónico de grandes bases de datos de varios motores de
de correas de los hombres”o '' compra en línea de correas de las mujeres” para que la salida más búsqueda, proporcionando características esenciales de los sistemas de datos grandes de segunda
personalizada y relevante para el comercio electrónico al cliente. Algunos de los modernos motores generación como el soporte fracaso parcial, escalabilidad, en tiempo real respuesta.
de búsqueda proporcionan una opción para la búsqueda personalizada. Sin embargo, por lo general
no se adaptan al cambio continuo de las necesidades del cliente como se comenta por Wang y Wong
(2014) . Por otra parte, los usuarios a menudo se requieren para modificar su búsqueda del número
de consultas de comercio electrónico de veces para recuperar enlaces web de interés en el orden
correcto de clasificación como se comenta por Verma et al., (2015)
4. Comparación de las plataformas para el análisis de grandes volúmenes de datos
Para elegir adecuadamente marco de implementación para una búsqueda de aplicaciones web y
la clasificación, tenemos que comparar diversos aspectos tales como las capacidades para el apoyo
parcial fracaso, tolerancia a fallos, escalado, procesamiento en tiempo real y e fi ciencia en la
ejecución iterativa. A continuación, se compararon varios paradigmas de implementación existentes
en las Secciones 4.1,4.2 y 4.3 para explicar algunas de las características de las diferentes
plataformas basadas en la nube útiles para el despliegue de Comercio electrónico de búsqueda web
metabuscadores pueden hacer frente a un problema de indexación parcial de los motores de
y el sistema de clasificación.
búsqueda convencionales de forma moderada. Se construyen en la parte superior de algunos motores
de búsqueda, y que la búsqueda de una consulta en todos los motores de búsqueda de apoyo, seguido
por la integración y la clasificación de los enlaces de salida recuperados de cada uno de los motores de
búsqueda para mostrar el resultado y por lo tanto mejorar la recuperación y precisión. Sin embargo, el
4.1. Tipos de plataformas de despliegue
enfoque metabuscador tiene su propio conjunto de limitaciones. El número habitual de enlaces
devueltos en la producción para la consulta de comercio electrónico por cada uno de los motores de
Varias plataformas existentes de despliegue basados en la nube se explican como sigue ( Khurana
búsqueda de apoyo es descomunal. Youssif et al., (2011) discuten como si la consulta de búsqueda es
2014; Malhotra et al., 2017a, b )
ambigua, enlaces de salida en consecuencia se vuelve aún más masivo que los motores de búsqueda
tradicionales intentan recuperar los enlaces a las webs correspondientes a todos los posibles
En uno de una clase, racimo utiliza espacio de almacenamiento blob como un espacio de
significados de una consulta, por lo tanto, la integración y la correcta clasificación de gran número de
almacenamiento primario tal como Azure tienda blob, S3. Aquí agrupaciones temporales se
sitios web de comercio electrónico requieren enormes esfuerzos . Por otra parte, el sitio web de
implementan, y existen sólo hasta el período de trabajo flujo de ejecución. Blob tienda sirven de
comercio electrónico la clasificación utilizando técnicas de minería de datos convencionales no es e fi
fuente y destino del flujo de trabajo. Aquí, las máquinas virtuales pueden ser considerados como
ciente como se discute por Verma y Singh (2017a, b) y requieren para hacer frente a muchos problemas
contenedores de ejecución de tareas.
como:
En otro tipo, en primer lugar la generación de HDFS (Hadoop Distributed File System) se utiliza como un
espacio de almacenamiento primario. Por el contrario, aquí, las agrupaciones persistentes se utilizan
para el almacenamiento a largo plazo. Por otra parte, las máquinas virtuales son persistentes, y que
pueden realizar la ejecución, así como el almacenamiento de datos. Este tipo puede incluso utilizar el
La credibilidad de los sitios web de alto rango de comercio electrónico en los motores de
almacenamiento blob para copias de seguridad cíclicos y para dar los datos de HDFS. Este tipo de
búsqueda de salida parecía haber disminuido como cliente no suele ser capaz de encontrar el
plataforma de despliegue en la nube es útil para cargas de trabajo de las cargas de trabajo por lotes tipo
producto adecuado y auténtico a un precio razonable. Por ejemplo, algunos de los sitios web de
SLA, Ad Hoc Ad Hoc interactivo y por lotes. Por ejemplo, las cargas de trabajo interactivas SLA suelen
comercio electrónico son vendedores sin adquirir preautorización del fabricante del producto a
ser desplegados en HDFS debido al requisito de máquinas virtuales como servidores y requisitos de
precios razonables que conducen a diversas di fi cultades para el cliente al solicitar los servicios
almacenamiento de blob como una copia de seguridad.
de garantía / garantía del fabricante. Por otra parte, E-Tailer
4.2. Segunda generación HDFS plished a través de HDFS y Spark son las opciones óptimas para aplicaciones de búsqueda web
como se comenta por Shou et al., (2014) , Y por lo tanto estos son los preferidos y propusieron
Con los recientes cambios tecnológicos, sistemas de procesamiento de datos grande de marcos de despliegue para la búsqueda web de comercio electrónico y aplicaciones de clasificación.
segunda generación tienen que soportar múltiples métodos analíticos sobre los tipos de datos La comparación clasificación detallada entre varias plataformas de despliegue se muestra en la tabla
variados, y la capacidad de responder en tiempo real. Malhotra y Rishi (2017) discutido las 1 . En la puesta en práctica de nuestra herramienta IMSSAE propuesto, hemos elegido la plataforma
características esenciales de fi HDFS rstgeneration como soporte fallo parcial, también se requiere la HDFS debido a su gran escala y la culpa rango de tolerancia, que son dos requisitos más
escalabilidad a través de flujo de datos y la programación de memoria global para ser continuada por importantes en un entorno de comercio electrónico. Hemos dado preferencia a HDFS sobre
la segunda generación de HDFS como se muestra en Figura 2 . Hay dos tendencias significativas de platformdue SPARK a la fácil disponibilidad y adaptabilidad de hardware y software relacionado con
Segunda Generación HDFS base de Big búsqueda de datos y sistemas de clasificación ( Gebara et los requisitos de infraestructura para reducir Mapa HDFS- medio ambiente y, por tanto, para mejorar
al, 2015.; Malhotra y Rishi, 2016 ) la probabilidad de un mayor uso y popularidad entre los minoristas.
Hay un rápido crecimiento en el ancho de banda en comparación con el ancho de banda del
disco duro.
5. Sistema de Diseño
Desarrollo de modelos de cálculo en memoria tales como Spark permitir que los resultados
intermedios que se mantiene en la memoria y por lo tanto reduce la sobrecarga de la analítica
Este trabajo de investigación propuestos direcciones antes mencionadas búsqueda en sitios web de
iterativos
comercio electrónico y el problema de la clasificación como se discute en la Sección 3 utilizando Tecnologías
inteligentes basadas personalizada analítica de grandes datos. El diagrama de bloques modular simplifica
Segunda Generación HDFS se adapta como un almacén a largo plazo desde donde las
ed del sistema se muestra en Fig. 3 .
aplicaciones web leen sus datos iniciales y escribir de nuevo sus resultados final. La capa de datos
se subdivide en varios segmentos para el almacenamiento estable y proporciona almacenamiento
para objetos intermedios por separado. Sin embargo, una de las limitaciones de HDFS se encuentra
5.1. Fase 1: preprocesamiento consulta mediante el análisis semántico
en el funcionamiento de algoritmos iterativos e fi cientemente. función de mapa requiere para leer los
datos en el comienzo de la iteración y volver a escribir los resultados en el disco al final de la
El sistema de ranking de páginas web de comercio electrónico propuesto puede fácilmente hacer
iteración. Esta frecuente acceso al disco en la escritura y lectura de datos es responsable de la
un seguimiento de las preferencias de los clientes, es decir, a corto plazo y las preferencias a largo
degradación del rendimiento y e fi ciencia como se comenta por Singh y Reddy (2015) .
plazo mediante la construcción del cliente per fi l. Este sistema puede supervisar de cerca el historial
de navegación del cliente, y el sistema se actualizará automáticamente al cliente de per fi l con un
cambio en su / sus patrones de navegación de sitios web sin necesidad de ningún esfuerzo adicional
por parte del cliente. Aquí preferencias a largo plazo pueden ser recuperados utilizando pasado
4.3. Clasificación comparación de las plataformas de despliegue existentes y propuestas historial de navegación del cliente y registrados preferencias mientras que las preferencias a corto
plazo serán recuperados usando el historial de navegación de sólo dos últimos días. Esta fase puede
extraer consultas de búsqueda y los enlaces visitados web de historial de navegación por ir a buscar
tabla 1 muestra una comparación de rango de varios marcos de despliegue de grandes volúmenes palabras clave meta y por lo tanto, mediante el desarrollo de clientes de per fi l que puede ser
de datos posibles sobre las características diferentes, tales como la escala, la tolerancia a fallos. Aquí utilizado además en establecer la base de datos de contexto del cliente. Estas palabras clave Meta
Rango -1 muestra la mejor opción y Rango pueden ser utilizados para la selección de conceptos con la base de datos basado en ontologías.
- 5 para peor opción entre todas las plataformas mencionadas. Cabe señalar que esta tabla de Estas palabras clave Meta a través de ideas seleccionadas serán utilizados para eliminar la
clasificación proporciona una idea general con respecto a las fortalezas y debilidades de las distintas ambigüedad de la consulta de búsqueda y por lo tanto se expanden a una consulta de palabras clave
plataformas y depende principalmente de la aplicación específico / propósito. En general, las simple en la consulta más significativo al cliente personalizado para mejorar los resultados de la
aplicaciones generales de datos grandes, hay un equilibrio entre Escalado y capacidades de búsqueda a través de motores de búsqueda como se comenta por backend Malhotra y Rishi (2017) .
procesamiento en tiempo real. La semántica Relevancia vectorial (SRV) se determina mediante el uso común más larga
Subsequence (LCS) para determinar
Por ejemplo, en aplicaciones de búsqueda web, proceso de indexación requiere una plataforma
altamente escalable para manejar mil millones de páginas web devueltas por algunos motores de
búsqueda de apoyo. Esta indexación acompa-
datos de Big Data Programación Almacén de Transmisión
análisis de Analytics Basado en el datos de datos
grandes volúmenes deEngine

motor 2 3 modelo (Valor
Llave,)
Espacio de reducir el procesamiento
Scheduling- Analítica del motor 1 Tratamiento Programación de memoria global
almacenamiento de datos de Recursos Espacio
Sección crítica de datos grande de HDFS HDFS de almacenamiento de datos del
En primer despliegue HDFS Generación
Segunda Generación de implementación de HDFS
Figura 2. Segunda Generación HDFS V / S Primera HDFS Generación ( Malhotra y Rishi, 2017 ).
tabla 1
Clasificación Comparación de las plataformas de implementación existentes y propuestas.
Plataforma Rango de escala (Tipo) Avería Rango Tolerancia Rango de procesamiento en tiempo real Tareas iterativos Rango
HDFS 1 ( Horizontal) 1 4 4
CHISPA 1 ( Horizontal) 1 4 3
DE IGUAL A IGUAL 1 ( Horizontal) 5 5 4
clusters HPC 3 (vertical) 2 3 2
MULTICORE 4 (vertical) 2 3 2
GPU 4 (vertical) 2 1 2
FPGA 5 (vertical) 2 1 2
Fase 2: Página Web

Ordenados Web
Fase 1: Consulta de Ranking utilizando
E-Commerce consulta Enlaces a cliente
preprocesamiento - c MapReduce Based RV
Search Consulta desambiguado
Seman algoritmo
Comentarios del cliente
Fig. 3. Simpli fi cado sistema de diseño.
la proximidad de la página web y la similitud de contexto en relación con los requerimientos del de acuerdo de nivel de servicio. Esta fase pre-procesada acepta consulta desambiguado como la
cliente. El de flujo conceptual detallada de este paso se muestra en la Fig. 4 . generada en el último paso. En este paso, vamos a buscar primero consulta fi cado especí usuario
en cada uno de los motores de búsqueda final de la espalda y le asignará un identificador único a
cada uno de los grupos recuperados de las páginas web de 1 a n. Estos grupos se comparan
5.2. Fase 2: Clasificación de Sitio Web utilizando MapReduce algoritmo de ranking de la página basada entonces con especí usuario fi caciones tales como la privacidad / seguridad, tiempo de respuesta y
RV la facilidad de acceso a FI lista clúster nd relevante L que debe ser procesada adicionalmente para la
clasificación propósito. Lista final de los clusters puede llevarse a cabo mediante la realización de un
Este trabajo de investigación utiliza Hadoop MapReduce-RV- marco de la minería de datos y partido paramétrico. El criterio muy primera es determinar la accesibilidad que pueden ser públicas,
análisis basados grandes para simplificar el sitio de comercio electrónico de búsqueda personalizada tipo de nube privada o comunitaria. El segundo criterio está relacionado con la seguridad que se
y el proceso de clasificación a través de la implementación de Sistema inteligente de meta búsqueda puede determinar por https: capacidad de transmisión o la disponibilidad SSL seguido por el tercer
avanzada para el comercio electrónico. IMSS-AE herramienta se construye en la parte superior de criterio del tiempo de respuesta que debe ser menor que el de valor fi cada cliente. La primera etapa
algunos otros directorios de búsqueda como Yahoo, metabuscadores como dogpile y motores de de clasificación será
búsqueda como Google. Este trabajo de investigación propuesto se implementa en la capa media de
la nube pública
Recuperar el comercio electrónico y
consultas basadas Examinada clientes Clientes

Clientes
Enlaces Web Perfil
Historial de compras
Sistema de recomendación para la recuperación
de palabras clave Meta
Base de datos
léxica y
Ontológico
La semántica basada Mejora de consultas -
La inserción de Palabras clave adicionales
E-Commerce Search
Personalizado y ampliado de
consultas de atención al Palabras madre Eliminación de consultas
consultas de comercio
cliente
electrónico
Fig. 4. Sistema Design- Preprocesamiento de consulta.
implementado por la determinación del contenido de relevancia en el modelo de dos fases de 5.3. Relevancia vectorial (RV) algoritmo de ranking de la página
programación llamado Mapa y reduce a apoyar HDFS marco basado en la nube. Reducir el mapa y
código utilizado en el algoritmo propuesto es el siguiente: Relevancia del vector, el algoritmo de ranking de la página es un algoritmo extendido de algoritmo
de RCP publicada anteriormente por Malhotra et al., (2017a, b) . algoritmo de RV es una mejora con
respecto algoritmo de RCP debido a dos razones principales (i) RV algoritmo está diseñado para
Mapa (SEngine_ID: Entero, Web_Log: String) // Registro de clúster Web sacar beneficio de la tecnología de nube (ii) algoritmo de RV, a diferencia de algoritmo de RCP está
tratamiento especialmente adaptado para el comercio electrónico ranking de páginas web. algoritmo de RV se
{ discute en detalle como sigue:
List <String> TL: = Tokenize (Web_Log) // Lista de emergencia TL

Mientras que (Web_Token en TL) {
comienzo
Inserte ((String) KL, (entero) 1) // KL- lista de palabras clave Acepta el comercio electrónico consulta de un cliente. Personalizar consulta de búsqueda
}} usando la base de datos de clientes per fi le y mejora semántica. Dividir la consulta en varias
palabras clave W 1, W 2 ,. . ... . ., W norte y eliminar palabras madre a partir de la consulta. Determinación
Reducir (KL: String, cuente: List <Integer>) { de la longitud mínima y máxima de cada uno de la palabra clave como sigue
Freq Integer = 0 Si bien

(KL) {
Freq = Frec + 1}
Inserte ((String) Web_Token, (entero) Frec)} Conjunto min = strlen (W 1), max = strlen (W 1)
Set c = 2
Mientras que (c <n) hacer
Si MIN> W do entonces
Min = strlen (W do)

Terminara si
Aquí, el método Mapa aceptará una clave como ID del motor de búsqueda para cada web
Si MAX <W do entonces
recuperado enlaces clúster desde varios motores de búsqueda de antecedentes y el segundo
MAX = strlen (W do)
argumento es weblog para tokenize cada uno de la entrada de la entrada de enlace en el blog para
EndIf
contar la frecuencia de cada una de las palabras clave en E-Commerce búsqueda. método Insert ()
EndWhile
se utiliza para generar elementos de la lista mediante la inserción de uno numérico correspondiente a
cada ocurrencia de una palabra clave como token. Sin embargo, Reducir método se implementa a
acumular sobre toda la ocurrencia de cada palabra clave. Esto se logra mediante la inserción de
numérico 1 (uno) para determinar la frecuencia de la palabra clave en cada uno de los documentos
Ejecutar la consulta de E-Commerce en varios motores de búsqueda backend y asignar ID de
web y por lo tanto a la conclusión de relevancia el vector contenido de los documentos recuperados
sitios web recuperados pueden determinar fácilmente la guía al cliente. Este proceso puede
web de diversos motores de búsqueda. La segunda etapa de clasificación concluye el vector tiempo
llevarse a cabo mediante la comparación de la consulta del cliente con cada uno de los últimos
de relevancia (TRV) para cada página web utilizando su último momento de la actualización en la
de comercio electrónico, y otras consultas de búsqueda presentes en cliente per fi l de base de
web, así como considerando anterior estadística de tiempo que pasan al cliente con la consulta de
datos utilizando LCS. Los LCS, es decir, más larga común Subsequence se utiliza para
búsqueda similar de comercio electrónico. La tercera etapa de clasificación incluye vector
determinar la proximidad entre el sitio web y preferencias de los clientes y almacenar la misma
retroalimentación relevancia (FRV) que puede incluir retroalimentación explícito e implícito de cliente
en SRV [ID] para representar el rango semántico de especial sitio web de comercio electrónico fi
pasado. Algunos de los resultados de las investigaciones anteriores muestran que la
identificado por ID. Calcular marca de tiempo T S de la creación y el tiempo medio de
retroalimentación explícita de un sitio web de productos / E-Commerce en forma de comentarios en
permanencia por el pasado T cliente PAG para calcular Tiempo relevancia vector TRV [ID] = (Ts +
línea puede signi fi cativamente el impacto de la decisión de compra de un cliente. Liu et al., (2017) discute
Tp) / 2
que es muy difícil para un cliente para revisar una gran cantidad de comentarios en línea fácilmente.
Por lo tanto, existe una necesidad urgente de desarrollar un método para clasificar los sitios web de
comercio electrónico basado en el análisis de opiniones. Las revisiones en línea por lo general
expresan en frases y, por tanto, el análisis semántico basado Diccionario se utiliza en este trabajo de
investigación para determinar opiniones neutras, positivas o negativas. La semántica Relevancia
// Cálculo de CRV [ID]
vectorial (SRV) ya está determinado en el paso 1. Por fin, todos estos vectores con su contribución
ponderada como se ha mencionado por el cliente ayuda en la determinación de rango para cada uno
Para x = 1 hasta n // n qué se refieren al número total de sitios web o Calcular la frecuencia de
del grupo de páginas web como se explica en la página RV algoritmo de clasificación propuesto. Las
cada palabra clave utilizando el diccionario web o eliminar todos aquellos sitios web con
diversas métricas de evaluación que intervienen en la determinación del rango de un sitio web de
frecuencia de encontrado número-
comercio electrónico son Semántica Relevancia vectorial (SRV), Evaluación Relevancia vectorial
palabras menos de que no se encuentran palabras clave o llamada Mapa( WebPage_ID,
(FRV), contenido Relevancia vectorial (CRV), Privacidad vectorial (PV) y Accesibilidad vectorial (AV).
WebPage_Content) O Call Reducir( Web_Link, Count) o Calcular la frecuencia media de la
El paso a paso Cálculo de varias métricas de evaluación y su papel en la determinación de la
frecuencia del individuo
clasificación general y la precisión de búsqueda personalizada de un sitio web de comercio
electrónico, junto con el diseño del sistema de la fase 2 se muestra en la Fig. 5 .
palabras clave
O STORE frecuencia media en CRV [ID] EndFor
Para x = 1 a R DO // r se refiere a sitios web que quedan después de la eliminación en la última etapa
- Calcula vector de privacidad, PV [ID] = 0; Si (linkprivacy = privacidad (w eb (ID)) a continuación,

establecer PV [ID] = 1
Extracto de las palabras clave de búsqueda semántico ampliado consulta
obtienen a partir de la fase 1 y determinan MIN y MAX longitud de cada una de

Fase 1
las palabras clave de consulta de E-Commerce
Implementar el diccionario de la página web de relevancia mediante el
almacenamiento de sólo aquellas palabras de la página web candidato que tiene
sitios web de comercio una longitud entre MIN y MAX
electrónico recuperados
utilizando los motores de

Asignar enlace ID para cada uno de los sitios web de comercio
búsqueda
electrónico recuperados.
Semántica diccionario base
de datos -WordNet, HowNet

alternativos
etc. revisiones en línea en críticas positivas, negativas relacionadas con los sitios web
es decir FRV [ID] de la página web mediante el rastreo y clasificación de las
diccionario web y mapa (), Reducir () métodos determinan la orientación semántica
Determinar la relevancia del contenido de sitio web es decir CRV [ID] utilizando el
Determinar el tiempo de pasar relevancia es decir TRV [ID] del sitio web utilizando la
Anterior tiempo de cliente de base
media estadística pasado el tiempo por el cliente previo con semánticamente similares
de datos dedicado
consulta de E-Commerce
Determinar la relevancia semántica del vector es decir SRV [ID] para la correcta
identificación de la sesión de navegación cliente usando lenguaje de ontologías
web y LCS y para determinar la proximidad entre el sitio web y los requerimientos
del cliente
entrada al
cliente Acepta el requisito de parámetros opcionales, es decir, la privacidad vector es
decir, PV [ID], tiempo de respuesta vector es decir RTV [ID], la accesibilidad vector
es decir AV [ID] en forma de peso en la escala de 1 a 5
Determinar el rango del candidato página web E-Commerce

sitios web de comercio usando la relación:
electrónico en el orden Rango (sitio web (ID)): = AV [ID] * ((SRV [ID] * W1 + CRV
correcto de rango respecto a [ID] * W2 + TRV [ID] * W3 + FRV [ID] * W4 + PV
[ID] * W5 + RTV [ID] * W6)
clientes
requisito
Determinar la retroalimentación explícita e implícita del orden de clasificación se muestra
Perfil del de sitios web y base de datos de actualización del perfil del cliente para obtener mejores
cliente db resultados personalizados en el futuro
Fig. 5. Sitio Web Ranking utilizando MapReduce basado graduación de la página de RV algoritmo.
- Calcula Accesibilidad Vector, AV [ID] = 0; Si (Cloud = Public) a continuación, establezca AV [ID]

Ajuste Count = 0
=1
- Calcular Responder Time Vector, Set RTV [ID] = 0 Si (revisión es positiva) entonces // Así Satis fi cada experiencia del pasado al cliente
- Si (linkresponse> ReplyTime (sitio web (ID)), entonces

Count = Count + 2
RTV [ID] = strResponse - ReplyTime (sitio web (ID)) EndFor Else if (Review es negativo), entonces // Insatis fi cada experiencia del pasado al
cliente
Count = -2 contar else if (Review es neutral) // Indeciso o confundido Pasado
Eliminar todos los sitios web de comercio electrónico, ya sea con RTV [ID] = 0, PV [ID] = 0 o AV Cliente
[ID] = 0
Determinar Evaluación Relevancia vector es decir FRV [ID] utilizando diccionarios semánticos Count = Count - 1 ENDIF
para analizar los comentarios en línea y clasificarlas en críticas negativas, positivas y neutras y
Establecer FRV [ID] = Conde
calcular FRV de la siguiente manera:
? Calcula Rango (sitio web (ID)): = AV [ID] / (( SRV [ID] / W1 + CRV [ID] / W2 + TRV [ID] / W3 + FRV 5.4. sistema de búsqueda avanzada meta inteligente para E-Commerce - herramienta IMSSAE
[ID] / W4 + PV [ID] / W5 + RTV [ID] / W6)
Aceptar la retroalimentación del cliente sobre el orden y la actualización de la clasificación se IMSS-AE utilizando la herramienta de segunda generación HDFS, Map-Reduce marco de
muestra al cliente per fi l de base de datos. análisis de datos grandes se implementa en el marco ASP.NET para ayudar al cliente mientras se
realiza la transacción de comercio electrónico. Esta herramienta también se utiliza para determinar el
El algoritmo de clasificación de la página RV determina la relevancia de un sitio web de comercio rendimiento de la página RV algoritmo de clasificación. La interfaz de la herramienta de IMSS-AE se
electrónico para un cliente especí fi co mediante el cálculo de los diversos vectores de relevancia muestra a continuación en el Fig. 6 . Después del registro / sesión / Registrarse, la interfaz de la
tales como contenido Relevancia vectorial, Semántica Relevancia vectorial, Responder tiempo herramienta de autenticación le permitirá al cliente seleccionar algunas o la totalidad del directorio del
vector, vector relevancia de votos, vector de privacidad. El algoritmo comienza con la expansión de la motor mencionado metabúsqueda / buscador / búsqueda, es decir, Dogpile, Yahoo, y google respectivamente,
consulta de búsqueda personalizada como se discute en la Sección 5.1 . Después de la eliminación de para el fondo de recuperación de sitios web de comercio electrónico. A continuación, la herramienta
las palabras madre a saber. una, el, una de la consulta. El algoritmo de RV calculará la longitud de IMSS-AE actuará como metabuscador; el cliente puede especificar cadena de búsqueda en el
mínima y máxima de cada una de las palabras clave de la cadena de búsqueda. El SRV se cuadro de búsqueda en la interfaz de la herramienta IMSSAE. La herramienta primer ampliar la
determina utilizando común más larga subsecuencia. El CRV se determina usando Mapa y reducir consulta de búsqueda a más significativa consulta de búsqueda personalizada. Esta herramienta va
funciones. Por otra parte, el algoritmo eliminará todos los sitios web de comercio electrónico de la a asignar aún más el rango de algunos de los mejores enlaces web recuperados de los motores de
producción final con la respuesta Tiempo Vector = 0, Accesibilidad Vector = 0 o privacidad Vector = búsqueda de back-end basado en el cálculo de los diferentes vectores de clasificación tales como
0. El paso anterior es seguido además por cálculo de Evaluación Relevancia vectorial dependiendo AV, FRV, SRV, CRV, RTV, TRV con la edad el peso adecuado, determinada a partir del cliente
de la experiencia del pasado cliente. En la última, el rango de un sitio web se calcula mediante la especí parámetros fi ed. La discusión detallada sobre el cálculo de los vectores de clasificación y
suma ponderada de varios vectores de relevancia. contribución ponderada se discute en la Sección 5.2 . La salida de la herramienta voluntad
Meta búsqueda inteligente System- Avanzada E-Comercio
Registro / Nuevo cliente ID de usuario: DM @ UOK Contraseña: ***********
Búsqueda personalizada Criterios de búsqueda avanzada
YAHOO GOOGLE dogpile
Cargando la página velocidad Seguridad en las transacciones Tiempo de respuesta
Introduzca Cadena de búsqueda: compra en línea de correa
BUSCAR REINICIAR AVANCE RÁPIDO >>
Ampliado Cadena de búsqueda personalizada por el IMSS-AE: compra en línea de correa para las mujeres
sugerir otro CONTINUAR CANCELAR
Clasificación Caja ......... ..
Rango Enlace web Tiempo de respuesta Realimentación
1 www.amazon.in/clothing/women 00: 00: 00: 15 ms S.M S
NO SÍ
2 www.myntra.com/women-belts 00: 00: 00: 36ms NO SÍ
3 m.jabong.com/women/accessories 00: 00: 00: 49 ms
NO
Fig. 6. Interfaz de la herramienta de IMSS-AE.
enlaces de la web de comercio electrónico en el orden de clasificación de su clasificación, junto con 2. En el último, la precisión global del motor de búsqueda / herramienta se determina calculando el
diversas estadísticas seleccionados por el cliente en el criterio de búsqueda avanzada, como la página promedio de todas las precisiones ponderados, recogida por voluntarios para un parámetro dado
de la velocidad de carga, tiempo de respuesta, seguridad de las transacciones, así como motor de a los tiempos de respuesta; Página de contenido actualizado, Relevancia personalizada a la vez,
búsqueda de antecedentes. Sin embargo, Búsqueda personalizada pestaña no permitirá elegir cualquiera
de los criterios de búsqueda y le dará un resultado directamente al referirse cliente registrado Precision (ID) = PROMEDIO (N una).
preferencias pasadas. Esta herramienta le sugerirá cadena de búsqueda ampliado personalizada
utilizando el historial de navegación. Por otra parte, la producción, la herramienta clasificar los diferentes La gráfica se muestra en Higos. 7, 8 y 9 demostrar la comparación métrica de precisión media
eslabones utilizando criterios de búsqueda preferidos de los clientes junto con los detalles de las entre propuesto herramienta IMSS-AE con un directorio de búsqueda populares, es decir, Yahoo
estadísticas seleccionadas, la herramienta también permitirá al cliente para enviar comentarios sobre el según los cálculos de los voluntarios, siguiendo los pasos anteriores para varios parámetros de
orden de clasificación de los enlaces de la web y por lo tanto para mejorar sus capacidades de precisión, es decir, tiempo de respuesta, página Frescura y Relevancia personalizada
clasificación personalizadas a mejor adaptación a los cambios en las preferencias de los clientes. respectivamente. Los gráficos mostrados indican que la precisión media inicial de IMSS-AE es menor
que yahoo para la página de frescura, tiempo de respuesta y la relevancia personalizado. Sin
embargo, poco después de algunas ejecuciones de prueba, la precisión de la herramienta mejora en
comparación con Yahoo. Esto demuestra una mayor precisión las capacidades de aprendizaje
basados en la semántica de IMSS-AE. Esta herramienta se puede construir la base de datos de
clientes per fi l mediante el control de su / sus preferencias de navegación personalizadas con
6. Experimental y análisis gráfico
algunas ejecuciones de prueba y, por tanto, la herramienta será capaz de calcular varios vectores de
relevancia importante como se discute en la Sección 5.2 tales como SRV, FRV, TRV con más
La relevancia de una página web personalizada de comercio electrónico a un cliente especí fi ca
precisión. Sin embargo, la mejora en la precisión Fig. 7 para el tiempo de respuesta no es tan
para una consulta determinado producto depende de su posición en la salida de los resultados de
significativo como en Higos. 8 y 9 , Es decir, para la página frescura y relevancia personalizado. Esta
búsqueda. Para comparar el IMSS-Tool con otros métodos de búsqueda populares, la precisión de
diferencia en las estadísticas de precisión se debe a la aplicación de fondo de la segunda generación
búsqueda en métrico X se considera, que se muestra aquí por P (X). Diversas herramientas de
HDFS-Reducir el mapa base utilizados en la herramienta. Este retraso se debe al retardo de tiempo
búsqueda utilizadas para la comparación en este estudio son metabuscador, buscador y directorio de
se producen a causa de la analítica iterativos. Esta suspensión se puede mejorar adicionalmente
búsqueda, es decir, Dogpile, Google, Yahoo y el IMSS-SE Tool por Malhotra et al., (2017a, b) . Para una
mediante el uso de Spark sistema HDFS basado como modelos de cálculo Inmemory implementadas
consulta E-Commerce dado, P (X) informa de cómo se presentan muchas fracciones de enlaces de
a través de Spark permiten resultados intermedios que se le mantenga inmemory y por lo tanto
salida en el resultado, etiquetados como significativo en los primeros resultados X. En este caso, se
reduce la sobrecarga de la analítica iterativos como
supone que un enlace web ocupó el superior es más relevante para el cliente. El rango de
herramientas se compara entonces con el juicio de voluntarios humanos para verificar la relevancia
informado por la herramienta, así como profesionales del motor de búsqueda / herramienta, y al final la
diferencia en la precisión de la herramienta IMSSAE y una herramienta de búsqueda de profesionales
se representa.
0.8
Para evaluar la e fi ciencia y efectividad de RV algoritmo propuesto y herramienta de IMSS-AE. 0.7
IMSS AE
A continuación, se emplearon 20 voluntarios humanos en diversos grupos de edad de 15 años a 45 0.6
0.5
años, y con un mínimo de 3 años de experiencia en la realización de numerosas transacciones de 0.4 YAHOO
comercio electrónico, nueve de ellos son varones, y once de ellos son mujeres. Se les pidió que 0.3
0.2
utilizar los ordenadores portátiles personales con la herramienta de IMSS-AE instalado seguido por el
0.1
signo arriba / proceso de registro en la herramienta, se pidió a los voluntarios que repetir los pasos 0
siguientes durante al menos cinco corridas de prueba en cada uno de Dogpile, Yahoo, Google y ist Run 2ª manga tercero Run cuarto Run
propuso herramienta AE IMSS:

Fig. 7. Comparación entre la precisión IMSS-AE y YAHOO- tiempo de respuesta.
1. Inicialmente, se pidió a los voluntarios para buscar intencionalmente incompleta consulta de

comercio electrónico, por ejemplo, una consulta como compra en línea Samsung más bien que compra
0.8 1
en línea móvil Samsung
IMSS-AE
0.6
2. En la siguiente etapa, se pidió a los voluntarios para clasificar los enlaces de salida de 1 (peor) a 5
(mejor) de forma individual a todos los motores considerados y propuesto herramienta de IMSS-AE. 0.4 YAHOO
La base de la clasificación es varios parámetros de precisión, tales como la relevancia

0.2
personalizado, página tiempo de actualización y el tiempo de respuesta a los 10 mejores enlaces
0
web en la salida.
ist Run 2ª manga tercero Run cuarto Run
3. Después de la recopilación de datos clasificados de cada uno de los voluntarios, la normalización
de diversos parámetros de precisión se lleva a cabo mediante el uso de la siguiente expresión: Fig. 8. Comparación entre la precisión IMSS-AE y YAHOO - Página Frescura.
NP ab = ( MAX (PP ab) - PP ABR) / ( MAX (PP ab) - MIN (PP ab))
Cuando, PP = ab Valor de b º parámetro de precisión metasearch página web; notario público = ab valor
normalizado de b º parámetro de precisión de una º 0.8 1

página web; MIN, MAX = valor mínimo y máximo de cada uno de los parámetros de precisión. IMSS AE
0.6
0.4 YAHOO
0.2
1. Después de esto, se calculó la precisión global ponderado de cada enlace web de comercio
electrónico recuperado por el voluntario como norte a = PAG W segundo. 0
ist Run 2ª manga tercero Run cuarto Run
notario público ab, Donde, N a = precisión ponderado de una º página web; W b =
Peso asignado a b º parámetro por el cliente, en donde 0 <= W b <= 1 Fig. 9. Comparación entre la precisión IMSS-AE y YAHOO- Relevancia personalizada.
0.8 1
Tiempo de respuesta
0.6
UPDA página? en
0.4
0.2 Relevancia personalizada
0
IMSS-AE IMSS-SE GOOGLE dogpile
Fig. 10. La comparación entre la búsqueda de precisión IMSS-AE con Dogpile, IMSS-SE, y Google.
discutido por Malhotra y Rishi (2017) . Del mismo modo, hemos llevado a cabo una extensa extracción de reglas de asociación de grandes volúmenes de datos almacenados en bases de datos transaccionales en línea. Estas
comparación experimental entre la herramienta IMSSAE propuesta con Google, Dogpile y el reglas de asociación asistirán diversas partes interesadas, es decir, minoristas electrónicos / minoristas para el lanzamiento de varios
IMSS-SE en relación con diversos parámetros de precisión, es decir, tiempo de respuesta, página esquemas de promoción tales como comprar uno por uno; combinados con descuento ofertas, sugerencias de productos adecuados a
Updation y Relevancia personalizada. La extensa evaluación experimental discutido y su los clientes en línea, blanco de la comercialización. Las bases de datos transaccionales al por menor son a menudo bastante enorme.
demostración gráfica de Higos. 7, 8, 9, y 10 indica la mejora en diversos parámetros de precisión a un La minería de datos tradicional se acerca a la mía patrones útiles a partir de esas bases de datos voluminosos para poner en marcha
ritmo mucho más rápido cuando una búsqueda personalizada se logra con propuesta IMSS-AE con programas de promoción son bastante tiempo y es ine fi ciente en comparación con Hadoop / Mapa reducir grande como marco de
respecto a otros motores de búsqueda profesional y popular, es decir, Google, Yahoo y motores de análisis de datos. Estos esquemas promocionales de los vendedores en línea / minoristas será muy beneficioso para la otra parte
búsqueda del meta, es decir, Dogpile, IMSS-SE. interesada, es decir, el usuario final y por lo tanto dará lugar a no sólo en las ventas sino también en una mejor satisfacción del usuario
final. Además, para el beneficio de otra de las partes interesadas, es decir, los desarrolladores de motores de búsqueda, análisis de
grandes volúmenes de datos de próxima generación se pueden incorporar en futuras ediciones. Estas versiones futuras pueden incluir
(i) modelo SPARK puede ser utilizado para la reducción de la sobrecarga de procesamiento. La sobrecarga es a cuenta de la analítica
iterativos y se puede reducir manteniendo los resultados intermedios en la memoria Para superar varias limitaciones de convencional
7. Conclusiones y trabajo futuro
HDFS- Mapa reducir tales como la falta de respuesta en tiempo real y la inicialización dinámica de múltiples motores analíticos (ii)
crecimiento proporcional de la red requisitos de ancho de banda, junto con las necesidades de almacenamiento secundario. La
Este trabajo de investigación presenta un marco de búsqueda de comercio electrónico
precisión de la herramienta propuesta IMSS-AE puede mejorarse aún más mediante la incorporación de redes neuronales arti fi ciales
personalizado Hadoop- Mapa basada Reducir para los análisis de grandes volúmenes de datos de
para la aplicación del aprendizaje supervisado de las preferencias del cliente para la mejor experiencia personalizada. desarrolladores
segunda generación. La brecha de investigación se muestra en este estudio mediante la presentación de
de motores de búsqueda, la próxima generación de análisis de grandes volúmenes de datos pueden ser incorporados en ediciones
diversos sistemas de búsqueda convencionales en forma de la categoría detallada revisión sabia
futuras. Estas versiones futuras pueden incluir (i) modelo SPARK puede ser utilizado para la reducción de la sobrecarga de
literatura. Este trabajo de investigación propone un nuevo algoritmo de clasificación de la página RV e
procesamiento. La sobrecarga es a cuenta de la analítica iterativos y se puede reducir manteniendo los resultados intermedios en la
implementa la misma como una herramienta de comercio electrónico ranking de páginas web, es decir,
memoria Para superar varias limitaciones de convencional HDFS- Mapa reducir tales como la falta de respuesta en tiempo real y la
inteligente Meta búsqueda avanzada del sistema para el comercio electrónico. La herramienta IMSS-AE
inicialización dinámica de múltiples motores analíticos (ii) crecimiento proporcional de la red requisitos de ancho de banda, junto con
puede ayudar a los clientes de hoy en día en la elección de sitio de comercio electrónico adecuado para
las necesidades de almacenamiento secundario. La precisión de la herramienta propuesta IMSS-AE puede mejorarse aún más
su compra en línea de un producto. La e fi ciencia de enfoque de clasificación propuesto es fi justificado
mediante la incorporación de redes neuronales arti fi ciales para la aplicación del aprendizaje supervisado de las preferencias del
por análisis experimental. La evaluación gráfica para la comparación de la precisión de la herramienta
cliente para la mejor experiencia personalizada. desarrolladores de motores de búsqueda, la próxima generación de análisis de
personalizada IMSS-RA durante Yahoo, Dogpile, Google, y una herramienta de IMSS-SE demuestra la
grandes volúmenes de datos pueden ser incorporados en ediciones futuras. Estas versiones futuras pueden incluir (i) modelo SPARK
eficacia del enfoque propuesto respecto a los métodos convencionales de graduación de la página y
puede ser utilizado para la reducción de la sobrecarga de procesamiento. La sobrecarga es a cuenta de la analítica iterativos y se
profesionales. Las implicaciones prácticas para los tres diferentes audiencias de este trabajo de
puede reducir manteniendo los resultados intermedios en la memoria Para superar varias limitaciones de convencional HDFS- Mapa reducir tales como l
investigación son los siguientes:
referencias
Adamopoulos, P., 2014. Al descubrir recomendaciones no obvias: Usando

La implicación práctica para End User-El usuario final de este trabajo de investigación es un
unexpectedness métodos de selección y barrio en los sistemas de fi ltrado de colaboración. En: Actas de la 7ª
cliente en línea dispuestos a hacer una transacción en línea. El resultado de este trabajo de Conferencia Internacional ACM en la búsqueda web y minería de datos, ACM, pp 655-660.. Alam, M., Sadaf, K.,
investigación en forma de herramienta de IMSS-AE puede ayudar a los clientes en la clasificación 2015. Etiquetado de búsqueda Web Agrupación de resultados utilizando heurístico
adecuada de los sitios web de comercio electrónico para la compra de un producto específico. El
Buscar y frecuentes conjunto de elementos. Procedia Ciencias de la Computación, Elsevier, pp. 216-222. Aoki, Y.,
usuario final será bene fi tted por ranking de páginas web personalizado de salida y por lo tanto puede Koshijima, R., Toyama, M., 2015. Determinación automática de hipervínculo
seleccionar fácilmente un sitio web que es más adecuado para satisfacer las necesidades de compra Índice de destino en Web. En: Actas de la Base de Datos Internacional de Ingeniería y Aplicaciones 19a
Simposio, ACM, pp 206-207.. Bo, C, Yang-Mei, L., 2014. Diseño y Desarrollo de Búsqueda Semántica-Basado
en línea de un usuario.
Modelo de motor. Tecnología inteligente Computación y Automatización (ICICTA), 2014 7ª Conferencia

Implicaciones prácticas para los minoristas electrónicos / minoristas: Los minoristas electrónicos, es decir, Internacional IEEE, pp. 145-148. Cacheda, F., Carneiro, V., Fernández, D., Formoso, V., 2011. Comparación de las
sitios web de comercio electrónico o minoristas serán bene fi tted de este trabajo de investigación, ya que
colaboración algoritmos fi ltrado: Las limitaciones de las técnicas actuales y propuestas de sistemas de
puede utilizar la herramienta de IMSS-AE para mejorar la estructura de sus sitios web para satisfacer a sus
recomendación escalable y de alto rendimiento. ACM Trans. Web (TWEB) 5 (1). https://doi.org/10.1145/1921591.1921593
clientes con facilidad y por lo tanto, para tomar la ventaja sobre la competencia. .
Gebara, F., Hofstee, H., Nowka, K., 2015. Los sistemas de segunda generación de datos grande: Cubierta
Característica de Outlook. IEEE Computer Society, IEEE, pp. 36-41 .
Implicaciones prácticas para los desarrolladores de motores de búsqueda: Este trabajo de investigación
Gómez-Nieto, E., San Román, F., Pagliosa, P., Casaca, W., Helou, ES, de Oliveira, MC
puede ayudar a los desarrolladores en el dominio del motor de búsqueda para llevar a cabo lo mejor posible F., Nonato, LG, 2014. Similitud preservación de visualización basado en fragmento de resultados de búsqueda
en la forma de la herramienta de búsqueda meta. Pueden aprovecharse de grandes bases de datos de web. IEEE Trans. Visualización Comput. Grafico. 20 (3), 457-470 .
Chico, I., Jaimes, A., Agulló, P., Moore, P., Nandy, P., Nastar, C, Schinzel, H., 2010. Will
varios motores de búsqueda y pueden emplear análisis del Big Datos a buscar a cabo patrones
recomendadores matan a buscar ?: sistemas de recomendación-una perspectiva de la industria. En: Actas de la
personalizados graduación de la página utilizando un innovador algoritmo propuesto como RV algoritmo de cuarta conferencia ACM en sistemas de recomendación, ACM, pp 7-12..
ranking de la página.
Jung, S., Harris, K., Webster, J., Herlocker, JL, 2004. SIERVO: integración humana
recomendaciones con la búsqueda. En: Actas de la decimotercera ACM
En el futuro, la página RV algoritmo de clasificación y una herramienta de IMSS-AE aún se Conferencia Internacional sobre Información y gestión del conocimiento, ACM, pp. 571-580.
pueden mejorar para implementar análisis de la cesta a través
Khurana, A., 2014. Trayendo grandes sistemas de datos a la nube. IEEE Comput nube. 1 (3), Tanapaisankit, P., Watrous-deVersterre, L., Song, M., 2012. consulta personalizada
IEEE, 72-75. expansión en el sistema QIC. En: Actas de la 12ª conferencia conjunta ACM / IEEE-CS sobre bibliotecas
Kuppusamy, KS, Aghila, G., 2014. CaSePer: un modelo de fi ciente para web personalizada digitales, ACM, pp 259-262.. Shou, L., Bai, H., Chen, K., Chen, G., 2014. Apoyo protección de la privacidad en
detección de cambio de página en función de la segmentación. J. King Saud University. Comput. Sci información.
26 (1), Elsevier, 19-27. Buscar en la Web personalizado. IEEE Trans. El conocimiento Eng datos. 26 (2), IEEE, 453-
Limbu, DK, Connor, A., peras, R., MacDonell, S., 2006. relevancia contextuales 467.
retroalimentación en la recuperación de información web. En: Actas de la primera Conferencia Internacional sobre Singh, A., Vélez, HG, 2014. jerárquica multi-registro del motor de búsqueda basado en la nube. En:
Interacción información en su contexto, ACM, pp 138-143.. Complejo, Los sistemas intensivos y software inteligentes (CISIS), Octava
Liu, Y., Bi, JW, Ventilador, ZP, 2017. Los productos de Ranking través de comentarios en línea: un método Conferencia Internacional IEEE, pp. 211-219. Singh, D., Reddy, CK, 2015. Una encuesta sobre plataformas para análisis de
basado en técnica de análisis de sentimiento y teoría de conjuntos difusos intuicionista. Fusión de la Información grandes volúmenes de datos. J. Big Data
36, 149-161 . 2 (1), 8. https://doi.org/10.1186/s40537-014-0008-6 .
Malhotra, D., 2014. minería web inteligente destinado a mejorar el uso de Web Page Rank Tsai, CW, Lai, CF, Chao, HC, Vasilakos, AV, 2015. Los análisis de datos grandes: una encuesta. J.
Retropropagación red neuronal. Confluencia de la Generación de Información Cumbre Tecnología siguiente Big Data 2 (1), 21. https://doi.org/10.1186/s40537-015-0030-3 .
(confluencia), 2014 5ª Conferencia Internacional IEEE, pp. 77-81. Verma, N., Malhotra, D., Malhotra, M., Singh, J., 2015. E-commerce ranking de páginas web
usando semántica minería web y la computación neuronal. Procedia Computer Science, Science Direct,
Malhotra, D., Verma, N., 2013. Una ingeniosa patrón de enfoque a juego para Elsevier, pp. 42-51 .
mejorar fila de la página web. En t. J. Comput. Appl. 65 (24), 33-39 . Verma, N. Singh, J., 2017. Un enfoque inteligente para análisis de grandes volúmenes de datos para
Malhotra, D., Malhotra, M., Rishi, OP, 2017. Un enfoque innovador de la página Web entorno minorista sostenible utilizando marco Apriori-MapReduce. Ind. Administrar. Syst datos. 117 (7), Emerald,
Clasificación Usando Hadoop- y MapReduce marco basado en la nube. En: Actas de los avances en Sistemas 1503-1520. Verma, N. Singh, J., 2017. Una revisión integral de la asociación secuencial
Inteligentes y Computing, Vol. 654, CSI, Springer, pp. 421-427.
computing para Hadoop MapReduce computación paralela en un escenario menor. J. Administrar. Analítica,
Malhotra, D., Rishi, OP, 2016. IMSS-E: un enfoque inteligente para el diseño de Taylor y Francis. doi: 10.1080 / 23270012.2017.1373261. Vinay, V., Wood, K., Milic-Frayling, N., Cox, IJ, 2005. La
Sistema adaptativo de búsqueda del meta para el sitio de comercio electrónico de clasificación. Actas de la comparación de retroalimentación relevancia
Conferencia Internacional sobre Avances en Tecnología de Información Comunicación e Informática, ACM. https://doi.org/10.1145/
algoritmos para la búsqueda web. En pistas de interés especial y carteles de la 14a Conferencia Internacional
sobre el World Wide Web, ACM, pp. 1042-1053. Wang, S., Xu, K., Zhang, Y., Li, F., 2011. de motor de búsqueda
2979779.2979782 . de optimización basado en
Malhotra, D., Rishi, OP, 2017. IMSS: un nuevo enfoque para Diseño de búsqueda adaptativa algoritmo de redes neuronales BP. En Inteligencia Computacional y Seguridad (CIS), 2011 Séptima Conferencia
Usando el sistema de segunda generación analítica de grandes datos. En: Actas de la Conferencia Internacional Internacional IEEE, pp. 390-394. Wang, H., Wong, K., 2014. búsqueda personalizada Un interactivo e iterativo
sobre Comunicación y Redes, Springer, pp 189-.
196. enfoque. En Servicios (servicios), 2014 World Congres IEEE, IEEE, pp. 3-10. WASID, M. y Kant, V., 2015. Un
Malhotra, D., Verma, N., Rishi, OP, Singh, J., 2017B. Inteligentes analítica de grandes datos: enfoque enjambre de partículas de colaboración fi ltrado
Adaptativo de comercio electrónico sitio web El uso de Hadoop Apriori-BDAS marco basado en la nube. sistemas de recomendación basados través de características difusos. Procedia Comput. Sci. 54, Elsevier, 440-448.
Maximización del rendimiento de negocios y e fi ciencia a través de sistemas inteligentes, IGI Global, pp. 50-72 .
Youssif, AA, ghalwash, AZ, Amer, EA, 2011. HSWS: Mejora de la e fi ciencia de la web
Rasekh, I., 2015. Una nueva estrategia basada en la inteligencia competitiva para la búsqueda de la página web. motor de búsqueda a través de la web semántica. En: Actas de la Conferencia Internacional sobre la Gestión de
Elsevier, Procedia Ciencias de la Computación, pp. 450-456 . los ecosistemas, los emergentes Digital ACM, pp 212-219.. Zhang, G., Li, C., Xing, C., 2012. Un Semántica ++
Sugiyama, K., Hatano, K., Yoshikawa, M., 2004. adaptativa búsqueda en la web en función del usuario Social Search Engine en el marco
per fi l de construida sin ningún esfuerzo por parte de los usuarios. En: Actas de la 13ª Conferencia Internacional Nube. En Semántica, Conocimiento y Rejillas (SKG), 2012 Octava Conferencia Internacional IEEE, pp. 270-278.
sobre el World Wide Web, ACM, pp 675-684..

1 en Es PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

1 en Es PDF

Cargado por

Copyright:

Formatos disponibles

Revista de la Universidad King Saud - Informática y Ciencias de xxx (2018) xxx-xxx

listas de contenidos ofrecidos en ScienceDirect

Revista de la Universidad King Saud - Informática

Un enfoque inteligente para el diseño de comercio electrónico metasearch y utilizando el sistema de

clasificación analítica de grandes datos de próxima generación

dheeraj Malhotra ⇑ , OP Rishi

información del artículo resumen

Dirección de correo electrónico: dheerajmalhotra4@gmail.com (D. Malhotra). La revisión por

pares bajo la responsabilidad de la Universidad Rey Saud.

Figura 1. Prioridad de sitios web Determinación de Verma et al., (2015).

3. La motivación fracaso, la infraestructura y la aplicación parcial de la escalabilidad, la recuperación de componentes,

motores de búsqueda convencionales sufren de varias limitaciones, como la indexación incompleta,

datos de Big Data Programación Almacén de Transmisión

análisis de Analytics Basado en el datos de datos

grandes volúmenes deEngine

almacenamiento de datos de Recursos Espacio

Sección crítica de datos grande de HDFS HDFS de almacenamiento de datos del

En primer despliegue HDFS Generación

Segunda Generación de implementación de HDFS

Fase 2: Página Web

Comentarios del cliente

Fig. 3. Simpli fi cado sistema de diseño.

Recuperar el comercio electrónico y

consultas basadas Examinada clientes Clientes

Sistema de recomendación para la recuperación

de palabras clave Meta

La semántica basada Mejora de consultas -

La inserción de Palabras clave adicionales

Fig. 4. Sistema Design- Preprocesamiento de consulta.

{ discute en detalle como sigue:

List <String> TL: = Tokenize (Web_Log) // Lista de emergencia TL

Freq Integer = 0 Si bien

Min = strlen (W do)

O STORE frecuencia media en CRV [ID] EndFor

- Calcula vector de privacidad, PV [ID] = 0; Si (linkprivacy = privacidad (w eb (ID)) a continuación,

Extracto de las palabras clave de búsqueda semántico ampliado consulta

obtienen a partir de la fase 1 y determinan MIN y MAX longitud de cada una de

Implementar el diccionario de la página web de relevancia mediante el

almacenamiento de sólo aquellas palabras de la página web candidato que tiene

sitios web de comercio una longitud entre MIN y MAX

utilizando los motores de

Semántica diccionario base

de datos -WordNet, HowNet

identificación de la sesión de navegación cliente usando lenguaje de ontologías

cliente Acepta el requisito de parámetros opcionales, es decir, la privacidad vector es

es decir AV [ID] en forma de peso en la escala de 1 a 5

Determinar el rango del candidato página web E-Commerce

cliente db resultados personalizados en el futuro

- Calcula Accesibilidad Vector, AV [ID] = 0; Si (Cloud = Public) a continuación, establezca AV [ID]

- Si (linkresponse> ReplyTime (sitio web (ID)), entonces

Meta búsqueda inteligente System- Avanzada E-Comercio

Registro / Nuevo cliente ID de usuario: DM @ UOK Contraseña: ***********

Búsqueda personalizada Criterios de búsqueda avanzada

YAHOO GOOGLE dogpile

Cargando la página velocidad Seguridad en las transacciones Tiempo de respuesta

Introduzca Cadena de búsqueda: compra en línea de correa

BUSCAR REINICIAR AVANCE RÁPIDO >>

sugerir otro CONTINUAR CANCELAR

Clasificación Caja ......... ..

Rango Enlace web Tiempo de respuesta Realimentación

1 www.amazon.in/clothing/women 00: 00: 00: 15 ms S.M S

2 www.myntra.com/women-belts 00: 00: 00: 36ms NO SÍ

3 m.jabong.com/women/accessories 00: 00: 00: 49 ms