Está en la página 1de 6

Traducido del inglés al español - www.onlinedoctranslator.

com

2021 2a Conferencia Internacional sobre Comercio Electrónico y Tecnología de Internet (ECIT)

Predicción de ventas basada en Machine Learning


ZixuanHuo
2021 2ª Conferencia Internacional sobre Comercio Electrónico y Tecnología de Internet (ECIT) | 978-1-6654-3873-5/20/$31.00 ©2021 IEEE | DOI: 10.1109/ECIT52743.2021.00093

Escuela Internacional
Universidad de Correos y Telecomunicaciones de Beijing
Beijing, China
huozixuan@bupt.edu.cn

Resumen—Con la creciente influencia de Internet en la vida de las personas, del Congreso Popular, el primer ministro Keqiang Li señaló que los
el desarrollo de las plataformas de comercio electrónico es más rápido, y los nuevos formatos, como el comercio electrónico, las compras en
usuarios y las ganancias de estas plataformas muestran una tendencia línea y los servicios en línea, han desempeñado un papel importante
creciente. En los últimos años, el fuerte apoyo de las políticas nacionales
en la lucha contra la epidemia. Se deben seguir introduciendo
también ha proporcionado un buen entorno para el desarrollo de la industria del
políticas de apoyo para promover integralmente el “Internet Plus” y
comercio electrónico. Bajo el impacto de la epidemia de este año, el papel de la
crear una nueva ventaja económica digital. El gobierno también
industria del comercio electrónico en el desarrollo de la economía nacional se ha
señaló claramente en el informe que apoyará enérgicamente el
vuelto más prominente. En tales casos, el número y la competitividad de las
plataformas de comercio electrónico y las empresas de comercio electrónico
comercio electrónico en el futuro y lanzará más políticas
están aumentando. Si una plataforma quiere mantener su ventaja en la relacionadas para promover la economía de Internet en el futuro.
competencia, debe ser capaz de satisfacer mejor las necesidades de los usuarios
Al mismo tiempo, debido a la gran base de población y la gran
y hacer un buen trabajo en todos los aspectos de coordinación y gestión. En este
cantidad de usuarios de Internet en China, con la mejora continua de la
punto, el pronóstico preciso del volumen de ventas de las plataformas de
tasa de penetración de Internet en el futuro, la mejora adicional de la
comercio electrónico es particularmente importante. En la actualidad, hay
industria logística y la comodidad que brinda la tecnología de pago móvil,
muchos estudios sobre la predicción de ventas de comercio electrónico, pero
el espacio de desarrollo de la industria del comercio electrónico nacional
todavía estamos explorando el modelo de predicción que se puede aplicar mejor
en diferentes escenarios. En este documento, probamos y evaluamos dos
sigue siendo muy amplia. Por lo tanto, la buena perspectiva de desarrollo
modelos lineales, tres modelos de aprendizaje automático y dos modelos de atrajo naturalmente a varias empresas de comercio electrónico. Según
aprendizaje profundo, y descubrimos que el aprendizaje automático y los los datos de Tianyancha pro, en noviembre de 2020, hay más de 3,78
modelos de aprendizaje profundo no tienen ninguna ventaja para mejorar la millones de empresas relacionadas con el comercio electrónico en China,
precisión del pronóstico de ventas, pero sobre una base predictiva, los modelos incluidas 570 000 empresas transfronterizas relacionadas con el comercio
funcionan mejor. cuando incluyen información sobre calendario y precio. electrónico. En los primeros 10 meses de 2020 se han sumado más de
95.000 empresas transfronterizas relacionadas con el comercio
electrónico, con un crecimiento interanual del 79,22%. Detrás del rápido
Palabras Clave-Predicción de Ventas; Regresión; Aprendizaje automático; desarrollo de la industria del comercio electrónico se encuentra la feroz
Aprendizaje profundo competencia de muchas empresas pares. Si una empresa quiere
mantenerse firme en una competencia tan feroz, los datos son
yo yoNTRODUCCIÓN fundamentales para ganar. Qué tipo de datos recopilar y cómo procesar
y aplicar estos datos son de gran importancia para convertir a los clientes
En los últimos 10 años, la industria del comercio electrónico en
potenciales en clientes de valor.
China se ha desarrollado rápidamente y aún muestra una tendencia
ascendente constante. Tomando datos de Alibaba y Amazon, dos
famosas empresas de comercio electrónico en el país y en el Independientemente de si se trata de una empresa en línea o fuera de
extranjero, por ejemplo, observando los datos de ingresos y línea, el propósito es proporcionar productos o servicios a la sociedad. Por
crecimiento de ingresos de Alibaba al 31 de marzo de 2015 a 2020, tanto, su producción y toma de decisiones se verá muy afectada por las
se puede encontrar que sus ingresos han seguido creciendo de previsiones de demanda. Para los comerciantes, el cumplimiento oportuno de
76,20 mil millones en 2015 a 509,7 mil millones en 2020, y el los requisitos del cliente para las fechas de entrega y otros aspectos puede
crecimiento de los ingresos de 2015 a 2019 también es estable y va mejorar la satisfacción del cliente y mejorar la competitividad, reducir el
en aumento [1]. En 2020, debido al impacto de la epidemia de inventario corporativo y organizar la producción, y también ayudar a los
COVID-19, la tasa de crecimiento de los ingresos disminuyó, pero los comerciantes a tomar decisiones de precios y promociones más razonables. La
ingresos continúan creciendo. Los datos del informe financiero gestión del transporte también se verá afectada por las predicciones de ventas.
anual de otro gran gigante del comercio electrónico, Amazon, En comparación con la industria minorista tradicional, las empresas de
también muestran una tendencia creciente. Los datos del informe comercio electrónico responden más rápidamente a las necesidades del
anual de Amazon muestran que sus ingresos continuaron mercado y de los consumidores para ganar una posición en la feroz
aumentando constantemente desde 2015 hasta 2019 [2]. competencia del mercado. Por lo tanto, es muy necesario que los comerciantes
de comercio electrónico predigan el volumen de ventas en el futuro.
A nivel nacional, la implementación de la "Ley de Comercio
Electrónico de la República Popular China" el 1 de enero de 2019 y el
ajuste de las políticas de importación minorista de comercio electrónico Los indicadores que afectan el pronóstico de ventas de productos de
transfronterizo muestran el énfasis de China en la industria del comercio comercio electrónico se dividen principalmente en tres categorías. La
electrónico. Además, en la Tercera Sesión del XIII Congreso Nacional primera categoría es el atributo índice característico del producto o

978-1-6654-3873-5/21/$31.00 ©2021 IEEE 410


DOI 10.1109/ECIT52743.2021.00093

Uso con licencia autorizado limitado a: Universidad de Carolina del Este. Descargado el 15 de junio de 2021 a las 17:51:28 UTC desde IEEE Xplore. Se aplican restricciones.
comercial, como información de promoción de productos, precio, ventas diarias, El autor tuvo en cuenta las actividades de promoción. A través de la verificación del caso real
tiempo de operación comercial actual, tasa de elogios de los clientes del producto, de Alibaba, el autor adoptó el modelo de algoritmo GA-BP y la precisión alcanzó el 94%. En
volumen histórico de transacciones, puntaje y nivel de reputación comercial actual, [21], tomando la plataforma de comercio electrónico Taobao (incluido Tmall) como objeto
popularidad de la colección de productos. La segunda categoría son las revisiones de principal, el autor capturó datos de seis campos, a saber, agricultura y ganadería, ropa,
productos y los indicadores derivados, como el tiempo de revisión, la información del bienes de consumo personal, muebles, automóviles de segunda mano y alimentos.
revisor, el texto de la revisión, las calificaciones de estrellas de la revisión, el número Adoptaron el modelo CNN y tomaron el modelo AdaBoost como modelo de comparación, y
de respuestas a la revisión. La tercera categoría es la información de búsqueda de obtuvieron que el modelo de aprendizaje profundo de CNN tenía una mejor precisión de
productos en línea, como el volumen de búsqueda de palabras clave. Este documento predicción y capacidad de generalización. En [22], considerando la baja precisión en la
considera principalmente el impacto de la primera categoría de indicadores en la predicción de ventas de productos de comercio electrónico con datos de muestra pequeños,
predicción de ventas. el autor, basado en los datos de ventas de productos de teléfonos móviles Lenovo ZUK Z2 en
JD Mall, adoptó el modelo de predicción de ventas basado en el algoritmo de aprendizaje
Desde la perspectiva de estudios previos, el modelo lineal [3], el modelo de
integrado XGBoost e integra indicadores multidimensionales para construir el modelo de
aprendizaje automático [4-9] y el modelo de aprendizaje profundo [10, 11] son
predicción basado en el aprendizaje integrado XGBoost. Los resultados mostraron que la
métodos comunes para predecir el volumen de ventas de comercio electrónico.
precisión de predicción de este modelo fue mejor que la combinación de BP, SVM y BP-SVM.

En resumen, queremos comparar si el aprendizaje automático y el En diferentes escenarios de predicción, diferentes algoritmos muestran diferentes ventajas.

aprendizaje profundo pueden predecir las ventas con mayor precisión y si otra Por lo tanto, en este documento, nos centraremos en comparar los efectos de predicción del

información además de la información histórica de ventas puede ayudar a modelo lineal, el modelo de aprendizaje automático y el modelo de aprendizaje profundo.

mejorar la precisión de la predicción. Usamos un conjunto de datos reales diferentes algoritmos muestran diferentes ventajas. Por lo tanto, en este documento, nos

proporcionado por Walmart y usamos los datos de ventas jerárquicos de centraremos en comparar los efectos de predicción del modelo lineal, el modelo de

Walmart para predecir las ventas diarias durante los próximos 28 días. En aprendizaje automático y el modelo de aprendizaje profundo. diferentes algoritmos

términos de ingresos, estos datos cubren tiendas en tres estados de EE. UU. muestran diferentes ventajas. Por lo tanto, en este documento, nos centraremos en

(California, Texas y Wisconsin), incluidos el nivel de producto, el departamento, comparar los efectos de predicción del modelo lineal, el modelo de aprendizaje automático y

la categoría del producto y los detalles de la tienda. Además, cuenta con el modelo de aprendizaje profundo.

variables explicativas como precio, promoción, día de la semana y eventos


especiales. Probamos 2 modelos lineales, 3 modelos de aprendizaje automático tercero DATASET
y 2 modelos de aprendizaje profundo en un conjunto de datos que contenía
datos de ventas de 1941 días. Descubrimos que después de agregar la fecha, el A. Descripción del conjunto de datos
precio y otra información, el rendimiento del modelo sería mejor. Sin embargo,
El conjunto de datos utilizado en este documento es el conjunto de
en comparación con los modelos de regresión lineal simple, los modelos
datos M5 proporcionado por WalMart, que involucra ventas unitarias de
complejos de aprendizaje automático y aprendizaje profundo no tienen
3049 productos, divididos en 3 categorías de productos (Hobby, Alimentos
ventajas en la predicción de ventas.
y Hogar) y 7 departamentos de productos (Hobbies_1, Hobbis_2, Foods_1,
Foods_2, Foods_3, Hogar_1, Hogar_2), donde se descomponen las
II. REXALTADOWORK categorías anteriores. Estos productos se venden en diez tiendas en tres
Muchos estudios previos han aplicado diferentes modelos de predicción y estados (CA California, TX Texas y WI Wisconsin). El conjunto de datos
han obtenido buenos resultados, especialmente los modelos de aprendizaje completo consta de tres conjuntos de datos, a saber, "calendar.csv", que
automático y aprendizaje profundo, que han demostrado ser efectivos en contiene información sobre las fechas de venta de productos;
diferentes problemas [12-18]. En [4] se propone un método de predicción "sell_prices.csv", que contiene información sobre los precios de los
aplicable a la situación sin ningún dato histórico de la cadena de suministro de productos para cada tienda y fecha; "sales_train.csv", que contiene datos
la moda, que se basó en el aprendizaje automático. En [19] se propuso un históricos de ventas unitarias diarias para cada producto y tienda.
modelo de predicción de ventas de productos básicos de demanda a corto plazo
basado en LSTM, que podría aprender la predicción del valor futuro de acuerdo
con la serie temporal de ventas y la calificación emocional de los comentarios. B. Preprocesamiento de conjuntos de datos

En [20] se muestra que el modelo de algoritmo GA-BP basado en la promoción y Preprocesamos este conjunto de datos de la siguiente manera:
los datos históricos de la plataforma de comercio electrónico B2C tenía una
buena adaptabilidad a la predicción de ventas. Apuntando al problema del (1) Hemos resumido las ventas de diferentes productos
pronóstico de ventas de las empresas transfronterizas de comercio electrónico, según sus estados y categorías correspondientes, de manera de
en [5] se propuso un modelo de tres etapas basado en XGBoost. El modelo obtener 9 series temporales diferentes, correspondientes a las
ARIMA-NARNN fue propuesto en [3] para predecir las ventas de comercio siguientes 9 situaciones: cat_id = ALIMENTOS, state_id = CA; cat_id =
electrónico. En nuestro estudio, compararemos aún más la efectividad de estos PASATIEMPOS, state_id = CA; cat_id = HOGAR, state_id = CA; cat_id =
modelos en el problema de pronóstico de ventas. ALIMENTOS, state_id = TX; cat_id = PASATIEMPOS, state_id = TX;
cat_id = HOGAR, state_id = TX; cat_id = ALIMENTOS, state_id = WI;
cat_id = PASATIEMPOS, state_id = WI; cat_id = HOGAR, state_id = WI.
En [19], el autor consideró el pronóstico de ventas a corto plazo basado Predeciremos estas nueve series de tiempo por separado en las
en el sentimiento de las reseñas de los consumidores en las plataformas de siguientes partes.
comercio electrónico. Con base en las ventas históricas y los datos de revisión
en línea de una tienda en línea que vende "cajas de regalo de chocolate de (2) Además de las ventas históricas, también usamos calendario y
varios sabores" en la tienda insignia oficial de Taobao, adoptaron el modelo información relacionada con el precio. Para la información de precios, tomamos el promedio

LSTM y lograron el objetivo de utilizar datos históricos mínimos, esfuerzos de los precios de todos los productos básicos en una determinada categoría en un

manuales de preparación de datos y recursos informáticos y maximizar la determinado estado como una característica de entrada que el modelo puede usar. Para la

precisión de las previsiones de ventas. En [20], el información del evento, no usamos contenido específico del evento, pero

411

Uso con licencia autorizado limitado a: Universidad de Carolina del Este. Descargado el 15 de junio de 2021 a las 17:51:28 UTC desde IEEE Xplore. Se aplican restricciones.
convirtió si un evento ocurrió o no en una variable 0-1 como una A. Modelos lineales
característica de entrada que el modelo puede usar. El método de suavización exponencial es un método
de pronóstico y análisis de series de tiempo desarrollado
C. Visualización de conjuntos de datos sobre la base del método de promedio móvil. Predice el
Mostramos las ventas en CA, TX y WI en la Figura 1-3, futuro del fenómeno calculando el valor de suavizado
respectivamente. En la Figura 1-3, la categoría ALIMENTOS tiene los exponencial con un determinado modelo de pronóstico
mayores volúmenes de ventas en los tres estados ya que tiene la mayor de series temporales. El principio es que el valor de
cantidad de productos. suavizado exponencial de cualquier período es el
promedio ponderado del valor de observación real del
período actual y el valor de suavizado exponencial del
período anterior. A los datos recientes de la secuencia se
les asigna un peso mayor y a los datos anteriores se les
asigna un peso menor. La razón es que, en
circunstancias normales, la influencia del valor de una
variable sobre su comportamiento posterior se atenúa
gradualmente. El primer suavizado exponencial es para
la serie sin tendencia y estacionalidad,
El modelo ARIMA es el modelo estadístico más común
utilizado para el pronóstico de series de tiempo. El modelo
ARIMA es muy simple, requiere solo variables endógenas y
ninguna otra variable exógena.
Figura 1. Ventas en CA.
B. Modelos de aprendizaje automático

El algoritmo de regresión es un algoritmo de aprendizaje


supervisado que se utiliza para establecer la relación de
mapeo entre la variable independiente X y la variable
observada Y. Si la variable observada es discreta, se
denomina clasificación; si la variable observada es continua,
se llama regresión. El propósito del algoritmo de regresión
es encontrar una función hipotética que se ajuste mejor a un
conjunto de datos dado. En el análisis de regresión, si solo
se incluyen una variable independiente y una variable
dependiente, y la relación entre las dos puede aproximarse
mediante una línea recta, se denomina análisis de regresión
lineal unario; si el análisis de regresión incluye dos o más
Figura 2. Ventas en TX. variables independientes, y las variables independientes
tienen una relación lineal, se denomina análisis de regresión
lineal múltiple. Para el espacio bidimensional, la linealidad
es una línea recta,
En esencia, XGBoost sigue siendo un árbol de decisiones de aumento
de gradiente (GBDT), y ambos son métodos de aumento, pero XGBoost es
más rápido y más eficiente que GBDT. La idea central del algoritmo de
XGBoost es: agregar árboles continuamente y realizar divisiones de
funciones continuamente para hacer crecer un árbol. Cada vez que agrega
un árbol, en realidad aprende una nueva función f(x) para ajustarse al
residuo de la última predicción. Cuando obtenemos k árboles después del
entrenamiento, necesitamos predecir la puntuación de una muestra. De
hecho, según las características de esta muestra, cada árbol caerá en un
nodo hoja correspondiente, y cada nodo hoja corresponde a una
puntuación. Finalmente, solo necesita sumar los puntajes
Figura 3. Ventas en WI.
correspondientes a cada árbol para obtener el valor pronosticado de la
muestra.
IV. METROODELAS
Random Forest utiliza el método de conjunto de Bagging (agregación de
En este documento, comparamos el rendimiento de dos modelos lineales, arranque). En Bagging, Random Forest entrenará varios clasificadores de forma
tres modelos de aprendizaje automático y dos modelos de aprendizaje independiente, y cada clasificador se entrena en función de un subconjunto del
profundo. conjunto de datos de entrenamiento. Finalmente, los resultados de predicción de
diferentes clasificadores utilizarán la regla de la mayoría para derivar los resultados
finales de la clasificación. Comparado con cierto

412

Uso con licencia autorizado limitado a: Universidad de Carolina del Este. Descargado el 15 de junio de 2021 a las 17:51:28 UTC desde IEEE Xplore. Se aplican restricciones.
clasificador, el modelo de conjunto no es fácil de cometer errores en una con auto_arima y el modelo óptimo es ARIMA(13, 1, 3), donde 13 es el
sola muestra. número de observaciones de retraso en el modelo, 1 es el número de
veces que se diferencian las observaciones sin procesar y 3 es el tamaño
C. Modelos de aprendizaje profundo de las observaciones en movimiento. ventana promedio. Los modelos
lineales pueden predecir los datos en los próximos 28 días.
El aprendizaje profundo está representado por varias redes
neuronales, en las que utilizamos el Perceptrón multicapa (MLP) y la Antes de usar los modelos de aprendizaje automático, tomamos los
Memoria a largo plazo (LSTM). El modelo MLP que usamos contiene datos rezagados de los 15 días anteriores como entrada. Luego
una capa de entrada, una capa oculta y una capa de salida. Usamos implementamos los modelos de aprendizaje automático con el paquete
256 neuronas y ReLU como función de activación en la capa oculta. scikit-learn. Para cada tipo de modelo de aprendizaje automático, se crea
El modelo LSTM que usamos contiene una capa de entrada, dos un total de 28 modelos separados y cada modelo predice un día. También
capas ocultas (es decir, la capa LSTM) y una capa de salida. Usamos comparamos las diferentes funciones de entrada con y sin información
100 neuronas y ReLU como función de activación en la capa LSTM. de calendario y precios en diferentes ejecuciones.

Preprocesamos aún más los datos históricos de ventas con


estandarización, porque los modelos de aprendizaje profundo son sensibles a
VEEXPERIMENTOS la distribución de datos de entrada. También podemos predecir una secuencia
para los próximos 28 días simultáneamente con los modelos de aprendizaje
A. Configuración
profundo.
Los modelos se implementan con Python 3.7, utilizando scikitlearn como
paquete de aprendizaje automático y TensorFlow como paquete de B. Resultados
aprendizaje profundo. Usamos el tiempo de entrenamiento del modelo y el
Primero mostramos los resultados de la comparación de diferentes
error cuadrático medio (RMSE) para las métricas de evaluación. El conjunto de
características de entrada en la Tabla 1. Se muestran y comparan los
datos entre 2011-01-29 y 2016-04-24 se usa como conjunto de entrenamiento,
resultados con y sin información de calendario y precios. De la Tabla 1,
y el conjunto de datos entre 2016-04-25 y 2016-05-22 se usa como conjunto de
encontramos que con más datos, el modelo funcionará mejor después de
prueba. El objetivo es predecir las ventas en los próximos 28 días.
agregar información como la fecha y el precio. Entonces, los siguientes
resultados usan esta información como entrada por defecto en estos
El modelo Triple Exponential Smoothing se implementa modelos.
con el paquete statsmodels. El modelo ARIMA está afinado

TABLA I. ACOMPARACIÓN DE DIFERENTES CARACTERÍSTICAS DE ENTRADA.

Re lineal Aleatorio
XGBoost
Registro lineal gresión Aleatorio Bosque (+ MLP (+Calen
cat_id id_estado XGBoost (+Calendario MLP
resion (+Calendario Bosque Calendario dar+Precio)
ar+Precio)
r+Precio) + Precio)
ALIMENTOS California 1014.91 829.57 1171.45 1139.99 1110.56 874.81 1158.41 996.76
AFICIONES California 223.16 216.60 229.91 229.25 240.89 217.87 226.12 284.67
FAMILIAR California 347.42 336.69 357.05 347.71 388.61 367.53 690.05 433.77
ALIMENTOS Texas 918.11 881.56 1012.62 967.73 972.21 974.08 774.69 1184.61
AFICIONES Texas 145.56 149.53 157.53 160.14 156.49 151.24 150.98 175.89
FAMILIAR Texas 337.67 352.04 363.77 365.22 340.84 390.68 316.77 336.82
ALIMENTOS Wisconsin 1184.97 1641.85 1829.74 1860.10 1448.37 1440.27 1850.95 1321.45
AFICIONES Wisconsin 116.63 115.80 119.77 128.20 111.99 138.03 155.41 137.64
FAMILIAR Wisconsin 371.75 374.75 325.05 322.82 363.22 351.42 440.20 376.10
Promedio 517.80 544.27 618.54 613.46 570.35 545.10 640.40 583.08

Luego mostramos el rendimiento de diferentes modelos en la Tabla resultados. Desde la perspectiva de una sola serie de tiempo, Triple
2. En la Tabla 2, encontramos que el aprendizaje automático complejo o Exponential Smoothing logró los mejores resultados en cinco series
los modelos de aprendizaje profundo no tienen ventajas. En general, los diferentes, mientras que el modelo LSTM logró los mejores
modelos de regresión lineal simple han logrado la mejor resultados en dos series diferentes.

TABLA II. ACOMPARACIÓN DE DISTINTOS MODELOS.

exponentes triples Re lineal


cat_id id_estado ARIMA Bosque aleatorio XGBoost MLP LSTM
alisado gresión
ALIMENTOS California 850.46 873.04 829.57 1139.99 874.81 996.76 1121.08
AFICIONES California 170.52 263.72 216.60 229.25 217.87 284.67 198.96
FAMILIAR California 282.91 353.08 336.69 347.71 367.53 433.77 428.68
ALIMENTOS Texas 1184.23 1125.19 881.56 967.73 974.08 1184.61 753.52
AFICIONES Texas 138.61 148.23 149.53 160.14 151.24 175.89 159.52
FAMILIAR Texas 334.37 341.08 352.04 365.22 390.68 336.82 322.28
ALIMENTOS Wisconsin 1668.76 1983.60 1641.85 1860.10 1440.27 1321.45 1515.48

413

Uso con licencia autorizado limitado a: Universidad de Carolina del Este. Descargado el 15 de junio de 2021 a las 17:51:28 UTC desde IEEE Xplore. Se aplican restricciones.
AFICIONES Wisconsin 107.04 121.39 115.80 128.20 138.03 137.64 162.66
FAMILIAR Wisconsin 302.45 343.36 374.75 322.82 351.42 376.10 355.83
Promedio 559.93 616.97 544.27 613.46 545.10 583.08 557.56

Finalmente, mostramos los resultados pronosticados de diferentes información en la serie de tiempo que se va a predecir, y luego probó y
modelos para la serie de tiempo de ventas en CA en la Figura 4-6. comparó los modelos de predicción. Nos enfocamos en probar dos
modelos lineales, tres modelos de aprendizaje automático y dos modelos
de aprendizaje profundo. Al observar las dos métricas de rendimiento
del tiempo de capacitación y RMSE, se encuentra que agregar más
información de fecha y precio es útil para la predicción de ventas, pero
los modelos de aprendizaje automático y aprendizaje profundo no tienen
ventajas obvias en la predicción de ventas. Este artículo solo estudia
algunos de los indicadores predictivos en las características de los
atributos del primer tipo de productos o comerciantes. Todavía hay
muchos factores influyentes que no se han tenido en cuenta. Después de
agregar más indicadores que pueden afectar la predicción de ventas de
comercio electrónico, el rendimiento del modelo de predicción de ventas
puede cambiar. Como indicación para futuras investigaciones, el
conjunto de datos utilizado en este artículo no es muy grande. Se puede
explorar más a fondo si existe una diferencia significativa en el
Figura 4. Predicciones para alimentos CA.
rendimiento del aprendizaje automático y el aprendizaje profundo en
conjuntos de datos de diferentes tamaños.

RFERENCIAS
[1] Informe financiero de Alibaba. En línea: http://emweb.eastmoney.com/pc_usf10/
FinancialAnalysis/index?color= web&code=BABA.N. Consultado el 12/12/2020.

[2] Informe financiero de Amazon. En línea: http://emweb.eastmoney.com/pc_usf10/


FinancialAnalysis/index?color= web&code=AMZN.O. Evaluado el 12/12/2020.

[3] Li M, Ji S, Liu G. Pronóstico de ventas de comercio electrónico chino: una


comparación empírica de ARIMA, red neuronal autorregresiva no lineal y
un modelo combinado ARIMA-NARNN [J]. Problemas Matemáticos en
Ingeniería, 2018, 2018.
[4] Kharfan M, Chan VWK, Efendigil T F. Un enfoque de pronóstico basado en datos para
productos de temporada recién lanzados mediante el aprovechamiento de enfoques
de aprendizaje automático [J]. Annals of Operations Research, 2020: 1-16.
Figura 5. Predicciones para pasatiempos de CA.
[5] Ji S, Wang X, Zhao W, et al. Una aplicación de un modelo basado en XGBoost de tres
etapas para el pronóstico de ventas de una empresa de comercio electrónico
transfronterizo[J]. Problemas Matemáticos en Ingeniería, 2019, 2019.
[6] Sharma SK, Chakraborti S, Jha T. Análisis de la predicción de ventas de libros en el
mercado de Amazon en India: un enfoque de aprendizaje automático [J].
Sistemas de Información y Gestión de e-Business, 2019, 17(2-4): 261- 284.

[7] Zhang B, Tan R, Lin C J. Pronóstico del volumen de transacciones de comercio electrónico
utilizando un híbrido de máquina de aprendizaje extremo y algoritmo mejorado de
optimización de llama de polilla [J]. Inteligencia Aplicada, 2020: 1-14.
[8] Tsai KH, Wang YS, Kuo HY, et al. Aprendizaje multifuente para la predicción
de ventas[C]//2017 Conferencia sobre Tecnologías y Aplicaciones de la
Inteligencia Artificial (TAAI). IEEE, 2017: 148-153.
[9] Li J, Wang Y, Zhao X. Método de pronóstico de ventas de productos básicos de empresas
de comercio electrónico [J]. Estadísticas y Decisión, 2018, 12: 176-179.
[10] Bandara K, Shi P, Bergmeir C, et al. Pronóstico de demanda de ventas en
comercio electrónico utilizando una metodología de redes neuronales de
Figura 6. Predicciones para el hogar CA. memoria a corto plazo [C] // Conferencia internacional sobre procesamiento de
información neuronal. Springer, Cham, 2019: 462-474.
[11] Pan H, Zhou H. Estudio sobre redes neuronales convolucionales y su aplicación
VI. CONCLUSIÓN en minería de datos y pronóstico de ventas para comercio electrónico [J].
Electrón. Comer. Res., 2020, 20(2): 297-320.
En este documento, el conjunto de datos que usamos cubre 3 categorías,
[12] Jiang W, Zhang L. Datos geoespaciales a imágenes: un marco de aprendizaje
7 departamentos de productos y un total de 3049 productos, que involucran
profundo para la previsión del tráfico [J]. Ciencia y tecnología de Tsinghua,
diez tiendas en 3 estados. El historial de ventas de estos productos es de 1.941 2018, 24(1): 52-64.
días o 5,4 años. Primero fusionamos el conjunto de datos, fusionamos la
[13] Jiang W. Aplicaciones del aprendizaje profundo en la predicción del mercado de valores:
información correspondiente a la fecha y el precio relacionado progreso reciente [J]. preimpresión de arXiv arXiv:2003.01859, 2020.

414

Uso con licencia autorizado limitado a: Universidad de Carolina del Este. Descargado el 15 de junio de 2021 a las 17:51:28 UTC desde IEEE Xplore. Se aplican restricciones.
[14] Zhao Z, Xu H. Pronóstico a corto plazo del volumen de ventas de productos básicos basado en la [19] Shih YS, Lin M H. Un enfoque LSTM para la previsión de ventas de bienes con
minería de datos de la red de comercio electrónico [J]. Logística Sci-Tech, 2019, 8: 1-7. demandas a corto plazo en el comercio electrónico[C]//Conferencia asiática
sobre información inteligente y sistemas de bases de datos. Springer, Cham,
[15] Wang J. Predicción del volumen de ventas en línea basada en la agrupación de artículos 2019: 244-256.
[J]. Sistemas informáticos y aplicaciones, 2016, 25(10): 162-168. [20] Zhuang Q, Zhang X, Wang P, et al. Un modelo de red neuronal para el pronóstico
[16] Jiang W, Zhang L. Edge-siamnet y edge-triplenet: nuevos modelos de aprendizaje de ventas de comercio electrónico B2C de China basado en factores
profundo para el reconocimiento numérico escrito a mano [J]. IEICE Transactions on promocionales y datos históricos[C]//2019 Conferencia internacional sobre
Information and Systems, 2020, 103(3): 720-723. gestión económica e ingeniería de modelos (ICEMME). IEEE, 2019: 307-312.

[17] Jiang W. Clasificación de series de tiempo: vecino más cercano versus modelos de [21] Rong F, Guo M. Sobre la idoneidad del modelo de predicción de ventas de
aprendizaje profundo [J]. SN Ciencias Aplicadas, 2020, 2(4): 1-17. productos en línea basado en redes neuronales convolucionales [J]. J.
Universidad Northwest Minzu, 2019, 2: 15-26.
[18] Liu S, Li X, Zhao R, et al. Pronóstico de ventas de actividades de promoción del
negocio eléctrico basado en minería de datos[J]. Informática Inteligente y [22] He X, Ma S, Wu Y, et al. Pronóstico de ventas de productos de comercio
Aplicaciones, 2019, 9: 338-340. electrónico con integración de índice multidimensional bajo muestra pequeña
[J]. Ingeniería y Aplicaciones Informáticas, 2019, 55(15): 177-184.

415

Uso con licencia autorizado limitado a: Universidad de Carolina del Este. Descargado el 15 de junio de 2021 a las 17:51:28 UTC desde IEEE Xplore. Se aplican restricciones.

También podría gustarte