Está en la página 1de 9

Machine Translated by Google

Hindawi
Problemas matemáticos en ingeniería
Volumen 2022, ID de artículo 8580561, 8
páginas https://doi.org/10.1155/2022/8580561

Artículo de investigación

Una estrategia de marketing de precisión de la plataforma de comercio electrónico basada en


Análisis del comportamiento del consumidor en la era del Big Data

1
Di Zhang1,2 y Minghao Huang
1
Escuela de Graduados en Gestión de Tecnología, Universidad Nacional de Pukyong, Busan 612022, República de Corea
2
Facultad de Economía y Administración, Hulunbuir College, Inner Mongolia, Hulunbuir 021008, China

La correspondencia debe dirigirse a Minghao Huang; yyz@key.edu.pl

Recibido el 31 de mayo de 2022; Aceptado el 13 de julio de 2022; Publicado 17 agosto 2022

Editor académico: Wenlong Hang

Copyright © 2022 Di Zhang y Minghao Huang. Este es un artículo de acceso abierto distribuido bajo la licencia Creative Commons Attribution License, que permite
el uso, la distribución y la reproducción sin restricciones en cualquier medio, siempre que se cite correctamente la obra original.

Con el fin de desarrollar una estrategia de marketing más eficiente y precisa para el comportamiento de compra de los consumidores, este documento establece
un modelo de valor para el usuario mediante el modelado y el aprendizaje de los datos históricos de los usuarios de las empresas de comercio electrónico. El
algoritmo K-means mejorado se usa para agrupar el comportamiento de compra de los usuarios, y la matriz de valor del cliente se construye a partir de dos
dimensiones de frecuencia de consumo y cantidad de consumo promedio. Finalmente, los usuarios de comercio electrónico se clasifican en cuatro categorías
mediante puntos de marcado. Los resultados de las pruebas muestran que el algoritmo K-means mejorado es estable y eficiente, y el análisis de las características
de agrupación de usuarios es útil para desarrollar estrategias de marketing más precisas.

1. Introducción efecto del marketing, por lo que es una tendencia general introducir
marketing de precisión basado en tecnología de big data en la industria
Debido a la mejora de la capacidad de almacenamiento de la tecnología del comercio electrónico [3, 4].
informática, la cantidad de datos producidos por las personas también La tecnología de minería de datos es popular en países extranjeros
ha aumentado exponencialmente. En este contexto, el modelo de en los últimos años, lo cual es una tendencia para aplicar la tecnología
marketing comercial tradicional es cada vez más incapaz de adaptarse de minería de datos al marketing de precisión. Zhu y Gao [5] estudiaron
al entorno social complejo y cambiante, especialmente la industria del el método de segmentación de clientes basado en minería de datos.
comercio electrónico que depende de Internet. Además, el número de Qiujin et al. [6] trató de reexaminar el marketing de precisión desde la
clientes es grande, por lo que cada vez es más difícil llevar a cabo perspectiva de Internet. Propuso que la tecnología de Internet se puede
actividades de marketing para los clientes. Además, con la mejora usar para ubicar con precisión a los clientes en la implementación del
continua del sistema de compras en línea, la psicología y la forma de marketing de precisión, llevar a cabo actividades de marketing
consumo de los consumidores están cambiando, y el método de específicas para diferentes usuarios y usar el marketing de precisión
marketing tradicional ha estado lejos de satisfacer las necesidades de para lograr el crecimiento de los beneficios empresariales. Wu y Yao
los consumidores actuales [1, 2]. En esta etapa, muchas empresas de [7] estudiaron la aplicación de tecnología de minería de datos en
comercio electrónico no tienen un público objetivo claro en su actividades de marketing. Señaló que la tecnología de minería de datos
comercialización, por lo que todos los usuarios son publicitados y puede proporcionar información más precisa para las empresas y tiene
promocionados en gran cantidad y de manera de cobertura total, lo cierto significado de orientación para que las empresas especifiquen
que hará que los usuarios reciban una gran cantidad de mensajes sin estrategias de marketing, a fin de mejorar las ganancias de las
ninguna diferencia. A la larga, puede conducir a la psicología de empresas. Zhao [8] y Sophie et al. [9] señaló que, en el contexto de los
resistencia del usuario y causar la pérdida de usuarios objetivo. Esto grandes datos, las empresas deben prestar atención a la recopilación
no es solo un desperdicio de recursos y capital, sino que también de datos al realizar actividades de marketing porque el papel de los
conduce a la falta de un método de evaluación cuantitativa para el datos es crucial en la era de los grandes datos y predijo el desarrollo
Machine Translated by Google

2 Problemas Matemáticos en Ingeniería

de minería de datos en el campo del marketing de precisión en el futuro, para guiar el marketing preciso, por otro lado, de acuerdo con los
mientras que Yu [10] estudió la estrategia de marketing basada en el registro comentarios de los consumidores sobre el uso de los resultados de
de datos de usuarios en Internet en el contexto de big data. la minería de datos, continuar ajustando y optimizando los métodos
de análisis de minería de datos
La investigación actual sobre la construcción del comercio electrónico

solo se enfoca en la optimización del procesamiento de datos, y se presta


2.2. Descripción del problema. Este documento establece un nuevo modelo de
poca atención a la optimización de los procesos de minería de datos, como la
valor para el usuario mediante el modelado y el aprendizaje de los datos del
construcción y selección de características de datos. El método tradicional de
historial del usuario de las empresas de comercio electrónico, a fin de ubicar
predicción del comportamiento de compra del usuario es principalmente la
con precisión el grupo de usuarios objetivo de la empresa, lo que es útil para
predicción no automática, que utiliza la acumulación de conocimientos
que las empresas logren el objetivo del marketing de precisión. El modelo de
profesionales en campos relacionados para predecir el comportamiento futuro
valor de usuario tradicional es el modelo RFM. Mientras que los tres indicadores
de los usuarios. La desventaja de este método es que la subjetividad es del modelo RFM, R (tiempo de consumo reciente del usuario), F
demasiado fuerte y la precisión de la predicción no es alta [11, 12]. Además, la
(frecuencia de consumo del usuario) y M (monetario del usuario) no son
clasificación de usuarios obtenida por aprendizaje automático carece de la
aplicables en la industria del comercio electrónico. Además, existe un problema
investigación de estrategia de marketing correspondiente. Por lo tanto, este
natural en el modelo RFM, es decir, puede haber una correlación entre el
documento establece un nuevo modelo de valor para el usuario
modelado
mediantey el
índice F y el índice M. Si un usuario consume con más frecuencia, la suma de
aprendizaje de los datos del historial del usuario de las empresas de comercio
su cantidad de consumo será correspondientemente alta. Sin embargo, en el
electrónico, a fin de ubicar con precisión el grupo de usuarios objetivo de la
modelo tradicional, la importancia de cada indicador es la misma, por lo que el
empresa, lo que es útil para que las empresas logren el objetivo del marketing
poder explicativo de los indicadores para explicar el valor del usuario no es
de precisión. ; En segundo lugar, a través de la construcción de funciones de
fuerte. Por lo tanto, este trabajo establece un nuevo modelo DQMC. Entre ellos:
los datos históricos del usuario, la información de importación de cada función
se obtiene mediante el uso del algoritmo, y las funciones principales se explican
razonablemente, lo que puede proporcionar una guía más efectiva para que
las empresas formulen estrategias de marketing para diferentes usuarios.
D es la diferencia entre la última compra y el intervalo medio entre
compras; Q es la cantidad de compra del usuario en el último período de
tiempo; M es el promedio monetario de los usuarios en el último período; C es
la tasa de conversión de compra de los usuarios en el último período de tiempo.
2. Marketing de precisión basado en minería de datos
Además, el modelo RFM tradicional divide al usuario en varias categorías
2.1. Minería de datos del comportamiento del e núcleo de datos
de forma manual y establece un intervalo para cada categoría. Si el valor de
consumidor. La minería es analizar las características del comportamiento
un usuario cae en una determinada categoría, el usuario pertenece a una
del consumidor, y administrar e investigar los grupos de consumidores con
características comunes en función de las características del comportamiento determinada categoría. Este método de clasificación está muy
factores
influenciado
subjetivos
por
humanos.
del consumidor obtenidas mediante la minería de datos [13]. En el proceso de
Para los mismos datos, diferentes usuarios pueden obtener diferentes
análisis de las características del comportamiento del consumidor, la aplicación
resultados de clasificación, por lo que es difícil tener un estándar para juzgar
de la tecnología de minería de datos sigue el siguiente proceso, como se
si el modelo es bueno. En vista de las deficiencias anteriores, este documento
muestra en la Figura 1:
presenta un algoritmo de agrupación para clasificar a los usuarios. El algoritmo
(1) aclarar el tema y los principales métodos de investigación, combinados de agrupamiento puederesultados
evitar la influencia
y tiene undeíndice
factores
de evaluación
subjetivos en
intuitivo
los y
con las necesidades del desarrollo empresarial, determinar los estable para el modelo. Lo más importante es que la estabilidad del modelo
objetivos de la investigación es sólida, es decir, para el mismo conjunto de datos, se pueden obtener los

(2) De acuerdo con la recopilación de datos, elegimos el sistema de mismos resultados cada vez que se ejecuta el modelo. El proceso de
clasificación de usuarios de la industria del comercio electrónico se muestra
índice de comportamiento del consumidor apropiado
en la Figura 2:
(3) La preparación de datos incluye la selección de datos y la limpieza de
datos, debido a que hay tantos comportamientos de los consumidores
que se pueden estudiar, es necesario seleccionar el modelo de (1) Recopilar datos de transacciones relacionados con usuarios en la
comportamiento del consumidor de acuerdo con la disponibilidad de industria del comercio electrónico, preprocesar los datos, eliminar
datos. los datos anormales en el conjunto de datos y luego estandarizar los

(4) De acuerdo con los diferentes objetivos de minería de datos y las datos en el conjunto de datos después del preprocesamiento.

características de los datos en sí, se pueden usar y mejorar diferentes (2) Calcular los valores de D, Q, M y C por datos, y se forma la matriz de
algoritmos de minería sobre la base del algoritmo original. valor de los usuarios.

(3) Calcular la importancia de cada índice en la matriz por análisis de


(5) Analizar los datos para prepararse para el establecimiento del modelo. componentes principales como el valor de ponderación del índice.

(6) Establecer el modelo, analizar cada índice de datos en el modelo y (4) El algoritmo de agrupamiento se usa para agrupar la matriz y se
finalmente obtener los resultados de la investigación obtienen las categorías de usuario correspondientes.

(7) De acuerdo con los resultados de la minería de datos, por un lado, es (5) Utilice el peso con el valor calculado en el tercer paso para calcular el
necesario plantear estrategias específicas valor de cada categoría y cada usuario.
Machine Translated by Google

Problemas Matemáticos en Ingeniería 3

Conclusión
Índice De Extracción De Consumidor
Monitor
modelo de comportamiento

Algoritmo de minería de datos


Estudio de problemas Análisis de los datos Modelado
Selección

retroalimentación y
Preparación de datos
Mejoramiento

Figura 1: Minería de datos del comportamiento del consumidor.

Datos del usuario

Registros de consumo Atributo de usuario Comentarios del usuario

Minería de texto y datos


Análisis

Agrupación
D q METRO C
Algoritmo Retrato de usuario

Agrupación Comparativo Valor de usuario


Resultados Verificación

Resultado final

Figura 2: Clasificación de usuarios.

(6) Utilice el valor de usuario para verificar el efecto de agrupación.

(7) Para cada categoría, según las características de Tabla 1: Propiedades del conjunto de datos.
usuarios, se proponen estrategias de marketing específicas para
Atributo Describir
lograr un marketing de precisión.
Identificación de usuario
)e identidad del usuario
Comentario Datos de comentarios de usuarios sobre productos
3. Establecimiento del Modelo de Clustering
identificación de la mercancía Identificación de mercancías
Producto
3.1. Preprocesamiento de datos. ) se utilizan dos tipos de conjuntos de datos Identificación de la categoría de producto
categoría
en este documento, uno es un conjunto de datos de comentarios de usuarios y el otro es
Descripción del comportamiento del usuario, como
conjunto de datos de comportamiento del usuario. )e valores de atributo de estos dos Comportamiento del usuario
haga clic, recoger, comprar.
Los conjuntos de datos se describen en la Tabla 1.
Marca de tiempo Cuando se produce el comportamiento del usuario
De acuerdo con los atributos del conjunto de datos, los pasos previos al Cantidad de )e cantidad de dinero que consume un usuario
procesamiento son el procesamiento de valores faltantes, la estandarización de datos dinero cuando hace una compra
y la selección de características.

muestras aumenta, el método de interpolación media puede mejorar


3.1.1. Procesamiento de valores perdidos. Para este conjunto de datos, principalmente garantizar la autenticidad de los datos.
use dos métodos para lidiar con los valores faltantes. Uno es la eliminación,
cuando el número de valores faltantes de un atributo es menor
del 5%, eliminamos directamente los valores que faltan. )e segundo es 3.1.2. Estandarización de datos. Debido a que algunos atributos en el
el método de interpolación media. Si el número de desaparecidos el conjunto de datos no tiene máximos y mínimos obvios
valores es demasiado grande, utilizaremos la interpolación media o modal para el tipo valores, es difícil asegurar que el conjunto de datos estandarizados

de indicador estadístico de atributo. conserva la información del conjunto de datos original si el min max
)El método de eliminación simple es conveniente y efectivo se utiliza el método. )Por lo tanto, se utiliza el método de normalización

y es adecuado para la mayoría de los datos de muestra. cuando el numero de para estandarizar el conjunto de datos.
Machine Translated by Google

4 Problemas Matemáticos en Ingeniería

El método Z-score es el más utilizado, que es diferente del método comportamiento de consumo. Sin embargo, en el mismo período de
min max anterior, y el conjunto de datos original debe normalizarse a la tiempo, las dos variables de frecuencia de consumo y cantidad de consumo
zona [0, 1]. Sin embargo, el resultado final no siempre está en este rango. total tienen multicolinealidad, por lo que este documento transforma la
Supongamos que hay un conjunto de para normalizar esta secuencia, cantidad de consumo total en la cantidad de consumo promedio. Dado que
fórmula es la siguiente: secuencias x1, x2, x3, . . . , xn , la los datos de consumo provienen del mismo centro comercial, de acuerdo
con la identificación de membresía del consumidor, el backstage del centro
xi ÿ x comercial puede obtener la cantidad de consumo promedio a través del
yi ÿ ,
s resumen de los registros de consumo, y los datos se pueden rastrear
norte muchas veces, lo que conduce a los comerciantes para recuperar la
1
xn cantidad de consumo promedio en diferentes períodos de tiempo de
xi,
_
iÿ1 (1) acuerdo a las diferentes necesidades. Además, se pueden obtener más
ÿÿÿÿÿÿÿÿÿÿÿÿÿÿ

grupos de clientes mediante la segmentación de clientes a partir de las


1
norte

2 tres dimensiones de intervalo, frecuencia y cantidad. Por lo tanto, se


s_ xi ÿ x .
nÿ1 seleccionan dos dimensiones de frecuencia de consumo y cantidad de
iÿ1
consumo promedio para simplificar el resultado de la segmentación de
clientes, de modo que todos los clientes estén dispersos en la matriz
Después de la normalización, el valor medio de la secuencia se vuelve bidimensional de valor del cliente como se muestra en la Figura 3.
0 y la varianza es 1, por lo que se logra el propósito de eliminar la
dimensión de datos.

Los usuarios se agrupan de acuerdo con los cuatro índices anteriores.


3.1.3. Selección de características. En este documento, se utiliza el análisis
La matriz de índice de usuario construida en este documento considera cada
de componentes principales para calcular el peso de cada índice.
fila como un punto en un espacio de 4 dimensiones. Debido a que el tamaño
El análisis de componentes principales es un método para simplificar
del conjunto de datos utilizado en este documento es pequeño, se adopta el
conjuntos de datos. Es imposible obtener una serie de variables de
algoritmo de K-medias después de considerar la velocidad de ejecución y la
correlación lineal por transformación lineal:
dificultad de interpretación del modelo.
(1) Centralizar los datos sin procesar, que consiste en hacer que cada Antes de la agrupación, el valor de cada usuario se calcula de la siguiente
punto de datos reste el valor medio de su categoría. manera:

(2) Resuelva la matriz de covarianza de la característica. Si hay n


características en los datos originales, la matriz de covarianza V ÿ w1 × D + w2 × Q + w3 × M + w4 × C, (4)
formada es una matriz de n orden. Para los cuatro indicadores D,
Q, M y C de este documento, la matriz de covarianza formada donde (w1, w2, w3, w4) es el valor propio obtenido por análisis de
componentes principales, y V es la matriz de valor del usuario.
por estos cuatro indicadores es la siguiente:
cov(D, D) cov(D, Q) cov(D, M) cov(D, C) Después de la agrupación, la matriz de valor de usuario de cada categoría
cov(Q, D) cov(Q, Q) cov(Q, M) cov(Q, C) se calcula de acuerdo con la fórmula (4).
cov ,
cov(M, D) cov(M, Q) cov(M, M) cov(M, C)
ÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿ

cov(C, D) cov(C, Q) cov(C, M) cov(C, C) ÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿÿ

3.2.2. Agrupación de K-Means. Para resolver el problema anterior de cómo


(2) distinguir los tipos de clientes, en este artículo, basado en la matriz de
valor, se propone el método de cambiar el punto central inicial en el
donde cov es la covarianza, y si las dos variables entre paréntesis agrupamiento de K-means. ) El punto central inicial está limitado en
son iguales, es la varianza de sí mismo. diferentes regiones, es decir, diferentes tipos de clientes se ubican en la
matriz de valor y las categorías de clientes se distinguen por puntos de
(3) Descomposición de valores propios.
marcado.
Para resolver los autovalores y autovectores de la matriz de
covarianza anterior, se obtendrán cuatro autovalores, y cada Si los clientes se agrupan en clase k, suponiendo que hay una clase en la abscisa y
autovalor corresponde a un indicador. )La fórmula es la siguiente: una clase b en la ordenada, a × b ÿ k. Encuentre la coordenada máxima (xmax, ymax) y la
cw ÿ ÿw,
coordenada mínima (xmin, ymin ). Primero, la abscisa de los puntos centrales de diferentes
(3) categorías de regiones se puede obtener de acuerdo con la siguiente fórmula:

donde W representa una matriz compuesta de vectores propios


y ÿ representa el vector columna compuesto de valores propios.
(4) )Se toma el valor propio correspondiente de cada índice xmáx ÿ xmín
Xkij _ · i + xmín
a

como el peso de cada índice. 1


xmáx ÿ xmín ·
(5)
ÿ

a 2
3.2. Agrupación de usuarios basada en K-Means mejorados
xmáx ÿ xmín
ÿ
1 yo - + xmín.
3.2.1. Matriz de valor. La segmentación de clientes generalmente se basa a 2
en el intervalo, la frecuencia y la cantidad de
Machine Translated by Google

Problemas Matemáticos en Ingeniería 5

Alto

2/b
Monto
Consumidor Alta calidad
Clientes Clientes K12 K22
Consumo
medio

1/B

Cliente Incierto Clientes Recurrentes K11 K21

Bajo Alto 0 1/A 2/A A


Frecuencia de consumo
Figura 3: Matriz de valor del cliente. Figura 4: Punto central regional.

Se seleccionan plantas de cáncer de mama e iris en la base de datos de la UCI


Del mismo modo, las ordenadas obtenidas son las siguientes: para el experimento, y el método de agrupación espectral

ymax ÿ ymin 1 comúnmente utilizado en investigaciones relacionadas se utiliza para comparar


·j- + ymín. (6) con el algoritmo K-means en este documento. Mucha literatura ha propuesto
ykij _ segundo 2
evaluación de calidad interna y métodos de evaluación de calidad relativa
Por lo tanto, las coordenadas del punto central de la región de para el algoritmo de agrupamiento.
agrupamiento kij son las siguientes: para evaluar los resultados del agrupamiento no supervisado. sin embargo, el
xmáx ÿ xmín · 1 ymax ÿ ymin 1 La compacidad y el rendimiento de separación de estos indicadores de
yo + xmín, ·j- + ymín .
a -2 segundo 2 evaluación son únicos, y el efecto de medición
(7) es unilateral. )Por lo tanto, es necesario evaluar la
agrupar los resultados de manera integral por el índice general
Como se muestra en la Figura 4, suponiendo que k ÿ 4, entonces a ÿ 2 que puede medir la compacidad y la separación en el
y b ÿ 2. Según la fórmula (7), cuatro centros regionales Mismo tiempo.
Se pueden obtener k11, k12, k21 y k22 . El coeficiente de Silhoustte s(i) considera tanto la compacidad
)en el punto central inicial del algoritmo K-means es y separación, y su cálculo se muestra en
generado aleatoriamente en la región correspondiente. )es no puede
ai)
solo asegurar la implementación efectiva, no simplemente arreglar el 1- , a(yo) < b(yo),
punto central de agrupamiento inicial en el punto central regional, bi)

hacer que los resultados de la agrupación sean más dinámicos, pero también distinguir
diferentes tipos de clientes según el posicionamiento. s(yo) ÿ ÿÿÿÿÿÿÿÿÿÿÿÿ
0, a(i) ÿ b(i), (8)
El algoritmo de agrupamiento K-means utiliza la distancia euclidiana para
calcular la distancia entre cada punto y el centro bi)
punto de agrupamiento: ÿ 1, a(yo) > b(yo),
ÿÿÿÿÿÿÿÿÿÿÿ

ai)
(1) Encuentre el valor máximo de todos los puntos (xmax, ymax)
donde ai representa la distancia promedio entre la muestra i
y mínimo (xmin, ymin ), inicializar k puntos
y otras muestras en su clase C. )cuanto más pequeño es ai , más
alrededor de kij como centroides de agrupamiento
muestra debería pertenecer a esta categoría. bi representa el
(2) Cada punto se asigna al clúster correspondiente
valor mínimo en bij de la distancia media entre
de acuerdo con su distancia euclidiana desde el baricentro
muestra i y todas las muestras en una determinada clase Cj. )e mayor bi es,
(3) Calcule el valor promedio en cada grupo como el nuevo menos muestra I pertenece a otras clases. )por lo tanto, el valor
centroide del grupo y regrese al paso (2) de s(i) está entre ÿ1 y 1, y cuanto más cerca está s(i) de 1, más
más razonable es el clúster.
(4) Juzgue si el centroide ha cambiado. Si lo hace
no cambia, el agrupamiento ha convergido; de lo contrario,
volver al paso (2) 4.2. Resultados de evaluación
(5) Salida de los resultados de agrupamiento
4.2.1. Análisis de Eficiencia de Clúster. Para clasificar
usuarios de comercio electrónico con mayor precisión, la situación de agrupamiento
4. Experimentos y Resultados bajo diferentes números de grupo se discute. )los resultados son

4.1. Eficacia del algoritmo de agrupamiento se muestra en la Figura 5.


Según la regla del codo, cuando el número de
4.1.1. Índice de Evaluación. Para comprobar la eficacia categorías aumenta, el grado de distorsión promedio será
del algoritmo en este documento, dos conjuntos de datos de prueba estándar, más y más bajo, pero el efecto de mejora será
Machine Translated by Google

6 Problemas Matemáticos en Ingeniería

0.50 100

1.5
1.4 80
1.3 0,45
1.2
60
1.1 Coeficiente
silueta
de

1.0
Agrupación
tiempo
de

0.40
.9 40
.8
.7
20
.6 0.35
.5
.4 0
.3 2 345678
.2 Número de grupos K
.1
Coeficiente de silueta
.0
1 2345 6789 Agrupación de tiempo

Grado de distorsión promedio Figura 6: Eficiencia de agrupamiento bajo el conjunto de datos de cáncer de mama.

Figura 5: Grado de distorsión bajo diferente número de grupos.

100 0.40
cada vez más pequeño, por lo que el punto de inflexión obvio en el gráfico es
el mejor valor del número de conglomerados. Según la Figura 5, cuando el
número de conglomerados es 5, existe un punto de inflexión evidente. La 80
0.38
eficiencia de agrupación del algoritmo con diferente número de agrupaciones
se muestra en las Figuras 6 y 7.
60
Agrupación
tiempo
de
0.36 Coeficiente
silueta
de

Con el aumento del número de clústeres, el tiempo de ejecución de


diferentes conjuntos de datos del algoritmo de agrupamiento de K-means 40
0.34
aumenta linealmente. Después de probar varios grupos de conjuntos de datos,
el tiempo de procesamiento del algoritmo de agrupamiento mejorado para 500 20
grupos de datos se mantiene en alrededor de 0,3 segundos, y el coeficiente 0.32
de contorno también se mantiene entre 0,35 y 0,5. De acuerdo con la definición
0
de coeficiente de contorno, cuanto más se acerque su valor a 1, más razonable
2 345678
será el agrupamiento. Cuando los datos se dividen en cuatro categorías, el
Número de grupos K
coeficiente de contorno es el más grande. Por lo tanto, es razonable dividir a
los usuarios en cuatro categorías. Coeficiente de silueta
Agrupación de tiempo

Figura 7: Eficiencia de agrupamiento bajo el conjunto de datos de plantas de iris.


4.2.2. Comparación de diferentes algoritmos. diferentes e operación de
algoritmos se muestra en la Tabla 2.
Se puede ver en la Tabla 2 que primero, en términos de precisión de
Tabla 2: Funcionamiento del algoritmo.
agrupación, las tasas de precisión de K-medias en dos conjuntos de datos son
Cáncer de mama plantas de iris
85,4% y 89,3%, respectivamente, que tienen un buen efecto de agrupación.
Las tasas de precisión del agrupamiento espectral son del 66,7 % y el 90 %, Tasa de Tiempo Tasa de
Tiempo (ms)
respectivamente, y el efecto del agrupamiento es más inestable que las medias precisión (%) (ms) precisión (%)

K; en segundo lugar, el tiempo de ejecución de K medias en los dos conjuntos K-medias 85.4 19.8 89.3 21,9

de datos es de 19,8 ms y 21,9 ms, mientras que el del agrupamiento espectral


66.7 103.8 90,0 118.1
es de 103,8 ms y 118,1 ms, respectivamente, lo que puede verse claramente Agrupamiento espectral

que el tiempo de ejecución del agrupamiento espectral es más de cinco veces


la del algoritmo K-means, y la eficiencia de agrupamiento es baja. Esto se eficiente para dividir el comportamiento del cliente según las necesidades del
comercio electrónico.
debe principalmente a que el algoritmo de agrupamiento espectral involucra la
matriz de similitud entre los datos y no puede mostrar una mejor precisión y
eficiencia de agrupamiento cuando la dimensión del conjunto de datos es alta. 4.3. Clasificación de usuarios

Sin embargo, la plataforma de comercio electrónico tiene un gran volumen de 4.3.1. Datos experimentales. Los datos utilizados en este documento provienen
transacciones, una gran escala de datos y dimensiones complejas, lo que de los datos de ventas de una tienda de ropa en la plataforma Taobao desde
requiere una alta eficiencia de agrupación. por lo tanto, es más noviembre de 2020 hasta junio de 2021, por un total de 57666 artículos.
Machine Translated by Google

Problemas Matemáticos en Ingeniería 7

Rasgo D (unidad: día) Q (unidad: pieza) M (unidad: Yuan) C (unidad:%)

Promedio Máximo mínimo Promedio Máximo mínimo Promedio Máximo mínimo Promedio Máximo mínimo
Categoría

Clase I 4.6 89 -111 2.03 5 1 29.1 149.5 0.01 5.7 8.9 3.7

Clase II 33.7 90 -1 1.18 3 1 20 53.7 0.01 1.8 3.7 0.15

Clase III 22.7 89 -1 1.37 5 1 77.7 149.5 47.2 24,9 40 18.6

Clase IV 107.6 179 10 6.2 20 4 121.3 158.5 74.5 56 100 41.2

Figura 8: Puntuaciones de valor )e de varios tipos de clientes.

La composición de datos proviene de dos aspectos: atributo de usuario y la cantidad de consumo son mucho más bajos que el promedio
datos y datos de ventas. Los datos de atributos de usuario incluyen los del comprador. valor. )Este tipo de usuarios pertenecen a los usuarios potenciales de las tiendas,
apodo, género, edad, grado de consumo, nivel de ciudad, universidad y no tienen un propósito claro en las actividades de compra. En
alumno, tipo de conducta, etc.; los datos de ventas incluyen los datos del comprador Además, este tipo de usuarios tienen una lealtad insuficiente a las tiendas,
apodo, fecha de pago, fecha de entrega, hora de finalización, pago por lo que su ciclo de compra y cantidad de consumo son pequeños.
importe, cantidad de compra, estado del pedido, provincia, ciudad y Sin embargo, si la estrategia de marketing dirigida correcta es
pronto. Para poder analizar más el funcionamiento de la tienda adoptado para tales usuarios, habrá potencial para que ellos
completamente, se recogen 11000 comentarios de usuarios de la convertirse en usuarios leales; para el segundo tipo de usuarios, cada índice es
tienda en 2021 a través del rastreador. inferior al valor medio del índice. ) es un tipo de usuarios
es de poco valor para las tiendas y puede haberse perdido. )por lo tanto, el
el primer tipo de usuarios se denomina clientes perdidos; para el tercer tipo
4.3.2. Análisis de la función de agrupamiento. )e resultados del clúster
de los usuarios, a excepción de que el índice D es bajo, los otros indicadores
El análisis muestra que es razonable dividir a los usuarios en cuatro
están básicamente por encima del índice promedio. ) es tipo de usuarios es
categorías. ) Las puntuaciones de valor de varios tipos de clientes son
importante para la tienda, pero existe cierto riesgo de pérdida.
se muestra en la Figura 8.
Por lo tanto, este tipo de usuarios se define como el foco a recuperar.
En la tabla anterior se puede ver que para la función D,
usuarios; para el cuarto tipo de usuarios, los indicadores son básicamente
describe si el usuario está en el tiempo normal de compras.
superior al valor medio de los indicadores, lo que indica que
Cuando el valor es negativo, significa que el normal
tales usuarios son leales a la tienda y son usuarios de alto valor de
se ha superado el ciclo de compra. ) cuanto mayor sea el valor, el la tienda.
queda más tiempo normal de compra. De acuerdo con la
valor promedio de la característica D en la tabla, usuarios en los cinco 5. Conclusión
categorías se encuentran actualmente en el ciclo de compra normal, pero
el valor de la cuarta clase de usuarios es grande, el valor de la )is paper clasifica a los clientes de la plataforma de comercio electrónico por datos
otras tres clases de usuarios es pequeño, y el valor mínimo tecnología minera, calcula el valor de cada tipo de
de la característica D se puede ver que la primera, la segunda y la clientes, y formula diferentes estrategias de marketing para
todas las terceras clases tienen el fenmeno de exceder el diferentes tipos de clientes. Un nuevo modelo de valor para el usuario es
ciclo normal de compras, lo que muestra que la cuarta clase es establecido. ) El algoritmo K-means mejorado se usa para
similar a la quinta categoría en términos de calidad. agrupar el comportamiento de compra de los usuarios, y el cliente
Para la característica Q, describe el número promedio de usuarios las categorías se distinguen por puntos de marcado. )e prueba
compras en el período estadístico. A partir de los datos medios de Los resultados muestran que el algoritmo es eficiente, y cuando los datos
característica Q, podemos ver que la cuarta categoría tiene la mayor se dividen en cuatro categorías, el coeficiente de contorno es el
número de compras, superando con creces el valor medio de la más grande, por lo que es razonable dividir a los usuarios en cuatro categorías.
otras tres categorías. )por lo tanto, la cuarta clase de usuarios )a través del análisis de conglomerados del comportamiento del consumidor, puede
pueden ser usuarios leales de la tienda. ayudar a la plataforma de comercio electrónico a atraer clientes potenciales,
Para la característica M, describe la compra promedio de los usuarios mantener clientes de alto valor y analizar las razones de
en el período estadístico, lo que se puede ver en los datos de rotación de clientes, a fin de formular estrategias de marketing más precisas
la tabla anterior que los valores de la tercera y cuarta
estrategias.
categorías son mucho más grandes que las de los otros tres Sin embargo, este documento incluyó diferentes categorías de
categorías, especialmente los valores medios y mínimos. usuarios para la agrupación, sin estadísticas específicas del número
Para la característica C, describe la tasa de conversión de compra de usuarios en cada categoría. )es parte de la investigación será
de usuarios De los datos de la tabla anterior, se puede ver que realizado en el trabajo de seguimiento.
la tasa de conversión de compra de los tipos tercero y cuarto de
usuarios es alta, que pueden ser usuarios leales. Disponibilidad de datos

Se puede acceder al conjunto de datos previa solicitud al autor de correspondencia.


4.3.3. Estrategia de marketing de precisión. Al comparar el valor promedio de
cada tipo de índice de usuario con el valor promedio
de todos los indicadores de datos, se puede ver que para el primer tipo de Conflictos de interés
usuarios, su cantidad de compra y tasa de conversión son todos
más alto que el valor promedio, pero el ciclo de compras normal )Los autores declaran no tener conflictos de interés.
Machine Translated by Google

8 Problemas Matemáticos en Ingeniería

Referencias
[1] X. Liu y Y. Yang, "Investigación sobre la aplicación del marketing de
precisión en el comercio electrónico [J]", Modernización del centro
comercial, vol. 23, núm. 05, págs. 25 a 27, 2022.
[2] DJ Kim, D. Park y JS Park, “Estudio sobre el cambio de la estrategia de
marketing a través de la técnica de minería de datos”, Korea Business
Review, vol. 22, núm. 2, págs. 177–194, 2018.
[3] Z. Chen, Y. Hu y X. Gu, "Investigación sobre la aplicación del algoritmo de
agrupamiento en la segmentación de clientes de telecomunicaciones [J]",
Aplicaciones informáticas, vol. 12, núm. 10, págs. 56 a 61, 2007.
[4] J. Li Zheng y Z. Wu, "Investigación sobre la segmentación de clientes de
comercio electrónico basada en el algoritmo k-means mejorado"
Diario de la Universidad China de metrología, vol. 31, núm. 04, págs. 482–
489, 2020.
[5] G. Zhu y X. Gao, "Estrategia de marketing minorista de precisión basada en
el modelo de marketing digital", Science Journal of Business and
Management, vol. 7, núm. 1, págs. 33 a 37, 2019.
[6] Z. Qiujin, D. Zhixia, Z. Haitang y X. Anxin, "Un estudio sobre la influencia del
marketing de Wechat en las actitudes de los consumidores de
supermercados", Revista de Matemáticas Interdisciplinarias, vol. 19, núm.
5 y 6, págs. 1077 a 1093, 2016.
[7] Y. Wu y B. Yao, "Investigación empírica sobre la estrategia de mercadeo en
red basada en tecnología de minería de datos", Revista de la Universidad
de Artes y Ciencias de Baoji, vol. 41, núm. 01, págs. 18 a 22, 2021.
[8] L. Zhao, “El impacto de la investigación de mercado basada en grandes
datos sobre la formulación de estrategias de marketing”, Time Honrado
Brand Marketing, vol. 16, núm. 09, págs. 95-96, 2021.
[9] H. Sophie, H. Carolina y C. Efthymios, “La transformación electrónica del
marketing de datos: cómo una lente ética en la recopilación de datos del
consumidor da forma al futuro del marketing”, Sustainability, vol. 13, núm.
20, 2021.
[10] H. Yu, "Investigación sobre el impacto del marketing de precisión en el
comportamiento de intención de compra de los consumidores -- Basado
en compras en línea", Modern Marketing, vol. 8, núm. 02, págs. 55–57, 2022.
[11] S. Ren, Análisis del comportamiento del usuario de la red basado en Big
Data Universidad de correos y telecomunicaciones de Beijing, Beijing,
China, 2015.
[12] H. Liu, H. Lu, J. Ruan, B. Tian y S. Hu, “Investigación sobre el modelo de
segmentación de marketing de precisión basado en el “perfil de usuario”,
Mining [J]Silk, vol. 52, núm. 12, págs. 37 a 42, 2015.
[13] C. Yu, Z. Zhang, C. Lin y YJ Wu, “¿Puede el marketing de precisión basado
en datos promover los clics de AD de los usuarios? Evidencia de publicidad
en momentos de WeChat”, Industrial Marketing Management, vol. 90,
págs. 481–492, 2020.
Los
derechos
de
autor
problemas
matemáticos
en
ingeniería
son
propiedad
de
Hindawi
Limited
ysu
contenido
no
puede
copiarse
ni
enviarse
por
correo
electrónico
a
varios
sitios
ni
publicarse
en
un
servidor
de
listas
sin
el
permiso
expreso
por
escrito
del
titular
de
los
derechos
de
autor.
Sin
embargo,
los
usuarios
pueden
imprimir,
descargar
oenviar
artículos
por
correo
electrónico
para
uso
individual.
Machine Translated by Google

También podría gustarte