Está en la página 1de 7

Traducido del inglés al español - www.onlinedoctranslator.

com

hindú
Problemas Matemáticos en Ingeniería
Volumen 2020, Artículo ID 8884227, 7 páginas
https://doi.org/10.1155/2020/8884227

Artículo de investigación

Un estudio empírico sobre segmentación de clientes por comportamientos


de compra utilizando un modelo RFM yk-Algoritmo de medios

junio wu,1,2li shi,1Wen-Pin Lin,3Sang Bing Tsai,4Yuan Yuan Li,2liping yang,2


y Guangshu Xu5
1Facultad de Ciencias y Tecnologías de la Información, Universidad de Tecnología Química de Beijing, Beijing 100029, China
2Escuela de Economía y Gestión, Universidad de Tecnología Química de Beijing, Beijing 100029, China
3Departamento de Marketing, Facultad de Administración de Empresas, Universidad de Baise, Baise, Guangxi, China
4Centro Regional de Investigación para el Desarrollo de la Economía Verde, Escuela de Negocios, Universidad de Wuyi, Wuyishan 354300, China
5Escuela de Logística, Universidad Wuzi de Beijing, Beijing 101149, China

La correspondencia debe dirigirse a Wen-Pin Lin; ibm.andy@163.com y Sang-Bing Tsai; cantando@hotmail.com

Recibido el 31 de agosto de 2020; Revisado el 27 de octubre de 2020; Aceptado el 3 de noviembre de 2020; Publicado 19 noviembre 2020

Editor académico: Yi-Zhang Jiang

Derechos de autor © 2020 JunWu et al. /is es un artículo de acceso abierto distribuido bajo la licencia Creative Commons Attribution License, que
permite el uso, la distribución y la reproducción sin restricciones en cualquier medio, siempre que se cite correctamente la obra original.

En este artículo, basamos nuestra investigación en el tratamiento de un problema del mundo real en una empresa. Un modelo RFM (recencia,
frecuencia y monetario) yk-El algoritmo de agrupación de medios se utiliza para realizar la segmentación de clientes y el análisis de valor mediante el
uso de datos de ventas en línea. Los clientes se clasifican en cuatro grupos en función de sus comportamientos de compra. Sobre esta base, se
plantean diferentes estrategias de CRM (gestión de relaciones con el cliente) para obtener un alto nivel de satisfacción del cliente. La eficacia de nuestro
método propuesto en este documento está respaldada por los resultados de mejora de algunos índices clave de rendimiento, como el crecimiento de
clientes activos, el volumen total de compras y la cantidad total de consumo.

1. Introducción aplicaciones En cuanto a las aplicaciones, incluye banca y finanzas


[5, 6], comercio minorista [7], telecomunicaciones y seguros [8–12].
En el mundo del comercio electrónico, las compras en línea se han convertido
en el patrón comercial más popular en China. Las estadísticas muestran que En la investigación de Ngai et al. [4], se utilizaron herramientas de
las ventas minoristas nacionales en línea alcanzaron los 10.632,4 mil millones minería de datos para analizar los datos de los clientes dentro de un
de RMB en 2019. En un entorno en línea de este tipo, los comportamientos de marco CRM. La minería de datos puede extraer información útil para
compra de los clientes cambian dinámicamente. Por lo tanto, las empresas de analizar el comportamiento y las características de los clientes. Por lo
venta necesitan una excelente estrategia de marketing orientada al cliente tanto, es de gran importancia para las empresas que esperan adquirir y
para predecir los comportamientos en línea de los clientes en función de la retener clientes potenciales, ayudándolas a maximizar el valor del cliente
extracción de datos. y respaldando sus decisiones de gestión de clientes y estrategia de
La minería de datos, que puede descubrir conocimiento oculto de gran mercado. Sin duda, la aplicación de la minería de datos en el dominio
relevancia a partir de enormes cantidades de datos de transacciones en línea, CRM es una tendencia emergente en la era de la economía de los
es el método más adecuado para el análisis del comportamiento de compra grandes datos. Uno de los modelos de minería de datos más utilizados es
del cliente. En particular, en la era actual de big data, se considera que la el clustering o segmentación, que divide a los clientes en grandes grupos
minería de datos tiene amplias perspectivas de aplicaciones en toda la en función de la similitud [4].
industria. Ha habido muchas teorías excelentes sobre la minería de datos con En este documento, basamos nuestra investigación en datos del
amplias aplicaciones industriales en las últimas dos décadas. Los lectores mundo real de una empresa en Beijing, China. Realizamos segmentación
interesados pueden consultar las referencias [1–4]. Proporcionan revisiones de clientes y proponemos estrategias de gestión combinando RFM yk
exhaustivas de las técnicas de minería de datos y sus aplicaciones industriales. -significa métodos. Con los datos de transacciones en línea recopilados
desde noviembre de 2017 hasta abril de 2019, creamos
2 Problemas Matemáticos en Ingeniería

un conjunto de datos estandarizados para su posterior análisis. teoría para establecer reglas de clasificación de clientes [14]. Chiang
Sobre esta base, utilizamos un modelo RFM yk-Algoritmo de medios propuso un modelo RFMDR (basado en un modelo RFM/RFMD), una
para realizar segmentación de clientes y análisis de valor. Luego se versión extendida del análisis RFM, para identificar clientes de compras
utiliza un método PCA para determinar el peso de los indicadores en línea valiosos para la industria y generar reglas de asociación difusa
RFM. Los clientes se clasifican en cuatro grupos en función de sus [17]. Kolarovski et al. han propuesto un método de modelado novedoso
comportamientos de compra. Sobre esta base, se plantean para los servicios postales utilizando la segmentación multidimensional.
diferentes estrategias de CRM para obtener un alto nivel de Este diseño de CRM resulta útil en las empresas de servicios postales
satisfacción del cliente. Se dan los cambios de algunos índices clave [18]. Canción et al. propuso un enfoque basado en estadísticas para
de rendimiento como resultado de la adopción del método evaluar a los usuarios potenciales a través de series temporales. Con este
propuesto en este documento, incluido el aumento en el volumen enfoque, es posible segmentar intervalos de tiempo de RFM en un
total de compra y la cantidad total de consumo, mostrando así la conjunto de datos a gran escala [19]. En vista del hecho de que la
eficacia obvia de este método. mayoría de los modelos RFM se desarrollan desde la perspectiva del
El resto del documento está organizado de la siguiente manera. Los cliente en lugar de la perspectiva del producto, Heldt et al. propuso un
estudios de investigación relevantes se revisan en la Sección 2. En la modelo RFM por producto (RFM/P). En este modelo, los valores para el
Sección 3, se describen la metodología y el modelo empleados para la cliente de todos los productos se estiman primero por separado y luego
presente investigación. Los resultados de los experimentos empíricos se se suman para obtener un valor total para el cliente. El análisis empírico
dan en la Sección 4. La Sección 5 concluye nuestra investigación con de las empresas financieras y los supermercados se puede realizar sobre
algunas estrategias de marketing recomendadas. esta base [6]. Adnan Amin et al. estudió la predicción de la rotación de
clientes en la industria de las telecomunicaciones en diferentes

2. Obras Relevantes condiciones mediante el uso de técnicas aproximadas, clasificación y


transformación de datos [9–12].
2.1. Modelo RFM./El modelo RFM fue propuesto por primera vez por
Hughes del American Database Institute en 1994 [13]. Como una
herramienta popular de análisis del valor del cliente, se ha utilizado 2.2. Algoritmo de K-Means.La agrupación es el proceso de dividir un
ampliamente para medir el valor del tiempo de vida del cliente [14] y en conjunto de objetos físicos o abstractos en grupos de objetos similares. /
la segmentación del cliente y el análisis del comportamiento [15]. En los mikEl algoritmo de medios, como uno de los algoritmos de
siguientes párrafos, proporcionamos una breve descripción del modelo agrupamiento más populares, fue utilizado por primera vez por
RFM en la literatura anterior. Macqueen en 1967 [20], y se ha utilizado ampliamente en varios campos,
RFM es la abreviatura de actualidad, frecuencia y monetario, incluida la extracción de datos, el análisis de datos estadísticos y otras
que se refieren a la actualidad de la última compra, la frecuencia de aplicaciones comerciales.
compra y el valor monetario de la compra, respectivamente. R /e literatura muestra que una de las principales aplicaciones de k
(reciente) representa el intervalo de tiempo entre la última fecha de -significa es la segmentación de clientes [21]. /mikEl algoritmo de medios
compra de un cliente y la fecha de finalización de un período se usa ampliamente para identificar de manera efectiva a los clientes
estadístico. /cuanto menor sea el intervalo, mayor será el valor de R. valiosos y desarrollar estrategias de marketing pertinentes [22]. En
F (frecuencia) indica el número de compras realizadas por el cliente particular, Cheng & Chen utilizó un modelo RFM yk-significa realizar la
durante el período estadístico. /cuanto mayor sea el valor de F, gestión de relaciones con los clientes, y los resultados experimentales
mayor será la lealtad del cliente y mayor la intención de volver a demuestran que el modelo que propusieron es un método efectivo en el
comprar. M (monetario) representa el monto total que el cliente análisis del valor del cliente [14]. Khalili-Damghani et al. propuso un
gasta en compras durante el período estadístico. En términos enfoque híbrido de computación basada en la metodología de
generales, cuanto mayor sea el monto total de la compra, más leal agrupamiento, extracción de reglas y árboles de decisión para predecir la
será el cliente. Puede servir como una medida directa de la segmentación de nuevos clientes de empresas centradas en el cliente.
capacidad de producción de una empresa vendedora. Este enfoque se aplicó en dos estudios de caso en los campos de los
Los estudios de investigación muestran que cuanto mayor seguros y las telecomunicaciones, respectivamente, con el objetivo de
sea el valor de R o F, mayor será la probabilidad de que el predecir clientes potenciales rentables y delinear las características más
cliente correspondiente realice una nueva transacción con el influyentes disponibles para los clientes durante dicha predicción [8]. Con
vendedor. Además, cuanto mayor sea M, más probable es que el modelo RFM yk-algoritmo de medios, una variedad de grupos de
el cliente correspondiente vuelva a comprar productos o conjuntos de datos se validan mediante el cálculo del coeficiente de
servicios del vendedor. Si bien Hughes asignó la misma silueta [23]. Yizhang Jiang et al. aplicó con éxito métodos de minería de
importancia a estas tres variables [13], Stone creía que la datos como c-means, aprendizaje de transferencia y aprendizaje de vistas
importancia de las tres variables varía entre las industrias múltiples en TC cerebral, segmentación de imágenes EEG e investigación
debido a sus diferentes características, lo que sugiere pesos de agrupamiento de vistas múltiples [24–26].
desiguales de estas variables [14].
RFM se usa ampliamente en el análisis del valor del cliente y los En comparación con otros algoritmos de agrupamiento, elk- significa
investigadores lo han ampliado de acuerdo con diferentes aspectos. que el algoritmo no solo es más rápido en el cálculo, sino que también
Liu y Shih utilizaron un proceso de jerarquía analítica (AHP) para puede reducir la tasa de clasificación errónea de los datos [27–29]. /
determinar el peso de las variables RFM, un método de agrupación nosotros, usamos elk-Algoritmo de medios para agrupar de acuerdo con
para agrupar clientes y un método de regla de asociación para los atributos de RFM. La precisión de este algoritmo depende de las
recomendar productos a clientes en diferentes grupos [16]. Cheng y condiciones de inicialización y del número de grupos [30–32]. /El famoso
Chen combinaron el análisis RFM con un conjunto aproximado método del codo es ampliamente utilizado para determinar la
Problemas Matemáticos en Ingeniería 3

valor de K. En la siguiente sección, presentaremos nuestro método


Datos
paso a paso. preprocesamiento
Paso 1

Normalización
3. Metodología del modelo RFM Paso 2
índices Precisión
Datos
Esta sección explica el proceso propuesto de análisis del valor del limpieza conjunto de datos
marketing
estrategia
cliente. /e proceso consta de los siguientes cuatro pasos que se muestran Índice de peso
Paso 3
análisis
en la Figura 1: (1) preprocesamiento de datos o preparación y
preprocesamiento de datos; (2) normalización de los índices del modelo
Cliente
RFM; (3) análisis de peso índice; y (4) agrupamiento de clientes pork clasificación
Etapa 4

-algoritmo de medios, donde cada dimensión de la información del


cliente se analiza utilizando el modelo RFM y k-Algoritmo de medios para
Cifra1: Pasos del proceso propuesto.
clasificar a los clientes objetivo.
/e proceso de análisis de investigación se introduce paso a paso de la siguiente
manera:
⎪⎧F1�X1tu11+X2tu12+· · · +Xmetrotu1metro,

Paso 1: preprocesamiento de datos ⎪F2�X1tu21+X2tu22+· · · +Xmetrotu2metro, (2)
En primer lugar, se selecciona un conjunto de datos original para el ⎩
F3�X1tu31+X2tu32+· · · +Xmetrotu3metro.
estudio de caso empírico basado en los parámetros del modelo
RFM. Luego, el conjunto de datos original se limpia para eliminar √�
los valores atípicos y los valores inexactos y generar un conjunto
tui�??Ai/hi), (3)
de datos inicial. Luego, al eliminar los atributos redundantes, los
datos se transforman en un formato que es más fácil y eficiente de donde la matriz de coeficientestuyocontiene los coeficientes
procesar para el análisis del valor del cliente. proporcionales de un componente principal como
combinación lineal de las variables originales: i(1,2,3,. . ., pag
Paso 2: normalización de los índices del modelo RFM
), j(1,2,3,. . ., metro). En casos típicos,metroypag representan
Dadas las grandes diferencias en los rangos de valores de los tres la puntuación compuesta del componente principal yW
indicadores del modelo RFM, es decir, tiempo desde la última representa el peso que indica la tasa de contribución de la
compra, frecuencia de compra y monto total de la compra, con el varianza del componente. La normalización del peso se
fin de eliminar el impacto de los valores numéricos en los logra con la siguiente fórmula:
resultados de la clasificación, el mín-máx El método de
normalización se utiliza para estandarizar los datos y obtener el F�F∗ 1(W1/(W1+W2+W3??
conjunto de datos estandarizados inicial (ver fórmula (1)): + F∗2(W2/(W1+W2+W3?? (4)
+ F∗3(W3/(W1+W2+W3??,
X−min??
yo Xj??

X′yo , (1) dóndeFes el conjunto de datos para el agrupamiento posterior.
máximo??Xj?? -min{X}j
Paso 4: agrupar a los clientes pork-significa algoritmo
dóndeXyorepresenta elj-ésimo índice de lai-ésima muestra. Paso 3.2: la fórmula para calcular la matriz de carga del
componente principaltu, la matriz de carga factorialA, y el
Paso 3: análisis del peso del indicador
valor propioλes como sigue:
El peso del índice se refiere al valor y la importancia relativa de
cada índice de inspección de un objeto medido. Dado que el Primero,kcentros de conglomerados inicialesCi(1≤i≤k) se
objeto de investigación de este artículo se caracteriza por una seleccionan al azar del conjunto de datos, y la distancia euclidiana
gran cantidad de clientes y datos de consumo masivo, se entre los objetos de datos restantes y el centro del grupoCi
utiliza un método de análisis de componentes principales para es calculado. /e centro del grupoCiSe identifica el objeto de datos de
asignar pesos al modelo RFM. El análisis de componentes destino más cercano y los objetos de datos se asignan al grupo
principales es un método de análisis estadístico que correspondiente a ese centro de grupo.Ci. Luego, el promedio de
transforma múltiples indicadores en unos pocos integrales a todos los objetos de datos en cada grupo se deriva como el nuevo
través de la técnica de reducción de dimensionalidad. /e peso centro del grupo para iniciar la siguiente iteración. Este proceso se
de cada indicador es igual a la tasa de contribución de la repite hasta que el centro del clúster deja de cambiar o se alcanza el
varianza del componente principal. /cuanto mayor sea la tasa número máximo de iteraciones.
de cotización de varianza, mayor será la importancia La fórmula (5) es el cálculo de la distancia euclidiana
del director componente. /e computación entre los objetos de datos en el espacio y el centro del clúster.
??
proceder ss se describe como fopermite: ??
metro

Paso3.1: un principal c El modelo de análisis de componentes es d(X, Ci??�??Xj−Cyo??, (5)


estafa estructurado en el siguiente la ecuación del ala: j�1
4 Problemas Matemáticos en Ingeniería

dóndeXes el objeto de datos,Cies eli-ésimo centro del grupo, Mesa1: Algunas entradas de datos en el conjunto de datos inicial.

metroes la dimensión del objeto de datos, yxjyCyoson losj-ésimo


ID de empleado Precio total Fecha_añadida_c
valor de atributo deXyCi, respectivamente.
YH170929000003 37.5 2017/11/1 19 : 39
/e selección del valor dekya que el número de conglomerados
YH170914000002 12.5 2017/11/1 20 : 29
tiene grandes implicaciones para los resultados de la agrupación. En
YH170623000003 12.5 2017/11/2 07 : 46
la práctica, el método del codo se utiliza generalmente para YH170623000003 24 2017/11/2 07 : 46
determinar la mejork valor. /e curva de relación entre SSE yktoma la YH170307000001 12.5 2017/11/2 12 : 48
forma de un codo, y el valor dekcorrespondiente a este codo es el YH170923000001 25 2017/11/2 13 :15
verdadero número de grupo de los datos. El indicador central del YH170317000002 75 2017/11/2 17 : 36
método del codo es SSE (suma de los errores al cuadrado), como se YH170317000002 12 2017/11/2 17 : 36
muestra en la siguiente fórmula:
k
?? ?? 25
SSE�?? ?? ??d(X iCi??2. (6)
F�1xεCi
20
Entre ellos,Cies eli-th cluster y SSE es el error de agrupación
de todas las muestras, que sirve como medida de la calidad de 15

SSE
la agrupación.
10

4. Estudio de caso empírico 5

En esta sección, presentamos un caso empírico y un proceso informático 0


utilizando un conjunto de datos de transacciones reales. /agrupación
1 2 3 4 5 6 7 8 9
aproximada de clientes, extraemos las características del k
comportamiento de compra de cada tipo de usuario y luego
Cifra2: Resultado del número óptimo de grupos de usuarios con el método del
desarrollamos estrategias de marketing precisas sobre esta base. codo.

4.1. Experimentos numéricos./El conjunto de datos consta de 10 248


entradas de datos de compra creadas en una plataforma de compras
comunitaria desde el 1 de noviembre de 2017 hasta el 15 de abril de 1.0
2019, que involucran a 1013 clientes. Esta plataforma vende 134 tipos de
productos básicos, en su mayoría alimentos cocinados y pasta. /e Los 0.8
siguientes pasos de procesamiento de datos se llevan a cabo en nuestra
0.6
investigación:
Z
Paso 1: limpieza de datos 0.4

Las entradas de datos /e se componen inicialmente de 12 componentes, 0.2


como ID de usuario, ID de producto, cantidad comprada y fecha de
0.0
consumo. Se seleccionan los tres componentes ID de usuario, cantidad
1.0
de consumo y fecha de consumo, y se eliminan los valores atípicos y la
0.8
información anormal para formar el conjunto de datos inicial (consulte
0.6
la Tabla 1). 0.0 0.4 Y
0.2
0.4
Paso 2: el método de rango se usa para estandarizar el conjunto de 0.6 0.2
X 0.8 0.0
datos inicial y obtener un conjunto de datos estandarizado inicial 1.0
Paso 3: se realiza un análisis de componentes principales para ponderar Cifra3: Diagrama de dispersión de agrupación de usuarios basado enk-significa algoritmo.
objetivamente los indicadores RFM para obtener un conjunto de datos
estandarizado final
en la trama,Xel eje representa el monto total de la compra,Y eje
representa el tiempo de compra más reciente, yZEl eje representa la
4.2. Resultados de clasificación de usuarios./mik-significa que se utiliza un frecuencia de compra.
algoritmo de agrupamiento para agrupar los datos. A juzgar por el codo Se puede ver que los datos generales del usuario están cerca de
método (ver Figura 2), la disminución en SSE no es significativa 0 enX eje que representa el importe total de la compra. En el
cuandokes mayor que 4. Por lo tanto, elegirk�4 daría método de rango, se toma como valor máximo al cliente con el
resultado favorable. mayor monto total de compra. /e gráfico muestra que un pequeño
Una biblioteca de código abierto de sk-learn en lenguaje Python es número de clientes superan con creces el importe medio de
utilizado para implementar lak-means algoritmo, y los resultados se compra. /su ID de usuario y los registros de compra
muestran en la Figura 3. correspondientes se extraen como se muestra en la Tabla 2.
Problemas Matemáticos en Ingeniería 5

Mesa2: Datos extraídos de valores atípicos individuales. formado ciertos hábitos de consumo en la plataforma. En
particular, todavía hay mucho espacio para mejorar el monto
ID de empleado Precio total Ultima vez libre
total de la compra y la frecuencia de compra, lo que significa
YH170317000002 3167.5 2019/3/26 14 : 33 86
que deben ser tratados como clientes de alto potencial. Los
YH171201000030 2394.5 2019/1/21 14 : 01 108
objetivos de marketing de la plataforma para ellos deben
YH180212000003 2251.5 2019/1/21 11 : 22 44
YH171116000009 1513 2019/1/26 22 : 54 37 centrarse en llevarlos del Grupo 4 al Grupo 2 con una frecuencia
de compra más alta y un monto de compra más alto.

Se puede ver a partir de los datos de compra de clientes


4.3. Estrategia de marketing de precisión./Agrupación aproximada de
anteriores que estos clientes tienen un monto total de compra
clientes, podemos extraer con precisión las características de
mayor, una frecuencia de compra más alta y un tiempo más corto
comportamiento de compra de cada tipo de cliente y hacer estrategias
desde la última compra, y el resultado combinado de lo cual es un
de marketing precisas.
mejor desempeño en los tres ejes, haciéndolos así aparecen como
valores atípicos de diversos grados. Grupo de clientes 1: estos clientes representan ciertos riesgos
Al mismo tiempo, también se extraen para su análisis los de pérdida y deben ser observados más a fondo. Se pueden
indicadores de diferentes grupos de clientes y los de todos los tomar medidas activas para que se sientan más apegados a la
clientes en su conjunto (ver Tabla 3). plataforma, incluso informándoles de actividades
/Los cuatro ID de usuario atípicos extraídos anteriormente se promocionales atractivas como descuentos de vacaciones y
pueden rastrear hasta el Grupo 2, que se caracteriza por un gran monto ventas de liquidación o enviando SMS para recordarles los
total de compra y una alta frecuencia de compra. Por lo tanto, los datos paquetes de regalo que se ofrecen a los clientes que regresan.
de compra de estos usuarios están en línea con las características Se pueden invertir más recursos para aumentar la lealtad de
generales de este grupo, lo que demuestra la racionalidad de la estos usuarios y, en consecuencia, el valor que aportan a la
agrupación anterior. plataforma. Los usuarios que no hayan respondido a dicha
La comparación de los indicadores de clientes de cada grupo información y realicen más compras pueden ser eliminados de
con los promedios de todos los clientes conduce a los siguientes la lista de clientes objetivo para reducir los costos de
hallazgos. marketing.
Los clientes del Grupo 1 tienen más tiempo desde la última
Grupo de Clientes 2: Todos los indicadores de estos usuarios
compra. Los datos de compra que dejaron en la plataforma se notan
son los más altos y por encima del promedio. Aparentemente,
menos debido a la hora anterior de la última compra, el valor más
gastan más tiempo y dinero comprando en la plataforma y,
pequeño del monto total de la compra y la frecuencia de compra
para el operador de la plataforma, representan una
más baja. Además, el número de tales clientes es relativamente
importante fuente de valor. Para estos clientes, especialmente
pequeño. Pueden ser considerados como clientes con riesgos de
los VIP, las actividades de marketing pueden enfocarse en
pérdida y que requieren mayor observación. Se deben invertir
mejorar su satisfacción y experiencias de compra y mantener
ciertos recursos en la plataforma para analizar y comprender mejor
su lealtad a la plataforma.
a dichos clientes.
Grupo de clientes 3: estos clientes completaron su última
La frecuencia de compra y el monto total de compra de los
compra en un tiempo anterior al promedio, y el monto total de
clientes del Grupo 2 son mayores que los promedios generales,
la compra y la frecuencia de compra son relativamente bajos,
y su última compra también es más reciente, lo que indica que
lo que implica que han aportado ganancias limitadas a la
son clientes de T-APP de alto valor. Al aportar un mayor flujo de
plataforma. Dado que compran en la plataforma
caja y ganancias a la plataforma, constituyen un grupo de
ocasionalmente, sus comportamientos de consumo pueden
clientes de alto valor. /e plataforma debería esforzarse más en
estimularse ofreciendo cupones para atraer nuevos visitantes.
mantener y mejorar la relación con ellos.
Los beneficios de tales ofertas son dobles. Al invitar a los
/e El monto total de la compra y la frecuencia de compra de
recién llegados a la plataforma, estos mismos clientes
los clientes del Grupo 3 son bajos y completaron su última
existentes pueden estar más dispuestos a usar la plataforma e
compra antes del tiempo promedio. /es implica que a pesar de
incluso formar un hábito de compra allí.
su comportamiento de compra reciente en la plataforma, no
han formado un hábito de consumo allí y no están en Grupo de Clientes 4: Si bien estos clientes han formado
condiciones de generar grandes ganancias para la plataforma. ciertos hábitos de consumo, no han dejado un registro de
Pueden ser vistos como clientes típicos. /e plataforma necesita consumo impresionante en la plataforma. La plataforma
cultivar sus hábitos de uso de la plataforma y esforzarse por debe realizar esfuerzos activos para cultivar aún más la
convertirlos en clientes activos que puedan generar más voluntad de compra entre dichos clientes. Las posibles
ganancias. medidas para este propósito incluyen la recomendación
Los clientes del grupo 4 realizaron su última compra en una fecha de productos favoritos a intervalos regulares, la oferta de
relativamente reciente. /eir indicadores de cantidad total de compra y subsidios y el trato preferencial para los usuarios que
frecuencia de compra están cerca de los promedios generales. Se puede recargan sus cuentas de compra, todo diseñado para
decir que estos clientes son más activos y tienen promover su mayor consumo en la plataforma.
6 Problemas Matemáticos en Ingeniería

Mesa3: Indicadores de clientes.

Tiempo promedio desde Promedio del total Compra promedio Número de


Grupo de clientes
última compra monto de la compra frecuencia clientes
Grupo 1 457.27 79.86 2.88 98
Grupo 2 46.93 452.15 25.47 184
Grupo 3 262.1 65.29 4.55 415
Grupo 4 157.54 156.25 10.71 316
Total 209.30 165.34 10.11 1013

Estos clientes también pueden convertirse gradualmente en [5] A. Machauer y S. Morgner, "Segmentación de clientes bancarios
clientes de mayor valor, lo que genera ganancias más por beneficios y actitudes esperados",Revista Internacional de
considerables para la empresa. Marketing Bancario, vol. 19, núm. 1, págs. 6 a 18, 2001.
[6] R. Heldt, CS Silveira y FB Luce, "Predicción del valor del cliente
por producto: de RFM a RFM/P"Revista de investigación
5. Conclusiones
empresarial, vol. 3, 2019.
En este artículo, los comportamientos de compra de los clientes se [7] A. Griva, C. Bardaki, K. Pramatari y D. Papakiriakopoulos, "Análisis de

analizan sistemáticamente en función de los datos de transacciones negocios minoristas: segmentación de visitas de clientes utilizando datos
de la cesta de la compra"Sistemas Expertos con Aplicaciones, vol. 100,
en línea de una empresa utilizando RFM yk-significa algoritmo de
págs. 1 a 16, 2018.
agrupamiento. Los clientes se clasifican en cuatro grupos según su
[8] K. Khalili-Damghani, F. Abdi y S. Abolmakarem, "Enfoque híbrido de
comportamiento de compra. En consecuencia, se proponen
computación blanda basado en agrupamiento, minería de reglas y
diferentes estrategias de CRM para obtener un alto nivel de
análisis de árboles de decisión para el problema de segmentación de
satisfacción del cliente. La eficacia evidente del método de análisis
clientes: caso real de industrias centradas en el cliente"Computación
propuesto en este documento se demuestra mediante la mejora de
blanda aplicada, vol. 73, págs. 816–828, 2018.
los índices clave de rendimiento de la empresa. Los resultados de [9] A. Amin, S. Anwar, A. Adnan et al., "Predicción de abandono de clientes en
mejora de algunos índices clave de desempeño se dan brevemente el sector de las telecomunicaciones utilizando un enfoque de conjunto
a continuación. /e número de clientes activos ha crecido en 529. /e aproximado"neurocomputación, vol. 237, págs. 242–254, 2017.
volumen total de compra ha aumentado en un 279%, y la cantidad [10] A. Amin, B. Shah, AM Khattak et al., "Predicción de abandono de
total de consumo ha aumentado en un 101,97%. clientes entre empresas en telecomunicaciones: una
En el futuro, hay dos direcciones para futuras investigaciones. comparación de métodos de transformación de datos"Revista
Uno es en la teoría y el otro en la práctica. Con la actualización de Internacional de Gestión de la Información, vol. 46, págs. 304–
datos cada día, se necesitan algoritmos más adecuados para hacer 319, 2019.
coincidir el nuevo conjunto de datos para el análisis teórico. En la [11] A. Amin, F. Al-Obeidat, B. Shah, A. Adnan, J. Loo y
práctica, cómo integrar un algoritmo en el sistema CRM para S. Anwar, "Predicción de abandono de clientes en la industria de las

respaldar la toma de decisiones de los gerentes es una buena telecomunicaciones utilizando la certeza de los datos"Revista de investigación

manera de ayudar a mejorar el desempeño. empresarial, vol. 94, págs. 290–301, 2019.
[12] A. Amin, F. Al-Obeidat, B. Shah et al., “Predicción de abandono de clientes
justo a tiempo en el sector de las telecomunicaciones”,<e Revista de
Disponibilidad de datos
supercomputación, vol. 76, núm. 6, págs. 3924–3948, 2020.
[13] AM Hughes,Marketing estratégico de bases de datos, Probus
Los datos utilizados para respaldar los hallazgos de este estudio
Publishing Company, Chicago, EE. UU., 1994.
se incluyen en el artículo.
[14] C.-H. Cheng y Y.-S. Chen, "Clasificación de la segmentación del valor
del cliente a través del modelo RFM y la teoría RS",Sistemas
Conflictos de interés Expertos con Aplicaciones, vol. 36, núm. 3, págs. 4176–4184, 2009.
[15] D. Chen, SL Sain y K. Guo, "Extracción de datos para la industria minorista
Los autores declaran no tener conflictos de intereses.
en línea: un estudio de caso de segmentación de clientes basada en el
modelo RFM mediante la extracción de datos"Revista de marketing de
Referencias bases de datos y gestión de estrategias de clientes, vol. 19, núm. 3, págs.
197 y 208, 2012.
[1] MS Chen, J. Han y PS Yu, "Minería de datos: una descripción general desde
[16] DR Liu y Y.-Y. Shih, "Integración de AHP y minería de datos para
la perspectiva de una base de datos".Transacciones IEEE sobre
la recomendación de productos basada en el valor de por vida
conocimiento e ingeniería de datos, vol. 8, núm. 6, págs. 866–883, 1996.
[2] MJ Shaw, C. Subramaniam, GW Tan y ME Welge, "Gestión del
del cliente"Gestión de la información, vol. 42, núm. 3, págs.
conocimiento y extracción de datos para marketing" Sistemas de 340–387, 2005.
[17] W.-Y. Chiang, "Para extraer reglas de asociación de valores del cliente a través de
Soporte a la Decisión, vol. 31, núm. 1, págs. 127 y 137, 2001.
[3] Y.-L. Chen, C.-L. Hsu y S.-C. Chou, "Construyendo un árbol de decisiones de un procedimiento de minería de datos con un modelo mejorado: un estudio de

múltiples valores y etiquetas múltiples",Sistemas Expertos con caso empírico"Sistemas Expertos con Aplicaciones, vol. 38, núm. 3, págs. 1716–

Aplicaciones, vol. 25, núm. 2, págs. 199 y 209, 2003. 1722, 2011.

[4] EWT Ngai, L. Xiu y DCK Chau, "Aplicación de técnicas de minería [18] P. Kolarovszki, J. Tengler y M. Majerčáková, “/e nuevo modelo de
de datos en la gestión de relaciones con los clientes: una segmentación de clientes en empresas postales,” Procedia-Ciencias
relación y clasificación bibliográficas"Sistemas Expertos con Sociales y del Comportamiento, vol. 230, págs. 121 a 127, 2016.
Aplicaciones, vol. 36, págs. 2529–2602, 2009.
Problemas Matemáticos en Ingeniería 7

[19] M. Song, X. Zhao, E. Haihong y Z. Ou, "Enfoque de crm basado en estadísticas a


través de series temporales que segmentan rfm en datos a gran escala"
Sistemas basados en el conocimiento, vol. 132, núm. 15, págs. 282 y 291,
2017.
[20] J. MacQueen, "Algunos métodos para la clasificación y el análisis
de observaciones multivariadas", enActas del Quinto Simposio
de Berkeley sobre Estadística Matemática y Probabilidad, págs.
281–297, University of California Press, Berkeley, California, EE.
UU., enero de 1967.
[21] D. Arunachalam y N. Kumar, "Segmentación de consumidores basada en
beneficios y evaluación del desempeño de los enfoques de
agrupamiento: una evidencia de la toma de decisiones basada en datos"
Sistemas Expertos con Aplicaciones, vol. 111, págs. 11 a 34, 2018.
[22] A. Mesforoush y MJ Tarokh, “Estudio de caso de segmentación
de rentabilidad de clientes para pymes: empresa de equipos de
red”Revista Internacional de Investigación en Ingeniería
Industrial, vol. 2, núm. 1, págs. 30 a 44, 2013.
[23] P. Anitha y MM Patil, "Modelo RFM para el comportamiento de
compra del cliente usando el algoritmo K-means"Revista de la
Universidad Rey Saud - Ciencias de la Computación e Información,
vol. 1, 2019.
[24] Y. Jiang, FL Chung, S. Wang et al., "Agrupación difusa colaborativa
desde múltiples vistas ponderadas"Transacciones IEEE sobre
cibernética, vol. 45, núm. 4, págs. 688–701, 2015.
[25] Y. Jiang, Z. Deng, FL Chung, G. Wang, P. Qian y
KS Choi, "Reconocimiento de señales EEG epilépticas utilizando un
novedoso sistema difuso TSK multivista"Transacciones IEEE en sistemas
difusos, vol. 25, núm. 1, págs. 3 a 20, 2016.
[26] L. Fabisiak, "Análisis de usabilidad del servicio web basado en las
preferencias del usuario",Revista de informática organizacional y de
usuario final, vol. 30, núm. 4, págs. 1 a 13, 2018.
[27] A. Shahri, M. Hosseini, K. Phalp, J. Taylor y R. Ali, "Cómo diseñar
la gamificación"Revista de informática organizacional y de
usuario final, vol. 31, núm. 1, págs. 39–60, 2019.
[28] T. Grubljesic, PS Coelho y J. Jaklic, “/e shift to socioorganizational
drivers of business intelligence and analytics acceptation,”
Revista de informática organizacional y de usuario final, vol. 31,
núm. 2, págs. 37 a 64, 2019.
[29] S. Namasudra y P. Roy, "PpBAC: modelo de control de acceso basado en la
popularidad para la computación en la nube"Revista de informática
organizacional y de usuario final, vol. 30, núm. 4, págs. 14 a 31, 2018.
[30] Y. Jiang, D. Wu, Z. Deng et al., "Clasificación de convulsiones a partir de
señales EEG mediante aprendizaje de transferencia, aprendizaje
semisupervisado y sistema difuso TSK"Transacciones IEEE sobre
sistemas neuronales e ingeniería de rehabilitación, vol. 25, núm. 12,
págs. 2270–2284, 2017.
[31] G. Khatwani y PR Srivastava, “Impacto de la tecnología de la información
en la selección de canales de búsqueda de información para los
consumidores”,Revista de informática organizacional y de usuario final,
vol. 30, núm. 3, págs. 63 a 80, 2018.
[32] B. Piedra,Métodos exitosos de marketing directo, págs. 37–57,
NTC Business Books, Lincolnwood, IL, EE. UU., 1995.

También podría gustarte