Está en la página 1de 11

Expert Systems with Applications 36 (2009) 25922602

Contents lists available at ScienceDirect

Expert Systems with Applications


j o u r n a l h o m e p a g e : w w w . e l s ev i e r . c o m / l o c a t e / e s w a

Review

Aplicacin de tcnicas de minera de datos en la gestin de relaciones con los clientes:


Una revisin de la literatura y clasificacin
E.W.T. Ngai a,*, Li Xiu b, D.C.K. Chau a
a
Department of Management and Marketing, The Hong Kong Polytechnic University, Hong Kong, PR China b
Department of Automation, Tsinghua University, Beijing, PR China

article info abstract


Keywords:
A pesar de la importancia de las tcnicas de minera de datos para la gestin de la relacin con los clientes (CRM), existe una
Data mining
Customer relationship management
carencia de una revisin bibliogrfica exhaustiva y un esquema de clasificacin para ello. Esta es la primera revisin de la
Literature review literatura acadmica identificable de la aplicacin de tcnicas de minera de datos a CRM. Proporciona una base de datos
Classification acadmica de literatura entre el perodo 2000-2006 que abarca 24 revistas y propone un esquema de clasificacin para
clasificar los artculos. Nueve centenares de artculos fueron identificados y revisados por su relevancia directa en la
aplicacin de tcnicas de minera de datos al CRM. Ochenta y siete artculos fueron seleccionados, revisados y clasificados
posteriormente. Cada uno de los 87 trabajos seleccionados se clasific en cuatro dimensiones de CRM (identificacin del
cliente, atraccin del cliente, retencin del cliente y desarrollo del cliente) y siete funciones de minera de datos (asociacin,
clasificacin, agrupacin, previsin, regresin, . Los documentos se clasificaron en nueve subcategoras de elementos CRM
bajo diferentes tcnicas de minera de datos basadas en el enfoque principal de cada artculo. El proceso de revisin y
clasificacin se verific de forma independiente. Los resultados de este trabajo indican que el rea de investigacin de
retencin de clientes recibi la mayor atencin de la investigacin. De stos, la mayora estn relacionados con programas de
marketing y fidelizacin uno a uno, respectivamente. Por otro lado, los modelos de clasificacin y asociacin son los dos
modelos utilizados comnmente para la minera de datos en CRM. Nuestro anlisis proporciona una hoja de ruta para guiar la
investigacin futura y facilitar la acumulacin y creacin de conocimiento sobre la aplicacin de tcnicas de minera de datos
en CRM.
Traductor de Google para empresas:Google Translator ToolkitTraductor de sitios web

2008 Elsevier Ltd. All rights reserved.

1. Introduction y personas para gestionar la relacin del cliente con su empresa


(Marketing, Ventas, Servicios y Soporte) durante todo el ciclo de vida del
La gestin de la relacin con el cliente (CRM) comprende un conjunto de cliente ". Parvatiyar y Sheth (2001, p.5) definieron la CRM como "una
procesos y sistemas de apoyo que soportan una estrategia de negocio para estrategia integral y un proceso de adquisicin, retencin y asociacin con
construir relaciones rentables a largo plazo con clientes especficos (Ling & clientes selectivos para crear un valor superior para la empresa y el cliente.
Yen, 2001). Los datos de los clientes y las herramientas de tecnologa de la
Implica la integracin del marketing, las ventas, el servicio al cliente y las
informacin (TI) constituyen la base sobre la que se construye cualquier
estrategia de CRM exitosa. Adems, el rpido crecimiento de Internet y sus funciones de la cadena de suministro de la organizacin para lograr mayores
tecnologas asociadas ha aumentado considerablemente las oportunidades de eficiencias y efectividad en la entrega de valor al cliente. Estas definiciones
comercializacin y ha transformado la forma en que se gestionan las enfatizan la importancia de ver CRM como un proceso integral de adquisicin
relaciones entre las empresas y sus clientes (Ngai, 2005). y retencin de clientes, con la ayuda de la inteligencia de negocios, para
maximizar el valor del cliente para la organizacin.
Aunque el CRM ha sido ampliamente reconocido como un enfoque comercial
importante, no existe una definicin universalmente aceptada de CRM (Ling
Desde el punto de vista de la arquitectura, el marco de CRM puede
& Yen, 2001; Ngai, 2005). Swift (2001, p.12) defini el CRM como un
"enfoque empresarial para entender e influir en el comportamiento del cliente clasificarse en operacional y analtico (Berson, Smith, & Thear-ling, 2000,
a travs de comunicaciones significativas para mejorar la adquisicin de Heo, Xu, Huang, & Deng, 2004; Teo, Devadoss, & Pan, 2006). CRM
clientes, la retencin de clientes, la lealtad del cliente y la rentabilidad del operacional se refiere a la automatizacin de los procesos empresariales,
cliente". Kincaid (2003, p.41) consider el CRM como "el uso estratgico de mientras que el CRM analtico se refiere al anlisis de las caractersticas y
la informacin, los procesos, la tecnologa, comportamientos de los clientes para apoyar las estrategias de gestin de
clientes de la organizacin. Como tal, el CRM analtico podra ayudar a una
* Corresponding author. Tel.: +852 2766 7296; fax: +852 2774 3679. organizacin a discriminar mejor y asignar ms efectivamente los recursos al
E-mail address: mswtngai@polyu.edu.hk (E.W.T. Ngai).
grupo ms rentable de clientes. Datos
0957-4174/$ - see front matter 2008 Elsevier Ltd. All rights reserved.
doi:10.1016/j.eswa.2008.02.021
E.W.T. Ngai et al. / Expert Systems with Applications 36 (2009) 25922602 2593

las herramientas de minera son un medio popular de analizar los datos de los produjo aproximadamente 900 artculos. El texto completo de cada artculo
clientes en el marco analtico de CRM. Muchas organizaciones han fue revisado para eliminar aquellos que no estaban realmente relacionados con
recopilado y almacenado una gran cantidad de datos sobre sus clientes la aplicacin de tcnicas de minera de datos en CRM. Los criterios de
actuales, clientes potenciales, proveedores y socios comerciales. Sin embargo, seleccin eran los siguientes:
la incapacidad de descubrir informacin valiosa oculta en los datos evita que
las organizaciones transformen estos datos en conocimiento valioso y til Slo se seleccionaron aquellos artculos que se haban publicado en revistas
(Berson et al., 2000). Las herramientas de minera de datos podran ayudar a relacionadas con la inteligencia comercial, el descubrimiento de conocimiento
estas organizaciones a descubrir el conocimiento oculto en la enorme cantidad o la gestin de clientes, ya que stos eran los out-lets ms apropiados para la
de datos. minera de datos en la investigacin de CRM y el enfoque de esta revisin.

Turban, Aronson, Liang y Sharda (2007, p. 305) define la minera de datos Slo se seleccionaron aquellos artculos que describan claramente la forma
como el proceso que utiliza las tcnicas estadsticas, matemticas, de en que se podan aplicar las tcnicas de minera de datos mencionadas y se
inteligencia artificial y de aprendizaje automtico para extraer e identificar ayudaron en las estrategias de CRM.
informacin til y posteriormente adquirir conocimientos de grandes bases de
datos ". Berson et al. (2000), Lejeune (2001), Ahmed (2004) y Berry y Linoff Se excluyeron los trabajos de conferencias, los maestros y las disertaciones
(2004) tambin proporcionan una definicin similar con respecto a la minera doctorales, los libros de texto y los documentos de trabajo inditos, ya que los
de datos como el proceso de extraccin o deteccin de patrones ocultos o acadmicos y los profesionales por igual usan con mayor frecuencia las
informacin de bases de datos grandes. Con los datos comprensivos de los revistas para adquirir informacin y difundir nuevos hallazgos. As, los
clientes, la tecnologa de minera de datos puede proporcionar inteligencia de jornales representan el nivel ms alto de investigacin (Nord & Nord, 1995).
negocios para generar nuevas oportunidades (Bortiz & Ken-nedy, 1995,
Fletcher y Goss, 1993, Langley y Simon, 1995, Lau, Wong, Hui y Pun, 2003,
Cada artculo fue cuidadosamente revisado y clasificado por separado de
Salchenberger, Cinar y Lash, 1992, Su, Hsu y Tsai, 2002, Tam y Kiang, 1992,
acuerdo con las cuatro categoras de dimensiones de CRM y siete categoras
Zhang, Hu, Patuwo, & Indro, 1999).
de modelos de minera de datos, como se muestra en la Figura 1. Aunque esta
bsqueda no fue exhaustiva, sirve como una base completa para la
La aplicacin de herramientas de minera de datos en CRM es una tendencia
comprensin de investigacin de minera de datos en CRM.
emergente en la economa global. Analizar y comprender los
comportamientos y las caractersticas de los clientes es la base del desarrollo
3. Mtodo de clasificacin
de una estrategia de CRM competitiva, para adquirir y retener clientes Segn Swift (2001, p.12), Parvatiyar y Sheth (2001, p.
potenciales y maximizar el valor del cliente. Las herramientas adecuadas de
extraccin de datos, que son buenas para extraer e identificar informacin y 5) y Kracklauer, Mills, y Seifert (2004, p.4), CRM se compone de cuatro
conocimientos tiles de enormes bases de datos de clientes, son una de las dimensiones:
mejores herramientas de apoyo para tomar diferentes decisiones de CRM
(Berson et al., 2000). Como tal, la aplicacin de tcnicas de minera de datos (1) Identificacin del Cliente;
en CRM vale la pena perseguir en una economa centrada en el cliente. (2) Atraccin del cliente;
(3) Retencin del Cliente;
This paper presents a comprehensive review of literature related to (4) Desarrollo del Cliente.
application of data mining techniques in CRM pub-lished in academic
journals between 2000 and 2006. A classifica-tion of framework is also Estas cuatro dimensiones pueden ser vistas como un ciclo cerrado de un
presented. The paper is organized as follows: first, the research methodology sistema de gestin de clientes (Au & Chan, 2003; Kracklauer et al., 2004;
used in the study is described; second, the method for classifying data mining Ling & Yen, 2001). Ellos comparten el objetivo comn de crear una
articles in CRM is presented; third, articles about data mining in CRM are comprensin ms profunda de los clientes para maximizar el valor del cliente
analysed and the results of the classification are reported; and finally, the a la organizacin en el largo plazo. Las tcnicas de minera de datos, por lo
conclusions, limitations and implications of the study are discussed. tanto, pueden ayudar a lograr este objetivo extrayendo o detectando las
caractersticas y comportamientos ocultos de las grandes bases de datos. El
aspecto generativo de la minera de datos consiste en la construccin de un
2. Research methodology
modelo a partir de datos (Carrier & Povel, 2003). Cada tcnica de minera de
datos puede realizar uno o ms de los siguientes tipos de modelado de datos:
Metodologia
Dado que la naturaleza de la investigacin en CRM y la minera de datos son
(1) Asociacin;
difciles de confinar a disciplinas especficas, los materiales relevantes se
encuentran dispersos en varias revistas. La inteligencia de negocios y el (2) Clasificacin;
descubrimiento de conocimiento son la disciplina acadmica ms comn para (3) agrupamiento;
la investigacin de minera de datos en CRM. En consecuencia, las siguientes (4) Pronstico;
bases de datos de revistas en lnea (5) Regresin;
se realizaron bsquedas para proporcionar una bibliografa exhaustiva de la (6) Descubrimiento de secuencias;
literatura acadmica sobre CRM y Data Mining: (7) Visualizacin.
Base de datos ABI / INFORM;
Bsqueda acadmica Premier; Los siete modelos anteriores cubren los modelos de minera de datos
Business Source Premier; mencionados en varios artculos (Ahmed, 2004, Carrier y Po-vel, 2003, Mitra,
Esmeralda Fulltext; Pal y Mitra, 2002, Shaw, Subramaniam, Tan y Welge, 2001, Turban et al .,
Diarios de Ingenta; 2007). Existen numerosas tcnicas de aprendizaje automtico disponibles para
Science Direct; y cada tipo de modelo de minera de datos. Las opciones de tcnicas de minera
Transaccin IEEE. de datos deben basarse en las caractersticas de los datos y los requisitos
empresariales (Carrier & Povel, 2003). Aqu hay algunos ejemplos de algunos
La bsqueda bibliogrfica se bas en el descriptor, "gestin de relaciones con algoritmos de minera de datos ampliamente utilizados:
los clientes" y "minera de datos", que originalmente
2594 E.W.T. Ngai et al. / Expert Systems with Applications 36 (2009) 25922602

Fig. 1. Classification framework for data mining techniques in CRM.

(1) regla de la asociacin; (i) desarrollo. El conocimiento detallado debe construirse


(2) rbol de decisin; sistemticamente para obtener una comprensin ms profunda de los
(3) Algoritmo gentico; comportamientos, caractersticas y necesidades de cada cliente. Las cuatro
(4) Redes neuronales; dimensiones del ciclo del CRM son esfuerzos esenciales para obtener la
(5) K-vecino ms cercano; percepcin del cliente (Ling & Yen, 2001).
(6) Regresin lineal / logstica.
(ii) (i) Identificacin del cliente: CRM comienza con la identificacin del
Se propone un marco de clasificacin grfica sobre tcnicas de minera de cliente, que se conoce como adquisicin del cliente en algunos artculos. Esta
datos en CRM y se muestra en la Fig. 1; se basa en una revisin de la fase implica dirigirse a la poblacin que es ms probable que se conviertan en
literatura sobre tcnicas de minera de datos en CRM. La revisin crtica de la clientes o ms rentables para la empresa. Adems, se trata de analizar a los
literatura sobre la minera de datos en CRM ayud a identificar las principales clientes que estn perdiendo a la competencia y cmo pueden ser ganados de
dimensiones de CRM y tcnicas de minera de datos para la aplicacin de vuelta (Kracklauer et al., 2004). Los elementos para la identificacin del
tcnicas de minera de datos en CRM. Este marco de trabajo tambin se basa cliente incluyen el anlisis del cliente objetivo y la segmentacin del cliente.
en la investigacin realizada por Swift (2001), Parvatiyar y Sheth (2001) y El anlisis del cliente objetivo consiste en buscar los segmentos rentables de
Kracklauer et al. (2004). Describieron las dimensiones del CRM como: los clientes a travs del anlisis de las caractersticas subyacentes de los
Identificacin del Cliente, Atraccin del Cliente, Retencin del Cliente y clientes, mientras que la segmentacin del cliente implica la subdivisin de
Desarrollo del Cliente. Adems, Ahmed, 2004; Carrier y Povel, 2003; Mitra toda una base de clientes en grupos o segmentos de clientes ms pequeos,
et al., 2002; Shaw et al., 2001 describieron los tipos de modelo de minera de (Woo, Bae, & Park, 2005).
datos como Asociacin, Clasificacin, Agrupacin, Pronstico, Regresin,
Descubrimiento y Visualizacin de Secuencias. Proporcionamos una breve (ii) Atraccin al cliente: Esta es la fase siguiente a la identificacin del
descripcin de estas cuatro dimensiones y algunas referencias para ms cliente. Despus de identificar los segmentos de clientes potenciales,
detalles, y cada una de ellas se analiza en las siguientes secciones. las organizaciones pueden dirigir esfuerzos y recursos para atraer a los
segmentos de clientes objetivo. Un elemento de la atraccin del cliente
es el marketing directo. El marketing directo es un proceso de
promocin que motiva a los clientes a realizar pedidos a travs de
diversos canales (Cheung, Kwok, Law, & Tsui, 2003; Liao & Chen,
3.1. Marco de clasificacin - dimensiones CRM 2004; Prinzie & Poel, 2005). Por ejemplo, el correo directo o la
distribucin de cupones son ejemplos tpicos de marketing directo.
En este estudio, CRM se define como ayudar a las organizaciones a
discriminar mejor y asignar ms efectivamente los recursos al grupo ms
rentable de clientes a travs del ciclo de identificacin de clientes, atraccin
de clientes, retencin de clientes y clientes
E.W.T. Ngai et al. / Expert Systems with Applications 36 (2009) 25922602 2595

(iii) Retencin de clientes: Esta es la preocupacin central de CRM. La para la clasificacin son redes neuronales, rboles de decisin y reglas if-
satisfaccin de los clientes, que se refiere a la comparacin de las expectativas then-else.
de los clientes con su percepcin de satisfaccin, es la condicin esencial para
retener clientes (Kracklauer et al., 2004). Como tales, los elementos de la (iii) Agrupacin: La agrupacin es la tarea de segmentar una poblacin
retencin de clientes incluyen marketing uno-a-uno, programas de heterognea en un nmero de clsteres ms homogneos (Ahmed, 2004;
Berry & Linoff, 2004; Carrier & Povel, 2003; Mitra et al., 2002). Es diferente
fidelizacin y gestin de reclamaciones. El marketing uno a uno se refiere a
a la clasificacin en que los grupos son desconocidos en el momento en que el
campaas de marketing personalizadas que son apoyadas por el anlisis, la algoritmo comienza. En otras palabras, no hay clsteres predefinidos. Las
deteccin y la prediccin de cambios en los comportamientos de los clientes herramientas comunes para el agrupamiento incluyen redes neuronales y
(Chen, Chiu, & Chang, 2005, Kim & Moon, 2006). Por lo tanto, los perfiles anlisis de discriminacin.
de los clientes, los sistemas de recomendacin o los sistemas de reposicin
estn relacionados con el marketing uno a uno. Los programas de fidelizacin (iv) Pronstico: La previsin estima el valor futuro basado en los patrones de
incluyen campaas o actividades de apoyo que buscan mantener una relacin un registro. Se trata de resultados continuamente valorados (Ahmed, 2004;
a largo plazo con los clientes. Especficamente, anlisis de churn, puntuacin Berry & Linoff, 2004). Se relaciona con el modelado y las relaciones lgicas
de crdito, calidad de servicio o satisfaccin forman parte de programas de del modelo en algn momento en el futuro. El pronstico de demanda es un
lealtad. ejemplo tpico de un modelo de pronstico. Las herramientas comunes para la
prediccin incluyen redes neuronales y anlisis de supervivencia.
(iv) Desarrollo del cliente: Esto implica la expansin consistente de la
(v) Regresin: La regresin es un tipo de tcnica de estimacin estadstica que
intensidad de la transaccin, el valor de la transaccin y la rentabilidad
se utiliza para asignar cada objeto de datos a un valor real que proporcione
individual del cliente. Los elementos del desarrollo del cliente incluyen el valor de prediccin (Carrier & Povel, 2003; Mitra et al., 2002). Los usos de la
anlisis del valor de la vida til del cliente, la subida / venta cruzada y el regresin incluyen la adaptacin de la curva, la prediccin (incluida la
anlisis de la cesta de mercado. El anlisis del valor de la vida del cliente se prediccin), el modelado de las relaciones causales y la prueba de hiptesis
define como la prediccin del ingreso neto total que una compaa puede cientficas sobre las relaciones entre variables. Las herramientas comunes
esperar de un cliente (Drew, Mani, Betz & Datta, 2001, Etzion, Fisher y para la regresin incluyen regresin lineal y regresin logstica.
Wasserkrug, 2005, Rosset, Neumann, Eick, & Vatnik, 2003). La
subcotizacin / venta cruzada se refiere a actividades de promocin cuyo vi) Deteccin de secuencias: El descubrimiento de secuencias es la
objetivo es aumentar el nmero de servicios asociados o estrechamente identificacin de asociaciones o patrones a lo largo del tiempo (Berson et al.,
relacionados que un cliente utiliza dentro de una empresa (Prinzie & Poel, 2000, Carrier & Povel, 2003, Mitra et al., 2002). Su objetivo es modelar los
2006). El anlisis de la cesta de mercado tiene como objetivo maximizar la estados del proceso que genera la secuencia o extraer y reportar desviaciones
y tendencias a lo largo del tiempo (Mitra et al., 2002). Las herramientas
intensidad y el valor de las transacciones de los clientes revelando
comunes para el descubrimiento de secuencias son estadstica y teora de
regularidades en el comportamiento de compra de los clientes (Aggarval & conjuntos.
Yu, 2002, Brijs, Swinnen, Vanhoof & Wets, 2004; , Shen & amp; Hu, 2005,
Giudici & Passerone, 2002, Kubat, Hafez, Raghavan, Lekkala, & Chen, vii) Visualizacin: La visualizacin se refiere a la presentacin de datos para
2003). que los usuarios puedan ver patrones complejos (Shaw et al., 2001). Se utiliza
junto con otros modelos de minera de datos para proporcionar una
3.2. Marco de clasificacin - modelos de minera de datos comprensin ms clara de los patrones o relaciones descubiertos (Turban et
al., 2007). Ejemplos de modelos de visualizacin son grficos 3D, '' Hygraphs
'' y '' SeeNet '' (Shaw et al., 2001).
En el contexto del CRM, la minera de datos puede ser vista como un proceso
impulsado por el negocio dirigido al descubrimiento y uso consistente de
conocimiento rentable a partir de datos organizacionales (Ling & Yen, 2001). A menudo se requiere una combinacin de modelos de minera de datos para
apoyar o predecir los efectos de una estrategia de CRM. En tal situacin, la
Puede usarse para guiar la toma de decisiones y predecir los efectos de las clasificacin de los modelos de minera de datos mencionados en el artculo
decisiones. Por ejemplo, la minera de datos puede aumentar las tasas de se basar en los principales temas de CRM que el artculo deseara abordar.
respuesta de la campaa de marketing segmentando a los clientes en grupos Por ejemplo, en el caso de los programas de venta ascendente / cruzada, los
clientes pueden segmentarse en clsteres antes de aplicar un modelo de
con diferentes caractersticas y necesidades; puede predecir la probabilidad de
asociacin a cada clster. En tales casos, el programa de venta ascendente /
que un cliente existente lleve su negocio a un competidor (Carrier & Povel, cruzada se clasificara como respaldado por un modelo de asociacin porque
2003). Cada uno de los elementos de CRM puede ser soportado por diferentes las relaciones entre los productos son la principal preocupacin; en el caso de
modelos de minera de datos, que generalmente incluyen la asociacin, la comercializacin directa, una cierta porcin de los clientes puede ser
segmentada en clusters para formar las clases iniciales del modelo de
clasificacin, agrupacin, pronstico, regresin, descubrimiento de secuencias clasificacin. El programa de comercializacin directa se clasificara como
y visualizacin. respaldado por la clasificacin, ya que la prediccin del comportamiento de
los clientes es la principal preocupacin.
(i) Asociacin: La asociacin tiene como objetivo establecer relaciones entre
elementos que existen juntos en un registro dado (Ahmed, 2004; Jiao, Zhang, 3.3. Proceso de clasificacin
& Helander, 2006; Mitra et al., 2002). El anlisis de la cesta de mercado y los
programas de venta cruzada son ejemplos tpicos para los que generalmente Cada uno de los artculos seleccionados fue revisado y clasificado de acuerdo
con el marco de clasificacin propuesto por tres investigadores
se adopta el modelo de asociacin. Las herramientas comunes para el
independientes. El proceso de clasificacin consisti en cuatro fases:
modelado de asociaciones son estadsticas y algoritmos apriori.
(1) Bsqueda de bases de datos en lnea.
ii) Clasificacin: La clasificacin es uno de los modelos de aprendizaje ms
(2) Clasificacin inicial por el primer investigador.
comunes en la extraccin de datos (Ahmed, 2004; Berry & Lin-off, 2004;
Carrier & Povel, 2003). Su objetivo es construir un modelo para predecir los (3) Verificacin independiente de los resultados de la clasificacin por el
futuros comportamientos de los clientes a travs de la clasificacin de segundo investigador; y
registros de bases de datos en un nmero de clases predefinidas basadas en
(4) Verificacin final de los resultados de clasificacin por tercer
ciertos criterios (Ahmed, 2004; Berson et al., 2000, Chen, Hsu y Chou, 2003; investigador.
, 2002). Herramientas comunes utilizadas
2596 E.W.T. Ngai et al. / Expert Systems with Applications 36 (2009) 25922602

Online
Database Exclude

Criterio de bsqueda:

1. Descriptor: Gestion de relaciones con clientes y mineria de datos


2. Publicado entre 2000 y 2006

No (Conference papers, master and doctoral dissertations,


Journal textbooks and unpublished working papers)
Article

Yes

No
Related
to CRM

Yes:
1. CRM Dimensions & Elements
a. Customer Identification
i. Target Customer Analysis
ii. Customer Segmentation
b. Customer Attraction
i. Direct Marketing
c. Customer Retention
i. Loyalty Program
ii. One-to-One Marketing
iii. Complaint Management
d. Customer Development
i. Customer Lift Time Cycle
ii. Up/Cross Selling
iii. Market Basket Analysis

No
Related
to DM

Yes:
1. DM Models and Techniques
a. Association
b. Classification a. 1st verification of classification result
c. Clustering by 2nd researcher
d. Forecasting b. Final verification of classification
e. Regression result by 3rd researcher
f. Sequence Discovery
g. Visualization
Inconsistency of Classification
Result among three researchers
Initial /2nd /3rd
Discussion on
Classification Classification
Results Results

Consistency of Classification
Result among three researchers

A majority decision will


Finalized
be considered final
Classification
Results of Articles

Fig. 2. Selection criteria and evaluation framework.

que se muestra en la figura 2. La coleccin de artculos se analiz de acuerdo


Si hubo una discrepancia en la clasificacin, cada uno de estos artculos fue con los elementos de CRM y modelos de minera de datos, por ao de
discutido hasta que hubo acuerdo sobre cmo el artculo debera ser publicacin y segn la revista en la que se public el artculo.
clasificado del conjunto final en el marco de clasificacin propuesto. Los
criterios de seleccin y el marco de evaluacin
E.W.T. Ngai et al. / Expert Systems with Applications 36 (2009) 25922602 2597

4. Clasificacin de los artculos y se aplican fcilmente a las reas de clasificacin, agrupamiento y


prediccin (Berry & Linoff, 2004, Turban et al., 2007). De los 30 artculos
Una distribucin detallada de los 87 artculos clasificados por el marco de que aplicaron tcnicas de redes neuronales, 16 (53,3%) adoptan subtipos de
clasificacin propuestos se muestra en la Tabla 1. mapas autoorganizados, lo que implica cartografiar datos estructurados de alta
dimensin en una matriz de neuronas mucho ms baja de manera ordenada a
4.1. Distribucin de artculos por dimensiones de CRM y modelos de minera travs del proceso de entrenamiento , Kim, Cho, & Kim, 2004).
de datos
rboles de decisin: Esta tcnica puede utilizarse para extraer modelos
que describen secuencias de decisiones interrelacionadas o para predecir
La distribucin de los artculos clasificados por el modelo de clasificacin futuras tendencias de datos (Berry y Linoff, 2004, Kim, Song, Kim,
propuesto se muestra en la Tabla 2. Entre las cuatro dimensiones CRM, la
& Kim, 2005). Clasifica entidades especficas en clases particulares
retencin de clientes (54 de 87 artculos, 62,1%) es la dimensin ms comn
basadas en las caractersticas de las entidades: una raz es seguida por nodos
para la que se utiliza la minera de datos apoyar la toma de decisiones. Haba
inter-nal, cada nodo est marcado con una pregunta y un arco asociado con
13 artculos para cada uno de identificacin del cliente y desarrollo del cliente
que cubra varios aspectos de CRM. cada nodo cubre todas las respuestas posibles (Buckinx, Moons , Poel, &
Wets, 2004, Chen et al., 2003). Algunos de los algoritmos ms conocidos son
De los 54 artculos de retencin de clientes, 51,9% (28 artculos) y 44,4% (24 ID3, C4.5 y rboles de clasificacin y regresin.
artculos) estn relacionados con programas de marketing y fidelizacin uno a
uno, respectivamente. Los programas de marketing y fidelizacin de uno a Reglas de asociacin: Se trata del descubrimiento de relaciones de
uno tambin ocupan el primer lugar (28 artculos de 87 artculos, 32,2%) y asociacin interesantes, que estn por encima de un umbral de inters, oculto
segundo (24 artculos de 87 artculos, 27,6%) en trminos de temas en las bases de datos (Berry y Linoff, 2004; Wang, Zhou, Yang y Yeung,
relacionados con la minera de datos y CRM. Sin embargo, hubo 2004; ). El umbral indica cun fuerte es el patrn y cun probable es que la
relativamente pocos artculos que abarcaban el "up / cross selling" (2 regla vuelva a ocurrir (Berson et al., 2000). Las reglas de asociacin
artculos, el 2,3%), el "com-plaint management" (2 artculos, el 2,3%), ) y seleccionadas pueden usarse para construir un modelo para predecir el valor
"anlisis de valor de la vida del cliente" (5 artculos, 5.7%). de un cliente futuro (Wang et al., 2005).

En el marketing uno a uno, el 46,4% (13 de 28 artculos) utilizaron modelos 4.2. Distribucin de artculos por ao de publicacin
de asociacin para analizar los datos de los clientes, seguidos del 25,0% (7 de
28 artculos) que utilizaron modelos de clasificacin. Con respecto a los
La distribucin de los artculos por ao de publicacin se muestra en la
programas de fidelidad, el 83,3% (20 de 24 artculos) utiliz modelos de
figura 3. Es obvio que las publicaciones relacionadas con la aplicacin de
clasificacin para ayudar en la toma de decisiones.
tcnicas de minera de datos en CRM han aumentado significativamente entre
La Tabla 3 muestra la distribucin de artculos por tcnicas de minera de 2000 y 2005. En 2006, la cantidad de publicaciones disminuy 30% en
datos. Entre las 34 tcnicas de minera de datos que se han aplicado en CRM, comparacin con 2005.
las redes neuronales son las tcnicas ms utilizadas. Se ha descrito en 30
(34,5%) de los 87 artculos en total. A continuacin se presentan las reglas de 4.3. Distribucin de artculos por la revista en la que se publicaron los
rbol de decisin y asociacin que han sido descritas respectivamente en 21 artculos
(24,1%) y 20 (23,0%) artculos. Proporcionamos una breve descripcin de las
tres tcnicas ms utilizadas y algunas referencias como sigue: La tabla 4 muestra la distribucin de artculos por revista. Los artculos
relacionados con la aplicacin de tcnicas de minera de datos en CRM se
Redes neuronales: En el campo de la inteligencia artificial, las tcnicas de red distribuyen en 24 revistas. De stos, "Sistemas expertos con aplicaciones",
neural han sido aplicadas con xito al reconocimiento del habla, al anlisis de que se centra en el conocimiento de la aplicacin
imgenes y al control adaptativo. La mayora de los sistemas de red neural
actualmente empleados simular el cerebro humano,

Table 1
Distribution of articles according to the proposed classification model

CRM dimensions CRM elements Data mining Data mining techniques References
functions
Customer Segmentation Classification Decision tree Kim, Jung, Suh, and Hwang (2006)
identification Self-organizing map, decision tree and Markov Ha, Bae, and Park (2002)
chain model
Clustering K-means Dennis, Marsland, and Cockett (2001)
Data envelopment analysis, self organizing map Lee and Park (2005)
& decision tree
Pattern based cluster Yang and Padmanabhan (2005)
Self-organizing map Bae, Park, and Ha (2003), Verd, Garca, Senabre, Marn, and
Franco (2006)
Regression Logistic regression Hwang, Jung, and Suh (2004)
Target customer Classification Decision tree Chen et al. (2003), Wu, Kao, Su, and Wu (2005), Yu, Ou,
analysis Zhang, and Zhang (2005)
Clustering Self-organizing map Lee, Suh, Kim, and Lee (2004)
Visualization Customer map Woo et al. (2005)
Customer Direct marketing Regression Logistic regression Prinzie and Poel (2005)
attraction Classification Bayesian network classifier Baesens et al. (2002)
Decision tree Buckinx et al. (2004)
Genetic algorithm Ahn et al. (2006), Chiu (2002)
Neural network and genetic algorithm Kim and Street (2004)
Clustering Outlier detection He et al. (2004)
(continued on next page)
2598 E.W.T. Ngai et al. / Expert Systems with Applications 36 (2009) 25922602

Table 1 (continued)
CRM CRM Data mining Data mining techniques References
dimensions elements functions
Customer Complaints Clustering Self-organizing map Bae et al. (2005)
retention management Sequence Survival analysis LariviRe and Poel (2005)
discovery
Loyalty Classification Decision tree 20 Cox (2002), Douglas et al. (2005), LarivieRe and Poel (2005)
program Genetic algorithm Kim et al. (2003)
Logical analysis of data Lejeune (2001)
Neural network, K-nearest neighbor and decision tree Datta et al. (2000)
Classification and regression tree and multivariate Lee et al. (2006)
adaptive regression splines
Logistic regression and neural network Kim (2006)
Logistic regression, neural network and random forest Buckinx and Poel (2005)
Neural network and decision tree Hung et al. (2006)
Self-organizing map and Markov chain Kim et al. (2005)
Logistic regression, neural network and decision tree Koh and Chan (2002), Mozer et al. (2000), Smith et al. (2000)
Self-organizing map and decision tree Chu, Isai, and Ho (2007)
Data mining by evolutionary learning Au et al. (2003)
Multi-classifier class combiner approach Wei and Chiu (2002)
Self-organizing map Song et al. (2004)
Survival analysis LarivieRe and Poel (2004), Poel and Larivire (2004)
Clustering Attribute oriented induction Li et al. (2006)
Regression Logistic regression Cassab and Maclachlan (2006), Poel and Buckinx (2005)
Sequence Goal oriented sequential pattern Chiang et al. (2003)
discovery
One to one Association Association rules Adomavicius and Tuzhilin (2001), Au and Chan (2003), Chen,
marketing Chiu, and Chang (2005), Demiriz (2004), Jiao et al. (2006), Lee
et al. (2001), Wang et al. (2004)
Set theory and self-organizing map Changchien and Lu (2001)
Association rules and self-organizing map Ha (2002), Ha et al. (2006), Hsieh (2004)
Association rules and K-means Liu and Shih (2005)
MARFS1/S2 He et al. (2005)
Classification Decision tree Kim, Song, Kim, and Kim (2005), Min et al. (2002)
If-then-else Leung et al. (2003)
Support vector machine and latent class model Cheung et al. (2003)
Decision tree, naive Bayes, rule based RIPPER, K-nearest Jiang and Tuzhilin (2006)
network, S-means, S-means mod, farther first,
expectation Max & Expectation Max Mod
Constructive assignment algorithm Kim and Moon (2006)
Self-organizing map Lee and Park (2003)
Clustering Association rules Liao and Chen (2004)
K-nearest neighbor Cho and Kim (2004)
Neural network and genetic algorithm Kuo et al. (2005)
Self-organizing map Cho et al. (2005), Min and Han (2005)
Association rules Song et al. (2001)
Association rules and online Kwan et al. (2005)
Analytical mining neural network Chang et al. (2006)
Customer Lifetime Classification Bayesian network classifier Baesens et al. (2004)
development value Clustering Neural network Drew et al. (2001)
Survival analysis Rosset et al. (2003)
Forecasting Markov chain model Etzion et al. (2005)
Regression Linear regression Verhoef and Donkers (2001)
Market Association Association rules Aggarval and Yu (2002), Brijs et al. (2004), Jukic and Nestorov
basket (2006)
analysis Markov chain model Giudici and Passerone (2002)
Sequence Association rules Chen, Tang, Shen, and Hu (2005), Kubat et al. (2003)
discovery
Up/cross Association Neural network and association rule Changchien et al. (2004)
selling Sequence Mixture transition distribution Prinzie and Poel (2006)
discovery

de sistemas expertos e inteligentes en la industria, el gobierno y la no puede pretender ser exhaustiva, s proporciona ideas razonables y
universidad en todo el mundo, contiene ms del 40% (38 de 87 artculos) muestra la incidencia de la investigacin sobre este tema. Los resultados
del nmero total de artculos publicados. presentados en este documento tienen varias implicaciones importantes:

5. Conclusin, implicaciones y limitaciones de la investigacin La investigacin sobre la aplicacin de la minera de datos en CRM
aumentar significativamente en el futuro sobre la base de las tasas de
Aplicacin de tcnicas de minera de datos en CRM es una tendencia publicaciones anteriores y el creciente inters en el rea.
emergente en la industria. Ha atrado la atencin de profesionales y La mayora de los artculos revisados estn relacionados con la retencin
acadmicos. Este artculo ha identificado ochenta y siete artculos de clientes. De estos, el 51,9% (28 artculos) y el 44,4% (24 artculos)
relacionados con la aplicacin de tcnicas de minera de datos en el CRM y estn relacionados con programas de marketing y fidelizacin uno a uno
publicados entre 2000 y 2006. Su objetivo es dar un resumen de la respectivamente. Estos artculos podran proporcionar una visin a los
investigacin sobre la aplicacin de la minera de datos en el dominio responsables polticos de la organizacin sobre las prcticas comunes de
CRM y las tcnicas que son ms utilizado a menudo. Aunque esta revisin minera de datos utilizadas en la retencin de clientes.
E.W.T. Ngai et al. / Expert Systems with Applications 36 (2009) 25922602 2599

Table 2 Table 3
Distribution of articles by CRM and data mining model Distribution of articles by data mining techniques

CRM dimensions CRM elements Data mining Amount Data mining techniques Amount
model Neural network 30
Customer Customer 8 Decision tree 23
identification segmentation Classification 2 Association rules 18
Clustering 5 Regression 10
Regression 1 Genetic algorithm 4
Target customer 5 Markov chain 4
analysis Classification 3 Survival analysis 4
Clustering 1 K means 3
Visualization 1 K nearest neighbour 3
13 Bayesian network classifier 2
If-then-else 1
Customer attraction Direct marketing 7
Set theory 1
Regression 1
Support vector machine 1
Classification 5
Attribute oriented induction 1
Clustering 1
Constructive assignment 1
7
Customer map 1
Customer retention Complaints 2
Data envelopment analysis 1
management Clustering 1
Data mining by evolutionary learning 1
Sequence 1
Expectation Max 1
Discovery
Expectation Max Mod 1
Loyalty program 24
Farthest first 1
Classification 20
Goal oriented sequential pattern 1
Clustering 1
Latent class model 1
Regression 2
Logical analysis of data 1
Sequence 1
MARFS1/S2 1
discovery
Mixture transition distribution 1
One to one marketing 28
Multi-classifier class combiner 1
Association 13
Multivariate adaptive regression splines 1
Classification 7
Online analytical mining 1
Clustering 5
Outlier detection 1
Sequence 3
Pattern based cluster 1
discovery
Rule-based RIPPER 1
54
S-means 1
Customer Customer lifetime 5 S-means Mod 1
development value Classification 1
Clustering 2 Totala 125
Forecasting 1 a
Remark: Each article may have used more that one data mining techniques.
Regression 1
Market basket 6
analysis Association 4
Sequence 2
discovery
25
Up/cross selling 2 23
Association 1
20
Sequence 1
ofArticle

16
discovery
16
s

13 15
Numbe

Total 87 87 87
10 11
10
r

De los 54 artculos relacionados con la retencin de clientes, slo dos de ellos 5


discuten la gestin de quejas. La gestin de quejas es un requisito crucial para 3

las empresas exitosas cuando se manejan las necesidades de los clientes y los 0
cambios en el comportamiento. Las tcnicas de minera de datos podran 2000 2001 2002 2003 2004 2005 2006
aplicarse para descubrir patrones no vistos de quejas de la base de datos de Year of Publication
una empresa. La raz de los problemas tambin puede ser descubierta Fig. 3. Distribution of articles by year of publication.
mediante la investigacin de la asociacin entre las quejas de diferentes
clientes. Por lo tanto, se podra realizar ms investigacin sobre la aplicacin
El modelo de clasificacin es el modelo ms comnmente aplicado en
de tcnicas de minera de datos en la gestin de quejas.
CRM para predecir comportamientos futuros de los clientes. Esto no es
sorprendente ya que el modelado de la clasificacin podra utilizarse para
Hay relativamente menos artculos que discuten el anlisis del cliente predecir la eficacia o la rentabilidad de una estrategia de CRM mediante la
objetivo. Las tcnicas de minera de datos, como las redes neuronales y los prediccin de comportamientos de los clientes.
rboles de decisin, podran utilizarse para buscar los segmentos rentables de Slo un artculo discuti la visualizacin de los resultados de minera de
los clientes a travs del anlisis de las caractersticas subyacentes de los datos en el contexto de CRM. Uno puede ver la visualizacin como un
clientes. A pesar del menor nmero de artculos relacionados con el anlisis complemento a otros modelos de minera de datos, ya que se refiere a la
presentacin de patrones o relaciones descubiertas. Por lo tanto, los buenos
del cliente objetivo, no significa que la aplicacin de datos min-ing en este sistemas de visualizacin podran ampliar el mrito de las tcnicas de
aspecto es menos maduro que en los otros. Las aplicaciones de la minera de minera de datos en CRM. Se podra hacer ms investigacin en este tema.
datos en otros dominios de CRM, como en el marketing uno a uno, tambin
pueden aplicarse al anlisis de clientes objetivo si poseen el mismo objetivo
de analizar las caractersticas de los clientes.
2600 E.W.T. Ngai et al. / Expert Systems with Applications 36 (2009) 25922602

Table 4 References
Distribution of articles by journal
Adomavicius, G., & Tuzhilin, A. (2001). Expert-driven validation of rule-based user models in
Journal title Amount Percentage personalization applications. Data Mining and Knowledge Discovery, 5, 3358.
(%)
Aggarval, C. C., & Yu, P. S. (2002). Finding localized associations in market basket data. IEEE
Expert Systems with Applications 38 43.70
Transactions on Knowledge and Data Engineering, 14, 5162.
Decision Support Systems 9 10.30 Ahmed, S. R. (2004). Applications of data mining in retail business. Information Technology:
European Journal of Operational Research 5 6.90 Coding and Computing, 2, 455459.
IEEE Transaction on Knowledge and Data Engineering 5 5.70 Ahn, H., Kim, K. J., & Han, I. (2006). Hybrid genetic algorithms and case-based reasoning
Data Mining and Knowledge Discovery 4 4.60 systems for customer classification. Expert Systems with Applications, 23, 127144.
IEEE Intelligent Systems 4 4.60
Artificial Intelligence Review 2 2.30 Au, W. H., & Chan, K. C. C. (2003). Mining fuzzy association rules in a bank-account
Computational Statistics and Data Analysis 2 2.30 database. IEEE Transactions on Fuzzy Systems, 11, 238248.
IEEE Transactions on Power Systems 2 2.30 Au, W. H., Chan, K. C. C., & Yao, X. (2003). A novel evolutionary data mining algorithm with
Computers and Industrial Engineering 1 1.10 applications to churn prediction. IEEE Transactions on Evolutionary Computation, 7, 532
Electronic Networking Applications and Policy 1 1.10 545.
Evolutionary Computation 1 1.10 Bae, S. M., Ha, S. H., & Park, S. C. (2005). A web-based system for analyzing the voices of call
IEEE Transactions on Fuzzy Systems 1 1.10 center customers in the service industry. Expert Systems with Applications, 28, 2941.
IEEE Transactions on speech and audio processing 1 1.10
Bae, S. M., Park, S. C., & Ha, S. H. (2003). Fuzzy web ad selector based on web usage mining.
Information and Management 1 1.10
IEEE Intelligent Systems, 6269.
Information Systems Frontiers 1 1.10 Baesens, B., Verstraeten, G., Dirk, V. D. P., Michael, E. P., Kenhove, V. K., & Vanthienen, J.
International Journal of Contemporary Hospitality 1 1.10 (2004). Bayesian network classifiers for identifying the slope of the customer-lifecycle of
Management long-life customers. European Journal of Operational Research, 156, 508523.
International Journal of Productivity and Performance 1 1.10
Management Baesens, B., Viaene, S., Poel, D. V. D., Vanthienen, J., & Dedene, G. (2002). Bayesian neural
Journal of knowledge management 1 1.10 network learning for repeat purchase modelling in direct marketing. European Journal of
Journal of Service Research 1 1.10 Operational Research, 138, 191211.
Journal of the Operational Research Society 1 1.10 Berry, M. J. A., & Linoff, G. S. (2004). Data mining techniques second edition - for marketing,
Knowledge-Based Systems 1 1.10 sales, and customer relationship management. Wiley.
Singapore Management Review 1 1.10 Berson, A., Smith, S., & Thearling, K. (2000). Building data mining applications for CRM.
Telecommunication Systems 1 1.10 McGraw-Hill.
Bortiz, J. E., & Kennedy, D. B. (1995). Effectiveness of neural network types for prediction of
Total 87 100.00 business failure. Expert Systems with Applications, 9, 503512.
Brijs, T., Swinnen, G., Vanhoof, K., & Wets, G. (2004). Building an association rules
framework to improve product assortment decisions. Data Mining and Knowledge
Entre los 87 artculos, 30 describieron redes neuronales en el dominio CRM. Discovery, 8, 723.
Buckinx, W., Moons, E., Poel, D. V. D., & Wets, G. (2004). Customer-adapted coupon
Las redes neuronales se pueden aplicar en la clasificacin, agrupacin y targeting using feature selection. Expert Systems with Applications, 26, 509 518.
prediccin. Por lo tanto, no es sorprendente que las redes neurales de
trabajo se utilizaron en una amplia gama de dominios de CRM. Buckinx, W., & Poel, D. V. D. (2005). Customer base analysis: Partial defection of
behaviorally-loyal clients in a non-contractual FMCG retail setting. European Journal of
Operational Research, 164, 252268.
rboles de decisin y reglas de asociacin de las tcnicas de rango despus de Carrier, C. G., & Povel, O. (2003). Characterising data mining software. Intelligent Data
redes neuronales en popularidad de la aplicacin en CRM. La lgica de Analysis, 7, 181192.
ambas tcnicas puede ser seguida ms fcilmente por los empresarios que Cassab, H., & Maclachlan, D. L. (2006). Interaction fluency: A customer performance measure
of multichannel service. International Journal of Productivity and Performance
por las redes neuronales. Por lo tanto, las dos tcnicas deben ser una Management, 55, 555568.
buena opcin para los no expertos en minera de datos. Chang, S. E., Changchien, S. W., & Huang, R. H. (2006). Assessing users product-specific
knowledge for personalization in electronic commerce. Expert Systems with Applications,
30, 682693.
Con respecto a los resultados de la investigacin, sugerimos que se puedan
Changchien, S. W., Lee, C. F., & Hsu, Y. J. (2004). On-line personalized sales promotion in
realizar ms investigaciones en el mbito del desarrollo del cliente. Con el electronic commerce. Expert Systems with Applications, 27, 35 52.
fin de maximizar los beneficios de una organizacin a travs de CRM, los
fabricantes de polticas tienen que retener clientes valiosos e incrementar Changchien, S. W., & Lu, T. C. (2001). Mining association rules procedure to support on-line
recommendation by customers and products fragmentation. Expert Systems with
el valor de vida del cliente. Como tal, la retencin de clientes y el Applications, 20, 325335.
desarrollo son importantes para mantener una relacin a largo plazo y Chen, M. C., Chiu, A. L., & Chang, H. H. (2005). Mining changes in customer behavior in
agradable con los clientes. retail marketing. Expert Systems with Applications, 28, 773781.
Chen, Y. L., Hsu, C. L., & Chou, S. C. (2003). Constructing a multi-valued and multi-labeled
decision tree. Expert Systems with Applications, 25, 199209.
Este estudio podra tener algunas limitaciones. En primer lugar, este estudio Chen, Y. L., Tang, K., Shen, R. J., & Hu, Y. H. (2005). Market basket analysis in a multiple
slo encuest artculos publicados entre 2000 y 2006, que se extrajeron a store environment. Decision Support Systems, 40, 339354.
partir de una bsqueda de palabras clave de "gestin de relaciones con Cheung, K. W., Kwok, J. T., Law, M. H., & Tsui, K. C. (2003). Mining customer product
ratings for personalized marketing. Decision Support Systems, 35, 231243.
clientes" y "minera de datos". No se pudo extraer artculos que Chiang, D. A., Wang, Y. F., Lee, S. L., & Lin, C. J. (2003). Goal-oriented sequential pattern for
mencionaran la aplicacin de tcnicas de minera de datos en CRM pero network banking churn analysis. Expert Systems with Applications, 25, 293302.
sin un ndice de palabras clave. En segundo lugar, este estudio limit la
Chiu, C. (2002). A case-based customer classification approach for direct marketing.
bsqueda de artculos a 7 bases de datos en lnea. Puede haber otras
Expert Systems with Applications, 22, 163168.
revistas acadmicas que puedan ser capaces de proporcionar una imagen Cho, Y. B., Cho, Y. H., & Kim, S. H. (2005). Mining changes in customer buying behavior for
ms completa de los artculos relacionados con la aplicacin de la minera collaborative recommendations. Expert Systems with Applications, 28, 359369.
de datos en CRM. Por ltimo, se excluyeron las publicaciones no inglesas
Cho, Y. H., & Kim, J. K. (2004). Application of web usage mining and product taxonomy to
en este estudio. Creemos que la investigacin sobre la aplicacin de collaborative recommendations in e-commerce. Expert Systems with Applications, 26,
tcnicas de minera de datos en CRM tambin se ha discutido y publicado 233246.
en otros idiomas. Chu, B. H., Tsai, M. S., & Ho, C. S. (2007). Toward a hybrid data mining model for customer
retention. Knowledge-Based Systems, 20, 703718.
Cox, L. A. (2002). Data mining and causal modeling of customer behaviors.
Expresiones de gratitud Telecommunication Systems, 21, 349381.
Datta, P., Masand, B., Mani, D. R., & Li, B. (2000). Automated cellular modeling and
Esta investigacin fue apoyada en parte por la Universidad Politcnica de prediction on a large scale. Artificial Intelligence Review, 14, 485502.
Demiriz, A. (2004). Enhancing product recommender systems on sparse binary data.
Hong Kong (Proyecto N: G-YF20) y la Fundacin Nacional de Ciencias Data Mining and Knowledge Discovery, 9, 147170.
Naturales de China (NSFC, Proyecto n: 70671059).
E.W.T. Ngai et al. / Expert Systems with Applications 36 (2009) 25922602 2601

Dennis, C., Marsland, D., & Cockett, T. (2001). Data mining for shopping centres-customer Lau, H. C. W., Wong, C. W. Y., Hui, I. K., & Pun, K. F. (2003). Design and implementation of
knowledge management framework. Journal of Knowledge Management, 5, 368374. an integrated knowledge system. Knowledge-Based Systems, 16, 6976.

Douglas, S., Agarwal, D., & Alonso, T. (2005). Mining customer care dialogs for daily news. Lee, C. H., Kim, Y. H., & Rhee, P. K. (2001). Web personalization expert with combining
IEEE Transactions on Speech and Audio Processing, 13, 652660. collaborative filtering and association rule mining technique. Expert Systems with
Drew, J. H., Mani, D. R., Betz, A. L., & Datta, P. (2001). Targeting customers with statistical Applications, 21, 131137.
and data-mining techniques. Journal of Service Research, 3, 205 220. Lee, J. H., & Park, S. C. (2003). Agent and data mining based decision support system and its
adaptation to a new customer-centric electronic commerce. Expert Systems with
Etzion, O., Fisher, A., & Wasserkrug, S. (2005). E-CLV: A modeling approach for customer Applications, 25, 619635.
lifetime evaluation in e-commerce domains, with an application and case study for online Lee, J. H., & Park, S. C. (2005). Intelligent profitable customers segmentation system based on
auction. Information Systems Frontiers, 7, 421434. business intelligence tools. Expert Systems with Applications, 29, 145152.
Fletcher, D., & Goss, E. (1993). Forecasting with neural networks: An application using
bankruptcy data. Information and Management, 3. Lee, S. C., Suh, Y. H., Kim, J. K., & Lee, K. J. (2004). A cross-national market segmentation of
Giudici, P., & Passerone, G. (2002). Data mining of association structures to model consumer online game industry using SOM. Expert Systems with Applications, 27, 559570.
behaviour. Computational Statistics and Data Analysis, 38, 533541.
Ha, S. H. (2002). Helping online customers decide through web personalization. IEEE Lee, T. S., Chiu, C. C., Chou, Y. C., & Lu, C. J. (2006). Mining the customer credit using
Intelligent Systems, 17, 3443. classification and regression tree and multivariate adaptive regression splines.
Ha, S. H., Bae, S. M., & Park, S. C. (2002). Customers time-variant purchase behavior and Computational Statistics and Data Analysis, 50, 11131130.
corresponding marketing strategies: An online retailers case. Computers and Industrial Lejeune, M. A. P. M. (2001). Measuring the impact of data mining on churn management.
Engineering, 43, 801820. Internet Research: Electronic Networking Applications and Policy, 11, 375387.
Ha, S. H., Bae, S. M., & Park, S. C. (2006). Digital content recommender on the internet. IEEE
Intelligent Systems, 21, 7077. Leung, R. W. K., Lau, H. C. W., & Kwong, C. K. (2003). On a responsive replenishment
He, Z., Xu, X., Deng, S., & Ma, R. (2005). Mining action rules from scratch. Expert Systems system: A fuzzy logic approach. Expert Systems with Applications, 20, 2032.
with Applications, 29, 691699. Li, S. T., Shue, L. Y., & Lee, S. F. (2006). Enabling customer relationship management in ISP
He, Z., Xu, X., Huang, J. Z., & Deng, S. (2004). Mining class outliers: Concepts, algorithms services through mining usage patterns. Expert Systems with Applications, 30, 621632.
and applications in CRM. Expert Systems with Applications, 27, 681697.
Liao, S. H., & Chen, Y. J. (2004). Mining customer knowledge for electronic catalog marketing.
Hsieh, N. C. (2004). An integrated data mining and behavioral scoring model for analyzing Expert Systems with Applications, 27, 521532.
bank customers. Expert Systems with Applications, 27, 623633. Ling, R., & Yen, D. C. (2001). Customer relationship management: An analysis framework and
Hung, S. Y., Yen, D. C., & Wang, H. Y. (2006). Applying data mining to telecom churn implementation strategies. Journal of Computer Information Systems, 41, 8297.
management. Expert Systems with Applications, 31, 515524.
Hwang, H., Jung, T., & Suh, E. (2004). An LTV model and customer segmentation based on Liu, D. R., & Shih, Y. Y. (2005). Integrating AHP and data mining for product recommendation
customer value: A case study on the wireless telecommunication industry. Expert Systems based on customer lifetime value. Information and Management, 42, 340387.
with Applications, 26, 181188.
Jiang, T., & Tuzhilin, A. (2006). Segmenting customers from population to individuals: Does 1- Min, H., Min, H., & Eman, A. (2002). A data mining approach to developing the profiles of
to-1 keep your customers forever. IEEE Transactions on Knowledge and Data Engineering, hotel customers. International Journal of Contemporary Hospitality Management, 14, 274
18, 12971311. 285.
Jiao, J. R., Zhang, Y., & Helander, M. (2006). A Kansei mining system for affective design. Min, S. H., & Han, I. (2005). Detection of the customer time-variant pattern for improving
Expert Systems with Applications, 30, 658673. recommender systems. Expert Systems with Applications, 28, 189199.
Jukic, N., & Nestorov, S. (2006). Comprehensive data warehouse exploration with qualified
association-rule mining. Decision Support Systems, 42, 859878. Mitra, S., Pal, S. K., & Mitra, P. (2002). Data mining in soft computing framework: A survey.
Kim, E., Kim, W., & Lee, Y. (2003). Combination of multiple classifiers for the customers IEEE Transactions on Neural Networks, 13, 314.
purchase behavior prediction. Decision Support Systems, 34, 167175. Mozer, M. C., Wolniewicz, R., Grimes, D. B., Johnson, E., & Kaushansky, H. (2000).
Predicting subscriber dissatisfaction and improving retention in the wireless
Kim, J. K., Song, H. S., Kim, T. S., & Kim, H. K. (2005). Detecting the change of customer telecommunications industry. IEEE Transactions on Neural Networks, 11, 690696.
behavior based on decision tree analysis. Expert Systems with Applications, 22, 193205.
Ngai, E. W. T. (2005). Customer relationship management research (19922002): An academic
Kim, S. Y., Jung, T. S., Suh, E. H., & Hwang, H. S. (2006). Customer segmentation and literature review and classification. Marketing Intelligence, Planning, 23, 582605.
strategy development based on customer lifetime value: A case study. Expert Systems with
Applications, 31, 101107. Nord, J. H., & Nord, G. D. (1995). MIS research: Journal status and analysis.
Kim, Y. A., Song, H. S., & Kim, S. H. (2005). Strategies for preventing defection based on the Information & Management, 29, 2942.
mean time to defection and their implementations on a self-organizing map. Expert Parvatiyar, A., & Sheth, J. N. (2001). Customer relationship management: Emerging practice,
Systems with Applications, 22, 265278. process, and discipline. Journal of Economic & Social Research, 3, 134. Poel, D. V. D., &
Kim, Y. H., & Moon, B. R. (2006). Multicampaign assignment problem. IEEE Transactions on Buckinx, W. (2005). Predicting online-purchasing behavior.
Knowledge and Data Engineering, 18, 405414. European Journal of Operational Research, 166, 557575.
Kim, Y. S. (2006). Toward a successful CRM: Variable selection, sampling, and ensemble. Poel, D. V. D., & Larivire, B. (2004). Customer attrition analysis for financial services using
Decision Support Systems, 41, 542553. proportional hazard models. European Journal of Operational Research, 157, 196217.
Kim, Y. S., & Street, W. N. (2004). An intelligent system for customer targeting: A data mining
approach. Decision Support Systems, 37, 215228. Prinzie, A., & Poel, D. V. D. (2005). Constrained optimization of data-mining problems to
Kincaid, J. W. (2003). Customer relationship management: Getting it right. Upper improve model performance: A direct-marketing application. Expert Systems with
saddle river. N.J.: Prentice Hall PTR. Applications, 29, 630640.
Koh, H. C., & Chan, K. L. G. (2002). Data mining and customer relationship marketing in the Prinzie, A., & Poel, D. V. D. (2006). Investigating purchasing-sequence patterns for financial
banking industry. Singapore Management Review, 24, 128. services using Markov, MTD and MTDg models. European Journal of Operational
Kracklauer, A. H., Mills, D. Q., & Seifert, D. (2004). Customer management as the origin of Research, 170, 710734.
collaborative customer relationship management. Collaborative Customer Relationship Rosset, S., Neumann, E., Eick, U., & Vatnik, N. (2003). Customer lifetime value models for
Management - taking CRM to the next level, 36. decision support. Data Mining and Knowledge Discovery, 7, 321339.
Kubat, M., Hafez, A., Raghavan, V. V., Lekkala, J. R., & Chen, W. K. (2003). Item set trees for Salchenberger, L. M., Cinar, E. M., & Lash, N. A. (1992). Neural networks: A new tool for
targeted association querying. IEEE Transaction on Knowledge and Data Engineering, 15, predicting thrift failures. Decision Sciences, 23, 899916.
15221534. Shaw, M. J., Subramaniam, C., Tan, G. W., & Welge, M. E. (2001). Knowledge management
Kuo, R. J., Liao, J. L., & Tu, C. (2005). Integration of art2 neural network and genetic k-means and data mining for marketing. Decision Support Systems, 31, 127137.
algorithm for analyzing web browsing paths in electronic commerce. Decision Support
Systems, 40, 355374. Smith, K. A., Wills, R. J., & Brooks, M. (2000). An analysis of customer retention and
Kwan, I. S. Y., Fong, J., & Wong, H. K. (2005). An e-customer behavior model with online insurance claim patterns using data mining: A case study. Journal of the Operational
analytical mining for internet marketing planning. Decision Support Systems, 41, 189204. Research Society, 51, 532541.
Song, H. S., Kim, J. K., Cho, Y. B., & Kim, S. H. (2004). A personalized defection detection
Langley, P., & Simon, H. A. (1995). Applications of machine learning and rule induction. and prevention procedure based on the self-organizing map and association rule mining:
Communication of the ACM, 38, 5564. Applied to online game site. Artificial Intelligence Review, 21, 161184.
LarivieRe, B., & Poel, D. V. D. (2004). Investigating the role of product features in preventing
customer churn, by using survival analysis and choice modeling: The case of financial Song, H. S., Kim, J. K., & Kim, S. H. (2001). Mining the change of customer behavior in an
services. Expert Systems with Applications, 27, 277285. internet shopping mall. Expert Systems with Applications, 21, 157168.
Su, C. T., Hsu, H. H., & Tsai, C. H. (2002). Knowledge mining from trained neural networks.
LarivieRe, B., & Poel, D. V. D. (2005). Predicting customer retention and profitability by using Journal of Computer Information Systems, 42, 6170.
random forests and regression forests techniques. Expert Systems with Applications, 29, Swift, R. S. (2001). Accelarating customer relationships: Using CRM and relationship
472484. technologies. Upper saddle river. N.J.: Prentice Hall PTR.
LariviRe, B., & Poel, D. V. D. (2005). Investigating the post-complaint period by means of Tam, K. Y., & Kiang, M. Y. (1992). Managerial applications of neural networks: The case of
survival analysis. Expert Systems with Applications, 29, 667677. bank failure predictions. Management Science, 38, 926947.
2602 E.W.T. Ngai et al. / Expert Systems with Applications 36 (2009) 25922602

Teo, T. S. H., Devadoss, P., & Pan, S. L. (2006). Towards a holistic perspective of customer Wei, C. P., & Chiu, I. T. (2002). Turning telecommunications call details to churn prediction: A
relationship management implementation: A case study of the housing and development data mining approach. Expert Systems with Applications, 23, 103112.
board, Singapore. Decision Support Systems, 42, 16131627.
Woo, J. Y., Bae, S. M., & Park, S. C. (2005). Visualization method for customer targeting using
Turban, E., Aronson, J. E., Liang, T. P., & Sharda, R. (2007). Decision support and business customer map. Expert Systems with Applications, 28, 763772.
intelligence systems (Eighth ed.). Pearson Education.
Verd, S. V., Garca, M. O., Senabre, C., Marn, A. G., & Franco, F. J. G. (2006). Wu, C. H., Kao, S. C., Su, Y. Y., & Wu, C. C. (2005). Targeting customers via discovery
Classification, filtering, and identification of electrical customer load patterns through the knowledge for the insurance industry. Expert Systems with Applications, 29, 291299.
use of self-organizing maps. IEEE Transactions on Power Systems, 21, 16721682.
Yang, Y., & Padmanabhan, B. (2005). A hierarchical pattern-based clustering algorithm for
Verhoef, P. C., & Donkers, B. (2001). Predicting customer potential value an application in the grouping web transactions. IEEE Transaction on Knowledge and Data Engineering, 17,
insurance industry. Decision Support Systems, 32, 189199. 13001304.
Wang, K., Zhou, S., Yang, Q., & Yeung, J. M. S. (2005). Mining customer value: From Yu, J. X., Ou, Y., Zhang, C., & Zhang, S. (2005). Identifying interesting visitors through web
association rules to direct marketing. Data Mining and Knowledge Discovery, 11, 5779. log classification. IEEE Intelligent Systems, 20, 5559.
Zhang, G., Hu, M. Y., Patuwo, B. E., & Indro, D. C. (1999). Artificial neural networks in
Wang, Y. F., Chuang, Y. L., Hsu, M. H., & Keh, H. C. (2004). A personalized recommender bankruptcy prediction: General framework and cross validation analysis. European Journal
system for the cosmetic business. Expert Systems with Applications, 26, 427434. of Operational Research, 116, 1632.