Documentos de Académico
Documentos de Profesional
Documentos de Cultura
abstracto
En este trabajo se analiza la literatura reciente en la bsqueda de tendencias
en aplicaciones de inteligencia empresarial para la industria bancaria. Las
bsquedas se realizaron en revistas relevantes que resultan en 219 artculos
publicados entre 2002 y 2013. Para analizar un gran nmero de manuscritos
tales, las tcnicas de minera de texto eran utilizados en la bsqueda de
trminos relevantes tanto en la inteligencia de negocio y dominios bancarios.
Por otra parte, la modelado asignacin Dirichlet latente se utiliz con el fin de
artculos de grupo en varios temas relevantes.
El anlisis se llev a cabo usando un diccionario de trminos que pertenecen a
ambas bancario y la inteligencia empresarial dominios. Este procedimiento
permiti la identificacin de las relaciones entre los trminos y temas la
agrupacin de artculos, lo que permite a surgir hiptesis con respecto a las
direcciones de investigacin. Para confirmar tales hiptesis, se recogieron y
examinaron los artculos pertinentes, lo que permite validar la minera de texto
procedimiento. Los resultados muestran que el crdito en la banca es
claramente la tendencia principal de la aplicacin, en particular la prediccin
riesgos y apoyando as la aprobacin o denegacin de crdito. Tambin hay un
inters relevante en quiebra y la prediccin fraude. La retencin del cliente
parece estar asociado, aunque dbilmente, con la focalizacin, justificando
banco ofrece para reducir la prdida de clientes. Adems, un gran nmero de
artculos se centr ms en los negocios tcnicas de inteligencia y sus
aplicaciones, utilizando el sector bancario slo para evaluacin, por lo tanto, no
clamando claramente los beneficios en el negocio bancario. Mediante la
identificacin de estos temas de investigacin actuales, este estudio tambin
destaca las oportunidades para la investigacin futura.
1. Introduccin
El banco ha sido una industria prolfico para la innovacin en relacin con
sistemas de informacin y tecnologas (Shu y Strassmann, 2005).
Por ejemplo, las nuevas tecnologas han permitido nueva comunicacin canales
que fueron adoptados rpidamente por los bancos. Adems, avanzado tcnicas
de anlisis de datos se usan actualmente para evaluar el riesgo en la
aprobacin del crdito (Huang, Chen, Hsu, Chen, y Wu, 2004) y el fraude
deteccin (Ngai, Hu, Wong, Chen, y Sun, 2011).
La inteligencia de negocios (BI) es un trmino general que incluye
arquitecturas, herramientas, bases de datos, aplicaciones y metodologas con
el objetivo de analizar los datos con el fin de apoyar las decisiones de negocio
gerentes (turbante, Sharda, y Delen, 2011). dominios bancarios, tales como la
evaluacin de crdito, el rendimiento sucursales, banca electrnica, la
segmentacin de clientes y la retencin, son excelentes campos de aplicacin
de una amplia variedad de conceptos y tcnicas de BI, incluyendo minera de
datos (DM), almacenes de datos y los sistemas de soporte de decisiones (DSS).
Para las empresas bancarias para sobrevivir e incluso sobresalir en la
turbulenta de hoy ambiente de negocios, gerentes de bancos necesitan tener
una continua centrarse en la solucin de problemas difciles y aprovechar las
oportunidades.
Eso exige una necesidad de soporte informtico de la decisin empresarial
haciendo lo que implica la necesidad de apoyo a las decisiones y los negocios
sistemas de inteligencia.
Hay varias encuestas / opiniones del dominio bancario. Wilson, Casu,
Girardone, y Molyneux (2010) public una reciente revisin de la literatura que
cubre el impacto de la crisis financiera global en el negocio bancario. Sus
resultados ponen el dominio de riesgos como un tema que merece una
atencin ms profunda con el fin de lograr una sistmica estabilidad. La
revisin de Ngai et al. (2011) dedicado a la atencin deteccin de fraude
financiero, y clasificaron 49 artculos en funcin del tipo de fraude. Los
resultados sugieren una falta de investigacin en la hipoteca fraude, lavado de
dinero y valores y materias primas fraude, por el contrario a un gran nmero
de artculos sobre el fraude de crdito.
Ms relacionados con este papel, y Fethi Pasiouras (2010) presentan una
encuesta sobre las sucursales bancarias de rendimiento basados en los
artculos 196 que emplean a la investigacin operativa y las tcnicas de la
inteligencia artificial, concluyendo que la eficiencia en beneficios y la
capacidad de eficiencia ciencia han recibido escasa atencin en los estudios
evaluados.
Una gran atencin de la investigacin se ha dado hacia el crdito. De hecho,
aunque el crdito es tradicionalmente relacionado con la banca, que tiene larga
extendido a otras industrias. Por lo tanto, algunos exmenes y estudios
recientes estn disponibles de forma natural en la materia. Abdou y Pointon
(2011) revisaron 214 artculos / libros / tesis sobre las aplicaciones de
calificacin de crdito, la bsqueda de las tcnicas estadsticas utilizadas para
la evaluacin y se encontr que no hay una mejor tcnica global de la
construccin modelos. La revisin de Marqus, Garca, y (2012) informes
Snchez sobre el uso de la computacin evolutiva para la puntuacin de
crdito.
Otro tema de inters es la banca electrnica, especficamente al cliente
aceptacin hacia un nuevo canal de comunicacin. Dahlberg, Mallat, Ondrus, y
Zmijewska (2008) revisaron publicaciones sobre pagos mvil y encontrado a
travs de su marco que carece de investigacin sobre los factores sociales y
2. Back ground
2.1. Text mining
La minera de datos (DM) tiene como objetivo extraer conocimiento til (por
ejemplo, patrones o tendencias) de datos en bruto (Witten y Frank, 2005).
Extraccin de textos (TM) es un tipo particular de DM que se centra en el
manejo estructurado o semi conjuntos de datos estructurados, como
documentos de texto (Fan, Wallace, Rich, y Zhang, 2006). Delen y Crossland
(2008) propuso la aplicacin de TM para el anlisis de la literatura y identificar
las tendencias de investigacin, lo que ayuda en la realizacin de los
investigadores estado de las crticas de arte sobre un tema de investigacin
determinado. su investigacin centrado en tres grandes revistas en los
sistemas de informacin de gestin, aunque sealan que su enfoque TM puede
ser valiosa en prcticamente cualquier campo de la investigacin.
Dentro de un anlisis de la literatura, que busca con palabras individuales es
menudo no es suficiente, ya que muchos trminos de bsqueda pueden estar
compuestos de una secuencia de palabras, como '' minera de datos '' o ''
apoyo a la decisin sistemas ''. Esas secuencias, que se pueden hacer de n
palabras, son llamado n-gramas. Cuando se extrae a partir de textos de gran
tamao, n-gramas constituyen un activo valioso, en particular en el anlisis de
las publicaciones, tales como el estudio de Soper y Turel (2012) mostraron
mediante el anlisis de once aos (de 2000 a 2010) de publicaciones en las
Comunicaciones de la revista ACM.
Al llevar a cabo TM sobre documentos de texto, palabras relevantes y trminos
se obtienen a menudo con el fin de producir una categorizacin que puede
ayudar a la construccin de un conjunto de conocimientos sobre la literatura
considerado (Delen y Crossland, 2008). Un enfoque interesante es el modelado
de un cierto nmero de temas distintos define de acuerdo con el nmero y
distribucin de trminos en todos los documentos, que que puede lograrse
mediante la asignacin de Dirichlet latente (LDA) modelo (Blei, Ng, y Jordan,
2003). Para cada documento, se determina la probabilidad de pertenencia a
cada uno de los temas, lo que permite a los documentos de grupo a los temas
que coinciden ms probables. esta organizacin estructura puede ayudar a
identificar qu temas estn captando ms atencin de los investigadores y
tambin para encontrar huecos para el futuro investigacin. TM se puede
utilizar de manera indiscriminada, mediante la bsqueda de la mayor parte
global contemplado palabras, o mediante el uso de diccionario especfico
palabras. Dado que este trabajo se trata de un anlisis de la literatura
enfocada, se utiliza un el diccionario de trminos en ambos dominios de BI y
bancarios.
2.2. Bancario
Los bancos son las instituciones que operan en el negocio financiero
actividades de dominio, que se refiera como prestataria, la gestin de los
depsitos y las inversiones en los mercados de capitales, entre otros. la banca
industria es crucial para la economa y por lo tanto es un objeto de gran inters
para los investigadores en un generalizado de diferentes dominios, como
ciencia de la administracin, marketing, finanzas y la informacin tecnologas.
Berger (2003) encontr evidencia de una relacin entre el progreso tecnolgico
y la productividad en el sector bancario. Lo mismo autor tambin hace hincapi
en que los bancos emplean modelos estadsticos basados en sus datos
financieros para diferentes propsitos, tales como la puntuacin de crdito y la
evaluacin de riesgos. reformas del sector financiero permitieron un aumento
de la competencia, girando banco prestamista una importante fuente de
financiacin. Riesgo crediticio evaluacin es, por su propia un vasto dominio,
que abarca un gran nmero de publicaciones de investigacin dentro de la
banca y se extendi a travs los ltimos doce aos (por ejemplo, Marqus et al.
(2012)). otros bancario tema relacionado donde la investigacin ha estado
activo es la prevencin del fraude y la deteccin de los servicios bancarios
tradicionales (por ejemplo, Abbasi, Albrecht, Vance, y Hansen (2012)) y en los
nuevos canales de comunicacin que servicios de apoyo de banca electrnica
(por ejemplo, Shuaibu, Norwawi, Selamat, y Al-Alwani (2013)), de la que el
tuvo en cuenta que cada uno de esos marcos deberan hablar de los criterios y
mtodos de investigacin, expresado en las columnas de la Tabla 1, para
permitir la comparacin de los diferentes enfoques con el mtodo propuesto.
El trabajo de Jourdan et al. (2008) ofrece una revisin general sobre BI y
requiere que al menos dos seres humanos (a veces tres, en casos de diferente
opinin de los dos autores ledos manualmente) cada uno de los 167 artculos.
Una ventaja principal de este enfoque es el hecho de que un lector humano
puede entender fcilmente el significado de una palabra por el contexto de el
resto del texto (por ejemplo, '' de alto nivel '' puede referirse a las personas de
edad avanzada, o para profesionales de alto nivel, que no podr ser tan viejo),
mientras que un enfoque automatizado no puede. sin embargo, el tiempo
necesario para llevar a cabo un anlisis de dichos manuales le prohbe que se
aplica a un gran nmero de manuscritos.
Los tres marcos restantes utilizan enfoques TM, analizando una serie de
artculos de ms de un millar. El trabajo de Sunikka y Bragge (2012) se centran
en dos temas, todava se lleva a cabo un anlisis separado de los dos
resultados, mientras que los dos restantes enfoques
Tambin hay que sealar que buscar algunas bases de datos en lnea Los
motores slo permite buscar en este tipo de contenidos, lo que hace inviable
una bsqueda de texto completo.
Los primeros resultados de bsqueda incluyeron un total de 240 artculos. Un
manual del anlisis, que consiste en la lectura de cada ttulo, resumen y
palabras clave, varios artculos detectados donde los trminos se produjeron
con una diferente es decir, como '' banco de sangre '' o '' crdito '' mencionado
en un pas que no contexto econmico. Esta poda manual de condujo a una
piscina de 219 artculos.
La Tabla 2 muestra la contribucin de cada revista en trminos de resultados
de bsqueda (Donde cada golpe denota un artculo).
3.3. minera de textos para la revisin de la literatura
Desde 219 artculos es un nmero bastante grande para un anlisis manual, en
este estudio se utiliz TM para facilitar en la produccin de organizado
informacin para analizar la literatura. Teniendo en cuenta el objetivo se
establece especficamente en aplicaciones de BI a la banca, a fin de mantener
el mbito de aplicacin dentro de una lista de trminos manejables, que tiene
sentido para definir un diccionario que incluye tanto la BI y la banca ms
comunes trminos y conceptos, en lugar de dejar que los algoritmos de TM
para buscar, grupo y las palabras de conteo de forma indiscriminada. Por lo
tanto, dos diccionarios se definieron, uno para la banca y otro para el BI, cada
uno de ellos conteniendo una lista de trminos compone de una o ms
palabras (n-gramos).
Partiendo es una tcnica a menudo se aplica en TM, a fin de reducir palabras
similares a un trmino nico (por ejemplo, '' banca '' y '' bancos '' son
transformado en '' banco ''). En lugar de simplemente realizar habitual
derivada, una lista ampliada de trminos relacionados se crea que incluye otros
conceptos en el mismo dominio. Por ejemplo, '' lealtad '' y '' Valor de la vida ''
son lo opuesto a '' desercin '' y '' batido '', pero todos ellos preocupacin por el
problema de cliente '' de retencin '', por lo tanto todos ellos fueron agrupados
bajo este trmino reducida.
Tanto la definicin de los diccionarios y la agrupacin de trminos en virtud de
un periodo reducido nica son subjetivas. Para reducir esta subjetividad, los
tres autores de este trabajo analizaron todas las decisiones. Eso Hay que
mencionar que, mientras que los tres autores son experimentados en sistemas
de informacin y de BI, una de ellas es a tiempo completo gerente de sistemas
de informacin en un banco comercial desde 2001, que tiene proyectos
coordinados en distintas reas tales como la comercializacin y el riesgo.
Adems, dos experimentados profesionales de la banca en diferentes reas
fueron consultados (uno de ellos tiene 3 aos como contacto tcnico soporte
central, y 10 aos como tcnico en Marketing, mientras que el otro tiene de 6
aos en el rea comercial, ms un ao en el Departamento de Riesgo). Para
ampliar an ms la validacin de los diccionarios, teniendo en cuenta stos
A efectos de demostracin, parte del cdigo est expuesto R (Cdigo 1). Este
cdigo fue utilizado por primera vez para crear el corpus de documentos
basado en una ruta que contiene todos los documentos (lnea 1), realice una
limpieza mediante la eliminacin de espacios adicionales (lnea 2) y la
conversin de todas las palabras de minsculas (lnea 3). A continuacin, la
lista de trminos equivalentes para reducir a un trmino comn nico (Tablas 3
y 4) se cargan en una tabla de bsqueda (lnea 5) y los trminos reducidos
(primer elemento de la R bsqueda en la lista de tabla) se comparan con los
diccionarios previamente cargado a travs de la funcin de interseccin, que
constituye el reducido Diccionario de trminos (lnea 6). Sigue despus un
costoso computacionalmente mapeo para realizar una funcin vstago que
utiliza los trminos en la tabla de consulta para reducirlos a un trmino comn
(lnea 7).
Por ltimo la lnea 10 define una funcin para permitir fichas hasta tres
palabras (las palabras mximas de los trminos en los diccionarios
considerados) y la lnea 11 se construye la matriz concepto de documento
(Delen y Crossland, 2008; Meyer et al., 2008).
El tema
mejor identificada con el crdito obtiene
70 artculos a juego, aunque los trminos segundo y tercero de este tema,
predecir y segmentacin, tiene un valor significativamente mayor b (mayor de
3.3), lo que significa que su relacin no es tan fuerte. Esto pone enfatiza en
numerosas aplicaciones de BI para beneficiar a las empresas de crdito y el
riesgo evaluacin. De hecho, el crdito se mete en el top 3 de los seis temas
ms
mientras que ser tambin el trmino superior para el cuarto tema, lo que
confirma la la diversidad de este tema.
El ao 2008 parece ser un valor atpico, que contiene una pequea nmero de
artculos en comparacin con sus aos circundantes (slo siete artculos). Es
probable que la crisis financiera global, que culmin en 2008 con el fracaso de
las principales instituciones financieras, tambin ayudado en auge la
investigacin en el ao siguiente de 2009, con un total de 37 artculos para el
conjunto analizado. El segundo tema, con 25 artculos en total, tuvo ocho
publicaciones slo para 2009, el nmero ms alto para el tema en los doce
aos de estudios. Adems, el tema incluye poblaciones como el tercer trmino
ms relevante, mientras que predecir y la teora de conjuntos son la primera y
segunda, respectivamente.
En relacin con el dominio de la banca, el fraude y la prediccin de la quiebra
conseguir un partido de nueve (tema 6) y siete artculos (tema 10)
respectivamente, aunque la mayora de ellos son recientes, que puede ser
tambin consecuencia de la crisis financiera. Las redes neuronales son los
dominantes tcnica de aprendizaje especfica adoptada, superando el tercer
tema con ms artculos (22). Tema 5, con 12 artculos, tiene los tres ms
relevantes
Slo trminos para la banca: la retencin, tasas de inters y la orientacin.
Este es un tema interesante, ya que muestra una distribucin uniforme nmero
de publicacin para el perodo considerado, con la mayora de los aos que
tiene slo uno o dos artculos, con la excepcin de los aos 2003, 2009 y 2010.
Teniendo en cuenta que los tres trminos tienen significativamente cerrar los
valores de b, se puede plantear la hiptesis de que, al dirigirse a los clientes
con atractivas tasas de inters en los productos ofrecidos pueden
Tambin sirven al propsito de retener ellos, lo que reduce la rotacin. DSS son
una temtica bastante antiguo, pero lejos de ser obsoleto. Desde el temas de
la Tabla 6, es posible confirmar la amplia referencia a DSS contando cinco
apariciones de los sistemas de soporte de decisiones plazo en diferentes
temas, con una distribucin aparente incluso en el aos considerados. Por otro
lado, la minera de datos tiene slo una referencia en los 3 primeros trminos
para cada tema, que es el tema 16, con slo 5 artculos. Esta un resultado
inesperado, ya que el estado de la tcnica de prediccin es la aplicacin de
tcnicas de extraccin de datos.
Sin embargo, cabe sealar que las tcnicas de minera de datos dominante
incluir la red neuronal y de regresin, que tienen varias referencias propagan a
travs de los 19 temas.
En el respeto de los cuatro temas que estn mejor identificados por tres
trminos todos ellos relacionados con el BI, y algunos otros temas, se puede
hipotetizar que es probablemente una indicacin de que la atencin se centra
en las aplicaciones de BI,
No evaluar los beneficios en profundidad para la banca.
xdfd}}
el tercer trmino de diez tema es '' depsito '', mientras que para los dos es el
tema '' stocks '', que es mucho ms relacionado con la quiebra: se menciona
varias veces a travs del texto.
Tema 3 se centra ms en las tcnicas aplicadas en lugar de el mismo problema
de la banca, que encaja perfectamente con el elegido artculo (Huang et al.,
2004). Este estudio se centra en la comparacin de mquina de tcnicas de
aprendizaje, utilizando la calificacin de crdito corporativo para la evaluacin
comparativa de su rendimiento.
Mientras que diecisiete de los diecinueve temas fueron emparejados por mejor
un artculo que se refera a los tres trminos ms relevantes (de Tabla 6),
quedan dos para los que el mejor artculo slo contena dos de los tres
trminos ms relevantes (tema 9) o slo uno (tema 14). En caso de tema 9, el
valor significativamente mayor para b '' Adaptacin '', el tercer trmino, ms
del doble que el segundo trmino, puede justificar el resultado. Sin embargo, el
tema 14 muestra claramente una debilidad de este enfoque: A pesar de que
los grupos de cinco artculos, ninguno est relacionado con ms de un trmino
de los tres ms relevantes (por ejemplo, el trabajo de Hsieh (2004) se dedica a
las reglas de asociacin, sin siquiera mencionando los dos trminos restantes).
Se puede plantear la hiptesis de que esto es una consecuencia directa del
problema mal planteado de la agrupacin: la naturaleza basada en datos de la
agrupacin hace que sea muy difcil de correctamente encontrar clusters en los
datos dados (Jain, 2010). LDA caras el mismo desafo de otros algoritmos de
agrupamiento, lo que implica que es inevitable que existen artculos que no
pueden igualar a cualquiera de los temas existentes, lo que lleva a problemas
como el que aqu el tema 14.
5. Conclusiones
En este trabajo el anlisis de la literatura centrada en la banca principal
problemas y soluciones de BI utilizados para resolverlos. La banca es un
competitivo sector en el que se desarrolle la innovacin, debido a la
importancia de este sector de la economa, por lo que es un campo atractivo
para los investigadores. La banca es tambin un dominio que genera gran
cantidad de los datos y las aplicaciones de BI donde potencialmente se pueden
beneficiar de negocios, aumentar la visibilidad y el reconocimiento de los
logros de la investigacin.
Este anlisis reciente abarc los ltimos doce aos (2002- 2013), siendo un
perodo que incluye el efecto de la financiera mundial crisis y su impacto en la
investigacin en este sector. Por lo tanto, este estudio puede beneficiarse
potencialmente investigadores, al permitir la identificacin de nuevas
tendencias de investigacin y las posibles lagunas para la investigacin futura.
Para el anlisis de la literatura, un enfoque de minera de texto usando el
latente Se llev a cabo la asignacin de Dirichlet. Como resultado, varios temas
agrupar los artculos se encontraron, siendo cada uno de estos temas
caracteriza por los tres trminos ms relevantes. Tales temas sugeridos varios