BI-Analytics Bigdata Impact Chen2012.en - Es

Traducido del inglés al español - www.onlinedoctranslator.
com
SESPECIALyoSUEÑO: BUTILIDADyoINTELIGENCIARBÚSQUEDA
BUTILIDADyoINTELIGENCIA YAANALÍTICOS:
FROMBYO GDATA ABYO GyoMPACT
Hsin Chun Chen
Eller College of Management, Universidad de Arizona,
Tucson, AZ 85721 EE. UU. { hchen@eller.arizona.edu }
Roger HL Chiang
Escuela de Negocios Carl H. Lindner, Universidad de Cincinnati,
Cincinnati, OH 45221-0211 EE. UU. { chianghl@ucmail.uc.edu }
Veda C. Piso
Facultad de Negocios J. Mack Robinson, Universidad Estatal de
Georgia, Atlanta, GA 30302-4015 EE. UU. { vstorey@gsu.edu }
Business Intelligence and Analytics (BI&A) se ha convertido en un área de estudio importante tanto para profesionales como para
investigadores, lo que refleja la magnitud y el impacto de los problemas relacionados con los datos que deben resolverse en las
organizaciones empresariales contemporáneas. Esta introducción a la edición especial trimestral de MIS sobre investigación de
inteligencia empresarial proporciona primero un marco que identifica la evolución, las aplicaciones y las áreas de investigación
emergentes de BI&A. BI&A 1.0, BI&A 2.0 y BI&A 3.0 se definen y describen en términos de sus características y capacidades clave. Se
analiza la investigación actual en BI&A y se identifican los desafíos y oportunidades asociados con la investigación y la educación de
BI&A. También informamos un estudio bibliométrico de publicaciones críticas de BI&A, investigadores, y temas de investigación
basados en más de una década de publicaciones académicas y de la industria relacionadas. Finalmente, los seis artículos que
componen este número especial se presentan y caracterizan en términos del marco de investigación propuesto por BI&A.
Palabras clave:Business Intelligence y Analytics, Big Data Analytics, Web 2.0
Introducción Se descubrió que el porcentaje de empresas con ingresos superiores a

los 100 millones de dólares utilizan algún tipo de análisis empresarial. Un
Business Intelligence and Analytics (BI&A) y el campo relacionado de Big Data informe del McKinsey Global Institute (Manyika et al. 2011) predijo que
Analytics se han vuelto cada vez más importantes tanto en la comunidad para 2018, solo en los Estados Unidos se enfrentará a una escasez de
académica como en la empresarial durante las últimas dos décadas. Los 140 000 a 190 000 personas con habilidades analíticas profundas, así
estudios de la industria han destacado este importante desarrollo. Por como a una escasez de 1,5 millones de gerentes expertos en datos con el
ejemplo, según una encuesta de más de 4000 profesionales de tecnología de la conocimiento para analizar big data para tomar decisiones efectivas.
información (TI) de 93 países y 25 industrias, laInforme de tendencias
tecnológicas de IBM (2011) identificaron el análisis empresarial como una de Hal Varian, economista jefe de Google y profesor emérito de la
las cuatro principales tendencias tecnológicas en la década de 2010. En una Universidad de California, Berkeley, comentó sobre las oportunidades
encuesta sobre el estado de la analítica empresarial realizada por Bloomberg emergentes para los profesionales y estudiantes de TI en el análisis de
Businessweek (2011), 97 datos de la siguiente manera:
MIS trimestral vol. 36 N° 4, págs. 1165-1188/diciembre de 2012 1165

Chen et al./Introducción: Investigación de Business Intelligence
Entonces, ¿qué se está volviendo ubicuo y barato? Datos. tecnologías de almacenamiento, gestión, análisis y visualización. En este
¿Y qué es complementario a los datos? Análisis. Así que mi artículo, usamos inteligencia y análisis de negocios (BI&A) como un
recomendación es tomar muchos cursos sobre cómo término unificado y tratamos el análisis de big data como un campo
manipular y analizar datos: bases de datos, aprendizaje relacionado que ofrece nuevas direcciones para la investigación de BI&A.
automático, econometría, estadísticas, visualización, etc.1
BI&A 1.0
Las oportunidades asociadas con los datos y el análisis en diferentes
organizaciones han ayudado a generar un interés significativo en Como enfoque centrado en los datos, BI&A tiene sus raíces en el antiguo
BI&A, que a menudo se conoce como las técnicas, tecnologías, campo de la gestión de bases de datos. Se basa en gran medida en
sistemas, prácticas, metodologías y aplicaciones que analizan datos diversas tecnologías de recopilación, extracción y análisis de datos
comerciales críticos para ayudar a una empresa a comprender (Chaudhuri et al. 2011; Turban et al. 2008; Watson y Wixom 2007). Las
mejor su negocio. y comercializar y tomar decisiones comerciales tecnologías y aplicaciones de BI&A actualmente adoptadas en la industria
oportunas. Además de las tecnologías analíticas y de procesamiento pueden considerarse como BI&A 1.0, donde los datos en su mayoría
de datos subyacentes, BI&A incluye prácticas y metodologías están estructurados, recopilados por empresas a través de varios
centradas en el negocio que se pueden aplicar a varias aplicaciones sistemas heredados y, a menudo, almacenados en sistemas comerciales
de alto impacto, como comercio electrónico, inteligencia de de administración de bases de datos relacionales (RDBMS). Las técnicas
mercado, gobierno electrónico, atención médica y seguridad. analíticas comúnmente utilizadas en estos sistemas, popularizadas en la
década de 1990, se basan principalmente en métodos estadísticos
Esta introducción a laMIS TrimestralEl número especial sobre desarrollados en la década de 1970 y técnicas de minería de datos
investigación de inteligencia empresarial proporciona una descripción desarrolladas en la década de 1980.
general de este campo emocionante y de alto impacto, destacando sus
muchos desafíos y oportunidades. La Figura 1 muestra las secciones La gestión y el almacenamiento de datos se consideran la
clave de este documento, incluida la evolución de BI&A, las aplicaciones y base de BI&A 1.0. El diseño de data marts y herramientas
las oportunidades emergentes de investigación analítica. Luego para extracción, transformación y carga (ETL) son esenciales
informamos sobre un estudio bibliométrico de publicaciones críticas de para convertir e integrar datos específicos de la empresa.
BI&A, investigadores y temas de investigación basados en más de una Las consultas de bases de datos, el procesamiento analítico
década de publicaciones académicas y de la industria relacionadas con en línea (OLAP) y las herramientas de generación de
BI&A. Se presentan oportunidades de educación y desarrollo de informes basadas en gráficos intuitivos pero simples se
programas en BI&A, seguidas de un resumen de los seis artículos que utilizan para explorar las características importantes de los
aparecen en este número especial utilizando nuestro marco de datos. La gestión del rendimiento empresarial (BPM)
investigación. La sección final concluye el documento. mediante cuadros de mando y paneles ayuda a analizar y
visualizar una variedad de métricas de rendimiento. Además
de estas funciones bien establecidas de generación de
informes comerciales, se adoptan técnicas de análisis
Evolución de BI&A: características clave estadístico y minería de datos para el análisis de
y Capacidades asociaciones, la segmentación y agrupación de datos, el
análisis de clasificación y regresión, la detección de
El términointeligenciaha sido utilizado por investigadores en inteligencia anomalías y el modelado predictivo en diversas aplicaciones
artificial desde la década de 1950.Inteligencia de negocios se convirtió en comerciales.
un término popular en las comunidades empresarial y de TI solo en la
década de 1990. A fines de la década de 2000,Análisis de negociose Entre las 13 capacidades consideradas esenciales para las plataformas de
introdujo para representar el componente analítico clave en BI BI, según el informe de Gartner de Sallam et al. (2011), los siguientes
(Davenport 2006). Más recientementegrandes datosyanálisis de grandes ocho se consideran BI&A 1.0: informes, tableros,ad hocconsulta, BI
datosse han utilizado para describir conjuntos de datos y técnicas basada en búsqueda, OLAP, visualización interactiva, cuadros de mando,
analíticas en aplicaciones que son tan grandes (desde terabytes hasta modelado predictivo y minería de datos. Algunas áreas de BI&A 1.0
exabytes) y complejas (desde sensores hasta datos de redes sociales) que todavía están en desarrollo activo según el análisis Gartner BI Hype Cycle
requieren datos avanzados y únicos para tecnologías de BI emergentes, que incluyen bancos de trabajo de
minería de datos, DBMS basados en columnas, DBMS en memoria y
herramientas de decisión en tiempo real (Bitterer 2011). Los planes de
1“Hal Varian responde a sus preguntas”, 25 de febrero de 2008 (http:// estudios académicos en Sistemas de Información (SI) y Ciencias de la
www.freakonomics.com/2008/02/25/hal-varian-answers-your-questions/). Computación (CS) a menudo
1166 MIS trimestral vol. 36 N° 4/Diciembre 2012

Figura 1. Descripción general de BI&A: evolución, aplicaciones e investigación emergente
incluir cursos bien estructurados, como sistemas de gestión de bases de Las herramientas de análisis web como Google Analytics
datos, minería de datos y estadísticas multivariadas. pueden proporcionar un seguimiento de las actividades en línea
del usuario y revelar los patrones de navegación y compra del
usuario. El diseño del sitio web, la optimización de la colocación
BI&A 2.0 de productos, el análisis de transacciones de clientes, el análisis
de la estructura del mercado y las recomendaciones de
Desde principios de la década de 2000, Internet y la Web comenzaron a productos se pueden lograr a través del análisis web. Las
ofrecer oportunidades únicas de recopilación de datos e investigación muchas aplicaciones Web 2.0 desarrolladas después de 2004
analítica y desarrollo. Los sistemas Web 1.0 basados en HTTP, también crearon una gran cantidad de contenido generado por
caracterizados por motores de búsqueda web como Google y Yahoo y el usuario de varios medios sociales en línea, como foros,
negocios de comercio electrónico como Amazon y eBay, permiten a las grupos en línea, blogs web, sitios de redes sociales, sitios
organizaciones presentar sus negocios en línea e interactuar multimedia sociales (para fotos y videos) e incluso sitios
directamente con sus clientes. Además de portar su información de virtuales. mundos y juegos sociales (O'Reilly 2005). Además de
productos tradicional basada en RDBMS y contenidos comerciales en capturar conversaciones de celebridades, referencias a eventos
línea, los registros de interacción y búsqueda de usuarios detallados y cotidianos y sentimientos sociopolíticos expresados en estos
específicos de IP que se recopilan sin problemas a través de cookies y medios, Web 2.
registros del servidor se han convertido en una nueva mina de oro para
comprender las necesidades de los clientes e identificar nuevos negocios. Muchos investigadores de marketing creen que el análisis de redes
oportunidades. La inteligencia web, el análisis web y el contenido sociales presenta una oportunidad única para que las empresas
generado por el usuario recopilado a través de los sistemas sociales y de traten el mercado como una "conversación" entre empresas y
colaboración abierta basados en la Web 2.0 (Doan et al. 2011; O'Reilly clientes en lugar del tradicional "marketing" unidireccional de
2005) han dado paso a una nueva y emocionante era de investigación empresa a cliente (Lusch et al. 2010). . A diferencia de las tecnologías
BI&A 2.0 en la década de 2000, centrada en texto y análisis web para BI&A 1.0 que ya están integradas en los sistemas de TI
contenidos web no estructurados. empresariales comerciales, los futuros sistemas BI&A 2.0 requerirán
la integración de técnicas maduras y escalables en minería de textos
Una inmensa cantidad de información de la empresa, la industria, el (p. ej., extracción de información, identificación de temas, minería
producto y el cliente se puede recopilar de la web y organizar y de opiniones, respuesta a preguntas), minería web, análisis de redes
visualizar a través de diversas técnicas de minería de texto y web. Al sociales y análisis espacio-temporal con sistemas BI&A 1.0 basados
analizar los registros de datos del flujo de clics de los clientes, en DBMS existentes.
MIS trimestral vol. 36 N° 4/Diciembre 2012 1167

Excepto por las capacidades básicas de consulta y búsqueda, La Tabla 1 resume las características clave de BI&A 1.0, 2.0 y 3.0 en
actualmente no se considera ningún análisis de texto avanzado para relación con las capacidades principales y el ciclo de exageración de las
contenido no estructurado en las 13 capacidades de las plataformas de plataformas de BI de Gartner.
BI de Gartner. Varios, sin embargo, se enumeran en Gartner BI Hype
Cycle, incluidos los servicios de información semántica, respuesta a La década de 2010 promete ser emocionante para la investigación y el
preguntas en lenguaje natural y análisis de contenido/texto (Bitterer desarrollo de BI&A de alto impacto tanto para la industria como para la
2011). Han surgido nuevos cursos IS y CS en minería de texto y minería academia. La comunidad empresarial y la industria ya han dado pasos
web para abordar la capacitación técnica necesaria. importantes para adoptar BI&A para sus necesidades. La comunidad de
SI enfrenta desafíos y oportunidades únicos para generar impactos
científicos y sociales que sean relevantes y duraderos (Chen 2011a). Los
BI&A 3.0 programas de investigación y educación de SI deben evaluar
cuidadosamente las direcciones futuras, los currículos y los planes de
Mientras que BI&A 2.0 basado en la web ha atraído investigaciones activas de la academia y la acción, desde BI&A 1.0 a 3.0.
industria, está surgiendo una nueva oportunidad de investigación en BI&A 3.0. Como se informó de
manera destacada en un artículo de octubre de 2011 enEl economista(2011), la cantidad de teléfonos
móviles y tabletas (alrededor de 480 millones de unidades) superó la cantidad de computadoras

Aplicaciones de BI&A: desde grandes
portátiles y PC (alrededor de 380 millones de unidades) por primera vez en 2011. Aunque la cantidad
de PC en uso superó los mil millones en 2008, la El mismo artículo proyectó que la cantidad de
Datos para un gran impacto
dispositivos móviles conectados alcanzaría los 10 mil millones en 2020. Los dispositivos móviles como
iPad, iPhone y otros teléfonos inteligentes y sus ecosistemas completos de aplicaciones descargables,
Varias tendencias comerciales y de TI globales han ayudado a dar forma
desde avisos de viaje hasta juegos para múltiples jugadores, están transformando diferentes facetas
a las direcciones de investigación pasadas y presentes de BI&A. Los viajes
internacionales, las conexiones de red de alta velocidad, la cadena de
de la sociedad, desde la educación hasta la atención médica y desde el entretenimiento hasta los
suministro global y la subcontratación han creado una gran oportunidad
gobiernos. Otros dispositivos habilitados para Internet basados en sensores y equipados con RFID,
para el avance de TI, como predijo Thomas Freeman en su libro seminal,
códigos de barras y etiquetas de radio (la "Internet de las cosas") están abriendo nuevos y
El mundo es plano(2005). Además de las conexiones de TI globales
emocionantes flujos de aplicaciones innovadoras. La capacidad de tales dispositivos móviles y
ultrarrápidas, el desarrollo y la implementación de estándares de datos
habilitados para Internet para admitir operaciones y transacciones altamente móviles, con
relacionados con el negocio, formatos de intercambio electrónico de
reconocimiento de ubicación, centradas en la persona y relevantes para el contexto continuará
datos (EDI) y bases de datos comerciales y sistemas de información han
ofreciendo desafíos y oportunidades de investigación únicos a lo largo de la década de 2010. La
facilitado en gran medida la creación y utilización de datos comerciales.
interfaz móvil, la visualización y el diseño de HCI (interacción humano-computadora) también son
El desarrollo de Internet en la década de 1970 y la subsiguiente adopción
áreas de investigación prometedoras. Si bien la llegada de la era Web 3.0 (móvil y basada en sensores)
a gran escala de la World Wide Web desde la década de 1990 han
parece segura, aún se desconocen las técnicas subyacentes de análisis móvil y de ubicación y contexto
aumentado exponencialmente la velocidad de generación y recopilación
para recopilar, procesar, analizar y visualizar datos móviles y de sensores tan fluidos y a gran escala. la
de datos comerciales. Recientemente, la era de Big Data ha llegado
visualización y el diseño HCI (interacción humano-computadora) también son áreas de investigación
silenciosamente a muchas comunidades, desde gobiernos y comercio
prometedoras. Si bien la llegada de la era Web 3.0 (móvil y basada en sensores) parece segura, aún se
electrónico hasta organizaciones de salud. Con una cantidad abrumadora
desconocen las técnicas subyacentes de análisis móvil y de ubicación y contexto para recopilar,
de datos basados en la web, móviles y generados por sensores que
procesar, analizar y visualizar datos móviles y de sensores tan fluidos y a gran escala. la visualización y
llegan a una escala de terabytes e incluso de exabytes (El economista
el diseño HCI (interacción humano-computadora) también son áreas de investigación prometedoras.
2010a, 2010b), se pueden obtener nuevas ciencias, descubrimientos e
Si bien la llegada de la era Web 3.0 (móvil y basada en sensores) parece segura, aún se desconocen las
ideas a partir de contenidos muy detallados, contextualizados y ricos de
técnicas subyacentes de análisis móvil y de ubicación y contexto para recopilar, procesar, analizar y
relevancia para cualquier negocio u organización.
visualizar datos móviles y de sensores tan fluidos y a gran escala.
No se prevén sistemas BI&A 3.0 comerciales integrados para el Además de basarse en datos, BI&A se aplica mucho y puede aprovechar
futuro cercano. La mayor parte de la investigación académica sobre las oportunidades que presentan los abundantes datos y los análisis
BI móvil aún se encuentra en una etapa embrionaria. Aunque no específicos de dominio que se necesitan en muchas áreas de aplicación
está incluido en las capacidades centrales de la plataforma de BI críticas y de alto impacto. Varias de estas aplicaciones BI&A
actual, el BI móvil se ha incluido en el análisis Gartner BI Hype Cycle prometedoras y de alto impacto se presentan a continuación, con una
como una de las nuevas tecnologías que tiene el potencial de alterar discusión de las características de datos y análisis, impactos potenciales y
significativamente el mercado de BI (Bitterer 2011). La ejemplos o estudios ilustrativos seleccionados: (1) comercio electrónico e
incertidumbre asociada con BI&A 3.0 presenta otra dirección de inteligencia de mercado, (2) gobierno electrónico y política 2.0, (3) ciencia
investigación única para la comunidad de SI. y tecnología, (4) salud inteligente y

Tabla 1. Evolución de BI&A: características y capacidades clave

Núcleo de las plataformas de BI de Gartner
Caracteristicas claves Capacidades Ciclo de publicidad de Gartner
BI&A 1.0 Contenido estructurado basado en DBMS • Ad hocBI basada en consultas y búsquedas • DBMS basado en columnas
• RDBMS y almacenamiento de datos • Informes, paneles y cuadros de mando • SGBD en memoria
• ETL y OLAP • OLAP • Decisión en tiempo real
• Tableros y cuadros de mando • Visualización interactiva • Bancos de trabajo de minería de datos
• Minería de datos y análisis estadístico • Modelado predictivo y minería de datos

BI&A 2.0 Contenido no estructurado basado en la web • Información semántica
• Recuperación y extracción de información servicios
• Minería de opinión • Respuesta a preguntas en
• Respuesta a preguntas lenguaje natural
• Analítica web e • Análisis de contenido y texto
inteligencia web
• Análisis de redes sociales
• Análisis de redes sociales
• Análisis espacio-temporal
BI&A 3.0 Contenido móvil y basado en sensores • BI móvil
• Análisis de ubicación
• Análisis centrado en la persona
• Análisis relevante al contexto
• Visualización móvil y HCI
bienestar, y (5) seguridad y protección pública. Al analizar líderes para “escuchar” la voz del mercado de un gran número de constituyentes
cuidadosamente las características de la aplicación y los datos, los comerciales que incluyen clientes, empleados, inversionistas y los medios de
investigadores y los profesionales pueden adoptar o desarrollar las comunicación (Doan et al. 2011; O'Rielly 2005). A diferencia de los registros de
técnicas analíticas apropiadas para obtener el impacto deseado. Además transacciones tradicionales recopilados de varios sistemas heredados de la década de
de la implementación del sistema técnico, se necesita un conocimiento 1980, los datos que los sistemas de comercio electrónico recopilan de la web están
significativo del negocio o del dominio, así como habilidades de menos estructurados y, a menudo, contienen información valiosa sobre la opinión y
comunicación efectivas para completar con éxito dichos proyectos de el comportamiento de los clientes.
BI&A. Por lo tanto, los departamentos de SI enfrentan oportunidades y

desafíos únicos en el desarrollo de programas integrados de Para el análisis de las opiniones de los clientes en las redes sociales, con
investigación y educación en BI&A para la nueva generación de frecuencia se adoptan técnicas de análisis de texto y análisis de
estudiantes y profesionales con conocimientos de datos/análisis y sentimientos (Pang y Lee 2008). También se han desarrollado varias
relevantes para el negocio (Chen 2011a). técnicas analíticas para los sistemas de recomendación de productos,
como la minería de reglas de asociación, la segmentación y agrupación
de bases de datos, la detección de anomalías y la minería de gráficos
Comercio electrónico e inteligencia de mercado (Adomavicius y Tuzhilin 2005). El marketing de cola larga logrado al llegar
a millones de nichos de mercado en el extremo superficial del flujo de
Podría decirse que el entusiasmo en torno a BI&A y Big Data se ha bits del producto se ha vuelto posible a través de búsquedas altamente
generado principalmente en las comunidades web y de comercio específicas y recomendaciones personalizadas (Anderson 2004).
electrónico. Los principales proveedores de comercio electrónico, como
Amazon y eBay, han logrado una transformación significativa del
mercado a través de sus innovadoras y altamente escalables plataformas El concurso del Premio Netfix2por el mejor algoritmo de filtrado
de comercio electrónico y sistemas de recomendación de productos. Las colaborativo para predecir las calificaciones de películas de los usuarios
principales empresas de Internet como Google, Amazon y Facebook ayudó a generar un interés académico y de la industria significativo en el
continúan liderando el desarrollo de análisis web, computación en la desarrollo de sistemas de recomendación y resultó en otorgar el gran
nube y plataformas de redes sociales. El surgimiento de contenido Web premio de $ 1 millón al equipo Pragmatic Chaos de Bellkor, que
2.0 generado por el cliente en varios foros, grupos de noticias,

plataformas de redes sociales y sistemas de colaboración colectiva ofrece 2Premio Netflix (http://www.netflixprize.com//community/viewtopic.php? id=1537;
otra oportunidad para investigadores y profesionales. consultado el 9 de julio de 2012).

superó el propio algoritmo de Netflix para predecir calificaciones en un 10,06 astrofísica y oceanografía, hasta genómica e investigación ambiental.
por ciento. Sin embargo, la publicidad asociada con la competencia también Para facilitar el intercambio de información y el análisis de datos, la
planteó importantes preocupaciones no deseadas sobre la privacidad de los Fundación Nacional de Ciencias (NSF) ordenó recientemente que cada
clientes. proyecto debe proporcionar un plan de gestión de datos. La
infraestructura cibernética, en particular, se ha vuelto fundamental para
Gran parte de la información sobre investigación y desarrollo de comercio electrónico respaldar tales iniciativas de intercambio de datos.
relacionada con BI&A está apareciendo en artículos académicos de IS y CS, así como
en revistas populares de TI. El BIGDATA de la NSF de 20123la solicitud de programas es un ejemplo obvio
de los esfuerzos concertados de la agencia de financiamiento del gobierno de
EE. UU. para promover el análisis de big data. El programa
E-Gobierno y Política 2.0

tiene como objetivo avanzar en los medios científicos y
El advenimiento de la Web 2.0 ha generado mucho entusiasmo por reinventar tecnológicos básicos para administrar, analizar, visualizar y
los gobiernos. Las elecciones presidenciales, la Cámara de Representantes y el extraer información útil de conjuntos de datos grandes,
Senado de EE. UU. de 2008 dieron los primeros signos de éxito para las diversos, distribuidos y heterogéneos para acelerar el
campañas y la participación política en línea. Con el nombre de "política 2.0", progreso del descubrimiento científico y la innovación;
los políticos utilizan las plataformas web altamente participativas y multimedia conducir a nuevos campos de investigación que de otro modo
para discusiones exitosas sobre políticas, publicidad de campañas, no serían posibles; fomentar el desarrollo de nuevas
movilización de votantes, anuncios de eventos y donaciones en línea. A medida herramientas y algoritmos de análisis de datos; facilitar una
que los procesos gubernamentales y políticos se vuelven más transparentes, infraestructura de datos escalable, accesible y sostenible;
participativos, en línea y ricos en multimedia, existe una gran oportunidad aumentar la comprensión de los procesos e interacciones
para adoptar la investigación de BI&A en aplicaciones de gobierno electrónico humanos y sociales; y promover el crecimiento económico y la
y política 2.0. Se pueden utilizar técnicas seleccionadas de minería de mejora de la salud y la calidad de vida.
opiniones, análisis de redes sociales y análisis de medios sociales para

respaldar la participación política en línea, la democracia electrónica, los blogs Varias disciplinas de CyT ya han comenzado su viaje hacia el análisis de
políticos y el análisis de foros, prestación de servicios de gobierno electrónico y big data. Por ejemplo, en biología, la NSF financió iPlant Collaborative4
transparencia y rendición de cuentas de los procesos (Chen 2009; Chen et al. está utilizando ciberinfraestructura para apoyar a una comunidad de
2007). Para las aplicaciones de gobierno electrónico, el directorio de investigadores, educadores y estudiantes que trabajan en ciencias de las
información semántica y el desarrollo ontológico (como se ejemplifica a plantas. iPlant tiene como objetivo fomentar una nueva generación de
continuación) también se pueden desarrollar para servir mejor a sus biólogos equipados para aprovechar las técnicas computacionales en
ciudadanos objetivo. rápida expansión y los conjuntos de datos en crecimiento para abordar
los grandes desafíos de la biología vegetal. El conjunto de datos de iPlant
A pesar del importante potencial de transformación de BI&A en es diverso e incluye datos canónicos o de referencia, datos
la investigación del gobierno electrónico, ha habido menos experimentales, datos de modelos y simulaciones, datos de observación
investigación académica que, por ejemplo, la investigación de y otros datos derivados. También ofrece varias herramientas de análisis y
BI&A relacionada con el comercio electrónico. La investigación procesamiento de datos de código abierto.
sobre gobierno electrónico a menudo involucra a investigadores

de ciencias políticas y políticas públicas. Por ejemplo, Karpf En astronomía, el Sloan Digital Sky Survey (SDSS)5muestra cómo los
(2009) analizó el crecimiento de la blogosfera política en los métodos computacionales y los grandes datos pueden apoyar y
Estados Unidos y encontró una innovación significativa de las facilitar la toma de decisiones y la toma de decisiones tanto a nivel
instituciones políticas existentes al adoptar plataformas de macroscópico como microscópico en un campo de investigación
blogs en sus ofertas web. En su investigación, el mapeo de globalizado y de rápido crecimiento. El SDSS es una de las encuestas
blogs en 2D con clasificaciones compuestas ayudó a revelar la más ambiciosas e influyentes en la historia de la astronomía.
composición partidista de la blogósfera política estadounidense.

Yang y Callan (2009) demostraron el valor del desarrollo de
ontologías para los servicios gubernamentales a través de su 3“Técnicas y tecnologías básicas para el avance de la ciencia e ingeniería de Big
desarrollo del sistema OntoCop, Data (BIGDATA)”, solicitud de programa NSF 12-499 (http://www.nsf.gov/pubs/
2012/nsf12499/nsf12499.htm; consultado el 2 de agosto de 2012) .
4iPlant Collaborative (http://www.iplantcollaborative.org/about; consultado el 2 de

Ciencia y Tecnología agosto de 2012).
Muchas áreas de ciencia y tecnología (CyT) están cosechando los 5“Sloan Digital Sky Survey: Mapping the Universe” (http://www.sdss.org/; consultado
beneficios de sensores e instrumentos de alto rendimiento, desde el 2 de agosto de 2012).

Durante sus ocho años de funcionamiento, ha obtenido imágenes Además de EHR, los sitios de redes sociales de salud como Daily Strength
multicolores y profundas que cubren más de una cuarta parte del cielo y ypatientslikeme brindan oportunidades de investigación únicas en el apoyo a
ha creado mapas tridimensionales que contienen más de 930.000 las decisiones de atención médica y el empoderamiento del paciente (Miller
galaxias y más de 120.000 cuásares. Continuando con la recopilación de 2012b), especialmente para enfermedades crónicas como diabetes, Parkinson,
datos a una velocidad de 200 gigabytes por noche, SDSS ha acumulado Alzheimer y cáncer. La minería y el agrupamiento de reglas de asociación, el
más de 140 terabytes de datos. El esfuerzo internacional del Gran monitoreo y análisis de redes sociales de salud, el análisis de textos de salud,
Colisionador de Hadrones (LHC) para la física de alta energía es otro las ontologías de salud, el análisis de redes de pacientes y el análisis de efectos
ejemplo de big data, que produce alrededor de 13 petabytes de datos en
secundarios adversos de medicamentos son áreas prometedoras de
un año (Brumfiel 2011).
investigación en BI&A relacionadas con la salud. Debido a la importancia de las
regulaciones de HIPAA, la extracción de datos de salud para preservar la
privacidad también está ganando atención (Gelfand 2011/2012).
Salud y Bienestar Inteligente
Al igual que las grandes oportunidades de datos que enfrentan las comunidades de comercio electrónico y ciencia y tecnología,
Parcialmente financiado por los Institutos Nacionales de Salud (NIH), la
la comunidad de la salud se enfrenta a un tsunami de contenido relacionado con la salud generado a partir de numerosos
solicitud del programa NSF BIGDATA incluye intereses comunes en big
puntos de contacto de atención al paciente, instrumentos médicos sofisticados y comunidades de salud basadas en la web. Dos
data en NSF y NIH. La toma de decisiones clínicas, la terapia centrada en
fuentes principales de macrodatos de salud son los macrodatos impulsados por la genómica (genotipificación, expresión
el paciente y las bases de conocimientos sobre salud, enfermedad,
génica, datos de secuenciación) y los macrodatos de pagador-proveedor (registros médicos electrónicos, registros de seguros,
genoma y medio ambiente son algunas de las áreas en las que las
recetas de farmacia, comentarios y respuestas de los pacientes) (Miller 2012a). Los datos de secuenciación sin procesar
técnicas de BI&A pueden contribuir (Chen 2011b; Wactlar et al. 2011).
esperados de cada persona son aproximadamente cuatro terabytes. Desde el lado del pagador-proveedor, una matriz de datos
Otra iniciativa reciente e importante de NSF relacionada con el análisis de
puede tener cientos de miles de pacientes con muchos registros y parámetros (datos demográficos, medicamentos, resultados)
big data de salud es NSF Smart Health and Wellbeing (SHB)6programa,
recopilados durante un largo período de tiempo. Extraer conocimiento de los grandes datos de salud plantea importantes
que busca abordar cuestiones técnicas y científicas fundamentales que
desafíos prácticos y de investigación, especialmente considerando los requisitos de HIPAA (Ley de responsabilidad y
portabilidad de seguros de salud) e IRB (Junta de revisión institucional) para construir una infraestructura de salud confiable y
respaldarían una transformación muy necesaria de la atención médica de
que preserve la privacidad y realizar investigaciones éticas relacionadas con la salud (Gelfand 2011/2012). El análisis de big data
reactiva y centrada en el hospital a preventiva, proactiva, basada en
de salud, en general, va a la zaga de las aplicaciones de BI&A de comercio electrónico porque rara vez se ha aprovechado de
evidencia, centrada en la persona y centrada en el bienestar en lugar del
métodos analíticos escalables o plataformas computacionales (Miller 2012a). especialmente considerando los requisitos de control de enfermedades. Los temas de investigación de SHB incluyen
HIPAA (Ley de Portabilidad y Responsabilidad de Seguros Médicos) e IRB (Junta de Revisión Institucional) para construir una tecnología de sensores, redes, información y tecnología de aprendizaje
infraestructura de salud confiable y que preserve la privacidad y realizar investigaciones éticas relacionadas con la salud automático, modelado de procesos cognitivos, modelado de sistemas y
(Gelfand 2011/2012). El análisis de big data de salud, en general, va a la zaga de las aplicaciones de BI&A de comercio procesos, y problemas sociales y económicos (Wactlar et al. 2011), la
electrónico porque rara vez se ha aprovechado de métodos analíticos escalables o plataformas computacionales (Miller 2012a). mayoría de los cuales son relevantes para BI&A de atención médica.
especialmente considerando los requisitos de HIPAA (Ley de Portabilidad y Responsabilidad de Seguros Médicos) e IRB (Junta de
Revisión Institucional) para construir una infraestructura de salud confiable y que preserve la privacidad y realizar
investigaciones éticas relacionadas con la salud (Gelfand 2011/2012). El análisis de big data de salud, en general, va a la zaga de
las aplicaciones de BI&A de comercio electrónico porque rara vez se ha aprovechado de métodos analíticos escalables o
Seguridad y Protección Pública
plataformas computacionales (Miller 2012a).
Desde los trágicos eventos del 11 de septiembre de 2001, la

investigación sobre seguridad ha ganado mucha atención,
Durante la última década, los registros de salud electrónicos
especialmente dada la creciente dependencia de las empresas y
(EHR, por sus siglas en inglés) han sido ampliamente
nuestra sociedad global de la habilitación digital. Se ha llamado
adoptados en hospitales y clínicas de todo el mundo. De
a investigadores en ciencias computacionales, sistemas de
estas colecciones se puede obtener un conocimiento clínico
información, ciencias sociales, ingeniería, medicina y muchos
significativo y una comprensión más profunda de los
otros campos para que ayuden a mejorar nuestra capacidad
patrones de enfermedad de los pacientes (Hanauer et al.
2009; Hanauer et al. 2011; Lin et al. 2011). Hanauer et al. para combatir la violencia, el terrorismo, los delitos cibernéticos
(2011), por ejemplo, utilizaron EHR longitudinales a gran y otros problemas de seguridad cibernética. Se han identificado
escala para investigar asociaciones en diagnósticos médicos áreas críticas de la misión donde la tecnología de la información
y considerar las relaciones temporales entre eventos para puede contribuir, como se sugiere en el informe de la Oficina de
dilucidar mejor los patrones de progresión de la Seguridad Nacional de los EE.
enfermedad. Lin et al. (2011) utilizaron la minería de reglas
de asociación síntoma-enfermedad-tratamiento (SDT) en un
EHR integral de aproximadamente 2,1 millones de registros 6“Smart Health and Wellbeing (SBH)”, solicitud de programa NSF 12-512 (http://
de un hospital importante. Basado en códigos seleccionados www.nsf.gov/pubs/2012/nsf12512/nsf12512.htm; consultado el 2 de agosto de 2012).
de la Clasificación Internacional de Enfermedades (ICD-9),

seguridad, lucha contra el terrorismo nacional, protección de la El sistema de extracción de datos sobre delitos, desarrollado inicialmente
infraestructura crítica (incluido el ciberespacio), defensa contra el con fondos de la NSF y el Departamento de Justicia, lo utilizan
terrorismo catastrófico y preparación y respuesta ante emergencias. actualmente más de 4500 agencias policiales en los Estados Unidos y en
Frente a las misiones críticas de seguridad internacional y diversos 25 países de la OTAN, y fue adquirido por IBM en 2011. La investigación
desafíos técnicos y de datos, se reconoció la necesidad de de la Dark Web, financiado por NSF y el Departamento de Defensa (DOD),
desarrollar la ciencia de la “informática de seguridad”, siendo su ha generado una de las bases de datos de investigación de terrorismo
principal objetivo la académico más grandes conocidas (alrededor de 20 terabytes de sitios
web terroristas y contenido de redes sociales) y ha generado técnicas
desarrollo de tecnologías de la información, sistemas, avanzadas de análisis de redes sociales multilingües.
algoritmos y bases de datos avanzados para aplicaciones
relacionadas con la seguridad, a través de un enfoque Reconociendo los desafíos presentados por el volumen y la complejidad
integrado tecnológico, organizacional y basado en de los grandes datos relacionados con la defensa, la Agencia de
políticas (Chen 2006, p. 7). Proyectos de Investigación Avanzada de Defensa de los EE. UU. (DARPA)
dentro del DOD inició el programa XDATA en 2012 para ayudar a
BI&A tiene mucho que aportar al campo emergente de la informática de desarrollar técnicas computacionales y herramientas de software para
seguridad. procesar y analizar la gran cantidad de información orientada a la misión
para actividades de defensa. XDATA tiene como objetivo abordar la
Los problemas de seguridad son una preocupación importante para la necesidad de algoritmos escalables para el procesamiento y visualización
mayoría de las organizaciones. Según la firma de investigación de datos imperfectos e incompletos. El programa involucra a las
International Data Corporation, se espera que las grandes empresas comunidades de matemáticas aplicadas, informática y visualización de
gasten 32.800 millones de dólares en seguridad informática en 2012, y datos para desarrollar análisis de big data y soluciones de usabilidad
las pequeñas y medianas empresas gastarán más en seguridad que en para los combatientes.7Los investigadores de BI&A podrían contribuir
otras compras de TI durante los próximos tres años (Perlroth y Rusli significativamente en esta área.
2012). En el ámbito académico, también están floreciendo varias
disciplinas relacionadas con la seguridad, como la seguridad informática, La Tabla 2 resume estas prometedoras aplicaciones de BI&A,
la criminología computacional y la informática del terrorismo características de datos, técnicas de análisis e impactos potenciales.
(Brantingham 2011; Chen et al. 2008).
Las agencias de inteligencia, seguridad y protección

pública están recopilando grandes cantidades de Marco de investigación de BI&A:
datos de múltiples fuentes, desde antecedentes tecnologías fundamentales e
penales de incidentes de terrorismo y desde investigación emergente en análisis
amenazas de seguridad cibernética hasta inteligencia
multilingüe de fuente abierta. Las empresas de Las oportunidades con las aplicaciones emergentes y de alto
diferentes tamaños se enfrentan a la enorme tarea de impacto antes mencionadas han generado un gran entusiasmo
defenderse de las amenazas a la ciberseguridad y tanto en la industria de BI&A como en la comunidad de
proteger sus activos intelectuales e infraestructura. investigación. Mientras que la industria se enfoca en sistemas e
Sin embargo, procesar y analizar datos relacionados implementaciones escalables e integrados para aplicaciones en
con la seguridad es cada vez más difícil. Un desafío diferentes organizaciones, la comunidad académica necesita
importante en la investigación de TI de seguridad es continuar avanzando en las tecnologías clave en análisis.
la sobrecarga de información que resulta de diversas
fuentes de datos, múltiples formatos de datos y Las oportunidades emergentes de investigación de análisis se
grandes volúmenes de datos. La investigación actual pueden clasificar en cinco áreas técnicas críticas: análisis de
sobre tecnologías para aplicaciones de datos (grandes), análisis de texto, análisis web, análisis de red y
ciberseguridad, contraterrorismo y lucha contra el análisis móvil, todos los cuales pueden contribuir a BI&A 1.0, 2.0
crimen carece de un marco coherente para abordar y 3.0. La clasificación de estas cinco áreas temáticas pretende
estos desafíos de datos. BI seleccionado
Los programas de investigación COPLINK y Dark Web de la Universidad

de Arizona ofrecen ejemplos significativos de minería de datos sobre 7
"DARPA pide avances en 'Big Data' para ayudar al combatiente", marzo
delitos e informática sobre terrorismo dentro de la comunidad IS (Chen
29, 2012 (http://www.darpa.mil/NewsEvents/Releases/2012/03/29.aspx; consultado el
2006, 2012). El intercambio de información de COPLINK y 5 de agosto de 2012).

Tabla 2. Aplicaciones de BI&A: de Big Data a Big Impact

comercio electrónico y Gobierno electrónico y Ciencias & Salud inteligente y Seguridad y
Inteligencia de mercado Política 2.0 Tecnología Bienestar Seguridad Pública
Aplicaciones • Recomendador • Omnipresente • Innovación en ciencia y tecnología • Genómica humana • Análisis delictivo
sistemas servicios gubernamentales • Prueba de hipótesis y vegetal • Computacional
• Redes sociales • Igualdad de acceso y • Conocimiento • Cuidado de la salud criminología
Monitoreando y servicios públicos descubrimiento apoyo a las decisiones • Terrorismo
análisis • Compromiso ciudadano • Comunidad de pacientes informatica
• Colaboración colectiva y participación análisis • Fuente abierta
sistemas • Campaña política inteligencia
• Juegos sociales y y votación electrónica • La seguridad cibernética
virtuales
Datos • Búsqueda y registros de • Información del gobierno • Instrumentos de ciencia y tecnología • Genómica y • Antecedentes penales
usuarios ción y servicios y sistema- datos de secuencia • Mapas delictivos
• Transac- • Reglas y datos generados • Salud electrónica • Redes criminales
registros de ción regulaciones • Sensores y registros (HCE) • Noticias y web
• Cliente- • Retroalimentación y comentarios de contenido de la red • Redes sociales de contenido
contenido generado los ciudadanos salud y pacientes • Incidente de terrorismo
bases de datos
• Virus, ciber
ataques, y
redes de bots
Características : Características : Características : Características : Características :

web estructurada- información fragmentada alto rendimiento Dispar pero muy Identidad personal
basado en el usuario fuentes de ción y basado en instrumentos contenido vinculado, información, ingresos
contenido generado, sistemas heredados, rico recopilación de datos, multa- específico de la persona completo y engañoso
rica información de red contenido textual, granulado multiple- contenido, HIPAA, IRB contenido, grupo rico
ción, no estructurado informal no estructurado modalidad y gran- y cuestiones de ética e información de red
cliente informal conversaciones ciudadanas registros de escala, C&T mación, multilingüe
opiniones formatos de datos específicos contenido
Analítica • Regla de asociación • Integración de información • Basado en ciencia y tecnología • Genómica y • Delincuente
minería ción específico del dominio análisis de secuencia regla de asociación
• Segmentación de bases de datos • Análisis de matemático y y visualización minería y
tación y contenido y texto modelos analíticos • Asociación EHR agrupamiento
agrupamiento • Información del gobierno minería y • Red criminal

• Detección de anomalías servicio semántico de ción agrupamiento análisis
• Minería de gráficos vicios y ontologías • Sociosanitario • Espacio temporal
• Red social • Monitoreo y análisis monitoreo de medios análisis y
análisis de redes sociales y análisis visualización
• Texto y web • Red social • Texto de salud • Texto multilingüe
analítica análisis analítica analítica
• Sentimiento y • Análisis de sentimientos • Ontologías de la salud • Sentimiento y
análisis de afecto y afectos • Red de pacientes análisis de afecto
análisis • Ataques ciberneticos
• Medicamento adverso análisis y

efecto secundario atribución
análisis
• Preservación de la privacidad
procesamiento de datos
Impactos marketing de cola larga, Transformando el gobierno Avances en ciencia y tecnología, Cuidado de la salud mejorado público mejorado
dirigido y persona- mentos, empoderamiento impacto científico calidad, mejorado seguridad y proteccion
recomendación alizada ciudadanos, mejorando cuidado a largo plazo,
ción, aumento de la venta transparencia, participación empoderamiento del paciente-
y cliente pacion e igualdad mento

satisfacción

Tabla 3. Marco de investigación de BI&A: tecnologías fundamentales e investigación emergente en análisis

Análisis de datos (grandes) Análisis de texto analista de la red Análisis de red Análisis móvil
Fundacional • RDBMS • información • información • bibliométrico • servicios web
Tecnologías • almacenamiento de datos recuperación recuperación análisis • teléfono inteligente
• ETL • documento • computacional • red de citas plataformas

• OLAP representación lingüística • coautoría
• BPM • procesamiento de consultas • los motores de búsqueda la red
• procesamiento de datos • retroalimentación de relevancia • rastreo web • red social
• agrupamiento • modelos de usuario • clasificación del sitio web teorías
• regresión • los motores de búsqueda • análisis de registro de búsqueda • métricas de red
• clasificación • búsqueda empresarial • recomendador y topología
• asociación sistemas sistemas • matemático
análisis • servicios web modelos de red
• Detección de anomalías • mezclas • la red
• Redes neuronales visualización
• algoritmos genéticos
• multivariado
análisis estadístico
• optimización
• búsqueda heurística
emergentes • máquina estadística • PNL estadística • servicios en la nube • minería de enlaces • web móvil
Investigar aprendizaje • información • computación en la nube • comunidad servicios
• secuencial y extracción • búsqueda social y detección • omnipresente en dispositivos móviles
minería temporal • modelos de temas minería • red dinámica aplicaciones
• minería espacial • respuesta a preguntas • sistemas de reputación modelado • detección móvil

• minería de alta velocidad sistemas • redes sociales • basado en agentes aplicaciones
corrientes de datos y • minería de opiniones analítica modelado • redes sociales móviles
datos del sensor • sentimiento/afecto • visualización web • Influencia social innovación

• minería de procesos análisis • basado en la web e información • redes sociales móviles
• preservación de la privacidad • web estilométrica subastas modelos de difusión redes

procesamiento de datos análisis • internet • ERGM • visualización móvil-
• minería de red • multilingüe monetización • Comunidades virtuales ción/HCI
• minería web análisis • Mercadeo social • criminal/oscuro • personalización y
• basado en columnas • visualización de texto • privacidad web/ redes conductual
SGBD • infrarrojos multimedia seguridad • sociales/políticas modelado
• SGBD en memoria • infrarrojos móviles análisis • ludificación
• DBMS paralelo • Hadoop • confianza y reputación • la publicidad móvil
• computación en la nube • Mapa reducido y mercadeo
• Hadoop
• Mapa reducido
resaltar las características clave de cada área; sin embargo, algunas de Desde finales de la década de 1980, los investigadores de las
estas áreas pueden aprovechar tecnologías subyacentes similares. En comunidades de inteligencia artificial, algoritmos y bases de datos han
cada área de análisis, presentamos las tecnologías fundamentales que desarrollado varios algoritmos de minería de datos. En la Conferencia
están maduras y bien desarrolladas y sugerimos áreas de investigación internacional sobre minería de datos (ICDM) de IEEE de 2006, se
emergentes seleccionadas (consulte la Tabla 3). identificaron los 10 algoritmos de minería de datos más influyentes en
función de las nominaciones de expertos, recuentos de citas y una
encuesta comunitaria. En orden de clasificación, son C4.5, k-medias, SVM
Análisis de datos (grandes) (máquina de vectores de soporte), Apriori, EM (maximización de
expectativas), PageRank, AdaBoost, kNN (k-vecinos más cercanos), Naïve
El análisis de datos se refiere a las tecnologías de BI&A que se basan Bayes y CART (Wu et al. . 2007). Estos algoritmos cubren clasificación,
principalmente en la extracción de datos y el análisis estadístico. agrupamiento, regresión, análisis de asociación y análisis de red. La
Como se mencionó anteriormente, la mayoría de estas técnicas se mayoría de estos populares algoritmos de minería de datos se han
basan en tecnologías comerciales maduras de DBMS relacional, incorporado en sistemas de minería de datos comerciales y de código
almacenamiento de datos, ETL, OLAP y BPM (Chaudhuri et al. 2011). abierto (Witten et al. 2011). Otro

avances como las redes neuronales para la clasificación/predicción y ha sido aclamada como una nueva plataforma revolucionaria para el
la agrupación y los algoritmos genéticos para la optimización y el acceso masivo a datos paralelos a gran escala (Patterson 2008). Inspirado
aprendizaje automático han contribuido al éxito de la minería de en parte por MapReduce, Hadoop proporciona un marco de software
datos en diferentes aplicaciones. basado en Java para el procesamiento distribuido de análisis y
transformación de datos intensivos. Los tres principales proveedores de
Otros dos enfoques de análisis de datos que se enseñan comúnmente en las bases de datos comerciales (Oracle, IBM y Microsoft) han adoptado
escuelas de negocios también son fundamentales para BI&A. Basado en Hadoop, algunos dentro de una infraestructura de nube. El Apache
teorías y modelos estadísticos, el análisis estadístico multivariado cubre Hadoop de código abierto también ganó una tracción significativa para el
técnicas analíticas como la regresión, el análisis factorial, el agrupamiento y el análisis empresarial, incluido Chukwa para la recopilación de datos,
análisis discriminante que se han utilizado con éxito en diversas aplicaciones HBase para el almacenamiento de datos distribuidos, Hive para el
comerciales. Desarrolladas en la comunidad científica de gestión, las técnicas resumen de datos yad hocconsultas y Mahout para minería de datos
de optimización y la búsqueda heurística también son adecuadas para (Henschen 2011). En su artículo de perspectiva, Stonebraker et al. (2010)
problemas seleccionados de BI&A, como la selección de características de la compararon MapReduce con el DBMS paralelo. El DBMS paralelo
base de datos y el rastreo/rastreo web. La mayoría de estas técnicas se pueden comercial mostró claras ventajas en el procesamiento de consultas
encontrar en los planes de estudios de las escuelas de negocios. eficiente y en el lenguaje y la interfaz de consultas de alto nivel, mientras
que MapReduce se destacó en ETL y análisis para conjuntos de datos
semiestructurados de "solo lectura". Los nuevos sistemas basados en
Debido al éxito logrado colectivamente por la comunidad de minería de datos y análisis estadístico, el análisis de datos continúa Hadoop y MapReduce se han convertido en otra opción viable para el
siendo un área activa de investigación. El aprendizaje automático estadístico, a menudo basado en modelos matemáticos bien análisis de big data además de los sistemas comerciales desarrollados
fundamentados y algoritmos potentes, técnicas como las redes bayesianas, los modelos ocultos de Markov, la máquina de para RDBMS, DBMS basado en columnas, DBMS en memoria y DBMS
vectores de soporte, el aprendizaje por refuerzo y los modelos de conjuntos, se han aplicado a aplicaciones de análisis de datos, paralelo (Chaudhuri et al. 2011).
texto y web. Otras nuevas técnicas de análisis de datos exploran y aprovechan características de datos únicas, desde minería
secuencial/temporal y minería espacial, hasta minería de datos para flujos de datos de alta velocidad y datos de sensores. El
aumento de la preocupación por la privacidad en varias aplicaciones de comercio electrónico, administración electrónica y
atención médica ha provocado que la extracción de datos para preservar la privacidad se convierta en un área emergente de Análisis de texto
investigación. Muchos de estos métodos se basan en datos y se basan en diversas técnicas de anonimización, mientras que
otros se basan en procesos y definen cómo se puede acceder y utilizar los datos (Gelfand 2011/2012). Durante la última década, Una parte significativa del contenido no estructurado recopilado por una
la minería de procesos también ha surgido como un nuevo campo de investigación que se centra en el análisis de procesos organización está en formato de texto, desde comunicaciones por correo
utilizando datos de eventos. La minería de procesos se ha vuelto posible gracias a la disponibilidad de registros de eventos en electrónico y documentos corporativos hasta páginas web y contenido de
varias industrias (p. ej., atención médica, cadenas de suministro) y nuevas técnicas de verificación de conformidad y redes sociales. El análisis de texto tiene sus raíces académicas en la
descubrimiento de procesos (van der Aalst 2012). Además, los datos de red y el contenido web han ayudado a generar recuperación de información y la lingüística computacional. En la recuperación
investigaciones interesantes en análisis de redes y análisis web, que se presentan a continuación. La minería de procesos de información, la representación de documentos y el procesamiento de
también ha surgido como un nuevo campo de investigación que se centra en el análisis de procesos utilizando datos de consultas son los cimientos para desarrollar el modelo de espacio vectorial, el
eventos. La minería de procesos se ha vuelto posible gracias a la disponibilidad de registros de eventos en varias industrias (p. modelo de recuperación booleano y el modelo de recuperación probabilística,
ej., atención médica, cadenas de suministro) y nuevas técnicas de verificación de conformidad y descubrimiento de procesos que a su vez se convirtieron en la base de las bibliotecas digitales modernas,
(van der Aalst 2012). Además, los datos de red y el contenido web han ayudado a generar investigaciones interesantes en los motores de búsqueda y los sistemas de búsqueda empresarial ( Saltón
análisis de redes y análisis web, que se presentan a continuación. La minería de procesos también ha surgido como un nuevo 1989). En lingüística computacional, técnicas de procesamiento estadístico del
campo de investigación que se centra en el análisis de procesos utilizando datos de eventos. La minería de procesos se ha lenguaje natural (PNL) para la adquisición léxica, desambiguación del sentido
vuelto posible gracias a la disponibilidad de registros de eventos en varias industrias (p. ej., atención médica, cadenas de de las palabras, etiquetado de partes del discurso (POST), y las gramáticas
suministro) y nuevas técnicas de verificación de conformidad y descubrimiento de procesos (van der Aalst 2012). Además, los libres de contexto probabilísticas también se han vuelto importantes para
datos de red y el contenido web han ayudado a generar investigaciones interesantes en análisis de redes y análisis web, que se representar texto (Manning y Schütze 1999). Además de las representaciones
presentan a continuación. de documentos y consultas, los modelos de usuario y los comentarios de
relevancia también son importantes para mejorar el rendimiento de la
búsqueda.
Además de la investigación académica activa sobre análisis de datos, la
investigación y el desarrollo de la industria también han generado mucho Desde principios de la década de 1990, los motores de búsqueda se han
entusiasmo, especialmente con respecto al análisis de big data para convertido en sistemas comerciales maduros, que consisten en un rastreo
contenido semiestructurado. A diferencia de los datos estructurados que rápido y distribuido; indexación invertida eficiente; ranking de páginas basado
se pueden manejar repetidamente a través de un RDBMS, los datos en enlaces internos; y análisis de registros de búsqueda. Muchas de estas
semiestructurados pueden requerirad hocy extracción, análisis, técnicas fundamentales de indexación y procesamiento de texto se han
procesamiento, indexación y análisis únicos en un entorno MapReduce o implementado en sistemas de gestión de documentos y búsqueda empresarial
Hadoop escalable y distribuido. Mapa reducido basados en texto en BI&A 1.0.

Aprovechando el poder de los grandes datos (para la capacitación) y la analista de la red

NLP estadística (para la construcción de modelos de lenguaje), las
técnicas de análisis de texto se han buscado activamente en varias áreas Durante la última década, la analítica web se ha convertido en un campo activo
emergentes, incluida la extracción de información, modelos de temas, de investigación dentro de BI&A. Sobre la base de la minería de datos y los
preguntas y respuestas (Q/A) y minería de opiniones. La extracción de fundamentos del análisis estadístico del análisis de datos y sobre la
información es un área de investigación que tiene como objetivo extraer recuperación de información y los modelos NLP en el análisis de texto, el
automáticamente tipos específicos de información estructurada de los análisis web ofrece oportunidades y desafíos analíticos únicos. Los sitios web
documentos. Como componente básico de la extracción de información, con hipervínculos basados en HTTP/HTML y los motores de búsqueda web
NER (reconocimiento de entidad nombrada, también conocido como asociados y los sistemas de directorio para ubicar contenido web han ayudado
extracción de entidades) es un proceso que identifica elementos a desarrollar tecnologías únicas basadas en Internet para rastrear/rastrear
atómicos en el texto y los clasifica en categorías predefinidas (por sitios web, actualizar páginas web, clasificar sitios web y analizar registros de
ejemplo, nombres, lugares, fechas). Las técnicas NER se han desarrollado búsqueda. El análisis de registros web basado en las transacciones de los
con éxito para el análisis de noticias y aplicaciones biomédicas. Los clientes se ha convertido posteriormente en una investigación activa en los
modelos de temas son algoritmos para descubrir los temas principales sistemas de recomendación. Sin embargo, la analítica web se ha vuelto aún
que impregnan una colección de documentos grande y desestructurada.
más emocionante con la madurez y la popularidad de los servicios web y los
Nuevos algoritmos de modelado de temas como LDA (asignación latente
sistemas Web 2.0 a mediados de la década de 2000 (O'Reilly 2005).
de Dirichlet) y otros modelos probabilísticos han atraído investigaciones
recientes (Blei 2012). Los sistemas de respuesta a preguntas (Q/A) se
basan en técnicas de NLP, recuperación de información e interacción
Basados en XML y protocolos de Internet (HTTP, SMTP), los servicios web ofrecen una nueva forma de reutilizar e
humano-computadora. Principalmente diseñados para responder
integrar sistemas heredados o de terceros. Los nuevos tipos de servicios web y sus API asociadas (interfaz de
preguntas fácticas (es decir, tipos de preguntas quién, qué, cuándo y
programación de aplicaciones) permiten a los desarrolladores integrar fácilmente contenido diverso de diferentes
dónde), los sistemas de preguntas y respuestas involucran diferentes
sistemas habilitados para la web, por ejemplo, REST (transferencia de estado representacional) para invocar
técnicas para el análisis de preguntas, recuperación de fuentes,
servicios remotos, RSS (sindicación realmente simple) para noticias "empuje", JSON (notación de objetos de
extracción de respuestas, y presentación de respuestas (Maybury 2004).
JavaScript) para el intercambio de datos livianos y AJAX (JavaScript asíncrono + XML) para el intercambio de datos y
Los éxitos recientes de Watson de IBM y Siri de Apple han destacado las
la visualización dinámica. Estos modelos de programación livianos admiten la sindicación y notificación de datos y
oportunidades de investigación y comercialización de Q/A. Se han
las "combinaciones" de contenido multimedia (p. ej., Flickr, Youtube, Google Maps) de diferentes fuentes web, un
identificado muchas áreas prometedoras de aplicación del sistema Q/A,
proceso algo similar a ETL (extracción, transformación y carga) en BI& Un 1.0. La mayoría de los proveedores de
incluidas la educación, la salud y la defensa. La minería de opiniones se
comercio electrónico han proporcionado API maduras para acceder a sus productos y al contenido de sus clientes
refiere a las técnicas computacionales para extraer, clasificar,
(Schonfeld 2005). Por ejemplo, a través de Amazon Web Services, los desarrolladores pueden acceder al catálogo
comprender y evaluar las opiniones expresadas en varias fuentes de
de productos, reseñas de clientes, clasificación de sitios, precios históricos y Amazon Elastic Compute Cloud (EC2)
noticias en línea, comentarios en redes sociales y otros contenidos
para la capacidad informática. Del mismo modo, las API web de Google admiten búsqueda AJAX, API de mapas,
generados por los usuarios. El análisis de sentimientos se usa a menudo
API de GData (para Calendar, Gmail, etc.), Google Translate y Google App Engine para recursos informáticos en la
en la minería de opiniones para identificar sentimientos, afectos,
nube. Los servicios web y las API continúan brindando un flujo emocionante de nuevas fuentes de datos para la
subjetividad y otros estados emocionales en textos en línea. La Web 2.0 y
investigación de BI&A 2.0. precios históricos y Amazon Elastic Compute Cloud (EC2) para la capacidad informática.
el contenido de las redes sociales han creado abundantes y
Del mismo modo, las API web de Google admiten búsqueda AJAX, API de mapas, API de GData (para Calendar,
emocionantes oportunidades para comprender las opiniones del público
Gmail, etc.), Google Translate y Google App Engine para recursos informáticos en la nube. Los servicios web y las
en general y de los consumidores con respecto a eventos sociales,
API continúan brindando un flujo emocionante de nuevas fuentes de datos para la investigación de BI&A 2.0.
movimientos políticos, estrategias empresariales,
precios históricos y Amazon Elastic Compute Cloud (EC2) para la capacidad informática. Del mismo modo, las API
web de Google admiten búsqueda AJAX, API de mapas, API de GData (para Calendar, Gmail, etc.), Google
Además de las direcciones de investigación anteriores, el análisis de texto Translate y Google App Engine para recursos informáticos en la nube. Los servicios web y las API continúan
también ofrece importantes oportunidades y desafíos de investigación brindando un flujo emocionante de nuevas fuentes de datos para la investigación de BI&A 2.0.
en varias áreas más enfocadas, incluido el análisis estilométrico web para

la atribución de autoría, el análisis multilingüe para documentos web y la
visualización de texto a gran escala. La recuperación de información
multimedia y la recuperación de información móvil son otras dos áreas
relacionadas que requieren soporte de técnicas de análisis de texto, Un componente emergente importante en la investigación de análisis web es
además de las tecnologías móviles y multimedia básicas. Al igual que el el desarrollo de plataformas y servicios de computación en la nube, que
análisis de big data, el análisis de texto que usa MapReduce, Hadoop y incluyen aplicaciones, software de sistema y hardware entregados como
los servicios en la nube continuará fomentando direcciones de servicios a través de Internet. Basado en la arquitectura orientada a servicios
investigación activas tanto en la academia como en la industria. (SOA), la virtualización de servidores y la computación de utilidades, la
computación en la nube se puede ofrecer como software como un

servicio (SaaS), infraestructura como servicio (IaaS) o plataforma como servicio representan relaciones sociales, colaboración, intercambios de correo
(PaaS). Actualmente, solo unos pocos proveedores líderes de TI están electrónico o adopciones de productos. Se puede realizar minería de
posicionados para admitir aplicaciones de BI&A de alta gama y alto enlaces utilizando solo la información de topología (Liben-Nowell y
rendimiento que utilizan computación en la nube. Por ejemplo, Amazon Elastic Kleinberg 2007). Las técnicas como los vecinos comunes, el coeficiente de
Compute Cloud (EC2) permite a los usuarios alquilar computadoras virtuales Jaccard, la medida de Adamic Adar y la medida de Katz son populares
en las que ejecutar sus propias aplicaciones informáticas. Su servicio de para predecir enlaces faltantes o futuros. La precisión de la minería de
almacenamiento simple (S3) proporciona un servicio web de almacenamiento enlaces se puede mejorar aún más cuando se consideran los atributos de
en línea. Google App Engine proporciona una plataforma para desarrollar y nodo y enlace. La detección comunitaria también es un área de
alojar aplicaciones web basadas en Java o Python. Google Bigtable se utiliza investigación activa de relevancia para BI&A (Fortunato 2010). Al
para el almacenamiento de datos de back-end. La plataforma Windows Azure representar las redes como gráficos, se pueden aplicar algoritmos de
de Microsoft proporciona servicios en la nube como SQL Azure y SharePoint, y partición de gráficos para encontrar un corte mínimo para obtener
permite que las aplicaciones de .Net Framework se ejecuten en la plataforma. subgráficos densos que representen comunidades de usuarios.
Los servicios web y en la nube liderados por la industria ofrecen desafíos

Se han desarrollado muchas técnicas para ayudar a estudiar la naturaleza dinámica de las redes sociales. Por ejemplo, los
únicos de recopilación, procesamiento y análisis de datos para BI&
modelos basados en agentes (a veces denominados sistemas multiagente) se han utilizado para estudiar redes de contactos de
enfermedades y redes criminales o terroristas (Consejo Nacional de Investigación 2008). Dichos modelos simulan las acciones e
interacciones de agentes autónomos (ya sea de entidades individuales o colectivas como organizaciones o grupos) con la
En el ámbito académico, la investigación actual relacionada con el análisis web
intención de evaluar sus efectos en el sistema como un todo. Los modelos de difusión de información e influencia social
abarca la búsqueda y minería social, los sistemas de reputación, el análisis de
también son técnicas viables para estudiar redes en evolución. Algunas investigaciones son particularmente relevantes para la
redes sociales y la visualización web. Además, las subastas basadas en la web,
dinámica de opinión e información de una sociedad. Dicha dinámica tiene muchas similitudes cualitativas con las infecciones
la monetización de Internet, el marketing social y la privacidad/seguridad web
por enfermedades (Bettencourt et al. 2006). Otra técnica de análisis de redes que ha llamado la atención en los últimos años es
son algunas de las direcciones de investigación prometedoras relacionadas
el uso de modelos de gráficos aleatorios exponenciales (Frank y Strauss 1986; Robins et al. 2007). Los ERGM son una familia de
con el análisis web. Muchas de estas áreas de investigación emergentes
modelos estadísticos para analizar datos sobre redes sociales y otras redes. Para respaldar la inferencia estadística sobre los
pueden depender de los avances en el análisis de redes sociales, el análisis de
procesos que influyen en la formación de la estructura de la red, los ERGM consideran el conjunto de todas las posibles redes
texto e incluso la investigación de modelos económicos.
alternativas ponderadas en su similitud con una red observada. Además de estudiar las redes tradicionales de amistad o
enfermedad, los ERGM son prometedores para comprender las propiedades de red subyacentes que causan la formación y
evolución de redes de clientes, ciudadanos o pacientes para BI&A. Los ERGM son una familia de modelos estadísticos para
Análisis de red analizar datos sobre redes sociales y otras redes. Para respaldar la inferencia estadística sobre los procesos que influyen en la
formación de la estructura de la red, los ERGM consideran el conjunto de todas las posibles redes alternativas ponderadas en su
El análisis de redes es un área de investigación incipiente que ha

similitud con una red observada. Además de estudiar las redes tradicionales de amistad o enfermedad, los ERGM son
evolucionado desde el anterior análisis bibliométrico basado en citas

prometedores para comprender las propiedades de red subyacentes que causan la formación y evolución de redes de clientes,
para incluir nuevos modelos computacionales para la comunidad en línea

ciudadanos o pacientes para BI&A. Los ERGM son una familia de modelos estadísticos para analizar datos sobre redes sociales y
y el análisis de redes sociales. Con base en el análisis bibliométrico, las otras redes. Para respaldar la inferencia estadística sobre los procesos que influyen en la formación de la estructura de la red,
redes de citas y las redes de coautoría se han adoptado durante mucho los ERGM consideran el conjunto de todas las posibles redes alternativas ponderadas en su similitud con una red observada.
tiempo para examinar el impacto científico y la difusión del Además de estudiar las redes tradicionales de amistad o enfermedad, los ERGM son prometedores para comprender las
conocimiento. El índice h es un buen ejemplo de una métrica de citas que propiedades de red subyacentes que causan la formación y evolución de redes de clientes, ciudadanos o pacientes para BI&A.
tiene como objetivo medir la productividad y el impacto del trabajo

publicado de un científico o académico (Hirsch 2005). Desde principios de
la década de 2000, la ciencia de redes ha comenzado a avanzar
rápidamente con las contribuciones de sociólogos, matemáticos e
informáticos. Se han desarrollado varias teorías de redes sociales, La mayoría de las técnicas de análisis de red mencionadas anteriormente
métricas de redes, topologías y modelos matemáticos que ayudan a no forman parte de las plataformas comerciales de BI&A existentes. Se
comprender las propiedades y relaciones de las redes (p. ej., centralidad, están realizando importantes esfuerzos de desarrollo de código abierto
intermediación, camarillas, caminos; lazos, agujeros estructurales, por parte de la comunidad de análisis de redes sociales. Se han
equilibrio estructural; red aleatoria, red de mundo pequeño, red sin desarrollado herramientas como UCINet (Borgatti et al. 2002) y Pajek
escala) (Barabási 2003; Watts 2003). (Batagelj y Mrvar 1998) y se utilizan ampliamente para el análisis y la
visualización de redes a gran escala. También se han puesto a disposición
La investigación reciente de análisis de redes se ha centrado en áreas de la comunidad académica nuevas herramientas de análisis de redes
como la minería de enlaces y la detección de comunidades. En la minería como ERGM (Hunter et al. 2008). Las comunidades virtuales en línea, las
de enlaces, uno busca descubrir o predecir enlaces entre nodos de una redes criminales y terroristas, las redes sociales y políticas y las redes de
red. Dentro de una red, los nodos pueden representar clientes, usuarios confianza y reputación son algunas de las nuevas aplicaciones
finales, productos y/o servicios, y los enlaces entre nodos pueden prometedoras para el análisis de redes.

Análisis móvil varias aplicaciones omnipresentes móviles, desde la gestión de

desastres hasta el soporte de atención médica. Están surgiendo
Como un canal eficaz para llegar a muchos usuarios y como un medio nuevas investigaciones de análisis móvil en diferentes áreas (p. ej.,
para aumentar la productividad y la eficiencia de la fuerza laboral de una aplicaciones de detección móvil que tienen en cuenta la ubicación y
organización, los encuestados de la reciente encuesta de tendencias la actividad; innovación social móvil para m-health y m-learning;
tecnológicas de IBM (IBM 2011) ven a la computación móvil como la redes sociales móviles y crowdsourcing; visualización móvil/HCI; y
segunda área con mayor “demanda” de desarrollo de software. Mobile BI personalización y modelado de comportamiento para aplicaciones
también fue considerado por el análisis Gartner BI Hype Cycle como una móviles). Además, los modelos sociales, de comportamiento y
de las nuevas tecnologías que tienen el potencial de alterar económicos para la gamificación, la publicidad móvil y el marketing
drásticamente el mercado de BI (Bitterer 2011). Según eMarketer, se social están en marcha y pueden contribuir al desarrollo de futuros
espera que el mercado de anuncios móviles se dispare, pasando de un sistemas BI&A 3.0.
valor estimado de 2600 millones de dólares en 2012 a 10 800 millones de
dólares en 2016 (Snider 2012).
La informática móvil ofrece un medio para el crecimiento profesional de

Mapeo del panorama del conocimiento de
TI a medida que más y más organizaciones crean aplicaciones. Con su BI&A: un estudio bibliométrico de
base de instalación global grande y en crecimiento, Android ha sido publicaciones académicas y de la industria
clasificada como la plataforma móvil superior desde 2010. Esta
plataforma de código abierto, basada en Java y XML, ofrece una curva de En un esfuerzo por comprender mejor el estado actual de la
aprendizaje mucho más corta y esto contribuye a su popularidad entre investigación relacionada con BI&A e identificar futuras fuentes de
los profesionales de TI: 70 por ciento de los encuestados de IBM conocimiento, llevamos a cabo un estudio bibliométrico que analiza la
planeaba usar Android como su plataforma de desarrollo móvil, mientras literatura relevante, los principales académicos, disciplinas y
que el 49 por ciento planeaba usar iOS y el 35 por ciento planeaba usar publicaciones de BI&A, y temas de investigación clave. En el estudio se
Windows 7. smart devices ha abierto nuevas posibilidades para siguió un proceso de recopilación, transformación y análisis, muy
oportunidades de BI&A avanzadas e innovadoras. Además de las parecido a un proceso típico de BI&A adoptado en otras aplicaciones.
ventajas de hardware y contenido, el ecosistema de aplicaciones único
desarrollado a través de la comunidad voluntaria de desarrolladores de Para discernir las tendencias de investigación en BI&A, se recopiló
aplicaciones móviles ofrece una nueva vía para la investigación de BI&A. literatura relacionada de la última década (2000–2011). Se
Solo la App Store de Apple ofrece más de 500.000 aplicaciones en casi identificaron publicaciones de TI relevantes de varias bibliotecas
cualquier categoría concebible a partir de agosto de 2012;8el número de digitales acreditadas y de gran escala: Web of Science (Thomson
aplicaciones de Android también llegó a 500.000 en agosto de 2012.9Han Reuters, que cubre más de 12,000 de las revistas de mayor impacto
comenzado a surgir muchos modelos de ingresos diferentes para las en ciencias, ingeniería y humanidades), Business Source Complete
aplicaciones móviles, desde aplicaciones pagas o gratuitas pero con (EBSCO, que cubre revistas de negocios, así como contenido que no
publicidad hasta juegos móviles, que incentivan a los participantes (por es de revistas, como revistas de industria/comercio), IEEE Xplore
ejemplo, usuarios o empleados) al otorgar recompensas por las (Instituto de Ingenieros Eléctricos y Electrónicos, que proporciona
contribuciones (Snider 2012). Para BI móvil, las empresas están acceso a la biblioteca digital IEEE), ScienceDirect (Elsevier, que cubre
considerando aplicaciones empresariales, aplicaciones específicas de la más de 2500 revistas científicas, técnicas, literatura médica) y
industria, aplicaciones de comercio electrónico y aplicaciones sociales (en Engineering Village (Elsevier, utilizado para recuperar documentos
orden de clasificación) según la encuesta de IBM. de conferencias de ACM seleccionados porque la interfaz de la
Biblioteca digital de ACM no admite la descarga automática). Estas
fuentes contienen metadatos bibliométricos de alta calidad,
Los modelos de programación ligeros de los servicios web incluidos el nombre y la fecha de la revista, el nombre del autor y la
actuales (p. ej., HTML, XML, CSS, Ajax, Flash, J2E) y las institución, y el título y el resumen del artículo.
plataformas de desarrollo móvil en maduración, como Android
e iOS, han contribuido al rápido desarrollo de los servicios web
móviles (p. ej., HTML5, Ajax móvil, Flash móvil, J2ME) en Para garantizar la coherencia y la relevancia de los datos en toda nuestra
colección, recuperamos solo aquellas publicaciones que contenían las
palabras claveinteligencia de negocios,Análisis de negocio, ograndes
8Apple – iPhone 5: obtenga información sobre las aplicaciones de la tienda de aplicaciones (http://
datosdentro de su título, resumen o índice de materias (cuando
www.apple.com/iphone/built-in-apps/app-store.html; consultado el 8 de agosto de 2012).
corresponda). La elección de estas tres palabras clave pretendía centrar
9AppBrain, Estadísticas de Android (http://www.appbrain.com/stats/number- nuestra búsqueda y análisis en publicaciones de relevancia directa para
ofandroid-apps; consultado el 8 de agosto de 2012). nuestro interés. Sin embargo, este procedimiento de búsqueda puede

Todos
Palabra clave Años 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011
Inteligencia de negocios 3,146 113 104 146 159 229 330 346 394 352 201 334 338
Análisis de negocio 213 0 5 43 4 5 2 9 6 19 dieciséis 17 126
Grandes datos 243 0 1 0 0 7 4 3 26 11 41 44 95
Total 3,602 113 110 149 163 241 336 358 426 382 358 356 560
Figura 2. Relación BI&A Pu atado blicati on Tre norte

d para metro2000 al 201 1
también omita los artículos que usan otros términos relevantes de BI&A En general, la mayor fuente de publicaciones académicas de inteligencia
(p. ej., almacenamiento de datos, minería de datos) pero no las tres comercial fueron las conferencias académicas. La Conferencia sobre
palabras clave específicas en el título o resumen. Este tipo de limitación Inteligencia de Negocios e Ingeniería Financiera (#1) y la Conferencia
es común en los estudios bibliométricos. Los datos recopilados se sobre Comercio Electrónico e Inteligencia de Negocios (#3) son
exportaron como registros XML y se analizaron en una base de datos conferencias académicas especializadas dedicadas a la inteligencia de
relacional (SQL Server) para su análisis. El número de registros negocios. Una conferencia IS ocupa el puesto número 2 en la lista de las
recuperados inicialmente ascendió a 6.187 artículos. Después de eliminar 20 principales: la Conferencia Internacional de Ciencias de Sistemas de
los duplicados, el número de registros únicos ascendió a 3.602. Hawái (HICSS), con 370 publicaciones.10IEEE lleva a cabo la mayoría de las
conferencias en la lista a través de varios puntos de venta; varios están
La figura 2 muestra las estadísticas y las tendencias de crecimiento de las relacionados con áreas técnicas emergentes, como la minería de datos, la
publicaciones relacionadas con las tres palabras clave de búsqueda. En general, la computación en Internet y la computación en la nube. La Conferencia
inteligencia comercial tuvo la mayor cobertura y la historia más larga. Esto es Internacional IEEE sobre Minería de Datos (ICDM) es muy apreciada y
consistente con la evolución de BI&A, ya que el término BI apareció por primera vez a ocupa el quinto lugar. ACM tiene dos publicaciones en la lista de las 20
principios de la década de 1990. En nuestra colección, el análisis de negocios y los principales:Comunicaciones de la ACMy la Conferencia Internacional ACM
grandes datos comenzaron a aparecer en la literatura en 2001, pero solo ganaron SIGKDD sobre Descubrimiento de Conocimiento y Minería de Datos.
mucha atención después de aproximadamente 2007. Las publicaciones relacionadas Ambos son bien conocidos en CS. Nuevamente, la comunidad de minería
con la inteligencia de negocios sumaron 3,146, mientras que las publicaciones de de datos ha contribuido significativamente a BI&A. Otras conferencias
análisis de negocios y grandes datos cada una contó con solo 213 y 243, técnicas en CS también están contribuyendo a BI&A en áreas como
respectivamente. . Si bien la tendencia general de publicación de inteligencia de inteligencia computacional, inteligencia web, computación evolutiva y
negocios se mantiene estable, las publicaciones de análisis de negocios y big data procesamiento de lenguaje natural, todos los cuales son críticos para
han experimentado un patrón de crecimiento más rápido en los últimos años. desarrollar futuras técnicas de análisis de datos, texto y web discutidas
en nuestro marco de investigación.
El conocimiento de las publicaciones más populares, así como de los

10Dos conferencias importantes de SI, ICIS (Conferencia Internacional sobre Sistemas de
autores más prolíficos, es beneficioso para comprender una disciplina de
Información) y WITS (Taller sobre Tecnologías y Sistemas de Información) también pueden
investigación emergente. La Tabla 4 resume las 20 principales revistas,
haber publicado importantes investigaciones de BI&A; sin embargo, sus colecciones no están
conferencias y revistas de la industria con publicaciones de BI&A. (Los 20
incluidas en las cinco principales bibliotecas digitales a las que tenemos acceso y, por lo
principales autores académicos de BI&A se identifican en la Tabla 6). tanto, no están incluidas en este análisis.

Tabla 4. Principales diarios, conferencias y revistas de la industria con publicaciones de BI&A

Parte superior Parte superior
20 Publicación Académica Publicaciones 20 Publicación de la industria Publicaciones
1 Conf. en Business Intelligence e Ingeniería Financiera 531 1 Mundo de la informática 282

2 Conferencia Internacional de Hawái. en Ciencias de Sistemas 370 2 Información hoy 258
3 Conf. sobre Comercio Electrónico e Inteligencia de Negocios 252 3 Semana de la información 229
Conf. Internacional sobre Web Intelligence y Talleres de Tecnología de
4 151 4 Informática Semanal 199
Agentes Inteligentes
5 Conferencia Internacional IEEE. sobre minería de datos 150 5 Minería de datos de Microsoft 108
Conferencia Internacional IEEE. sobre tecnología electrónica, comercio electrónico y servicio
6 129 6 InfoMundo 86
electrónico
7 Sistemas inteligentes IEEE 47 7 director de información 71

8 Computación en la nube IEEE 44 8 KM mundo 61
CRN (anteriormente
9 Sistemas de Soporte a la Decisión 39 9 59
VARNegocios)
10 Congreso IEEE sobre computación evolutiva 39 10 Revista de tiendas 56
11 Revista de ética empresarial 34 11 Forbes 45
12 Comunicaciones de la ACM 33 12 Revista CRM 40
13 Revista Europea de Marketing 32 13 mundo de la red 39
Simposio internacional IEEE/ACM sobre computación en clúster, en la
14 31 14 Ejecutivo Financiero 37
nube y en malla
Cuidado de la salud Financiero

15 Revista Internacional de Gestión de Tecnología 29 15 33
administración
Conferencia Internacional ACM SIGKDD sobre descubrimiento de conocimiento y

dieciséis 28 dieciséis Edad de la cadena de tiendas 40
minería de datos
17 Simposio Internacional sobre Procesamiento del Lenguaje Natural 22 17 Finanzas Estratégicas 29

18 Computación en Internet IEEE 21 18 tráfico mundial 28
Conf. Internacional en Inteligencia Computacional e Ingeniería de
19 21 19 Estrategia de datos 27
Software
20 Software IEEE 20 20 director de Finanzas 25
trabajar. Las revistas son algo más limitadas en su volumen de La Tabla 6 resume los 20 principales autores académicos con
publicación, aunque llama la atención que la revista IS Sistemas de publicaciones de BI&A. La mayoría de estos autores son de IS y CS,
Soporte a la Decisiónhizo la lista de los 20 principales (en el # 9). Algunas con varios otros de los campos relacionados de marketing,
revistas de escuelas de negocios también contienen investigaciones administración, comunicación y matemáticas. Muchos de estos
relacionadas con BI&A en áreas como ética empresarial, marketing y autores son colaboradores cercanos, por ejemplo, Hsinchun Chen
gestión de tecnología. Otras publicaciones importantes de SI también (#1), Jay F. Nunamaker (#18), Michael Chau (#11) y Wingyan Chung
publicaron artículos relacionados con la inteligencia empresarial, pero a (#18) a través de la conexión de la Universidad de Arizona,11y
un ritmo menor que las fuentes antes mencionadas (ver Tabla 5). Las Barabara H. Wixom (#5) y Hugh J. Watson (#5) a través de la
fuentes relevantes de la industria tienden a ser publicaciones generales conexión de la Universidad de Georgia. También informamos el
de TI, sin un enfoque específico de BI (por ejemplo,Mundo de la puntaje de PageRank (Brin y Page 1998), una métrica popular para
informáticaa la 1,Información hoyen el #2, ySemana de la informaciónen el análisis de datos y redes, para los autores de BI&A en función de
#3), como se muestra en la Tabla 4. Sin embargo, también hay algunas la red de coautoría dentro de las publicaciones de BI&A. Una
fuentes enfocadas, comoMinería de datos de Microsoft(#5),KM mundo(# puntuación más alta de PageRank captura la propensión de un
8), y Revista CRM(#12), que son más relevantes para los temas autor a colaborar con otros autores prolíficos. los
relacionados con BI&A de minería de datos, gestión del conocimiento y

gestión de relaciones con los clientes. KM y CRM han sido
11Los lectores pueden ponerse en contacto con los autores para la validación de nuestro conjunto de
tradicionalmente temas de interés para los estudiosos de SI. datos y resultados o para un análisis adicional.

Tabla 5. Principales revistas de SI con publicaciones de BI&A
Publicación Académica Publicaciones

Sistemas de Soporte a la Decisión 41
Comunicaciones del AIS 19
Revista de sistemas de información de gestión 12
Ciencias de la gestión 10
Investigación de Sistemas de Información 9
Revista de la Asociación de Sistemas de Información 5
INFORMA Revista de Informática 4
Sistemas de Información Gerencial Trimestral 2
Tabla 6. Principales autores académicos en BI&A
Rango Nombre Afiliación Disciplina Región Total Rango de página
1 Hsin Chun Chen Universidad de Arizona, EE. UU. ES América del norte 19 7.471
2 Shenghong Li Universidad de Zhejiang, China Matemáticas Asia dieciséis 4.276
3 yong shi Universidad de Nebraska, Estados Unidos CS América del norte 15 3.708
4 Kin Keung Lai Universidad de la ciudad de Hong Kong, China ES Asia 14 4.780
5 Bárbara H. Wixom Universidad de Virginia, EE. UU. ES América del norte 8 2.727
5 hugh j. watson Universidad de Georgia, EE. UU. ES América del norte 8 2.485
5 elizabeth chang Universidad de Curtin, Australia ES Australia 8 2.381
5 sheila wright Universidad De Montfort, Reino Unido Marketing Europa 8 2.859
5 Mateo Golfarelli Universidad de Bolonia, Italia CS Europa 8 1.785
5 Farookh Hussain Universidad de Tecnología de Sydney, Australia CS Australia 8 1.264
11 miguel chau Universidad de Hong Kong, China ES Asia 7 1.788
11 josef schiefer Universidad Tecnológica de Viena, Austria CS Europa 7 2.731
11 Craig S. Fleisher Colegio de Costal Georgia, EE. UU. administración América del norte 7 1.042
14 lingling zhang Universidad de Towson, Estados Unidos Comunicación América del norte 6 2.328
14 Olivera Marjanovic Universidad de Sídney, Australia ES Australia 6 2.464
dieciséis Xiaofeng Zhang Universidad de Ciencia y Tecnología de ES Asia 5 2.393
Changsha, China
dieciséis Stefano Rizzi Universidad de Bolonia, Italia CS Europa 5 1.683
18 Jay F. Nunamaker Universidad de Arizona, EE. UU. ES América del norte 4 2.792
18 Wingyan Chung Universidad de Santa Clara, EE. UU. ES América del norte 4 1.761
18 Zahir Urabú Universidad de Brunel, Reino Unido administración Europa 4 2.241
El análisis revela una contribución amplia y uniforme de autores de trigramas relacionados como "gestión de relaciones con el cliente" y "planificación de
América del Norte, Asia, Europa y Australia, lo que refleja la recursos empresariales". Luego, estas palabras clave se clasificaron en función de su
diversidad y el interés internacional en el campo de BI&A. frecuencia y las 30 palabras clave principales se mostraron utilizando la visualización
de la nube de etiquetas. Las palabras clave más importantes se resaltan con fuentes
El último conjunto de análisis investigó el contenido de las publicaciones más grandes, como se muestra en la Figura 3. Por ejemplo, la ventaja competitiva, los
de BI&A entre 2000 y 2011. Mallet (McCallum 2002), una herramienta de macrodatos, el almacenamiento de datos y el apoyo a la toma de decisiones
análisis de texto NLP de código abierto basada en Java, se utilizó para surgieron como los cuatro temas principales en la literatura de BI&A. Otros temas
extraer los principales bigramas (frases de dos palabras) de cada año. Se relacionados con BI&A, como la gestión de las relaciones con los clientes, la minería
combinaron algunos bi-gramas para formar BI- más significativos. de datos, la competencia

Figura 3. Visualización de nube de etiquetas de temas principales en la literatura de BI&A
la inteligencia, la planificación de recursos empresariales y la gestión del Desafíos de la educación

conocimiento también obtuvieron una alta calificación. En general, los
temas extraídos fueron muy relevantes para BI&A, especialmente por sus BI&A se centra en la comprensión, la interpretación, la elaboración de
valores administrativos y de aplicación, aunque la mayoría de los estrategias y la adopción de medidas para promover los intereses de la
términos técnicos detallados, como se describe en las secciones organización. Varias disciplinas académicas han contribuido a BI&A,
anteriores del marco de investigación, no estaban presentes. Esto podría incluidos IS, CS, Estadística, Gestión y Marketing, como se muestra en
nuestro estudio bibliométrico. Los programas de SI, en particular, están
atribuirse a la tendencia de los autores a utilizar terminologías amplias
en una posición única para capacitar a una nueva generación de
en los títulos y resúmenes de los artículos.
académicos y estudiantes debido a su énfasis en la gestión de datos clave
y las tecnologías de la información, el análisis estadístico orientado a los
negocios y las técnicas de ciencias de la gestión, y una amplia exposición
Programa y educación de BI&A a la disciplina empresarial (por ejemplo, Finanzas, Contabilidad,
Desarrollo Marketing y Economía).
Desde su inicio hace aproximadamente 45 años, IS como disciplina académica

BI&A brinda oportunidades no solo para la comunidad de investigación,
se ha centrado principalmente en las necesidades comerciales en una era en la
sino también para la educación y el desarrollo de programas. En julio de
que los principales desafíos involucraban la gestión de datos comerciales y
2012, la Universidad de Columbia y la ciudad de Nueva York anunciaron
transaccionales internos. En la era de los grandes datos, estos problemas
planes para invertir más de $80 millones de dólares en un nuevo Centro
persisten, pero el énfasis en la industria se ha desplazado hacia el análisis de
de ciencia de datos, que se espera que genere miles de puestos de
datos y la toma rápida de decisiones comerciales basadas en grandes
trabajo y millones de dólares en ingresos fiscales de 100 empresas
volúmenes de información. Esta toma de decisiones en las que el tiempo es
emergentes durante los próximos 10 años. (Prensa Asociada 2012). BI&A
crítico tiene lugar en gran medida fuera de la función de SI (es decir, en
es ciencia de datos en los negocios. Las ofertas de trabajo que buscan
unidades de negocio como marketing, finanzas y logística). ¿Pueden los
científicos de datos y especialistas en análisis empresarial abundan en programas de SI satisfacer las necesidades de estos tomadores de decisiones
estos días. Existe una clara escasez de profesionales con el conocimiento comerciales? ¿Podemos ofrecer cursos de minería de datos, minería de textos,
"profundo" necesario para gestionar las tres V de big data: volumen, minería de opiniones, análisis de redes/medios sociales, minería web, y el
velocidad y variedad (Russom 2011). También existe una creciente análisis predictivo que se requieren para las carreras de marketing y finanzas?
demanda de personas con los conocimientos profundos necesarios para También deberíamos preguntarnos sobre los conjuntos de habilidades que
gestionar las tres "perspectivas" de la toma de decisiones empresariales: necesitan los estudiantes. ¿Deberíamos reclutar estudiantes con fuertes
análisis descriptivo, predictivo y prescriptivo. En esta sección, habilidades matemáticas y estadísticas, por ejemplo? Sostenemos que una
describimos la educación en BI&A en las escuelas de negocios, nueva visión para SI, o al menos para algunos programas de SI, debería
presentamos los desafíos que enfrentan los departamentos de SI y abordar estas preguntas.
discutimos las oportunidades de desarrollo del programa BI&A. También
brindamos algunas sugerencias para que la disciplina de SI aborde estos BI&A presenta una oportunidad única para que las unidades de SI en las
desafíos (Chiang et al. 2012). escuelas de negocios se posicionen como una opción viable para la educación.

proporcionar profesionales con la profundidad y el rigor académico necesarios Las opciones de desarrollo de programas para brindar educación en BI&A
para abordar la creciente complejidad de los problemas de BI&A. Los incluyen
programas IS alojados en las escuelas de negocios tienen acceso a una
variedad de cursos de negocios, así como a cursos destinados a mejorar las • crear una Maestría en Ciencias (MS) en BI&A
habilidades de comunicación y presentación. También es común que las • crear una concentración de BI&A en los programas MS IS
escuelas de negocios alojen a los profesores de ciencias administrativas y existentes
estadísticas en la misma unidad de SI. • ofrecer un programa de certificado de posgrado en BI&A
La primera opción requiere el esfuerzo de desarrollar un nuevo
Conocimientos y habilidades de BI&A programa. Algunas universidades se han embarcado en este esfuerzo.
Una lista no exhaustiva incluye la Universidad Estatal de Carolina del
La educación en BI&A debe ser interdisciplinaria y cubrir habilidades Norte, la Universidad de Saint Joseph, la Universidad de Northwestern, la
analíticas y de TI críticas, conocimiento comercial y de dominio, y Universidad de Denver, el Instituto de Tecnología Stevens y la
habilidades de comunicación requeridas en un entorno empresarial Universidad de Fordham. La Universidad de Nueva York lanzará su nuevo
complejo centrado en datos. programa en mayo de 2013. Los nuevos programas de grado de
maestría se pueden diseñar explícitamente para atraer a estudiantes
Las habilidades analíticas y de TI incluyen una variedad de temas en analíticamente fuertes con títulos universitarios en áreas como
evolución. Se extraen de disciplinas como la estadística y la matemáticas, ciencias e informática, y para preparar a estos estudiantes
informática para gestionar y analizar datos estructurados y texto no para carreras, no solo en los grupos de SI o TI en la industria, sino
estructurado. La cobertura de estos temas va desde BI&A 1.0 hasta también en áreas funcionales como investigación y desarrollo,
BI&A 3.0. Los programas académicos destinados a producir marketing, medios, logística y finanzas.
profesionales de BI&A deben considerar estas habilidades analíticas

y de TI como se sugiere en la Tabla 3 de nuestro marco de La segunda opción aprovecha los programas MS IS existentes con
investigación. una concentración en BI&A que complementaría el plan de estudios
ya existente en TI, gestión de datos y cursos de comunicación y
Para proporcionar información útil y apoyo en la toma de negocios con cobertura de análisis adicional. Esta opción ha sido
decisiones, los profesionales de BI&A deben ser capaces de adoptada por varias escuelas, incluidos los departamentos de SI de
comprender los problemas comerciales y enmarcar las soluciones la Universidad Carnegie Mellon y la Universidad de Arizona. Esta
analíticas adecuadas. El conocimiento empresarial necesario para opción proporciona conocimientos y habilidades de BI&A para
los profesionales de BI&A va desde la familiaridad general con las estudiantes que principalmente encontrarán carreras en grupos de
áreas de Contabilidad, Finanzas, Gestión, Marketing, Logística y IS en la industria.
Gestión de operaciones, hasta el conocimiento del dominio
requerido en aplicaciones específicas de BI&A, algunas de las cuales Para los profesionales de TI que trabajan y desean expandirse a BI&A, una
se analizan anteriormente y se resumen en la Tabla 2. . maestría a tiempo parcial o un programa de certificación (la tercera opción)
ofrecen alternativas prácticas y válidas. Estos programas de certificación
Davenport (2006) enfatiza la importancia de una cultura en toda la pueden entregarse en línea o en el sitio y deben proporcionar las habilidades
organización para la toma de decisiones informada basada en hechos que complementarán la experiencia comercial o de TI actual de los
para el análisis empresarial. Para respaldar dicha cultura, los profesionales de TI, y/o brindar habilidades técnicas y analíticas a los
profesionales de BI&A necesitan saber no solo cómo convertir datos e profesionales de negocios en áreas que no son de TI. Los programas en línea
información sin procesar (a través de análisis) en conocimiento que están actualmente disponibles incluyen la Maestría en Análisis Predictivo
significativo y procesable para una organización, sino también cómo de la Universidad de Northwestern y el Certificado de Posgrado en Minería de
interactuar adecuadamente y comunicar este conocimiento a los Big Data de la Universidad de Stanford. Además, los programas de IS pueden
expertos del negocio y del dominio. de la organización. ayudar a diseñar una concentración de BI&A en programas de MBA para
ayudar a capacitar a una nueva generación de gerentes expertos en datos y
análisis.
Desarrollo del programa

Una clave para el éxito de un programa de BI&A es integrar el concepto
de "aprender haciendo" en el plan de estudios de BI&A a través de
BI&A brinda una oportunidad única para que las unidades de SI en las
proyectos prácticos, pasantías y prácticas guiadas por la industria. El
escuelas de negocios desarrollen nuevos cursos, programas de
certificación y programas de grado encargados de preparar a la próxima análisis de big data requiere prueba y error y experimentación. Las
generación de pensadores analíticos. Hay muchas opciones para brindar relaciones y asociaciones sólidas entre los programas académicos y los
educación en BI&A. Debido a la profundidad del conocimiento requerido, socios de la industria son fundamentales para fomentar el aspecto de
los programas de posgrado son la opción obvia. Viable aprendizaje experiencial del plan de estudios de BI&A.

Artículos en este número especial patrones de comunicación dentro de sus círculos. Para construir el
modelo específico de inferencia y validación, se utilizó una combinación
La idea de este número especial comenzó en mayo de 2009, cuando de métodos, incluido el procesamiento de consultas, la inferencia
Detmar Straub, editor en jefe deMIS Trimestral, solicitó sugerencias estadística, el análisis de redes sociales y la elaboración de perfiles de
para ediciones especiales de los miembros del consejo editorial. usuarios. Los autores analizaron más de 20 millones de transacciones de
Presentamos la propuesta del número especial sobre Business llamadas móviles reales y su modelo de inferencia basado en redes
Intelligence Research en agosto de 2009, con la convocatoria sociales propuesto superó sistemáticamente a los enfoques alternativos.
aprobada y distribuida en el 30elConferencia Internacional Anual
sobre Sistemas de Información (ICIS) en diciembre de ese año. Los En "Escaneo ambiental web 2.0 y soporte de decisiones adaptativo para
envíos a este número especial debían relacionarse conMIS trimestral fusiones y adquisiciones de empresas", Raymond Lau, Stephen Liao, KF Wong y
misión con fuerte relevancia e impacto gerencial, organizacional y Dickson Chiu analizaron las fusiones y adquisiciones de empresas (M&A). El
social. Además del enfoque de Design Science (Hevner et al. 2004; escaneo ambiental en línea con Web 2.0 brinda a los altos ejecutivos la
March & Storey 2008), investigación rigurosa y relevante relacionada oportunidad de aprovechar la inteligencia web colectiva para desarrollar
con BI utilizando ciencia de gestión (modelado, optimización), mejores conocimientos sobre los factores socioculturales y político-
economía de la información y metodologías organizacionales y de económicos que enfrentan las fusiones y adquisiciones transfronterizas.
comportamiento (estudios de casos, encuestas) también fue bien Basado en el modelo de las cinco fuerzas de Porter, esta investigación diseñó
recibido. En octubre de 2010 se recibió un total de 62 manuscritos. un modelo de cuadro de mando de diligencia debida que aprovecha la
En los siguientes 20 meses, seis de los manuscritos pasaron por tres inteligencia web colectiva para mejorar la toma de decisiones de fusiones y
o cuatro rondas de revisión y luego fueron aceptados para este adquisiciones. Los autores también desarrollaron un sistema adaptativo de
número. inteligencia comercial (BI) 2.0, que aplicaron a las actividades de fusiones y
adquisiciones transfronterizas de las empresas chinas.
Los seis documentos abordan varios aspectos del marco de
investigación de BI&A presentado en este documento de En su artículo, "Modelado y análisis basados en redes del
introducción (ver Tabla 7). Los seis artículos se basan en BI&A 1.0 y riesgo sistémico en los sistemas bancarios", Daning Hu, J. Leon
tres también se basan en BI&A 2.0. Los primeros tres artículos de Zhao, Zhimin Hua y Michael Wong analizaron el riesgo sistémico
Chau y Xu, Park et al., y Lau et al. concéntrese en BI&A 2.0 con en los sistemas bancarios al tratar a los bancos como una red
aplicaciones de comercio electrónico e inteligencia de mercado vinculada a las relaciones financieras. que conduce a un
mediante análisis de texto, web y red. En los dos artículos enfoque de red para la gestión de riesgos (NARM). Los autores
siguientes, tanto Hu et al. y Abbasi et al. trabajan en la categoría de utilizaron NARM para analizar el riesgo sistémico atribuido a
BI&A 1.0 con un enfoque en seguridad, pero Hu et al. utilizan cada banco individual a través de una simulación basada en
análisis de red, mientras que Abbasi et al. enfatizar el análisis de datos del mundo real de la Corporación Federal de Seguros de
seguridad y el análisis de datos. Finalmente, Sahoo et al. también Depósitos. NARM ofreció un nuevo medio por el cual se podían
trabajo en BI&A 1.0, con aplicación directa a e-commerce e predecir quiebras bancarias contagiosas y se podían determinar
inteligencia de mercado mediante analítica web y de datos. las prioridades de inyección de capital a nivel de banco
individual a raíz de una crisis financiera. Un estudio de
En "Inteligencia empresarial en blogs: comprensión de las interacciones y simulación mostró que, bajo shocks de mercado significativos,
las comunidades de los consumidores", Michael Chau y Jennifer Xu
reconocieron la potencial "mina de oro" del contenido de los blogs para
la inteligencia empresarial y desarrollaron un marco para recopilar Ahmed Abbasi, Conan Albrecht, Anthony Vance y James Hansen en
inteligencia empresarial mediante la recopilación y el análisis su artículo, "MetaFraud: un marco de metaaprendizaje para detectar
automáticos del contenido de los blogs y de los blogueros. redes de el fraude financiero", emplearon un enfoque científico del diseño
interacción. Se aplicó un sistema desarrollado utilizando este marco a para desarrollar MetaFraud, un marco de metaaprendizaje para
dos estudios de casos, que revelaron patrones novedosos en las mejorar la detección del fraude financiero. Se realizó una serie de
interacciones y comunidades de blogueros. experimentos en miles de empresas legítimas y fraudulentas para
demostrar la eficacia del marco sobre los métodos de referencia
Sung-Hyuk Park, Soon-Young Huh, Wonseok Oh y Sang Pil Han en su existentes. Los resultados de la investigación tienen implicaciones
artículo, "Un modelo de inferencia basado en redes sociales para validar para los oficiales de cumplimiento, inversionistas, firmas de
los datos del perfil del cliente", argumentan que los sistemas de auditoría y reguladores.
inteligencia comercial tienen un valor limitado cuando se ocupan de
datos inexactos. y datos poco fiables. Los autores propusieron un marco El artículo de Nachiketa Sahoo, Param Vir Singh y Tridas Mukhopadhyay,
de inferencia impulsado por redes sociales para determinar la precisión y "Un modelo oculto de Markov para el filtrado colaborativo", informa
confiabilidad de los perfiles de clientes autoinformados. El marco utilizó sobre el análisis de hacer recomendaciones personalizadas cuando las
los círculos sociales de los individuos y preferencias del usuario están cambiando. los

Tabla 7. Resumen de artículos de números especiales dentro del marco de investigación de BI&A
Autores y Títulos Evoluciones Aplicaciones Datos Análisis/ Investigación Impactos
Chau y Xu, "Inteligencia comercial BI&A 2.0 en Inteligencia de mercado Generado por el usuario • Análisis de texto y Ventas incrementadas
en blogs: comprensión de las redes sociales sobre los consumidores y contenido extraído red y cliente
interacciones y las comunidades & la red comunidades de blogs • Detección de comunidad satisfacción
de los consumidores" analítica • Visualización de red
Park et al., “Un modelo de BI&A 1.0 y Inteligencia de mercado Usuario autoinformado • Análisis de red Personalizado
inferencia basado en redes 2.0 en redes sociales en la predicción de clientes perfiles y movil • Detección de anomalías recomendación
sociales para validar la red perfiles de tomers registros de llamadas • Análisis predictivo y aumentó
Datos del perfil del cliente” análisis y cliente
estadístico satisfacción
análisis
Lau et al., “Escaneo ambiental BI&A 1.0 y Inteligencia de mercado Información de negocios • Análisis de texto y web Decisión estratégica
Web 2.0 y soporte de 2.0 en sobre el medio ambiente extraído de • Análisis de sentimientos y haciendo en
decisiones adaptable para cuadros de mando exploración internet y afectos fusiones y
fusiones y adquisiciones de y web financiero propietario • Minería de relaciones adquisiciones
empresas” analítica información
Hu et al., “Modelado y análisis BI&A 1.0 en Riesgo sistémico Información bancaria de EE. UU. • Análisis de redes y Monitoreando y
basados en redes del riesgo estadístico análisis y mación extraída de datos atenuante de
sistémico en los sistemas análisis gestión en FDIC y Federal • Descriptivo y banco contagioso
bancarios” sistemas bancarios Alambre de reserva modelado predictivo fracasos
La red • Simulación de eventos discretos
Abbasi et al., “Metafraude: un BI&A 1.0 en Detección de fraude Razones financieras, y • Análisis de datos Fraude financiero
marco de metaaprendizaje procesamiento de datos organizacional y • Clasificación y detección
para detectar y meta- características de contexto a nivel generalización
Fraude" aprendizaje industrial • Aprendizaje adaptativo
Sahoo et al., "Un modelo BI&A 1.0 en Sistema de recomendación Datos de lectura del blog, • Análisis de datos y web Personalizado
oculto de Markov para el estadístico artículos con cambio Conjunto de datos de premios de • Modelo dinámico estadístico recomendaciones
filtrado colaborativo" análisis Preferencias del usuario Netflix y datos de Last.fm • Filtración colaborativa
Los autores propusieron un modelo oculto de Markov basado en el Si bien BI&A 2.0 aún está madurando, nos encontramos al borde de
filtrado colaborativo para predecir las preferencias de los usuarios y BI&A 3.0, con toda la incertidumbre concomitante que traen las
hacer las recomendaciones personalizadas más adecuadas para la tecnologías nuevas y potencialmente revolucionarias.
preferencia prevista. Los autores emplearon conjuntos de datos del
mundo real y simulaciones para mostrar que, cuando las preferencias del EsteMIS TrimestralEl número especial sobre investigación de inteligencia
usuario cambian, existe una ventaja al usar el algoritmo propuesto sobre de negocios pretende servir, en parte, como plataforma y guía de
los existentes. conversación para examinar cómo la disciplina de SI puede satisfacer
mejor las necesidades de los tomadores de decisiones de negocios a la
luz de las tecnologías de BI&A maduras y emergentes, Big Data ubicuo y
la Escasez prevista de gerentes expertos en datos y de profesionales de
Resumen y conclusiones negocios con habilidades analíticas profundas. ¿Cómo pueden los
programas académicos de SI continuar satisfaciendo las necesidades de
A través de las iniciativas de BI&A 1.0, las empresas y organizaciones de todos sus estudiantes tradicionales, al mismo tiempo que llegan al profesional
los sectores comenzaron a obtener información crítica de los datos de TI en activo que necesita nuevas habilidades analíticas? Es posible que
estructurados recopilados a través de varios sistemas empresariales y se necesite una nueva visión para IS para abordar esta y otras preguntas.
analizados por los sistemas comerciales de gestión de bases de datos
relacionales. En los últimos años, la inteligencia web, el análisis web, la web 2.0 Al destacar varias aplicaciones como el comercio electrónico, la
y la capacidad de extraer contenido no estructurado generado por el usuario inteligencia de mercado, el gobierno electrónico, la atención médica y la
han dado paso a una nueva y emocionante era de investigación BI&A 2.0, que seguridad, y al mapear facetas importantes del panorama actual del
ha dado lugar a una inteligencia sin precedentes sobre la opinión del conocimiento de BI&A, esperamos contribuir a futuras fuentes de
consumidor, las necesidades del cliente y el reconocimiento de nuevos conocimiento y aumentar las discusiones actuales sobre el importancia
oportunidades de negocio. Ahora, en esta era de Big Data, incluso de la investigación académica (relevante).

Finalmente, los seis artículos seleccionados para este número especial son en Paul Jen-Hwa Hu, Universidad de Utah
sí mismos un microcosmos del estado actual de la investigación de BI&A. Estos Hemant Jain, Universidad de Wisconsin – Milwaukee Robert
artículos de investigación "lo mejor de lo mejor" muestran cómo la Kauffman, Universidad de Administración de Singapur Vijay
Khatri, Universidad de Indiana
investigación académica de alta calidad puede abordar problemas del mundo
Gondy Leroy, Claremont Graduate University Ting-Peng Liang,
real y aportar soluciones que sean relevantes y duraderas, exactamente el
National Chengchi University Ee-Peng Lim, Singapore
desafío que nuestra disciplina continúa enfrentando.
Management University Vijay Mookerjee, University of Texas at
Dallas Sridhar Narasimhan, Georgia Institute of Technology
Jeffrey Parsons, Memorial University of Newfoundland H.
Expresiones de gratitud Raghav Rao, The Universidad Estatal de Nueva York en Buffalo
Raghu T. Santanam, Universidad Estatal de Arizona
Deseamos agradecer al Editor en Jefe deMIS Trimestral, Detmar Balasubramaniam Ramesh, Universidad Estatal de Georgia
Straub, por su firme apoyo a este número especial desde su Ramesh Sharda, Universidad Estatal de Oklahoma
creación. Compartió la creencia de que la inteligencia empresarial y Matti Rossi, Facultad de Economía de la Universidad Aalto
el análisis es un área de investigación de SI emergente y crítica. Michael Jeng-Ping Shaw, Universidad de Illinois, Urbana-Champaign
Agradecemos el apoyo continuo del editor en jefe entrante, Paulo Olivia Sheng, Universidad de Utah
Goes, y sus comentarios sobre una versión anterior de este Keng Siau, Universidad de Ciencia y Tecnología de Missouri Atish
documento. También agradecemos a Janice DeGross y Jennifer Sinha, Universidad de Wisconsin – Milwaukee Alexander Tuzhilin,
Syverson delMIS Trimestral office por su apoyo editorial profesional Universidad de Nueva York
y Cathy Larson por su apoyo y asistencia en la gestión de los Vijay Vaishnavi, Universidad Estatal de Georgia Doug
Vogel, Universidad de la Ciudad de Hong Kong Chih-
manuscritos y la coordinación del proceso de revisión.
Ping Wei, Universidad Nacional de Taiwán Barbara
Wixom, Universidad de Virginia Carson Woo,
Agradecemos a nuestro excelente grupo de 35 editores asociados
Universidad de Columbia Británica Daniel Zeng,
(enumerados a continuación) y a los revisores (demasiados para nombrarlos)
Universidad de Arizona
que llevaron a cabo el proceso de revisión de manera oportuna mientras aún
J. Leon Zhao, Universidad de la Ciudad de Hong Kong
se reuníanMIS trimestralaltas expectativas de calidad académica.
Agradecemos a los autores de estas 62 presentaciones que optaron por enviar
su investigación a nuestro número especial. Estamos especialmente en deuda
con los editores asociados que manejaron los seis artículos aceptados del Referencias
número especial. Ellos y los revisores a los que invitaron ofrecieron valiosas
críticas y sugerencias a lo largo del proceso de revisión. Este número especial Adomavicius, G. y Tuzhilin, A. 2005. “Hacia el próximo
no hubiera sido posible sin sus esfuerzos. Generación de Sistemas de Recomendación: Relevamiento del
Estado del Arte y Posibles Ampliaciones”,Transacciones IEEE
La investigación informada en este artículo fue respaldada parcialmente sobre conocimiento e ingeniería de datos(17:6), págs. 734-749.
Anderson, C. 2004. “La cola larga”,Revista CABLEADA(12:10)
por las siguientes fuentes: National Science Foundation (NSF
(http://www.wired.com/wired/archive/12.10/tail.html). Associated
CMMI-1057624, CMMI-0926270, CNS-0709338), Defense Threat Reduction
Press. 2012. “Columbia U Plans New Institute for Data
Agency (DTRA HDTRA-09-0058), J. Mack Robinson College de Negocios de
Sciences”, 30 de julio (http://www.cbsnews.com/
la Universidad Estatal de Georgia, la Facultad de Negocios Carl H. Lindner
8301-505245_162-57482466/columbia-u-plans-new-institute-for-data-
de la Universidad de Cincinnati y la Facultad de Administración Eller de la
sciences/, consultado el 3 de agosto de 2012).
Universidad de Arizona. También agradecemos a los siguientes colegas
Barabási, A. 2003.Vinculado: cómo todo está conectado a
por su ayuda o comentarios: Ee-Peng Lim, Ted Stohr, Barbara Wixom,
Todo lo demás y lo que significa para los negocios, la ciencia y la vida
Yukai Lin y Victor Benjamin.
cotidiana, Nueva York: Penacho.
Batagelj, V. y Mrvar, A. 1998. “Pajek: A Program for Large
Análisis de red,"Conexiones(21), págs. 47-57. Bettencourt,
Editores asociados de números especiales LMA, Cintrón-Arias, A., Kaiser, DI, and Castillo-
Chávez, C. 2006. “El poder de una buena idea: modelado cuantitativo
Gediminas Adomavicius, Universidad de Minnesota Sue de la difusión de ideas a partir de modelos epidemiológicos”, Física A(
Brown, Universidad de Arizona 364), págs. 513-536.
Michael Chau, Universidad de Hong Kong Cecil Chua, Bitterer, A. 2011. “Hype Cycle for Business Intelligence”, Gartner,
Universidad de Auckland Wendy Currie, Audencia, Inc., Stamford, CT.
Ecole de Management Andrew Gemino, Universidad Blei, DM 2012. "Modelos temáticos probabilísticos",Comunicaciones
Simon Fraser Paulo Goes, Universidad de Arizona de la ACM(55:4), págs. 77-84.
Bloomberg Business Week. 2011. “El estado actual de los negocios
Alok Gupta, Universidad de Minnesota Análisis: ¿Hacia dónde vamos desde aquí?”, Bloomberg Business-

Week Research Services (http://www.sas.com/resources/asset/ http://biomedicalcomputationreview.org/content/privacy-

busanalyticsstudy_wp_08232011.pdf). andbiomedical-research-building-trust-infrastructure, consultado el 2
Borgatti, SP, Everett, MG y Freeman, LC 2002.UCInet de agosto de 2012).
para Windows: Software para Análisis de Redes Sociales, Harvard, Hanauer, DA, Rhodes, DR y Chinnaiyan, AM 2009.
MA: Tecnologías analíticas. "Exploración de asociaciones clínicas utilizando análisis de
Brantingham, PL 2011. “Criminología computacional”, Keynote enriquecimiento basados en '-Omics'",Más uno(4:4): e5203.
Discurso ante la Conferencia Europea de Informática de Seguridad e Hanauer, DA, Zheng, K., Ramakrishnan, N. y Keller, BJ
Inteligencia, Atenas, Grecia, del 12 al 14 de septiembre. 2011. "Oportunidades y desafíos en la asociación y el descubrimiento de
Brin, S. y Page, L. 1998. “The Anatomy of a Large-Scale Hyper- episodios a partir de registros médicos electrónicos"Sistemas inteligentes
motor de búsqueda web de texto,”Redes informáticas y sistemas IEEE(26:5), págs. 83-87.
RDSI(30), págs. 107-117. Henschen, D. 2011. "¿Por qué todos los Hadoopla?"Semana de la información,
Brumfiel, G. 2911, “Física de alta energía: abajo del petabyte 14 de noviembre, págs. 19-26.
Carretera,"Naturaleza(469), págs. 282-283. Hevner, A., March, ST, Park, J. y Ram. S. 2004. “Diseño
Chaudhuri, S., Dayal, U. y Narasayya, V. 2011. “An Overview Investigación Científica en Sistemas de Información”,MIS Trimestral
de Tecnología de Inteligencia de Negocios,”Comunicaciones de la (28:1), págs. 75-105.
ACM(54:8), págs. 88-98. Hirsch, JE 2005. “An Index to Quantify an Individual’s Scientific
Chen, H. 2006.Informática de Inteligencia y Seguridad para Inter- Resultados de la investigación”,Actas de la Academia Nacional de
Seguridad nacional: intercambio de información y minería de datos, Nueva Ciencias de los Estados Unidos de América(102:46), págs.
York: Springer. 16569-16572.
Chen, H. 2009. "IA, gobierno electrónico y política 2.0",IEEE Hunter, DR, Handcock, MS, Butts, CT, Goodreau, SM y
Sistemas inteligentes(24:5), págs. 64-67. Morris, M. 2008. "ergm: un paquete para ajustar, simular y
Chen, H. 2011a. “La ciencia del diseño, los grandes desafíos y la sociedad
diagnosticar modelos de familia exponencial para redes"Revista
Impactos,”Transacciones de ACM en sistemas de información de
de software estadístico(24:3) (http://www.ncbi.nlm.nih.gov/pmc/
gestión(2:1), págs. 1:1-1:10.
articles/PMC2743438/).
IBM. 2011. “Informe de tendencias tecnológicas de IBM de 2011: Las nubes son
Chen, H. 2011b. “Salud y Bienestar Inteligentes,”IEEE Inteligente
Rolling In...Is Your Business Ready?,” 15 de noviembre (http://
Sistemas(26:5), págs. 78-79.
www.ibm.com/developerworks/techntrendsreport; consultado el
Chen, H. 2012.Internet oscura:Explorando y Minando el Lado Oscuro de
4 de agosto de 2012).
La web, Nueva York: Springer.
Karpf, D. 2009. “Blogsphere Research: A Mixed-Methods Research
Chen, H., Brandt, L., Gregg, V., Traunmuller, R., McIntosh, A.,
Enfoque de los sistemas que cambian rápidamente”,Sistemas inteligentes
Dawes, S., Hovy, E. y Larson, CA (eds.). 2007.Gobierno digital:
IEEE(24:5), págs. 67-70.
investigación, estudios de casos e implementación de gobierno
Liben-Nowell, D. y Kleinberg, J. 20007. “The Link-Prediction
electrónico, Nueva York: Springer.
Problema para las Redes Sociales”,Revista de la Sociedad
Chen, H., Reid, E., Sinai, J., Silke, A. y Ganor, B. (eds.). 2008.
Estadounidense de Ciencia y Tecnología de la Información(58:7),
Informática del terrorismo: gestión del conocimiento y extracción
págs. 1019-1031. Lin, Y., Brown, RA, Yang, HJ, Li, S., Lu, H. y Chen, H.
de datos para la seguridad nacional, Nueva York: Springer.
2011. “Extracción de datos de registros médicos electrónicos a gran
Chiang, RHL, Goes, P. y Stohr, EA 2012. “Business
escala para apoyo clínico”Sistemas inteligentes IEEE(26:5), págs.
Educación y desarrollo de programas de inteligencia y análisis: una
87-90. Lusch, RF, Liu, Y. y Chen, Y. 2010. “The Phase Transition of
oportunidad única para la disciplina de sistemas de información”,
Mercados y organizaciones: la nueva inteligencia y la frontera
Transacciones de ACM en sistemas de información de gestión(3:3),
empresarial”,Sistemas inteligentes IEEE(25:1), págs. 71-75.
próximamente.
Manyika, J., Chui, M., Brown, B., Bughin, J., Dobbs, R., Roxburgh,
Davenport, TH 2006. "Competir en análisis",harvard
C. y Byers, AH 2011. “Big Data: The Next Frontier for Innovation,
Revision del negocio(84:1), pág. 98-107.
Competition, and Productivity”, McKinsey Global Institute (http://
Doan, A., Ramakrishnan, R. y Halevy, AY 2011. “Crowd- www.mckinsey.com/insights/mgi/research/
sistemas de aprovisionamiento en la World-Wide Web”,Comunicaciones de
technology_and_innovation/big_data_the_next_frontier_for_in
la ACM(54:4), págs. 86-96.
novation; consultado el 4 de agosto de 2012).
Fortunato, S. 2010. “Detección comunitaria en gráficas”,Física Manning, CD y Schütze, H. 1999.Fundamentos de Estadística
Informes(486:3-5), págs. 75-174. Procesamiento natural del lenguaje, Cambridge, MA: The MIT
Frank, O. y Strauss, D. 1986. “Gráficos de Markov”,Diario de la Press. March, ST y Storey, VC 2008. “La ciencia del diseño en el
Asociación Estadounidense de Estadística(81:395), págs. 832-842. Disciplina de Sistemas de Información”,MIS Trimestral(32:4), págs.
Freeman, T. 2005.El mundo es plano: una breve historia de la 725-730.
Siglo veintiuno, Nueva York: Farrar, Straus y Giroux. Gelfand, Maybury, MT (ed.). 2004.Nuevas direcciones en cuestión
A. 2011/2012. “Privacidad e Investigación Biomédica: respondiendo, Cambridge, MA: The MIT Press.
Creación de una infraestructura de confianza: una exploración de los McCallum, A. 2002. “Mallet: un aprendizaje automático para el lenguaje
enfoques de privacidad de datos basados en datos y procesos.Revisión de Toolkit”, Universidad de Massachusetts, Amherst (http://
computación biomédica, Winter, págs. 23-28 (disponible en mallet.cs.umass.edu/).

Miller, K. 2012a. “Análisis de Big Data en la Investigación Biomédica,” Snider, M. 2012. "Más empresas se ponen en marcha"EE.UU
Revisión de computación biomédica(disponible en http:// Este Dia, 30 de julio.
biomedicalcomputationreview.org/content/big-data- Stonebraker, M., Abadi, D., DeWitt, DJ, Madden, S., Pavlo, A.,
analyticsbiomedical-research; consultado el 2 de agosto de 2012). y Rasin, A. 2012. “MapReduce y DBMS paralelos: amigos o
Miller, K. 2012b. “Aprovechando las redes sociales para la biomedicina enemigos”,Comunicaciones de la ACM(53:1), págs. 64-71. El
Investigación: cómo los sitios de redes sociales están realizando economista. 2010a. “El diluvio de datos”, Informe especial sobre
rápidamente investigaciones únicas en grandes cohortes”,Revisión de Gestión de la Información, Sección de Tecnología, 25 de febrero
computación biomédica (disponible en http:// (http://www.economist.com/node/15579717).
biomedicalcomputationreview.org/content/leveraging-social-media- El economista. 2010b. “Demasiado”, Informe especial sobre
biomedical-research; consultado el 2 de agosto de 2012). Gestión de la Información, Sección de Tecnología, 25 de febrero
Consejo nacional de investigación. 2008.Modelado conductual y simulación (http://www.economist.com/node/15557421).
lación: de los individuos a las sociedades, Comité de Modelado El economista. 2011. “Más allá de la PC”, Informe especial sobre
Organizacional: De Individuos a Sociedades, GL Zacharias, J. Personal Technology, 8 de octubre (http://www.economist.com/
MacMillan y SB Van Hemel (eds.), Junta de Ciencias del node/21531109).
Comportamiento, Cognitivas y Sensoriales, División de Ciencias Turban, E., Sharda, R., Aronson, JE y King, D. 2008.Negocio
Sociales y del Comportamiento y Educación, Washington, DC: The Inteligencia: un enfoque gerencial, Boston: Pearson Prentice Hall,
Prensa de las Academias Nacionales.
O'Reilly, T. 2005. “¿Qué es la web 2.0? Patrones de diseño y Oficina de Seguridad Nacional de los Estados Unidos. Estrategia Nacional para
Business Models for the Next Generation of Software”, 30 de 2002. Seguridad nacional, Washington, DC: Oficina de la Patria
septiembre, (http://www.oreillynet.com/pub/a/oreilly/tim/news/ Seguridad.
2005/09/30/what-is-web-20.html) . van der Aalst, W. 2012. “Minería de procesos: Resumen y
Pang, B. y Lee, L. 2008. “Opinion Mining and Sentiment Oportunidades,"Transacciones de ACM en sistemas de información de
Análisis,"Fundamentos y Tendencias en la Recuperación de Información gestión(3:2), págs. 7:1-7:17.
(2:1-2), págs. 1-135. Wactlar, H., Pavel, M. y Barkis, W. 2011. “Can Computer
Patterson, DA 2008. “Perspectiva técnica: el centro de datos es ¿La ciencia salva la atención médica?Sistemas inteligentes IEEE(26:5), págs.
el ordenador,"Comunicaciones de la ACM(51:1), pág. 105. 79-83.
Perlroth, N. y Rusli, EM 2012. “Security Start-Ups Catch Watson, HJ y Wixom, BH 2007. “El estado actual de
Fantasía de los inversores”,New York Times, Sección de Tecnología, 5 de Inteligencia de negocios,"Computadora IEEE(40:9), págs. 96-99.
agosto. Vatios, D. 2003.Seis grados: la ciencia de una era conectada,
Robins, G., Pattison, P., Kalish, Y. y Lusher, D. 2007. “An Nueva York: WW Norton.
Introducción a los modelos de gráfico aleatorio exponencial (p*) para Witten, IH, Frank, E. y Hall, M. 2011.Procesamiento de datos:
redes sociales”,Redes sociales(29:2), págs. 173-191. Russom, P. 2011. Herramientas y técnicas prácticas de aprendizaje automático(3rded.), San
"Análisis de Big Data", Mejores prácticas de TDWI Francisco: Morgan Kaufmann.
Informe, Cuarto Trimestre. Wu, X., Kumar, V., Quinlan, JR, Ghosh, J., Yang, Q., Motoda, H.,
Sallam, RL, Richardson, J., Hagerty, J. y Hostmann, B. 2011. McLachlan, GJ, Ng, A., Liu, B., Yu, PS, Zhou, Z.-H.,
“Cuadrante Mágico para Plataformas de Business Intelligence”, Gartner Steinbach, M., Hand, DJ y Steinberg, D. 2007. “Top 10
Group, Stamford, CT. Algorithms in Data Mining, ”Sistemas de Información y
Salton, G. 1989.Procesamiento automático de texto, Lectura, MA: Conocimiento(14:1), págs. 1-37.
AddisonWesley. Yang, H. y Callan, J. 2009. “OntoCop: Construyendo ontologías
Schonfeld, E. 2005. “El gran obsequio”,Negocios 2.0(6:3), págs. para comentarios públicos,”Sistemas inteligentes IEEE(24:5), págs.
80-86. 70-75.

BI-Analytics Bigdata Impact Chen2012.en - Es

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

BI-Analytics Bigdata Impact Chen2012.en - Es

Cargado por

Copyright:

Formatos disponibles

Traducido del inglés al español - www.onlinedoctranslator.

Palabras clave:Business Intelligence y Analytics, Big Data Analytics, Web 2.0

Introducción Se descubrió que el porcentaje de empresas con ingresos superiores a

MIS trimestral vol. 36 N° 4, págs. 1165-1188/diciembre de 2012 1165

1166 MIS trimestral vol. 36 N° 4/Diciembre 2012

Figura 1. Descripción general de BI&A: evolución, aplicaciones e investigación emergente

MIS trimestral vol. 36 N° 4/Diciembre 2012 1167

manera destacada en un artículo de octubre de 2011 enEl economista(2011), la cantidad de teléfonos

móviles y tabletas (alrededor de 480 millones de unidades) superó la cantidad de computadoras

1168 MIS trimestral vol. 36 N° 4/Diciembre 2012

Tabla 1. Evolución de BI&A: características y capacidades clave

Caracteristicas claves Capacidades Ciclo de publicidad de Gartner

• Minería de datos y análisis estadístico • Modelado predictivo y minería de datos

BI&A. Por lo tanto, los departamentos de SI enfrentan oportunidades y

2.0 generado por el cliente en varios foros, grupos de noticias,

MIS trimestral vol. 36 N° 4/Diciembre 2012 1169

E-Gobierno y Política 2.0

opiniones, análisis de redes sociales y análisis de medios sociales para

sobre gobierno electrónico a menudo involucra a investigadores

composición partidista de la blogósfera política estadounidense.

4iPlant Collaborative (http://www.iplantcollaborative.org/about; consultado el 2 de

1170 MIS trimestral vol. 36 N° 4/Diciembre 2012

Desde los trágicos eventos del 11 de septiembre de 2001, la

MIS trimestral vol. 36 N° 4/Diciembre 2012 1171

Las agencias de inteligencia, seguridad y protección

Los programas de investigación COPLINK y Dark Web de la Universidad

1172 MIS trimestral vol. 36 N° 4/Diciembre 2012

Tabla 2. Aplicaciones de BI&A: de Big Data a Big Impact

Características : Características : Características : Características : Características :

agrupamiento • Información del gobierno minería y • Red criminal

• Medicamento adverso análisis y

ción, aumento de la venta transparencia, participación empoderamiento del paciente-

y cliente pacion e igualdad mento

MIS trimestral vol. 36 N° 4/Diciembre 2012 1173

Tabla 3. Marco de investigación de BI&A: tecnologías fundamentales e investigación emergente en análisis

• ETL • documento • computacional • red de citas plataformas

minería temporal • modelos de temas minería • red dinámica aplicaciones

• minería espacial • respuesta a preguntas • sistemas de reputación modelado • detección móvil

corrientes de datos y • minería de opiniones analítica modelado • redes sociales móviles

datos del sensor • sentimiento/afecto • visualización web • Influencia social innovación

• preservación de la privacidad • web estilométrica subastas modelos de difusión redes

1174 MIS trimestral vol. 36 N° 4/Diciembre 2012

MIS trimestral vol. 36 N° 4/Diciembre 2012 1175

Aprovechando el poder de los grandes datos (para la capacitación) y la analista de la red

en varias áreas más enfocadas, incluido el análisis estilométrico web para

1176 MIS trimestral vol. 36 N° 4/Diciembre 2012

Los servicios web y en la nube liderados por la industria ofrecen desafíos

El análisis de redes es un área de investigación incipiente que ha

evolucionado desde el anterior análisis bibliométrico basado en citas

para incluir nuevos modelos computacionales para la comunidad en línea

tiene como objetivo medir la productividad y el impacto del trabajo

MIS trimestral vol. 36 N° 4/Diciembre 2012 1177

Análisis móvil varias aplicaciones omnipresentes móviles, desde la gestión de

La informática móvil ofrece un medio para el crecimiento profesional de

1178 MIS trimestral vol. 36 N° 4/Diciembre 2012

Figura 2. Relación BI&A Pu atado blicati on Tre norte

El conocimiento de las publicaciones más populares, así como de los

MIS trimestral vol. 36 N° 4/Diciembre 2012 1179

Tabla 4. Principales diarios, conferencias y revistas de la industria con publicaciones de BI&A

20 Publicación Académica Publicaciones 20 Publicación de la industria Publicaciones

1 Conf. en Business Intelligence e Ingeniería Financiera 531 1 Mundo de la informática 282

7 Sistemas inteligentes IEEE 47 7 director de información 71

Cuidado de la salud Financiero