Documentos de Académico
Documentos de Profesional
Documentos de Cultura
BI-Analytics Bigdata Impact Chen2012.en - Es
BI-Analytics Bigdata Impact Chen2012.en - Es
com
SESPECIALyoSUEÑO: BUTILIDADyoINTELIGENCIARBÚSQUEDA
BUTILIDADyoINTELIGENCIA YAANALÍTICOS:
FROMBYO GDATA ABYO GyoMPACT
Hsin Chun Chen
Eller College of Management, Universidad de Arizona,
Tucson, AZ 85721 EE. UU. { hchen@eller.arizona.edu }
Roger HL Chiang
Escuela de Negocios Carl H. Lindner, Universidad de Cincinnati,
Cincinnati, OH 45221-0211 EE. UU. { chianghl@ucmail.uc.edu }
Veda C. Piso
Facultad de Negocios J. Mack Robinson, Universidad Estatal de
Georgia, Atlanta, GA 30302-4015 EE. UU. { vstorey@gsu.edu }
Business Intelligence and Analytics (BI&A) se ha convertido en un área de estudio importante tanto para profesionales como para
investigadores, lo que refleja la magnitud y el impacto de los problemas relacionados con los datos que deben resolverse en las
organizaciones empresariales contemporáneas. Esta introducción a la edición especial trimestral de MIS sobre investigación de
inteligencia empresarial proporciona primero un marco que identifica la evolución, las aplicaciones y las áreas de investigación
emergentes de BI&A. BI&A 1.0, BI&A 2.0 y BI&A 3.0 se definen y describen en términos de sus características y capacidades clave. Se
analiza la investigación actual en BI&A y se identifican los desafíos y oportunidades asociados con la investigación y la educación de
BI&A. También informamos un estudio bibliométrico de publicaciones críticas de BI&A, investigadores, y temas de investigación
basados en más de una década de publicaciones académicas y de la industria relacionadas. Finalmente, los seis artículos que
componen este número especial se presentan y caracterizan en términos del marco de investigación propuesto por BI&A.
Entonces, ¿qué se está volviendo ubicuo y barato? Datos. tecnologías de almacenamiento, gestión, análisis y visualización. En este
¿Y qué es complementario a los datos? Análisis. Así que mi artículo, usamos inteligencia y análisis de negocios (BI&A) como un
recomendación es tomar muchos cursos sobre cómo término unificado y tratamos el análisis de big data como un campo
manipular y analizar datos: bases de datos, aprendizaje relacionado que ofrece nuevas direcciones para la investigación de BI&A.
automático, econometría, estadísticas, visualización, etc.1
BI&A 1.0
Las oportunidades asociadas con los datos y el análisis en diferentes
organizaciones han ayudado a generar un interés significativo en Como enfoque centrado en los datos, BI&A tiene sus raíces en el antiguo
BI&A, que a menudo se conoce como las técnicas, tecnologías, campo de la gestión de bases de datos. Se basa en gran medida en
sistemas, prácticas, metodologías y aplicaciones que analizan datos diversas tecnologías de recopilación, extracción y análisis de datos
comerciales críticos para ayudar a una empresa a comprender (Chaudhuri et al. 2011; Turban et al. 2008; Watson y Wixom 2007). Las
mejor su negocio. y comercializar y tomar decisiones comerciales tecnologías y aplicaciones de BI&A actualmente adoptadas en la industria
oportunas. Además de las tecnologías analíticas y de procesamiento pueden considerarse como BI&A 1.0, donde los datos en su mayoría
de datos subyacentes, BI&A incluye prácticas y metodologías están estructurados, recopilados por empresas a través de varios
centradas en el negocio que se pueden aplicar a varias aplicaciones sistemas heredados y, a menudo, almacenados en sistemas comerciales
de alto impacto, como comercio electrónico, inteligencia de de administración de bases de datos relacionales (RDBMS). Las técnicas
mercado, gobierno electrónico, atención médica y seguridad. analíticas comúnmente utilizadas en estos sistemas, popularizadas en la
década de 1990, se basan principalmente en métodos estadísticos
Esta introducción a laMIS TrimestralEl número especial sobre desarrollados en la década de 1970 y técnicas de minería de datos
investigación de inteligencia empresarial proporciona una descripción desarrolladas en la década de 1980.
general de este campo emocionante y de alto impacto, destacando sus
muchos desafíos y oportunidades. La Figura 1 muestra las secciones La gestión y el almacenamiento de datos se consideran la
clave de este documento, incluida la evolución de BI&A, las aplicaciones y base de BI&A 1.0. El diseño de data marts y herramientas
las oportunidades emergentes de investigación analítica. Luego para extracción, transformación y carga (ETL) son esenciales
informamos sobre un estudio bibliométrico de publicaciones críticas de para convertir e integrar datos específicos de la empresa.
BI&A, investigadores y temas de investigación basados en más de una Las consultas de bases de datos, el procesamiento analítico
década de publicaciones académicas y de la industria relacionadas con en línea (OLAP) y las herramientas de generación de
BI&A. Se presentan oportunidades de educación y desarrollo de informes basadas en gráficos intuitivos pero simples se
programas en BI&A, seguidas de un resumen de los seis artículos que utilizan para explorar las características importantes de los
aparecen en este número especial utilizando nuestro marco de datos. La gestión del rendimiento empresarial (BPM)
investigación. La sección final concluye el documento. mediante cuadros de mando y paneles ayuda a analizar y
visualizar una variedad de métricas de rendimiento. Además
de estas funciones bien establecidas de generación de
informes comerciales, se adoptan técnicas de análisis
Evolución de BI&A: características clave estadístico y minería de datos para el análisis de
y Capacidades asociaciones, la segmentación y agrupación de datos, el
análisis de clasificación y regresión, la detección de
El términointeligenciaha sido utilizado por investigadores en inteligencia anomalías y el modelado predictivo en diversas aplicaciones
artificial desde la década de 1950.Inteligencia de negocios se convirtió en comerciales.
un término popular en las comunidades empresarial y de TI solo en la
década de 1990. A fines de la década de 2000,Análisis de negociose Entre las 13 capacidades consideradas esenciales para las plataformas de
introdujo para representar el componente analítico clave en BI BI, según el informe de Gartner de Sallam et al. (2011), los siguientes
(Davenport 2006). Más recientementegrandes datosyanálisis de grandes ocho se consideran BI&A 1.0: informes, tableros,ad hocconsulta, BI
datosse han utilizado para describir conjuntos de datos y técnicas basada en búsqueda, OLAP, visualización interactiva, cuadros de mando,
analíticas en aplicaciones que son tan grandes (desde terabytes hasta modelado predictivo y minería de datos. Algunas áreas de BI&A 1.0
exabytes) y complejas (desde sensores hasta datos de redes sociales) que todavía están en desarrollo activo según el análisis Gartner BI Hype Cycle
requieren datos avanzados y únicos para tecnologías de BI emergentes, que incluyen bancos de trabajo de
minería de datos, DBMS basados en columnas, DBMS en memoria y
herramientas de decisión en tiempo real (Bitterer 2011). Los planes de
1“Hal Varian responde a sus preguntas”, 25 de febrero de 2008 (http:// estudios académicos en Sistemas de Información (SI) y Ciencias de la
www.freakonomics.com/2008/02/25/hal-varian-answers-your-questions/). Computación (CS) a menudo
incluir cursos bien estructurados, como sistemas de gestión de bases de Las herramientas de análisis web como Google Analytics
datos, minería de datos y estadísticas multivariadas. pueden proporcionar un seguimiento de las actividades en línea
del usuario y revelar los patrones de navegación y compra del
usuario. El diseño del sitio web, la optimización de la colocación
BI&A 2.0 de productos, el análisis de transacciones de clientes, el análisis
de la estructura del mercado y las recomendaciones de
Desde principios de la década de 2000, Internet y la Web comenzaron a productos se pueden lograr a través del análisis web. Las
ofrecer oportunidades únicas de recopilación de datos e investigación muchas aplicaciones Web 2.0 desarrolladas después de 2004
analítica y desarrollo. Los sistemas Web 1.0 basados en HTTP, también crearon una gran cantidad de contenido generado por
caracterizados por motores de búsqueda web como Google y Yahoo y el usuario de varios medios sociales en línea, como foros,
negocios de comercio electrónico como Amazon y eBay, permiten a las grupos en línea, blogs web, sitios de redes sociales, sitios
organizaciones presentar sus negocios en línea e interactuar multimedia sociales (para fotos y videos) e incluso sitios
directamente con sus clientes. Además de portar su información de virtuales. mundos y juegos sociales (O'Reilly 2005). Además de
productos tradicional basada en RDBMS y contenidos comerciales en capturar conversaciones de celebridades, referencias a eventos
línea, los registros de interacción y búsqueda de usuarios detallados y cotidianos y sentimientos sociopolíticos expresados en estos
específicos de IP que se recopilan sin problemas a través de cookies y medios, Web 2.
registros del servidor se han convertido en una nueva mina de oro para
comprender las necesidades de los clientes e identificar nuevos negocios. Muchos investigadores de marketing creen que el análisis de redes
oportunidades. La inteligencia web, el análisis web y el contenido sociales presenta una oportunidad única para que las empresas
generado por el usuario recopilado a través de los sistemas sociales y de traten el mercado como una "conversación" entre empresas y
colaboración abierta basados en la Web 2.0 (Doan et al. 2011; O'Reilly clientes en lugar del tradicional "marketing" unidireccional de
2005) han dado paso a una nueva y emocionante era de investigación empresa a cliente (Lusch et al. 2010). . A diferencia de las tecnologías
BI&A 2.0 en la década de 2000, centrada en texto y análisis web para BI&A 1.0 que ya están integradas en los sistemas de TI
contenidos web no estructurados. empresariales comerciales, los futuros sistemas BI&A 2.0 requerirán
la integración de técnicas maduras y escalables en minería de textos
Una inmensa cantidad de información de la empresa, la industria, el (p. ej., extracción de información, identificación de temas, minería
producto y el cliente se puede recopilar de la web y organizar y de opiniones, respuesta a preguntas), minería web, análisis de redes
visualizar a través de diversas técnicas de minería de texto y web. Al sociales y análisis espacio-temporal con sistemas BI&A 1.0 basados
analizar los registros de datos del flujo de clics de los clientes, en DBMS existentes.
Excepto por las capacidades básicas de consulta y búsqueda, La Tabla 1 resume las características clave de BI&A 1.0, 2.0 y 3.0 en
actualmente no se considera ningún análisis de texto avanzado para relación con las capacidades principales y el ciclo de exageración de las
contenido no estructurado en las 13 capacidades de las plataformas de plataformas de BI de Gartner.
BI de Gartner. Varios, sin embargo, se enumeran en Gartner BI Hype
Cycle, incluidos los servicios de información semántica, respuesta a La década de 2010 promete ser emocionante para la investigación y el
preguntas en lenguaje natural y análisis de contenido/texto (Bitterer desarrollo de BI&A de alto impacto tanto para la industria como para la
2011). Han surgido nuevos cursos IS y CS en minería de texto y minería academia. La comunidad empresarial y la industria ya han dado pasos
web para abordar la capacitación técnica necesaria. importantes para adoptar BI&A para sus necesidades. La comunidad de
SI enfrenta desafíos y oportunidades únicos para generar impactos
científicos y sociales que sean relevantes y duraderos (Chen 2011a). Los
BI&A 3.0 programas de investigación y educación de SI deben evaluar
cuidadosamente las direcciones futuras, los currículos y los planes de
Mientras que BI&A 2.0 basado en la web ha atraído investigaciones activas de la academia y la acción, desde BI&A 1.0 a 3.0.
industria, está surgiendo una nueva oportunidad de investigación en BI&A 3.0. Como se informó de
de PC en uso superó los mil millones en 2008, la El mismo artículo proyectó que la cantidad de
Datos para un gran impacto
dispositivos móviles conectados alcanzaría los 10 mil millones en 2020. Los dispositivos móviles como
iPad, iPhone y otros teléfonos inteligentes y sus ecosistemas completos de aplicaciones descargables,
Varias tendencias comerciales y de TI globales han ayudado a dar forma
desde avisos de viaje hasta juegos para múltiples jugadores, están transformando diferentes facetas
a las direcciones de investigación pasadas y presentes de BI&A. Los viajes
internacionales, las conexiones de red de alta velocidad, la cadena de
de la sociedad, desde la educación hasta la atención médica y desde el entretenimiento hasta los
suministro global y la subcontratación han creado una gran oportunidad
gobiernos. Otros dispositivos habilitados para Internet basados en sensores y equipados con RFID,
para el avance de TI, como predijo Thomas Freeman en su libro seminal,
códigos de barras y etiquetas de radio (la "Internet de las cosas") están abriendo nuevos y
El mundo es plano(2005). Además de las conexiones de TI globales
emocionantes flujos de aplicaciones innovadoras. La capacidad de tales dispositivos móviles y
ultrarrápidas, el desarrollo y la implementación de estándares de datos
habilitados para Internet para admitir operaciones y transacciones altamente móviles, con
relacionados con el negocio, formatos de intercambio electrónico de
reconocimiento de ubicación, centradas en la persona y relevantes para el contexto continuará
datos (EDI) y bases de datos comerciales y sistemas de información han
ofreciendo desafíos y oportunidades de investigación únicos a lo largo de la década de 2010. La
facilitado en gran medida la creación y utilización de datos comerciales.
interfaz móvil, la visualización y el diseño de HCI (interacción humano-computadora) también son
El desarrollo de Internet en la década de 1970 y la subsiguiente adopción
áreas de investigación prometedoras. Si bien la llegada de la era Web 3.0 (móvil y basada en sensores)
a gran escala de la World Wide Web desde la década de 1990 han
parece segura, aún se desconocen las técnicas subyacentes de análisis móvil y de ubicación y contexto
aumentado exponencialmente la velocidad de generación y recopilación
para recopilar, procesar, analizar y visualizar datos móviles y de sensores tan fluidos y a gran escala. la
de datos comerciales. Recientemente, la era de Big Data ha llegado
visualización y el diseño HCI (interacción humano-computadora) también son áreas de investigación
silenciosamente a muchas comunidades, desde gobiernos y comercio
prometedoras. Si bien la llegada de la era Web 3.0 (móvil y basada en sensores) parece segura, aún se
electrónico hasta organizaciones de salud. Con una cantidad abrumadora
desconocen las técnicas subyacentes de análisis móvil y de ubicación y contexto para recopilar,
de datos basados en la web, móviles y generados por sensores que
procesar, analizar y visualizar datos móviles y de sensores tan fluidos y a gran escala. la visualización y
llegan a una escala de terabytes e incluso de exabytes (El economista
el diseño HCI (interacción humano-computadora) también son áreas de investigación prometedoras.
2010a, 2010b), se pueden obtener nuevas ciencias, descubrimientos e
Si bien la llegada de la era Web 3.0 (móvil y basada en sensores) parece segura, aún se desconocen las
ideas a partir de contenidos muy detallados, contextualizados y ricos de
técnicas subyacentes de análisis móvil y de ubicación y contexto para recopilar, procesar, analizar y
relevancia para cualquier negocio u organización.
visualizar datos móviles y de sensores tan fluidos y a gran escala.
No se prevén sistemas BI&A 3.0 comerciales integrados para el Además de basarse en datos, BI&A se aplica mucho y puede aprovechar
futuro cercano. La mayor parte de la investigación académica sobre las oportunidades que presentan los abundantes datos y los análisis
BI móvil aún se encuentra en una etapa embrionaria. Aunque no específicos de dominio que se necesitan en muchas áreas de aplicación
está incluido en las capacidades centrales de la plataforma de BI críticas y de alto impacto. Varias de estas aplicaciones BI&A
actual, el BI móvil se ha incluido en el análisis Gartner BI Hype Cycle prometedoras y de alto impacto se presentan a continuación, con una
como una de las nuevas tecnologías que tiene el potencial de alterar discusión de las características de datos y análisis, impactos potenciales y
significativamente el mercado de BI (Bitterer 2011). La ejemplos o estudios ilustrativos seleccionados: (1) comercio electrónico e
incertidumbre asociada con BI&A 3.0 presenta otra dirección de inteligencia de mercado, (2) gobierno electrónico y política 2.0, (3) ciencia
investigación única para la comunidad de SI. y tecnología, (4) salud inteligente y
BI&A 1.0 Contenido estructurado basado en DBMS • Ad hocBI basada en consultas y búsquedas • DBMS basado en columnas
• RDBMS y almacenamiento de datos • Informes, paneles y cuadros de mando • SGBD en memoria
• ETL y OLAP • OLAP • Decisión en tiempo real
• Tableros y cuadros de mando • Visualización interactiva • Bancos de trabajo de minería de datos
bienestar, y (5) seguridad y protección pública. Al analizar líderes para “escuchar” la voz del mercado de un gran número de constituyentes
cuidadosamente las características de la aplicación y los datos, los comerciales que incluyen clientes, empleados, inversionistas y los medios de
investigadores y los profesionales pueden adoptar o desarrollar las comunicación (Doan et al. 2011; O'Rielly 2005). A diferencia de los registros de
técnicas analíticas apropiadas para obtener el impacto deseado. Además transacciones tradicionales recopilados de varios sistemas heredados de la década de
de la implementación del sistema técnico, se necesita un conocimiento 1980, los datos que los sistemas de comercio electrónico recopilan de la web están
significativo del negocio o del dominio, así como habilidades de menos estructurados y, a menudo, contienen información valiosa sobre la opinión y
comunicación efectivas para completar con éxito dichos proyectos de el comportamiento de los clientes.
de comercio electrónico y sistemas de recomendación de productos. Las colaborativo para predecir las calificaciones de películas de los usuarios
principales empresas de Internet como Google, Amazon y Facebook ayudó a generar un interés académico y de la industria significativo en el
continúan liderando el desarrollo de análisis web, computación en la desarrollo de sistemas de recomendación y resultó en otorgar el gran
nube y plataformas de redes sociales. El surgimiento de contenido Web premio de $ 1 millón al equipo Pragmatic Chaos de Bellkor, que
superó el propio algoritmo de Netflix para predecir calificaciones en un 10,06 astrofísica y oceanografía, hasta genómica e investigación ambiental.
por ciento. Sin embargo, la publicidad asociada con la competencia también Para facilitar el intercambio de información y el análisis de datos, la
planteó importantes preocupaciones no deseadas sobre la privacidad de los Fundación Nacional de Ciencias (NSF) ordenó recientemente que cada
clientes. proyecto debe proporcionar un plan de gestión de datos. La
infraestructura cibernética, en particular, se ha vuelto fundamental para
Gran parte de la información sobre investigación y desarrollo de comercio electrónico respaldar tales iniciativas de intercambio de datos.
relacionada con BI&A está apareciendo en artículos académicos de IS y CS, así como
en revistas populares de TI. El BIGDATA de la NSF de 20123la solicitud de programas es un ejemplo obvio
de los esfuerzos concertados de la agencia de financiamiento del gobierno de
EE. UU. para promover el análisis de big data. El programa
El advenimiento de la Web 2.0 ha generado mucho entusiasmo por reinventar tecnológicos básicos para administrar, analizar, visualizar y
los gobiernos. Las elecciones presidenciales, la Cámara de Representantes y el extraer información útil de conjuntos de datos grandes,
Senado de EE. UU. de 2008 dieron los primeros signos de éxito para las diversos, distribuidos y heterogéneos para acelerar el
campañas y la participación política en línea. Con el nombre de "política 2.0", progreso del descubrimiento científico y la innovación;
los políticos utilizan las plataformas web altamente participativas y multimedia conducir a nuevos campos de investigación que de otro modo
para discusiones exitosas sobre políticas, publicidad de campañas, no serían posibles; fomentar el desarrollo de nuevas
movilización de votantes, anuncios de eventos y donaciones en línea. A medida herramientas y algoritmos de análisis de datos; facilitar una
que los procesos gubernamentales y políticos se vuelven más transparentes, infraestructura de datos escalable, accesible y sostenible;
participativos, en línea y ricos en multimedia, existe una gran oportunidad aumentar la comprensión de los procesos e interacciones
para adoptar la investigación de BI&A en aplicaciones de gobierno electrónico humanos y sociales; y promover el crecimiento económico y la
y política 2.0. Se pueden utilizar técnicas seleccionadas de minería de mejora de la salud y la calidad de vida.
políticos y el análisis de foros, prestación de servicios de gobierno electrónico y big data. Por ejemplo, en biología, la NSF financió iPlant Collaborative4
transparencia y rendición de cuentas de los procesos (Chen 2009; Chen et al. está utilizando ciberinfraestructura para apoyar a una comunidad de
2007). Para las aplicaciones de gobierno electrónico, el directorio de investigadores, educadores y estudiantes que trabajan en ciencias de las
información semántica y el desarrollo ontológico (como se ejemplifica a plantas. iPlant tiene como objetivo fomentar una nueva generación de
continuación) también se pueden desarrollar para servir mejor a sus biólogos equipados para aprovechar las técnicas computacionales en
ciudadanos objetivo. rápida expansión y los conjuntos de datos en crecimiento para abordar
los grandes desafíos de la biología vegetal. El conjunto de datos de iPlant
A pesar del importante potencial de transformación de BI&A en es diverso e incluye datos canónicos o de referencia, datos
la investigación del gobierno electrónico, ha habido menos experimentales, datos de modelos y simulaciones, datos de observación
investigación académica que, por ejemplo, la investigación de y otros datos derivados. También ofrece varias herramientas de análisis y
BI&A relacionada con el comercio electrónico. La investigación procesamiento de datos de código abierto.
Muchas áreas de ciencia y tecnología (CyT) están cosechando los 5“Sloan Digital Sky Survey: Mapping the Universe” (http://www.sdss.org/; consultado
beneficios de sensores e instrumentos de alto rendimiento, desde el 2 de agosto de 2012).
Durante sus ocho años de funcionamiento, ha obtenido imágenes Además de EHR, los sitios de redes sociales de salud como Daily Strength
multicolores y profundas que cubren más de una cuarta parte del cielo y ypatientslikeme brindan oportunidades de investigación únicas en el apoyo a
ha creado mapas tridimensionales que contienen más de 930.000 las decisiones de atención médica y el empoderamiento del paciente (Miller
galaxias y más de 120.000 cuásares. Continuando con la recopilación de 2012b), especialmente para enfermedades crónicas como diabetes, Parkinson,
datos a una velocidad de 200 gigabytes por noche, SDSS ha acumulado Alzheimer y cáncer. La minería y el agrupamiento de reglas de asociación, el
más de 140 terabytes de datos. El esfuerzo internacional del Gran monitoreo y análisis de redes sociales de salud, el análisis de textos de salud,
Colisionador de Hadrones (LHC) para la física de alta energía es otro las ontologías de salud, el análisis de redes de pacientes y el análisis de efectos
ejemplo de big data, que produce alrededor de 13 petabytes de datos en
secundarios adversos de medicamentos son áreas prometedoras de
un año (Brumfiel 2011).
investigación en BI&A relacionadas con la salud. Debido a la importancia de las
regulaciones de HIPAA, la extracción de datos de salud para preservar la
privacidad también está ganando atención (Gelfand 2011/2012).
Salud y Bienestar Inteligente
Al igual que las grandes oportunidades de datos que enfrentan las comunidades de comercio electrónico y ciencia y tecnología,
Parcialmente financiado por los Institutos Nacionales de Salud (NIH), la
la comunidad de la salud se enfrenta a un tsunami de contenido relacionado con la salud generado a partir de numerosos
solicitud del programa NSF BIGDATA incluye intereses comunes en big
puntos de contacto de atención al paciente, instrumentos médicos sofisticados y comunidades de salud basadas en la web. Dos
data en NSF y NIH. La toma de decisiones clínicas, la terapia centrada en
fuentes principales de macrodatos de salud son los macrodatos impulsados por la genómica (genotipificación, expresión
el paciente y las bases de conocimientos sobre salud, enfermedad,
génica, datos de secuenciación) y los macrodatos de pagador-proveedor (registros médicos electrónicos, registros de seguros,
genoma y medio ambiente son algunas de las áreas en las que las
recetas de farmacia, comentarios y respuestas de los pacientes) (Miller 2012a). Los datos de secuenciación sin procesar
técnicas de BI&A pueden contribuir (Chen 2011b; Wactlar et al. 2011).
esperados de cada persona son aproximadamente cuatro terabytes. Desde el lado del pagador-proveedor, una matriz de datos
Otra iniciativa reciente e importante de NSF relacionada con el análisis de
puede tener cientos de miles de pacientes con muchos registros y parámetros (datos demográficos, medicamentos, resultados)
big data de salud es NSF Smart Health and Wellbeing (SHB)6programa,
recopilados durante un largo período de tiempo. Extraer conocimiento de los grandes datos de salud plantea importantes
que busca abordar cuestiones técnicas y científicas fundamentales que
desafíos prácticos y de investigación, especialmente considerando los requisitos de HIPAA (Ley de responsabilidad y
portabilidad de seguros de salud) e IRB (Junta de revisión institucional) para construir una infraestructura de salud confiable y
respaldarían una transformación muy necesaria de la atención médica de
que preserve la privacidad y realizar investigaciones éticas relacionadas con la salud (Gelfand 2011/2012). El análisis de big data
reactiva y centrada en el hospital a preventiva, proactiva, basada en
de salud, en general, va a la zaga de las aplicaciones de BI&A de comercio electrónico porque rara vez se ha aprovechado de
evidencia, centrada en la persona y centrada en el bienestar en lugar del
métodos analíticos escalables o plataformas computacionales (Miller 2012a). especialmente considerando los requisitos de control de enfermedades. Los temas de investigación de SHB incluyen
HIPAA (Ley de Portabilidad y Responsabilidad de Seguros Médicos) e IRB (Junta de Revisión Institucional) para construir una tecnología de sensores, redes, información y tecnología de aprendizaje
infraestructura de salud confiable y que preserve la privacidad y realizar investigaciones éticas relacionadas con la salud automático, modelado de procesos cognitivos, modelado de sistemas y
(Gelfand 2011/2012). El análisis de big data de salud, en general, va a la zaga de las aplicaciones de BI&A de comercio procesos, y problemas sociales y económicos (Wactlar et al. 2011), la
electrónico porque rara vez se ha aprovechado de métodos analíticos escalables o plataformas computacionales (Miller 2012a). mayoría de los cuales son relevantes para BI&A de atención médica.
especialmente considerando los requisitos de HIPAA (Ley de Portabilidad y Responsabilidad de Seguros Médicos) e IRB (Junta de
Revisión Institucional) para construir una infraestructura de salud confiable y que preserve la privacidad y realizar
investigaciones éticas relacionadas con la salud (Gelfand 2011/2012). El análisis de big data de salud, en general, va a la zaga de
las aplicaciones de BI&A de comercio electrónico porque rara vez se ha aprovechado de métodos analíticos escalables o
Seguridad y Protección Pública
plataformas computacionales (Miller 2012a).
seguridad, lucha contra el terrorismo nacional, protección de la El sistema de extracción de datos sobre delitos, desarrollado inicialmente
infraestructura crítica (incluido el ciberespacio), defensa contra el con fondos de la NSF y el Departamento de Justicia, lo utilizan
terrorismo catastrófico y preparación y respuesta ante emergencias. actualmente más de 4500 agencias policiales en los Estados Unidos y en
Frente a las misiones críticas de seguridad internacional y diversos 25 países de la OTAN, y fue adquirido por IBM en 2011. La investigación
desafíos técnicos y de datos, se reconoció la necesidad de de la Dark Web, financiado por NSF y el Departamento de Defensa (DOD),
desarrollar la ciencia de la “informática de seguridad”, siendo su ha generado una de las bases de datos de investigación de terrorismo
principal objetivo la académico más grandes conocidas (alrededor de 20 terabytes de sitios
web terroristas y contenido de redes sociales) y ha generado técnicas
desarrollo de tecnologías de la información, sistemas, avanzadas de análisis de redes sociales multilingües.
algoritmos y bases de datos avanzados para aplicaciones
relacionadas con la seguridad, a través de un enfoque Reconociendo los desafíos presentados por el volumen y la complejidad
integrado tecnológico, organizacional y basado en de los grandes datos relacionados con la defensa, la Agencia de
políticas (Chen 2006, p. 7). Proyectos de Investigación Avanzada de Defensa de los EE. UU. (DARPA)
dentro del DOD inició el programa XDATA en 2012 para ayudar a
BI&A tiene mucho que aportar al campo emergente de la informática de desarrollar técnicas computacionales y herramientas de software para
seguridad. procesar y analizar la gran cantidad de información orientada a la misión
para actividades de defensa. XDATA tiene como objetivo abordar la
Los problemas de seguridad son una preocupación importante para la necesidad de algoritmos escalables para el procesamiento y visualización
mayoría de las organizaciones. Según la firma de investigación de datos imperfectos e incompletos. El programa involucra a las
International Data Corporation, se espera que las grandes empresas comunidades de matemáticas aplicadas, informática y visualización de
gasten 32.800 millones de dólares en seguridad informática en 2012, y datos para desarrollar análisis de big data y soluciones de usabilidad
las pequeñas y medianas empresas gastarán más en seguridad que en para los combatientes.7Los investigadores de BI&A podrían contribuir
otras compras de TI durante los próximos tres años (Perlroth y Rusli significativamente en esta área.
2012). En el ámbito académico, también están floreciendo varias
disciplinas relacionadas con la seguridad, como la seguridad informática, La Tabla 2 resume estas prometedoras aplicaciones de BI&A,
la criminología computacional y la informática del terrorismo características de datos, técnicas de análisis e impactos potenciales.
(Brantingham 2011; Chen et al. 2008).
Aplicaciones • Recomendador • Omnipresente • Innovación en ciencia y tecnología • Genómica humana • Análisis delictivo
sistemas servicios gubernamentales • Prueba de hipótesis y vegetal • Computacional
• Redes sociales • Igualdad de acceso y • Conocimiento • Cuidado de la salud criminología
Monitoreando y servicios públicos descubrimiento apoyo a las decisiones • Terrorismo
análisis • Compromiso ciudadano • Comunidad de pacientes informatica
• Colaboración colectiva y participación análisis • Fuente abierta
sistemas • Campaña política inteligencia
• Juegos sociales y y votación electrónica • La seguridad cibernética
virtuales
Datos • Búsqueda y registros de • Información del gobierno • Instrumentos de ciencia y tecnología • Genómica y • Antecedentes penales
usuarios ción y servicios y sistema- datos de secuencia • Mapas delictivos
• Transac- • Reglas y datos generados • Salud electrónica • Redes criminales
registros de ción regulaciones • Sensores y registros (HCE) • Noticias y web
• Cliente- • Retroalimentación y comentarios de contenido de la red • Redes sociales de contenido
contenido generado los ciudadanos salud y pacientes • Incidente de terrorismo
bases de datos
• Virus, ciber
ataques, y
redes de bots
Analítica • Regla de asociación • Integración de información • Basado en ciencia y tecnología • Genómica y • Delincuente
minería ción específico del dominio análisis de secuencia regla de asociación
• Segmentación de bases de datos • Análisis de matemático y y visualización minería y
tación y contenido y texto modelos analíticos • Asociación EHR agrupamiento
procesamiento de datos
Impactos marketing de cola larga, Transformando el gobierno Avances en ciencia y tecnología, Cuidado de la salud mejorado público mejorado
dirigido y persona- mentos, empoderamiento impacto científico calidad, mejorado seguridad y proteccion
recomendación alizada ciudadanos, mejorando cuidado a largo plazo,
emergentes • máquina estadística • PNL estadística • servicios en la nube • minería de enlaces • web móvil
Investigar aprendizaje • información • computación en la nube • comunidad servicios
• secuencial y extracción • búsqueda social y detección • omnipresente en dispositivos móviles
resaltar las características clave de cada área; sin embargo, algunas de Desde finales de la década de 1980, los investigadores de las
estas áreas pueden aprovechar tecnologías subyacentes similares. En comunidades de inteligencia artificial, algoritmos y bases de datos han
cada área de análisis, presentamos las tecnologías fundamentales que desarrollado varios algoritmos de minería de datos. En la Conferencia
están maduras y bien desarrolladas y sugerimos áreas de investigación internacional sobre minería de datos (ICDM) de IEEE de 2006, se
emergentes seleccionadas (consulte la Tabla 3). identificaron los 10 algoritmos de minería de datos más influyentes en
función de las nominaciones de expertos, recuentos de citas y una
encuesta comunitaria. En orden de clasificación, son C4.5, k-medias, SVM
Análisis de datos (grandes) (máquina de vectores de soporte), Apriori, EM (maximización de
expectativas), PageRank, AdaBoost, kNN (k-vecinos más cercanos), Naïve
El análisis de datos se refiere a las tecnologías de BI&A que se basan Bayes y CART (Wu et al. . 2007). Estos algoritmos cubren clasificación,
principalmente en la extracción de datos y el análisis estadístico. agrupamiento, regresión, análisis de asociación y análisis de red. La
Como se mencionó anteriormente, la mayoría de estas técnicas se mayoría de estos populares algoritmos de minería de datos se han
basan en tecnologías comerciales maduras de DBMS relacional, incorporado en sistemas de minería de datos comerciales y de código
almacenamiento de datos, ETL, OLAP y BPM (Chaudhuri et al. 2011). abierto (Witten et al. 2011). Otro
avances como las redes neuronales para la clasificación/predicción y ha sido aclamada como una nueva plataforma revolucionaria para el
la agrupación y los algoritmos genéticos para la optimización y el acceso masivo a datos paralelos a gran escala (Patterson 2008). Inspirado
aprendizaje automático han contribuido al éxito de la minería de en parte por MapReduce, Hadoop proporciona un marco de software
datos en diferentes aplicaciones. basado en Java para el procesamiento distribuido de análisis y
transformación de datos intensivos. Los tres principales proveedores de
Otros dos enfoques de análisis de datos que se enseñan comúnmente en las bases de datos comerciales (Oracle, IBM y Microsoft) han adoptado
escuelas de negocios también son fundamentales para BI&A. Basado en Hadoop, algunos dentro de una infraestructura de nube. El Apache
teorías y modelos estadísticos, el análisis estadístico multivariado cubre Hadoop de código abierto también ganó una tracción significativa para el
técnicas analíticas como la regresión, el análisis factorial, el agrupamiento y el análisis empresarial, incluido Chukwa para la recopilación de datos,
análisis discriminante que se han utilizado con éxito en diversas aplicaciones HBase para el almacenamiento de datos distribuidos, Hive para el
comerciales. Desarrolladas en la comunidad científica de gestión, las técnicas resumen de datos yad hocconsultas y Mahout para minería de datos
de optimización y la búsqueda heurística también son adecuadas para (Henschen 2011). En su artículo de perspectiva, Stonebraker et al. (2010)
problemas seleccionados de BI&A, como la selección de características de la compararon MapReduce con el DBMS paralelo. El DBMS paralelo
base de datos y el rastreo/rastreo web. La mayoría de estas técnicas se pueden comercial mostró claras ventajas en el procesamiento de consultas
encontrar en los planes de estudios de las escuelas de negocios. eficiente y en el lenguaje y la interfaz de consultas de alto nivel, mientras
que MapReduce se destacó en ETL y análisis para conjuntos de datos
semiestructurados de "solo lectura". Los nuevos sistemas basados en
Debido al éxito logrado colectivamente por la comunidad de minería de datos y análisis estadístico, el análisis de datos continúa Hadoop y MapReduce se han convertido en otra opción viable para el
siendo un área activa de investigación. El aprendizaje automático estadístico, a menudo basado en modelos matemáticos bien análisis de big data además de los sistemas comerciales desarrollados
fundamentados y algoritmos potentes, técnicas como las redes bayesianas, los modelos ocultos de Markov, la máquina de para RDBMS, DBMS basado en columnas, DBMS en memoria y DBMS
vectores de soporte, el aprendizaje por refuerzo y los modelos de conjuntos, se han aplicado a aplicaciones de análisis de datos, paralelo (Chaudhuri et al. 2011).
texto y web. Otras nuevas técnicas de análisis de datos exploran y aprovechan características de datos únicas, desde minería
secuencial/temporal y minería espacial, hasta minería de datos para flujos de datos de alta velocidad y datos de sensores. El
aumento de la preocupación por la privacidad en varias aplicaciones de comercio electrónico, administración electrónica y
atención médica ha provocado que la extracción de datos para preservar la privacidad se convierta en un área emergente de Análisis de texto
investigación. Muchos de estos métodos se basan en datos y se basan en diversas técnicas de anonimización, mientras que
otros se basan en procesos y definen cómo se puede acceder y utilizar los datos (Gelfand 2011/2012). Durante la última década, Una parte significativa del contenido no estructurado recopilado por una
la minería de procesos también ha surgido como un nuevo campo de investigación que se centra en el análisis de procesos organización está en formato de texto, desde comunicaciones por correo
utilizando datos de eventos. La minería de procesos se ha vuelto posible gracias a la disponibilidad de registros de eventos en electrónico y documentos corporativos hasta páginas web y contenido de
varias industrias (p. ej., atención médica, cadenas de suministro) y nuevas técnicas de verificación de conformidad y redes sociales. El análisis de texto tiene sus raíces académicas en la
descubrimiento de procesos (van der Aalst 2012). Además, los datos de red y el contenido web han ayudado a generar recuperación de información y la lingüística computacional. En la recuperación
investigaciones interesantes en análisis de redes y análisis web, que se presentan a continuación. La minería de procesos de información, la representación de documentos y el procesamiento de
también ha surgido como un nuevo campo de investigación que se centra en el análisis de procesos utilizando datos de consultas son los cimientos para desarrollar el modelo de espacio vectorial, el
eventos. La minería de procesos se ha vuelto posible gracias a la disponibilidad de registros de eventos en varias industrias (p. modelo de recuperación booleano y el modelo de recuperación probabilística,
ej., atención médica, cadenas de suministro) y nuevas técnicas de verificación de conformidad y descubrimiento de procesos que a su vez se convirtieron en la base de las bibliotecas digitales modernas,
(van der Aalst 2012). Además, los datos de red y el contenido web han ayudado a generar investigaciones interesantes en los motores de búsqueda y los sistemas de búsqueda empresarial ( Saltón
análisis de redes y análisis web, que se presentan a continuación. La minería de procesos también ha surgido como un nuevo 1989). En lingüística computacional, técnicas de procesamiento estadístico del
campo de investigación que se centra en el análisis de procesos utilizando datos de eventos. La minería de procesos se ha lenguaje natural (PNL) para la adquisición léxica, desambiguación del sentido
vuelto posible gracias a la disponibilidad de registros de eventos en varias industrias (p. ej., atención médica, cadenas de de las palabras, etiquetado de partes del discurso (POST), y las gramáticas
suministro) y nuevas técnicas de verificación de conformidad y descubrimiento de procesos (van der Aalst 2012). Además, los libres de contexto probabilísticas también se han vuelto importantes para
datos de red y el contenido web han ayudado a generar investigaciones interesantes en análisis de redes y análisis web, que se representar texto (Manning y Schütze 1999). Además de las representaciones
presentan a continuación. de documentos y consultas, los modelos de usuario y los comentarios de
relevancia también son importantes para mejorar el rendimiento de la
búsqueda.
Además de la investigación académica activa sobre análisis de datos, la
investigación y el desarrollo de la industria también han generado mucho Desde principios de la década de 1990, los motores de búsqueda se han
entusiasmo, especialmente con respecto al análisis de big data para convertido en sistemas comerciales maduros, que consisten en un rastreo
contenido semiestructurado. A diferencia de los datos estructurados que rápido y distribuido; indexación invertida eficiente; ranking de páginas basado
se pueden manejar repetidamente a través de un RDBMS, los datos en enlaces internos; y análisis de registros de búsqueda. Muchas de estas
semiestructurados pueden requerirad hocy extracción, análisis, técnicas fundamentales de indexación y procesamiento de texto se han
procesamiento, indexación y análisis únicos en un entorno MapReduce o implementado en sistemas de gestión de documentos y búsqueda empresarial
Hadoop escalable y distribuido. Mapa reducido basados en texto en BI&A 1.0.
web de Google admiten búsqueda AJAX, API de mapas, API de GData (para Calendar, Gmail, etc.), Google
Además de las direcciones de investigación anteriores, el análisis de texto Translate y Google App Engine para recursos informáticos en la nube. Los servicios web y las API continúan
también ofrece importantes oportunidades y desafíos de investigación brindando un flujo emocionante de nuevas fuentes de datos para la investigación de BI&A 2.0.
además de las tecnologías móviles y multimedia básicas. Al igual que el el desarrollo de plataformas y servicios de computación en la nube, que
análisis de big data, el análisis de texto que usa MapReduce, Hadoop y incluyen aplicaciones, software de sistema y hardware entregados como
los servicios en la nube continuará fomentando direcciones de servicios a través de Internet. Basado en la arquitectura orientada a servicios
investigación activas tanto en la academia como en la industria. (SOA), la virtualización de servidores y la computación de utilidades, la
computación en la nube se puede ofrecer como software como un
servicio (SaaS), infraestructura como servicio (IaaS) o plataforma como servicio representan relaciones sociales, colaboración, intercambios de correo
(PaaS). Actualmente, solo unos pocos proveedores líderes de TI están electrónico o adopciones de productos. Se puede realizar minería de
posicionados para admitir aplicaciones de BI&A de alta gama y alto enlaces utilizando solo la información de topología (Liben-Nowell y
rendimiento que utilizan computación en la nube. Por ejemplo, Amazon Elastic Kleinberg 2007). Las técnicas como los vecinos comunes, el coeficiente de
Compute Cloud (EC2) permite a los usuarios alquilar computadoras virtuales Jaccard, la medida de Adamic Adar y la medida de Katz son populares
en las que ejecutar sus propias aplicaciones informáticas. Su servicio de para predecir enlaces faltantes o futuros. La precisión de la minería de
almacenamiento simple (S3) proporciona un servicio web de almacenamiento enlaces se puede mejorar aún más cuando se consideran los atributos de
en línea. Google App Engine proporciona una plataforma para desarrollar y nodo y enlace. La detección comunitaria también es un área de
alojar aplicaciones web basadas en Java o Python. Google Bigtable se utiliza investigación activa de relevancia para BI&A (Fortunato 2010). Al
para el almacenamiento de datos de back-end. La plataforma Windows Azure representar las redes como gráficos, se pueden aplicar algoritmos de
de Microsoft proporciona servicios en la nube como SQL Azure y SharePoint, y partición de gráficos para encontrar un corte mínimo para obtener
permite que las aplicaciones de .Net Framework se ejecuten en la plataforma. subgráficos densos que representen comunidades de usuarios.
enfermedades y redes criminales o terroristas (Consejo Nacional de Investigación 2008). Dichos modelos simulan las acciones e
interacciones de agentes autónomos (ya sea de entidades individuales o colectivas como organizaciones o grupos) con la
En el ámbito académico, la investigación actual relacionada con el análisis web
intención de evaluar sus efectos en el sistema como un todo. Los modelos de difusión de información e influencia social
abarca la búsqueda y minería social, los sistemas de reputación, el análisis de
también son técnicas viables para estudiar redes en evolución. Algunas investigaciones son particularmente relevantes para la
redes sociales y la visualización web. Además, las subastas basadas en la web,
dinámica de opinión e información de una sociedad. Dicha dinámica tiene muchas similitudes cualitativas con las infecciones
la monetización de Internet, el marketing social y la privacidad/seguridad web
por enfermedades (Bettencourt et al. 2006). Otra técnica de análisis de redes que ha llamado la atención en los últimos años es
son algunas de las direcciones de investigación prometedoras relacionadas
el uso de modelos de gráficos aleatorios exponenciales (Frank y Strauss 1986; Robins et al. 2007). Los ERGM son una familia de
con el análisis web. Muchas de estas áreas de investigación emergentes
modelos estadísticos para analizar datos sobre redes sociales y otras redes. Para respaldar la inferencia estadística sobre los
pueden depender de los avances en el análisis de redes sociales, el análisis de
procesos que influyen en la formación de la estructura de la red, los ERGM consideran el conjunto de todas las posibles redes
texto e incluso la investigación de modelos económicos.
alternativas ponderadas en su similitud con una red observada. Además de estudiar las redes tradicionales de amistad o
enfermedad, los ERGM son prometedores para comprender las propiedades de red subyacentes que causan la formación y
evolución de redes de clientes, ciudadanos o pacientes para BI&A. Los ERGM son una familia de modelos estadísticos para
Análisis de red analizar datos sobre redes sociales y otras redes. Para respaldar la inferencia estadística sobre los procesos que influyen en la
formación de la estructura de la red, los ERGM consideran el conjunto de todas las posibles redes alternativas ponderadas en su
y el análisis de redes sociales. Con base en el análisis bibliométrico, las otras redes. Para respaldar la inferencia estadística sobre los procesos que influyen en la formación de la estructura de la red,
redes de citas y las redes de coautoría se han adoptado durante mucho los ERGM consideran el conjunto de todas las posibles redes alternativas ponderadas en su similitud con una red observada.
tiempo para examinar el impacto científico y la difusión del Además de estudiar las redes tradicionales de amistad o enfermedad, los ERGM son prometedores para comprender las
conocimiento. El índice h es un buen ejemplo de una métrica de citas que propiedades de red subyacentes que causan la formación y evolución de redes de clientes, ciudadanos o pacientes para BI&A.
9AppBrain, Estadísticas de Android (http://www.appbrain.com/stats/number- nuestra búsqueda y análisis en publicaciones de relevancia directa para
ofandroid-apps; consultado el 8 de agosto de 2012). nuestro interés. Sin embargo, este procedimiento de búsqueda puede
Todos
Palabra clave Años 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011
Inteligencia de negocios 3,146 113 104 146 159 229 330 346 394 352 201 334 338
Análisis de negocio 213 0 5 43 4 5 2 9 6 19 dieciséis 17 126
Grandes datos 243 0 1 0 0 7 4 3 26 11 41 44 95
Total 3,602 113 110 149 163 241 336 358 426 382 358 356 560
también omita los artículos que usan otros términos relevantes de BI&A En general, la mayor fuente de publicaciones académicas de inteligencia
(p. ej., almacenamiento de datos, minería de datos) pero no las tres comercial fueron las conferencias académicas. La Conferencia sobre
palabras clave específicas en el título o resumen. Este tipo de limitación Inteligencia de Negocios e Ingeniería Financiera (#1) y la Conferencia
es común en los estudios bibliométricos. Los datos recopilados se sobre Comercio Electrónico e Inteligencia de Negocios (#3) son
exportaron como registros XML y se analizaron en una base de datos conferencias académicas especializadas dedicadas a la inteligencia de
relacional (SQL Server) para su análisis. El número de registros negocios. Una conferencia IS ocupa el puesto número 2 en la lista de las
recuperados inicialmente ascendió a 6.187 artículos. Después de eliminar 20 principales: la Conferencia Internacional de Ciencias de Sistemas de
los duplicados, el número de registros únicos ascendió a 3.602. Hawái (HICSS), con 370 publicaciones.10IEEE lleva a cabo la mayoría de las
conferencias en la lista a través de varios puntos de venta; varios están
La figura 2 muestra las estadísticas y las tendencias de crecimiento de las relacionados con áreas técnicas emergentes, como la minería de datos, la
publicaciones relacionadas con las tres palabras clave de búsqueda. En general, la computación en Internet y la computación en la nube. La Conferencia
inteligencia comercial tuvo la mayor cobertura y la historia más larga. Esto es Internacional IEEE sobre Minería de Datos (ICDM) es muy apreciada y
consistente con la evolución de BI&A, ya que el término BI apareció por primera vez a ocupa el quinto lugar. ACM tiene dos publicaciones en la lista de las 20
principios de la década de 1990. En nuestra colección, el análisis de negocios y los principales:Comunicaciones de la ACMy la Conferencia Internacional ACM
grandes datos comenzaron a aparecer en la literatura en 2001, pero solo ganaron SIGKDD sobre Descubrimiento de Conocimiento y Minería de Datos.
mucha atención después de aproximadamente 2007. Las publicaciones relacionadas Ambos son bien conocidos en CS. Nuevamente, la comunidad de minería
con la inteligencia de negocios sumaron 3,146, mientras que las publicaciones de de datos ha contribuido significativamente a BI&A. Otras conferencias
análisis de negocios y grandes datos cada una contó con solo 213 y 243, técnicas en CS también están contribuyendo a BI&A en áreas como
respectivamente. . Si bien la tendencia general de publicación de inteligencia de inteligencia computacional, inteligencia web, computación evolutiva y
negocios se mantiene estable, las publicaciones de análisis de negocios y big data procesamiento de lenguaje natural, todos los cuales son críticos para
han experimentado un patrón de crecimiento más rápido en los últimos años. desarrollar futuras técnicas de análisis de datos, texto y web discutidas
en nuestro marco de investigación.
5 Conferencia Internacional IEEE. sobre minería de datos 150 5 Minería de datos de Microsoft 108
Conferencia Internacional IEEE. sobre tecnología electrónica, comercio electrónico y servicio
6 129 6 InfoMundo 86
electrónico
trabajar. Las revistas son algo más limitadas en su volumen de La Tabla 6 resume los 20 principales autores académicos con
publicación, aunque llama la atención que la revista IS Sistemas de publicaciones de BI&A. La mayoría de estos autores son de IS y CS,
Soporte a la Decisiónhizo la lista de los 20 principales (en el # 9). Algunas con varios otros de los campos relacionados de marketing,
revistas de escuelas de negocios también contienen investigaciones administración, comunicación y matemáticas. Muchos de estos
relacionadas con BI&A en áreas como ética empresarial, marketing y autores son colaboradores cercanos, por ejemplo, Hsinchun Chen
gestión de tecnología. Otras publicaciones importantes de SI también (#1), Jay F. Nunamaker (#18), Michael Chau (#11) y Wingyan Chung
publicaron artículos relacionados con la inteligencia empresarial, pero a (#18) a través de la conexión de la Universidad de Arizona,11y
un ritmo menor que las fuentes antes mencionadas (ver Tabla 5). Las Barabara H. Wixom (#5) y Hugh J. Watson (#5) a través de la
fuentes relevantes de la industria tienden a ser publicaciones generales conexión de la Universidad de Georgia. También informamos el
de TI, sin un enfoque específico de BI (por ejemplo,Mundo de la puntaje de PageRank (Brin y Page 1998), una métrica popular para
informáticaa la 1,Información hoyen el #2, ySemana de la informaciónen el análisis de datos y redes, para los autores de BI&A en función de
#3), como se muestra en la Tabla 4. Sin embargo, también hay algunas la red de coautoría dentro de las publicaciones de BI&A. Una
fuentes enfocadas, comoMinería de datos de Microsoft(#5),KM mundo(# puntuación más alta de PageRank captura la propensión de un
8), y Revista CRM(#12), que son más relevantes para los temas autor a colaborar con otros autores prolíficos. los
1 Hsin Chun Chen Universidad de Arizona, EE. UU. ES América del norte 19 7.471
2 Shenghong Li Universidad de Zhejiang, China Matemáticas Asia dieciséis 4.276
3 yong shi Universidad de Nebraska, Estados Unidos CS América del norte 15 3.708
4 Kin Keung Lai Universidad de la ciudad de Hong Kong, China ES Asia 14 4.780
5 Bárbara H. Wixom Universidad de Virginia, EE. UU. ES América del norte 8 2.727
5 hugh j. watson Universidad de Georgia, EE. UU. ES América del norte 8 2.485
5 elizabeth chang Universidad de Curtin, Australia ES Australia 8 2.381
5 sheila wright Universidad De Montfort, Reino Unido Marketing Europa 8 2.859
5 Mateo Golfarelli Universidad de Bolonia, Italia CS Europa 8 1.785
5 Farookh Hussain Universidad de Tecnología de Sydney, Australia CS Australia 8 1.264
11 miguel chau Universidad de Hong Kong, China ES Asia 7 1.788
11 josef schiefer Universidad Tecnológica de Viena, Austria CS Europa 7 2.731
11 Craig S. Fleisher Colegio de Costal Georgia, EE. UU. administración América del norte 7 1.042
14 lingling zhang Universidad de Towson, Estados Unidos Comunicación América del norte 6 2.328
14 Olivera Marjanovic Universidad de Sídney, Australia ES Australia 6 2.464
dieciséis Xiaofeng Zhang Universidad de Ciencia y Tecnología de ES Asia 5 2.393
Changsha, China
dieciséis Stefano Rizzi Universidad de Bolonia, Italia CS Europa 5 1.683
18 Jay F. Nunamaker Universidad de Arizona, EE. UU. ES América del norte 4 2.792
18 Wingyan Chung Universidad de Santa Clara, EE. UU. ES América del norte 4 1.761
18 Zahir Urabú Universidad de Brunel, Reino Unido administración Europa 4 2.241
El análisis revela una contribución amplia y uniforme de autores de trigramas relacionados como "gestión de relaciones con el cliente" y "planificación de
América del Norte, Asia, Europa y Australia, lo que refleja la recursos empresariales". Luego, estas palabras clave se clasificaron en función de su
diversidad y el interés internacional en el campo de BI&A. frecuencia y las 30 palabras clave principales se mostraron utilizando la visualización
de la nube de etiquetas. Las palabras clave más importantes se resaltan con fuentes
El último conjunto de análisis investigó el contenido de las publicaciones más grandes, como se muestra en la Figura 3. Por ejemplo, la ventaja competitiva, los
de BI&A entre 2000 y 2011. Mallet (McCallum 2002), una herramienta de macrodatos, el almacenamiento de datos y el apoyo a la toma de decisiones
análisis de texto NLP de código abierto basada en Java, se utilizó para surgieron como los cuatro temas principales en la literatura de BI&A. Otros temas
extraer los principales bigramas (frases de dos palabras) de cada año. Se relacionados con BI&A, como la gestión de las relaciones con los clientes, la minería
combinaron algunos bi-gramas para formar BI- más significativos. de datos, la competencia
términos técnicos detallados, como se describe en las secciones organización. Varias disciplinas académicas han contribuido a BI&A,
anteriores del marco de investigación, no estaban presentes. Esto podría incluidos IS, CS, Estadística, Gestión y Marketing, como se muestra en
nuestro estudio bibliométrico. Los programas de SI, en particular, están
atribuirse a la tendencia de los autores a utilizar terminologías amplias
en una posición única para capacitar a una nueva generación de
en los títulos y resúmenes de los artículos.
académicos y estudiantes debido a su énfasis en la gestión de datos clave
y las tecnologías de la información, el análisis estadístico orientado a los
negocios y las técnicas de ciencias de la gestión, y una amplia exposición
Programa y educación de BI&A a la disciplina empresarial (por ejemplo, Finanzas, Contabilidad,
proporcionar profesionales con la profundidad y el rigor académico necesarios Las opciones de desarrollo de programas para brindar educación en BI&A
para abordar la creciente complejidad de los problemas de BI&A. Los incluyen
programas IS alojados en las escuelas de negocios tienen acceso a una
variedad de cursos de negocios, así como a cursos destinados a mejorar las • crear una Maestría en Ciencias (MS) en BI&A
habilidades de comunicación y presentación. También es común que las • crear una concentración de BI&A en los programas MS IS
escuelas de negocios alojen a los profesores de ciencias administrativas y existentes
estadísticas en la misma unidad de SI. • ofrecer un programa de certificado de posgrado en BI&A
Conocimientos y habilidades de BI&A programa. Algunas universidades se han embarcado en este esfuerzo.
Una lista no exhaustiva incluye la Universidad Estatal de Carolina del
La educación en BI&A debe ser interdisciplinaria y cubrir habilidades Norte, la Universidad de Saint Joseph, la Universidad de Northwestern, la
analíticas y de TI críticas, conocimiento comercial y de dominio, y Universidad de Denver, el Instituto de Tecnología Stevens y la
habilidades de comunicación requeridas en un entorno empresarial Universidad de Fordham. La Universidad de Nueva York lanzará su nuevo
complejo centrado en datos. programa en mayo de 2013. Los nuevos programas de grado de
maestría se pueden diseñar explícitamente para atraer a estudiantes
Las habilidades analíticas y de TI incluyen una variedad de temas en analíticamente fuertes con títulos universitarios en áreas como
evolución. Se extraen de disciplinas como la estadística y la matemáticas, ciencias e informática, y para preparar a estos estudiantes
informática para gestionar y analizar datos estructurados y texto no para carreras, no solo en los grupos de SI o TI en la industria, sino
estructurado. La cobertura de estos temas va desde BI&A 1.0 hasta también en áreas funcionales como investigación y desarrollo,
BI&A 3.0. Los programas académicos destinados a producir marketing, medios, logística y finanzas.
se analizan anteriormente y se resumen en la Tabla 2. . maestría a tiempo parcial o un programa de certificación (la tercera opción)
ofrecen alternativas prácticas y válidas. Estos programas de certificación
Davenport (2006) enfatiza la importancia de una cultura en toda la pueden entregarse en línea o en el sitio y deben proporcionar las habilidades
organización para la toma de decisiones informada basada en hechos que complementarán la experiencia comercial o de TI actual de los
para el análisis empresarial. Para respaldar dicha cultura, los profesionales de TI, y/o brindar habilidades técnicas y analíticas a los
profesionales de BI&A necesitan saber no solo cómo convertir datos e profesionales de negocios en áreas que no son de TI. Los programas en línea
información sin procesar (a través de análisis) en conocimiento que están actualmente disponibles incluyen la Maestría en Análisis Predictivo
significativo y procesable para una organización, sino también cómo de la Universidad de Northwestern y el Certificado de Posgrado en Minería de
interactuar adecuadamente y comunicar este conocimiento a los Big Data de la Universidad de Stanford. Además, los programas de IS pueden
expertos del negocio y del dominio. de la organización. ayudar a diseñar una concentración de BI&A en programas de MBA para
ayudar a capacitar a una nueva generación de gerentes expertos en datos y
análisis.
generación de pensadores analíticos. Hay muchas opciones para brindar relaciones y asociaciones sólidas entre los programas académicos y los
educación en BI&A. Debido a la profundidad del conocimiento requerido, socios de la industria son fundamentales para fomentar el aspecto de
los programas de posgrado son la opción obvia. Viable aprendizaje experiencial del plan de estudios de BI&A.
Artículos en este número especial patrones de comunicación dentro de sus círculos. Para construir el
modelo específico de inferencia y validación, se utilizó una combinación
La idea de este número especial comenzó en mayo de 2009, cuando de métodos, incluido el procesamiento de consultas, la inferencia
Detmar Straub, editor en jefe deMIS Trimestral, solicitó sugerencias estadística, el análisis de redes sociales y la elaboración de perfiles de
para ediciones especiales de los miembros del consejo editorial. usuarios. Los autores analizaron más de 20 millones de transacciones de
Presentamos la propuesta del número especial sobre Business llamadas móviles reales y su modelo de inferencia basado en redes
Intelligence Research en agosto de 2009, con la convocatoria sociales propuesto superó sistemáticamente a los enfoques alternativos.
aprobada y distribuida en el 30elConferencia Internacional Anual
sobre Sistemas de Información (ICIS) en diciembre de ese año. Los En "Escaneo ambiental web 2.0 y soporte de decisiones adaptativo para
envíos a este número especial debían relacionarse conMIS trimestral fusiones y adquisiciones de empresas", Raymond Lau, Stephen Liao, KF Wong y
misión con fuerte relevancia e impacto gerencial, organizacional y Dickson Chiu analizaron las fusiones y adquisiciones de empresas (M&A). El
social. Además del enfoque de Design Science (Hevner et al. 2004; escaneo ambiental en línea con Web 2.0 brinda a los altos ejecutivos la
March & Storey 2008), investigación rigurosa y relevante relacionada oportunidad de aprovechar la inteligencia web colectiva para desarrollar
con BI utilizando ciencia de gestión (modelado, optimización), mejores conocimientos sobre los factores socioculturales y político-
economía de la información y metodologías organizacionales y de económicos que enfrentan las fusiones y adquisiciones transfronterizas.
comportamiento (estudios de casos, encuestas) también fue bien Basado en el modelo de las cinco fuerzas de Porter, esta investigación diseñó
recibido. En octubre de 2010 se recibió un total de 62 manuscritos. un modelo de cuadro de mando de diligencia debida que aprovecha la
En los siguientes 20 meses, seis de los manuscritos pasaron por tres inteligencia web colectiva para mejorar la toma de decisiones de fusiones y
o cuatro rondas de revisión y luego fueron aceptados para este adquisiciones. Los autores también desarrollaron un sistema adaptativo de
número. inteligencia comercial (BI) 2.0, que aplicaron a las actividades de fusiones y
adquisiciones transfronterizas de las empresas chinas.
Los seis documentos abordan varios aspectos del marco de
investigación de BI&A presentado en este documento de En su artículo, "Modelado y análisis basados en redes del
introducción (ver Tabla 7). Los seis artículos se basan en BI&A 1.0 y riesgo sistémico en los sistemas bancarios", Daning Hu, J. Leon
tres también se basan en BI&A 2.0. Los primeros tres artículos de Zhao, Zhimin Hua y Michael Wong analizaron el riesgo sistémico
Chau y Xu, Park et al., y Lau et al. concéntrese en BI&A 2.0 con en los sistemas bancarios al tratar a los bancos como una red
aplicaciones de comercio electrónico e inteligencia de mercado vinculada a las relaciones financieras. que conduce a un
mediante análisis de texto, web y red. En los dos artículos enfoque de red para la gestión de riesgos (NARM). Los autores
siguientes, tanto Hu et al. y Abbasi et al. trabajan en la categoría de utilizaron NARM para analizar el riesgo sistémico atribuido a
BI&A 1.0 con un enfoque en seguridad, pero Hu et al. utilizan cada banco individual a través de una simulación basada en
análisis de red, mientras que Abbasi et al. enfatizar el análisis de datos del mundo real de la Corporación Federal de Seguros de
seguridad y el análisis de datos. Finalmente, Sahoo et al. también Depósitos. NARM ofreció un nuevo medio por el cual se podían
trabajo en BI&A 1.0, con aplicación directa a e-commerce e predecir quiebras bancarias contagiosas y se podían determinar
inteligencia de mercado mediante analítica web y de datos. las prioridades de inyección de capital a nivel de banco
individual a raíz de una crisis financiera. Un estudio de
En "Inteligencia empresarial en blogs: comprensión de las interacciones y simulación mostró que, bajo shocks de mercado significativos,
las comunidades de los consumidores", Michael Chau y Jennifer Xu
reconocieron la potencial "mina de oro" del contenido de los blogs para
la inteligencia empresarial y desarrollaron un marco para recopilar Ahmed Abbasi, Conan Albrecht, Anthony Vance y James Hansen en
inteligencia empresarial mediante la recopilación y el análisis su artículo, "MetaFraud: un marco de metaaprendizaje para detectar
automáticos del contenido de los blogs y de los blogueros. redes de el fraude financiero", emplearon un enfoque científico del diseño
interacción. Se aplicó un sistema desarrollado utilizando este marco a para desarrollar MetaFraud, un marco de metaaprendizaje para
dos estudios de casos, que revelaron patrones novedosos en las mejorar la detección del fraude financiero. Se realizó una serie de
interacciones y comunidades de blogueros. experimentos en miles de empresas legítimas y fraudulentas para
demostrar la eficacia del marco sobre los métodos de referencia
Sung-Hyuk Park, Soon-Young Huh, Wonseok Oh y Sang Pil Han en su existentes. Los resultados de la investigación tienen implicaciones
artículo, "Un modelo de inferencia basado en redes sociales para validar para los oficiales de cumplimiento, inversionistas, firmas de
los datos del perfil del cliente", argumentan que los sistemas de auditoría y reguladores.
inteligencia comercial tienen un valor limitado cuando se ocupan de
datos inexactos. y datos poco fiables. Los autores propusieron un marco El artículo de Nachiketa Sahoo, Param Vir Singh y Tridas Mukhopadhyay,
de inferencia impulsado por redes sociales para determinar la precisión y "Un modelo oculto de Markov para el filtrado colaborativo", informa
confiabilidad de los perfiles de clientes autoinformados. El marco utilizó sobre el análisis de hacer recomendaciones personalizadas cuando las
los círculos sociales de los individuos y preferencias del usuario están cambiando. los
Tabla 7. Resumen de artículos de números especiales dentro del marco de investigación de BI&A
Chau y Xu, "Inteligencia comercial BI&A 2.0 en Inteligencia de mercado Generado por el usuario • Análisis de texto y Ventas incrementadas
en blogs: comprensión de las redes sociales sobre los consumidores y contenido extraído red y cliente
interacciones y las comunidades & la red comunidades de blogs • Detección de comunidad satisfacción
de los consumidores" analítica • Visualización de red
Park et al., “Un modelo de BI&A 1.0 y Inteligencia de mercado Usuario autoinformado • Análisis de red Personalizado
inferencia basado en redes 2.0 en redes sociales en la predicción de clientes perfiles y movil • Detección de anomalías recomendación
sociales para validar la red perfiles de tomers registros de llamadas • Análisis predictivo y aumentó
Datos del perfil del cliente” análisis y cliente
estadístico satisfacción
análisis
Lau et al., “Escaneo ambiental BI&A 1.0 y Inteligencia de mercado Información de negocios • Análisis de texto y web Decisión estratégica
Web 2.0 y soporte de 2.0 en sobre el medio ambiente extraído de • Análisis de sentimientos y haciendo en
decisiones adaptable para cuadros de mando exploración internet y afectos fusiones y
fusiones y adquisiciones de y web financiero propietario • Minería de relaciones adquisiciones
empresas” analítica información
Hu et al., “Modelado y análisis BI&A 1.0 en Riesgo sistémico Información bancaria de EE. UU. • Análisis de redes y Monitoreando y
basados en redes del riesgo estadístico análisis y mación extraída de datos atenuante de
sistémico en los sistemas análisis gestión en FDIC y Federal • Descriptivo y banco contagioso
bancarios” sistemas bancarios Alambre de reserva modelado predictivo fracasos
La red • Simulación de eventos discretos
Abbasi et al., “Metafraude: un BI&A 1.0 en Detección de fraude Razones financieras, y • Análisis de datos Fraude financiero
marco de metaaprendizaje procesamiento de datos organizacional y • Clasificación y detección
para detectar y meta- características de contexto a nivel generalización
Fraude" aprendizaje industrial • Aprendizaje adaptativo
Sahoo et al., "Un modelo BI&A 1.0 en Sistema de recomendación Datos de lectura del blog, • Análisis de datos y web Personalizado
oculto de Markov para el estadístico artículos con cambio Conjunto de datos de premios de • Modelo dinámico estadístico recomendaciones
filtrado colaborativo" análisis Preferencias del usuario Netflix y datos de Last.fm • Filtración colaborativa
Los autores propusieron un modelo oculto de Markov basado en el Si bien BI&A 2.0 aún está madurando, nos encontramos al borde de
filtrado colaborativo para predecir las preferencias de los usuarios y BI&A 3.0, con toda la incertidumbre concomitante que traen las
hacer las recomendaciones personalizadas más adecuadas para la tecnologías nuevas y potencialmente revolucionarias.
preferencia prevista. Los autores emplearon conjuntos de datos del
mundo real y simulaciones para mostrar que, cuando las preferencias del EsteMIS TrimestralEl número especial sobre investigación de inteligencia
usuario cambian, existe una ventaja al usar el algoritmo propuesto sobre de negocios pretende servir, en parte, como plataforma y guía de
los existentes. conversación para examinar cómo la disciplina de SI puede satisfacer
mejor las necesidades de los tomadores de decisiones de negocios a la
luz de las tecnologías de BI&A maduras y emergentes, Big Data ubicuo y
la Escasez prevista de gerentes expertos en datos y de profesionales de
Resumen y conclusiones negocios con habilidades analíticas profundas. ¿Cómo pueden los
programas académicos de SI continuar satisfaciendo las necesidades de
A través de las iniciativas de BI&A 1.0, las empresas y organizaciones de todos sus estudiantes tradicionales, al mismo tiempo que llegan al profesional
los sectores comenzaron a obtener información crítica de los datos de TI en activo que necesita nuevas habilidades analíticas? Es posible que
estructurados recopilados a través de varios sistemas empresariales y se necesite una nueva visión para IS para abordar esta y otras preguntas.
analizados por los sistemas comerciales de gestión de bases de datos
relacionales. En los últimos años, la inteligencia web, el análisis web, la web 2.0 Al destacar varias aplicaciones como el comercio electrónico, la
y la capacidad de extraer contenido no estructurado generado por el usuario inteligencia de mercado, el gobierno electrónico, la atención médica y la
han dado paso a una nueva y emocionante era de investigación BI&A 2.0, que seguridad, y al mapear facetas importantes del panorama actual del
ha dado lugar a una inteligencia sin precedentes sobre la opinión del conocimiento de BI&A, esperamos contribuir a futuras fuentes de
consumidor, las necesidades del cliente y el reconocimiento de nuevos conocimiento y aumentar las discusiones actuales sobre el importancia
oportunidades de negocio. Ahora, en esta era de Big Data, incluso de la investigación académica (relevante).
Finalmente, los seis artículos seleccionados para este número especial son en Paul Jen-Hwa Hu, Universidad de Utah
sí mismos un microcosmos del estado actual de la investigación de BI&A. Estos Hemant Jain, Universidad de Wisconsin – Milwaukee Robert
artículos de investigación "lo mejor de lo mejor" muestran cómo la Kauffman, Universidad de Administración de Singapur Vijay
Khatri, Universidad de Indiana
investigación académica de alta calidad puede abordar problemas del mundo
Gondy Leroy, Claremont Graduate University Ting-Peng Liang,
real y aportar soluciones que sean relevantes y duraderas, exactamente el
National Chengchi University Ee-Peng Lim, Singapore
desafío que nuestra disciplina continúa enfrentando.
Management University Vijay Mookerjee, University of Texas at
Dallas Sridhar Narasimhan, Georgia Institute of Technology
Jeffrey Parsons, Memorial University of Newfoundland H.
Expresiones de gratitud Raghav Rao, The Universidad Estatal de Nueva York en Buffalo
Raghu T. Santanam, Universidad Estatal de Arizona
Deseamos agradecer al Editor en Jefe deMIS Trimestral, Detmar Balasubramaniam Ramesh, Universidad Estatal de Georgia
Straub, por su firme apoyo a este número especial desde su Ramesh Sharda, Universidad Estatal de Oklahoma
creación. Compartió la creencia de que la inteligencia empresarial y Matti Rossi, Facultad de Economía de la Universidad Aalto
el análisis es un área de investigación de SI emergente y crítica. Michael Jeng-Ping Shaw, Universidad de Illinois, Urbana-Champaign
Agradecemos el apoyo continuo del editor en jefe entrante, Paulo Olivia Sheng, Universidad de Utah
Goes, y sus comentarios sobre una versión anterior de este Keng Siau, Universidad de Ciencia y Tecnología de Missouri Atish
documento. También agradecemos a Janice DeGross y Jennifer Sinha, Universidad de Wisconsin – Milwaukee Alexander Tuzhilin,
Syverson delMIS Trimestral office por su apoyo editorial profesional Universidad de Nueva York
y Cathy Larson por su apoyo y asistencia en la gestión de los Vijay Vaishnavi, Universidad Estatal de Georgia Doug
Vogel, Universidad de la Ciudad de Hong Kong Chih-
manuscritos y la coordinación del proceso de revisión.
Ping Wei, Universidad Nacional de Taiwán Barbara
Wixom, Universidad de Virginia Carson Woo,
Agradecemos a nuestro excelente grupo de 35 editores asociados
Universidad de Columbia Británica Daniel Zeng,
(enumerados a continuación) y a los revisores (demasiados para nombrarlos)
Universidad de Arizona
que llevaron a cabo el proceso de revisión de manera oportuna mientras aún
J. Leon Zhao, Universidad de la Ciudad de Hong Kong
se reuníanMIS trimestralaltas expectativas de calidad académica.
Agradecemos a los autores de estas 62 presentaciones que optaron por enviar
su investigación a nuestro número especial. Estamos especialmente en deuda
con los editores asociados que manejaron los seis artículos aceptados del Referencias
número especial. Ellos y los revisores a los que invitaron ofrecieron valiosas
críticas y sugerencias a lo largo del proceso de revisión. Este número especial Adomavicius, G. y Tuzhilin, A. 2005. “Hacia el próximo
no hubiera sido posible sin sus esfuerzos. Generación de Sistemas de Recomendación: Relevamiento del
Estado del Arte y Posibles Ampliaciones”,Transacciones IEEE
La investigación informada en este artículo fue respaldada parcialmente sobre conocimiento e ingeniería de datos(17:6), págs. 734-749.
Anderson, C. 2004. “La cola larga”,Revista CABLEADA(12:10)
por las siguientes fuentes: National Science Foundation (NSF
(http://www.wired.com/wired/archive/12.10/tail.html). Associated
CMMI-1057624, CMMI-0926270, CNS-0709338), Defense Threat Reduction
Press. 2012. “Columbia U Plans New Institute for Data
Agency (DTRA HDTRA-09-0058), J. Mack Robinson College de Negocios de
Sciences”, 30 de julio (http://www.cbsnews.com/
la Universidad Estatal de Georgia, la Facultad de Negocios Carl H. Lindner
8301-505245_162-57482466/columbia-u-plans-new-institute-for-data-
de la Universidad de Cincinnati y la Facultad de Administración Eller de la
sciences/, consultado el 3 de agosto de 2012).
Universidad de Arizona. También agradecemos a los siguientes colegas
Barabási, A. 2003.Vinculado: cómo todo está conectado a
por su ayuda o comentarios: Ee-Peng Lim, Ted Stohr, Barbara Wixom,
Todo lo demás y lo que significa para los negocios, la ciencia y la vida
Yukai Lin y Victor Benjamin.
cotidiana, Nueva York: Penacho.
Batagelj, V. y Mrvar, A. 1998. “Pajek: A Program for Large
Análisis de red,"Conexiones(21), págs. 47-57. Bettencourt,
Editores asociados de números especiales LMA, Cintrón-Arias, A., Kaiser, DI, and Castillo-
Chávez, C. 2006. “El poder de una buena idea: modelado cuantitativo
Gediminas Adomavicius, Universidad de Minnesota Sue de la difusión de ideas a partir de modelos epidemiológicos”, Física A(
Brown, Universidad de Arizona 364), págs. 513-536.
Michael Chau, Universidad de Hong Kong Cecil Chua, Bitterer, A. 2011. “Hype Cycle for Business Intelligence”, Gartner,
Universidad de Auckland Wendy Currie, Audencia, Inc., Stamford, CT.
Ecole de Management Andrew Gemino, Universidad Blei, DM 2012. "Modelos temáticos probabilísticos",Comunicaciones
Simon Fraser Paulo Goes, Universidad de Arizona de la ACM(55:4), págs. 77-84.
Bloomberg Business Week. 2011. “El estado actual de los negocios
Alok Gupta, Universidad de Minnesota Análisis: ¿Hacia dónde vamos desde aquí?”, Bloomberg Business-
Brumfiel, G. 2911, “Física de alta energía: abajo del petabyte 14 de noviembre, págs. 19-26.
Carretera,"Naturaleza(469), págs. 282-283. Hevner, A., March, ST, Park, J. y Ram. S. 2004. “Diseño
Chaudhuri, S., Dayal, U. y Narasayya, V. 2011. “An Overview Investigación Científica en Sistemas de Información”,MIS Trimestral
de Tecnología de Inteligencia de Negocios,”Comunicaciones de la (28:1), págs. 75-105.
ACM(54:8), págs. 88-98. Hirsch, JE 2005. “An Index to Quantify an Individual’s Scientific
Chen, H. 2006.Informática de Inteligencia y Seguridad para Inter- Resultados de la investigación”,Actas de la Academia Nacional de
Seguridad nacional: intercambio de información y minería de datos, Nueva Ciencias de los Estados Unidos de América(102:46), págs.
York: Springer. 16569-16572.
Chen, H. 2009. "IA, gobierno electrónico y política 2.0",IEEE Hunter, DR, Handcock, MS, Butts, CT, Goodreau, SM y
Sistemas inteligentes(24:5), págs. 64-67. Morris, M. 2008. "ergm: un paquete para ajustar, simular y
Chen, H. 2011a. “La ciencia del diseño, los grandes desafíos y la sociedad
diagnosticar modelos de familia exponencial para redes"Revista
Impactos,”Transacciones de ACM en sistemas de información de
de software estadístico(24:3) (http://www.ncbi.nlm.nih.gov/pmc/
gestión(2:1), págs. 1:1-1:10.
articles/PMC2743438/).
IBM. 2011. “Informe de tendencias tecnológicas de IBM de 2011: Las nubes son
Chen, H. 2011b. “Salud y Bienestar Inteligentes,”IEEE Inteligente
Rolling In...Is Your Business Ready?,” 15 de noviembre (http://
Sistemas(26:5), págs. 78-79.
www.ibm.com/developerworks/techntrendsreport; consultado el
Chen, H. 2012.Internet oscura:Explorando y Minando el Lado Oscuro de
4 de agosto de 2012).
La web, Nueva York: Springer.
Karpf, D. 2009. “Blogsphere Research: A Mixed-Methods Research
Chen, H., Brandt, L., Gregg, V., Traunmuller, R., McIntosh, A.,
Enfoque de los sistemas que cambian rápidamente”,Sistemas inteligentes
Dawes, S., Hovy, E. y Larson, CA (eds.). 2007.Gobierno digital:
IEEE(24:5), págs. 67-70.
investigación, estudios de casos e implementación de gobierno
Liben-Nowell, D. y Kleinberg, J. 20007. “The Link-Prediction
electrónico, Nueva York: Springer.
Problema para las Redes Sociales”,Revista de la Sociedad
Chen, H., Reid, E., Sinai, J., Silke, A. y Ganor, B. (eds.). 2008.
Estadounidense de Ciencia y Tecnología de la Información(58:7),
Informática del terrorismo: gestión del conocimiento y extracción
págs. 1019-1031. Lin, Y., Brown, RA, Yang, HJ, Li, S., Lu, H. y Chen, H.
de datos para la seguridad nacional, Nueva York: Springer.
2011. “Extracción de datos de registros médicos electrónicos a gran
Chiang, RHL, Goes, P. y Stohr, EA 2012. “Business
escala para apoyo clínico”Sistemas inteligentes IEEE(26:5), págs.
Educación y desarrollo de programas de inteligencia y análisis: una
87-90. Lusch, RF, Liu, Y. y Chen, Y. 2010. “The Phase Transition of
oportunidad única para la disciplina de sistemas de información”,
Mercados y organizaciones: la nueva inteligencia y la frontera
Transacciones de ACM en sistemas de información de gestión(3:3),
empresarial”,Sistemas inteligentes IEEE(25:1), págs. 71-75.
próximamente.
Manyika, J., Chui, M., Brown, B., Bughin, J., Dobbs, R., Roxburgh,
Davenport, TH 2006. "Competir en análisis",harvard
C. y Byers, AH 2011. “Big Data: The Next Frontier for Innovation,
Revision del negocio(84:1), pág. 98-107.
Competition, and Productivity”, McKinsey Global Institute (http://
Doan, A., Ramakrishnan, R. y Halevy, AY 2011. “Crowd- www.mckinsey.com/insights/mgi/research/
sistemas de aprovisionamiento en la World-Wide Web”,Comunicaciones de
technology_and_innovation/big_data_the_next_frontier_for_in
la ACM(54:4), págs. 86-96.
novation; consultado el 4 de agosto de 2012).
Fortunato, S. 2010. “Detección comunitaria en gráficas”,Física Manning, CD y Schütze, H. 1999.Fundamentos de Estadística
Informes(486:3-5), págs. 75-174. Procesamiento natural del lenguaje, Cambridge, MA: The MIT
Frank, O. y Strauss, D. 1986. “Gráficos de Markov”,Diario de la Press. March, ST y Storey, VC 2008. “La ciencia del diseño en el
Asociación Estadounidense de Estadística(81:395), págs. 832-842. Disciplina de Sistemas de Información”,MIS Trimestral(32:4), págs.
Freeman, T. 2005.El mundo es plano: una breve historia de la 725-730.
Siglo veintiuno, Nueva York: Farrar, Straus y Giroux. Gelfand, Maybury, MT (ed.). 2004.Nuevas direcciones en cuestión
A. 2011/2012. “Privacidad e Investigación Biomédica: respondiendo, Cambridge, MA: The MIT Press.
Creación de una infraestructura de confianza: una exploración de los McCallum, A. 2002. “Mallet: un aprendizaje automático para el lenguaje
enfoques de privacidad de datos basados en datos y procesos.Revisión de Toolkit”, Universidad de Massachusetts, Amherst (http://
computación biomédica, Winter, págs. 23-28 (disponible en mallet.cs.umass.edu/).
Miller, K. 2012a. “Análisis de Big Data en la Investigación Biomédica,” Snider, M. 2012. "Más empresas se ponen en marcha"EE.UU
Revisión de computación biomédica(disponible en http:// Este Dia, 30 de julio.
biomedicalcomputationreview.org/content/big-data- Stonebraker, M., Abadi, D., DeWitt, DJ, Madden, S., Pavlo, A.,
analyticsbiomedical-research; consultado el 2 de agosto de 2012). y Rasin, A. 2012. “MapReduce y DBMS paralelos: amigos o
Miller, K. 2012b. “Aprovechando las redes sociales para la biomedicina enemigos”,Comunicaciones de la ACM(53:1), págs. 64-71. El
Investigación: cómo los sitios de redes sociales están realizando economista. 2010a. “El diluvio de datos”, Informe especial sobre
rápidamente investigaciones únicas en grandes cohortes”,Revisión de Gestión de la Información, Sección de Tecnología, 25 de febrero
computación biomédica (disponible en http:// (http://www.economist.com/node/15579717).
biomedicalcomputationreview.org/content/leveraging-social-media- El economista. 2010b. “Demasiado”, Informe especial sobre
biomedical-research; consultado el 2 de agosto de 2012). Gestión de la Información, Sección de Tecnología, 25 de febrero
Consejo nacional de investigación. 2008.Modelado conductual y simulación (http://www.economist.com/node/15557421).
lación: de los individuos a las sociedades, Comité de Modelado El economista. 2011. “Más allá de la PC”, Informe especial sobre
Organizacional: De Individuos a Sociedades, GL Zacharias, J. Personal Technology, 8 de octubre (http://www.economist.com/
MacMillan y SB Van Hemel (eds.), Junta de Ciencias del node/21531109).
Comportamiento, Cognitivas y Sensoriales, División de Ciencias Turban, E., Sharda, R., Aronson, JE y King, D. 2008.Negocio
Sociales y del Comportamiento y Educación, Washington, DC: The Inteligencia: un enfoque gerencial, Boston: Pearson Prentice Hall,
Prensa de las Academias Nacionales.
O'Reilly, T. 2005. “¿Qué es la web 2.0? Patrones de diseño y Oficina de Seguridad Nacional de los Estados Unidos. Estrategia Nacional para
Business Models for the Next Generation of Software”, 30 de 2002. Seguridad nacional, Washington, DC: Oficina de la Patria
septiembre, (http://www.oreillynet.com/pub/a/oreilly/tim/news/ Seguridad.
2005/09/30/what-is-web-20.html) . van der Aalst, W. 2012. “Minería de procesos: Resumen y
Pang, B. y Lee, L. 2008. “Opinion Mining and Sentiment Oportunidades,"Transacciones de ACM en sistemas de información de
Análisis,"Fundamentos y Tendencias en la Recuperación de Información gestión(3:2), págs. 7:1-7:17.
(2:1-2), págs. 1-135. Wactlar, H., Pavel, M. y Barkis, W. 2011. “Can Computer
Patterson, DA 2008. “Perspectiva técnica: el centro de datos es ¿La ciencia salva la atención médica?Sistemas inteligentes IEEE(26:5), págs.
el ordenador,"Comunicaciones de la ACM(51:1), pág. 105. 79-83.
Perlroth, N. y Rusli, EM 2012. “Security Start-Ups Catch Watson, HJ y Wixom, BH 2007. “El estado actual de
Fantasía de los inversores”,New York Times, Sección de Tecnología, 5 de Inteligencia de negocios,"Computadora IEEE(40:9), págs. 96-99.
agosto. Vatios, D. 2003.Seis grados: la ciencia de una era conectada,
Robins, G., Pattison, P., Kalish, Y. y Lusher, D. 2007. “An Nueva York: WW Norton.
Introducción a los modelos de gráfico aleatorio exponencial (p*) para Witten, IH, Frank, E. y Hall, M. 2011.Procesamiento de datos:
redes sociales”,Redes sociales(29:2), págs. 173-191. Russom, P. 2011. Herramientas y técnicas prácticas de aprendizaje automático(3rded.), San
"Análisis de Big Data", Mejores prácticas de TDWI Francisco: Morgan Kaufmann.
Informe, Cuarto Trimestre. Wu, X., Kumar, V., Quinlan, JR, Ghosh, J., Yang, Q., Motoda, H.,
Sallam, RL, Richardson, J., Hagerty, J. y Hostmann, B. 2011. McLachlan, GJ, Ng, A., Liu, B., Yu, PS, Zhou, Z.-H.,
“Cuadrante Mágico para Plataformas de Business Intelligence”, Gartner Steinbach, M., Hand, DJ y Steinberg, D. 2007. “Top 10
Group, Stamford, CT. Algorithms in Data Mining, ”Sistemas de Información y
Salton, G. 1989.Procesamiento automático de texto, Lectura, MA: Conocimiento(14:1), págs. 1-37.
AddisonWesley. Yang, H. y Callan, J. 2009. “OntoCop: Construyendo ontologías
Schonfeld, E. 2005. “El gran obsequio”,Negocios 2.0(6:3), págs. para comentarios públicos,”Sistemas inteligentes IEEE(24:5), págs.
80-86. 70-75.