Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Michel Wedel y PK Kannan
Análisis de marketing para
Entornos ricos en datos
Los autores brindan un examen crítico de los métodos de análisis de marketing rastreando su desarrollo histórico, examinando sus aplicaciones a
datos estructurados y no estructurados generados dentro o fuera de una empresa, y revisando su potencial para respaldar las decisiones de
marketing. Los autores identifican direcciones para nuevos métodos de investigación analítica, abordando (1) análisis para optimizar el gasto de la
mezcla de marketing en un entorno rico en datos, (2) análisis para la personalización y (3) análisis en el contexto de la privacidad y la seguridad
de los datos de los clientes. . Revisan las implicaciones para las organizaciones que pretenden implementar análisis de big data. Finalmente,
mirando hacia el futuro, los autores identifican las tendencias que darán forma a la analítica de marketing como disciplina, así como a la educación
en analítica de marketing.
Palabras clave: big data, marketing analytics, marketing mix, personalización, privacidad
Suplemento en línea: http://dx.doi.org/10.1509/jm.15.0413
ha sido llamado “el petróleo” de la economía digital. eficiente y efectivo. Sin embargo, aún no está lo suficientemente
La captura rutinaria de información digital a través de claro qué tipos de análisis funcionan para qué tipo de problemas
Datos aplicaciones móviles y en línea produce grandes flujos de y datos, qué nuevos métodos se necesitan para analizar
datos sobre cómo los consumidores se sienten, se comportan e nuevos tipos de datos o cómo las empresas y su gestión deben
interactúan con los productos y servicios, así como también cómo evolucionar para desarrollar e implementar habilidades y
responden a los esfuerzos de marketing. Los datos están asumiendo procedimientos para competir en este nuevo entorno.
un papel cada vez más central en las organizaciones, ya que los El Marketing Science Institute ha esbozado el alcance de las
especialistas en marketing buscan aprovechar los datos para construir prioridades de investigación en torno a estos temas.1 El presente
y mantener relaciones con los clientes; personalizar productos, artículo proporciona una revisión de la investigación sobre una de
servicios y la mezcla de marketing; y automatizar los procesos de estas prioridades: análisis para entornos ricos en datos. Hemos
marketing en tiempo real. El crecimiento explosivo de los medios, estructurado nuestras ideas utilizando el marco de la Figura 1. En el
canales, dispositivos digitales y aplicaciones de software ha brindado centro está el uso de análisis para respaldar las decisiones de
a las empresas oportunidades sin precedentes para aprovechar los marketing, que se basa, por un lado, en la disponibilidad de datos y,
datos para ofrecer más valor a los clientes, mejorar sus experiencias, por otro lado, en los avances en análisis. métodos. Los dominios
aumentar su satisfacción y lealtad y extraer valor. Si bien es posible clave para las aplicaciones de análisis son (1) la gestión de relaciones
que inicialmente se haya sobrevalorado el potencial de big data, y que con los clientes (CRM), con métodos que ayudan a la adquisición,
las empresas hayan invertido demasiado en la captura y el retención y satisfacción de los clientes para mejorar su valor de por
almacenamiento de datos y no lo suficiente en análisis, cada vez es vida para la empresa2; (2) la combinación de marketing, con métodos,
más claro que la disponibilidad de big data está generando culturas modelos y algoritmos que respaldan la asignación de recursos para
de decisión basadas en datos en las empresas, proporcionando con mejorar la eficacia del esfuerzo de marketing; (3) personalización de
ventajas competitivas, y teniendo un impacto significativo en su la mezcla de marketing para consumidores individuales, en la que
desempeño financiero. El reconocimiento cada vez más generalizado se han logrado avances significativos como resultado del desarrollo
de que los grandes datos se pueden aprovechar de manera efectiva de varios enfoques para capturar la heterogeneidad de los clientes; y
para respaldar las decisiones de marketing se destaca por el éxito de (4) privacidad y seguridad, un área que preocupa cada vez más a las
los líderes de la industria. Han surgido formas completamente nuevas empresas y los reguladores. Estos dominios conducen a dos pilares
de marketing, incluidas recomendaciones, geocercas, marketing de del desarrollo e implementación exitosos de análisis de marketing en
búsqueda y retargeting. El análisis de marketing ha llegado a las empresas: (1) la adopción de estructuras y culturas organizacionales
desempeñar un papel central en estos desarrollos, y existe una que fomentan la toma de decisiones basada en datos y (2) la
educación
demanda urgente de métricas y métodos analíticos nuevos y más potentes que y capacitación
hagan que de profesionales
las operaciones de marketing abnalíticos.
asadas en datos sean más
Michel Wedel es profesor presidido por PepsiCo de Ciencias del Consumidor y
profesor universitario distinguido en la Escuela de Negocios Robert H. Smith de la
Universidad de Maryland, College Park (correo electrónico: mwedel@rhsmith.umd.edu). 1Consulte http://www.msi.org/articles/marketerstopconcernsframe
PK Kannan es Profesor Ralph J. Tyser de Ciencias del Marketing, Robert H. 201416investigaciónprioridades/.
Smith School of Business, Universidad de Maryland, College Park (correo 2No nos enfocamos en temas de CRM más allá de la personalización en este
electrónico: pkannan@rhsmith.umd.edu). artículo, porque otro artículo en este número cubre CRM en profundidad.
© 2016, Asociación Americana de Marketing Journal of Marketing: edición especial de AMA/MSI,
ISSN: 00222429 (impreso) vol. 80 (noviembre de 2016), 97–121
15477185 (electrónico) 97 DOI: 10.1509/jm.15.0413
Machine Translated by Google
FIGURA 1
Marco del artículo
Tipos de datos
Analítica para
Decisiones de marketing
Analítica y
Métodos analíticos
Analítica Implementando grandes
Educación y Datos y análisis
Capacitación en empresas
El futuro de la analítica de marketing
Notas: Los datos de marketing y los métodos analíticos se utilizan en cuatro áreas principales de decisiones de marketing. Su implementación en las empresas
depende de la cultura y la estructura organizativa de la empresa y plantea requisitos de educación y formación, que darán forma al futuro de la analítica de marketing.
La agenda de este artículo es la siguiente. Usando el marco de la han reconocido cada vez más las ventajas competitivas clave que pueden
Figura 1, proporcionamos una breve revisión de la historia de los datos y ofrecer los análisis, lo que ha impulsado su desarrollo e implementación
análisis de marketing, seguida de un examen crítico de la medida en que (Davenport 2006).
los métodos analíticos específicos son aplicables en entornos ricos en
Datos disponibles
datos y respaldan la toma de decisiones de marketing en dominios
centrales. Este análisis conduce a la identificación de futuras líneas de La historia del uso sistemático de datos en marketing comienza alrededor
investigación. Elegimos centrarnos en (1) análisis para optimizar el gasto de 1910 con el trabajo de Charles Coolidge Parlin para Curtis Publishing
de la combinación de marketing, (2) análisis para personalizar la Company en Boston (Bartels 1988, p. 125).
combinación de marketing y (3) análisis en el contexto de la seguridad de Parlin recopiló información sobre los mercados para guiar la publicidad y
los datos y la privacidad del cliente. Revisamos las implicaciones para otras prácticas comerciales, lo que llevó a varias de las principales
implementar el análisis de big data en las organizaciones y para la empresas estadounidenses a establecer departamentos de investigación comercial.
educación y capacitación en análisis. Al hacerlo, identificamos las Duncan (1919) enfatizó el uso de datos externos además de los internos
tendencias que darán forma al marketing como disciplina y discutimos las por parte de estos departamentos. La investigación mediante cuestionarios,
interconexiones reales y aspiradas entre la práctica del marketing y la ya realizada en el contexto de las encuestas de opinión por Gallup en la
academia. década de 1820, se volvió cada vez más popular en la década de 1920
(Reilly 1929). En esa época, los conceptos de la psicología se incorporaron
al marketing para fomentar una mayor comprensión del consumidor. El
modelo de atención, interés, deseo, acción (AIDA) de Starch (1923) es un
Una breve historia de los datos y el análisis de marketing
excelente ejemplo, y se le atribuye la adopción generalizada de la
El análisis de marketing implica la investigación de copias.
recopilación, la gestión y el análisis (descriptivo, de diagnóstico, predictivo Esta era también vio el primer uso de datos de seguimiento ocular (Nixon
y prescriptivo) de datos para obtener información sobre el rendimiento del 1924).
marketing, maximizar la eficacia de los instrumentos de control de En 1923, AC Nielsen fundó una de las primeras empresas de
marketing y optimizar los resultados de las empresas. retorno de la investigación de mercado. Nielsen comenzó midiendo las ventas de
inversión (ROI). Es interdisciplinario, estando en el nexo de mercadeo y productos en las tiendas y, en las décadas de 1930 y 1950, comenzó a
otras áreas de negocios, matemáticas, estadística, economía, econometría, evaluar las audiencias de radio y televisión. En 1931, se fundó la firma de
psicología, psicometría y, más recientemente, informática. El análisis de investigación de mercado Burke en los Estados Unidos, e inicialmente
marketing tiene una larga historia y, como resultado del crecimiento realizó investigaciones de prueba de productos para Procter & Gamble. En
explosivo en la disponibilidad de datos en la economía digital en las últimas 1934, se estableció en Alemania la empresa de investigación de mercado
dos décadas, las empresas GfK. La década siguiente vio el auge de los experimentos de campo y el
mayor uso de encuestas telefónicas (White 1931).
98 / Journal of Marketing: edición especial de AMA/MSI, noviembre de 2016
Machine Translated by Google
Los datos de panel se hicieron cada vez más populares, al principio principalmente (GPS), marcó el inicio de la captura de datos de ubicación del consumidor a
para medir la exposición a los medios, pero en la década de 1940 las empresas una escala sin precedentes.
comenzaron a utilizar datos de panel para registrar las compras de los
consumidores (Stonborough 1942). George Cullinan, quien introdujo las métricas Analítica
de "actualidad, frecuencia, monetarias" que se convirtieron en centrales en CRM
La iniciativa de la Fundación Ford y el Instituto de Matemáticas Básicas para
(Neslin 2014), estimuló el uso de los propios datos de clientes de las empresas a partir de 1961.
Aplicaciones en los Negocios de Harvard (en 1959/1960) es ampliamente
En 1966, se fundó el Instituto de marketing de áreas de venta, que se centró en
reconocida por haber dado el mayor impulso a la aplicación de la analítica al
los datos de retiro del almacén. La importancia de las computadoras para la
marketing (Winer y Neslin 2014). Condujo a la fundación del Instituto de Ciencias
investigación de mercados también se reconoció por primera vez en esa época
(Casher 1969). del Marketing en 1961, que desde entonces ha tenido un papel continuo en la
creación de puentes entre la academia y la práctica del marketing. Los métodos
A partir de fines de la década de 1970, la firma de investigación de mercado
estadísticos (p. ej., análisis de varianza) se habían aplicado en la investigación
Claritas, fundada sobre el trabajo del sociólogo Charles Booth alrededor de
de mercados durante más de una década (Ferber 1949), pero el desarrollo de
1890, acumuló datos geodemográficos de bases de datos gubernamentales y
agencias de crédito. La introducción del Código de producto universal y el punto modelos estadísticos y econométricos adaptados a problemas específicos de
de datos por parte de los minoristas. Compañías como Nielsen rápidamente
reconocieron la promesa de usar datos de escáner de punto de venta con
fines de investigación y reemplazaron las auditorías de tiendas bimensuales El desarrollo de la teoría de la decisión bayesiana en el Instituto Harvard (Raiffa
con datos de escáner más granulares. Pronto, se pudo rastrear a los clientes y Schlaifer 1961) también desempeñó un papel, ejemplificado por su exitosa
individuales a través de tarjetas de fidelización, lo que condujo a la aparición de aplicación, entre otras cosas, a las decisiones de fijación de precios por parte
datos de panel de escáner (Guadagni y Little 1983). La empresa de investigación de Green (1963). La investigación académica en marketing comenzó a centrarse
de mercado IRI, que midió la publicidad televisiva desde la fundación de la más en el desarrollo de modelos estadísticos y análisis predictivos. Aunque no
empresa en 1979, lanzó su servicio de escaneo de códigos de barras en el es posible revisar todos los desarrollos posteriores aquí (para una revisión
hogar en 1995. extensa, consulte Winer y Neslin 2014), señalamos algunos hitos.
El uso de datos de clientes internos fue impulsado en gran medida por la
introducción de la computadora personal en el mercado masivo por parte de
IBM en 1981. Las computadoras personales permitieron a los comerciantes Los nuevos modelos de difusión de productos (Bass 1969) involucraron
almacenar datos sobre clientes actuales y potenciales, lo que contribuyó al aplicaciones de ecuaciones diferenciales de la epidemiología.
surgimiento del marketing de base de datos, iniciado por Robert y Kate Los modelos estocásticos del comportamiento del comprador (Massy,
Kestnbaum y Robert Shaw (1987). En 1990, surgió el software CRM, para el Montgomery y Morrison, 1970) tenían sus raíces en las estadísticas e incluían
cual el trabajo anterior sobre la automatización de la fuerza de ventas en Siebel supuestos de distribución sobre las medidas del comportamiento de compra
Systems allanó el camino. Las computadoras personales también facilitaron la de los consumidores. La aplicación del cálculo de decisiones (Little y Lodish
investigación mediante encuestas a través de entrevistas personales y 1969; Lodish 1971) para optimizar el gasto en publicidad y la fuerza de ventas
telefónicas. se hizo popular después de su introducción al marketing por parte de Little
En 1995, después de más de dos décadas de desarrollo en la Agencia de (1970). Los modelos de cuota de mercado y demanda de datos de escáner a
Proyectos de Investigación Avanzada de Defensa y otras organizaciones, nació nivel de tienda (Nakanishi y Cooper 1974) se derivaron de modelos
la World Wide Web, y esto condujo a la disponibilidad de grandes volúmenes econométricos de demanda. Las técnicas de escalado y despliegue
de datos de marketing. multidimensional, fundadas en la psicometría (Coombs 1950), se convirtieron
Los datos de flujo de clics extraídos de los registros del servidor se utilizaron en un área activa de investigación, con contribuciones clave de Green (1969) y
para realizar un seguimiento de las visitas a la página y los clics mediante DeSarbo (DeSarbo y Rao 1986). Estas técnicas allanaron el camino para la
cookies. Los datos de clics arrojaron medidas de la efectividad de la publicidad en línea.investigación de la estructura del mercado y el posicionamiento del producto al
Internet estimuló el desarrollo de sistemas CRM por parte de empresas como derivar mapas espaciales a partir de juicios y elecciones de proximidad y
Oracle y, en 1999, Salesforce fue la primera empresa en ofrecer sistemas CRM preferencia. El análisis conjunto (Green y Srinivasan 1978) y, más tarde, el
a través de la computación en la nube. análisis de elección conjunta (Louviere y Woodworth 1983) son contribuciones
Google se fundó en 1998 y defendió la búsqueda de palabras clave y la únicas que evolucionaron a partir del trabajo psicométrico de Luce sobre la
´
captura de datos de búsqueda. Los motores de búsqueda existían desde la cuantificación de los atributos psicológicos (Luce y Tukey 1964).
década anterior; el primer motor de búsqueda de protocolo de transferencia de
archivos Archie se desarrolló en la Universidad McGill. El advenimiento del
contenido generado por el usuario, incluidas las reseñas de productos en línea, Los modelos logit multinomiales basados en panel de escáner (Guadagni y
los blogs y los videos, resultó en un aumento del volumen y la variedad de Little 1983) se construyeron directamente sobre la investigación en econometría
datos. El lanzamiento de Facebook en 2004 abrió una era de datos de redes de McFadden (1974). El modelo logit anidado que captura la toma de decisiones
sociales. Con la llegada de YouTube en 2005, grandes cantidades de datos en jerárquica del consumidor se introdujo en marketing (Kannan y Wright 1991), y
forma de texto y video subidos por los usuarios se convirtieron en la materia se reconoció que los modelos de múltiples aspectos del comportamiento del
prima para la orientación por comportamiento. Twitter, con sus mensajes mucho consumidor (por ejemplo, incidencia, elección, tiempo, cantidad) podrían
más simples de 140 caracteres, hizo lo mismo en 2006. Los teléfonos inteligentes integrarse (Gupta 1988). Esto resultó ser una idea poderosa para los modelos
existían desde principios de la década de 1990, pero la introducción del iPhone de actualidad, frecuencia y métricas monetarias (Schmittlein y Peterson 1994).
de Apple en 2007, con su sistema de posicionamiento global Mientras que los métodos anteriores para identificar
Análisis de marketing para entornos ricos en datos / 99
Machine Translated by Google
Las estructuras de mercado competitivo se basaron en elasticidades compañía que se especializó en pruebas de textos publicitarios basadas
cruzadas de precios estimadas, los modelos que derivan mapas en el trabajo académico de Starch, y John DC Little y Glen L. Urban's
competitivos a partir de datos de elección de panel se desarrollaron sobre Management Decision Systems, que luego se vendió a IRI.
la base de la noción de que las estructuras de mercado competitivo surgen El trabajo de Zoltman y Sinha sobre la asignación de la fuerza de ventas
de las percepciones de los consumidores sobre la sustituibilidad, revelada se implementó en la práctica a través de ZS Associates. El trabajo de
a través de sus elecciones de productos (Elrod 1988) . Los métodos de Claes Fornell sobre la medición de la satisfacción condujo al Índice de
series de tiempo (DeKimpe y Hanssens 1995) permitieron a los Satisfacción del Consumidor Estadounidense, elaborado por su empresa,
investigadores comprobar si los instrumentos de marketing producían CFI Group. MarketShare, la empresa cofundada por Dominique Hanssens,
cambios permanentes o transitorios en las ventas. implementó con éxito sus modelos sobre la eficacia a largo plazo de la
La heterogeneidad en los comportamientos de los consumidores combinación de marketing.
individuales se convirtió en una premisa central en la que se basó la JanBenedict EM Steenkamp fundó AiMark, una empresa conjunta con
estrategia de marketing, y el modelo de elección mixta fue el primero en GfK que aplica métodos y conceptos académicos, particularmente en
permitir a los gerentes identificar segmentos de consumidores basados marketing internacional. Prácticamente todas estas empresas tuvieron
en respuestas a partir de datos de escáner (Kamakura y Russell 1989). éxito gracias a la aplicación de análisis.
Este modelo se generalizó para dar cabida a una amplia gama de modelos
de comportamiento del consumidor (Wedel y DeSarbo 1995). La Ejemplos de empresas con vínculos muy estrechos con la academia
heterogeneidad del consumidor se representó de manera continua en los incluyen Sawtooth Software de Richard M. Johnson, que se especializa
modelos jerárquicos de Bayes (Rossi, McCulloch y Allenby 1996). Aunque en el diseño y análisis de software para estudios conjuntos, e In4mation
los académicos inicialmente debatieron cuál de estos dos enfoques Insights de Steven Cohen y Mark Garratt, que aplica modelos estadísticos
representaba mejor la heterogeneidad, la investigación ha demostrado bayesianos completos a una amplia variedad de problemas aplicados,
que cada uno de los enfoques coincide con tipos específicos de problemas incluido el modelado de la mezcla de marketing. En algunos casos, la
de marketing, con pocas diferencias entre ellos (Andrews, Ainslie y Currim academia de marketing va a la zaga de los desarrollos en la práctica y,
2002). Se puede decir con seguridad que el enfoque bayesiano es ahora por lo tanto, se enfoca en el impacto y la validez de estos desarrollos en
uno de los enfoques de modelado dominantes en marketing, que ofrece la práctica. En otros casos, los académicos son coinvestigadores que
un marco poderoso para desarrollar modelos integrados de comportamiento confían en los datos y problemas proporcionados por las empresas y
del consumidor (Rossi y Allenby 2003). Dichos modelos se han aplicado trabajan junto con estas empresas para desarrollar soluciones analíticas
con éxito al seguimiento ocular publicitario (Wedel y Pieters 2000), implementables. Sin embargo, como discutiremos a continuación, en un
marketing por correo electrónico (Ansari y Mela 2003), navegación web número cada vez mayor de áreas de aplicación en la economía digital, los
(Montgomery et al. 2004), redes sociales (Moe y Trusov 2011) y búsqueda académicos están liderando el desarrollo de nuevos conceptos y métodos.
paga. publicidad (Rutz, Trusov y Bucklin 2011).
Síntesis El
La derivación de decisiones de maximización de beneficios, inspirada
en el trabajo de Dorfman y Steiner (1954) en economía, formó la base del desarrollo del análisis basado en datos en marketing desde alrededor de
enfoque de investigación operativa (OR) para la toma de decisiones 1900 hasta la introducción de la World Wide Web en 1995 ha progresado
óptimas en publicidad (Parsons y Bass 1971), asignación de fuerza de a través de aproximadamente tres etapas: (1) la descripción de las
ventas ( Mantrala, Sinha y Zoltners 1994), selección de objetivos en condiciones observables del mercado a través de enfoques estadísticos
marketing directo (Bult y Wansbeek 1995) y personalización de descuentos simples, (2) el desarrollo de modelos para proporcionar conocimientos y
de precios en línea (Zhang y Krishnamurthi 2004). Los modelos diagnósticos utilizando teorías de la economía y la psicología, y (3) la
estructurales basados en la economía incluyen enfoques que evaluación de las políticas de marketing, en las que se predicen sus
complementan las ecuaciones de demanda agregada con supuestos de efectos y se respalda la toma de decisiones de marketing utilizando
equilibrio del lado de la oferta (Chintagunta 2002), basados en el trabajo enfoques estadísticos, econométricos y OR. En muchos casos a lo largo
de los economistas Berry, Levinsohn y Pakes (1995). Una segunda clase de la historia del análisis de marketing, poco después de que se dispusiera
de modelos estructurales acomoda el comportamiento prospectivo (Erdem de nuevas fuentes de datos, se introdujeron o desarrollaron métodos para
y Keane 1996), basado en el trabajo en economía de Rust (1987). Los analizarlos (para obtener un resumen de la historia de los datos y los
modelos estructurales permiten predicciones de los cambios de métodos analíticos, consulte la Figura 2; la Tabla 1 resume el estado
comportamiento de los agentes cuando se implementan cambios de enfoques de última generación). Muchos de los métodos desarrollados
política (Chintagunta et al. 2006). por académicos de marketing desde la década de 1960 ahora se han
puesto en práctica y respaldan la toma de decisiones en áreas como
CRM, marketing mix y personalización y han aumentado el rendimiento
De la teoría a la práctica Roberts,
financiero de las empresas que los implementan.
Kayande y Stremersch (2014) demuestran empíricamente el impacto de
estos desarrollos académicos en la práctica del marketing. A través de
entrevistas entre gerentes, encuentran un impacto significativo de varias Desde el año 2000, la captura automatizada de flujo de clics en línea,
herramientas de análisis en la toma de decisiones de la empresa. La mensajes, boca a boca (WOM), transacciones y datos de ubicación ha
relevancia de estos desarrollos para la práctica del marketing se evidencia reducido en gran medida el costo variable de la recopilación de datos y
aún más con ejemplos de empresas que se fundaron en el trabajo ha dado como resultado volúmenes de datos sin precedentes que brindan
académico. Los primeros casos de empresas exitosas incluyen Starch información sobre los consumidores. comportamiento a niveles
and Associates, una excepcionales de profundidad y granularidad. Aunque los académicos tienen
100 / Journal of Marketing: edición especial de AMA/MSI, noviembre de 2016
Machine Translated by Google
FIGURA 2
Un resumen de la línea de tiempo de los datos y análisis de marketing
Cuota de mercado
Modelos
Notas: ANOVA = análisis de varianza; MDS = escalamiento multidimensional; POS = punto de venta; MNL = modelo logit multinomial; HB = Bayes jerárquico.
Esta línea de tiempo resume la disponibilidad de nuevos datos de marketing y el desarrollo de las principales clases de modelos de marketing. A medida que nuevos
tipos de datos estuvieron disponibles, siguieron nuevos modelos para analizarlos.
asumido el desafío de desarrollar modelos de diagnóstico y predictivos analistas, y/o la presencia de barreras organizacionales para
para estos datos en la última década, es cierto que estos desarrollos implementar análisis avanzados. En particular, los datos no
aún están en pañales. Por un lado, las métricas descriptivas que se estructurados en forma de blogs, reseñas y tweets ofrecen
muestran en los tableros son populares en la práctica. Esto podría oportunidades para profundizar en la economía y la psicología del
ser el resultado de limitaciones en el poder de cómputo, la necesidad comportamiento del consumidor, lo que podría marcar el comienzo
de conocimientos rápidos en tiempo real, la falta de personal capacitado de la segunda etapa en el análisis de marketing digital una vez que los modelos aprop
TABLA 1
Análisis de marketing: enfoques de vanguardia y sus aplicaciones
Área de enfoque Desarrollos y enfoques de vanguardia
Datos
Datos estructurados • Una plétora de métodos descriptivos, diagnósticos, predictivos y prescriptivos para análisis en muchos
las áreas de marketing están disponibles
• Los enfoques para manejar big data incluyen aquellos que utilizan métodos bayesianos, métodos de agregación y compresión
de datos, métodos de muestreo y selección de variables, aproximaciones y simplificaciones de modelos, algoritmos eficientes
de cadena de Markov Monte Carlo y computación paralela • Experimentos de campo y cuasiexperimentos,
variables instrumentales (IV) y enfoques libres de instrumentos para
endogeneidad, enfoques de discontinuidad de regresión
Datos no estructurados • En su mayoría métodos analíticos descriptivos y de diagnóstico, los métodos predictivos y prescriptivos aún se ponen al día •
Enfoques
de minería de texto y aprendizaje automático • Incorporación de
estructura a través de métricas para datos de texto, audio, imagen y video; seguimiento ocular, rostro
reconocimiento y otros neurodatos
Modelado de mezcla de marketing • Efectos de modelado de redes sociales, búsqueda de palabras clave, WOM en línea, tendencias y dispositivos móviles/ubicación
dentro de la mezcla de marketing
• Análisis de toda la ruta de compra, modelado de atribución • Incorporación
de entornos y contextos institucionales específicos para mejorar la estimación de la estructura
modelos y sus simulaciones de políticas; mejores variables instrumentales para abordar la endogeneidad; experimentos de
campo y cuasiexperimentos para efectos causales •
Personalización Personalización en línea y móvil de la combinación de marketing • Tratar con
las observaciones faltantes e incorporar la receptividad en las recomendaciones • Enfoques de personalización
adaptativa—aprendiendo y adaptándose a los cambios de preferencias de los usuarios en un ciclo automatizado continuo •
Investigación en el efectos de las
Seguridad y privacidad regulaciones y políticas de privacidad y seguridad en el comportamiento del consumidor y la competencia entre empresas
• Modelos para analizar datos minimizados y anonimizados
Análisis de marketing para entornos ricos en datos / 101
Machine Translated by Google
se desarrollan y aplican. Por otro lado, los métodos de aprendizaje Datos y análisis
automático de las ciencias de la computación (incluidas las redes
neuronales profundas y los sistemas cognitivos, que analizamos más Tipos de datos Big
adelante; consulte la Tabla 1) se han vuelto populares en la práctica,
data a menudo se caracteriza por las cuatro "V": volumen (de terabytes
pero se han investigado con poca frecuencia en la academia de
a petabytes), velocidad (desde instantáneas únicas hasta datos de
marketing. Su popularidad puede provenir de su excelente desempeño
alta frecuencia y transmisión), variedad (numérica, red, texto, imágenes
predictivo y su naturaleza de caja negra, lo que permite una aplicación
y vídeo) y veracidad (fiabilidad y validez). Las dos primeras
de rutina con una intervención limitada del analista. características son importantes desde el punto de vista informático, y
La pregunta es si los académicos de marketing deberían subirse al las dos últimas son importantes desde el punto de vista analítico. A
carro del aprendizaje automático, algo a lo que pueden haber sido veces se añade una quinta “V”: valor. Trasciende los cuatro primeros
reacios porque estas técnicas no establecen efectos causales ni y es importante desde el punto de vista empresarial. Los grandes
producen conocimientos teóricos generalizables. Sin embargo, la datos son principalmente observacionales, pero las encuestas, los
combinación de estos enfoques con modelos más clásicos para el experimentos de campo y los experimentos de laboratorio pueden
análisis de marketing puede abordar estas deficiencias y ser generar datos de gran variedad y alta velocidad.
prometedor para futuras investigaciones (Tabla 2). Gran parte del entusiasmo que rodea a los grandes datos se ejemplifica
Es razonable esperar que el tercer paso en la evolución de la analítica en la escala y el alcance de los datos de observación generados por
en la economía digital, el desarrollo de modelos para generar los "tres grandes" de los grandes datos: Google, Amazon y Facebook.
información de diagnóstico y respaldar decisiones en tiempo real a Google recibe más de 4 millones de consultas de búsqueda por minuto
partir de big data, sea inminente. Sin embargo, la academia de de los 2.400 millones de usuarios de Internet de todo el mundo y
marketing deberá desarrollar métodos analíticos con un buen ojo para procesa 20 petabytes de información al día. Los 1.300 millones de
el volumen y la variedad de datos, así como para la velocidad de usuarios de Facebook comparten 2,5 millones de piezas de contenido
cálculo, componentes que hasta ahora se han ignorado en gran cada minuto. Amazon ha creado un marketplace con 278 millones de
medida (consulte la Tabla 2). En el resto de este artículo, revisamos clientes activos del que registra datos en línea
los desarrollos recientes e identificamos las posibles barreras y Comportamiento de navegación y compra. Estas y otras empresas
oportunidades hacia la implementación exitosa de análisis para han cambiado el panorama del marketing en la última década a través
respaldar las decisiones de marketing en entornos ricos en datos. de la generación, provisión y utilización de big data.
TABLA 2
Análisis de marketing: temas para futuras investigaciones
Área de enfoque Temas prometedores e importantes para la investigación
Datos
Datos estructurados • Segmentación por comportamiento con datos entre dispositivos; análisis móvil, basado en la ubicación y social • Fusión de datos
generados dentro de la empresa con datos generados fuera de la empresa; integrando “pequeñas estadísticas
sobre big data” con enfoques de “big stats on small data”
• Combinar enfoques de aprendizaje automático con métodos econométricos y basados en la teoría para aplicaciones de big data;
soluciones computacionales a modelos de marketing para big data • Desarrollo de enfoques
Datos no estructurados diagnósticos, predictivos y prescriptivos para el análisis de datos a gran escala
datos no estructurados
• Enfoques para analizar datos sociales, geoespaciales y móviles no estructurados y combinarlos con
datos estructurados en contextos de big data
• Usar, evaluar y extender métodos de aprendizaje profundo y computación cognitiva para analizar datos de marketing no estructurados
Modelado de mezcla de marketing • Alinear el análisis de datos desagregados con el de datos agregados e incluir datos no estructurados
en el análisis de la mezcla de marketing
• Nuevas técnicas y métodos para medir con precisión el impacto de los instrumentos de marketing y su remanente y difusión a través de
medios y dispositivos utilizando datos integrados de ruta de compra
• Optimización dinámica, multiperíodo y entre categorías de la combinación de marketing • Enfoques para incorporar
diferentes ciclos de planificación para diferentes instrumentos de marketing en los medios
mezclar modelos
Personalización • Soluciones de marketing de circuito cerrado automatizado para entornos digitales; marketing totalmente automatizado
soluciones
• Personalización y técnicas de personalización mediante sistemas cognitivos, artificiales en general.
análisis de inteligencia y atención automatizados; personalización de contenido
• Personalización móvil y basada en la ubicación de la combinación de marketing •
Seguridad y privacidad Métodos para producir y manejar minimización de datos y anonimización de datos en la evaluación
eficacia y personalización de la mezcla de marketing
• Soluciones de datos distribuidos para mejorar la seguridad y privacidad de los datos mientras se maximizan las oportunidades de
marketing personalizadas
102 / Journal of Marketing: edición especial de AMA/MSI, noviembre de 2016
Machine Translated by Google
Las soluciones emergentes para vincular los datos de los clientes a FIGURA 3
través de canales en línea y fuera de línea y de televisión, tabletas, Gestión de tipos de datos
dispositivos móviles y otros dispositivos digitales contribuirán aún más a
la disponibilidad de datos. Además, en 2014, más de 15 000 millones de
dispositivos estaban equipados con sensores que les permiten
No SQL
conectarse y transferir datos a través de redes sin interacción humana. no estructurado
sql Hadoop
Este "Internet de las cosas" puede convertirse en una fuente importante Relacional casandra
de desarrollo de nuevos productos y servicios y generar datos masivos en el hojas de calculo bases de datos Dremel
puntajes netos de promotores de un solo elemento. Como consecuencia,
los datos longitudinales y de sección transversal repetida se están Notas: El eje vertical muestra el grado de estructura de los datos y el eje
horizontal muestra las dimensiones que dan como resultado el big data.
volviendo más comunes. Mittal, Kumar y Tsiros (1999) utilizan esos
El software para gestionar estos datos aparece en el centro de la figura.
datos para rastrear los impulsores de la lealtad del cliente a lo largo del
tiempo. Para abordar el problema de los cuestionarios más cortos, se
han desarrollado técnicas analíticas para crear encuestas personalizadas Software para el procesamiento de Big Data3 La
que se adaptan sobre la base de las respuestas a preguntas anteriores
(Kamakura y Wedel 1995), así como el diseño de cuestionarios divididos Figura 3 proporciona una descripción general de las clases de datos de
¨
a medida para encuestas masivas (Adiguzel y Wedel 1995). Wedel marketing discutidos anteriormente y los métodos para almacenarlos y
manipularlos. Para datos estructurados de tamaño pequeño a mediano,
2008).
los métodos convencionales como las hojas de cálculo de Excel;
Las tecnologías digitales facilitan los experimentos de campo a
archivos ASCII; o conjuntos de datos de paquetes estadísticos como
gran escala que producen grandes datos y se han convertido en
SAS, SPlus, STATA y SPSS son adecuados. SAS se mantiene
poderosas herramientas para obtener respuestas a las preguntas sobre
particularmente bien a medida que aumenta el tamaño de los datos y es
los efectos causales de las acciones de marketing. Por ejemplo, las
popular en muchos sectores industriales (p. ej., comercio minorista,
pruebas A/B a gran escala permiten a las empresas "probar y aprender"
servicios financieros, gobierno) por ese motivo. A medida que el número
para optimizar los diseños de sitios web, la publicidad (búsqueda, social
y móvil), la orientación por comportamiento y otros aspectos de la de registros asciende a millones, las bases de datos relacionales como
combinación de marketing. Hui et al. (2013) utilizan experimentos de MySQL (utilizada, por ejemplo, por Wikipedia) son cada vez más eficaces
campo para evaluar promociones móviles en tiendas minoristas. para la manipulación de datos y para realizar consultas. Para aplicaciones
Alternativamente, los experimentos naturales (o cuasi) aprovechan los web grandes y en tiempo real en las que el volumen, la variedad y la
impactos exógenos que ocurren naturalmente en los datos para velocidad son altos, las bases de datos como NoSQL son la opción
preferida porque proporcionan un mecanismo para el almacenamiento y
establecer relaciones causales, pero a menudo se requieren métodos
recuperación de datos que no requiere relaciones tabulares como las de
analíticos más extensos (incluidos los métodos de comparación y de
las bases de datos relacionales. y se pueden escalar horizontalmente a
variables instrumentales) para establecer la causalidad. Por ejemplo,
través del hardware básico. Apache Cassandra, un software de código
Ailawadi et al. (2010) muestran cómo se pueden usar diseños
abierto desarrollado inicialmente por Facebook, es un buen ejemplo de
cuasiexperimentales para evaluar el impacto de la entrada de las tiendas
un sistema de administración de base de datos distribuida. Hadoop,
WalMart en los minoristas, utilizando un diseño de antes y después
con un grupo de control de tiendas emparejadas en una variedad de desarrollado originalmente en Yahoo!, es un sistema para almacenar y
medidas. Otra forma de aprovechar los grandes datos para evaluar la manipular datos en una multitud de computadoras, escrito en el lenguaje
causalidad es examinar porciones delgadas de datos en torno a los de programación Java. En su núcleo se encuentran el sistema de gestión
cambios de política que ocurren en los datos, lo que puede revelar el de archivos distribuidos Hadoop para el almacenamiento de datos y el
impacto de esos cambios en las variables dependientes de interés a marco de programación MapReduce para el procesamiento de datos.
Por lo general, las aplicaciones están escritas en un lenguaje como Pig,
través de los llamados diseños de discontinuidad de regresión (Hartmann, Nair, y Narayanan 2011).
que asigna consultas a través de datos que se almacenan en cientos de
Finalmente, los experimentos de laboratorio generalmente generan
computadoras de forma paralela y luego combina la información de
volúmenes más pequeños de datos, pero los avances tecnológicos han
todos para responder la consulta. Los motores SQL como Dremel
permitido la administración y recopilación en línea de audio, video,
(Google), Hive (Hortonworks) y Spark (Databricks) permiten tiempos de
seguimiento ocular, seguimiento facial (Teixeira, Wedel y Pieters 2010)
respuesta muy cortos. Sin embargo, para el posprocesamiento, estos
y datos de neuromarketing obtenidos de electroencefalografía. e
imágenes cerebrales (Telpaz, Webb y Levy 2015). datos de alta frecuencia a menudo todavía se almacenan en bases de
Estos datos son recopilados de forma rutinaria por empresas como datos relacionales con mayor funcionalidad.
Nielsen y, a menudo, arrojan datos p > n con más variables que los
encuestados. Las técnicas de metanálisis se pueden utilizar para
generalizar los hallazgos en un gran número de estos experimentos 3El Apéndice web proporciona enlaces a explicaciones de los términos
(Bijmolt, Van Heerde y Pieters 2005). utilizados en esta y otras secciones.
Análisis de marketing para entornos ricos en datos / 103
Machine Translated by Google
C++, Fortran y Java son herramientas de programación de bajo nivel los modelos encajarán mejor. Sin embargo, a medida que aumenta la variedad
poderosas y rápidas para análisis que vienen con grandes bibliotecas de rutinas. de datos y los datos se vuelven más ricos, el DGM subyacente se expande. Gran
Los programas Java a menudo se integran como applets dentro del código de parte del atractivo de los grandes datos en el marketing es que proporciona
las páginas web. R, utilizado por Google, es un lenguaje de programación de alto rastros de los comportamientos de los consumidores (p. ej., actividades,
nivel de código abierto considerablemente más lento pero de uso frecuente con intereses, opiniones, interacciones) que antes eran costosos de observar incluso
una funcionalidad comparable a lenguajes como MATLAB. Perl es un software en muestras pequeñas. Para capturar completamente el valor informativo de
adecuado para procesar datos de flujo de clics no estructurados (HTML); estos datos, se necesitan modelos más complejos. Esos modelos respaldarán
inicialmente fue utilizado por Amazon, pero ha sido reemplazado en su mayoría conocimientos más profundos y mejores decisiones, mientras que, al mismo
por su rival Python (utilizado por Dropbox), que es un lenguaje de programación tiempo, grandes volúmenes de datos respaldarán representaciones más ricas
más intuitivo que permite la implementación de MapReduce. Actualmente, la del DGM. Sin embargo, estos modelos tienen mayores costos computacionales.
investigación académica en análisis de marketing ya se basa en muchos de
estos lenguajes de programación, y R parece ser el más popular. Es probable Muchos modelos estadísticos y econométricos actuales y los métodos de
que gran parte de este software para la gestión y el procesamiento de big data estimación utilizados en la literatura de marketing no están diseñados para
se convierta en una parte integral del ecosistema de académicos de marketing y manejar grandes volúmenes de datos de manera eficiente. Las soluciones a
analistas de marketing aplicado en un futuro próximo. este problema implican la reducción de datos, algoritmos más rápidos,
simplificación de modelos y/o soluciones computacionales, que se analizan a
continuación. Para respaldar por completo la toma de decisiones de marketing
basada en datos, el campo de la analítica de marketing debe abarcar cuatro
Volumen, Variedad, Velocidad: Implicaciones para Big Data
niveles de análisis: (1) resumen y visualización de datos descriptivos con fines
Analytics La pregunta es si
exploratorios, (2) modelos explicativos de diagnóstico que estiman las relaciones
mejores decisiones comerciales requieren más datos o mejores modelos. Parte entre variables y permiten para la prueba de hipótesis, (3) modelos predictivos
del debate en torno a esa pregunta se origina en la investigación de Microsoft, que permiten pronósticos de variables de interés y simulación del efecto de la
en la que Banko y Brill (2001) demostraron que, en el contexto de la minería de configuración de control de marketing, y (4) modelos de optimización prescriptivos
textos, los algoritmos de diferente complejidad funcionaban de manera similar, que se utilizan para determinar niveles óptimos de variables de control de
pero al agregar datos mejoraban mucho el rendimiento. De hecho, a lo largo de marketing.
la literatura académica de marketing, los modelos complejos apenas superan a
los más simples en conjuntos de datos de tamaño pequeño a moderado. La La Figura 4 muestra que la viabilidad de estos niveles más altos de análisis
respuesta a la pregunta se basa en el equilibrio entre sesgo y varianza. Por un disminuye en función de las dimensiones de big data. Ilustra que el valor de
lado, el sesgo resulta de una representación incompleta del verdadero mecanismo información de los datos crece a medida que aumenta su volumen, variedad y
de generación de datos (DGM) por un modelo debido a la simplificación de velocidad, pero que el valor de decisión derivado de los métodos analíticos
suposiciones. Un modelo menos complejo (uno que contiene menos parámetros) aumenta a expensas de una mayor complejidad del modelo y costo computacional.
a menudo tiene un mayor sesgo, pero un modelo necesita simplificar la realidad
para proporcionar información generalizable. Para citar al estadístico George En el ámbito de los datos estructurados, en el que hasta ahora se han
Box, “Todos los modelos son incorrectos, pero algunos son útiles”. Un modelo producido muchos de los avances en análisis de marketing, se encuentran los
simple puede producir soluciones manejables de forma cerrada, pero los métodos cuatro niveles de análisis. Muchos de los desarrollos en ingeniería de marketing
numéricos y de muestreo permiten el examen de modelos más complejos a un (Lilien y Rangaswamy 2006) también se han producido en este espacio, y
costo computacional más alto. Los métodos de promediación de modelos y abarcan una amplia gama de áreas de marketing (incluidos precios, publicidad,
conjuntos, como embolsado o potenciación, abordan el sesgo en modelos más promociones, fuerza de ventas, gestión de ventas, competencia, distribución,
simples al promediar muchos de ellos (Hastie, Tibshirani y Friedman 2008). En etc.). marketing mix, branding, segmentación y posicionamiento, desarrollo de
marketing, los investigadores utilizan rutinariamente evidencia sin modelo para nuevos productos, cartera de productos, lealtad, adquisición y retención). Los
brindar confianza de que los modelos más complejos capturan con precisión el modelos explicativos y predictivos, como la regresión lineal y logística y los
DGM (ver, por ejemplo, Bronnenberg, Dube, y Gentzkow 2012). Los experimentos modelos de series temporales, han utilizado tradicionalmente métodos de
de campo son cada vez más populares porque la calidad de los datos (veracidad) estimación econométrica estándar, como los mínimos cuadrados generalizados,
puede sustituir la complejidad del modelo: cuando el DGM está bajo el control de el método de los momentos y la máxima verosimilitud. Estos métodos de
los investigadores, se pueden usar modelos más simples para hacer inferencias estimación basados en la optimización se vuelven difíciles de manejar para
causales (Hui et al. 2013). La varianza, por otro lado, resulta de la variación modelos complejos con una gran cantidad de parámetros. Para modelos
aleatoria en los datos debido al error de muestreo y medición. Un mayor volumen complejos, la probabilidad basada en simulación y los métodos Monte Carlo de
de datos reduce la varianza. la cadena bayesiana de Markov (MCMC) se utilizan ampliamente. La cadena de
Markov Monte Carlo es una clase de métodos de estimación bayesianos, cuyo
objetivo principal es caracterizar la distribución posterior de los parámetros del
modelo. Dichos métodos implican la extracción recursiva de muestras de
subconjuntos de parámetros a partir de sus distribuciones posteriores
Los modelos complejos calibrados en conjuntos de datos más pequeños a condicionales (Gelman et al. 2003). Esto hace posible ajustar modelos que
menudo sobreajustan los datos (es decir, capturan el error aleatorio en lugar del DGM). generan una visión profunda del fenómeno subyacente con el objetivo de generar
Es bien sabido que la noción de que más datos reducen el error beneficia a los predicciones que se generalicen a través de categorías, contextos y mercados.
métodos de aprendizaje automático, como las redes neuronales, que están Se han desplegado modelos de optimización para ventas
altamente parametrizadas (Geman, Bienenstock y Doursat 1992). Sin embargo,
no todos los datos se crean de la misma manera. Un mayor volumen de datos
reduce la varianza, e incluso más simple
104 / Journal of Marketing: edición especial de AMA/MSI, noviembre de 2016
Machine Translated by Google
FIGURA 4
Enfoques analíticos y de datos
Complejidad, Cómputo, Costo
Valor de decisión
Analítica
Modelos de Predicción, Máquina
Aprendizaje, Sistemas Cognitivos
Estadística, Econométrica, Psicométrica
Modelos
Preceptivo
Profético
Modelos Estructurales
Diagnóstico
O métodos de optimización
Descriptivo
Estadísticas resumidas y
Pruebas, métricas, tableros,
Visualización
Datos
volumen, variedad,
Velocidad
Valor de la información
Notas: La figura muestra el tamaño y el grado de estructura de los datos de marketing de derecha a izquierda, y la medida en que los métodos analíticos de aumento
complejidad se aplican a esos datos de izquierda a derecha.
asignación de fuerza, precios óptimos, análisis conjunto, diseño óptimo Se pueden utilizar las especificaciones. En segundo lugar, la velocidad y
de productos/servicios, focalización óptima y aplicaciones de marketing la capacidad de los recursos computacionales se pueden aumentar con
mix. aproximaciones, algoritmos más eficientes y computación de alto
Ha habido un número creciente de aplicaciones de análisis de rendimiento. Las técnicas para reducir la dimensionalidad de los datos y
marketing en el ámbito de los datos no estructurados. acelerar los cálculos a menudo se implementan simultáneamente, y las
Los desarrollos tecnológicos en el procesamiento de datos no analizamos más adelante.
estructurados y el desarrollo de métricas a partir de resúmenes de datos,
como los proporcionados por software de minería de texto, seguimiento Agregación y compresión. El volumen de datos se puede reducir
ocular y reconocimiento de patrones, permiten a los investigadores mediante la agregación de una o más de sus dimensiones, más
proporcionar una estructura de datos para facilitar la aplicación de frecuentemente temas, variables o tiempo. Esto se puede hacer mediante
métodos analíticos. Un ejemplo del uso de métricas como puerta de un simple promedio o suma, que, en varios casos, produce suficientes
entrada al análisis predictivo incluye la aplicación de Netzer et al. (2012), estadísticas de los parámetros del modelo que hacen innecesario el
quienes utilizan la minería de texto en contenido generado por el usuario procesamiento de los datos completos, así como a través de métodos de
para desarrollar estructuras de mercado competitivas. Una vez que se reducción de variables, como el análisis de componentes principales y
establece una estructura de datos utilizando métricas, los investigadores métodos relacionados, que son común en minería de datos,
pueden crear modelos explicativos, de predicción y de optimización. reconocimiento de voz y procesamiento de imágenes.
Aunque la aplicación de enfoques predictivos y prescriptivos para datos Por ejemplo, Naik y Tsai (2004) proponen un modelo semiparamétrico
no estructurados todavía está rezagada, especialmente en la práctica, el de un solo factor que combina la regresión inversa cortada y la regresión
análisis de datos no estructurados en marketing parece reducirse a isotónica. Reduce la dimensionalidad en el análisis de bases de datos
transformarlos en datos estructurados utilizando métricas adecuadas. de transacciones de clientes de alta dimensión y es escalable porque
Los datos estructurados de gran volumen comprenden cuatro evita soluciones iterativas de una función objetiva. Naik, Wedel y
dimensiones principales: variables, atributos, sujetos y tiempo (Naik et al. Kamakura (2010) extienden esto a modelos con múltiples factores y lo
2008). El costo de modelar datos estructurados para los cuales una o aplican al análisis de grandes datos sobre la rotación de clientes.
más de estas dimensiones es grande se puede reducir de una de dos
maneras. Primero, una o más de las dimensiones de los datos pueden La agregación de datos sobre diferentes muestras de clientes (p.
reducirse mediante agregación, muestreo o selección; alternativamente, ej., móvil, social, streaming, geodemográfica) se puede lograr mediante
simplificaciones apropiadas a la situación en el modelo la combinación de datos agregados a lo largo del espacio (p. ej.,
Análisis de marketing para entornos ricos en datos / 105
Machine Translated by Google
área de mercado designada, código postal) o dimensiones de tiempo (p. ej., inferencia basada en muestreo. Aquí, el investigador tiene control total sobre
semana, mes) o a través de métodos de fusión de datos (Gilula, McCulloch el tamaño, la naturaleza y la integridad de la muestra y puede analizar
y Rossi 2006; Kamakura y Wedel 1997). múltiples muestras. Algunos de los enfoques de estimación dominantes en
Los requisitos de datos para aplicaciones específicas se pueden reducir la academia de marketing, en particular la máxima verosimilitud, se
fusionando datos en diferentes niveles de agregación. Por ejemplo, si los desarrollan dentro de un marco estadístico que pretende utilizar una muestra
datos de ventas a nivel de tienda están disponibles de un minorista, estos para hacer inferencias sobre la población. Sin embargo, debido a que, en
podrían fusionarse con los datos del panel del escáner en el hogar. Esto muchos casos, los grandes datos capturan a toda una población, la
crea nuevas variables que pueden aumentar la veracidad de los datos inferencia estadística se vuelve muda a medida que las regiones de
porque los datos de la tienda tienen una mejor cobertura de mercado pero confianza asintóticas degeneran en masas puntuales bajo el peso de estos
no información de la competencia, mientras que lo contrario es cierto para datos masivos (Naik et al. 2008). La inferencia estadística tradicional y las
los datos de escaneo doméstico. La fusión también puede ser útil cuando pruebas de hipótesis pierden su atractivo porque el valor p, la probabilidad
se aplican modelos estructurales de demanda que recuperan la de obtener un efecto en muestras repetidas que es al menos tan extremo
heterogeneidad a nivel individual a partir de datos agregados (demanda a como el efecto en los datos disponibles, pierde sentido en ese caso. A
nivel de tienda), en cuyo caso la fusión con datos a nivel individual (datos menos que se analicen muestras de los datos, se requieren métodos
de panel de escáner) puede ayudar a identificar la distribución de alternativos.
heterogeneidad. Feit et al. (2013) utilizan técnicas de fusión bayesiana para
fusionar dichos datos agregados (sobre el uso de medios por parte del Sin embargo, un problema de usar muestras en lugar de los datos completos
cliente a lo largo del tiempo) con datos desagregados (uso de nivel individual es que este enfoque puede limitar la capacidad de los investigadores para
manejar
de los clientes en cada punto de contacto) para hacer inferencias sobre patrones de distribuciones
comportamiento de
a nivel cola
de larga y observaciones extremas, y es
cliente.
Los enfoques bayesianos se pueden utilizar en la compresión de datos. problemático cuando el enfoque del modelo es explicar o predecir eventos
Por ejemplo, al procesar datos recopilados a lo largo del tiempo, se puede raros en el cola de datos de alta dimensión (ver Naik y Tsai 2004). Además,
estimar un modelo bayesiano en un conjunto inicial de datos para el primer surgen problemas con el muestreo cuando se hacen inferencias en las
período de tiempo para determinar las distribuciones posteriores de los redes sociales.
parámetros. Luego, el investigador solo necesita retener estos datos En este caso, es posible que no se disponga de un marco de muestreo y
posteriores para uso futuro como datos previos para los parámetros del que los métodos de muestreo aleatorio simple y otros métodos de muestreo
modelo calibrado en nuevos datos para períodos de tiempo posteriores. estándar sean ineficientes o incluso perjudiciales para las propiedades de la
Oravecz, Huentelman y Vandekerckhove (2015) aplican este método en el red (las muestras de bosque aleatorias o de bola de nieve funcionan mejor;
contexto del crowdsourcing. Hay varios refinamientos de este enfoque consulte Ebbes, Huang y Rangaswamy 2015). Más importante aún, el
general. Ridgeway y Madigan (2002) proponen primero realizar MCMC muestreo impide la personalización, para lo cual se necesitan datos sobre
tradicional en un subconjunto de datos para obtener una estimación inicial cada cliente individual y, por lo tanto, elimina un importante punto de
de la distribución posterior y luego aplicar muestreo/remuestreo de apalancamiento de los grandes datos.
importancia a las estimaciones iniciales basadas en los datos completos. La inferencia estadística bayesiana ofrece ventajas filosóficas en las
Este procedimiento también se puede aplicar a medida que ingresan nuevos aplicaciones de big data porque la inferencia está condicionada a los datos
datos con el tiempo. Una técnica relacionada involucra el uso de información y considera que los parámetros son aleatorios. La inferencia refleja la
previa ponderada nuevamente, lo que evita la necesidad de ejecutar cadenas incertidumbre subjetiva del investigador sobre el modelo y sus parámetros
MCMC cada vez que ingresan nuevos datos. En su lugar, los nuevos datos en lugar de la variación aleatoria debida al muestreo (Berger 1985). Esto le
se usan para volver a ponderar las muestras existentes a partir de la permite al investigador formular una declaración probabilística sobre la
distribución posterior de los parámetros (Wang, Bradlow y Jorge 2014). Este verdad subyacente en lugar de sobre los datos (p. ej., "¿Cuál es la
enfoque está relacionado con el filtro de partículas aplicado, por ejemplo, probabilidad de que la hipótesis nula sea verdadera?"). Sin embargo, una
por Chung, Rust y Wedel (2009) para reducir la carga computacional en el limitación de muchos algoritmos MCMC es que son de naturaleza iterativa
procesamiento secuencial de datos entrantes. Todas estas técnicas y, por lo tanto, computacionalmente intensos. Las soluciones a este
secuenciales de actualización bayesiana reducen sustancialmente la carga problema computacional (consulte las discusiones anteriores y siguientes)
computacional de estimar modelos complejos con MCMC en datos de gran harán factible el modelado estadístico integral de big data, que luego se
volumen y alta velocidad porque vuelven a pesar (o redibujar) las muestras puede usar para generar métricas en tableros y pantallas. Es una vía
originales de los parámetros a partir de sus distribuciones posteriores, a prometedora para un mayor desarrollo combinar una visión profunda con
menudo con formas cerradas. pesos que son proporcionales a la probabilidad los tableros de usuario, como lo ilustran Dew y Ansari (2015), quienes usan
calculada a partir de los nuevos datos. Por lo tanto, esta clase de algoritmos la predicción semiparamétrica de la dinámica de la base de clientes en
es prometedora para big data porque evita ejecutar cadenas MCMC en los tableros para juegos de computadora. Estos desarrollos son importantes
datos completos o en los nuevos datos que ingresan. Además, paralelizar dado el uso omnipresente de tableros como base principal para la toma de
estos algoritmos es mucho más fácil que con MCMC estándar porque no decisiones en la industria, como es el caso de Procter & Gamble, por
implican cálculos iterativos. ejemplo.
La selección se puede utilizar para reducir la dimensionalidad de big
data en términos de variables, atributos o temas. La selección de sujetos/
Muestreo y selección. El muestreo se aplica principalmente a sujetos, clientes se puede utilizar cuando el interés se centra en subpoblaciones o
productos o atributos. En muchos casos, el big data interno de la empresa segmentos específicos bien definidos. Aunque los grandes datos pueden
está compuesto por toda la población de clientes. El uso de muestras de tener una gran cantidad de variables (p > n datos), es posible que no todas
estos datos permite la clásica contribuyan a la predicción. bayesiano
106 / Journal of Marketing: edición especial de AMA/MSI, noviembre de 2016
Machine Translated by Google
Los enfoques de árbol de regresión aditiva producen estructuras de árbol que buenos resultados de predicción para reconocimiento de voz, procesamiento
pueden usarse para seleccionar variables relevantes. En el enfoque de la de lenguaje natural, reconocimiento y clasificación visual (especialmente
sección variable Bayesiana intensamente computacional, la idea clave es objetos y escenas en imágenes y video) y juegos de computadora. Estas
utilizar una combinación previa, lo que permite al investigador obtener una redes neuronales tienen muchas capas ocultas que se pueden entrenar a
distribución posterior sobre todos los modelos de subconjuntos posibles. través de métodos de descenso de gradiente estocástico y brindan enfoques
Alternativamente, se pueden usar métodos de tipo lazo, que colocan un viables para el análisis de datos no estructurados con mucho poder predictivo
coeficiente previo de Laplace en los coeficientes (Genkin, Lewis y Madigan (Nguyen, Yosinski y Clune 2015). Tanto Facebook como Google han invertido
2007). Se han desarrollado rutinas para la estimación de estos enfoques recientemente en el desarrollo y la aplicación de dichos enfoques. Los
utilizando computación paralela (Allenby et al. 2014). modelos de marketing para datos no estructurados a gran escala todavía
están en pañales, pero la investigación está comenzando a surgir (Lee y
Bradlow 2011; Netzer et al.
Aproximaciones y simplificaciones. Un desarrollo empleado para el
análisis predictivo de big data es la estrategia de "divide y vencerás". Varios 2012). En este trabajo, el cálculo de métricas a partir de datos de texto,
modelos más simples se ajustan a los datos y los resultados se combinan. imagen y video utilizando métodos de procesamiento de imágenes facilita la
Los ejemplos de esta estrategia incluyen la estimación de regresión logística, aplicación de modelos estándar para datos estructurados. Algunos ejemplos
o árboles de clasificación y regresión en submuestras de los datos, que luego son Pieters, Wedel y Batra (2010), que utilizan el tamaño de archivo de las
se unen mediante técnicas de arranque, embolsado y potenciación (Varian imágenes JPEG como medida de la complejidad de las características de las
2014). Para permitir la inferencia estadística en el contexto de macrodatos imágenes publicitarias; Landwehr, Labroo y Herrmann (2011), quienes aplican
estructurados, los investigadores han utilizado variaciones de esta estrategia la transformación de imágenes a puntos de diseño seleccionados para
para superar las desventajas de utilizar una única muestra aleatoria. Dentro calcular la similitud visual de las imágenes de automóviles; y Xiao y Ding
de un marco bayesiano, los análisis de submuestras de big data con uno o (2014), quienes implementan métodos de caras propias para clasificar las
varios modelos se han combinado utilizando técnicas de metanálisis (Bijmolt, características faciales de los modelos en los anuncios.
Van Heerde y Pieters 2005; Wang, Bradlow y George 2014) o métodos de Relativamente poco trabajo en la literatura académica de marketing ha
promediación de modelos (Chung , Rust y Wedel 2009). abordado las redes neuronales profundas y otros métodos de aprendizaje
automático. Esto puede deberse a que los académicos de marketing
favorecen los métodos que representan el DGM subyacente y respaldan la
determinación de las variables de control de marketing y, por lo tanto, pueden
Otro enfoque para reducir la carga computacional de MCMC para el evitar los modelos y métodos de estimación de "una solución para todos",
análisis de big data es derivar aproximaciones analíticas a distribuciones cuyas propiedades de identificación y convergencia no pueden establecerse
posteriores complejas en modelos bayesianos. Bradlow, Hardie y Fader de manera inequívoca.
(2002) y Everson y Bradlow (2002) derivan la inferencia bayesiana de forma Sin embargo, se pueden lograr ganancias futuras si algunos de estos métodos
cerrada para modelos con antecedentes y verosimilitud no conjugados, como se pueden integrar con los enfoques de marketing más basados en la teoría.
los modelos binomial negativo y betabinomial, utilizando expansiones de Esta es un área fructífera para futuras investigaciones.
series. Una técnica relacionada que utiliza aproximaciones determinísticas
manejables a la distribución posterior es la inferencia variacional (Braun y
McAuliffe 2010). Aquí, la idea es desarrollar una aproximación (cuadrática) Cálculo. Muchos de los modelos estadísticos y econométricos utilizados
a la distribución posterior, cuyo modo se puede derivar en forma cerrada. en marketing actualmente no son escalables a big data. Los algoritmos de
MapReduce (que son el núcleo de Hadoop) brindan una solución y permiten
el procesamiento de datos muy grandes de forma masivamente paralela al
Otro método que promete acelerar los cálculos de MCMC es el muestreo de llevar el cálculo localmente a partes de los datos distribuidos en múltiples
rechazo escalable (Braun y Damien 2015), que se basa en aproximaciones núcleos en lugar de copiar los datos en su totalidad para entrada en el
estocásticas manejables a la distribución posterior (en lugar de aproximaciones software de análisis. Por ejemplo, se han desarrollado agrupaciones basadas
deterministas, como en la inferencia variacional). En conjunto, estos en MapReduce, clasificación ingenua de Bayes, descomposición de valores
desarrollos hacen que la estimación de MCMC de modelos jerárquicos en big singulares, filtrado colaborativo, regresión logística y redes neuronales. Este
data sea cada vez más factible. marco fue utilizado inicialmente por Google y se ha implementado para redes
de escritorio multinúcleo y entornos informáticos móviles.
Una forma alternativa de lograr la manejabilidad es simplificar los propios
modelos: el investigador puede utilizar modelos de probabilidad simples sin
variables predictoras que permitan soluciones de forma cerrada y cálculos La maximización de la probabilidad es adecuada para MapReduce
rápidos. El estudio de Fader y Hardie (2009) es un ejemplo en el ámbito de porque la probabilidad logarítmica consiste en una suma de términos de
CRM para evaluar el valor de por vida. Se necesita más trabajo para respaldar probabilidad logarítmica individuales que se pueden distribuir fácilmente y
la aplicación de métodos sin modelos (Goldgar 2001; Hastie, Tibshirani y permitir las operaciones Map() y Reduce(). En este contexto, los métodos de
Friedman 2008; Wilson et al. 2010). Los métodos sin modelo pueden reducir descenso de gradiente estocástico (SGD) se utilizan a menudo para optimizar
el esfuerzo computacional para que los grandes datos puedan analizarse en la probabilidad logarítmica. En lugar de evaluar el gradiente de todos los
tiempo real, pero la validación predictiva es fundamental, por ejemplo, términos en la suma, SGD toma muestras de un subconjunto de estos
mediante validación cruzada o embolsado (Hastie, Tibshirani y Friedman términos en cada paso y evalúa su gradiente, lo que economiza en gran
2008). En el caso de los datos no estructurados, el tema es más complejo. medida los cálculos.
Las redes neuronales profundas (Hinton 2007) proporcionan La paralelización de MCMC también es un área activa de investigación
y se han realizado varios avances prometedores.
Análisis de marketing para entornos ricos en datos / 107
Machine Translated by Google
recientemente (Brockwell y Kadane 2005; Neiswanger, Wang y Xing 2014; objetivos a corto y largo plazo. Definimos el análisis de marketing como los
Scott et al. 2013; Tibbitts, Haran y Liechty 2011). También parece que se métodos para medir, analizar, predecir y gestionar el rendimiento del
están realizando investigaciones para combinar características de SGD y marketing con el fin de maximizar la eficacia y el retorno de la inversión (ROI).
MCMC. Con el continuo crecimiento de la computación multinúcleo, los
algoritmos MCMC que anteriormente eran computacionalmente prohibitivos La Figura 5 muestra cómo el análisis de marketing de big data crea una
ahora se han vuelto factibles, como lo ilustra su implementación a gran escala amplitud de diagnóstico cada vez mayor, lo que a menudo es particularmente
por parte de la empresa de análisis In4mation Insights. Los avances recientes beneficioso para respaldar los objetivos a largo plazo de las empresas.
en la paralelización utilizando unidades de procesamiento gráfico que Los siguientes ejemplos de investigaciones recientes (ilustrados en la
prometen acelerar la maximización de la probabilidad y el muestreo MCMC Figura 5) aprovechan las nuevas fuentes de datos digitales para desarrollar
(Suchard et al. 2010) son igualmente prometedores pero están fuera del enfoques analíticos personalizados que generan conocimientos novedosos.
alcance de la presente exposición. El análisis de las reseñas en línea puede ayudar a una empresa a afinar sus
ofertas y brindar un mejor valor a sus clientes.
Chevalier y Mayzlin (2006) demuestran esto para las reseñas (de libros) en
Síntesis En la línea, que demostraron tener un efecto positivo en las ventas de libros. El
análisis de búsqueda de palabras clave puede ayudar a las empresas a
actualidad, solo unas pocas aplicaciones de marketing académico aprovechan
evaluar la rentabilidad del diseño de sus sitios web y la ubicación de sus
los datos a una escala extremadamente grande, especialmente los datos ricos
anuncios. Por ejemplo, Yao y Mela (2011) desarrollan un modelo estructural
no estructurados, y abordan los desafíos informáticos que conllevan. Las
dinámico para explorar la interacción de consumidores y anunciantes en la
aplicaciones de marketing favorecen los modelos estadísticos y econométricos
búsqueda de palabras clave. Encuentran que cuando los consumidores hacen
integrales que capturan el DGM en detalle, pero a menudo son (demasiado)
clic con más frecuencia, la posición del enlace publicitario patrocinado tiene
complicados computacionalmente para big data (Tabla 1). Las soluciones para
un efecto mayor. Además, el estudio muestra que las herramientas de
el análisis de big data en el futuro utilizarán lo siguiente:
búsqueda (p. ej., clasificar/filtrar en función del precio y las calificaciones)
pueden conducir a un aumento de los ingresos de la plataforma y al bienestar
1. Desarrollos en computación de alto rendimiento, incluidos los del consumidor. Los análisis de datos minoristas móviles pueden ayudar a
marcos MapReduce para procesamiento paralelo, computación una empresa a brindar mejores recomendaciones, orientar promociones,
en red y en la nube, y computación en tarjetas gráficas; 2.
personalizar ofertas y aumentar el gasto de los clientes existentes. A través
Enfoques de modelado descriptivo más simples, como modelos de
de experimentos de campo con tiendas minoristas, Hui et al. (2013) encuentran
probabilidad, o enfoques de informática y aprendizaje automático
que las promociones móviles motivan a los compradores a viajar más dentro
que facilitan los cálculos de forma cerrada, posiblemente en
combinación con el promedio de modelos y otras estrategias de de la tienda, lo que induce a un mayor gasto no planificado. El análisis social
divide y vencerás para puede ayudar a las empresas a evaluar y controlar el valor de su marca y sus
reducir el sesgo; 3. Mejoras en la velocidad de los algoritmos posiciones competitivas mediante la identificación de palabras clave de
proporcionadas por inferencia variacional, muestreo de rechazo tendencia. Por ejemplo, Nam y Kannan (2014) proponen medidas basadas en
escalable, remuestreo y reponderación, MCMC secuencial y datos de etiquetado social y muestran cómo se pueden utilizar para realizar
paralelización de algoritmos de probabilidad y MCMC; y un seguimiento del valor de marca basado en el cliente y mejorar de forma
4. Aplicación de métodos de agregación, fusión de datos, selección proactiva el rendimiento de la marca. La inteligencia competitiva y la previsión
y muestreo que reduzcan la dimensionalidad de los datos. de tendencias pueden ayudar a las empresas a identificar cambios en el
La investigación en la práctica a menudo ha implementado una combinación entorno y establecer defensas para conservar su cuota de mercado. En esta
de los componentes 1 y 2, centrándose en la exploración y la descripción y línea, Du y Kamakura (2012) muestran cómo detectar tendencias de mercado
generando información procesable a partir de datos no estructurados en con los datos de tendencias de Google utilizando modelos analíticos de
factores. El análisis de datos de flujo de clics permite la coincidencia de
tiempo real; dicho trabajo puede llamarse "pequeñas estadísticas sobre grandes datos".
La mayoría de la investigación académica actualmente se enfoca en los patrones entre el comportamiento de clientes y no clientes para ayudar a las
componentes 3 y 4: modelos de procesos rigurosos y completos que permiten empresas a identificar segmentos para la orientación por comportamiento.
la inferencia estadística sobre los mecanismos conductuales causales Trusov, Ma y Jamal (2016) muestran cómo combinar los datos de una empresa
subyacentes y la toma de decisiones óptima, en su mayoría calibrados en con datos de terceros para mejorar la recuperación de perfiles de clientes. El
datos estructurados de tamaño pequeño a moderado; dicho trabajo puede análisis de datos de GPS móvil brinda oportunidades para segmentar
llamarse "grandes estadísticas sobre pequeños datos". geográficamente a los clientes con ofertas promocionales basadas en
Es probable que las soluciones futuras tengan una naturaleza de "todas contextos situacionales. Los datos móviles permiten a las empresas probar la
las anteriores" (Tabla 2). Los enfoques de talla única pueden no ser tan eficacia de su selección de clientes y no clientes para aumentar los ingresos.
efectivos, y las técnicas deberán combinarse y combinarse para adaptarse a Usando experimentos de campo, Andrews et al. (2015) muestran que los
las propiedades específicas del problema en cuestión. Por lo tanto, el software viajeros en trenes subterráneos abarrotados tienen el doble de probabilidades
para la gestión y el procesamiento de big data y la informática de alto de responder a una oferta móvil que los viajeros en trenes subterráneos no
rendimiento probablemente se convertirán en una parte integral del ecosistema abarrotados.
de los analistas de marketing en un futuro próximo. Estos ejemplos ilustrativos facilitan la comprensión de la importancia del
análisis de big data para respaldar la toma de decisiones de marketing en una
amplia gama de áreas. El enfoque de ingeniería de marketing, defendido por
Lilien y Rangaswamy (2006), ha contribuido al reconocimiento generalizado
Análisis y modelos de que si el problema impulsa la elección de modelos, la efectividad superior
Los abundantes datos internos y/o externos permiten que el análisis de de estos modelos, la calidad de los conocimientos que
marketing cree valor para las empresas y las ayude a lograr sus objetivos.
108 / Journal of Marketing: edición especial de AMA/MSI, noviembre de 2016
Machine Translated by Google
FIGURA 5
La amplitud de diagnóstico de Big Data Marketing Analytics
Diagnóstico
Amplitud
Atribución Camino a
Externo Sentimiento Analítica Compra Retargeting
Analítica
Tendencia En línea
Analítica GPS y Revisar
Social
Móvil Analítica Segmentación
Analítica
Analítica
Competitivo conductual
Inteligencia Web Perfilado y A/B
Palabra clave Orientación
Analítica
Buscar Pruebas
Analítica
Personalización
Minorista
Recomendaciones Analítica
Marketing
Mezcla
CRM Publicidad
Analítica Analítica
Estructurado
Interno
Notas: La flecha muestra la amplitud creciente de los conocimientos de diagnóstico en función de la utilización de datos internos (en su mayoría estructurados) y datos externos
(en su mayoría no estructurados).
se mejora el rendimiento y la consistencia de las decisiones basadas en recomendaciones para acciones óptimas a niveles más altos de
ellos. Después de cinco décadas de desarrollo, la mayoría de las especificidad y granularidad. Este fue el caso cuando los datos del
estrategias y tácticas de marketing ahora tienen sus propios requisitos escáner estuvieron disponibles (ver Wittink et al. 2011), y las nuevas
analíticos y de datos bien especificados. La investigación académica de fuentes de datos digitales conducirán a desarrollos similares.
mercados ha desarrollado métodos que abordan específicamente Por ejemplo, los datos digitales sobre inteligencia competitiva y tendencias
cuestiones en áreas como fijación de precios, publicidad, promociones, externas se pueden usar para comprender los impulsores del desempeño
fuerza de ventas, gestión de ventas, competencia, distribución, marca, bajo el control directo de la empresa y separarlos de los factores
segmentación, posicionamiento, desarrollo de nuevos productos, cartera externos, como la competencia, los factores ambientales, económicos y
de productos, lealtad y adquisición y retención. . Varios subcampos de demográficos, y las tendencias generales del mercado. . De manera
marketing han tenido un amplio desarrollo de métodos analíticos, por lo similar, los experimentos de campo que controlan el impacto de los
que está disponible un conjunto cohesivo de modelos y herramientas de factores externos permiten a los minoristas en línea y fuera de línea
toma de decisiones, que incluyen análisis de CRM, análisis web y análisis calibrar los efectos del precio y las promociones sobre la demanda de
de publicidad. A continuación, analizamos con más detalle el análisis de sus productos y mejorar las previsiones de su impacto (Muller 2014). A
tres dominios centrales estrechamente conectados: optimización de continuación, nos enfocamos en los desarrollos en el modelado de la
mezcla de marketing/medios, personalización y privacidad y seguridad. mezcla de marketing en la era de los grandes datos, que involucran (1)
incluir información y métricas obtenidas de nuevas fuentes de datos
digitales para brindar mejores explicaciones de los efectos de los
elementos de la mezcla de marketing; (2) atribuir los efectos de la
Mezcla de marketing/mezcla de
combinación de marketing a nuevos puntos de contacto, asignar recursos
medios Los modelos para medir el desempeño de la mezcla de marketing de mercado a través de los medios clásicos y nuevos, y comprender y
de la empresa, pronosticar sus efectos y optimizar sus elementos se pronosticar el impacto simultáneo de los elementos de la combinación
remontan a la década de 1960. Notamos algunos de estos desarrollos de marketing en las métricas de rendimiento; y (3) evaluar los efectos
históricos en la subsección "Análisis" (para revisiones, véase Gatignon causales de las variables de control de marketing a través de
1993; Hanssens 2014; Hanssens, Parsons y Schultz 2001; Leeflang et representaciones estructurales del comportamiento del consumidor, IV y experimentos de c
al. 2000; Rao 2014). A medida que se dispone de nuevas fuentes de
datos, aumentan las oportunidades de obtener explicaciones causales Incorporación de nuevas fuentes de datos. La investigación en la
mejores y más detalladas, así como asignación de la mezcla de marketing se beneficia significativamente de dos
Análisis de marketing para entornos ricos en datos / 109
Machine Translated by Google
desarrollos en la disponibilidad de datos. El primero es la mayor disponibilidad en la propia ubicación de la empresa (geofencing) frente a la ubicación de un
de datos extensos a nivel de clientes dentro de los entornos de la empresa, competidor (geoconquesting). Encuentran que la orientación geográfica
mediante la realización de encuestas directas a los clientes, la medición de competitiva produce rendimientos crecientes en la profundidad de los
actitudes o satisfacción, o el registro del comportamiento de los clientes en descuentos promocionales.
tiendas físicas y en sitios web y aplicaciones móviles. Hanssens et al. (2014) La investigación antes mencionada destaca la convergencia de diferentes
aprovechan una fuente de tales datos, las métricas de mentalidad del medios (televisión, Internet y dispositivos móviles) y los efectos indirectos
consumidor, para resultantes de las acciones de mezcla de marketing realizadas a través de
modelar mejor el impacto de las acciones de marketing en el rendimiento de esos medios. La disponibilidad de rutas a nivel individual para comprar datos,
las ventas. Encuentran que la combinación de métricas de marketing mix y a través de múltiples canales en línea (p. ej., anuncios gráficos, afiliados,
actitudinales en modelos VAR mejora tanto la predicción de ventas como las referencias, búsqueda), a través de dispositivos (p. ej., computadoras de
recomendaciones para la asignación de marketing mix. El segundo desarrollo escritorio, tabletas, teléfonos inteligentes) o a través de puntos de contacto en
implica el uso de datos recopilados sobre clientes y prospectos fuera del línea y fuera de línea, creará oportunidades significativas para comprender y
entorno de la empresa, además de los datos que están disponibles dentro de predecir el impacto de las acciones de marketing a un nivel muy granular. Por
la empresa. Esto puede aliviar el problema de que las actividades de los un lado, estos datos han puesto en primer plano el problema de la atribución
clientes (potenciales) con los competidores no se pueden observar en los datos (asignar crédito a cada punto de contacto para la conversión final). Li y Kannan
internos y puede ayudar a determinar completamente su ruta de compra. Por (2014) proponen una metodología para abordar ese problema. Al igual que la
ejemplo, las medidas de WOM en línea (Godes y Mayzlin 2004), las reseñas asignación de la mezcla de marketing, la atribución implica un problema de
en línea (Chevalier y Mayzlin 2006) o los flujos de clics (Moe 2003) se pueden asignación de recursos de marketing. Sin embargo, incluso si el problema de
incluir en los modelos de mezcla de marketing para brindar mejores atribución se resuelve por completo, es solo un paso intermedio hacia la
explicaciones y predicciones sobre las elecciones y las ventas de los predicción de sus efectos en todo el recorrido del cliente y hacia la obtención
consumidores. Específicamente, Moe (2003) utiliza datos de flujo de clics para de una asignación óptima de toda la mezcla de marketing. Se pueden esperar
categorizar las visitas como visitas de compra, navegación o búsqueda sobre muchos desafíos. El modelado debe acomodar los efectos indirectos entre las
la base de los patrones de navegación observados y muestra que estos acciones de marketing y debe conciliar datos móviles y en línea más granulares
diferentes tipos de visitas están asociados con diferentes probabilidades de (p. ej., derivados de redes sociales) con datos fuera de línea más agregados y
compra. Si bien se han logrado avances significativos, la investigación adicional coordinar los diferentes ciclos de planificación para diferentes canales
debe centrarse en establecer qué métricas específicas funcionan y cuáles no, publicitarios.
y cómo pueden incluirse mejor en los modelos de elección individual, ventas
agregadas y desempeño del mercado.
Además, el aumento de las opciones para que los especialistas en
marketing influyan en los consumidores, como a través del contenido generado
por la empresa en las redes sociales y el marketing de contenido, en el que las
Atribución y asignación a nuevos puntos de contacto. Los datos de nuevos empresas se convierten en creadores y editores de contenido, ha dado
canales y dispositivos están contribuyendo al desarrollo de nuevas formas en importancia al problema de comprender los efectos individuales de estas
las que se pueden tomar mejores decisiones de mezcla de marketing. Por opciones como parte. de la mezcla de mercadotecnia. Se necesitan métodos y
ejemplo, mientras que Prins y Verhoef (2007) examinan las sinergias entre el técnicas más nuevos para medir con precisión su impacto. Por ejemplo,
marketing directo y las comunicaciones masivas, Risselada, Verhoef y Bijmolt Johnson, Lewis y Nubbemeyer (2015) miden el efecto de los anuncios gráficos
(2014) aprovechan los datos de las redes sociales de los clientes para mediante una nueva metodología que facilita la identificación de los efectos del
comprender los efectos dinámicos del marketing directo y la influencia social. tratamiento de los anuncios en un experimento aleatorio. Muestran que es
en la adopción de un producto de alta tecnología. Nitzan y Libai (2011) utilizan mejor que los anuncios de servicio público y las pruebas A/B de intención de
datos sobre las redes sociales individuales de más de un millón de clientes tratar para minimizar los costos de las pruebas. Después de medir dichos
para comprender cómo los vecindarios de la red influyen en el peligro de efectos individuales, es posible asignar presupuestos de manera óptima a los
deserción de un proveedor de servicios. Joo et al. (2014) se centran en las elementos de marketing/combinación de medios.
palabras clave de marca (a diferencia de las genéricas) y encuentran que los
anuncios de televisión afectan la cantidad de búsquedas relacionadas en línea. Albers (2012) proporciona pautas sobre cómo se pueden desarrollar
ayudas prácticas para la toma de decisiones para la asignación óptima de la
mezcla de marketing. Señala la necesidad de estudiar el comportamiento de
De manera similar, Liaukonyte, Teixeira y Wilbur (2015), utilizando datos los gerentes para determinar mejor la especificación de los modelos del lado de la oferta.
cuasiexperimentales a gran escala de publicidad televisiva y frecuencia de Uno de los beneficios importantes de trabajar en un entorno rico en datos
compras en línea en ventanas de dos minutos, encuentran que la publicidad radica en la creación de ayudas para la toma de decisiones para mejorar el
televisiva influye en las compras en línea y que el contenido publicitario juega presupuesto y asignar mejor las inversiones en la combinación de marketing,
un papel clave. Estos estudios destacan el papel de los efectos cruzados en la diferentes productos, segmentos de mercado y clientes.
planificación de la mezcla de marketing. En el contexto de los nuevos Hanssens (2014) proporciona una revisión de los algoritmos de optimización
dispositivos, Danaher et al. (2015) utilizan datos de panel para examinar la que abarcan enfoques de un solo período y de varios períodos y son apropiados
efectividad de las promociones de cupones móviles. Encuentran que la para entornos monopolísticos y competitivos. Naik, Raman y Winer (2005)
ubicación y el tiempo de entrega de los cupones (en relación con el tiempo de modelan explícitamente el comportamiento estratégico de una empresa que
compra) influyen en el canje. Fong, Fang y Luo (2015) examinan la eficacia de anticipa cómo los competidores probablemente tomarán decisiones futuras y
la orientación geográfica de las promociones móviles mediante un experimento razona hacia atrás para deducir su propia decisión óptima en respuesta.
de campo aleatorio e investigan la orientación.
Aunque la mayor parte del trabajo existente se ha centrado en asignar la
110 / Journal of Marketing: edición especial de AMA/MSI, noviembre de 2016
Machine Translated by Google
presupuesto en productos individuales, Fischer et al. (2011) proponen son progresistas y descuentan los ingresos futuros. Los investigadores
un enfoque heurístico para resolver el problema de asignación de estiman su modelo con MCMC paralelo, lo que les permite adaptarse a
presupuesto de marketing dinámico para empresas multiproducto y la heterogeneidad a nivel individual y diseñar estrategias de marketing
multisegmento (países). Este enfoque, implementado en la empresa dirigidas. Este trabajo es una de las primeras aplicaciones de un modelo
multinacional Bayer, es un ejemplo de una dirección de modelado que estructural en datos relativamente grandes y es un desarrollo prometedor
resuelve problemas prácticos apremiantes. porque es importante tener en cuenta el comportamiento prospectivo en
los modelos de mezcla de marketing, incluso aquellos calibrados en
Evaluación de la causalidad de los efectos de la mezcla de marketing. experimentos de campo.
La evaluación de la causalidad en los modelos de mezcla de marketing
ha recibido una amplia atención en el mundo académico, pero
lamentablemente aún no ha recibido tanta atención en la industria. Si
Personalización
una variable de control de marketing se determina endógenamente pero
no se tiene en cuenta en el modelo (debido, por ejemplo, a variables La personalización lleva la asignación de la combinación de marketing
faltantes, acciones de gestión que dependen de los resultados de un paso más allá, ya que adapta la oferta de productos o servicios y
ventas), el DGM no se captura con precisión. En ese caso, las otros elementos de la combinación de marketing a las necesidades de
predicciones de los efectos de este elemento de la mezcla de marketing estarán
sesgadas
los (Rossi
usuarios 2014). (Khan, Lewis y Singh, 2009). Hay tres métodos
individuales
Este problema puede aliviarse si se pueden encontrar IV exógenas que principales de personalización. (1) La personalización pull brinda un
estén relacionadas con la variable de control endógena. servicio personalizado cuando un cliente lo solicita explícitamente. Un
En primer lugar, la variedad de big data podría ayudar a encontrar ejemplo es Dell, que permite a los clientes personalizar la computadora
mejores IV, lo cual es necesario porque los IV suelen ser problemáticos. que compran en términos de características de producto preespecificadas.
En el caso de la publicidad televisiva, Shapiro (2014) explota las (2) La personalización pasiva muestra información personalizada sobre
discontinuidades en el gasto publicitario en áreas de mercado locales productos o servicios en respuesta a actividades relacionadas con el
designadas. Los diseños de discontinuidad de regresión que aprovechan cliente, pero el consumidor tiene que actuar sobre esa información. Por
las variaciones en una variable de tratamiento posiblemente endógena ejemplo, Catalina Marketing Services, un líder de la industria de cupones
en cualquier lado de un umbral no son económicos en el uso de datos y, personalizados entregados en el mostrador de pago de las tiendas
por lo tanto, pueden beneficiarse de grandes datos (Hartmann, Nair y minoristas físicas, personaliza los cupones sobre la base del historial
Narayanan 2011). Sin embargo, los modelos con IV generalmente no de compras de los compradores registrado en sus tarjetas de fidelización.
predicen mejor fuera de la muestra (Ebbes, Papies y Van Heerde 2011). Los sistemas de recomendación representan otro ejemplo de este
Los investigadores han desarrollado varios métodos sin instrumentos enfoque. (3) La personalización push lleva la personalización pasiva un
para ayudar en situaciones en las que no se pueden encontrar paso más allá al enviar un producto o servicio personalizado directamente
instrumentos válidos (Ebbes et al. 2005; Park y Gupta 2012). Estos a los clientes sin su solicitud explícita. Un ejemplo de esto es Pandora,
métodos son adecuados para la aplicación automatizada en entornos de que crea estaciones de radio personalizadas en línea o móviles. Las
producción de datos a gran escala en la industria, en los que la búsqueda estaciones de radio se adaptan individualmente sobre la base de las
de instrumentos válidos caso por caso a menudo es inviable. selecciones de música iniciales de los usuarios y las similitudes entre los
atributos de las canciones extraídos de la base de datos de Music
En segundo lugar, los entornos de datos digitales permiten experimentos Genome.
de campo que permiten al investigador evaluar los efectos causales.
de variables de control de marketing (para investigaciones en este Para cada uno de estos tipos de personalización, hay tres posibles
contexto, véase Andrews et al. 2015; Hui et al. 2013). En tercer lugar, en niveles de granularidad: (1) personalización masiva, en la que todos los
el modelado estructural de la oferta y la demanda, los nuevos tipos de consumidores reciben la misma oferta y/o combinación de marketing,
datos pueden ayudar a calibrar las especificaciones de los modelos de personalizada a su gusto promedio; (2) personalización a nivel de
manera más precisa y eficiente. Chung, Steenburgh y Sudhir (2014) segmento, en la que se identifican grupos de consumidores con
brindan un ejemplo ilustrativo en el que estiman un modelo estructural preferencias homogéneas y se personaliza el marketing mix de la misma
dinámico de respuesta de la fuerza de ventas a un plan de compensación manera para todos los consumidores de un segmento; y (3)
basado en bonos. En lugar de asumir los factores de descuento utilizados personalización a nivel individual, en la que cada consumidor recibe
por los vendedores con visión de futuro, como se ha hecho en ofertas y/o elementos de la mezcla de marketing personalizados para
investigaciones anteriores, los estiman a partir de datos de campo sus gustos y comportamientos individuales. Sin embargo, la disponibilidad
utilizando una combinación de restricciones de exclusión y un modelo de big data con amplia información a nivel individual no necesariamente
específico para el entorno institucional. hace deseable que las empresas personalicen al nivel más granular. Big
Por último, es importante tener en cuenta el comportamiento data ofrece a las empresas la oportunidad de elegir un nivel óptimo de
prospectivo de los consumidores al desarrollar modelos de mezcla de granularidad para diferentes elementos de la combinación de marketing,
marketing que den cuenta de la idea de que los consumidores pueden según la existencia de economías de escala y el ROI. Por ejemplo, una
maximizar sus ganancias en un horizonte finito o infinito, en lugar de ser empresa como Ford Motor Company desarrolla una imagen de marca
miopes. Aunque la identificación de estos modelos se beneficia de una global (masiva); personaliza la publicidad de productos y marcas para
mayor variación en los datos de gran volumen y variedad, dichos modelos segmentos de clientes; personaliza el esfuerzo de ventas, los precios y
presentan desafíos computacionales que aún deben resolverse. Liu, las promociones a nivel individual; y personaliza las experiencias en el
Montgomery y Srinivasan (2015) abordan este problema mediante la automóvil utilizando tecnología de imágenes.
construcción de un modelo de decisiones de planificación financiera de
los consumidores basado en el supuesto de que
Análisis de marketing para entornos ricos en datos / 111
Machine Translated by Google
Sistemas de recomendación. Los sistemas de recomendación son para ser dirigido a través de los consumidores, el tiempo, las redes publicitarias
poderosas herramientas de personalización, con las mejores aplicaciones de y los sitios web en un nivel muy alto de granularidad. Hemos mencionado la
su clase de Amazon y Netflix. Existen dos tipos básicos de motores de personalización adaptativa de Pandora como otro ejemplo en una sección
recomendación que se basan en filtrado de contenido o filtrado colaborativo, anterior. Por lo tanto, la personalización adaptativa lleva la automatización del
pero también existen sistemas de recomendación híbridos que combinan marketing a la siguiente etapa. En lugar de automatizar decisiones de
características de ambos tipos. marketing simples, automatiza todo el circuito de retroalimentación de CLM.
El filtrado de contenido involucra a agentes digitales que hacen La automatización ofrece el beneficio adicional de acelerar drásticamente el
recomendaciones basadas en la similitud entre las preferencias pasadas de ciclo de personalización.
un cliente por productos y servicios. El filtrado colaborativo predice las Los sistemas de personalización adaptables requieren una participación
preferencias de un cliente utilizando las de clientes similares. Los sistemas proactiva mínima del usuario y se basan principalmente en datos observados
basados en modelos utilizan métodos estadísticos para predecir estas de compra, uso o flujo de clics. Aprenden los gustos de los consumidores de
preferencias; la literatura de marketing se ha centrado predominantemente en forma adaptativa a lo largo del tiempo mediante el seguimiento de los
estos (Ansari, Essegaier y Kohli 2000). La investigación ha demostrado que comportamientos cambiantes de los consumidores. Desde el punto de vista
los sistemas basados en modelos superan a los motores de recomendación del consumidor, estos sistemas son fáciles de usar: el usuario solo interactúa
más simples, pero lo hacen a costa de una mayor carga computacional. con el servicio mientras se registran los datos de uso y el servicio se adapta automáticamente.
También ha demostrado que debido a que muchos consumidores no quieren Los sistemas de personalización adaptable en línea y móvil implementan
o no pueden proporcionar calificaciones de productos de manera activa, falta estrategias CLM completamente automatizadas mediante la recopilación y el
gran parte de la información en los sistemas de recomendación basados en análisis de datos, la predicción del comportamiento del usuario, la
calificaciones. Tratar adecuadamente con esta información faltante en los personalización de los servicios y la evaluación de la eficacia de las
sistemas de recomendación basados en calificaciones ubicuas puede hacer recomendaciones en un ciclo continuo y automatizado.
que las recomendaciones sean mucho más efectivas (Ying, Feinberg y Wedel Zhang y Krishnamurthi (2004) fueron de los primeros en desarrollar un
2006). Además, la mayoría de los sistemas producen recomendaciones para enfoque de personalización adaptativa. Personalizan los descuentos de
los consumidores sobre la base de sus preferencias o elecciones previstas, precios promocionales en línea mediante el uso de un modelo integrado de
pero no necesariamente sobre la base de su respuesta prevista a las incidencia, cantidad y tiempo de compra que pronostica la respuesta de los
recomendaciones mismas. Tener en cuenta la receptividad al hacer consumidores al esfuerzo promocional a lo largo del tiempo, y emplean la
recomendaciones mediante la utilización de ideas de segmentación basada maximización de ganancias numéricas para determinar de forma adaptativa
en respuestas puede aumentar en gran medida su eficacia (Bodapati 2008). el tiempo y la profundidad de las promociones personalizadas. Esta aplicación
es conceptualmente similar a los servicios de Catalina Marketing en tiendas
offline. En una extensión de este trabajo, Zhang y Wedel (2009) investigan
Conceptualmente, la personalización consiste en (1) conocer las las implicaciones de ganancias de la personalización adaptativa en línea y
preferencias del consumidor, (2) adaptar las ofertas a los consumidores y (3) fuera de línea, comparando tres niveles de granularidad: masivo, segmento e
evaluar la efectividad de la personalización. individual. Los resultados muestran que la personalización a nivel individual
Algunos de los problemas con los sistemas de recomendación basados en es rentable, pero sobre todo en el canal online. Chung, Rust y Wedel (2009)
calificaciones han llevado a las empresas (p. ej., Amazon) a utilizar datos diseñan y evalúan un enfoque de personalización adaptable para la música
obtenidos discretamente de los clientes como entrada para la personalización móvil. Su enfoque personaliza la música utilizando datos de escucha, así
de servicios en línea y móviles. Estas tres etapas se han utilizado durante como los atributos de la música que se utilizan como variables de predicción.
mucho tiempo en estrategias de marketing de ciclo cerrado (CLM). En entornos Desarrollan un algoritmo escalable de filtrado de partículas en tiempo real (un
digitales, CLM puede automatizarse completamente en un ciclo continuo, lo algoritmo MCMC dinámico) para la personalización que se ejecuta en
que da lugar a sistemas de personalización adaptativos. dispositivos móviles. Se incorpora un elemento de sorpresa a través de
recomendaciones aleatorias, que evitan que el sistema se centre en un
conjunto demasiado limitado de gustos de los usuarios. El modelo es discreto
Personalización adaptativa. Los sistemas de personalización adaptativa para los usuarios y no requiere ninguna entrada del usuario más que el
llevan la personalización un paso más allá al proporcionar servicios comportamiento de escucha del usuario para las canciones que se descargan
personalizados dinámicamente en tiempo real (Steckel et al. 2005). Por automáticamente en el dispositivo. Las pruebas de campo han demostrado
ejemplo, Groupon personaliza ofertas diarias de productos y servicios de que este sistema supera a los algoritmos alternativos similares a los de
minoristas locales o nacionales y las entrega por correo electrónico o en Pandora.
dispositivos móviles; a medida que recopila más datos sobre el suscriptor
individual, las ofertas se personalizan con mayor precisión. Otro ejemplo es la
compra y venta de impresiones de anuncios gráficos en línea en subastas de Hauser et al. (2009) desarrollan un sistema para la personalización
ofertas en tiempo real en plataformas de intercambio de anuncios. Estas adaptativa del diseño de sitios web. Este enfoque, al que denominan
subastas se ejecutan de forma totalmente automática en el tiempo (menos de "transformación del sitio web", implica hacer coincidir el contenido, el aspecto
una décima de segundo) que tarda un sitio web en cargarse. El anuncio y la "sensación" del sitio web con una cantidad fija de estilos cognitivos. En
ganador se muestra instantáneamente en el sitio del editor. Para construir primer lugar, el sistema estima la probabilidad de cada segmento de estilo
reglas de oferta autónomas, los anunciantes (1) rastrean el comportamiento cognitivo para los visitantes del sitio web sobre la base de los datos de
de navegación de los consumidores en los sitios web, (2) exponen inicialización que involucran los flujos de clics de los encuestados y los juicios
selectivamente segmentos definidos sobre la base de esos comportamientos de morfologías alternativas de la página web. En un segundo ciclo, la
a sus anuncios gráficos en línea y (3) registran el comportamiento de clics de asignación de morfología óptima se calcula usando programación dinámica,
los consumidores en respuesta. a sus anuncios. Esto permite la colocación de maximizando tanto la ganancia inmediata esperada como la ganancia futura
anuncios descontada obtenida cuando el
112 / Journal of Marketing: edición especial de AMA/MSI, noviembre de 2016
Machine Translated by Google
usuario realiza una compra en el sitio web. El sistema equilibra la compensación entre promulgarse en los Estados Unidos. Goldfarb y Tucker (2010) muestran que la
la explotación (es decir, la presentación de opciones de productos que mejor se regulación de la privacidad que restringe el uso de datos personales puede hacer que
adaptan a las preferencias previstas de los usuarios) y la exploración (es decir, la los anuncios gráficos en línea sean menos efectivos e impone un costo, especialmente
introducción de sorpresas para ayudar a mejorar la estimación). Morphing puede a las empresas en línea más jóvenes y pequeñas que dependen de los ingresos
mejorar sustancialmente la rentabilidad esperada realizada en el sitio web. Los publicitarios (Campbell, Goldfarb y Tucker 2015).
investigadores han aplicado ideas similares a la transformación de anuncios publicitarios En segundo lugar, es cada vez más probable que las empresas se vigilen a sí mismas.
(Urban et al. 2014), que se colocan automáticamente en sitios web y se relacionan con Actualmente, la mayoría de las empresas comunican las políticas de privacidad a sus
los consumidores en función de sus probabilidades de pertenencia al segmento para clientes. Respetar la privacidad de los clientes es una buena práctica empresarial y
maximizar las tasas de clics. ayuda a la empresa a establecer relaciones con los clientes. La investigación de Tucker
(2014) respalda esta noción.
La personalización adaptativa crecerá con la llegada del Internet de las cosas y En un experimento de campo, muestra que cuando un sitio web brinda a los
las interfaces de usuario naturales, a través de las cuales los consumidores interactúan consumidores más control sobre su información personal, la tasa de clics en anuncios
con sus dispositivos digitales a través de la voz, la mirada, la expresión facial y el personalizados se duplica. Al comparar los efectos de las políticas de exclusión
control del movimiento. A medida que estos datos estén disponibles para los voluntaria, inclusión voluntaria y prohibición de seguimiento en la industria de la
especialistas en marketing a gran escala, permitirán el análisis de atención publicidad gráfica, Johnson, Lewis y Nubbemeyer (2015) encuentran que la política de
automatizado, lo que potencialmente beneficiará la personalización de la mezcla de exclusión voluntaria tiene el menor impacto negativo en los ingresos de los editores y
marketing de muchas maneras. el excedente de los anunciantes. . Cada vez más, se espera que los gerentes
comprendan mejor las nuevas tecnologías y protocolos para proteger la seguridad de
Privacidad y seguridad A medida
los datos. Además, la automatización del marketing (como, por ejemplo, la
que se recopilan más datos de clientes y avanza la personalización, la privacidad y la personalización adaptativa) evitará la intrusión humana y brindará a los clientes una
seguridad se han convertido en temas críticos para el análisis de big data en marketing. mayor confianza de que su privacidad está protegida. Lo que es más importante, las
Según una encuesta reciente (Dupre 2015), más de las tres cuartas partes de los empresas deberán asegurarse de que la información confidencial de los clientes se
consumidores piensan que los anunciantes en línea tienen más información sobre distribuya a través de sistemas separados, que los datos sean anónimos y que el
ellos de la que se sienten cómodos, y aproximadamente la mitad de ellos cree que los acceso a la información privada de los clientes esté restringido dentro de la
sitios web ignoran las leyes de privacidad. Estas percepciones son indicativas de dos organización. Con las brechas de seguridad cada vez más comunes, existe la opinión
realidades. En primer lugar, las empresas han estado recopilando datos de múltiples emergente de que las empresas no pueden hacer que sus sistemas sean
fuentes y fusionándolos para obtener mejores perfiles de sus clientes. La fácil completamente seguros contra las brechas. Además de tomar medidas para proteger
disponibilidad de datos de fuentes gubernamentales (como censos, salud, empleo y los datos, las empresas deben contar con planes de respuesta ante filtraciones de
metadatos telefónicos, facilitada por el "Plan de Datos Abiertos" publicado por la Casa datos.
Blanca en 2013) y la disminución de los costos de almacenamiento y procesamiento
de datos han llevado a un gran ROI en tales esfuerzos (Rust, Kannan y Peng 2002). La implicación de los factores antes mencionados para el análisis de marketing
es que habrá un mayor énfasis en la minimización y el anonimato de los datos (ver
también Verhoef, Kooge y Walk 2016). La minimización de datos requiere que los
comerciantes limiten el tipo y la cantidad de datos que recopilan y retengan y eliminen
Sin embargo, la combinación de conjuntos de datos ha llevado al “efecto mosaico”, los datos que ya no necesitan. Los datos pueden volverse anónimos usando
que genera información sobre los consumidores que debería ser privada pero que, sin procedimientos como kanonimización (cada registro es indistinguible de al menos k
embargo, se revela en los datos integrados (p. ej., el sitio web de búsqueda de 1 otros), eliminando información de identificación personal, recodificando, intercambiando
personas Spokeo explota dichos datos). En segundo lugar, las leyes de privacidad y la o aleatorizando datos, o encriptando irreversiblemente campos de datos para convertir
tecnología de seguridad no han seguido el ritmo de las tecnologías de recopilación, datos en un formato no legible por humanos. forma.
almacenamiento y procesamiento de datos. Esto ha dado lugar a un entorno en el que
prevalecen las infracciones de seguridad de alto perfil y el mal uso de la información
privada del consumidor. En los últimos diez años, se han reportado más de 5000 Sin embargo, aunque estos métodos protegen la privacidad, es posible que no
filtraciones importantes de datos, la mayoría en la industria financiera. Según una disuadan de las filtraciones de datos (Miller y Tucker 2011).
investigación realizada por IBM y Ponemon Institute, el costo promedio de una filtración
de datos se acerca a los $4 millones, aproximadamente $150 por registro robado. Como resultado de la minimización de datos, es posible que estén disponibles
Ejemplos de violaciones recientes de seguridad de datos de alto perfil son las que menos datos a nivel individual para el desarrollo analítico en la investigación académica
afectaron a Target, Sony Pictures Entertainment, Home Depot y Ashley Madison. Con y aplicada, y cada vez más datos estarán disponibles solo en forma agregada. La
el aumento del almacenamiento en la nube, se prevé que las violaciones de datos se investigación en análisis de marketing debe desarrollar procedimientos para acomodar
vuelvan más comunes. datos minimizados y anonimizados sin degradar el poder diagnóstico y predictivo, y
métodos analíticos que preserven el anonimato. Por ejemplo, la Comisión Federal de
Comercio requiere que los proveedores de datos, como Experian o Claritas, protejan
Es probable que surjan dos tendencias que cambiarán el statu quo. Primero, los la privacidad de los consumidores individuales agregando datos a nivel individual a
gobiernos promulgarán leyes de privacidad cada vez más estrictas para proteger a sus nivel de código postal. Los vendedores directos confían en estos datos, pero
ciudadanos. Esto limitará la forma en que se pueden usar los grandes datos y el tradicionalmente ignoran la naturaleza anónima de la información a nivel de código
análisis con fines de marketing. La Unión Europea, que ya tiene leyes de privacidad postal al desarrollar sus campañas de marketing dirigidas. Steenburgh, Ainslie y
más estrictas, está considerando expandir el llamado “derecho al olvido” a cualquier Engebretson (2003) muestran cómo aprovechar
empresa que recopile datos personales de clientes (Dwoskin 2015). Leyes similares
pero menos restrictivas pronto podrían
Análisis de marketing para entornos ricos en datos / 113
Machine Translated by Google
datos de códigos postales “masivamente categóricos” a través de un modelo términos de la continuidad del aprendizaje automático a los modelos basados en la
teoría?
bayesiano jerárquico. El modelo permite al investigador combinar datos de varias
fuentes en diferentes niveles de agregación. 5. ¿Cuáles son las estrategias y enfoques viables de análisis de datos para el modelado
de diagnóstico, predictivo y prescriptivo de datos no estructurados a gran escala?
Además, si los modelos utilizados para el análisis predictivo se conocen a priori y
tienen suficientes estadísticas asociadas o distribuciones posteriores (p. ej., medias,
6. ¿Cómo se pueden ampliar las técnicas de computación cognitiva y de aprendizaje
varianzas, productos cruzados), se pueden conservar para permitir el análisis sin
profundo para analizar e interpretar datos de marketing no estructurados? ¿Cómo
pérdida de información (en lugar de utilizar el datos originales). Los métodos para
pueden incorporarse elementos creativos de la mezcla de marketing en técnicas
analizar datos agregados que se adaptan a las inferencias sobre la heterogeneidad predictivas y prescriptivas?
no observada del consumidor pueden brindar soluciones en algunos casos. Los
métodos de imputación de datos faltantes se pueden utilizar para obtener
información a nivel del consumidor a partir de datos agregados (p. ej., Musalem, Mezcla de marketing
Bradlow y Raju 2008) o para datos en los que se han suprimido campos, variables
1. ¿Cómo se pueden alinear los datos granulares en línea y móviles con datos fuera de
o registros. Los métodos de imputación también son útiles cuando solo una parte línea más agregados para arrojar luz sobre el camino hacia la compra y facilitar la
de los clientes optan por compartir su información porque el aumento de datos orientación por comportamiento? ¿Cómo se pueden incorporar metadatos de
puede imputar datos faltantes de aquellos clientes que eligen no participar. La contextos y datos no estructurados sobre creatividades en el análisis de datos de
investigación adicional en esta área debe centrarse en cómo se puede proteger la ruta de compra?
privacidad de los clientes. en el uso de datos de marketing enriquecidos mientras 2. ¿Cómo puede el modelado de ROI identificar y cuantificar con mayor precisión el
impacto financiero simultáneo de las actividades de marketing en línea y fuera de
se maximiza la utilidad que se puede derivar de ellos mediante el desarrollo de
línea?
modelos y algoritmos que pueden preservar o garantizar la privacidad del
3. ¿Qué nuevas técnicas y métodos pueden medir con precisión la sinergia, el remanente
consumidor.
y el desbordamiento entre medios y dispositivos utilizando datos integrados de ruta
de compra?
4. ¿Cómo puede la atribución entre medios, canales y dispositivos dar cuenta del
comportamiento estratégico de los consumidores y la endogeneidad en la orientación?
Síntesis y futuras direcciones de investigación Los desarrollos en
5. ¿Cómo se pueden incorporar los ciclos de planificación para diferentes instrumentos
curso en el análisis de big data (ver Tabla 1) implican (1) la inclusión de datos
de marketing en los modelos de optimización de la mezcla de marketing?
obtenidos de fuentes de datos digitales externas con datos fuera de línea para
mejorar las explicaciones y predicciones de los efectos de la mezcla de marketing;
Personalización
(2) la atribución de los efectos de la mezcla de marketing a través de una mejor
comprensión del impacto simultáneo de los elementos de la mezcla de marketing 1. ¿Qué contenido debe personalizarse, a qué nivel de granularidad y con qué
frecuencia? ¿Cómo se puede adaptar el contenido a los consumidores individuales
mientras se adaptan a sus diferentes ciclos de planificación; (3) la caracterización
utilizando información a nivel individual y gestión de campañas automatizada?
de toda la ruta de compra a través de canales fuera de línea y en línea y múltiples
dispositivos y asignación dinámica de recursos a puntos de contacto individuales
2. ¿Cómo pueden las empresas obtener información a nivel individual a partir de big
dentro de esa ruta; (4) la evaluación de los efectos causales de las variables de
data, utilizando técnicas más rápidas y menos costosas desde el punto de vista
control de marketing a través de representaciones estructurales del comportamiento computacional para dar lecturas de las intenciones de los clientes en tiempo real?
del consumidor, variables instrumentales, métodos sin instrumentos y experimentos
3. ¿Cómo pueden las empresas personalizar la combinación de puntos de contacto (a
de campo; y (5) personalización de la mezcla de marketing en ciclos de circuito través de canales, dispositivos y puntos en el embudo de compra) para los clientes
cerrado totalmente automatizados. Los estudios futuros deben basarse en estas en ciclos cerrados para que su experiencia sea siempre excelente?
direcciones de investigación y centrarse en los siguientes temas y preguntas
(Tabla 2). 4. ¿Qué papel pueden desempeñar los sistemas cognitivos, la inteligencia artificial
general y los sistemas de análisis de atención automatizados en la entrega de
experiencias de cliente personalizadas?
Grandes datos de marketing Seguridad y privacidad
1. ¿Cómo puede la fusión de datos generados dentro de la empresa con datos 1. ¿Qué técnicas se pueden usar para reducir la reacción a la intrusión, ya que una
generados fuera de la empresa aprovechar los metadatos en el contexto de las mayor personalización aumenta las posibilidades de que resulte contraproducente?
interacciones con los clientes? ¿Cómo se puede hacer esto de una manera que
permita análisis en tiempo real y decisiones en tiempo real? 2. ¿Qué nuevas metodologías deben desarrollarse para dar a los clientes más control
2. ¿Qué nuevas metodologías y tecnologías facilitarán la integración de enfoques de en la personalización de sus propias experiencias y mejorar la eficacia de las
“pequeñas estadísticas sobre grandes datos” con enfoques de “grandes estadísticas técnicas de minimización de datos?
sobre pequeños datos”? ¿Cuáles son las compensaciones clave que deben hacerse
para estimar modelos realistas que sean aproximaciones suficientes? 3. ¿Cómo se pueden desarrollar soluciones de modelado, software y datos para mejorar
la seguridad y la privacidad de los datos y, al mismo tiempo, maximizar las
3. ¿Cómo se pueden utilizar los experimentos de campo para generar grandes datos oportunidades de marketing personalizadas?
(observacionales) para obtener estimaciones válidas de los efectos del marketing lo
Para proporcionar ejemplos más detallados de lo que puede implicar dicha
suficientemente rápido como para permitir la eficiencia operativa sin retrasar los
investigación adicional, considere el punto 4 bajo "Grandes datos de marketing".
procesos de marketing?
En la investigación académica y aplicada, los datos no estructurados, como videos,
4. ¿Cómo se pueden combinar los métodos de aprendizaje automático con los métodos
econométricos para facilitar la estimación de los efectos causales de los grandes textos e imágenes, se utilizan como entrada para el modelado predictivo al introducir
datos a altas velocidades? ¿Qué condiciones específicas determinan dónde deben la estructura a través de la derivación de datos numéricos: métodos de bolsa de
diseñarse estos nuevos métodos en palabras para
114 / Journal of Marketing: edición especial de AMA/MSI, noviembre de 2016
Machine Translated by Google
información textual, etiquetas y descriptores para imágenes y videos, de manera fragmentaria. Lo que se necesita es un enfoque integral
etc. Sin embargo, además de requerir diccionarios específicos del de la combinación de marketing y el modelo de atribución que integre
contexto y clasificación supervisada, ninguna de estas técnicas estos diversos componentes de la combinación de marketing y aborde
captura completamente el significado completo contenido en los todos estos problemas simultáneamente. Los datos ya no son una
datos no estructurados. Por ejemplo, el conteo de palabras en reseñas limitación para hacerlo, aunque será necesario combinar los datos de
o blogs ignora la dependencia entre las palabras y la sintaxis y la varias fuentes. Es probable que se necesite una estrecha colaboración
secuencia lógica de las oraciones. La investigación ya ha utilizado entre académicos y empresas para garantizar la disponibilidad de
métodos de aprendizaje automático para detectar idiomas específicos datos y recursos computacionales. Es necesario desarrollar nuevos
y proporcionar resúmenes de texto significativos. métodos que puedan combinar técnicas como el modelado VAR, los
Por lo tanto, se pueden utilizar para proporcionar una interpretación modelos jerárquicos de Bayes y de elección, la selección de variables
de los datos textuales. Las soluciones de aprendizaje automático en y la reducción y fusión de datos.
la nube de Google para la visión por computadora pueden interpretar La investigación adicional debería investigar qué fuentes de datos y
el contenido de la imagen; clasificar imágenes en categorías; y modelos son adecuados.
detectar texto y objetos, incluidos rostros, flores, animales, casas y
logotipos, en imágenes. Además, se puede clasificar la expresión
Implementación de Big Data y análisis en
emocional de los rostros en la imagen. Esto significa que es posible
una interpretación de la imagen basada en relaciones significativas organizaciones Las organizaciones utilizan análisis
entre estos objetos. Estos métodos se pueden utilizar para analizar e en la toma de decisiones en todas las áreas funcionales, no solo
interpretar, por ejemplo, contenido de redes sociales obtenido en marketing y ventas, sino también gestión de la cadena de suministro,
plataformas como Facebook, Twitter e Instagram. Estas interpretaciones finanzas y recursos humanos.
de texto e imágenes en noticias en línea, reseñas de productos, WalMart ejemplifica esto, un pionero en el uso de análisis de big data
recomendaciones, acciones compartidas, reenvíos o menciones en para operaciones, que se basa en gran medida en análisis en
redes sociales pueden usarse para comprender conversaciones en recursos humanos y marketing. Muchas empresas aspiran a integrar
línea sobre productos y servicios. Se pueden usar para hacer decisiones basadas en datos en diferentes áreas funcionales. Si bien
predicciones sobre su éxito, proporcionar recomendaciones a los la gestión del análisis de big data implica tecnología, estructura
consumidores y personalizar el contenido de la comunicación organizacional y analistas capacitados y capacitados, la principal
comercial en las plataformas en línea, incluido el contenido propio de condición previa para su implementación exitosa en las empresas es
las redes sociales, las palabras clave y la publicidad dirigida (tocando una cultura de toma de decisiones basada en evidencia. Esta cultura
así los puntos 1 y 2 bajo "Personalización" ). Para lograr esto, los se resume mejor con una cita ampliamente atribuida a W. Edwards
investigadores deben comprender cómo incluir interpretaciones ricas Deming: “En Dios confiamos; todos los demás deben traer datos”. En
de imágenes y texto en modelos predictivos. Exactamente cómo se tal cultura, los ejecutivos de la empresa reconocen la necesidad de
puede forjar el vínculo entre el resultado del modelo de aprendizaje organizar el análisis de big data y dar a los gerentes de datos/análisis
profundo y los modelos de marketing, cuáles son las interpretaciones la responsabilidad y autoridad para utilizar los recursos para almacenar
de ese resultado y si hacen que los modelos de marketing sean más y mantener las bases de datos; desarrollar y/o adquirir software; y
efectivos son temas para futuras investigaciones. construir e implementar modelos descriptivos, predictivos y normativos
Como segundo ejemplo, tome el punto 3 bajo "Marketing Mix". (Grossman y Siegel 2014). En esas empresas exitosas, los campeones
Los modelos integrados de mezcla de marketing deben acomodar de análisis de big data generalmente se encuentran en la sala de
los gastos en vehículos de medios dentro de las clases de televisión, juntas (por ejemplo, el director financiero, el director de marketing), y
radio, medios impresos, al aire libre y medios sociales propios y los análisis se utilizan para impulsar la innovación comercial en lugar
pagados a niveles granulares, espaciales y temporales y medir los de simplemente mejorar las operaciones (Hagen y Khan 2014).
efectos directos e indirectos de WOM en ganado. redes sociales,
métricas de mentalidad y ventas, dando cuenta de la endogeneidad En una organización como Netflix, en la que el análisis está
de las acciones de marketing y el ROI computacional. Esto requiere completamente centralizado, las iniciativas se generan, priorizan,
modelos a gran escala con una estructura de series de tiempo y coordinan y supervisan en la sala de juntas. A pesar del tremendo
multitud de efectos directos e indirectos. Dichos modelos deben ser éxito de Netflix, la naturaleza altamente especializada del análisis de
completos y permitir la atribución y la cuantificación de los remanentes marketing, que varía drásticamente entre los dominios de marketing,
y efectos indirectos entre estas clases de medios y vehículos. exige con frecuencia una infraestructura descentralizada o híbrida.
Necesitan acomodar diferentes niveles de granularidad temporal y Esto proporciona la flexibilidad necesaria para la experimentación y
espacial y niveles de agregación de clientes. Además, los estudios la innovación rápidas y es más propicio para una implementación ágil
actuales sobre modelos de atribución solo han arañado la superficie y eficaz de análisis para una amplia variedad de problemas de
de la información disponible sobre los toques de los clientes en sitios marketing. Una organización descentralizada facilita la colaboración
web, anuncios gráficos, anuncios de búsqueda, etc. porque codifican interfuncional y la cocreación a través de la comunicación de analistas
cada punto de contacto en una sola dimensión. Cada punto de y gerentes de marketing en la empresa. Permite a los analistas
contacto se puede describir con múltiples variables. Por ejemplo, un identificar nuevas fuentes de datos relevantes y oportunidades de
sitio web tiene una colección asociada de metadatos que describen análisis y, junto con los gerentes de marketing, les permite adaptar
el diseño, el contenido y el diseño del sitio web, las ubicaciones de sus modelos y algoritmos a las demandas específicas de los
anuncios, etc., todo lo cual podría afectar el comportamiento de los problemas de marketing. Sin embargo, esta estructura organizacional
clientes cuando visitan el sitio web. La literatura de marketing existente requiere capacidades analíticas distribuidas profundas y un
ha abordado algunos de estos problemas, aunque
Análisis de marketing para entornos ricos en datos / 115
Machine Translated by Google
énfasis en la colaboración. AT&T se encuentra entre las empresas soluciones para ganar eficiencia y economías de escala en equipos
que siguen este modelo al alojar análisis de datos dentro de sus de análisis descentralizados.
unidades comerciales. En resumen, las organizaciones que buscan extraer valor del
Uno de los principales desafíos de la descentralización es lograr análisis de big data deben tener (1) una cultura y líderes que
una masa crítica de analistas que permita el desarrollo continuo de reconozcan la importancia de los datos, el análisis y la toma de
una experiencia amplia y profunda en toda la organización y una decisiones basada en datos; (2) una estructura de gobierno que evite
respuesta rápida y flexible a los problemas emergentes, sin gastos los silos y facilite la integración de datos y análisis en la estrategia y
generales ni burocracia excesivos. Por lo tanto, un modelo los procesos generales de la organización de tal manera que se
organizacional híbrido suele ser efectivo. Aquí, una unidad genere valor para la empresa; y (3) una masa crítica de analistas de
centralizada es responsable de la tecnología de la información y el marketing que, en conjunto, tengan una experiencia lo suficientemente
software, así como de la creación y el mantenimiento de las bases de datos.profunda en análisis, así como conocimientos sustantivos de
Los analistas de marketing pueden aprovechar la experiencia de marketing. Casi todas las empresas se enfrentan actualmente al
dicha unidad central cuando sea necesario. Google adopta este desafío de contratar al talento adecuado para lograrlo. Una amplia
enfoque, mediante el cual las unidades comerciales toman sus oferta de analistas de marketing con un conjunto de habilidades
propias decisiones pero colaboran con una unidad central en multifuncionales; competencia en tecnología, ciencia de datos y
iniciativas seleccionadas. En algunos casos, especialmente para las análisis; y se necesita con urgencia experiencia actualizada en el
empresas más pequeñas y las que están al comienzo de la curva de dominio, al igual que personas con habilidades de gestión y
aprendizaje, la subcontratación de una o más de estas funciones conocimiento de la estrategia comercial para armar y liderar esos
centralizadas es una opción viable y rentable. equipos. Reflexionamos sobre las implicaciones para la educación
Llevando el papel de la unidad centralizada un paso más allá empresarial en la sección final de este artículo.
están las organizaciones que forman un centro de excelencia (CoE)
de big data independiente dentro de la empresa, supervisado por un
Conclusión: implicaciones para la educación Este
director de análisis. El departamento de marketing y otras unidades
artículo ha revisado
persiguen iniciativas supervisadas por el CoE. Amazon y LinkedIn
son dos empresas que emplean un CoE, y este modelo parece ser la historia de los datos y el análisis; destacó los desarrollos recientes
el más adoptado por las empresas de big data. Proporciona sinergias en los dominios clave de marketing mix, personalización, privacidad
y economías de escala porque facilita el intercambio de datos y y seguridad; e identificó posibles barreras organizacionales y
soluciones entre las unidades de negocio y apoya y coordina sus oportunidades hacia la implementación exitosa de análisis de datos
iniciativas. Un problema de la gestión de los presupuestos de de marketing enriquecidos en las empresas. La Tabla 1 resume el
marketing es el efecto "silo". A menudo, en las grandes organizaciones estado del campo y la Tabla 2 resume las futuras prioridades de
de marketing, las inversiones en cada uno de los instrumentos de investigación. En esta sección, completamos nuestro discurso con
marketing (p. ej., creación de marca, marketing de búsqueda, una discusión de las implicaciones para el conjunto de habilidades
marketing por correo electrónico) las gestionan diferentes equipos requeridas para los analistas.
con sus propios presupuestos. Esto puede llevar a que cada silo En el entorno emergente de big data, los analistas de marketing
intente optimizar su propio gasto sin tener una visión más global. trabajarán cada vez más en la interfaz de estadísticas/econometría,
Con un mayor enfoque en las comunicaciones de marketing informática y marketing. Su conjunto de habilidades deberá ser
integradas, el marketing multicanal y la influencia en todo el proceso amplio y profundo. Esto plantea desafíos obvios que se ven
de compra, la función de análisis de datos reside mejor en una unidad agravados por el hecho de que varios subdominios de marketing (por
central o CoE, lo que evita el efecto de silo al adoptar una visión más ejemplo, publicidad, promociones, desarrollo de productos, marca)
global de los presupuestos de marketing con informes directos a el tienen diferentes requisitos de datos y análisis, y las soluciones
director de marketing. analíticas de talla única no son ni deseables ni probables. ser
Sin embargo, incluso una infraestructura de análisis efectivo. Por lo tanto, los analistas deben tener un conocimiento
descentralizada o híbrida no excluye la necesidad de una gobernanza suficientemente profundo de las técnicas de modelado de marketing
de datos y análisis. Las funciones de gobierno analítico, que residen para predecir la respuesta de marketing, la optimización de la
en unidades centralizadas o CoE, priorizan oportunidades, obtienen combinación de marketing y la personalización.
recursos, garantizan el acceso a datos y software, facilitan la Deben estar bien versados en la aplicación de técnicas de estimación,
implementación de modelos, desarrollan la experiencia necesaria, como los métodos de máxima verosimilitud, las técnicas Bayesianas
aseguran la responsabilidad y coordinan el esfuerzo del equipo. Los MCMC y los métodos de aprendizaje automático, así como estar
equipos en cuestión incluyen (1) funciones de marketing y gestión, familiarizados con las técnicas de optimización de OR. Además,
que identifican y priorizan oportunidades e implementan soluciones y deben poseer habilidades blandas y conocimientos sustantivos de
decisiones basadas en datos; (2) ingenieros de análisis, que vanguardia en marketing para garantizar que puedan comunicar a
determinan las necesidades de datos, software y análisis; organizar los responsables de la toma de decisiones la capacidad y las
aplicaciones y procesos; y documentar estándares y mejores limitaciones de los modelos analíticos para fines de marketing
prácticas; (3) funciones de gestión de datos y ciencia de datos, que específicos. Esto maximizará el apoyo y el impacto de sus
garantizan que los datos sean precisos, actualizados, completos y recomendaciones de decisión. En muchas organizaciones, los
coherentes; y (4) funciones legales y de cumplimiento, que supervisan analistas de marketing desempeñarán el papel de intermediarios
la seguridad de los datos, las políticas de privacidad y el entre los gerentes de marketing y el personal de tecnología de la
cumplimiento. El director de análisis puede promover el desarrollo de información, o entre los gerentes de marketing y los proveedores
procesos repetibles y externos de datos y capacidades analíticas, para lo cual deben tener suficiente conoc
116 / Journal of Marketing: edición especial de AMA/MSI, noviembre de 2016
Machine Translated by Google
ambas áreas. Cada vez más, los procesos y decisiones de marketing Las empresas deben invertir sistemáticamente en la capacitación y
rutinarios se están automatizando. Esto crea el desafío de determinar cómo educación de los empleados actuales y contratar nuevos con un conjunto
basar estas decisiones automatizadas en el conocimiento sustantivo, así de habilidades actualizado para cubrir nichos específicos en sus equipos.
como en la intuición y la supervisión gerenciales. Los futuros vendedores WalMart, por ejemplo, organiza su propia conferencia anual de análisis con
deben estar bien equipados para hacer eso. Finalmente, el campo necesitará cientos de participantes y utiliza el crowdsourcing para atraer nuevos
personas con habilidades de gestión y conocimiento de la estrategia talentos.
comercial, así como suficiente familiaridad con la tecnología y el análisis La formación y educación de los analistas de marketing para desarrollar
para supervisar y administrar equipos y unidades comerciales. Un estudio este amplio y profundo conjunto de habilidades plantea un desafío para el
reciente de la firma de investigación Gartner reveló que los líderes mundo académico. En muchos casos, las personas que provienen
empresariales creen que la dificultad de encontrar talento con estas directamente de programas de matemáticas, estadística, econometría o
habilidades es la principal barrera para implementar el análisis de big data ciencias de la computación pueden no convertirse en analistas de marketing
(Levy 2015). efectivos y exitosos. En cambio, además de las especializaciones existentes
en programas exitosos de pregrado y maestría en administración de
Estos requisitos de conjunto de habilidades también presentan un empresas en muchas universidades, los programas de maestría
desafío para los educadores; Pocas personas podrán desarrollar un recientemente creados en análisis de marketing en instituciones como la
conocimiento profundo en todas estas áreas al principio de su carrera. En Universidad de Maryland y la Universidad de Rochester se enfocan en
las organizaciones, estos conjuntos de habilidades se cultivan con mayor desarrollar estos conjuntos de habilidades multidisciplinarias en estudiantes
frecuencia a través de la capacitación en el trabajo y el esfuerzo colectivo que ya tener una formación rigurosa en estas disciplinas básicas. Se
del equipo. Algunos estudiantes de análisis pueden especializarse y necesitan con urgencia programas similares y se están desarrollando en
desarrollar una gran experiencia en marketing sustantivo, habilidades otros lugares para satisfacer la creciente demanda de analistas de marketing
blandas y administración, de modo que puedan asumir puestos gerenciales en todo el mundo. Además, es posible que nuestro campo deba adoptar el
y supervisar a los analistas, negociar con proveedores externos de análisis modelo de las disciplinas de las matemáticas y las ciencias de la computación
y ayudar a formular problemas e interpretar y comunicar resultados. para educar a los estudiantes de doctorado únicamente para las funciones de la industria (Sud
En el otro extremo del espectro están aquellos que aspiran a ser ingenieros Finalmente, enfatizamos las oportunidades para la fertilización cruzada
de análisis de marketing o científicos de datos y trabajan para desarrollar un del talento de la academia y la industria; por ejemplo, los profesionales
conocimiento profundo de los aspectos técnicos del campo, incluida la pueden beneficiarse de clases especializadas desarrolladas por
gestión de bases de datos, la programación y el modelado estadístico/ universidades, y los académicos pueden pasar tiempo dentro de las
econométrico. Cada uno de esos especialistas en marketing tendrá un papel empresas para estar expuestos a problemas y datos actuales. Tales
que desempeñar en los equipos de análisis de las organizaciones. Todos oportunidades son cada vez más comunes y beneficiarán significativamente
aquellos que trabajan en el campo deberán continuar actualizando sus al campo en el futuro cercano, ya que el análisis de big data continuará
conocimientos en un amplio dominio, a través de conferencias y desafiando e inspirando a académicos y profesionales por igual.
capacitaciones, para mantenerse al tanto de la ola de nuevos desarrollos.
REFERENCIAS
¨
Adiguzel, Feray y Michel Wedel (2008), “Diseño de cuestionario Banko, Michele y Eric Brill (2001). "Escalado a cuerpos muy, muy grandes para
dividido para encuestas masivas”, Journal of Marketing la desambiguación del lenguaje natural", en Actas de la 39.ª reunión anual
Research, 45 (octubre), 608–17. de la Asociación de lingüística computacional. Toulouse, Francia: Asociación
Ailawadi, Kusum L., Jie Zhang, Aradhna Krishna y Michael Kruger (2010), "When de Lingüística Computacional, 26–33.
WalMart Enters: How Incumbent Retailers React and How Affects Their
Sales Outcomes", Journal of Marketing Research, 47 (agosto), 577 –93. Bartels, Robert (1988), La historia del pensamiento de marketing, 3ª ed.
¨ Columbus, OH: Horizontes editoriales.
Albers, Sonke (2012), "Modelado de respuesta agregada optimizable e Bass, Frank (1969), “Un nuevo crecimiento de productos para bienes duraderos
implementable para el soporte de decisiones de marketing", International de consumo modelo”, Management Science, 15 (5), 215–27.
Journal of Research in Marketing, 29 (2), 111–22. Berger, James O. (1985), Teoría de la decisión estadística y análisis bayesiano.
Allenby, Greg, Eric Bradlow, Edward George, Joh Liechty y Robert McCulloch Nueva York: SpringerVerlag.
(2014), "Perspectivas sobre métodos bayesianos y macrodatos", Customer Berry, Steven, James Levinsohn y Ariel Pakes (1995), “Precios de automóviles
Needs and Solution, 1 (3), 169–75. en equilibrio de mercado”, Econometrica, 63 (4), 841–90.
Andrews, Michelle, Xueming Luo, Zeng Fang y Anindya Ghose (2015), "Eficacia Bijmolt, Tammo HA, Harald J. van Heerde, Rik GM Pieters (2005), “Nuevas
de los anuncios móviles: Orientación hipercontextual con multitud", Marketing generalizaciones empíricas sobre los determinantes de la elasticidad de los
Science, 35 (2), 218–33. precios”, Journal of Marketing Research, 42 (mayo), 141–56.
Andrews, Rick L., Andrew Ainslie e Imran S. Currim (2002), “Una comparación Bodapati, Anand (2008), "Sistemas de recomendación con datos de compra",
empírica de modelos de elección logit con representaciones discretas Journal of Marketing Research, 45 (febrero), 77–93.
versus continuas de heterogeneidad”, Bradlow, Eric T., Bruce GS Hardie y Peter S. Fader (2002), "Inferencia bayesiana
Journal of Marketing Research, 39 (noviembre), 479–87. para la distribución binomial negativa a través de expansiones polinómicas",
Ansari, Asim, Skander Essegaier y Rajeev Kohli (2000), "Sistemas de Journal of Computational and Graphical Statistics, 11 (1), 189–201.
recomendación de Internet", Journal of Marketing Research, 37 (agosto),
363–75. Braun, Michael y Paul Damien (2015), “Muestreo de rechazo escalable para
——— y Carl F. Mela (2003), “ECustomization”, Journal of Marketing Research, modelos jerárquicos bayesianos”, Marketing Science, 35 (3), 427–44.
40 (mayo), 131–45.
Análisis de marketing para entornos ricos en datos / 117
Machine Translated by Google
——— y Jon McAuliffe (2010), “Inferencia variacional para modelos a gran Dwoskin, Elizabeth (2015), “EU Seeks to Tighten Data Privacy Laws”, The
escala de elección discreta”, Journal of the American Statistical Wall Street Journal, (15 de marzo), [disponible en http://blogs.wsj.com/
Association, 105 (489), 324–35. digits/2015/03/10/eu buscaajustarlas leyesdeprivacidaddedatos/].
Brockwell, Anthony E. y Joseph B. Kadane (2005), "Identi fication of
Regeneration Times in MCMC Simulation, with Application to Adaptive Ebbes, Peter, Zan Huang y Arvind Rangaswamy (2015), “Sampling Designs
Schemes", Journal of Computational and Graphical Statistics, 14 (2), 436– for Recovering Local and Global Char acteristics of Social Networks”,
58. International Journal of Research in Marketing, (disponible electrónicamente
´
Bronnenberg, Bart J., JeanPierre Dube y Matthew Gentzkow (2012), "La el 19 de noviembre), [DOI: 10.1016/j. ijresmar.2015.09.009].
evolución de las preferencias de marca: evidencia de la migración del
consumidor", American Economic Review, 102 (6), 2472–508. ———, Dominique Papies y Harald Van Heerde (2011), “El sentido y el
sinsentido de la validación de muestras de exclusión en presencia de
Bult, JanRoelf y Tom Wansbeek (1995), “Selección óptima para correo endogeneidad”, Marketing Science, 30 (6), 1115–22.
¨
directo”, Marketing Science, 14 (4), 378–94. ———, Michel Wedel, Ulf Bockenholt y Ton Steerneman (2005), “Resolving
Campbell, James, Avi Goldfarb y Catherine Tucker (2015), “Regulación de la and Testing for RegressorError (In)Depend ence When No Instrumental
privacidad y estructura del mercado”, Journal of Economics & Variables Are Available: With New Evidence for the Effect of Education
Management Strategy, 24 (1), 47–73. on Income”, Quantitative Marketing and Economics, 3 (4), 365–92.
Casher, Jonathan D. (1969), Marketing y la computadora. Boston:
Publicaciones de DH Mark. Elrod, Terry (1988), “Mapa de elección: Inferir un mapa de productomercado
Chevalier, Judith A. y Dina Mayzlin (2006), "El efecto del boca a boca en las a partir de datos de panel”, Marketing Science, 7 (1), 21–40.
¨
ventas: reseñas de libros en línea", Journal of Marketing Research, 43 Erdem, Tulin y Michael P. Keane (1996), “Toma de decisiones en condiciones
(agosto), 345–54. de incertidumbre: captura de procesos dinámicos de elección de marca
Chintagunta, Pradeep (2002), “Investigating Category Pricing Behavior in a en mercados de bienes de consumo turbulentos”, Marketing Science, 15
Retail Chain”, Journal of Marketing Research, 39 (mayo), 141–54. (1), 1–21.
Everson, Philip J. y Eric T. Bradlow (2002), "Inferencia bayesiana para la
¨
———, Tulin Erdem, Peter E. Rossi y Michel Wedel (2006), “Modelado distribución betabinomial a través de expansiones polinómicas"
estructural en marketing: revisión y evaluación”, Revista de Estadística Computacional y Gráfica, 11 (1), 202–07.
Ciencias del marketing, 25 (6), 604–16.
Chung, Doug J., Thomas Steenburgh y K. Sudhir (2014), “¿Mejoran las Fader, Peter y Bruce Hardie (2009), "Modelos de probabilidad para el análisis
bonificaciones la productividad de las ventas? Un análisis estructural de la base de clientes", Journal of Interactive Marketing, 23 (1), 61–69.
dinámico de los planes de compensación basados en bonos”, Marketing
Science, 33 (2), 165–87. Feit, Eleanor, Pengyuan Wang, Eric T. Bradlow y Peter S. Fader (2013),
Chung, TuckSiong, Roland T. Rust y Michel Wedel (2009), "Mi música móvil: "Fusing Aggregate and Disgregate Data with an Application to Multiplatform
un sistema de personalización adaptable para reproductores de audio Media Conquisition", Journal of Marketing Research, 50 (junio), 348–64.
digital", Marketing Science, 28 (1), 52–68.
Coombs, Clyde (1950), “Escala psicológica sin unidad de medida”, Ferber, Robert (1949), Técnicas estadísticas en investigación de mercados.
Psychological Review, 57, 148–58. Nueva York: McGrawHill.
¨
Danaher, Peter J., Michael S. Smith, Kulan A. Ranasinghe y Tracey S. Fischer, Marc, Sonke Albers, Nils Wagner y Monika Frie (2011), “Practice
Danaher (2015), "Dónde, cuándo y cuánto tiempo: factores que influyen Prize Winner—Dynamic Marketing Budget Allocation Across Countries,
en el canje de cupones para teléfonos móviles", Journal of Marketing Products, and Marketing Activities”, Marketing Science, 30 (4), 568–85.
Research, 52 (octubre), 710–25.
Fong, Nathan M., Zheng Fang y Xueming Luo (2015), "Geo Conquesting:
Davenport, Thomas H. (2006), "Competir en análisis", Harvard Competitive Locational Targeting of Mobile Promotions", Journal of
Business Review, (enero), 99–107. Marketing Research, 52 (octubre), 726–35.
DeKimpe, Marnik G. y Dominique M. Hanssens (1995), “La persistencia de
los efectos del marketing en las ventas”, Marketing Science, 14 (1), 1–21. Gatignon, Hubert (1993), “Marketing Mix Models”, en Handbooks in Operations
Research and Management Science, vol. 5: Marketing, J. Eliashherg y
DeSarbo, Wayne S. y Vithala Rao (1986), “Una metodología de despliegue GL Lilien, eds. Ámsterdam: Norte, 697–732.
restringido para el posicionamiento de productos”, Marketing Science, 5
(1), 1–19. Gelman, Andrew, John B. Carlin, Hal S. Stern y Donald B. Rubin (2003),
Dew, Ryan y Asim Ansari (2015), “Un marco semiparamétrico bayesiano Análisis de datos bayesianos. Londres: Chapman and Hall.
´
para comprender y predecir la dinámica de la base de clientes”, Geman, Stuart, Elie Bienenstock y Rene Doursat (1992), “Neural
documento de trabajo, Universidad de Columbia. Networks and the Bias/Variance Dilemma”, Neural Computation, 4 (1),
Dorfman, Robert y Peter O. Steiner (1954), “Publicidad óptima y calidad 1–58.
óptima”, American Economic Review, 44 (5), 826–36. Genkin, Alexander, David D. Lewis y David Madigan (2007), “Regresión
logística bayesiana a gran escala para la categorización del texto”,
Du, Rex Yuxing y Wagner A. Kamakura (2012), “Detección cuantitativa de Technometrics, 49 (3), 291–304.
tendencias”, Journal of Marketing Research, 49 (agosto), 514–36. Gilula, Zvi, Robert E. McCulloch y Peter E. Rossi (2006), “A Direct Approach
to Data Fusion”, Journal of Marketing Research, 43 (febrero), 73–83.
Duncan, CS (1919), Investigación comercial. Nueva York: Mc Millan Co.
Dupre, Elyse (2015), “Privacy and Security Remain Tall Orders Godes, David y Dina Mayzlin (2004), “Uso de conversaciones en línea para
for Today's Marketers”, Direct Marketing News, (23 de enero), estudiar la comunicación de boca en boca”, Marketing Science, 23 (4),
[disponible en http://www.dmnews.com/infographics/privacy 545–60.
andsecurityremain tallordersfortodaysmarketers Goldfarb, Avi y Catherine Tucker (2010), “Regulación de la privacidad y
infographic/ article/393980/]. publicidad en línea”, Management Science, 57 (1), 57–71.
118 / Journal of Marketing: edición especial de AMA/MSI, noviembre de 2016
Machine Translated by Google
Goldgar, David E. (2001), "17 principales fortalezas y debilidades de los métodos ——— y ——— (1997), “Fusión de datos estadísticos para tabulación cruzada”,
sin modelos", Advances in Genetics, 42, 241–51. Journal of Marketing Research, 34 (noviembre), 485–98.
Green, Paul E. (1963), "Teoría de la decisión bayesiana en la estrategia de
precios", Journal of Marketing, 27 (enero), 5–14. Kannan, PK y Gordon P. Wright (1991), "Modelado y prueba de mercados
——— (1969), "Escalamiento multidimensional: una introducción y comparación estructurados: un enfoque logit anidado", Marketing Science, 10 (1), 58–82.
de técnicas de desarrollo no métricas", Journal of Marketing Research, 6
(agosto), 330–41. ——— y V. Srinivasan (1978), Khan, Romana, Michael Lewis y Vishal Singh (2009), “Gestión dinámica de
“Conjoint Analysis in Consumer Research: Issues and Outlook”, Journal of clientes y el valor del marketing uno a uno”, Marketing Science, 28 (6),
Consumer Research, 5 (2), 103–23. 1063–79.
Landwehr, Jan R., Aparna A. Labroo y Andreas Herrmann (2011), "Gut Gut for
Grossman, Robert L. y Kevin P. Siegel (2014), "Modelos organizacionales para the Ordinary: Incorporating Design Fluency Improves Automobile Sales
Big Data y análisis", Journal of Organization Design, 3 (1), 20–25. Forecasts", Marketing Science, 30 (3), 416–29.
Guadagni, Peter M. y John DC Little (1983), “Un modelo logit de elección de Lee, TY y Eric T. Bradlow (2011), "Construcción automática de atributos y niveles
marca calibrado con datos de escáner”, Marketing Science, 2 (3), 203–38. conjuntos a partir de reseñas de clientes en línea",
Journal of Marketing Research, 48 (octubre), 881–94.
Gupta, Sunil (1988), “Impacto de las promociones de ventas sobre cuándo, qué Leeflang, Peter SH, Dick R. Wittink, Michel Wedel y Alan Bultez (2000), Modelos
y cuánto comprar”, Journal of Marketing Research, 25 (noviembre), 342–55. de construcción para decisiones de marketing.
Boston: Editores académicos de Kluwer.
Hagen, Christian y Khalid Khan (2014), “Building an Analytics Based Levy, Heather Pemberton (2015), “Marketers Embrace Analytics and Look for
Organization”, informe de investigación, AT Kearney, (consultado el 1 de Talent”, Gartner.com, (9 de septiembre), (consultado el 19 de julio de 2016),
enero de 2016), [disponible en http://www.africa.atkearney.com/documents/ [disponible en http://www.gartner.com/smarterwithgartner/ los especialistas
10192 /6978675/Building+an+AnalyticsBased+ Organization.pdf/67d6181d en marketing adoptan la analítica y buscan talento].
ab7e40ceae4a7bd92991bf76]. Li, Hongshuang (Alice) y PK Kannan (2014), "Atribuir conversiones en un entorno
Hanssens, Dominique M. (2014), “Modelos econométricos”, en The History of de marketing en línea multicanal: un modelo empírico y un experimento de
Marketing Science, Russell S. Winer y Scott A. Neslin, eds. Singapur: World campo", Journal of Marketing Research, 51 (febrero), 40–56.
Scientific Publishing, 99–128.
———, Leonard J. Parsons y Randall L. Schultz (2001), Modelos de respuesta Liaukonyte, Jura, Thales Teixeira y Kenneth C. Wilbur (2015), "Publicidad
del mercado: análisis económico y de series temporales. Boston: Editores televisiva y compras en línea", Marketing Science, 34 (3), 311–30.
académicos de Kluwer.
———, Koen H. Pauwels, Shuba Srinivasan, Marc Vanhuele y Lilien, Gary L. y Arvind Rangaswamy (2006), Ingeniería de marketing:
Gokhan Yildirim (2014), "Métricas de actitud del consumidor para guiar las Planificación y análisis asistidos por computadora, Plataforma de publicación
decisiones de mezcla de marketing", Marketing Science, 33 (4), 534–50. independiente CreateSpace.
Little, John DC (1970), "Modelos y gerentes: el concepto de un cálculo de
Hartmann, Wesley, Harikesh S. Nair y Sridhar Narayanan (2011), "Identificación decisiones", Management Science, 16 (8), B466–485. ——— y Len M.
de los efectos causales de la combinación de marketing mediante un diseño Lodish (1969), “Un cálculo de planificación de medios”,
de discontinuidad de regresión", Marketing Science, 30 (6), 1079–97. Investigación de operaciones, 17 (1), 1–35.
Liu, Xiao, Alan Montgomery y Kannan Srinivasan (2015), “Overhaul Overdraft
Hastie, Trevor, Robert Tibshirani y Jerome Friedman (2008), Los elementos del Fees: Creating Pricing and Product Design Strategies with Big Data”,
aprendizaje estadístico: minería de datos, inferencia y predicción. Nueva documento de trabajo, Carnegie Mellon University.
York: Springer.
Hauser, John R., Glen L. Urban, Guilherme Liberali y Michael Braun (2009), Lodish, Leonard M. (1971), "CALLPLAN: Sistema de planificación de llamadas
“Website Morphing”, Marketing Science, 28 (2), 202–23. de un vendedor interactivo", Management Science, 18, P25–40.
´
Louviere, Jordan J. y George Woodworth (1983), “Diseño y análisis de
Hinton, Geoffrey (2007), “Aprendizaje de múltiples capas de representación”, experimentos simulados de elección o asignación del consumidor: un
Trends in Cognitive Sciences, 11 (10), 428–34. enfoque basado en datos agregados”, Journal of Marketing Research, 20
Hui, Sam K., J. Jeffrey Inman, Yanliu Huang y Jacob Suher (2013), "El efecto de (noviembre), 350–67.
la distancia de viaje en la tienda sobre el gasto no planificado: aplicaciones Luce, R. Duncan y John W. Tukey (1964), "Medición conjunta simultánea: un
a las estrategias de promoción móvil" nuevo tipo de escala de medición fundamental", Journal of Mathematical
Journal of Marketing, 77 (marzo), 1–16. Psychology, 1 (1), 1–27.
Johnson, Garrett A., Randall A. Lewis y Elmar I. Nubbemeyer
(2015) disponible en http://papers.ssrn. com/sol3/papers.cfm? Mantrala, Murali K., Prabhakant Sinha y Andris A. Zoltners (1994), "Estructuración
abstract_id=2620078]. de un plan de bonificación de cuota de ventas de productos múltiples para
una fuerza de ventas heterogénea: un enfoque práctico basado en modelos",
Marketing Science, 13 (2), 121 –44.
Joo, Mingyu, Kenneth C. Wilbur, Bo Cowgill y Yi Zhu (2014), “Publicidad Massy, William F., David B. Montgomery y Donald G. Morrison (1970), Modelos
televisiva y búsqueda en línea”, Management Science, 60 (1), 56–73. estocásticos de comportamiento de compra. Cambridge, MA: MIT Press.
Kamakura, Wagner A. y Gary J. Russell (1989), “A Probabilistic Choice Model McFadden, Daniel (1974), “Análisis logit condicional del comportamiento de
for Market Segmentation and Elasticity Struc ture”, Journal of Marketing elección cualitativa”, en Frontiers in Econometrics, P. Zarembka, ed. Nueva
Research, 26 (noviembre), 379–90. ——— y Michel Wedel (1995), “Life York: Prensa Académica, 105–42.
Style Segmentation with Tailored Interviewing”, Journal of Marketing Research, Miller, Amalia y Catherine Tucker (2011), “Encryption and Data Security”, Journal
32 (agosto), 308–17. of Policy Analysis and Management, 30 (3), 534–56.
Análisis de marketing para entornos ricos en datos / 119
Machine Translated by Google
Mittal, Vikas, Pankaj Kumar y Michael Tsiros (1999), “Desempeño, Oravecz, Z., M. Huentelman y J. Vandekerckhove (2015), "Actualización
satisfacción e intenciones de comportamiento a nivel de atributos a lo bayesiana secuencial para Big Data", en Big Data en la ciencia cognitiva:
largo del tiempo: un enfoque del sistema de consumo”, Journal of de métodos a conocimientos, M. Jones, ed.
Marketing, 63 (abril), 88–101. Sussex, Reino Unido: Psychology Press.
Moe, Wendy W. (2003), “Comprar, buscar o navegar: diferenciar entre Park, Sungho y Sachin Gupta (2012), "Manejo de regresores endógenos
compradores en línea mediante el flujo de clics de navegación en la mediante estimación conjunta mediante cópulas", Marketing Science,
tienda”, Journal of Consumer Psychology, 13 (1/2), 29–40. 31 (4), 567–86.
Parsons, Leonard J. y Frank M. Bass (1971), “Implicaciones del gasto
——— y Michael Trusov (2011), “El valor de la dinámica social en los foros publicitario óptimo de un análisis de regresión de ecuaciones
de calificación de productos en línea”, Journal of Marketing Research, simultáneas”, Operations Research, 19 (3), 822–31.
48 (junio), 444–56. Pieters, Rik, Michel Wedel y Rajeev Batra (2010), "El poder de detención
Montgomery, Alan L., Shibo Li, Kannan Srinivasan y John C. Liechty (2004), de la publicidad: medidas y efectos de la complejidad visual", Journal
"Modelado de navegación en línea y análisis de ruta mediante datos de of Marketing, 74 (septiembre), 48–60.
secuencia de clics", Marketing Science, 23 (4), 579–95. Prins, Remco y Peter C. Verhoef (2007), “Marketing Communication Drivers
Muller, Frans (2014), “Big Data: Impact and Applications in Grocery Retail”, of Adoption Timing of a New EService Among Existing Customers”,
presentación en el Simposio de Marketing e Innovación de 2014, Journal of Marketing, 71 (abril), 169–83.
Universidad Erasmus, (27 y 28 de mayo), Rotter dam, Países Bajos. Raiffa, Howard y Robert Schlaifer (1961), Teoría de la decisión estadística
aplicada. Boston: Prensa de Clinton.
´
Musalem, Andres, Eric T. Bradlow y Jagmohan S. Raju (2008), “¿Quién Rao, Vithala R. (2014), “Análisis conjunto”, en The History of Marketing
tiene el cupón? Estimating Consumer Preferences and Coupon Usage Science, Russell S. Winer y Scott A. Neslin, eds.
from Aggregate Information”, Journal of Marketing Research, 45 Singapur: World Scientific Publishing, 47–76.
(diciembre), 715–30. Reilly, WJ (1929), Investigaciones de marketing. Nueva York: Ronal Press
Naik, Prasad A., Kalyan Raman y Russell S. Winer (2005), “Planning Company.
MarketingMix Strategies in the Presence of Inter action Effects”, Ridgeway, George y David Madigan (2002), "Análisis bayesiano de
Marketing Science, 24 (1), 25–34. ——— y ChiLing Tsai conjuntos de datos masivos a través de filtros de partículas", en Actas
(2004), “Modelo de índice único isotónico para el marketing de bases de de KDD 02, La octava conferencia internacional sobre descubrimiento
datos de alta dimensión”, Estadística computacional y análisis de de conocimientos y minería de datos. Nueva York: Asociación de
datos, 47 (4), 175–90. Maquinaria de Computación, 5–13.
———, Michel Wedel, Lynd Bacon, Anand Bodapati, Eric Bradlow, Risselada, Hans, Peter C. Verhoef y Tammo HA Bijmolt (2014), “Dynamic
Wagner Kamakura, et al. (2008), "Desafíos y oportunidades en análisis Effects of Social Influence and Direct Marketing on the Adoption of High
de datos de elección de alta dimensión", Technology Products”, Journal of Marketing, 78 (marzo), 52–68.
Cartas de marketing, 19 (3/4), 201–13. y
———, ———, Wagner Kamakura (2010), “Modelo de respuesta Roberts, John, Ujwal Kayande y Stefan Stremersch (2014), "De la
binaria de múltiples índices para el análisis de grandes datos”, Journal investigación académica a la práctica de marketing: exploración de la
of Business & Economic Statistics, 28 (1), 67–81. cadena de valor de la ciencia del marketing", International Journal of
Nakanishi, Masao y Lee G. Cooper (1974), “Estimación de parámetros Research in Marketing, 31 (2), 127–40.
para un modelo de interacción competitiva multiplicativa: enfoque de Rossi, Peter E. (2014), "Incluso los ricos pueden empobrecerse: un examen
mínimos cuadrados”, Journal of Marketing Research, 11 (agosto), 303– crítico del uso de métodos IV en marketing"
11. Ciencias del marketing, 33 (5), 655–72.
Nam, Hyoryung y PK Kannan (2014), “Valor informativo de las redes de ——— y Greg M. Allenby (2003), “Estadísticas y marketing bayesianos”,
etiquetado social”, Journal of Marketing, 78 (julio), 21–40. Marketing Science, 22 (3), 304–28.
———, Robert E. McCulloch y Greg M. Allenby (1996), "El valor de los
Neiswanger, W., C. Wang y E. Xing (2014), "Asymptotically Exact, datos del historial de compras en el marketing objetivo", Marketing
Embarrassingly Parallel MCMC", en Proceedings of the 30th International Science, 15 (4), 321–40.
Conference on Conference on Uncertainty in Artificial Intelligence, Rust, John (1987), "Reemplazo óptimo de motores de autobuses GMC: un
[disponible en http://www. cs.cmu.edu/ ~epxing/papers/2014/ modelo empírico de Harold Zurcher", Econometrica, 55 (5), 999–1033.
Neiswanger_Wang_Xing_UAI14a.pdf'.
Neslin, Scott A. (2014), “Gestión de las relaciones con los clientes”, en The Rust, Roland T., PK Kannan y Na Peng (2002), “The Customer Economics
History of Marketing Science, Russell S. Winer y Scott A. Neslin, eds. of Privacy in EService”, Journal of the Academy of Marketing Science,
Hackensack, Nueva Jersey: World Scientific Publishing, 289–318. 30 (4), 455–64.
Rutz, Oliver J., Michael Trusov y Randolph E. Bucklin (2011), “Modelado de
Netzer, Oded, Ronen Feldman, Jacob Goldenberg y Fresco Moshe (2012), los efectos indirectos de la publicidad de búsqueda paga: ¿Qué palabras
"Mine Your Own Business: Market Structure Surveillance Through Text clave conducen a más visitas futuras?” Ciencias del marketing, 30 (4),
Mining", Marketing Science, 31 (3), 521–43. 646–65.
Schmittlein, David C. y Robert A. Peterson (1994), "Análisis de la base de
Nguyen, A., J. Yosinski y J. Clune (2015), "Las redes neuronales profundas clientes: una aplicación del proceso de compra industrial",
se engañan fácilmente: predicciones de alta confianza para imágenes Ciencias del marketing, 13 (1), 41–67.
irreconocibles", en Visión artificial y reconocimiento de patrones. Scott, Steven L., Alexander W. Blocker, Fernando V. Bonassi, Hugh A.
Piscataway, NJ: Instituto de Ingenieros Eléctricos y Electrónicos. Chipman, Edward J. George y Robert E. McCulloch (2013), "Bayes and
Big Data: The Consensus Monte Carlo Algorithm", documento de
Nitzan, Irit y Barak Libai (2011), “Social Effects on Customer Retention”, trabajo , Universidad de Chicago.
Journal of Marketing, 75 (noviembre), 24–38. Shapiro, BT (2014), “Positive Spillovers and Free Riding in Ad vertising of
Nixon, HK (1924), “Atención e interés en la publicidad”, Pharmaceuticals: The Case of Antidepressants”, documento de trabajo,
Archivos de Psicología, 72 (1), 5–67. Booth School of Business, University of Chicago.
120 / Journal of Marketing: edición especial de AMA/MSI, noviembre de 2016
Machine Translated by Google
Shaw, Robert (1987), Marketing de base de datos, Gower Publishing Co. Wang, P., Eric Bradlow y Ed George (2014), "Metaanálisis mediante la
Almidón, Daniel (1923), Principios de publicidad. Chicago: AW ponderación de la información: una aplicación a la publicidad en línea",
Compañía Shaw. Quantitative Marketing and Economics, 12 (2), 209–33.
Steckel, Joel, Russell Winer, Randolph E. Bucklin, Benedict Dellaert, Xavier
` ¨
Dreze, Gerald Haubl, et al. (2005), “Elección en entornos interactivos”, Wedel, Michel y Wayne S. DeSarbo (1995), "Un enfoque de similitud de
Marketing Letters, 16 (3/4), 309–20. mezcla para modelos lineales generalizados", Journal of Classification,
Steenburgh, Thomas, Andrew Ainslie y Peder Hans Engebretson (2003), 12 (1), 21–55. ——— y Rik
“Variables masivamente categóricas: revelación de la información en Pieters (2000), “Fijaciones oculares en anuncios y memoria para marcas:
los códigos postales”, Marketing Science, 22 (1), 40–57. un modelo y hallazgos”, Marketing Science, 19 (4), 297–312.
Stonborough, Thomas HW (1942), “Fixed Panels in Consumer Research”,
Journal of Marketing, 7 (abril), 129–38. White, Percival (1931), Técnica de Investigación de Mercados. Nueva York:
Suchard, Marc A., Quanli Wang, Cliburn Chan, Jacob Frelinger, Andrew Harper & Brothers.
Cron y Mike West (2010), "Comprensión de la programación de GPU Wilson, Melanie A., Edwin S. Iversen, Merlise A. Clyde, Scott C. Schmidler
para la computación estadística: estudios en mezclas masivas y Joellen M. Schildkraut (2010), "Búsqueda de modelos bayesianos e
inferencia multinivel para estudios de asociación de SNP"
masivamente paralelas", Journal of Computational and Graphical
Annals of Applied Statistics, 4 (3), 1342–64.
Statistics, 19 ( 2), 419–38.
Winer, Russell S. y Scott A. Neslin, eds. (2014), La historia de la ciencia
Sudhir, K. (2016), "La compensación de exploraciónexplotación y la
del marketing. Hackensack, Nueva Jersey: World Scientific Publishing.
eficiencia en la producción de conocimiento", Marketing Science, 35 (1), 1–9.
Teixeira, Thales, Michel Wedel y Rik Pieters (2010), "Marca óptima
Wittink, Dick R., MJ Addona, William J. Hawkes y John C. Porter (2011),
momento a momento en comerciales de televisión: prevención de la
"SCAN*PRO: La estimación, validación y uso de efectos promocionales
evasión mediante pulsos", Marketing Science, 29 (5), 783–804.
basados en datos de escáner", en Liber Amicorum en honor a Peter SH
Telpaz, Ariel, Ryan Webb y Dino Levy (2015), "Using EEG to Predict
Leeflang, JE Wierenga, PC
Consumers' Future Choices", Journal of Marketing Research, 52
Verhoef y JC Hoekstra, eds. Groningen, Países Bajos: Universidad de
(agosto), 511–29.
Groningen, 135–62.
Tibbitts, Matthew, Murali Haran y John C. Liechty (2011), “Muestreo de
Xiao, Li y Min Ding (2014), "Solo las caras: exploración de los efectos de
cortes multivariantes paralelos”, Estadísticas y computación, 21 (3),
las características faciales en la publicidad impresa", Marketing Science,
415–30. 33 (3), 338–52.
Trusov, Michael, Liye Ma y Zainab Jamal (2016), "Crumbs of the Cookie: Yao, Song y Carl F. Mela (2011), "Un modelo dinámico de publicidad de
User Profiling in CustomerBase Analysis and Be havioral Targeting", búsqueda patrocinada", Marketing Science, 30 (3), 447–68.
Marketing Science, 35 (3), 405–26.
Tucker, Catherine (2014), “Redes sociales, publicidad personalizada y Ying, Yuan Ping, Fred Feinberg y Michel Wedel (2006), “Aprovechamiento
controles de privacidad”, Journal of Marketing Research, 51 (octubre), de las calificaciones faltantes para mejorar los sistemas de
546–62. recomendación en línea”, Journal of Marketing Research, 43 (agosto),
Urban, Glen L., Gui Liberali, ErinMacDonald, Robert Bordley y John Hauser 355–65.
(2014), "Ad Morphing", Marketing Science, 33 (1), 27–46. Zhang, Jie y Lakshman Krishnamurthi (2004), “Personalizar promociones
Varian, Hal R. (2014), "Grandes datos: nuevos trucos para la econometría", en tiendas en línea”, Marketing Science, 23 (4), 561–78.
Revista de Perspectivas Económicas, 28 (2), 3–27.
Verhoef, Peter C., Edwin Kooge y Natasha Walk (2016), Crear valor con ——— y Michel Wedel (2009), “La eficacia de las promociones
Big Data Analytics: tomar decisiones de marketing más inteligentes. personalizadas en tiendas en línea y fuera de línea”, Journal of Marketing
Londres: Routledge. Research, 46 (abril), 190–206.
Análisis de marketing para entornos ricos en datos / 121