Está en la página 1de 25

Machine Translated by Google

Michel  Wedel  y  PK  Kannan

Análisis  de  marketing  para
Entornos  ricos  en  datos
Los  autores  brindan  un  examen  crítico  de  los  métodos  de  análisis  de  marketing  rastreando  su  desarrollo  histórico,  examinando  sus  aplicaciones  a  
datos  estructurados  y  no  estructurados  generados  dentro  o  fuera  de  una  empresa,  y  revisando  su  potencial  para  respaldar  las  decisiones  de  
marketing.  Los  autores  identifican  direcciones  para  nuevos  métodos  de  investigación  analítica,  abordando  (1)  análisis  para  optimizar  el  gasto  de  la  
mezcla  de  marketing  en  un  entorno  rico  en  datos,  (2)  análisis  para  la  personalización  y  (3)  análisis  en  el  contexto  de  la  privacidad  y  la  seguridad  
de  los  datos  de  los  clientes. .  Revisan  las  implicaciones  para  las  organizaciones  que  pretenden  implementar  análisis  de  big  data.  Finalmente,  
mirando  hacia  el  futuro,  los  autores  identifican  las  tendencias  que  darán  forma  a  la  analítica  de  marketing  como  disciplina,  así  como  a  la  educación  
en  analítica  de  marketing.

Palabras  clave:  big  data,  marketing  analytics,  marketing  mix,  personalización,  privacidad

Suplemento  en  línea:  http://dx.doi.org/10.1509/jm.15.0413

ha  sido  llamado  “el  petróleo”  de  la  economía  digital. eficiente  y  efectivo.  Sin  embargo,  aún  no  está  lo  suficientemente  
La  captura  rutinaria  de  información  digital  a  través  de   claro  qué  tipos  de  análisis  funcionan  para  qué  tipo  de  problemas  
Datos aplicaciones  móviles  y  en  línea  produce  grandes  flujos  de   y  datos,  qué  nuevos  métodos  se  necesitan  para  analizar  
datos  sobre  cómo  los  consumidores  se  sienten,  se  comportan  e   nuevos  tipos  de  datos  o  cómo  las  empresas  y  su  gestión  deben  
interactúan  con  los  productos  y  servicios,  así  como  también  cómo   evolucionar  para  desarrollar  e  implementar  habilidades  y  
responden  a  los  esfuerzos  de  marketing.  Los  datos  están  asumiendo   procedimientos  para  competir  en  este  nuevo  entorno.
un  papel  cada  vez  más  central  en  las  organizaciones,  ya  que  los   El  Marketing  Science  Institute  ha  esbozado  el  alcance  de  las  
especialistas  en  marketing  buscan  aprovechar  los  datos  para  construir   prioridades  de  investigación  en  torno  a  estos  temas.1  El  presente  
y  mantener  relaciones  con  los  clientes;  personalizar  productos,   artículo  proporciona  una  revisión  de  la  investigación  sobre  una  de  
servicios  y  la  mezcla  de  marketing;  y  automatizar  los  procesos  de   estas  prioridades:  análisis  para  entornos  ricos  en  datos.  Hemos  
marketing  en  tiempo  real.  El  crecimiento  explosivo  de  los  medios,   estructurado  nuestras  ideas  utilizando  el  marco  de  la  Figura  1.  En  el  
canales,  dispositivos  digitales  y  aplicaciones  de  software  ha  brindado   centro  está  el  uso  de  análisis  para  respaldar  las  decisiones  de  
a  las  empresas  oportunidades  sin  precedentes  para  aprovechar  los   marketing,  que  se  basa,  por  un  lado,  en  la  disponibilidad  de  datos  y,  
datos  para  ofrecer  más  valor  a  los  clientes,  mejorar  sus  experiencias,   por  otro  lado,  en  los  avances  en  análisis.  métodos.  Los  dominios  
aumentar  su  satisfacción  y  lealtad  y  extraer  valor.  Si  bien  es  posible   clave  para  las  aplicaciones  de  análisis  son  (1)  la  gestión  de  relaciones  
que  inicialmente  se  haya  sobrevalorado  el  potencial  de  big  data,  y  que   con  los  clientes  (CRM),  con  métodos  que  ayudan  a  la  adquisición,  
las  empresas  hayan  invertido  demasiado  en  la  captura  y  el   retención  y  satisfacción  de  los  clientes  para  mejorar  su  valor  de  por  
almacenamiento  de  datos  y  no  lo  suficiente  en  análisis,  cada  vez  es   vida  para  la  empresa2;  (2)  la  combinación  de  marketing,  con  métodos,  
más  claro  que  la  disponibilidad  de  big  data  está  generando  culturas   modelos  y  algoritmos  que  respaldan  la  asignación  de  recursos  para  
de  decisión  basadas  en  datos  en  las  empresas,  proporcionando  con   mejorar  la  eficacia  del  esfuerzo  de  marketing;  (3)  personalización  de  
ventajas  competitivas,  y  teniendo  un  impacto  significativo  en  su   la  mezcla  de  marketing  para  consumidores  individuales,  en  la  que  
desempeño  financiero.  El  reconocimiento  cada  vez  más  generalizado   se  han  logrado  avances  significativos  como  resultado  del  desarrollo  
de  que  los  grandes  datos  se  pueden  aprovechar  de  manera  efectiva   de  varios  enfoques  para  capturar  la  heterogeneidad  de  los  clientes;  y  
para  respaldar  las  decisiones  de  marketing  se  destaca  por  el  éxito  de   (4)  privacidad  y  seguridad,  un  área  que  preocupa  cada  vez  más  a  las  
los  líderes  de  la  industria.  Han  surgido  formas  completamente  nuevas   empresas  y  los  reguladores.  Estos  dominios  conducen  a  dos  pilares  
de  marketing,  incluidas  recomendaciones,  geo­cercas,  marketing  de   del  desarrollo  e  implementación  exitosos  de  análisis  de  marketing  en  
búsqueda  y  retargeting.  El  análisis  de  marketing  ha  llegado  a   las  empresas:  (1)  la  adopción  de  estructuras  y  culturas  organizacionales  
desempeñar  un  papel  central  en  estos  desarrollos,  y  existe  una   que  fomentan  la  toma  de  decisiones  basada  en  datos  y  (2)  la  
educación  
demanda  urgente  de  métricas  y  métodos  analíticos  nuevos  y  más  potentes  que   y  capacitación  
hagan  que   de  profesionales  
las  operaciones   de  marketing  abnalíticos.
asadas  en  datos  sean  más

Michel  Wedel  es  profesor  presidido  por  PepsiCo  de  Ciencias  del  Consumidor  y  
profesor  universitario  distinguido  en  la  Escuela  de  Negocios  Robert  H.  Smith  de  la  
Universidad  de  Maryland,  College  Park  (correo  electrónico:  mwedel@rhsmith.umd.edu). 1Consulte  http://www.msi.org/articles/marketers­top­concerns­frame
PK  Kannan  es  Profesor  Ralph  J.  Tyser  de  Ciencias  del  Marketing,  Robert  H. 2014­16­investigación­prioridades/.
Smith  School  of  Business,  Universidad  de  Maryland,  College  Park  (correo   2No  nos  enfocamos  en  temas  de  CRM  más  allá  de  la  personalización  en  este  
electrónico:  pkannan@rhsmith.umd.edu). artículo,  porque  otro  artículo  en  este  número  cubre  CRM  en  profundidad.

©  2016,  Asociación  Americana  de  Marketing Journal  of  Marketing:  edición  especial  de  AMA/MSI,  
ISSN:  0022­2429  (impreso)   vol.  80  (noviembre  de  2016),  97–121  
1547­7185  (electrónico) 97 DOI:  10.1509/jm.15.0413
Machine Translated by Google

FIGURA  1
Marco  del  artículo

Tipos  de  datos

Analítica  para
Decisiones  de  marketing
Analítica  y
Métodos  analíticos

Personalización Marketing Privacidad  y


CRM
Mezcla Seguridad

Analítica Implementando  grandes
Educación  y Datos  y  análisis
Capacitación en  empresas

El  futuro  de  la  analítica  de  marketing

Notas:  Los  datos  de  marketing  y  los  métodos  analíticos  se  utilizan  en  cuatro  áreas  principales  de  decisiones  de  marketing.  Su  implementación  en  las  empresas  
depende  de  la  cultura  y  la  estructura  organizativa  de  la  empresa  y  plantea  requisitos  de  educación  y  formación,  que  darán  forma  al  futuro  de  la  analítica  de  marketing.

La  agenda  de  este  artículo  es  la  siguiente.  Usando  el  marco  de  la   han  reconocido  cada  vez  más  las  ventajas  competitivas  clave  que  pueden  
Figura  1,  proporcionamos  una  breve  revisión  de  la  historia  de  los  datos  y   ofrecer  los  análisis,  lo  que  ha  impulsado  su  desarrollo  e  implementación  
análisis  de  marketing,  seguida  de  un  examen  crítico  de  la  medida  en  que   (Davenport  2006).
los  métodos  analíticos  específicos  son  aplicables  en  entornos  ricos  en  
Datos  disponibles
datos  y  respaldan  la  toma  de  decisiones  de  marketing  en  dominios  
centrales.  Este  análisis  conduce  a  la  identificación  de  futuras  líneas  de   La  historia  del  uso  sistemático  de  datos  en  marketing  comienza  alrededor  
investigación.  Elegimos  centrarnos  en  (1)  análisis  para  optimizar  el  gasto   de  1910  con  el  trabajo  de  Charles  Coolidge  Parlin  para  Curtis  Publishing  
de  la  combinación  de  marketing,  (2)  análisis  para  personalizar  la   Company  en  Boston  (Bartels  1988,  p.  125).
combinación  de  marketing  y  (3)  análisis  en  el  contexto  de  la  seguridad  de   Parlin  recopiló  información  sobre  los  mercados  para  guiar  la  publicidad  y  
los  datos  y  la  privacidad  del  cliente.  Revisamos  las  implicaciones  para   otras  prácticas  comerciales,  lo  que  llevó  a  varias  de  las  principales  
implementar  el  análisis  de  big  data  en  las  organizaciones  y  para  la   empresas  estadounidenses  a  establecer  departamentos  de  investigación  comercial.
educación  y  capacitación  en  análisis.  Al  hacerlo,  identificamos  las   Duncan  (1919)  enfatizó  el  uso  de  datos  externos  además  de  los  internos  
tendencias  que  darán  forma  al  marketing  como  disciplina  y  discutimos  las   por  parte  de  estos  departamentos.  La  investigación  mediante  cuestionarios,  
interconexiones  reales  y  aspiradas  entre  la  práctica  del  marketing  y  la   ya  realizada  en  el  contexto  de  las  encuestas  de  opinión  por  Gallup  en  la  
academia. década  de  1820,  se  volvió  cada  vez  más  popular  en  la  década  de  1920  
(Reilly  1929).  En  esa  época,  los  conceptos  de  la  psicología  se  incorporaron  
al  marketing  para  fomentar  una  mayor  comprensión  del  consumidor.  El  
modelo  de  atención,  interés,  deseo,  acción  (AIDA)  de  Starch  (1923)  es  un  
Una  breve  historia  de  los  datos  y  el  análisis  de  marketing  
excelente  ejemplo,  y  se  le  atribuye  la  adopción  generalizada  de  la  
El  análisis  de  marketing  implica  la   investigación  de  copias.
recopilación,  la  gestión  y  el  análisis  (descriptivo,  de  diagnóstico,  predictivo   Esta  era  también  vio  el  primer  uso  de  datos  de  seguimiento  ocular  (Nixon  
y  prescriptivo)  de  datos  para  obtener  información  sobre  el  rendimiento  del   1924).
marketing,  maximizar  la  eficacia  de  los  instrumentos  de  control  de   En  1923,  AC  Nielsen  fundó  una  de  las  primeras  empresas  de  
marketing  y  optimizar  los  resultados  de  las  empresas.  retorno  de  la   investigación  de  mercado.  Nielsen  comenzó  midiendo  las  ventas  de  
inversión  (ROI).  Es  interdisciplinario,  estando  en  el  nexo  de  mercadeo  y   productos  en  las  tiendas  y,  en  las  décadas  de  1930  y  1950,  comenzó  a  
otras  áreas  de  negocios,  matemáticas,  estadística,  economía,  econometría,   evaluar  las  audiencias  de  radio  y  televisión.  En  1931,  se  fundó  la  firma  de  
psicología,  psicometría  y,  más  recientemente,  informática.  El  análisis  de   investigación  de  mercado  Burke  en  los  Estados  Unidos,  e  inicialmente  
marketing  tiene  una  larga  historia  y,  como  resultado  del  crecimiento   realizó  investigaciones  de  prueba  de  productos  para  Procter  &  Gamble.  En  
explosivo  en  la  disponibilidad  de  datos  en  la  economía  digital  en  las  últimas   1934,  se  estableció  en  Alemania  la  empresa  de  investigación  de  mercado  
dos  décadas,  las  empresas GfK.  La  década  siguiente  vio  el  auge  de  los  experimentos  de  campo  y  el  
mayor  uso  de  encuestas  telefónicas  (White  1931).

98 /  Journal  of  Marketing:  edición  especial  de  AMA/MSI,  noviembre  de  2016
Machine Translated by Google

Los  datos  de  panel  se  hicieron  cada  vez  más  populares,  al  principio  principalmente   (GPS),  marcó  el  inicio  de  la  captura  de  datos  de  ubicación  del  consumidor  a  
para  medir  la  exposición  a  los  medios,  pero  en  la  década  de  1940  las  empresas   una  escala  sin  precedentes.
comenzaron  a  utilizar  datos  de  panel  para  registrar  las  compras  de  los  
consumidores  (Stonborough  1942).  George  Cullinan,  quien  introdujo  las  métricas   Analítica
de  "actualidad,  frecuencia,  monetarias"  que  se  convirtieron  en  centrales  en  CRM  
La  iniciativa  de  la  Fundación  Ford  y  el  Instituto  de  Matemáticas  Básicas  para  
(Neslin  2014),  estimuló  el  uso  de  los  propios  datos  de  clientes  de  las  empresas  a  partir  de  1961.
Aplicaciones  en  los  Negocios  de  Harvard  (en  1959/1960)  es  ampliamente  
En  1966,  se  fundó  el  Instituto  de  marketing  de  áreas  de  venta,  que  se  centró  en  
reconocida  por  haber  dado  el  mayor  impulso  a  la  aplicación  de  la  analítica  al  
los  datos  de  retiro  del  almacén.  La  importancia  de  las  computadoras  para  la  
marketing  (Winer  y  Neslin  2014).  Condujo  a  la  fundación  del  Instituto  de  Ciencias  
investigación  de  mercados  también  se  reconoció  por  primera  vez  en  esa  época  
(Casher  1969). del  Marketing  en  1961,  que  desde  entonces  ha  tenido  un  papel  continuo  en  la  
creación  de  puentes  entre  la  academia  y  la  práctica  del  marketing.  Los  métodos  
A  partir  de  fines  de  la  década  de  1970,  la  firma  de  investigación  de  mercado  
estadísticos  (p.  ej.,  análisis  de  varianza)  se  habían  aplicado  en  la  investigación  
Claritas,  fundada  sobre  el  trabajo  del  sociólogo  Charles  Booth  alrededor  de  
de  mercados  durante  más  de  una  década  (Ferber  1949),  pero  el  desarrollo  de  
1890,  acumuló  datos  geodemográficos  de  bases  de  datos  gubernamentales  y  
agencias  de  crédito.  La  introducción  del  Código  de  producto  universal  y  el  punto   modelos  estadísticos  y  econométricos  adaptados  a  problemas  específicos  de  

de  vista  computarizado  de  IBM  Los  dispositivos  de  escaneo  de  ventas  en  la   marketing   despegó  cuando  el  marketing  se  reconoció  como  un  campo  de  toma  

venta  minorista  de  alimentos  en  1972  marcaron  la  primera  captura  automatizada   de  d ecisiones.  a  través  de  la  iniciativa  Ford/Harvard  (Bartels  1988,  p.  125).

de  datos  por  parte  de  los  minoristas.  Compañías  como  Nielsen  rápidamente  
reconocieron  la  promesa  de  usar  datos  de  escáner  de  punto  de  venta  con  
fines  de  investigación  y  reemplazaron  las  auditorías  de  tiendas  bimensuales   El  desarrollo  de  la  teoría  de  la  decisión  bayesiana  en  el  Instituto  Harvard  (Raiffa  

con  datos  de  escáner  más  granulares.  Pronto,  se  pudo  rastrear  a  los  clientes   y  Schlaifer  1961)  también  desempeñó  un  papel,  ejemplificado  por  su  exitosa  

individuales  a  través  de  tarjetas  de  fidelización,  lo  que  condujo  a  la  aparición  de   aplicación,  entre  otras  cosas,  a  las  decisiones  de  fijación  de  precios  por  parte  

datos  de  panel  de  escáner  (Guadagni  y  Little  1983).  La  empresa  de  investigación   de  Green  (1963).  La  investigación  académica  en  marketing  comenzó  a  centrarse  

de  mercado  IRI,  que  midió  la  publicidad  televisiva  desde  la  fundación  de  la   más  en  el  desarrollo  de  modelos  estadísticos  y  análisis  predictivos.  Aunque  no  

empresa  en  1979,  lanzó  su  servicio  de  escaneo  de  códigos  de  barras  en  el   es  posible  revisar  todos  los  desarrollos  posteriores  aquí  (para  una  revisión  

hogar  en  1995. extensa,  consulte  Winer  y  Neslin  2014),  señalamos  algunos  hitos.

El  uso  de  datos  de  clientes  internos  fue  impulsado  en  gran  medida  por  la  
introducción  de  la  computadora  personal  en  el  mercado  masivo  por  parte  de  
IBM  en  1981.  Las  computadoras  personales  permitieron  a  los  comerciantes   Los  nuevos  modelos  de  difusión  de  productos  (Bass  1969)  involucraron  

almacenar  datos  sobre  clientes  actuales  y  potenciales,  lo  que  contribuyó  al   aplicaciones  de  ecuaciones  diferenciales  de  la  epidemiología.

surgimiento  del  marketing  de  base  de  datos,  iniciado  por  Robert  y  Kate   Los  modelos  estocásticos  del  comportamiento  del  comprador  (Massy,  

Kestnbaum  y  Robert  Shaw  (1987).  En  1990,  surgió  el  software  CRM,  para  el   Montgomery  y  Morrison,  1970)  tenían  sus  raíces  en  las  estadísticas  e  incluían  

cual  el  trabajo  anterior  sobre  la  automatización  de  la  fuerza  de  ventas  en  Siebel   supuestos  de  distribución  sobre  las  medidas  del  comportamiento  de  compra  

Systems  allanó  el  camino.  Las  computadoras  personales  también  facilitaron  la   de  los  consumidores.  La  aplicación  del  cálculo  de  decisiones  (Little  y  Lodish  
investigación  mediante  encuestas  a  través  de  entrevistas  personales  y   1969;  Lodish  1971)  para  optimizar  el  gasto  en  publicidad  y  la  fuerza  de  ventas  
telefónicas. se  hizo  popular  después  de  su  introducción  al  marketing  por  parte  de  Little  
En  1995,  después  de  más  de  dos  décadas  de  desarrollo  en  la  Agencia  de   (1970).  Los  modelos  de  cuota  de  mercado  y  demanda  de  datos  de  escáner  a  
Proyectos  de  Investigación  Avanzada  de  Defensa  y  otras  organizaciones,  nació   nivel  de  tienda  (Nakanishi  y  Cooper  1974)  se  derivaron  de  modelos  

la  World  Wide  Web,  y  esto  condujo  a  la  disponibilidad  de  grandes  volúmenes   econométricos  de  demanda.  Las  técnicas  de  escalado  y  despliegue  
de  datos  de  marketing. multidimensional,  fundadas  en  la  psicometría  (Coombs  1950),  se  convirtieron  
Los  datos  de  flujo  de  clics  extraídos  de  los  registros  del  servidor  se  utilizaron   en  un  área  activa  de  investigación,  con  contribuciones  clave  de  Green  (1969)  y  
para  realizar  un  seguimiento  de  las  visitas  a  la  página  y  los  clics  mediante   DeSarbo  (DeSarbo  y  Rao  1986).  Estas  técnicas  allanaron  el  camino  para  la  
cookies.  Los  datos  de  clics  arrojaron  medidas  de  la  efectividad  de  la  publicidad  en  línea.investigación  de  la  estructura  del  mercado  y  el  posicionamiento  del  producto  al  
Internet  estimuló  el  desarrollo  de  sistemas  CRM  por  parte  de  empresas  como   derivar  mapas  espaciales  a  partir  de  juicios  y  elecciones  de  proximidad  y  
Oracle  y,  en  1999,  Salesforce  fue  la  primera  empresa  en  ofrecer  sistemas  CRM   preferencia.  El  análisis  conjunto  (Green  y  Srinivasan  1978)  y,  más  tarde,  el  
a  través  de  la  computación  en  la  nube. análisis  de  elección  conjunta  (Louviere  y  Woodworth  1983)  son  contribuciones  
Google  se  fundó  en  1998  y  defendió  la  búsqueda  de  palabras  clave  y  la   únicas  que  evolucionaron  a  partir  del  trabajo  psicométrico  de  Luce  sobre  la  
´
captura  de  datos  de  búsqueda.  Los  motores  de  búsqueda  existían  desde  la   cuantificación  de  los  atributos  psicológicos  (Luce  y  Tukey  1964).
década  anterior;  el  primer  motor  de  búsqueda  de  protocolo  de  transferencia  de  
archivos  Archie  se  desarrolló  en  la  Universidad  McGill.  El  advenimiento  del  
contenido  generado  por  el  usuario,  incluidas  las  reseñas  de  productos  en  línea,   Los  modelos  logit  multinomiales  basados  en  panel  de  escáner  (Guadagni  y  
los  blogs  y  los  videos,  resultó  en  un  aumento  del  volumen  y  la  variedad  de   Little  1983)  se  construyeron  directamente  sobre  la  investigación  en  econometría  
datos.  El  lanzamiento  de  Facebook  en  2004  abrió  una  era  de  datos  de  redes   de  McFadden  (1974).  El  modelo  logit  anidado  que  captura  la  toma  de  decisiones  
sociales.  Con  la  llegada  de  YouTube  en  2005,  grandes  cantidades  de  datos  en   jerárquica  del  consumidor  se  introdujo  en  marketing  (Kannan  y  Wright  1991),  y  
forma  de  texto  y  video  subidos  por  los  usuarios  se  convirtieron  en  la  materia   se  reconoció  que  los  modelos  de  múltiples  aspectos  del  comportamiento  del  
prima  para  la  orientación  por  comportamiento.  Twitter,  con  sus  mensajes  mucho   consumidor  (por  ejemplo,  incidencia,  elección,  tiempo,  cantidad)  podrían  
más  simples  de  140  caracteres,  hizo  lo  mismo  en  2006.  Los  teléfonos  inteligentes   integrarse  (Gupta  1988).  Esto  resultó  ser  una  idea  poderosa  para  los  modelos  
existían  desde  principios  de  la  década  de  1990,  pero  la  introducción  del  iPhone   de  actualidad,  frecuencia  y  métricas  monetarias  (Schmittlein  y  Peterson  1994).  
de  Apple  en  2007,  con  su  sistema  de  posicionamiento  global Mientras  que  los  métodos  anteriores  para  identificar

Análisis  de  marketing  para  entornos  ricos  en  datos /  99
Machine Translated by Google

Las  estructuras  de  mercado  competitivo  se  basaron  en  elasticidades   compañía  que  se  especializó  en  pruebas  de  textos  publicitarios  basadas  
cruzadas  de  precios  estimadas,  los  modelos  que  derivan  mapas   en  el  trabajo  académico  de  Starch,  y  John  DC  Little  y  Glen  L.  Urban's  
competitivos  a  partir  de  datos  de  elección  de  panel  se  desarrollaron  sobre   Management  Decision  Systems,  que  luego  se  vendió  a  IRI.
la  base  de  la  noción  de  que  las  estructuras  de  mercado  competitivo  surgen   El  trabajo  de  Zoltman  y  Sinha  sobre  la  asignación  de  la  fuerza  de  ventas  
de  las  percepciones  de  los  consumidores  sobre  la  sustituibilidad,  revelada   se  implementó  en  la  práctica  a  través  de  ZS  Associates.  El  trabajo  de  
a  través  de  sus  elecciones  de  productos  (Elrod  1988) .  Los  métodos  de   Claes  Fornell  sobre  la  medición  de  la  satisfacción  condujo  al  Índice  de  
series  de  tiempo  (DeKimpe  y  Hanssens  1995)  permitieron  a  los   Satisfacción  del  Consumidor  Estadounidense,  elaborado  por  su  empresa,  
investigadores  comprobar  si  los  instrumentos  de  marketing  producían   CFI  Group.  MarketShare,  la  empresa  cofundada  por  Dominique  Hanssens,  
cambios  permanentes  o  transitorios  en  las  ventas. implementó  con  éxito  sus  modelos  sobre  la  eficacia  a  largo  plazo  de  la  
La  heterogeneidad  en  los  comportamientos  de  los  consumidores   combinación  de  marketing.
individuales  se  convirtió  en  una  premisa  central  en  la  que  se  basó  la   Jan­Benedict  EM  Steenkamp  fundó  AiMark,  una  empresa  conjunta  con  
estrategia  de  marketing,  y  el  modelo  de  elección  mixta  fue  el  primero  en   GfK  que  aplica  métodos  y  conceptos  académicos,  particularmente  en  
permitir  a  los  gerentes  identificar  segmentos  de  consumidores  basados   marketing  internacional.  Prácticamente  todas  estas  empresas  tuvieron  
en  respuestas  a  partir  de  datos  de  escáner  (Kamakura  y  Russell  1989).   éxito  gracias  a  la  aplicación  de  análisis.
Este  modelo  se  generalizó  para  dar  cabida  a  una  amplia  gama  de  modelos  
de  comportamiento  del  consumidor  (Wedel  y  DeSarbo  1995).  La   Ejemplos  de  empresas  con  vínculos  muy  estrechos  con  la  academia  
heterogeneidad  del  consumidor  se  representó  de  manera  continua  en  los   incluyen  Sawtooth  Software  de  Richard  M.  Johnson,  que  se  especializa  
modelos  jerárquicos  de  Bayes  (Rossi,  McCulloch  y  Allenby  1996).  Aunque   en  el  diseño  y  análisis  de  software  para  estudios  conjuntos,  e  In4mation  
los  académicos  inicialmente  debatieron  cuál  de  estos  dos  enfoques   Insights  de  Steven  Cohen  y  Mark  Garratt,  que  aplica  modelos  estadísticos  
representaba  mejor  la  heterogeneidad,  la  investigación  ha  demostrado   bayesianos  completos  a  una  amplia  variedad  de  problemas  aplicados,  
que  cada  uno  de  los  enfoques  coincide  con  tipos  específicos  de  problemas   incluido  el  modelado  de  la  mezcla  de  marketing.  En  algunos  casos,  la  
de  marketing,  con  pocas  diferencias  entre  ellos  (Andrews,  Ainslie  y  Currim   academia  de  marketing  va  a  la  zaga  de  los  desarrollos  en  la  práctica  y,  
2002).  Se  puede  decir  con  seguridad  que  el  enfoque  bayesiano  es  ahora   por  lo  tanto,  se  enfoca  en  el  impacto  y  la  validez  de  estos  desarrollos  en  
uno  de  los  enfoques  de  modelado  dominantes  en  marketing,  que  ofrece   la  práctica.  En  otros  casos,  los  académicos  son  coinvestigadores  que  
un  marco  poderoso  para  desarrollar  modelos  integrados  de  comportamiento   confían  en  los  datos  y  problemas  proporcionados  por  las  empresas  y  
del  consumidor  (Rossi  y  Allenby  2003).  Dichos  modelos  se  han  aplicado   trabajan  junto  con  estas  empresas  para  desarrollar  soluciones  analíticas  
con  éxito  al  seguimiento  ocular  publicitario  (Wedel  y  Pieters  2000),   implementables.  Sin  embargo,  como  discutiremos  a  continuación,  en  un  
marketing  por  correo  electrónico  (Ansari  y  Mela  2003),  navegación  web   número  cada  vez  mayor  de  áreas  de  aplicación  en  la  economía  digital,  los  
(Montgomery  et  al.  2004),  redes  sociales  (Moe  y  Trusov  2011)  y  búsqueda   académicos  están  liderando  el  desarrollo  de  nuevos  conceptos  y  métodos.
paga.  publicidad  (Rutz,  Trusov  y  Bucklin  2011).

Síntesis  El  
La  derivación  de  decisiones  de  maximización  de  beneficios,  inspirada  
en  el  trabajo  de  Dorfman  y  Steiner  (1954)  en  economía,  formó  la  base  del   desarrollo  del  análisis  basado  en  datos  en  marketing  desde  alrededor  de  
enfoque  de  investigación  operativa  (OR)  para  la  toma  de  decisiones   1900  hasta  la  introducción  de  la  World  Wide  Web  en  1995  ha  progresado  
óptimas  en  publicidad  (Parsons  y  Bass  1971),  asignación  de  fuerza  de   a  través  de  aproximadamente  tres  etapas:  (1)  la  descripción  de  las  
ventas  ( Mantrala,  Sinha  y  Zoltners  1994),  selección  de  objetivos  en   condiciones  observables  del  mercado  a  través  de  enfoques  estadísticos  
marketing  directo  (Bult  y  Wansbeek  1995)  y  personalización  de  descuentos   simples,  (2)  el  desarrollo  de  modelos  para  proporcionar  conocimientos  y  
de  precios  en  línea  (Zhang  y  Krishnamurthi  2004).  Los  modelos   diagnósticos  utilizando  teorías  de  la  economía  y  la  psicología,  y  (3)  la  
estructurales  basados  en  la  economía  incluyen  enfoques  que   evaluación  de  las  políticas  de  marketing,  en  las  que  se  predicen  sus  
complementan  las  ecuaciones  de  demanda  agregada  con  supuestos  de   efectos  y  se  respalda  la  toma  de  decisiones  de  marketing  utilizando  
equilibrio  del  lado  de  la  oferta  (Chintagunta  2002),  basados  en  el  trabajo   enfoques  estadísticos,  econométricos  y  OR.  En  muchos  casos  a  lo  largo  
de  los  economistas  Berry,  Levinsohn  y  Pakes  (1995).  Una  segunda  clase   de  la  historia  del  análisis  de  marketing,  poco  después  de  que  se  dispusiera  
de  modelos  estructurales  acomoda  el  comportamiento  prospectivo  (Erdem   de  nuevas  fuentes  de  datos,  se  introdujeron  o  desarrollaron  métodos  para  
y  Keane  1996),  basado  en  el  trabajo  en  economía  de  Rust  (1987).  Los   analizarlos  (para  obtener  un  resumen  de  la  historia  de  los  datos  y  los  
modelos  estructurales  permiten  predicciones  de  los  cambios  de   métodos  analíticos,  consulte  la  Figura  2;  la  Tabla  1  resume  el  estado­  
comportamiento  de  los  agentes  cuando  se  implementan  cambios  de   enfoques  de  última  generación).  Muchos  de  los  métodos  desarrollados  
política  (Chintagunta  et  al.  2006). por  académicos  de  marketing  desde  la  década  de  1960  ahora  se  han  
puesto  en  práctica  y  respaldan  la  toma  de  decisiones  en  áreas  como  
CRM,  marketing  mix  y  personalización  y  han  aumentado  el  rendimiento  
De  la  teoría  a  la  práctica  Roberts,  
financiero  de  las  empresas  que  los  implementan.
Kayande  y  Stremersch  (2014)  demuestran  empíricamente  el  impacto  de  
estos  desarrollos  académicos  en  la  práctica  del  marketing.  A  través  de  
entrevistas  entre  gerentes,  encuentran  un  impacto  significativo  de  varias   Desde  el  año  2000,  la  captura  automatizada  de  flujo  de  clics  en  línea,  
herramientas  de  análisis  en  la  toma  de  decisiones  de  la  empresa.  La   mensajes,  boca  a  boca  (WOM),  transacciones  y  datos  de  ubicación  ha  
relevancia  de  estos  desarrollos  para  la  práctica  del  marketing  se  evidencia   reducido  en  gran  medida  el  costo  variable  de  la  recopilación  de  datos  y  
aún  más  con  ejemplos  de  empresas  que  se  fundaron  en  el  trabajo   ha  dado  como  resultado  volúmenes  de  datos  sin  precedentes  que  brindan  
académico.  Los  primeros  casos  de  empresas  exitosas  incluyen  Starch   información  sobre  los  consumidores.  comportamiento  a  niveles  
and  Associates,  una excepcionales  de  profundidad  y  granularidad.  Aunque  los  académicos  tienen

100 /  Journal  of  Marketing:  edición  especial  de  AMA/MSI,  noviembre  de  2016
Machine Translated by Google

FIGURA  2
Un  resumen  de  la  línea  de  tiempo  de  los  datos  y  análisis  de  marketing

Cuota  de  mercado
Modelos

ANOVA, bayesiano Latente


MDS  conjunto Estructural
Regresión Decisión Clase

Analítica O MNL media  pensión

1900 1925 1950 1975 2000 2025

Datos TPV Buscar Social


Exploración

Ojo Diario Transacción Escáner


Paneles Vídeo  de  flujo  de  clics Ubicación
Encuesta  de  seguimiento Panel

Notas:  ANOVA  =  análisis  de  varianza;  MDS  =  escalamiento  multidimensional;  POS  =  punto  de  venta;  MNL  =  modelo  logit  multinomial;  HB  =  Bayes  jerárquico.
Esta  línea  de  tiempo  resume  la  disponibilidad  de  nuevos  datos  de  marketing  y  el  desarrollo  de  las  principales  clases  de  modelos  de  marketing.  A  medida  que  nuevos  
tipos  de  datos  estuvieron  disponibles,  siguieron  nuevos  modelos  para  analizarlos.

asumido  el  desafío  de  desarrollar  modelos  de  diagnóstico  y  predictivos   analistas,  y/o  la  presencia  de  barreras  organizacionales  para  
para  estos  datos  en  la  última  década,  es  cierto  que  estos  desarrollos   implementar  análisis  avanzados.  En  particular,  los  datos  no  
aún  están  en  pañales.  Por  un  lado,  las  métricas  descriptivas  que  se   estructurados  en  forma  de  blogs,  reseñas  y  tweets  ofrecen  
muestran  en  los  tableros  son  populares  en  la  práctica.  Esto  podría   oportunidades  para  profundizar  en  la  economía  y  la  psicología  del  
ser  el  resultado  de  limitaciones  en  el  poder  de  cómputo,  la  necesidad   comportamiento  del  consumidor,  lo  que  podría  marcar  el  comienzo  
de  conocimientos  rápidos  en  tiempo  real,  la  falta  de  personal  capacitado de  la  segunda  etapa  en  el  análisis  de  marketing  digital  una  vez  que  los  modelos  aprop

TABLA  1
Análisis  de  marketing:  enfoques  de  vanguardia  y  sus  aplicaciones
Área  de  enfoque Desarrollos  y  enfoques  de  vanguardia

Datos
Datos  estructurados •  Una  plétora  de  métodos  descriptivos,  diagnósticos,  predictivos  y  prescriptivos  para  análisis  en  muchos
las  áreas  de  marketing  están  disponibles
•  Los  enfoques  para  manejar  big  data  incluyen  aquellos  que  utilizan  métodos  bayesianos,  métodos  de  agregación  y  compresión  
de  datos,  métodos  de  muestreo  y  selección  de  variables,  aproximaciones  y  simplificaciones  de  modelos,  algoritmos  eficientes  
de  cadena  de  Markov  Monte  Carlo  y  computación  paralela  •  Experimentos  de  campo  y  cuasi­experimentos,  
variables  instrumentales  (IV)  y  enfoques  libres  de  instrumentos  para
endogeneidad,  enfoques  de  discontinuidad  de  regresión
Datos  no  estructurados •  En  su  mayoría  métodos  analíticos  descriptivos  y  de  diagnóstico,  los  métodos  predictivos  y  prescriptivos  aún  se  ponen  al  día  •  
Enfoques  
de  minería  de  texto  y  aprendizaje  automático  •  Incorporación  de  
estructura  a  través  de  métricas  para  datos  de  texto,  audio,  imagen  y  video;  seguimiento  ocular,  rostro
reconocimiento  y  otros  neurodatos

Modelado  de  mezcla  de  marketing •  Efectos  de  modelado  de  redes  sociales,  búsqueda  de  palabras  clave,  WOM  en  línea,  tendencias  y  dispositivos  móviles/ubicación
dentro  de  la  mezcla  de  marketing  
•  Análisis  de  toda  la  ruta  de  compra,  modelado  de  atribución  •  Incorporación  
de  entornos  y  contextos  institucionales  específicos  para  mejorar  la  estimación  de  la  estructura
modelos  y  sus  simulaciones  de  políticas;  mejores  variables  instrumentales  para  abordar  la  endogeneidad;  experimentos  de  
campo  y  cuasi­experimentos  para  efectos  causales  •  
Personalización Personalización  en  línea  y  móvil  de  la  combinación  de  marketing  •  Tratar  con  
las  observaciones  faltantes  e  incorporar  la  receptividad  en  las  recomendaciones  •  Enfoques  de  personalización  
adaptativa—aprendiendo  y  adaptándose  a  los  cambios  de  preferencias  de  los  usuarios  en  un  ciclo  automatizado  continuo  •  
Investigación  en  el  efectos  de  las  

Seguridad  y  privacidad regulaciones  y  políticas  de  privacidad  y  seguridad  en  el  comportamiento  del  consumidor  y  la  competencia  entre  empresas

•  Modelos  para  analizar  datos  minimizados  y  anonimizados

Análisis  de  marketing  para  entornos  ricos  en  datos /  101
Machine Translated by Google

se  desarrollan  y  aplican.  Por  otro  lado,  los  métodos  de  aprendizaje   Datos  y  análisis
automático  de  las  ciencias  de  la  computación  (incluidas  las  redes  
neuronales  profundas  y  los  sistemas  cognitivos,  que  analizamos  más   Tipos  de  datos  Big  
adelante;  consulte  la  Tabla  1)  se  han  vuelto  populares  en  la  práctica,  
data  a  menudo  se  caracteriza  por  las  cuatro  "V":  volumen  (de  terabytes  
pero  se  han  investigado  con  poca  frecuencia  en  la  academia  de  
a  petabytes),  velocidad  (desde  instantáneas  únicas  hasta  datos  de  
marketing.  Su  popularidad  puede  provenir  de  su  excelente  desempeño  
alta  frecuencia  y  transmisión),  variedad  (numérica,  red,  texto,  imágenes  
predictivo  y  su  naturaleza  de  caja  negra,  lo  que  permite  una  aplicación  
y  vídeo)  y  veracidad  (fiabilidad  y  validez).  Las  dos  primeras  
de  rutina  con  una  intervención  limitada  del  analista. características  son  importantes  desde  el  punto  de  vista  informático,  y  
La  pregunta  es  si  los  académicos  de  marketing  deberían  subirse  al   las  dos  últimas  son  importantes  desde  el  punto  de  vista  analítico.  A  
carro  del  aprendizaje  automático,  algo  a  lo  que  pueden  haber  sido   veces  se  añade  una  quinta  “V”:  valor.  Trasciende  los  cuatro  primeros  
reacios  porque  estas  técnicas  no  establecen  efectos  causales  ni   y  es  importante  desde  el  punto  de  vista  empresarial.  Los  grandes  
producen  conocimientos  teóricos  generalizables.  Sin  embargo,  la   datos  son  principalmente  observacionales,  pero  las  encuestas,  los  
combinación  de  estos  enfoques  con  modelos  más  clásicos  para  el   experimentos  de  campo  y  los  experimentos  de  laboratorio  pueden  
análisis  de  marketing  puede  abordar  estas  deficiencias  y  ser   generar  datos  de  gran  variedad  y  alta  velocidad.
prometedor  para  futuras  investigaciones  (Tabla  2). Gran  parte  del  entusiasmo  que  rodea  a  los  grandes  datos  se  ejemplifica  
Es  razonable  esperar  que  el  tercer  paso  en  la  evolución  de  la  analítica   en  la  escala  y  el  alcance  de  los  datos  de  observación  generados  por  
en  la  economía  digital,  el  desarrollo  de  modelos  para  generar   los  "tres  grandes"  de  los  grandes  datos:  Google,  Amazon  y  Facebook.
información  de  diagnóstico  y  respaldar  decisiones  en  tiempo  real  a   Google  recibe  más  de  4  millones  de  consultas  de  búsqueda  por  minuto  
partir  de  big  data,  sea  inminente.  Sin  embargo,  la  academia  de   de  los  2.400  millones  de  usuarios  de  Internet  de  todo  el  mundo  y  
marketing  deberá  desarrollar  métodos  analíticos  con  un  buen  ojo  para   procesa  20  petabytes  de  información  al  día.  Los  1.300  millones  de  
el  volumen  y  la  variedad  de  datos,  así  como  para  la  velocidad  de   usuarios  de  Facebook  comparten  2,5  millones  de  piezas  de  contenido  
cálculo,  componentes  que  hasta  ahora  se  han  ignorado  en  gran   cada  minuto.  Amazon  ha  creado  un  marketplace  con  278  millones  de  
medida  (consulte  la  Tabla  2).  En  el  resto  de  este  artículo,  revisamos   clientes  activos  del  que  registra  datos  en  línea
los  desarrollos  recientes  e  identificamos  las  posibles  barreras  y   Comportamiento  de  navegación  y  compra.  Estas  y  otras  empresas  
oportunidades  hacia  la  implementación  exitosa  de  análisis  para   han  cambiado  el  panorama  del  marketing  en  la  última  década  a  través  
respaldar  las  decisiones  de  marketing  en  entornos  ricos  en  datos. de  la  generación,  provisión  y  utilización  de  big  data.

TABLA  2
Análisis  de  marketing:  temas  para  futuras  investigaciones
Área  de  enfoque Temas  prometedores  e  importantes  para  la  investigación

Datos
Datos  estructurados •  Segmentación  por  comportamiento  con  datos  entre  dispositivos;  análisis  móvil,  basado  en  la  ubicación  y  social  •  Fusión  de  datos  
generados  dentro  de  la  empresa  con  datos  generados  fuera  de  la  empresa;  integrando  “pequeñas  estadísticas
sobre  big  data”  con  enfoques  de  “big  stats  on  small  data”
•  Combinar  enfoques  de  aprendizaje  automático  con  métodos  econométricos  y  basados  en  la  teoría  para  aplicaciones  de  big  data;  
soluciones  computacionales  a  modelos  de  marketing  para  big  data  •  Desarrollo  de  enfoques  
Datos  no  estructurados diagnósticos,  predictivos  y  prescriptivos  para  el  análisis  de  datos  a  gran  escala
datos  no  estructurados
•  Enfoques  para  analizar  datos  sociales,  geoespaciales  y  móviles  no  estructurados  y  combinarlos  con
datos  estructurados  en  contextos  de  big  data
•  Usar,  evaluar  y  extender  métodos  de  aprendizaje  profundo  y  computación  cognitiva  para  analizar  datos  de  marketing  no  estructurados

Modelado  de  mezcla  de  marketing •  Alinear  el  análisis  de  datos  desagregados  con  el  de  datos  agregados  e  incluir  datos  no  estructurados
en  el  análisis  de  la  mezcla  de  marketing
•  Nuevas  técnicas  y  métodos  para  medir  con  precisión  el  impacto  de  los  instrumentos  de  marketing  y  su  remanente  y  difusión  a  través  de  
medios  y  dispositivos  utilizando  datos  integrados  de  ruta  de  compra
•  Optimización  dinámica,  multiperíodo  y  entre  categorías  de  la  combinación  de  marketing  •  Enfoques  para  incorporar  
diferentes  ciclos  de  planificación  para  diferentes  instrumentos  de  marketing  en  los  medios
mezclar  modelos

Personalización •  Soluciones  de  marketing  de  circuito  cerrado  automatizado  para  entornos  digitales;  marketing  totalmente  automatizado
soluciones
•  Personalización  y  técnicas  de  personalización  mediante  sistemas  cognitivos,  artificiales  en  general.
análisis  de  inteligencia  y  atención  automatizados;  personalización  de  contenido
•  Personalización  móvil  y  basada  en  la  ubicación  de  la  combinación  de  marketing  •  

Seguridad  y  privacidad Métodos  para  producir  y  manejar  minimización  de  datos  y  anonimización  de  datos  en  la  evaluación
eficacia  y  personalización  de  la  mezcla  de  marketing
•  Soluciones  de  datos  distribuidos  para  mejorar  la  seguridad  y  privacidad  de  los  datos  mientras  se  maximizan  las  oportunidades  de  
marketing  personalizadas

102 /  Journal  of  Marketing:  edición  especial  de  AMA/MSI,  noviembre  de  2016
Machine Translated by Google

Las  soluciones  emergentes  para  vincular  los  datos  de  los  clientes  a   FIGURA  3
través  de  canales  en  línea  y  fuera  de  línea  y  de  televisión,  tabletas,   Gestión  de  tipos  de  datos
dispositivos  móviles  y  otros  dispositivos  digitales  contribuirán  aún  más  a  
la  disponibilidad  de  datos.  Además,  en  2014,  más  de  15 000  millones  de  
dispositivos  estaban  equipados  con  sensores  que  les  permiten  
No  SQL
conectarse  y  transferir  datos  a  través  de  redes  sin  interacción  humana.   no  estructurado
sql Hadoop
Este  "Internet  de  las  cosas"  puede  convertirse  en  una  fuente  importante   Relacional casandra
de  desarrollo  de  nuevos  productos  y  servicios  y  generar  datos  masivos  en  el hojas  de  calculo bases  de  datos Dremel

proceso. Estructurado Tiempo  real colmena,  cerdo


archivos  ASCII
bases  de  datos
Las  encuestas  se  han  vuelto  mucho  más  fáciles  de  administrar  con  
los  avances  tecnológicos  que  permiten  la  recopilación  de  datos  móviles  
Volumen
y  en  línea  (por  ejemplo,  Amazon  Mechanical  Turk).  Las  empresas   experimento  de  laboratorio Grandes  datos
Velocidad
evalúan  continuamente  la  satisfacción  del  cliente;  las  nuevas  interfaces   Encuesta Variedad
digitales  requieren  que  esto  se  haga  con  encuestas  cortas  para  reducir   Experimento  de  campo
la  fatiga  y  el  desgaste.  Por  ejemplo,  la  lealtad  a  menudo  se  evalúa  con   Observacional,  Web,  Móvil

puntajes  netos  de  promotores  de  un  solo  elemento.  Como  consecuencia,  
los  datos  longitudinales  y  de  sección  transversal  repetida  se  están   Notas:  El  eje  vertical  muestra  el  grado  de  estructura  de  los  datos  y  el  eje  
horizontal  muestra  las  dimensiones  que  dan  como  resultado  el  big  data.
volviendo  más  comunes.  Mittal,  Kumar  y  Tsiros  (1999)  utilizan  esos  
El  software  para  gestionar  estos  datos  aparece  en  el  centro  de  la  figura.
datos  para  rastrear  los  impulsores  de  la  lealtad  del  cliente  a  lo  largo  del  
tiempo.  Para  abordar  el  problema  de  los  cuestionarios  más  cortos,  se  
han  desarrollado  técnicas  analíticas  para  crear  encuestas  personalizadas   Software  para  el  procesamiento  de  Big  Data3  La  
que  se  adaptan  sobre  la  base  de  las  respuestas  a  preguntas  anteriores  
(Kamakura  y  Wedel  1995),  así  como  el  diseño  de  cuestionarios  divididos   Figura  3  proporciona  una  descripción  general  de  las  clases  de  datos  de  
¨
a  medida  para  encuestas  masivas  (Adiguzel  y  Wedel  1995).  Wedel   marketing  discutidos  anteriormente  y  los  métodos  para  almacenarlos  y  
manipularlos.  Para  datos  estructurados  de  tamaño  pequeño  a  mediano,  
2008).
los  métodos  convencionales  como  las  hojas  de  cálculo  de  Excel;  
Las  tecnologías  digitales  facilitan  los  experimentos  de  campo  a  
archivos  ASCII;  o  conjuntos  de  datos  de  paquetes  estadísticos  como  
gran  escala  que  producen  grandes  datos  y  se  han  convertido  en  
SAS,  S­Plus,  STATA  y  SPSS  son  adecuados.  SAS  se  mantiene  
poderosas  herramientas  para  obtener  respuestas  a  las  preguntas  sobre  
particularmente  bien  a  medida  que  aumenta  el  tamaño  de  los  datos  y  es  
los  efectos  causales  de  las  acciones  de  marketing.  Por  ejemplo,  las  
popular  en  muchos  sectores  industriales  (p.  ej.,  comercio  minorista,  
pruebas  A/B  a  gran  escala  permiten  a  las  empresas  "probar  y  aprender"  
servicios  financieros,  gobierno)  por  ese  motivo.  A  medida  que  el  número  
para  optimizar  los  diseños  de  sitios  web,  la  publicidad  (búsqueda,  social  
y  móvil),  la  orientación  por  comportamiento  y  otros  aspectos  de  la   de  registros  asciende  a  millones,  las  bases  de  datos  relacionales  como  

combinación  de  marketing.  Hui  et  al.  (2013)  utilizan  experimentos  de   MySQL  (utilizada,  por  ejemplo,  por  Wikipedia)  son  cada  vez  más  eficaces  

campo  para  evaluar  promociones  móviles  en  tiendas  minoristas.   para  la  manipulación  de  datos  y  para  realizar  consultas.  Para  aplicaciones  

Alternativamente,  los  experimentos  naturales  (o  cuasi)  aprovechan  los   web  grandes  y  en  tiempo  real  en  las  que  el  volumen,  la  variedad  y  la  
impactos  exógenos  que  ocurren  naturalmente  en  los  datos  para   velocidad  son  altos,  las  bases  de  datos  como  NoSQL  son  la  opción  
preferida  porque  proporcionan  un  mecanismo  para  el  almacenamiento  y  
establecer  relaciones  causales,  pero  a  menudo  se  requieren  métodos  
recuperación  de  datos  que  no  requiere  relaciones  tabulares  como  las  de  
analíticos  más  extensos  (incluidos  los  métodos  de  comparación  y  de  
las  bases  de  datos  relacionales.  y  se  pueden  escalar  horizontalmente  a  
variables  instrumentales)  para  establecer  la  causalidad.  Por  ejemplo,  
través  del  hardware  básico.  Apache  Cassandra,  un  software  de  código  
Ailawadi  et  al.  (2010)  muestran  cómo  se  pueden  usar  diseños  
abierto  desarrollado  inicialmente  por  Facebook,  es  un  buen  ejemplo  de  
cuasiexperimentales  para  evaluar  el  impacto  de  la  entrada  de  las  tiendas  
un  sistema  de  administración  de  base  de  datos  distribuida.  Hadoop,  
Wal­Mart  en  los  minoristas,  utilizando  un  diseño  de  antes  y  después  
con  un  grupo  de  control  de  tiendas  emparejadas  en  una  variedad  de   desarrollado  originalmente  en  Yahoo!,  es  un  sistema  para  almacenar  y  

medidas.  Otra  forma  de  aprovechar  los  grandes  datos  para  evaluar  la   manipular  datos  en  una  multitud  de  computadoras,  escrito  en  el  lenguaje  

causalidad  es  examinar  porciones  delgadas  de  datos  en  torno  a  los   de  programación  Java.  En  su  núcleo  se  encuentran  el  sistema  de  gestión  

cambios  de  política  que  ocurren  en  los  datos,  lo  que  puede  revelar  el   de  archivos  distribuidos  Hadoop  para  el  almacenamiento  de  datos  y  el  

impacto  de  esos  cambios  en  las  variables  dependientes  de  interés  a   marco  de  programación  MapReduce  para  el  procesamiento  de  datos.  
Por  lo  general,  las  aplicaciones  están  escritas  en  un  lenguaje  como  Pig,  
través  de  los  llamados  diseños  de  discontinuidad  de  regresión  (Hartmann,  Nair,  y  Narayanan  2011).
que  asigna  consultas  a  través  de  datos  que  se  almacenan  en  cientos  de  
Finalmente,  los  experimentos  de  laboratorio  generalmente  generan  
computadoras  de  forma  paralela  y  luego  combina  la  información  de  
volúmenes  más  pequeños  de  datos,  pero  los  avances  tecnológicos  han  
todos  para  responder  la  consulta.  Los  motores  SQL  como  Dremel  
permitido  la  administración  y  recopilación  en  línea  de  audio,  video,  
(Google),  Hive  (Hortonworks)  y  Spark  (Databricks)  permiten  tiempos  de  
seguimiento  ocular,  seguimiento  facial  (Teixeira,  Wedel  y  Pieters  2010)  
respuesta  muy  cortos.  Sin  embargo,  para  el  posprocesamiento,  estos  
y  datos  de  neuromarketing  obtenidos  de  electroencefalografía.  e  
imágenes  cerebrales  (Telpaz,  Webb  y  Levy  2015). datos  de  alta  frecuencia  a  menudo  todavía  se  almacenan  en  bases  de  

Estos  datos  son  recopilados  de  forma  rutinaria  por  empresas  como   datos  relacionales  con  mayor  funcionalidad.

Nielsen  y,  a  menudo,  arrojan  datos  p  >  n  con  más  variables  que  los  
encuestados.  Las  técnicas  de  metanálisis  se  pueden  utilizar  para  
generalizar  los  hallazgos  en  un  gran  número  de  estos  experimentos   3El  Apéndice  web  proporciona  enlaces  a  explicaciones  de  los  términos  
(Bijmolt,  Van  Heerde  y  Pieters  2005). utilizados  en  esta  y  otras  secciones.

Análisis  de  marketing  para  entornos  ricos  en  datos /  103
Machine Translated by Google

C++,  Fortran  y  Java  son  herramientas  de  programación  de  bajo  nivel   los  modelos  encajarán  mejor.  Sin  embargo,  a  medida  que  aumenta  la  variedad  
poderosas  y  rápidas  para  análisis  que  vienen  con  grandes  bibliotecas  de  rutinas.   de  datos  y  los  datos  se  vuelven  más  ricos,  el  DGM  subyacente  se  expande.  Gran  
Los  programas  Java  a  menudo  se  integran  como  applets  dentro  del  código  de   parte  del  atractivo  de  los  grandes  datos  en  el  marketing  es  que  proporciona  
las  páginas  web.  R,  utilizado  por  Google,  es  un  lenguaje  de  programación  de  alto   rastros  de  los  comportamientos  de  los  consumidores  (p.  ej.,  actividades,  
nivel  de  código  abierto  considerablemente  más  lento  pero  de  uso  frecuente  con   intereses,  opiniones,  interacciones)  que  antes  eran  costosos  de  observar  incluso  
una  funcionalidad  comparable  a  lenguajes  como  MATLAB.  Perl  es  un  software   en  muestras  pequeñas.  Para  capturar  completamente  el  valor  informativo  de  
adecuado  para  procesar  datos  de  flujo  de  clics  no  estructurados  (HTML);   estos  datos,  se  necesitan  modelos  más  complejos.  Esos  modelos  respaldarán  
inicialmente  fue  utilizado  por  Amazon,  pero  ha  sido  reemplazado  en  su  mayoría   conocimientos  más  profundos  y  mejores  decisiones,  mientras  que,  al  mismo  
por  su  rival  Python  (utilizado  por  Dropbox),  que  es  un  lenguaje  de  programación   tiempo,  grandes  volúmenes  de  datos  respaldarán  representaciones  más  ricas  
más  intuitivo  que  permite  la  implementación  de  MapReduce.  Actualmente,  la   del  DGM.  Sin  embargo,  estos  modelos  tienen  mayores  costos  computacionales.
investigación  académica  en  análisis  de  marketing  ya  se  basa  en  muchos  de  
estos  lenguajes  de  programación,  y  R  parece  ser  el  más  popular.  Es  probable   Muchos  modelos  estadísticos  y  econométricos  actuales  y  los  métodos  de  
que  gran  parte  de  este  software  para  la  gestión  y  el  procesamiento  de  big  data   estimación  utilizados  en  la  literatura  de  marketing  no  están  diseñados  para  
se  convierta  en  una  parte  integral  del  ecosistema  de  académicos  de  marketing  y   manejar  grandes  volúmenes  de  datos  de  manera  eficiente.  Las  soluciones  a  
analistas  de  marketing  aplicado  en  un  futuro  próximo. este  problema  implican  la  reducción  de  datos,  algoritmos  más  rápidos,  
simplificación  de  modelos  y/o  soluciones  computacionales,  que  se  analizan  a  
continuación.  Para  respaldar  por  completo  la  toma  de  decisiones  de  marketing  
basada  en  datos,  el  campo  de  la  analítica  de  marketing  debe  abarcar  cuatro  
Volumen,  Variedad,  Velocidad:  Implicaciones  para  Big  Data  
niveles  de  análisis:  (1)  resumen  y  visualización  de  datos  descriptivos  con  fines  
Analytics  La  pregunta  es  si  
exploratorios,  (2)  modelos  explicativos  de  diagnóstico  que  estiman  las  relaciones  
mejores  decisiones  comerciales  requieren  más  datos  o  mejores  modelos.  Parte   entre  variables  y  permiten  para  la  prueba  de  hipótesis,  (3)  modelos  predictivos  
del  debate  en  torno  a  esa  pregunta  se  origina  en  la  investigación  de  Microsoft,   que  permiten  pronósticos  de  variables  de  interés  y  simulación  del  efecto  de  la  
en  la  que  Banko  y  Brill  (2001)  demostraron  que,  en  el  contexto  de  la  minería  de   configuración  de  control  de  marketing,  y  (4)  modelos  de  optimización  prescriptivos  
textos,  los  algoritmos  de  diferente  complejidad  funcionaban  de  manera  similar,   que  se  utilizan  para  determinar  niveles  óptimos  de  variables  de  control  de  
pero  al  agregar  datos  mejoraban  mucho  el  rendimiento.  De  hecho,  a  lo  largo  de   marketing.
la  literatura  académica  de  marketing,  los  modelos  complejos  apenas  superan  a  
los  más  simples  en  conjuntos  de  datos  de  tamaño  pequeño  a  moderado.  La   La  Figura  4  muestra  que  la  viabilidad  de  estos  niveles  más  altos  de  análisis  
respuesta  a  la  pregunta  se  basa  en  el  equilibrio  entre  sesgo  y  varianza.  Por  un   disminuye  en  función  de  las  dimensiones  de  big  data.  Ilustra  que  el  valor  de  
lado,  el  sesgo  resulta  de  una  representación  incompleta  del  verdadero  mecanismo   información  de  los  datos  crece  a  medida  que  aumenta  su  volumen,  variedad  y  
de  generación  de  datos  (DGM)  por  un  modelo  debido  a  la  simplificación  de   velocidad,  pero  que  el  valor  de  decisión  derivado  de  los  métodos  analíticos  
suposiciones.  Un  modelo  menos  complejo  (uno  que  contiene  menos  parámetros)   aumenta  a  expensas  de  una  mayor  complejidad  del  modelo  y  costo  computacional.
a  menudo  tiene  un  mayor  sesgo,  pero  un  modelo  necesita  simplificar  la  realidad  
para  proporcionar  información  generalizable.  Para  citar  al  estadístico  George   En  el  ámbito  de  los  datos  estructurados,  en  el  que  hasta  ahora  se  han  
Box,  “Todos  los  modelos  son  incorrectos,  pero  algunos  son  útiles”.  Un  modelo   producido  muchos  de  los  avances  en  análisis  de  marketing,  se  encuentran  los  
simple  puede  producir  soluciones  manejables  de  forma  cerrada,  pero  los  métodos   cuatro  niveles  de  análisis.  Muchos  de  los  desarrollos  en  ingeniería  de  marketing  
numéricos  y  de  muestreo  permiten  el  examen  de  modelos  más  complejos  a  un   (Lilien  y  Rangaswamy  2006)  también  se  han  producido  en  este  espacio,  y  
costo  computacional  más  alto.  Los  métodos  de  promediación  de  modelos  y   abarcan  una  amplia  gama  de  áreas  de  marketing  (incluidos  precios,  publicidad,  
conjuntos,  como  embolsado  o  potenciación,  abordan  el  sesgo  en  modelos  más   promociones,  fuerza  de  ventas,  gestión  de  ventas,  competencia,  distribución,  
simples  al  promediar  muchos  de  ellos  (Hastie,  Tibshirani  y  Friedman  2008).  En   etc.).  marketing  mix,  branding,  segmentación  y  posicionamiento,  desarrollo  de  
marketing,  los  investigadores  utilizan  rutinariamente  evidencia  sin  modelo  para   nuevos  productos,  cartera  de  productos,  lealtad,  adquisición  y  retención).  Los  
brindar  confianza  de  que  los  modelos  más  complejos  capturan  con  precisión  el   modelos  explicativos  y  predictivos,  como  la  regresión  lineal  y  logística  y  los  
DGM  (ver,  por  ejemplo,  Bronnenberg,  Dube,  y  Gentzkow  2012).  Los  experimentos   modelos  de  series  temporales,  han  utilizado  tradicionalmente  métodos  de  
de  campo  son  cada  vez  más  populares  porque  la  calidad  de  los  datos  (veracidad)   estimación  econométrica  estándar,  como  los  mínimos  cuadrados  generalizados,  
puede  sustituir  la  complejidad  del  modelo:  cuando  el  DGM  está  bajo  el  control  de   el  método  de  los  momentos  y  la  máxima  verosimilitud.  Estos  métodos  de  
los  investigadores,  se  pueden  usar  modelos  más  simples  para  hacer  inferencias   estimación  basados  en  la  optimización  se  vuelven  difíciles  de  manejar  para  
causales  (Hui  et  al.  2013).  La  varianza,  por  otro  lado,  resulta  de  la  variación   modelos  complejos  con  una  gran  cantidad  de  parámetros.  Para  modelos  
aleatoria  en  los  datos  debido  al  error  de  muestreo  y  medición.  Un  mayor  volumen   complejos,  la  probabilidad  basada  en  simulación  y  los  métodos  Monte  Carlo  de  
de  datos  reduce  la  varianza. la  cadena  bayesiana  de  Markov  (MCMC)  se  utilizan  ampliamente.  La  cadena  de  
Markov  Monte  Carlo  es  una  clase  de  métodos  de  estimación  bayesianos,  cuyo  
objetivo  principal  es  caracterizar  la  distribución  posterior  de  los  parámetros  del  
modelo.  Dichos  métodos  implican  la  extracción  recursiva  de  muestras  de  
subconjuntos  de  parámetros  a  partir  de  sus  distribuciones  posteriores  
Los  modelos  complejos  calibrados  en  conjuntos  de  datos  más  pequeños  a   condicionales  (Gelman  et  al.  2003).  Esto  hace  posible  ajustar  modelos  que  
menudo  sobreajustan  los  datos  (es  decir,  capturan  el  error  aleatorio  en  lugar  del  DGM). generan  una  visión  profunda  del  fenómeno  subyacente  con  el  objetivo  de  generar  
Es  bien  sabido  que  la  noción  de  que  más  datos  reducen  el  error  beneficia  a  los   predicciones  que  se  generalicen  a  través  de  categorías,  contextos  y  mercados.  
métodos  de  aprendizaje  automático,  como  las  redes  neuronales,  que  están   Se  han  desplegado  modelos  de  optimización  para  ventas
altamente  parametrizadas  (Geman,  Bienenstock  y  Doursat  1992).  Sin  embargo,  
no  todos  los  datos  se  crean  de  la  misma  manera.  Un  mayor  volumen  de  datos  
reduce  la  varianza,  e  incluso  más  simple

104 /  Journal  of  Marketing:  edición  especial  de  AMA/MSI,  noviembre  de  2016
Machine Translated by Google

FIGURA  4
Enfoques  analíticos  y  de  datos

Complejidad,  Cómputo,  Costo
Valor  de  decisión

Analítica

Modelos  de  Predicción,  Máquina
Aprendizaje,  Sistemas  Cognitivos

Estadística,  Econométrica,  Psicométrica
Modelos
Preceptivo
Profético
Modelos  Estructurales
Diagnóstico
O  métodos  de  optimización
Descriptivo
Estadísticas  resumidas  y
Pruebas,  métricas,  tableros,
Visualización

Datos

volumen,  variedad,
Velocidad
Valor  de  la  información

Notas:  La  figura  muestra  el  tamaño  y  el  grado  de  estructura  de  los  datos  de  marketing  de  derecha  a  izquierda,  y  la  medida  en  que  los  métodos  analíticos  de  aumento
complejidad  se  aplican  a  esos  datos  de  izquierda  a  derecha.

asignación  de  fuerza,  precios  óptimos,  análisis  conjunto,  diseño  óptimo   Se  pueden  utilizar  las  especificaciones.  En  segundo  lugar,  la  velocidad  y  
de  productos/servicios,  focalización  óptima  y  aplicaciones  de  marketing­ la  capacidad  de  los  recursos  computacionales  se  pueden  aumentar  con  
mix. aproximaciones,  algoritmos  más  eficientes  y  computación  de  alto  
Ha  habido  un  número  creciente  de  aplicaciones  de  análisis  de   rendimiento.  Las  técnicas  para  reducir  la  dimensionalidad  de  los  datos  y  
marketing  en  el  ámbito  de  los  datos  no  estructurados. acelerar  los  cálculos  a  menudo  se  implementan  simultáneamente,  y  las  
Los  desarrollos  tecnológicos  en  el  procesamiento  de  datos  no   analizamos  más  adelante.
estructurados  y  el  desarrollo  de  métricas  a  partir  de  resúmenes  de  datos,  
como  los  proporcionados  por  software  de  minería  de  texto,  seguimiento   Agregación  y  compresión.  El  volumen  de  datos  se  puede  reducir  
ocular  y  reconocimiento  de  patrones,  permiten  a  los  investigadores   mediante  la  agregación  de  una  o  más  de  sus  dimensiones,  más  
proporcionar  una  estructura  de  datos  para  facilitar  la  aplicación  de   frecuentemente  temas,  variables  o  tiempo.  Esto  se  puede  hacer  mediante  
métodos  analíticos.  Un  ejemplo  del  uso  de  métricas  como  puerta  de   un  simple  promedio  o  suma,  que,  en  varios  casos,  produce  suficientes  
entrada  al  análisis  predictivo  incluye  la  aplicación  de  Netzer  et  al.  (2012),   estadísticas  de  los  parámetros  del  modelo  que  hacen  innecesario  el  
quienes  utilizan  la  minería  de  texto  en  contenido  generado  por  el  usuario   procesamiento  de  los  datos  completos,  así  como  a  través  de  métodos  de  
para  desarrollar  estructuras  de  mercado  competitivas.  Una  vez  que  se   reducción  de  variables,  como  el  análisis  de  componentes  principales  y  
establece  una  estructura  de  datos  utilizando  métricas,  los  investigadores   métodos  relacionados,  que  son  común  en  minería  de  datos,  
pueden  crear  modelos  explicativos,  de  predicción  y  de  optimización.   reconocimiento  de  voz  y  procesamiento  de  imágenes.
Aunque  la  aplicación  de  enfoques  predictivos  y  prescriptivos  para  datos   Por  ejemplo,  Naik  y  Tsai  (2004)  proponen  un  modelo  semiparamétrico  
no  estructurados  todavía  está  rezagada,  especialmente  en  la  práctica,  el   de  un  solo  factor  que  combina  la  regresión  inversa  cortada  y  la  regresión  
análisis  de  datos  no  estructurados  en  marketing  parece  reducirse  a   isotónica.  Reduce  la  dimensionalidad  en  el  análisis  de  bases  de  datos  
transformarlos  en  datos  estructurados  utilizando  métricas  adecuadas. de  transacciones  de  clientes  de  alta  dimensión  y  es  escalable  porque  
Los  datos  estructurados  de  gran  volumen  comprenden  cuatro   evita  soluciones  iterativas  de  una  función  objetiva.  Naik,  Wedel  y  
dimensiones  principales:  variables,  atributos,  sujetos  y  tiempo  (Naik  et  al. Kamakura  (2010)  extienden  esto  a  modelos  con  múltiples  factores  y  lo  
2008).  El  costo  de  modelar  datos  estructurados  para  los  cuales  una  o   aplican  al  análisis  de  grandes  datos  sobre  la  rotación  de  clientes.
más  de  estas  dimensiones  es  grande  se  puede  reducir  de  una  de  dos  
maneras.  Primero,  una  o  más  de  las  dimensiones  de  los  datos  pueden   La  agregación  de  datos  sobre  diferentes  muestras  de  clientes  (p.  
reducirse  mediante  agregación,  muestreo  o  selección;  alternativamente,   ej.,  móvil,  social,  streaming,  geodemográfica)  se  puede  lograr  mediante  
simplificaciones  apropiadas  a  la  situación  en  el  modelo la  combinación  de  datos  agregados  a  lo  largo  del  espacio  (p.  ej.,

Análisis  de  marketing  para  entornos  ricos  en  datos /  105
Machine Translated by Google

área  de  mercado  designada,  código  postal)  o  dimensiones  de  tiempo  (p.  ej.,   inferencia  basada  en  muestreo.  Aquí,  el  investigador  tiene  control  total  sobre  
semana,  mes)  o  a  través  de  métodos  de  fusión  de  datos  (Gilula,  McCulloch   el  tamaño,  la  naturaleza  y  la  integridad  de  la  muestra  y  puede  analizar  
y  Rossi  2006;  Kamakura  y  Wedel  1997). múltiples  muestras.  Algunos  de  los  enfoques  de  estimación  dominantes  en  
Los  requisitos  de  datos  para  aplicaciones  específicas  se  pueden  reducir   la  academia  de  marketing,  en  particular  la  máxima  verosimilitud,  se  
fusionando  datos  en  diferentes  niveles  de  agregación.  Por  ejemplo,  si  los   desarrollan  dentro  de  un  marco  estadístico  que  pretende  utilizar  una  muestra  
datos  de  ventas  a  nivel  de  tienda  están  disponibles  de  un  minorista,  estos   para  hacer  inferencias  sobre  la  población.  Sin  embargo,  debido  a  que,  en  
podrían  fusionarse  con  los  datos  del  panel  del  escáner  en  el  hogar.  Esto   muchos  casos,  los  grandes  datos  capturan  a  toda  una  población,  la  
crea  nuevas  variables  que  pueden  aumentar  la  veracidad  de  los  datos   inferencia  estadística  se  vuelve  muda  a  medida  que  las  regiones  de  
porque  los  datos  de  la  tienda  tienen  una  mejor  cobertura  de  mercado  pero   confianza  asintóticas  degeneran  en  masas  puntuales  bajo  el  peso  de  estos  
no  información  de  la  competencia,  mientras  que  lo  contrario  es  cierto  para   datos  masivos  (Naik  et  al.  2008).  La  inferencia  estadística  tradicional  y  las  
los  datos  de  escaneo  doméstico.  La  fusión  también  puede  ser  útil  cuando   pruebas  de  hipótesis  pierden  su  atractivo  porque  el  valor  p,  la  probabilidad  
se  aplican  modelos  estructurales  de  demanda  que  recuperan  la   de  obtener  un  efecto  en  muestras  repetidas  que  es  al  menos  tan  extremo  
heterogeneidad  a  nivel  individual  a  partir  de  datos  agregados  (demanda  a   como  el  efecto  en  los  datos  disponibles,  pierde  sentido  en  ese  caso.  A  
nivel  de  tienda),  en  cuyo  caso  la  fusión  con  datos  a  nivel  individual  (datos   menos  que  se  analicen  muestras  de  los  datos,  se  requieren  métodos  
de  panel  de  escáner)  puede  ayudar  a  identificar  la  distribución  de   alternativos.
heterogeneidad.  Feit  et  al.  (2013)  utilizan  técnicas  de  fusión  bayesiana  para  
fusionar  dichos  datos  agregados  (sobre  el  uso  de  medios  por  parte  del   Sin  embargo,  un  problema  de  usar  muestras  en  lugar  de  los  datos  completos  
cliente  a  lo  largo  del  tiempo)  con  datos  desagregados  (uso  de  nivel  individual   es  que  este  enfoque  puede  limitar  la  capacidad  de  los  investigadores  para  
manejar  
de  los  clientes  en  cada  punto  de  contacto)  para  hacer  inferencias  sobre  patrones  de   distribuciones  
comportamiento   de  
a  nivel   cola  
de   larga  y  observaciones  extremas,  y  es  
cliente.
Los  enfoques  bayesianos  se  pueden  utilizar  en  la  compresión  de  datos. problemático  cuando  el  enfoque  del  modelo  es  explicar  o  predecir  eventos  
Por  ejemplo,  al  procesar  datos  recopilados  a  lo  largo  del  tiempo,  se  puede   raros  en  el  cola  de  datos  de  alta  dimensión  (ver  Naik  y  Tsai  2004).  Además,  
estimar  un  modelo  bayesiano  en  un  conjunto  inicial  de  datos  para  el  primer   surgen  problemas  con  el  muestreo  cuando  se  hacen  inferencias  en  las  
período  de  tiempo  para  determinar  las  distribuciones  posteriores  de  los   redes  sociales.
parámetros.  Luego,  el  investigador  solo  necesita  retener  estos  datos   En  este  caso,  es  posible  que  no  se  disponga  de  un  marco  de  muestreo  y  
posteriores  para  uso  futuro  como  datos  previos  para  los  parámetros  del   que  los  métodos  de  muestreo  aleatorio  simple  y  otros  métodos  de  muestreo  
modelo  calibrado  en  nuevos  datos  para  períodos  de  tiempo  posteriores.   estándar  sean  ineficientes  o  incluso  perjudiciales  para  las  propiedades  de  la  
Oravecz,  Huentelman  y  Vandekerckhove  (2015)  aplican  este  método  en  el   red  (las  muestras  de  bosque  aleatorias  o  de  bola  de  nieve  funcionan  mejor;  
contexto  del  crowdsourcing.  Hay  varios  refinamientos  de  este  enfoque   consulte  Ebbes,  Huang  y  Rangaswamy  2015).  Más  importante  aún,  el  
general.  Ridgeway  y  Madigan  (2002)  proponen  primero  realizar  MCMC   muestreo  impide  la  personalización,  para  lo  cual  se  necesitan  datos  sobre  
tradicional  en  un  subconjunto  de  datos  para  obtener  una  estimación  inicial   cada  cliente  individual  y,  por  lo  tanto,  elimina  un  importante  punto  de  
de  la  distribución  posterior  y  luego  aplicar  muestreo/remuestreo  de   apalancamiento  de  los  grandes  datos.
importancia  a  las  estimaciones  iniciales  basadas  en  los  datos  completos.   La  inferencia  estadística  bayesiana  ofrece  ventajas  filosóficas  en  las  
Este  procedimiento  también  se  puede  aplicar  a  medida  que  ingresan  nuevos   aplicaciones  de  big  data  porque  la  inferencia  está  condicionada  a  los  datos  
datos  con  el  tiempo.  Una  técnica  relacionada  involucra  el  uso  de  información   y  considera  que  los  parámetros  son  aleatorios.  La  inferencia  refleja  la  
previa  ponderada  nuevamente,  lo  que  evita  la  necesidad  de  ejecutar  cadenas   incertidumbre  subjetiva  del  investigador  sobre  el  modelo  y  sus  parámetros  
MCMC  cada  vez  que  ingresan  nuevos  datos.  En  su  lugar,  los  nuevos  datos   en  lugar  de  la  variación  aleatoria  debida  al  muestreo  (Berger  1985).  Esto  le  
se  usan  para  volver  a  ponderar  las  muestras  existentes  a  partir  de  la   permite  al  investigador  formular  una  declaración  probabilística  sobre  la  
distribución  posterior  de  los  parámetros  (Wang,  Bradlow  y  Jorge  2014).  Este   verdad  subyacente  en  lugar  de  sobre  los  datos  (p.  ej.,  "¿Cuál  es  la  
enfoque  está  relacionado  con  el  filtro  de  partículas  aplicado,  por  ejemplo,   probabilidad  de  que  la  hipótesis  nula  sea  verdadera?").  Sin  embargo,  una  
por  Chung,  Rust  y  Wedel  (2009)  para  reducir  la  carga  computacional  en  el   limitación  de  muchos  algoritmos  MCMC  es  que  son  de  naturaleza  iterativa  
procesamiento  secuencial  de  datos  entrantes.  Todas  estas  técnicas   y,  por  lo  tanto,  computacionalmente  intensos.  Las  soluciones  a  este  
secuenciales  de  actualización  bayesiana  reducen  sustancialmente  la  carga   problema  computacional  (consulte  las  discusiones  anteriores  y  siguientes)  
computacional  de  estimar  modelos  complejos  con  MCMC  en  datos  de  gran   harán  factible  el  modelado  estadístico  integral  de  big  data,  que  luego  se  
volumen  y  alta  velocidad  porque  vuelven  a  pesar  (o  redibujar)  las  muestras   puede  usar  para  generar  métricas  en  tableros  y  pantallas.  Es  una  vía  
originales  de  los  parámetros  a  partir  de  sus  distribuciones  posteriores,  a   prometedora  para  un  mayor  desarrollo  combinar  una  visión  profunda  con  
menudo  con  formas  cerradas.  pesos  que  son  proporcionales  a  la  probabilidad   los  tableros  de  usuario,  como  lo  ilustran  Dew  y  Ansari  (2015),  quienes  usan  
calculada  a  partir  de  los  nuevos  datos.  Por  lo  tanto,  esta  clase  de  algoritmos   la  predicción  semiparamétrica  de  la  dinámica  de  la  base  de  clientes  en  
es  prometedora  para  big  data  porque  evita  ejecutar  cadenas  MCMC  en  los   tableros  para  juegos  de  computadora.  Estos  desarrollos  son  importantes  
datos  completos  o  en  los  nuevos  datos  que  ingresan.  Además,  paralelizar   dado  el  uso  omnipresente  de  tableros  como  base  principal  para  la  toma  de  
estos  algoritmos  es  mucho  más  fácil  que  con  MCMC  estándar  porque  no   decisiones  en  la  industria,  como  es  el  caso  de  Procter  &  Gamble,  por  
implican  cálculos  iterativos. ejemplo.

La  selección  se  puede  utilizar  para  reducir  la  dimensionalidad  de  big  
data  en  términos  de  variables,  atributos  o  temas.  La  selección  de  sujetos/
Muestreo  y  selección.  El  muestreo  se  aplica  principalmente  a  sujetos,   clientes  se  puede  utilizar  cuando  el  interés  se  centra  en  subpoblaciones  o  
productos  o  atributos.  En  muchos  casos,  el  big  data  interno  de  la  empresa   segmentos  específicos  bien  definidos.  Aunque  los  grandes  datos  pueden  
está  compuesto  por  toda  la  población  de  clientes.  El  uso  de  muestras  de   tener  una  gran  cantidad  de  variables  (p  >  n  datos),  es  posible  que  no  todas  
estos  datos  permite  la  clásica contribuyan  a  la  predicción.  bayesiano

106 /  Journal  of  Marketing:  edición  especial  de  AMA/MSI,  noviembre  de  2016
Machine Translated by Google

Los  enfoques  de  árbol  de  regresión  aditiva  producen  estructuras  de  árbol  que   buenos  resultados  de  predicción  para  reconocimiento  de  voz,  procesamiento  
pueden  usarse  para  seleccionar  variables  relevantes.  En  el  enfoque  de  la   de  lenguaje  natural,  reconocimiento  y  clasificación  visual  (especialmente  
sección  variable  Bayesiana  intensamente  computacional,  la  idea  clave  es   objetos  y  escenas  en  imágenes  y  video)  y  juegos  de  computadora.  Estas  
utilizar  una  combinación  previa,  lo  que  permite  al  investigador  obtener  una   redes  neuronales  tienen  muchas  capas  ocultas  que  se  pueden  entrenar  a  
distribución  posterior  sobre  todos  los  modelos  de  subconjuntos  posibles.   través  de  métodos  de  descenso  de  gradiente  estocástico  y  brindan  enfoques  
Alternativamente,  se  pueden  usar  métodos  de  tipo  lazo,  que  colocan  un   viables  para  el  análisis  de  datos  no  estructurados  con  mucho  poder  predictivo  
coeficiente  previo  de  Laplace  en  los  coeficientes  (Genkin,  Lewis  y  Madigan   (Nguyen,  Yosinski  y  Clune  2015).  Tanto  Facebook  como  Google  han  invertido  
2007).  Se  han  desarrollado  rutinas  para  la  estimación  de  estos  enfoques   recientemente  en  el  desarrollo  y  la  aplicación  de  dichos  enfoques.  Los  
utilizando  computación  paralela  (Allenby  et  al.  2014). modelos  de  marketing  para  datos  no  estructurados  a  gran  escala  todavía  
están  en  pañales,  pero  la  investigación  está  comenzando  a  surgir  (Lee  y  
Bradlow  2011;  Netzer  et  al.
Aproximaciones  y  simplificaciones.  Un  desarrollo  empleado  para  el  
análisis  predictivo  de  big  data  es  la  estrategia  de  "divide  y  vencerás".  Varios   2012).  En  este  trabajo,  el  cálculo  de  métricas  a  partir  de  datos  de  texto,  
modelos  más  simples  se  ajustan  a  los  datos  y  los  resultados  se  combinan.   imagen  y  video  utilizando  métodos  de  procesamiento  de  imágenes  facilita  la  
Los  ejemplos  de  esta  estrategia  incluyen  la  estimación  de  regresión  logística,   aplicación  de  modelos  estándar  para  datos  estructurados.  Algunos  ejemplos  
o  árboles  de  clasificación  y  regresión  en  submuestras  de  los  datos,  que  luego   son  Pieters,  Wedel  y  Batra  (2010),  que  utilizan  el  tamaño  de  archivo  de  las  
se  unen  mediante  técnicas  de  arranque,  embolsado  y  potenciación  (Varian   imágenes  JPEG  como  medida  de  la  complejidad  de  las  características  de  las  
2014).  Para  permitir  la  inferencia  estadística  en  el  contexto  de  macrodatos   imágenes  publicitarias;  Landwehr,  Labroo  y  Herrmann  (2011),  quienes  aplican  
estructurados,  los  investigadores  han  utilizado  variaciones  de  esta  estrategia   la  transformación  de  imágenes  a  puntos  de  diseño  seleccionados  para  
para  superar  las  desventajas  de  utilizar  una  única  muestra  aleatoria.  Dentro   calcular  la  similitud  visual  de  las  imágenes  de  automóviles;  y  Xiao  y  Ding  
de  un  marco  bayesiano,  los  análisis  de  submuestras  de  big  data  con  uno  o   (2014),  quienes  implementan  métodos  de  caras  propias  para  clasificar  las  
varios  modelos  se  han  combinado  utilizando  técnicas  de  metanálisis  (Bijmolt,   características  faciales  de  los  modelos  en  los  anuncios.
Van  Heerde  y  Pieters  2005;  Wang,  Bradlow  y  George  2014)  o  métodos  de   Relativamente  poco  trabajo  en  la  literatura  académica  de  marketing  ha  
promediación  de  modelos  (Chung ,  Rust  y  Wedel  2009). abordado  las  redes  neuronales  profundas  y  otros  métodos  de  aprendizaje  
automático.  Esto  puede  deberse  a  que  los  académicos  de  marketing  
favorecen  los  métodos  que  representan  el  DGM  subyacente  y  respaldan  la  
determinación  de  las  variables  de  control  de  marketing  y,  por  lo  tanto,  pueden  
Otro  enfoque  para  reducir  la  carga  computacional  de  MCMC  para  el   evitar  los  modelos  y  métodos  de  estimación  de  "una  solución  para  todos",  
análisis  de  big  data  es  derivar  aproximaciones  analíticas  a  distribuciones   cuyas  propiedades  de  identificación  y  convergencia  no  pueden  establecerse  
posteriores  complejas  en  modelos  bayesianos.  Bradlow,  Hardie  y  Fader   de  manera  inequívoca.
(2002)  y  Everson  y  Bradlow  (2002)  derivan  la  inferencia  bayesiana  de  forma   Sin  embargo,  se  pueden  lograr  ganancias  futuras  si  algunos  de  estos  métodos  
cerrada  para  modelos  con  antecedentes  y  verosimilitud  no  conjugados,  como   se  pueden  integrar  con  los  enfoques  de  marketing  más  basados  en  la  teoría.  
los  modelos  binomial  negativo  y  beta­binomial,  utilizando  expansiones  de   Esta  es  un  área  fructífera  para  futuras  investigaciones.
series.  Una  técnica  relacionada  que  utiliza  aproximaciones  determinísticas  
manejables  a  la  distribución  posterior  es  la  inferencia  variacional  (Braun  y  
McAuliffe  2010).  Aquí,  la  idea  es  desarrollar  una  aproximación  (cuadrática)   Cálculo.  Muchos  de  los  modelos  estadísticos  y  econométricos  utilizados  
a  la  distribución  posterior,  cuyo  modo  se  puede  derivar  en  forma  cerrada. en  marketing  actualmente  no  son  escalables  a  big  data.  Los  algoritmos  de  
MapReduce  (que  son  el  núcleo  de  Hadoop)  brindan  una  solución  y  permiten  
el  procesamiento  de  datos  muy  grandes  de  forma  masivamente  paralela  al  
Otro  método  que  promete  acelerar  los  cálculos  de  MCMC  es  el  muestreo  de   llevar  el  cálculo  localmente  a  partes  de  los  datos  distribuidos  en  múltiples  
rechazo  escalable  (Braun  y  Damien  2015),  que  se  basa  en  aproximaciones   núcleos  en  lugar  de  copiar  los  datos  en  su  totalidad  para  entrada  en  el  
estocásticas  manejables  a  la  distribución  posterior  (en  lugar  de  aproximaciones   software  de  análisis.  Por  ejemplo,  se  han  desarrollado  agrupaciones  basadas  
deterministas,  como  en  la  inferencia  variacional).  En  conjunto,  estos   en  MapReduce,  clasificación  ingenua  de  Bayes,  descomposición  de  valores  
desarrollos  hacen  que  la  estimación  de  MCMC  de  modelos  jerárquicos  en  big   singulares,  filtrado  colaborativo,  regresión  logística  y  redes  neuronales.  Este  
data  sea  cada  vez  más  factible. marco  fue  utilizado  inicialmente  por  Google  y  se  ha  implementado  para  redes  
de  escritorio  multinúcleo  y  entornos  informáticos  móviles.
Una  forma  alternativa  de  lograr  la  manejabilidad  es  simplificar  los  propios  
modelos:  el  investigador  puede  utilizar  modelos  de  probabilidad  simples  sin  
variables  predictoras  que  permitan  soluciones  de  forma  cerrada  y  cálculos   La  maximización  de  la  probabilidad  es  adecuada  para  MapReduce  
rápidos.  El  estudio  de  Fader  y  Hardie  (2009)  es  un  ejemplo  en  el  ámbito  de   porque  la  probabilidad  logarítmica  consiste  en  una  suma  de  términos  de  
CRM  para  evaluar  el  valor  de  por  vida.  Se  necesita  más  trabajo  para  respaldar   probabilidad  logarítmica  individuales  que  se  pueden  distribuir  fácilmente  y  
la  aplicación  de  métodos  sin  modelos  (Goldgar  2001;  Hastie,  Tibshirani  y   permitir  las  operaciones  Map()  y  Reduce().  En  este  contexto,  los  métodos  de  
Friedman  2008;  Wilson  et  al.  2010).  Los  métodos  sin  modelo  pueden  reducir   descenso  de  gradiente  estocástico  (SGD)  se  utilizan  a  menudo  para  optimizar  
el  esfuerzo  computacional  para  que  los  grandes  datos  puedan  analizarse  en   la  probabilidad  logarítmica.  En  lugar  de  evaluar  el  gradiente  de  todos  los  
tiempo  real,  pero  la  validación  predictiva  es  fundamental,  por  ejemplo,   términos  en  la  suma,  SGD  toma  muestras  de  un  subconjunto  de  estos  
mediante  validación  cruzada  o  embolsado  (Hastie,  Tibshirani  y  Friedman   términos  en  cada  paso  y  evalúa  su  gradiente,  lo  que  economiza  en  gran  
2008).  En  el  caso  de  los  datos  no  estructurados,  el  tema  es  más  complejo.   medida  los  cálculos.
Las  redes  neuronales  profundas  (Hinton  2007)  proporcionan La  paralelización  de  MCMC  también  es  un  área  activa  de  investigación  
y  se  han  realizado  varios  avances  prometedores.

Análisis  de  marketing  para  entornos  ricos  en  datos /  107
Machine Translated by Google

recientemente  (Brockwell  y  Kadane  2005;  Neiswanger,  Wang  y  Xing  2014;   objetivos  a  corto  y  largo  plazo.  Definimos  el  análisis  de  marketing  como  los  
Scott  et  al.  2013;  Tibbitts,  Haran  y  Liechty  2011).  También  parece  que  se   métodos  para  medir,  analizar,  predecir  y  gestionar  el  rendimiento  del  
están  realizando  investigaciones  para  combinar  características  de  SGD  y   marketing  con  el  fin  de  maximizar  la  eficacia  y  el  retorno  de  la  inversión  (ROI).
MCMC.  Con  el  continuo  crecimiento  de  la  computación  multinúcleo,  los  
algoritmos  MCMC  que  anteriormente  eran  computacionalmente  prohibitivos   La  Figura  5  muestra  cómo  el  análisis  de  marketing  de  big  data  crea  una  
ahora  se  han  vuelto  factibles,  como  lo  ilustra  su  implementación  a  gran  escala   amplitud  de  diagnóstico  cada  vez  mayor,  lo  que  a  menudo  es  particularmente  
por  parte  de  la  empresa  de  análisis  In4mation  Insights.  Los  avances  recientes   beneficioso  para  respaldar  los  objetivos  a  largo  plazo  de  las  empresas.
en  la  paralelización  utilizando  unidades  de  procesamiento  gráfico  que   Los  siguientes  ejemplos  de  investigaciones  recientes  (ilustrados  en  la  
prometen  acelerar  la  maximización  de  la  probabilidad  y  el  muestreo  MCMC   Figura  5)  aprovechan  las  nuevas  fuentes  de  datos  digitales  para  desarrollar  
(Suchard  et  al.  2010)  son  igualmente  prometedores  pero  están  fuera  del   enfoques  analíticos  personalizados  que  generan  conocimientos  novedosos.  
alcance  de  la  presente  exposición. El  análisis  de  las  reseñas  en  línea  puede  ayudar  a  una  empresa  a  afinar  sus  
ofertas  y  brindar  un  mejor  valor  a  sus  clientes.
Chevalier  y  Mayzlin  (2006)  demuestran  esto  para  las  reseñas  (de  libros)  en  
Síntesis  En  la   línea,  que  demostraron  tener  un  efecto  positivo  en  las  ventas  de  libros.  El  
análisis  de  búsqueda  de  palabras  clave  puede  ayudar  a  las  empresas  a  
actualidad,  solo  unas  pocas  aplicaciones  de  marketing  académico  aprovechan  
evaluar  la  rentabilidad  del  diseño  de  sus  sitios  web  y  la  ubicación  de  sus  
los  datos  a  una  escala  extremadamente  grande,  especialmente  los  datos  ricos  
anuncios.  Por  ejemplo,  Yao  y  Mela  (2011)  desarrollan  un  modelo  estructural  
no  estructurados,  y  abordan  los  desafíos  informáticos  que  conllevan.  Las  
dinámico  para  explorar  la  interacción  de  consumidores  y  anunciantes  en  la  
aplicaciones  de  marketing  favorecen  los  modelos  estadísticos  y  econométricos  
búsqueda  de  palabras  clave.  Encuentran  que  cuando  los  consumidores  hacen  
integrales  que  capturan  el  DGM  en  detalle,  pero  a  menudo  son  (demasiado)  
clic  con  más  frecuencia,  la  posición  del  enlace  publicitario  patrocinado  tiene  
complicados  computacionalmente  para  big  data  (Tabla  1).  Las  soluciones  para  
un  efecto  mayor.  Además,  el  estudio  muestra  que  las  herramientas  de  
el  análisis  de  big  data  en  el  futuro  utilizarán  lo  siguiente:
búsqueda  (p.  ej.,  clasificar/filtrar  en  función  del  precio  y  las  calificaciones)  
pueden  conducir  a  un  aumento  de  los  ingresos  de  la  plataforma  y  al  bienestar  
1.  Desarrollos  en  computación  de  alto  rendimiento,  incluidos  los   del  consumidor.  Los  análisis  de  datos  minoristas  móviles  pueden  ayudar  a  
marcos  MapReduce  para  procesamiento  paralelo,  computación   una  empresa  a  brindar  mejores  recomendaciones,  orientar  promociones,  
en  red  y  en  la  nube,  y  computación  en  tarjetas  gráficas;  2.  
personalizar  ofertas  y  aumentar  el  gasto  de  los  clientes  existentes.  A  través  
Enfoques  de  modelado  descriptivo  más  simples,  como  modelos  de  
de  experimentos  de  campo  con  tiendas  minoristas,  Hui  et  al.  (2013)  encuentran  
probabilidad,  o  enfoques  de  informática  y  aprendizaje  automático  
que  las  promociones  móviles  motivan  a  los  compradores  a  viajar  más  dentro  
que  facilitan  los  cálculos  de  forma  cerrada,  posiblemente  en  
combinación  con  el  promedio  de  modelos  y  otras  estrategias  de   de  la  tienda,  lo  que  induce  a  un  mayor  gasto  no  planificado.  El  análisis  social  
divide  y  vencerás  para   puede  ayudar  a  las  empresas  a  evaluar  y  controlar  el  valor  de  su  marca  y  sus  
reducir  el  sesgo;  3.  Mejoras  en  la  velocidad  de  los  algoritmos   posiciones  competitivas  mediante  la  identificación  de  palabras  clave  de  
proporcionadas  por  inferencia  variacional,  muestreo  de  rechazo   tendencia.  Por  ejemplo,  Nam  y  Kannan  (2014)  proponen  medidas  basadas  en  
escalable,  remuestreo  y  reponderación,  MCMC  secuencial  y   datos  de  etiquetado  social  y  muestran  cómo  se  pueden  utilizar  para  realizar  
paralelización  de  algoritmos  de  probabilidad  y  MCMC;  y un  seguimiento  del  valor  de  marca  basado  en  el  cliente  y  mejorar  de  forma  
4.  Aplicación  de  métodos  de  agregación,  fusión  de  datos,  selección   proactiva  el  rendimiento  de  la  marca.  La  inteligencia  competitiva  y  la  previsión  
y  muestreo  que  reduzcan  la  dimensionalidad  de  los  datos. de  tendencias  pueden  ayudar  a  las  empresas  a  identificar  cambios  en  el  
La  investigación  en  la  práctica  a  menudo  ha  implementado  una  combinación   entorno  y  establecer  defensas  para  conservar  su  cuota  de  mercado.  En  esta  
de  los  componentes  1  y  2,  centrándose  en  la  exploración  y  la  descripción  y   línea,  Du  y  Kamakura  (2012)  muestran  cómo  detectar  tendencias  de  mercado  
generando  información  procesable  a  partir  de  datos  no  estructurados  en   con  los  datos  de  tendencias  de  Google  utilizando  modelos  analíticos  de  
factores.  El  análisis  de  datos  de  flujo  de  clics  permite  la  coincidencia  de  
tiempo  real;  dicho  trabajo  puede  llamarse  "pequeñas  estadísticas  sobre  grandes  datos".
La  mayoría  de  la  investigación  académica  actualmente  se  enfoca  en  los   patrones  entre  el  comportamiento  de  clientes  y  no  clientes  para  ayudar  a  las  
componentes  3  y  4:  modelos  de  procesos  rigurosos  y  completos  que  permiten   empresas  a  identificar  segmentos  para  la  orientación  por  comportamiento.  
la  inferencia  estadística  sobre  los  mecanismos  conductuales  causales   Trusov,  Ma  y  Jamal  (2016)  muestran  cómo  combinar  los  datos  de  una  empresa  
subyacentes  y  la  toma  de  decisiones  óptima,  en  su  mayoría  calibrados  en   con  datos  de  terceros  para  mejorar  la  recuperación  de  perfiles  de  clientes.  El  
datos  estructurados  de  tamaño  pequeño  a  moderado;  dicho  trabajo  puede   análisis  de  datos  de  GPS  móvil  brinda  oportunidades  para  segmentar  
llamarse  "grandes  estadísticas  sobre  pequeños  datos". geográficamente  a  los  clientes  con  ofertas  promocionales  basadas  en  
Es  probable  que  las  soluciones  futuras  tengan  una  naturaleza  de  "todas   contextos  situacionales.  Los  datos  móviles  permiten  a  las  empresas  probar  la  

las  anteriores" (Tabla  2).  Los  enfoques  de  talla  única  pueden  no  ser  tan   eficacia  de  su  selección  de  clientes  y  no  clientes  para  aumentar  los  ingresos.  
efectivos,  y  las  técnicas  deberán  combinarse  y  combinarse  para  adaptarse  a   Usando  experimentos  de  campo,  Andrews  et  al.  (2015)  muestran  que  los  
las  propiedades  específicas  del  problema  en  cuestión.  Por  lo  tanto,  el  software   viajeros  en  trenes  subterráneos  abarrotados  tienen  el  doble  de  probabilidades  
para  la  gestión  y  el  procesamiento  de  big  data  y  la  informática  de  alto   de  responder  a  una  oferta  móvil  que  los  viajeros  en  trenes  subterráneos  no  
rendimiento  probablemente  se  convertirán  en  una  parte  integral  del  ecosistema   abarrotados.
de  los  analistas  de  marketing  en  un  futuro  próximo. Estos  ejemplos  ilustrativos  facilitan  la  comprensión  de  la  importancia  del  
análisis  de  big  data  para  respaldar  la  toma  de  decisiones  de  marketing  en  una  
amplia  gama  de  áreas.  El  enfoque  de  ingeniería  de  marketing,  defendido  por  
Lilien  y  Rangaswamy  (2006),  ha  contribuido  al  reconocimiento  generalizado  
Análisis  y  modelos de  que  si  el  problema  impulsa  la  elección  de  modelos,  la  efectividad  superior  
Los  abundantes  datos  internos  y/o  externos  permiten  que  el  análisis  de   de  estos  modelos,  la  calidad  de  los  conocimientos  que
marketing  cree  valor  para  las  empresas  y  las  ayude  a  lograr  sus  objetivos.

108 /  Journal  of  Marketing:  edición  especial  de  AMA/MSI,  noviembre  de  2016
Machine Translated by Google

FIGURA  5
La  amplitud  de  diagnóstico  de  Big  Data  Marketing  Analytics

Diagnóstico
Amplitud

Atribución Camino  a
Externo Sentimiento Analítica Compra Retargeting
Analítica

Tendencia En  línea
Analítica GPS  y Revisar
Social
Móvil Analítica Segmentación
Analítica
Analítica

Competitivo conductual
Inteligencia Web Perfilado  y A/B
Palabra  clave Orientación
Analítica
Buscar Pruebas
Analítica
Personalización
Minorista
Recomendaciones Analítica

Marketing
Mezcla
CRM Publicidad
Analítica Analítica

Estructurado

Interno

Notas:  La  flecha  muestra  la  amplitud  creciente  de  los  conocimientos  de  diagnóstico  en  función  de  la  utilización  de  datos  internos  (en  su  mayoría  estructurados)  y  datos  externos  
(en  su  mayoría  no  estructurados).

se  mejora  el  rendimiento  y  la  consistencia  de  las  decisiones  basadas  en   recomendaciones  para  acciones  óptimas  a  niveles  más  altos  de  
ellos.  Después  de  cinco  décadas  de  desarrollo,  la  mayoría  de  las   especificidad  y  granularidad.  Este  fue  el  caso  cuando  los  datos  del  
estrategias  y  tácticas  de  marketing  ahora  tienen  sus  propios  requisitos   escáner  estuvieron  disponibles  (ver  Wittink  et  al.  2011),  y  las  nuevas  
analíticos  y  de  datos  bien  especificados.  La  investigación  académica  de   fuentes  de  datos  digitales  conducirán  a  desarrollos  similares.
mercados  ha  desarrollado  métodos  que  abordan  específicamente   Por  ejemplo,  los  datos  digitales  sobre  inteligencia  competitiva  y  tendencias  
cuestiones  en  áreas  como  fijación  de  precios,  publicidad,  promociones,   externas  se  pueden  usar  para  comprender  los  impulsores  del  desempeño  
fuerza  de  ventas,  gestión  de  ventas,  competencia,  distribución,  marca,   bajo  el  control  directo  de  la  empresa  y  separarlos  de  los  factores  
segmentación,  posicionamiento,  desarrollo  de  nuevos  productos,  cartera   externos,  como  la  competencia,  los  factores  ambientales,  económicos  y  
de  productos,  lealtad  y  adquisición  y  retención. .  Varios  subcampos  de   demográficos,  y  las  tendencias  generales  del  mercado. .  De  manera  
marketing  han  tenido  un  amplio  desarrollo  de  métodos  analíticos,  por  lo   similar,  los  experimentos  de  campo  que  controlan  el  impacto  de  los  
que  está  disponible  un  conjunto  cohesivo  de  modelos  y  herramientas  de   factores  externos  permiten  a  los  minoristas  en  línea  y  fuera  de  línea  
toma  de  decisiones,  que  incluyen  análisis  de  CRM,  análisis  web  y  análisis   calibrar  los  efectos  del  precio  y  las  promociones  sobre  la  demanda  de  
de  publicidad.  A  continuación,  analizamos  con  más  detalle  el  análisis  de   sus  productos  y  mejorar  las  previsiones  de  su  impacto  (Muller  2014).  A  
tres  dominios  centrales  estrechamente  conectados:  optimización  de   continuación,  nos  enfocamos  en  los  desarrollos  en  el  modelado  de  la  
mezcla  de  marketing/medios,  personalización  y  privacidad  y  seguridad. mezcla  de  marketing  en  la  era  de  los  grandes  datos,  que  involucran  (1)  
incluir  información  y  métricas  obtenidas  de  nuevas  fuentes  de  datos  
digitales  para  brindar  mejores  explicaciones  de  los  efectos  de  los  
elementos  de  la  mezcla  de  marketing;  (2)  atribuir  los  efectos  de  la  
Mezcla  de  marketing/mezcla  de  
combinación  de  marketing  a  nuevos  puntos  de  contacto,  asignar  recursos  
medios  Los  modelos  para  medir  el  desempeño  de  la  mezcla  de  marketing   de  mercado  a  través  de  los  medios  clásicos  y  nuevos,  y  comprender  y  
de  la  empresa,  pronosticar  sus  efectos  y  optimizar  sus  elementos  se   pronosticar  el  impacto  simultáneo  de  los  elementos  de  la  combinación  
remontan  a  la  década  de  1960.  Notamos  algunos  de  estos  desarrollos   de  marketing  en  las  métricas  de  rendimiento;  y  (3)  evaluar  los  efectos  
históricos  en  la  subsección  "Análisis" (para  revisiones,  véase  Gatignon   causales  de  las  variables  de  control  de  marketing  a  través  de  
1993;  Hanssens  2014;  Hanssens,  Parsons  y  Schultz  2001;  Leeflang  et   representaciones  estructurales  del  comportamiento  del  consumidor,  IV  y  experimentos  de  c
al.  2000;  Rao  2014).  A  medida  que  se  dispone  de  nuevas  fuentes  de  
datos,  aumentan  las  oportunidades  de  obtener  explicaciones  causales   Incorporación  de  nuevas  fuentes  de  datos.  La  investigación  en  la  
mejores  y  más  detalladas,  así  como asignación  de  la  mezcla  de  marketing  se  beneficia  significativamente  de  dos

Análisis  de  marketing  para  entornos  ricos  en  datos /  109
Machine Translated by Google

desarrollos  en  la  disponibilidad  de  datos.  El  primero  es  la  mayor  disponibilidad   en  la  propia  ubicación  de  la  empresa  (geo­fencing)  frente  a  la  ubicación  de  un  
de  datos  extensos  a  nivel  de  clientes  dentro  de  los  entornos  de  la  empresa,   competidor  (geo­conquesting).  Encuentran  que  la  orientación  geográfica  
mediante  la  realización  de  encuestas  directas  a  los  clientes,  la  medición  de   competitiva  produce  rendimientos  crecientes  en  la  profundidad  de  los  
actitudes  o  satisfacción,  o  el  registro  del  comportamiento  de  los  clientes  en   descuentos  promocionales.
tiendas  físicas  y  en  sitios  web  y  aplicaciones  móviles.  Hanssens  et  al.  (2014)   La  investigación  antes  mencionada  destaca  la  convergencia  de  diferentes  
aprovechan  una  fuente  de  tales  datos,  las  métricas  de  mentalidad  del   medios  (televisión,  Internet  y  dispositivos  móviles)  y  los  efectos  indirectos  
consumidor,  para resultantes  de  las  acciones  de  mezcla  de  marketing  realizadas  a  través  de  
modelar  mejor  el  impacto  de  las  acciones  de  marketing  en  el  rendimiento  de   esos  medios.  La  disponibilidad  de  rutas  a  nivel  individual  para  comprar  datos,  
las  ventas.  Encuentran  que  la  combinación  de  métricas  de  marketing  mix  y   a  través  de  múltiples  canales  en  línea  (p.  ej.,  anuncios  gráficos,  afiliados,  
actitudinales  en  modelos  VAR  mejora  tanto  la  predicción  de  ventas  como  las   referencias,  búsqueda),  a  través  de  dispositivos  (p.  ej.,  computadoras  de  
recomendaciones  para  la  asignación  de  marketing  mix.  El  segundo  desarrollo   escritorio,  tabletas,  teléfonos  inteligentes)  o  a  través  de  puntos  de  contacto  en  
implica  el  uso  de  datos  recopilados  sobre  clientes  y  prospectos  fuera  del   línea  y  fuera  de  línea,  creará  oportunidades  significativas  para  comprender  y  
entorno  de  la  empresa,  además  de  los  datos  que  están  disponibles  dentro  de   predecir  el  impacto  de  las  acciones  de  marketing  a  un  nivel  muy  granular.  Por  
la  empresa.  Esto  puede  aliviar  el  problema  de  que  las  actividades  de  los   un  lado,  estos  datos  han  puesto  en  primer  plano  el  problema  de  la  atribución  
clientes  (potenciales)  con  los  competidores  no  se  pueden  observar  en  los  datos   (asignar  crédito  a  cada  punto  de  contacto  para  la  conversión  final).  Li  y  Kannan  
internos  y  puede  ayudar  a  determinar  completamente  su  ruta  de  compra.  Por   (2014)  proponen  una  metodología  para  abordar  ese  problema.  Al  igual  que  la  

ejemplo,  las  medidas  de  WOM  en  línea  (Godes  y  Mayzlin  2004),  las  reseñas   asignación  de  la  mezcla  de  marketing,  la  atribución  implica  un  problema  de  
en  línea  (Chevalier  y  Mayzlin  2006)  o  los  flujos  de  clics  (Moe  2003)  se  pueden   asignación  de  recursos  de  marketing.  Sin  embargo,  incluso  si  el  problema  de  
incluir  en  los  modelos  de  mezcla  de  marketing  para  brindar  mejores   atribución  se  resuelve  por  completo,  es  solo  un  paso  intermedio  hacia  la  
explicaciones  y  predicciones  sobre  las  elecciones  y  las  ventas  de  los   predicción  de  sus  efectos  en  todo  el  recorrido  del  cliente  y  hacia  la  obtención  
consumidores.  Específicamente,  Moe  (2003)  utiliza  datos  de  flujo  de  clics  para   de  una  asignación  óptima  de  toda  la  mezcla  de  marketing.  Se  pueden  esperar  
categorizar  las  visitas  como  visitas  de  compra,  navegación  o  búsqueda  sobre   muchos  desafíos.  El  modelado  debe  acomodar  los  efectos  indirectos  entre  las  
la  base  de  los  patrones  de  navegación  observados  y  muestra  que  estos   acciones  de  marketing  y  debe  conciliar  datos  móviles  y  en  línea  más  granulares  
diferentes  tipos  de  visitas  están  asociados  con  diferentes  probabilidades  de   (p.  ej.,  derivados  de  redes  sociales)  con  datos  fuera  de  línea  más  agregados  y  
compra.  Si  bien  se  han  logrado  avances  significativos,  la  investigación  adicional   coordinar  los  diferentes  ciclos  de  planificación  para  diferentes  canales  
debe  centrarse  en  establecer  qué  métricas  específicas  funcionan  y  cuáles  no,   publicitarios.
y  cómo  pueden  incluirse  mejor  en  los  modelos  de  elección  individual,  ventas  
agregadas  y  desempeño  del  mercado.
Además,  el  aumento  de  las  opciones  para  que  los  especialistas  en  
marketing  influyan  en  los  consumidores,  como  a  través  del  contenido  generado  
por  la  empresa  en  las  redes  sociales  y  el  marketing  de  contenido,  en  el  que  las  
Atribución  y  asignación  a  nuevos  puntos  de  contacto.  Los  datos  de  nuevos   empresas  se  convierten  en  creadores  y  editores  de  contenido,  ha  dado  
canales  y  dispositivos  están  contribuyendo  al  desarrollo  de  nuevas  formas  en   importancia  al  problema  de  comprender  los  efectos  individuales  de  estas  
las  que  se  pueden  tomar  mejores  decisiones  de  mezcla  de  marketing.  Por   opciones  como  parte.  de  la  mezcla  de  mercadotecnia.  Se  necesitan  métodos  y  
ejemplo,  mientras  que  Prins  y  Verhoef  (2007)  examinan  las  sinergias  entre  el   técnicas  más  nuevos  para  medir  con  precisión  su  impacto.  Por  ejemplo,  
marketing  directo  y  las  comunicaciones  masivas,  Risselada,  Verhoef  y  Bijmolt   Johnson,  Lewis  y  Nubbemeyer  (2015)  miden  el  efecto  de  los  anuncios  gráficos  
(2014)  aprovechan  los  datos  de  las  redes  sociales  de  los  clientes  para   mediante  una  nueva  metodología  que  facilita  la  identificación  de  los  efectos  del  
comprender  los  efectos  dinámicos  del  marketing  directo  y  la  influencia  social.   tratamiento  de  los  anuncios  en  un  experimento  aleatorio.  Muestran  que  es  
en  la  adopción  de  un  producto  de  alta  tecnología.  Nitzan  y  Libai  (2011)  utilizan   mejor  que  los  anuncios  de  servicio  público  y  las  pruebas  A/B  de  intención  de  
datos  sobre  las  redes  sociales  individuales  de  más  de  un  millón  de  clientes   tratar  para  minimizar  los  costos  de  las  pruebas.  Después  de  medir  dichos  
para  comprender  cómo  los  vecindarios  de  la  red  influyen  en  el  peligro  de   efectos  individuales,  es  posible  asignar  presupuestos  de  manera  óptima  a  los  
deserción  de  un  proveedor  de  servicios.  Joo  et  al.  (2014)  se  centran  en  las   elementos  de  marketing/combinación  de  medios.
palabras  clave  de  marca  (a  diferencia  de  las  genéricas)  y  encuentran  que  los  
anuncios  de  televisión  afectan  la  cantidad  de  búsquedas  relacionadas  en  línea. Albers  (2012)  proporciona  pautas  sobre  cómo  se  pueden  desarrollar  
ayudas  prácticas  para  la  toma  de  decisiones  para  la  asignación  óptima  de  la  
mezcla  de  marketing.  Señala  la  necesidad  de  estudiar  el  comportamiento  de  
De  manera  similar,  Liaukonyte,  Teixeira  y  Wilbur  (2015),  utilizando  datos   los  gerentes  para  determinar  mejor  la  especificación  de  los  modelos  del  lado  de  la  oferta.
cuasiexperimentales  a  gran  escala  de  publicidad  televisiva  y  frecuencia  de   Uno  de  los  beneficios  importantes  de  trabajar  en  un  entorno  rico  en  datos  
compras  en  línea  en  ventanas  de  dos  minutos,  encuentran  que  la  publicidad   radica  en  la  creación  de  ayudas  para  la  toma  de  decisiones  para  mejorar  el  
televisiva  influye  en  las  compras  en  línea  y  que  el  contenido  publicitario  juega   presupuesto  y  asignar  mejor  las  inversiones  en  la  combinación  de  marketing,  
un  papel  clave.  Estos  estudios  destacan  el  papel  de  los  efectos  cruzados  en  la   diferentes  productos,  segmentos  de  mercado  y  clientes.
planificación  de  la  mezcla  de  marketing.  En  el  contexto  de  los  nuevos   Hanssens  (2014)  proporciona  una  revisión  de  los  algoritmos  de  optimización  
dispositivos,  Danaher  et  al.  (2015)  utilizan  datos  de  panel  para  examinar  la   que  abarcan  enfoques  de  un  solo  período  y  de  varios  períodos  y  son  apropiados  
efectividad  de  las  promociones  de  cupones  móviles.  Encuentran  que  la   para  entornos  monopolísticos  y  competitivos.  Naik,  Raman  y  Winer  (2005)  
ubicación  y  el  tiempo  de  entrega  de  los  cupones  (en  relación  con  el  tiempo  de   modelan  explícitamente  el  comportamiento  estratégico  de  una  empresa  que  
compra)  influyen  en  el  canje.  Fong,  Fang  y  Luo  (2015)  examinan  la  eficacia  de   anticipa  cómo  los  competidores  probablemente  tomarán  decisiones  futuras  y  
la  orientación  geográfica  de  las  promociones  móviles  mediante  un  experimento   razona  hacia  atrás  para  deducir  su  propia  decisión  óptima  en  respuesta.
de  campo  aleatorio  e  investigan  la  orientación.
Aunque  la  mayor  parte  del  trabajo  existente  se  ha  centrado  en  asignar  la

110 /  Journal  of  Marketing:  edición  especial  de  AMA/MSI,  noviembre  de  2016
Machine Translated by Google

presupuesto  en  productos  individuales,  Fischer  et  al.  (2011)  proponen   son  progresistas  y  descuentan  los  ingresos  futuros.  Los  investigadores  
un  enfoque  heurístico  para  resolver  el  problema  de  asignación  de   estiman  su  modelo  con  MCMC  paralelo,  lo  que  les  permite  adaptarse  a  
presupuesto  de  marketing  dinámico  para  empresas  multiproducto  y   la  heterogeneidad  a  nivel  individual  y  diseñar  estrategias  de  marketing  
multisegmento  (países).  Este  enfoque,  implementado  en  la  empresa   dirigidas.  Este  trabajo  es  una  de  las  primeras  aplicaciones  de  un  modelo  
multinacional  Bayer,  es  un  ejemplo  de  una  dirección  de  modelado  que   estructural  en  datos  relativamente  grandes  y  es  un  desarrollo  prometedor  
resuelve  problemas  prácticos  apremiantes. porque  es  importante  tener  en  cuenta  el  comportamiento  prospectivo  en  
los  modelos  de  mezcla  de  marketing,  incluso  aquellos  calibrados  en  
Evaluación  de  la  causalidad  de  los  efectos  de  la  mezcla  de  marketing.   experimentos  de  campo.
La  evaluación  de  la  causalidad  en  los  modelos  de  mezcla  de  marketing  
ha  recibido  una  amplia  atención  en  el  mundo  académico,  pero  
lamentablemente  aún  no  ha  recibido  tanta  atención  en  la  industria.  Si  
Personalización
una  variable  de  control  de  marketing  se  determina  endógenamente  pero  
no  se  tiene  en  cuenta  en  el  modelo  (debido,  por  ejemplo,  a  variables   La  personalización  lleva  la  asignación  de  la  combinación  de  marketing  
faltantes,  acciones  de  gestión  que  dependen  de  los  resultados  de   un  paso  más  allá,  ya  que  adapta  la  oferta  de  productos  o  servicios  y  
ventas),  el  DGM  no  se  captura  con  precisión.  En  ese  caso,  las   otros  elementos  de  la  combinación  de  marketing  a  las  necesidades  de  
predicciones  de  los  efectos  de  este  elemento  de  la  mezcla  de  marketing  estarán  
sesgadas  
los   (Rossi  
usuarios   2014). (Khan,  Lewis  y  Singh,  2009).  Hay  tres  métodos  
individuales  
Este  problema  puede  aliviarse  si  se  pueden  encontrar  IV  exógenas  que   principales  de  personalización.  (1)  La  personalización  pull  brinda  un  
estén  relacionadas  con  la  variable  de  control  endógena. servicio  personalizado  cuando  un  cliente  lo  solicita  explícitamente.  Un  
En  primer  lugar,  la  variedad  de  big  data  podría  ayudar  a  encontrar   ejemplo  es  Dell,  que  permite  a  los  clientes  personalizar  la  computadora  
mejores  IV,  lo  cual  es  necesario  porque  los  IV  suelen  ser  problemáticos. que  compran  en  términos  de  características  de  producto  preespecificadas.  
En  el  caso  de  la  publicidad  televisiva,  Shapiro  (2014)  explota  las   (2)  La  personalización  pasiva  muestra  información  personalizada  sobre  
discontinuidades  en  el  gasto  publicitario  en  áreas  de  mercado  locales   productos  o  servicios  en  respuesta  a  actividades  relacionadas  con  el  
designadas.  Los  diseños  de  discontinuidad  de  regresión  que  aprovechan   cliente,  pero  el  consumidor  tiene  que  actuar  sobre  esa  información.  Por  
las  variaciones  en  una  variable  de  tratamiento  posiblemente  endógena   ejemplo,  Catalina  Marketing  Services,  un  líder  de  la  industria  de  cupones  
en  cualquier  lado  de  un  umbral  no  son  económicos  en  el  uso  de  datos  y,   personalizados  entregados  en  el  mostrador  de  pago  de  las  tiendas  
por  lo  tanto,  pueden  beneficiarse  de  grandes  datos  (Hartmann,  Nair  y   minoristas  físicas,  personaliza  los  cupones  sobre  la  base  del  historial  
Narayanan  2011).  Sin  embargo,  los  modelos  con  IV  generalmente  no   de  compras  de  los  compradores  registrado  en  sus  tarjetas  de  fidelización.  
predicen  mejor  fuera  de  la  muestra  (Ebbes,  Papies  y  Van  Heerde  2011).   Los  sistemas  de  recomendación  representan  otro  ejemplo  de  este  
Los  investigadores  han  desarrollado  varios  métodos  sin  instrumentos   enfoque.  (3)  La  personalización  push  lleva  la  personalización  pasiva  un  
para  ayudar  en  situaciones  en  las  que  no  se  pueden  encontrar   paso  más  allá  al  enviar  un  producto  o  servicio  personalizado  directamente  
instrumentos  válidos  (Ebbes  et  al.  2005;  Park  y  Gupta  2012).  Estos   a  los  clientes  sin  su  solicitud  explícita.  Un  ejemplo  de  esto  es  Pandora,  
métodos  son  adecuados  para  la  aplicación  automatizada  en  entornos  de   que  crea  estaciones  de  radio  personalizadas  en  línea  o  móviles.  Las  
producción  de  datos  a  gran  escala  en  la  industria,  en  los  que  la  búsqueda   estaciones  de  radio  se  adaptan  individualmente  sobre  la  base  de  las  
de  instrumentos  válidos  caso  por  caso  a  menudo  es  inviable. selecciones  de  música  iniciales  de  los  usuarios  y  las  similitudes  entre  los  
atributos  de  las  canciones  extraídos  de  la  base  de  datos  de  Music  
En  segundo  lugar,  los  entornos  de  datos  digitales  permiten  experimentos   Genome.
de  campo  que  permiten  al  investigador  evaluar  los  efectos  causales.
de  variables  de  control  de  marketing  (para  investigaciones  en  este   Para  cada  uno  de  estos  tipos  de  personalización,  hay  tres  posibles  
contexto,  véase  Andrews  et  al.  2015;  Hui  et  al.  2013).  En  tercer  lugar,  en   niveles  de  granularidad:  (1)  personalización  masiva,  en  la  que  todos  los  
el  modelado  estructural  de  la  oferta  y  la  demanda,  los  nuevos  tipos  de   consumidores  reciben  la  misma  oferta  y/o  combinación  de  marketing,  
datos  pueden  ayudar  a  calibrar  las  especificaciones  de  los  modelos  de   personalizada  a  su  gusto  promedio;  (2)  personalización  a  nivel  de  
manera  más  precisa  y  eficiente.  Chung,  Steenburgh  y  Sudhir  (2014)   segmento,  en  la  que  se  identifican  grupos  de  consumidores  con  
brindan  un  ejemplo  ilustrativo  en  el  que  estiman  un  modelo  estructural   preferencias  homogéneas  y  se  personaliza  el  marketing  mix  de  la  misma  
dinámico  de  respuesta  de  la  fuerza  de  ventas  a  un  plan  de  compensación   manera  para  todos  los  consumidores  de  un  segmento;  y  (3)  
basado  en  bonos.  En  lugar  de  asumir  los  factores  de  descuento  utilizados   personalización  a  nivel  individual,  en  la  que  cada  consumidor  recibe  
por  los  vendedores  con  visión  de  futuro,  como  se  ha  hecho  en   ofertas  y/o  elementos  de  la  mezcla  de  marketing  personalizados  para  
investigaciones  anteriores,  los  estiman  a  partir  de  datos  de  campo   sus  gustos  y  comportamientos  individuales.  Sin  embargo,  la  disponibilidad  
utilizando  una  combinación  de  restricciones  de  exclusión  y  un  modelo   de  big  data  con  amplia  información  a  nivel  individual  no  necesariamente  
específico  para  el  entorno  institucional. hace  deseable  que  las  empresas  personalicen  al  nivel  más  granular.  Big  
Por  último,  es  importante  tener  en  cuenta  el  comportamiento   data  ofrece  a  las  empresas  la  oportunidad  de  elegir  un  nivel  óptimo  de  
prospectivo  de  los  consumidores  al  desarrollar  modelos  de  mezcla  de   granularidad  para  diferentes  elementos  de  la  combinación  de  marketing,  
marketing  que  den  cuenta  de  la  idea  de  que  los  consumidores  pueden   según  la  existencia  de  economías  de  escala  y  el  ROI.  Por  ejemplo,  una  
maximizar  sus  ganancias  en  un  horizonte  finito  o  infinito,  en  lugar  de  ser   empresa  como  Ford  Motor  Company  desarrolla  una  imagen  de  marca  
miopes.  Aunque  la  identificación  de  estos  modelos  se  beneficia  de  una   global  (masiva);  personaliza  la  publicidad  de  productos  y  marcas  para  
mayor  variación  en  los  datos  de  gran  volumen  y  variedad,  dichos  modelos   segmentos  de  clientes;  personaliza  el  esfuerzo  de  ventas,  los  precios  y  
presentan  desafíos  computacionales  que  aún  deben  resolverse.  Liu,   las  promociones  a  nivel  individual;  y  personaliza  las  experiencias  en  el  
Montgomery  y  Srinivasan  (2015)  abordan  este  problema  mediante  la   automóvil  utilizando  tecnología  de  imágenes.
construcción  de  un  modelo  de  decisiones  de  planificación  financiera  de  
los  consumidores  basado  en  el  supuesto  de  que

Análisis  de  marketing  para  entornos  ricos  en  datos /  111
Machine Translated by Google

Sistemas  de  recomendación.  Los  sistemas  de  recomendación  son   para  ser  dirigido  a  través  de  los  consumidores,  el  tiempo,  las  redes  publicitarias  
poderosas  herramientas  de  personalización,  con  las  mejores  aplicaciones  de   y  los  sitios  web  en  un  nivel  muy  alto  de  granularidad.  Hemos  mencionado  la  
su  clase  de  Amazon  y  Netflix.  Existen  dos  tipos  básicos  de  motores  de   personalización  adaptativa  de  Pandora  como  otro  ejemplo  en  una  sección  
recomendación  que  se  basan  en  filtrado  de  contenido  o  filtrado  colaborativo,   anterior.  Por  lo  tanto,  la  personalización  adaptativa  lleva  la  automatización  del  
pero  también  existen  sistemas  de  recomendación  híbridos  que  combinan   marketing  a  la  siguiente  etapa.  En  lugar  de  automatizar  decisiones  de  
características  de  ambos  tipos. marketing  simples,  automatiza  todo  el  circuito  de  retroalimentación  de  CLM.  
El  filtrado  de  contenido  involucra  a  agentes  digitales  que  hacen   La  automatización  ofrece  el  beneficio  adicional  de  acelerar  drásticamente  el  
recomendaciones  basadas  en  la  similitud  entre  las  preferencias  pasadas  de   ciclo  de  personalización.
un  cliente  por  productos  y  servicios.  El  filtrado  colaborativo  predice  las   Los  sistemas  de  personalización  adaptables  requieren  una  participación  
preferencias  de  un  cliente  utilizando  las  de  clientes  similares.  Los  sistemas   proactiva  mínima  del  usuario  y  se  basan  principalmente  en  datos  observados  
basados  en  modelos  utilizan  métodos  estadísticos  para  predecir  estas   de  compra,  uso  o  flujo  de  clics.  Aprenden  los  gustos  de  los  consumidores  de  
preferencias;  la  literatura  de  marketing  se  ha  centrado  predominantemente  en   forma  adaptativa  a  lo  largo  del  tiempo  mediante  el  seguimiento  de  los  
estos  (Ansari,  Essegaier  y  Kohli  2000).  La  investigación  ha  demostrado  que   comportamientos  cambiantes  de  los  consumidores.  Desde  el  punto  de  vista  
los  sistemas  basados  en  modelos  superan  a  los  motores  de  recomendación   del  consumidor,  estos  sistemas  son  fáciles  de  usar:  el  usuario  solo  interactúa  
más  simples,  pero  lo  hacen  a  costa  de  una  mayor  carga  computacional.   con  el  servicio  mientras  se  registran  los  datos  de  uso  y  el  servicio  se  adapta  automáticamente.
También  ha  demostrado  que  debido  a  que  muchos  consumidores  no  quieren   Los  sistemas  de  personalización  adaptable  en  línea  y  móvil  implementan  
o  no  pueden  proporcionar  calificaciones  de  productos  de  manera  activa,  falta   estrategias  CLM  completamente  automatizadas  mediante  la  recopilación  y  el  
gran  parte  de  la  información  en  los  sistemas  de  recomendación  basados  en   análisis  de  datos,  la  predicción  del  comportamiento  del  usuario,  la  
calificaciones.  Tratar  adecuadamente  con  esta  información  faltante  en  los   personalización  de  los  servicios  y  la  evaluación  de  la  eficacia  de  las  
sistemas  de  recomendación  basados  en  calificaciones  ubicuas  puede  hacer   recomendaciones  en  un  ciclo  continuo  y  automatizado.
que  las  recomendaciones  sean  mucho  más  efectivas  (Ying,  Feinberg  y  Wedel   Zhang  y  Krishnamurthi  (2004)  fueron  de  los  primeros  en  desarrollar  un  
2006).  Además,  la  mayoría  de  los  sistemas  producen  recomendaciones  para   enfoque  de  personalización  adaptativa.  Personalizan  los  descuentos  de  
los  consumidores  sobre  la  base  de  sus  preferencias  o  elecciones  previstas,   precios  promocionales  en  línea  mediante  el  uso  de  un  modelo  integrado  de  
pero  no  necesariamente  sobre  la  base  de  su  respuesta  prevista  a  las   incidencia,  cantidad  y  tiempo  de  compra  que  pronostica  la  respuesta  de  los  
recomendaciones  mismas.  Tener  en  cuenta  la  receptividad  al  hacer   consumidores  al  esfuerzo  promocional  a  lo  largo  del  tiempo,  y  emplean  la  
recomendaciones  mediante  la  utilización  de  ideas  de  segmentación  basada   maximización  de  ganancias  numéricas  para  determinar  de  forma  adaptativa  
en  respuestas  puede  aumentar  en  gran  medida  su  eficacia  (Bodapati  2008). el  tiempo  y  la  profundidad  de  las  promociones  personalizadas.  Esta  aplicación  
es  conceptualmente  similar  a  los  servicios  de  Catalina  Marketing  en  tiendas  
offline.  En  una  extensión  de  este  trabajo,  Zhang  y  Wedel  (2009)  investigan  
Conceptualmente,  la  personalización  consiste  en  (1)  conocer  las   las  implicaciones  de  ganancias  de  la  personalización  adaptativa  en  línea  y  
preferencias  del  consumidor,  (2)  adaptar  las  ofertas  a  los  consumidores  y  (3)   fuera  de  línea,  comparando  tres  niveles  de  granularidad:  masivo,  segmento  e  
evaluar  la  efectividad  de  la  personalización. individual.  Los  resultados  muestran  que  la  personalización  a  nivel  individual  
Algunos  de  los  problemas  con  los  sistemas  de  recomendación  basados  en   es  rentable,  pero  sobre  todo  en  el  canal  online.  Chung,  Rust  y  Wedel  (2009)  
calificaciones  han  llevado  a  las  empresas  (p.  ej.,  Amazon)  a  utilizar  datos   diseñan  y  evalúan  un  enfoque  de  personalización  adaptable  para  la  música  
obtenidos  discretamente  de  los  clientes  como  entrada  para  la  personalización   móvil.  Su  enfoque  personaliza  la  música  utilizando  datos  de  escucha,  así  
de  servicios  en  línea  y  móviles.  Estas  tres  etapas  se  han  utilizado  durante   como  los  atributos  de  la  música  que  se  utilizan  como  variables  de  predicción.  
mucho  tiempo  en  estrategias  de  marketing  de  ciclo  cerrado  (CLM).  En  entornos   Desarrollan  un  algoritmo  escalable  de  filtrado  de  partículas  en  tiempo  real  (un  
digitales,  CLM  puede  automatizarse  completamente  en  un  ciclo  continuo,  lo   algoritmo  MCMC  dinámico)  para  la  personalización  que  se  ejecuta  en  
que  da  lugar  a  sistemas  de  personalización  adaptativos. dispositivos  móviles.  Se  incorpora  un  elemento  de  sorpresa  a  través  de  
recomendaciones  aleatorias,  que  evitan  que  el  sistema  se  centre  en  un  
conjunto  demasiado  limitado  de  gustos  de  los  usuarios.  El  modelo  es  discreto  
Personalización  adaptativa.  Los  sistemas  de  personalización  adaptativa   para  los  usuarios  y  no  requiere  ninguna  entrada  del  usuario  más  que  el  
llevan  la  personalización  un  paso  más  allá  al  proporcionar  servicios   comportamiento  de  escucha  del  usuario  para  las  canciones  que  se  descargan  
personalizados  dinámicamente  en  tiempo  real  (Steckel  et  al.  2005).  Por   automáticamente  en  el  dispositivo.  Las  pruebas  de  campo  han  demostrado  
ejemplo,  Groupon  personaliza  ofertas  diarias  de  productos  y  servicios  de   que  este  sistema  supera  a  los  algoritmos  alternativos  similares  a  los  de  
minoristas  locales  o  nacionales  y  las  entrega  por  correo  electrónico  o  en   Pandora.
dispositivos  móviles;  a  medida  que  recopila  más  datos  sobre  el  suscriptor  
individual,  las  ofertas  se  personalizan  con  mayor  precisión.  Otro  ejemplo  es  la  
compra  y  venta  de  impresiones  de  anuncios  gráficos  en  línea  en  subastas  de   Hauser  et  al.  (2009)  desarrollan  un  sistema  para  la  personalización  
ofertas  en  tiempo  real  en  plataformas  de  intercambio  de  anuncios.  Estas   adaptativa  del  diseño  de  sitios  web.  Este  enfoque,  al  que  denominan  
subastas  se  ejecutan  de  forma  totalmente  automática  en  el  tiempo  (menos  de   "transformación  del  sitio  web",  implica  hacer  coincidir  el  contenido,  el  aspecto  
una  décima  de  segundo)  que  tarda  un  sitio  web  en  cargarse.  El  anuncio   y  la  "sensación"  del  sitio  web  con  una  cantidad  fija  de  estilos  cognitivos.  En  
ganador  se  muestra  instantáneamente  en  el  sitio  del  editor.  Para  construir   primer  lugar,  el  sistema  estima  la  probabilidad  de  cada  segmento  de  estilo  
reglas  de  oferta  autónomas,  los  anunciantes  (1)  rastrean  el  comportamiento   cognitivo  para  los  visitantes  del  sitio  web  sobre  la  base  de  los  datos  de  
de  navegación  de  los  consumidores  en  los  sitios  web,  (2)  exponen   inicialización  que  involucran  los  flujos  de  clics  de  los  encuestados  y  los  juicios  
selectivamente  segmentos  definidos  sobre  la  base  de  esos  comportamientos   de  morfologías  alternativas  de  la  página  web.  En  un  segundo  ciclo,  la  
a  sus  anuncios  gráficos  en  línea  y  (3)  registran  el  comportamiento  de  clics  de   asignación  de  morfología  óptima  se  calcula  usando  programación  dinámica,  
los  consumidores  en  respuesta.  a  sus  anuncios.  Esto  permite  la  colocación  de   maximizando  tanto  la  ganancia  inmediata  esperada  como  la  ganancia  futura  
anuncios descontada  obtenida  cuando  el

112 /  Journal  of  Marketing:  edición  especial  de  AMA/MSI,  noviembre  de  2016
Machine Translated by Google

usuario  realiza  una  compra  en  el  sitio  web.  El  sistema  equilibra  la  compensación  entre   promulgarse  en  los  Estados  Unidos.  Goldfarb  y  Tucker  (2010)  muestran  que  la  
la  explotación  (es  decir,  la  presentación  de  opciones  de  productos  que  mejor  se   regulación  de  la  privacidad  que  restringe  el  uso  de  datos  personales  puede  hacer  que  
adaptan  a  las  preferencias  previstas  de  los  usuarios)  y  la  exploración  (es  decir,  la   los  anuncios  gráficos  en  línea  sean  menos  efectivos  e  impone  un  costo,  especialmente  
introducción  de  sorpresas  para  ayudar  a  mejorar  la  estimación).  Morphing  puede   a  las  empresas  en  línea  más  jóvenes  y  pequeñas  que  dependen  de  los  ingresos  
mejorar  sustancialmente  la  rentabilidad  esperada  realizada  en  el  sitio  web.  Los   publicitarios  (Campbell,  Goldfarb  y  Tucker  2015).
investigadores  han  aplicado  ideas  similares  a  la  transformación  de  anuncios  publicitarios   En  segundo  lugar,  es  cada  vez  más  probable  que  las  empresas  se  vigilen  a  sí  mismas.
(Urban  et  al.  2014),  que  se  colocan  automáticamente  en  sitios  web  y  se  relacionan  con   Actualmente,  la  mayoría  de  las  empresas  comunican  las  políticas  de  privacidad  a  sus  
los  consumidores  en  función  de  sus  probabilidades  de  pertenencia  al  segmento  para   clientes.  Respetar  la  privacidad  de  los  clientes  es  una  buena  práctica  empresarial  y  
maximizar  las  tasas  de  clics. ayuda  a  la  empresa  a  establecer  relaciones  con  los  clientes.  La  investigación  de  Tucker  
(2014)  respalda  esta  noción.
La  personalización  adaptativa  crecerá  con  la  llegada  del  Internet  de  las  cosas  y   En  un  experimento  de  campo,  muestra  que  cuando  un  sitio  web  brinda  a  los  
las  interfaces  de  usuario  naturales,  a  través  de  las  cuales  los  consumidores  interactúan   consumidores  más  control  sobre  su  información  personal,  la  tasa  de  clics  en  anuncios  
con  sus  dispositivos  digitales  a  través  de  la  voz,  la  mirada,  la  expresión  facial  y  el   personalizados  se  duplica.  Al  comparar  los  efectos  de  las  políticas  de  exclusión  
control  del  movimiento.  A  medida  que  estos  datos  estén  disponibles  para  los   voluntaria,  inclusión  voluntaria  y  prohibición  de  seguimiento  en  la  industria  de  la  
especialistas  en  marketing  a  gran  escala,  permitirán  el  análisis  de  atención   publicidad  gráfica,  Johnson,  Lewis  y  Nubbemeyer  (2015)  encuentran  que  la  política  de  
automatizado,  lo  que  potencialmente  beneficiará  la  personalización  de  la  mezcla  de   exclusión  voluntaria  tiene  el  menor  impacto  negativo  en  los  ingresos  de  los  editores  y  
marketing  de  muchas  maneras. el  excedente  de  los  anunciantes. .  Cada  vez  más,  se  espera  que  los  gerentes  
comprendan  mejor  las  nuevas  tecnologías  y  protocolos  para  proteger  la  seguridad  de  
Privacidad  y  seguridad  A  medida  
los  datos.  Además,  la  automatización  del  marketing  (como,  por  ejemplo,  la  
que  se  recopilan  más  datos  de  clientes  y  avanza  la  personalización,  la  privacidad  y  la   personalización  adaptativa)  evitará  la  intrusión  humana  y  brindará  a  los  clientes  una  
seguridad  se  han  convertido  en  temas  críticos  para  el  análisis  de  big  data  en  marketing.   mayor  confianza  de  que  su  privacidad  está  protegida.  Lo  que  es  más  importante,  las  
Según  una  encuesta  reciente  (Dupre  2015),  más  de  las  tres  cuartas  partes  de  los   empresas  deberán  asegurarse  de  que  la  información  confidencial  de  los  clientes  se  
consumidores  piensan  que  los  anunciantes  en  línea  tienen  más  información  sobre   distribuya  a  través  de  sistemas  separados,  que  los  datos  sean  anónimos  y  que  el  
ellos  de  la  que  se  sienten  cómodos,  y  aproximadamente  la  mitad  de  ellos  cree  que  los   acceso  a  la  información  privada  de  los  clientes  esté  restringido  dentro  de  la  
sitios  web  ignoran  las  leyes  de  privacidad.  Estas  percepciones  son  indicativas  de  dos   organización.  Con  las  brechas  de  seguridad  cada  vez  más  comunes,  existe  la  opinión  
realidades.  En  primer  lugar,  las  empresas  han  estado  recopilando  datos  de  múltiples   emergente  de  que  las  empresas  no  pueden  hacer  que  sus  sistemas  sean  
fuentes  y  fusionándolos  para  obtener  mejores  perfiles  de  sus  clientes.  La  fácil   completamente  seguros  contra  las  brechas.  Además  de  tomar  medidas  para  proteger  
disponibilidad  de  datos  de  fuentes  gubernamentales  (como  censos,  salud,  empleo  y   los  datos,  las  empresas  deben  contar  con  planes  de  respuesta  ante  filtraciones  de  
metadatos  telefónicos,  facilitada  por  el  "Plan  de  Datos  Abiertos"  publicado  por  la  Casa   datos.
Blanca  en  2013)  y  la  disminución  de  los  costos  de  almacenamiento  y  procesamiento  
de  datos  han  llevado  a  un  gran  ROI  en  tales  esfuerzos  (Rust,  Kannan  y  Peng  2002). La  implicación  de  los  factores  antes  mencionados  para  el  análisis  de  marketing  
es  que  habrá  un  mayor  énfasis  en  la  minimización  y  el  anonimato  de  los  datos  (ver  
también  Verhoef,  Kooge  y  Walk  2016).  La  minimización  de  datos  requiere  que  los  
comerciantes  limiten  el  tipo  y  la  cantidad  de  datos  que  recopilan  y  retengan  y  eliminen  
Sin  embargo,  la  combinación  de  conjuntos  de  datos  ha  llevado  al  “efecto  mosaico”,   los  datos  que  ya  no  necesitan.  Los  datos  pueden  volverse  anónimos  usando  
que  genera  información  sobre  los  consumidores  que  debería  ser  privada  pero  que,  sin   procedimientos  como  k­anonimización  (cada  registro  es  indistinguible  de  al  menos  k  ­  
embargo,  se  revela  en  los  datos  integrados  (p.  ej.,  el  sitio  web  de  búsqueda  de   1  otros),  eliminando  información  de  identificación  personal,  recodificando,  intercambiando  
personas  Spokeo  explota  dichos  datos).  En  segundo  lugar,  las  leyes  de  privacidad  y  la   o  aleatorizando  datos,  o  encriptando  irreversiblemente  campos  de  datos  para  convertir  
tecnología  de  seguridad  no  han  seguido  el  ritmo  de  las  tecnologías  de  recopilación,   datos  en  un  formato  no  legible  por  humanos.  forma.
almacenamiento  y  procesamiento  de  datos.  Esto  ha  dado  lugar  a  un  entorno  en  el  que  
prevalecen  las  infracciones  de  seguridad  de  alto  perfil  y  el  mal  uso  de  la  información  
privada  del  consumidor.  En  los  últimos  diez  años,  se  han  reportado  más  de  5000   Sin  embargo,  aunque  estos  métodos  protegen  la  privacidad,  es  posible  que  no  
filtraciones  importantes  de  datos,  la  mayoría  en  la  industria  financiera.  Según  una   disuadan  de  las  filtraciones  de  datos  (Miller  y  Tucker  2011).
investigación  realizada  por  IBM  y  Ponemon  Institute,  el  costo  promedio  de  una  filtración  
de  datos  se  acerca  a  los  $4  millones,  aproximadamente  $150  por  registro  robado.   Como  resultado  de  la  minimización  de  datos,  es  posible  que  estén  disponibles  
Ejemplos  de  violaciones  recientes  de  seguridad  de  datos  de  alto  perfil  son  las  que   menos  datos  a  nivel  individual  para  el  desarrollo  analítico  en  la  investigación  académica  
afectaron  a  Target,  Sony  Pictures  Entertainment,  Home  Depot  y  Ashley  Madison.  Con   y  aplicada,  y  cada  vez  más  datos  estarán  disponibles  solo  en  forma  agregada.  La  
el  aumento  del  almacenamiento  en  la  nube,  se  prevé  que  las  violaciones  de  datos  se   investigación  en  análisis  de  marketing  debe  desarrollar  procedimientos  para  acomodar  
vuelvan  más  comunes. datos  minimizados  y  anonimizados  sin  degradar  el  poder  diagnóstico  y  predictivo,  y  
métodos  analíticos  que  preserven  el  anonimato.  Por  ejemplo,  la  Comisión  Federal  de  
Comercio  requiere  que  los  proveedores  de  datos,  como  Experian  o  Claritas,  protejan  
Es  probable  que  surjan  dos  tendencias  que  cambiarán  el  statu  quo.  Primero,  los   la  privacidad  de  los  consumidores  individuales  agregando  datos  a  nivel  individual  a  
gobiernos  promulgarán  leyes  de  privacidad  cada  vez  más  estrictas  para  proteger  a  sus   nivel  de  código  postal.  Los  vendedores  directos  confían  en  estos  datos,  pero  
ciudadanos.  Esto  limitará  la  forma  en  que  se  pueden  usar  los  grandes  datos  y  el   tradicionalmente  ignoran  la  naturaleza  anónima  de  la  información  a  nivel  de  código  
análisis  con  fines  de  marketing.  La  Unión  Europea,  que  ya  tiene  leyes  de  privacidad   postal  al  desarrollar  sus  campañas  de  marketing  dirigidas.  Steenburgh,  Ainslie  y  
más  estrictas,  está  considerando  expandir  el  llamado  “derecho  al  olvido”  a  cualquier   Engebretson  (2003)  muestran  cómo  aprovechar
empresa  que  recopile  datos  personales  de  clientes  (Dwoskin  2015).  Leyes  similares  
pero  menos  restrictivas  pronto  podrían

Análisis  de  marketing  para  entornos  ricos  en  datos /  113
Machine Translated by Google

datos  de  códigos  postales  “masivamente  categóricos”  a  través  de  un  modelo   términos  de  la  continuidad  del  aprendizaje  automático  a  los  modelos  basados  en  la  
teoría?
bayesiano  jerárquico.  El  modelo  permite  al  investigador  combinar  datos  de  varias  
fuentes  en  diferentes  niveles  de  agregación. 5.  ¿Cuáles  son  las  estrategias  y  enfoques  viables  de  análisis  de  datos  para  el  modelado  
de  diagnóstico,  predictivo  y  prescriptivo  de  datos  no  estructurados  a  gran  escala?
Además,  si  los  modelos  utilizados  para  el  análisis  predictivo  se  conocen  a  priori  y  
tienen  suficientes  estadísticas  asociadas  o  distribuciones  posteriores  (p.  ej.,  medias,  
6.  ¿Cómo  se  pueden  ampliar  las  técnicas  de  computación  cognitiva  y  de  aprendizaje  
varianzas,  productos  cruzados),  se  pueden  conservar  para  permitir  el  análisis  sin  
profundo  para  analizar  e  interpretar  datos  de  marketing  no  estructurados?  ¿Cómo  
pérdida  de  información  (en  lugar  de  utilizar  el  datos  originales).  Los  métodos  para  
pueden  incorporarse  elementos  creativos  de  la  mezcla  de  marketing  en  técnicas  
analizar  datos  agregados  que  se  adaptan  a  las  inferencias  sobre  la  heterogeneidad   predictivas  y  prescriptivas?
no  observada  del  consumidor  pueden  brindar  soluciones  en  algunos  casos.  Los  
métodos  de  imputación  de  datos  faltantes  se  pueden  utilizar  para  obtener  
información  a  nivel  del  consumidor  a  partir  de  datos  agregados  (p.  ej.,  Musalem,   Mezcla  de  marketing
Bradlow  y  Raju  2008)  o  para  datos  en  los  que  se  han  suprimido  campos,  variables  
1.  ¿Cómo  se  pueden  alinear  los  datos  granulares  en  línea  y  móviles  con  datos  fuera  de  
o  registros.  Los  métodos  de  imputación  también  son  útiles  cuando  solo  una  parte   línea  más  agregados  para  arrojar  luz  sobre  el  camino  hacia  la  compra  y  facilitar  la  
de  los  clientes  optan  por  compartir  su  información  porque  el  aumento  de  datos   orientación  por  comportamiento?  ¿Cómo  se  pueden  incorporar  metadatos  de  
puede  imputar  datos  faltantes  de  aquellos  clientes  que  eligen  no  participar.  La   contextos  y  datos  no  estructurados  sobre  creatividades  en  el  análisis  de  datos  de  

investigación  adicional  en  esta  área  debe  centrarse  en  cómo  se  puede  proteger  la   ruta  de  compra?

privacidad  de  los  clientes.  en  el  uso  de  datos  de  marketing  enriquecidos  mientras   2.  ¿Cómo  puede  el  modelado  de  ROI  identificar  y  cuantificar  con  mayor  precisión  el  
impacto  financiero  simultáneo  de  las  actividades  de  marketing  en  línea  y  fuera  de  
se  maximiza  la  utilidad  que  se  puede  derivar  de  ellos  mediante  el  desarrollo  de  
línea?
modelos  y  algoritmos  que  pueden  preservar  o  garantizar  la  privacidad  del  
3.  ¿Qué  nuevas  técnicas  y  métodos  pueden  medir  con  precisión  la  sinergia,  el  remanente  
consumidor.
y  el  desbordamiento  entre  medios  y  dispositivos  utilizando  datos  integrados  de  ruta  
de  compra?
4.  ¿Cómo  puede  la  atribución  entre  medios,  canales  y  dispositivos  dar  cuenta  del  
comportamiento  estratégico  de  los  consumidores  y  la  endogeneidad  en  la  orientación?
Síntesis  y  futuras  direcciones  de  investigación  Los  desarrollos  en  
5.  ¿Cómo  se  pueden  incorporar  los  ciclos  de  planificación  para  diferentes  instrumentos  
curso  en  el  análisis  de  big  data  (ver  Tabla  1)  implican  (1)  la  inclusión  de  datos  
de  marketing  en  los  modelos  de  optimización  de  la  mezcla  de  marketing?
obtenidos  de  fuentes  de  datos  digitales  externas  con  datos  fuera  de  línea  para  
mejorar  las  explicaciones  y  predicciones  de  los  efectos  de  la  mezcla  de  marketing;  
Personalización
(2)  la  atribución  de  los  efectos  de  la  mezcla  de  marketing  a  través  de  una  mejor  
comprensión  del  impacto  simultáneo  de  los  elementos  de  la  mezcla  de  marketing   1.  ¿Qué  contenido  debe  personalizarse,  a  qué  nivel  de  granularidad  y  con  qué  
frecuencia?  ¿Cómo  se  puede  adaptar  el  contenido  a  los  consumidores  individuales  
mientras  se  adaptan  a  sus  diferentes  ciclos  de  planificación;  (3)  la  caracterización  
utilizando  información  a  nivel  individual  y  gestión  de  campañas  automatizada?
de  toda  la  ruta  de  compra  a  través  de  canales  fuera  de  línea  y  en  línea  y  múltiples  
dispositivos  y  asignación  dinámica  de  recursos  a  puntos  de  contacto  individuales  
2.  ¿Cómo  pueden  las  empresas  obtener  información  a  nivel  individual  a  partir  de  big  
dentro  de  esa  ruta;  (4)  la  evaluación  de  los  efectos  causales  de  las  variables  de  
data,  utilizando  técnicas  más  rápidas  y  menos  costosas  desde  el  punto  de  vista  
control  de  marketing  a  través  de  representaciones  estructurales  del  comportamiento   computacional  para  dar  lecturas  de  las  intenciones  de  los  clientes  en  tiempo  real?
del  consumidor,  variables  instrumentales,  métodos  sin  instrumentos  y  experimentos  
3.  ¿Cómo  pueden  las  empresas  personalizar  la  combinación  de  puntos  de  contacto  (a  
de  campo;  y  (5)  personalización  de  la  mezcla  de  marketing  en  ciclos  de  circuito   través  de  canales,  dispositivos  y  puntos  en  el  embudo  de  compra)  para  los  clientes  
cerrado  totalmente  automatizados.  Los  estudios  futuros  deben  basarse  en  estas   en  ciclos  cerrados  para  que  su  experiencia  sea  siempre  excelente?
direcciones  de  investigación  y  centrarse  en  los  siguientes  temas  y  preguntas  
(Tabla  2). 4.  ¿Qué  papel  pueden  desempeñar  los  sistemas  cognitivos,  la  inteligencia  artificial  
general  y  los  sistemas  de  análisis  de  atención  automatizados  en  la  entrega  de  
experiencias  de  cliente  personalizadas?

Grandes  datos  de  marketing Seguridad  y  privacidad

1.  ¿Cómo  puede  la  fusión  de  datos  generados  dentro  de  la  empresa  con  datos   1.  ¿Qué  técnicas  se  pueden  usar  para  reducir  la  reacción  a  la  intrusión,  ya  que  una  

generados  fuera  de  la  empresa  aprovechar  los  metadatos  en  el  contexto  de  las   mayor  personalización  aumenta  las  posibilidades  de  que  resulte  contraproducente?
interacciones  con  los  clientes?  ¿Cómo  se  puede  hacer  esto  de  una  manera  que  

permita  análisis  en  tiempo  real  y  decisiones  en  tiempo  real? 2.  ¿Qué  nuevas  metodologías  deben  desarrollarse  para  dar  a  los  clientes  más  control  

2.  ¿Qué  nuevas  metodologías  y  tecnologías  facilitarán  la  integración  de  enfoques  de   en  la  personalización  de  sus  propias  experiencias  y  mejorar  la  eficacia  de  las  

“pequeñas  estadísticas  sobre  grandes  datos”  con  enfoques  de  “grandes  estadísticas   técnicas  de  minimización  de  datos?

sobre  pequeños  datos”?  ¿Cuáles  son  las  compensaciones  clave  que  deben  hacerse  
para  estimar  modelos  realistas  que  sean  aproximaciones  suficientes? 3.  ¿Cómo  se  pueden  desarrollar  soluciones  de  modelado,  software  y  datos  para  mejorar  
la  seguridad  y  la  privacidad  de  los  datos  y,  al  mismo  tiempo,  maximizar  las  

3.  ¿Cómo  se  pueden  utilizar  los  experimentos  de  campo  para  generar  grandes  datos   oportunidades  de  marketing  personalizadas?

(observacionales)  para  obtener  estimaciones  válidas  de  los  efectos  del  marketing  lo  
Para  proporcionar  ejemplos  más  detallados  de  lo  que  puede  implicar  dicha  
suficientemente  rápido  como  para  permitir  la  eficiencia  operativa  sin  retrasar  los  
investigación  adicional,  considere  el  punto  4  bajo  "Grandes  datos  de  marketing".  
procesos  de  marketing?
En  la  investigación  académica  y  aplicada,  los  datos  no  estructurados,  como  videos,  
4.  ¿Cómo  se  pueden  combinar  los  métodos  de  aprendizaje  automático  con  los  métodos  
econométricos  para  facilitar  la  estimación  de  los  efectos  causales  de  los  grandes   textos  e  imágenes,  se  utilizan  como  entrada  para  el  modelado  predictivo  al  introducir  

datos  a  altas  velocidades?  ¿Qué  condiciones  específicas  determinan  dónde  deben   la  estructura  a  través  de  la  derivación  de  datos  numéricos:  métodos  de  bolsa  de  
diseñarse  estos  nuevos  métodos  en palabras  para

114 /  Journal  of  Marketing:  edición  especial  de  AMA/MSI,  noviembre  de  2016
Machine Translated by Google

información  textual,  etiquetas  y  descriptores  para  imágenes  y  videos,   de  manera  fragmentaria.  Lo  que  se  necesita  es  un  enfoque  integral  
etc.  Sin  embargo,  además  de  requerir  diccionarios  específicos  del   de  la  combinación  de  marketing  y  el  modelo  de  atribución  que  integre  
contexto  y  clasificación  supervisada,  ninguna  de  estas  técnicas   estos  diversos  componentes  de  la  combinación  de  marketing  y  aborde  
captura  completamente  el  significado  completo  contenido  en  los   todos  estos  problemas  simultáneamente.  Los  datos  ya  no  son  una  
datos  no  estructurados.  Por  ejemplo,  el  conteo  de  palabras  en  reseñas   limitación  para  hacerlo,  aunque  será  necesario  combinar  los  datos  de  
o  blogs  ignora  la  dependencia  entre  las  palabras  y  la  sintaxis  y  la   varias  fuentes.  Es  probable  que  se  necesite  una  estrecha  colaboración  
secuencia  lógica  de  las  oraciones.  La  investigación  ya  ha  utilizado   entre  académicos  y  empresas  para  garantizar  la  disponibilidad  de  
métodos  de  aprendizaje  automático  para  detectar  idiomas  específicos   datos  y  recursos  computacionales.  Es  necesario  desarrollar  nuevos  
y  proporcionar  resúmenes  de  texto  significativos. métodos  que  puedan  combinar  técnicas  como  el  modelado  VAR,  los  
Por  lo  tanto,  se  pueden  utilizar  para  proporcionar  una  interpretación   modelos  jerárquicos  de  Bayes  y  de  elección,  la  selección  de  variables  
de  los  datos  textuales.  Las  soluciones  de  aprendizaje  automático  en   y  la  reducción  y  fusión  de  datos.
la  nube  de  Google  para  la  visión  por  computadora  pueden  interpretar   La  investigación  adicional  debería  investigar  qué  fuentes  de  datos  y  
el  contenido  de  la  imagen;  clasificar  imágenes  en  categorías;  y   modelos  son  adecuados.
detectar  texto  y  objetos,  incluidos  rostros,  flores,  animales,  casas  y  
logotipos,  en  imágenes.  Además,  se  puede  clasificar  la  expresión  
Implementación  de  Big  Data  y  análisis  en  
emocional  de  los  rostros  en  la  imagen.  Esto  significa  que  es  posible  
una  interpretación  de  la  imagen  basada  en  relaciones  significativas   organizaciones  Las  organizaciones  utilizan  análisis  
entre  estos  objetos.  Estos  métodos  se  pueden  utilizar  para  analizar  e   en  la  toma  de  decisiones  en  todas  las  áreas  funcionales,  no  solo  
interpretar,  por  ejemplo,  contenido  de  redes  sociales  obtenido  en   marketing  y  ventas,  sino  también  gestión  de  la  cadena  de  suministro,  
plataformas  como  Facebook,  Twitter  e  Instagram.  Estas  interpretaciones   finanzas  y  recursos  humanos.
de  texto  e  imágenes  en  noticias  en  línea,  reseñas  de  productos,   Wal­Mart  ejemplifica  esto,  un  pionero  en  el  uso  de  análisis  de  big  data  
recomendaciones,  acciones  compartidas,  reenvíos  o  menciones  en   para  operaciones,  que  se  basa  en  gran  medida  en  análisis  en  
redes  sociales  pueden  usarse  para  comprender  conversaciones  en   recursos  humanos  y  marketing.  Muchas  empresas  aspiran  a  integrar  
línea  sobre  productos  y  servicios.  Se  pueden  usar  para  hacer   decisiones  basadas  en  datos  en  diferentes  áreas  funcionales.  Si  bien  
predicciones  sobre  su  éxito,  proporcionar  recomendaciones  a  los   la  gestión  del  análisis  de  big  data  implica  tecnología,  estructura  
consumidores  y  personalizar  el  contenido  de  la  comunicación   organizacional  y  analistas  capacitados  y  capacitados,  la  principal  
comercial  en  las  plataformas  en  línea,  incluido  el  contenido  propio  de   condición  previa  para  su  implementación  exitosa  en  las  empresas  es  
las  redes  sociales,  las  palabras  clave  y  la  publicidad  dirigida  (tocando   una  cultura  de  toma  de  decisiones  basada  en  evidencia.  Esta  cultura  
así  los  puntos  1  y  2  bajo  "Personalización" ).  Para  lograr  esto,  los   se  resume  mejor  con  una  cita  ampliamente  atribuida  a  W.  Edwards  
investigadores  deben  comprender  cómo  incluir  interpretaciones  ricas   Deming:  “En  Dios  confiamos;  todos  los  demás  deben  traer  datos”.  En  
de  imágenes  y  texto  en  modelos  predictivos.  Exactamente  cómo  se   tal  cultura,  los  ejecutivos  de  la  empresa  reconocen  la  necesidad  de  
puede  forjar  el  vínculo  entre  el  resultado  del  modelo  de  aprendizaje   organizar  el  análisis  de  big  data  y  dar  a  los  gerentes  de  datos/análisis  
profundo  y  los  modelos  de  marketing,  cuáles  son  las  interpretaciones   la  responsabilidad  y  autoridad  para  utilizar  los  recursos  para  almacenar  
de  ese  resultado  y  si  hacen  que  los  modelos  de  marketing  sean  más   y  mantener  las  bases  de  datos;  desarrollar  y/o  adquirir  software;  y  
efectivos  son  temas  para  futuras  investigaciones. construir  e  implementar  modelos  descriptivos,  predictivos  y  normativos  
Como  segundo  ejemplo,  tome  el  punto  3  bajo  "Marketing  Mix".   (Grossman  y  Siegel  2014).  En  esas  empresas  exitosas,  los  campeones  
Los  modelos  integrados  de  mezcla  de  marketing  deben  acomodar   de  análisis  de  big  data  generalmente  se  encuentran  en  la  sala  de  
los  gastos  en  vehículos  de  medios  dentro  de  las  clases  de  televisión,   juntas  (por  ejemplo,  el  director  financiero,  el  director  de  marketing),  y  
radio,  medios  impresos,  al  aire  libre  y  medios  sociales  propios  y   los  análisis  se  utilizan  para  impulsar  la  innovación  comercial  en  lugar  
pagados  a  niveles  granulares,  espaciales  y  temporales  y  medir  los   de  simplemente  mejorar  las  operaciones  (Hagen  y  Khan  2014).
efectos  directos  e  indirectos  de  WOM  en  ganado.  redes  sociales,  
métricas  de  mentalidad  y  ventas,  dando  cuenta  de  la  endogeneidad   En  una  organización  como  Netflix,  en  la  que  el  análisis  está  
de  las  acciones  de  marketing  y  el  ROI  computacional.  Esto  requiere   completamente  centralizado,  las  iniciativas  se  generan,  priorizan,  
modelos  a  gran  escala  con  una  estructura  de  series  de  tiempo  y   coordinan  y  supervisan  en  la  sala  de  juntas.  A  pesar  del  tremendo  
multitud  de  efectos  directos  e  indirectos.  Dichos  modelos  deben  ser   éxito  de  Netflix,  la  naturaleza  altamente  especializada  del  análisis  de  
completos  y  permitir  la  atribución  y  la  cuantificación  de  los  remanentes   marketing,  que  varía  drásticamente  entre  los  dominios  de  marketing,  
y  efectos  indirectos  entre  estas  clases  de  medios  y  vehículos.   exige  con  frecuencia  una  infraestructura  descentralizada  o  híbrida.  
Necesitan  acomodar  diferentes  niveles  de  granularidad  temporal  y   Esto  proporciona  la  flexibilidad  necesaria  para  la  experimentación  y  
espacial  y  niveles  de  agregación  de  clientes.  Además,  los  estudios   la  innovación  rápidas  y  es  más  propicio  para  una  implementación  ágil  
actuales  sobre  modelos  de  atribución  solo  han  arañado  la  superficie   y  eficaz  de  análisis  para  una  amplia  variedad  de  problemas  de  
de  la  información  disponible  sobre  los  toques  de  los  clientes  en  sitios   marketing.  Una  organización  descentralizada  facilita  la  colaboración  
web,  anuncios  gráficos,  anuncios  de  búsqueda,  etc.  porque  codifican   interfuncional  y  la  cocreación  a  través  de  la  comunicación  de  analistas  
cada  punto  de  contacto  en  una  sola  dimensión.  Cada  punto  de   y  gerentes  de  marketing  en  la  empresa.  Permite  a  los  analistas  
contacto  se  puede  describir  con  múltiples  variables.  Por  ejemplo,  un   identificar  nuevas  fuentes  de  datos  relevantes  y  oportunidades  de  
sitio  web  tiene  una  colección  asociada  de  metadatos  que  describen   análisis  y,  junto  con  los  gerentes  de  marketing,  les  permite  adaptar  
el  diseño,  el  contenido  y  el  diseño  del  sitio  web,  las  ubicaciones  de   sus  modelos  y  algoritmos  a  las  demandas  específicas  de  los  
anuncios,  etc.,  todo  lo  cual  podría  afectar  el  comportamiento  de  los   problemas  de  marketing.  Sin  embargo,  esta  estructura  organizacional  
clientes  cuando  visitan  el  sitio  web.  La  literatura  de  marketing  existente   requiere  capacidades  analíticas  distribuidas  profundas  y  un
ha  abordado  algunos  de  estos  problemas,  aunque

Análisis  de  marketing  para  entornos  ricos  en  datos /  115
Machine Translated by Google

énfasis  en  la  colaboración.  AT&T  se  encuentra  entre  las  empresas   soluciones  para  ganar  eficiencia  y  economías  de  escala  en  equipos  
que  siguen  este  modelo  al  alojar  análisis  de  datos  dentro  de  sus   de  análisis  descentralizados.
unidades  comerciales. En  resumen,  las  organizaciones  que  buscan  extraer  valor  del  
Uno  de  los  principales  desafíos  de  la  descentralización  es  lograr   análisis  de  big  data  deben  tener  (1)  una  cultura  y  líderes  que  
una  masa  crítica  de  analistas  que  permita  el  desarrollo  continuo  de   reconozcan  la  importancia  de  los  datos,  el  análisis  y  la  toma  de  
una  experiencia  amplia  y  profunda  en  toda  la  organización  y  una   decisiones  basada  en  datos;  (2)  una  estructura  de  gobierno  que  evite  
respuesta  rápida  y  flexible  a  los  problemas  emergentes,  sin  gastos   los  silos  y  facilite  la  integración  de  datos  y  análisis  en  la  estrategia  y  
generales  ni  burocracia  excesivos.  Por  lo  tanto,  un  modelo   los  procesos  generales  de  la  organización  de  tal  manera  que  se  
organizacional  híbrido  suele  ser  efectivo.  Aquí,  una  unidad   genere  valor  para  la  empresa;  y  (3)  una  masa  crítica  de  analistas  de  
centralizada  es  responsable  de  la  tecnología  de  la  información  y  el   marketing  que,  en  conjunto,  tengan  una  experiencia  lo  suficientemente  
software,  así  como  de  la  creación  y  el  mantenimiento  de  las  bases  de  datos.profunda  en  análisis,  así  como  conocimientos  sustantivos  de  
Los  analistas  de  marketing  pueden  aprovechar  la  experiencia  de   marketing.  Casi  todas  las  empresas  se  enfrentan  actualmente  al  
dicha  unidad  central  cuando  sea  necesario.  Google  adopta  este   desafío  de  contratar  al  talento  adecuado  para  lograrlo.  Una  amplia  
enfoque,  mediante  el  cual  las  unidades  comerciales  toman  sus   oferta  de  analistas  de  marketing  con  un  conjunto  de  habilidades  
propias  decisiones  pero  colaboran  con  una  unidad  central  en   multifuncionales;  competencia  en  tecnología,  ciencia  de  datos  y  
iniciativas  seleccionadas.  En  algunos  casos,  especialmente  para  las   análisis;  y  se  necesita  con  urgencia  experiencia  actualizada  en  el  
empresas  más  pequeñas  y  las  que  están  al  comienzo  de  la  curva  de   dominio,  al  igual  que  personas  con  habilidades  de  gestión  y  
aprendizaje,  la  subcontratación  de  una  o  más  de  estas  funciones   conocimiento  de  la  estrategia  comercial  para  armar  y  liderar  esos  
centralizadas  es  una  opción  viable  y  rentable. equipos.  Reflexionamos  sobre  las  implicaciones  para  la  educación  
Llevando  el  papel  de  la  unidad  centralizada  un  paso  más  allá   empresarial  en  la  sección  final  de  este  artículo.
están  las  organizaciones  que  forman  un  centro  de  excelencia  (CoE)  
de  big  data  independiente  dentro  de  la  empresa,  supervisado  por  un  
Conclusión:  implicaciones  para  la  educación  Este  
director  de  análisis.  El  departamento  de  marketing  y  otras  unidades  
artículo  ha  revisado  
persiguen  iniciativas  supervisadas  por  el  CoE.  Amazon  y  LinkedIn  
son  dos  empresas  que  emplean  un  CoE,  y  este  modelo  parece  ser   la  historia  de  los  datos  y  el  análisis;  destacó  los  desarrollos  recientes  
el  más  adoptado  por  las  empresas  de  big  data.  Proporciona  sinergias   en  los  dominios  clave  de  marketing  mix,  personalización,  privacidad  
y  economías  de  escala  porque  facilita  el  intercambio  de  datos  y   y  seguridad;  e  identificó  posibles  barreras  organizacionales  y  
soluciones  entre  las  unidades  de  negocio  y  apoya  y  coordina  sus   oportunidades  hacia  la  implementación  exitosa  de  análisis  de  datos  
iniciativas.  Un  problema  de  la  gestión  de  los  presupuestos  de   de  marketing  enriquecidos  en  las  empresas.  La  Tabla  1  resume  el  
marketing  es  el  efecto  "silo".  A  menudo,  en  las  grandes  organizaciones   estado  del  campo  y  la  Tabla  2  resume  las  futuras  prioridades  de  
de  marketing,  las  inversiones  en  cada  uno  de  los  instrumentos  de   investigación.  En  esta  sección,  completamos  nuestro  discurso  con  
marketing  (p.  ej.,  creación  de  marca,  marketing  de  búsqueda,   una  discusión  de  las  implicaciones  para  el  conjunto  de  habilidades  
marketing  por  correo  electrónico)  las  gestionan  diferentes  equipos   requeridas  para  los  analistas.
con  sus  propios  presupuestos.  Esto  puede  llevar  a  que  cada  silo   En  el  entorno  emergente  de  big  data,  los  analistas  de  marketing  
intente  optimizar  su  propio  gasto  sin  tener  una  visión  más  global.   trabajarán  cada  vez  más  en  la  interfaz  de  estadísticas/econometría,  
Con  un  mayor  enfoque  en  las  comunicaciones  de  marketing   informática  y  marketing.  Su  conjunto  de  habilidades  deberá  ser  
integradas,  el  marketing  multicanal  y  la  influencia  en  todo  el  proceso   amplio  y  profundo.  Esto  plantea  desafíos  obvios  que  se  ven  
de  compra,  la  función  de  análisis  de  datos  reside  mejor  en  una  unidad   agravados  por  el  hecho  de  que  varios  subdominios  de  marketing  (por  
central  o  CoE,  lo  que  evita  el  efecto  de  silo  al  adoptar  una  visión  más   ejemplo,  publicidad,  promociones,  desarrollo  de  productos,  marca)  
global  de  los  presupuestos  de  marketing  con  informes  directos  a  el   tienen  diferentes  requisitos  de  datos  y  análisis,  y  las  soluciones  
director  de  marketing. analíticas  de  talla  única  no  son  ni  deseables  ni  probables.  ser  
Sin  embargo,  incluso  una  infraestructura  de  análisis   efectivo.  Por  lo  tanto,  los  analistas  deben  tener  un  conocimiento  
descentralizada  o  híbrida  no  excluye  la  necesidad  de  una  gobernanza   suficientemente  profundo  de  las  técnicas  de  modelado  de  marketing  
de  datos  y  análisis.  Las  funciones  de  gobierno  analítico,  que  residen   para  predecir  la  respuesta  de  marketing,  la  optimización  de  la  
en  unidades  centralizadas  o  CoE,  priorizan  oportunidades,  obtienen   combinación  de  marketing  y  la  personalización.
recursos,  garantizan  el  acceso  a  datos  y  software,  facilitan  la   Deben  estar  bien  versados  en  la  aplicación  de  técnicas  de  estimación,  
implementación  de  modelos,  desarrollan  la  experiencia  necesaria,   como  los  métodos  de  máxima  verosimilitud,  las  técnicas  Bayesianas  
aseguran  la  responsabilidad  y  coordinan  el  esfuerzo  del  equipo.  Los   MCMC  y  los  métodos  de  aprendizaje  automático,  así  como  estar  
equipos  en  cuestión  incluyen  (1)  funciones  de  marketing  y  gestión,   familiarizados  con  las  técnicas  de  optimización  de  OR.  Además,  
que  identifican  y  priorizan  oportunidades  e  implementan  soluciones  y   deben  poseer  habilidades  blandas  y  conocimientos  sustantivos  de  
decisiones  basadas  en  datos;  (2)  ingenieros  de  análisis,  que   vanguardia  en  marketing  para  garantizar  que  puedan  comunicar  a  
determinan  las  necesidades  de  datos,  software  y  análisis;  organizar   los  responsables  de  la  toma  de  decisiones  la  capacidad  y  las  
aplicaciones  y  procesos;  y  documentar  estándares  y  mejores   limitaciones  de  los  modelos  analíticos  para  fines  de  marketing  
prácticas;  (3)  funciones  de  gestión  de  datos  y  ciencia  de  datos,  que   específicos.  Esto  maximizará  el  apoyo  y  el  impacto  de  sus  
garantizan  que  los  datos  sean  precisos,  actualizados,  completos  y   recomendaciones  de  decisión.  En  muchas  organizaciones,  los  
coherentes;  y  (4)  funciones  legales  y  de  cumplimiento,  que  supervisan   analistas  de  marketing  desempeñarán  el  papel  de  intermediarios  
la  seguridad  de  los  datos,  las  políticas  de  privacidad  y  el   entre  los  gerentes  de  marketing  y  el  personal  de  tecnología  de  la  
cumplimiento.  El  director  de  análisis  puede  promover  el  desarrollo  de   información,  o  entre  los  gerentes  de  marketing  y  los  proveedores  
procesos  repetibles  y externos  de  datos  y  capacidades  analíticas,  para  lo  cual  deben  tener  suficiente  conoc

116 /  Journal  of  Marketing:  edición  especial  de  AMA/MSI,  noviembre  de  2016
Machine Translated by Google

ambas  áreas.  Cada  vez  más,  los  procesos  y  decisiones  de  marketing   Las  empresas  deben  invertir  sistemáticamente  en  la  capacitación  y  
rutinarios  se  están  automatizando.  Esto  crea  el  desafío  de  determinar  cómo   educación  de  los  empleados  actuales  y  contratar  nuevos  con  un  conjunto  
basar  estas  decisiones  automatizadas  en  el  conocimiento  sustantivo,  así   de  habilidades  actualizado  para  cubrir  nichos  específicos  en  sus  equipos.  
como  en  la  intuición  y  la  supervisión  gerenciales.  Los  futuros  vendedores   Wal­Mart,  por  ejemplo,  organiza  su  propia  conferencia  anual  de  análisis  con  
deben  estar  bien  equipados  para  hacer  eso.  Finalmente,  el  campo  necesitará   cientos  de  participantes  y  utiliza  el  crowdsourcing  para  atraer  nuevos  
personas  con  habilidades  de  gestión  y  conocimiento  de  la  estrategia   talentos.
comercial,  así  como  suficiente  familiaridad  con  la  tecnología  y  el  análisis   La  formación  y  educación  de  los  analistas  de  marketing  para  desarrollar  
para  supervisar  y  administrar  equipos  y  unidades  comerciales.  Un  estudio   este  amplio  y  profundo  conjunto  de  habilidades  plantea  un  desafío  para  el  
reciente  de  la  firma  de  investigación  Gartner  reveló  que  los  líderes   mundo  académico.  En  muchos  casos,  las  personas  que  provienen  
empresariales  creen  que  la  dificultad  de  encontrar  talento  con  estas   directamente  de  programas  de  matemáticas,  estadística,  econometría  o  
habilidades  es  la  principal  barrera  para  implementar  el  análisis  de  big  data   ciencias  de  la  computación  pueden  no  convertirse  en  analistas  de  marketing  
(Levy  2015). efectivos  y  exitosos.  En  cambio,  además  de  las  especializaciones  existentes  
en  programas  exitosos  de  pregrado  y  maestría  en  administración  de  
Estos  requisitos  de  conjunto  de  habilidades  también  presentan  un   empresas  en  muchas  universidades,  los  programas  de  maestría  
desafío  para  los  educadores;  Pocas  personas  podrán  desarrollar  un   recientemente  creados  en  análisis  de  marketing  en  instituciones  como  la  
conocimiento  profundo  en  todas  estas  áreas  al  principio  de  su  carrera.  En   Universidad  de  Maryland  y  la  Universidad  de  Rochester  se  enfocan  en  
las  organizaciones,  estos  conjuntos  de  habilidades  se  cultivan  con  mayor   desarrollar  estos  conjuntos  de  habilidades  multidisciplinarias  en  estudiantes  
frecuencia  a  través  de  la  capacitación  en  el  trabajo  y  el  esfuerzo  colectivo   que  ya  tener  una  formación  rigurosa  en  estas  disciplinas  básicas.  Se  
del  equipo.  Algunos  estudiantes  de  análisis  pueden  especializarse  y   necesitan  con  urgencia  programas  similares  y  se  están  desarrollando  en  
desarrollar  una  gran  experiencia  en  marketing  sustantivo,  habilidades   otros  lugares  para  satisfacer  la  creciente  demanda  de  analistas  de  marketing  
blandas  y  administración,  de  modo  que  puedan  asumir  puestos  gerenciales   en  todo  el  mundo.  Además,  es  posible  que  nuestro  campo  deba  adoptar  el  
y  supervisar  a  los  analistas,  negociar  con  proveedores  externos  de  análisis   modelo  de  las  disciplinas  de  las  matemáticas  y  las  ciencias  de  la  computación  
y  ayudar  a  formular  problemas  e  interpretar  y  comunicar  resultados. para  educar  a  los  estudiantes  de  doctorado  únicamente  para  las  funciones  de  la  industria  (Sud
En  el  otro  extremo  del  espectro  están  aquellos  que  aspiran  a  ser  ingenieros   Finalmente,  enfatizamos  las  oportunidades  para  la  fertilización  cruzada  
de  análisis  de  marketing  o  científicos  de  datos  y  trabajan  para  desarrollar  un   del  talento  de  la  academia  y  la  industria;  por  ejemplo,  los  profesionales  
conocimiento  profundo  de  los  aspectos  técnicos  del  campo,  incluida  la   pueden  beneficiarse  de  clases  especializadas  desarrolladas  por  
gestión  de  bases  de  datos,  la  programación  y  el  modelado  estadístico/ universidades,  y  los  académicos  pueden  pasar  tiempo  dentro  de  las  
econométrico.  Cada  uno  de  esos  especialistas  en  marketing  tendrá  un  papel   empresas  para  estar  expuestos  a  problemas  y  datos  actuales.  Tales  
que  desempeñar  en  los  equipos  de  análisis  de  las  organizaciones.  Todos   oportunidades  son  cada  vez  más  comunes  y  beneficiarán  significativamente  
aquellos  que  trabajan  en  el  campo  deberán  continuar  actualizando  sus   al  campo  en  el  futuro  cercano,  ya  que  el  análisis  de  big  data  continuará  
conocimientos  en  un  amplio  dominio,  a  través  de  conferencias  y   desafiando  e  inspirando  a  académicos  y  profesionales  por  igual.
capacitaciones,  para  mantenerse  al  tanto  de  la  ola  de  nuevos  desarrollos.

REFERENCIAS  
¨
Adiguzel,  Feray  y  Michel  Wedel  (2008),  “Diseño  de  cuestionario   Banko,  Michele  y  Eric  Brill  (2001).  "Escalado  a  cuerpos  muy,  muy  grandes  para  
dividido  para  encuestas  masivas”,  Journal  of  Marketing   la  desambiguación  del  lenguaje  natural",  en  Actas  de  la  39.ª  reunión  anual  
Research,  45  (octubre),  608–17. de  la  Asociación  de  lingüística  computacional.  Toulouse,  Francia:  Asociación  
Ailawadi,  Kusum  L.,  Jie  Zhang,  Aradhna  Krishna  y  Michael  Kruger  (2010),  "When   de  Lingüística  Computacional,  26–33.
Wal­Mart  Enters:  How  Incumbent  Retailers  React  and  How  Affects  Their  
Sales  Outcomes",  Journal  of  Marketing  Research,  47  (agosto),  577  –93. Bartels,  Robert  (1988),  La  historia  del  pensamiento  de  marketing,  3ª  ed.

¨ Columbus,  OH:  Horizontes  editoriales.
Albers,  Sonke  (2012),  "Modelado  de  respuesta  agregada  optimizable  e   Bass,  Frank  (1969),  “Un  nuevo  crecimiento  de  productos  para  bienes  duraderos  
implementable  para  el  soporte  de  decisiones  de  marketing",  International   de  consumo  modelo”,  Management  Science,  15  (5),  215–27.
Journal  of  Research  in  Marketing,  29  (2),  111–22. Berger,  James  O.  (1985),  Teoría  de  la  decisión  estadística  y  análisis  bayesiano.  
Allenby,  Greg,  Eric  Bradlow,  Edward  George,  Joh  Liechty  y  Robert  McCulloch   Nueva  York:  Springer­Verlag.
(2014),  "Perspectivas  sobre  métodos  bayesianos  y  macrodatos",  Customer   Berry,  Steven,  James  Levinsohn  y  Ariel  Pakes  (1995),  “Precios  de  automóviles  
Needs  and  Solution,  1  (3),  169–75. en  equilibrio  de  mercado”,  Econometrica,  63  (4),  841–90.
Andrews,  Michelle,  Xueming  Luo,  Zeng  Fang  y  Anindya  Ghose  (2015),  "Eficacia   Bijmolt,  Tammo  HA,  Harald  J.  van  Heerde,  Rik  GM  Pieters  (2005),  “Nuevas  
de  los  anuncios  móviles:  Orientación  hipercontextual  con  multitud",  Marketing   generalizaciones  empíricas  sobre  los  determinantes  de  la  elasticidad  de  los  
Science,  35  (2),  218–33. precios”,  Journal  of  Marketing  Research,  42  (mayo),  141–56.
Andrews,  Rick  L.,  Andrew  Ainslie  e  Imran  S.  Currim  (2002),  “Una  comparación   Bodapati,  Anand  (2008),  "Sistemas  de  recomendación  con  datos  de  compra",  
empírica  de  modelos  de  elección  logit  con  representaciones  discretas   Journal  of  Marketing  Research,  45  (febrero),  77–93.
versus  continuas  de  heterogeneidad”, Bradlow,  Eric  T.,  Bruce  GS  Hardie  y  Peter  S.  Fader  (2002),  "Inferencia  bayesiana  
Journal  of  Marketing  Research,  39  (noviembre),  479–87. para  la  distribución  binomial  negativa  a  través  de  expansiones  polinómicas",  
Ansari,  Asim,  Skander  Essegaier  y  Rajeev  Kohli  (2000),  "Sistemas  de   Journal  of  Computational  and  Graphical  Statistics,  11  (1),  189–201.
recomendación  de  Internet",  Journal  of  Marketing  Research,  37  (agosto),  
363–75. Braun,  Michael  y  Paul  Damien  (2015),  “Muestreo  de  rechazo  escalable  para  
———  y  Carl  F.  Mela  (2003),  “E­Customization”,  Journal  of  Marketing  Research,   modelos  jerárquicos  bayesianos”,  Marketing  Science,  35  (3),  427–44.
40  (mayo),  131–45.

Análisis  de  marketing  para  entornos  ricos  en  datos /  117
Machine Translated by Google

———  y  Jon  McAuliffe  (2010),  “Inferencia  variacional  para  modelos  a  gran   Dwoskin,  Elizabeth  (2015),  “EU  Seeks  to  Tighten  Data  Privacy  Laws”,  The  
escala  de  elección  discreta”,  Journal  of  the  American  Statistical   Wall  Street  Journal,  (15  de  marzo),  [disponible  en  http://blogs.wsj.com/
Association,  105  (489),  324–35. digits/2015/03/10/eu­  busca­ajustar­las­  leyes­de­privacidad­de­datos/].
Brockwell,  Anthony  E.  y  Joseph  B.  Kadane  (2005),  "Identi  fication  of  
Regeneration  Times  in  MCMC  Simulation,  with  Application  to  Adaptive   Ebbes,  Peter,  Zan  Huang  y  Arvind  Rangaswamy  (2015),  “Sampling  Designs  
Schemes",  Journal  of  Computational  and  Graphical  Statistics,  14  (2),  436– for  Recovering  Local  and  Global  Char  acteristics  of  Social  Networks”,  
58. International  Journal  of  Research  in  Marketing,  (disponible  electrónicamente  
´
Bronnenberg,  Bart  J.,  Jean­Pierre  Dube  y  Matthew  Gentzkow  (2012),  "La   el  19  de  noviembre),  [DOI:  10.1016/j.  ijresmar.2015.09.009].
evolución  de  las  preferencias  de  marca:  evidencia  de  la  migración  del  
consumidor",  American  Economic  Review,  102  (6),  2472–508. ———,  Dominique  Papies  y  Harald  Van  Heerde  (2011),  “El  sentido  y  el  
sinsentido  de  la  validación  de  muestras  de  exclusión  en  presencia  de  
Bult,  Jan­Roelf  y  Tom  Wansbeek  (1995),  “Selección  óptima  para  correo   endogeneidad”,  Marketing  Science,  30  (6),  1115–22.
¨
directo”,  Marketing  Science,  14  (4),  378–94. ———, Michel  Wedel,  Ulf  Bockenholt  y  Ton  Steerneman  (2005),  “Resolving  
Campbell,  James,  Avi  Goldfarb  y  Catherine  Tucker  (2015),  “Regulación  de  la   and  Testing  for  Regressor­Error  (In)Depend  ence  When  No  Instrumental  
privacidad  y  estructura  del  mercado”,  Journal  of  Economics  &   Variables  Are  Available:  With  New  Evidence  for  the  Effect  of  Education  
Management  Strategy,  24  (1),  47–73. on  Income”,  Quantitative  Marketing  and  Economics,  3  (4),  365–92.
Casher,  Jonathan  D.  (1969),  Marketing  y  la  computadora.  Boston:  
Publicaciones  de  DH  Mark. Elrod,  Terry  (1988),  “Mapa  de  elección:  Inferir  un  mapa  de  producto­mercado  
Chevalier,  Judith  A.  y  Dina  Mayzlin  (2006),  "El  efecto  del  boca  a  boca  en  las   a  partir  de  datos  de  panel”,  Marketing  Science,  7  (1),  21–40.
¨
ventas:  reseñas  de  libros  en  línea",  Journal  of  Marketing  Research,  43   Erdem,  Tulin  y  Michael  P.  Keane  (1996),  “Toma  de  decisiones  en  condiciones  
(agosto),  345–54. de  incertidumbre:  captura  de  procesos  dinámicos  de  elección  de  marca  
Chintagunta,  Pradeep  (2002),  “Investigating  Category  Pricing  Behavior  in  a   en  mercados  de  bienes  de  consumo  turbulentos”,  Marketing  Science,  15  
Retail  Chain”,  Journal  of  Marketing  Research,  39  (mayo),  141–54. (1),  1–21.
Everson,  Philip  J.  y  Eric  T.  Bradlow  (2002),  "Inferencia  bayesiana  para  la  
¨
———, Tulin  Erdem,  Peter  E.  Rossi  y  Michel  Wedel  (2006),  “Modelado   distribución  beta­binomial  a  través  de  expansiones  polinómicas"
estructural  en  marketing:  revisión  y  evaluación”, Revista  de  Estadística  Computacional  y  Gráfica,  11  (1),  202–07.
Ciencias  del  marketing,  25  (6),  604–16.
Chung,  Doug  J.,  Thomas  Steenburgh  y  K.  Sudhir  (2014),  “¿Mejoran  las   Fader,  Peter  y  Bruce  Hardie  (2009),  "Modelos  de  probabilidad  para  el  análisis  
bonificaciones  la  productividad  de  las  ventas?  Un  análisis  estructural   de  la  base  de  clientes",  Journal  of  Interactive  Marketing,  23  (1),  61–69.
dinámico  de  los  planes  de  compensación  basados  en  bonos”,  Marketing  
Science,  33  (2),  165–87. Feit,  Eleanor,  Pengyuan  Wang,  Eric  T.  Bradlow  y  Peter  S.  Fader  (2013),  
Chung,  Tuck­Siong,  Roland  T.  Rust  y  Michel  Wedel  (2009),  "Mi  música  móvil:   "Fusing  Aggregate  and  Disgregate  Data  with  an  Application  to  Multiplatform  
un  sistema  de  personalización  adaptable  para  reproductores  de  audio   Media  Conquisition",  Journal  of  Marketing  Research,  50  (junio),  348–64.
digital",  Marketing  Science,  28  (1),  52–68.
Coombs,  Clyde  (1950),  “Escala  psicológica  sin  unidad  de  medida”,   Ferber,  Robert  (1949),  Técnicas  estadísticas  en  investigación  de  mercados.
Psychological  Review,  57,  148–58. Nueva  York:  McGraw­Hill.
¨
Danaher,  Peter  J.,  Michael  S.  Smith,  Kulan  A.  Ranasinghe  y  Tracey  S.   Fischer,  Marc,  Sonke  Albers,  Nils  Wagner  y  Monika  Frie  (2011),  “Practice  
Danaher  (2015),  "Dónde,  cuándo  y  cuánto  tiempo:  factores  que  influyen   Prize  Winner—Dynamic  Marketing  Budget  Allocation  Across  Countries,  
en  el  canje  de  cupones  para  teléfonos  móviles",  Journal  of  Marketing   Products,  and  Marketing  Activities”,  Marketing  Science,  30  (4),  568–85.
Research,  52  (octubre),  710–25.
Fong,  Nathan  M.,  Zheng  Fang  y  Xueming  Luo  (2015),  "Geo  Conquesting:  
Davenport,  Thomas  H.  (2006),  "Competir  en  análisis",  Harvard Competitive  Locational  Targeting  of  Mobile  Promotions",  Journal  of  
Business  Review,  (enero),  99–107. Marketing  Research,  52  (octubre),  726–35.
DeKimpe,  Marnik  G.  y  Dominique  M.  Hanssens  (1995),  “La  persistencia  de  
los  efectos  del  marketing  en  las  ventas”,  Marketing  Science,  14  (1),  1–21. Gatignon,  Hubert  (1993),  “Marketing  Mix  Models”,  en  Handbooks  in  Operations  
Research  and  Management  Science,  vol.  5:  Marketing,  J.  Eliashherg  y  
DeSarbo,  Wayne  S.  y  Vithala  Rao  (1986),  “Una  metodología  de  despliegue   GL  Lilien,  eds.  Ámsterdam:  Norte,  697–732.
restringido  para  el  posicionamiento  de  productos”,  Marketing  Science,  5  
(1),  1–19. Gelman,  Andrew,  John  B.  Carlin,  Hal  S.  Stern  y  Donald  B.  Rubin  (2003),  
Dew,  Ryan  y  Asim  Ansari  (2015),  “Un  marco  semiparamétrico  bayesiano   Análisis  de  datos  bayesianos.  Londres:  Chapman  and  Hall.
´
para  comprender  y  predecir  la  dinámica  de  la  base  de  clientes”,   Geman,  Stuart,  Elie  Bienenstock  y  Rene  Doursat  (1992),  “Neural
documento  de  trabajo,  Universidad  de  Columbia. Networks  and  the  Bias/Variance  Dilemma”,  Neural  Computation,  4  (1),  
Dorfman,  Robert  y  Peter  O.  Steiner  (1954),  “Publicidad  óptima  y  calidad   1–58.
óptima”,  American  Economic  Review,  44  (5),  826–36. Genkin,  Alexander,  David  D.  Lewis  y  David  Madigan  (2007),  “Regresión  
logística  bayesiana  a  gran  escala  para  la  categorización  del  texto”,  
Du,  Rex  Yuxing  y  Wagner  A.  Kamakura  (2012),  “Detección  cuantitativa  de   Technometrics,  49  (3),  291–304.
tendencias”,  Journal  of  Marketing  Research,  49  (agosto),  514–36. Gilula,  Zvi,  Robert  E.  McCulloch  y  Peter  E.  Rossi  (2006),  “A  Direct  Approach  
to  Data  Fusion”,  Journal  of  Marketing  Research,  43  (febrero),  73–83.
Duncan,  CS  (1919),  Investigación  comercial.  Nueva  York:  Mc  Millan  Co.
Dupre,  Elyse  (2015),  “Privacy  and  Security  Remain  Tall  Orders   Godes,  David  y  Dina  Mayzlin  (2004),  “Uso  de  conversaciones  en  línea  para  
for  Today's  Marketers”,  Direct  Marketing  News,  (23  de  enero),   estudiar  la  comunicación  de  boca  en  boca”,  Marketing  Science,  23  (4),  
[disponible  en  http://www.dmnews.com/infographics/privacy   545–60.
and­security­remain­  tall­orders­for­todays­marketers­ Goldfarb,  Avi  y  Catherine  Tucker  (2010),  “Regulación  de  la  privacidad  y  
infographic/  article/393980/]. publicidad  en  línea”,  Management  Science,  57  (1),  57–71.

118 /  Journal  of  Marketing:  edición  especial  de  AMA/MSI,  noviembre  de  2016
Machine Translated by Google

Goldgar,  David  E.  (2001),  "17  principales  fortalezas  y  debilidades  de  los  métodos   ———  y  ———  (1997),  “Fusión  de  datos  estadísticos  para  tabulación  cruzada”,  
sin  modelos",  Advances  in  Genetics,  42,  241–51. Journal  of  Marketing  Research,  34  (noviembre),  485–98.
Green,  Paul  E.  (1963),  "Teoría  de  la  decisión  bayesiana  en  la  estrategia  de  
precios",  Journal  of  Marketing,  27  (enero),  5–14. Kannan,  PK  y  Gordon  P.  Wright  (1991),  "Modelado  y  prueba  de  mercados  
———  (1969),  "Escalamiento  multidimensional:  una  introducción  y  comparación   estructurados:  un  enfoque  logit  anidado",  Marketing  Science,  10  (1),  58–82.
de  técnicas  de  desarrollo  no  métricas",  Journal  of  Marketing  Research,  6  
(agosto),  330–41.  ———  y  V.  Srinivasan  (1978),   Khan,  Romana,  Michael  Lewis  y  Vishal  Singh  (2009),  “Gestión  dinámica  de  
“Conjoint  Analysis  in  Consumer  Research:  Issues  and  Outlook”,  Journal  of   clientes  y  el  valor  del  marketing  uno  a  uno”,  Marketing  Science,  28  (6),  
Consumer  Research,  5  (2),  103–23. 1063–79.
Landwehr,  Jan  R.,  Aparna  A.  Labroo  y  Andreas  Herrmann  (2011),  "Gut  Gut  for  
Grossman,  Robert  L.  y  Kevin  P.  Siegel  (2014),  "Modelos  organizacionales  para   the  Ordinary:  Incorporating  Design  Fluency  Improves  Automobile  Sales  
Big  Data  y  análisis",  Journal  of  Organization  Design,  3  (1),  20–25. Forecasts",  Marketing  Science,  30  (3),  416–29.

Guadagni,  Peter  M.  y  John  DC  Little  (1983),  “Un  modelo  logit  de  elección  de   Lee,  TY  y  Eric  T.  Bradlow  (2011),  "Construcción  automática  de  atributos  y  niveles  
marca  calibrado  con  datos  de  escáner”,  Marketing  Science,  2  (3),  203–38. conjuntos  a  partir  de  reseñas  de  clientes  en  línea",
Journal  of  Marketing  Research,  48  (octubre),  881–94.
Gupta,  Sunil  (1988),  “Impacto  de  las  promociones  de  ventas  sobre  cuándo,  qué   Leeflang,  Peter  SH,  Dick  R.  Wittink,  Michel  Wedel  y  Alan  Bultez  (2000),  Modelos  
y  cuánto  comprar”,  Journal  of  Marketing  Research,  25  (noviembre),  342–55. de  construcción  para  decisiones  de  marketing.
Boston:  Editores  académicos  de  Kluwer.
Hagen,  Christian  y  Khalid  Khan  (2014),  “Building  an  Analytics  Based   Levy,  Heather  Pemberton  (2015),  “Marketers  Embrace  Analytics  and  Look  for  
Organization”,  informe  de  investigación,  AT  Kearney,  (consultado  el  1  de   Talent”,  Gartner.com,  (9  de  septiembre),  (consultado  el  19  de  julio  de  2016),  
enero  de  2016),  [disponible  en  http://www.africa.atkearney.com/documents/ [disponible  en  http://www.gartner.com/smarterwithgartner/  los  especialistas  
10192 /6978675/Building+an+Analytics­Based+  Organization.pdf/67d6181d­ en  marketing  adoptan  la  analítica  y  buscan  talento].
ab7e­40ce­ae4a­7bd92991bf76]. Li,  Hongshuang  (Alice)  y  PK  Kannan  (2014),  "Atribuir  conversiones  en  un  entorno  
Hanssens,  Dominique  M.  (2014),  “Modelos  econométricos”,  en  The  History  of   de  marketing  en  línea  multicanal:  un  modelo  empírico  y  un  experimento  de  
Marketing  Science,  Russell  S.  Winer  y  Scott  A.  Neslin,  eds.  Singapur:  World   campo",  Journal  of  Marketing  Research,  51  (febrero),  40–56.
Scientific  Publishing,  99–128.
———, Leonard  J.  Parsons  y  Randall  L.  Schultz  (2001),  Modelos  de  respuesta   Liaukonyte,  Jura,  Thales  Teixeira  y  Kenneth  C.  Wilbur  (2015),  "Publicidad  
del  mercado:  análisis  económico  y  de  series  temporales.  Boston:  Editores   televisiva  y  compras  en  línea",  Marketing  Science,  34  (3),  311–30.
académicos  de  Kluwer.
———, Koen  H.  Pauwels,  Shuba  Srinivasan,  Marc  Vanhuele  y Lilien,  Gary  L.  y  Arvind  Rangaswamy  (2006),  Ingeniería  de  marketing:  
Gokhan  Yildirim  (2014),  "Métricas  de  actitud  del  consumidor  para  guiar  las   Planificación  y  análisis  asistidos  por  computadora,  Plataforma  de  publicación  
decisiones  de  mezcla  de  marketing",  Marketing  Science,  33  (4),  534–50. independiente  CreateSpace.
Little,  John  DC  (1970),  "Modelos  y  gerentes:  el  concepto  de  un  cálculo  de  
Hartmann,  Wesley,  Harikesh  S.  Nair  y  Sridhar  Narayanan  (2011),  "Identificación   decisiones",  Management  Science,  16  (8),  B­466–485.  ———  y  Len  M.  
de  los  efectos  causales  de  la  combinación  de  marketing  mediante  un  diseño   Lodish  (1969),  “Un  cálculo  de  planificación  de  medios”,
de  discontinuidad  de  regresión",  Marketing  Science,  30  (6),  1079–97. Investigación  de  operaciones,  17  (1),  1–35.
Liu,  Xiao,  Alan  Montgomery  y  Kannan  Srinivasan  (2015),  “Overhaul  Overdraft  
Hastie,  Trevor,  Robert  Tibshirani  y  Jerome  Friedman  (2008),  Los  elementos  del   Fees:  Creating  Pricing  and  Product  Design  Strategies  with  Big  Data”,  
aprendizaje  estadístico:  minería  de  datos,  inferencia  y  predicción.  Nueva   documento  de  trabajo,  Carnegie  Mellon  University.
York:  Springer.
Hauser,  John  R.,  Glen  L.  Urban,  Guilherme  Liberali  y  Michael  Braun  (2009),   Lodish,  Leonard  M.  (1971),  "CALLPLAN:  Sistema  de  planificación  de  llamadas  
“Website  Morphing”,  Marketing  Science,  28  (2),  202–23. de  un  vendedor  interactivo",  Management  Science,  18,  P­25–40.
´
Louviere,  Jordan  J.  y  George  Woodworth  (1983),  “Diseño  y  análisis  de  
Hinton,  Geoffrey  (2007),  “Aprendizaje  de  múltiples  capas  de  representación”,   experimentos  simulados  de  elección  o  asignación  del  consumidor:  un  
Trends  in  Cognitive  Sciences,  11  (10),  428–34. enfoque  basado  en  datos  agregados”,  Journal  of  Marketing  Research,  20  
Hui,  Sam  K.,  J.  Jeffrey  Inman,  Yanliu  Huang  y  Jacob  Suher  (2013),  "El  efecto  de   (noviembre),  350–67.
la  distancia  de  viaje  en  la  tienda  sobre  el  gasto  no  planificado:  aplicaciones   Luce,  R.  Duncan  y  John  W.  Tukey  (1964),  "Medición  conjunta  simultánea:  un  
a  las  estrategias  de  promoción  móvil" nuevo  tipo  de  escala  de  medición  fundamental",  Journal  of  Mathematical  
Journal  of  Marketing,  77  (marzo),  1–16. Psychology,  1  (1),  1–27.
Johnson,  Garrett  A.,  Randall  A.  Lewis  y  Elmar  I.  Nubbemeyer  
(2015)  disponible  en  http://papers.ssrn.  com/sol3/papers.cfm? Mantrala,  Murali  K.,  Prabhakant  Sinha  y  Andris  A.  Zoltners  (1994),  "Estructuración  
abstract_id=2620078]. de  un  plan  de  bonificación  de  cuota  de  ventas  de  productos  múltiples  para  
una  fuerza  de  ventas  heterogénea:  un  enfoque  práctico  basado  en  modelos",  
Marketing  Science,  13  (2),  121  –44.
Joo,  Mingyu,  Kenneth  C.  Wilbur,  Bo  Cowgill  y  Yi  Zhu  (2014),  “Publicidad   Massy,  William  F.,  David  B.  Montgomery  y  Donald  G.  Morrison  (1970),  Modelos  
televisiva  y  búsqueda  en  línea”,  Management  Science,  60  (1),  56–73. estocásticos  de  comportamiento  de  compra.  Cambridge,  MA:  MIT  Press.

Kamakura,  Wagner  A.  y  Gary  J.  Russell  (1989),  “A  Probabilistic  Choice  Model   McFadden,  Daniel  (1974),  “Análisis  logit  condicional  del  comportamiento  de  
for  Market  Segmentation  and  Elasticity  Struc  ture”,  Journal  of  Marketing   elección  cualitativa”,  en  Frontiers  in  Econometrics,  P.  Zarembka,  ed.  Nueva  
Research,  26  (noviembre),  379–90.  ———  y  Michel  Wedel  (1995),  “Life­ York:  Prensa  Académica,  105–42.
Style  Segmentation  with  Tailored  Interviewing”,  Journal  of  Marketing  Research,   Miller,  Amalia  y  Catherine  Tucker  (2011),  “Encryption  and  Data  Security”,  Journal  
32  (agosto),  308–17. of  Policy  Analysis  and  Management,  30  (3),  534–56.

Análisis  de  marketing  para  entornos  ricos  en  datos /  119
Machine Translated by Google

Mittal,  Vikas,  Pankaj  Kumar  y  Michael  Tsiros  (1999),  “Desempeño,   Oravecz,  Z.,  M.  Huentelman  y  J.  Vandekerckhove  (2015),  "Actualización  
satisfacción  e  intenciones  de  comportamiento  a  nivel  de  atributos  a  lo   bayesiana  secuencial  para  Big  Data",  en  Big  Data  en  la  ciencia  cognitiva:  
largo  del  tiempo:  un  enfoque  del  sistema  de  consumo”,  Journal  of   de  métodos  a  conocimientos,  M.  Jones,  ed.
Marketing,  63  (abril),  88–101. Sussex,  Reino  Unido:  Psychology  Press.
Moe,  Wendy  W.  (2003),  “Comprar,  buscar  o  navegar:  diferenciar  entre   Park,  Sungho  y  Sachin  Gupta  (2012),  "Manejo  de  regresores  endógenos  
compradores  en  línea  mediante  el  flujo  de  clics  de  navegación  en  la   mediante  estimación  conjunta  mediante  cópulas",  Marketing  Science,  
tienda”,  Journal  of  Consumer  Psychology,  13  (1/2),  29–40. 31  (4),  567–86.
Parsons,  Leonard  J.  y  Frank  M.  Bass  (1971),  “Implicaciones  del  gasto  
———  y  Michael  Trusov  (2011),  “El  valor  de  la  dinámica  social  en  los  foros   publicitario  óptimo  de  un  análisis  de  regresión  de  ecuaciones  
de  calificación  de  productos  en  línea”,  Journal  of  Marketing  Research,   simultáneas”,  Operations  Research,  19  (3),  822–31.
48  (junio),  444–56. Pieters,  Rik,  Michel  Wedel  y  Rajeev  Batra  (2010),  "El  poder  de  detención  
Montgomery,  Alan  L.,  Shibo  Li,  Kannan  Srinivasan  y  John  C.  Liechty  (2004),   de  la  publicidad:  medidas  y  efectos  de  la  complejidad  visual",  Journal  
"Modelado  de  navegación  en  línea  y  análisis  de  ruta  mediante  datos  de   of  Marketing,  74  (septiembre),  48–60.
secuencia  de  clics",  Marketing  Science,  23  (4),  579–95. Prins,  Remco  y  Peter  C.  Verhoef  (2007),  “Marketing  Communication  Drivers  
Muller,  Frans  (2014),  “Big  Data:  Impact  and  Applications  in  Grocery  Retail”,   of  Adoption  Timing  of  a  New  E­Service  Among  Existing  Customers”,  
presentación  en  el  Simposio  de  Marketing  e  Innovación  de  2014,   Journal  of  Marketing,  71  (abril),  169–83.
Universidad  Erasmus,  (27  y  28  de  mayo),  Rotter  dam,  Países  Bajos. Raiffa,  Howard  y  Robert  Schlaifer  (1961),  Teoría  de  la  decisión  estadística  
aplicada.  Boston:  Prensa  de  Clinton.
´
Musalem,  Andres,  Eric  T.  Bradlow  y  Jagmohan  S.  Raju  (2008),  “¿Quién   Rao,  Vithala  R.  (2014),  “Análisis  conjunto”,  en  The  History  of  Marketing  
tiene  el  cupón?  Estimating  Consumer  Preferences  and  Coupon  Usage   Science,  Russell  S.  Winer  y  Scott  A.  Neslin,  eds.
from  Aggregate  Information”,  Journal  of  Marketing  Research,  45   Singapur:  World  Scientific  Publishing,  47–76.
(diciembre),  715–30. Reilly,  WJ  (1929),  Investigaciones  de  marketing.  Nueva  York:  Ronal  Press  
Naik,  Prasad  A.,  Kalyan  Raman  y  Russell  S.  Winer  (2005),  “Planning   Company.
Marketing­Mix  Strategies  in  the  Presence  of  Inter  action  Effects”,   Ridgeway,  George  y  David  Madigan  (2002),  "Análisis  bayesiano  de  
Marketing  Science,  24  (1),  25–34.  ———  y  Chi­Ling  Tsai   conjuntos  de  datos  masivos  a  través  de  filtros  de  partículas",  en  Actas  
(2004),  “Modelo  de  índice  único  isotónico  para  el  marketing  de  bases  de   de  KDD  02,  La  octava  conferencia  internacional  sobre  descubrimiento  
datos  de  alta  dimensión”,  Estadística  computacional  y  análisis  de   de  conocimientos  y  minería  de  datos.  Nueva  York:  Asociación  de  
datos,  47  (4),  175–90. Maquinaria  de  Computación,  5–13.
———, Michel  Wedel,  Lynd  Bacon,  Anand  Bodapati,  Eric  Bradlow,   Risselada,  Hans,  Peter  C.  Verhoef  y  Tammo  HA  Bijmolt  (2014),  “Dynamic  
Wagner  Kamakura,  et  al.  (2008),  "Desafíos  y  oportunidades  en  análisis   Effects  of  Social  Influence  and  Direct  Marketing  on  the  Adoption  of  High­
de  datos  de  elección  de  alta  dimensión", Technology  Products”,  Journal  of  Marketing,  78  (marzo),  52–68.
Cartas  de  marketing,  19  (3/4),  201–13.  y  
———,  ———, Wagner  Kamakura  (2010),  “Modelo  de  respuesta   Roberts,  John,  Ujwal  Kayande  y  Stefan  Stremersch  (2014),  "De  la  
binaria  de  múltiples  índices  para  el  análisis  de  grandes  datos”,  Journal   investigación  académica  a  la  práctica  de  marketing:  exploración  de  la  
of  Business  &  Economic  Statistics,  28  (1),  67–81. cadena  de  valor  de  la  ciencia  del  marketing",  International  Journal  of  
Nakanishi,  Masao  y  Lee  G.  Cooper  (1974),  “Estimación  de  parámetros   Research  in  Marketing,  31  (2),  127–40.
para  un  modelo  de  interacción  competitiva  multiplicativa:  enfoque  de   Rossi,  Peter  E.  (2014),  "Incluso  los  ricos  pueden  empobrecerse:  un  examen  
mínimos  cuadrados”,  Journal  of  Marketing  Research,  11  (agosto),  303– crítico  del  uso  de  métodos  IV  en  marketing"
11. Ciencias  del  marketing,  33  (5),  655–72.
Nam,  Hyoryung  y  PK  Kannan  (2014),  “Valor  informativo  de  las  redes  de   ———  y  Greg  M.  Allenby  (2003),  “Estadísticas  y  marketing  bayesianos”,  
etiquetado  social”,  Journal  of  Marketing,  78  (julio),  21–40. Marketing  Science,  22  (3),  304–28.
———, Robert  E.  McCulloch  y  Greg  M.  Allenby  (1996),  "El  valor  de  los  
Neiswanger,  W.,  C.  Wang  y  E.  Xing  (2014),  "Asymptotically  Exact,   datos  del  historial  de  compras  en  el  marketing  objetivo",  Marketing  
Embarrassingly  Parallel  MCMC",  en  Proceedings  of  the  30th  International   Science,  15  (4),  321–40.
Conference  on  Conference  on  Uncertainty  in  Artificial  Intelligence,   Rust,  John  (1987),  "Reemplazo  óptimo  de  motores  de  autobuses  GMC:  un  
[disponible  en  http://www.  cs.cmu.edu/  ~epxing/papers/2014/ modelo  empírico  de  Harold  Zurcher",  Econometrica,  55  (5),  999–1033.
Neiswanger_Wang_Xing_UAI14a.pdf'.
Neslin,  Scott  A.  (2014),  “Gestión  de  las  relaciones  con  los  clientes”,  en  The   Rust,  Roland  T.,  PK  Kannan  y  Na  Peng  (2002),  “The  Customer  Economics  
History  of  Marketing  Science,  Russell  S.  Winer  y  Scott  A.  Neslin,  eds.   of  Privacy  in  E­Service”,  Journal  of  the  Academy  of  Marketing  Science,  
Hackensack,  Nueva  Jersey:  World  Scientific  Publishing,  289–318. 30  (4),  455–64.
Rutz,  Oliver  J.,  Michael  Trusov  y  Randolph  E.  Bucklin  (2011),  “Modelado  de  
Netzer,  Oded,  Ronen  Feldman,  Jacob  Goldenberg  y  Fresco  Moshe  (2012),   los  efectos  indirectos  de  la  publicidad  de  búsqueda  paga:  ¿Qué  palabras  
"Mine  Your  Own  Business:  Market  Structure  Surveillance  Through  Text   clave  conducen  a  más  visitas  futuras?”  Ciencias  del  marketing,  30  (4),  
Mining",  Marketing  Science,  31  (3),  521–43. 646–65.
Schmittlein,  David  C.  y  Robert  A.  Peterson  (1994),  "Análisis  de  la  base  de  
Nguyen,  A.,  J.  Yosinski  y  J.  Clune  (2015),  "Las  redes  neuronales  profundas   clientes:  una  aplicación  del  proceso  de  compra  industrial",
se  engañan  fácilmente:  predicciones  de  alta  confianza  para  imágenes   Ciencias  del  marketing,  13  (1),  41–67.
irreconocibles",  en  Visión  artificial  y  reconocimiento  de  patrones.   Scott,  Steven  L.,  Alexander  W.  Blocker,  Fernando  V.  Bonassi,  Hugh  A.  
Piscataway,  NJ:  Instituto  de  Ingenieros  Eléctricos  y  Electrónicos. Chipman,  Edward  J.  George  y  Robert  E.  McCulloch  (2013),  "Bayes  and  
Big  Data:  The  Consensus  Monte  Carlo  Algorithm",  documento  de  
Nitzan,  Irit  y  Barak  Libai  (2011),  “Social  Effects  on  Customer  Retention”,   trabajo ,  Universidad  de  Chicago.
Journal  of  Marketing,  75  (noviembre),  24–38. Shapiro,  BT  (2014),  “Positive  Spillovers  and  Free  Riding  in  Ad  vertising  of  
Nixon,  HK  (1924),  “Atención  e  interés  en  la  publicidad”, Pharmaceuticals:  The  Case  of  Antidepressants”,  documento  de  trabajo,  
Archivos  de  Psicología,  72  (1),  5–67. Booth  School  of  Business,  University  of  Chicago.

120 /  Journal  of  Marketing:  edición  especial  de  AMA/MSI,  noviembre  de  2016
Machine Translated by Google

Shaw,  Robert  (1987),  Marketing  de  base  de  datos,  Gower  Publishing  Co. Wang,  P.,  Eric  Bradlow  y  Ed  George  (2014),  "Metaanálisis  mediante  la  
Almidón,  Daniel  (1923),  Principios  de  publicidad.  Chicago:  AW ponderación  de  la  información:  una  aplicación  a  la  publicidad  en  línea",  
Compañía  Shaw. Quantitative  Marketing  and  Economics,  12  (2),  209–33.
Steckel,  Joel,  Russell  Winer,  Randolph  E.  Bucklin,  Benedict  Dellaert,  Xavier  
` ¨
Dreze,  Gerald  Haubl,  et  al.  (2005),  “Elección  en  entornos  interactivos”,   Wedel,  Michel  y  Wayne  S.  DeSarbo  (1995),  "Un  enfoque  de  similitud  de  
Marketing  Letters,  16  (3/4),  309–20. mezcla  para  modelos  lineales  generalizados",  Journal  of  Classification,  
Steenburgh,  Thomas,  Andrew  Ainslie  y  Peder  Hans  Engebretson  (2003),   12  (1),  21–55.  ———  y  Rik  
“Variables  masivamente  categóricas:  revelación  de  la  información  en   Pieters  (2000),  “Fijaciones  oculares  en  anuncios  y  memoria  para  marcas:  
los  códigos  postales”,  Marketing  Science,  22  (1),  40–57. un  modelo  y  hallazgos”,  Marketing  Science,  19  (4),  297–312.
Stonborough,  Thomas  HW  (1942),  “Fixed  Panels  in  Consumer  Research”,  
Journal  of  Marketing,  7  (abril),  129–38. White,  Percival  (1931),  Técnica  de  Investigación  de  Mercados.  Nueva  York:  
Suchard,  Marc  A.,  Quanli  Wang,  Cliburn  Chan,  Jacob  Frelinger,  Andrew   Harper  &  Brothers.
Cron  y  Mike  West  (2010),  "Comprensión  de  la  programación  de  GPU   Wilson,  Melanie  A.,  Edwin  S.  Iversen,  Merlise  A.  Clyde,  Scott  C.  Schmidler  
para  la  computación  estadística:  estudios  en  mezclas  masivas   y  Joellen  M.  Schildkraut  (2010),  "Búsqueda  de  modelos  bayesianos  e  
inferencia  multinivel  para  estudios  de  asociación  de  SNP"
masivamente  paralelas",  Journal  of  Computational  and  Graphical  
Annals  of  Applied  Statistics,  4  (3),  1342–64.
Statistics,  19  ( 2),  419–38.
Winer,  Russell  S.  y  Scott  A.  Neslin,  eds.  (2014),  La  historia  de  la  ciencia  
Sudhir,  K.  (2016),  "La  compensación  de  exploración­explotación  y  la  
del  marketing.  Hackensack,  Nueva  Jersey:  World  Scientific  Publishing.
eficiencia  en  la  producción  de  conocimiento",  Marketing  Science,  35  (1),  1–9.
Teixeira,  Thales,  Michel  Wedel  y  Rik  Pieters  (2010),  "Marca  óptima  
Wittink,  Dick  R.,  MJ  Addona,  William  J.  Hawkes  y  John  C.  Porter  (2011),  
momento  a  momento  en  comerciales  de  televisión:  prevención  de  la  
"SCAN*PRO:  La  estimación,  validación  y  uso  de  efectos  promocionales  
evasión  mediante  pulsos",  Marketing  Science,  29  (5),  783–804.
basados  en  datos  de  escáner",  en  Liber  Amicorum  en  honor  a  Peter  SH  
Telpaz,  Ariel,  Ryan  Webb  y  Dino  Levy  (2015),  "Using  EEG  to  Predict  
Leeflang,  JE  Wierenga,  PC
Consumers'  Future  Choices",  Journal  of  Marketing  Research,  52  
Verhoef  y  JC  Hoekstra,  eds.  Groningen,  Países  Bajos:  Universidad  de  
(agosto),  511–29.
Groningen,  135–62.
Tibbitts,  Matthew,  Murali  Haran  y  John  C.  Liechty  (2011),  “Muestreo  de  
Xiao,  Li  y  Min  Ding  (2014),  "Solo  las  caras:  exploración  de  los  efectos  de  
cortes  multivariantes  paralelos”,  Estadísticas  y  computación,  21  (3),  
las  características  faciales  en  la  publicidad  impresa",  Marketing  Science,  
415–30. 33  (3),  338–52.
Trusov,  Michael,  Liye  Ma  y  Zainab  Jamal  (2016),  "Crumbs  of  the  Cookie:   Yao,  Song  y  Carl  F.  Mela  (2011),  "Un  modelo  dinámico  de  publicidad  de  
User  Profiling  in  Customer­Base  Analysis  and  Be  havioral  Targeting",   búsqueda  patrocinada",  Marketing  Science,  30  (3),  447–68.
Marketing  Science,  35  (3),  405–26.
Tucker,  Catherine  (2014),  “Redes  sociales,  publicidad  personalizada  y   Ying,  Yuan  Ping,  Fred  Feinberg  y  Michel  Wedel  (2006),  “Aprovechamiento  
controles  de  privacidad”,  Journal  of  Marketing  Research,  51  (octubre),   de  las  calificaciones  faltantes  para  mejorar  los  sistemas  de  
546–62. recomendación  en  línea”,  Journal  of  Marketing  Research,  43  (agosto),  
Urban,  Glen  L.,  Gui  Liberali,  ErinMacDonald,  Robert  Bordley  y  John  Hauser   355–65.
(2014),  "Ad  Morphing",  Marketing  Science,  33  (1),  27–46. Zhang,  Jie  y  Lakshman  Krishnamurthi  (2004),  “Personalizar  promociones  
Varian,  Hal  R.  (2014),  "Grandes  datos:  nuevos  trucos  para  la  econometría", en  tiendas  en  línea”,  Marketing  Science,  23  (4),  561–78.
Revista  de  Perspectivas  Económicas,  28  (2),  3–27.
Verhoef,  Peter  C.,  Edwin  Kooge  y  Natasha  Walk  (2016),  Crear  valor  con   ———  y  Michel  Wedel  (2009),  “La  eficacia  de  las  promociones  
Big  Data  Analytics:  tomar  decisiones  de  marketing  más  inteligentes.   personalizadas  en  tiendas  en  línea  y  fuera  de  línea”,  Journal  of  Marketing  
Londres:  Routledge. Research,  46  (abril),  190–206.

Análisis  de  marketing  para  entornos  ricos  en  datos /  121

También podría gustarte