Está en la página 1de 7

Capítulo 1

Actualmente tenemos mejor capacidad de recopilar datos en toda la empresa. Del área
operaciones, fabricación, gestión de la cadena de suministro, comportamiento del cliente,
rendimiento de la campaña de marketing, procedimientos de flujo de trabajo, etc.

La información ahora está ampliamente disponible sobre eventos externos, como las tendencias
del mercado, la industria, noticias y movimientos de la competencia.

La ubicuidad de las oportunidades de datos

Con una gran cantidad de datos ahora disponibles, las empresas de casi todas las industrias están
enfocadas en la explotación de datos para obtener una ventaja competitiva. En el pasado, las
empresas podían emplear equipos de estadísticos, modeladores y analistas para explorar
conjuntos de datos manualmente, pero el volumen y la variedad de datos ha superado con creces
la capacidad del análisis manual. Al mismo tiempo, las computadoras se han vuelto mucho más
poderosas, las redes se han vuelto omnipresentes, y se han desarrollado algoritmos que pueden
conectar conjuntos de datos para permitir más y análisis más profundos de lo que era posible
anteriormente. La convergencia de estos fenómenos ha dado lugar a la aplicación empresarial
cada vez más generalizada de los principios de la ciencia de datos y técnicas de minería de datos.

Ejemplo: huracán Frances

Considere un ejemplo de una historia del New York Times de 2004:


El huracán Frances estaba en camino, atravesando el Caribe, amenazando con una golpe en la
costa atlántica de Florida. Wal-Mart  oportunidad tecnología predictiva.

Una semana antes de la llegada de la tormenta, Linda M. Dillman, directora de


información de Wal-Mart oficial, presionó a su personal para que elaboraran pronósticos basados
en lo que había sucedido cuando El huracán Charley semanas antes. Respaldado por billones de
bytes de historial de compradores que se almacena en el almacén de datos de Wal-Mart,
consideró que la empresa podría "comenzar a predecir lo que va a suceder, en lugar de esperar a
que suceda".

Ideas Ejecutivos:

- las personas en el camino del huracán comprarían más agua embotellada.

- aumento en las ventas debido al huracán – abastecimiento

- Sería más valioso descubrir patrones debidos al huracán que no fueran obvios.

Para hacer esto, los analistas podrían examinar el enorme volumen de datos de Wal-Mart de

situaciones similares (como el huracán Charley) para identificar una demanda local inusual de

productos. A partir de tales patrones, la empresa podría anticipar una demanda inusual.

- Resultado: enteran que aumento la demanda de tartas, (siete veces su tasa de ventas
normal, antes de un huracán)
- El artículo más vendido antes del huracán fue cerveza.
Ejemplo2: Predicción en la rotación de clientes

Suponga que acaba de conseguir un gran trabajo analítico con MegaTelCo, una de las empresas de
telecomunicaciones más grandes empresas en los Estados Unidos. La empresa tiene un problema
importante con el cliente en el negocio de comunicación inalámbrica (Wireless).

En la región del Atlántico medio, el 20% de los clientes de celulares se van cuando vencen sus
contratos, y cada vez es más difícil adquirir nuevos clientes. Dado que el mercado de la telefonía
móvil está ahora saturado. (Churn – Fenómeno en que el cliente cambia entre operadoras)

Se le ha llamado para ayudar a comprender el problema e idear una solución.

- Atraer nuevos clientes es mucho más caro que retener a los existentes, por lo que un buen
presupuesto del área de marketing se asigna a prevenir el Churn.
- Su tarea es diseñar un plan preciso, paso a paso, de cómo el equipo data science puede
utilizar los datos de MegaTel para decidir que clientes deberab recibir un trato especial
antes de su termino de contrato.

¿Cómo debería MegaTelCo elegir un conjunto de clientes para recibir su oferta con el fin de
reducir el Churn? Responder a esta pregunta es mucho más complicada de lo que parece y esta es
una de las grandes áreas en donde se utiliza la data mining.

Ciencia de datos, ingeniería y Toma de decisiones basadas en datos

Data Science - La ciencia de datos involucra principios, procesos y técnicas para comprender los
fenómenos a través del análisis (automatizado) de datos. / Concepto de procesar mucha
información relacionada sobre una organización.

Se conoce que a mayor data es considerada para la toma de decisiones, mejor es la productividad,
y se puede incluso controlar un poco mejores factores perturbadores.

- Una desviación estándar más alta en la escala DDD se asocia con un aumento del 4% al 6%
en la productividad.
- DDD también es correlacionado con un mayor rendimiento de los activos, rendimiento del
capital, utilización de activos y mercado valor, y la relación parece ser causal.

Puntual Libro DDD: (1) decisiones para las cuales es necesario realizar "descubrimientos"
dentro de los datos, (ejemplo Wawlmart)

(2) decisiones que repetir, especialmente a escala masiva.

Caso Ejemplo Target

Nuevos padres- Si compran pañales se les puede ofrecer nuevos productos. (cambio de hábitos de
compra)

Sin embargo, Target quería adelantarse a su competencia. Estaban interesados en sí podrían


predecir que las personas están esperando un bebé. (Ventaja)
Con data de clientes que luego estaban embarazados se conocía  Las madres embarazadas a
menudo cambian su dieta, su guardarropa, sus regímenes vitamínicos, etc. Estos indicadores
podrían extraerse de datos históricos, reunidos en modelos predictivos y luego implementados en
Campañas de marketing.

Es importante destacar que tanto en el ejemplo de Walmart como en el de Target, el análisis de


datos no estaba probando una hipótesis simple. En cambio, los datos se exploraron con la
esperanza de que se descubriera algo útil.

Nuestro ejemplo de “Churn” ilustra un problema de DDD de tipo 2. MegaTelCo tiene cientos de
millones de clientes, cada uno de los cuales es candidato a la deserción. Decenas de millones de
clientes tienen contratos que vencen cada mes, por lo que cada uno de ellos tiene una mayor
probabilidad de deserción en un futuro próximo. La idea es mejorar la capacidad de estimar, cuán
rentable sería para nosotros enfocarnos en un determinado tipo de cliente y así cosechar grandes
beneficios.

La misma lógica se aplica a muchas de las áreas donde hemos visto la aplicación más intensa de
ciencia de datos y minería de datos: marketing directo, publicidad en línea, calificación crediticia,
comercio financiero, gestión de la mesa de ayuda, detección de fraudes, clasificación de búsqueda,
recomendación de productos, etc.

Las decisiones comerciales se toman, cada vez más seguido, automáticamente por sistemas
computacionales. Diferentes industrias han adoptado la toma de decisiones automática. Las
industrias de finanzas y telecomunicaciones fueron las primeras en adoptarlas, en gran parte
porque de su acelerado y temprano desarrollo de redes de datos y la implementación de la
informática, que permitió agregar y modelar datos a gran escala, para luego aplicar modelos de
toma de decisiones.

Ejemplos: casinos de Harrah's y las recomendaciones de Amazon y Netflix. Actualmente estamos


viendo una revolución en la publicidad, debido en gran parte a un gran aumento en la cantidad de
tiempo que los consumidores tienen en línea. Dando a la publicidad la capacidad de llegar a ellos
cada segundo.

Data Processing and “Big Data” – Procesamiento de datos y Big Data

Conceptos diferentes  El procesamiento de datos no siempre implica o es ciencia de datos.

La ingeniería de datos y el procesamiento de datos son fundamentales para respaldar la ciencia


de datos, pero son más generales.

Para comprender la ciencia de datos y las empresas basadas en datos, es importante comprender
las diferencias. La ciencia de datos necesita acceso a datos y, a menudo, se beneficia de la
ingeniería de datos sofisticada que el procesamiento de datos y las tecnologías pueden facilitar,
pero estas tecnologías no son tecnologías de ciencia de datos por sé. Son compatibles con la
ciencia de datos, como se muestra en la Figura 1-1, pero son útiles para mucho más.

Las tecnologías de procesamiento de datos son muy importantes para muchas tareas comerciales
orientadas a los datos que no impliquen la extracción de conocimientos o la toma de decisiones
basada en datos, como la eficiencia procesamiento de transacciones, procesamiento de sistemas
web modernos y publicidad en línea administración de campaña.

Las tecnologías de "Big Data (Macrodatos)" (como Hadoop, HBase y MongoDB) han recibido
considerables la atención de los medios recientemente. Big data esencialmente significa conjuntos
de datos que son demasiado grandes para los sistemas tradicionales de procesamiento de datos y,
por lo tanto, requieren nuevas tecnologías de procesamiento. Al igual que con las tecnologías
tradicionales, las tecnologías de big data se utilizan para muchas tareas, incluida la ingeniería de
datos. A veces para implementar técnicas de minería de datos. Con mucha más frecuencia se
utilizan las conocidas tecnologías de big data para
el procesamiento de datos en apoyo de las técnicas
de minería de datos y otras actividades de ciencia
de datos, como se representa en la Figura 1-1.

Un estudio separado, realizado por la economista


Prasanna Tambe de la Stern School de la NYU,
examinó hasta qué punto las tecnologías de big
data parecen ayudar a las empresas (Tambe, 2012).
Encuentra que después de controlar varios posibles
factores de confusión, el uso de tecnologías de big
data se asocia con un crecimiento adicional
significativo de la productividad. Específicamente,
una desviación estándar más alta en la utilización
de tecnologías de big data se asocia con una
productividad entre un 1% y un 3% más alta que la
empresa promedio.

From Big Data 1.0 to Big Data 2.0 / De Big Data 1.0 a Big Data 2.0

Web1.0 internet es una base de datos de consulta

Web 2.0 a partir de los 2000 internet es interactivo entre web y usuarios- blogs, redes, etc.

Una forma de pensar sobre el estado de las tecnologías de big data es establecer una analogía con
la adopción empresarial de las tecnologías de Internet. En la Web 1.0, las empresas se ocuparon
de implementar las tecnologías básicas de Internet para poder establecer una presencia en la web,
desarrollar la capacidad de comercio electrónico y mejorar la eficiencia de sus operaciones. Luego,
comenzaron a preguntarse qué podía hacer la Web por ellos y cómo podía mejorar las cosas que
siempre habían hecho y entramos en la era de la Web 2.0, donde nuevos sistemas y empresas
comenzaron a aprovechar la naturaleza interactiva de la Web. Los cambios provocados por este
cambio de pensamiento son omnipresentes; la más obvia es la incorporación de componentes de
redes sociales y el surgimiento de la “voz” del consumidor individual (y ciudadano).
Adelantados a su tiempo  Amazon es un excelente ejemplo, incorporando la "voz" del
consumidor desde el principio, en la calificación de los productos, en las reseñas de productos (y
más profundamente, en la calificación de las reseñas de productos). Del mismo modo, vemos que
algunas empresas ya están aplicando Big Data 2.0. Amazon vuelve a ser una empresa a la
vanguardia que ofrece recomendaciones basadas en datos a partir de datos masivos.

Data and Data Science Capability as a Strategic Asset / Capacidad de datos y ciencia de datos
como un activo estratégico

Las secciones anteriores sugieren uno de los principios fundamentales de la ciencia de datos: los
datos y la capacidad de extraer conocimiento útil de los datos deben considerarse activos
estratégicos clave. Demasiadas empresas consideran que el análisis de datos pertenece
principalmente a la obtención de valor a partir de algunos datos existentes y, a menudo, sin tener
en cuenta si la empresa tiene el talento analítico adecuado. Verlos como activos nos permite
pensar explícitamente en la medida en que uno debería invertir en ellos.

A menudo, no tenemos exactamente los datos correctos para tomar las mejores decisiones y / o
el talento adecuado para respaldar mejor la toma de decisiones a partir de los datos. Además,
pensar en estos como activos debería llevarnos a darnos cuenta de que son complementarios. El
mejor equipo de ciencia de datos puede generar poco valor sin los datos adecuados; los datos
correctos a menudo no pueden mejorar sustancialmente las decisiones sin el talento adecuado en
ciencia de datos.

Construir un equipo de ciencia de datos de primer nivel no es una tarea trivial, pero puede marcar
una gran diferencia para la toma de decisiones.

Signet Bank de la década de 1990 es un buen ejemplo. Anteriormente, en la década de 1980, la ciencia de
datos había transformado el negocio del crédito al consumo. Modelar la probabilidad de incumplimiento
había cambiado la industria de la evaluación personal de la probabilidad de incumplimiento a estrategias de
escala masiva y participación de mercado, lo que trajo consigo economías de escala concomitantes.

1990, dos visionarios estratégicos (Richard Fairbanks y Nigel Morris) se dieron cuenta de que la tecnología
de la información era lo suficientemente poderosa como para poder hacer modelos predictivos más
sofisticados al inicio los grandes bancos no creían en la propuesta, hasta que lograron captar el interés de
una pequeña región Banco de Virginia: Signet Bank. La gerencia de Signet Bank estaba convencida de que
modelar la rentabilidad, no solo la probabilidad de incumplimiento, era la estrategia correcta. Sabían que
una pequeña proporción de clientes en realidad representa más del 100% de las ganancias de un banco de
operaciones con tarjeta de crédito. Si pudieran modelar la rentabilidad, podrían hacer mejores ofertas a los
mejores clientes y "desnatar la crema" de la clientela de los grandes bancos. Pero Signet Bank tuvo un gran
problema al implementar esta estrategia. No tenían los datos adecuados para modelar la rentabilidad con el
objetivo de ofrecer diferentes términos a diferentes clientes. Nadie lo hizo. Dado que los bancos estaban
ofreciendo crédito con un conjunto específico de términos y un modelo predeterminado específico, tenían
los datos para modelar la rentabilidad (1) para los términos que realmente han ofrecido en el pasado y (2)
para el tipo de cliente que realmente estaba dirigido el crédito (es decir, aquellos que fueron considerados
dignos de crédito por el modelo existente).

¿Que hicieron? Pusieron en juego una estrategia fundamental de la ciencia de datos: adquirir los datos
necesarios a un costo. Una vez que consideramos los datos como un activo comercial, debemos pensar si
estamos dispuestos a invertir y cuánto. En el caso de Signet, se podrían generar datos sobre la rentabilidad
de los clientes con diferentes condiciones crediticias mediante la realización de experimentos. Se ofrecieron
diferentes bebeficios al azar a diferentes clientes. Esto puede parecer una tontería fuera del contexto del
pensamiento analítico de datos: ¡es probable que pierda dinero! Esto es verdad. En este caso, las pérdidas
son el costo de la adquisición de datos. Como era de esperar, cuando Signet comenzó al azar al ofrecer
condiciones a los clientes por la adquisición de datos, el número de cuentas defectuosas se disparó.

Signet pasó de una tasa de "cancelación" líder en la industria (el 2,9% de los saldos quedaron impagos) hasta
casi el 6% de cancelaciones. Las pérdidas continuaron durante algunos años mientras los científicos de datos
trabajaban en construir modelos predictivos a partir de los datos, evaluarlos e implementarlos en mejorar
las ganancias. (empres  perdidas = costo de inversión)

Finalmente, la tarjeta de crédito de Signet dio la vuelta y se volvió tan rentable que debió ser separado de
otras operaciones del banco que estaban eclipsando el éxito del crédito al consumo. Fairbanks y Morris se
convirtieron en presidente y director ejecutivo y presidente y director de operaciones, y procedieron a
replicar los principios de la ciencia de datos en toda la empresa, no solo para la adquisición del cliente
también para su retención.

Nota: (a pesar de la dificultad de estudio de estos casos por reserva de información de las
empresas bancarias podemos saber que):

Los bancos con mayores activos de datos pueden tener una importante ventaja estratégica sobre
sus competidores más pequeños. Si estas tendencias se generalizan y los bancos pueden aplicar
análisis sofisticados, los bancos con mayores activos de datos debe ser más capaz de identificar a
los mejores clientes para productos individuales. El resultado neto será una mayor adopción de los
productos del banco, una disminución del costo de adquisición de clientes, o ambos.

Data-Analytic Thinking / Pensamiento analítico de datos

Es importante comprender la ciencia de datos incluso si nunca tiene la intención para hacerlo
usted mismo, porque el análisis de datos es ahora muy importante para la estrategia empresarial.

Entendiendo el concepto fundamental y tener marcos para organizar el pensamiento analítico de


datos no solo le permitirá a uno interactuar de manera competente, sino que le ayudará a
visualizar oportunidades para mejorar la toma de decisiones basada en datos, o para ver
amenazas competitivas orientadas a datos.

Las empresas de muchas industrias tradicionales están explotando recursos de datos nuevos y
existentes buscando ventaja competitiva. Emplean equipos de ciencia de datos para traer
tecnologías avanzadas buscando aumentar los ingresos y reducir los costes. Además, muchas
empresas nuevas están siendo desarrollado con la minería de datos como un componente
estratégico clave. Facebook y Twitter, junto con muchas otras empresas "Digital 100" (Business
Insider, 2012)

Los proyectos de análisis de datos llegan a toda unidad de negocios. Los empleados de estas
unidades deben interactuar con la ciencia de datos. Firmas donde la gente de negocios no
entiende lo que están haciendo los científicos de datos están en una desventaja sustancial, porque
pierden tiempo y esfuerzo o, peor aún, pierden por tomar decisiones equivocadas.

También podría gustarte