Está en la página 1de 34

Machine Translated by Google

Esta página se dejó en blanco intencionalmente


Machine Translated by Google

CAPÍTULO

1
Una visión general de los negocios

Inteligencia, análisis y ciencia


de datos

OBJETIVOS DE APRENDIZAJE

ÿ Comprender la necesidad de soporte ÿ Comprender los diferentes tipos de análisis y


computarizado para la toma de decisiones ver aplicaciones seleccionadas
gerenciales ÿ Comprender el ecosistema analítico para
ÿ Reconocer la evolución de tales identificar varios jugadores clave y
soporte computarizado al estado actual: oportunidades de carrera.
análisis/ciencia de datos
ÿ Describir la inteligencia comercial
(BI) metodología y conceptos

cada vez más complejo. Las organizaciones, tanto privadas como públicas, están bajo pres
El entornoseguros
empresarial (clima)
que los cambia
obligan constantemente
a responder y se aestá
rápidamente las volviendo
condiciones cambiantes y a ser
innovadores en la forma en que operan. Tales actividades requieren que las organizaciones sean ágiles y
tomen decisiones estratégicas, tácticas y operativas frecuentes y rápidas, algunas de las cuales son muy
complejas. Tomar tales decisiones puede requerir cantidades considerables de datos, información y
conocimientos relevantes. Su procesamiento, en el marco de las decisiones necesarias, debe hacerse de
forma rápida, frecuentemente en tiempo real, y suele requerir algún soporte informático.

Este libro trata sobre el uso de análisis de negocios como soporte computarizado para la toma de
decisiones gerenciales. Se concentra en los fundamentos teóricos y conceptuales del apoyo a la toma de
decisiones, así como en las herramientas y técnicas comerciales disponibles. Este libro presenta los
fundamentos de las técnicas y la forma en que se construyen y utilizan estos sistemas. Seguimos un
enfoque EEE para presentar estos temas: exposición, experiencia y exploración. El libro proporciona
principalmente exposición a diversas técnicas analíticas y sus aplicaciones. La idea es que un estudiante
se inspire para aprender de cómo otras organizaciones han empleado análisis para tomar decisiones o
para obtener una ventaja competitiva. Creemos que tal exposición a lo que se está haciendo con la
analítica y cómo se puede lograr es el componente clave del aprendizaje sobre la analítica.

Al describir las técnicas, también damos ejemplos de herramientas de software específicas que pueden ser

29
Machine Translated by Google

30 Capítulo 1 • Una descripción general de Business Intelligence, Analytics y Data Science

utilizado para el desarrollo de tales aplicaciones. El libro no se limita a ninguna herramienta de software, por lo
que los estudiantes pueden experimentar estas técnicas utilizando cualquier cantidad de herramientas de
software disponibles. Esperamos que esta exposición y experiencia capacite y motive a los lectores a explorar el
potencial de estas técnicas en su propio dominio. Para facilitar dicha exploración, incluimos ejercicios que
dirigen al lector a Teradata University Network (TUN) y otros sitios que incluyen ejercicios orientados al equipo
cuando corresponda.
Este capítulo introductorio proporciona una introducción a la analítica, así como una descripción general del
libro. El capítulo tiene las siguientes secciones:

1.1 Viñeta de apertura: Sports Analytics: una frontera emocionante para el aprendizaje y
Comprensión de las aplicaciones de análisis 30
1.2 Entornos empresariales cambiantes y necesidades en evolución de apoyo a la toma de decisiones y
Analítica 37
1.3 Evolución del soporte de decisiones computarizado para análisis/ciencia de datos 39
1.4 Un marco para la inteligencia empresarial 41
1.5 Resumen de análisis 48
1.6 Ejemplos de análisis en dominios seleccionados 55
1.7 Una breve introducción a Big Data Analytics 61
1.8 Una descripción general del ecosistema analítico 63
1.9 Planta del Libro 72
1.10 Recursos, enlaces y la conexión de red de la Universidad de Teradata 73

1.1 VIÑETA DE APERTURA: Sports Analytics: una frontera emocionante


para el aprendizaje y la comprensión de las aplicaciones de la
analítica
La aplicación de la analítica a los problemas empresariales es una habilidad clave que aprenderá en este libro.
Muchas de estas técnicas ahora se están aplicando para mejorar la toma de decisiones en todos los aspectos
de los deportes, un área muy candente llamada análisis deportivo. El análisis deportivo es el arte y la ciencia de
recopilar datos sobre atletas y equipos para crear información que mejore las decisiones deportivas, como decidir
qué jugadores reclutar, cuánto pagarles, con quién jugar, cómo entrenarlos, cómo mantenerlos saludables. , y
cuándo deben negociarse o retirarse. Para los equipos, implica decisiones comerciales como el precio de las
entradas, así como decisiones sobre la lista, el análisis de las fortalezas y debilidades de cada competidor y
muchas decisiones el día del juego.

De hecho, la analítica deportiva se está convirtiendo en una especialidad dentro de la analítica. Es un área
importante porque los deportes son un gran negocio que genera alrededor de $145 mil millones en ingresos cada año,
más $100 mil millones adicionales en apuestas legales y $300 mil millones en apuestas ilegales, según Price Waterhouse.1
En 2014, solo se gastaron $ 125 millones en análisis (menos del 0,1% de los ingresos). Se espera que esto
crezca a un ritmo saludable a $ 4.7 mil millones para 2021.2

1“Changing the Game: Outlook for the Global Sports Market to 2015”, Price Waterhouse Coopers Report, aparece
en https://www.pwc.com/gx/en/hospitality-leisure/pdf/ Changing-the-game-outlook -for-the-global-sports-market
to-2015.pdf. Datos de apuestas de https://www.capcredit.com/how-much-americansspend-on-sports-each-year/.
2“Sports Analytics Market Worth $4.7B by 2021,” Comunicado de prensa de Wintergreen Research, cubierto por PR
Newswire en http://www.prnewswire.com/news-releases/sports-analytics-market-worth-47-billion-by- 2021-509869871.html,
25 de junio de 2015.
Machine Translated by Google

Capítulo 1 • Una descripción general de Business Intelligence, Analytics y Data Science 31

El uso de análisis para los deportes se popularizó con el libro Moneyball de Michael Lewis en 2003 y la
película protagonizada por Brad Pitt en 2011. Mostraba al gerente general de los Atléticos de Oakland, Billy Beane,
y su uso de datos y análisis para convertir un equipo perdedor en un ganador. . En particular, contrató a un analista
que usó análisis para reclutar jugadores capaces de embasarse en lugar de jugadores que se destacaron en
medidas tradicionales como carreras impulsadas o bases robadas. Estos conocimientos les permitieron seleccionar
prospectos ignorados por otros equipos con salarios iniciales razonables. Funcionó: llegaron a los playoffs en 2002
y 2003.
Ahora los análisis se utilizan en todas las partes de los deportes. El análisis se puede dividir entre la oficina
principal y la oficina administrativa. Una buena descripción con 30 ejemplos aparece en el artículo de la encuesta
de Tom Davenport.3 Los análisis comerciales de la oficina principal incluyen el análisis del comportamiento de los
fanáticos que van desde modelos predictivos para renovaciones de boletos de temporada y ventas regulares de
boletos, hasta tweets de puntaje de fanáticos sobre el equipo, atletas, entrenadores y dueños Esto es muy similar
a la gestión tradicional de las relaciones con los clientes (CRM). El análisis financiero también es un área clave,
donde los topes salariales (para profesionales) o los límites de becas (universidades) son parte de la ecuación.

Los usos administrativos incluyen el análisis tanto de atletas individuales como del juego en equipo. Para
jugadores individuales, hay un enfoque en modelos de reclutamiento y análisis de exploración, análisis de fuerza y
estado físico, así como desarrollo, y PM para evitar el sobreentrenamiento y las lesiones. La investigación sobre la
conmoción cerebral es un campo candente. El análisis del equipo incluye estrategias y tácticas, evaluaciones
competitivas y opciones óptimas de la lista en diversas situaciones en el campo o en la cancha.

Los siguientes ejemplos representativos ilustran cómo tres organizaciones deportivas utilizan datos y análisis
para mejorar las operaciones deportivas, de la misma manera que los análisis han mejorado la toma de decisiones
de la industria tradicional.

Ejemplo 1: La oficina comercial


Dave Ward trabaja como analista de negocios para un importante equipo de béisbol profesional y se enfoca en los
ingresos. Analiza la venta de entradas, tanto de los abonados de temporada como de los compradores de entradas
sueltas. Las preguntas de muestra en su área de responsabilidad incluyen por qué los titulares de boletos de
temporada renuevan (o no renuevan) sus boletos, así como qué factores impulsan las compras de boletos de
asientos individuales de último minuto. Otra cuestión es cómo fijar el precio de las entradas.
Algunas de las técnicas analíticas que usa Dave incluyen estadísticas simples sobre el comportamiento de
los fanáticos, como la asistencia general y las respuestas a las preguntas de la encuesta sobre la probabilidad de
volver a comprar. Sin embargo, lo que dicen los fanáticos versus lo que hacen puede ser diferente. Dave realiza
una encuesta a los fanáticos por ubicación de los asientos de boletos ("nivel") y les pregunta sobre la probabilidad
de que renueven sus boletos de temporada. Pero cuando compara lo que dicen con lo que hacen, descubre
grandes diferencias. (Consulte la Figura 1.1.) Encontró que el 69 % de los fanáticos en los asientos de Nivel 1 que dijeron en el

Nivel Altamente probable Probablemente tal vez Probablemente no Ciertamente no


1 92 88 75 69 45

2 88 81 70 sesenta y cinco 38

3 80 76 68 55 36

4 77 72 sesenta y cinco 45 25

5 75 70 60 35 25

FIGURA 1.1 Renovaciones de boletos de temporada: puntajes de la encuesta.

3Thomas Davenport, “Analytics in Sports: The New Science of Winning”, Informe técnico del Instituto Internacional de
Análisis, patrocinado por SAS, febrero de 2014. En el sitio web de SAS en: http://www.sas.com/content/dam/ SAS/
en_us/doc/whitepaper2/iia-analytics-in-sports-106993.pdf. (Consultado en julio de 2016)
Machine Translated by Google

32 Capítulo 1 • Una descripción general de Business Intelligence, Analytics y Data Science

encuesta que "probablemente no renovarían" en realidad lo hizo. Esta es una información útil que conduce a la
acción: los clientes en las celdas verdes tienen más probabilidades de renovar boletos, por lo que requieren menos
toques de marketing y menos dólares para convertir, por ejemplo, en comparación con los clientes en las celdas
azules.
Sin embargo, muchos factores influyen en el comportamiento de compra de boletos de los fanáticos,
especialmente el precio, lo que genera estadísticas y análisis de datos más sofisticados. Para ambas áreas, pero
especialmente para los boletos de un solo juego, Dave está impulsando el uso de precios dinámicos, moviendo el
negocio de un simple precio estático por nivel de ubicación de asiento a precios que aumentan y disminuyen día a
día de asientos individuales. Esta es un área de investigación rica para muchos equipos deportivos y tiene un gran
potencial para mejorar los ingresos. Por ejemplo, su precio tiene en cuenta el historial del equipo, contra quién
juegan, las fechas y horas de los juegos, qué atletas estrella juegan para cada equipo, el historial de renovación de
boletos de temporada o compra de boletos individuales de cada fanático, así como factores como la ubicación del
asiento. , número de asientos e información en tiempo real como la congestión del tráfico históricamente a la hora
del juego e incluso el clima. Consulte la Figura 1.2.
¿Cuáles de estos factores son importantes? ¿Cuánto cuesta? Dada su amplia experiencia en estadísticas,
Dave crea modelos de regresión para seleccionar los factores clave que impulsan estos comportamientos históricos
y crea PM para identificar cómo gastar los recursos de marketing para generar ingresos.
Construye modelos de abandono para titulares de boletos de temporada para crear segmentos de clientes que
renovarán, no renovarán o son indiferentes, lo que luego impulsa campañas de marketing más refinadas.

Además, califica el sentimiento de los comentarios de los fanáticos, como tweets, que lo ayudan a segmentar
a los fanáticos en diferentes segmentos de lealtad. Otros estudios sobre los factores que impulsan la asistencia a
un solo juego ayudan al departamento de marketing a comprender el impacto de obsequios como cabezas de
muñecos o camisetas, o sugerencias sobre dónde realizar compras de anuncios de televisión.
Más allá de los ingresos, hay muchas otras áreas analíticas en las que trabaja el equipo de Dave, que
incluyen merchandising, ingresos por transmisiones de radio y televisión, aportes al gerente general sobre las
negociaciones salariales, borradores de análisis especialmente dados los topes salariales, efectividad de la
promoción, incluidos los canales publicitarios y conocimiento de la marca. así como análisis de socios. ¡Es un tipo
muy ocupado!

Desempeño del equipo local en los últimos 10 juegos


Asiento Equipo
Ubicación Actuación
El oponente llegó a los playoffs el año anterior

Hora de inicio del juego

Relacionado al tiempo
parte de la temporada Oponente de la misma división
Variables

Días antes del Juego

¿Qué lanzador? ¿Cuál es su promedio de carreras ganadas?


jugador individual
Reputaciones
Número de All Stars en la lista del oponente

FIGURA 1.2 Trabajo previo de fijación dinámica de precios: Major League Baseball. Fuente: Adaptado de C.
Kemper y C. Breuer, “How Efficient is Dynamic Pricing for Sports Events? Diseño de un modelo de precios dinámicos
para el Bayern de Múnich”, Intl. Journal of Sports Finance, 11, pp. 4-25, 2016.
Machine Translated by Google

Capítulo 1 • Una descripción general de Business Intelligence, Analytics y Data Science 33

Número total de reproducciones: 540


Porcentaje de ejecución: 46,48%
Porcentaje de Aprobado: 53,52%

Si Off_Pers es
10, 11, 20, 22,
12, 21, 30, 31, 32 o Falta

Número total de reproducciones: 155 Número total de reproducciones: 385


Porcentaje de Ejecución: 79,35% Porcentaje de Ejecución: 33,25%
Porcentaje de Aprobado: 20,65% Porcentaje de Aprobado: 66,75%
Si esto es...

1.° o 2.° abajo Tercera o cuarta oportunidad

Número total de reproducciones: 294 Número total de reproducciones: 91

Porcentaje de ejecución: 38,78% Porcentaje de ejecución: 15,38%


Porcentaje de Aprobado: 61,22% Porcentaje de Aprobado: 84,62%
Si la distancia a alcanzar
Si... el siguiente es
estamos liderando
o es un empate estamos atras Menos de 5 yardas Más de 5 yardas

Número total de reproducciones: 162 Número total de reproducciones: 132 Número total de reproducciones: 25 Número total de reproducciones: 66

Porcentaje de Ejecución: 50,62% Porcentaje de Ejecución: 24,24% Porcentaje de ejecución: 44,00% Porcentaje de Ejecución: 4.55%
Porcentaje de Aprobado: 49,38% Porcentaje de Aprobado: 75,67% Porcentaje de Aprobado: 56,00% Porcentaje de Aprobado: 95,45%

FIGURA 1.3 Árbol de decisiones en cascada para jugadas de carrera o pase.

Ejemplo 2: El Entrenador
Bob Breedlove es el entrenador de fútbol de un importante equipo universitario. Para él, se trata de ganar
juegos. Sus áreas de enfoque incluyen reclutar a los mejores jugadores de la escuela secundaria, desarrollarlos
para que se ajusten a sus sistemas ofensivos y defensivos, y obtener el máximo esfuerzo de ellos en los días
de juego. Ejemplos de preguntas en su área de responsabilidad incluyen: ¿A quién reclutamos?
¿Qué ejercicios ayudan a desarrollar sus habilidades? ¿Cuánto presiono a nuestros atletas? ¿Dónde son
fuertes o débiles los oponentes y cómo averiguamos sus tendencias de juego?
Afortunadamente, su equipo ha contratado a un nuevo experto en operaciones de equipo, Dar Beranek,
que se especializa en ayudar a los entrenadores a tomar decisiones tácticas. Ella está trabajando con un equipo
de estudiantes en prácticas que están creando análisis de oponentes. Usaron la película del juego anotada por
el entrenador para construir un modelo de árbol de decisión en cascada (Figura 1.3) para predecir si la próxima
jugada será una jugada de carrera o de pase. Para el coordinador defensivo, han creado mapas de calor
(Figura 1.4) de la ofensiva de pase de cada oponente, que ilustran sus tendencias a lanzar a la izquierda o a la
derecha y en qué zonas de cobertura defensiva. Finalmente, construyeron algunos análisis de series de tiempo
(Figura 1.5) sobre jugadas explosivas (definidas como una ganancia de más de 16 yardas para una jugada de
pase o más de 12 yardas para una jugada de carrera). Para cada jugada, comparan el resultado con sus
propias formaciones defensivas y las formaciones ofensivas del otro equipo, lo que ayuda al entrenador
Breedlove a reaccionar más rápidamente a los cambios de formación durante un juego. Explicaremos las
técnicas analíticas que generaron estas cifras con mucha más profundidad en los Capítulos 2 a 5 y el Capítulo 7.
El nuevo trabajo que Dar está fomentando involucra la construcción de mejores modelos de
reclutamiento de atletas en la escuela secundaria. Por ejemplo, cada año el equipo otorga becas a tres
estudiantes que son reclutas de receptores abiertos. Para Dar, elegir a los mejores jugadores va más allá de
medidas simples como qué tan rápido corren los atletas, qué tan alto saltan o qué tan largos son sus brazos, a
criterios más nuevos como qué tan rápido pueden girar la cabeza para atrapar un pase, qué tipo de reacción
veces que se exponen a múltiples estímulos y con qué precisión ejecutan las rutas de paso. Algunas de sus
ideas que ilustran estos conceptos aparecen en el sitio web de TUN; busque el estuche BSI de balón de fútbol
de precisión.4

4Investigación de escenarios empresariales BSI: El caso del fútbol de precisión (video). (Otoño de 2015). Aparece en http://
www.teradatauniversitynetwork.com/About-Us/Whats-New/BSI–Sports-Analytics—Precision-Football//,Fall 2015. (Consultado en septiembre
de 2016)
Machine Translated by Google

34 Capítulo 1 • Una descripción general de Business Intelligence, Analytics y Data Science

Ofensa

A Completo: B Completo: C Completo:


35 Total: 46 6 Total: 8 22 Total: 27
76,08% 75,00% 81,48%
Explosivo: 4 Explosivo: 5 Explosivo: 2

Línea de scrimmage

2 3
1 Completo: Completo: 12 Completo: 14 4 Completo: 5 Completo:
25 Total: 35 Total: 24 Total: 28 8 Total: 14 25 Total: 44
71,4% 50% 50% 57,14% 56,81%
Explosivo: 1 Explosivo: 0 Explosivo: 0 Explosivo: 0 Explosivo: 1

6 8
Completo: 7 7 Completo: 13 Completo: 7 9 Completo: 15
totales: 10 Total: 21 Total: 10 Total: 27
70% 61,9% 70% 55,55%
Explosivo: 2 Explosivo: 9 Explosivo: 6 Explosivo: 8

X Completo: Y Completo: Z Completo:


1 Total: 13 7 Total: 18 5 Total: 15
7,69% 38,88% 33,33%
Explosivo: 1 Explosivo: 7 Explosivo: 6

Defensa

FIGURA 1.4 Análisis de zona de mapa de calor para jugadas de pase.

ud_d_cov

ud_d_cov0

ud_d_off_pers
ud_d_cov2

ud_d_cov3 Expl_

ud_d_off_pers10 ud_d_cov4

ud_d_cov4
ATASCO
ud_d_cov6 ud_d_covBUZZ
ud_d_covFALL

ud_d_covFIRES

ud_d_covLLAMA

ud_d_off_pers11 ud_d_covMANOS
Expl_Y
ud_d_covHARD
ud_d_covHERO

ud_d_covHOT

ud_d_off_pers12
ud_d_covNIVELES

ud_d_covMIX

ud_d_off_pers20
ud_d_covROBBER

ud_d_covROLL

ud_d_off_pers21
ud_d_covSKY

ud_d_covSMOKE
ud_d_covSPARK
ud_d_off_pers22

ud_d_off_pers23 ud_d_covSENTADILLA

ud_d_off_pers30
ud_d_covESTADO
ud_d_covWALL
ud_d_off_pers31

ud_d_off_pers32

FIGURA 1.5 Análisis de series temporales de juegos explosivos.


Machine Translated by Google

Capítulo 1 • Una descripción general de Business Intelligence, Analytics y Data Science 35

FIGURA 1.6 Modelos de lesiones en el fútbol.5

Ejemplo 3: El Entrenador
El Dr. Dan Johnson es el entrenador de un equipo universitario de fútbol femenino. Su trabajo es ayudar a los jugadores a
mantenerse saludables y asesorar a los entrenadores sobre cuánta carga deben poner sobre los jugadores durante las
prácticas. También le interesa el bienestar de los jugadores, incluido cuánto duermen y cuánto descansan entre sesiones
de práctica intensas y livianas. El objetivo es garantizar que los jugadores estén listos para jugar los días de juego con la
máxima eficiencia.
Afortunadamente, debido a los dispositivos portátiles, hay muchos más datos para que los analice el Dr. Dan.
Sus jugadores entrenan usando chalecos que contienen sensores que pueden medir cargas internas como los latidos del
corazón, la temperatura corporal y la frecuencia respiratoria. Los chalecos también incluyen acelerómetros que miden
cargas externas como distancias y velocidades de carrera, así como aceleraciones y desaceleraciones. Sabe qué jugadores
se esfuerzan al máximo durante las prácticas y quiénes no.

Su enfoque en este momento es la investigación que predice o previene las lesiones de los jugadores (Figura 1.6).
Algunas tareas simples, como una prueba de sujeción de sentadillas con una sola pierna, de pie sobre un pie, luego sobre
el otro, con diferencias de puntaje de más del 10% pueden proporcionar información útil sobre las fortalezas y debilidades
del núcleo del cuerpo (Figura 1.7). Si un atleta recibe un fuerte golpe durante un partido, un entrenador puede realizar una
prueba al margen, reaccionando a un estímulo en un dispositivo móvil, lo que se suma a los protocolos tradicionales de
conmoción cerebral. Los sensores de sueño muestran quién está descansando lo suficiente (o quién estuvo de fiesta toda
la noche). Él hace que el laboratorio de resonancia magnética en el campus realice exploraciones cerebrales periódicas
para mostrar qué atletas están en riesgo de sufrir una lesión cerebral.

5 “Lesiones en el fútbol femenino”, Informe del Centro Nacional de Investigación de Lesiones Deportivas Catastróficas, NCAA. Las hojas
informativas sobre lesiones deportivas de la NCAA son producidas por el Centro Datalys para la Investigación y Prevención de Lesiones
Deportivas en colaboración con la Asociación Nacional de Atletismo Colegiado y STOP Sports Injuries. Aparece en https://www.ncaa.org/
sitios/predeterminado/archivos/NCAA_W_Soccer_Injuries_WEB.pdf. (Consultado en noviembre de 2016).
Machine Translated by Google

36 Capítulo 1 • Una descripción general de Business Intelligence, Analytics y Data Science

Z
X

X
Z

458

308

FIGURA 1.7 Prueba de sujeción en sentadilla con una


sola pierna: prueba de fuerza central del cuerpo
(Fuente: Figura adaptada de Gary Wilkerson y Ashish
Gupta).

PREGUNTAS SOBRE ESTOS EJEMPLOS

1. ¿Cuáles son los tres factores que podrían ser parte de un PM para renovaciones de boletos de temporada?
2. ¿Cuáles son dos técnicas que los equipos de fútbol pueden usar para hacer análisis de oponentes?
3. ¿Cómo pueden los wearables mejorar la salud y la seguridad de los jugadores? ¿Qué tipos de análisis nuevos
pueden usar los entrenadores?

4. ¿Qué otros usos analíticos puede imaginar en los deportes?

¿Qué podemos aprender de estas viñetas?


Más allá de los analistas comerciales de la oficina principal, los entrenadores, entrenadores y expertos en rendimiento, hay
muchas otras personas en los deportes que usan datos, desde jardineros de golf que miden las condiciones del suelo y el
césped para los torneos de la PGA, hasta árbitros de béisbol y baloncesto que son calificados. en las llamadas correctas e
incorrectas que hacen. De hecho, es difícil encontrar un área de deportes que no se vea afectada por la disponibilidad de
más datos, especialmente de los sensores.

Las habilidades que aprenderá en este libro para el análisis empresarial se aplicarán a los deportes. Si desea
profundizar más en esta área, lo alentamos a que consulte la sección Sports Analytics de Teradata University Network
(TUN), un recurso gratuito para estudiantes y profesores. En este sitio web, encontrará descripciones de lo que debe leer
para obtener más información sobre análisis de deportes, compilaciones de lugares donde puede encontrar conjuntos de
datos disponibles públicamente para análisis, así como ejemplos de proyectos de estudiantes en análisis de deportes y
entrevistas de deportes. profesionales que utilizan datos y análisis para hacer su trabajo. ¡Buena suerte aprendiendo
análisis!
Machine Translated by Google

Capítulo 1 • Una descripción general de Business Intelligence, Analytics y Data Science 37

Fuente y créditos: contribución del Dr. Dave Schrader, quien se jubiló después de 24 años en desarrollo avanzado y
marketing en Teradata. Ha permanecido en la Junta de Asesores de Teradata University Network, donde pasa su
jubilación ayudando a estudiantes y profesores a aprender más sobre análisis deportivos. Las imágenes de fútbol (Figuras
1.3–1.5) fueron construidas por Peter Liang y Jacob Pearson, estudiantes graduados de la Universidad Estatal de
Oklahoma, como parte de un proyecto estudiantil en la primavera de 2016. Las imágenes de entrenamiento (Figuras 1.6
y 1.7) están adaptadas de la imágenes proporcionadas por el Prof. Gary Wilkerson de la Universidad de Tennessee en
Chattanooga y el Prof. Ashish Gupta de la Universidad de Auburn.

1.2 Entornos comerciales cambiantes y necesidades


en evolución de soporte de decisiones y análisis
La viñeta de apertura ilustra cómo toda una industria puede emplear análisis para desarrollar informes
sobre lo que está sucediendo, predecir lo que es probable que suceda y luego también tomar decisiones
para hacer el mejor uso de la situación actual. Estos pasos requieren que una organización recopile y
analice grandes almacenes de datos. Desde los usos tradicionales en las funciones de nómina y
contabilidad, los sistemas computarizados ahora han penetrado áreas administrativas complejas que van
desde el diseño y la administración de fábricas automatizadas hasta la aplicación de métodos analíticos
para la evaluación de fusiones y adquisiciones propuestas. Casi todos los ejecutivos saben que la tecnología
de la información es vital para su negocio y utilizan ampliamente las tecnologías de la información.

Las aplicaciones informáticas han pasado de actividades de seguimiento y procesamiento de


transacciones a aplicaciones de análisis y solución de problemas, y gran parte de la actividad se realiza
con tecnologías basadas en la nube, en muchos casos a las que se accede a través de dispositivos móviles.
Las herramientas de análisis y BI, como el almacenamiento de datos, la minería de datos, el procesamiento
analítico en línea (OLAP), los tableros y el uso de sistemas basados en la nube para el soporte de
decisiones son las piedras angulares de la administración moderna actual. Los gerentes deben tener
sistemas de información en red de alta velocidad (alámbricos o inalámbricos) para ayudarlos con su tarea
más importante: tomar decisiones. En muchos casos, tales decisiones se automatizan rutinariamente,
eliminando la necesidad de cualquier intervención gerencial.
Además del crecimiento evidente en las capacidades de hardware, software y red, algunos
desarrollos han contribuido claramente a facilitar el crecimiento del soporte de decisiones y el análisis de
varias maneras, incluidas las siguientes:

• Comunicación y colaboración en grupo. Muchas decisiones son tomadas hoy por grupos cuyos
miembros pueden estar en diferentes lugares. Los grupos pueden colaborar y comunicarse fácilmente
mediante el uso de herramientas de colaboración, así como los omnipresentes teléfonos inteligentes.
La colaboración es especialmente importante a lo largo de la cadena de suministro, donde los socios,
desde los proveedores hasta los clientes, deben compartir información. Reunir un grupo de tomadores
de decisiones, especialmente expertos, en un solo lugar puede ser costoso. Los sistemas de
información pueden mejorar el proceso de colaboración de un grupo y permitir que sus miembros
estén en diferentes lugares (ahorrando costos de viaje). Más importante aún, dicha colaboración en
la cadena de suministro permite a los fabricantes conocer los patrones cambiantes de la demanda
casi en tiempo real y, por lo tanto, reaccionar más rápido a los cambios del mercado.
• Gestión de datos mejorada. Muchas decisiones implican cálculos complejos.
Los datos para estos se pueden almacenar en diferentes bases de datos en cualquier lugar de la
organización e incluso posiblemente fuera de la organización. Los datos pueden incluir texto, sonido,
gráficos y video, y estos pueden estar en diferentes idiomas. Muchas veces es necesario transmitir
datos rápidamente desde lugares distantes. Los sistemas de hoy pueden buscar, almacenar y
transmitir los datos necesarios de forma rápida, económica, segura y transparente.

• Gestión de almacenes de datos gigantes y Big Data. Los grandes almacenes de datos (DW),
como los que opera Walmart, contienen enormes cantidades de datos. Especial
Machine Translated by Google

38 Capítulo 1 • Una descripción general de Business Intelligence, Analytics y Data Science

Los métodos, incluida la computación paralela, Hadoop/Spark, etc., están disponibles para organizar, buscar y
extraer los datos. Los costos relacionados con el almacenamiento y la extracción de datos están disminuyendo
rápidamente. Las tecnologías que se incluyen en la amplia categoría de Big Data han permitido obtener datos
masivos provenientes de una variedad de fuentes y en muchas formas diferentes, lo que permite una visión muy
diferente del desempeño organizacional que no era posible en el pasado.

• Soporte analítico. Con más datos y tecnologías de análisis, se pueden evaluar más alternativas, se pueden mejorar
los pronósticos, se puede realizar un análisis de riesgos rápidamente y se pueden recopilar rápidamente y a un
costo reducido las opiniones de los expertos (algunos de los cuales pueden estar en ubicaciones remotas). . La
experiencia puede incluso derivarse directamente de los sistemas analíticos. Con tales herramientas, los tomadores
de decisiones pueden realizar simulaciones complejas, verificar muchos escenarios posibles y evaluar diversos
impactos de manera rápida y económica. Esto, por supuesto, es el enfoque de varios capítulos del libro.

• Superación de los límites cognitivos en el procesamiento y almacenamiento de la información. Según Simon


(1977), la mente humana tiene una capacidad limitada para procesar y almacenar información. A veces, a las
personas les resulta difícil recordar y utilizar la información sin errores debido a sus límites cognitivos. El término
límites cognitivos indica que la capacidad de resolución de problemas de un individuo está limitada cuando se
requiere una amplia gama de información y conocimientos diversos. Los sistemas computarizados permiten a las
personas superar sus límites cognitivos accediendo y procesando rápidamente grandes cantidades de información
almacenada.

• Conocimiento administrativo. Las organizaciones han recopilado una gran cantidad de información sobre sus
propias operaciones, clientes, procedimientos internos, interacciones de los empleados, etc., a través de las
comunicaciones estructuradas y no estructuradas que tienen lugar entre las diversas partes interesadas. Los
sistemas de gestión del conocimiento se han convertido en fuentes de apoyo formales e informales para la toma
de decisiones de los directivos, aunque en ocasiones ni siquiera se les llame KMS. Tecnologías como el análisis
de texto e IBM Watson están haciendo posible generar valor a partir de dichos almacenes de conocimiento.

• Soporte en cualquier lugar y en cualquier momento. Usando tecnología inalámbrica, los gerentes pueden
acceder a la información en cualquier momento y desde cualquier lugar, analizarla e interpretarla y comunicarse
con los involucrados. Este es quizás el cambio más grande que ha ocurrido en los últimos años. La velocidad a la
que se debe procesar la información y convertirla en decisiones realmente ha cambiado las expectativas tanto de
los consumidores como de las empresas.
Estas y otras capacidades han estado impulsando el uso de soporte de decisiones computarizado desde finales
de la década de 1960, pero especialmente desde mediados de la década de 1990. El crecimiento de las tecnologías
móviles, las plataformas de redes sociales y las herramientas analíticas ha permitido un nivel diferente de soporte
de sistemas de información (IS) para los gerentes. Este crecimiento en la prestación de soporte basado en datos
para cualquier decisión se extiende no solo a los gerentes sino también a los consumidores. Primero estudiaremos
una descripción general de las tecnologías a las que se ha hecho referencia en general como BI. A partir de ahí,
ampliaremos nuestros horizontes para introducir varios tipos de análisis.

SECCIÓN 1.2 PREGUNTAS DE REVISIÓN

1. ¿Cuáles son algunas de las tendencias clave orientadas al sistema que han fomentado
toma de decisiones a un nuevo nivel?
2. Enumerar algunas capacidades de los sistemas de información que pueden facilitar la toma de decisiones gerenciales
haciendo.
3. ¿Cómo puede una computadora ayudar a superar los límites cognitivos de los humanos?
Machine Translated by Google

Capítulo 1 • Una descripción general de Business Intelligence, Analytics y Data Science 39

1.3 Evolución del soporte de decisiones computarizado


para análisis/ciencia de datos
La línea de tiempo en la Figura 1.8 muestra la terminología utilizada para describir el análisis desde la década de
1970. Durante la década de 1970, el enfoque principal del soporte de los sistemas de información para la toma de
decisiones se centró en proporcionar informes periódicos estructurados que un gerente podría usar para la toma
de decisiones (o ignorarlos). Las empresas comenzaron a crear informes de rutina para informar a los tomadores
de decisiones (gerentes) sobre lo que había sucedido en el período anterior (por ejemplo, día, semana, mes,
trimestre). Aunque era útil saber lo que había sucedido en el pasado, los gerentes necesitaban más que esto:
necesitaban una variedad de informes en diferentes niveles de granularidad para comprender mejor y abordar las
necesidades cambiantes y los desafíos del negocio. Por lo general, estos se denominaron sistemas de información
gerencial (MIS). A principios de la década de 1970, Scott-Morton articuló por primera vez los principales conceptos
de DSS. Él definió los DSS como “sistemas interactivos basados en computadora, que ayudan a los tomadores de
decisiones a utilizar datos y modelos para resolver problemas no estructurados” (Gorry y Scott-Morton, 1971). La
siguiente es otra definición clásica de DSS, proporcionada por Keen y Scott-Morton (1978):

Los sistemas de soporte de decisiones combinan los recursos intelectuales de las personas con las capacidades
de la computadora para mejorar la calidad de las decisiones. Es un sistema de apoyo basado en computadora
para los tomadores de decisiones gerenciales que se ocupan de problemas semiestructurados.

Tenga en cuenta que el término sistema de soporte de decisiones, como sistema de información de gestión
y varios otros términos en el campo de TI, es una expresión libre de contenido (es decir, significa diferentes cosas
para diferentes personas). Por lo tanto, no existe una definición universalmente aceptada de DSS.

Durante los primeros días de la analítica, los datos a menudo se obtenían de los expertos del dominio
mediante procesos manuales (es decir, entrevistas y encuestas) para construir modelos matemáticos o basados
en el conocimiento para resolver problemas de optimización restringidos. La idea era hacer lo mejor con recursos
limitados. Dichos modelos de apoyo a la decisión se denominaron típicamente investigación de operaciones (OR).
Los problemas que eran demasiado complejos para resolverlos de manera óptima (utilizando técnicas de
programación matemática lineal o no lineal) se abordaron utilizando métodos heurísticos como los modelos de
simulación. (Los presentaremos como análisis prescriptivos más adelante en este capítulo y con un poco más de
detalle en el Capítulo 6).
A fines de la década de 1970 y principios de la de 1980, además de los modelos OR maduros que se
usaban en muchas industrias y sistemas gubernamentales, había surgido una nueva y emocionante línea de
modelos: los sistemas expertos basados en reglas. Estos sistemas prometían capturar el conocimiento de los
expertos en un formato que las computadoras pudieran procesar (a través de una colección de reglas if-then-else
o heurísticas) para que pudieran usarse para consultas de la misma manera que uno

InformesSistemas
de rutinade soporte de
AI/Sistemas decisiones
expertos
Informes DBMS
estáticos relacional
bajo
Almacenamientodemanda Cuadros
de datos de planificación dederecursos
Sistemas mando yempresariales
cuadros ejecutiva
de información de mando AnálisisAnálisis
Informática en la nube, SaaS Minería de datos/texto Inteligencia empresarial de redes
de bigsociales/medios
data In-Memory, In-Database

1970 1980 1990 años 2000 2010s

Sistemas de apoyo a la toma de decisiones Enterprise/Executive IS Inteligencia de negocios Analítica Big Data...

FIGURA 1.8 Evolución del soporte de decisiones, inteligencia comercial y análisis.


Machine Translated by Google

40 Capítulo 1 • Una descripción general de Business Intelligence, Analytics y Data Science

utilizaría expertos de dominio para identificar un problema estructurado y prescribir la solución más probable. Los
ES permitieron poner a disposición la experiencia escasa donde y cuando se necesitaba, utilizando un DSS
"inteligente".
La década de 1980 vio un cambio significativo en la forma en que las organizaciones capturaban datos
relacionados con el negocio. La práctica anterior había sido tener múltiples sistemas de información inconexos
adaptados para capturar datos transaccionales de diferentes unidades o funciones organizacionales (por ejemplo,
contabilidad, marketing y ventas, finanzas, manufactura). En la década de 1980, estos sistemas se integraron
como sistemas de información de nivel empresarial que ahora comúnmente llamamos sistemas de planificación
de recursos empresariales (ERP). Los antiguos esquemas de representación de datos, en su mayoría secuenciales
y no estandarizados, fueron reemplazados por sistemas de gestión de bases de datos relacionales (RDBM). Estos
sistemas permitieron mejorar la captura y almacenamiento de datos, así como las relaciones entre los campos de
datos organizacionales al tiempo que redujeron significativamente la replicación de información. La necesidad de
sistemas RDBM y ERP surgió cuando la integridad y la consistencia de los datos se convirtieron en un problema,
lo que obstaculizó significativamente la efectividad de las prácticas comerciales. Con ERP, todos los datos de
todos los rincones de la empresa se recopilan e integran en un esquema consistente para que cada parte de la
organización tenga acceso a la versión única de la verdad cuando y donde sea necesario. Además de la aparición
de los sistemas ERP, o quizás debido a estos sistemas, los informes comerciales se convirtieron en una práctica
comercial a pedido y según las necesidades. Los tomadores de decisiones podían decidir cuándo necesitaban o
querían crear informes especializados para investigar problemas y oportunidades organizacionales.

En la década de 1990, la necesidad de informes más versátiles condujo al desarrollo de sistemas de


información ejecutiva (EIS; DSS diseñados y desarrollados específicamente para ejecutivos y sus necesidades
de toma de decisiones). Estos sistemas se diseñaron como tableros gráficos y tarjetas de puntuación para que
pudieran servir como pantallas visualmente atractivas mientras se enfocaban en los factores más importantes
para que los tomadores de decisiones hicieran un seguimiento de los indicadores clave de desempeño. Para
hacer posible esta generación de informes altamente versátil y mantener intacta la integridad transaccional de los
sistemas de información comercial, fue necesario crear un nivel de datos intermedio conocido como DW como
depósito para respaldar específicamente los informes comerciales y la toma de decisiones. En muy poco tiempo,
la mayoría de las grandes y medianas empresas adoptaron el almacenamiento de datos como su plataforma para
la toma de decisiones en toda la empresa. Los tableros y los cuadros de mando obtuvieron sus datos de un DW
y, al hacerlo, no obstaculizaron la eficiencia de los sistemas de transacciones comerciales, en su mayoría
denominados sistemas (ERP).
En la década de 2000, los DSS impulsados por DW comenzaron a denominarse sistemas de BI. A medida
que aumentaba la cantidad de datos longitudinales acumulados en los DW, también lo hacían las capacidades del
hardware y el software para mantenerse al día con las necesidades cambiantes y en constante evolución de los
responsables de la toma de decisiones. Debido al mercado competitivo globalizado, los encargados de tomar
decisiones necesitaban información actual en un formato muy digerible para abordar los problemas comerciales y
aprovechar las oportunidades del mercado de manera oportuna. Debido a que los datos en un DW se actualizan
periódicamente, no reflejan la información más reciente. Para elevar este problema de latencia de la información,
los proveedores de DW desarrollaron un sistema para actualizar los datos con mayor frecuencia, lo que condujo
a los términos almacenamiento de datos en tiempo real y, de manera más realista, almacenamiento de datos en
el momento adecuado, que se diferencia del primero por adoptar un data-warehousing. política de actualización
basada en la actualización necesaria de los elementos de datos (es decir, no es necesario actualizar todos los
elementos de datos en tiempo real). Los DW son muy grandes y tienen muchas funciones, y se hizo necesario
"minar" los datos corporativos para "descubrir" nuevos y útiles fragmentos de conocimiento para mejorar los
procesos y prácticas comerciales, de ahí los términos minería de datos y minería de texto. Con los crecientes
volúmenes y variedades de datos, surgieron las necesidades de más almacenamiento y más poder de procesamiento.
Si bien las grandes corporaciones tenían los medios para abordar este problema, las pequeñas y medianas
empresas necesitaban modelos comerciales más manejables desde el punto de vista financiero. Esta necesidad
condujo a la arquitectura y el software orientados a los servicios y a los modelos de negocio analíticos de
infraestructura como servicio. Las empresas más pequeñas, por lo tanto, obtuvieron acceso a las capacidades analíticas en un
Machine Translated by Google

Capítulo 1 • Una descripción general de Business Intelligence, Analytics y Data Science 41

según sea necesario y pagaron solo por lo que usaron, en lugar de invertir en recursos de hardware y software
financieramente prohibitivos.
En la década de 2010, estamos viendo otro cambio de paradigma en la forma en que se capturan y utilizan los
datos. En gran parte debido al uso generalizado de Internet, han surgido nuevos medios de generación de datos. De
todas las nuevas fuentes de datos (p. ej., etiquetas de identificación por radiofrecuencia [RFID], medidores de energía
digital, registros web de seguimiento de clics, dispositivos domésticos inteligentes, equipos portátiles de control de la
salud), quizás la más interesante y desafiante son las redes sociales/medios sociales. Estos datos no estructurados
son ricos en contenido de información, pero el análisis de tales fuentes de datos plantea desafíos importantes para los
sistemas computacionales, tanto desde la perspectiva del software como del hardware. Recientemente, el término Big
Data se ha acuñado para resaltar los desafíos que nos han traído estos nuevos flujos de datos. Se han desarrollado
muchos avances tanto en hardware (p. ej., procesamiento paralelo masivo con memoria computacional muy grande y
sistemas informáticos de multiprocesador altamente paralelos) como en software/algoritmos (p. ej., Hadoop con
MapReduce y NoSQL) para abordar los desafíos de Big Data.

Es difícil predecir lo que traerá la próxima década y cuáles serán los nuevos términos relacionados con el
análisis. El tiempo entre los nuevos cambios de paradigma en los sistemas de información y, en particular, en el análisis
se ha ido reduciendo, y esta tendencia continuará en el futuro previsible. Aunque la analítica no es nueva, la explosión
de su popularidad es muy nueva. Gracias a la reciente explosión de Big Data, las formas de recopilar y almacenar estos
datos y las herramientas de software intuitivas, los conocimientos basados en datos son más accesibles que nunca
para los profesionales de negocios. Por lo tanto, en medio de la competencia global, existe una gran oportunidad de
tomar mejores decisiones administrativas mediante el uso de datos y análisis para aumentar los ingresos y reducir los
costos al crear mejores productos, mejorar la experiencia del cliente y detectar el fraude antes de que suceda, lo que
mejora la participación del cliente. a través de la orientación y la personalización, todo con el poder del análisis y los
datos. Cada vez son más las empresas que preparan a sus empleados con conocimientos de análisis empresarial para
impulsar la eficacia y la eficiencia en sus procesos de toma de decisiones del día a día.

La siguiente sección se centra en un marco para BI. Aunque la mayoría de las personas estaría de acuerdo en
que BI se ha convertido en análisis y ciencia de datos, muchos proveedores e investigadores todavía usan ese término.
Entonces, la Sección 1.4 rinde homenaje a esa historia al enfocarse específicamente en lo que se ha llamado BI.
Después de la siguiente sección, presentamos el análisis y lo usaremos como la etiqueta para clasificar todos los
conceptos relacionados.

SECCIÓN 1.3 PREGUNTAS DE REVISIÓN

1. Enumere tres de los términos que han sido predecesores de la analítica.


2. ¿Cuál fue la principal diferencia entre los sistemas denominados MIS, DSS y Executive?
¿Soporte de sistemas?
3. ¿DSS evolucionó a BI o viceversa?

1.4 Un marco para la inteligencia empresarial


Los conceptos de soporte de decisiones presentados en las Secciones 1.2 y 1.3 han sido implementados gradualmente,
bajo diferentes nombres, por muchos proveedores que han creado herramientas y metodologías para el soporte de
decisiones. Como se señaló en la Sección 1.3, a medida que crecían los sistemas de toda la empresa, los gerentes
podían acceder a informes fáciles de usar que les permitían tomar decisiones rápidamente. Estos sistemas, que
generalmente se denominaban EIS, comenzaron a ofrecer capacidades adicionales de visualización, alertas y medición
del rendimiento. Para 2006, los principales productos y servicios comerciales aparecieron bajo el término inteligencia
de negocios (BI).
Machine Translated by Google

42 Capítulo 1 • Una descripción general de Business Intelligence, Analytics y Data Science

Definiciones de BI
Business Intelligence (BI) es un término general que combina arquitecturas, herramientas, bases de
datos, herramientas analíticas, aplicaciones y metodologías. Es, como DSS, una expresión sin
contenido, por lo que significa diferentes cosas para diferentes personas. Parte de la confusión sobre
BI radica en la ráfaga de acrónimos y palabras de moda que se asocian con él (por ejemplo, gestión del
rendimiento empresarial [BPM]). El objetivo principal de BI es permitir el acceso interactivo (a veces en
tiempo real) a los datos, permitir la manipulación de datos y brindar a los gerentes y analistas
comerciales la capacidad de realizar análisis apropiados. Mediante el análisis de datos, situaciones y
actuaciones históricas y actuales, los responsables de la toma de decisiones obtienen información
valiosa que les permite tomar mejores y más informadas decisiones. El proceso de BI se basa en la
transformación de datos en información, luego en decisiones y finalmente en acciones.

Una breve historia de BI


El término BI fue acuñado por Gartner Group a mediados de la década de 1990. Sin embargo, como
señala la historia en la sección anterior, el concepto es mucho más antiguo; tiene sus raíces en los
sistemas de informes MIS de la década de 1970. Durante ese período, los sistemas de informes eran
estáticos, bidimensionales y no tenían capacidades analíticas. A principios de la década de 1980, surgió
el concepto de EIS. Este concepto amplió el soporte computarizado a los gerentes y ejecutivos de
primer nivel. Algunas de las capacidades introducidas fueron informes dinámicos multidimensionales
(ad hoc o bajo demanda), pronósticos y predicciones, análisis de tendencias, desglose de detalles,
acceso al estado y factores críticos de éxito. Estas características aparecieron en docenas de productos
comerciales hasta mediados de la década de 1990. Luego aparecieron las mismas capacidades y
algunas nuevas bajo el nombre BI. Hoy en día, un buen sistema de información empresarial basado en
BI contiene toda la información que necesitan los ejecutivos. Entonces, el concepto original de EIS se
transformó en BI. Para 2005, los sistemas de BI comenzaron a incluir capacidades de inteligencia
artificial, así como poderosas capacidades analíticas. La figura 1.9 ilustra las diversas herramientas y
técnicas que pueden incluirse en un sistema de BI. También ilustra la evolución de BI. Las herramientas
que se muestran en la Figura 1.9 proporcionan las capacidades de BI. Los productos de BI más
sofisticados incluyen la mayoría de estas capacidades; otros se especializan en solo algunos de ellos.

La arquitectura de BI
Un sistema de BI tiene cuatro componentes principales: un DW, con sus datos de origen; análisis de
negocios, una colección de herramientas para manipular, extraer y analizar los datos en el DW; BPM
para monitorear y analizar el desempeño; y una interfaz de usuario (por ejemplo, un tablero). La
relación entre estos componentes se ilustra en la Figura 1.10.

Los orígenes y los impulsores de BI


¿De dónde provienen los enfoques modernos de almacenamiento de datos y BI? ¿Cuáles son sus
raíces y cómo afectan esas raíces la forma en que las organizaciones gestionan estas iniciativas en la
actualidad? Las inversiones actuales en tecnología de la información están bajo un mayor escrutinio en
términos de su impacto final y potencial. Lo mismo ocurre con DW y las aplicaciones de BI que hacen
posibles estas iniciativas.
Las organizaciones se ven obligadas a capturar, comprender y aprovechar sus datos para
respaldar la toma de decisiones para mejorar las operaciones comerciales. La legislación y la regulación
(p. ej., la Ley Sarbanes-Oxley de 2002) ahora requieren que los líderes empresariales documenten sus
procesos comerciales y firmen la legitimidad de la información en la que confían e informen a las partes
interesadas. Además, los tiempos del ciclo comercial ahora están extremadamente comprimidos; Por lo
tanto, una toma de decisiones más rápida, más informada y mejor es un imperativo competitivo. Los
gerentes necesitan la información correcta en el momento correcto y en el lugar correcto. Este es el
mantra de los enfoques modernos de BI.
Machine Translated by Google

Capítulo 1 • Una descripción general de Business Intelligence, Analytics y Data Science 43

Consultas e ETL
informes

metadatos Almacén de datos

DSS
EIS/ESS

Data marts hojas de calculo


Informes
(MS Excel)
financieros

OLAP

Cabinas y tableros
digitales
Negocio
Cuadros de mando y Inteligencia
cuadros de mando

flujo de trabajo

Alertas y
notificaciones

Minería de
datos y texto Analítica Herramientas de
Portales
predictiva difusión

FIGURA 1.9 Evolución de la Inteligencia de Negocios (BI).

Almacén de datos Análisis de negocio Rendimiento y


Ambiente Ambiente Estrategia

Datos
Personal técnico Usuarios comerciales Gerentes/ejecutivos
Fuentes
Construir el almacén de datos Acceso estrategias BPM
- Organizar Almacén de datos
- Resumiendo manipulación, resultados
- Estandarización

Interfaz de usuario

Componente futuro: - Navegador


Sistemas inteligentes -Portal
- Tablero

FIGURA 1.10 Arquitectura de alto nivel de BI. (Fuente: Basado en W. Eckerson, Smart Companies in the 21st Century: The
Secrets of Creating Successful Business Intelligent Solutions. The Data Warehousing Institute, Seattle, WA, 2003, p. 32, Ilustración
5.)

Las organizaciones tienen que trabajar inteligentemente. Prestar especial atención a la gestión
de las iniciativas de BI es un aspecto necesario para hacer negocios. No sorprende, entonces, que
las organizaciones defiendan cada vez más BI y bajo su nueva encarnación como análisis. El caso
de aplicación 1.1 ilustra una de esas aplicaciones de BI que ha ayudado a muchas aerolíneas y, por
supuesto, a las empresas que ofrecen tales servicios a las aerolíneas.
Machine Translated by Google

44 Capítulo 1 • Una descripción general de Business Intelligence, Analytics y Data Science

Caso de aplicación 1.1


Sabre ayuda a sus clientes a través de paneles y análisis

Sabre es uno de los líderes mundiales en la industria de los viajes y revisión más enfocada de los datos con menos esfuerzo y tiempo. Esto

ofrece tanto servicios de empresa a consumidor como servicios de facilita el diálogo del equipo al hacer que los datos/
empresa a empresa. Sirve a viajeros, agentes de viajes, corporaciones y métricas relacionadas con el rendimiento de ventas disponibles para
proveedores de viajes a través de sus cuatro empresas principales: muchas partes interesadas, incluida la emisión de boletos, los asientos
Travelocity, Sabre Travel Network, Sabre Airline Solutions y Sabre vendidos y volados, el rendimiento operativo, incluidos los datos sobre el
Hospitality Solutions. El volátil entorno económico mundial actual plantea movimiento y el seguimiento de vuelos, las reservas de clientes, el
importantes desafíos competitivos para la industria de las aerolíneas. Para inventario y los ingresos en los múltiples canales de distribución de una
mantenerse por delante de la competencia, Sabre Airline Solutions aerolínea. Los sistemas de tablero brindan infraestructura escalable,
reconoció que los ejecutivos de las aerolíneas necesitaban herramientas soporte de interfaz gráfica de usuario, integración y agregación de datos
mejoradas para administrar sus decisiones comerciales al eliminar el que permiten a los ejecutivos de las aerolíneas ser más proactivos al
proceso tradicional, manual y lento de agregar información financiera y de tomar acciones que generan impactos positivos en la salud general de su
otro tipo necesaria para iniciativas procesables. Esto permite el soporte de aerolínea.
decisiones en tiempo real en aerolíneas de todo el mundo para maximizar
su retorno de la información (y, a su vez, el de Sabre) al generar Con su ETDW, Sabre también podría desarrollar otras soluciones
conocimientos, inteligencia procesable y valor para los clientes a partir de analíticas y de generación de informes basadas en la Web que aprovechan
los datos crecientes. los datos para obtener información sobre los clientes a través del análisis
de los perfiles de los clientes y sus interacciones de ventas para calcular
el valor del cliente. Esto permite una mejor segmentación de clientes y

conocimientos para servicios de valor agregado.


Sabre desarrolló un Enterprise Travel Data Warehouse (ETDW)
utilizando Teradata para almacenar sus datos masivos de reservaciones. Preguntas para la discusión
ETDW se actualiza casi en tiempo real con lotes que se ejecutan cada 15 1. ¿Qué es el periodismo tradicional? ¿Cómo se utiliza en la organización?
minutos, recopilando datos de todos los negocios de Sabre. Sabre usa su
ETDW para crear Sabre Executive Dashboards que brindan información
2. ¿Cómo se pueden usar los análisis para transformar los informes
ejecutiva casi en tiempo real utilizando una plataforma Cognos BI con
tradicionales?
infraestructuras de tecnología Oracle Data Integrator y Oracle Goldengate.
3. ¿Cómo pueden los informes interactivos ayudar a las organizaciones?
ciones en la toma de decisiones?

Los tableros ejecutivos ofrecen a los gerentes de alto nivel y a los

tomadores de decisiones de las aerolíneas clientes una solución oportuna,


Lo que podemos aprender de esto
automatizada y fácil de usar, agregando métricas de desempeño críticas
Caso de aplicación
de manera sucinta y brindando de un vistazo una vista de 360 grados de
la salud general de la aerolínea. En una aerolínea, los tableros ejecutivos Este caso muestra que las organizaciones que anteriormente usaban
de Sabre brindan a la alta gerencia una instantánea diaria e intradiaria de informes solo para realizar un seguimiento de sus actividades comerciales
los indicadores clave de rendimiento en una sola aplicación que reemplaza internas y cumplir con los requisitos de cumplimiento establecidos por el
el proceso de 8 horas una vez a la semana de generar el mismo informe gobierno ahora están avanzando hacia la generación de inteligencia
a partir de varias fuentes de datos. El uso de tableros no se limita a los procesable a partir de sus datos comerciales transaccionales. Los informes
clientes externos; Sabre también los utiliza para su evaluación del se han vuelto más amplios a medida que las organizaciones ahora intentan
desempeño operativo interno. analizar los datos transaccionales archivados para comprender las
tendencias y patrones ocultos subyacentes que les permitirán tomar

mejores decisiones al obtener información sobre áreas problemáticas y


resolverlas para buscar oportunidades de mercado actuales y futuras. Los
Los tableros ayudan a los clientes de Sabre a tener una informes han avanzado a informes en línea interactivos, que permiten a
comprensión clara de los datos a través de pantallas visuales que los usuarios extraer y crear informes personalizados rápidos.
incorporan capacidades interactivas de desglose. Reemplaza las
presentaciones planas y permite una
Machine Translated by Google

Capítulo 1 • Una descripción general de Business Intelligence, Analytics y Data Science 45

informes e incluso presentar los informes con la ayuda de Fuente: Teradata.com, "Sabre Airline Solutions", Terry, D. (2011),
herramientas de visualización que tienen la capacidad de "Sabre Streamlines Decision Making", http://www.teradatamaga
zine.com/v11n04/Features/Sabre-Streamlines-Decision-Making/
conectarse a la base de datos, proporcionando la capacidad de
(Consultado en julio de 2016).
profundizar en los datos resumidos.

Un ejercicio multimedia en Business Intelligence


TUN incluye videos (similares al programa de televisión CSI) para ilustrar conceptos de análisis en diferentes
industrias. Estos se denominan “Videos BSI (investigaciones de escenarios comerciales)”.
No solo son entretenidos, sino que también le brindan a la clase algunas preguntas para debatir. Para empezar,
vaya a http://www.teradatauniversitynetwork.com
/Library/Items/BSI–The-Case-of-the-Misconnecting-Passengers/ o www.youtube.com
/reloj?v=NXEL5F4_aKA. Mira el video que aparece en YouTube. Esencialmente, debe asumir el papel de un
profesional del centro de atención al cliente. Un vuelo entrante se retrasa y es probable que varios pasajeros
pierdan sus vuelos de conexión. Hay asientos en un vuelo saliente que pueden acomodar a dos de los cuatro
pasajeros. ¿Qué dos pasajeros deben tener prioridad? Se le proporciona información sobre los perfiles de los
clientes y las relaciones con la aerolínea. Sus decisiones pueden cambiar a medida que aprende más sobre los
perfiles de esos clientes.

Mire el video, póngalo en pausa según corresponda y responda las preguntas sobre qué pasajeros deben
tener prioridad. Luego reanude el video para obtener más información. Una vez que se completa el video, puede
ver las diapositivas relacionadas con este video y cómo se preparó el análisis en un conjunto de diapositivas en
www.slideshare.net/teradata/bsi-how-we-did-it-the
-caso-de-los-pasajeros-desconectados.
Esta excursión multimedia proporciona un ejemplo de cómo la información adicional disponible a través
de un DW empresarial puede ayudar en la toma de decisiones.
Aunque algunas personas equiparan DSS con BI, estos sistemas no son, en la actualidad, lo mismo. Es
interesante notar que algunas personas creen que DSS es parte de BI, una de sus herramientas analíticas. Otros
piensan que BI es un caso especial de DSS que se ocupa principalmente de informes, comunicación y
colaboración (una forma de DSS orientado a datos). Otra explicación (Watson, 2005) es que BI es el resultado
de una revolución continua, y como tal, DSS es uno de los elementos originales de BI. Además, como se indica
en la siguiente sección, en muchos círculos, BI se ha incluido en los nuevos términos análisis o ciencia de datos.

Procesamiento de transacciones versus procesamiento analítico


Para ilustrar las principales características de BI, primero mostraremos lo que BI no es, es decir, el procesamiento
de transacciones. Todos estamos familiarizados con los sistemas de información que respaldan nuestras
transacciones, como retiros de cajeros automáticos, depósitos bancarios, escaneos de cajas registradoras en la
tienda de comestibles, etc. Estos sistemas de procesamiento de transacciones están constantemente involucrados
en el manejo de actualizaciones de lo que podríamos llamar bases de datos operativas. Por ejemplo, en una
transacción de retiro de cajero automático, necesitamos reducir nuestro saldo bancario en consecuencia; un
depósito bancario se suma a una cuenta; y una compra en una tienda de comestibles probablemente se refleje
en el cálculo de las ventas totales del día de la tienda, y debería reflejar una reducción adecuada en el inventario
de la tienda para los artículos que compramos, y así sucesivamente. Estos sistemas de procesamiento de
transacciones en línea (OLTP) manejan los negocios en curso de rutina de una empresa. Por el contrario, un
DW suele ser un sistema distinto que proporciona almacenamiento para los datos que se utilizarán para el
análisis. La intención de ese análisis es darle a la gerencia la capacidad de rastrear los datos en busca de
información sobre el negocio, y se puede usar para proporcionar apoyo para la toma de decisiones tácticas u operativas, mediante el cual, por ejemplo,
Machine Translated by Google

46 Capítulo 1 • Una descripción general de Business Intelligence, Analytics y Data Science

el personal de línea puede tomar decisiones más rápidas y/o más informadas. Proporcionaremos una
definición más técnica de DW en el Capítulo 2, pero baste decir que los DW están destinados a trabajar
con datos informativos utilizados para sistemas de procesamiento analítico en línea (OLAP) .
La mayoría de los datos operativos en los sistemas de planificación de recursos empresariales
(ERP), y en sus hermanos complementarios, como la gestión de la cadena de suministro (SCM) o CRM,
se almacenan en un sistema OLTP, que es un tipo de procesamiento informático en el que la computadora
responde inmediatamente a las solicitudes de los usuarios. Cada solicitud se considera una transacción,
que es un registro computarizado de un evento discreto, como la recepción de inventario o el pedido de
un cliente. En otras palabras, una transacción requiere un conjunto de dos o más actualizaciones de la
base de datos que deben completarse en forma de todo o nada.
El mismo diseño que hace que un sistema OLTP sea eficiente para el procesamiento de
transacciones lo hace ineficiente para los informes, consultas y análisis ad hoc del usuario final. En la
década de 1980, muchos usuarios comerciales se referían a sus mainframes como "agujeros negros"
porque toda la información entraba en ellos, pero nunca regresaba. Todas las solicitudes de informes
debían ser programadas por el personal de TI, mientras que solo los informes "preestablecidos" podían
generarse de forma programada, y las consultas ad hoc en tiempo real eran prácticamente imposibles.
Aunque los sistemas ERP basados en cliente/servidor de la década de 1990 eran algo más amigables
con los informes, todavía ha estado muy lejos de ser la usabilidad deseada por los usuarios finales
regulares, no técnicos, para cosas como informes operativos, análisis interactivo, etc. Para resolver estos
problemas, se crearon las nociones de DW y BI.
Los DW contienen una amplia variedad de datos que presentan una imagen coherente de las
condiciones comerciales en un solo punto en el tiempo. La idea era crear una infraestructura de base de
datos que estuviera siempre en línea y que contuviera toda la información de los sistemas OLTP, incluidos
los datos históricos, pero reorganizada y estructurada de tal manera que fuera rápida y eficiente para
consultas, análisis y soporte de decisiones. Separar el OLTP del soporte de análisis y decisiones permite
los beneficios de BI que se describieron anteriormente.

Adecuada Planificación y Alineación con la Estrategia de Negocio


En primer lugar, las razones fundamentales para invertir en BI deben estar alineadas con la estrategia
comercial de la empresa. BI no puede ser simplemente un ejercicio técnico para el departamento de
sistemas de información. Tiene que servir como una forma de cambiar la forma en que la empresa realiza
negocios al mejorar sus procesos comerciales y transformar los procesos de toma de decisiones para
que estén más basados en datos. Muchos consultores y profesionales de BI involucrados en iniciativas
exitosas de BI advierten que un marco para la planificación es una condición previa necesaria.
Un marco, desarrollado por Gartner, Inc. (2004), descompone la planificación y la ejecución en
componentes de negocio, organización, funcionalidad e infraestructura. A nivel empresarial y
organizacional, los objetivos estratégicos y operativos deben definirse considerando las habilidades
organizacionales disponibles para lograr esos objetivos. La alta dirección debe considerar los problemas
de la cultura organizacional que rodean las iniciativas de BI y generar entusiasmo por esas iniciativas y
procedimientos para el intercambio dentro de la organización de las mejores prácticas de BI, con planes
establecidos para preparar a la organización para el cambio. Uno de los primeros pasos en ese proceso
es evaluar la organización de SI, los conjuntos de habilidades de las clases potenciales de usuarios y si
la cultura es susceptible de cambio. A partir de esta evaluación, y suponiendo que exista una justificación
y la necesidad de avanzar, una empresa puede elaborar un plan de acción detallado. Otro tema crítico
para el éxito de la implementación de BI es la integración de varios proyectos de BI (la mayoría de las
empresas usan varios proyectos de BI) entre ellos y con los otros sistemas de TI en la organización y sus
socios comerciales.
Si la estrategia de la empresa está adecuadamente alineada con las razones de las iniciativas de
DW y BI, y si la organización de SI de la empresa es o puede ser capaz de desempeñar su papel en dicho
proyecto, y si la comunidad de usuarios necesaria está en su lugar y tiene la motivación adecuada, es
aconsejable iniciar BI y establecer un Centro de competencia de BI dentro de la empresa. El centro podría
cumplir algunas o todas las siguientes funciones (Gartner, 2004):
Machine Translated by Google

Capítulo 1 • Una descripción general de Business Intelligence, Analytics y Data Science 47

• El centro puede demostrar cómo BI está claramente vinculado a la estrategia y ejecución de


estrategia.
• Un centro puede servir para fomentar la interacción entre las comunidades de usuarios empresariales potenciales
y la organización de SI.
• El centro puede servir como repositorio y difusor de las mejores prácticas de BI entre las diferentes líneas de
negocio.
• Los estándares de excelencia en las prácticas de BI pueden ser defendidos y fomentados a través de
fuera de la empresa.
• La organización de SI puede aprender mucho a través de la interacción con las comunidades de usuarios,
como el conocimiento sobre la variedad de tipos de herramientas analíticas que se necesitan.

• La comunidad de usuarios comerciales y la organización de SI pueden comprender mejor por qué la plataforma
DW debe ser lo suficientemente flexible para adaptarse a los cambiantes requisitos comerciales.
• Puede ayudar a las partes interesadas importantes, como los ejecutivos de alto nivel, a ver cómo BI puede jugar
Un rol importante.

Otro factor de éxito importante de BI es su capacidad para facilitar un tiempo real, en


exigen un entorno ágil, que se presenta a continuación.

BI en tiempo real bajo demanda es alcanzable


La demanda de acceso instantáneo y bajo demanda a información dispersa ha crecido a medida que la necesidad de
cerrar la brecha entre los datos operativos y los objetivos estratégicos se ha vuelto más apremiante. Como resultado,
ha surgido una categoría de productos denominada aplicaciones de BI en tiempo real.
La introducción de nuevas tecnologías de generación de datos, como RFID y otros sensores, solo está acelerando
este crecimiento y la subsiguiente necesidad de BI en tiempo real. Los sistemas de BI tradicionales utilizan un gran
volumen de datos estáticos que se han extraído, limpiado y cargado en un DW para generar informes y análisis. Sin
embargo, la necesidad no es solo informar porque los usuarios necesitan monitoreo comercial, análisis de rendimiento
y una comprensión de por qué suceden las cosas. Estos pueden ayudar a los usuarios que necesitan saber
(prácticamente en tiempo real) sobre los cambios en los datos o la disponibilidad de informes, alertas y notificaciones
relevantes sobre eventos y tendencias emergentes en las aplicaciones de redes sociales. Además, las aplicaciones
comerciales se pueden programar para actuar sobre lo que descubren estos sistemas de BI en tiempo real. Por
ejemplo, una aplicación de SCM puede realizar automáticamente un pedido de más "widgets" cuando el inventario en
tiempo real cae por debajo de un cierto umbral o cuando una aplicación de CRM activa automáticamente a un
representante de servicio al cliente y al empleado de control de crédito para verificar un cliente que ha realizado un
pedido. un pedido en línea mayor a $10,000.

Un enfoque de BI en tiempo real utiliza el modelo DW de los sistemas de BI tradicionales. En este caso, los
productos de innovadores proveedores de plataformas de BI brindan una solución casi en tiempo real orientada a
servicios que llena el DW mucho más rápido que el típico extracto nocturno/
la actualización por lotes de transferencia/carga sí lo hace (consulte el Capítulo 3). Los proveedores de middleware de
BAM puro y/o BAM híbrido (como Savvion, Iteration Software, Vitria, webMethods, Quantive, Tibco o Vineyard
Software) adoptan un segundo enfoque, comúnmente denominado gestión de la actividad empresarial (BAM). Omite
el DW por completo y utiliza servicios web u otros medios de monitoreo para descubrir eventos comerciales clave.
Estos monitores de software (o agentes inteligentes) se pueden colocar en un servidor separado en la red o en las
propias bases de datos de aplicaciones transaccionales, y pueden usar enfoques basados en eventos y procesos para
medir y monitorear de manera proactiva e inteligente los procesos operativos.

Desarrollo o adquisición de sistemas de BI


Hoy en día, muchos proveedores ofrecen herramientas diversificadas, algunas de las cuales están completamente
preprogramadas (llamadas shells); todo lo que tienes que hacer es insertar tus números. Estas herramientas se
pueden comprar o arrendar. Para obtener una lista de productos, demostraciones, libros blancos y productos más actuales
Machine Translated by Google

48 Capítulo 1 • Una descripción general de Business Intelligence, Analytics y Data Science

información, consulte los directorios de productos en tdwi.org. Se requiere registro de usuario gratuito. Casi
todas las aplicaciones de BI están construidas con shells proporcionados por proveedores que pueden crear
ellos mismos una solución personalizada para un cliente o trabajar con otro proveedor externo. El problema al
que se enfrentan las empresas es qué alternativa seleccionar: comprar, arrendar o construir. Cada una de estas
alternativas tiene varias opciones. Uno de los principales criterios para tomar la decisión es la justificación y el
análisis de costo-beneficio.

Justificación y Análisis Costo-Beneficio


A medida que aumenta el número de posibles aplicaciones de BI, surge la necesidad de justificarlas y
priorizarlas. Esta no es una tarea fácil debido a la gran cantidad de beneficios intangibles. Es necesario
identificar tanto los beneficios directos como los intangibles. Por supuesto, aquí es donde el conocimiento de
aplicaciones similares en otras organizaciones y estudios de casos es extremadamente útil.
Por ejemplo, The Data Warehousing Institute (tdwi.org) proporciona una gran cantidad de información sobre
productos y aplicaciones e implementaciones innovadoras. Dicha información puede ser útil para estimar los
beneficios directos e indirectos.

Seguridad y Protección de la Privacidad


Este es un tema extremadamente importante en el desarrollo de cualquier sistema computarizado, especialmente
BI que contiene datos que pueden tener valor estratégico. Además, se debe proteger la privacidad de los
empleados y clientes.

Integración de Sistemas y Aplicaciones


Con la excepción de algunas aplicaciones pequeñas, todas las aplicaciones de BI deben integrarse con otros
sistemas, como bases de datos, sistemas heredados, sistemas empresariales (particularmente ERP y CRM),
comercio electrónico (lado de ventas, lado de compras) y muchos más. Además, las aplicaciones de BI suelen
estar conectadas a Internet y muchas veces a los sistemas de información de los socios comerciales.
Además, las herramientas de BI a veces necesitan integrarse entre sí, creando sinergia. La necesidad
de integración empujó a los proveedores de software a agregar continuamente capacidades a sus productos.
Los clientes que compran un paquete de software todo en uno solo tratan con un proveedor y no tienen que
lidiar con la conectividad del sistema. Sin embargo, pueden perder la ventaja de crear sistemas compuestos por
los componentes "mejores en su clase".

SECCIÓN 1.4 PREGUNTAS DE REVISIÓN

1. Defina BI.

2. Enumere y describa los principales componentes de BI.


3. Defina OLTP.
4. Defina OLAP.

5. Enumere algunos de los temas de implementación abordados por el informe de Gartner.


6. Enumere algunos otros factores de éxito de BI.

1.5 Descripción general de análisis


La palabra análisis ha reemplazado en gran medida a los componentes individuales anteriores de las
tecnologías de soporte de decisiones computarizadas que han estado disponibles bajo varias etiquetas en el
pasado. De hecho, muchos profesionales y académicos ahora usan la palabra análisis en lugar de BI.
Aunque muchos autores y consultores lo han definido de manera ligeramente diferente, uno puede ver el
análisis como el proceso de desarrollar decisiones procesables o recomendaciones para acciones basadas en
conocimientos generados a partir de datos históricos. Según el Institute for Operations Research and
Management Science (INFORMS), la analítica representa la combinación de
Machine Translated by Google

Capítulo 1 • Una descripción general de Business Intelligence, Analytics y Data Science 49

informática, técnicas de ciencias administrativas y estadísticas para resolver problemas reales.


Por supuesto, muchas otras organizaciones han propuesto sus propias interpretaciones y
motivaciones para el análisis. Por ejemplo, SAS Institute Inc. propuso ocho niveles de análisis
que comienzan con informes estandarizados de un sistema informático. Estos informes
esencialmente brindan una idea de lo que está sucediendo con una organización. Las
tecnologías adicionales nos han permitido crear informes más personalizados que se pueden generar ad hoc.
La próxima extensión de los informes nos lleva a consultas de tipo OLAP que permiten a un usuario
profundizar y determinar fuentes específicas de preocupación u oportunidades. Las tecnologías disponibles
en la actualidad también pueden emitir alertas automáticamente para un tomador de decisiones cuando el
desempeño justifica dichas alertas. A nivel de consumidor, vemos este tipo de alertas sobre el clima u otros
problemas. Pero también se pueden generar alertas similares en configuraciones específicas cuando las
ventas caen por encima o por debajo de cierto nivel dentro de un cierto período de tiempo o cuando el
inventario de un producto específico se está agotando. Todas estas aplicaciones son posibles a través del
análisis y las consultas sobre los datos recopilados por una organización. El siguiente nivel de análisis
podría implicar un análisis estadístico para comprender mejor los patrones. Luego, estos se pueden llevar
un paso más allá para desarrollar pronósticos o modelos para predecir cómo los clientes podrían responder
a una campaña de marketing específica u ofertas de servicios/productos en curso. Cuando una organización
tiene una buena visión de lo que está sucediendo y lo que es probable que suceda, también puede emplear
otras técnicas para tomar las mejores decisiones según las circunstancias. Estos ocho niveles de análisis
se describen con más detalle en un documento técnico de SAS (sas.com/news/sascom/analytics_levels.pdf).
Esta idea de observar todos los datos para comprender qué está sucediendo, qué
sucederá y cómo aprovecharlo al máximo también ha sido resumida por INFORMS al proponer
tres niveles de análisis. Estos tres niveles se identifican (informs.org/Community/Analytics)
como descriptivo, predictivo y prescriptivo. La figura 1.11 presenta una vista gráfica de estos
tres niveles de análisis. Sugiere que estos tres son pasos algo independientes y un tipo de
aplicaciones de análisis lleva a otro. También sugiere que en realidad existe cierta superposición
entre estos tres tipos de análisis. En cualquier caso, la naturaleza interconectada de los
diferentes tipos de aplicaciones de análisis es evidente. A continuación presentamos estos tres niveles de análisis.

Análisis de negocio

Descriptivo Profético Preceptivo

¿Qué sucedió? ¿Lo que sucederá? ¿Qué tengo que hacer?


¿Lo que está sucediendo? ¿Por qué sucederá? ¿Por qué debería hacerlo?

Habilitadores
preguntas
de

Informes comerciales Procesamiento de datos Mejoramiento


Tableros Extracción de textos Simulación
cuadros de mando Minería web/media Modelado de decisiones
Almacenamiento de datos Pronóstico Sistemas expertos

Resultados

Bien definido Proyecciones precisas Mejor posible


problemas de negocios de eventos futuros y decisiones de negocios
y oportunidades resultados y acciones

FIGURA 1.11 Tres tipos de análisis.


Machine Translated by Google

50 Capítulo 1 • Una descripción general de Business Intelligence, Analytics y Data Science

Analítica descriptiva
El análisis descriptivo (o de informes) se refiere a saber qué está sucediendo en la organización y
comprender algunas tendencias subyacentes y las causas de tales ocurrencias. En primer lugar, esto
implica la consolidación de las fuentes de datos y la disponibilidad de todos los datos relevantes en una
forma que permita la elaboración de informes y análisis adecuados. Por lo general, el desarrollo de esta
infraestructura de datos es parte de los DW. A partir de esta infraestructura de datos, podemos desarrollar
informes, consultas, alertas y tendencias apropiados utilizando diversas herramientas y técnicas de
generación de informes.
Una tecnología significativa que se ha convertido en un actor clave en esta área es la visualización.
Usando las últimas herramientas de visualización en el mercado, ahora podemos desarrollar conocimientos
poderosos en las operaciones de nuestra organización. Los casos de aplicación 1.2 y 1.3 destacan algunas
de estas aplicaciones. Las representaciones en color de las visualizaciones discutidas en estas aplicaciones
están disponibles en línea o en el sitio web complementario del libro (dssbibook.com).

Caso de aplicación 1.2


Silvaris aumenta el negocio con capacidades de análisis visual y generación de informes en tiempo real

Silvaris Corporation fue fundada en 2000 por un equipo de Silvaris realiza un seguimiento de los pedidos en línea
profesionales de la industria forestal para proporcionar realizados por los clientes y sabe cuándo enviar impulsos de
avances tecnológicos en el sector de la madera y los renovación a qué clientes para que sigan comprando en línea.
materiales de construcción. Silvaris es la primera plataforma Además, los analistas de Silvaris pueden ahorrar tiempo al
de comercio electrónico en los Estados Unidos específicamente generar tableros en lugar de escribir cientos de páginas de
para productos forestales y tiene su sede en Seattle, informes con Tableau.
Washington. Es un proveedor mayorista líder de productos
industriales de madera y materiales de construcción excedentes. Preguntas para la discusión
Silvaris vende sus productos y brinda servicios de 1. ¿Cuál fue el desafío que enfrentó Silvaris?
logística internacional a más de 3.500 clientes. Para 2. ¿Cómo resolvió Silvaris su problema usando datos?
administrar varios procesos que están involucrados en una visualización con Tableau?
transacción, crearon una plataforma de comercio en línea
patentada para rastrear el flujo de información relacionado Lo que podemos aprender de esto
con transacciones entre comerciantes, contabilidad, crédito y
Caso de aplicación
logística. Esto permitió a Silvaris compartir su información en
tiempo real con sus clientes y socios. Pero debido a los Muchas industrias necesitan analizar datos en tiempo real.
precios de los materiales que cambiaban rápidamente, se El análisis en tiempo real permite a los analistas identificar
hizo necesario que Silvaris obtuviera una vista en tiempo real problemas que afectan su negocio. La visualización es a
de los datos sin mover los datos a un formato de informe veces la mejor manera de comenzar a analizar los flujos de
separado. datos en vivo. Tableau es una de esas herramientas de
Silvaris comenzó a usar Tableau debido a su capacidad visualización de datos que tiene la capacidad de analizar
para conectarse y visualizar datos en vivo. Debido a los datos en vivo sin traer los datos en vivo a un formato de
informe separado.
tableros creados por Tableau que son fáciles de entender y
explicar, Silvaris comenzó a usar Tableau para generar
Fuentes: Tableau.com, “Silvaris Augments Proprietary Technology
informes. Esto ayudó a Silvaris a extraer información
Platform with Tableau's Real-Time Reporting Capabilities,” http://
rápidamente de los datos e identificar problemas que impactan www.tableau.com/sites/default/files/case-studies/silvaris business-
en su negocio. Silvaris logró administrar los pedidos en línea dashboards_0.pdf (consultado en julio 2016); Silvaris.com,
frente a los pedidos fuera de línea con la ayuda de los “Descripción general”, http://www.silvaris.com/About/ (consultado en julio de 2016).
informes generados por Tableau. Ahora,
Machine Translated by Google

Capítulo 1 • Una descripción general de Business Intelligence, Analytics y Data Science 51

Caso de aplicación 1.3


Siemens reduce costos con el uso de visualización de datos

Siemens es una empresa alemana con sede en Berlín, Alemania. La organización de logística global responde preguntas como cómo
Es una de las empresas más grandes del mundo que se enfoca en las diferentes tasas de suministro en diferentes ubicaciones afectan
las áreas de electrificación, automatización y digitalización. Tiene la operación, lo que les ayuda a reducir el tiempo de ciclo en un 12
una facturación anual de 76 mil millones de euros. % y el costo de desechos en un 25 %.

El grupo de análisis visual de Siemens tiene la tarea de Preguntas para la discusión


brindar soluciones integrales de generación de informes y 1. ¿Qué desafíos enfrentó Siemens visual
consultoría para todas las necesidades internas de BI de Siemens. grupo de analisis?
Este grupo enfrentaba el desafío de brindar soluciones de 2. ¿Cómo ayudó la herramienta de visualización de datos Dundas
generación de informes a toda la organización de Siemens en
BI a Siemens a reducir costos?
diferentes departamentos, al tiempo que mantenía un equilibrio
entre la gobernanza y las capacidades de autoservicio. Siemens
Lo que podemos aprender de esto
necesitaba una plataforma que pudiera analizar sus múltiples casos
de encuestas de satisfacción del cliente, procesos logísticos e Caso de aplicación
informes financieros. Esta plataforma debe ser fácil de usar para Muchas organizaciones quieren herramientas que puedan usarse
sus empleados para que puedan usar estos datos para el análisis para analizar datos de múltiples divisiones. Estas herramientas
y la toma de decisiones. Además, la plataforma debe integrarse pueden ayudarlos a mejorar el rendimiento y hacer que el
fácilmente con los sistemas Siemens existentes y brindar a los descubrimiento de datos sea transparente para sus usuarios para
empleados una experiencia de usuario perfecta. que puedan identificar fácilmente los problemas dentro del negocio.

Comenzaron a usar Dundas BI, un proveedor global líder de Fuentes: Dundas.com, “Cómo Siemens redujo drásticamente los costos con
soluciones de visualización de datos y BI. Permitió a Siemens crear aplicaciones de BI administradas”, http://www.dundas.com/resource
/getcasestudy?caseStudyName=09-03-2016-Siemens%2FDundas
tableros de control altamente interactivos que permitieron a Siemens
-BI-Siemens-Case-Study.pdf (consultado en julio de 2016); Wikipedia.org,
detectar problemas temprano y así ahorrar una cantidad significativa
“SIEMENS,” https://en.wikipedia.org/wiki/Siemens (consultado en julio de 2016);
de dinero. Los tableros desarrollados por Dundas BI ayudaron a Siemens.com, “Acerca de Siemens”, http://www.siemens.
Siemens com/about/en/ (consultado en julio de 2016).

Análisis predictivo
El análisis predictivo tiene como objetivo determinar qué es probable que suceda en el futuro. Este análisis se
basa en técnicas estadísticas, así como en otras técnicas desarrolladas más recientemente que caen dentro de la
categoría general de minería de datos. El objetivo de estas técnicas es poder predecir si es probable que el cliente
cambie a un competidor ("abandono"), qué es probable que el cliente compre a continuación y cuánto, a qué
promociones respondería un cliente, si este cliente es un riesgo digno de crédito, y así sucesivamente. Se utilizan
varias técnicas para desarrollar aplicaciones analíticas predictivas, incluidos varios algoritmos de clasificación. Por
ejemplo, como se describe en los capítulos 4 y 5, podemos usar técnicas de clasificación como la regresión
logística, los modelos de árboles de decisión y las redes neuronales para predecir qué tan bien le irá a una película
en la taquilla. También podemos usar algoritmos de agrupamiento para segmentar a los clientes en diferentes
grupos para poder dirigirles promociones específicas. Finalmente, podemos usar técnicas de minería de
asociaciones para estimar las relaciones entre diferentes comportamientos de compra. Es decir, si un cliente
compra un producto, ¿qué más es probable que compre? Dicho análisis puede ayudar a un minorista a recomendar
o promocionar productos relacionados. Por ejemplo, cualquier búsqueda de productos en Amazon.com da como
resultado que el minorista también sugiera otros productos similares en los que un cliente pueda estar interesado.
Estudiaremos estas técnicas y sus aplicaciones en los Capítulos 3 a 6. El caso de aplicación 1.4 ilustra una
aplicación de este tipo en los deportes. .
Machine Translated by Google

52 Capítulo 1 • Una descripción general de Business Intelligence, Analytics y Data Science

Caso de aplicación 1.4


Análisis de lesiones deportivas

Cualquier actividad atlética es propensa a las lesiones. Si las estado actual de la lesión, gravedad, parte del cuerpo, sitio del
lesiones no se manejan adecuadamente, entonces el equipo sufre. cuerpo, tipo de lesión, actividad, ubicación del evento, acción
El uso de análisis para comprender las lesiones puede ayudar a tomada y posición jugada. El éxito de clasificar la categoría de
obtener información valiosa que permitiría a los entrenadores y curación fue bastante bueno: la precisión fue del 79,6 % por ciento.
médicos del equipo administrar la composición del equipo, Con base en el análisis, se sugirieron muchas recomendaciones
comprender los perfiles de los jugadores y, en última instancia, comerciales, que incluyen emplear más aportes de especialistas
ayudar a tomar mejores decisiones sobre qué jugadores podrían desde el inicio de la lesión en lugar de permitir que el personal de la
estar disponibles para jugar en un momento dado. sala de entrenamiento evalúe a los jugadores lesionados; entrenar
En un estudio exploratorio, la Universidad Estatal de a los jugadores en posiciones defensivas para evitar lesiones; y la
Oklahoma analizó las lesiones deportivas relacionadas con el fútbol celebración de prácticas para comprobar minuciosamente los
americano utilizando informes y análisis predictivos. mecanismos de seguridad.
El proyecto siguió la metodología CRISP-DM (que se describirá en
el Capítulo 4) para comprender el problema de hacer Preguntas para la discusión
recomendaciones sobre el manejo de lesiones, comprender los 1. ¿Qué tipos de análisis se aplican en el análisis de lesiones?
diversos elementos de datos recopilados sobre lesiones, limpiar los
datos, desarrollar visualizaciones para sacar varias inferencias,
2. ¿Cómo ayudan las visualizaciones a comprender los datos y
construir PM para analice el período de tiempo de curación de
brindar información sobre los datos?
lesiones y dibuje reglas de secuencia para predecir las relaciones
3. ¿Qué es un problema de clasificación?
entre las lesiones y las diversas partes del cuerpo afectadas por
4. ¿Qué se puede obtener al realizar un análisis de secuencias?
lesiones.

El conjunto de datos de lesiones consistió en más de 560


registros de lesiones de fútbol americano, que se clasificaron en Lo que podemos aprender de esto
variables específicas de la lesión (parte del cuerpo/sitio/lateralidad, Caso de aplicación
acción tomada, gravedad, tipo de lesión, fechas de inicio y curación
Para cualquier proyecto de análisis, siempre es importante
de la lesión) y variables específicas del jugador/deporte —
comprender el dominio comercial y el estado actual del problema
ID del jugador, posición jugada, actividad, inicio y ubicación del
comercial mediante un análisis exhaustivo del único recurso: los
juego. El tiempo de curación se calculó para cada registro, que se
datos históricos.
clasificó en diferentes conjuntos de períodos de tiempo: 0 a 1 mes,
Las visualizaciones a menudo proporcionan una gran herramienta
1 a 2 meses, 2 a 4 meses, 4 a 6 meses y 6 a 24 meses.
para obtener información inicial sobre los datos, que se puede
refinar aún más en función de las opiniones de expertos para
Se construyeron varias visualizaciones para dibujar inferir
identificar la importancia relativa de los elementos de datos
Las incidencias de datos de lesiones establecen información que
relacionados con el problema. Las visualizaciones también ayudan
representa el período de tiempo de curación asociado con las
a generar ideas para problemas oscuros, que se pueden seguir en
posiciones de los jugadores, la gravedad de las lesiones y el período
la creación de PM que podrían ayudar a las organizaciones en la
de tiempo de curación, el tratamiento ofrecido y el período de tiempo
toma de decisiones.
de curación asociado, las lesiones importantes que afectan a partes
del cuerpo, etc.
Fuente: Sharda, R., Asamoah, D. y Ponna, N. (2013). “Investigación
Los modelos de redes neuronales se construyeron para y Pedagogía en Business Analytics: Oportunidades y Ejemplos
predecir cada una de las categorías de curación utilizando IBM Ilustrativos”. Revista de informática y tecnología de la información,
SPSS Modeler. Algunas de las variables predictoras fueron 21(3), 171–182.

Analítica prescriptiva
La tercera categoría de análisis se denomina análisis prescriptivo. El objetivo del análisis prescriptivo es reconocer
lo que está sucediendo, así como el pronóstico probable y tomar decisiones para lograr el mejor rendimiento posible.
Este grupo de técnicas se ha estudiado históricamente bajo el paraguas de las IO o ciencias de la gestión y
generalmente están dirigidas
Machine Translated by Google

Capítulo 1 • Una descripción general de Business Intelligence, Analytics y Data Science 53

en la optimización del rendimiento de un sistema. El objetivo aquí es proporcionar una decisión o una
recomendación para una acción específica. Estas recomendaciones pueden adoptar la forma de una decisión
específica de sí o no para un problema, una cantidad específica (por ejemplo, el precio de un artículo
específico o el pasaje aéreo a cobrar) o un conjunto completo de planes de producción. Las decisiones se
pueden presentar a un tomador de decisiones en un informe o se pueden usar directamente en un sistema de
reglas de decisión automatizado (por ejemplo, en sistemas de tarificación de líneas aéreas). Por lo tanto, estos
tipos de análisis también pueden denominarse análisis normativo o de decisión. El caso de aplicación 1.5
brinda un ejemplo de tales aplicaciones analíticas prescriptivas. Aprenderemos sobre algunos aspectos de la
analítica prescriptiva en el Capítulo 6.

Analítica aplicada a diferentes dominios


Las aplicaciones de análisis en varios sectores de la industria han generado muchas áreas relacionadas o, al
menos, palabras de moda. Está casi de moda adjuntar la palabra análisis a cualquier industria específica o
tipo de datos. Además de la categoría general de análisis de texto, cuyo objetivo es obtener valor del texto
(que se estudiará en el Capítulo 5), o análisis web, que analiza datos web

Caso de aplicación 1.5 Una


empresa de barras de acero especiales utiliza análisis para determinar las fechas disponibles para promesa

Este caso de aplicación se basa en un proyecto que incluye a de este posible cliente. Finalmente, incluso podría haber una
uno de nosotros. Una empresa que no desea revelar su nombre oportunidad de cobrar una prima por un nuevo pedido al reutilizar
(ni siquiera la industria precisa) se enfrentaba a un gran problema el inventario previamente comprometido para satisfacer este
al tomar decisiones sobre qué inventario de materias primas nuevo pedido mientras se retrasa un pedido ya comprometido.
utilizar para satisfacer a qué clientes. Esta empresa suministra Por supuesto, tales decisiones deben basarse en los análisis de
barras de acero configuradas a medida para sus clientes. Estas costo-beneficio de retrasar un pedido anterior. Por lo tanto, el
barras se pueden cortar en formas o tamaños específicos y sistema debería poder extraer datos en tiempo real sobre
pueden tener requisitos únicos de material y acabado. inventario, pedidos comprometidos, materia prima entrante,
restricciones de producción, etc.
La empresa adquiere materias primas de todo el mundo y las
almacena en su almacén. Cuando un posible cliente llama a la Para respaldar estas decisiones de ATP, se desarrolló un
empresa para solicitar una cotización de las barras especiales DSS en tiempo real para encontrar una asignación óptima del
que cumplen con los requisitos específicos del material inventario disponible y para respaldar análisis hipotéticos
(composición, origen del metal, calidad, formas, tamaños, etc.), adicionales. El DSS utiliza un conjunto de modelos de
el vendedor generalmente tiene poco tiempo para enviar dicha programación de enteros mixtos que se resuelven mediante
cotización incluye la fecha en que se puede entregar el producto software comercial. La empresa ha incorporado el DSS en su
y, por supuesto, los precios, etc. Debe tomar decisiones de sistema de planificación de recursos empresariales para facilitar
disponibilidad para prometer (ATP), que determinan en tiempo sin problemas el uso de análisis de negocios.
real las fechas en las que puede prometer la entrega de los
productos que los clientes solicitaron durante la etapa de
cotización. Anteriormente, un vendedor tenía que tomar tales
Preguntas para la discusión
decisiones analizando informes sobre el inventario disponible de
1. ¿Por qué la reasignación del inventario de un cliente a otro
materias primas. Es posible que parte de la materia prima
sería un tema de discusión importante?
disponible ya se haya comprometido con el pedido de otro
2. ¿Cómo podría un DSS ayudar a tomar estas decisiones?
cliente. Por lo tanto, es posible que el inventario en stock no sea
realmente el inventario libre disponible. Por otro lado, puede
Fuente: Pajouh Foad, M., Xing, D., Hariharan, S., Zhou, Y., Balasundaram,
haber materia prima que se espera entregar en un futuro cercano B., Liu, T. y Sharda, R. (2013). "Disponible para prometer en la práctica:
que también podría usarse para satisfacer el pedido. una aplicación de análisis en la industria de productos de barras de acero
especiales". Interfaces, 43(6), 503–517. http://
dx.doi.org/10.1287/inte.2013.0693 (consultado en julio de 2016).
Machine Translated by Google

54 Capítulo 1 • Una descripción general de Business Intelligence, Analytics y Data Science

flujos (también en el Capítulo 5): muchas profesiones/profesiones analíticas específicas de la industria o del problema
Se han desarrollado arroyos. Ejemplos de tales áreas son análisis de marketing, análisis minorista, análisis de fraude,
análisis de transporte, análisis de salud, análisis de deportes, análisis de talento, análisis de comportamiento, etc. Por
ejemplo, la Sección 1.1 introdujo la frase análisis deportivo. El Caso de aplicación 1.1 también podría denominarse un
estudio de caso en análisis de aerolíneas. La siguiente sección presentará análisis de salud y análisis de mercado en
general. Literalmente, cualquier análisis sistemático de datos en un sector específico se etiqueta como análisis “(llenar
espacios en blanco)”.
Si bien esto puede resultar en una exageración del concepto de análisis, el beneficio es que más personas en
industrias específicas son conscientes del poder y el potencial de los análisis. También proporciona un enfoque a los
profesionales que desarrollan y aplican los conceptos de análisis en un sector vertical. Si bien muchas de las técnicas
para desarrollar aplicaciones de análisis pueden ser comunes, existen problemas únicos dentro de cada segmento
vertical que influyen en cómo se recopilan, procesan, analizan los datos y se implementan las aplicaciones. Por lo
tanto, la diferenciación de la analítica basada en un enfoque vertical es buena para el crecimiento general de la
disciplina.

¿Analítica o ciencia de datos?


Aunque el concepto de análisis está recibiendo más atención en la industria y los círculos académicos, ya se ha
introducido otro término y se está volviendo popular. El nuevo término es ciencia de datos. Por lo tanto, los practicantes
de la ciencia de datos son científicos de datos. A DJ Patil de LinkedIn a veces se le atribuye la creación del término
ciencia de datos. Ha habido algunos intentos de describir las diferencias entre los analistas de datos y los científicos
de datos (p. ej., consulte emc.com/collateral/about/news/emc-data-science-study-wp.pdf). Una opinión es que analista
de datos es solo otro término para los profesionales que estaban haciendo BI en forma de compilación de datos,
limpieza, informes y tal vez alguna visualización. Sus conjuntos de habilidades incluían Excel, algunos conocimientos
de SQL e informes. Reconocería esas capacidades como análisis descriptivos o de informes. Por el contrario, un
científico de datos es responsable del análisis predictivo, el análisis estadístico y las herramientas y algoritmos
analíticos más avanzados. Pueden tener un conocimiento más profundo de los algoritmos y pueden reconocerlos bajo
varias etiquetas: minería de datos, descubrimiento de conocimiento o aprendizaje automático. Es posible que algunos
de estos profesionales también necesiten conocimientos de programación más profundos para poder escribir código
para la limpieza/análisis de datos en lenguajes actuales orientados a la web, como Java o Python, y lenguajes
estadísticos como R. Muchos profesionales de análisis también necesitan adquirir una experiencia significativa en
modelado estadístico, experimentación y análisis. Nuevamente, nuestros lectores deben reconocer que estos se
encuentran bajo el paraguas de análisis predictivo y prescriptivo. Sin embargo, el análisis prescriptivo también incluye
una experiencia más significativa en OR, incluida la optimización, la simulación, el análisis de decisiones, etc. Es más
probable que los que cubren estos campos se llamen científicos de datos que profesionales analíticos.

Nuestra opinión es que la distinción entre análisis y científico de datos es más un grado de conocimiento
técnico y conjuntos de habilidades que funciones. También puede ser más una distinción entre disciplinas. Los
programas de informática, estadística y matemáticas aplicadas parecen preferir la etiqueta de ciencia de datos,
reservando la etiqueta de análisis para profesionales más orientados a los negocios. Como otro ejemplo de esto, los
profesionales de la física aplicada han propuesto usar la ciencia de redes como el término para describir los análisis
que se relacionan con grupos de personas: redes sociales, redes de cadena de suministro, etc. Ver http://

barabasi.com/networksciencebook/ para un libro de texto en evolución sobre este tema.


Aparte de una clara diferencia en los conjuntos de habilidades de los profesionales que solo tienen que hacer
análisis descriptivos/de informes frente a aquellos que participan en los tres tipos de análisis, la distinción es confusa
entre las dos etiquetas, en el mejor de los casos. Observamos que los graduados de nuestros programas de análisis
tienden a ser responsables de tareas que están más en línea con los profesionales de la ciencia de datos (según lo
definen algunos círculos) que solo informar análisis. Este libro es claramente
Machine Translated by Google

Capítulo 1 • Una descripción general de Business Intelligence, Analytics y Data Science 55

cuyo objetivo es presentar las capacidades y la funcionalidad de todos los análisis (que incluyen la ciencia de datos),
no solo los análisis de informes. De ahora en adelante, usaremos estos términos indistintamente.

SECCIÓN 1.5 PREGUNTAS DE REVISIÓN

1. Defina análisis.
2. ¿Qué es el análisis descriptivo? ¿Cuáles son las diversas herramientas que se emplean en la descripción?
análisis tivo?
3. ¿En qué se diferencia el análisis descriptivo de los informes tradicionales?
4. ¿Qué es un DW? ¿Cómo puede la tecnología de almacenamiento de datos ayudar a habilitar el análisis?
5. ¿Qué es el análisis predictivo? ¿Cómo pueden las organizaciones emplear el análisis predictivo?
6. ¿Qué es el análisis prescriptivo? ¿Qué tipo de problemas se pueden resolver mediante prescriptivos?
¿analítica?
7. Defina el modelado desde la perspectiva analítica.
8. ¿Es una buena idea seguir una jerarquía de análisis descriptivo y predictivo antes
aplicando análisis prescriptivos?
9. ¿Cómo pueden ayudar los análisis en la toma de decisiones objetivas?

1.6 Ejemplos de análisis en dominios seleccionados


Verá ejemplos de aplicaciones de análisis a lo largo de varios capítulos. Ese es uno de los principales enfoques
(exposición) de este libro. En esta sección, destacamos dos áreas de aplicación: atención médica y comercio minorista,
donde se han reportado la mayoría de las aplicaciones y los éxitos.

Aplicaciones de análisis en el cuidado de la salud: ejemplos de Humana


Aunque los análisis de atención médica abarcan una amplia variedad de aplicaciones, desde la prevención hasta el
diagnóstico, las operaciones eficientes y la prevención del fraude, nos enfocamos en algunas aplicaciones que se han
desarrollado en una importante compañía de seguros de salud, Humana. Según el sitio web de la empresa, “La
estrategia de la empresa integra la prestación de atención, la experiencia de los miembros y los conocimientos clínicos
y de los consumidores para fomentar el compromiso, el cambio de comportamiento, el alcance clínico proactivo y el
bienestar. . . .” Alcanzar estos objetivos estratégicos incluye inversiones significativas en tecnología de la información
en general y análisis en particular. Brian LeClaire es vicepresidente sénior y CIO de Humana, un importante proveedor
de seguros de salud en los Estados Unidos.
Tiene un doctorado en MIS de la Universidad Estatal de Oklahoma. Ha defendido la analítica como un diferenciador
competitivo en Humana, incluido el copatrocinio de la creación de un centro de excelencia en analítica. Describió los
siguientes proyectos como ejemplos de las iniciativas de análisis de Humana, dirigidos por el director de análisis clínico
de Humana, Vipin Gopal.

Ejemplo 1: Prevención de caídas en una población de adultos mayores:


Un enfoque analítico

Las caídas accidentales son un riesgo importante para la salud de los adultos mayores de 65 años, y un
tercio sufre una caída cada año.1 Las caídas también son el factor principal de lesiones fatales y no
fatales en adultos mayores, y las caídas con lesiones aumentan el riesgo de discapacidad en hasta un
50 %.2 Los costes de las caídas suponen una carga importante para

1
http://www.cdc.gov/homeandrecreationalsafety/falls/adultfalls.html.
2Gill, TM, Murphy, TE, Gahbauer, EA, et al. (2013). Asociación de caídas con lesiones con resultados de
discapacidad y admisiones en hogares de ancianos en personas mayores que viven en la comunidad. Revista
estadounidense de epidemiología, 178(3), 418–425.
Machine Translated by Google

56 Capítulo 1 • Una descripción general de Business Intelligence, Analytics y Data Science

el sistema de salud de EE. UU., con costos directos de caídas estimados en $34 mil millones
solo en 2013.1 Con el porcentaje de personas mayores en la población de EE. UU. en aumento,
se prevé que aumenten las caídas y los costos asociados. Según los Centros para el Control y
la Prevención de Enfermedades (CDC), "las caídas son un problema de salud pública que se
puede prevenir en gran medida".1
Humana es el segundo mayor proveedor de beneficios de Medicare Advantage del país,
con aproximadamente 3,2 millones de afiliados, la mayoría de los cuales son adultos mayores.
Mantener sanos a sus miembros mayores y ayudarlos a vivir con seguridad en sus hogares es
un objetivo comercial clave, del cual la prevención de caídas es un componente importante. Sin
embargo, no se disponía de una metodología rigurosa para identificar a las personas con mayor
probabilidad de caídas, para quienes los esfuerzos de prevención de caídas serían beneficiosos.
A diferencia de las condiciones médicas crónicas como la diabetes y el cáncer, una caída no es
una condición médica bien definida. Además, las caídas generalmente no se informan en los
datos de reclamos, ya que los médicos generalmente tienden a codificar la consecuencia de una
caída, como fracturas y dislocaciones. Aunque existen muchas evaluaciones administradas
clínicamente para identificar a las personas que se caen, tienen un alcance limitado y carecen
de suficiente poder predictivo.3 Como tal, existe la necesidad de un método prospectivo y preciso
para identificar a las personas con mayor riesgo de caídas, para que puedan ser evaluadas.
gestionado de forma proactiva para la prevención de caídas. El equipo de análisis de Humana
emprendió el desarrollo de un modelo predictivo de caídas en este contexto. Es el primer PM
integral informado que utiliza reclamaciones médicas y farmacéuticas administrativas, datos
clínicos, patrones clínicos temporales, información del consumidor y otros datos para identificar
a las personas con alto riesgo de caerse en un horizonte temporal.
Hoy en día, Falls PM es fundamental para la capacidad de Humana de identificar a los
adultos mayores que podrían beneficiarse de las intervenciones de mitigación de caídas. Una
prueba de concepto inicial con consumidores de Humana, que representan el 2% superior con
mayor riesgo de caídas, demostró que los consumidores utilizaban más los servicios de
fisioterapia, lo que indica que los consumidores están tomando medidas activas para reducir el
riesgo de caídas. Una segunda iniciativa utiliza Falls PM para identificar individuos de alto riesgo
para programas de monitoreo remoto. Usando el PM, Humana pudo identificar a 20,000
consumidores con alto riesgo de caídas, que se beneficiaron de este programa.
Los consumidores identificados usan un dispositivo que detecta caídas y alerta a un servicio
24/7 para asistencia inmediata.
Este trabajo fue reconocido con el Premio al Liderazgo Analítico de la Escuela de Negocios
Kelly de la Universidad de Indiana en 2015, por la adopción innovadora de análisis en un entorno
empresarial.

3Gates, S., Smith, LA, Fisher, JD, et al. (2008). Revisión sistemática de la precisión de los instrumentos de detección
para predecir el riesgo de caídas entre los adultos mayores que viven de forma independiente. Revista de
Investigación y Desarrollo de Rehabilitación, 45(8), 1105–1116.

Colaboradores: Harpreet Singh, PhD; Dr. Vipin Gopal; Philip Painter, MD.

Ejemplo 2: Objetivo audaz de Humana: aplicación de análisis a


Definir las métricas correctas

En 2014, Humana, Inc. anunció el objetivo audaz de su organización para mejorar la salud de
las comunidades a las que sirve en un 20 % para 2020 al facilitar que las personas logren su
mejor salud. Las comunidades a las que Humana sirve se pueden definir de muchas maneras,
incluso geográficamente (estado, ciudad, vecindario), por producto (Medicare Advantage, planes
basados en el empleador, comprados individualmente) o por perfil clínico (condiciones prioritarias
que incluyen diabetes, hipertensión, CHF [insuficiencia cardíaca congestiva], CAD [enfermedad
de las arterias coronarias], EPOC [enfermedad
Machine Translated by Google

Capítulo 1 • Una descripción general de Business Intelligence, Analytics y Data Science 57

enfermedad pulmonar obstructiva], o depresión). Comprender la salud de estas comunidades y cómo


siguen a lo largo del tiempo es fundamental no solo para la evaluación de la meta, sino también para
diseñar estrategias para mejorar la salud de todos los miembros en su totalidad.

Un desafío al que se enfrentaba la organización de análisis era identificar una métrica que
captara la esencia del objetivo audaz. Las métricas de seguros de salud tradicionales medidas
objetivamente, como las admisiones hospitalarias o las visitas a la sala de emergencias por cada 1000
personas, no captarían el espíritu de esta nueva misión. El objetivo era identificar una métrica que
capturara la salud y su mejora en una comunidad, pero que también fuera relevante para Humana
como empresa. A través de evaluaciones analíticas rigurosas, Humana finalmente seleccionó "Días
saludables", un cuestionario de calidad de vida de cuatro preguntas desarrollado originalmente por los
CDC para rastrear y medir su progreso general hacia la meta audaz.

Era fundamental asegurarse de que la métrica seleccionada estuviera altamente correlacionada


con las métricas comerciales y de salud, de modo que cualquier mejora en los Días Saludables
redundara en una mejor salud y mejores resultados comerciales. Algunos ejemplos de cómo los “Días
saludables” se correlacionan con las métricas de interés incluyen los siguientes:

• Las personas con más días no saludables (UHD, por sus siglas en inglés) exhiben patrones de uso
y costos más altos. Para un aumento de 5 días en los UHD, hay (a) un aumento de $82 en los
costos médicos y farmacéuticos mensuales promedio, (b) un aumento de 52 admisiones de
pacientes hospitalizados por cada 1000 pacientes, y (c) un aumento de 0,28 días en la duración
promedio de estancia.1
• Las personas que exhiben comportamientos saludables y tienen sus condiciones crónicas bien
controladas tienen menos UHD. Por ejemplo, cuando observamos a las personas con diabetes, los
UHD son más bajos si obtuvieron una prueba de detección de LDL (-4.3 UHD) o un examen de la
vista para diabéticos (-2.3 UHD). Asimismo, si tienen niveles de azúcar en sangre controlados
medidos por HbA1C (-1,8 UHDs) o niveles de LDL (-1,3 UHDs)2.
• Las personas con enfermedades crónicas tienen más UHD que las que no tienen: (a) CHF (16,9
UHD), (b) CAD (14,4 UHD), (c) hipertensión (13,3 UHD), (d) diabetes (14,7 UHD) , (e) EPOC (17,4
UHD), o (f) depresión (22,4 UHD).1,3,4

Desde entonces, Humana ha adoptado Healthy Days como su métrica para la medida.
ment de progreso hacia Bold Goal.5

Colaboradores: Tristan Cordier, MPH; Gil Haugh, MS; Jonathan Peña, MS; Eriv Havens, MS; Dr. Vipin Gopal.

1Havens, E., Peña, J., Slabaugh, S., Cordier, T., Renda, A. y Gopal, V. (2015, octubre). Explorar la relación entre
la calidad de vida relacionada con la salud y las condiciones de salud, los costos, la utilización de recursos y las
medidas de calidad. Presentación en el podio de la 22ª Conferencia Anual de ISOQOL, Vancouver, Canadá.

2Havens, E., Slabaugh, L., Peña J., Haugh G. y Gopal, V. (2015, febrero). ¿Existen diferencias en los Días
Saludables en función del cumplimiento de las medidas preventivas de detección de la salud? Presentación de
póster en Preventive Medicine 2015, Atlanta, GA.
3Chiguluri, V., Guthikonda, K., Slabaugh, S., Havens, E., Peña, J. y Cordier, T. (junio de 2015).
Relación entre las complicaciones de la diabetes y la calidad de vida relacionada con la salud entre una población
de adultos mayores en los Estados Unidos. Presentación de póster en la 75.ª Sesión Científica Anual de la
Asociación Estadounidense de Diabetes. Boston, MA.
4Cordier, T., Slabaugh, L., Haugh, G., Gopal, V., Cusano, D., Andrews, G. y Renda, A.
(2015, septiembre). La calidad de vida cambia con la progresión de la insuficiencia cardíaca congestiva.
Presentación de póster en la 19ª Reunión Científica Anual de la Heart Failure Society of America, Washington, DC.

5http://populationhealth.humana.com/wp-content/uploads/2016/05/BoldGoal2016ProgressReport_1.pdf.
Machine Translated by Google

58 Capítulo 1 • Una descripción general de Business Intelligence, Analytics y Data Science

Ejemplo 3: Modelos predictivos para identificar el mayor riesgo


Afiliación a una Aseguradora de Salud

La regla 80/20 generalmente se aplica en el cuidado de la salud, es decir, aproximadamente el 20 %


de los consumidores representan el 80 % de los recursos de atención médica debido al deterioro de su
salud y sus condiciones crónicas. Las aseguradoras de salud como Humana generalmente han inscrito
a los afiliados de mayor riesgo en programas clínicos y de manejo de enfermedades para ayudar a
controlar las afecciones crónicas que tienen los afiliados.
La identificación de los miembros correctos es fundamental para este ejercicio y, en los últimos
años, se han desarrollado PM para identificar a los afiliados con un alto riesgo futuro. Muchos de estos
PM se desarrollaron con una gran dependencia de los datos de reclamaciones médicas, que resultan
de los servicios médicos que utilizan los afiliados. Debido al retraso que existe en el envío y
procesamiento de datos de reclamos, existe un retraso correspondiente en la identificación de miembros
de alto riesgo para la inscripción en el programa clínico. Este tema es especialmente relevante cuando
los nuevos miembros se unen a una aseguradora de salud, ya que no tendrían un historial de reclamos
con una aseguradora.
Un PM basado en reclamos podría demorar en promedio de 9 a 12 meses después de la inscripción de
nuevos miembros para identificarlos y derivarlos a programas clínicos.
A principios de esta década, Humana atrajo a una gran cantidad de nuevos miembros en sus
productos Medicare Advantage y necesitaba una mejor forma de administrar clínicamente esta
membresía. Como tal, se volvió extremadamente importante que se desarrollara un enfoque analítico
diferente para identificar de manera rápida y precisa a los nuevos miembros de alto riesgo para el
manejo clínico, para mantener este grupo saludable y reducir los costos.

El equipo de Análisis Clínicos de Humana desarrolló el Modelo Predictivo de Nuevos Miembros


(NMPM) que identificaría rápidamente a las personas en riesgo poco después de su inscripción en el
nuevo plan con Humana, en lugar de esperar a que haya suficiente historial de reclamos disponible
para compilar perfiles clínicos y predecir futuros riesgos para la salud. . Diseñado para abordar los
desafíos únicos asociados con los nuevos miembros, NMPM desarrolló un enfoque novedoso que
aprovechó e integró conjuntos de datos más amplios más allá de los datos de reclamos médicos, como
datos de evaluación de riesgos de salud autoinformados e indicadores tempranos de datos de farmacia,
empleó técnicas avanzadas de extracción de datos para patrones descubrimiento, y calificó a cada
consumidor de MA diariamente según los datos más recientes que Humana tiene hasta la fecha. El
modelo se implementó con un equipo interdisciplinario de análisis, TI y operaciones para garantizar
una integración operativa y comercial perfecta.

Desde que se implementó NMPM en enero de 2013, ha estado identificando rápidamente nuevos
miembros de alto riesgo para su inscripción en los programas clínicos de Humana. Los resultados
positivos logrados a través de este modelo se han destacado en múltiples comunicados de líderes
sénior de Humana. En la presentación del informe de ganancias del primer trimestre de 2013 a los
inversionistas, Bruce Broussard, director ejecutivo de Humana, afirmó la importancia de "la mejora en
los PM de nuevos afiliados y los procesos de evaluación clínica", lo que resultó en 31,000 nuevos
afiliados inscritos en programas clínicos, en comparación con 4,000 en el mismo período del año
anterior, un aumento del 675%. Además del mayor volumen de inscripciones en programas clínicos,
los estudios de resultados mostraron que los consumidores recién inscritos identificados por NMPM
también fueron derivados a programas clínicos antes, con más del 50 % de las referencias identificadas
dentro de los primeros 3 meses posteriores a las nuevas inscripciones en el plan MA.

Los consumidores identificados también participaron a un ritmo más alto y tenían una permanencia
más prolongada en los programas.

Colaboradores: Sandy Chiu, MS; Dr. Vipin Gopal.


Machine Translated by Google

Capítulo 1 • Una descripción general de Business Intelligence, Analytics y Data Science 59

Estos ejemplos ilustran cómo una organización explora e implementa aplicaciones de análisis para
cumplir sus objetivos estratégicos. Verá varios otros ejemplos de aplicaciones de atención médica a lo largo
de varios capítulos del libro.

Análisis en la cadena de valor minorista


El sector minorista es donde quizás vería la mayoría de las aplicaciones de análisis. Este es el dominio donde
los volúmenes son grandes pero los márgenes suelen ser estrechos. Los gustos y preferencias de los clientes
cambian con frecuencia. Las tiendas físicas y en línea enfrentan muchos desafíos para tener éxito. Y el
dominio del mercado en un momento dado no garantiza el éxito continuo. Por lo tanto, invertir en aprender
sobre sus proveedores, clientes, empleados y todas las partes interesadas que permiten que una cadena de
valor minorista tenga éxito y usar esa información para tomar mejores decisiones ha sido un objetivo de la
industria analítica durante mucho tiempo. Incluso los lectores ocasionales de análisis probablemente conozcan
las enormes inversiones de Amazon en análisis para impulsar su cadena de valor. De manera similar,
Walmart, Target y otros minoristas importantes han invertido millones de dólares en análisis para sus cadenas
de suministro. La mayoría de los proveedores de tecnología y servicios analíticos tienen una presencia
importante en el análisis minorista. La cobertura de incluso una pequeña parte de esas aplicaciones para
lograr nuestro objetivo de exposición podría llenar un libro completo. Así que esta sección solo destaca algunas aplicaciones potenciales.
La mayoría de estos han sido presentados por muchos minoristas y están disponibles a través de muchos
proveedores de tecnología, por lo que en esta sección daremos una visión más general en lugar de señalar
casos específicos. Esta visión general ha sido propuesta por Abhishek Rathi, director ejecutivo de
vCreaTek.com. vCre aTek, LLC es una empresa boutique de software y servicios de análisis que tiene oficinas
en la India, los Estados Unidos, los Emiratos Árabes Unidos (EAU) y Bélgica. La empresa desarrolla
aplicaciones en múltiples dominios, pero el análisis minorista es una de sus áreas de enfoque clave.
La figura 1.12 destaca los componentes seleccionados de una cadena de valor minorista. Comienza
con los proveedores y concluye con los clientes, pero ilustra muchos puntos de decisión intermedios de
planificación estratégica y operativa en los que el análisis (descriptivo, predictivo o prescriptivo) puede
desempeñar un papel en la toma de mejores decisiones basadas en datos. La Tabla 1.1 también ilustra
algunas de las áreas importantes de las aplicaciones analíticas, ejemplos de preguntas clave que pueden
responderse a través de la analítica y, por supuesto, el valor comercial potencial derivado de la aplicación de
dicha analítica. A continuación se analizan algunos ejemplos.

Cadena de valor minorista


Necesidades críticas en cada punto de contacto de la cadena de valor minorista

• Espacio en los estantes • Análisis de tendencia • Entregar sin problemas


mejoramiento • Categoría cliente
• Análisis de ubicación administración experiencia •
• Estante y piso • Predicción Comprender
planificación desencadenar eventos desempeño relativo
• Promociones en venta de canales
y descuento • Mejores pronósticos • Optimizar la comercialización
mejoramiento de la demanda estrategias

Depósito multicanal
Planificación Comercialización Comprar & Logística Operaciones
Vendedores Clientes

• Cadena de suministro • Promociones dirigidas • • Producto a tiempo • Retención de edificios


administración Inventario personalizado • disponibilidad en baja y satisfacción
• Costo de inventario Promociones y costos • Comprensión
mejoramiento optimización de precios • Cumplimiento de la orden las necesidades de la
• Escasez de inventario • Compras personalizadas y discotecas cliente mejor
y exceso experiencia • Reducido • Servicio de LTV alto
administración transportación clientes mejor
• Menos costos no deseados costos

FIGURA 1.12 Ejemplo de aplicaciones analíticas en una cadena de valor minorista. Contribución de Abhishek Rathi, director ejecutivo, vCreaTek.com
Machine Translated by Google

60 Capítulo 1 • Una descripción general de Business Intelligence, Analytics y Data Science

TABLA 1.1 Ejemplos de aplicaciones analíticas en la cadena de valor minorista


Analítico

Solicitud Pregunta de negocios Valor de negocio

Inventario 1. ¿Qué productos tienen una gran 1. Pronosticar el consumo de rápido movimiento

Mejoramiento demanda? productos y ordenarlos con suficiente inventario para evitar un

2. Qué productos son lentos escenario de falta de existencias.

¿Se muda o se vuelve obsoleto? 2. Realice una rápida rotación de inventario de productos de lento

movimiento combinándolos con uno de alta demanda.

Elasticidad de precio 1. ¿Cuánto margen neto tengo sobre el 1. Los precios de descuento para cada producto se pueden

producto? optimizar para reducir la pérdida de margen en dólares.

2. ¿Cuánto descuento puedo dar en este 2. Se identifica el precio optimizado para el paquete de productos

producto? para ahorrar dinero de margen.

Cesta de la compra 1. ¿Qué productos debo combinar para crear 1. El análisis de afinidad identifica lo oculto

Análisis una oferta de paquete? correlaciones entre los productos, que pueden ayudar en los

2. ¿Debo combinar productos? siguientes valores:

basado en características de movimiento a) Cree una estrategia para la oferta del paquete de productos en

lento y rápido? función del enfoque en el inventario o el margen.


3. ¿Debo crear un paquete a partir de b) Aumentar las ventas cruzadas o las ventas adicionales creando

la misma categoría o línea de categoría paquete de diferentes categorías o de las mismas categorías,

diferente? respectivamente.

Perspectiva del comprador 1. ¿Qué cliente está comprando qué producto 1. Mediante la segmentación de clientes, el dueño del negocio puede

en qué ubicación? crear ofertas personalizadas que resulten en una mejor

experiencia del cliente y retención del cliente.

Cliente 1. ¿Quiénes son los clientes que 1. Las empresas pueden identificar las relaciones con los clientes y los

Análisis de abandono ¿no volverá? productos que no funcionan y muestran una alta rotación. Por lo
2. ¿Cuánto negocio perderé? tanto, puede tener un mejor enfoque en la calidad del producto y la
3. ¿Cómo puedo retenerlos? razón de esa rotación.

4. ¿Qué demografía de cliente es mi cliente leal? 2. Con base en el valor de por vida del cliente (LTV), la empresa

puede hacer marketing dirigido que resulte en la retención del


cliente.

Análisis de canales 1. ¿Qué canal tiene menor 1. El presupuesto de marketing se puede optimizar en función de la

costo de adquisición del cliente? información para obtener un mejor retorno de la inversión.
2. Qué canal tiene mejor
¿retención de clientes?

3. ¿Qué canal es más rentable?

Nueva tienda 1. ¿Qué ubicación debo abrir? 1. Las mejores prácticas de otras ubicaciones y canales pueden

Análisis 2. ¿Qué y cuánto inventario de apertura debo ser utilizado para obtener un buen comienzo.

mantener? 2. La comparación con los datos de la competencia puede ayudar a


crear un factor diferenciador/PVU para atraer al
nuevos clientes.

Diseño de tienda 1. ¿Cómo debo hacer el diseño de la tienda 1. Comprender la asociación de productos para decidir el diseño de la

para una mejor línea superior? tienda y una mejor alineación con las necesidades del cliente.

2. ¿Cómo puedo mejorar mi experiencia de

cliente en la tienda? 2. El despliegue de la fuerza laboral se puede planificar para

una mejor interactividad con el cliente y, por lo tanto, una

experiencia satisfactoria para el cliente.

Análisis de vídeo 1. ¿Qué demografía ingresa a la tienda durante 1. Las promociones y los eventos en la tienda se pueden planificar

el período pico de ventas? en función de la demografía del tráfico entrante.

2. La participación del cliente objetivo y el descuento instantáneo

2. ¿Cómo puedo identificar a un cliente con mejoran la experiencia del cliente, lo que resulta en una

alto LTV en la entrada de la tienda para mayor retención.


que una mejor

experiencia personalizada se puede

proporcionar a este cliente?


Machine Translated by Google

Capítulo 1 • Una descripción general de Business Intelligence, Analytics y Data Science 61

Un sitio minorista en línea generalmente conoce a su cliente tan pronto como el cliente inicia sesión y,
por lo tanto, puede ofrecer páginas/ofertas personalizadas para mejorar la experiencia. Para cualquier tienda
minorista, conocer a su cliente en la entrada de la tienda sigue siendo un gran desafío.
Al combinar el análisis de video y la información/credencial emitida a través de su programa de fidelización, la
tienda puede identificar al cliente en la entrada y, por lo tanto, habilitar una oportunidad adicional para una
venta cruzada o una venta adicional. Además, se puede proporcionar una experiencia de compra personalizada
con un compromiso más personalizado durante el tiempo del cliente en la tienda.

Los minoristas de tiendas invierten mucho dinero en escaparates atractivos, eventos promocionales,
gráficos personalizados, decoraciones de tiendas, anuncios impresos y pancartas. Para discernir la eficacia de
estos métodos de marketing, el equipo puede utilizar análisis de compradores mediante la observación de
imágenes de circuito cerrado de televisión (CCTV) para averiguar los detalles demográficos del tráfico peatonal
en la tienda. Las imágenes de CCTV se pueden analizar utilizando algoritmos avanzados para obtener detalles
demográficos como la edad, el sexo y el estado de ánimo de la persona que navega por la tienda.
Además, los datos de movimiento del cliente en la tienda, cuando se combinan con el diseño de los
estantes y el planograma, pueden brindar más información al gerente de la tienda para identificar la venta caliente/
áreas rentables dentro de la tienda. Además, el gerente de la tienda puede usar esta información para planificar
también la asignación de mano de obra para esas áreas durante los períodos pico.
Los gerentes de categoría han utilizado comúnmente el análisis de la canasta de mercado para impulsar
la venta de los SKU que se mueven lentamente. Mediante el uso de análisis avanzados de los datos disponibles,
la afinidad del producto se puede realizar en el nivel más bajo de SKU para impulsar mejores ROI en las ofertas
de paquetes. Además, mediante el uso de técnicas de elasticidad de precios, también se puede deducir la
reducción o el precio óptimo de la oferta del paquete, reduciendo así cualquier pérdida en el margen de
beneficio.
Por lo tanto, mediante el uso de análisis de datos, un minorista no solo puede obtener información sobre
sus operaciones actuales, sino que también puede obtener más información para aumentar los ingresos y
disminuir el costo operativo para obtener mayores ganancias. Un bloguero de Data Science Central propone
una lista bastante completa de aplicaciones analíticas minoristas actuales y potenciales que un minorista
importante como Amazon podría usar. Esa lista está disponible en http://www.datasciencecen tral.com/profiles/
blogs/20-data-science-systems-used-by-amazon-to-operate-its-business.
Como se señaló anteriormente, hay demasiados ejemplos de estas oportunidades para enumerarlos aquí, pero
verá muchos ejemplos de tales aplicaciones a lo largo del libro.

SECCIÓN 1.6 PREGUNTAS DE REVISIÓN

1. ¿Por qué una compañía de seguros de salud invertiría en análisis más allá de la detección de fraudes?
¿Por qué les conviene predecir la probabilidad de caídas de los pacientes?
2. ¿Qué otras aplicaciones similares a la predicción de caídas imaginas?
3. ¿Cómo convencería a un nuevo cliente de seguro de salud para que adopte una vida más saludable?
estilos (Ejemplo 3 de Humana)?
4. Identificar al menos otras tres oportunidades para aplicar la analítica en el valor minorista
cadena más allá de los cubiertos en esta sección.
5. ¿Qué tiendas minoristas que conoce emplean algunas de las aplicaciones de análisis identificadas en
esta sección?

1.7 Una breve introducción a Big Data Analytics


¿Qué es Big Data?
Cualquier libro sobre análisis y ciencia de datos debe incluir una cobertura significativa de lo que se denomina
análisis de Big Data. Lo cubriremos en el Capítulo 7, pero aquí hay una introducción muy breve. Nuestros
cerebros funcionan de manera extremadamente rápida y eficiente y son versátiles en el procesamiento.

También podría gustarte