Está en la página 1de 26

Gestión

para la toma
de decisiones

Semana 14 – Principales Herramientas para Procesos Predictivos No Supervisados

© Profesores del Curso – Gestión para la Toma de Decisiones


1
Agenda
✓ Modelización Matemática
✓ Modelización Descriptiva
✓ Tipos de Análisis de Conglomerados
✓ Algoritmos No Supervisados
✓ Taller en Análisis de Asociación en Orange Canvas

© Profesores del Curso – Gestión para la Toma de Decisiones


2
Modelización Matemática

“La modelización
matemática es el arte de
aplicar la matemática a
situaciones de la vida real”

Niss,Mogens 1989

© Profesores del Curso – Gestión para la Toma de Decisiones


3
Modelización Descriptiva
Objetivos: Agrupaciones y Patrones

Separa grupos de objetos (Clusters) de similar varianza,


minimizando un concepto conocido como inercia, que es la
suma de las distancias al cuadrado de cada objeto del
Cluster a un punto conocido como Centroide (punto medio
de todos los objetos del Cluster).

Ejemplos:
Segmentación -> Clustering, K-Means
Asociación -> Ofertas de productos venta cruzada

© Profesores del Curso – Gestión para la Toma de Decisiones


4
Análisis de Asociación (Basket Analysis)

Objetivo: Identificación de eventos que ocurren juntos o en secuencia

Otros Ejemplos:
• Recomendaciones de compra basado en historial de compras y navegación
• Agrupar artículos que se suelen vender juntos.

© Profesores del Curso – Gestión para la Toma de Decisiones


5
Indicador:
Análisis de Canastas de Compra

HALLEMOS EL SOPORTE Y LA CONFIANZA PARA


CADA UNA DE LAS REGLAS A ANALIZAR

https://www.youtube.com/watch?v=PpqP3bFX1J4
© Profesores del Curso – Gestión para la Toma de Decisiones
6
Indicador:
Análisis de Canastas de Compra

https://www.youtube.com/watch?v=PpqP3bFX1J4
© Profesores del Curso – Gestión para la Toma de Decisiones
7
Segmentación (Clustering)
Objetivo: Organizar en grupos homogéneos
Poco valor

Valor Medio

Alto valor
Otros Ejemplos:
• Identificar áreas de similar topografía
• Buscar tipologías de clientes

© Profesores del Curso – Gestión para la Toma de Decisiones


8
Métodos Jerárquicos
Cuando aparece un grupo de elementos organizados de manera jerárquica.

p1
p3 p4
p2
p1 p2 p3 p4
Dendrograma Particional
Conglomerado Particional

p1
p3 p4
p2

p1 p2 p3 p4
Clonglomerado Jerarquico Dendograma Jerarquico
© Profesores del Curso – Gestión para la Toma de Decisiones
9
Algoritmos No Supervisados

© Profesores del Curso – Gestión para la Toma de Decisiones


10
El Negocio del Retail
• Gran Cantidad de Productos ➔5.000 SKU’s
• Gran Cantidad de Clientes (muchas veces no identificables)
• Gran Cantidad de Datos: POS
• Industria de Supermercados en fuerte competencia
• Variables claves del negocio
• Retener al cliente actual
• Manejo del espacio de venta
• Control de existencias en locales y centros de distribución
• Generación de Promociones atractivas para los clientes
• Descuentos
• Packs de Productos
© Profesores del Curso – Gestión para la Toma de Decisiones
11
Market Basket Analysis
Los hábitos de compra de los clientes pueden ser representados a través de asociaciones o
correlaciones entre los diferentes productos que compran en sus “canastas”.

Cliente 1: Cliente 2: Cliente 3:

{Arroz, puré, bebida} {Arroz, helado, pan} {Arroz, bebida, cerveza}

© Profesores del Curso – Gestión para la Toma de Decisiones


12
Indicador: Análisis de Compra
Importancia Relativa (Support):Indica el porcentaje de transacciones que llevan el antecedente y el consecuente,
con respecto al total de transacciones analizadas.
(𝑿 ∪ 𝒀)
𝑺= X= Antecedente , Y = Consecuente, T= # Transacciones
𝑻
T1 T2 T3

{arroz, puré, cerveza}, {arroz, helado, pan}, {arroz, bebida, cerveza}

1er vez 2da vez


El denominador son las 3 transacciones que existen en total, y el numerador es la
cantidad de veces que ocurre los productos (arroz->Cerveza) en total 2veces .

(𝑨𝒓𝒓𝒐𝒛 ∪ 𝑪𝒆𝒓𝒗𝒆𝒛𝒂) Support (arroz➔ cerveza)= 2/3=66%


𝑺=
#𝑻𝒓𝒂𝒏𝒔𝒂𝒄𝒄𝒊𝒐𝒏𝒆𝒔
Este indicador señala que tan frecuente es la relación entre productos con respecto al universo. Pero no
indica si existe vínculo entre ambos productos.
© Profesores del Curso – Gestión para la Toma de Decisiones
13
Indicador: Análisis de Compra
Confiabilidad (confidence):Supone una relación que se desea medir. Indica el porcentaje de transacciones que
llevan el antecedente
. y el consecuente juntos, con respecto al total de transacciones que llevan el antecedente.
𝑺(𝑿 ∪ 𝒀) X= Antecedente , Y = Consecuente, T= # Transacciones
𝑪=
𝑺(𝑿)
1 Vez Consecuente
T1 T2 T3

{arroz, puré, cerveza}, {arroz, helado, pan}, {arroz, bebida, cerveza}


2 veces antecedente

𝑺(𝑪𝒆𝒓𝒗𝒆𝒛𝒂 ∪ 𝑷𝒖𝒓𝒆)
𝑪=
𝑺(𝑪𝒆𝒓𝒗𝒆𝒛𝒂) Confianza (Cerveza➔ Pure)= 1/2=50%
En este caso el denominador indica la cantidad de veces en las cuales se ha presentado el producto antecedente (en mi ejemplo es Cerveza),
ocurriendo Cerveza, en nuestro caso en 2 transacciones.

En el numerador, se coloca, en cuantas de esas veces, también se compró el producto consecuente de la relación (en este caso en cuantas
TAMBIEN hubo Pure (además de Cerveza) en esas veces). Esto saldría 1 sola vez.

Entonces la confiabilidad es 1/2 para Cerveza=> Pure, que se leería confianza de que se compre el producto Puré, habiéndose comprado también
el producto Cerveza.
© Profesores del Curso – Gestión para la Toma de Decisiones
14
Análisis de Canasta de Compras
• Ganancia (Lift): Es un valor o puntaje que representa que antecedente y consecuente aparecen muchas
veces juntos mas de lo esperado; esto significa que la ocurrencia del antecedente tiene positivo efecto
sobre la ocurrencia del consecuente o que el antecedente esta positivamente correlacionado.
• Ejemplo:

𝑺𝒖𝒑𝒑𝒑𝒐𝒓𝒕 (𝑿∪ 𝒀)
𝑳𝒊𝒇𝒕 =
𝑺𝒖𝒑𝒑𝒐𝒓𝒕 𝑿 .𝑺𝒖𝒑𝒑𝒐𝒓𝒕 (𝒀)

#1 #2 #3

{Arroz, Puré, Cerveza} {Arroz, Helado, Pan} {Arroz, Bebida, Cerveza}


𝑺 (𝑪𝒆𝒓𝒗𝒆𝒛𝒂 ∪ 𝑷𝒖𝒓é) 1/3 𝟏/𝟑
Lift = (Cerveza, Puré) = = = = 1.5
𝑺 𝑪𝒆𝒓𝒗𝒆𝒛𝒂 . 𝑺(𝑷𝒖𝒓é) 𝟐/𝟑 𝒙 𝟏/𝟑 𝟐/𝟗

En el numerador va el # de veces que (Cerveza, Pure) se repite y observamos 1 vez, y dividido en el # de transacciones.
En el denominador va el # de veces que (Cerveza)aparece y observamos 2 veces y dividido en el # de transacciones.
En el denominador va el # de veces que (Pure) aparece y observamos 1 vez, y divido en el # de Transacciones.
Se realiza los cálculos y se obtiene el puntaje de Ganancia = 1.5

© Profesores del Curso – Gestión para la Toma de Decisiones


15
Ejercicio: Análisis de Canasta de Compras

https://www.youtube.com/watch?v=PpqP3bFX1J4

Regla Soporte Confianza Ganancia


𝑺(𝑿 ∪ 𝒀) 𝑺 (𝑿∪ 𝒀)
(𝑿 ∪ 𝒀) 𝑪= 𝑳=
𝑺= 𝑺(𝑿) 𝑺 𝑿 𝒙 𝑺 (𝒀)
𝑻
(2/5) / [(3/5)x(3/5)] = 50/45 = 1.111
A => D 2/5 2/3 (2/5) / [(4/5)x(3/5)] = 50/60 = 0.833
C => A 2/5 2/4 (2/5) / [(3/5)x(4/5)] = 50/60 = 0.833
A => C 2/5 2/3 (1/5) / [(3/5)x(3/5)] = 25/45 =0.556
B & C => D 1/5 1/3
© Profesores del Curso – Gestión para la Toma de Decisiones
16
Tres indicadores Altos:

• Support Alto: Significa que debería aplicar a una gran cantidad de


casos de canastas.

• Confidence Alto: Significa que debería ser muchas veces la


canasta correcta.

• Lift Alto: Significa que esto no es solo una coincidencia, que se


cumple la regla de asociación de productos con la canasta correcta.

© Profesores del Curso – Gestión para la Toma de Decisiones


17
Soluciones Comerciales disponibles

© Profesores del Curso – Gestión para la Toma de Decisiones


18
Reglas de Asociación
o Algoritmo a Priori

ORANGE CANVAS

© Profesores del Curso – Gestión para la Toma de Decisiones


19
Caso práctico: Comportamiento de Clientes
• Para comprender cualquier modelo, primero debe comprender los datos
que incluye. Los datos de este ejemplo contienen información sobre
comportamiento de Clientes cuando compran productos en el
Supermercado o Retails.
Algoritmo Reglas de
Asociación
Algoritmo Item
- Modelo Support
Frecuentes
- Modelo Confidence
- Modelo Support
- Modelo Ganancia

Modelos de
Asociación

© Profesores del Curso – Gestión para la Toma de Decisiones


20
Caso práctico: Modelo de Item Frecuentes

Tabla de Datos

Tabla de Archivos

Modelo de Item
Frecuentes
© Profesores del Curso – Gestión para la Toma de Decisiones
21
Caso práctico: Modelo Reglas de Asociación

Tabla de
Datos

3 principales indicadores de Canastas, se muestran


Archivo de en la tabla. Pueden hacerse infinidad de
Datos combinaciones para conocer el Patrón del
consumidor.
Reglas de
Asociación
© Profesores del Curso – Gestión para la Toma de Decisiones
22
Caso práctico: Modelo Reglas de Asociación

Aquí se realiza en forma selectiva que


combinaciones deseo obtener en Reglas
de Asociación

© Profesores del Curso – Gestión para la Toma de Decisiones


23
© Profesores del Curso – Gestión para la Toma de Decisiones
24
Tipos de Análisis de Conglomerados

© Profesores del Curso – Gestión para la Toma de Decisiones


25
Métricas de Validación/Test en Clustering

Validación Interna Validación Externa

• Cohesión y Separación • Precision


• Sum of Squared Within (SSW) • Recall
• Sum of Squared Between (SSB) • Medidas F
• Sum of Squared bases Indexed • Entropia
• Davies Bouldin • Pureza
• Coeficiente de Silhouette • Mutual Information

© Profesores del Curso – Gestión para la Toma de Decisiones


27

También podría gustarte