Está en la página 1de 31

Deep Learning y sus

Aplicaciones en los Negocios

Sesión 09 - 10: Clustering y Análisis de Canastos


Agenda

• Modelo CRISP
• Caso de Estudio – Árbol de Decisión
• Caso de Estudio – Random Forest
• Caso de Estudio – Market Basket Analysis

Deep Learning y sus Aplicaciones en los Negocios


2
Clustering

Deep Learning y sus Aplicaciones en los Negocios


3
Clustering

• Identificar grupos de individuos /objetos con características


similares.
• Tipologías
• Economía: Segmentación de Mercados de Consumidores
• Biología: Creación sistemática sobre el mundo vegetal y animal
• Medicina: Clasificación de las enfermedades en función a su sintomalogía
• Definición de Cluster
• Conjunto de técnicas multivariantes cuyo principal propósito es la
agrupación de individuos en conglomerados (cluster) basándose en la
características de los mismos.

Deep Learning y sus Aplicaciones en los Negocios


4
Aprendizaje supervisado vs No supervisado

• Aprendizaje Supervisado: Identifica


los
patrones en los atributos de los datos
buscando un atributo objetivo.
• Estos patrones se utilizan para predecir los
valores de la clase objetivo en instancias de
registros futuros. Aprendizaje Supervisado

• Aprendizaje No Supervisado: Los datos no


tienen un atributo objetivo.
• Exploramos la data para encontrar patrones
en ella misma.

Aprendizaje No Supervisado

Deep Learning y sus Aplicaciones en los Negocios


5
¿Qué es el análisis Cluster?

• Encontrar grupos de manera que los objetos de un grupo sean similares (o


relacionados) entre sí y sean diferentes (o no estén relacionados) con los objetos
de otros grupos.

Maximiza la
Minimiza la distancia entre-
distancia intra- clusters.
cluster.

Deep Learning y sus Aplicaciones en los Negocios


6
6
Conglomerado o Clustering

Puntos Originales Clustering

Deep Learning y sus Aplicaciones en los Negocios


7
7
Método de Análisis de Conglomerados

Deep Learning y sus Aplicaciones en los Negocios


8
Clasificación de clusters o conglomerados

• Se clasifican en:

• Particional
• Se dividen los datos en sub grupos que
no se traslapan haciendo que cada
elemento pertenezca a un único sub
grupo.

• Jerárquico
• Cuando aparece un grupo de
elementos organizados de manera
jerárquica.

Deep Learning y sus Aplicaciones en los Negocios


9
9
Método de Análisis
Conglomerado Jerárquico

p1
p3 p4
p2
p1 p2 p3 p4
Conglomerado Jerárquico Tradicional Dendograma Tradicional

p1
p3 p4
p2
p1 p2 p3 p4
Clustering Jerárquico No Tradicional Dendograma No Tradicional

Deep Learning y sus Aplicaciones en los Negocios


10
10
Método de Análisis
Conglomerado No Jerárquico

• Conglomerado K-means y Variaciones

Diagrama de Alcanzabilidad

• Conglomerado en base la Densidad


Característica de ID
Ordenados

• Conglomerado Jerárquico

Deep Learning y sus Aplicaciones en los Negocios


11
Variaciones de Algoritmos K-means

Distancia IntraCluster

Monto Consumo
Distancia IntraCluster
Hartigan-W

Monto Consumo
Lloyd
Distancia IntraCluster
McQueen

Monto Consumo
Forgy
Distancia IntraCluster

Nota: Distancia intracluster es

Monto Consumo
la suma de las distancia de los
centroides

Deep Learning y sus Aplicaciones en los Negocios


12
Método de Agrupamiento

Deep Learning y sus Aplicaciones en los Negocios


13
Selección de Distancia entre Conglomerados

Las distancias entre los conglomerados son funciones de las distancias


entre observaciones, hay varias formas de definirlas:

• Sean A y B dos conglomerados:

Deep Learning y sus Aplicaciones en los Negocios


14
Selección de Distancia entre Conglomerados

Deep Learning y sus Aplicaciones en los Negocios


15
Ejercicio de Clustering

Deep Learning y sus Aplicaciones en los Negocios


16
Pasos con Análisis ORANGE
• Formulación del Problema

• Selección del Archivo

• Tipos de las variables

• Análisis Conglomerados Jerárquicos

• Escoger la medida de distancia

• Escoger el método de agrupamiento

• Vecino mas lejano

• Método Ward

• Determinar la Red - distancias

• Explorar la Red

• Determinar el Dendograma
Deep Learning y sus Aplicaciones en los Negocios
17
Ejemplo Clustering - Orange

Deep Learning y sus Aplicaciones en los Negocios


18
Conglomerado – Patrón de Consumo MPG

Deep Learning y sus Aplicaciones en los Negocios


19
Análisis de Canastas

Deep Learning y sus Aplicaciones en los Negocios


20
Market Basquet Analysis

Análisis de Canasta de
Mercado

Deep Learning y sus Aplicaciones en los Negocios


21
Análisis de Canastas de Mercado

Los hábitos de compra de los clientes pueden ser representados a través de asociaciones o
correlaciones entre los diferentes productos que compran en sus “canastas”.

Cliente 1 Cliente 2 Cliente 3

Arroz, pure, bebida Arroz, helado, pan Arroz, bebida, cerveza

Deep Learning y sus Aplicaciones en los Negocios


22
Aplicaciones en el Negocio
• Posicionamiento de los productos en el lineal.

Colocar juntas la cerveza y las patatas fritas si se ha determinado que se compran simultáneamente, maximiza la venta
de ambos productos.

• Mejoras de las ofertas “trade”.

En el sector del retail habitualmente se hacen ofertas de paquetes de compra de 2 o más productos. La búsqueda de
asociaciones permite la selección de estos productos para maximizar la atención del cliente y, finalmente, las ventas de
los paquetes.

• Selección del surtido para las tiendas.

En las tiendas no caben todos los productos de los que dispone el supermercado. El análisis de los productos que se
compran simultáneamente en la tienda más grande de la cadena ayuda en la selección del surtido de las tiendas.

• La venta cruzada (o “cross-selling”) de productos complementarios en caja.

Ofrecer un producto a todos los clientes que pasan por caja es una buena estrategia para vender más. Pero, ¿qué
pasaría si pudiéramos hacer una oferta personalizada en función del ticket de compra del cliente, en lugar de ofrecer
siempre el mismo producto, sea cual sea el cliente? Si sabemos que el arroz está asociado a la compra simultánea de
tomate frito, ofrezcamos el tomate a ese cliente que ha comprado arroz, en lugar de un refresco de cola.

Deep Learning y sus Aplicaciones en los Negocios


23
Análisis de Canasta de Compras
Importancia Relativa (Support):Indica el porcentaje de transacciones que llevan el antecedente y el
consecuente, con respecto al total de transacciones analizadas.
(𝑿 ∪ 𝒀)
𝑺= X= Antecedente , Y = Consecuente, T= Total # Transacciones
𝑻
T1 T2 T3

{arroz, cerveza,pure}, {arroz, helado, pan}, {arroz, bebida, cerveza}


2da vez
1er vez

El denominador son las 3 transacciones que existen en total, y el numerador es la cantidad de veces que
ocurre los productos (arroz->Cerveza) en total 2veces .
(𝑨𝒓𝒓𝒐𝒛 ∪𝑪𝒆𝒓𝒗𝒆𝒛𝒂)
Support (arroz→cerveza) = P (arroz U cerveza) Support = = 2/3 = 66.7%
#𝑻𝒓𝒂𝒏𝒔𝒂𝒄𝒄𝒊𝒐𝒏𝒆𝒔

Este indicador señala que tan frecuente es la relación entre productos con respecto al universo. Pero no
indica si existe vínculo entre ambos productos.
Deep Learning y sus Aplicaciones en los Negocios
24
Análisis de Canasta de Compras
Confiabilidad (confidence):Supone una relación que se desea medir. Indica el porcentaje de transacciones que llevan el
antecedente y el consecuente juntos, con respecto al total de transacciones que llevan el antecedente.

𝑺(𝑿 ∪ 𝒀) X= Antecedente , Y = Consecuente, T= # Transacciones


𝑪=
𝑺(𝑿)
1 Vez Consecuente
T1 T2 T3

{arroz, cerveza, pure} {arroz, helado, pan}, {arroz, bebida, cerveza}


2 veces antecedente

𝑺(𝑪𝒆𝒓𝒗𝒆𝒛𝒂 ∪ 𝑷𝒖𝒓é) 𝟏
Confiabilidad = (Cerveza→ Puré) = P(Cerveza/Pure) 𝑪=
𝑺(𝑪𝒆𝒓𝒗𝒆𝒛𝒂)
= = 𝟓𝟎%
𝟐
En este caso el denominador indica la cantidad de veces en las cuales se ha presentado el producto antecedente (en mi ejemplo es
Cerveza), ocurriendo Cerveza, en nuestro caso en 2 transacciones.

En el numerador, se coloca, en cuantas de esas veces, también se compró el producto consecuente de la relación (en este caso en cuantas
TAMBIEN hubo Puré (además de Cerveza) en esas veces). Esto saldría 1 sola vez.
Entonces la confiabilidad es 1/2 para Puré=>Cerveza, que se leería confianza de que se compre el producto Puré, habiéndose comprado
también el producto Cerveza.
Deep Learning y sus Aplicaciones en los Negocios
25
Ejercicio: Soporte y Confianza

Realice las siguientes reglas:


Transacciones
𝑆𝑜𝑝𝑜𝑟𝑡𝑒 (𝐴𝑈𝐶)
ABC 𝑆𝑜𝑝𝑜𝑟𝑡𝑒 (𝐴 → 𝐶) =
# 𝑇𝑟𝑎𝑛𝑠𝑎𝑐𝑐𝑖𝑜𝑛𝑒𝑠 =?
BC
AC 𝑆𝑜𝑝𝑜𝑟𝑡𝑒 (𝐴𝑈𝐶)
ACD 𝐶𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 (𝐴 → 𝐶) =
𝑆𝑜𝑝𝑜𝑟𝑡𝑒 (𝐴)
=?

Deep Learning y sus Aplicaciones en los Negocios


26
Análisis de la Ganancia (Lift)

• La ocurrencia de un itemset A es independiente de otro B si P(A U B) =


P(A).P(B), en caso contrario, existe cierta dependencia o correlación.
• La correlación o Ganancia entre dos eventos se define como:

𝑃(𝐴𝑈𝐵) 𝑆𝑢𝑝𝑝𝑜𝑟𝑡 (𝐴𝑈𝐵)


𝐶𝑜𝑟𝑟 𝐴, 𝐵 = = 𝐿𝑖𝑓𝑡 𝐴 → 𝐵 =
𝑃 𝐴 .𝑃(𝐵) 𝑆𝑢𝑝𝑝𝑜𝑟𝑡 𝐴 .𝑆𝑢𝑝𝑝𝑜𝑟𝑡(𝐵)

• Si Lift es menor que 1, entonces la ocurrencia de uno decrece la ocurrencia


del otro.
• Si Lift es 1 son independientes.
• Si Lift es mayor que 1 la ocurrencia de uno favorece la ocurrencia de otro.

Deep Learning y sus Aplicaciones en los Negocios


27
Análisis de Canasta de Compras
• Ganancia (Lift): Es un valor o puntaje que representa que antecedente y consecuente aparecen muchas veces juntos mas de lo
esperado; esto significa que la ocurrencia del antecedente tiene positivo efecto sobre la ocurrencia del consecuente o que el
antecedente esta positivamente correlacionado.
• Ejemplo:
𝑺𝒖𝒑𝒑𝒑𝒐𝒓𝒕 (𝑿∪ 𝒀)
𝑳𝒊𝒇𝒕 =
𝑺𝒖𝒑𝒑𝒐𝒓𝒕 𝑿 .𝑺𝒖𝒑𝒑𝒐𝒓𝒕 (𝒀)

T1 T2 T3
{Arroz, Cerveza, pure} {Arroz, Helado, Pan} {Arroz, Bebida, Cerveza}

𝑺 (𝑪𝒆𝒓𝒗𝒆𝒛𝒂 ∪ 𝑷𝒖𝒓é) 1/3 𝟏/𝟑


Lift = (Cerveza, Puré) = = = = 1.5
𝑺 𝑪𝒆𝒓𝒗𝒆𝒛𝒂 . 𝑺(𝑷𝒖𝒓é) 𝟐/𝟑 𝒙 𝟏/𝟑 𝟐/𝟗

En el numerador va el # de veces que (Cerveza, Puré) se repite y observamos 1 vez, y dividido en el # de transacciones.
En el denominador va el # de veces que (Cerveza) aparece y observamos 2 veces y dividido en el # de transacciones.
En el denominador va el # de veces que (Puré) aparece y observamos 1 vez, y divido en el # de Transacciones.
Se realiza los cálculos y se obtiene el puntaje de Ganancia = 1.5

Deep Learning y sus Aplicaciones en los Negocios


28
Tres indicadores Altos:

• Support Alto: Significa que debería aplicar a una gran cantidad de


casos de canastas.

• Confidence Alto: Significa que debería ser muchas veces la


canasta correcta.

• Lift Alto: Significa que esto no es solo una coincidencia, que se


cumple la regla de asociación de productos con la canasta correcta.

Deep Learning y sus Aplicaciones en los Negocios


29
Ejercicios en
ORANGE CANVAS

También podría gustarte