Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Patrones de Asociacion
Patrones de Asociacion
Patrones de asociación
Patrones frecuentes
Itemset
2. REGLAS DE ASOCIACIÓN
Medidas de evaluación
Propiedades de la confianza
Problema
3. ALGORITMOS PARA PATRONES FRECUENTES
5. BIBLIOGRAFÍA
1
INTRODUCCIÓN
Patrones de asociación
Propósito
Origen
2
Patrones de asociación
Aplicaciones
3
Patrones de asociación
Ejemplo
COMPRAS
ID Productos
1 fondant, azúcar, colorante
2 fondant, revistas, libros
3 azúcar, revistas, libros
4 fondant, azúcar, revistas, libros
5 fondant, azúcar, colorantes, libros
4
Patrones frecuentes
Universo (U)
u1 u2 . . . uj . . . um
T1 τ11 τ12 . . . τ1j . . . τ1m
Transacciones (T)
(
1 si el ı́tem j está presente en la transacción Ti
τij =
0 en otro caso
5
Patrones frecuentes
Ejemplo
• Productos de la compra
u1 = fondant, u2 = azúcar, u3 = colorante, u4 = revistas, u5 = libros
6
Patrones frecuentes
Algunas definiciones
7
Patrones frecuentes
Ejemplo
u1 u2 u3 u4 u5
T1 1 1 1 0 0 I = {u1 , u2 } ⇒ sup(I ) = 3/5
T2 1 0 0 1 1 I = {u2 , u4 } ⇒ sup(I ) = 2/5
T3 0 1 0 1 1 I = {u2 , u3 , u4 } ⇒ sup(I ) = 0
T4 1 1 0 1 1
T5 1 1 1 0 1
8
Patrones de asociación
Propiedades
∀I , J : J ⊆ I ⇒ supp(J) ≥ supp(I )
9
REGLAS DE ASOCIACIÓN
Reglas de asociación
Definición
X →Y
{revistas} → {libros}
{libros} → {revistas}
{azúcar, fondant} → {colorante}
{fondant} → {azúcar, colorante}
10
Reglas de asociación
Medidas de evaluación
11
Reglas de asociación
Ejemplo
• Productos de la compra
u1 = fondant, u2 = azúcar, u3 = colorante, u4 = revistas, u5 = libros
Observaciones
13
Reglas de asociación
Propiedades
14
Reglas de asociación
1. Soporte mı́nimo
supp(X → Y ) ≥ minsupp
2. Confianza mı́nima
conf (X → Y ) ≥ minconf
15
ALGORITMOS PARA
PATRONES FRECUENTES
Algoritmos para patrones frecuentes
Búsqueda exhaustiva
16
Algoritmos para patrones frecuentes
17
Algoritmos para patrones frecuentes
k 2k − 2
2 2
4 14
8 126
15 32766
20 1048574
18
Algoritmos para patrones frecuentes
• Todas las reglas anteriores tienen el mismo soporte, ya que han sido
construidas desde el mismo conjunto de ı́tems.
• Sin embargo, la confianza varı́a, ya que depende de la distribución de
los ı́tems en el antecedente y consecuente de las reglas.
• Por tanto, la búsqueda de reglas que cumplan los requerimientos
mı́nimos de soporte y confianza puede desarrollar en dos etapas.
19
Algoritmos para patrones frecuentes
20
Algoritmos para patrones frecuentes
21
Algoritmos para patrones frecuentes
22
Algoritmos para patrones frecuentes
Algoritmos Apriori
datos: T , transacciones
entrada: minsupp, umbral de soporte mı́nimo
variable: Ck , k-ı́tems candidatos a ser frecuentes
variable: Fk , k-ı́tems frecuentes
Sk
salida: i=1 Fi , conjuntos frecuentes de ı́tems
propósito: Encontrar eficientemente los conjuntos frecuentes de ı́tems
propuesta: Aplicar inteligentemente la propiedad de clausura descen-
dente del soporte.
23
Algoritmos para patrones frecuentes
k = 1;
F1 = {conjuntos de 1-itemsets frecuentes};
repeat
Generar Ck+1 uniendo pares de elementos de Fk ;
Podar los itemsets de Ck+1 que violen la clausura descendente;
Determinar Fk+1 ;
k = k + 1;
until (Fk = ∅);
Sk
return ( i=1 Fi );
24
Algoritmos para patrones frecuentes
• Transacciones
u1 u2 u3 u4 u5
T1 1 1 1 0 0
T2 1 0 0 1 1
T3 0 1 0 1 1
T4 1 1 0 1 1
T5 1 1 1 0 1
• Soporte mı́nimo: minsupp = 3/5
25
Algoritmos para patrones frecuentes
• Iteración 1.-
26
Algoritmos para patrones frecuentes
• Iteración 2.-
27
Algoritmos para patrones frecuentes
• Iteración 3.-
28
Algoritmos para patrones frecuentes
Conjunto Soporte
{u1 } 4/5
{u2 } 4/5
{u4 } 3/5
{u5 } 4/5
{u1 , u2 } 3/5
{u1 , u5 } 3/5
{u2 , u5 } 3/5
{u4 , u5 } 3/5
29
Algoritmos para patrones frecuentes
Generación de reglas
30
Algoritmos para patrones frecuentes
Generación de reglas
31
Algoritmos para patrones frecuentes
32
Algoritmos para patrones frecuentes
33
OTRAS MEDIDAS DE
EVALUACIÓN
Otras medidas de evaluación
34
Otras medidas de evaluación
Tipos de medidas
35
Otras medidas de evaluación
B B
A f11 f10 f1+
A f01 f00 f0+
f+1 f+0 N
• A, B: variables.
• f11 , número de veces que aparecen conjuntamente A y B.
• f10 , número de veces que aparece A, pero no B.
• f01 , número de veces que no aparece A, pero sı́ B.
• f00 , número de veces que no aparecen ni A ni B.
• N , número total de observaciones.
36
Otras medidas de evaluación
Café No café
Té 150 50 200
No té 650 150 800
800 200 1000
37
Otras medidas de evaluación
Café No café
Té 150 50 200
No té 650 150 800
800 200 1000
• Es decir, conocer que una persona bebe té hace que disminuya la
probabilidad de que beba café.
38
Otras medidas de evaluación
• Lift
conf (X → Y )
Lift(X → Y ) =
supp(Y )
• Se tiene que:
supp(X ∪ Y ) N · f11
Lift(X → Y ) = =
supp(X ) · supp(Y ) f1+ · f+1
39
Otras medidas de evaluación
40
Otras medidas de evaluación
41
Otras medidas de evaluación
42
Otras medidas de evaluación
43
Otras medidas de evaluación
44
BIBLIOGRAFÍA
Bibliografı́a
Aggarwal, C. C.
Data Mining. The Textbook.
Springer, 2015.
Agrawal, R., Imieliński, T., and Swami, A.
Mining association rules between sets of items in large
databases.
In Proceedings of the 1993 ACM SIGMOD International Conference
on Management of Data (New York, NY, USA, 1993), SIGMOD ’93,
ACM, pp. 207–216.
Tan, P.-N., Steinbach, M., and Kumar, V.
Introduction to Data Mining.
Addison-Wesley, 2006.
45
Licencia
46