Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Reglas de Asociación
Reglas de Asociación
Cesta 1 1 1 0 0 0 1 0
Cesta 2 0 1 1 0 0 0 0
Cesta 3 0 0 0 1 1 1 0
Cesta 4 1 1 0 1 1 1 1
Cesta 5 0 0 0 0 0 1 0
Cesta 6 1 0 0 0 0 1 1
Cesta 7 0 1 1 1 1 0 0
Cesta 8 0 0 0 1 1 1 1
Cesta 9 1 1 0 0 1 0 1
1 EL CLIENTE HA ADQUIRIDO EL PRODUCTO
Cesta 10 0 1 0 0 1 0 0
0 EL CLIENTE NO HA ADQUIRIDO EL PRODUCTO
• A partir del análisis de la tabla anterior podemos
obtener, por simple observación, un par de
reglas de asociación:
1. SI agua y pan entonces galletas
2. SI pan y galletas entonces chocolate
Caso de estudio: cesta de • A diferencia de las reglas de clasificación, las
compras reglas de asociación pueden incluir, en el lado
derecho de la expresión, uno o más atributos.
• Generalizando, una regla de asociación presenta
la forma siguiente:
• SI A entonces B
• donde a (también llamado predecesor) y B
(también llamado sucesor o consecuente) son
dos conjuntos disjuntos de atributos, es decir,
que no tienen ningún elemento en común.
• La calidad de las reglas de asociación suele ser
medida mediante dos parámetros, para los cuales se
establecen requerimientos mínimos:
• Cobertura (Support).- número o porcentaje de instancias
Caso de estudio: cesta de (renglones) que la regla predice correctamente.
compras • Confianza (Confidence).- También llamada precisión, mide
el porcentaje de veces que la regla se cumple cuando es
posible aplicarla.
• Para nuestra regla número 1, tenemos que:
• Cobertura = 3 instancias que se cumplen totalmente
• Precisión = 75%, es decir, es correcta tres veces de las
cuatro en las cuales aplica.
• Para la regla de asociación siguiente:
• SI A entonces B (A B)
• es posible definir el soporte en la forma:
𝑛(𝐴∧𝐵)
• 𝑠𝑜𝑝𝑜𝑟𝑡𝑒 = = 𝑃(𝐴 ∧ 𝐵)
𝑛
• http://elvex.ugr.es/decsai/intelligent/slides/dm/D2%20Association.pdf
• https://www-users.cs.umn.edu/~kumar/dmbook/ch6.pdf
• https://www-users.cs.umn.edu/~kumar/dmbook/dmslides/chap6_basic_association_analysis.pdf
Ejercicio: cesta de compras
• Dado que las reglas de asociación trabajan con valores nominales (no numéricos), el
primer paso es modificar los valores en nuestra tabla de ejemplo, quedando de la
siguiente forma:
Vino Refresco Tequila Agua Pan Galletas Chocolate
Cesta 1 Si Si No No No Si No
Cesta 2 No Si Si No No No No
Cesta 3 No No No Si Si Si No
Cesta 4 Si Si No Si Si Si Si
Cesta 5 No No No No No Si No
Cesta 6 Si No No No No Si Si
Cesta 7 No Si Si Si Si No No
Cesta 8 No No No Si Si Si Si
Cesta 9 Si Si No No Si No Si
Cesta 10 No Si No No Si No 0
Ejercicio: cesta de compras
• Nuestro archivo debe ser guardado como datos separados por comas
(CSV utf-8) para poder ser cargado en weka:
Ejercicio: cesta de compras
• Para generar las reglas de asociación es necesario hacer click en la pestaña associate y el botón
start, nótese que el algoritmo predeterminado es a priori y que el número de reglas a generar
está limitado a 10, este valor puede ser modificado haciendo click justo sobre dicho valor:
Ejercicio: cesta de compras
• De esta forma, las reglas generadas nos llevan a pensar que, si alguien compra galletas,
de acuerdo a nuestros registros en la base de datos, no comprará tequila (regla 1) y que
si alguien compra agua, también comprará pan (regla 8).
• UN DETALLE IMPORTANTE CON ESTE CASO DE ESTUDIO ES QUE LA CANTIDAD DE REGISTROS (INSTANCIAS) ES MUY
PEQUEÑA Y QUE LOS ATRIBUTOS SON POCO ESPECÍFICOS, YA QUE NO SE INDICA EL TIPO DE GALLETAS (DULCES O
SALADAS) NI EL TIPO DE AGUA (SIMPLE, AGUA QUINA, AGUA MINERAL).
• LA SIMPLICIDAD DEL CASO, ENCAMINADA A LA COMPRENSIÓN DEL MÉTODO, NOS LLEVA A CONCLUSIONES GENERALES,
LAS CUALES PUEDEN SER MÁS ÚTILES CUANDO SE UTILIZAN MUCHOS MÁS REGISTROS Y SE ES MÁS ESPECÍFICO EN LOS
DETALLES DE LOS PRODUCTOS O, GENERALMENTE HABLANDO, EN LOS ATRIBUTOS DE CADA INSTANCIA.
Ejercicio: cesta de compras
• Desde luego, si nos interesa que la regla generada sea altamente representativa en nuestra base
de datos, debemos buscar las reglas con más alto soporte, para esto es posible modificar el
parámetro LowerBoundMinSupport =0.6, para el cual tenemos el siguiente resultado:
• De los hechos observados podemos concluir que la verdadera utilidad de las reglas de
asociación estriba en la interpretación que hagamos de las reglas presentadas por la
herramienta, lo cual implica hacer varios ejercicios modificando los parámetros de
soporte mínimo y confianza, analicemos dos casos más:
• LA REGLA 45 TIENE UNA CONFIANZA DEL 100% Y UN SOPORTE DE 3/10, LO CUAL NO ES TAN REPRESENTATIVO YA QUE, SIN DUDA,
NOS GUSTARÍA ENCONTRAR REGLAS QUE TUVIERAN UN SOPORTE DE 10/10 (PARA ESTE EJERCICIO), ES DECIR, QUE SE
CUMPLIERAN EN EL 100% DE LOS CASOS REGISTRADOS. EN CONCLUSIÓN PARA ESTA REGLA, SI ALGUIEN COMPRA PAN Y
TAMBIÉN COMPRA GALLETAS, DE ACUERDO A LOS REGISTROS DE NUESTRA PEQUEÑA BASE DE DATOS, TAMBIÉN COMPRARÁ
AGUA.
• LO IDEAL, DE ACUERDO A LA REGLA GENERADA, SERÍA COLOCAR ESTOS TRES PRODUCTOS LO MÁS CERCANOS ENTRE SÍ Y LO MÁS
VISIBLE POSIBLE PARA EL CONSUMIDOR.
• ¿QUÉ NOS INDICA LA REGLA 46?