Está en la página 1de 3

2/23/2024

Association rules:
Association rules are a fundamental concept in data mining used to discover interesting
relationships between variables in large datasets. Specifically, association rule mining seeks to
identify associations or patterns that indicate a strong correlation between items in a dataset.

These rules are typically of the form "if X, then Y," where X and Y are sets of items. The rules
are evaluated based on two metrics: support and confidence. Support measures how frequently a
rule occurs in the dataset, while confidence measures how often the rule is true.

For example, in a retail dataset, an association rule might indicate that customers who buy bread
are also likely to buy butter. This information can be valuable for marketing strategies, such as
placing butter next to bread in the store to increase sales.

Possible applications:
1-. Discover new patterns in the answers.
2-. Check hypotheses about people`s preferences.
3-. Find relationships between groups of responses.
Basic Definitions:
Itemset: Colección de uno o más ítems {Leche, Pañales, cerveza}
Soporte: Frecuencia relativa en la que un itemset aparece dentro de los datos.
Itemset frecuente: Un itemset el cual aparece más veces que un determinado umbral.
Regla de Asociación: Expresión de la forma X  Y, donde X e Y son Itemsets:
- {Leche, baby diapers(pañales)}  {Cerveza}
– Antecedente  Consecuente
2/24/2024

Soporte, Confianza y Lift

Objetivo principal: Entender indicadores de rendimiento en las Reglas de Asociación.


Soporte: Frecuencia Relativa del Itemset.
Confianza: Probabilidad empírica de que ocurra el consecuente dado que ocurrió el antecedente.
Lift: Refleja el aumento de la probabilidad de que ocurra el consecuente cuando nos enteramos
de que ocurre el antecedente.

Soporte: Frecuencia relativa de una regla sobre el total


de las transacciones:

El soporte del Itemset (Leche, Pañales, cerveza) es de


0.4 o 40%. Es la cantidad de veces que aparece el
Itemset entre el total. Podemos decir que el 40% de las
transacciones muestran que leche, pañales y cerveza se
compraron juntos.

Confianza: Mide que tan confiable es la suposición


hecha por la regla. (Leche, Pañales) (Cerveza)
En el numerador podemos las veces que aparece el
Itemset y en el denominador las veces que aparece el
Antecedente. Podemos decir que el 67% de los
consumidores que compraron leche y pañales, también
compraron cerveza.

También podría gustarte