Está en la página 1de 5

Reglas de asociacin - Wikipedia, la enciclopedia libre https://es.wikipedia.

org/wiki/Reglas_de_asociacin

Reglas de asociacin
De Wikipedia, la enciclopedia libre

En minera de datos y aprendizaje automtico, las reglas de asociacin se utilizan para descubrir hechos que
ocurren en comn dentro de un determinado conjunto de datos.1 Se han investigado ampliamente diversos
mtodos para aprendizaje de reglas de asociacin que han resultado ser muy interesantes para descubrir
relaciones entre variables en grandes conjuntos de datos.

Piatetsky-Shapiro2 describe el anlisis y la presentacin de reglas 'fuertes' descubiertas en bases de datos


utilizando diferentes medidas de inters. Basado en el concepto de regla fuerte, Agrawal et al.3 presentaron un
trabajo en el que indicaban las reglas de asociacin que descubran las relaciones entre los datos recopilados a
gran escala en los sistemas de terminales de punto de venta de unos supermercados. Por ejemplo, la siguiente
regla:

Encontrada en los datos de ventas de un supermercado, indicara que un consumidor que compra cebollas y
verdura a la vez, es probable que compre tambin carne. Esta informacin se puede utilizar como base para
tomar decisiones sobre marketing como precios promocionales para ciertos productos o dnde ubicar stos
dentro del supermercado. Adems del ejemplo anterior aplicado al anlisis de la cesta de la compra, hoy en
da, las reglas de asociacin tambin son de aplicacin en otras muchas reas como el Web mining, la deteccin
de intrusos o la bioinformtica.

ndice
1 Definicin del problema
1.1 Ejemplo prctico
1.2 Reglas significativas, 'soporte' y 'confianza'
1.3 Mejora de la confianza: "Lift" (1, 2)
2 Algoritmos
3 Referencias
4 Vase tambin
5 Enlaces externos
5.1 Bibliografa
5.2 Implementaciones
5.3 Enlaces

Definicin del problema


Segn la definicin original de Agrawal et al3 el problema de minera de reglas de asociacin se define como:

1 de 5 10/7/17 23:25
Reglas de asociacin - Wikipedia, la enciclopedia libre https://es.wikipedia.org/wiki/Reglas_de_asociacin

Sea un conjunto de atributos binarios llamados items.

Sea un conjunto de transacciones almacenadas en una base de datos.

Cada transaccin en tiene un ID (identificador) nico y contiene un subconjunto de items de . Una regla se
define como una implicacin de la forma:

Donde:

Los conjuntos de items y se denominan respectivamente "antecedente" (o parte izquierda) y


"consecuente" (o parte derecha) de la regla.

Ejemplo prctico
Para ilustrar estos conceptos vase el siguiente ejemplo sobre ventas Ejemplo:
en un supermercado. El conjunto de items es: Base de datos con 4 items y 5
transacciones
ID Leche Pan Mantequilla Cerveza
A la derecha se muestra una pequea base de datos que contiene los 1 1 1 0 0
items, donde el cdigo '1' se interpreta como que el producto (item)
correspondiente est presente en la transaccin y el cdigo '0' significa 2 0 1 1 0
que dicho producto no est presente. Un ejemplo de regla para el 3 0 0 0 1
supermercado podra ser:
4 1 1 1 0
5 0 1 0 0

Significara que si el cliente compr 'leche' y 'pan' tambin compr


'mantequilla', es decir, segn la especificacin formal anterior se tendra que:

Reglas significativas, 'soporte' y 'confianza'


Ntese que el ejemplo anterior es muy pequeo, en la prctica, una regla necesita un soporte de varios cientos
de registros (transacciones) antes de que sta pueda considerarse significativa desde un punto de vista
estadstico. A menudo las bases de datos contienen miles o incluso millones de registros.

Para seleccionar reglas interesantes del conjunto de todas las reglas posibles que se pueden derivar de un
conjunto de datos se pueden utilizar restricciones sobre diversas medidas de "significancia" e "inters". Las
restricciones ms conocidas son los umbrales mnimos de "soporte" y "confianza".

El 'soporte' de un conjunto de items en una base de datos se define como la proporcin de transacciones
en la base de datos que contiene dicho conjunto de items:

2 de 5 10/7/17 23:25
Reglas de asociacin - Wikipedia, la enciclopedia libre https://es.wikipedia.org/wiki/Reglas_de_asociacin

En el ejemplo anterior el conjunto tiene un soporte de;

Es decir, el soporte es del 40% (2 de cada 5 transacciones).

La 'confianza' de una regla se define como:

Por ejemplo, para la regla:

La confianza sera:

Este clculo significa que el 50% de las reglas de la base de datos que contienen 'leche' y 'pan' en el antecedente
tambin tienen 'mantequilla' en el consecuente; en otras palabras, que la regla:

Es cierta en el 50% de los casos.

La confianza puede interpretarse como un estimador de , la probabilidad de encontrar la parte derecha


de una regla condicionada a que se encuentre tambin la parte izquierda.4

Las reglas de asociacin deben satisfacer las especificaciones del usuario en cuanto a umbrales mnimos de
soporte y confianza. Para conseguir esto el proceso de generacin de reglas de asociacin se realiza en dos
pasos. Primero se aplica el soporte mnimo para encontrar los conjuntos de items ms frecuentes en la base de
datos. En segundo lugar se forman las reglas partiendo de estos conjuntos frecuentes de items y de la
restriccin de confianza mnima.

Encontrar todos los subconjuntos frecuentes de la base de datos es difcil ya que esto implica considerar todos
los posibles subconjuntos de items (combinaciones de items). El conjunto de posibles conjuntos de items es el
conjunto potencia de y su tamao es de (excluyendo el conjunto vaco que no es vlido como
conjunto de items). Aunque el tamao del conjunto potencia crece exponencialmente con el nmero de items
de , es posible hacer una bsqueda eficiente utilizando la propiedad "downward-closure" del soporte3
(tambin llamada anti-montona5 ) que garantiza que para un conjunto de items frecuente, todos sus
subconjuntos tambin son frecuentes, y del mismo modo, para un conjunto de items infrecuente, todos sus
superconjuntos deben ser infrecuentes. Explotando esta propiedad se han diseado algoritmos eficientes (por
ejemplo: Apriori6 y Eclat7 ) para encontrar los items frecuentes.

3 de 5 10/7/17 23:25
Reglas de asociacin - Wikipedia, la enciclopedia libre https://es.wikipedia.org/wiki/Reglas_de_asociacin

Mejora de la confianza: "Lift" (1 (http://web.archive.org/web/http://www.daedalus.es


/mineria-de-datos/los-panales-y-la-cerveza/), 2 (http://users.dsic.upv.es/~jorallo/docent
/doctorat/weka.pdf))
El indicador lift expresa cul es la proporcin del soporte observado de un conjunto de productos respecto del
soporte terico de ese conjunto dado el supuesto de independencia. Un valor de lift = 1 indica que ese conjunto
aparece una cantidad de veces acorde a lo esperado bajo condiciones de independencia. Un valor de lift > 1
indica que ese conjunto aparece una cantidad de veces superior a lo esperado bajo condiciones de
independencia (por lo que se puede intuir que existe una relacin que hace que los productos se encuentren en
el conjunto ms veces de lo normal). Un valor de lift < 1 indica que ese conjunto aparece una cantidad de veces
inferior a lo esperado bajo condiciones de independencia (por lo que se puede intuir que existe una relacin que
hace que los productos no estn formando parte del mismo conjunto ms veces de lo normal).

Algoritmos
Existen diversos algoritmos que realizan bsquedas de reglas de asociacin bases de datos.

Apriori
Partition
Eclat

Referencias
1. T. Menzies, Y. Hu. Data Mining For Busy People. IEEE Computer, Outubro de 2003, pgs. 18-25.
2. Piatetsky-Shapiro, G. (1991), Discovery, analysis, and presentation of strong rules, in G. Piatetsky-Shapiro & W. J.
Frawley, eds, Knowledge Discovery in Databases, AAAI/MIT Press, Cambridge, MA.
3. R. Agrawal; T. Imielinski; A. Swami: Mining Association Rules Between Sets of Items in Large Databases",
SIGMOD Conference 1993: 207-216
4. Jochen Hipp, Ulrich Gntzer, and Gholamreza Nakhaeizadeh. Algorithms for association rule mining - A general
survey and comparison. SIGKDD Explorations, 2(2):1-58, 2000.
5. Jian Pei, Jiawei Han, and Laks V.S. Lakshmanan. Mining frequent itemsets with convertible constraints. In
Proceedings of the 17th International Conference on Data Engineering, April 2-6, 2001, Heidelberg, Germany, pages
433-442, 2001.
6. Rakesh Agrawal and Ramakrishnan Srikant. Fast algorithms for mining association rules in large databases. In Jorge
B. Bocca, Matthias Jarke, and Carlo Zaniolo, editors, Proceedings of the 20th International Conference on Very
Large Data Bases, VLDB, pages 487-499, Santiago, Chile, September 1994.
7. Mohammed J. Zaki. Scalable algorithms for association mining. IEEE Transactions on Knowledge and Data
Engineering, 12(3):372-390, May/June 2000.

Vase tambin
Minera de datos
Aprendizaje automtico
WEKA
Iconografa de las correlaciones

Enlaces externos

4 de 5 10/7/17 23:25
Reglas de asociacin - Wikipedia, la enciclopedia libre https://es.wikipedia.org/wiki/Reglas_de_asociacin

Bibliografa
Extensive Bibliography on Association Rules (http://www.uco.es/grupos/kdis/ARMBibliography) by
J.M. Luna
Annotated Bibliography on Association Rules (http://michael.hahsler.net/research/bib/association_rules/)
by M. Hahsler

Implementaciones
Implementaciones Java de algoritmos de asociacion (http://www.uco.es/grupos/kdis/ARMBibliography
/index.html)
arules (http://cran.r-project.org/package=arules), paquete para minera de reglas de asociacin con R.
Implementaciones en C de los algoritmos Apriori y Eclat (http://www.borgelt.net/fpm.html)
FIMI (Frequent Itemset Mining Implementations Repository) (http://fimi.cs.helsinki.fi/)
Frequent pattern mining implementations from Bart Goethals (http://adrem.ua.ac.be/~goethals/software/)
Weka (http://www.cs.waikato.ac.nz/ml/weka/), coleccin de algoritmos para tareas de minera de datos
implementados en Java.
Software de minera de datos deMohammed J. Zaki (http://www.cs.rpi.edu/~zaki/software/)

Enlaces
Detalles sobre reglas de asociaciones (http://blog.misproyectosenred.com/wordpress/asociacionismo-la-
parte-tecnica-elemental/) by abc

Obtenido de https://es.wikipedia.org/w/index.php?title=Reglas_de_asociacin&oldid=99056237

Categoras: Bancos de datos Minera de datos

Se edit esta pgina por ltima vez el 11 may 2017 a las 15:23.
El texto est disponible bajo la Licencia Creative Commons Atribucin Compartir Igual 3.0; pueden
aplicarse clusulas adicionales. Al usar este sitio, usted acepta nuestros trminos de uso y nuestra poltica
de privacidad.
Wikipedia es una marca registrada de la Fundacin Wikimedia, Inc., una organizacin sin nimo de
lucro.

5 de 5 10/7/17 23:25

También podría gustarte