Está en la página 1de 7

ESCUELA SUPERIOR POLITÉCNICA DE CHIMBORAZO

FACULTAD DE CIENCIAS
ESCUELA DE FÍSICA Y MATEMÁTICA
INGENIERÍA EN ESTADÍSTICA INFORMÁTICA

Estadística no paramétrica

DOCENTE:

Doctor. Rubén Pazmiño

INTEGRANTE:
Geovanny Miranda (247)
NIVEL:
Sexto
RIOBAMBA, 10 DE NOVIEMBRE 2020
1. PAQUETE ARULES Y FUNCIÓN ECLAT EN RSTUDIO

2. Introducción
Las reglas del paquete R presentadas en este documento proporcionan una
infraestructura básica para crear y manipular conjuntos de datos de entrada y para
analizar los conjuntos de elementos y reglas resultantes. (Hahsler et al.)
Eclat son los algoritmos básicos más conocidos para extraer conjuntos de elementos
frecuentes en un conjunto de transacciones. (Borgelt, «Implementaciones eficientes de
Apriori y Eclat»)
El paquete arules es para poder realizar la función eclat en especial podremos manipular
datos grandes a nuestro gusto, también veremos algunas funciones, usos, análisis,
clasificación, instalación, algoritmos, argumentos, entre otros.

3. Desarrollo

3.1 Descripción paquete arules

Proporciona una infraestructura para representar, manipular y analizar patrones y datos


de transacciones (conjuntos de elementos frecuentes y reglas de asociación). También
proporciona una implementación en C de los algoritmos de minería de asociaciones
Apriori y Eclat.(arules.pdf)

La extracción de conjuntos de elementos frecuentes y reglas de asociación es un


enfoque popular y bien investigado para descubrir relaciones interesantes entre variables
en grandes bases de datos. 

Este tipo de análisis se utiliza para estudiar la navegación del usuario a través de
páginas web, o para el análisis del carrito de compras a largo plazo para ver posibles
asociaciones condicionales, por lo que la introducción es simplemente el concepto de
causalidad entre dos eventos.

3.2 Paquetes básicos de arules:

 arules : paquete base arules con estructuras de datos, algoritmos de minería


(apriori y ECLAT), medidas de interés.
 ArulesViz : Extiende las 'arules' del paquete con varias técnicas de visualización
para reglas de asociación y conjuntos de elementos. El paquete también incluye
varias visualizaciones interactivas para la exploración de reglas.(arulesViz)
 ArulesCBA : Proporciona la infraestructura para la clasificación basada en
reglas de asociación, incluidos algoritmos como Clasificación basada en
asociaciones (CBA).
 ArulesSequences : Complemento de arules para manejar y extraer secuencias
frecuentes. Proporciona interfaces para la implementación C ++ de cSPADE por
Mohammed J. Zaki.(arulesSequences)

3.3 Análisis en la base de datos

 IbmdbR : IBM in-database analytics for R puede calcular reglas de asociación a


partir de una tabla de base de datos.
 Rfml : Extraiga conjuntos de elementos frecuentes o reglas de asociación
utilizando un servidor MarkLogic.

3.4 Interfaz

 Rattle : proporciona una interfaz gráfica de usuario para la minería de reglas de


asociación.
 Pmml : genera PMML (lenguaje de marcado de modelo predictivo) para reglas
de asociación.

3.5 Clasificación

 arco : Implementación alternativa de CBA.


 inTrees : Interpret Tree Ensembles proporciona funciones para: extraer, medir y
podar reglas; seleccionar un conjunto de reglas compacto; resumir las reglas en
un alumno.
 rCBA : Implementación alternativa de CBA.
 qCBA : Clasificación cuantitativa por reglas de asociación.
 sblr : algoritmo de listas de reglas bayesianas escalables para clasificación.

3.6 Detección de valores atípicos

fpmoutliers : valores atípicos de minería de patrones frecuentes.

3.7 Recomendación / predicción

recomennerlab : admite la creación de predicciones mediante reglas de asociación.


3.8 Instalación

Paso 1: Versión estable de CRAN: instale desde R el paquete mencionada

Paso 2: install. packages ("arules") o también puede instalar en r en opciones tools.

3.9 Ejemplo

1. Cargar el paquete y extraiga algunas reglas de asociación.

library("arules")

data("Adult")

rules <- a priori (Adult, parameter = list (supp = 0.5, conf = 0.9, target = "rules"))

2. Muestra de estadísticas básicas.

summary (rules)

3. Inspección de las reglas con la mayor elevación.

Inspect (head (rules, by = "lift"))

3.10 Descripción de la función eclat

Eclat es un programa que puede utilizar el algoritmo Eclat para encontrar conjuntos de
elementos frecuentes (incluidos elementos cerrados, elementos máximos y
generadores), existe desde la versión 5.0, el programa disponible anteriormente también
se puede utilizar para encontrar reglas de asociación.(Hahsler et al.)

Eclat también puede usar tidLists = TRUE como parámetro para devolver el ID de
transacción de cada conjunto de elementos encontrado, y el resultado puede ser
recuperado por el objeto '> tidLists (usando el método tidLists () de clase'> conjunto de
elementos). Tenga en cuenta que almacenar una lista de ID de transacciones consume
mucha memoria, y crear una lista de ID de transacciones solo es adecuado para crear un
conjunto relativamente pequeño de valores mínimos de soporte.(función eclat |
Documentación R)

La implementación de Eclat utiliza matrices de bits (dispersas) para representar listas de


transacciones y para filtrar conjuntos de elementos cerrados y máximos.

3.11 Implementación de Eclat

Mi implementación de Eclat representa el conjunto de transacciones como una matriz de


bits (dispersa) e interseca filas para determinar el soporte de conjuntos de elementos. La
búsqueda sigue un primer recorrido en profundidad de un árbol de prefijos como se
muestra en la Figura 2.(Borgelt, «Efficient Implementations of Apriori and Eclat»)

Ilustración 1 implementación de eclat

3.12 El algoritmo Eclat

El algoritmo Eclat se utiliza para realizar minería de conjuntos de elementos. La minería


de conjuntos de elementos nos permite encontrar patrones frecuentes en los datos, por
ejemplo, si un consumidor compra leche, también compra pan. Este tipo de patrón se
denomina reglas de asociación y se utiliza en muchos dominios de aplicación.(Yang
et al.)

3.13 Argumentos

 Datos: objeto de la clase '>transactionso cualquier estructura de datos que puede


ser obligado a '>transactions (por ejemplo, binario matrix, data.frame ).
 Parámetro: objeto de clase '>ECparametero lista con nombre (los valores
predeterminados son: soporte 0.1 y maxlen 5)
 Controlar: objeto de clase '>ECcontrolo lista con nombre para controles
algorítmicos.

3.14 Uso

eclat (datos, parámetro = NULL, control = NULL)

3.15 Ejemplo:

library("arules")
data (“Adult”)
1. Conjuntos de elementos de mina con soporte mínimo de 0.1
itemsets <- eclat (Adult, parameter = list (supp = 0.1, maxlen = 15))
2. Extraer conjuntos de elementos frecuentes con Eclat.
fsets<-eclat (Adult, parameter = list(sup=0.5))
3. Muestra los 5 conjuntos de elementos con el mayor apoyo.
fsets.top5<-sort(fsets)
fsets.top5
inspect (fsets.top5)
4. Obtenga los conjuntos de elementos como una lista
as(items(fsets.top5),"list")
5. Obtenga los conjuntos de elementos como una matriz binaria
as (items (fsets.top5 ) , "matrix" )
6. Obtenga los conjuntos de elementos como una matriz dispersa, una
ngCMatrix del paquete Matrix. Advertencia: por razones de eficiencia, el
ngCMatrix que obtiene se transpone
as (items (fsets.top5) , "ngCMatrix" )

4. Conclusión
El paquete arules nos facilita para poder manipular nuestros datos de forma que
queramos, podemos tener al alcance de nuestra mano grandes base de datos y de ello
podemos analizar, manipular, graficar y hacer cosas imaginables, también dentro de este
paquete viene incluido la función eclat que nos permite en si recuperar objetos
especificar variables y de ello analizar, la función eclat es para valores de soporte
mínimo más bajos, mientras que para valores de soporte mínimo más altos su desventaja
es casi insignificante.

5. Cita Bibliográfica

arules.pdf. https://cran.r-project.org/web/packages/arules/arules.pdf. Accedido 8 de

noviembre de 2020.

arulesSequences: Minería de secuencias frecuentes. R-Packages, https://CRAN.R-

project.org/package=arulesSequences. Accedido 8 de noviembre de 2020.

arulesViz: Visualización de reglas de asociación y conjuntos de elementos frecuentes.

R-Packages, https://CRAN.R-project.org/package=arulesViz. Accedido 8 de

noviembre de 2020.
Borgelt, Christian. «Efficient Implementations of Apriori and Eclat». Proceedings of

the IEEE ICDM Workshop on Frequent Itemset Mining Implementations; 19

November 2003, diciembre de 2003.

---. «Implementaciones eficientes de Apriori y Eclat». Proc. 1er Taller IEEE ICDM

sobre implementaciones mineras frecuentes de conjuntos de elementos (FIMI

2003, Melbourne, FL). Actas del taller CEUR 90.

función eclat | Documentación R.

https://www.rdocumentation.org/packages/arules/versions/1.6-6/topics/eclat.

Accedido 8 de noviembre de 2020.

Hahsler, Michael, et al. «Arules - A Computational Environment for Mining

Association Rules and Frequent Item Sets». Journal of Statistical Software, vol.

14, n.o 15, 2005. DOI.org (Crossref), doi:10.18637/jss.v014.i15.

Yang, Juncheng, et al. «An Improved Eclat Algorithm for Mining Association Rules

Based on Increased Search Strategy». International Journal of Database Theory

and Application, vol. 9, n.o 5, pp. 251-66.

También podría gustarte