Está en la página 1de 14

Universidad Tecnológica de México

Entregable 2 Reglas de Asociación


WEKA - UTILIZAR APRIORI para generar 20 reglas, analizar las reglas presentadas y destacar aquellas que
considere más importantes y expresivas sobre los hábitos de consumo de los consumidores. PROPONER
ESTRATEGIA.

M. C. Analítica e Inteligencia de Negocios


Mat. Descubrimiento de Patrones de Datos
Mtra. Claudia González Ruvalcaba
Alumno: Víctor Fonseca Rodríguez
Matricula: 17975466
Ciclo Escolar: 21-2

Fecha de entrega: 12 al 18 de abril de 2021


Índice
Introducción ......................................................................................................................................................................... 3
Datos de Weka:................................................................................................................................................................. 3
Reglas de Asociación: ........................................................................................................................................................ 4
Método A priori: ............................................................................................................................................................... 5
Objetivo de Este entregable: ............................................................................................................................................ 6
Análisis A priori 20 reglas: ..................................................................................................................................................... 7
El caso de estudio: ............................................................................................................................................................ 7
Análisis de las 20 reglas: ................................................................................................................................................... 8
Conclusiones: ...................................................................................................................................................................... 13
Estrategia: ....................................................................................................................................................................... 13
Bibliografía:......................................................................................................................................................................... 14

2
Introducción
Introducción una cuartilla incluye datos de WEKA, reglas de asociación, método Apriori, etc...
Datos de Weka:
En este trabajo final de la materia Descubrimiento de Patrones de Datos vamos explicar de la manera más clara
posible los principales aspectos del software Weka que se utiliza para el aprendizaje automático y minería de
datos, está escrito en Java, corre en casi todas las plataformas como: Windows, Linux, Mac OS y otras. El
software se desarrolló en la Universidad de Waikato, es un software libre que se distribuye bajo la licencia de
GNO, contiene herramientas de algoritmos para la visualización de datos y modelado de predictivo, que se unen
a una interfaz gráfica de usuario para acceder fácilmente a sus funcionalidades. Brinda acceso transparente a
cajas de herramientas que se conocen como: scikit-learn, R y Deeplearning4j. Se puede utilizar sin tener que
programar creando canales de aprendizaje automático, entrenar clasificadores y ejecutar evaluaciones sin tener
que escribir líneas de código. Se usa de la siguiente manera:
Abrir un conjunto de datos para evaluar.
Una vez eligiendo un clasificador, se selecciona un algoritmo de aprendizaje a utilizar, ejemplo clasificador J48,
que enseña árboles de decisiones.
Evaluar la precisión predictiva, Finalmente corremos una 10-fold-cross-validatión para evaluar y obtener una
estimación del rendimiento predictivo.
Los programadores pueden implementar fácilmente estos canales utilizando la API de Java de Weka ejemplo:

WekaDeeplearning4j es un paquete de aprendizaje profundo para Weka. Las redes neuronales profundas,
incluyendo las redes recurrentes, se pueden entrenar directamente desde las interfaces gráficas de usuario de
Weka, que nos proporciona una metodología de vanguardia para tareas como la clasificación de imágenes y
texto.
Weka se puede se puede integrar con las herramientas de ciencia de datos más populares, tales como: R usando
el paquete RWeka, los algoritmos R y herramientas de visualización se pueden invocar desde Weka con el
paquete RPlugin para Weka. Se puede acceder a las funciones de Weka desde Python usando Python Weka
Wrapper, y contrariamente Python toolkits semejante a scikit-learn puede ser usado desde Weka.
Weka se utiliza en muchas áreas con finalidades docentes y de investigación, soporta varias tareas estándar de
minería de datos como son: re procesamiento de datos, clasificación, regresión, visualización y selección.

3
Reglas de Asociación:
En minería de datos y aprendizaje automático, las reglas de asociación se utilizan para descubrir hechos que
ocurren en común dentro de un determinado conjunto de datos. Hay muchas investigaciones acerca de los
métodos para el aprendizaje de reglas de asociación muy interesantes para descubrir relaciones entre variables
en grandes conjuntos de datos.
Reglas de asociación, según la definición original de Agrawal et al problema de minería de reglas de asociación
se define como:

Un ejemplo de esto es en la industria, si una tienda departamental ve que un cliente que compra determinados
productos tales como: verduras, vegetales como cebollas es probable que también quiera comprar carne para
preparar un alambre por ejemplo, con esta información se pueden diseñar estrategias de marketing para lanzar
promociones y ponerlos en lugares determinados dentro del súper para encontrarlos de manera rápida y así la
tienda pueda vender más con la asociación de productos, se me ocurre que el departamento de carnes,
pescados y mariscos, esté cerca de las frutas y verduras. Las reglas de asociación también se aplican a minería
en la web, detección de intrusos o bioinformática, etc.
En Weka las reglas de asociación se utilizan como: se abre la aplicación, se le da click al botón explorar

Abrimos el archivo correspondiente, se pueden buscar archivos ya preparados, se carga el conjunto de datos,
se le da la opción de asociar, por defecto ya tiene el asociador Apriori, al darle click podemos entre otras cosas
cambiar propiedades para dar más precisión para encontrar las reglas de asociación, la propiedad se refiere al
decremento que el programa va haciendo con cada iteración (delta), el soporte mínimo para escoger las reglas
de asociación, el tipo de métrica, por defecto está en el sistema (confianza), el método mínimo (0.9),número de
reglas, por defecto están (10), lo anterior se utiliza para dar precisión al momento de que Weka busque las

4
reglas de asociación, aplicando los parámetros dependiendo del tipo de reglas de asociación se encuentren, se
le da ok Se puede cambiar el tipo de asociador, en el ejemplo del video, utilizaron el tipo de asociador por
filtrado, pero con este asociador no todas las reglas que se definieron sirven para encontrar las reglas de
asociación, se debe de escoger el filtro adecuado para el tipo de reglas que se necesiten, en el tutorial del video
se escogieron supervisado, en la parte de atributo se escoge selección de atributos, se le da ok e iniciar. Nos
proporciona algunas reglas de asociación y un pequeño resumen de los parámetros con los que encontró estas
reglas, por ejemplo: el soporte, las métricas mínimas, la confianza y número de siclos, y después nos da unas
reglas de asociación en forma de lista. En cada regla nos proporciona las métricas y los valores de cada métrica,
para aclarar que regla de asociación es más efectiva para los casos que se estén evaluando. La parte más
compleja es la interpretación de las reglas, que dependen de cada una de sus métricas en Weka es a través de:
soporte, la confianza, levantamiento, leverage o apalancamiento y la convicción, a continuación, la definición
matemática de cada una de ellas:

EL soporte y la confianza definen el grado de interés de una regla de asociación, una regla con un valor bajo de
soporte puede ocurrir simplemente por casualidad; se utiliza para eliminar reglas que no resultan interesantes
al análisis que se efectúa. Un valor de confianza alto indica que el porcentaje de transacciones que contienen X
también a Y de manera conjunta.

Método A priori:
El algoritmo A priori se utiliza en minería de datos, en bases de datos transaccionales, permite encontrar de
manera eficiente “conjuntos de ítems frecuentes”, los cuales sirven de base para generar reglas de asociación.
Identifica los ítems individuales frecuentes en la base de datos y se extienden a conjuntos de mayor tamaño
siempre y cuando esos conjuntos de datos esos conjuntos de datos aparezcan suficientemente seguidos en las
bases de datos. Se aplica mucho en transacciones comerciales y en problemas de predicción (fuente Wikipedia).
En Weka al abrir el explorador lo primero que vemos es que nos aparecen diferentes técnicas de minería de
datos, hay que cargar la data set sobre se quiere trabajar al cargar este aparecen todos sus atributos, para poder
ejecutar el algoritmo A priori se debe de comprobar que todos los atributos sean de tipo nominal, en la pestaña
associate se selecciona el algoritmo a priori, cuando se hace click en las opciones de a priori se abre una ventana
donde aparecen los parámetros básicos de a priori como: reglas de asociación, el tipo de métricas, etc. Cuando
se configura el algoritmo se le da click de acuerdo a los parámetros indicados se pueden analizar los resultados,

5
entre estos resultados nos muestra una lista con reglas de asociación. Se pueden modificar de acuerdo al tipo
de consecuente, en el video nos muestra un ejemplo de reglas del atributo edad y de astigmatismo, solo se le
dará la opción del número que corresponde al índice que queremos, ya después se deberá comprobar que todas
las reglas que nos devuelve a priori contienen el atributo que seleccionamos en el consecuente.

Objetivo de Este entregable:


Para este entregable tendremos que instalar Weka y cargar una data set del supermercado para analizar 20
reglas a priori con distintos valores elegidos por mí de soporte mínimo y confianza. Después analizar esas reglas
destacando aquellas que considero más importantes y expresivas sobre los hábitos de consumo de los
consumidores. Con las reglas que se destaqué se generará una estrategia de negocios para sugerir.

6
Análisis A priori 20 reglas:
El caso de estudio:
Se analiza la información de un
supermercado los patrones de venta de
productos con la finalidad nuevas
estrategias de venta y de marketing para
mantener la posición de algunos productos
e incrementar las ventas de otros productos
y sea atractivo para los clientes del
supermercado. La regla de asociación que
se utilizó es A Priori la cual se aplicará a la
herramienta Weka. Se presenta un set de 20
reglas que presenten el análisis de los
productos, ejemplo:

Parámetros:

 Instancias: 4,627
 Atributos: 215
 Límite superior: 1.0
 Límite inferior: 0.05
 Regla: Apriori 20
 Soporte mínimo: 0.06 (278 instancias)
 Métrica mínima (nivel de confianza):
0.95

7
Análisis de las 20 reglas:

No. Regla Salida Confianza Lift Lev Vonv


baking needs=t pet foods=t ==> bread and cake=t
1 tissues-paper prd=t cheese=t 281 0.96 1.33 (0.02) [70] (6.32)
fruit=t total=high 293

De un total de 293 clientes si alguno compra insumos para hornear, alimentos para perro, pañuelos, queso,
fruta: 281 de ellos comprarán pan y pastel.
No. Regla Salida Confianza Lift Lev Vonv

. biscuits=t frozen foods=t pet bread and cake=t 284


foods=t milk-cream=t margarine=t
2 0.96 (1.33) (0.02) [70] (5.95)
fruit=t vegetables=t 297

De un total de 297 clientes si alguno de ellos compra galletas, alimentos congelados, alimentos para mascotas, leche,
crema, margarina, fruta, verduras: 284 de ellos compraran pan y pastel.

8
No. Regla Salida Confianza Lift Lev Vonv

biscuits=t cheese=t milk-cream=t bread and cake=t 281


beef=t total=high 294
3 0.96 (1.33) (0.02) [69] (5.89)

De un total de 294 clientes si alguno de ellos compra galletas, queso, leche, crema, carne: 281 comprarán pan
y pastel.
No. Regla Salida Confianza Lift Lev Vonv

baking needs=t frozen foods=t pet bread and cake=t 281


foods=t milk-cream=t margarine=t
4 0.96 (1.33) (0.02) [69] (5.89)
fruit=t total=high 294

De un total de 294 clientes, si alguno de ellos compra insumos para hornear, alimentos congelados, alimentos
para mascotas, leche, crema, margarina, fruta: 281 de ellos comprarán pan y pastel.
No. Regla Salida Confianza Lift Lev Vonv

frozen foods=t pet foods=t cheese=t bread and cake=t


milk-cream=t fruit=t total=high 293 280
5 0.96 (1.33) (0.02) [69] (5.87)

De un total de 293 clientes, si alguno de ellos compra alimentos congelados, comida para mascotas, queso,
leche, crema, fruta: 280 de ellos comprarán pan y pastel.
No. Regla Salida Confianza Lift Lev Vonv
baking needs=t biscuits=t canned bread and cake=t
vegetables=t party snack foods=t 299
6 fruit=t total=high 313 0.96 (1.33) (0.02) [73] (5.85)

De un total de 313 clientes, si alguno de ellos compra insumos para hornear, galletas, verduras enlatadas,
bocadillos para fiestas, fruta: 299 de ellos comprarán pan y pastel.
No. Regla Salida Confianza Lift Lev Vonv

baking needs=t frozen foods=t pet bread and cake=t


foods=t milk-cream=t margarine=t 299
7 0.96 (1.33) (0.02) [73] (5.85)
fruit=t vegetables=t 313

De un total de 313 clientes, si alguno de ellos compra insumos para hornear, alimentos congelados, alimentos
para mascotas, leche, crema, margarina, fruta y verduras: 299 de ellos comprarán pan y pastel.

9
No. Regla Salida Confianza Lift Lev Vonv
baking needs=t frozen foods=t pet bread and cake=t
foods=t tissues-paper prd=t milk- 292
8 0.95 (1.33) (0.02) [71] (5.72)
cream=t fruit=t total=high 306

De un total de 306 clientes, si alguno de ellos compra insumos para hornear, alimentos congelados, alimentos
para mascotas, pañuelos desechables, crema, leche, fruta: 292 comprarán pan y pastel.
No. Regla Salida Confianza Lift Lev Vonv

baking needs=t biscuits=t frozen bread and cake=t


foods=t party snack foods=t 309
9 0.95 (1.33) (0.02) [75] (5.68)
cheese=t fruit=t total=high 324

De 324 clientes, si alguno de ellos compra insumos para hornear, galletas, alimentos congelados, bocadillos para
fiestas, queso, fruta: 309 de ellos comprarán pan y pastel.
No. Regla Salida Confianza Lift Lev Vonv
frozen foods=t party snack foods=t bread and cake=t
small goods=t fruit=t total=high 300 286
10 0.95 (1.32) (0.02) [70] (5.61)

De un total de 300 clientes, si alguno de ellos compra alimentos congelados, bocadillos para fiestas, small godos
(botanas, dulces, salchichas pequeñas, etc.), fruta: 286 comprarán pan y pastel.
No. Regla Salida Confianza Lift Lev Vonv

baking needs=t juice-sat-cord-ms=t bread and cake=t


biscuits=t party snack foods=t 285
11 cheese=t fruit=t total=high 299 0.95 (1.32) (0.02) [69] (5.59)

De un total de 299 clientes, si alguno de ellos compra insumos para hornear, jugos, galletas, bocadillos para
fiestas, queso, fruta: 285 de ellos comprarán también pan y pastel.
No. Regla Salida Confianza Lift Lev Vonv

baking needs=t biscuits=t frozen bread and cake=t


foods=t pet foods=t milk-cream=t 282
12 0.95 (1.32) (0.02) [68] (5.53)
margarine=t fruit=t 296

De un total de 296 clientes, si alguno de ellos compra insumos para hornear, galletas, comida congelada,
alimento para mascotas, leche, crema, margarina, fruta: 282 de ellos comprarán pan y pastel.

10
No. Regla Salida Confianza Lift Lev Vonv

biscuits=t frozen foods=t party snack ==> bread and


foods=t cheese=t milk-cream=t cake=t 282
13 0.95 (1.32) (0.01) [68] (5.53)
fruit=t total=high 296 ==>

De un total de 296 clientes, si alguno de ellos compra galletas, comida congelada, bocadillos para fiestas, queso,
leche, crema, fruta: 282 de ellos comprarán pan y pastel.
No. Regla Salida Confianza Lift Lev Vonv

baking needs=t biscuits=t frozen bread and cake=t


foods=t cheese=t milk-cream=t 302
14 0.95 (1.32) (0.02) [73] (5.55)
fruit=t total=high 317

De un total de 317 clientes, si alguno de ellos compra insumos para hornear, galletas, comida congelada, queso,
leche, crema, fruta: 302 de ellos comprarán pan y pastel.
No. Regla Salida Confianza Lift Lev Vonv

frozen foods=t pet foods=t tissues- bread and cake=t


paper prd=t cheese=t fruit=t 281
15 0.95 (1.32) (0.01) [68] (5.51)
total=high 295

De un total de 295 clientes, si alguno de ellos compra comida congelada, alimento para mascotas, pañuelos
desechables, queso, fruta: 281 de ellos comprarán pan y pastel.
No. Regla Salida Confianza Lift Lev Vonv

biscuits=t pet foods=t cheese=t milk- bread and cake=t


cream=t fruit=t total=high 292 278
16 0.95 (1.32) (0.01) [67] (5.46)

De un total de 292 clientes, si alguno de ellos compra galletas, comida para mascotas, leche, crema, fruta: 278 de ellos
comprarán pan y pastel.

No. Regla Salida Confianza Lift Lev Vonv

baking needs=t biscuits=t pet bread and cake=t


foods=t cheese=t fruit=t total=high 291
17 0.95 (1.32) (0.02) [70] (5.36)
306

De un total de 306 clientes, si alguno de ellos compra insumos para hornear, galletas, alimento para mascotas,
queso, fruta: 291 de ellos comprarán pan y pastel.

11
No. Regla Salida Confianza Lift Lev Vonv

baking needs=t frozen foods=t pet bread and cake=t


foods=t cheese=t fruit=t total=high 291
18 0.95 (1.32) (0.02) [70] (5.36)
306

De un total de 306 clientes, si alguno de ellos compra insumos para hornear, comida congelada, alimento para
mascotas, queso, fruta: 291 de ellos comprarán pan y pastel.

No. Regla Salida Confianza Lift Lev Vonv

baking needs=t juice-sat-cord-ms=t bread and


biscuits=t cheese=t fruit=t vegetables=t cake=t 307
19 0.95 (1.32) (0.02) [74] (5.33)
total=high 323

De un total de 323 clientes, si alguno de ellos compra insumos para hornear, juego de cables, galletas, queso,
fruta, vegetales: 307 de ellos comprarán pan y pastel.
No. Regla Salida Confianza Lift Lev Vonv

baking needs=t laundry needs=t party bread and


snack foods=t tissues-paper prd=t cake=t 285
20 0.95 (1.32) (0.01) [69] (5.26)
fruit=t total=high 300

De un total de 300 clientes, si alguno de ellos compra insumos para hornear, insumos para lavar la ropa,
bocadillos para fiestas, papel higiénico, pañuelos desechables o servilletas, fruta: 285 de ellos comprarán pan y
pastel.

12
Conclusiones:
Las reglas generadas para este caso de estudio fueron altamente representativas de la base de datos, acorde a
los valores presentados, las reglas más importantes y representativas de los hábitos de consumo son:

 Las primeras 7 reglas tienen un nivel de confianza de 96% y por lo tanto para mí son las más importantes
y las restantes tienen un nivel de confianza de 95%.
 Por lo tanto, las reglas de mayor soporte son las que tuvieron un nivel de confianza más alto como se
mencionó con anterioridad fueron de la 1 a la 7.
 De acuerdo al levantamiento las reglas tuvieron un valor de mayor a 1 los conjuntos aparecen una
cantidad de veces mayor a lo esperado bajo condiciones de independencia, se intuye que existe una
relación que hace que los productos se encuentren en el conjunto más veces de lo normal, tienen una
correlación positiva, se refiere a que el aumento de uno significa el aumento de otros.
 Para generar las reglas de asociación se tomó en consideración una confianza mínima de 0.95
(minMetric) con un lowerBoundSupport de 0.05.
 El Data Set tiene muchos valores faltantes (missing Data) por ello se le dio la opción removeAllMissingCol
= True para discriminar la columna con los datos faltantes.

Estrategia:

Se debe dar más énfasis al departamento de panadería, y pastelería con productos de calidad e innovadores,
especialmente en los días con mayor afluencia de clientes como viernes de quincena y fines de semana, incluir
galletas y en días especiales se ofrecerá a los clientes pizzas en rebanadas o completas, además de estar ubicada
cerca de otros productos como quesos, salchichería, crema, lácteos en general, vinos y licores, carnes, pescados
y mariscos, etc. Que a su vez se conectan con otros departamentos como mascotas ya que nuestros clientes
piensan en la comida, pero también cuidan de sus mascotas, el departamento de insumos para preparar hornear
deberá de dársele más énfasis y contar con insumos y utensilios para preparar toda clase de alimentos
horneados, en general todos los productos comestibles, bebidas en general (refrescos, aguas de sabor, cervezas,
etc.), deberán de estar cerca así como las botanas y toda clase de alimentos enlatados para generar ventas por
productos que se relacionan, así como el pan comercial, (Bimbo), galletas de varios proveedores, pan dulce
industrializado, etc.

13
Bibliografía:
al menos 3 fuentes consultadas

Duarte, D. 20 mayo 2020. Weka que es? Recuperado de: https://www.youtube.com/watch?v=bbiL6mllFEk

Castillo, J. 18 nov. 2017. Reglas de Asociación en Weka. Minería de Datos. Recuperado de:
https://www.youtube.com/watch?v=FtBSgG_Z96A

Ventura, S. 11 oct 2016. VideoAPriori2. Recuperado de: https://www.youtube.com/watch?v=C00N04auROo

González, C. (2018). 02 reglas de asociación.

González, C. (2018). Ejemplo WEKA

González, R. (2020). Resumen semana 04 (podcast)

Hall, M. (mayo, 2011) Tutorial 1: Introduction to the WEKA Explorer. Recuperado de:
http://www.micai.org/2012/tutorials/Weka%20tutorials%20Spanish.pdf

Salazar, J. (Febrero, 2012) Weka tutorial parte 1/3 https://www.youtube.com/watch?v=5c9404w5erM

Salazar, J. (Febrero, 2012) Weka tutorial parte 2/3 https://www.youtube.com/watch?v=VhmCqE-Ap5M

14

También podría gustarte