Documentos de Académico
Documentos de Profesional
Documentos de Cultura
inducción/C5.0)
Este ejemplo está relacionado con datos ficticios que describen el contenido de cestas
de supermercado (es decir, una colección de artículos comprados a la vez) junto con
los datos personales del comprador, que pueden obtenerse a través de las tarjetas de
fidelidad. El objetivo es descubrir grupos de clientes que compren productos parecidos
calificables desde el punto de vista demográfico, como por edad, ingresos, etc.
sexo
casa_propia. Si el titular posee o no una casa propia.
ingresos
edad
frutería
carne
lácteos
lata_veg
embutidos
congelados
cerveza
vino
refrescos
pescado
pastelería
Note: puede establecer las opciones de varios campos a la vez pulsando la tecla
Mayús para seleccionarlos antes de especificar una opción de las columnas.
sugiere que una visualización de malla (que muestre sólo asociaciones de dos
factores) puede resaltar algunos de los patrones de estos datos.
Conecte un nodo Malla al nodo Tipo, edite el nodo Malla, seleccione todo el contenido
de la cesta, seleccione Mostrar sólo marcas verdaderas y pulse en ejecutar el nodo
Malla.
Aquellos que compran pescado, fruta y verdura, a los que se podría denominar
"consumidores sanos".
Aquellos que compran vino y productos de pastelería.
Aquellos que compran cerveza, congelados y latas de verdura ("cerveza, judías
y pizza")
Primero debe derivar una marca para cada grupo. Esto se puede hacer de forma
automática utilizando la visualización de malla que acaba de crear. Con el botón
derecho del ratón, pulse en el enlace entre frutería y pescado para resaltarlo y pulse
con el botón derecho y seleccione Generar nodo Derivar para el enlace.
Para el tercer grupo (que implica tres enlaces), asegúrese primero de que ningún
enlace está seleccionado. A continuación, seleccione los tres enlaces en el
triángulo lata_veg, cerveza y congelados. Para ello, mantenga pulsada la tecla Mayús
mientras pulsa el botón izquierdo del ratón. (Asegúrese de estar en modo interactivo, y
no en modo de edición). A continuación, en el menú de la visualización de malla elija:
Para perfilar estos grupos de clientes, conecte el nodo Tipo existente a esos tres
nodos Derivar en serie y, a continuación, conecte otro nodo Tipo. En el nuevo nodo
Tipo, defina el rol de todos los campos como Ninguno, excepto
para valor, forma_pago, sexo, casa_propia, ingresos y edad, que deberían
establecerse como Entrada y el grupo de clientes relevante (por
ejemplo, cerveza_judías_pizza), que debería establecerse como Objetivo. Adjunte un
nodo C5.0, establezca el tipo Salida en Conjunto de reglas y pulse en ejecutar el
nodo. El modelo resultante (para cerveza_judías_pizza) contiene un perfil demográfico
claro para este grupo de clientes:
Rule 1 for T:
if sex = M
and income <= 16,900
then T
Resumen
Este ejemplo muestra cómo puede utilizarse IBM® SPSS Modeler para descubrir
afinidades, o enlaces, en una base de datos tanto por modelado (utilizando Apriori)
como por visualización (utilizando una visualización de malla). Estos enlaces se
corresponden con agrupaciones de casos de los datos. Dichas agrupaciones pueden
investigarse detalladamente y perfilarse mediante modelado (utilizando conjuntos de
reglas C5.0).