Está en la página 1de 10

- Plaza Vea no tiene competidores en la ciudad de Puno (presente).

- La alta gerencia ha tomado conocimiento que Tottus dispondrá de una tienda en la ciudad de
Puno dentro de poco.
- Entre los objetivos estratégicos de Plaza Vea está el fidelizar a sus clientes, para el que no
ha tenido que desplegar mayor esfuerzo en la ciudad de Puno ( no tenía competencia
directa). Ahora que lo va a tener, necesita ir operativizando este objetivo.
- Su equipo ha sido convocado para que proponga un proyecto que permita la fidelización de
los clientes, a través de mejoras en la experiencia de usuario.
- Se ha pedido a su equipo un resumen (póster) que muestre a la alta dirección la aplicación
de minería de datos para alcanzar dichos objetivos.
- El equipo puede suponer otros aspectos no indicados como los datos, modelos y otros.

PLAZA VEA
1. Compresión del negocio.
Determine los objetivos comerciales
● Ofrecer la mejor experiencia de compra al contar con productos y servicios
de calidad.
● Fidelizar el segmento de mercado, mediante el programa de Descuentos y
Financiamiento mediante la suscripción a la Tarjeta Oh!
● Generar ahorro con la propuesta de Precios Bajos Todos los Días.
Evaluar la situación
● Plaza Vea se encuentra actualmente como el único supermercado de la
Provincia de Puno.
● Se conoce la introducción de un nuevo y único competidor dentro de la
categoría de supermercado en la Provincia de Puno.
● La empresa decide mejorar sus servicios, que permitan fidelizar al cliente
ante el nuevo competidor.
Determine los objetivos de la minería de datos
● Determinar la calidad de atención al cliente mediante comentarios de
clientes.
● Identificar los grupos de clientes que tienden a contratar una tarjeta de
crédito PlazaVea.
● Detectar los productos más vendidos según el horario de compra diario.
Producir plan de proyecto
El proyecto se dividirá en las siguientes etapas para de este modo
mantenerlo organizado y así estimar el tiempo de realización de este.
● Etapa 1: Análisis de la estructura de los datos y la información disponible
en la Base de Datos así como la recopilada para el fin del proyecto.
● Etapa 2: Ejecución de consultas, identificar relaciones entre los datos
para así tener muestras representativas de los datos.
● Etapa 3: Preparación de los datos (Selección, limpieza, conversión,
integración y formateo en caso de ser necesario).
● Etapa 4: Elección de herramientas, técnicas de modelado y ejecución
sobre los datos.
● Etapa 5: Producción de informes con los resultados obtenidos en función
de los objetivos de negocio.
● Etapa 6: Presentación de los resultados finales
Evaluación inicial de técnicas
Respecto a las técnicas que se van a emplear para la extracción de conocimiento, se
han seleccionado las siguientes:
Predictivas
● Clasificación
● Regresión
Descriptivas
● Agrupamiento o segmentación (Clustering)

K-means es un algoritmo de clasificación no supervisada (clusterización) que agrupa


objetos en k grupos basándose en sus características. El agrupamiento se realiza
minimizando la suma de distancias entre cada objeto y el centroide de su grupo o
cluster.
K-Nearest-Neighbor es un algoritmo basado en instancia de tipo supervisado de
Machine Learning. Puede usarse para clasificar nuevas muestras (valores discretos) o
para predecir (regresión, valores continuos).
Las Máquinas de Vectores de Soporte o Support Vector Machines (SVM) son un
conjunto de algoritmos de aprendizaje supervisado que están principalmente
relacionados con problemas de clasificación y regresión.

2. Comprensión de los datos.


Recopilar datos iniciales
● Seleccionar comentarios y post de redes sociales de los meses de agosto
a diciembre del 2022.
● Opinión de clientes en foros, redes sociales, comentarios, libro de
reclamaciones.
● Incentivos para el llenado de encuestas semanales, recolección de datos
personales como gustos y patrones de compras, satisfacción de atención,
entre otros.
● Cantidad, monto y porcentajes de compra de clientes de manera
mensual.
● Lista de productos, hora y fecha de compra, además de información
personal de los clientes.
Describa los datos
● De las ventas

Datos Tipo Descripción

Fecha y hora Fecha Fecha y hora de


compra

DNI (Nombres) Numérico Datos de la persona


atendida

Cantidad de Numérico Cantidad de los


productos productos adquiridos
durante la compra

Monto total Numérico Suma total de la


compra

Descuentos Numérico Suma total de


descuento obtenido
durante la compra

Nombre del cajero Texto Datos del personal de


atención encargado

Código de cajero Numérico Código asignado del


personal o cajero

● De las opiniones

Datos Tipo Descripción

Nombres Texto Datos personales de


la persona que brinda
su opinión

Cantidad de Numérico Contabilización de


comentarios positivos comentarios positivos
realizados

Cantidad de Numérico Contabilización de


comentarios negativos comentarios negativos
realizados

Cantidad de Numérico Contabilización de


comentarios neutros comentarios neutros
realizados

Porcentaje de Numérico Calificación obtenida


satisfacción de de la atención
compra

Incentivo otorgado Texto Acumulación de


beneficios otorgado al
cliente por comentario

Motivo de opinión Texto Razón de la opinión


obtenida por el cliente

Tendencia Texto Frecuencia de opinión


brindada
Explorar los datos
● De las ventas
○ Gráfico de barras del número de ventas que se realizaron en el día
por frecuencia.
○ Gráfica de barras del número de comprar por descuento
○ Gráfico de barras de edad por compras.
● De las opiniones
○ Gráfico de barras de tipo de comentario por hora.
○ Gráfico de barras de aceptación de encuestas por hora.
○ Gráfico de barras de caja de atención y experiencia de usuario.

Verificación de calidad de datos

● Para validar la calidad de los datos, tomaremos como referencia y


parámetro la norma ISO 20215 debido a que es el estándar de
seguridad de la información publicado por la Organización
Internacional de Normalización, mediante el uso de una matriz,
identificaremos qué datos deben ser considerados para mejorar su
calidad.
○ Conformidad
○ Confidencialidad
○ Eficiencia
○ Precisión
○ Trazabilidad
○ Comprensibilidad
3. Preparación de los datos.
Selección de datos
● Para los objetivos de la minería de datos, necesitaremos los datos
principales de las ventas realizadas, las opiniones obtenidas y la
frecuencia de estas opiniones, motivos y beneficios resultantes para
los clientes.
Limpiar datos
● De las ventas, para este caso incluiremos los datos de “Descuentos”,
“Cantidad de productos” y el “Nombre del cajero”.
● De las opiniones, incluimos los “Comentarios neutros”.
Construya datos
● Los datos obtenidos serán recolectados a partir de las ventas
realizadas a los clientes, durante jornadas del periodo asignado.
● Los datos tambièn serán recolectados
Integrar datos


Datos Tipo Descripción

Fecha y hora Fecha Fecha y hora de


compra

DNI (Nombres) Numérico Datos de la persona


atendida

Cantidad de Numérico Cantidad de los


productos productos adquiridos
durante la compra

Monto total Numérico Suma total de la


compra

Descuentos Numérico Suma total de


descuento obtenido
durante la compra

Nombre del cajero Texto Datos del personal de


atención encargado

Código de cajero Numérico Código asignado del


personal o cajero

Cantidad de Numérico Contabilización de


comentarios positivos comentarios positivos
realizados

Cantidad de Numérico Contabilización de


comentarios negativos comentarios negativos
realizados

Cantidad de Numérico Contabilización de


comentarios neutros comentarios neutros
realizados

Porcentaje de Numérico Calificación obtenida


satisfacción de de la atención
compra

Incentivo otorgado Texto Acumulación de


beneficios otorgado al
cliente por comentario

Motivo de opinión Texto Razón de la opinión


obtenida por el cliente

Tendencia Texto Frecuencia de opinión


brindada

Dar forma a los datos


Datos Tipo Descripción del


cambio

Fecha y hora Fecha

DNI (Nombres) Numérico

Cantidad de Numérico
productos

Monto total Numérico

Descuentos Numérico

Nombre del cajero Texto -> Numérico Asignar nombre del


cajero a un número
para una mejor
identificación

Código de cajero Numérico

Cantidad de Numérico
comentarios positivos

Cantidad de Numérico
comentarios negativos

Cantidad de Numérico
comentarios neutros

Porcentaje de Numérico
satisfacción de
compra

Incentivo otorgado Texto -> Numérico Cuantificar por escala


de niveles de
beneficio que se le
otorga al cliente

Motivo de opinión Texto

Tendencia Texto -> Numérico Agrupar tendencias


frecuentes en escala
4. Modelado.
Seleccione técnicas de modelado
C4.5 Algorithm
El algoritmo C4.5 es uno de los algoritmos de minería de datos más utilizados
para cumplir tareas de clasificación. Lo que se hace es generar un
clasificador en forma de árbol de decisión a partir de un conjunto de datos
que ya ha sido clasificado.
K-nearest neighbors

K-means
Uno de los algoritmos de agrupamiento más comunes, k-means, funciona
creando un número k-grupos a partir de un conjunto de objetos en función de
la similitud entre los objetos. Es posible que no se garantice que los
miembros del grupo sean exactamente similares, pero los miembros del
grupo serán más similares en comparación con los miembros que no
pertenecen al grupo.

SVM
En términos de tareas, la máquina de vectores de soporte (SVM) funciona de
manera similar al algoritmo C4.5, excepto que SVM no usa ningún árbol de
decisión. SVM aprende los conjuntos de datos y define un hiperplano para
clasificar los datos en dos clases. Un hiperplano es una ecuación para una
línea. SVM exagera para proyectar sus datos a dimensiones más altas. Una
vez proyectado, SVM define el mejor hiperplano para separar los datos en las
dos clases.

Apriori Algorithm
El algoritmo a priori funciona mediante el aprendizaje de reglas de
asociación. Las reglas de asociación son una técnica de minería de datos
que se utiliza para aprender correlaciones entre variables en una base de
datos. Una vez que se aprenden las reglas de asociación, se aplican a una
base de datos que contiene una gran cantidad de transacciones. El algoritmo
a priori se usa para descubrir patrones interesantes y relaciones mutuas y,
por lo tanto, se trata como un enfoque de aprendizaje no supervisado.

PageRank Algorithm
Es un algoritmo de análisis de enlaces que determina la importancia relativa
de un objeto enlazado dentro de una red de objetos. El análisis de enlaces es
un tipo de análisis de red que explora las asociaciones entre objetos.
Generar diseño de prueba
Para poder evaluar los modelos creados, debemos definir un plan que nos
ayude a valorar los modelos creados.

Modelo de compilación
Se crearon modelos

Evaluar el modelo
De los modelos creados se seleccionaron aquellos que mejores resultados
obtuvieron. Cada modelo creado tiene una hoja de especificaciones que
guarda información de los parámetros utilizados para obtener esos
resultados.

5. Evaluación.
Evaluar resultados
● Determinar la calidad de atención al cliente mediante comentarios de
clientes.
● Identificar los grupos de clientes que tienden a contratar una tarjeta de
crédito PlazaVea.
● Detectar los productos más vendidos según el horario de compra diario.

Modelo para el objetivo 1


Este modelo es factible debido a que muestra el nivel de satisfacción al cliente, el
cual consideramos aceptable desde el punto de vista de los objetivos de negocio.
Modelo para el objetivo 2

Este modelo es factible ya que se puede predecir el cliente propicio a


contratar una tarjeta de crédito, el cual consideramos aceptable desde el punto de
vista de los objetivos de negocio.

Modelo para el objetivo 3

Este modelo es factible ya que se puede predecir el o los productos más


vendidos en una fecha y horario futura, el cual consideramos aceptable desde el
punto de vista de los objetivos de negocio.

Proceso de revisión
Se revisan los modelos, sus parámetros y resultados. Se busca eliminar
errores que pudieron ocurrir en la fase previa.
Determine los próximos pasos
Evaluamos los modelos y se determina que se realizará a partir de este
momento. Con los modelos y los resultados ya podemos iniciar la siguiente
fase, despliegue, o hacer más iteraciones para producir modelos más
precisos según se necesite.

6. Despliegue.
Planificar la implementación:
El despliegue se realizará con la metodología Scrum. que presenta 3 fases:+
● Planificación: Product Backlog
○ Establecen las tareas prioritarias.
● Ejecución: Sprint:
○ Mini proyecto.
● Control: Burn Down:
○ Mide el progreso de un determinado proyecto
Supervisión y mantenimiento del plan
Como plan de mantenimiento y supervisión se podría establecer los
siguientes procesos:

● Extracción y almacenamiento de los datos guardando la información


obtenida en formato de hoja de cálculo o base de datos
● Distribución de los datos en función de los modelos de software de
minería de datos a trabajar.
● Los archivos de la explotación de datos deberán ser guardados.
● Los resultados obtenidos en cada explotación de datos serán
graficados estadísticamente para una mejor visualización e
interpretación de los resultados obtenidos en cada periodo.
Producir informe final

En este paso se debe presentar un informe resumiendo los puntos


importantes del proyecto y la experiencia adquirida durante su desarrollo. El
público al que va dirigido este informe sería el personal del área de
marketing, administradores, y gerentes de Plaza Vea, de tal manera que se
pueda estudiar la situación actual y tomar medidas correctivas para la mejora
del servicio operacional de PlazaVea. Cabe decir que parte de este informe
final será presentado de manera oral con una presentación, por lo que en
este apartado solamente haremos un breve resumen.

Revisar el proyecto
La propuesta planteada para este proyecto, se buscó obtener la preferencia
de clientes con respecto a la competencia, todo esto a base del estudio y
aplicación de metodologías de minería de datos, recolectando información
relevante en busca de la mejora de atención y satisfacción.
Se consideraron puntos importantes como la extracción de datos de compras
y encuestas de diferentes fuentes asociadas a la cadena de supermercado,
extrayendo para así lograr con estos datos e información de ayuda para la
identificación de patrones de déficit en los que se puedan mejorar.
A pesar de haber intentado generar unos datos lo más veraces posibles, no
cabe duda que existen multitud de factores que no podemos manejar y que
disponer de los datos reales y de más características. Esto se puede
interpretar como algo positivo, ya que podemos dar como válidos algunos
módulos y sin disponer de la cantidad de la veracidad de los datos que se
manejan en la base de datos, esto quiere decir que si los proyectos salen a la
realidad, los resultados mejorarán aún más.

https://www.canva.com/design/DAFLj5mW2FY/rcgC_2vFiBQD1qz17EA7xA/e
dit?utm_content=DAFLj5mW2FY&utm_campaign=designshare&utm_medium
=link2&utm_source=sharebutton

También podría gustarte