Está en la página 1de 35

Facultad de Ingeniería

Carrera Profesional de Ingeniería de Sistemas e Informática

Implementación de probadores digitales para la


empresa TOPITOP

Trabajo que como parte del curso de Innovación y


Transformación Digital presentan los estudiantes:

APELLIDOS Nombres Códigos

Incio Nuñez, Christian Jesús U17211957


Avila Tito, Diego Armando U18304745
Castro Mantari, Antonny Edison U17301854
Sánchez castro, Nicolle Brigith U18303583
Vasquez Ruiz, Erika Milagros U18202963

Lima – Perú
2022
RESUMEN............................................................................................................................................................... 4
ABSTRACT............................................................................................................................................................... 5
INTRODUCCIÓN...................................................................................................................................................... 6
CAPÍTULO I: PROBLEMÁTICA................................................................................................................................... 7
1.1 Contexto..................................................................................................................................................... 7
1.2 Descripción del problema........................................................................................................................... 7
1.3 Objetivo del proyecto................................................................................................................................. 7
1.3.1 Objetivo general......................................................................................................................................... 7
1.3.2 Objetivos específicos.................................................................................................................................. 8
CAPÍTULO II: DEFINICIÓN DEL PROYECTO................................................................................................................. 8
2.1 Definición del Proyecto............................................................................................................................... 8
2.2 Beneficios esperados.................................................................................................................................. 8
2.3 Áreas impactadas y principales representantes........................................................................................... 8
2.4 Cronograma y riesgos iniciales del proyecto.............................................................................................. 10
2.4.1 Fecha inicio y fin del proyecto................................................................................................................... 10
2.4.2 Etapas del proyecto:................................................................................................................................. 10
2.4.3 Cronograma del proyecto, detallar las actividades.....................................................................................10
2.4.4 Describir los riesgos que pueda tener el proyecto......................................................................................10
CAPÍTULO III: DESARROLLO DEL PROYECTO........................................................................................................... 11
3.1 Diagrama de Gantt.................................................................................................................................... 11
3.2 Metodología CRISP - DM........................................................................................................................... 11
3.2.1 Fase I. Business Understanding. Definición de necesidades del cliente (comprensión del negocio).............11
3.2.2 Fase II. Data Understanding. Estudio y comprensión de los datos..............................................................12
3.2.3 Fase III. Data Preparation. Análisis de los datos y selección de características............................................13
3.2.4 Fase IV. Modeling. Modelado.................................................................................................................... 14
3.2.5 Fase V. Evaluation. Evaluación (obtención de resultados)..........................................................................14
3.3. Metodología aplicada al Proyecto............................................................................................................. 16
3.3.1 Fase I. Business Understanding. Definición de necesidades del cliente (comprensión del negocio).............16
3.3.2 Fase II. Data Understanding. Estudio y comprensión de los datos..............................................................17
3.3.3 Fase III. Data Preparation. Análisis de los datos y selección de características............................................18
3.3.4 Fase IV. Modeling. Modelado.................................................................................................................... 19
3.3.5 Fase V. Evaluation. Evaluación (obtención de resultados)..........................................................................20
3.3.6 Fase VI. Deployment. Despliegue (puesta en producción)..........................................................................21
CAPÍTULO IV: ANALISIS DE APLICACIONES DE MACHINE LEARNING........................................................................22
4.1 Definicion de algoritmos........................................................................................................................... 22
4.1.1 Algoritmos de Aprendizaje Profundo......................................................................................................... 22
4.1.2 Árboles de decision................................................................................................................................... 23
4.1.3 Vecinos más cercanos KNN....................................................................................................................... 24
CAPÍTULO V: APLICACION DE MACHINE LEARNING AL PROYECTO..........................................................................25
5.1 Simulación de implementación................................................................................................................. 25
5.1.1 Formulario................................................................................................................................................ 25
5.1.2 Gráficos.................................................................................................................................................... 27
5.2 Implementacion de Algoritmos................................................................................................................. 29
5.2.1 Arbol de Decisión...................................................................................................................................... 29
5.2.2 Plan de Implementación........................................................................................................................... 30
5.2.3 Beneficios................................................................................................................................................. 31
Conclusiones:........................................................................................................................................................ 33
Anexos …………………………………………………………………………………………………………………………………………………………………33
Referencias Bibliográficas...................................................................................................................................... 35
RESUMEN

• Tienda peruana dedicada a la comercialización de prendas de vestir,


pertenece a una cadena de tienda retail y fue fundada por aquilino flores. de
igual manera también es comercializada sus prendas en varios países de
América y Europa. En el presente trabajo se dará una idea de mejor desarrollo
en el proceso de elección de prendas por parte de los clientes, así como
también la agilización de él mismo.

• Se planea comenzar con el análisis exhaustivo midiendo los tiempos y calidad


del proceso que conlleva a la elección de las prendas de los clientes en tienda.
Posteriormente realizar planes para poder agilizar aquel proceso mediante la
idea que tenemos de modernizar la acción de probar las prendas físicamente a
una que se realice de manera virtual, sin perder la esencia de ir a la tienda
para poder igual manera visualizar las prendas que queremos adquirir. De tal
manera que en el plazo establecido se puedan dar las pruebas en las tiendas,
obteniendo así resultados buenos y en caso negativos poder solucionarlo
teniendo como enfoque el plan de proyecto.

• Se realizará aquel proyecto desde la planeación hasta la ejecución en un plazo


de cuatro meses, para lo cual se obtiene como presupuesto aproximado de
USD
$15,000. Por otro lado, el personal se estará asignando en torno a las
actividades que se vayan realizando, comenzando con un jefe de proyecto, un
analista de proyecto, un ingeniero de sistemas y un supervisor de personal.

• En lo que conlleva al desarrollo del proyecto, nos guiaremos de un


cronograma el cual corresponde fases como el análisis del entorno y la
situación, desarrollo del plan y la ejecución del proyecto. Es probable que se
presenten errores o situaciones que puedan impedir el retraso al presentar los
entregables, sin embargo, mediante los planes de contingencia tales como por
ejemplo la capacidad de tener un personal de respaldo; podremos sobrellevar
satisfactoriamente las contingencias y llegar a finalizar el plan de proyecto.
ABSTRACT

• Peruvian store dedicated to the commercialization of clothing, it belongs to a


chain of retail stores and was founded by Aquilino Flores. In the same way,
its garments are also marketed in several countries in America and Europe. In
the present work, an idea of better development in the process of choosing
garments by customers will be given, as well as the speeding up of it.

• It is planned to begin with the exhaustive analysis measuring the times and
quality of the process that leads to the choice of garments by customers in the
store. Subsequently, make plans to be able to speed up that process through
the idea that we have of modernizing the action of trying on the garments
physically to one that is carried out virtually, without losing the essence of
going to the store to be able to visualize the garments that we want to acquire.
. In such a way that tests can be given in the stores within the established
period, thus obtaining good results and, if negative, being able to solve it with
the project plan as an approach.

• That project will be carried out from planning to execution within a period of
four months, for which it obtains an approximate budget of USD$15,000. On
the other hand, the staff will be assigned around the activities that are being
carried out, starting with a project manager. a project analyst, a systems
engineer and a staff supervisor.

• As far as the development of the project is concerned, we will be guided by a


schedule which corresponds to phases such as the analysis of the environment
and the situation, development of the plan and the execution of the project.
Errors or situations are likely to prevent delays in delivering deliverables,
however, through contingency plans such as the ability to have backup staff;
we will be able to satisfactorily cope with contingencies and finalize the
project plan.
INTRODUCCIÓN

En la actualidad tenemos diversas tiendas que comercializan prendas de vestir,


ya que viene a ser parte muy importante de nuestro día a día la vestimenta.
Además, forma parte también de las tendencias de moda y diversidad por cada
temporada. Tiendas que venden ropa podemos encontrarlas en muchas partes,
hay de todo tipo tanto pequeñas como grandes y también para diversos gustos de
los clientes.
Ya que las prendas de vestir forman parte muy importante en nuestra vida e
indispensable igual manera, hemos decidido poder investigar un poco acerca de
cómo podemos obtener aquellos productos indispensables, ya que una de las
tareas más difíciles es poder escoger la que más se adecue a los gustos y estilos
de cada uno.
Por ello que en el presente trabajo se realizará la investigación de cómo
generalmente se da a escoger aquellas prendas de vestir en una determinada
tienda de ropa, y cómo poder obtener una significativa innovación en cuanto a
su proceso.
No es su trabajo tiene como finalidad poder ayudar a la empresa, ya sea tanto en
reducir los tiempos en el proceso de elección de ropa como también brindar un
valor agregado a la tienda; dándole accesibilidad, facilidad y versatilidad al
cliente al momento de escoger la mejor prenda para él.
CAPÍTULO I: PROBLEMÁTICA

1.1 Contexto

Durante el inicio de la pandemia, el presidente decretó cuarentena obligatoria para


todo el país, por ello, muchas empresas se perjudicaron porque no podían realizar
sus ventas presencialmente, algunas implementaron la metodología de compra
online que ayudó mucho a reinventarse a las empresas.
En la actualidad, ya existe un retorno casi al 100% de las ventas presenciales como
de productos, comida y ropa. Sin embargo, este último, al necesitar probarse las
prendas, aún existe una desconfianza por parte de los usuarios, por el contagio que
puede existir al probarse prendas que ya usaron otras personas.
Por ello, se desea implementar un espejo electrónico a la empresa TOPITOP que
permita que nuestros clientes puedan verse en este, escoger y cambiar prendas
virtuales al gusto. Este método de probar las prendas es nuevo, sin embargo, en la
actualidad puede mejorar un cierto porcentaje las ventas, y atraerá más clientes, ya
que no existe la necesidad de probarse lo utilizado por otros.
1.2 Descripción del problema

En esta ocasión podríamos decir que se intenta convertir una compra


física en algo digitalmente para así tener una mejor experiencia al
momento de comprar. escogiendo diversos productos. Además, que
en la actualidad no existe una plataforma de probador virtual dedicada
exclusivamente a mostrar cómo les queda las prendas de vestir y con
esta innovación vamos a poder resolver de forma favorable los
principales problemas de nuestros clientes, como lo son los cambios y
devoluciones de sus prendas.
1.3 Objetivo del proyecto

Sistematizar el método de probado de prendas de los clientes de la empresa

TOPITOP.

1.3.1 Objetivo general


Agilizar la elección de prendas a través de la implementación de un probador electrónico en
la empresa TOPITOP.
1.3.2 Objetivos específicos
 Determinar la eficacia de la implementación de un probador electrónico en la
empresa TOPITOP.
 Crear interfaces interactivas para una mejor experiencia al cliente.
 Identificar la prenda más buscada en el probador electrónico en la empresa
TOPITOP.
 Brindar una manera fácil y segura de probarse las prendas a los clientes.

CAPÍTULO II: DEFINICIÓN DEL PROYECTO

2.1 Definición del Proyecto

La idea de negocio se basa en facilitar a las tiendas un probador digital, lo cual


les permitirá a los clientes ver cómo les queda sus prendas de manera rápida y
segura. Con esta herramienta se podrá visualizar los diversos modelos y diseños
que deseen probarse. Cuando hablamos de un probador de realidad aumentada,
nos referimos a la visión desde un dispositivo tecnológico, lo que se hará es
añadir contenidos visuales llamativos e interactivos, además tendrá una
categorización, como por ejemplo color de prendas, tipos de ropa, etc.

2.2 Beneficios esperados

Dar a conocer, organizar y gestionar accesorios para satisfacer y


embellecer a la sociedad.
● Indicar los precios de los productos (vestidos, zapatos y accesorios)
● Determinar el volumen de ventas que se presentan por medio del probador.
● Determinar la opinión de los clientes sobre las actividades desarrolladas por
los probadores digitales.

2.3 Áreas impactadas y principales representantes

Atención al cliente
Encargada de la atención y prestación de servicios para que los
clientes se sientan cómodos realizando su compra. El realizar una
buena gestión en esta área garantiza que el cliente se vuelva
recurrente, es decir, si nuestro proyecto genera conformidad por
parte del cliente, volverá a
realizar sus compras en las instalaciones.
Ventas (Gerente de Ventas)
Encargada en el envío de información de los pedidos de los clientes
(Tiendas propias, clientes por regiones y clientes mayoristas).Al tener
una base de datos en línea se pueden tomar decisiones efectivas en el
ofrecimiento de nuevos productos, logrando de esta manera que
lleguen sin ningún tipo de retraso y en los plazos pactados.
Sistemas (Desarrolladores del Software)
Encargada de brindar el mantenimiento y soporte al sistema de
probadores electrónicos ante cualquier problema en el funcionamiento
correcto de la aplicación, asegurando el correcto funcionamiento del
envío, recepción y carga de las interfaces en el Sistema.
Operaciones (Operador Lógico)
Encargada de asegurar y cumplir los procesos de logística para la
empresa, cumpliendo con la correcta actualización de inventarios y
como principal objetivo de poder enviar la información para una
correcta entrega del producto final según los requerimientos del
cliente. Contando con la confirmación hacia la empresa de la entrega
del producto, reduciendo de esta manera el margen de errores con
ayuda de un procesamiento automático.
Organigrama
2.4 Cronograma y riesgos iniciales del proyecto

Nuestro proyecto contará con 5 etapas y 5 fases de desarrollo,


teniendo como principales actividades:

2.4.1 Fecha inicio y fin del proyecto


El presente proyecto Contará con un Tiempo de Desarrollo de 6
meses, teniendo como inicio el mes de marzo del 2022 y un final en
septiembre del 2022.

2.4.2 Etapas del proyecto:


 Levantamiento de información
 Análisis y diseño
 Desarrollo
 Pruebas
 Implementación

2.4.3 Cronograma del proyecto, detallar las actividades.

2.4.4 Describir los riesgos que pueda tener el proyecto.


● Cambio del personal encargado del análisis de la información
recopilada y funcionamiento de la implementación.
● Postergación de la fecha de salida de la implementación,
podría adelantarse como retrasarse, ante ambos escenarios,
cambian las actividades y esfuerzos.
● Ante un requerimiento no programado de carácter urgente, se
podría compartir recursos, generando retrasos.

CAPÍTULO III: DESARROLLO DEL PROYECTO

3.1 Diagrama de Gantt

3.2 Metodología CRISP - DM

3.2.1 Fase I. Business Understanding. Definición de


necesidades del cliente (comprensión del negocio)

El cometido general de esta fase es entender los objetivos y requerimientos del


proyecto desde una perspectiva de negocio y convertir este conocimiento en la
definición de un problema de minería de datos y un plan preliminar para alcanzar
los objetivos. Las principales tareas que engloba son las siguientes:

● Determinar los objetivos de negocio: Comprender al detalle, desde una


perspectiva de negocio, qué es lo que el cliente quiere conseguir realmente.
El objetivo es descubrir desde el principio factores importantes que pueden
influir el resultado del proyecto. Se debe registrar la información que se
conoce sobre la situación de negocio de la organización al comienzo del
proyecto, así como los criterios de éxito y utilidad del resultado desde el
punto de vista del negocio.

● Evaluar el contexto: Caracterizar al detalle los recursos (personas, datos,


recursos de computación, software, etc.), requerimientos (alcance y calidad
de los resultados, así como aspectos de seguridad y legalidad en el uso de
los datos), asunciones y otros factores a considerar al determinar los
objetivos y plan del proyecto (por ejemplo, la gestión de riesgos y planes de
contingencia). También se debe realizar un análisis comparativo de los
costes del proyecto y los potenciales beneficios para el negocio si el
proyecto es exitoso.

● Determinar los objetivos de minería de datos: Pasar de la enunciación de


los objetivos en términos de negocio a describirlos en el plano técnico,
ligado a los conceptos de minería de datos. Al igual que con los objetivos de
negocio, hay que determinar unos criterios de éxito técnico e identificar
quiénes son los roles dentro del proyecto que van a evaluar el cumplimiento
de estos criterios.

● Generar el plan de proyecto: Es importante incluir una valoración


preliminar del tipo de herramientas y técnicas que pueden requerirse en el
trabajo, dado que la selección puede influir en el proyecto completo.

3.2.2 Fase II. Data Understanding. Estudio y comprensión de


los datos

En esta segunda fase de la metodología CRISP-DM se realiza la


recolección inicial de los datos para poder establecer un primer contacto
con el problema, familiarizarse con los datos y averiguar su calidad, así
como identificar las relaciones más evidentes para formular las primeras
hipótesis.
Las fases 1 y 2 pueden sucederse repetitivamente si tras los resultados de
los análisis exploratorios (fase 2) se descubren aspectos que redefinen los
objetivos de negocio (fase 1).
Las actividades principales de esta etapa son:
● Recolección de datos: Consiste en obtener los datos a utilizar en el
proyecto identificando las fuentes, las técnicas empleadas en su
recolección, los problemas encontrados en su obtención y la forma
como se resolvieron los mismos.
● Descripción de datos: Identifica el tipo, formato, volumetría y
significado de cada dato.
● Exploración de datos: Radica en aplicar pruebas estadísticas
básicas que permitan conocer las propiedades de los datos a fin de
entenderlos lo mejor posible.

3.2.3 Fase III. Data Preparation. Análisis de los datos y


selección de características

En esta fase de la metodologia se decide qué datos se utilizarán en el


análisis. Los criterios incluyen: la importancia de los datos respecto a los
objetivos de la minería de datos, calidad, y restricciones técnicas (como
límites sobre el volumen de datos o los tipos de datos). Por tanto, debe
generarse una lista con los datos incluidos o excluidos, y los motivos para
estas decisiones.

La lista de comprobación para el gestor del proyecto de análisis de


datos:

● Listar los datos a ser empleados/excluidos y los motivos para estas


decisiones.
● Recoger datos adicionales apropiados (de diferentes fuentes internas
y externas).
● Realizar los tests de correlación para decidir si se incluyen los
campos.
● Reconsiderar los Criterios de Selección de Datos (tarea II.1) según la
calidad real de los datos y el resultado de la exploración de datos y el
modelado.
● Seleccionar diferentes subconjuntos de datos (por ejemplo, atributos
diferentes, sólo los datos que tengan ciertas condiciones, etc.).
● Considerar el uso de técnicas de muestreo.
● Documentar el razonamiento para la inclusión/exclusión de atributos.
3.2.4 Fase IV. Modeling. Modelado
En esta parte de la metodología se puede optar por una selección de una
técnica de modelado real a utilizar. Aunque se haya podido seleccionar una
herramienta durante la fase de “comprensión del negocio”, esta tarea se
refiere a la técnica de modelado específico. Si se aplican múltiples técnicas,
se realiza esta tarea para cada técnica seleccionada. Además, tiene un
checklist para una gestión de proyecto:

● Decidir las técnicas apropiadas para el escenario, teniendo en cuenta


la herramienta seleccionada.
● Registrar las técnicas de modelado reales que se van a emplear.
● Analizar cualquier asunción realizada por la técnica de modelado
sobre los datos (por ejemplo, la calidad, el formato, la distribución).

3.2.5 Fase V. Evaluation. Evaluación (obtención de resultados)


En esta fase se evalúan y revisan los pasos seguidos para tener la certeza de
que el modelo cumple los objetivos de negocio planteados o si hay algún
aspecto importante desde el punto de vista del contexto de negocio que no
ha sido suficientemente tenido en cuenta. El objetivo final de la fase es
decidir la aprobación o no del uso de los resultados del análisis de datos.

Las principales tareas contempladas en esta fase son:

● Evaluación de los resultados: Así como los pasos previos ligados a


la evaluación se centraban en la precisión y la generalidad del
modelo, en este caso la tarea se centraría en medir el grado en el que
el modelo cumple los objetivos de negocio y detectar si hay alguna
razón ligada al negocio por la que el modelo es deficiente. Se puede
plantear también la evaluación del modelo dentro de su aplicación
real, si el tiempo y presupuesto lo permiten.
● Revisión del proceso: Se debe realizar una revisión más exhaustiva
de lo que ha sido el trabajo de minería de datos y los pasos seguidos
(si han sido eficaces y eficientes, si admiten mejoras, si pudieran
haberse planteado con una aproximación diferente), para determinar
si hay factores importantes que se han pasado por alto y analizar
aspectos de aseguramiento de la calidad de los modelos.
● Decisión sobre siguientes pasos: Según las conclusiones de la
evaluación de los resultados y de la revisión del proceso, se toma una
decisión sobre los siguientes pasos a afrontar: pasar a la fase de
despliegue para poner el modelo en operación, hacer nuevas
iteraciones de las fases anteriores, iniciar nuevos proyectos de
minería de datos, etc.

3.2.6 Fase VI. Deployment. Despliegue (puesta en producción)

En esta fase se debe organizar el conocimiento adquirido gracias al proceso


de minería de datos y presentarlo de una manera que sea utilizable en el
contexto de negocio. Esto implica la integración de los modelos dentro de
los procesos de toma de decisiones de la organización, además de requerir la
implicación del cliente en los propios pasos de puesta en operación del
modelo.

Las principales tareas que engloba esta fase son las siguientes:
● Planificación del despliegue: Es necesario determinar una estrategia
para la puesta en operación del modelo, identificando los pasos
necesarios y cómo (quién, cuándo) ejecutarlos.
● Planificación de la monitorización y mantenimiento: Las tareas de
monitorización y mantenimiento del modelo puesto en producción
son una parte muy importante de la integración del resultado de un
proyecto de minería de datos dentro de la operativa diaria de un
entorno de negocio. Una buena planificación de estos aspectos ayuda
a evitar efectos no deseados, como por ejemplo una utilización
incorrecta de los resultados del análisis. Las características del
despliegue diseñado en la tarea anterior influyen en cómo debe
diseñarse esta tarea.
● Informe final del proyecto: Se debe realizar un compendio de los
diferentes entregables y documentaciones generadas a lo largo del
proyecto, resumiendo y organizando los pasos realizados y todos los
resultados obtenidos. Esta tarea suele incluir algún tipo de reunión
de cierre o presentación final.
● Revisión del proyecto: En la línea de las “lecciones aprendidas” de
la gestión de proyectos, es importante resumir la experiencia
adquirida en el proyecto, evaluar lo que fue bien y lo que no,
identificar puntos de mejora, aprendizaje que podría reaprovecharse
en proyectos posteriores o en problemas similares de análisis de
datos, etc.
3.3. Metodología aplicada al Proyecto

3.3.1 Fase I. Business Understanding. Definición de


necesidades del cliente (comprensión del negocio)

A continuación, seguiremos cada una de las tareas que componen esta


primera fase del proceso de minería de datos, cuya finalidad es definir los
objetivos y requisitos del proyecto desde un punto de vista empresarial,
para que éste pueda convertirlos en objetivos comerciales. desde el punto
de vista empresarial, desde el punto de vista técnico y en la planificación
de proyectos.

El objetivo principal que se ha definido es el identificar cual es el cliente


de la tienda de ropa que es más probable a adquirir nuevas prendas de ropa
con el fin de aumentar y mantener el número de clientes que realizan
compras en esta tienda.

Actualmente la problemática que se está presentando a causa de la


pandemia los centros comerciales están restringiendo el acceso a los
probadores de prendas de ropa que las personas desean comprar,
ocasionando de esta manera la imposibilidad de que los consumidores
puedan probarse las distintas prendas y que de esa manera puedan
comprobar que les queda bien y que se acomoda a sus necesidades.

Los objetivos en términos de minería de datos son:

● Identificar cuáles son las prendas más solicitadas por los


consumidores según el género, edad y temporada del año.
● Identificar los perfiles de las personas que tienen una mayor
tendencia a la adquisición de nuevas prendas.
● Identificar los días y horas en donde se presenta una mayor cantidad
de clientes.
● Identificar el grado de satisfacción con la solución planteada.

El proyecto se dividirá en las siguientes etapas para facilitar su


organización y estimar el tiempo de realización del mismo:

● Etapa 1: Análisis de la estructura de los datos y la información de la


base de datos.

● Etapa 2: Ejecución de consultas para tener muestras representativas


de los datos.

● Etapa 3: Preparación de los datos (selección, limpieza, conversión y


formateo, si fuera necesario)

● Etapa 4: Elección de las técnicas de modelado y ejecución de las


mismas sobre los datos.

● Etapa 5: Análisis de los resultados obtenidos en la etapa anterior, si


fuera necesario repetir la etapa 4.

● Etapa 6: Producción de informes con los resultados obtenidos en


función de los objetivos de negocio y los criterios de éxito
establecidos.

● Etapa 7: Presentación de los resultados finales.

3.3.2 Fase II. Data Understanding. Estudio y comprensión de


los datos

En esta fase de la metodología CRISP-DM vamos a realizar la


recolección de datos de los clientes que acuden a la empresa topitop en
busca de prendas de vestir. Por ejemplo, su género, edad, preferencias de
colores, preferencia de prendas, etc.
Esto lo haremos con el objetivo de establecer un primer contacto con la
problemática establecida anteriormente, familiarizándose así con los
datos y averiguando la calidad de ellos más adelante, por ejemplo,
filtrando o seleccionando los datos que necesitamos y que son más
relevantes para resolver la problemática.
Como bien sabemos la metodología se divide en 3 actividades
principales: La recolección de datos, la descripción de datos y por último
la exploración de datos.

Para la recolección de datos, usaremos principalmente las encuestas, las


cuales haremos cuando el cliente vaya a la tienda a comprar ropa de
forma usual. Les brindaremos un formulario físico o también virtual para
que lo puedan realizar de manera más sencilla que solo constará de unas
5 preguntas básicas y fundamentales. En caso de que se presentarán
algunos inconvenientes al resolver las encuestas de manera digital, se
tomará en consideración el formulario físico, el cual no tomará más de 5
minutos realizarlo.
Para la segunda fase, descripción de datos; habiendo ya reunido los datos
recolectados en las encuestas en la primera actividad, identificaremos el
tipo y formato de cada dato recolectado. por ejemplo, tendremos la edad
qué es un número o las preferencias, como lo son los colores, los cuales
serán una cadena de texto, de esta manera diferenciaremos los datos y
podremos mejorar su manejo futuro.
Por último, en la exploración de datos, usaremos cuadros estadísticos,
como por ejemplo el de barras o circulares, que nos ayuden a comprender
mejor a los clientes que frecuentan el establecimiento. Identificamos así
las tendencias o gustos preferentes qué aquellos clientes tendrían.

3.3.3 Fase III. Data Preparation. Análisis de los datos y


selección de características
En esta fase de la metodología se trata de preparar los datos para
adecuarlos a la implementación de un probador virtual que se van a
emplear en la empresa de topitop. Esto implica seleccionar el
subconjunto de datos que se va a utilizar, limpiarlos para mejorar su
calidad, añadir nuevos datos a
partir de los existentes y darles el formato requerido por la herramienta
de modelado.
Seleccionar los Datos En términos de registros, se van a utilizar todos
los registros dentro de cada componente de datos, ya que al ser ésta una
base de datos específicamente creada para este proyecto, el número de
registros que se han insertado ha sido elegido mediante la elección de
compra del cliente y además que contara con cierta variedad de prendas
de vestir.

Limpiar los Datos La base de datos con la que se cuenta para el proyecto
contiene toda la información necesaria para poder cumplir los objetivos
de la implementación del probador, además, estos datos al haber sido
introducidos para el caso práctico que se presenta, son datos limpios y por
lo tanto no hay necesidad de hacer una limpieza más profunda sobre ellos

Construir los Datos En esta parte de la operación de preparación de


datos de los artículos que se van a vender por medio del vestidor digital,
como el ingreso de nuevos registros, o la transformación de valores para
atributos existentes.

Integrar los Datos No ha sido necesaria la creación de nuevas


estructuras ya que un programa se encarga de realizar estas tareas
automáticamente del vestidor digital.

Formateo de los Datos Modificar ciertos artículos de prendas de vestir


pero no cambiara su significado pero son necesarias para ver el modelado
en el orden correcto y además de delimitar ciertos parámetros. Además de
poder satisfacer las necesidades de los clientes.

3.3.4 Fase IV. Modeling. Modelado


En esta ocasión sobre la fase de la metodología modeling la cual se
escogerá la técnica más apropiada para los objetivos marcados de la
implementación de los probadores. A continuación, y una vez realizado
un plan de prueba para los modelos escogidos, se procederá a aplicar
técnicas
sobre los datos para generar el modelo y finalizando se tendrá que evaluar
si dicho modelo ha cumplido los criterios de éxito o no.

● Escoger la Técnica de Modelado: Con respecto a esta técnica se va


a utilizar un software para realizar una implementación probadores
digitales y asi, poder utilizar alguna de las técnicas de modelado que
nos ofrece esta herramienta de acuerdo con los objetivos de nuestro
proyecto
● Generar el Plan de Prueba El procedimiento que se empleará será
probar una calidad y validez del modelo
● Construir el Modelo Se podrá proceder a la ejecución del modelo
elegido sobre los datos de entrenamiento.
● Evaluar el Modelo En este paso de la metodología CRISP-DM
también se hará una evaluación que están más orientada a los
objetivos de la implementación de los probadores digitales

3.3.5 Fase V. Evaluation. Evaluación (obtención de resultados)


Para la fase de evaluación se evaluará y revisara los pasos vistos
previamente para tener certeza de que cumple los objetivos del probador
digital, es decir, este deberá aceptar la información que el usuario ingrese,
permitiendo con ello que el usuario pueda elegir las prendas y
visualizarlo en el espejo digital, seleccionando lo que le gusta y
llevándolo finalmente a poder comprarlo o verlo según su ubicación en
que sección de la tienda se encuentra.

Para esta fase, se emplearán tareas las cuales son:

1. se evaluará el grado en el que se encuentra el espejo digital con


respecto a los objetivos del negocio, detectar si hay alguna razón
porque el espejo digital tenga alguna deficiencia que no cumpla con
el objetivo, hacerle mejoras o cambios para que cumpla con los
objetivos, pero priorizando si el tiempo y presupuesto de la empresa
lo permitan.
2. se hará una revisión más exhaustiva el trabajo de minería de datos para
ver si han sido eficientes y eficaces, si admiten mejoras, en caso de
que se hayan pasado por alto algunos factores y analizar aspectos de
calidad del modelo
3. finalmente, se darán conclusiones sobre el espejo digital, los
resultados de la revisión y se tomara decisiones sobre este para pasar
a la siguiente fase.

3.3.6 Fase VI. Deployment. Despliegue (puesta en producción)


En el proyecto se está planeando la implementación del sistema de
espejos inteligentes teniendo en primera instancia la recolección de datos
en general sobre la tienda en donde se piensa aplicar, con ayuda de los
trabajadores poder recopilar la información exacta, y así identificar las
necesidades que se requieren para poder cubrirlas. Finalmente realizar la
implementación de la solución seguidamente pasar por las pruebas
calidad para finalmente ofrecerlas para el consumo del público.
La solución planteada se encontrará en monitoreo constante para ver la
manera en cómo esta interactúa con el consumidor, recibiendo una
retroalimentación constante para ver en que se puede mejorar, para luego
de obtener una serie de patrones repetitivos pueda darse un
mantenimiento de modo que sea mejorado.
Como informe final se buscará conseguir el perfecto funcionamiento sin
quejas del consumidor final, teniendo en cuenta cada una de las
retroalimentaciones obtenidas con anterioridad, logrando así el
cumplimiento del objetivo planteado.
Se tendrá en constante revisión cualquier tipo de problema que pueda
surgir para poder solucionarlo de inmediato.
CAPÍTULO IV: ANALISIS DE APLICACIONES DE MACHINE
LEARNING

4.1 Definicion de algoritmos


4.1.1 Algoritmos de Aprendizaje Profundo
Para empezar la aplicación del algoritmo hemos analizado en primera
instancia el concepto el cual es el siguiente, el aprendizaje profundo
(Deep learning) es un tipo de aprendizaje automático que imita la forma
en que los humanos obtienen ciertos tipos de conocimiento.
El aprendizaje profundo es un elemento importante de la ciencia de
datos, que incluye estadísticas y modelos predictivos. Es extremadamente
beneficioso para los científicos de datos que tienen la tarea de recopilar,
analizar e interpretar grandes cantidades de datos; el aprendizaje
profundo hace que este proceso sea más rápido y sencillo.
Para el presente trabajo de investigación propuesto, el algoritmo de
aprendizaje profundo servirá para poder reconocer a través del
reconocimiento facial los rasgos faciales de la persona que será el objeto
de análisis, comparando con la diferente información recopilada a lo
largo del proceso. Pudiendo determinar de esa manera el género de la
persona.
Además, de poder reconocer de acuerdo a las dimensiones del rostro y
características como, barbas, canas, arrugas, etc. La edad del objeto de
análisis con el fin de poder reconocer la edad aproximada de la persona
de acuerdo con la base de datos recopilada a lo largo del proceso.

 Reconocimiento de Genero por Reconocimiento facial


 Reconocimiento de Edad por Reconocimiento facial

4.1.2 Árboles de decision


Un árbol de decisión es un modelo predictivo que divide el espacio de los
predictores agrupando observaciones con valores similares para la
variable respuesta o dependiente.
Para dividir el espacio muestral en sub-regiones es preciso aplicar una
serie de reglas o decisiones, para que cada sub-región contenga la mayor
proporción posible de individuos de una de las poblaciones.
Si una sub-región contiene datos de diferentes clases, se subdivide en
regiones más pequeñas hasta fragmentar el espacio en sub-regiones
menores que integran datos de la misma clase.
Estos algoritmos son simples porque proponen una serie de condiciones
if-else para crear decisiones y usar un método de agregación (como la
media o la moda) en valores en una región de decisión para predecir el
resultado.
Para el presente trabajo de investigación propuesto, el algoritmo del árbol
de decisión servirá para poder predecir dos resultados:

 Clasificación de Tipos de prenda según género


Según su género se mostrará el tipo de prenda, es decir, si el cliente es
femenino, se mostrará tipos de prendas, por ejemplo: blusas, faldas,
pantalones, poleras, shorts, etc., pero si el cliente es masculino, se
mostrará otros tipos de prendas, por ejemplo: camisas, pantalones,
poleras, shorts, etc.

4.1.3 Vecinos más cercanos KNN


Primero definamos qué significa el algoritmo de k vecinos más cercanos,
este también es conocido como KNN, lo cual significa en inglés K
Nearest Neighbours, es un clasificador de aprendizaje supervisado no
paramétrico, el cual usa la proximidad para poder hacer clasificaciones o
predicciones acerca de la agrupación de un punto de datos individuales.
Es algoritmo se puede usar para problemas de regresión o clasificación,
sin embargo también se usa como un algoritmo de clasificación,
partiendo de las suposición de que se pueden encontrar algunos puntos
similares cerca uno del otro.
En nuestro caso hemos escogido este algoritmo para poder clasificar en
primera instancia los rangos de precio que más se prefieren en base a las
encuestas realizadas a los clientes. Para el desarrollo de este problema de
preferencias de precios, se asigna una etiqueta de clase sobre la base de
un voto mayoritario, es decir, se usa la etiqueta que se representa con más
frecuencia alrededor de un punto de datos determinados.
Después de esto se definiría técnicamente lo que se considera como “voto
por mayoría”, mediante una distinción que debería superar el 50% de los
votos, para así distinguir una clase de mayor preferencia.
Seguido de ello, este algoritmo nos permitirá, aparte de saber cuál es el
rango de precio más preferente, también podremos saber cuáles son los
rangos de precio más cercanos a este precio con mayores votos.

 Rango de precio
CAPÍTULO V: APLICACION DE MACHINE LEARNING AL
PROYECTO
5
5.1 Simulación de implementación

5.1.1 Formulario
https://docs.google.com/forms/d/15s2Sb7MoBImLOGPppXKJ_n9Wk50slWu8sclHHhDY-
mc/edit#responses
5.1.2 Gráficos
4
5
5.1
5.2 Implementacion de Algoritmos

4
5
5.1
5.2
5.2.1 Arbol de Decisión
Después de la evaluación de los algoritmos, se decidió trabajar con el
algoritmo de árbol de decisión, ya que es un algoritmo de machine
learning que se adecúa a la construcción de modelos predictivos de
análisis de datos para el Big Data, basados en su clasificación según
ciertas características o propiedades, o en la regresión mediante la
relación entre distintas variables para predecir el valor de otra y así
cumplir los objetivos planteados.

Para realizar la predicción de las prendas al cliente, lo primero a realizar,


es determinar el género o código del cliente. Se va a considerar como
género, tipo femenino y masculino.

A continuación, se construye el árbol de decisión de la siguiente manera


para poder lograr lo propuesto.

En primer lugar, un asistente de voz consultará al cliente si es un


recurrente o nuevo cliente, si es la primera opción, pedirá código del
cliente el cual será dictado por voz y para la segunda opción, pasará a
reconocer el género del cliente.

En segundo lugar, cuando el cliente dicta el código, aparecerán prendas


recomendadas de acuerdo con el historial de compras, y una opción que
dirá “si desea ver más prendas, mencione más”. Por otro lado, al cliente
nuevo, después de reconocer el género, mostrará las prendas más
vendidas de acuerdo con el género y de igual forma la opción de más.

La información que se tiene es una base de datos con la compra de todos


los cliente a lo largo del tiempo, de toda la base de datos en el cual se
tienen unas 35 columnas, las cuales estamos considerando para el
algoritmo son, el código del cliente, el género, el tipo de prenda, los
colores, y las tallas.

5.2.2 Plan de Implementación


Para poder llevar a cabo la implementación del proyecto, es necesario
identificar los riesgos. Se tiene identificados los siguientes:

 Falta de abastecimiento de probadores

 Demoras en tiempo de identificación de la persona debido a


características poco comunes (personas con parches, aparatos
faciales por temas médicos, etc)

 Cortes de Energía eléctrica.

 Fallas en el Software o Hardware.

Ademas, debemos tener en cuenta los recursos que necesitaremos. Los


recursos analizados para la adecuada ejecucion del proyecto son las
siguientes:

 Los miembros del equipo

 El presupuesto

 El plazo

 La propiedad intelectual, las ideas o habilidades especificas

 Equipamento

 Software o herramientas

Por otro lado, se llevo a cabo la asignacion de tareas o roles para cada
persona; atraves de una herramienta:

Matriz Raci – Metodologia Crisp

Leyenda:
R : Responsable
C : Consultado
A: Aprobador
I : Informado

5.2.3 Beneficios
Árbol de decisiones

Con respecto a los beneficios que te brinda el árbol de decisiones es que


se divide en ciertos espacios de los predictores agrupándolos de cierta
forma en que sus valores se han algo similares a una variable ya se
independiente o dependiente. Además, de eso obtener datos de diferentes
clases ya se han más pequeñas pero también de la misma clase.
 Son fáciles de construir, interpretar y visualizar.
 Selecciona las variables más importantes y en su creación no
siempre se hace uso de todos los predictores.
 Si faltan datos no podremos recorrer el árbol hasta un nodo
terminal, pero sí podemos hacer predicciones promediando las
hojas del sub-árbol que alcancemos.
 No es preciso que se cumplan una serie de supuestos como en la
regresión lineal (linealidad, normalidad de los residuos,
homogeneidad de la varianza, etc.).
 Sirven tanto para variables dependientes cualitativas como
cuantitativas, como para variables predictores o independientes
numéricas y categóricas. Además, no necesita variables, aunque a
veces mejoran el modelo.
 Permiten relaciones no lineales entre las variables explicativas y
la variable dependiente.
 Nos podemos servir de ellos para categorizar variables numéricas.

Con respecto al proyecto


 El cliente podrá encontrar la talla perfecta y personalizar la
experiencia de compra basándose en las medidas encontradas y
los productos que mejor van a vestir
 Los probadores virtuales permiten realizar compras con mayor
efectividad
 Se ofrecerá un servicio orientado a la satisfacción del cliente, a
través de un trato altamente profesional aplicando lo aprendido
del maching learnig.
 Dar un uso de los probadores virtuales ya que se realizará
publicidad mediante las redes sociales de la empresa.
 También, se tendrá en cuenta ciertas promociones en la paginas
digitales el probador virtual, incentivando a los usuarios a hacer
uso de ella.
 Una buena estratégica con proveedores que realizan el software
del probador virtual y lograr un mejor margen de ganancia
 Realizaremos constantemente actualizaciones de los sistemas
operativos con el maching learning para garantizar y mantener el
buen funcionamiento de esta.
 Asimismo, al implementar esta tecnología de probadores
virtuales, servirá para una recolección de datos, con un factor
clave para ayudar a nuestro cliente a determinar cierto interés y
tener conocimiento de los principales patrones, conductas,
preferencias y estilos de los clientes.
Conclusiones:
 La agilización en los procesos de ventas, en especifico al momento de
seleccionar una prenda, contribuye bastante a la eficiencia de la tienda de
prendas, como es en el caso de Topitop.

 Machine Learnig aplicado a los proyectos empresariales de mejora continua,


es una muy buena herramienta que facilita los procesos de la empresa.

 La digitalización hoy en día, es una gran herramienta que permite poder tener
mayor alcance de ofrecimiento de parte de las empresas a los clientes.

 El mejoramiento continuo a través de la innovación digital, y apoyado en


herramientas de aprendizaje automatizado, como el machine learning; son
partes fundamentales en el crecimiento de cualquier tipo de empresas.

Anexos
Referencias Bibliográficas
a) Mora Hernández, S. (2020). Sistema predictivo de cancelaciones en las tarjetas de crédito basada en
técnicas de Machine Learning.

b) Minería de datos: predicción de la deserción escolar mediante el algoritmo de árboles de decisión y el


algoritmo de los k vecinos más cercanos. Ene, 779(73), 33.

c) Wu, Xindong; Kumar, Vipin; Ross Quinlan, J.; Ghosh, Joydeep; Yang, Qiang; Motoda, Hiroshi;
McLachlan, Geoffrey J.; Ng, Angus; Liu, Bing; Yu, Philip S.; Zhou, Zhi-Hua (1 de enero de 2008).
«Top 10 algorithms in data mining». Knowledge and Information Systems (en inglés) 14 (1): 1-37.
ISSN 0219-3116. doi:10.1007/s10115-007-0114-2.

d) Piryonesi S. Madeh; El-Diraby Tamer E. (1 de marzo de 2020). «Data Analytics in Asset


Management: Cost-Effective Prediction of the Pavement Condition Index». Journal of Infrastructure
Systems 26 (1): 04019036. doi:10.1061/(ASCE)IS.1943-555X.0000512.

e) Rokach, Lior; Maimon, O. (2008). Data mining with decision trees: theory and applications. World
Scientific Pub Co Inc. ISBN 978-9812771711.

f) Quinlan, J. R., (1986). Induction of Decision Trees. Machine Learning 1: 81-106, Kluwer Academic
Publishers

g) Breiman, Leo; Friedman, J. H.; Olshen, R. A.; Stone, C. J. (1984). Classification and regression trees.
Monterey, CA: Wadsworth & Brooks/Cole Advanced Books & Software. ISBN 978-0-412-04841-8.

h) Breiman, L. (1996). Bagging Predictors. "Machine Learning, 24": pp. 123-140.

i) Friedman, J. H. (1999). Stochastic gradient boosting. Stanford University.

También podría gustarte