Proyecto Red Neuronal Mantenimiento UPC

Solución web usando red neuronal profunda
para la predicción de retrasos de servicios de

mantenimiento preventivo en el sector automotriz
Item Type info:eu-repo/semantics/bachelorThesis
Authors Jacinto Camacho, Christyan Gerald; Tavara Garay, Maverick

Marco Antonio
Publisher Universidad Peruana de Ciencias Aplicadas (UPC)
Rights info:eu-repo/semantics/openAccess; Attribution-

NonCommercial-ShareAlike 4.0 International
Download date 26/02/2024 21:35:40
Item License http://creativecommons.org/licenses/by-nc-sa/4.0/
Link to Item http://hdl.handle.net/10757/667749

UNIVERSIDAD PERUANA DE CIENCIAS APLICADAS
FACULTAD DE INGENIERÍA
PROGRAMA ACADÉMICO DE INGENIERÍA DE SOFTWARE
SOLUCIÓN WEB USANDO RED NEURONAL PROFUNDA PARA LA
PREDICCIÓN DE RETRASOS DE SERVICIOS DE MANTENIMIENTO
PREVENTIVO EN EL SECTOR AUTOMOTRIZ
TESIS
Para optar el título profesional de Ingeniero de Software
AUTOR(ES)
Jacinto Camacho, Christyan Gerald (0000-0003-3761-704X)
Tavara Garay, Maverick Marco Antonio (0000-0003-0568-1012)
ASESOR
Barrientos Padilla, Alfredo (0000-0002-0029-4913)
Lima, 11 de enero del 2023

DEDICATORIA
Esta investigación se la dedicamos a nuestros familiares, amistades y docentes por todo el

apoyo y esfuerzo para la elaboración de este trabajo
I
AGRADECIMIENTOS
Es valorado el hecho de que la organización sin ánimo de lucro haya depositado su

confianza en nosotros y nos haya brindado la oportunidad de colaborar en este proyecto.
Además, deseamos expresar nuestro agradecimiento a cada uno de los profesores que
nos orientaron y fortalecieron nuestros conocimientos para la creación de este trabajo.
II
RESUMEN
El presente proyecto tiene como propuesta una solución web usando red neuronal profunda
aplicado a una empresa del sector automotriz. Este proyecto busca reducir los tiempos de
entrega de los vehículos en los cuales se realiza un servicio de mantenimiento preventivo.
Así mismo, se busca que la propuesta permita a la empresa tomar decisiones anticipadas para
poder asignar sus recursos de manera eficiente.
Para la realización de este proyecto se investigaron soluciones de redes neuronales profundas

aplicadas en instituciones financieras para evaluar el riesgo de morosidad en las tarjetas de
crédito en función a las características personales del cliente y los comportamientos de gasto.
En este caso la propuesta aplica un diseño de rutina en el cual se identificarán los retrasos a
base de las características del operador o técnico del taller automotriz y su historial de
servicios de mantenimiento preventivos realizados.
Finalmente se realizó un análisis de factibilidad económica para validar si la propuesta es

rentable o no, al obtener los resultados de VAN y TIR se concluyó que el proyecto será
viable a partir del año nueve. Esto quiere decir que si se espera recuperar la inversión antes
de este tiempo no será rentable.
Palabras clave: Aprendizaje automático; Mejora tecnológica; Redes neuronales profundas;

Transformación digital
III
ABSTRACT
This project proposes a web solution using deep neural network applied to a company in the
automotive sector. This project seeks to reduce delivery times of vehicles in which a
preventive maintenance service is performed. Likewise, the proposal is intended to allow the
company to make decisions in advance in order to allocate its resources efficiently.
For the realization of this project, deep neural network solutions applied in financial
institutions were investigated to evaluate the risk of delinquency in credit cards based on the
customer's personal characteristics and spending behaviors. In this case the proposal applies
a routine design in which delays will be identified based on the characteristics of the operator
or technician of the auto repair shop and their history of preventive maintenance services
performed.
Finally, an economic feasibility analysis was carried out to validate whether the proposal is
profitable or not. By obtaining the NPV and IRR results, it was concluded that the project
will be viable as of year nine, which means that if the investment is expected to be recovered
before this time, it will not be profitable.
Keywords: Deep neural network; Digital transformation; Machine learning; Technological

improvement
IV
V
VI
VII
VIII
IX
TABLA DE CONTENIDOS
INTRODUCCIÓN ............................................................................................................... 1
1 DESCRIPCIÓN DEL PROYECTO .......................................................................... 3
1.1 ANTECEDENTES ...................................................................................................... 4

1.2 DOMINIO DEL PROBLEMA........................................................................................ 4
1.3 PLANTEAMIENTO DE LA SOLUCIÓN ......................................................................... 4
1.4 OBJETIVOS DEL PROYECTO ..................................................................................... 4
1.4.1 Objetivo General................................................................................................ 4
1.4.2 Objetivos específicos ......................................................................................... 5
1.4.3 Indicadores de éxito ........................................................................................... 5
1.5 PLANIFICACIÓN DEL PROYECTO .............................................................................. 5
1.5.1 Gestión del Alcance ........................................................................................... 5
1.5.2 Gestión del tiempo ............................................................................................. 6
1.5.3 Gestión de recursos humanos ............................................................................ 6
1.5.4 Gestión de comunicaciones ............................................................................... 7
1.5.5 Gestión del riesgo .............................................................................................. 7
2 LOGROS DE LOS STUDENT OUTOMES ............................................................. 9
2.1 STUDENT OUTCOME (1) ................................................................................. 10

2.1.1 Descripción ...................................................................................................... 10
2.1.2 Evidencia ......................................................................................................... 10
2.2 STUDENT OUTCOME (2) ................................................................................. 10
2.2.1 Descripción ...................................................................................................... 10
2.2.2 Evidencia ......................................................................................................... 10
2.3 STUDENT OUTCOME (3) ................................................................................. 11
2.3.1 Descripción ...................................................................................................... 11
2.3.2 Evidencia ......................................................................................................... 11
2.4 STUDENT OUTCOME (4) ................................................................................. 12
2.4.1 Descripción ...................................................................................................... 12
2.4.2 Evidencia ......................................................................................................... 12
2.5 STUDENT OUTCOME (5) ................................................................................. 12
X
2.5.1 Descripción ...................................................................................................... 12
2.5.2 Evidencia ......................................................................................................... 13
2.6 STUDENT OUTCOME (6) ................................................................................. 13
2.6.1 Descripción ...................................................................................................... 13
2.6.2 Evidencia ......................................................................................................... 13
2.7 STUDENT OUTCOME (7) ................................................................................. 14
2.7.1 Descripción ...................................................................................................... 14
2.7.2 Evidencia ......................................................................................................... 14
3 MARCO TEÓRICO .................................................................................................. 15
3.1 MANTENIMIENTO (MAINTENANCE) ...................................................................... 16

3.2 RED NEURONAL ARTIFICIAL (ARTIFICIAL NEURAL NETWORKS).......................... 17
3.3 APRENDIZAJE PROFUNDO O REDES NEURONALES PROFUNDAS (DEEP LEARNING OR
DEEP NEURAL NETWORKS) .............................................................................................. 18
3.4 LAS PRINCIPALES DIFERENCIAS ENTRE EL APRENDIZAJE PROFUNDO Y LOS ENFOQUES
CONVENCIONALES DE APRENDIZAJE AUTOMÁTICO ........................................................... 19
4 ESTADO DEL ARTE ............................................................................................... 21
4.1 PREFACIO ............................................................................................................. 22

4.2 RESUMEN DE ARTÍCULOS DE LA CATEGORÍA APRENDIZAJE AUTOMÁTICO CON
RETRASOS ......................................................................................................................... 29
4.2.1 Resumen artículo N° 1..................................................................................... 29

PREDICCIÓN ...................................................................................................................... 37

4.4 RESUMEN DE ARTÍCULOS DE LA CATEGORÍA PREDICCIÓN CON RETRASOS ............. 44
4.4.1 Resumen artículo N° 10................................................................................... 44
XI
PREDICCIÓN CON RETRASOS .............................................................................................. 57

4.6 CONCLUSIONES .................................................................................................... 64
4.6.1 Conclusiones de artículos de la categoría aprendizaje automático con retrasos
64
4.6.2 Conclusiones de artículos de la categoría aprendizaje automático con predicción
64
4.6.3 Conclusiones de artículos de la categoría predicción con retrasos .................. 65
con retrasos .................................................................................................................. 65
4.6.5 Conclusiones generales.................................................................................... 65
5 DESARROLLO DEL PROYECTO ........................................................................ 67
5.1 ANÁLISIS DE ALGORITMOS DE INTELIGENCIA ARTIFICIAL ..................................... 68

5.2 PROPUESTA DE RED NEURONAL ............................................................................ 70
5.2.1 Plataforma de implementación de la red neuronal .......................................... 70
5.2.2 Diseño de la red neuronal profunda ................................................................. 70
5.2.3 Datos de prueba ............................................................................................... 72
5.3 ARQUITECTURA DE CAPAS .................................................................................... 73
5.3.1 Capa de negocio............................................................................................... 73
5.3.2 Capa de aplicación y tecnología ...................................................................... 74
5.4 GESTIÓN DEL PROYECTO ...................................................................................... 77
5.4.1 Marco de metodología ágil .............................................................................. 77
XII
5.4.2 Iniciativa, Épicas e Historias de usuario .......................................................... 78
5.4.3 Herramientas y tecnologías ............................................................................. 85
5.5 INTERFACES DE LA SOLUCIÓN WEB ....................................................................... 87
5.6 ATRIBUTOS DE CALIDAD ...................................................................................... 89
5.7 COSTO .................................................................................................................. 90
5.7.1 Hardware ......................................................................................................... 90
5.7.2 Costos Cloud y Software ................................................................................. 90
5.7.3 Honorarios del personal ................................................................................... 91
5.7.4 Costos generales .............................................................................................. 92
5.7.5 Costos de Mantenimiento por año ................................................................... 92
6 VALIDACIÓN DE LA PROPUESTA..................................................................... 93
6.1 VALIDACIÓN DE FACTIBILIDAD ECONÓMICA ......................................................... 93

6.1.1 Análisis de ganancia de la empresa ................................................................. 93
6.1.2 Recuperación de la inversión........................................................................... 94
6.1.3 Análisis de VAN y TIR ................................................................................... 94
6.1.4 Recuperación de la inversión en un plazo de dos años.................................... 97
7 CONCLUSIONES ..................................................................................................... 99
8 RECOMENDACIONES ......................................................................................... 100
9 BIBLIOGRAFÍA ..................................................................................................... 101
XIII
ÍNDICE DE TABLAS
Tabla 1 Tabla de indicadores de éxito del proyecto. ............................................................ 5

Tabla 2 Hitos del Proyecto ................................................................................................... 6
Tabla 3 Descripción de roles ................................................................................................ 7
Tabla 4 Matriz de riesgos ..................................................................................................... 8
Tabla 5 Comparación de algoritmos de machine learning y deep learning ...................... 10
Tabla 6 Tecnologías de IA para redes neuronales ............................................................. 12
Tabla 7 Hitos del proyecto con entregables ....................................................................... 13
Tabla 8 Artículos de investigación. .................................................................................... 24
Tabla 9 Comparación de algoritmos de machine learning y deep learning ...................... 68
Tabla 10 Tecnologías de IA para redes neuronales ........................................................... 70
Tabla 11 Configuración de una red neuronal profunda..................................................... 71
Tabla 12 Estructura de la data ........................................................................................... 72
Tabla 13 Datos de ingreso .................................................................................................. 72
Tabla 14 Datos de salida .................................................................................................... 72
Tabla 15 Product backlog................................................................................................... 80
Tabla 16 Sprint 1 ................................................................................................................ 81
Tabla 17 Sprint 2 ................................................................................................................ 81
Tabla 18 Sprint 3 ................................................................................................................ 81
Tabla 19 Sprint 4 ............................................................................................................... 81
Tabla 20 Sprint 5 ................................................................................................................ 82
Tabla 21 Horas diseñador .................................................................................................. 84
Tabla 22 Horas backend ..................................................................................................... 84
Tabla 23 Horas IA .............................................................................................................. 84
Tabla 24 Horas analista de datos ....................................................................................... 84
Tabla 25 Horas frontend..................................................................................................... 85
Tabla 26 Horas analista de pruebas ................................................................................... 85
Tabla 27 Herramientas y tecnologías ................................................................................. 85
Tabla 28 Lista de atributos de calidad ............................................................................... 89
Tabla 29 Costo de hardware .............................................................................................. 90
Tabla 30 Costo de cloud service ......................................................................................... 90
Tabla 31 Costo de recursos ................................................................................................ 91
Tabla 32 Costo de roles ...................................................................................................... 91
XIV
Tabla 33 Costo general....................................................................................................... 92
Tabla 34 Costo de mantenimiento ...................................................................................... 92
Tabla 35 Datos generales de flujo de autos ....................................................................... 93
Tabla 36 Ganancias por mes .............................................................................................. 94
Tabla 37 VAN y TIR por año .............................................................................................. 96
Tabla 38 Ganancias por año óptimo .................................................................................. 97
Tabla 39 VAN y TIR óptimo ................................................................................................ 98
XV
ÍNDICE DE FIGURAS
Figura 1 Organigrama del proyecto ..................................................................................... 6
Figura 2 Interfaz de la solución web .................................................................................. 11
Figura 3 Esquema de tipos de mantenimiento .................................................................... 16
Figura 4 Arquitectura de una red neuronal artificial......................................................... 17
Figura 5 Pesos de cada elemento y entrada y salida del sistema ANN .............................. 18
Figura 6 La arquitectura de tecnologías de aprendizaje profundo .................................... 19
Figura 7 Comparación de modelos tradicionales .............................................................. 30
Figura 8 Comparación de modelos avanzados ................................................................... 31
Figura 9 Resultados de orden por rangos .......................................................................... 32
Figura 10 DNN ................................................................................................................... 34
Figura 11 Resultados de prueba ......................................................................................... 34
Figura 12 Clasificadores .................................................................................................... 37
Figura 13 Modelo ............................................................................................................... 39
Figura 14 Arquitectura ....................................................................................................... 40
Figura 15 Algoritmos .......................................................................................................... 41
Figura 16 Clasificadores .................................................................................................... 43
Figura 17 Indicadores ........................................................................................................ 45
Figura 18 Probabilidad de phising ..................................................................................... 47
Figura 19 Diagrama de estrategia del algoritmo SRN....................................................... 48
Figura 20 QoE de esquemas de colaboración de varias tareas ......................................... 50
Figura 21 Ecuación para obtener el CDI ........................................................................... 52
Figura 22 Ecuación para obtener el percentil PD ............................................................. 52
Figura 23 Modelo de entrenamiento .................................................................................. 53
Figura 24 Comparación de algoritmos .............................................................................. 54
Figura 25 Comparación de algoritmos por coeficientes .................................................... 55
Figura 26 Comparación de los tiempos de operación de trenes ........................................ 57
Figura 27 Preparación de datos para entrenar .................................................................. 59
Figura 28 Peso bruto y número de operaciones por asamblea .......................................... 59
Figura 29 Retraso según predicción ................................................................................... 61
Figura 30 Comparación de validación con valores reales ................................................. 62
Figura 31 Comparación de técnicas de machine learning ................................................. 63
Figura 32 Estructura de una red neuronal profunda ......................................................... 71
XVI
Figura 33 Capa de negocio de la solución web integrada a una red neuronal ................. 73
Figura 34 Diagrama de componentes del servidor cloud de la red neuronal .................... 74
Figura 35 Diagrama de componentes del servidor de la aplicación web .......................... 74
Figura 36 Diagrama de componentes del servidor de base de datos ................................. 75
Figura 37 Diagrama de componentes del servidor de base de datos ................................. 76
Figura 38 Iniciativa, épicas e historias de usuario ............................................................ 79
Figura 39 Tablero Kanban ................................................................................................. 82
Figura 40 Interfaz de inicio de sesión a la plataforma web ............................................... 87
Figura 41 Interfaz de registro de usuario ........................................................................... 87
Figura 42 Interfaz de registro de la orden de trabajo ........................................................ 88
Figura 43 Interfaz de estado actividades según su estado ................................................. 88
XVII
INTRODUCCIÓN
El presente proyecto tiene como objetivo principal proponer una solución web usando red
neuronal profunda para la predicción de retrasos en los servicios de mantenimiento
preventivo en el sector automotriz. Por tal razón, de acuerdo con la estructura brindada por
la Universidad Peruana de Ciencias Aplicadas (UPC), en el presente trabajo se detalla la
descripción completa del proyecto. El fin de este proyecto es permitir a la empresa del sector
automotriz identificar los posibles servicios de mantenimiento preventivo que presenten
demoras, el cual les permitirá intervenir con anticipación. La estructura de este documento
se encuentra distribuida en los siguientes ocho capítulos:
En el primer capítulo se especifica la descripción del proyecto, el planteamiento del

problema y sus causas, la propuesta de solución, el objetivo general, los objetivos
específicos, los indicadores de éxito y la planificación del proyecto.
El segundo capítulo describe cómo el proyecto ha desarrollado y cumplido diversas

capacidades necesarias para los organismos de certificación internacional a los que responde
la universidad.
El tercer capítulo se dedica al marco teórico del proyecto, el cual presenta los conceptos y
definiciones generales utilizados durante la investigación y que proveen un entendimiento
sobre las soluciones, sistemas y procesos empleados en el proyecto.
En el cuarto capítulo se detalla el Estado del arte del proyecto, en donde se mencionan los
artículos de investigación y casos de estudios relacionados con la solución.
El quinto capítulo se enfoca en el planteamiento del análisis de actividades del proceso de

cuentas por cobrar y, posteriormente, se presenta el plan para lograr la solución planteada.
En el sexto capítulo se valida la viabilidad técnica y económica mediante cifras que

representan especificaciones y costos relacionados a la solución.
El séptimo capítulo interpreta los resultados obtenidos argumentando el punto de vista del
autor.
1
Finalmente, el octavo capítulo presenta los cambios o mejoras realizados en la solución.
2
1 DESCRIPCIÓN DEL PROYECTO
En esta sección, se describirá a detalle, todos los aspectos generales del proyecto. Se enuncia
la problemática, el objetivo general, los objetivos específicos, alcance del proyecto, gestión
de recursos humanos y tiempo del proyecto.
3
1.1 Antecedentes
El proyecto se titula: Solución web usando red neuronal profunda para la predicción de
retrasos en los servicios de mantenimiento preventivo en el sector automotriz. Este busca
disminuir el tiempo de duración de un servicio de mantenimiento ya que según Rengifo
(2017):
PWC (Price waterhouse Coopers) demostró que el 49% de los vehículos en los que
se realizan este tipo de servicio no están listos a la hora comprometida y las causas
principales son: demora en la recepción y entrega, calidad de trabajo, retrasos en
recibir componentes comprados, finalizar cotizaciones, verificar listas de repuestos,
obtener información necesaria del cliente y la incorrecta asignación de técnicos por
servicio. Estos generan una demora en la entrega final del vehículo del cliente y un
número mayor de reclamos por parte de los clientes (p. 51).
La solución propuesta por el proyecto tendrá en cuentas dichas características.
1.2 Dominio del problema

La empresa automotriz escogida para la propuesta del proyecto se enfoca principalmente en
realizar operaciones de mantenimiento y reparación de vehículos. Estas actividades no se
realizan de manera eficiente debido a que no tiene un seguimiento de los tiempos de
ejecución y no hay visibilidad del estado en que se encuentra un mantenimiento o reparación.
1.3 Planteamiento de la Solución

Se propone una solución web basada en una red neuronal profunda para la estimación de los
tiempos de mantenimiento preventivo. Esta información permitirá a los usuarios finales tener
una mayor precisión del tiempo requerido para la entrega del vehículo y así proseguir con la
siguiente reparación o mantenimiento.
1.4 Objetivos del Proyecto

1.4.1 Objetivo General
Proponer una solución web usando red neuronal profunda para la predicción de retrasos en
los servicios de mantenimiento preventivo en el sector automotriz.
4
1.4.2 Objetivos específicos
− OE1: Analizar algoritmos de machine learning y redes neuronales para la predicción
de retrasos.
− OE2: Diseñar una arquitectura de capas de una solución web usando red neuronal
profunda e interfaces de la solución propuesta.
− OE3: Validar la factibilidad técnica y económica de la implementación web con red
neuronal profunda de predicción de retrasos en los servicios de mantenimiento
preventivo en el sector automotriz.
1.4.3 Indicadores de éxito
Tabla 1
Tabla de indicadores de éxito del proyecto.
N° Indicadores de éxito Objetivo

Comparación de algoritmos de machine learning y redes
1 OE1
neuronales
Diseño de un esquema de arquitectura de capas de la
2 OE2
solución web usando red neuronal
3 Interfaces de la solución web usando red neuronal OE2
4 Validación de la solución web usando red neuronal OE3
1.5 Planificación del proyecto

Con el objetivo de obtener una eficiente gestión del proyecto se definen necesidades y
entregables en el proceso, hitos principales, gestión de recursos humanos y gestión de riesgos
del proyecto propuesto.
1.5.1 Gestión del Alcance

El alcance de la solución propuesta tiene las siguientes consideraciones:
− Análisis de los algoritmos de machine learning y redes neuronales.
− Diseño de las arquitecturas de capas (negocio, aplicación y tecnología) de la solución
web.
− Interfaces de la solución web.
− Balance de costos requeridos para la implementar la solución web.
5
1.5.2 Gestión del tiempo
En esta fase se busca definir los principales hitos del proyecto, con el fin de tener las fechas
estimadas de los entregables y actividades para su respectivo seguimiento.
Tabla 2
Hitos del Proyecto
Fase del Fecha
Hito del Proyecto Entregables Incluidos Prioridad
proyecto Estimada
Informe del análisis e
Investigación de
investigación los
algoritmos de
Investigación 28/10/2022 algoritmos de machine Alta
machine learning y
learning y redes
redes neuronales
neuronales.
Arquitectura de Informe del diseño de la
capas de la solución arquitectura de capas de
Diseño 25/11/2022 Alta
web usando red la solución web usando
neuronal red neuronal
Interfaces de la
Informe de los mockups
Diseño solución web usando 25/11/2022 Alta
de la solución
red neuronal
Validación de la
Informe de validación
Validación solución web usando 13/01/2023 Alta
de viabilidad técnica
red neuronal
1.5.3 Gestión de recursos humanos

En esta fase se identifican y definen los roles y responsabilidades de las actividades a lo
largo del desarrollo del proyecto.
Figura 1
Organigrama del proyecto
Comité de Proyectos
Daniel Subauste, Jimmy
Armas, Willy Ugarte
Jefe de Proyecto
Christyan Jacinto
Consultor
Maverick Tavara
6
Para cada uno de los roles especificados previamente, se establecen sus siguientes
responsabilidades:
Tabla 3
Descripción de roles
Roles Responsabilidades
Comité de Proyecto • Revisar los proyectos considerando los criterios

establecidos por la escuela
• Dar seguimiento al cumplimiento de los entregables
• Absolver dudas de los demás miembros del equipo sobre
las historias de usuario
Jefe de Proyecto • Documentar los resultados de las investigaciones
• Velar de que se cumpla con el cronograma de entrega
• Solucionar los impedimentos
• Validar el cumplimiento de los entregables por sprint
Consultor • Proponer, aplicar y controlar buenas prácticas en el
proceso de desarrollo de software
• Velar por la correcta asignación de personas en el
proyecto
• Supervisar al personal y las actividades del departamento
bajo su responsabilidad.
1.5.4 Gestión de comunicaciones

En esta fase se busca definir estándares necesarios para que la comunicación entre todos los
Stakeholders se lleve de forma clara y con canales definidos. Para ello se plantea lo siguiente:
− Las reuniones se deben solicitar con una anticipación mínima de 24 horas.

− Las coordinaciones se deberán realizar por email o WhatsApp.
− Se listará los acuerdos en cada reunión.
1.5.5 Gestión del riesgo

En esta fase se detallan los posibles riesgos a los que se enfrenta el desarrollo proyecto. El
riesgo está detallado junto a su probabilidad, impacto y la estrategia de mitigación.
7
Tabla 4
Matriz de riesgos
# Riesgo Probabilidad Impacto Acciones
Falta de Mitigar:
conocimiento en Coordinar reuniones con la
1 Media Alta
el uso de la administración para enseñar el
solución. método de importación.
Incompatibilidad Mitigar:
2 con los servicios Baja Alta Coordinar con la administración para
obsoletos actualizar las integraciones.
Cambios en las Aceptar:

políticas de los Coordinar con la administración para
3 Baja Media
servicios cloud evaluar las nuevas políticas de los
empleados. servicios.
Mitigar:
Cambios en la
Comunicar periódicamente los
definición y
4 Media Media avances del proyecto a los
alcance del
stakeholders para identificar
proyecto.
oportunamente cambios necesarios.
Retraso en las Mitigar:
entregas de los Monitorear el avance del proyecto
5 Media Alta
avances del con el fin de cumplir con los plazos
proyecto. de entrega.
Mitigar:
Pérdida de
Almacenar los archivos relacionados
información
6 Baja Alta al proyecto en servicios cloud con
relevante para el
capacidad de versionar y recuperar
proyecto.
archivos.
Falta de Mitigar:
disponibilidad de Comunicar oportunamente a las
7 Media Media
los stakeholders autoridades académicas la falta de
o asesores. recursos o especialistas.
8
2 LOGROS DE LOS STUDENT OUTOMES
El objetivo de este capítulo es describir como el presente proyecto se relaciona con cada uno
de los Student Outcomes definidos por la acreditadora internacional ABET.
9
2.1 STUDENT OUTCOME (1)
2.1.1 Descripción
La capacidad de identificar, formular y resolver problemas complejos de ingeniería
aplicando los principios de ingeniería, ciencia y matemática.
2.1.2 Evidencia
− Durante el análisis de algoritmos de machine learning se investigó diferentes
métricas para determinar la mejor opción para la solución del proyecto propuesto.
Tabla 5
Comparación de algoritmos de machine learning y deep learning
Red Red Árbol de
Naive Regresión
Métricas Neuronal neuronal decisión
Bayes Logística
Profunda artificial (J48)
Precisión General 0.9959 0.9941 0.6428 0.9949 0.9944
Predicción 0.6053 0.5521 0.8677 0.5770 0.4527
Precisión 0.9009 0.7291 0.0217 0.8047 0.9080
Especificidad 0.9994 0.9981 0.6407 0.9987 0.9996
Tasa de Falsos Positivos 0.3947 0.4479 0.1323 0.4230 0.5473
Tasa de Falsos Negativos 0.0006 0.0019 0.3593 0.0013 0.0004
Nota. Información al 23 de febrero de 2023. Adaptado de Predicting credit card

delinquencies: An application of deep neural networks. de Sun, T., & Vasarhelyi, M. 2018
(https://doi.org/10.1002/isaf.1437)

2.2.1 Descripción
La capacidad de aplicar el diseño de ingeniería para producir soluciones que satisfagan
necesidades específicas con consideración de salud pública, seguridad y bienestar, así como
factores globales, culturales, sociales, ambientales y económicos.
2.2.2 Evidencia
− Se diseñó una solución de inteligencia artificial para solucionar necesidades de uso
diario.
− Durante el proceso se diseñó interfaces de la solución web.
10
Figura 2
Interfaz de la solución web

2.3.1 Descripción
Capacidad de comunicarse efectivamente con un rango de audiencias.
2.3.2 Evidencia
− El proyecto fue revisado progresivamente por varios especialistas mediante
entregables y avances desde la planificación hasta la validación de este.
− Se estableció un medio de comunicación con el consultor para adquirir la
información necesaria para el proyecto.
− El proyecto es explicado a los demás colegas que llevan el curso de titulación.
11
2.4.1 Descripción
Capacidad de reconocer responsabilidades éticas y profesionales en situaciones de
ingeniería. Hacer juicios informados, que deben considerar el impacto de las soluciones de
ingeniería en contextos globales, económicos, ambientales y sociales.
2.4.2 Evidencia
− Se citaron correctamente las fuentes empleadas, desde imágenes y tablas.
− Para la validación de la propuesta se utilizó información sensible de la organización
de manera responsable tales como gastos y ganancias por vehículo en
mantenimiento.
− Se realizó un análisis de precios de los servicios cloud para el abastecimiento del
resultado esperado.
Tabla 6
Tecnologías de IA para redes neuronales
Tecnologías de inteligencia artificial para redes neuronales profundas
Características
Amazon SageMaker Vertex AI (Google Cloud Platform)
Apache MXNet, Chainer, Hugging

Face, Pytorch, Reinforcement PySpark, Pytorch, TensorFlow,
Frameworks
Learning, Scikit-Learn, SparkML XGBoost
Serving, TensorFlow, XGBoost
Seguridad de la
Sí Sí
información
13 USD/mes - Studio Notebooks
20 USD/mes - Vertex AI Training
Precios 6 USD/mes – Training
22 USD/mes - Vertex AI Prediction
39 USD/mes - Real Time Inference

2.5.1 Descripción
Capacidad de funcionar efectivamente en un equipo cuyos miembros juntos proporcionan
liderazgo, crean un entorno de colaboración e inclusivo, establecen objetivos, planifican
tareas y cumplen objetivos.
12
2.5.2 Evidencia
− Se establecieron objetivos específicos para el desarrollo del modelo, los cuales
fueron validados con cada uno de los indicadores de éxito.
− Haciendo uso de la gestión del tiempo, se establecieron hitos para los principales
entregables del modelo.
Tabla 7
Hitos del proyecto con entregables
Fase del Fecha

Hito del proyecto Entregables incluidos Prioridad
proyecto estimada
Investigación de Informe del análisis e
algoritmos de machine investigación los algoritmos
Investigación 28/10/2022 Alta
learning y redes de machine learning y redes
neuronales neuronales.
Informe del diseño de la
Arquitectura de capas
arquitectura de capas de la
Diseño de la solución web 25/11/2022 Alta
solución web usando red
usando red neuronal
neuronal
Interfaces de la
Informe de los mockups de la
Diseño solución web usando 25/11/2022 Alta
solución
red neuronal
Validación de la
Informe de validación de
Validación solución web usando 13/01/2023 Alta
viabilidad técnica
red neuronal

2.6.1 Descripción
Capacidad de desarrollar y llevar a cabo la experimentación adecuada, analizar e interpretar
datos, y usar el juicio de ingeniería para sacar conclusiones.
2.6.2 Evidencia
− Se realizó un estudio de servicios cloud para desarrollar el entrenamiento de la red
neuronal.
− Se dedica un apartado de recomendaciones y conclusiones donde se realiza un
análisis general del proyecto propuesto y su viabilidad.
13
2.7.1 Descripción
Capacidad de adquirir y aplicar nuevos conocimientos según sea necesario, utilizando
estrategias de aprendizaje apropiadas.
2.7.2 Evidencia
− Se estudió los distintos usos que se le da a los algoritmos de inteligencia artificial
(machine learning y deep learning) que ayudan a la predicción de varias actividades
diarias según su entorno, tales como la determinación de llegada de un bus para evitar
esperas, pronósticos de clima lluvioso, predicción de moras por clientes con historial
crediticio, predicción de tiempo de vuelo de aviones, entre otros.
14
3 MARCO TEÓRICO
En este capítulo, se presentarán, definirán y explicarán los principales términos tecnológicos
relacionados al proyecto que sirvieron como base para la planificación de este.
15
3.1 Mantenimiento (Maintenance)
La definición de mantenimiento lo podemos encontrar con Rengifo (2017):
Es el cuidado regular que necesita los vehículos para funcionar bien y por largo
tiempo, a través de actividades en los diferentes sistemas que se efectúan para
garantizar la disponibilidad de la unidad, aumentando la vida útil del vehículo. La
finalidad del mantenimiento en todos sus ámbitos es el de reparar desperfectos en
forma rápida y rentablemente económica para la empresa, de tal manera que la
inversión que se realiza en el mantenimiento se vea reflejada en la producción. Al
realizar los mantenimientos programados se mantendrá los vehículos operativos en
sus diferentes sistemas: Motor, sistema de transmisión, chasis (frenos, suspensión,
dirección) y sistema eléctrico (p. 22).
Figura 3
Esquema de tipos de mantenimiento
Nota. De “Optimización de los tiempos de servicio de mantenimiento preventivo de la

empresa maquinarias-concesionario Nissan Rep. De Panamá”, por Rengifo, P, 2017
(https://repositorio.utp.edu.pe/bitstream/handle/20.500.12867/857/Plinio%20Rengifo_Trab
ajo%20de%20Suficiencia%20Profesional_Titulo%20Profesional_2017.pdf).
16
3.2 Red Neuronal Artificial (Artificial Neural Networks)
Es un modelo de procesamiento de datos basado en la forma en que los sistemas nerviosos
biológicos, como el cerebro, procesan los datos. Se centran en la estructura neuronal de la
corteza cerebral de los mamíferos, pero a una escala mucho menor. Muchos expertos en
inteligencia artificial creen que las redes neuronales artificiales son lo mejor y quizás la única
esperanza para diseñar una máquina inteligente.
Las redes neuronales artificiales están diseñadas de la misma manera que el cerebro humano,
con nodos de neuronas interconectados en forma de red. Las neuronas son miles de millones
de células que componen el cerebro humano. Cada neurona está formada por un cuerpo
celular que procesa la información llevándola hacia y desde el cerebro (entradas y salidas)
(Van Gerven y Bohte, 2017). La idea principal de tales redes está hasta cierto punto inspirada
en la forma en que funciona el sistema neuronal biológico, para procesar datos e información
con el fin de aprender y crear conocimiento. El elemento clave de esta idea es crear nuevas
estructuras para el sistema de procesamiento de información.
Figura 4
Arquitectura de una red neuronal artificial
Nota. Red neuronal artificial. De “Artificial Neural Network Systems”, por Dastres, Roza
& Soori, Mohsen, 2021 (https://hal.science/hal-03349542/document).
El sistema está formado por una gran cantidad de elementos de procesamiento altamente
interconectados llamados neuronas que trabajan en conjunto para resolver un problema y
17
transmiten información a través de sinapsis (conexiones electromagnéticas). Las neuronas
están estrechamente interconectadas y organizadas en capas. La capa de entrada recibe los
datos, mientras que la capa de salida genera el resultado final. Entre los dos, normalmente
se intercalan una o más capas secretas. Esta disposición dificulta predecir o conocer el flujo
exacto de datos. Cada conexión tiene un peso de conexión y cada neurona tiene un valor de
umbral y una función de activación (Balakrishnan, 2019). Se calcula si cada entrada tiene un
peso positivo o negativo en función del signo del peso de la entrada. El peso afecta la
intensidad de la señal en una conexión (Liu, 2018). Neuronas que tienen un umbral por
encima del cual solo se transmite una señal si la señal agregada lo supera. El valor de
activación es la suma ponderada de la unidad de suma, y la salida se genera en función de la
señal de este valor de activación. La relación entre el peso de cada elemento y la entrada y
salida del sistema ANN se muestra a continuación:
Figura 5
Pesos de cada elemento y entrada y salida del sistema ANN
Nota. Entrada y salida del sistema ANN. De “Artificial Neural Network Systems”, por
Dastres, Roza & Soori, Mohsen, 2021 (https://hal.science/hal-03349542/document).
3.3 Aprendizaje Profundo o Redes Neuronales Profundas (Deep Learning or Deep Neural
Networks)
Los sistemas ANN deberían ser más complejos para representar características más
complejas y "leer" modelos cada vez más complejos para la predicción y clasificación de
datos basados en miles o incluso millones de características. El aprendizaje profundo es un
subcampo de aprendizaje automático que se enfoca en aprender "capas" sucesivas de
representaciones cada vez más significativas mientras aprende representaciones a partir de
datos (Grekousis 2019). Se ocupa de las redes neuronales artificiales (ANN), que son
algoritmos basados en la estructura y función del cerebro. El aprendizaje profundo permite
18
que los modelos computacionales con múltiples capas de procesamiento aprendan múltiples
niveles de abstracción para las representaciones de datos. Son redes neuronales que tienen
más de tres capas de neuronas (incluidas las capas de entrada y salida). Estas
representaciones en capas se aprenden utilizando modelos conocidos como "redes
neuronales", que se organizan en capas literales que se colocan una encima de la otra
(Schmidhuber 2015). Esto se logra simplemente aumentando el número de capas ocultas y/o
el número de neuronas por capa oculta. Más capas y neuronas pueden representar modelos
cada vez más complejos, pero también requieren más tiempo y potencia para calcular. La
arquitectura de las tecnologías de aprendizaje profundo (Santos, 2021).
Figura 6
La arquitectura de tecnologías de aprendizaje profundo
Nota. Red neuronal artificial. De “Artificial Neural Network Systems”, por Dastres, Roza
& Soori, Mohsen, 2021 (https://hal.science/hal-03349542/document).
3.4 Las principales diferencias entre el aprendizaje profundo y los enfoques

convencionales de aprendizaje automático
Aunque el concepto de red neuronal tiene décadas de antigüedad, las ANN no han logrado
un progreso sólido debido a las limitaciones técnicas. Hoy en día, el almacenamiento de
datos más barato, la capacidad computacional más poderosa (por ejemplo, la disponibilidad
de unidades de procesamiento de gráficos), el procesamiento distribuido y la disponibilidad
de datos en varias estructuras facilitan el avance de esta tecnología. Los desarrolladores
pueden establecer capas jerárquicas más profundas de neuronas virtuales. Con la gran
profundidad de las capas y la gran cantidad de neuronas, una DNN tiene un poder de
representación mucho mayor que una ANN tradicional que solo tiene una o dos capas
19
ocultas. Otra diferencia importante entre el aprendizaje profundo y las técnicas tradicionales
de aprendizaje automático es su rendimiento a medida que aumenta la escala de datos. Los
algoritmos de aprendizaje profundo aprenden de ejemplos anteriores. Como resultado,
necesitan una cantidad de datos suficientemente grande para comprender el patrón complejo
subyacente. Es posible que un DNN no funcione mejor que los algoritmos tradicionales de
aprendizaje automático, como los árboles de decisión, cuando el conjunto de datos es
pequeño o simple. Pero su rendimiento mejorará significativamente a medida que aumente
la escala de datos (Shaikh, 2017). El aprendizaje profundo funciona excelentemente en
términos de ingeniería de características. Mientras que el aprendizaje automático tradicional
generalmente se basa en el conocimiento de expertos humanos para identificar características
críticas de datos para reducir la complejidad de los datos y eliminar el ruido creado por
atributos irrelevantes, Deep Learning aprende automáticamente características altamente
abstractas de los datos en sí sin intervención humana (Sun & Vasarheyi , 2017). Un ejemplo
de cómo funciona el aprendizaje profundo es una CNN que se entrena para reconocer rostros.
En las capas iniciales, la red identifica elementos básicos como píxeles y bordes, mientras
que en capas posteriores se enfoca en partes específicas del rostro, hasta que finalmente
produce una representación de alto nivel del rostro como salida. Este tipo de aprendizaje se
considera una gran mejora en comparación con los métodos tradicionales de aprendizaje
automático, ya que ha permitido avances notables en la detección de objetos en imágenes, la
traducción de discursos, la comprensión del texto y el juego del Go, incluso superando el
rendimiento humano en algunos casos. Grandes empresas de contabilidad, como KPMG y
Deloitte, están utilizando tecnologías de aprendizaje profundo para analizar grandes
cantidades de datos financieros y documentos, respectivamente, con el objetivo de detectar
anomalías y realizar tareas de análisis (Sun & Vasarheyi , 2018).
20
4 ESTADO DEL ARTE
En este capítulo se presentará una revisión de la literatura que se enfoca en tecnologías y
proyectos relacionados con el aprendizaje automático, la predicción y los retrasos. Para
llevar a cabo esta revisión, se seguirá una metodología de cuatro fases que implica la
formulación de preguntas para abordar la solución del problema, el análisis de los artículos
y la extracción de conclusiones relevantes.
21
4.1 Prefacio
El presente trabajo de investigación tiene como finalidad el planteamiento de una solución
web que aplique un modelo de red neuronal profunda que permita identificar los retrasos de
los servicios en una empresa automotriz. Con dicha propuesta se pretende ofrecer a estos
clientes una herramienta que les permita identificar las demoras en tiempos de ejecución de
servicios como mantenimientos o reparaciones. Existen investigaciones acerca de predecir
retrasos en pedidos, ensamblajes, vuelos de aviones, tiempo de buses en ruta, morosidad en
deudas de tarjetas de crédito y créditos hipotecarios usando aprendizaje automático.
Con el objetivo de respaldar científicamente esta investigación, se realizó una búsqueda

exhaustiva, recolección, análisis y comparación de artículos científicos que abordaran
temáticas relacionadas con la propuesta de estudio. Para facilitar la búsqueda, se utilizaron
palabras clave como "machine learning", "prediction" y "delay/delinquency". Asimismo, se
incluyó un filtro para asegurar que los artículos seleccionados tuvieran una antigüedad no
mayor a 5 años y estuvieran escritos en inglés.
Esta limitación en el espacio de búsqueda permitió obtener únicamente artículos recientes

que emplean de manera eficiente los recursos computacionales actuales. Antes de validar la
calidad de los artículos preseleccionados, se comprobó que estuvieran disponibles en los
motores de búsqueda Scopus y/o Web of Science, que contienen una amplia variedad de
artículos de diferentes áreas de investigación, como ingeniería, medicina, entre otras. Luego,
se aseguró que los artículos seleccionados hubieran sido publicados en conferencias de alta
relevancia académica, utilizando el motor de búsqueda "Scimago". De esta manera, se
verificó que las conferencias en las que se publicaron los artículos elegidos tuvieran un
cuartil con un valor no menor a dos.
La selección de los 20 artículos se realizó fundamentalmente a base a cuatro criterios: ¿qué

tipos de algoritmos de “machine learning” se usa para la predicción de datos?, ¿de qué
manera la predicción de información ayuda a reducir los retrasos?, ¿qué tipos de algoritmos
de machine learning se usa para los retrasos?, ¿qué tipos de algoritmos de machine learning
se usa para la predicción de demoras?
22
Tras finalizar el proceso de selección y aprobación de dichos artículos, se agruparon estos
en 4 categorías según el tipo de técnica que empleaban para solucionar la problemática que
planteaban. Las tipologías en las que fueron agrupados los artículos son las siguientes:
La primera tipología engloba los artículos que proponen distintos algoritmos de “machine
learning” enfocadas en la identificación de demoras ya sean desde pedidos, flujos de tránsito
hasta morosidad bancaria como deudas de tarjetas crédito o crédito hipotecario.
La segunda tipología agrupa a los artículos que proponen distintos algoritmos de “machine
learning” enfocadas en predicción en gestión de inventarios, hora de llegada de autobuses,
cadena de suministros y precipitaciones climáticas.
La tercera tipología engloba a los artículos que brindan información acerca de las distintas
maneras de prevenir retrasos. Por ello, no todas se enfocan en “machine learning” como
solución, por lo tanto, se conocen otras opciones para aplicar. Estos brindan una visión
general ante la predicción de demoras.
La cuarta tipología agrupa a los artículos que emplean modelos y algoritmos de “machine
learning” para lidiar con la problemática de prevenir demoras. El aporte de estos trabajos de
investigación es el demostrar la variedad de soluciones que existen para este problema, se
investigó acerca del uso de estos algoritmos en problemas que fueran lo más similares al que
se investiga como, por ejemplo, predecir retrasos en una empresa de canteras y retrasos en
una empresa de ensamblaje.
En la Tabla 8 se puede evidenciar, a modo de resumen, el flujo que se siguió en el proceso

de investigación para la búsqueda, análisis y recopilación de los artículos de investigación.
23
Tabla 8
Artículos de investigación.
TIPOLOGÍA ID TÍTULO AUTORES AÑO FUENTE RANKING PREGUNTA
Aprendizaje 1 A predictive intelligence system of credit Wu, C.-F., 2021 Applied Soft Q1 RQ1
automático scoring based on deep multiple kernel Huang, S.-C., Computing
Retrasos learning (Sistema de inteligencia predictiva Chiou, C.-C.,
de calificación crediticia basado en Wang, Y.-M.
aprendizaje de múltiples núcleos)
2 Predicting mortgage early delinquency Chen, S., 2020 European Q1 RQ1
with machine learning methods Guo, Z., Journal of
(Predicción de morosidad hipotecaria Zhao, X. Operational
temprana con métodos de aprendizaje Research
automático)
3 Predicting credit card delinquencies: An Sun, T., 2018 Intelligent Q2 RQ1
application of deep neural networks Vasarhelyi, Systems in
(Predicción de morosidad de tarjetas de M.A. Accounting,
crédito: una aplicación de redes neuronales Finance and
profundas) Management
4 Predicting the likelihood of airspace user Dalmau, R. 2022 Transportatio Q1 RQ1
rerouting to mitigate air traffic flow n Research
management delay (Predecir la Part C:
probabilidad de que los usuarios del Emerging
espacio aéreo cambien de ruta para mitigar Technologies
el retraso en la gestión del flujo del tránsito
aéreo)
5 Machine Learning Algorithms for Gondia, A., 2020 Journal of Q1 RQ1
Construction Projects Delay Risk Siam, A., El- Construction
Prediction (Los algoritmos de aprendizaje Dakhakhni, Engineering
automático para proyectos de construcción W., Nassar, and
retrasan la predicción de riesgos) A.H. Management
24
Aprendizaje 6 An Explainable Machine Learning Model Ntakolia, C., 2021 Sensors Q2 RQ2
automático for Material Backorder Prediction in Kokkotis, C.,
Predicción Inventory Management (Un modelo de Karlsson, P.,
parendizaje automático explicable para Moustakidis,
MaterialBackOrder en la gestión de S.
inventario)
7 Analysis on the Bus Arrival Time Shanthi, N., 2022 Computation Q1 RQ2
Prediction Model for Human-Centric Sathishkumar al
Services Using Data Mining Techniques , V.E., Intelligence
(Análisis del Modelo de Predicción de Upendra and
Horas de Llegada de Autobuses para Babu, K., Neuroscience
Servicios Centrados en Personas (...),
Utilizando Técnicas de Minería de Datos) Rajendran,
S., Allayear,
S.M.
8 Predicting supply chain risks using Baryannis, 2019 Future Q1 RQ2
machine learning: The trade-off between G., Dani, S., Generation
performance and interpretability Antoniou, G. Computer
(Predicción de los riesgos de la cadena de Systems
suministro mediante el aprendizaje
automático: el equilibrio entre el
rendimiento y la interpretabilidad)
9 A Data-Driven Approach for Accurate Manandhar, 2019 IEEE Q1 RQ2
Rainfall Prediction (Un enfoque basado en S., Dev, S., Transactions
datos para una predicción precisa de las Lee, Y.H., on
precipitaciones) Meng, Y.S., Geoscience
Winkler, S. and Remote
Sensing
Predicción 10 Universality of delay-time averages for Ritschel, S., 2021 Journal of Q2 RQ3
Retraso financial time series: analytical results, Cherstvy, Physics:
computer simulations, and analysis of Complexity
25
historical stock-market prices A.G.,
(Universalidad de los promedios de tiempo Metzler, R.
de retardo para series temporales
financieras: resultados analíticos,
simulaciones por computadora y análisis
de precios históricos del mercado de
valores)
11 Phishing Website Detection Based on Yang, R., 2021 Sensors Q2 RQ3
Deep Convolutional Neural Network and Zheng, K.,
Random Forest Ensemble Learning Wu, B., Wu,
(Detección de sitios web de phishing C., Wang, X.
basada en redes neuronales
convolucionales profundas y aprendizaje
de conjunto de bosques aleatorios)
12 Intelligent Prediction of Train Delay Zhou, P., 2021 IEEE Q1 RQ3
Changes and Propagation Using RVFLNs Chen, L., Transactions
With Improved Transfer Learning and Dai, X., Li, on Intelligent
Ensemble Learning (Predicción inteligente B., Chai, T. Transportatio
de cambios de demora de trenes y n Systems
propagación mediante RVFLN con
aprendizaje de transferencia y aprendizaje
de conjuntos mejorados)
13 Resource Prediction-Based Edge Park, J., 2021 Sensors Q2 RQ3
Collaboration Scheme for Improving QoE Chung, K.
(Esquema de colaboración perimetral
basado en la predicción de recursos para
mejorar la QoE)
14 Critical Duration Index: Anticipating González- 2022 Journal of Q1 RQ3
Project Delays (Índice de duración crítica: Cruz, M.-C., Construction
anticipación de retrasos en los proyectos) Ballesteros- Engineering
Pérez, P.,
26
Lucko, G., and
Zhang, J.-X. Management
15 Prediction of ignition delay times of Jet A- Huang, Y., 2022 Aerospace Q1 RQ3
1/hydrogen fuel mixture using machine Jiang, C., Science and
learning (Predicción de los tiempos de Wan, K., (...), Technology
retardo de encendido de la mezcla de Cai, Q., Liu,
combustible Jet A-1/hidrógeno utilizando J.
el aprendizaje automático)
16 Flight delay prediction for commercial air Yu, B., Guo, 2019 Transportatio Q1 RQ3
transport: A deep learning approach Z., Asian, S., n Research
(Predicción de retrasos de vuelos para el Wang, H., Part E:
transporte aéreo comercial: un enfoque de Chen, G. Logistics and
aprendizaje profundo) Transportatio
n Review
17 A hybrid Bayesian network model for Lessan, J., 2019 Computers Q1 RQ3
predicting delays in train operations (Un Fu, L., Wen, and Industrial
modelo híbrido de red bayesiana para C. Engineering
predecir retrasos en la operación de trenes)
Aprendizaje 18 Impact of material data in assembly delay Steinberg, F., 2022 The Q2 RQ4
automático prediction --a machine learning‑based case Burggaef, P., International
Predicción study in machinery industry (Impacto de Wagner, J., Journal of
Retraso los datos de materiales en la predicción de Heinbach, B. Advanced
retrasos en el esamblaje: un estudio de caso Manufacturin
basado en el aprendizaje automático en la g Technology
industria de la maquinaria)
19 Machine Learning Algorithm for Delay Abdellah, 2021 Future Q2 RQ4
Prediction in IoT and Tactile Internet A.R., Internet
(Algoritmo de aprendizaje automático para Mahmood,
la predicción de retrasos en IoT e Internet O.A.,
táctil) Kirichek, R.,
Paramonov,
27
A.,
Koucheryavy
, A.
20 Machine learning approach for predicting Kannan, R., 2022 Journal of Q1 RQ4
production delays: a quarry company case Abdul Halim, Big Data
study (Enfoque de aprendizaje automático H.A.,
para predecir retrasos en la producción: Ramakrishna
estudio de caso de una empresa de n, K., Ismail,
canteras) S., Wijaya,
D.R.
28
4.2 Resumen de artículos de la categoría aprendizaje automático con retrasos
4.2.1 Resumen artículo N° 1
Título:
A predictive intelligence system of credit scoring based on deep multiple kernel
learning (Sistema de inteligencia predictiva de calificación crediticia basado en
aprendizaje de múltiples núcleos).
Aporte:
En estudios anteriores, se propusieron una variedad de métodos de aprendizaje
automático para evaluar el riesgo crediticio. Sin embargo, los métodos
convencionales son vistos como modelos superficiales y no son buenos para
representar características de composición. Por lo tanto, este estudio aplica un
clasificador de kernel múltiple profundo como una técnica de vanguardia, que es
competente para hacer frente a una estructura profunda y datos complejos en la
evaluación del riesgo crediticio. Apoyará adecuadamente a los responsables de la
emisión de tarjetas de crédito en China.
Proceso:
Las calificaciones crediticias de los clientes brindan información importante sobre el
riesgo crediticio para los bancos en los mercados financieros. Por lo tanto, se aplicó
el aprendizaje profundo para crear un novedoso sistema de predicción de
calificaciones. En el artículo, se examinó el rendimiento del sistema en relación con
el conjunto de datos de muestra. En la primera etapa, se probaron varios modelos
tradicionales utilizados para pronosticar calificaciones crediticias, a saber, perceptrón
multicapa (MP), red bayesiana (BayesNet), SVM, clasificador de vecinos más
cercanos (IBK), regresiones logísticas y árbol de decisión (J48). En la segunda etapa,
se comparó varios modelos de conjuntos avanzados, a saber, AdaBoost M1,
embolsado, apilado, comité y subespacios aleatorios. Los clasificadores base de estos
métodos de conjunto se configuraron como un árbol de decisión (J48), a excepción
del comité aleatorio, que utilizó un árbol aleatorio como clasificadores base. El
conjunto de datos se dividió aleatoriamente en diez partes y se aplicó una validación
cruzada de diez veces para evaluar el rendimiento de los modelos. Tradicionalmente,
los algoritmos de aprendizaje de múltiples núcleos usaban RBF y núcleos
29
polinómicos. Dado que el objetivo es maximizar el límite superior de la
pseudodimensión del núcleo final (que aumentará su riqueza con cada capa sucesiva),
este estudio opta por no utilizar estos núcleos tradicionales. Este usó cuatro kernels
base únicos: un kernel lineal, un kernel RBF, un kernel polinomial de grado 2 y un
kernel polinomial de grado 3. Usaron un conjunto de kernels para cada capa e
hicieron una arquitectura de 5 capas para el DMKC. Este estudio también utilizó un
algoritmo de descenso de gradiente para entrenar el DMKC. Las precisiones (en %)
de los modelos tradicionales. La mejor fue la regresión logística, seguida de SVM.
Estos fueron mejores que otros clasificadores. El más pobre en términos de
rendimiento fue el BayesNet. Luego compararon varios modelos de conjuntos
avanzados con nuestro DMKC. Los detalles sobre el rendimiento comparativo de
estos modelos avanzados se presentan en unas tablas del artículo, que muestran que
el DMKC supera estos modelos de conjunto. Aunque los modelos de conjuntos
suelen funcionar bien en muchas aplicaciones y son robustos, no parecen ser muy
efectivos en este caso. Esto puede atribuirse al hecho de que, aunque los métodos de
conjunto son poderosos, sus clasificadores básicos son modelos poco profundos y no
pueden aprovechar al máximo los métodos de conjunto. Si utilizamos modelos
profundos como clasificadores base para un modelo de conjunto, el cálculo requerido
será extremo, lo que no es asequible en una plataforma de cálculo general.
Figura 7
Comparación de modelos tradicionales
Nota. De “A predictive intelligence system of credit scoring based on deep multiple

kernel learning”, por Wu, C., Huang, S., Chiou, C., & Wang, Y., 2021
(https://doi.org/10.1016/j.asoc.2021.107668).
30
Figura 8
Comparación de modelos avanzados
Nota. De “A predictive intelligence system of credit scoring based on deep multiple

kernel learning”, por Wu, C., Huang, S., Chiou, C., & Wang, Y., 2021
(https://doi.org/10.1016/j.asoc.2021.107668).
Principal resultado:
Los resultados indican que el clasificador de kernel múltiple profundo supera a los
modelos convencionales y de conjunto. Los departamentos de tarjetas de crédito con
una mejor gestión del riesgo pueden evitar posibles deudas incobrables, beneficiando
así las operaciones de los bancos. Las aplicaciones de la inteligencia predictiva
mejoran la predicción del comportamiento humano en la industria de las tarjetas de
crédito.

Título:
Predicting mortgage early delinquency with machine learning methods (Predicción
de morosidad hipotecaria temprana con métodos de aprendizaje automático).
Aporte:
Este artículo investiga el desempeño de trece métodos para modelar y predecir las
probabilidades de morosidad temprana de hipotecas. Estos modelos incluyen
variantes de modelos logit, algunos métodos de aprendizaje automático de uso común
y variantes de modelos de conjunto. Encontramos que los métodos de conjuntos
31
heterogéneos lideran otros métodos en los conjuntos de datos de entrenamiento, fuera
de muestra y fuera de tiempo en términos de clasificación de riesgo.
Proceso:
Se investigó el desempeño de trece métodos para modelar la morosidad hipotecaria
temprana. En comparación con los artículos en la literatura existente que aplican
métodos de ML en modelos de morosidad transversal de hipotecas, como Fitzpatrick
y Mues (2016), Lesmann et al. (2015), y Li et al. (2017), esta investigación es más
exhaustiva y cubre no solo la clasificación de riesgos sino también la precisión
predictiva, en una muestra mucho más grande que representa el mercado de hipotecas
de primera calidad de EE. UU. durante los períodos posteriores a la crisis financiera.
Figura 9
Resultados de orden por rangos
Nota. De “Predicting mortgage early delinquency with machine learning methods”,

por Chen, S., Guo, Z., & Zhao, X., 2021 (https://doi.org/10.1016/j.ejor.2020.07.058).
En este artículo, encontramos que, en términos de clasificación de riesgo, los métodos
de conjuntos heterogéneos superan a los otros métodos en los conjuntos de datos de
entrenamiento, fuera de muestra y fuera de tiempo en este estudio. Sin embargo, la
precisión predictiva es un gran desafío que enfrentan todos los modelos de morosidad
temprana de hipotecas. La clasificación de varios métodos difiere según las diferentes
medidas de precisión predictiva. Ningún método se destaca clara y consistentemente
en varias métricas de esta dimensión de desempeño en los conjuntos de datos de
entrenamiento, fuera de muestra y fuera de tiempo. De hecho, ninguno de los
modelos puede capturar con exactitud la precisión predictiva en los grupos FICO
refinados, incluso en esta de capacitación. Dichos resultados podrían deberse a la
incapacidad de incorporar algunos factores de riesgo críticos (como los ingresos)
entre la lista de variables explicativas y, por lo tanto, la precisión predictiva es un
32
desafío importante que enfrentan todos los modelos de morosidad temprana de
hipotecas.

Título:
Predicting credit card delinquencies: An application of deep neural networks
(Predicción de morosidad de tarjetas de crédito: una aplicación de redes neuronales
profundas).
Aporte:
El objetivo de este artículo es doble. Primero, desarrolla un sistema de predicción
para ayudar al emisor de la tarjeta de crédito a modelar el riesgo de morosidad de la
tarjeta de crédito. En segundo lugar, busca explorar el potencial del aprendizaje
profundo (también llamado red neuronal profunda), una tecnología de inteligencia
artificial emergente, en el dominio del riesgo crediticio. Con datos de tarjetas de
crédito de la vida real vinculados a 711 397 titulares de tarjetas de crédito de un gran
banco en Brasil, este estudio desarrolla una red neuronal profunda para evaluar el
riesgo de morosidad en las tarjetas de crédito en función de las características
personales del cliente y los comportamientos de gasto.
Proceso:
Hay 85 clientes legítimos clasificados como deudores por la DNN. Además, se
detectan con éxito 773 de 1277 clientes morosos. Los resultados de la prueba fuera
de muestra en la Tabla 9 muestran que el modelo DNN generalmente funciona de
manera efectiva para detectar morosidad, como lo refleja el valor de AUC más alto
(0.9246). El recuerdo es 0,6053, que es el segundo valor más alto. El valor más alto
de recuperación es 0,8677 para el modelo ingenuo de Bayes. La precisión del DNN
también es la segunda más alta, que es 0,9009. Teniendo en cuenta tanto la precisión
como la recuperación, la DNN supera a otros modelos con la puntuación F 1 más alta
(0,7241). Este resultado es consistente con el resultado de todos los modelos en los
conjuntos de validación cruzada. Específicamente, la puntuación F 1 para el conjunto
de prueba es más alta que la del conjunto de validación cruzada. Las métricas
restantes respaldan que, en comparación con la ANN tradicional, el bayesiano
33
ingenuo, la regresión logística y el árbol de decisiones, la DNN se desempeña de
manera más eficaz en la identificación de la morosidad de las tarjetas de crédito.
Figura 10
DNN
Nota. De “Predicting credit card delinquencies: An application of deep neural

networks”, por Sun, T., & Vasarhelyi, M. A. 2018
(https://doi.org/10.1002/isaf.1437).
Figura 11
Resultados de prueba
Nota. De “Predicting credit card delinquencies: An application of deep neural

networks”, por Sun, T., & Vasarhelyi, M. A. 2018
(https://doi.org/10.1002/isaf.1437).
Este documento demuestra la efectividad del aprendizaje profundo para predecir la
morosidad de las tarjetas de crédito. Utilizando datos de tarjetas de crédito de la vida
real de un gran banco en Brasil, desarrollaron una DNN (red neuronal profunda) para
predecir morosidad severa en función de la información personal y las características
de gasto de los clientes. Compararon el rendimiento predictivo de la DNN con el de
la ANN tradicional (red neuronal artificial, regresión logística, bayesiano ingenuo y
modelos de árboles de decisión). El resultado de la validación cruzada y las pruebas
muestran que la DNN generalmente funciona mejor que otros modelos, ya que
34
medido por puntajes F y AUC. El éxito del modelo DNN implica que el aprendizaje
profundo es una técnica prometedora que puede tener mucho que contribuir a la
gestión eficaz del riesgo de tarjetas de crédito para las instituciones financieras y los
reguladores, especialmente cuando los datos disponibles son grandes y complejos.

Título:
Predicting the likelihood of airspace user rerouting to mitigate air traffic flow
management delay (Predecir la probabilidad de que los usuarios del espacio aéreo
cambien de ruta para mitigar el retraso en la gestión del flujo del tránsito aéreo).
Aporte:
Los usuarios de espacio aéreo pueden modificar la trayectoria de un espacio regulado
para prevenir el retraso. Sin embargo, si varios usuarios aplican esta práctica
terminarían congestionando la ruta resultando inefectiva. Por ello, los autores buscan
reducir los retrasos de vuelos y los costos implicados proponiendo un modelo de
aprendizaje automático usando árboles de decisión potenciado por gradiente usando
datos históricos con técnicas de aprendizaje supervisado. Aunque el modelo no es
perfecto supera un modelo de árbol de decisión rudimentario.
Proceso:
El sistema de asignación de espacios asistido por computadora (CASA) se encarga
de la asignación de los vuelos según orden de planificación tratando de reducir el
reglamento de gestión de flujo de tráfico aéreo (ATFM). Teniendo en cuenta estos
conceptos el objetivo consiste en detectar los cambios de ruta para reducir el ATFM
considerando que también pueden cancelar un vuelo y ejecutar un nuevo plan de
vuelo.
A continuación, se genera un modelo según la siguiente información:

• El perfil aéreo ha cambiado
• El retraso ATFM ha disminuido o ya no está regulado
• El MPR ya no afecta el vuelo
35
Esta información es entrenada con un dataset de 26.4 millones de observaciones de
2.35 millones de vuelos en 3 situaciones: actual, pasado 1 hora y cualquier tiempo
consiguiendo los siguientes resultados:
• Cuando el retraso de ATFM es menor de 30min tiene un impacto negativo.
• Los vuelos más cortos tienen menos probabilidad de cambiar de ruta.
• Hay más penalización ocasionada por capacidad o gestión de espacio aéreo.
La propuesta de un árbol de decisión potenciado por gradientes está lejos de ser
perfecto, sin embargo, puede usar una función de "what-if" con un estimado número
de cambio de rutas generándose un nuevo indicador. Asimismo, se sabe que
desarrollar e implementar un servicio de soporte gradual con toma de decisiones
automáticas es costoso, por lo que el modelo propuesto puede ser reutilizado para
dichos fines.

Título:
Machine Learning Algorithms for Construction Projects Delay Risk Prediction (Los
algoritmos de aprendizaje automático para proyectos de construcción retrasan la
predicción de riesgos).
Aporte:
Los autores tienen como objetivo identificar y desarrollar un modelo de aprendizaje
automático que permita facilitar la predicción de riesgo de retraso de un proyecto.
Para ello, se entrena dos modelos de aprendizaje automático: árbol de decisión y red
bayesiana.
Proceso:
Se plantea como objetivo lo siguiente:
• Identificar fuentes relevantes de riesgo de retraso.
• Desarrollar un algoritmo para analizar data de proyectos anteriores.
Para la aplicación, se usó fuente de datos se usó 51 proyectos de los cuales se

establece 9 fuentes de riesgo: consultante, contratante, diseño, mano de obra,
36
materiales, equipo, proyecto y aspectos externos; cada una con un grupo distinto de
factores de riesgo. A su vez éstas se clasificaron según el impacto que genera: muy
alto, alto, medio, bajo y muy bajo. Para el primer objetivo se obtuvo que las fuentes
de retraso son altamente interdependientes, las fuentes de retraso y el tiempo de
exceso (TO) están relacionadas de una manera compleja y las fuentes de riesgo de
retraso están relacionadas de una manera compleja entre ellas mismas. Para el
segundo objetivo se planteó dos modelos de aprendizaje automático: árbol de
decisión y redes bayesianas. En este punto se clasificó la información por tiempo de
exceso (TO): <30%, 30%-60% y >60%. Comparando los resultados se verificó que
el segundo modelo predice los retrasos con mayor precisión.
Figura 12
Clasificadores
Nota. De “Machine Learning Algorithms for Construction Projects Delay Risk

Prediction”, por Abdellah, A. R., Mahmood, O. A., Kirichek, R., Paramonov, A., &
Koucheryavy, A., 2021 (https://doi.org/10.1016/j.trc.2022.103869).
Se usaron dos modelos de aprendizaje automático (árbol de decisión y redes
bayesianas) para determinar los retrasos en proyectos de construcción usando filtros
por factores de retraso y clasificándolos según el impacto que genera. A través de
esto se obtuvo que el modelo de redes bayesianas se aplica mejor para este caso de
estudio.
4.3 Resumen de artículos de la categoría aprendizaje automático con predicción

Título:
An Explainable Machine Learning Model for Material Backorder Prediction in
Inventory Management (Un modelo de aprendizaje automático explicable para
MaterialBackOrder en la gestión de inventario).
37
Aporte:
En este artículo se destaca la importancia de desarrollar modelos de predicción
efectivos de la tasa de pedidos atrasados en sistemas de inventario, con el fin de
mejorar la cadena de suministro y, en consecuencia, el desempeño empresarial. Sin
embargo, los enfoques convencionales en la literatura se basan en la aproximación
estocástica, sin tomar en cuenta la información de los datos históricos. Con este fin,
se deben emplear modelos de aprendizaje automático para extraer conocimiento de
grandes datos históricos para desarrollar modelos predictivos. Por lo tanto, para
cubrir esta necesidad, en este estudio se abordó el problema de predicción de pedidos
atrasados. Específicamente, se compararon varios modelos de aprendizaje
automático para resolver el problema de clasificación binaria de la predicción de
pedidos atrasados, seguidos de la calibración del modelo y una explicación post-hoc
basada en el modelo SHAP para identificar e interpretar las características más
importantes que contribuyen a los pedidos atrasados de material.
Proceso:
El conjunto de datos presentado se utilizó en una canalización de aprendizaje
automático (AA) para predecir posibles pedidos pendientes en el sistema de gestión
de inventario. Los pasos integrados en la canalización de AA fueron los siguientes:
• Preprocesamiento de datos para manejar los datos faltantes y los valores
categóricos; selección de características a través de un método de última
generación, llamado Boost-ARoota.
• Una evaluación comparativa de modelos populares de aprendizaje
automático, como Random Forest (RF), LightGBM (LGBM), XGBoost
(XGB), Balanced Blagging (BB), Neural Networks (NN), Logistic
Regression (LR), Support Vector Máquinas (SVM) y K-vecinos más
cercanos (KNN);
• Un análisis de aplicabilidad con el uso del modelo SHAP aplicado al modelo
de predicción de mejor desempeño en el anterior paso.
38
Figura 13
Modelo
Nota. De “An Explainable Machine Learning Model for Material Backorder

Prediction in Inventory Management”, por Ntakolia, C., Kokkotis, C., Karlsson, P.,
& Moustakidis, S., 2021 (https://doi.org/10.3390/s21237926).
Los resultados mostraron que los modelos RF, XGB, LGBM y BB alcanzaron una
puntuación AUC de 0,95, mientras que el modelo con mejor rendimiento fue el
modelo LGBM después de la calibración con el método de regresión isotónica. El
análisis de aplicabilidad mostró que el stock de inventario de un producto, el volumen
de productos que se pueden entregar, la demanda inminente de ventas y la predicción
precisa de la demanda futura pueden contribuir significativamente a la predicción
correcta de pedidos atrasados.

Título:
Analysis on the Bus Arrival Time Prediction Model for Human-Centric Services
Using Data Mining Techniques (Análisis del Modelo de Predicción de Horas de
Llegada de Autobuses para Servicios Centrados en Personas Utilizando Técnicas de
Minería de Datos).
Aporte:
En la actualidad los pasajeros cuentan con una falta de información de la
disponibilidad de buses para una ruta especifica y tiempo estimado de llegada (ETA).
Para ellos, los autores proponen proveer una aplicación interacción humano-
computadora (HCI) web/mobile para realizar un seguimiento de los buses en tiempo
39
real. Esta aplicación tiene como objetivo estimar el tiempo estimado de llegada
(ETA) usando técnicas de aprendizaje automático considerando los impactos del
medio ambiente en entornos dinámicos. De esta manera el beneficio será para los
pasajeros, conductores de buses y administradores de buses.
Proceso:
Para llevar a cabo la investigación se tuvo que realizar lo siguiente:
• Establecer un sistema de inteligencia de transporte que colecte, analice e
identifique patrones de transporte.
• Desarrollar un sistema de administración de buses con sistema de proceso de
información avanzada.
• Crear módulos para dar seguimiento y mostrar el movimiento de los
vehículos en tiempo real bajo la influencia de varios factores como tráfico,
clima.
• Registrar viajes diarios y rutas incluyendo la velocidad y tráfico con el
movimiento de los vehículos.
• Desarrollar un módulo para enviar información como ruta, duración de viaje,
tráfico hacia los pasajeros.
Figura 14
Arquitectura
Nota. De “Analysis on the Bus Arrival Time Prediction Model for Human-Centric
Services Using Data Mining Techniques”, por Shanthi, N., Sathishkumar, V. E.,
Upendra Babu, K., Karthikeyan, P., Rajendran, S., & Allayear, S. M., 2022
(https://doi.org/10.1155/2022/7094654).
40
Se obtuvo información de 30 días con un total de 3360 registros, después se procede
a calcular el error por medio de varios algoritmos:
• Error medio cuadrado (MSE)
• Relative Squared Error (RSE)
• Error cuadrático medio de la raíz (RMSE)
Esos algoritmos fueron modelados por SVR (Regresión de vectores de soporte) y

luego comparados con modelos como RFR (regresión de árbol aleatorio), DTR
(regresión de árbol de decisión), KNNR (regresión k-vecinos), GBR (regresor
potenciador de gradiente), consiguiendo los siguientes resultados:
Figura 15
Algoritmos
Nota. De “Analysis on the Bus Arrival Time Prediction Model for Human-Centric
Services Using Data Mining Techniques”, por Shanthi, N., Sathishkumar, V. E.,
Upendra Babu, K., Karthikeyan, P., Rajendran, S., & Allayear, S. M., 2022
(https://doi.org/10.1155/2022/7094654).
Por medio del modelo SVR (regresión de vectores de soporte) consigue una mejor
precisión que RMSE por 20 segundos, sin embargo, aún se puede realizar mejoras,
como usar un seguimiento de GPS y GSM con soporte a comunicación 4G, mejorar
la comunicación reduciendo la carga Raspberry Pi mediante el uso de servidores
independientes, usar un dataset de mayor magnitud.

Título:
Predicting supply chain risks using machine learning: The trade-off between
performance and interpretability (Predicción de los riesgos de la cadena de suministro
mediante el aprendizaje automático: el equilibrio entre el rendimiento y la
interpretabilidad).
41
Aporte:
Los autores proponen un marco de trabajo de predicción de riesgos de cadena de
suministro usando técnicas de aprendizaje automático para predecir el rendimiento e
interpretabilidad usando máquina de vectores de soporte, árbol de decisión y árbol
de decisión restringido.
Proceso:
Se establece las bases del modelo según categorías de riesgo:
• Riesgo de proveedor
• Riesgo de pedido
• Riesgo de capacidad
• Riesgo de producto
Para esto se usa un dataset de 500000 productos por un periodo de 6 años con la
siguiente información:
• Proveedor de nivel 1
• Proveedor de nivel 2
• Productos
• Pedidos
• Entregas
Con la información obtenida se procesa el estado del envío: temprano, a tiempo,

tarde. Además, como métrica se usaron los siguientes identificadores:
• Puntaje F
• Promedio de precisión (AP)
• coeficiente correlativo de Matthews (MCC)
• matriz de confusión (CM)
Consiguiendo el siguiente resultado que se muestra en la ilustración 16:
42
Figura 16
Clasificadores
Nota. De “Predicting supply chain risks using machine learning: The trade-off
between performance and interpretability”, por Baryannis, G., Dani, S., & Antoniou,
G., 2019 (https://doi.org/10.1016/j.future.2019.07.059).
Los árboles de decisión pueden ser informativos para llegar a un resultado mientras
que los modelos SVM proporcionan información relacionada. A partir de este
modelo se puede mejorar utilizando un dataset más amplio con más características y
técnicas de aprendizaje automático.

Título:
A Data-Driven Approach for Accurate Rainfall Prediction (Un enfoque basado en
datos para una predicción precisa de las precipitaciones).
Aporte:
Los autores proponen un enfoque sistemático para analizar parámetros que afectan
la precipitación en la atmósfera para modelar un algoritmo de aprendizaje automático
para predecir la lluvia.
Proceso:
Los radiómetros pueden proveer información importante del PWV (vapor de agua
precipitable) sólo en condiciones sin lluvia; sin embargo, el GPS provee información
espaciotemporal ante cualquier condición climática. Debido a esto se plantea usar un
GPS-derivado PWV para la predicción de lluvias.
La información se consiguió de la estación de clima SNUS limitándose a 4 años

(2012-2015) en intervalos de 5 minutos considerando datos importantes para el
estudio como la temperatura, la humedad relativa, el punto de rocío y la radiación
43
solar. Esta información en procesada por un modelo de red neuronal artificial (ANN)
y máquina de soporte de vectores (SVM) previa clasificación por características de
clima, hora del día (HoD) y día del año (DoY). Como resultado se obtuvo una tasa
de detección real del 80.4%, una tasa de falsa alarma del 20.3% y una precisión real
del 79.6%.
Por medio de las características meteorológicas terrestres en conjunto con factores
estacionales y variables climáticas se puede llegar a predecir las lluvias. Este modelo
se puede mejorar considerando características como el viento, cobertura de nubes,
entre otros.
4.4 Resumen de artículos de la categoría predicción con retrasos

Título:
Universality of delay-time averages for financial time series: analytical results,
computer simulations, and analysis of historical stock-market prices (Universalidad
de los promedios de tiempo de retraso para series temporales financieras: resultados
analíticos, simulaciones por computadora y análisis de precios históricos del mercado
de valores).
Aporte:
Se analizaron datos históricos de los precios del mercado de valores para múltiples
índices financieros utilizando el concepto de promedio de tiempo de retraso para la
serie de tiempo financiero. La región de validez de nuestras predicciones teóricas
recientes para los "desplazamientos" cuadráticos medios promediados en el tiempo
estándar y retardados del FTS histórico se extiende a todos los tiempos de retardo.
Como primer elemento novedoso, se realizó extensas simulaciones por computadora
de la ecuación diferencial estocástica que describe el movimiento browniano
geométrico (GBM) que demuestran un acuerdo cuantitativo con las predicciones
analíticas de evolución de precios a largo plazo en términos del TAMSD retrasado.
En segundo lugar, se presentó un procedimiento robusto de determinación de los
44
parámetros del modelo de GBM mediante el ajuste de las características de la
dinámica de evolución de precios en el FTS para acciones y criptomonedas.
Proceso:
Resultados de simulaciones por computadora versus teoría.
Figura 17
Indicadores
Nota. De “Universality of delay-time averages for financial time series: analytical

results, computer simulations, and analysis of historical stock-market prices”, por
Ritschel, S., Cherstvy, A. G., & Metzler, R., 2021 (http://dx.doi.org/10.1088/2632-
072X/ac2220).
Se presentó un análisis basado en el promedio de tiempo del FTS histórico de la
evolución del precio de las acciones. Primero compararon las predicciones analíticas
basadas en GBM e informaron los resultados de extensas simulaciones por
computadora basadas en GBM. Su enfoque principal estaba en el comportamiento
del nuevo observable, el TAMSD retrasado.
45
Título:
Phishing Website Detection Based on Deep Convolutional Neural Network and
Random Forest Ensemble Learning (Detección de sitios web de phishing basada en
redes neuronales convolucionales profundas y aprendizaje de conjunto de bosques
aleatorios).
Aporte:
Este artículo propone un método integrado de detección de sitios web de phishing
basado en redes neuronales convolucionales (CNN) y bosques aleatorios (RF). El
método puede predecir la legitimidad de las URL sin acceder al contenido web ni
utilizar servicios de terceros. La técnica propuesta utiliza técnicas de incrustación de
caracteres para convertir direcciones URL en matrices de tamaño fijo, extraer
características en diferentes niveles utilizando modelos CNN, clasificar
características de varios niveles utilizando múltiples clasificadores de RF y,
finalmente, generar resultados de predicción utilizando un enfoque en el que el
ganador se lo lleva todo.
Proceso:
Esta sección presenta un método de detección de sitios web de phishing basado en la
incrustación de caracteres, CNN y RF. El método de detección de sitios web de
phishing propuesto en este documento consta de tres componentes principales. En
primer lugar, los datos de URL se transforman en un vector de caracteres mediante
el método de incrustación de caracteres. Las URL convertidas tienen la misma
estructura de datos, lo que es beneficioso para la detección de sitios web de phishing.
En segundo lugar, se diseña una red CNN mejorada y el modelo se entrena utilizando
los datos de URL transformados. Una vez que se entrena el modelo, se extraen las
características de la URL para obtener las características de las diferentes capas en la
red CNN. En tercer lugar, las características extraídas de diferentes capas de red se
clasifican en bosques aleatorios por separado. El clasificador con el mejor resultado
de clasificación se utiliza como clasificador final para clasificar el sitio web.
46
Figura 18
Probabilidad de phising
Nota. De “Phishing Website Detection Based on Deep Convolutional Neural

Network and Random Forest Ensemble Learning”, por Yang, R., Zheng, K., Wu, B.,
Wu, C., & Wang, X., 2021 (https://doi.org/10.3390/s21248281).
En el conjunto de datos, se logró una tasa de precisión del 99,35% utilizando el
modelo propuesto. Se logró una tasa de precisión del 99,26 % en los datos de
referencia, mucho más alta que la del modelo extremo existente.

Título:
Intelligent Prediction of Train Delay Changes and Propagation Using RVFLNs With
Improved Transfer Learning and Ensemble Learning (Predicción inteligente de
cambios de demora de trenes y propagación mediante RVFLN con aprendizaje de
transferencia y aprendizaje de conjuntos mejorados).
47
Aporte:
En este artículo, se propone un método inteligente de múltiples etapas para predecir
los cambios dinámicos y la propagación de los retrasos de los trenes utilizando redes
de enlace funcional de vector aleatorio (RVFLN) con aprendizaje de transferencia
mejorado y aprendizaje de conjunto. En primer lugar, para mejorar el rendimiento de
predicción del modelo de RVFLN único, se propone un algoritmo de regresión de
RVFLN de aprendizaje de conjunto de apilamiento (SRN) mejorado para el
modelado de predicción de los cambios de retraso. Luego, para garantizar la precisión
de la clasificación de datos de trenes no etiquetados y de clase desequilibrada, se
propone un clasificador mejorado de aprendizaje de transferencia RVFLN (ITRN)
para decidir si el retraso inicial conducirá a retrasos asociados, con la ayuda del
algoritmo SMOTE mejorado para procesar datos desequilibrados.
Proceso:
Diagrama de estrategia del algoritmo SRN propuesto (en cada cuadro de línea
continua, el sombreado blanco representa el modelo, el sombreado gris oscuro
representa los datos del entrenamiento del modelo y el sombreado naranja representa
los datos de la prueba del modelo).
Figura 19
Diagrama de estrategia del algoritmo SRN
Nota. De “Intelligent Prediction of Train Delay Changes and Propagation Using

RVFLNs With Improved Transfer Learning and Ensemble Learning”, por Zhou, P.,
Chen, L., Dai, X., Li, B., & Chai, T., 2021
(https://doi.org/10.1109/TITS.2020.3002785).
48
Con el fin de abordar los desafíos de predecir los cambios y la propagación de los
retrasos de los trenes, se propone un método novedoso de predicción de retrasos de
trenes basado en datos de múltiples etapas mediante la mejora e integración de varias
tecnologías de modelado inteligente. El clasificador ITRN está desarrollado para
clasificar los datos del tren no etiquetados y desequilibrados para juzgar la
propagación del retraso. Con el fin de mejorar el rendimiento de la predicción y la
generalización del método de modelado de RVFLN individuales, se propone un
algoritmo SRN basado en el aprendizaje de conjunto de apilamiento mejorado para
predecir los cambios de retraso y los retrasos asociados.

Título:
Resource Prediction-Based Edge Collaboration Scheme for Improving QoE
(Esquema de colaboración perimetral basado en la predicción de recursos para
mejorar la QoE).
Aporte:
Se propuso un esquema de colaboración perimetral que utiliza otros nodos
informáticos para aumentar la eficiencia del procesamiento de tareas y mejorar la
calidad de la experiencia (QoE). Sin embargo, los esquemas de colaboración de
servidores perimetrales existentes tienen una QoE baja porque no tienen en cuenta
los recursos informáticos ni el tiempo de comunicación de otros servidores
perimetrales. En este documento, proponen un esquema de colaboración perimetral
basado en la predicción de recursos para mejorar la QoE. Estimaron el uso de
recursos informáticos en función de las tareas recibidas de los dispositivos. De
acuerdo con los recursos informáticos previstos, el servidor perimetral colabora de
forma probabilística con otros servidores perimetrales. El esquema propuesto se basa
en el modelo de retardo y utiliza el algoritmo voraz. Asigna recursos informáticos a
la tarea teniendo en cuenta el tiempo de cálculo y almacenamiento en búfer.
49
Proceso:
QoE de esquemas de colaboración de varias tareas: (a) Tasa de éxito; (b) tiempo de
finalización; (c) tiempo de procesamiento; (d) Tiempo de comunicación.
Figura 20
QoE de esquemas de colaboración de varias tareas
Nota. De “Resource Prediction-Based Edge Collaboration Scheme for Improving

QoE”, por Park, J., & Chung, K., 2021 (https://doi.org/10.3390/s21248500).
Los resultados experimentales muestran que el esquema propuesto logra una QoE
alta en comparación con los esquemas existentes debido a la alta tasa de éxito y el
bajo tiempo de finalización.

Título:
Critical Duration Index: Anticipating Project Delays (Índice de duración crítica:
anticipación de retrasos en los proyectos).
Aporte:
50
Se propone un modelo matemático que permite identificar si un proyecto va a
finalizar tarde y la duración de este haciendo uso del CDI (Índice de duración crítica).
Para ello se determinan variables tales como el tiempo promedio, variabilidad de
duración, orden de ejecución, orden de ejecución, interrupciones, superposiciones,
desfases, entre otros. El objetivo de los autores es ofrecer una herramienta fácil de
usar para determinar si un proyecto finalizará a tiempo.
Proceso:
En la actualidad existen muchas aplicaciones como el diagrama de Grantt, método
del camino crítico que te permiten estimar la duración de un proyecto. No obstante,
el tiempo es subestimado con respecto a la realidad, debido a múltiples factores que
no se aplican al realizar el cálculo. Por ello, se propone el cálculo de una variable
llamada CDI (Índice de duración crítica) que indicará la probabilidad de que un
proyecto termine después del tiempo estimado con un horario determinado.
En un estudio realizado por Ballesteros Pérez (2020) se determinó que el 50% de los
proyectos de construcción terminaban a tiempo, lo que significa que el promedio de
retrasos es equivalente a cero. También se obtuvo que a mayor cantidad de partes
paralelas en un proyecto es mayor la probabilidad de que termine tarde. Debido a
esto, la probabilidad de que un proyecto termine a tiempo (50% = 1/2) adicionado a
una parte paralela (50% = 1/2) resulta 1/2 x 1/2 = 1/4; si a esto le adicionamos una
parte paralela terminaría 1/2 x 1/2 x 1/2 = 1/8 = 2-3 = 0.125. Generalizando se
consigue que la probabilidad de que un proyecto termine a tiempo según la cantidad
de partes en paralelo se consigue mediante 2-j, siendo "j" la cantidad de partes en
paralelo. Sin embargo, este valor no es preciso debido a que los tiempos divergen,
entrelazan, superponen, fusionan. Por ello, se propone el siguiente modelo
matemático para calcular el CDI donde di = duración de las actividades y tfi = el total
decimal:
51
Figura 21
Ecuación para obtener el CDI
Nota. De “Critical Duration Index: Anticipating Project Delays”, por González-Cruz,

M. -., Ballesteros-Pérez, P., Lucko, G., & Zhang, J, 2022
(https://ascelibrary.org/doi/10.1061/%28ASCE%29CO.1943-7862.0002387).
Por consiguiente, la probabilidad de que un proyecto termine tarde se obtiene de la

siguiente expresión:
Figura 22
Ecuación para obtener el percentil PD
Nota. De “Critical Duration Index: Anticipating Project Delays”, por González-Cruz,

M., Ballesteros-Pérez, P., Lucko, G., & Zhang, J., 2022
(https://ascelibrary.org/doi/10.1061/%28ASCE%29CO.1943-7862.0002387).
Ambas ecuaciones se ejecutaron para un dataset de 4100 proyectos de diferentes

áreas de los cuales se obtuvo que:
• Es más simple que el modelo propuesto por Ballesteros-Pérez et al. (2020).
• Requiere menos información que el modelo anterior.
• Tiene más precisión.
Se calculó las expresiones de regresión haciendo uso del CDI (Índice de duración
crítica) en dos datasets obteniendo una buena precisión para determinar si un
proyecto va a terminar tarde y el tiempo aproximado de demora; sin embargo, la
duración puede variar en algunos casos debido a la complejidad de los procesos.
52
Título:
Prediction of ignition delay times of Jet A-1/hydrogen fuel mixture using machine
learning (Predicción de los tiempos de retardo de encendido de la mezcla de
combustible Jet A-1/hidrógeno utilizando el aprendizaje automático).
Aporte:
Los autores proponen obtener una predicción del retraso del tiempo de combustión
mediante operadores condicionales en un aprendizaje automático. Para ellos aplican
usar una sub-ANN anidada al modelo original ANN para conseguir una mayor
precisión al usar condiciones. Como consecuencia, se produce un modelo con una
mayor precisión al predecir los retrasos de los tiempos de combustión de la mezcla
jet A-1/hidrógeno.
Proceso:
Se plantea una red neuronal (ANN) anidada a una sub-ANN utilizando los siguientes
parámetros: presión, temperatura, radio equivalente, relación molar de mezcla de
hidrógeno, los cuales son entrenados de la siguiente manera:
Figura 23
Modelo de entrenamiento
Nota. De “Prediction of ignition delay times of Jet A-1/hydrogen fuel mixture using
machine learning”, por Huang, Y., Jiang, C., Wan, K., Gao, Z., Vervisch, L.,
Domingo, P., Liu, J., 2022 (https://doi.org/10.1016/j.ast.2022.107675).
53
Los resultados fueron comparados con estudios anteriores obteniéndose que la
propuesta realiza mejor que los métodos de bosque aleatorio y el modelo ANN
propuesto por Choi y Chen (2005).
Figura 24
Comparación de algoritmos
Nota. De “Prediction of ignition delay times of Jet A-1/hydrogen fuel mixture using
machine learning”, por Huang, Y., Jiang, C., Wan, K., Gao, Z., Vervisch, L.,
Domingo, P., Liu, J., 2022 (https://doi.org/10.1016/j.ast.2022.107675).
• Después de entrenar una red neuronal ANN con un dataset de 104 000
registros se puede concluir que:
• Un modelo básico de ANN con 5 capas ocultas produce buenos resultados en
predicciones.
• Una sub-ANN anidada mejora la precisión de las predicciones
• La propuesta es cerca de 10 3 más rápida que el modelo clásico de simulación
HyChem.
54
Título:
Flight delay prediction for commercial air transport: A deep learning approach
(Predicción de retrasos de vuelos para el transporte aéreo comercial: un enfoque de
aprendizaje profundo).
Aporte:
Los retrasos en los aeropuertos suelen propagarse a otros aeropuertos, incluso a su
propia red de transporte aéreo. Por ello, los autores tienen como objetivo generar un
modelo de aprendizaje automático para predecir los retrasos de los vuelos usando
una regresión de vectores de soporte. Para dicho caso se tomó como caso de estudio
el aeropuerto central de PEK ubicado en Beijing (China). Este modelo es
posteriormente comparado con otros modelos conocidos.
Proceso:
En comparación con otros estudios realizados anteriormente, los autores buscan no
sólo basarse en variantes macro como clima, efectos situacionales, propagación de
retraso y control de tráfico aéreo, sino también variantes micro tales como la
situación de ruta aérea y grado de aglomeración del aeropuerto.
Con colaboración del aeropuerto central PEK se toma un dataset de 528471 registros
donde se incluyen 49 aerolíneas. Esta información es entrenada por un modelo
mezcla de red bayesiana dinámica con regresión de vectores de soporte (DBN-SVR).
El uso de red bayesiana dinámica (DBN) es un conocida para filtrar información y
evitar datos redundantes, mientras que la regresión de vectores de soporte (SVR).
Éste nuevo modelo generado es posteriormente comparado con otros modelos como
k-nearest neighbors (KNN), support vector machine (SVM) y linear regression (LR)
en base a su coeficiente de determinación.
Figura 25
Comparación de algoritmos por coeficientes
55
Nota. De “Flight delay prediction for commercial air transport: A deep learning
approach”, por Yu, B., Guo, Z., Asian, S., Wang, H., & Chen, G., 2019
(https://doi.org/10.1016/j.tre.2019.03.013).
Se construyó un modelo DBN-SVR usando multifactores (macro y micro) para
obtener una mayor precisión en tiempo real y reducir la ansiedad de los pasajeros y
quejas. Este modelo tiene limitantes ya que no implica vuelos de llegada y vuelos
internacionales.

Título:
A hybrid Bayesian network model for predicting delays in train operations (Un
modelo híbrido de red bayesiana para predecir retrasos en la operación de trenes).
Aporte:
Los retrasos inesperados en los trenes pueden generar costo enorme a los pasajeros y
operadores, además de las quejas. Debido a esto los autores buscan reducir los
retrasos mediante un modelo de predicción de retrasos basado en red bayesiana (BN)
híbrida.
Proceso:
Para el estudio se empleó una operación de trenes en China que conecta 18 estaciones
con información desde febrero de 2015 a noviembre de 2015 con un total de 378510
eventos de llegadas y salidas. Las predicciones de error se basaron en los criterios:
MAE, ME, RMSE. Luego de procesar la información se obtuvo lo siguiente:
56
Figura 26
Comparación de los tiempos de operación de trenes
Nota. De “A hybrid Bayesian network model for predicting delays in train

operations”, por Lessan, J., Fu, L., & Wen, C., 2018
(https://doi.org/10.1016/j.cie.2018.03.017).
Las primeras estimaciones presentan un error mínimo, mientras que las más alejadas
no, esto se debe a que los errores se acumulan a través de las estaciones.
Se llegó a demostrar que el modelo propuesto de red bayesiana híbrida puede lograr
más de 80% de precisión para un horizonte de 60 minutos. Además, se puede afirmar
que es simple, interpretable, eficiente e incorpora las interrelaciones de los factores
casuales y la superposición de los componentes de retraso llegada y salida.
4.5 Resumen de artículos de la categoría aprendizaje automático con predicción con

retrasos
Título:
Impact of material data in assembly delay prediction --a machine learning‑based case
study in machinery industry (Impacto de los datos de materiales en la predicción de
retrasos en el esamblaje: un estudio de caso basado en el aprendizaje automático en
la industria de la maquinaria).
57
Aporte:
Para analizar esta investigación, se siguió el método CRISP-DM establecido para
configurar 12 modelos de predicción en un fabricante de máquinas y plantas elegido
como ejemplo utilizando un enfoque de clasificación binaria. Estos 12 modelos se
diferenciaron en la utilización de datos materiales (incluidos o excluidos datos
materiales) y en el algoritmo de aprendizaje automático utilizado (seis algoritmos por
caso de datos). La evaluación de los diferentes modelos reveló un impacto positivo
de los datos del material en la calidad del modelo. Con los resultados obtenidos,
nuestro estudio valida el beneficio de usar datos de materiales en modelos que
predicen retrasos en el inicio del ensamblaje.
Proceso:
Fases:
Comprensión del negocio: En la fase de “Business Understanding”, se deriva
objetivos y requisitos desde una perspectiva empresarial y se convierte en un
problema de minería de datos.
Comprensión de datos: Se recopila y analiza los datos para identificar problemas de

calidad de datos y desarrollar un conjunto de datos sólidos.
Preparación de data: Se continua con la preparación del conjunto de datos final para
entrenar los modelos transformando y limpiando los datos sin procesar iniciales.
Modelado: Esta abarcó el desarrollo de modelos ML y la calibración de los
parámetros a valores óptimos.
58
Figura 27
Preparación de datos para entrenar
Nota. De “Impact of material data in assembly delay prediction --a machine

learning‑based case study in machinery industry”, por Steinberg, F., Burggaef, P.,
Wagner, J., & Heinbach, B., 2022 (https://doi.org/10.1007/s00170-022-08767-3).
Figura 28
Peso bruto y número de operaciones por asamblea
Nota. De “Impact of material data in assembly delay prediction --a machine

learning‑based case study in machinery industry”, por Steinberg, F., Burggaef, P.,
Wagner, J., & Heinbach, B., 2022 (https://doi.org/10.1007/s00170-022-08767-3).
59
Evaluación e la aplicación modelo: En la fase de evaluación, los modelos aplicados
se evaluaron minuciosamente para comprobar si cumplen los objetivos de nuestro
enfoque de minería de datos. Cuantificación del impacto de los datos materiales en
la calidad de un modelo que predice retrasos en el inicio del ensamblaje.
En total, se analizó con éxito el impacto de los datos de materiales en la calidad de
los modelos que predicen los retrasos en el inicio del ensamblaje y brindamos
información sobre el rendimiento de diferentes enfoques de modelado. Con estos
resultados, lograron sus dos contribuciones principales: primero, desarrollar un
modelo para predecir los retrasos en el inicio del ensamblaje utilizando un enfoque
de clasificación de aprendizaje automático. En segundo lugar, identificaron que los
datos del material influyen en la calidad del modelo de un modelo que predice
retrasos en el inicio del ensamblaje. Sin embargo, solo hubo una ligera influencia.
Con sus hallazgos, para los futuros enfoques de aprendizaje automático en el área de
planificación y control de la producción, recomiendan considerar las fuentes de datos
además de las fuentes de datos utilizadas normalmente. Pudieron demostrar que
incluso las fuentes de datos atípicas pueden contribuir a una mejora del modelo.

Título:
Machine Learning Algorithm for Delay Prediction in IoT and Tactile Internet
(Algoritmo de aprendizaje automático para la predicción de retrasos en IoT e Internet
táctil).
Aporte:
La predicción del tráfico es un enfoque integral para garantizar los requisitos de
seguridad, confiabilidad y calidad de servicio (QoS). Hoy en día, se puede utilizar en
varias aplicaciones, como monitoreo de red, gestión de recursos, control de
congestión, asignación de ancho de banda de red, detección de intrusos en la red, etc.
enfoque de predicción anticipada con autorregresivo no lineal con red neuronal
recurrente habilitada para entrada externa (NARX). El aprendizaje máquina se
60
entrenó con cuatro funciones de entrenamiento diferentes: retro propagación de
regularización bayesiana (Trainbr), retro propagación de Levenberg-Marquardt
(Trainlm), retro propagación de gradiente conjugado con actualizaciones de Fletcher-
Reeves (Traincgf) y el algoritmo de retro propagación resiliente (Trainrp).
Proceso:
Modelos de salida pronosticados basados en el enfoque de predicción de k pasos con
respecto al algoritmo de entrenamiento de Trainbr.
Figura 29
Retraso según predicción
Nota. De “Machine Learning Algorithm for Delay Prediction in IoT and Tactile
Internet”, por Gondia, A., Siam, A., El-Dakhakhni, W., & Nassar, A. H., 2020
(https://doi.org/10.3390/fi13120304).
El mejor rendimiento de validación en caso de usar algoritmo Trainrp
61
Figura 30
Comparación de validación con valores reales
Nota. De “Machine Learning Algorithm for Delay Prediction in IoT and Tactile
Internet”, por Gondia, A., Siam, A., El-Dakhakhni, W., & Nassar, A. H., 2020
(https://doi.org/10.3390/fi13120304).
Este artículo propone métodos de aprendizaje máquina para la predicción de retrasos
en IoT y redes de Internet táctiles, utilizando el enfoque de predicción de k-pasos con
la técnica RNN habilitada para NARX. ANN fue entrenada utilizando cuatro
algoritmos diferentes: Trainbr, Traincgf, Trainlm y Trainrp, considerando la función
de pérdida de MSE como una medida de rendimiento para investigar qué modelo de
predicción proporciona una precisión óptima y una mejora promedio máxima. La
precisión de la predicción se midió en términos de RMSE y MAPE como medida de
la precisión de la predicción.

Título:
Machine learning approach for predicting production delays: a quarry company case
study (Enfoque de aprendizaje automático para predecir retrasos en la producción:
estudio de caso de una empresa de canteras).
62
Aporte:
Los autores proponen hacer uso de data analytics y maching learning para la
predicción de retrasos generando un modelo de red neuronal multicapas superando
algoritmos tales como árbol de decisión, red neuronal, bosque aleatorio y bayesianos
con una precisión del 97.9%.
Proceso:
Para la investigación se toma como estudio de caso a una empresa operativa de
construcción en Malasia con más de 40 años en la que se busca descubrir retrasos
potenciales para mejorar la eficiencia de este. Como datos se tomó información de
dos máquinas de producción en un periodo de 6 meses generando un punto de
referencia 4 modelos de aprendizaje automático:
• Árbol de decisión: Construye una decisión óptima para la predicción del objetivo.
• Red neuronal: Capaz de predecir un tipo de falla determinado.
• Bosque aleatorio: Construye árboles de decisión cuyo resultado se basa en votación.
• Bayesianos: Es eficiente y trabaja bien con datasets pequeños.
Para determinar la mejor opción se tomó en cuenta los siguientes factores: precisión,
exactitud y sensibilidad, tomando como resultado lo siguiente:
Figura 31
Comparación de técnicas de machine learning
Nota. De “Machine learning approach for predicting production delays: a quarry

company case study”, por Kannan, R., Abdul Halim, H. A., Ramakrishnan, K.,
Ismail, S., & Wijaya, D. R., 2022 (https://doi.org/10.1186/s40537-022-00644-w).
63
Para este caso el mejor modelo de predicción de retrasos es usando una red neuronal
(NN).
El uso de aprendizaje automático y análisis de datos ayuda a la predicción de retrasos
en una compañía para conseguir una producción más eficiente. Tomando como
referencia los datos de la empresa la mejor opción a usar es una red neuronal con una
precisión de 98% y una sensibilidad de 97.9%.
4.6 Conclusiones
En este punto se presentará un resumen detallado de cada categoría según el cuadro
presentado anteriormente.
4.6.1 Conclusiones de artículos de la categoría aprendizaje automático con retrasos

Dentro de la primera categoría seleccionada, la cual agrupa diferentes
investigaciones relacionadas al aprendizaje máquina, clasificador de kernel múltiple
profundo, redes bayesianas, arboles de decisión entre otros algoritmos para la
identificación y predicción de retrasos en casos de morosidad de pagos de hipotecas,
deudas de tarjetas de crédito e incluso tiempos de vuelos de aerolíneas.
Del estudio de estos trabajos, pueden concluirse que, el mejor algoritmo lo compone
las redes neuronales profundas porque pueden lograr tener una mayor predicción,
exactitud o una disminución en los márgenes de error si se tiene una gran muestra de
prueba en comparación a los otros algoritmos de ML.

Dentro de la segunda categoría seleccionada en las investigaciones se han aplicado
clasificación binaria para predecir tasa de pedidos atrasados la cual una llamada
LGBM tuvo una mejor precisión en otro artículo se ve que el modelo SVR tiene
buena predicción para tiempos de buses en rutas de tránsito y por ultimo los árboles
de decisión pueden ser muy informativos para llegar a un resultado específico.
64
Del estudio de estos trabajos de investigación, puede concluirse que, los algoritmos
de aprendizaje automático tienen mayor precisión y predicción para obtener
resultados ya sea desde pedidos, manufactura hasta analizar los tiempos de buses en
ruta.
4.6.3 Conclusiones de artículos de la categoría predicción con retrasos

En la tercera categoría de filtro de búsqueda de artículos de investigación el cual
implica la predicción de retrasos, se obtuvo como objetivo principal generar un
modelo capaz de superar a los modelos de investigaciones pasadas. Entre los cuales
podemos destacar mejoras como mayor precisión en datos de referencia, precisión
para determinar si un proyecto va a terminar a tiempo o termina tarde, predicción del
retraso del tiempo de combustión mediante operadores condicionales, predecir los
retrasos de los vuelos usando regresión de vectores de soporte, predicción de retrasos
en trenes.
4.6.4 Conclusiones de artículos de la categoría aprendizaje automático con predicción con

retrasos
En esta categoría, la cual agrupa la predicción de retrasos mediante el uso de
aprendizaje máquina tales como redes neuronales, redes bayesianas, bosque
aleatorio, árbol de decisión, se puede concluir que cuenta como propósito principal
desarrollar un modelo que permita predecir un objeto. Entre los trabajos de
investigación se obtuvo la predicción de retrasos en el ensamblaje consiguiendo una
leve mejora en el proceso. También se aplicaron modelos de aprendizaje máquina
para predecir retrasos en IoT y redes de internet táctiles y retrasos en una compañía
para conseguir una producción más eficiente. De esto se puede inferir que la
resolución de estos modelos puede ser aplicado en diversos ámbitos de negocio,
aunque no es una gran mejora se consigue optimizar los recursos.
4.6.5 Conclusiones generales

Luego de filtrar y procesar los artículos de investigación por categorías y previa
selección se puede concluir que un factor determinante en las generaciones de
modelos de aprendizaje máquina es la fuente de datos y la clasificación de esta. De
65
esta manera, al contar con más información y factores que segmentan la misma se
puede obtener un mejor resultado o precisión.
Asimismo, se observa la propuesta de modelos de aprendizaje con variaciones o

mezclas generando un modelo final con mayor efectividad a la hora de generar
resultados que los modelos genéricos. Dichos modelos, como se ha estudiado
anteriormente, pueden ser aplicados en distintos sectores.
Finalmente, el algoritmo a entrenar es un factor importante para optar por un modelo

competente que supere las expectativas de un trabajo de investigación en este ámbito.
66
5 DESARROLLO DEL PROYECTO
En el presente capítulo se mostrará los procedimientos seguidos para poder concluir de
manera exitosa el desarrollo de nuestra propuesta de proyecto en su totalidad. Asimismo, se
comparten gráficos y tablas para mostrar lo desarrollado a lo largo del proyecto.
67
5.1 Análisis de algoritmos de inteligencia artificial
En la siguiente tabla se detalla una lista de métricas para evaluar el rendimiento predictivo
de una red neuronal profunda (DNN) para identificar personas que presentan retrasos al
pagar una tarjeta de crédito. Se hizo una validación cruzada con los siguientes algoritmos de
machine learning:
• Una red neuronal artificial con una sola capa oculta y un número comparativo de
neuronas (ANN).
• Técnicas de regresión logística.
• Naive Bayes
• Arboles de decisión
Tabla 9
Comparación de algoritmos de machine learning y deep learning
Red Red Árbol de
Métricas Naive Regresión
Neuronal neuronal decisión
Bayes Logística
Profunda artificial (J48)
Precisión General
0.9959 0.9941 0.6428 0.9949 0.9944
(Exactitud)
Predicción 0.6053 0.5521 0.8677 0.5770 0.4527
Precisión 0.9009 0.7291 0.0217 0.8047 0.9080
Especificidad 0.9994 0.9981 0.6407 0.9987 0.9996
Tasa de Falsos
0.3947 0.4479 0.1323 0.4230 0.5473
Positivos
Tasa de Falsos
0.0006 0.0019 0.3593 0.0013 0.0004
Negativos
Nota. Información al 23 de febrero de 2023. Adaptado de Predicting credit card
delinquencies: An application of deep neural networks. de Sun, T., & Vasarhelyi, M. 2018.
(https://doi.org/10.1002/isaf.1437)
Como se muestra en la tabla, la red neuronal profunda tiene una precisión general del 99,59%
más alta que la red neuronal artificial y regresión logística. Además, se consideró un
conjunto de métricas adicionales.
68
La especificidad, denominada tasa de verdaderos negativos (TNR), mide la proporción de
negativos que se identifican correctamente como tales. En este caso, es el porcentaje de
personas legítimas que están identificados como no morosos. El TNR de la red neuronal
profunda es 0.9994 que es el segundo puntaje más alto de todos los algoritmos. Este resultado
muestra que el clasificador DNN funciona de manera excelente en la correcta identificación
de clientes legítimos. El árbol de decisión tiene una TNR ligeramente superior 0.9996. ANN
y la regresión logística tienen una alta puntuación de especificidad. Sin embargo, Naive
Bayes tiene un TNR bajo 0.6407. Esto significa que muchos clientes legítimos son
erróneamente identificados por el modelo de Bayes como morosas.
La tasa de falsos positivos (FNR) es la proporción de positivos que se identifican

incorrectamente como negativos. Un FNR de 0.3947 en el DNN indica que el clasificador
no detecta el 39,58% de los clientes morosos. Ésta es la segunda puntuación más baja. La
puntuación más baja es 0.1323 generada por Naive Bayes. Hasta ahora, parece que el modelo
de Bayes tiende a considerar todas las observaciones como predeterminadas debido al bajo
nivel de TNR y FNR.
La tasa de falsos positivos (FPR) es la proporción de negativos que se clasifican

incorrectamente como positivos. En la tabla podemos ver que la tasa de error del árbol de
decisión es de 0.04%, la cual es mejor que la de la DNN 0.06%. Esto sugiere que es poco
probable que estas dos identifiquen un cliente normal como problemático.
La precisión es (verdaderos positivos)/((verdaderos positivos +falsos positivos)) y

predicción es (verdaderos positivos)/((verdaderos positivos +falsos negativos)) , son dos
medidas importantes para la capacidad del clasificador en detectar a clientes que presenten
demora en los pagos. La precisión mide el porcentaje de morosidad real en todos los clientes.
La puntuación de precisión de DNN 0.9009 es inferior al del árbol de decisión, pero, superior
a los otros algoritmos. En efecto, el modelo de Bayes recibe una puntuación extremadamente
baja de 0.0217. Este numero muestra que aproximadamente todos los clientes morosos
percibidos son en realidad clientes legítimos.
69
Por otro lado, ¿cuántos de los clientes morosos son identificados satisfactoriamente por el
clasificador?, a esto se denomina sensibilidad o tasa positiva verdadera, que se puede
considerar como una medida de integridad de un clasificador. La puntuación de predicción
de la DNN es 0.6053, la puntuación más alta de todos los modelos excepto de Naive Bayes.
Este número significa que el 39,47% de los clientes morosos no son identificados por este
modelo, lo cual es consistente con el resulta de FNR.
5.2 Propuesta de red neuronal
5.2.1 Plataforma de implementación de la red neuronal
Tabla 10
Tecnologías de IA para redes neuronales
Tecnologías de inteligencia artificial para redes neuronales profundas
Características
Vertex AI (Google Cloud
Amazon SageMaker
Platform)
Apache MXNet, Chainer,

Hugging Face, Pytorch,
PySpark, Pytorch, TensorFlow,
Frameworks Reinforcement Learning, Scikit-
XGBoost
Learn, SparkML Serving,
TensorFlow, XGBoost
Seguridad de la
Sí Sí
información
13 USD/mes - Studio Notebooks 20 USD/mes - Vertex AI
6 USD/mes – Training Training
Precios
39 USD/mes - Real Time 22 USD/mes - Vertex AI
Inference Prediction
En la comparación realizada se optó por la solución Vertex AI (Google Cloud Platform) ya

que es la más adecuada para la implementación de la red neuronal profunda debido al menor
costo mensual en comparación de la solución ofrecida por Amazon.
5.2.2 Diseño de la red neuronal profunda
70
Se elige una red neuronal profunda ya que en la comparación realizada con otros algoritmos
de machine learning tiene una mayor precisión. A continuación, se detalla la estructura de la
red neuronal y sus configuraciones, las cuales fueron obtenidas de la siguiente investigación
“Predicting credit card delinquencies: An application of deep neural networks” (Sun y
Vasarhelyi 2018):
Figura 32
Estructura de una red neuronal profunda
Tabla 11
Configuración de una red neuronal profunda
Distribución inicial de
Capas N° de neuronas Tipo
pesos/Función de activación
1 322 Entrada Uniforme
2 175 Oculta Rectifier
5 2 Salida Sigmoid (Binary prediction)
71
Nota. De “Predicting credit card delinquencies: An application of deep neural networks”,
por Sun y Vasarhelyi, 2018.
Numero de Épocas: 10
Funciones de Pérdida: Descenso del gradiente y Momentum
5.2.3 Datos de prueba

Para el conjunto de datos para la red neuronal está dividido en 2 grupos: servicios sin
demoras y servicios con demora.
Tabla 12
Estructura de la data
Técnico Vehículo Servicio
Edad
Marca
Años de experiencia
Modelo
Género Duración del servicio
Años de fabricación
Número de servicios
Tipo de transmisión
atendidos
Tabla 13
Datos de ingreso
Técnico Vehículo
Marca
Edad
Modelo
Años de experiencia
Año de fabricación
Género
Tipo de transmisión
Tabla 14
Datos de salida
Valor Significado
0 No presentará demora
1 Si Presentará demora
72
5.3 Arquitectura de capas
La solución web propuesta se encuentra establecido mediante una arquitectura de 3 capas
(negocio, tecnología y aplicación), las cuales se detallan a continuación:
5.3.1 Capa de negocio
En este nivel podemos ver el flujo principal identificando los roles principales desde la
entrega del vehículo a recibir mantenimiento hasta la salida del mismo.
Figura 33
Capa de negocio de la solución web integrada a una red neuronal
Nota. El diagrama muestra los actores principales y las actividades que realizan para llevar
a cabo la función de mantenimiento de vehículos.
73
5.3.2 Capa de aplicación y tecnología
En este nivel identificamos todos los componentes que se incluyen en los sevidores cloud de
la red neuronal y la aplicación web.
Figura 34
Diagrama de componentes del servidor cloud de la red neuronal
Nota. El diagrama muestra los componentes de una red neuronal en Google que intervienen
en el manejo de información para la predicción de datos.
Figura 35
Diagrama de componentes del servidor de la aplicación web
Nota. El diagrama muestra los componentes que intervienen en el flujo de la solución web
desde la autenticación hasta la solicitud de información para realizar la predicción.
74
Figura 36
Diagrama de componentes del servidor de base de datos
Nota. El diagrama muestra los componentes que intervienen en el flujo de datos enviados
desde la plataforma web y almacenados en la base de datos según los esquemas y tablas
indicados.
75
Figura 37
Diagrama de componentes del servidor de base de datos
Nota. El diagrama muestra el flujo entre las tres capas para determinar el tiempo que demora en realizar el mantenimiento de un vehículo.
76
5.4 Gestión del Proyecto
Actualmente la empresa del sector automotriz no cuenta con área de sistema o desarrollo.
Por tal motivo se contempla en proponer dicha área para la realización del proyecto
utilizando lo mejor de cada marco ágil (Scrum y Kanban).
5.4.1 Marco de metodología ágil

Según Atlassian (2023):
Scrum: El marco de trabajo de scrum es heurístico. Se basa en el aprendizaje continuo
y en la adaptación a los factores fluctuantes. Reconoce que el equipo no lo sabe todo
al inicio de un proyecto y evolucionará a través de la experiencia. Scrum está
estructurado para ayudar a los equipos a adaptarse de forma natural a las condiciones
cambiantes y a los requisitos de los usuarios, con el cambio de prioridades integrado
en el proceso y ciclos de lanzamiento breves para que el equipo pueda aprender y
mejorar constantemente.
También, según Atlassian (2023):
Tablero kanban: Es una herramienta que se usa para visualizar las tareas y optimizar
el flujo de trabajo entre los miembros del equipo. Aunque los tableros físicos gozan
de popularidad entre algunos equipos, los tableros virtuales constituyen una función
esencial de cualquier herramienta de desarrollo de software ágil para garantizar la
trazabilidad, la colaboración sencilla y la accesibilidad desde varias ubicaciones.
77
5.4.2 Iniciativa, Épicas e Historias de usuario
Según Atlassian (2023):
Esta ofrece una guía de gestión ágil de proyectos, la cual es una forma iterativa de gestionar los proyectos de desarrollo de software
que se basa en realizar entregas de forma continua y en integrar el feedback del cliente con cada iteración. Los equipos de software que
aplican las metodologías ágiles en la gestión de proyectos aumentan su velocidad de desarrollo, expanden la colaboración y fomentan
la capacidad de responder mejor a las tendencias del mercado.
78
Figura 38
Iniciativa, épicas e historias de usuario
Aumentar en un 10% el
número de servicio de
Iniciativa mantenimiento preventivos
atendidos
Crear una página web para Integrar una red neuronal profunda
Épicas visualizar los servicios de para identificar posibles demoras en
mantemiento los servicios
Historias de usuario HU-01 HU-02 ... HU-06 ...
79
5.4.2.1 Product & Sprint Backlog
A continuación, se describirán las historias de usuario a realizar en el proyecto, cada Sprint
tiene una duración de 8 días.
Tabla 15
Product backlog
Código Descripción
Como usuario deseo una opción en la página web, para registrar las ordenes de
HU-01
trabajo de los servicios de mantenimiento.
Como usuario deseo una opción en la página, para registrar las órdenes de
HU-02
compra de repuestos de los servicios de mantenimiento.
Como usuario deseo una opción en la página, para registrar a los técnicos que
HU-03
realizan el servicio de mantenimiento.
Como usuario deseo poder visualizar los servicios de mantenimiento en proceso
HU-04
para poder saber la capacidad de trabajo diario.
Como usuario deseo una opción página web, para registrar los repuestos de los
HU-05
servicios de mantenimiento.
Como usuario deseo poder visualizar los servicios de mantenimiento preventivo
HU-06 que posiblemente tengan retrasos para poder reasignar la carga de trabajo
diaria.
Como usuario deseo poder visualizar un “dashboard” para obtener métricas y
HU-07
comparar KPIs.
Como usuario deseo poder iniciar sesión en la página web para poder guardar
HU-08
mis propias configuraciones.
Como usuario deseo pode agregar otros usuarios para poder asignarles distintos
HU-09
roles.
Como usuario deseo poder ver distintos mockups de una página web para poder
HU-10
elegir la más intuitiva y fácil de usar.
80
Tabla 16
Sprint 1
Como usuario deseo poder iniciar sesión en la página web para poder guardar
HU-08
mis propias configuraciones.
Como usuario deseo pode agregar otros usuarios para poder asignarles distintos
HU-09
roles.
Como usuario deseo poder ver distintos mockups de una página web para poder
HU-10
elegir la más intuitiva y fácil de usar.
Tabla 17
Sprint 2
Como usuario deseo una opción en la página, para registrar a los técnicos que
HU-03
realizan el servicio de mantenimiento.
Como usuario deseo una opción en la página web, para registrar las ordenes de
HU-01
trabajo de los servicios de mantenimiento.
Tabla 18 Sprint 3
Como usuario deseo una opción en la página, para registrar las órdenes de
HU-02
compra de repuestos de los servicios de mantenimiento.
Como usuario deseo una opción en la página web, para registrar los repuestos
HU-05
de los servicios de mantenimiento.
Tabla 19
Sprint 4
Como usuario deseo poder visualizar los servicios de mantenimiento en proceso
HU-04
para poder saber la capacidad de trabajo diario.
Como usuario deseo poder visualizar los servicios de mantenimiento preventivo
HU-06 que posiblemente tengan retrasos para poder reasignar la carga de trabajo
diaria.
81
Tabla 20
Sprint 5
Como usuario deseo poder visualizar un dashboard para obtener métricas y
HU-07
comparar KPIs.
5.4.2.2 Tablero Kanban

Se usarán las siguientes columnas como parte del ciclo de desarrollo del software
Figura 39
Tablero Kanban
Nota. Proceso del desarrollo de la solución web.
5.4.2.3 Cotización de la propuesta

El proyecto contará con una página administrativa donde se podrá realizar lo siguiente:
• CRUD
o Listado
o Detalle
o Crear
o Editar
o Activar/Desactivar
82
Backend y Web Admin
• Autenticación
o Login (Usuarios)
o Recuperar contraseña (Envío de correo)
• Usuarios
o CRUD
• Técnicos
o CRUD
o Horario de disponibilidad
• Órdenes de trabajo
o CRUD
• Servicios
o CRUD
▪ Mostrar en Web
• Clientes
o Listado
o Detalle
o Editar
o Activar/Desactivar
Frontend y Web Usuario

• Autenticación
o Login (Usuarios)
o Recuperar contraseña (Envío de correo)
• Técnicos
o Lista de técnicos
• Servicios
o Lista de servicios
o Detalle de Servicios
o Tablero de Servicios
• Home y Vistas Informativas
o Vista de Landing de la Web
o Dashboard
Red Neuronal
• Diseño
o Datos de entrada
o Datos de salida
o Configuración de la red neuronal
• Construcción
83
Tabla 21
Horas diseñador
Módulo Tiempo (Horas)

Wireframes 8
Mockups 8
Prototipos 12
Total 28
Tabla 22
Horas backend

Autenticación 6
Usuarios 8
Técnicos 15
Servicios 15
Clientes 8
Órdenes de trabajo 15
Total 67
Tabla 23
Horas IA

Diseño 10
Construcción 20
Total 30
Tabla 24
Horas analista de datos
Dashboard 15
Datos de red neuronal 8
Total 23
84
Tabla 25
Horas frontend

Autenticación 9
Home y Vistas informativas 40
Técnicos 15
Servicios 15
Clientes 10
Órdenes de trabajo 15
Total 104
Tabla 26
Horas analista de pruebas

Pruebas de integración 25
5.4.3 Herramientas y tecnologías

Tabla 27
Herramientas y tecnologías
Herramientas/Framework Descripción
Front-End React simplifica la creación de interfaces de

usuario interactivas al permitir diseñar vistas
simples para cada estado de la aplicación.
React se encarga de actualizar y renderizar
los componentes de manera eficiente cuando
los datos cambian, lo que facilita la gestión
de las actualizaciones en la interfaz de
usuario.
Back-End Nest (NestJS) es un framework que se utiliza

para desarrollar aplicaciones escalables y
eficientes en el lado del servidor utilizando
Node.js. Se basa en JavaScript progresivo, y
es compatible con TypeScript. El framework
combina características de la Programación
Orientada a Objetos, la Programación
Funcional y la Programación Reactiva
Funcional.
85
Base de Datos MySQL es un sistema de gestión de bases de
datos relacionales de código abierto, el cual
está respaldado por Oracle y utiliza el
lenguaje de consulta estructurado (SQL).
Puede ser utilizado en prácticamente todas
las plataformas, incluyendo Linux, UNIX y
Windows. Aunque es apto para diversas
aplicaciones, MySQL es comúnmente
asociado con aplicaciones web y
publicaciones en línea.
IA Keras es una biblioteca de alto nivel que

proporciona una API para acceder a las
funcionalidades de la biblioteca tensorflow,
utilizada para crear modelos de aprendizaje
profundo a nivel de bajo nivel. Al combinar
ambas bibliotecas, es posible crear de forma
sencilla redes neuronales complejas,
especificando todos los elementos que las
componen, desde la estructura física de la
red en capas hasta las funciones de
activación, los criterios de evaluación y otras
funcionalidades.
QA Selenium es un marco de pruebas de

software para aplicaciones web. Proporciona
una herramienta de grabación/reproducción
para crear pruebas sin necesidad de utilizar
un lenguaje de scripting para pruebas
(Selenium IDE). Además, incluye un
lenguaje específico de dominio para pruebas
(Selenese) que permite escribir pruebas en
varios lenguajes de programación populares
como Java, C#, Ruby, Groovy, Perl, PHP y
Python. Las pruebas pueden ejecutarse en la
mayoría de los navegadores web modernos
en diferentes sistemas operativos, como
Windows, Linux y OSX.
86
5.5 Interfaces de la solución web
Figura 40
Interfaz de inicio de sesión a la plataforma web
Figura 41
Interfaz de registro de usuario
87
Figura 42
Interfaz de registro de la orden de trabajo
Figura 43
Interfaz de estado actividades según su estado
88
5.6 Atributos de Calidad
Se ponderan las características de calidad para el proyecto de software según la normativa
ISO/IEC 25010, según la estructura siguiente:
Tabla 28
Lista de atributos de calidad
Características Clasificación Valor Peso % Justificación
La aplicación debe contemplar

Funcionalidad Alta 9 0.20 20% las funcionalidades de las tareas
identificadas
La aplicación implementada
Desempeño Alta 8 0.20 20% debe brindar un alto desempeño
en el tiempo de ejecución de la
web y la red neuronal
Usabilidad Alta 7 0.10 10% La aplicación debe ser intuitiva

y de fácil uso
La aplicación debe contener

Seguridad Alta 8 0.10 10% certificados SSL en la
interacción de sus componentes
(cliente – servidor)
La aplicación debe trabajar la

Fiabilidad Alta 8 0.15 15% mayoría del tiempo y sin
errores (Infraestructura cloud 6
días/8 horas)
Al implementar una
infraestructura Cloud se separa
Mantenibilidad Media 6 0.10 10% los componentes (web – base
de datos – red neuronal) para no
generar dependencia entre
estos.
La aplicación web coexiste con

Compatibilidad Baja 3 0.10 10% los servicios de la red neuronal
y los servicios conectados a la
base de datos
La solución web solo se va a

Portabilidad Baja 1 0.05 5% usar en un navegador web de
escritorio.
Total 50 1.00 100%
89
5.7 Costo
5.7.1 Hardware
Para el presente proyecto se utilizarán los siguientes equipos de hardware
Tabla 29
Costo de hardware
Recurso Cantidad Precio ($)
PC para el desarrollo 6 1200.00

Total 7200.00
5.7.2 Costos Cloud y Software

Tabla 30
Costo de cloud service
Servicios cloud
Características
Amazon Web Services Google Cloud Platform
Instancia para EC2 vCPUs: 1 compute engine vCPUs: 1
la web RAM: 3.75GB RAM: 3.75GB
Precios 7,86 USD/mes 9,91 USD/mes
RDS para MySQL cloud SQL para MySQL
Base de datos
instancia: db.t4g.micro instancia: db-f1-micro
MySQL
HDD almacenamiento: 150 GB HDD almacenamiento: 150 GB
Precios 36,54 USD/mes 15,96 USD/mes
Storage cloud storage almacenamiento:
S3 almacenamiento: 50GB
(Imágenes) 50GB
Precios 1,16 USD/mes 1 USD/mes
Total 45,56 USD/mes 26,87 USD/mes
En base a los puntos mencionados anteriormente, los servicios de Google Cloud Platform,
es la más adecuada para la implementación de la parte web y base de datos debido al menor
costo que ofrecen.
90
Para estimar el costo total de la infraestructura total se tomó la duración total del proyecto
45 𝑑𝑖𝑎𝑠 ≅ 2,5 𝑚𝑒𝑠𝑒𝑠.
Tabla 31
Costo de recursos
Recurso Precio ($) /mes Meses Total ($) /mes

Vertex AI Prediction 22,00 2,50 55,00
Vertex AI Training 20,00 2,50 50,00
Google Compute Engine 9,91 2,50 24,78
Cloud SQL (MySQL) 15,96 2,50 39,90
Storage 1,00 2,50 2,50
Total 172,18
5.7.3 Honorarios del personal

Tabla 32
Costo de roles
#N Rol Días Costo por día ($) Total

1 Scrum Master 45 40,00 1.800,00
2 Diseñador 20 25,00 500,00
3 Analista de datos 10 28,00 280,00
4 Desarrollador IA 10 100,00 1.000,00
5 Desarrollador de front-end 45 30,00 1.350,00
6 Desarrollador de back-end 45 35,00 1.575,00
7 QA 45 28,00 1.260,00
Total 7.765,00
Nota. Los precios fueron obtenidos por PayLab (https://www.paylab.com/pe/salaryinfo).
91
5.7.4 Costos generales
Tabla 33
Costo general
Tipo de costo Precio ($)

Hardware 7.200,00
Infraestructura y Software 172,18
Honorarios 7.765,00
Subtotal 15.137,18
Presupuesto de contingencia (10% total) 1.513,72
Total 16.650,89
5.7.5 Costos de Mantenimiento por año

Tabla 34
Costo de mantenimiento
Tipo de costo Precio ($) /Año

Infraestructura y Software 322,44
Mantenimiento web 600,00
Total 922,44
92
6 VALIDACIÓN DE LA PROPUESTA
6.1 Validación de factibilidad económica
6.1.1 Análisis de ganancia de la empresa
La empresa del sector automotriz tiene tres principales fuentes de rentabilidad:
• Servicios de mantenimiento preventivos

• Servicios de mantenimiento correctivos
• Servicios de mantenimiento predictivos
De las tres en este caso solo se va a abordar la ganancia generada por los servicios de
mantenimiento preventivos. Actualmente la empresa tiene la capacidad de atender a 91
vehículo por mes sin embargo el 16,67% presenta demoras en la entrega de los autos hacia
los clientes.
Tabla 35
Datos generales de flujo de autos
Datos Promedio Mínimo máximo

Autos totales por día 3,50 3,00 4,00
Autos totales por mes (26 días hábiles) 91,00
Autos con retraso por semana 3,50 3,00 4,00
Autos con retraso por mes 15,17
Costo de mantenimiento S/ 450,00 S/ 300,00 S/ 600,00
Ganancia de mantenimiento S/ 75,00 S/ 50,00 S/ 100,00
De 91 Ordenes de trabajo de la empresa se pudo verificar el porcentaje de vehículo que

presentan demoras cuando se realiza un servicio de mantenimiento preventivo.
Con la precisión de la red neuronal se espera reducir el número de autos con retraso con una
precisión de 99,59%.
93
Tabla 36
Ganancias por mes
Datos Sin solución web Con solución web Diferencia
Autos totales por mes 237.00 237.00
Autos con retraso por mes 40.00 0.16
Autos con mantenimiento por mes 197.00 236.84
Ingreso total por mes S/ 88,650.00 S/ 106,576.20 S/ 17,926.20
Ganancia por mes S/ 14,775.00 S/ 17,762.70 S/ 2,987.70
Aplicando esta solución web la empresa incrementaría su ganancia en S/ 1.132,84 por mes.
6.1.2 Recuperación de la inversión

La empresa realiza todos sus pagos en soles, por ello, el costo del proyecto es:
$16,650.00 × 𝑡𝑎𝑠𝑎 𝑑𝑒 𝑐𝑎𝑚𝑏𝑖𝑜 (3,84) = 𝑆/ 63.939,41
Calculamos el tiempo de recuperación de inversión en meses con la siguiente fórmula:

𝑚𝑜𝑛𝑡𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑖𝑛𝑣𝑒𝑟𝑠𝑖ó𝑛
𝑡𝑖𝑒𝑚𝑝𝑜 𝑑𝑒 𝑟𝑒𝑐𝑢𝑝𝑒𝑟𝑎𝑐𝑖ó𝑛𝑚𝑒𝑠𝑒𝑠 =
𝑎𝑢𝑡𝑜𝑠 𝑐𝑜𝑛 𝑑𝑒𝑚𝑜𝑟𝑎 × 𝑟𝑒𝑛𝑡𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒𝑙 𝑠𝑒𝑟𝑣𝑖𝑐𝑖𝑜
63.939,41
𝑡𝑖𝑒𝑚𝑝𝑜 𝑑𝑒 𝑟𝑒𝑐𝑢𝑝𝑒𝑟𝑎𝑐𝑖ó𝑛𝑚𝑒𝑠𝑒𝑠 = = 56,20 ≅ 57 𝑚𝑒𝑠𝑒𝑠
15,17 × 75,00
Tomando en cuenta el 16,67% de vehículo que se agregarían mensualmente para realizar

un servicio de mantenimiento preventivo, se estaría recuperando la inversión en un plazo
de 57 meses sin contar el costo de mantenimiento anual de la solución web.
6.1.3 Análisis de VAN y TIR

El flujo de caja que tendrá la empresa con solo realizar los servicios de mantenimiento
preventivos obtenidos por la Red neuronal profunda es de 15,17 autos por mes
Por año:
𝐺𝑎𝑛𝑎𝑛𝑐𝑖𝑎 12 𝑚𝑒𝑠𝑒𝑠 = 𝑛° 𝑎𝑢𝑡𝑜𝑠 𝑑𝑒 𝑙𝑎 𝐼𝐴 × 𝑔𝑎𝑛𝑎𝑐𝑖𝑎 𝑝𝑜𝑟 𝑎𝑢𝑡𝑜 × 12
𝐺𝑎𝑛𝑎𝑛𝑐𝑖𝑎 12 𝑚𝑒𝑠𝑒𝑠 = 15,17 × 𝑆/ 75,00 × 12
𝐺𝑎𝑛𝑎𝑛𝑐𝑖𝑎 12 𝑚𝑒𝑠𝑒𝑠 = 𝑆/ 13.653,00
94
Costo de mantenimiento de la infraestructura web por año:
𝑀𝑎𝑛𝑡𝑒𝑛𝑖𝑚𝑖𝑒𝑛𝑡𝑜 12 𝑚𝑒𝑠𝑒𝑠 = $ 922,44 × 3,84 = 𝑆/ 3.542,17
Flujo de caja:
𝐹𝑙𝑢𝑗𝑜 𝑑𝑒 𝑐𝑎𝑗𝑎 = 𝐺𝑎𝑛𝑎𝑛𝑐𝑖𝑎 12 𝑚𝑒𝑠𝑒𝑠 − 𝑀𝑎𝑛𝑡𝑒𝑛𝑖𝑚𝑖𝑒𝑛𝑡𝑜 12 𝑚𝑒𝑠𝑒𝑠
𝐹𝑙𝑢𝑗𝑜 𝑑𝑒 𝑐𝑎𝑗𝑎 = 𝑆/ 13.653,00 − 𝑆/ 3.542,17
𝐹𝑙𝑢𝑗𝑜 𝑑𝑒 𝑐𝑎𝑗𝑎 = 𝑆/ 10.110,83
Fórmula para el cálculo del VAN:

𝑛
𝐹𝑡
𝑉𝐴𝑁 = ∑ − 𝐼0
(1 + 𝑘)𝑡
𝑡=1
De “Van y TIR: Concepto, diferencias y cómo calcularlos”, por Ramírez, Pedro, 2022
(https://economia3.com/van-tir-concepto-diferencias-como-calcularlos/).
• La inversión inicial para realizar (𝐼0 ).

• Los flujos de caja futuros ya sean positivos o negativos (𝐹𝑡 ).
• La tasa de descuento o el tipo de interés mínimo esperado (k).
• VAN = 0. Sí el resultado es igual a cero (0), se determina que el proyecto no dará
ganancias ni perdidas, o sea, es indiferente.
• VAN > 0. Cuando el valor obtenido es mayor a cero (0) se asume que el proyecto
será rentable.
• VAN < 0. Si el valor obtenido es menor a cero (0) se considera el proyecto no
viable.
Fórmula para el cálculo de la TIR

𝑛
𝐹𝑛
𝑇𝐼𝑅 = ∑ =0
(1 + 𝑖)𝑛
𝑡=0
De “Van y TIR: Concepto, diferencias y cómo calcularlos”, por Ramírez, Pedro, 2022
(https://economia3.com/van-tir-concepto-diferencias-como-calcularlos/).
95
En donde:
• 𝐹𝑛 es el flujo de caja en el periodo n.
• n es el número de períodos.
• i es el valor de la inversión inicial.
• Si la TIR es < tasa de descuento se determina que el proyecto debe ser rechazado.
• Si la TIR es > tasa de descuento entonces el proyecto será viable y puede ser
aprobado.
• En el caso de que la TIR = 0, el proyecto en principio debe ser rechazado. Es cierto,
que desde el punto de vista estratégico puro, se podría decidir invertir, pero a nivel
financiero no compensa asumir dicho riesgo.
La Tasa de descuento anual será de 7,05% ya que es el interés que ofrece un banco en un
depósito a largo plazo.
Tabla 37
VAN y TIR por año
Años Flujo caja

VAN TIR
0 -S/ 63.939,41
1 S/ 10.110,83 -S/ 54.494,45 -84,19%
2 S/ 10.110,83 -S/ 45.671,51 -51,55%
3 S/ 10.110,83 -S/ 37.429,62 -29,70%
4 S/ 10.110,83 -S/ 29.730,51 -16,10%
5 S/ 10.110,83 -S/ 22.538,45 -7,35%
6 S/ 10.110,83 -S/ 15.820,04 -1,48%
7 S/ 10.110,83 -S/ 9.544,08 2,61%
8 S/ 10.110,83 -S/ 3.681,44 5,54%
9 S/ 10.110,83 S/ 1.795,11 7,71%
10 S/ 10.110,83 S/ 6.910,99 9,34%
11 S/ 10.110,83 S/ 11.689,95 10,58%
12 S/ 10.110,83 S/ 16.154,18 11,56%
Según el resultado de la VAN > 0 en el año 9, esto quiere decir que el proyecto no dará
ganancias en menos de 9 años.
Según el resultado de la TIR > tasa de descuento se da en el año 9, esto quiere decir que el
proyecto será viable después de esa cantidad de años.
96
6.1.4 Recuperación de la inversión en un plazo de dos años
Costo total por dos años:
𝐶𝑜𝑠𝑡𝑜 𝑑𝑒𝑙 𝑝𝑟𝑜𝑦𝑒𝑐𝑡𝑜 + 2 𝑎ñ𝑜𝑠 × 𝐶𝑜𝑠𝑡𝑜 𝑚𝑎𝑛𝑡𝑒𝑛𝑖𝑚𝑖𝑒𝑛𝑡𝑜 𝑎𝑛𝑢𝑎𝑙
𝑆/ 63.939,41 + 2 × 𝑆/ 3.542,17 = 𝑆/ 71.023,75
Calculamos el número de autos con demora por mes con la siguiente fórmula:
𝑚𝑜𝑛𝑡𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑖𝑛𝑣𝑒𝑟𝑠𝑖ó𝑛
𝑎𝑢𝑡𝑜𝑠 𝑐𝑜𝑛 𝑑𝑒𝑚𝑜𝑟𝑎 =
𝑡𝑖𝑒𝑚𝑝𝑜 𝑑𝑒 𝑟𝑒𝑐𝑢𝑝𝑒𝑟𝑎𝑐𝑖ó𝑛𝑚𝑒𝑠𝑒𝑠 × 𝑟𝑒𝑛𝑡𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒𝑙 𝑠𝑒𝑟𝑣𝑖𝑐𝑖𝑜
71.023,75
𝑎𝑢𝑡𝑜𝑠 𝑐𝑜𝑛 𝑑𝑒𝑚𝑜𝑟𝑎 = = 39,46 ≅ 40 𝑎𝑢𝑡𝑜𝑠
24 × 75,00
Calculamos el número total de autos por mes:

16,67% × 𝑎𝑢𝑡𝑜𝑠 𝑡𝑜𝑡𝑎𝑙 = 𝑎𝑢𝑡𝑜𝑠 𝑐𝑜𝑛 𝑑𝑒𝑚𝑜𝑟𝑎
𝑎𝑢𝑡𝑜𝑠 𝑐𝑜𝑛 𝑑𝑒𝑚𝑜𝑟𝑎
𝑎𝑢𝑡𝑜𝑠 𝑡𝑜𝑡𝑎𝑙 =
16,67%
40
𝑎𝑢𝑡𝑜𝑠 𝑡𝑜𝑡𝑎𝑙 =
16,67%
𝑎𝑢𝑡𝑜𝑠 𝑡𝑜𝑡𝑎𝑙 = 236,71 ≅ 237 𝑎𝑢𝑡𝑜𝑠
Tabla 38
Ganancias por año óptimo
Datos Sin solución web Con solución web Diferencia
Autos totales por mes 237,00 237,00
Autos con retraso por mes 40,00 0,16
Autos con mantenimiento por mes 197,00 236,84
Ingreso total por mes S/ 88.650,00 S/ 106.576,20 S/ 17.926,20
Ganancia por mes S/ 14.775,00 S/ 17.762,70 S/ 2.987,70
Flujo de caja anual:

𝐹𝑙𝑢𝑗𝑜 𝑑𝑒 𝑐𝑎𝑗𝑎 = 𝐺𝑎𝑛𝑎𝑛𝑐𝑖𝑎 12 𝑚𝑒𝑠𝑒𝑠 − 𝑀𝑎𝑛𝑡𝑒𝑛𝑖𝑚𝑖𝑒𝑛𝑡𝑜 12 𝑚𝑒𝑠𝑒𝑠
𝐹𝑙𝑢𝑗𝑜 𝑑𝑒 𝑐𝑎𝑗𝑎 = 𝑆/ 35.852,40 − 𝑆/ 3.542,17
𝐹𝑙𝑢𝑗𝑜 𝑑𝑒 𝑐𝑎𝑗𝑎 = 𝑆/ 32.310,23
97
Análisis de VAN y TIR
La Tasa de descuento anual será de 7,05% ya que es el interés que ofrece un banco en un
depósito a largo plazo.
Tabla 39
VAN y TIR óptimo
Años Flujo caja VAN TIR
0 -S/ 63.939,41
1 S/ 32.310,23 -S/ 33.757,04 -49,47%
2 S/ 32.310,23 -S/ 5.562,39 0,71%
3 S/ 32.310,23 S/ 20.775,45 24,08%
Según el resultado de la VAN > 0 en el año 3, esto quiere decir que el proyecto no dará
ganancias en menos de 3 años.
Según el resultado de la TIR > tasa de descuento se da en el año 3, esto quiere decir que el
proyecto será viable después de esa cantidad de años.
98
7 CONCLUSIONES
Posteriormente del análisis de algoritmos de machine learning y redes neuronales, se
concluye que la red neuronal profunda es la mejor opción ya que tiene una mayor precisión
general en comparación de los otros.
El objetivo 2 nos permitió obtener una visión más precisa de cómo se van a integrar todos
los componentes, desde el front-end hasta el back-end.
Por último, se concluye que para recuperar la inversión del proyecto en un plazo máximo de
2 años la empresa debe poder atender un total de 237 vehículos por mes, es decir, un
aproximado de 9 a 10 autos por día para poder obtener un VAN > 0 y una TIR > tasa de
descuento.
99
8 RECOMENDACIONES
Se invita a usar un mayor tamaño de dataset o incluir un número mayor de neuronas y capas
en la red neuronal para obtener una mejor predicción de retrasos en los servicios de
mantenimiento preventivo.
Se sugiere usar los servicios cloud de Google Platform, debido a que presentan un precio
más económico en comparación a otras tecnologías en el mercado.
Se recomienda a las empresas del sector automotriz, que perciben un mayor número de
vehículos mensuales mayores e iguales a 237 para realizar un servicio de mantenimiento,
implementar la propuesta, con ello pueden lograr aumentar el número de atención de
vehículos mensual, asignar correctamente a los técnicos y generar mayores ingresos en un
plazo de 2 años.
100
9 BIBLIOGRAFÍA
Abdellah, A. R., Mahmood, O. A., Kirichek, R., Paramonov, A., & Koucheryavy, A. (2021).
Machine learning algorithm for delay prediction in IoT and tactile internet. Future
Internet, 13(12) https://doi.org/10.3390/fi13120304
Atlassian. (s.f) Gestión ágil de proyectos. Atlassian. Recuperado el 19 de enero del 2023, de
https://www.atlassian.com/es/agile/project-management
Balakrishnan, H., Aditi K., Snehanshu S., and Nithin N. (2019). ChaosNet:A chaos based
artificial neural network architecture for classification. An Interdisciplinary Journal of
Nonlinear Science 29 (11). https://doi.org/10.48550/arXiv.1910.02423
Ballesteros-Pérez, P., Sanz-Ablanedo, E., Soetanto, R., González-Cruz, M., Larsen, G.,
Cerezo-Narváez, A. (2020). Duration and cost variability of construction activities: an
empirical study. Journal of Construction Engineering and Management, 146(1).
https://ascelibrary.org/doi/10.1061/%28ASCE%29CO.1943-7862.0001739
Baryannis, G., Dani, S., & Antoniou, G. (2019). Predicting supply chain risks using machine
learning: The trade-off between performance and interpretability. Future Generation
Computer Systems, 101, 993-1004. https://doi.org/10.1016/j.future.2019.07.059
Chen, S., Guo, Z., & Zhao, X. (2021). Predicting mortgage early delinquency with machine
learning methods. European Journal of Operational Research, 290(1), 358-372.
https://doi.org/10.1016/j.ejor.2020.07.058
Choi Y., & Chen J. (2005), Fast prediction of start-of-combustion in HCCI with combined
artificial neural networks and ignition delay model, Proceedings of the Combustion
Institute 30, 2711-2718 https://doi.org/10.1016/j.proci.2004.08.143
Dalmau, R. (2022). Predicting the likelihood of airspace user rerouting to mitigate air traffic
flow management delay. Transportation Research Part C: Emerging Technologies,
144 https://doi.org/10.1016/j.trc.2022.103869
Dastres, R., & Soori, M. (2021). Artificial Neural Network Systems. International Journal
of Imaging and Robotics. 21. 13-25. https://hal.science/hal-03349542/document
Gondia, A., Siam, A., El-Dakhakhni, W., & Nassar, A. H. (2020). Machine learning
algorithms for construction projects delay risk prediction. Journal of Construction
101
Engineering and Management, 146(1)
González-Cruz, M., Ballesteros-Pérez, P., Lucko, G., & Zhang, J. (2022). Critical duration
index: Anticipating project delays from deterministic schedule information. Journal of
Construction Engineering and Management, 148(11)
Grekousis, G. (2019). Artificial neural networks and deep learning in urban geography: A
systematic review and meta-analysis. Computers, Environment and Urban Systems 74
https://doi.org/10.1016/j.compenvurbsys.2018.10.008
Hamet, P., Tremblay, J. (2017). Artificial intelligence in medicine. Metabolism 69

https://doi.org/10.1016/j.metabol.2017.01.011
Huang, Y., Jiang, C., Wan, K., Gao, Z., Vervisch, L., Domingo, P., Liu, J. (2022). Prediction
of ignition delay times of jet A-1/hydrogen fuel mixture using machine learning.
Aerospace Science and Technology, 127 https://doi.org/10.1016/j.ast.2022.107675
ISO/IEC 25010. (s.f) Normas ISO 25000. ISO 25000. Recuperado el 23 de enero del 2023,
de https://iso25000.com/index.php/normas-iso-25000/iso-25010
Kannan, R., Abdul Halim, H. A., Ramakrishnan, K., Ismail, S., & Wijaya, D. R. (2022).
Machine learning approach for predicting production delays: A quarry company case
study. Journal of Big Data, 9(1) https://doi.org/10.1186/s40537-022-00644-w
Lessan, J., Fu, L., & Wen, C. (2019). A hybrid bayesian network model for predicting delays
in train operations. Computers and Industrial Engineering, 127, 1214-1222.
https://doi.org/10.1016/j.cie.2018.03.017
Liu, J.Chen, L., Boli L., Weijian C., Meihao W., Rui L., Yunjun Y., Bing Z., and Zilong H.
(2018). Prediction of rupture risk in anterior communicating artery aneurysms with a
feed-forward artificial neural network. European radiology 28(8):3268-75.
https://doi.org/10.1007/s00330-017-5300-3
Manandhar, S., Dev, S., Lee, Y. H., Meng, Y. S., & Winkler, S. (2019). A data-driven
approach for accurate rainfall prediction. IEEE Transactions on Geoscience and
Remote Sensing, 57(11), 9323-9330. https://doi.org/10.1109/TGRS.2019.2926110
102
Ntakolia, C., Kokkotis, C., Karlsson, P., & Moustakidis, S. (2021). An explainable machine
learning model for material backorder prediction in inventory management. Sensors,
21(23) https://doi.org/10.3390/s21237926
Park, J., & Chung, K. (2021). Resource prediction‐based edge collaboration scheme for
improving qoe. Sensors, 21(24) https://doi.org/10.3390/s21248500
Ramírez, P. (2022, 26 de setiembre). Van y TIR: Concepto, diferencias y cómo calcularlos.

Economia3. Recuperado el 23 de enero del 2023, de https://economia3.com/van-tir-
concepto-diferencias-como-calcularlos/
Rengifo, P. (2017). Optimización de los tiempos de servicio de mantenimiento preventivo de

la empresa maquinarias-concesionario Nissan Rep. De Panamá [Tesis de titulación,
Universidad Tecnológica del Perú]. Repositorio Institucional de la UTP. Recuperado el
23 de enero del 2023, de
https://repositorio.utp.edu.pe/bitstream/handle/20.500.12867/857/Plinio%20Rengifo_
Trabajo%20de%20Suficiencia%20Profesional_Titulo%20Profesional_2017.pdf
Ritschel, S., Cherstvy, A. G., & Metzler, R. (2021). Universality of delay-time averages for
financial time series: Analytical results, computer simulations, and analysis of historical
stock-market prices. Journal of Physics: Complexity, 2(4)
http://dx.doi.org/10.1088/2632-072X/ac2220
Santos, I., Luz, C., Nereida, R. Alvaro, T., & Adrian, C. 2021. "Artificial Neural Networks
and Deep Learning in the Visual Arts: A review. Neural Computing and
Applications:1-37. https://doi.org/10.1007/s00521-020-05565-4
Schmidhuber, J. (2015). Deep learning in neural networks: An overview. Neural Networks

61:85-117. https://doi.org/10.1016/j.neunet.2014.09.003
Shaikh, F. (2017). Deep learning vs. machine learning—the essential differences you need
to know. Analytics Vidhya Recuperado el 13 de Julio de 2018
https://www.analyticsvidhya.com/blog/2017/04/comparison‐between‐deep‐learning‐
machine‐learning/
Shanthi, N., Sathishkumar, V. E., Upendra Babu, K., Karthikeyan, P., Rajendran, S., &
Allayear, S. M. (2022). Analysis on the bus arrival time prediction model for human-
centric services using data mining techniques. Computational Intelligence and
103
Neuroscience, 2022 https://doi.org/10.1155/2022/7094654
Steinberg, F., Burggaef, P., Wagner, J., & Heinbach, B. (2022). Impact of material data in
assembly delay prediction—a machine learning-based case study in machinery
industry. International Journal of Advanced Manufacturing Technology, 120(1-2),
1333-1346. https://doi.org/10.1007/s00170-022-08767-3
Sun, T., & Vasarheyi, M. A. (2017). Deep learning and the future of auditing: how an
evolving technology could transform analysis and improve judgment. The CPA Journal
87(6), 24–29 https://www.proquest.com/scholarly-journals/deep-learning-future-
auditing-how-evolving/docview/2213055096/se-2
Sun, T., & Vasarhelyi, M. A. (2018). Predicting credit card delinquencies: An application of
deep neural networks. Intelligent Systems in Accounting, Finance and Management,
25(4), 174-189. https://doi.org/10.1002/isaf.1437
Van Gerven, M., Bohte, S. (2017). Artificial Neural Networks as Models of Neural
Information Processing. Frontiers in Computational Neuroscience 11
https://doi.org/10.3389/fncom.2017.00114
Wu, C., Huang, S., Chiou, C., & Wang, Y. (2021). A predictive intelligence system of credit
scoring based on deep multiple kernel learning. Applied Soft Computing, 111
https://doi.org/10.1016/j.asoc.2021.107668
Yang, R., Zheng, K., Wu, B., Wu, C., & Wang, X. (2021). Phishing website detection based
on deep convolutional neural network and random forest ensemble learning. Sensors,
21(24) https://doi.org/10.3390/s21248281
Yu, B., Guo, Z., Asian, S., Wang, H., & Chen, G. (2019). Flight delay prediction for
commercial air transport: A deep learning approach. Transportation Research Part E:
Logistics and Transportation Review, 125, 203-221.
https://doi.org/10.1016/j.tre.2019.03.013
Zhou, P., Chen, L., Dai, X., Li, B., & Chai, T. (2021). Intelligent prediction of train delay
changes and propagation using RVFLNs with improved transfer learning and ensemble
learning. IEEE Transactions on Intelligent Transportation Systems, 22(12), 7432-7444.
https://doi.org/10.1109/TITS.2020.3002785
104

Proyecto Red Neuronal Mantenimiento UPC

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Proyecto Red Neuronal Mantenimiento UPC

Cargado por

Copyright:

Formatos disponibles

Solución web usando red neuronal profunda

para la predicción de retrasos de servicios de

Item Type info:eu-repo/semantics/bachelorThesis

Authors Jacinto Camacho, Christyan Gerald; Tavara Garay, Maverick

Publisher Universidad Peruana de Ciencias Aplicadas (UPC)

Rights info:eu-repo/semantics/openAccess; Attribution-

Download date 26/02/2024 21:35:40

Item License http://creativecommons.org/licenses/by-nc-sa/4.0/

Link to Item http://hdl.handle.net/10757/667749

PROGRAMA ACADÉMICO DE INGENIERÍA DE SOFTWARE

SOLUCIÓN WEB USANDO RED NEURONAL PROFUNDA PARA LA

PREDICCIÓN DE RETRASOS DE SERVICIOS DE MANTENIMIENTO

PREVENTIVO EN EL SECTOR AUTOMOTRIZ

Para optar el título profesional de Ingeniero de Software

Jacinto Camacho, Christyan Gerald (0000-0003-3761-704X)

Tavara Garay, Maverick Marco Antonio (0000-0003-0568-1012)

Barrientos Padilla, Alfredo (0000-0002-0029-4913)

Lima, 11 de enero del 2023

Esta investigación se la dedicamos a nuestros familiares, amistades y docentes por todo el

Es valorado el hecho de que la organización sin ánimo de lucro haya depositado su

Para la realización de este proyecto se investigaron soluciones de redes neuronales profundas

Finalmente se realizó un análisis de factibilidad económica para validar si la propuesta es

Palabras clave: Aprendizaje automático; Mejora tecnológica; Redes neuronales profundas;

Keywords: Deep neural network; Digital transformation; Machine learning; Technological

1 DESCRIPCIÓN DEL PROYECTO .......................................................................... 3

1.1 ANTECEDENTES ...................................................................................................... 4

2 LOGROS DE LOS STUDENT OUTOMES ............................................................. 9

2.1 STUDENT OUTCOME (1) ................................................................................. 10

3 MARCO TEÓRICO .................................................................................................. 15

3.1 MANTENIMIENTO (MAINTENANCE) ...................................................................... 16

4 ESTADO DEL ARTE ............................................................................................... 21

4.1 PREFACIO ............................................................................................................. 22

4.2.1 Resumen artículo N° 1..................................................................................... 29

4.3.1 Resumen artículo N° 6..................................................................................... 37

PREDICCIÓN CON RETRASOS .............................................................................................. 57

4.5.1 Resumen artículo N° 18................................................................................... 57

5 DESARROLLO DEL PROYECTO ........................................................................ 67

5.1 ANÁLISIS DE ALGORITMOS DE INTELIGENCIA ARTIFICIAL ..................................... 68

6.1 VALIDACIÓN DE FACTIBILIDAD ECONÓMICA ......................................................... 93

8 RECOMENDACIONES ......................................................................................... 100

9 BIBLIOGRAFÍA ..................................................................................................... 101

Tabla 1 Tabla de indicadores de éxito del proyecto. ............................................................ 5

En el primer capítulo se especifica la descripción del proyecto, el planteamiento del

El segundo capítulo describe cómo el proyecto ha desarrollado y cumplido diversas

El quinto capítulo se enfoca en el planteamiento del análisis de actividades del proceso de

En el sexto capítulo se valida la viabilidad técnica y económica mediante cifras que

1.2 Dominio del problema

1.3 Planteamiento de la Solución

1.4 Objetivos del Proyecto

1.4.3 Indicadores de éxito

N° Indicadores de éxito Objetivo

4 Validación de la solución web usando red neuronal OE3

1.5 Planificación del proyecto

1.5.1 Gestión del Alcance

1.5.3 Gestión de recursos humanos

Comité de Proyecto • Revisar los proyectos considerando los criterios

1.5.4 Gestión de comunicaciones

− Las reuniones se deben solicitar con una anticipación mínima de 24 horas.

1.5.5 Gestión del riesgo

# Riesgo Probabilidad Impacto Acciones

Cambios en las Aceptar:

Predicción 0.6053 0.5521 0.8677 0.5770 0.4527

Precisión 0.9009 0.7291 0.0217 0.8047 0.9080

Especificidad 0.9994 0.9981 0.6407 0.9987 0.9996