Documentos de Académico
Documentos de Profesional
Documentos de Cultura
com
Siguiendo el dinero:
Una investigación exploratoria sobre el proceso de
declaraciones internacionales utilizando la minería de procesos
Palabras clave: minería de procesos, descubrimiento de procesos, análisis de procesos, análisis de datos,
declaraciones, BPMN, Disco
2 WTH van Bakel, RM Hulscher, M. Klijs, MJ Sturm
1 Introducción
Los procesos nos rodean y están presentes en cualquier entorno empresarial. Hoy en día, la
mayoría de estos procesos están respaldados por sistemas de información, que a menudo
registran información sobre la ejecución de los procesos en los llamados registros de
eventos. Cada evento en el registro contiene información como la actividad realizada, un ID
de caso y la persona que realizó la acción.
La minería de procesos es la ciencia que gira en torno al análisis de estos registros de
eventos. El objetivo de la minería de procesos es recopilar información útil y adquirir
conocimiento sobre los procesos ejecutados y, si es posible, mejorar o apoyar la ejecución
de los procesos existentes.
Este documento está escrito como una presentación al décimo Desafío Internacional de Inteligencia
de Procesos de Negocios.1 en la categoría de estudiante. El desafío requiere que analicemos datos de
eventos de la vida real utilizando herramientas de minería de procesos para obtener información sobre
los procesos capturados en los registros de eventos.
Los datos del desafío de este año provienen de TU / e (Technische Universiteit
Eindhoven)2. Los datos proporcionados giran en torno al reembolso de los gastos
de viaje. En este informe, posicionamos los montos de declaraciones como tema
central. Analizaremos lo siguiente:
- ¿Qué propiedades relacionadas con el proceso están correlacionadas con la cantidad de dinero
declarada?
- ¿Cuáles son las características de los permisos de gasto excesivo y gasto insuficiente?
- ¿Existen diferencias en el proceso en función del monto solicitado?
Este informe comienza con una introducción a los datos y los procesos. A continuación, las
preguntas mencionadas anteriormente se responden en su propio capítulo. A lo largo de
estos capítulos, se hacen recomendaciones. Para concluir, estas recomendaciones se
resumen en el capítulo final.
1 https://icpmconference.org/2020/bpi-challenge/
2 https://www.tue.nl/en/
Siguiendo el dinero 3
Como se dijo en la introducción, este informe se centra en los diferentes niveles de costos de
los viajes internacionales. Por lo tanto, eldeclaraciones nacionales y solicitudes de pago los
registros del resto de este informe no se tienen en cuenta.
Todos los datos en los registros de eventos se anonimizan de tal manera que no hay identificaciones
internas de TU / e visibles en el conjunto de datos. Todos los miembros del personal son reemplazados
por sus roles. Además, todas las cantidades (de pago) en los registros se modifican ligeramente. Aún es
posible sumar declaraciones que se refieran al mismo permiso de viaje y luego compararlas con el
presupuesto original. En una muestra lo suficientemente grande, las cantidades resumidas también
deben ser aproximadamente correctas.
Los datos contienen tres conceptos principales un permiso, una declaración y un pago.
Los permisos y declaraciones pueden serenviado, rechazado, aprobado o final aprobado. El
pago puede sersolicitado y manejado. Esta información se incluye como atributos de evento.
Permisos Los conceptos para el registro de permisos y los atributos importantes se presentan en
la Figura 1. (Dado que el registro de permisos contiene toda la información sobre declaraciones
internacionales, los conceptos se superponen). Cadapermiso corresponde exactamente a uno
unidad organizacional, proyecto, y presupuesto. El permiso puede tener múltiplessolicitudes de
pago. El proyecto puede tener múltiplespresupuestos y los presupuestos pueden referirse a
múltiples proyectos.
3 https://data.4tu.nl/repository/uuid:52fb97d4-4588-43c9-9d04-3604d4613b51
4 WTH van Bakel, RM Hulscher, M. Klijs, MJ Sturm
1 .. * 1 .. *
Proyecto Presupuesto
1..1 1..1
0 .. *
1..1 Permiso
Unidad organizacional
total declarado
0 .. * 0..1 1 .. *
Fig.1: Modelo de datos para los conceptos principales para las declaraciones internacionales y los
permisos
Empleado
Empleado
Enviar
Presentar permiso Iniciar viaje
declaración
Quiere Viaje terminado
viajar internacionalmente
Administración
Administración
Aprobar Solicitud
Aprobar permiso
declaración pago
Manejado
Supervisor
Supervisor
Aprobar
Aprobar permiso
declaración
Permisos de viaje El flujo del proceso de los permisos de viaje es similar al flujo del
proceso de las declaraciones internacionales y se obtuvo de la misma manera. Se
presenta en la Figura 4.
4 https://fluxicon.com/disco/
6 WTH van Bakel, RM Hulscher, M. Klijs, MJ Sturm
Iniciar viaje
4.897
4.148 4.397
Viaje final
4.897
371 3,509
4.713 4.733
2.516 2.814
4.524
Solicitar pago
4.683
4.668
Pago manejado
4.687
4.396
Iniciar viaje
5.584
5,017 4.918
Viaje final
5.584
432 3248
5.631 4.469
2,925 2.636
4.214
Solicitar pago
5.927
5.502
Pago manejado
5.931
4.251
En esta sección nos enfocamos en los casos de Declaración Internacional del archivo de
registro de Declaración Internacional. Cada declaración se puede vincular a un permiso,
como se describe en la sección 2.1. En esta sección, analizamos ciertas características del
proceso de cada declaración y cómo esto se relaciona con la cantidad de dinero que se
declara.
Se definió la siguiente pregunta de investigación: ¿Qué propiedades relacionadas con el
proceso están correlacionadas con la cantidad de dinero declarada? Esta pregunta se responde
trazando la distribución de las cantidades y calculando los coeficientes de correlación entre la
cantidad y una sola propiedad relacionada con el proceso. Esta sección es de naturaleza
exploratoria, en la que intentamos deducir algunas reglas de proceso a partir de los datos
disponibles.
3.1 Método
Como se describe en la sección 2.1, los datos contienen algunas actividades que se
realizan en los casos de declaración. Podemos determinar para cada caso: la cantidad
de veces que se realizó una actividad en particular y si la actividad se realiza en
absoluto. Lo mismo se aplica al actor que realiza la actividad. Se generan métricas
sobre cuántas veces estuvo involucrado un actor en particular por caso.
Primero, se descartaron declaraciones con montos de 0. Luego, para obtener las nuevas
propiedades del caso,xml.etree.ElementTree Paquete de Python5 se utilizó. Esto nos
permitió extraer las frecuencias de los atributos de actividad del registro de declaraciones
internacionales.
Los diagramas de caja y los gráficos de barras se generaron utilizando el Plotly6 paquete.
Finalmente, se utilizó la correlación de Spearman para determinar la correlación entre las
propiedades generadas del caso y la cantidad. Esto se debe a que las cantidades están
relacionadas con variables de frecuencia, que no se distribuyen normalmente. Por tanto, no se
pudo utilizar Pearson.
3.2 Análisis
5 https://docs.python.org/3/library/xml.etree.elementtree.html
6 https://plotly.com/
8 WTH van Bakel, RM Hulscher, M. Klijs, MJ Sturm
Declaración
Aprobado Final Aprobado Rechazado Enviado
Declaraciones 5510 6174 1393 6175
Total 7680 6261 3294 7874
Permiso
Aprobado Final Aprobado Rechazado
Declaraciones 5191 5751 245
Total 7441 5771 490
Actor
Director supervisor Empleado
Declaraciones 6175 665 6175
Total 12236 870 15695
Tabla 1: Frecuencia de las actividades y actores en el registro de Declaraciones
Internacionales (0 declaraciones de monto omitidas). Las filas de Declaración indican
cuántas declaraciones contienen la actividad / actor al menos una vez. Las filas de Total
denotan el número total de actividades / actor sumadas en todas las declaraciones.
declaraciones, las actividades de rechazo son mucho menos frecuentes que las actividades de
aprobación.
Para los actores, al menos una actividad por declaración la realiza un supervisory un
empleado. Esto contrasta fuertemente con ladirector actor. Solo una de cada diez
declaraciones implica actividades realizadas pordirectores. Por tanto, podría darse el caso
de quedirector solo se involucrará si las declaraciones cumplen con una propiedad
desconocida. Esta propiedad puede estar relacionada con los costos.
Conocimiento: Las declaraciones con cantidades más altas tienen trazas de proceso más largas y, por lo
tanto, se evalúan con mayor frecuencia.
La explicación más probable de este hallazgo es que las declaraciones con montos superiores
se tratan con más cuidado y, por lo tanto, pasan por un proceso más largo. Por supuesto, el riesgo
(pérdida de dinero) involucrado en aprobar una declaración defectuosa es mucho
Siguiendo el dinero 9
mayor con un monto de declaración mayor. Por lo tanto, durante los pasos de revisión, los
revisores posiblemente estén más inclinados a rechazar una solicitud si tienen dudas. Eso
daría lugar a un paso de revisión adicional antes de que se pueda finalizar una declaración.
Por lo tanto, conduce a un mayor número de actividades asociadas con dicha declaración.
Actores La correlación entre el tipo de actores que realizaron actividades para una
declaración y el monto de una declaración se muestra en la Figura 6. Lo primero que
se debe notar es que para cada tipo de actor, la correlación es positiva. Lo que significa
que si un tipo particular de actor realiza más actividades, se espera que el monto de
las declaraciones sea mayor. Esto era de esperar, ya que el hallazgo anterior se refería
a que un mayor número de actividades se correlacionaba con el monto de una
declaración. Aunque lo interesante aquí es la diferencia entre el tipo de actores. El
número de actividades que involucran a un director tiene la mayor correlación con el
monto de una declaración. Al contrario, el supervisor es todo lo contrario.
Podemos hacer algunas especulaciones sobre por qué es así. Un director es una función
de alto nivel dentro de una organización. Las reglas de la organización pueden ser que para
casos de alto impacto, un director debe estar involucrado. Aquí, el alto
10 WTH van Bakel, RM Hulscher, M. Klijs, MJ Sturm
El impacto se deriva de que la declaración tiene una gran cantidad de dinero. Por el
contrario, el supervisor podría estar involucrado en todas las declaraciones. Por lo tanto, no
se correlacionan con una mayor cantidad de dinero que se declara.
Esta sección investiga los permisos asociados con las declaraciones internacionales. El objetivo de
esta exploración es investigar qué permisos sobrepasaron el presupuesto o se quedaron por
debajo del presupuesto, en función del valor del atributo "gastado en exceso". Se pueden tomar
medidas adicionales basadas en estos hallazgos. Por ejemplo, para revisar ciertos permisos o
evaluar el proceso para una unidad organizativa específica. Esto dio lugar a recomendaciones para
el TU / e. De esta manera se responde a la siguiente pregunta de investigación:¿Cuáles son las
características de los permisos de gasto insuficiente y excesivo?
Para esta exploración, se utilizó el registro de permisos. El registro de permisos contiene
información sobre las declaraciones que pertenecen a ese permiso, si se gastan en exceso
(más gasto de lo que se solicita) y por cuánto (como se presenta en la Figura 1). Un proyecto
puede tener múltiples permisos y una organización puede tener múltiples permisos y
proyectos (como se puede ver en la Figura 1). Por lo tanto, los proyectos y las unidades
organizativas también se investigan para ver qué proyectos cuestan más dinero o qué
unidades organizativas gastan más o menos.
- Obtenga información sobre los datos: Antes de que se pueda investigar la pregunta
principal de la investigación, es importante comprender primero los datos y observar
los rangos de los diferentes atributos y observar las anomalías en los datos.
- Identificación de valores atípicos: Antes de realizar más procesamiento, es importante
identificar los valores atípicos. Los valores atípicos existentes que se detectan pueden
significar un error o un caso extremo que debe investigarse más a fondo.
12 WTH van Bakel, RM Hulscher, M. Klijs, MJ Sturm
- ¿Cuáles son los 7 proyectos con gastos inferiores, presupuestados y con gastos superiores a los previstos?
- ¿Qué unidad organizativa tiene los proyectos más por debajo o por encima del
presupuesto?
4.4 Resultados
Esta sección presenta los resultados de las preguntas de investigación presentadas en la sección
anterior.
Parte aislada Todos los montos de gastos excesivos se trazaron en una gráfica de caja, que se
muestra en la Figura 9. Como puede verse, un punto tiene un monto de gastos excesivos mucho
mayor. Este punto corresponde al permiso de viaje 54518. El empleado que presentó este permiso
de viaje solicitó un presupuesto de 2.000 euros. Sin embargo, declaró un importe total cercano a
los 1.500.000 euros. Esto da como resultado un gasto excesivo de casi el mismo número. Esta
declaración pertenece a la unidad organizativa 65466.
La Figura 8 muestra el proceso por el que pasó este caso. Si comparamos el modelo de
proceso con el flujo feliz presentado en la Figura 4, podemos ver que elSolicitud de pago
FloridaEl flujo es mucho más temprano en el proceso, antes de que comenzara el viaje. No
es así como el happy-flow lo especifica. Este flujo incluso carece deDeclaración Tareas. La
solicitud promedio tarda 10 eventos con un tiempo de procesamiento de 73 días, el valor
atípico contiene 24 eventos y tarda 181,3 días en finalizar.
No conocemos los detalles de este proceso lo suficiente como para sacar conclusiones sobre
cómo sucedió. En todas las preguntas de investigación posteriores, este caso fue excluido.
Cuando se excluye este valor atípico y vemos el diagrama de caja en la Figura 10, no hay
valores atípicos adicionales obvios.
Siguiendo el dinero 13
3 1
Solicitar pago
2
1 1
2 1
Iniciar viaje
Viaje final
Enviar recordatorio 1
2
Fig.9: Diagrama de caja de los montos de gastos Fig.10: Diagrama de caja de los montos de gastos
excesivos para todos los permisos en el Registro de excesivos para todos los permisos en el Registro de
permisos permisos (valor atípico excluido)
Proyectos Las tablas de la Figura 14 presentan una descripción general de los 7 proyectos con
gastos inferiores (14a), gastos excesivos (14b), totales (14c) y 7 totales inferiores (14d).
Si nos fijamos en los proyectos de gasto excesivo superior (Figura 14b), podemos ver que
aunque ciertos permisos para ese proyecto fueron gastados en exceso, el total siempre fue
positivo (gasto insuficiente).
Siguiendo el dinero 15
Fig. 11: La cantidad relativa de permisos basada en la cantidad total para cada
unidad organizativa.
Recomendación: Podría ser muy interesante examinar más a fondo los proyectos de
gasto excesivo y gasto insuficiente. ¿Se estimó incorrectamente el presupuesto y qué
se puede hacer para hacer mejores estimaciones en el futuro? ¿Hubo circunstancias
imprevistas?
Cabe señalar que la unidad organizativa 65458 aparece tres veces entre los 7 proyectos con gastos
inferiores a los previstos. Las unidades organizativas 65456 y 65460 aparecen, respectivamente, cuatro y
dos veces en los 7 proyectos inferiores con un gasto inferior al total (por lo que se gastaron en exceso).
dieciséis WTH van Bakel, RM Hulscher, M. Klijs, MJ Sturm
Recomendación: Sería muy interesante analizar más a fondo por qué ciertas unidades
organizativas tienen más proyectos que gastan menos y otras tienen más proyectos
que gastan más.
Siguiendo el dinero 17
(a) los 7 primeros gastos inferiores a los previstos (b) los 7 principales gastos excesivos
5 Grupos
En lugar de mirar el monto del gasto excesivo en relación con la unidad organizativa,
en este capítulo veremos la relación entre el monto gastado excesivo y el presupuesto
solicitado, cómo difieren en términos de proceso y posibles recomendaciones. De esta
manera se responde a la siguiente pregunta de investigación:
Al dividir los datos en grupos en relación con el presupuesto solicitado, ¿podemos ver
diferencias en los modelos de proceso en términos de tiempo de producción, desviaciones y
probabilidades de aprobación?
5.1 Método
1. Preparación de los datos El primer paso es preparar la variante de Rstudio convirtiendo todos los
valores a su tipo de datos respetado y eliminando columnas innecesarias (para esta pregunta de
investigación) como tipo de actividad, tipo de costo, tipo de declaración, identificación de rfp, tarea e
identificación de decisión. Dado que todas las actividades en los mismos ID de caso tendrán los mismos
valores de atributo, eliminamos todas las filas de ID de caso duplicadas en Rstudio, de modo que cada ID
de caso solo existe una vez. La Figura 15 presenta una descripción general de las frecuencias relativas al
presupuesto solicitado.
en relación con el grupo presupuestario. Hicimos algunos hallazgos interesantes junto con la
Figura 16:
- los Grupo inferior Solo tenía 74 de las 1500 declaraciones sobre el presupuesto, donde los presupuestos
gastados en exceso promediaron un 47% de gasto excesivo y los presupuestos gastados insuficientemente
-42%
- los Grupo mediano tuvo un peor desempeño en la cantidad de declaraciones sobre el presupuesto
(23), pero lo hizo un poco mejor con los presupuestos gastados en exceso con un promedio del 28%
de gasto excesivo y los presupuestos gastados insuficientemente -34%
- Casi ninguna declaración (8 de 1500) en el Grupo superior estuvo dentro del presupuesto y tuvo un
desempeño similar al del grupo mediano donde los presupuestos gastados en exceso promediaron
un 23% de gasto excesivo y los presupuestos gastados insuficientemente -34%
5.2 Análisis
Grupo Eventos promedio Duración media del caso - Duración media del
caso
Bajo 11,1 46,7 días 61,5 días
Medio 13,6 64,9 días 74,4 días
Elevado 15,6 87,1 días 14 semanas
Dividimos las cantidades de casos filtrados por la cantidad total de casos por grupo
y obtuvimos los siguientes resultados en la tabla 4. Solo hay casos pequeños que se
asemejan al modelo de proceso de flujo feliz y al comparar los grupos vemos que el
grupo de presupuesto alto solicitado se desempeña peor con más actividades no
deseadas que los otros dos grupos.
Finalmente, hicimos obligatorias las actividades no deseadas para verificar las variantes más
frecuentes de desviaciones, que eran iguales para todos los grupos, las declaraciones fueron
rechazadas por la administración.
6. Conclusión
El objetivo de este informe empresarial fue investigar los procesos relacionados con las
declaraciones internacionales en TU / e. El enfoque fue presentar recomendaciones a la UT /
e sobre la cantidad de dinero declarada o solicitada. Se recopilaron las siguientes preguntas
de investigación;
1. ¿Qué propiedades relacionadas con el proceso están correlacionadas con la cantidad de dinero
declarada?
2. ¿Cuáles son las características de los permisos de gasto excesivo y gasto insuficiente?
3. ¿Existen diferencias en el proceso en función del monto solicitado?
- Se recomienda investigar el permiso de viaje 54518 más a fondo para determinar los pasos
apropiados que se deben tomar.
- Podría ser muy interesante analizar más a fondo los proyectos gastados en exceso y en
escasez. ¿Se estimó incorrectamente el presupuesto y qué se puede hacer para hacer
mejores estimaciones en el futuro? ¿Hubo circunstancias imprevistas?
- Sería muy interesante analizar más a fondo por qué ciertas unidades organizativas
tienen más proyectos infrautilizados y otras tienen más proyectos gastados en
exceso.
- Anime al empleado a pensar más en el presupuesto requerido / solicitado. Tal vez tenga
consecuencias cuando la cantidad gastada en exceso esté por encima de un
24 WTH van Bakel, RM Hulscher, M. Klijs, MJ Sturm
- Las declaraciones con importes superiores parecen evaluarse con más frecuencia que las
declaraciones con importes inferiores.
- Los directores participan con mayor frecuencia en declaraciones con montos superiores que en
declaraciones con montos inferiores.