Documentos de Académico
Documentos de Profesional
Documentos de Cultura
AUTORES:
La base de datos utilizada es una data con información puntual de los casos
atendidos en la mesa de ayuda de la compañía gubernamental, la cual es recibida por
diferentes canales, estos requerimientos son categorizados en la mesa de ayuda
según:
Después de validar la metodología de trabajo y los datos con los que se cuentan,
concluimos que la técnica de clasificación es el modelo adecuado para el desarrollo de
nuestro proyecto teniendo en cuenta lo indicado en la lectura fundamental Unidad 1 /
Escenario 1 Introducción a la minería de datos “buscan crear unas funciones y reglas
que permitan ubicar futuros individuos u objetos en grupos ya predeterminados,
partiendo de que al pasar por la función, las variables dependientes o explicativas, diga
la probabilidad de que ese individuo u objeto pertenezca a determinado grupo”.
Historia
Misión
Hidrocarburos
Al tener los usuarios la potestad de colocar esta información vital en los casos,
se producen desviaciones en la información, ya que lo que para una persona es vital,
para otra puede ser un problema con prioridad media o baja.
Para este análisis las variables necesarias son Impacto, Prioridad, Urgencia,
Categoría, Usuario y Tiempo de Solución Real en Minutos.
Una vez se tengan estos datos, se deben cruzar con los ANS (acuerdo nivel de
servicio), para verificar si se cumplen o si es necesario hacer ajustes a la gestión de la
mesa de ayuda.
Los registros que se tienen para el análisis hacen parte de una base de datos de
24.155 casos, los cuales nos dan suficiente información para hacer un análisis del
comportamiento de estos.
VARIABLE TIPO
Impacto Nominal
Prioridad Nominal
Urgencia Nominal
Categoría Cadena
Usuario Cadena
Tiempo de solución Real en Minutos Continua
Fuente: Elaboración propia del estudiante
La variable categoría, que es de tipo cadena, solo puede tomar los siguientes valores:
CATEGORÍAS DE CASOS
ACTIVACIÓN O INACTIVACIÓN USUARIO
ACTIVAR O INACTIVAR USUARIO
ACTUALIZACIÓN DATOS DE AGREMIACIÓN
ACTUALIZACIÓN DATOS DE GENERALES
ACTUALIZACIÓN DE DATOS GENERALES
ACTUALIZACIÓN DE DOCUMENTACIÓN
ACTUALIZACIÓN DE REPRESENTANTE LEGAL
ACTUALIZACIÓN DE RESOLUCIONES
ACTUALIZACIÓN DE RESOLUCIONES
ACTUALIZACIÓN DE TANQUES Y PRODUCTO
ACTUALIZAR CONTRATO SUMINISTRO DE COMBUSTIBLE
ACTUALIZAR CORREO ELECTRÓNICO
ACTUALIZAR CORREO ELECTRÓNICO
ACTUALIZAR DATOS DE AGREMIACIÓN
ACTUALIZAR DATOS DE CONTACTO
ACTUALIZAR REPRESENTANTE LEGAL
AGREGAR PRODUCTO PARA DECLARACIÓN
AJUSTE DE CUMPLIDOS ZF
AJUSTE DE CUMPLIDOS ZONA DE FRONTERA
AJUSTE DE INFORMACIÓN CUMPLIDO
AJUSTE SOBRE ORDENES DE PEDIDO
ANULACIÓN O RECHAZO ORDEN DE PEDIDO
APLICATIVO MÓVIL GNCV
APLICATIVO SICOM
APLICATIVO WEB SERVICE
ASIGNACIÓN DE CUPOS ZF
AUTORIZACIÓN DE CUPOS A PRECIO NACIONAL
AUTORIZACIÓN DE CUPOS A PRECIO NACIONAL
CAMBIO DE DIRECCIÓN
CAMBIO DE DIRECCIÓN NOMENCLATURA Y/O CORRESPONDENCIA
CAMBIO DE DISTRIBUIDOR MAYORISTA
CAMBIO DE NIT / RAZÓN SOCIAL
CAMBIO DE NIT Y RAZÓN SOCIAL
CAMBIO DE OPERADOR
CAMBIO DE ORGANISMO CERTIFICADOR
CAMBIO DE PROPIETARIO
CAMBIO DE PROPIETARIO Y OPERADOR
CAMBIO DE REPRESENTANTE LEGAL
CAMBIO DISTRIBUIDOR MAYORISTA
CAMBIO TEMPORAL DE MAYORISTA
CAPACIDAD DISCO
CAPACITACIÓN CERTIFICADO DE CAPACITACIÓN CLDP
CAPACITACIÓN CERTIFICADOS DE CAPACITACIÓN GNCV
CAPACITACIÓN COMERCIALIZADOR INDUSTRIAL CLDP
CAPACITACIÓN ESTACIÓN DE SERVICIO PÚBLICA CLDP
CAPACITACIÓN ESTACIONES DE SERVICIO GNCV
CAPACITACIÓN GNCV
CAPACITACIÓN GRUPO PRIMAX Y ENTIDADES CLDP
CAPACITACIÓN MINORISTAS CLDP
CAPACITACIÓN TALLER DE CONVERSIÓN GNCV
CERTIFICADO DE CAPACITACIÓN CLDP
CESIONES DE CUPO
CIERRE ORDEN DE PEDIDO
CÓDIGO SICOM GNCV
CONFIGURACIÓN DE PRODUCTOS PARA COMPRA Y VENTA
CONFIGURACIÓN DE TANQUES
CONSULTA ESTADO DE RADICADO O TICKET
CONSULTA ESTADO DE RADICADOS ASIGNADOS POR EL MME
CONSULTA DE GESTION Y ANALISIS DE INFORMACION
CONSULTA DE GESTIÓN Y ANÁLISIS DE INFORMACIÓN
CONSULTA ESTADO DEL VEHICULO NACIONAL
CONSULTA ESTADO TICKET
CONSULTA TICKET
CONSULTAS GENERALES
CONTINGENCIAS
CONTRATO PROVEEDORES
CREACIÓN CÓDIGO SICOM GNCV
CREACIÓN USUARIO GNCV
CREACIÓN Y/O ACTUALIZACIÓN DE CONTRATO CLIENTES PARA
COMERCIALIZADOR INDUSTRIAL
CREAR CÓDIGO SICOM
CREAR CÓDIGO SICOM
CREDENCIALES ARANDA
CRUCE DE INFORMACIÓN CON MAYORISTAS
DATOS GENERALES
DECLARACIÓN DE INFORMACIÓN
DECLARACIÓN DE INFORMACIÓN (CORRECCIONES E
INCONSISTENCIAS)
DESBLOQUEO O ACTIVACION DE EDS
DISPOSICIÓN Y/O ACTUALIZACIÓN DE TANQUES
DUPLICIDAD ORDENES DE PEDIDO
ELIMINAR VALIDACIÓN
ENCUESTA SICOM
ERROR EN LA VALIDACIÓN DE USUARIOS Y CONTRASEÑAS
FALLA CORREO ELECTRÓNICO
FALLA INGRESO A SICOM GNCV
FALLA INGRESO A SICOM LÍQUIDOS
FALLA TRANSMISIÓN DATOS WEB SERVICE SICOM GNCV
FALLA TRANSMISIÓN DATOS WEB SERVICE SICOM LÍQUIDOS
GAS GNCV
GENERACIÓN ORDENES DE PEDIDO
GESTOR P8
INCONVENIENTES APLICACIÓN BI
INCONVENIENTES CUPOS ZDF
INCONVENIENTES FUNCIONALES SICOM GNCV
INCONVENIENTES INGRESO AMBIENTE DE PRUEBAS GNCV
INCONVENIENTES INGRESO AMBIENTE DE PRUEBAS SICOM
INCONVENIENTES TÉCNICOS AGENTE DE LA CADENA
INCONVENIENTES TÉCNICOS AGENTE DE LA CADENA GNCV
INCONVENIENTES TÉCNICOS DEL AGENTE DE LA CADENA SICOM
GNCV
INDISPONIBILIDAD DEL HOME DE SICOM
INDISPONIBILIDAD DEL MODULO TRANSACCIONAL DE SICOM GNCV
INDISPONIBILIDAD DEL PORTAL TRANSACCIONAL DE SICOM LÍQUIDOS
INFORMACIÓN GENERAL
LÍQUIDOS
NO PERMITE CAMBIAR ESTADO DE LAS ÓRDENES DE PEDIDO
NO PERMITE CAMBIAR ESTADO DE ÓRDENES DE PEDIDO WEB
SERVICE
ORDENES DE PEDIDO
PLANTILLA SOLICITUD DE DATOS DEL VEHÍCULO GNCV
POR LÍQUIDOS
POR SICOM GNCV
POR SICOM LÍQUIDOS
PROBLEMAS DE TRANSMISIÓN DE DATOS
PROBLEMAS DE TRANSMISIÓN DE DATOS
PUBLICACIÓN DE INFORMACIÓN
REDISTRIBUCIÓN DE CUPOS ZF
REDISTRIBUCIÓN DE CUPOS ZF
REGISTRO DE PRECIO ACTUAL
REGISTRO DE PRECIO ACTUAL (REGISTRO E INCONVENIENTES)
REGISTRO INICIAL DE AGENTE
RENOVACIÓN CERTIFICADO DE CONFORMIDAD
RENOVACIÓN CERTIFICADO DE CONFORMIDAD
RENOVACIÓN PÓLIZAS DE RESPONSABILIDAD CIVIL
RENOVACIÓN PÓLIZAS DE RESPONSABILIDAD CIVIL
RENOVACIÓN PÓLIZAS VEHICULARES
RENUNCIA A TÉRMINOS DE CUPO ZF
RENUNCIA A TÉRMINOS DE CUPO ZF
REPORTE PARA LA CONCILIACIÓN DE INFORMACIÓN ENTRE AGENTES
REPORTES DE INFORMACIÓN
REPORTES DE INFORMACIÓN SOLICITADOS POR LOS AGENTES
REPORTES DE INFORMACIÓN SOLICITADOS POR MME
RESTABLECER CONTRASEÑA
RESTABLECER CONTRASEÑA SICOM
RESTABLECER CORREO ELECTRÓNICO
RESTABLECER CORREO ELECTRÓNICO GNCV
RESTABLECIMIENTO DE CONTRASEÑA DE USUARIO WEB SERVICE
RESTABLECIMIENTO DE CONTRASEÑAS DE USUARIO DE WEB
SERVICE
RESTABLECIMIENTO DE CORREO ELECTRÓNICO
SEGURIDAD PERIMETRAL.
SEGURIDAD SO LINUX o WINDOWS
SOLICITUD CAPACITACIÓN COMERCIALIZADOR DE EQUIPOS
SOLICITUD CAPACITACIÓN COMERCIALIZADOR INDUSTRIAL
SOLICITUD CAPACITACIÓN DE ORGANISMO CERTIFICADOR
SOLICITUD CAPACITACIÓN DE ORGANISMO
CERTIFICADOR(INSPECTOR)
SOLICITUD CAPACITACIÓN DE TALLER DE CONVERSIÓN
SOLICITUD CAPACITACIÓN EDS GNCV
SOLICITUD CAPACITACIÓN EDS PUBLICA
SOLICITUD CAPACITACIÓN GRUPO PRIMA Y ENTIDADES
SOLICITUD CAPACITACIÓN MINORISTAS
SOLICITUD CREACIÓN USUARIO GNCV
SOLICITUD DE AJUSTE DE INFORMACIÓN CUMPLIDO
SOLICITUD ESPECIAL DIRIGIDA AL MME
SOLICITUDES MIN ENERGÍA
VALIDACIÓN CERTIFICADO DE CONFORMIDAD GNCV
VALIDACIÓN DE CERTIFICADO DE CONFORMIDAD GNCV
VEHÍCULOS Y AUTORIZACIONES COMERCIALIZADOR INDUSTRIAL
VENTANA MANTENIMIENTO APLICACIÓN WEB SERVICE
VENTANA MANTENIMIENTO APLICACIÓN WEB SERVICE SICOM
LÍQUIDOS
Fuente: Elaboración propia del estudiante
Usuarios: Son los registrados en Aranda y los que únicamente generan los
tickets.
La Variable Tiempo de Solución Real en Minutos tiene 7.143 campos con valor
cero, lo que equivale al 29,57% de los casos. Haciendo un estudio con la realidad, se
puede determinar que, dentro de este Universo de casos, hay unos cancelados, lo que
justifica el cero. También hay casos que están en gestión con el funcionario o con otra
entidad, lo que significa que no se ha cerrado y por lo tanto no tiene una fecha de
solución.
La variable Usuario, que también hace parte importante del análisis solo tiene un
registro en donde no aparece, todos los demás registros tienen este campo. Al tener
una base de datos con gran cantidad de registros, un campo en blanco no representa
una parte muy significativa, ni va a generar desviaciones representativas en las
estadísticas.
Ya que los datos han sido tomados en un software especializado en esta tarea,
la calidad que se tiene es bastante alta, se presentan muy pocos casos con problemas,
los cuales no producirán cambios en los resultados del análisis
En el punto 2.2 se hizo una descripción de cada una de las variables, razón por
la que en esta sección solo se dirá cuales se tienen en cuenta para el análisis y cuales
quedan excluidas. Esto se hace tomando como base el objetivo de la investigación y
los resultados que se están esperando.
La base de datos que se tomó para hacer el análisis es bastante completa, tiene
una cantidad de registros bastante alta, lo que permite tener un punto de vista mucho
más acertado y cercano a la realidad.
Hasta este momento del análisis, teniendo en cuenta la cantidad de registros con
los que se cuenta, las validaciones que el software de mesa de ayuda tiene al momento
de generar un nuevo caso y la calidad de los datos, no es necesario generar nuevas
variables o nuevos datos, los cálculos de tiempo, que en este caso son prioritarios, ya
hacen parte de la información suministrada y es suficiente para cumplir con el objetivo
del análisis.
Para poder explicar el formato de los datos primero es necesario aclarar dos cosas:
Por estas dos razones, los datos que se tiene no se deben modificar ni formatear
de ninguna manera, ya que son admitidos por la herramienta tal y como están, dan la
claridad suficiente para poder generar el análisis y al finalizar permitirán hacer los
comparativos que son el objetivo de este proyecto de minería de datos
La base de datos utilizada para nuestro proyecto, es una data con información
puntual de los casos atendidos en una mesa de ayuda de una compañía
gubernamental, la cual es recibida por diferentes medios de atención, esta data, es
categorizada en la mesa de ayuda según el área a la que pertenezca el requerimiento,
la cual es valorada con un nivel de impacto, según la trascendencia que posea el
usuario en los procesos y según el nivel de complejidad de la solicitud del usuario, la
cual es atendida en un número determinado de horas dependiendo del nivel de análisis
y procedimientos que el analista necesite ejecutar para su resolución.
XXXXXXXXXXXXXXXXXXXXXXXX
ARBOL DE DECISIÓN
Para aplicar esta técnica, vamos a seleccionar el nodo de árbol de decisión del
repositorio y lo vamos a conectar con la salida del 70% de los datos del nodo
partitioning.
Alli podemos observar el árbol de decisión el cual para nuestro análisis se despliega de
la siguiente forma.
En el cual, con el primer parámetro de tipo de registro observamos que, el impacto que
predomina es el MEDIO, presentándose ganador en 4 de 6 parámetros presentados.
En el parámetro portal cliente, los casos que son atendidos menor o igual a 0,0151
horas pertenecen a impacto medio, y los atendidos mayor a 0,0151 horas también
pertenecen a impacto medio.
Por el parámetro de llamada, los casos que entran y son atendidos menor o igual a
0,0254 horas, son de impacto medio, y que los casos que se solucionan mayor a
0,0254 horas son de impacto medio.
Para seguir con el proceso de predicción, ahora vamos a buscar el nodo de predictor
de árbol de decisión, y vamos a unir parte superior del nodo con la parte azul del nodo
de árbol de decisión, y la fecha de abajo la vamos a unir con el 30% de casos
sobrantes del nodo de partitioning.
Para obtener la predicción, vamos a unir el predictor de árbol de decisión con el nodo
de scorer.
Alli desplegamos la matriz de confusión, y observamos que la predicción de ocurrencia
que lleguen casos de impacto medio es de 80,088% con un porcentaje de error del
19,912%.
REGRESION LINEAL
NAIVE BAYES
Este nodo lo vamos a unir con el nodo de predicción, el cual es el predictor de Naive
Bayes, el cual en la parte superior estará unido con la salida de datos del Naive Bayes
Learnes, y en la parte de abajo lo vamos a unir con el 30% de datos que salen del nodo
de partitioning, y lo vamos a unir con un nodo de scorer.
Por último, en la matriz de confusión del Naive Bayes podemos observar que la
posibilidad de ocurrencia, que prediga la llegada de casos de impacto medio es de
79,15% con un porcentaje de error del 20,84%.
Para evaluar el árbol decisión, se identifico las variables del problema, y se enumeraron
todos los factores, luego se procedió a priorizar los criterios de decisión, y se identifico
la importancia de cada uno, se observaron las variables de una forma ordenada y
gráfica, la cual nos lleva a una mejor interpretación de los datos, al observar el árbol de
decisión se profundiza en los datos mas convenientes y relevantes y al final evaluando
la efectividad de la decisión se toma como mejor modelo el árbol de decisión para la
clasificación ya que el nivel de ocurrencia es de 80.08% mayor al que se muestra en la
regresión lineal, y Naives Bayes.