Está en la página 1de 9

Machine Translated by Google

Revista  de  Europa  del  Este  de  Tecnologías  Empresariales  ISSN  1729­3774 1/2  ( 115 )  2022

CDU  004.9
Con  el  aumento  diario  en  el  flujo  de  documentos,  así  
DOI:  10.15587/1729­4061.2022.251689
como  la  transición  a  la  gestión  de  documentos  sin  papel  en  
todo  el  mundo,  la  demanda  de  sistemas  de  gestión  de  
documentos  electrónicos  está  aumentando.  Esto  requiere  
significativamente  la  optimización  de  estos  sistemas  en   DESARROLLO  DE
términos  de  recuperación  de  información  de  documentos  
de  calidad  y  gestión  de  documentos.  Sin  embargo,  la   ELECTRÓNICA  INTELIGENTE
investigación  basada  en  métodos  estadísticos  no  puede  
manejar  con  eficacia  grandes  cantidades  de  datos  extraídos  
de  documentos  electrónicos.  En  este  sentido,  los  métodos  
GESTIÓN  DE  DOCUMENTOS
de  aprendizaje  automático  pueden  resolver  este  problema  
de  manera  efectiva.  Este  documento  presenta  un  enfoque   MODELO  DE  SISTEMA  BASADO
para  construir  un  modelo  de  un  sistema  inteligente  de  
gestión  de  documentos  utilizando  técnicas  de  aprendizaje   SOBRE  EL  APRENDIZAJE  AUTOMÁTICO
automático  para  garantizar  el  desempeño  eficiente  de  los  
empleados  en  las  organizaciones.
Los  autores  han  resuelto  una  serie  de  problemas  para  
MÉTODOS
optimizar  cada  uno  de  los  subsistemas  de  gestión  de  
documentos,  dando  como  resultado  el  desarrollo  de  un  
Madina  Sambetbayeva  Autora  para  
modelo  de  sistema  de  gestión  de  documentos  inteligente,  
que  se  puede  aplicar  de  manera  efectiva  a  empresas,  
correspondencia  PhD,  
instituciones  gubernamentales  y  corporativas.  La  viabilidad   Profesora  Asociada*  
y  eficacia  del  modelo  propuesto  de  sistema  inteligente  de   Investigadora  
gestión  documental  basado  en  aprendizaje  automático  y  
Principal**  Correo  electrónico:  
modelado  multiagente  de  los  procesos  de  recuperación  de  
información  proporciona  la  máxima  fiabilidad  y  reduce  el   madina_jgtu@mail.ru  I  nkarzhan  
tiempo  de  trabajo  en  los  documentos.  Los  resultados   Kuspanov  a  
obtenidos  muestran  que  con  la  ayuda  del  modelo  presentado  
Estudiante  de  Doctorado*  Aigerim  
es  posible  desarrollar  aún  más  un  sistema  inteligente  de  
gestión  de  documentos  que  permitirá  que  un  documento  
Yerimbetova  PhD,  Profesora  Asociada,  
electrónico  pase  cualitativamente  por  todo  el  ciclo  de  vida   Investigadora  Líder**  Departamento  
de  un  documento,  desde  el  momento  del  registro  del   de  Ingeniería  de  Software  Instituto  de  Automatización  
documento  hasta  el  final.  con  su  cierre,  es  decir,  su   e  Información  
ejecución,  lo  que  facilitará  enormemente  el  trabajo  diario  de  
los  usuarios  con  grandes  volúmenes  de  documentos.  Al  
Tecnologías  Universidad  Satbayev  Satbayev  str.,  22  a,  
mismo  tiempo,  el  documento  considera  la  aplicación  de   Almaty,  República  de  Kazajstán,  050013  
métodos  de  modelado  de  temas  y  algoritmos  de  análisis  de   S  
texto  basados  en  un  enfoque  de  múltiples  agentes,  que  
pueden  usarse  para  construir  un  sistema  inteligente  de  
andugash  Serikbayev  a  Profesor*  
gestión  de  documentos  Palabras  clave:  sistema  de  gestión  
Shynar  
de  documentos  electrónicos,  aprendizaje  automático,  multi   Bauyrzhanova  Estudiante  de  
doctorado*  *Departamento  de  Sistemas  de  
­tecnologías  de  agentes,  modelado  de  temas
Información  LN  Gumilyov  Universidad  Nacional  de  Eurasia  
Satpayev  str.,  2,  Nur­Sultan,  República  de  Kazajstán,  
010008  **Instituto  de  Tecnologías  de  la  Información  y  Computación  Shevche

Fecha  de  recepción  19.11.2021 Cómo  citar:  Sambetbayeva,  M.,  Kuspanova,  I.,  Yerimbetova,  A.,  Serikbayeva,  S.,  Bauyrzhanova,  S.  (2022).  Desarrollo  de  un  modelo  de  sistema  
Fecha  de  aceptación  17.01.2022   inteligente  de  gestión  de  documentos  electrónicos  basado  en  métodos  de  aprendizaje  automático.  Diario  de  Europa  del  Este  de  Tecnologías  
Fecha  de  publicación  25.02.2022 Empresariales,  1  (2  (115)),  68–76.  doi:  https://doi.org/10.15587/1729­4061.2022.251689

1.  Introducción de  las  solicitudes  procesadas  pueden  llegar  a  varios  miles  por  día.  Al  
mismo  tiempo,  se  tipifican  los  procesos  en  las  estructuras  de  gobierno,  
Los  sistemas  de  gestión  de  documentos  electrónicos  se  utilizan  en   así  como  los  documentos,  por  lo  que  la  aplicación  de  algoritmos  
varios  campos.  En  particular,  los  sistemas  de  gestión  de  documentos   inteligentes  será  más  efectiva  que  en  una  estructura  con  una  estructura  
electrónicos  juegan  un  papel  clave  en  la  estructuración  de  los  procesos   organizacional  compleja  y  única.  El  aprendizaje  automático  puede  
de  trámites  en  las  agencias  gubernamentales,  integrándolos  en  un  solo   acelerar  el  procesamiento  de  documentos,  preparar  todos  los  datos  
orden,  así  como  optimizando  el  trabajo  de  los  servidores  públicos  al   necesarios  para  la  toma  de  decisiones  humanas  y  también  prevenir  errores  humanos.
proporcionar  un  acceso  efectivo  y  fluido  a  los  documentos  con  la  función   La  historia  de  la  gestión  documental  se  remonta  a  finales  del  siglo  
de  automatizar  las  operaciones  de  rutina  para  rastrear  y  buscar  la   XIX  con  la  invención  del  archivador.  En  1898,  Edwin  Granville  Seibels  
información  necesaria  y  la  formación  de  informes  sobre  el  flujo  de   desarrolló  un  sistema  de  archivo  vertical  en  el  que  los  documentos  en  
documentos. papel  se  organizan  en  cajas  colocadas  en  armarios  plegados.  Estos  
Sin  embargo,  cada  año  se  procesa  en  las  autoridades  públicas  un   gabinetes  seguirían  siendo  el  principal  método  de  almacenamiento  de  
volumen  muy  grande  de  documentos  con  un  tiempo  de  procesamiento   documentos  en  el  mundo  de  los  negocios  durante  la  mayor  parte  del  
regulado,  y  la  calidad  y  eficiencia  de  las  interacciones  de  los  documentos   siglo  XX  [1].
determinan  en  gran  medida  la  eficiencia  y  eficacia  de  las  autoridades   La  historia  de  la  gestión  de  documentos  cambió  drásticamente  en  la  
públicas.  A  medida  que  se  desarrolla  el  gobierno  electrónico,  el  número década  de  1980  con  la  creciente  disponibilidad  de  com

68

Copyright  ©  2022,  Autores.  Este  es  un  artículo  de  acceso  abierto  bajo  la  licencia  Creative  Commons  CC  BY
Machine Translated by Google

Tecnologías  de  la  información

tecnología  informática.  El  desarrollo  de  servidores  permitió  a  las   los  resultados  científicos  se  utilizarán  para  la  solución  de  problemas  de  
organizaciones  almacenar  documentos  electrónicamente  en  mainframes   automatización  del  procesamiento  de  información  en  diferentes  sistemas  
centralizados.  Este  fue  el  comienzo  de  los  sistemas  de  gestión  de   de  información.  Sin  embargo,  el  trabajo  [5]  sugirió  desarrollar  un  algoritmo  
documentos  electrónicos.  Mientras  tanto,  la  invención  de  los  escáneres   de  adaptación  utilizando  métodos  de  aprendizaje  automático  para  resolver  
hizo  posible  convertir  documentos  en  papel  en  documentos  digitales.  El   el  problema  de  la  síntesis  estructural­paramétrica  de  EDMS.
crecimiento  de  las  computadoras  ha  permitido  a  las  empresas  crear  y   Se  muestra  que  los  principales  resultados  científicos  obtenidos  en  el  
almacenar  documentos  en  las  computadoras  de  la  oficina  [2]. artículo  incluyen:  criterios  formalizados  para  la  adaptación  de  EDMS;  el  
Los  modernos  sistemas  de  gestión  de  documentos  electrónicos   algoritmo  para  el  diseño  y  adaptación  de  EDMS;  y  desarrollo  de  software  
permiten  almacenar  grandes  volúmenes  de  documentos  digitales  de   para  adaptar  EDMS,  incluida  una  red  neuronal  entrenada  y  una  API.
forma  centralizada.  Para  garantizar  una  buena  clasificación  de  los  
documentos  electrónicos,  muchos  sistemas  de  gestión  de  documentos   El  trabajo  [6]  presenta  los  resultados  de  la  investigación  del  uso  de  
electrónicos  se  basan  en  un  proceso  detallado  de  almacenamiento  de   la  entrada  de  datos  automatizada  a  partir  de  copias  escaneadas  de  
documentos  que  incluye  ciertos  elementos  denominados  metadatos.  Un   documentos  del  departamento  de  contratos  en  comparación  con  la  entrada  
gran  número  de  empresas  modernas  utilizan  protocolos  de  almacenamiento   manual.  Para  mejorar  la  transferencia  de  datos  desde  una  copia  escaneada  
originales  en  sus  sistemas  de  gestión  de  documentos  electrónicos  para   de  un  documento  a  un  sistema  de  gestión  de  base  de  datos  corporativa  
mejorar  la  seguridad  de  la  información,  que  es  lo  que  hace  que  un  sistema  en  la  industria  energética,  se  propone  utilizar  el  aprendizaje  automático,  
presentado  
de  gestión  de  documentos  electrónicos  sea  tan  valioso  para  una  empresa  u  organización   en  forma  de  red  neuronal.  Se  muestra  que  el  aprendizaje  
[2].
Cada  actividad  se  refleja  en  documentos,  ya  sea  de  gestión,  finanzas   automático  permite  clasificar  los  datos  de  los  documentos  analizados,  lo  
o  producción,  por  lo  que  la  gestión  de  documentos  es  un  sistema  vital  para   que  asegura  la  selección  de  la  plantilla  correcta  al  momento  de  generar  
una  organización.  Muy  a  menudo,  la  automatización  de  la  gestión  de   un  documento  electrónico.  Se  fundamenta  la  elección  de  herramientas  
documentos  por  sí  sola  puede  mejorar  significativamente  los  procesos   para  desarrollar  un  módulo  de  software  para  la  extracción  de  datos  y  se  
comerciales  de  toda  una  organización. describe  el  principio  de  su  funcionamiento.  Pero  las  preguntas  relacionadas  
El  aumento  masivo  en  el  volumen  de  flujo  de  documentos  electrónicos   con  los  modelos  de  aprendizaje  automático  de  clasificación  de  texto  
debido  a  la  pandemia  ha  provocado  un  aumento  en  el  trabajo  de  tipo  único   múltiple  no  se  reflejan.  La  razón  de  esto  puede  ser  la  dificultad  en  términos  
mecánico  de  los  empleados,  gerentes  y  personal  de  servicios  de   de  usar  métodos  de  clasificación  en  un  gran  volumen  de  documentos.  El  
documentos  de  las  organizaciones,  quienes  registran  y  responden  a  mil  o   enfoque  de  utilizar  métodos  de  clasificación  se  aplicó  en  el  trabajo  [7].
más  documentos  al  año.  día.  Esto  ha  resultado  en  un  aumento  de  los  
costos  de  mano  de  obra  y  tiempo.  La  relevancia  de  este  problema  en  los   El  trabajo  [7]  utilizó  el  reconocimiento  óptico  de  caracteres  (OCR)  
tiempos  modernos  es  mejorar  los  sistemas  tradicionales  de  gestión  de   para  crear  y  evaluar  múltiples  modelos  de  aprendizaje  automático  de  
documentos  electrónicos,  mediante  la  aplicación  de  métodos  de  análisis   clasificación  de  texto,  incluidos  enfoques  de  "bolsa  de  palabras"  y  
de  datos  y  aprendizaje  automático,  para  optimizar  el  trabajo  de  los   aprendizaje  profundo.  Evaluaron  el  sistema  en  tres  niveles  diferentes  de  
empleados  de  la  organización  y  el  paso  de  calidad  de  todo  el  ciclo  de   clasificación  utilizando  tanto  el  documento  completo  como  entrada  como  
vida  de  la  electrónica.  documento  con  una  mínima  intervención  humana   las  páginas  individuales  del  documento.  Además,  compararon  los  efectos  
en  el  proceso. de  diferentes  métodos  de  procesamiento  de  texto.  Este  modelo  distinguió  
entre  documentos  clínicamente  relevantes  y  documentos  no  clínicamente  
relevantes  con  una  precisión  de  0,973;  entre  subclasificaciones  intermedias  
2.  Revisión  de  la  literatura  y  planteamiento  del  problema con  una  precisión  de  0,949;  y  entre  clases  individuales  con  una  precisión  
de  0,913.  Sin  embargo,  el  documento  solo  proporciona  una  comparación  
El  trabajo  [3]  presenta  los  resultados  de  la  investigación  de  técnicas   de  los  métodos  de  clasificación,  pero  no  proporciona  un  mapa  semántico  
de  aprendizaje  automático  para  discutir  los  desafíos  actuales  en  la  gestión   para  la  subsiguiente  categorización  de  documentos.  La  razón  de  esto  
de  flujos  de  trabajo  científicos  en  sistemas  distribuidos.  Se  muestra  que   puede  ser  las  dificultades  asociadas  con  proporcionar  un  mapa  semántico  
existen  algunos  problemas  potenciales  con  el  uso  del  aprendizaje   para  la  clasificación  de  documentos.  Además,  este  enfoque  se  utilizó  en  el  
automático,  como  la  recopilación  de  datos  de  entrenamiento.  Describieron   trabajo  [7].
el  análisis  a  nivel  de  flujo  de  trabajo,  el  análisis  a  nivel  de  tarea,  el  análisis  
a  nivel  de  infraestructura,  el  análisis  a  nivel  cruzado,  el  análisis  en  línea/ El  trabajo  [8]  describe  los  resultados  de  la  investigación  de  un  
fuera  de  línea  y  la  recopilación  de  datos  de  capacitación.  Creen  que  los   enfoque  patentado  basado  en  el  uso  de  un  mapa  semántico  como  
nuevos  sistemas  de  flujo  de  trabajo  podrán  comprender  las  solicitudes   herramienta  de  reducción  de  características  para  la  clasificación  de  
anteriores  del  usuario,  descubrir  los  datos  relacionados  y  estructurar  los   documentos.  Investigaron  el  impacto  de  este  enfoque  en  la  calidad  de  la  
cálculos  necesarios  para  entregar  los  resultados  deseados.  Pero  las   clasificación  de  documentos  y  describen  su  aplicación  a  la  implementación  
preguntas  relacionadas  con  el  uso  de  técnicas  de  aprendizaje  automático   de  la  categorización  de  documentos.  Pero  no  se  consideran  las  cuestiones  
en  el  espacio  del  flujo  de  trabajo  científico  siguen  sin  investigarse.  La  razón   relacionadas  con  el  uso  de  tecnologías  de  agentes.  La  razón  de  esto  
de  esto  puede  ser  la  dificultad  de  analizar  los  procesos  utilizados  para   puede  ser  las  dificultades  asociadas  con  el  suministro  de  las  tecnologías  
producir  los  resultados,  así  como  la  dificultad  de  reproducibilidad.  Sin   de  los  agentes  para  los  documentos,  lo  que  hace  que  la  investigación  
embargo,  potencialmente  puede  proporcionar  un  medio  de  comparación   relevante  no  sea  práctica.  En  el  trabajo  se  utilizó  el  enfoque  de  desarrollar  
de  diferentes  métodos  científicos  y  sus  similitudes  y  diferencias  con  otros   la  nueva  arquitectura  mediante  el  uso  de  agentes  [9].
enfoques.  Una  opción  para  superar  las  dificultades  correspondientes   El  trabajo  [9]  presenta  los  resultados  de  la  investigación  de  un  nuevo  
puede  ser  el  uso  de  métodos  de  aprendizaje  automático.  Es  este  enfoque   concepto  de  clasificación  del  conocimiento  integrado  en  la  arquitectura  
el  que  se  utilizó  en  el  trabajo  [4].  Los  autores  utilizaron  el  concepto  de   del  agente  cognitivo,  para  acelerar  su  proceso  de  inferencia.  Describieron  
subsistema  de  apoyo  a  la  toma  de  decisiones  a  partir  de  la  aplicación  de   la  nueva  arquitectura  y  el  agente  podrá  seleccionar  solo  la  clase  de  regla  
interacciones  del  tipo  “Usuario  ­  EDMS  ­  Documento”;  y  se  formulan   procesable,  en  lugar  de  intentar  inferir  toda  su  base  de  reglas  de  forma  
tecnologías  de  aprendizaje  automático,  que  se  utilizarán  para  automatizar   exhaustiva.  Pero  no  se  consideran  las  cuestiones  relacionadas  con  el  uso  
el  proceso  de  procesamiento  de  documentos  mediante  el  ejemplo  de   de  tecnologías  multiagente  y  el  modelado  de  temas.  La  razón  de  esto  
documentación  de  diseño  EDMS.  Lo  obtenido puede  ser  las  dificultades  objetivas  asociadas  con  la  parte  costosa  de

69
Machine Translated by Google

Revista  de  Europa  del  Este  de  Tecnologías  Empresariales  ISSN  1729­3774 1/2  ( 115 )  2022

desarrollando  la  arquitectura  con  tecnologías  multiagente  para  documentos.   –  el  proceso  de  dar  instrucciones  (resoluciones)  y
Una  opción  para  superar  las  dificultades  correspondientes  puede  ser   ejercer  control  sobre  la  ejecución  de  documentos;
desarrollar  un  modelo  de  sistemas  de  gestión  de  documentos  utilizando   –  el  proceso  de  lectura,  creación,  aprobación,  firma,
tecnologías  de  aprendizaje  automático,  modelado  de  temas  y  multiagente. finalizar,  ejecutar,  cerrar  y  almacenar  documentos;  –  el  proceso  
de  intercambio  de  documentos  electrónicos;  –  el  proceso  
de  formación  y  almacenamiento  de  informes.
Sin  embargo,  cada  año  se  procesa  en  las  autoridades  públicas  un  
3.  Finalidad  y  objetivos  del  estudio gran  volumen  de  documentos  con  un  tiempo  de  tramitación  regulado,  y  la  
calidad  y  eficiencia  de  las  interacciones  entre  documentos  determinan  en  
El  objetivo  del  estudio  es  construir  un  modelo  de  sistema  inteligente   gran  medida  la  eficiencia  y  eficacia  de  las  autoridades  públicas.  Las  
de  gestión  de  documentos  electrónicos  mediante  algoritmos  de  inteligencia   funciones  de  EDMS  en  los  órganos  gubernamentales  no  se  limitan  a  la  
artificial,  que  permitirá  a  los  usuarios  optimizar  el  paso  de  todo  el  ciclo  de   gestión  interna.
vida  del  documento  con  la  mínima  intervención  humana  en  el  proceso. Un  gran  volumen  lo  ocupa  la  gestión  de  documentos  externos:  la  
comunicación  con  los  ciudadanos  y  las  organizaciones  sobre  la  prestación  
Las  tecnologías  y  herramientas  creadas  proporcionarán  el  modelado   de  servicios  públicos.  Debido  al  desarrollo  del  gobierno  electrónico,  la  
de  procesos  de  extracción  de  información  y  la  creación  de  sistemas   cantidad  de  solicitudes  procesadas  puede  llegar  a  varios  miles  por  día.  Al  
automáticos  de  procesamiento  de  texto  basados  en  la  ontología  del  área   mismo  tiempo,  se  tipifican  los  procesos  en  las  estructuras  de  gobierno,  así  
temática  y  el  conocimiento  lingüístico  representado  por  diccionarios   como  los  documentos,  por  lo  que  la  aplicación  de  algoritmos  inteligentes  
temáticos  y  modelos  de  hechos. será  más  efectiva  que  en  una  estructura  con  una  estructura  organizacional  
El  objetivo  del  estudio  es  desarrollar  un  modelo,  métodos  y  algoritmos   compleja  y  única.
efectivos  que  permitan  la  extracción  de  información  de  los  documentos,  
compilando  análisis  de  texto  inteligente  y  optimizando  todo  el  proceso  de   El  aprendizaje  automático  puede  acelerar  el  procesamiento  de  
negocio  de  la  gestión  documental. documentos,  preparar  todos  los  datos  necesarios  para  la  toma  de  
Para  alcanzar  el  objetivo,  debían  realizarse  las  siguientes  tareas:  –   decisiones  humanas  y  evitar  errores  humanos  [12].
realizar  un  análisis   Mediante  el  uso  de  algoritmos  de  aprendizaje  automático,  un  
comparativo  de  los  sistemas  de  gestión  de  documentos  electrónicos   documento  puede  ir  desde  el  registro  hasta  la  formación  del  propio  
existentes  en  el  mercado  de  los  sistemas  de  información;  –  optimizar  cada   documento  con  una  mínima  intervención  humana  en  el  proceso.
uno  de  los  
subsistemas  del  sistema  de  gestión  de  documentos  electrónicos   Los  EDMS  existentes  son  sistemas  automatizados  de  información  y  
utilizando  métodos  de  aprendizaje  automático;  –  construir  un  modelo  de   referencia  diseñados  para  automatizar  los  siguientes  procesos  tecnológicos,  
sistema  inteligente  de  gestión  de  documentos  para  garantizar  el  trabajo   tanto  intra­agenciales  como  interdepartamentales:  –  procesamiento  de  
eficiente  del  personal  de  las  organizaciones. documentos  
electrónicos  (en  adelante  denominados  ED);  asegurar  los  mecanismos  
de  control  de  la  ejecución  de  la  ED;  –  autorizar  el  acceso  a  los  ED;  –  
proporcionar  
4.  Materiales  y  métodos acceso  a  los  documentos  publicados.

El  aprendizaje  automático  es  un  campo  de  la  informática,  cuyo  objetivo   El  sistema  procesa  los  documentos  creados  y  utilizados  en  el
es  entrenar  a  las  computadoras  para  que  aprendan  y  actúen  sin  una   gestión  de  registros  de  los  organismos  estatales.
programación  explícita.  Específicamente,  el  aprendizaje  automático  es  un   Para  garantizar  estos  objetivos,  EDMS  proporciona  las  siguientes  
enfoque  para  el  análisis  de  datos  que  implica  construir  y  adaptar  modelos   funciones:  preparación,  registro,  almacenamiento,  archivo  y  recuperación  
que  permitan  que  los  programas  "aprendan"  de  la  experiencia.  El   de  ED  a  nivel  departamental  y  enrutamiento  a  nivel  interinstitucional;  
aprendizaje  automático  implica  la  construcción  de  algoritmos  que  adaptan   provisión  de  un  entorno  de  transporte  para  el  intercambio  interinstitucional  
modelos  para  mejorar  su  capacidad  de  formar  predicciones  o  acciones   de  documentos  [13].
adicionales  en  procedimientos  similares  que  se  han  integrado  en  el  modelo  [10]. El  EDMS  consta  de  los  siguientes  subsistemas:  –  un  
Los  Sistemas  de  Gestión  de  Documentos  Electrónicos  (en  lo  sucesivo,   subsistema  para  el  procesamiento  de  la  correspondencia  interna  y  
EDMS)  son  sistemas  automatizados  de  información  y  referencia  diseñados   externa;  –  un  
para  automatizar  los  procesos  tecnológicos  de  preparación,  registro,   subsistema  para  la  preparación  y  aprobación  de  borradores  de  
estructuración  centralizada,  almacenamiento,  archivo,  búsqueda  y   documentos;  
procesamiento  de  documentos,  control  de  ejecución,  autorización  de   –  un  subsistema  de  apoyo  a  la  información  reglamentaria  y  de  
acceso  a  ellos,  emisión  y  distribución  de  documentos,  extracción  de   referencia  (NRIS);  –  un  
información  de  documentos  y  su  análisis,  obtención  de  conocimiento  a   subsistema  para  la  preparación  de  informes  de  información;  –  un  
partir  de  la  información  acumulada,  apoyo  a  la  toma  de  decisiones  [11]. subsistema  de  interacción  con  la  base  de  archivo  temporal;  –  un  
subsistema  para  la  conversión  de  documentos  en  papel
Los  EDMS  están  diseñados  para  mejorar  la  eficiencia  y  la  transparencia   copiar  a  un  formato  electrónico;  –  
de  los  procesos  de  flujo  de  trabajo  y  realizan  las  siguientes  funciones   un  subsistema  de  la  administración  del  sistema;  –  un  
principales:  –  recepción,   subsistema  que  garantiza  la  interacción  con  el  centro  EDMS.
procesamiento,  registro  y  almacenamiento  de  la  correspondencia  
entrante  y  saliente,  incluida  la  correspondencia  interna;  –  recepción,   La  estructura  funcional  de  los  subsistemas  EDMS  se  muestra  en  la  
procesamiento,   Fig.  1.
registro,  almacenamiento  y  redirección Esta  estructura  funcional  es  adecuada  para  los  sistemas  de  gestión  
ción  de  referencias  de  personas  físicas  y  jurídicas; de  documentos  electrónicos  tradicionales  y  requiere  modificaciones  y  
–  recepción,  procesamiento,  registro  y  almacenamiento  de  organin optimizaciones  significativas  para  construir  un  nuevo  modelo  de  un  sistema  
documentos  nacionales  y  administrativos; de  gestión  de  documentos  inteligente.

70
Machine Translated by Google

Tecnologías  de  la  información

Sistema  de  gestión  de  documentos  electrónicos.

Conversión  de   Preparación   Base  de  archivo  


documentos  en  papel  a  ED temporal
de  informes

Administracion  del  sistema
Procesamiento  de  documentos

soporte  INE
Elaboración  de   Interacción  con  el  
borradores  de  documentos. centro  EDMS

Fig.  1.  Estructura  funcional  de  los  subsistemas  del  sistema  de  gestión  de  documentos  electrónicos

5.  Enfoques  para  construir  un  modelo  de  sistema  de  gestión   De  la  tabla  anterior  se  desprende  que  los  sistemas  existentes  en  el  
de  documentos  inteligente país  brindan  una  automatización  completa  de  los  trámites.  Pero  con  el  
aumento  diario  en  el  volumen  de  documentos  con  tiempos  de  
5.  1.  Análisis  comparativo  de  los  sistemas  de  gestión  de  documentos   procesamiento  regulados,  la  calidad  y  eficiencia  de  las  interacciones  de  
electrónicos  existentes  en  el  mercado  de  los  sistemas  de  información   documentos  dependen  en  gran  medida  de  la  prontitud  y  eficiencia  de  
En  el  mercado  de   las  organizaciones.  Las  funciones  de  los  sistemas  de  gestión  de  
los  sistemas  de  información  están  representados  varios  sistemas   documentos  electrónicos  no  se  limitan  a  la  administración  interna,  el  
de  gestión  de  documentos  electrónicos,  pero  solo  pueden  proporcionar   gran  volumen  de  gestión  de  documentos  externos  lo  ocupa  la  
una  automatización  típica  del  papeleo.  La  descripción  de  los  sistemas   comunicación  con  los  ciudadanos  y  las  organizaciones  sobre  la  
de  gestión  documental  implementados  en  el  mercado  del  país  se   prestación  de  servicios.  Al  mismo  tiempo,  la  aplicación  de  algoritmos  
presenta  en  la  Tabla  1. inteligentes  será  más  efectiva  para  aumentar  la  productividad  de  cada  
usuario  y  de  la  organización  en  su  conjunto.

tabla  1

Análisis  comparativo  de  los  sistemas  de  gestión  de  documentos  electrónicos  existentes

Sistema   Descripción  2
1

Una  solución  para  la  gestión  documental  y  la  automatización  de  procesos  empresariales  orientados  a  documentos.  Diseñado  para  organizaciones  
gubernamentales  y  comerciales  (empresas)  de  varios  tamaños.  InDocs  permite  automatizar  el  trabajo  con  varios  tipos  de  documentos,  tanto  dentro  
InDocs
de  la  red  local,  como  en  estructuras  distribuidas  territorialmente  con  el  esquema  complejo  de  flujos  de  información.  La  plataforma  está  implementada  
en  Java.  En  

combinación  con  OOP  y  OOD  (programación  y  diseño  orientados  a  objetos),  TDD  (desarrollo  basado  en  pruebas)  y  una  serie  de  potentes  marcos  
y  bibliotecas  (Spring,  ORM  Hibernate),  la  plataforma  AlmexECM  es  una  herramienta  de  automatización  de  flujo  de  trabajo  potente  y  estable.
AlmexECM

La  plataforma  utiliza  la  tecnología  Apache  Thrift  para  escribir  código  de  integración  en  cualquier  lenguaje  de  programación  moderno.  
SoftLine  ofrece  soluciones  basadas  en  plataformas  ECM  líderes,  listas  para  una  implementación  rápida,  para  minoristas,  bancos,  organizaciones  de  
Línea  blanda  de  tesis
seguros,  empresas  industriales  y  de  construcción,  el  sector  del  petróleo  y  el  gas  y  agencias  gubernamentales.  Software  para  la  
organización  de  un  enfoque  holístico  y  sistemático  para  la  gestión  de  los  procesos  internos  de  la  organización,  a  saber:  Control  de  órdenes  y  
protocolos;  Gestión  de  documentos  
Flujo  de  trabajo  de  sinergia organizativos  y  administrativos;  Registros  de  personal  y  flujo  de  trabajo;  
Informe  de  disciplina  de  desempeño  
Creado  especialmente  para  el  
mercado  de  Kazajstán,  el  sistema  Directum  QAZ  cubre  toda  la  gama  de  tareas  de  automatización  de  la  circulación  interna  de  documentos  
electrónicos  y  procesos  comerciales  específicos  en  empresas  de  diversas  industrias.
DIRECTO
El  sistema  con  mecanismos  inteligentes  integrados  es  compatible  con  ES  de  la  Autoridad  Nacional  de  Certificación  de  la  República  de  Kazajstán  (NCA  
QAZ
RK),  está  localizado  en  el  idioma  kazajo  y  registrado  por  el  Ministerio  de  Justicia  de  la  República  de  Kazajstán  (certificado  de  registro  estatal  No.  
157  del  13.08.2018)
El  sistema  E1  Evfrat  es  una  poderosa  herramienta  para  la  automatización  de  procesos  comerciales  y  flujo  de  documentos  para  empresas  de  todo  tipo  
y  tamaño.  El  sistema  resuelve  tareas  de  manera  eficiente  tanto  dentro  de  una  estructura  pequeña,  como  una  oficina,  un  departamento,  una  unidad  o  
Е1  Evfrat
una  organización  local  en  su  conjunto,  como  dentro  de  una  organización  distribuida  geográficamente  con  un  esquema  complejo  de  flujos  de  información.  
El  sistema  tiene  una  posición  de  liderazgo  en  las  clases  de  sistemas  DMS,  BPM  y  EMC

71
Machine Translated by Google

Revista  de  Europa  del  Este  de  Tecnologías  Empresariales  ISSN  1729­3774 1/2  ( 115 )  2022

Continuación  de  la  Tabla  1

1 2
EDM Docsvision  es  una  plataforma  EDMS/ECM  con  funciones  completas  que  permite  una  amplia  variedad  de  soluciones  para  automatizar  
docsvision procesos  comerciales  y  tareas  de  procesamiento  
de  documentos.  Documentolog  proporciona  el  ciclo  de  vida  completo  de  toda  la  documentación  electrónica  dentro  de  los  procesos  
Documentolog comerciales  actuales  de  la  empresa.  Automatización  de  los  procesos  comerciales  de  cualquier  organización  de  acuerdo  con  las  
normas  internas  de  la  organización  y  las  normas  aprobadas  de  la  República  de  
Kazajstán  El  sistema  le  permite  gestionar  la  creación,  ejecución  y  aprobación  de  documentos.  El  sistema  se  adapta  a  cualquier  tipo  
TENGRIDOC® de  empresa,  admite  el  intercambio  de  documentos  con  oficinas  distribuidas  geográficamente  y  automatiza  tanto  el  trabajo  de  los  
departamentos  individuales  (por  ejemplo,  el  departamento  administrativo)  como  el  de  la  empresa  
en  su  conjunto.  EDMS  está  diseñado  para  organizar  el  flujo  de  trabajo  sin  papel  y  la  tecnología  de  gestión  de  documentos  
Euredoc corporativos. ,  que  asegura  el  movimiento  de  documentos  en  el  cliente  desde  el  momento  en  que  se  crean  o  reciben,  hasta  que  
se  completan  y  ejecutan  o  envían,  además  de  brindar  soporte  de  información  para  las  actividades  organizativas  y  
integro administrativas  Automatización  de  todo  el  “ciclo  de  vida”  del  documento  (desde  la  creación  del  proyecto  para  documentar  la  cancelación  y  el  archivo)

RealSoft Basado  en  una  plataforma  IBM  Lotus  Notes/Domino  IBM  Messaging  and  Collaboration  Solutions  (Collaboration  Solutions  
Messaging  and  Collaboration),  Collaboration  Solution  Portal  (Collab  Sol  Portal)

5.  2.  Optimización  de  cada  uno  de  los  subsistemas  de  gestión  de   del  procesamiento  de  documentos  depende  completamente  del  conjunto  
documentos  electrónicos  utilizando  técnicas  de  aprendizaje  automático   de  atributos:  por  ejemplo,  los  documentos  de  un  destinatario  específico  y  
Para  implementar  un  flujo  de  trabajo  inteligente,  lo  anterior sobre  un  tema  específico  (las  categorías  mencionadas  anteriormente)  
los  subsistemas  deben  mejorarse  utilizando  el  aprendizaje  automático. deben  ser  procesados  por  una  unidad  específica  y  de  acuerdo  con  reglas  
El  tratamiento  de  la  correspondencia  interna  y  externa bastante  específicas.  En  la  actualidad,  la  tramitación  de  cada  documento  
El  subsistema  realiza  las  siguientes  operaciones  básicas: es  100  %  manual.  Pero,  dada  la  naturaleza  estructurada  de  esta  
1.  Registro  de  documentos. información,  las  mismas  reglas  se  pueden  enseñar  fácilmente  a  un  
En  esta  operación,  se  definen  los  detalles  primarios  del  documento  y   algoritmo  de  aprendizaje  automático.  Al  "ingerir"  una  buena  base  de  datos  
se  determina  el  curso  posterior  de  su  procesamiento,  es  decir,  a  quién   en  la  que  los  documentos  se  estructuran  de  acuerdo  con  las  reglas  de  la  
debe  transmitirse  el  documento  para  su  consideración.  El  documento   organización,  los  algoritmos  de  aprendizaje  automático  estarán  listos  para  
puede  pasar  no  solo  directamente  a  la  siguiente  etapa  de  procesamiento   predecir  de  forma  independiente  nuevos  atributos  y  rutas  de  procesamiento  
de  documentos,  sino  también  en  caso  de  que  ya  se  conozca  al  posible   para  nuevos  documentos,  así  como  predecir  la  cantidad  de  días  que  lleva  
ejecutor  de  este  documento,  directamente  para  su  ejecución. completar  una  tarea  y  identificar  al  ejecutante.  Para  que  los  algoritmos  
aprendan  a  hacer  esto  con  gran  precisión,  se  necesita  una  base  de  datos  
2.  Definición  de  resoluciones  para  el  documento. de  grandes  volúmenes  de  datos  estructurados  y  no  tan  estructurados  
En  el  curso  de  esta  operación,  el  documento  se  determina  de   [14];  –  Autocompletar  en  el  registro.  Con  base  en  el  contenido  del  
acuerdo  con  la  estructura  jerárquica  de  la  organización:  el  documento  va   texto,  el  sistema  debe  completar  automáticamente  los  datos  necesarios  
desde  el  director  ejecutivo  hasta  el  ejecutor  final. en  la  tarjeta  del  documento,  determinar  la  relación  con  otros  documentos  
o  correspondencia  similares  y  sugerir  el  destinatario  del  mensaje  en  sí,  
3.  Poner  un  documento  bajo  control. con  base  en  los  datos  sobre  el  cumplimiento  de  asuntos  similares.  Y  de  
Esta  operación  se  puede  realizar  después  de  que  el  documento  se   acuerdo  con  el  mismo  principio,  se  determinarán  los  tiempos  de  
registre  en  el  EDMS  o  en  cualquier  momento  del  procesamiento  del   tramitación  de  los  documentos;  –  abstracción  automática.  La  elaboración  
documento.  Al  momento  de  esta  operación  se  determina  el  albacea   manual  de  resúmenes  (crear  un  "extracto"  breve  y  significativo  del  
responsable  y  el  plazo  para  el  documento documento  completo)  es  un  trabajo  difícil  y  lento,  por  lo  que  también  es  
se  establece  la  ejecución. recomendable  utilizar  herramientas  de  generación  automática  de  
4.  Ejecución  de  las  instrucciones  de  este  documento. resúmenes.  Las  primeras  publicaciones  sobre  el  tema  de  los  métodos  
Según  resoluciones,  se  continúa  con  la  ejecución  de  este  documento.   automáticos  de  resúmenes  de  texto  datan  de  1958.  Desde  entonces  se  
Si  la  ejecución  requiere  la  creación  de  un  documento  de  respuesta,  se   han  desarrollado  un  gran  número  de  métodos  y  ha  mejorado  la  calidad  
lleva  a  cabo  en  forma  de  elaboración  de  un  borrador  de  documento  y  su   de  los  resultados.  Las  tareas  principales  del  resumen  automático  en  un  
aprobación. EDMS  son  resaltar  la  información  principal  en  un  documento  y  evitar  la  
5.  Retiro  del  control. duplicación.
La  retirada  del  control  se  lleva  a  cabo  de  acuerdo  con  los  resultados   En  el  subsistema  de  elaboración  y  aprobación  de  anteproyectos,  se  
de  la  ejecución  del  documento,  si  este  documento  requiere  confirmación. realizan  las  siguientes  operaciones  principales:  para  automatizar  los  
procesos  de  elaboración  y  concertación  de  documentos,  el  tipo  de  
Se  supone  que  se  implementarán  las  siguientes  tareas  en  este   documento  convencional  –  “documento  proyecto”,  caracterizado  por  su  
subsistema:  –   propia  ficha  y  con  su  propio  se  introduce  un  número  de  registro  único.
análisis  de  datos  de  conglomerados.  Antes  de  aplicar  algoritmos  de  
aprendizaje  automático  a  los  documentos,  dado  el  gran  volumen  de  datos,   Este  subsistema  proporciona  enlace  a  los  siguientes  subsistemas:  1.  
es  necesario  particionarlos  en  clústeres.  Esto  resolverá  problemas  como   Subsistema  
encontrar  duplicados,  buscar  documentos  relacionados/similares,  etc.,  y   de  procesamiento  de  correspondencia  interna  y  externa.
también  permitirá  construir  un  algoritmo  para  una  predicción  más  precisa  
de  los  atributos  del  documento; Los  procesos  de  redacción  y  aprobación  de  documentos  se  consideran  
–  predicción  de  atributos  de  documento.  Todo  documento  electrónico   principalmente  como  una  de  las  operaciones  en  el  curso  del  procesamiento  
va  acompañado  de  un  conjunto  de  atributos  (autor,  subdivisión,  tipo  de   de  documentos.  La  interacción  entre  subsistemas  se  realiza  definiendo  
documento,  albacea,  etc.)  que  deben  ser  cumplimentados  para  su  posterior   una  asignación  en  el  subsistema  de  correspondencia  interna  y  externa,  
procesamiento,  así  como  para  la  posterior  búsqueda  de  documentos  y   procesando  una  asignación,  que  se  convierte  en  la  base  para  la  creación  
generación  de  informes.  De  hecho,  el  proceso de  documentos.

72
Machine Translated by Google

Tecnologías  de  la  información

Un  documento  creado  sin  una  definición  de  asignación  explícita  (iniciativa)   generación  de  informes  para  documentos  vencidos  en  tiempo  real,  generación  
se  envía  al  subsistema  de  procesamiento  para  su  registro  después  de  las   de  informes  para  cada  ejecutor  con  carga  de  trabajo  detallada  de  cada  ejecutor,  
operaciones  de  aprobación  y  firma. generación  de  informes  para  documentos  de  control.
2.  El  subsistema  de  trabajo  con  NSI,  para  solicitud  de  elementos  de   El  subsistema  de  interacción  con  los  departamentales
directorios,  que  se  utilizan  para  el  llenado  de  requisitos  de  documentos. archivo  de  EDMS  realiza  las  siguientes  operaciones  principales:
–  esta  función  garantiza  la  transferencia  de  datos  (documentos  finalizados  
Los  libros  de  referencia  se  utilizan  para  la  determinación  de  los  valores. en  la  gestión  de  registros  del  año  anterior)  al
de  detalles  de  borradores  de  documentos,  por  lo  tanto,  durante  el  procesamiento   archivo  departamental  EDMS;
de  documentos,  se  lleva  a  cabo  su  registro,  consulta  de  datos  de  libros  de   –  este  subsistema  interactúa  con  el  subsistema  de  procesamiento  de  
referencia  del  subsistema  NSI  [15]. documentos  y  NSI  para  obtener  la  información  necesaria  y  transferir  
En  este  subsistema,  se  supone  que  deben  implementarse  las  siguientes   documentos  al  depósito  de  archivo  temporal.
tareas:  –  
enrutamiento  inteligente.  El  sistema  en  unos  segundos. El  subsistema  para  convertir  documentos  en  papel  en  registros  electrónicos.
El  sistema  debe  determinar  automáticamente  una  ruta  de  aprobación  de  
un  proyecto  en  función  de  su  contenido,  encontrar  documentos  relacionados  y   Este  subsistema  garantiza  la  automatización  de  la  conversión  de  
redactar  una  resolución  de  documento.  Como  resultado,  se  acelera  el  proceso   documentos  en  papel  a  formato  electrónico.  El  subsistema  de  escaneo  permite  
de  aprobación  y  se  reducen  los  errores  en  la  producción  de  documentos. almacenar  documentos  electrónicos  para  diferentes  bases  de  datos  y  navegar  
También  es  posible  ver  qué  pasos  o  empleados  ralentizan  el  trabajo.  Al  mismo   por  la  lista  de  documentos  escaneados.
tiempo,  el  enrutamiento  inteligente  puede  tener  en  cuenta  la  carga  de  trabajo   En  este  subsistema  se  implementarán  las  siguientes  tareas:  reconocimiento  
de  los  empleados:  si  se  excede  el  límite  de  tareas  del  revisor,  un  colega  se   de  texto  en  documentos  escaneados,  aplicación  del  método  de  aprendizaje  
involucra  en  el  proceso  de  aprobación;  –  preparar  una  plantilla  de  respuesta.  A   automático  a  textos  escaneados.
menudo  se  recibe  el  mismo  tipo  de  solicitudes. El  subsistema  de  administración  del  sistema  realiza  las  siguientes  
operaciones  básicas:  –  Las  
Muy  a  menudo,  se  recibe  el  mismo  tipo  de  consultas.  En  la  elaboración  del   funciones  del  administrador  del  sistema  incluyen  la  gestión  de  la  
proyecto  de  escrito  de  contestación  a  estas  consultas,  el  sistema  deberá   configuración  de  los  subsistemas  relevantes  y  el  acceso  a  las  funciones  
buscar  automáticamente  documentos  similares  y  elaborar  la  plantilla  típica  del   proporcionadas  por  el  sistema,  así  como  la  visualización  de  los  registros  de  
escrito  de  contestación;  –  búsqueda  inteligente  en  el  sistema. auditoría  del  trabajo  de  los  usuarios.  Además,  el  sistema  brinda  auditoría  de  las  
operaciones  realizadas  por  el  mismo  Administrador  del  Sistema,  excepto  la  
El  sistema  debe  permitir  configurar  la  búsqueda  inteligente  de  los   determinación  de  los  derechos  de  acceso  a  los  objetos  del  sistema;
documentos.
En  el  subsistema  de  soporte  de  la  información  normativa­referencial  se   –  Las  funciones  de  administración  del  sistema  quedan  fuera  de  este  
realizan  las  siguientes  operaciones  básicas:  Este  subsistema  da  acceso  al   subsistema:  copia  de  seguridad,  instalación  del  sistema,  configuración  de  
INE  del  sistema.  El parámetros  del  sistema,  etc.
El  NSI  utilizado  en  el  sistema  se  clasifica  en:  1.  NSI   El  subsistema  de  administración  interactúa  con  los  demás  sistemas  
utilizado  en  el  intercambio  de  documentos  interdepartamentales. incluidos  en  el  EDMS  para  determinar  la  configuración  de  estos  subsistemas,  
Para  esta  clase  de  directorios,  se  proporciona  mantenimiento  y   garantizar  la  seguridad  y  auditar  las  operaciones  realizadas  por  los  usuarios  de  
almacenamiento  centralizados. los  subsistemas.
2.  Los  directorios  de  una  determinada  autoridad  pública. Para  implementar  las  tareas  anteriores,  se  propone  utilizar  el  área  de  
Estos  directorios  no  se  utilizan  en  el  intercambio  interdepartamental  y  se   desarrollo  activo  y  actualmente  relevante :  el  modelado  de  temas.
utilizan  para  determinar  los  detalles  de  los  documentos  de  la  propia  autoridad  
estatal. El  modelado  de  temas  es  un  método  para  construir  un  modelo  de  una  
Este  subsistema  proporciona  los  datos  necesarios  a  otros  subsistemas   colección  de  documentos  de  texto,  que  determina  qué  temas  están  relacionados  
incluidos  en  el  SGDE. con  cada  uno  de  los  documentos.  El  modelo  de  tema  de  una  colección  de  
Las  siguientes  tareas  se  implementarán  en  este  subsistema:  directorio   documentos  de  texto  identifica  qué  temas  cubre  cada  documento  y  qué  palabras  
inteligente.  Implementación  de  guía  inteligente,  búsqueda  semántica  de   (términos)  constituyen  cada  tema.  Los  métodos  de  modelado  de  temas  más  
palabras  [16]. populares  actualmente  se  pueden  dividir  en  dos  grupos  principales:  algebraicos  
En  el  subsistema  de  elaboración  de  informes  de  información y  probabilísticos  (generativos).
mación,  se  llevan  a  cabo  las  siguientes  operaciones  básicas.
Este  subsistema  está  diseñado  para  obtener  información  estadística   Los  modelos  algebraicos  incluyen  el  Modelo  de  Espacio  Vectorial  estándar  
sobre  los  documentos  que  se  procesan  en  el  sistema. (VSM),  el  Análisis  Semántico  Latente  (LSA)  y  entre  los  probabilísticos,  los  más  
Además  de  proporcionar  formularios  de  informes  estadísticos  estándar,   populares  son  el  LSA  probabilístico  (pLSA)  y  la  Asignación  de  Dirichlet  Latente  
existe  la  oportunidad  de  crear  plantillas  de  formularios  de  informes  que  reflejen   (LDA),  así  como  la  regularización  aditiva  del  tema.  (ARTM)  basados  en  estos  
los  detalles  de  la  autoridad  pública  respectiva,  utilizando  un  generador  de   algoritmos  [17].
informes  de  alto  nivel.
El  subsistema  de  gestión  de  plantillas  de  informes  y  gener. Durante  el  estudio  se  decidió  utilizar  Latent  Dirichlet  Allocation  ya  que  este  
La  generación  de  formularios  de  informe  proporciona  las  siguientes  funciones: método  evita  los  inconvenientes  de  pLSA,  como  el  “sobreaprendizaje”  y  la  falta  
1.  Recepción  de  formularios  de  informes  utilizando  las  plantillas  de  informes  disponibles. de  patrón  en  la  generación  de  documentos  a  partir  del  conjunto  obtenido  por  
2.  Creación  de  plantillas  de  informe  y  determinación  de  un temas,  lo  que  mejora  significativamente  la  muestra  final.
cronograma  para  la  generación  de  formularios  de  informes  disponibles  para  los  usuarios.

Este  subsistema  interactúa  con  el  subsistema  de  procesamiento  de   Latent  Dirichlet  Allocation  es  un  modelo  generador  utilizado  en  aprendizaje  
documentos  y  NSI  para  obtener  la  información  necesaria  para  proporcionar   automático  y  recuperación  de  información  que  permite  explicar  los  resultados  
información  de  informes. de  las  observaciones  utilizando  grupos  implícitos,  de  modo  que  es  posible  
En  este  subsistema  se  espera  implementar  las  siguientes  tareas:   identificar  las  razones  de  la  similitud  de  algunas  partes  de  los  datos.  Por  
Generación  de  reportes  inteligentes.  Inteligente ejemplo,  si  las  observaciones

73
Machine Translated by Google

Revista  de  Europa  del  Este  de  Tecnologías  Empresariales  ISSN  1729­3774 1/2  ( 115 )  2022

son  palabras  recopiladas  en  documentos,  se  argumenta  que  cada   que  es  fácil  de  usar  y  administrar,  pero  la  eficiencia  de  este  tipo  de  
documento  es  una  mezcla  de  un  pequeño  número  de  temas  y  que  la   sistemas  es  muy  baja.  La  arquitectura  secuencial  implica  el  análisis  
aparición  de  cada  palabra  está  relacionada  con  uno  de  los  temas  del   secuencial  del  texto  en  diferentes  niveles  lingüísticos:  grafemático,  
documento  [17]. morfológico,  sintáctico  y  semántico.
Recientemente,  se  han  desarrollado  enfoques  orientados  
5.  3.  Construcción  de  un  modelo  de  sistema  inteligente  de  gestión   semánticamente  para  el  análisis  de  textos  y  se  han  creado  sistemas  con  
documental  para  garantizar  el  trabajo  eficiente  de  los  empleados  en  las   arquitectura  no  secuencial  [19],  cuando  el  análisis  se  realiza  en  paralelo  
organizaciones   en  todos  los  niveles  sobre  la  base  de  varios  recursos  semánticos  como  
El  modelo  de  un  sistema  inteligente  de  gestión  documental  se   tesauros  y  ontologías.  El  uso  del  enfoque  multiagente  permite  crear  
desarrolla  sobre  la  base  de  nuevos  métodos  y  algoritmos  de  análisis  de   buenas  alternativas  a  los  sistemas  de  análisis  de  texto  con  arquitectura  
texto  basados  en  aprendizaje  automático ,  así  como  un  enfoque   secuencial.  La  peculiaridad  del  enfoque  es  la  representación  del  sistema  
multiagente  [14].  La  novedad  de  los  métodos  de  aprendizaje  automático   desarrollado  con  la  ayuda  de  entidades  autónomas  ­  agentes,  que  tienen  
es  la  configuración  y  el  desarrollo  simplificados  de  los  sistemas  de   la  capacidad  de  interactuar  con  el  medio  ambiente  y  otros  agentes.  En  el  
recuperación  de  información  y  el  cambio  facilitado  de  todo  el  sistema  de   proceso  de  esta  interacción  tiene  lugar  el  funcionamiento  del  sistema.  
gestión  de  documentos  a  una  nueva  área  temática.  Y  el  análisis  de  texto   Tradicionalmente,  la  ventaja  del  enfoque  multiagente  es  el  paralelismo  
multiagente  y  la  extracción  de  información  consisten  en  utilizar  dos  tipos   del  proceso  de  funcionamiento  del  sistema,  debido  a  la  independencia  de  
de  agentes.  Los  agentes  léxicos  corresponden  a  los  objetos  del  área   los  agentes  y  su  capacidad  de  interactuar  entre  sí,  por  lo  que  las  tareas  
temática  que  se  encuentran  en  el  texto,  y  los  agentes  cognitivo­ del  sistema  se  resuelven  localmente  y  por  lo  tanto  acelerar  
lingüísticos  detallan  estos  objetos  y  establecen  conexiones  entre  ellos.   significativamente  el  resultado  [20].
Los  agentes  cognitivo­lingüísticos  están  asociados  a  diversas  operaciones  
cognitivas  asociadas  a  estructuras  lingüísticas  complejas  y  diferentes  
tipos  de  procesamiento  de  la  información  lingüística.  Todos  los  agentes   Habiendo  analizado  todos  los  EDMS  existentes  en  el  país  y  los  
actúan  de  forma  paralela  e  independiente.  Los  agentes  extraen   problemas  no  resueltos  de  gestión  de  documentos  y  algoritmos  de  
información  del  texto  en  forma  de  estructuras  basadas  en  ontologías   aprendizaje  automático,  se  propone  un  modelo  de  EDMS  inteligente  
(hechos,  objetos,  relaciones).  El  resultado  de  sus  acciones  será  la   (Fig.  2)  para  implementar  aún  más  un  documento  de  autoaprendizaje,  
información  representada  por  la  red  de  agentes,  donde  cada  agente   autodesarrollo  y  autorregulación.  sistema  de  gestión.
forma  un  objeto  o  una  instancia  de  una  relación  correspondiente  a  alguna  
clase  de  ontología  [18]. Se  espera  que  la  implementación  del  modelo  anterior  mejore  el  
mecanismo  de  enrutamiento  de  documentos,  el  procesamiento  
El  enfoque  propuesto  está  en  línea  con  las  tendencias  actuales  de  la   estadístico  de  los  esquemas  de  enrutamiento  (estadísticas  de  aprobación,  
investigación  moderna  dedicada  al  procesamiento  y  análisis  automático   delegación,  cuellos  de  botella,  demoras),  la  reconfiguración  de  la  ruta  de  
de  grandes  volúmenes  de  datos  heterogéneos  presentados  en  lenguaje   documentos,  el  desarrollo  del  sistema  de  operaciones  de  documentos,  
natural.  La  mayoría  de  los  sistemas  tradicionales  de  análisis  de  texto   la  formación  de  una  base  de  conocimientos ,  trabajo  con  grandes  flujos  
están  organizados  sobre  la  base  de  una  arquitectura  puramente  secuencial, de  documentos,  reconocimiento  de  documentos,  etc.

Modelo  EDMS  inteligente

Correspondencia  saliente
Envío  para  ejecución,  
seguimiento Gestión
Correo  electrónico
Notificación  
de  entrega
Armonización  (ruta  
Resolución  
inteligente)
(predicción  del  
Autocompletar   Firma  (firma  
ejecutante)
durante  el  registro electrónica)
Correspondencia  entrante
Monitoreo  personal Trabajando  en  
reconocimiento  de  texto (proyectos  de  carga  de  trabajo  de  los  estudiantes  
en  escaneos
Oficina (informe  automático)  reformas,  buscando  
Documentos  en  papel
similares
Predicción  de  atributos  de   documentos)
documentos
Correo  electrónico

Personal

soporte  INE

Fig.  2.  Modelo  inteligente  de  sistemas  de  gestión  de  documentos  electrónicos

74
Machine Translated by Google

Tecnologías  de  la  información

6.  Discusión  de  los  resultados  experimentales  del  estudio  del   el  modelo  de  extracción  de  información  se  presenta  en  forma  de  gráfico  
modelo  de  sistema  inteligente  de  gestión  de  documentos   atribuido  con  las  propiedades  dadas.
electrónicos  basado  en  métodos  de  aprendizaje  automático La  principal  ventaja  de  este  enfoque  es  que  la  tecnología  creada  
reduce  significativamente  el  tiempo  de  trabajo  en  los  documentos,  asegura  
Como  resultado  de  un  análisis  comparativo  de  los  sistemas  de  gestión   un  flujo  de  documentos  óptimo  y  proporciona  transparencia  (explicabilidad)  
de  documentos  electrónicos  tradicionales  existentes,  se  reveló  que  ninguno   de  los  resultados  obtenidos  por  el  sistema  para  el  usuario.  También  el  
de  ellos  puede  presentarse  como  un  sistema  inteligente  de  gestión  de   desarrollo  de  un  subsistema  de  vocabulario,  que  realiza  un  análisis  léxico  
documentos.  En  consecuencia,  eso  requiere  la  mejora  y  mejora  de  los   del  texto  e  identifica  términos  significativos  sobre  la  base  de  diccionarios  
sistemas  tradicionales  de  gestión  de  documentos  electrónicos  en  términos   orientados  a  temas.  Desarrollo  del  módulo  de  tipificación  de  género,  
del  uso  de  métodos  de  formación  avanzados. realizando  análisis  de  género  del  texto  sobre  la  base  de  patrones  de  
En  este  sentido,  se  ha  desarrollado  un  modelo  de  sistema  inteligente  de   género.  Sobre  la  base  de  la  plataforma  multiagente  especializada,  puede  
gestión  de  documentos  electrónicos,  lo  que  se  explica  por  la  introducción   crear  una  implementación  simplificada  de  los  algoritmos  de  análisis  de  
de  nuevos  módulos  para  mejorar  los  procesos  de  negocio  de  la  gestión  de   texto  multiagente.
documentos  electrónicos  (Fig.  2).  Por  lo  tanto,  los  métodos  para  la   Incluirá  un  sistema  de  inicialización  de  agentes,  un  verificador  de  
optimización  de  procesos  comerciales  de  los  sistemas  EDI,  como  la   condicionalidad,  un  componente  para  la  búsqueda  de  modelos  de  control  
búsqueda  de  duplicados,  la  búsqueda  de  documentos  relacionados/ apropiados  y  la  implementación  de  protocolos  de  interacción  de  agentes.
similares  y  el  algoritmo  para  una  predicción  más  precisa  de  los  atributos   Este  artículo  construye  un  modelo  supuesto  de  un  sistema  inteligente  
de  los  documentos,  el  registro  automático  de  documentos,  el  enrutamiento   de  gestión  de  documentos  electrónicos,  lo  que  puede  generar  dificultades  
inteligente,  la  preparación  de  plantillas  de  cartas  de  respuesta  y  se   en  el  desarrollo  del  propio  sistema  y  la  elección  de  métodos  de  análisis  
presenta  la  generación  de  reportes  inteligentes. inteligente.  Sin  embargo,  todas  las  deficiencias  del  estudio  pueden  
En  cuanto  al  análisis  de  textos,  con  base  en  la  investigación  realizada,   eliminarse  con  la  adición  de  nuevos  resultados  de  investigación.
se  ha  formulado  la  tarea  de  resolver  la  ambigüedad  en  el  análisis  de  
textos  y  extraer  información  del  mismo.  El  resultado  del  análisis  de  texto   El  desarrollo  de  esta  investigación  puede  conducir  al  abandono  de  
es  un  conjunto  de  hechos  encontrados  representados  en  forma  de   los  sistemas  tradicionales  de  gestión  de  documentos  electrónicos  en  favor  
cobertura  de  texto  de  objetos  de  información  de  un  área  temática   de  sistemas  inteligentes.  Sin  embargo,  uno  puede  enfrentar  dificultades  
determinada.  La  ambigüedad  del  texto  en  este  nivel  se  manifiesta  en  la   experimentales  cuando  se  trata  de  un  gran  volumen  de  documentos  
presencia  de  relaciones  conflictivas  entre  objetos,  donde  cada  conflicto,   electrónicos.
de  hecho,  genera  una  versión  separada  de  la  cobertura  del  objeto  del  
texto.  En  contraste  con  el  trabajo  [7],  donde  solo  hay  tres  niveles  diferentes  
de  clasificación,  que  usan  el  documento  completo  como  datos  de  entrada,   7.  Conclusiones
y  páginas  individuales  del  documento,  nuestro  problema  propuesto  de  
resolución  de  conflictos  es  resolver  todas  las  ambigüedades  para  que  el   1.  Un  análisis  comparativo  de  los  sistemas  de  gestión  de  documentos  
El  sistema  está  libre  de  conflictos  y,  sin  embargo,  conserva  tantos  objetos   electrónicos  existentes  reveló  que  ninguno  de  ellos  puede  posicionarse  
y  relaciones  como  sea  posible.  Para  resolver  este  problema,  se  utilizarán   como  un  sistema  inteligente  de  gestión  de  documentos.  Tienen  enormes  
una  serie  de  algoritmos  para  resolver  ambigüedades  de  texto  como  parte   deficiencias  y  requieren  mejoras  mediante  el  uso  de  métodos  de  minería  
de  un  sistema  de  resolución  de  conflictos  para  un  sistema  de  análisis  de  texto  mde  
ultiagente.
datos  y  sistemas  multiagente.  El  uso  de  estos  métodos  creará  
Se  propone  un  método  de  verificación  para  familias  de  sistemas   documentos  en  un  solo  proceso  comercial,  optimizando  así  la  función  de  
distribuidos  y  multiagente  generados  por  una  gramática  de  red  dependiente   trabajar  con  documentos.
del  contexto  de  un  tipo  especial.  Este  método  de  verificación  se  puede   2.  Se  analiza  cada  subsistema  del  sistema  de  gestión  de  documentos  
aplicar  para  verificar  las  propiedades  de  los  sistemas  de  resolución  de   electrónicos.  Se  proponen  métodos  para  optimizar  cada  uno  de  estos  
conflictos  de  múltiples  agentes.  El  conjunto  de  instancias  de  ontología   subsistemas.  La  peculiaridad  de  los  métodos  propuestos  es  la  extracción  
encontradas  en  el  proceso  de  análisis  de  texto  se  puede  representar  en   de  información  con  la  ayuda  de  algoritmos  de  aprendizaje  automático  y  
forma  de  sistema  de  información  de  Scott  con  una  relación  de  inferencia   algoritmos  multiagente  que  implementan  el  análisis  de  texto  desde  la  
en  forma  de  conjunto  de  relaciones  de  información.  El  sistema  de   perspectiva  de  la  interacción  entre  agentes.  Otra  característica  de  la  
información  de  Scott  obtenido  genera  un  sistema  multiagente  cuyos   tecnología  desarrollada  es  el  premodelado  de  los  procesos  de  análisis  de  
agentes  resuelven  ambigüedades  léxicas  y  semánticas  y  es  el  algoritmo   texto,  en  el  que  el  modelo  de  extracción  de  información  se  representa  en  
correcto  para  la  resolución  de  ambigüedades. forma  de  un  gráfico  atribuido  con  las  propiedades  dadas.
Sobre  la  base  de  la  investigación,  se  propone  desarrollar  un  entorno  
tecnológico  para  la  creación  de  sistemas  de  extracción  de  información  de   3.  Los  resultados  del  trabajo  permiten  recomendar  el  modelo  
textos  orientados  a  temas  sobre  la  base  de  una  plataforma  multiagente   desarrollado  de  un  sistema  inteligente  de  gestión  de  documentos  
especializada.  Y  también  la  implementación  del  diseño  del  entorno   electrónicos  para  la  realización  de  la  optimización  dada  en  estructuras  
tecnológico,  que  incluye  tres  componentes  principales:  un  subsistema  de   estatales  o  en  organizaciones,  donde  se  implementa  el  sistema  de  gestión  
diccionario,  un  módulo  de  tipificación  de  género  y  un  módulo  de  análisis   de  documentos  electrónicos.  La  principal  ventaja  de  este  enfoque  es  que  
de  texto  multiagente. la  tecnología  creada  sobre  la  base  de  este  modelo  reduce  significativamente  
La  originalidad  del  enfoque  propuesto  en  el  estudio,  en  contraste  con   el  tiempo  de  trabajo  en  los  documentos,  asegura  el  flujo  óptimo  de  
el  trabajo  [9],  donde  la  arquitectura  se  construye  donde  el  agente  puede   documentos  y  proporciona  transparencia  de  los  resultados  obtenidos  por  
seleccionar  solo  la  clase  de  reglas  válidas,  en  lugar  de  tratar  de  derivar   el  sistema  para  el  usuario.
exhaustivamente  toda  la  base  de  reglas,  es  que  la  La  extracción  de  
información  se  realizará  mediante  algoritmos  de  aprendizaje  automático  y  
algoritmos  multiagente  que  implementan  el  análisis  de  texto  a  partir  de  la   Expresiones  de  gratitud
interacción  de  agentes:  agentes  de  información,  emparejados  con  las  
entidades  del  dominio,  y  agentes  de  control,  calculando  las  características   Esta  investigación  ha  sido  financiada  por  el  Comité  de  Ciencias  del  
del  objeto.  Otra  característica  de  la  tecnología  desarrollada  es  el  modelado   Ministerio  de  Educación  y  Ciencia  de  la  República  de  Kazajstán  (Subvención  
preliminar  de  los  procesos  de  análisis  de  texto,  en  el  que No  AP08857179).

75
Machine Translated by Google

Revista  de  Europa  del  Este  de  Tecnologías  Empresariales  ISSN  1729­3774 1/2  ( 115 )  2022

Referencias

1.  Lapshina,  SN  (2012).  Arquitectura  de  la  Empresa.  Ekaterimburgo:  UrFU.
2.  Alpaidín,  E.  (2017).  Machine  learning:  la  nueva  inteligencia  artificial.  Moscú:  Editorial  Alpina,  Grupo  editorial  "Tochka",  208.
Disponible  en:  https://cdn1.ozone.ru/multimedia/1017469342.pdf
3.  Deelman,  E.,  Mandal,  A.,  Jiang,  M.,  Sakellariou,  R.  (2019).  El  papel  del  aprendizaje  automático  en  los  flujos  de  trabajo  científicos.  Revista  
internacional  de  aplicaciones  informáticas  de  alto  rendimiento,  33  (6),  1128–1139.  doi:  https://doi.org/10.1177/1094342019852127  4.  
Obukhov,  A.,  Krasnyanskiy,  M.,  Nikolyukin,  M.  (2019).  Implementación  del  Subsistema  de  Apoyo  a  la  Decisión  en  Sistemas  de  Documentos  
Electrónicos  Utilizando  Técnicas  de  Aprendizaje  Automático.  2019  Multiconferencia  internacional  sobre  ingeniería  industrial  y  tecnologías  
modernas  (FarEastCon).  doi:  https://doi.org/10.1109/fareastcon.2019.8934879  5.  Obukhov,  
A.,  Krasnyanskiy,  M.,  Nikolyukin,  M.  (2020).  Algoritmo  de  adaptación  de  sistema  de  gestión  de  documentos  electrónicos  basado  en  tecnología  de  
aprendizaje  automático.  Progreso  en  Inteligencia  Artificial,  9  (4),  287–303.  doi:  https://doi.org/10.1007/s13748­020­00214­2  6.  Levina,  T.,  
Rodionov,  A.,  Farkhutdinov,  R.  (2020).  Módulo  de  software  para  la  extracción  de  datos  de  documentos  electrónicos.  2020  Congreso  Internacional  
de  Complejos  y  Sistemas  Electrotécnicos  (ICOECS).  doi:  https://doi.org/10.1109/icoecs50468.2020.9278492  7.  Goodrum,  H.,  Roberts,  
K.,  Bernstam,  EV  (2020).  Clasificación  automática  de  documentos  escaneados  de  historias  clínicas  electrónicas.
Revista  internacional  de  informática  médica,  144,  104302.  doi:  https://doi.org/10.1016/j.ijmedinf.2020.104302
8.  Kostkina,  A.,  Bodunkov,  D.,  Klimov,  V.  (2018).  Categorización  de  documentos  basada  en  el  uso  de  la  reducción  de  características  con  
agrupación  de  sinónimos  en  un  mapa  semántico  débil.  Procedia  Computer  Science,  145,  288–292.  doi:  https://doi.org/10.1016/
j.procs.2018.11.061  9.  Chemchem,  A.,  Alin,  F.,  Krajecki,  M.  (2018).  Clasificación  de  Deep  Learning  y  Data  Mining  a  través  del  Razonamiento  de  
Agente  Inteligente.  2018  6ta  Conferencia  Internacional  sobre  el  Futuro  Internet  de  las  Cosas  y  Talleres  en  la  Nube  (FiCloudW).  doi:  https://
doi.org/10.1109/w­ficloud.2018.00009  10.  
Holzinger,  A.,  Kieseberg,  P.,  Tjoa,  AM  y  Weippl,  E.  (Eds.)  (2018).  Aprendizaje  automático  y  extracción  de  conocimiento.  Apuntes  de  clase  en  
informática.  Springer,  372.  doi:  https://doi.org/10.1007/978­3­319­99740­7  11.  Edinaya  
sistema  elektronnogo  dokumentooborota  gosudarstvennyh  organov  (ESEDO).  Disponible  en:  https://www.nitec.kz/index.php/
post/edinaya­sistema­elektronnogo­dokumentooborota­gosudarstvennyih­organov­esedo
12.  Aliev,  VS,  Chistov,  DV  (2011).  Planificación  empresarial  mediante  el  programa  Project  Expert  (curso  completo).  Moscú:  INFRA­M,  432.
13.  Eremeev,  M.,  Vorontsov,  K.  (2019).  Medida  de  complejidad  de  texto  basada  en  cuantiles  léxicos.  Actas  de  avances  recientes  en  natural
Procesamiento  del  lenguaje.  Varna,  270–275.  Disponible  en:  https://aclanthology.org/R19­1031.pdf
14.  Ataeva,  OM  (2016).  Un  modelo  de  información  de  la  biblioteca  semántica  LibMeta.  Software  y  sistemas,  4,  36–44.  doi:  https://doi.org/
10.15827/0236­235x.116.036­044  
15.  Web  Semántica.  Disponible  en:  https://www.w3.org/standards/semanticweb/  16.  
Weitzel,  D.,  Bockelman,  B.,  Brown,  DA,  Couvares,  P.,  Würthwein,  F.,  Hernandez,  EF  (2017).  Acceso  a  datos  para  LIGO  en  OSG.
Actas  de  la  Práctica  y  Experiencia  en  Informática  de  Investigación  Avanzada  2017  sobre  Sostenibilidad,  Éxito  e  Impacto.  doi:  https://doi.org/
10.1145/3093338.3093363
17.  Linev,  AA  (2014).  EDMS  moderno:  de  la  gestión  de  documentos  a  la  gestión  de  la  eficiencia.  Deloproizvodstvo,  1.  Disponible  en:  https://
www.top­personal.ru/officeworkissue.html?314  18.  
Challenger,  M.,  Tezel,  B.,  Alaca,  O.,  Tekinerdogan,  B.,  Kardas,  G.  (2018).  Desarrollo  de  sistemas  multiagente  BDI  habilitados  para  web  semántica  
utilizando  SEA_ML:  un  estudio  de  caso  de  trueque  electrónico.  Ciencias  Aplicadas,  8  (5),  688.  doi:  https://doi.org/10.3390/  app8050688

19.  Jensen,  AB,  Villadsen,  J.  (2020).  GOAL­DTU:  Desarrollo  de  Inteligencia  Distribuida  para  la  Programación  Multi­Agente
Concurso.  Apuntes  de  conferencias  en  informática,  79–105.  doi:  https://doi.org/10.1007/978­3­030­59299­8_4

76

También podría gustarte