Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Aumentar La Precisión Del Diagnóstico de Asma Utilizando Una Definición Operativa para El Asma y Un Método de Aprendizaje Automático
Aumentar La Precisión Del Diagnóstico de Asma Utilizando Una Definición Operativa para El Asma y Un Método de Aprendizaje Automático
com
Abstracto
IntroducciónEl análisis de los datos del Seguro Nacional de Salud se ha llevado a cabo activamente con el fin de realizar investigaciones
académicas y establecer evidencias científicas para la política de servicios de atención médica en asma. Sin embargo, ha habido una limitación
para la precisión de los datos extraídos a través de la definición operativa convencional. En este estudio, verificamos la precisión de la
definición operativa convencional de asma, aplicándola a un entorno hospitalario real. Y mediante el uso de una técnica de aprendizaje
automático, establecimos una definición operativa adecuada que predice el asma con mayor precisión.
MétodosExtrajimos pacientes con asma usando la definición operativa convencional de asma en el hospital St. Mary's de Seúl y el
hospital St. Paul's en la Universidad Católica de Corea entre enero de 2017 y enero de 2018. Entre estos pacientes de asma
extraídos, el 10 % de los pacientes fueron seleccionados al azar. Verificamos la precisión de la definición operativa convencional
para el asma comparando el diagnóstico real a través de la revisión de la historia clínica. Y luego operamos enfoques de aprendizaje
automático para predecir el asma con mayor precisión.
ResultadosSe identificó un total de 4235 pacientes con asma utilizando una definición de asma convencional durante el período de estudio.
De estos, se recogieron 353 pacientes. Los pacientes de asma fueron el 56% de la población de estudio, el 44% de los pacientes no eran
asmáticos. El uso de técnicas de aprendizaje automático mejoró la precisión general. El modelo de predicción XGBoost para el diagnóstico de
asma mostró una precisión del 87,1 %, un AUC del 93,0 %, una sensibilidad del 82,5 % y una especificidad del 97,9 %. Las principales variables
explicativas fueron ICS/LABA,LAMA y LTRA para el diagnóstico adecuado del asma.
ConclusionesLa definición operativa convencional de asma tiene limitaciones para extraer verdaderos pacientes con asma en el mundo real.
Por lo tanto, es necesario establecer una definición operativa estandarizada precisa de asma. En este estudio, el enfoque de aprendizaje
automático podría ser una buena opción para construir una definición operativa relevante en la investigación utilizando datos de reclamos.
†Young Kyoon Kim y Chin Kook Rhee contribuyeron igualmente a este trabajo.
* Correspondencia:
El joven Kyoon Kim
youngkim@catholic.ac.kr
Chin Kook Rhee
chinkook77@gmail.com
La lista completa de información del autor está disponible al final del artículo.
© El(los) autor(es) 2023.Acceso abiertoEste artículo tiene una licencia internacional de Creative Commons Attribution 4.0, que permite el uso, el
intercambio, la adaptación, la distribución y la reproducción en cualquier medio o formato, siempre que se otorgue el crédito correspondiente al autor
o autores originales y a la fuente, se proporcione una enlace a la licencia Creative Commons, e indicar si se realizaron cambios. Las imágenes u otro
material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de
crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la regulación legal
o excede el uso permitido, deberá obtener el permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visitehttp://
creativecommons.org/licenses/by/4.0/. La renuncia de Creative Commons Public Domain Dedication (http://creativecommons.org/publicdomain/zero/
1.0/) se aplica a los datos disponibles en este artículo, a menos que se indique lo contrario en una línea de crédito a los datos.
estructura de árbol similar a un diagrama de flujo, donde los nodos usado. Todos los análisis se realizaron con el software R
internos denotan una prueba de un atributo; cada rama representa un versión 3.4 (The R Foundation for Statistical Computing,
resultado de la prueba y cada nodo hoja tiene una etiqueta de clase. Viena, Austria).
Random forest es un conjunto de árboles de decisión creados
utilizando muestras de arranque de los datos de entrenamiento y
selección aleatoria de características para inducir el árbol. El LGBM fue Resultados
diseñado para ser preciso, eficiente y rápido, que son ventajas cuando Características basales de la población de estudio
se manejan datos a gran escala. XGBoost es una implementación de Se identificó un total de 4.235 pacientes con asma utilizando la
una máquina de aumento de gradiente y uno de los algoritmos de definición convencional de asma. De estos, se reclutaron 353
mejor rendimiento utilizados para el aprendizaje supervisado. Se pacientes (fig.1). Las características basales de los pacientes
puede utilizar tanto para problemas de regresión como de clasificación. inscritos se describen en la Tabla1. Entre el
CatBoost proporciona un marco de refuerzo de gradiente que intenta
resolver las características categóricas mediante una alternativa Tabla 2Fármacos de mantenimiento tomados por la población de estudio
el área bajo la curva característica operativa (AUC) del receptor, así SCI 30 (8,5%)
para evaluar la calidad del modelo en el conjunto de prueba (el 25 LAMA 83 (23,5%)
una validación cruzada de diez veces. Para probar la diferencia en SABA 58 (16,4%)
el índice de evaluación de cada modelo, este estudio usó el Derivados de xantina 81 (22,9%)
arranque en los datos de validación extra, preparó 1000 conjuntos LTRA 184 (52,1%)
de prueba diferentes en 50 tamaños de unidad o 50 000 muestras Agonista beta sistémico 17 (4,8%)
diferencia en el valor promedio del índice La prueba post-hoc de SCIcorticoide inhalado,LABAAgonista beta2 de acción prolongada,LAMAAntagonista muscarínico
353 pacientes, el 49,3% eran mujeres y la edad media fue de 64,6 años; Diagnóstico real por revisión de la historia clínica
El 45,3% nunca fueron fumadores, el 34,8% eran fumadores actuales o Cifra2muestra los diagnósticos reales de la población de estudio.
exfumadores y el promedio de cigarrillos-año fue de 18,3. El volumen Los pacientes con asma comprendían el 56 % de la población del
espiratorio forzado medio posbroncodilatador (BD) en 1 s (FEV1) fue de estudio y el 44 % de los pacientes no tenían asma. De estas, la
2,01 l (76,3 % del valor teórico) y el FEV1/capacidad vital forzada medio enfermedad pulmonar obstructiva crónica (EPOC) fue la más
posbroncodilatador (BD) fue de 65,6. Mesa2muestra los fármacos de frecuente, seguida de la bronquitis, la bronquiolitis obliterante
mantenimiento de la población de estudio. Un inhalador combinado (BO) y otras enfermedades. Además, prescribimos medicamentos
ICS/LABA fue el medicamento prescrito con más frecuencia, seguido para el asma de acuerdo con el diagnóstico real (Fig.3). Un
por los inhaladores antagonistas de los receptores de leucotrienos inhalador LAMA fue el medicamento recetado con más frecuencia
(LTRA) y LAMA. para los pacientes con EPOC y BO.
Tabla 3Habilidades predictivas de los modelos de aprendizaje automático para el Predicción de pacientes con asma utilizando una técnica de aprendizaje
diagnóstico de asma después de una búsqueda en cuadrícula con validación cruzada automático
Tabla 4Habilidades predictivas de los modelos de aprendizaje automático modelos. El modelo predictivo XGBoost (ajuste de hiperparámetro
para el diagnóstico de asma después de la validación cruzada con ajuste de bayesiano) para el diagnóstico de asma mostró una precisión del 87,1
hiperparámetro bayesiano %, un AUC del 93,0 %, una sensibilidad del 82,5 % y una especificidad
del 97,9 %. Este resultado fue mejor que el de la regresión logística. Los
Modelo Exactitud ABC Sensibilidad especificidad
(Recordar) (Precisión) otros modelos mostraron mejores resultados que la precisión real. Los
modelos de aprendizaje automático proporcionaron una mayor
Árbol 0.8353 0.8712 0.8070 0.9388
capacidad predictiva que la definición operativa convencional de asma.
Bosque aleatorio 0.7412 0.8835 0.6140 1.0000
XGBoost 0.8706 0.9301 0.8246 0.9792
La precisión fue significativamente diferente como resultado del
LGBT 0.8118 0.8966 0.7193 1.0000
arranque, en comparación con XBG (Bayes), que mostró la mayor
gatoboost 0.8000 0.9029 0.7544 0.9348
precisión, pero la diferencia en el AUC entre los tres modelos no
LGBTModelo de aumento de gradiente de luz,XGBoostImpulso de gradiente extremo fue significativa. Los tres modelos con el mayor rendimiento
tuvieron un grado similar de precisión (Tabla5).
Figura 4Modelo de árbol de decisión para el diagnóstico de asma. La entropía es una medida de la aleatoriedad en la información que se procesa. Cuanto mayor
es la entropía, más difícil es concluir. La muestra es el número de datos correspondientes al nodo actual. La lista de valores indica cuántas muestras de un nodo
determinado se incluyen en cada categoría. Cada elemento en el dominio de clasificación se denomina clase.
Tabla 5Habilidades predictivas de los modelos de aprendizaje automático para el Inhalador ICS (Tabla6). Este resultado es similar al resultado de la
diagnóstico de asma después de la validación cruzada de arranque técnica de aprendizaje automático.
(Recordar) (Precisión)
Discusión
XGBoost 0.869421 0.893428 0.823082 0.978909 0.89388
Los datos de reclamos se pueden usar para examinar el estado actual y
LGBT 0.858168 0.894258 0.788516 1.0000 0.881333
las tendencias que reflejan el entorno de atención médica real en lugar
(Logi) 0.858168 0.894258 0.788516 1.0000 0.881333
de un entorno experimental limitado. Sin embargo, la precisión del
Árbol 0.834608 0.849462 0.80581 0.938875 0.86682
diagnóstico de la enfermedad incluido en los datos de las
Aleatorio 0.822236 0.867463 0.734925 1.0000 0.846677
bosque
reclamaciones sigue siendo controvertida. Se puede utilizar una
definición operativa para confirmar la presencia o ausencia de
LGBTModelo de aumento de gradiente de luz,XGBoostImpulso de gradiente extremo
enfermedad. Sin embargo, este enfoque tiene algunas limitaciones.
Disminuye el número de pacientes extraídos, lo que diluye la ventaja de
los datos de reclamaciones como big data a la hora de poner
Variables predictivas importantes condiciones para la extracción de pacientes utilizando la definición
Cifras5y6indicar las variables importantes para predecir el operativa. Aunque la extracción con condiciones simples conduce a la
diagnóstico de asma. Las principales variables explicativas extracción de más pacientes, da como resultado la inclusión de más
fueron ICS/LABA, LAMA y LTRA para un diagnóstico adecuado pacientes no deseados.
de asma. La variable más significativa para un correcto En este estudio, examinamos la proporción real de
diagnóstico de asma en el modelo de regresión logística fue el pacientes comparando los pacientes de la muestra en función
uso de un inhalador ICS/LABA, seguida de un de una definición operativa y los datos de su historial médico.
Figura 5Importancia variable basada en los modelos de aprendizaje automático para el diagnóstico de asma después de una búsqueda en cuadrícula con validación cruzada
Figura 6Importancia variable basada en los modelos de aprendizaje automático para el diagnóstico de asma después de la validación cruzada con ajuste de hiperparámetro
bayesiano
BO Bronquiolitis obliterante
LAMA. Sin embargo, si se eliminara LAMA, se excluiría al 13,1 % EPOC Enfermedad pulmonar obstructiva crónica
(26/199) de los pacientes reales con asma. En particular, se VEF Volumen espiratorio forzado en 1 s
excluirían los pacientes con asma grave. Sin embargo, si se utiliza CVF Capacidad vital forzada
CIE-10 Clasificación Internacional de Enfermedades Décima Revisión
un método de aprendizaje automático, la precisión del diagnóstico SCI Corticosteroide inhalado
de asma aumenta, incluso cuando los pacientes se muestrean a LABA Agonista β2 de acción prolongada
través de una definición operativa que incluye LAMA. LAMA Antagonista muscarínico de acción prolongada
muchos estudios previos por definición convencional pueden no SAMA Antagonista muscarínico de acción corta
aumentó en nuestro estudio. En segundo lugar, solo se extrajeron financiado por el Ministerio de Salud y Bienestar de la República de Corea. (número de concesión:
HI18C0522).
y analizaron los pacientes de un hospital de referencia. Existen
diferencias en el uso de medicamentos en hospitales primarios, Disponibilidad de datos y materiales.
secundarios y terciarios.7]. La frecuencia de uso de LAMA en un Los conjuntos de datos utilizados y/o analizados durante el estudio actual están
disponibles del autor correspondiente a pedido razonable.
hospital primario es notablemente baja. El predictor clave en los
métodos de aprendizaje automático fue LAMA. Por lo tanto, la
Declaraciones
efectividad del aprendizaje automático puede parecer exagerada,
pero el aumento en la precisión del diagnóstico es innegable. En Aprobación ética y consentimiento para participar
tercer lugar, nuestro estudio utilizó múltiples modelos de Este estudio se realizó de acuerdo con la Declaración de Helsinki enmendada. La
Junta de Revisión Institucional del Hospital St. Mary de Seúl aprobó el protocolo
aprendizaje automático y las técnicas de optimización de del estudio (KC18ZNSI0850). La Junta de Revisión Institucional del Hospital St.
hiperparámetros pueden aumentar el riesgo de sobreajustar los Mary's de Seúl eliminó el requisito de consentimiento informado por escrito de
modelos a los datos de entrenamiento, lo que puede resultar en cada paciente debido a la naturaleza retrospectiva del estudio.
Referencias
1. Ferver K, Burton B, Jesilow P. El uso de datos de reclamos en la investigación de atención médica.
Salud Pública Abierta J. 2009;2(1):11–24.
2. Lee J, Lee JS, Park SH, Shin SA, Kim K. Perfil de cohorte: Servicio Nacional de Seguros de
Salud-Cohorte Nacional de Muestra (NHIS-NSC), Corea del Sur. Int J Epidemiol.
2017;46(2):e15.
3. Choi JY, Yoon HK, Lee JH, Yoo KH, Kim BY, Bae HW, Kim YK, Rhee CK. Estado actual
de la atención del asma en Corea del Sur: base de datos del servicio de
revisión y evaluación de seguros de salud a nivel nacional. J Torac Dis.
2017;9(9):3208–14.
4. Choi JY, Yoon HK, Lee JH, Yoo KH, Kim BY, Bae HW, Kim YK, Rhee CK. Índices de
pruebas de función pulmonar a nivel nacional en pacientes con asma de
Corea del Sur. J Torac Dis. 2018;10(7):4360–7.
5. Choi JY, Yoon HK, Lee JH, Yoo KH, Kim BY, Bae HW, Kim YK, Rhee CK. Uso a nivel
nacional de corticosteroides inhalados por pacientes con asma de Corea del
Sur: un examen de la base de datos de servicio y revisión de seguros de salud.
J Torac Dis. 2018;10(9):5405–13.
6. Park HJ, Byun MK, Kim HJ, Ahn CM, Rhee CK, Kim K, Kim BY, Bae HW, Yoo KH. Las
visitas regulares de seguimiento reducen el riesgo de exacerbación del asma que
requiera hospitalización en adultos coreanos con asma. Alergia Asma Clin
Immunol. 2018;14:29.
7. Cho EY, Oh KJ, Rhee CK, Yoo KH, Kim BY, Bae HW, Lee BJ, Choi DC, Lee H,
Park HY. Comparación de características clínicas y manejo del asma por
tipos de atención médica en Corea del Sur. J Torac Dis. 2018;10(6):3269–
76.
8. Rhee CK, Yoon HK, Yoo KH, Kim YS, Lee SW, Park YB, Lee JH, Kim Y, Kim
K, Kim J, et al. Utilización médica y costo en pacientes con síndrome de
superposición de enfermedad pulmonar obstructiva crónica y asma. EPOC.
2014;11(2):163–70.
9. Kim S, Kim J, Kim K, Kim Y, Park Y, Baek S, Park SY, Yoon SY, Kwon HS, Cho YS, et al.
Uso de la atención médica y patrones de prescripción asociados con el asma en
adultos en Corea: análisis de la base de datos de reclamos del NHI. Alergia.
2013;68(11):1435–42.
10. Lee E, Kim A, Ye YM, Choi SE, Park HS. Aumento de la prevalencia y la mortalidad del
asma con la edad en Corea, 2002-2015: un estudio nacional basado en la población.
Alergia Asma Immunol Res. 2020;12(3):467–84.
11. Gillman A, Douglass JA. Asma en el anciano. Alergia Asia Pac.
2012;2(2):101–8.
12. Akgun KM, Crothers K, Pisani M. Epidemiología y manejo de enfermedades
pulmonares comunes en personas mayores. J Gerontol A Biol Sci Med Sci.
2012;67(3):276–91.
13. Oraka E, Kim HJ, King ME, Callahan DB. Prevalencia del asma entre los ancianos estadounidenses por
Nota del editor • minuciosa revisión por pares realizada por investigadores experimentados en su campo
• Gold Open Access, que fomenta una colaboración más amplia y un aumento de las citas
• visibilidad máxima para su investigación: más de 100 millones de visitas al sitio web por año
Aprende másbiomedcentral.com/submissions
Contenido de la revista Springer Nature, presentado por cortesía de Springer Nature Customer Service Centre GmbH ("Springer Nature").
Springer Nature apoya una cantidad razonable de trabajos de investigación compartidos por autores, suscriptores y usuarios autorizados ("Usuarios"), para uso
personal no comercial a pequeña escala, siempre que se mantengan todos los derechos de autor, marcas comerciales y de servicio y otros avisos de propiedad.
Al acceder, compartir, recibir o utilizar el contenido de la revista Springer Nature, usted acepta estos términos de uso ("Términos"). A estos efectos, Springer
Nature considera que el uso académico (por parte de investigadores y estudiantes) no es comercial.
Estos Términos son complementarios y se aplicarán además de los términos y condiciones aplicables del sitio web, una licencia de sitio relevante o una suscripción
personal. Estos Términos prevalecerán sobre cualquier conflicto o ambigüedad con respecto a los términos relevantes, una licencia del sitio o una suscripción personal
(solo en la medida del conflicto o la ambigüedad). Para los artículos con licencia Creative Commons, se aplicarán los términos de la licencia Creative Commons utilizada.
Recopilamos y utilizamos datos personales para proporcionar acceso al contenido de la revista Springer Nature. También podemos utilizar estos datos personales
internamente dentro de ResearchGate y Springer Nature y, según lo acordado, compartirlos, de forma anónima, con fines de seguimiento, análisis e informes. De lo
contrario, no divulgaremos sus datos personales fuera de ResearchGate o del grupo de empresas Springer Nature, a menos que tengamos su permiso, como se detalla en
la Política de privacidad.
Si bien los Usuarios pueden usar el contenido de la revista Springer Nature para uso personal no comercial a pequeña escala, es importante tener en cuenta que los Usuarios no pueden:
1. utilizar dicho contenido con el fin de proporcionar acceso a otros usuarios de forma regular oa gran escala o como un medio para eludir el control de acceso;
2. usar dicho contenido cuando hacerlo se considere un delito penal o legal en cualquier jurisdicción, o dé lugar a responsabilidad civil, o sea ilegal de otro
modo;
3. insinúe o sugiera de forma falsa o engañosa respaldo, aprobación, patrocinio o asociación a menos que Springer Nature lo acepte explícitamente por
escrito;
4. usar bots u otros métodos automatizados para acceder al contenido o redirigir mensajes
6. compartir el contenido para crear un sustituto de los productos o servicios de Springer Nature o una base de datos sistemática del contenido de la revista Springer Nature.
De acuerdo con la restricción contra el uso comercial, Springer Nature no permite la creación de un producto o servicio que genere ingresos, regalías, alquileres o ingresos
de nuestro contenido o su inclusión como parte de un servicio pago o para otra ganancia comercial. El contenido de la revista Springer Nature no se puede utilizar para
préstamos interbibliotecarios y los bibliotecarios no pueden cargar el contenido de la revista Springer Nature a gran escala en su repositorio institucional o en cualquier
otro.
Estos términos de uso se revisan periódicamente y pueden modificarse en cualquier momento. Springer Nature no está obligado a publicar ninguna información o contenido en este sitio
web y puede eliminarlo o eliminar características o funcionalidades a nuestro exclusivo criterio, en cualquier momento con o sin previo aviso. Springer Nature puede revocarle esta
licencia en cualquier momento y eliminar el acceso a cualquier copia del contenido de la revista Springer Nature que se haya guardado.
En la máxima medida permitida por la ley, Springer Nature no ofrece garantías, representaciones ni garantías a los Usuarios, ya sea expresa o implícita con
respecto al contenido de la revista Springer Nature y todas las partes renuncian y renuncian a cualquier garantía implícita o impuesta por la ley, incluida la
comerciabilidad o idoneidad para un fin determinado.
Tenga en cuenta que estos derechos no se extienden automáticamente al contenido, los datos u otro material publicado por Springer Nature que puede tener licencia de
terceros.
Si desea utilizar o distribuir el contenido de nuestra revista Springer Nature a un público más amplio o de forma regular o de cualquier otra manera no permitida
expresamente por estos Términos, comuníquese con Springer Nature en
onlineservice@springernature.com