0 calificaciones0% encontró este documento útil (0 votos)
8 vistas15 páginas
Este documento describe el uso de modelos de aprendizaje automático para predecir la retención de pacientes y la supresión viral en cohortes de tratamiento del VIH en Sudáfrica. Los modelos utilizaron datos demográficos, de visitas y de laboratorio para predecir la asistencia a las visitas y los resultados de la carga viral. Los modelos tuvieron éxito en la predicción correcta del 66-79% de las visitas y del 76% de los resultados de la carga viral. Esto puede usarse para segmentar a los pacientes en grupos de
Descripción original:
ateneo clinico
Título original
Applying Machine Learning and Predictive Modeling to Retention
Este documento describe el uso de modelos de aprendizaje automático para predecir la retención de pacientes y la supresión viral en cohortes de tratamiento del VIH en Sudáfrica. Los modelos utilizaron datos demográficos, de visitas y de laboratorio para predecir la asistencia a las visitas y los resultados de la carga viral. Los modelos tuvieron éxito en la predicción correcta del 66-79% de las visitas y del 76% de los resultados de la carga viral. Esto puede usarse para segmentar a los pacientes en grupos de
Este documento describe el uso de modelos de aprendizaje automático para predecir la retención de pacientes y la supresión viral en cohortes de tratamiento del VIH en Sudáfrica. Los modelos utilizaron datos demográficos, de visitas y de laboratorio para predecir la asistencia a las visitas y los resultados de la carga viral. Los modelos tuvieron éxito en la predicción correcta del 66-79% de las visitas y del 76% de los resultados de la carga viral. Esto puede usarse para segmentar a los pacientes en grupos de
and viral suppression in South African HIV treatment cohorts Los modelos predictivos utilizados para mejorar la orientación de las intervenciones mediante modelos de atención diferenciados antes de que los pacientes abandonen los programas de tratamiento, lo que aumenta la rentabilidad y mejora los resultados de los pacientes. • En septiembre de 2016, el Departamento Nacional de Salud revisó sus directrices de tratamiento para ampliar la disponibilidad de TAR a todas las personas que viven con el VIH, independientemente del recuento de células CD4 y del estadio de la enfermedad. • Esta política, ampliamente conocida como "tratar a todos" o "prueba y tratamiento universales" (PTU), promete ofrecer avances sustanciales no solo en la salud de las personas que viven con el VIH, sino también en el acceso a la terapia antirretrovírica. • También en los esfuerzos del país por iniciar y retener al 95% de todas las personas que viven con el VIH (PVVS). • Las razones de la desvinculación son muy diversas, pero los estudios que las investigan suelen tener en cuenta las características basales individuales o combinadas (normalmente en un punto determinado, como el inicio de la terapia antirretroviral) y, a continuación, tratan a grandes grupos (por ejemplo, hombres o personas de determinadas franjas de edad) como homogéneos. Estos enfoques parten de dos supuestos potencialmente erróneos: (1) asumen que los grandes grupos de subpoblación son homogéneos y deben tratarse como una única entidad (por ejemplo, los servicios adaptados a los adolescentes), y (2) asumen que las características predictivas se determinan desde un punto de referencia aleatorio de evaluación hasta puntos finales específicos que van desde los 6 meses hasta varios años después de la evaluación de estas características. • Sin embargo, la ciencia del comportamiento nos dice que los factores conductuales que determinan las pautas de búsqueda de atención sanitaria no sólo difieren según el paciente, sino también a lo largo del tiempo. • Para abordar estos retos, aplican el aprendizaje automático a los datos demográficos, de visitas y de laboratorio recopilados de forma rutinaria y se construye un modelo predictivo capaz de separar eficazmente a los pacientes de alto riesgo de los de bajo riesgo utilizando una combinación de datos clínicos, de laboratorio y de comportamiento (patrones de visitas) disponibles de forma rutinaria. Dados los continuos problemas de financiación para ejecutar y poner en marcha programas de VIH/TB en Sudáfrica, es fundamental una programación de precisión basada en intervenciones rentables y basadas en datos casi en tiempo real. Este enfoque se ve reforzado por la aplicación del análisis predictivo y el aprendizaje automático en los programas existentes. Fuente de datos y población de estudio. Se utilizaron datos longitudinales, anónimos y recopilados de forma rutinaria de pacientes que acceden a la atención y el tratamiento del VIH en centros de tratamiento del sector público en Mpumalanga y el Estado Libre entre enero de 2016 y diciembre de 2018. Los datos se utilizaron para entrenar dos modelos predictivos: (1) modelo de retención y (2) modelo de supresión de LV. Los datos incluyeron registros demográficos, clínicos y de tratamiento antirretroviral que indicaban visitas clínicas, resultados de pruebas de laboratorio y otros indicadores clave del VIH. Para este estudio, se incluyeron registros de pacientes que habían accedido a la atención del VIH (observados en las visitas rutinarias). outcomes • (1) visit attendance≤ 28 days of the next scheduled clinic visit and • (2) suppression of the next HIV viral load (VL) • Para el modelo de retención: Una visita se definió como "asistida" si se observaba una visita a la clínica antes o en los 28 días siguientes a la fecha de la siguiente cita programada. Los pacientes que acudieron a una visita se consideraron seguidos en ese momento. Una visita se consideraba "perdida" si un paciente no acudía en los 28 días siguientes a su cita programada y, en ese momento, se consideraba que el paciente no seguía recibiendo atención. • En segundo lugar, para el modelo de supresión de la carga viral, se consideraba que un paciente tenía una carga viral no suprimida si el resultado de la prueba de carga viral indicaba una carga viral del VIH superior a 400 copias/mL. Durante el periodo de estudio, las directrices nacionales de tratamiento indicaban la monitorización de la CV para todos los pacientes en tratamiento antirretroviral, con la primera CV a los seis meses del inicio y, posteriormente, una vez al año. • Cada visita y prueba de VL se consideraron eventos únicos, de forma que en un único paciente se mediría el resultado de cada visita y prueba de VL, y los resultados de un paciente (perdido/asistido y suprimido/no suprimido) podrían cambiar en las visitas y pruebas posteriores. • Para ambos modelos, se incluyeron los pacientes que iniciaron el tratamiento antirretroviral antes de 2016 siempre que se observaran datos de visitas o de carga viral para ese paciente durante el periodo 2016-2018. Además, para el resultado de CV, se excluyó del análisis cualquier prueba de CV que siguiera a un valor de CV alto (>1000 copias/mL) debido a que la mayoría de estas eran pruebas confirmatorias y, por lo tanto, tenían una alta probabilidad de no estar suprimidas. • También se eliminó cualquier observación de VL que tuviera una VL previa reciente (dentro de los 6 meses anteriores), de nuevo debido a la alta probabilidad de concordancia entre estos resultados. Estas exclusiones eliminan los resultados que son clínicamente más "obvios" para un observador humano y fáciles de clasificar correctamente por el algoritmo. Esto nos permitió construir un modelo centrado en los pacientes que previamente habían estado virológicamente estables o que aún no se habían sometido a la prueba, es decir, que la predicción se centrara en aquellos con mayor riesgo de convertirse al nuevo "estado" de virológicamente no suprimido. • Se probaron algoritmos de clasificación en árbol: regresión logística, bosque aleatorio y AdaBoost. La regresión logística es un ejemplo de clasificador lineal. • El enfoque de bosque aleatorio es un enfoque de conjunto que consiste en una colección de diferentes árboles de decisión compuestos aleatoriamente cuyos resultados se agregan (a través de un proceso de votación de estilo torneo) en un resultado de mejor raza. Su naturaleza aleatoria limita la sobrecarga a la vez que controla el error, lo que los convierte en herramientas de modelado atractivas para hiperespacios complejos con separaciones no lineales entre clases. • Al igual que el bosque aleatorio, el clasificador AdaBoost ("Adaptive Boosting") es un metaestimador que prueba un clasificador en el conjunto de datos original y luego prueba copias adicionales del mismo clasificador en el mismo conjunto de datos; en este caso con árboles de decisión como clasificador • El rendimiento del modelo se evaluó en términos de: • exactitud (proporción de observaciones clasificadas correctamente por el algoritmo entre todas las observaciones del conjunto de pruebas no visto), • sensibilidad (proporción de resultados positivos conocidos en el conjunto de pruebas no visto que el algoritmo identifica correctamente como tales), • el valor predictivo positivo, también conocido como precisión (la proporción de resultados positivos predichos por el algoritmo que corresponden a resultados positivos conocidos en el conjunto de pruebas no visto) • y la especificidad (la proporción de resultados negativos conocidos en el conjunto de pruebas no visto que se identifican correctamente como tales). • Se utiliza el área bajo la curva (AUC) de una curva receiver operating characteristic (ROC) para evaluar el amplio rendimiento de clasificación predictiva del modelo. Un rango de 0,5 indica un poder predictivo nulo, mientras que 1,0 indica un poder predictivo perfecto. Por último, se repitió la comprobación del modelo tras analizar individualmente a los pacientes con las puntuaciones más altas y más bajas y cada una de sus características. Se comprueba manualmente si había puntos en común evidentes y si el algoritmo podía estar eligiendo respuestas obvias o haciendo suposiciones erróneas. • En primer lugar, utilizando únicamente datos demográficos, de visitas y de laboratorio recopilados de forma rutinaria, y dependiendo del método de entrenamiento, los modelos predictivos tienen la capacidad de predecir correctamente la asistencia en un rango del 66-79% de las visitas clínicas programadas y la supresión de la carga viral en el 76% de los resultados de las pruebas de carga viral, dos predictores clave de los objetivos 95-95-95 de UNAID. En segundo lugar, la forma de la curva ROC nos permite identificar umbrales y rangos de diferentes perfiles de riesgo de grupo (grupos que representan una parte importante de las personas con cada resultado). Por ejemplo, en el modelo de CV no suprimida, el 20% de la población representaba más del 50% de los resultados de CV no suprimida, lo que indica diferentes estratos de riesgo dentro de los grupos de población. Se pueden identificar umbrales para segmentar la población en grupos de riesgo ("Rojo"=alto riesgo de resultado, "Amarillo"=riesgo medio de resultado y "Verde"=bajo riesgo de resultado). • Esta estratificación de los grupos de riesgo puede aprovecharse para aumentar el poder predictivo estimado mediante segmentos de población. Dirigirse a los pacientes de riesgo antes de que abandonen la atención sanitaria o no se supriman viralmente permite una mayor eficiencia en el uso de los recursos. En tercer lugar, demostramos un alto valor predictivo negativo (94% y 95% para los modelos de retención y VL, respectivamente) y una sensibilidad >60% para ambos modelos. Esto, combinado con un valor predictivo positivo bajo (VPP~20%), indica potencialmente que los pacientes de bajo riesgo o denominados "verdes" son identificados fácilmente y con precisión por el modelo y tienen rasgos comunes. Por el contrario, los pacientes con alto riesgo de malos resultados o los denominados pacientes "rojos" pueden identificarse fácilmente como "no verdes", pero demostraron mucha heterogeneidad en términos de presentación y motivo subyacente para desvincularse de la atención. • Aunque los modelos no pueden proporcionar la razón subyacente del abandono de la asistencia, la capacidad de identificar a los pacientes de bajo riesgo con gran precisión podría resultar de gran valor para los sistemas sanitarios, ya que permite al personal sanitario dar prioridad a los pacientes no clasificados como de bajo riesgo. Algunas limitaciones: • En primer lugar, dado que para elaborar los modelos se utilizaron datos anónimos recopilados de forma rutinaria a nivel de centro, no fue posible rastrear los datos que faltaban ni corregir las visitas y los datos de laboratorio vinculados erróneamente. • En segundo lugar, los datos a nivel de centro utilizados para definir el resultado en cada uno de los modelos no tienen en cuenta todos los traslados a otro centro, por lo que en la medida en que se haya producido esta clasificación errónea del resultado, sobrestimaremos las visitas perdidas. • En tercer lugar, una de las limitaciones reconocidas en la naturaleza de los métodos de aprendizaje automático, como los árboles de clasificación, es que, si bien estos predictores contribuyen a las diferencias en el riesgo, todavía no podemos explicar completamente cómo o por qué contribuyen en el contexto de un paciente individual. • El siguiente paso consiste en comprender qué valores o rangos del espectro del predictor en combinación con las demás variables en determinados niveles pueden correlacionarse con un determinado resultado. Por ejemplo, no está claro si la relación de riesgo entre las visitas y la edad y los malos resultados se debe a que los más jóvenes llegan a tiempo o los mayores llegan tarde, o viceversa. Se están llevando a cabo actividades adicionales de análisis y modelización para proporcionar descripciones interpretables de cómo el algoritmo es capaz de segmentar las poblaciones de observaciones. Por último, gran parte de la comprensión de por qué son importantes determinados predictores de visitas o demográficos puede residir en matices sociales más sutiles relacionados con las circunstancias sociales y los comportamientos de búsqueda de atención sanitaria de un individuo (como la revelación de información, el empleo o el apoyo familiar).