Está en la página 1de 15

Applying machine learning and

predictive modeling to retention


and viral suppression in South
African HIV treatment cohorts
Los modelos predictivos utilizados para mejorar la orientación de las
intervenciones mediante modelos de atención diferenciados antes de
que los pacientes abandonen los programas de tratamiento, lo que
aumenta la rentabilidad y mejora los resultados de los pacientes.
• En septiembre de 2016, el Departamento Nacional de Salud revisó sus
directrices de tratamiento para ampliar la disponibilidad de TAR a
todas las personas que viven con el VIH, independientemente del
recuento de células CD4 y del estadio de la enfermedad.
• Esta política, ampliamente conocida como "tratar a todos" o "prueba
y tratamiento universales" (PTU), promete ofrecer avances
sustanciales no solo en la salud de las personas que viven con el VIH,
sino también en el acceso a la terapia antirretrovírica.
• También en los esfuerzos del país por iniciar y retener al 95% de todas
las personas que viven con el VIH (PVVS).
• Las razones de la desvinculación son muy diversas, pero los estudios que las investigan
suelen tener en cuenta las características basales individuales o combinadas (normalmente
en un punto determinado, como el inicio de la terapia antirretroviral) y, a continuación,
tratan a grandes grupos (por ejemplo, hombres o personas de determinadas franjas de
edad) como homogéneos. Estos enfoques parten de dos supuestos potencialmente
erróneos: (1) asumen que los grandes grupos de subpoblación son homogéneos y deben
tratarse como una única entidad (por ejemplo, los servicios adaptados a los adolescentes), y
(2) asumen que las características predictivas se determinan desde un punto de referencia
aleatorio de evaluación hasta puntos finales específicos que van desde los 6 meses hasta
varios años después de la evaluación de estas características.
• Sin embargo, la ciencia del comportamiento nos dice que los factores conductuales que
determinan las pautas de búsqueda de atención sanitaria no sólo difieren según el
paciente, sino también a lo largo del tiempo.
• Para abordar estos retos, aplican el aprendizaje automático a los datos
demográficos, de visitas y de laboratorio recopilados de forma rutinaria y
se construye un modelo predictivo capaz de separar eficazmente a los
pacientes de alto riesgo de los de bajo riesgo utilizando una combinación
de datos clínicos, de laboratorio y de comportamiento (patrones de
visitas) disponibles de forma rutinaria. Dados los continuos problemas de
financiación para ejecutar y poner en marcha programas de VIH/TB en
Sudáfrica, es fundamental una programación de precisión basada en
intervenciones rentables y basadas en datos casi en tiempo real. Este
enfoque se ve reforzado por la aplicación del análisis predictivo y el
aprendizaje automático en los programas existentes.
Fuente de datos y población de estudio.
Se utilizaron datos longitudinales, anónimos y recopilados de forma rutinaria de pacientes que acceden a la atención y el tratamiento
del VIH en centros de tratamiento del sector público en Mpumalanga y el Estado Libre entre enero de 2016 y diciembre de 2018.
Los datos se utilizaron para entrenar dos modelos predictivos: (1) modelo de retención y (2) modelo de supresión de LV. Los datos
incluyeron registros demográficos, clínicos y de tratamiento antirretroviral que indicaban visitas clínicas, resultados de pruebas de
laboratorio y otros indicadores clave del VIH. Para este estudio, se incluyeron registros de pacientes que habían accedido a la atención
del VIH (observados en las visitas rutinarias).
outcomes
• (1) visit attendance≤ 28 days of the next scheduled clinic visit and
• (2) suppression of the next HIV viral load (VL)
• Para el modelo de retención: Una visita se definió como "asistida" si se observaba una visita a la
clínica antes o en los 28 días siguientes a la fecha de la siguiente cita programada. Los pacientes
que acudieron a una visita se consideraron seguidos en ese momento. Una visita se
consideraba "perdida" si un paciente no acudía en los 28 días siguientes a su cita programada y,
en ese momento, se consideraba que el paciente no seguía recibiendo atención.
• En segundo lugar, para el modelo de supresión de la carga viral, se consideraba que un paciente
tenía una carga viral no suprimida si el resultado de la prueba de carga viral indicaba una carga
viral del VIH superior a 400 copias/mL. Durante el periodo de estudio, las directrices nacionales
de tratamiento indicaban la monitorización de la CV para todos los pacientes en tratamiento
antirretroviral, con la primera CV a los seis meses del inicio y, posteriormente, una vez al año.
• Cada visita y prueba de VL se consideraron eventos únicos, de forma que en un único paciente
se mediría el resultado de cada visita y prueba de VL, y los resultados de un paciente
(perdido/asistido y suprimido/no suprimido) podrían cambiar en las visitas y pruebas
posteriores.
• Para ambos modelos, se incluyeron los pacientes que iniciaron el tratamiento antirretroviral
antes de 2016 siempre que se observaran datos de visitas o de carga viral para ese paciente
durante el periodo 2016-2018. Además, para el resultado de CV, se excluyó del análisis
cualquier prueba de CV que siguiera a un valor de CV alto (>1000 copias/mL) debido a que la
mayoría de estas eran pruebas confirmatorias y, por lo tanto, tenían una alta probabilidad de
no estar suprimidas.
• También se eliminó cualquier observación de VL que tuviera una VL previa reciente (dentro
de los 6 meses anteriores), de nuevo debido a la alta probabilidad de concordancia entre
estos resultados. Estas exclusiones eliminan los resultados que son clínicamente más
"obvios" para un observador humano y fáciles de clasificar correctamente por el algoritmo.
Esto nos permitió construir un modelo centrado en los pacientes que previamente habían
estado virológicamente estables o que aún no se habían sometido a la prueba, es decir, que
la predicción se centrara en aquellos con mayor riesgo de convertirse al nuevo "estado" de
virológicamente no suprimido.
• Se probaron algoritmos de clasificación en árbol: regresión logística, bosque
aleatorio y AdaBoost. La regresión logística es un ejemplo de clasificador lineal.
• El enfoque de bosque aleatorio es un enfoque de conjunto que consiste en una
colección de diferentes árboles de decisión compuestos aleatoriamente cuyos
resultados se agregan (a través de un proceso de votación de estilo torneo) en un
resultado de mejor raza. Su naturaleza aleatoria limita la sobrecarga a la vez que
controla el error, lo que los convierte en herramientas de modelado atractivas
para hiperespacios complejos con separaciones no lineales entre clases.
• Al igual que el bosque aleatorio, el clasificador AdaBoost ("Adaptive Boosting") es
un metaestimador que prueba un clasificador en el conjunto de datos original y
luego prueba copias adicionales del mismo clasificador en el mismo conjunto de
datos; en este caso con árboles de decisión como clasificador
• El rendimiento del modelo se evaluó en términos de:
• exactitud (proporción de observaciones clasificadas correctamente por el algoritmo entre todas las
observaciones del conjunto de pruebas no visto),
• sensibilidad (proporción de resultados positivos conocidos en el conjunto de pruebas no visto que el algoritmo
identifica correctamente como tales),
• el valor predictivo positivo, también conocido como precisión (la proporción de resultados positivos predichos
por el algoritmo que corresponden a resultados positivos conocidos en el conjunto de pruebas no visto)
• y la especificidad (la proporción de resultados negativos conocidos en el conjunto de pruebas no visto que se
identifican correctamente como tales).
• Se utiliza el área bajo la curva (AUC) de una curva receiver operating characteristic (ROC) para evaluar el
amplio rendimiento de clasificación predictiva del modelo. Un rango de 0,5 indica un poder predictivo nulo,
mientras que 1,0 indica un poder predictivo perfecto. Por último, se repitió la comprobación del modelo tras
analizar individualmente a los pacientes con las puntuaciones más altas y más bajas y cada una de sus
características. Se comprueba manualmente si había puntos en común evidentes y si el algoritmo podía estar
eligiendo respuestas obvias o haciendo suposiciones erróneas.
• En primer lugar, utilizando únicamente datos demográficos, de visitas y de laboratorio recopilados de forma rutinaria, y dependiendo
del método de entrenamiento, los modelos predictivos tienen la capacidad de predecir correctamente la asistencia en un rango del
66-79% de las visitas clínicas programadas y la supresión de la carga viral en el 76% de los resultados de las pruebas de carga viral, dos
predictores clave de los objetivos 95-95-95 de UNAID. En segundo lugar, la forma de la curva ROC nos permite identificar umbrales y
rangos de diferentes perfiles de riesgo de grupo (grupos que representan una parte importante de las personas con cada resultado).
Por ejemplo, en el modelo de CV no suprimida, el 20% de la población representaba más del 50% de los resultados de CV no
suprimida, lo que indica diferentes estratos de riesgo dentro de los grupos de población. Se pueden identificar umbrales para
segmentar la población en grupos de riesgo ("Rojo"=alto riesgo de resultado, "Amarillo"=riesgo medio de resultado y "Verde"=bajo
riesgo de resultado).
• Esta estratificación de los grupos de riesgo puede aprovecharse para aumentar el poder predictivo estimado mediante segmentos de
población. Dirigirse a los pacientes de riesgo antes de que abandonen la atención sanitaria o no se supriman viralmente permite una
mayor eficiencia en el uso de los recursos. En tercer lugar, demostramos un alto valor predictivo negativo (94% y 95% para los
modelos de retención y VL, respectivamente) y una sensibilidad >60% para ambos modelos. Esto, combinado con un valor predictivo
positivo bajo (VPP~20%), indica potencialmente que los pacientes de bajo riesgo o denominados "verdes" son identificados fácilmente
y con precisión por el modelo y tienen rasgos comunes. Por el contrario, los pacientes con alto riesgo de malos resultados o los
denominados pacientes "rojos" pueden identificarse fácilmente como "no verdes", pero demostraron mucha heterogeneidad en
términos de presentación y motivo subyacente para desvincularse de la atención.
• Aunque los modelos no pueden proporcionar la razón subyacente del abandono de la asistencia, la capacidad de identificar a los
pacientes de bajo riesgo con gran precisión podría resultar de gran valor para los sistemas sanitarios, ya que permite al personal
sanitario dar prioridad a los pacientes no clasificados como de bajo riesgo.
Algunas limitaciones:
• En primer lugar, dado que para elaborar los modelos se utilizaron datos anónimos recopilados de forma rutinaria a nivel
de centro, no fue posible rastrear los datos que faltaban ni corregir las visitas y los datos de laboratorio vinculados
erróneamente.
• En segundo lugar, los datos a nivel de centro utilizados para definir el resultado en cada uno de los modelos no tienen en
cuenta todos los traslados a otro centro, por lo que en la medida en que se haya producido esta clasificación errónea del
resultado, sobrestimaremos las visitas perdidas.
• En tercer lugar, una de las limitaciones reconocidas en la naturaleza de los métodos de aprendizaje automático, como los
árboles de clasificación, es que, si bien estos predictores contribuyen a las diferencias en el riesgo, todavía no podemos
explicar completamente cómo o por qué contribuyen en el contexto de un paciente individual.
• El siguiente paso consiste en comprender qué valores o rangos del espectro del predictor en combinación con las demás
variables en determinados niveles pueden correlacionarse con un determinado resultado. Por ejemplo, no está claro si la
relación de riesgo entre las visitas y la edad y los malos resultados se debe a que los más jóvenes llegan a tiempo o los
mayores llegan tarde, o viceversa. Se están llevando a cabo actividades adicionales de análisis y modelización para
proporcionar descripciones interpretables de cómo el algoritmo es capaz de segmentar las poblaciones de observaciones.
Por último, gran parte de la comprensión de por qué son importantes determinados predictores de visitas o demográficos
puede residir en matices sociales más sutiles relacionados con las circunstancias sociales y los comportamientos de
búsqueda de atención sanitaria de un individuo (como la revelación de información, el empleo o el apoyo familiar).

También podría gustarte