Está en la página 1de 10

Clase 10: “Evaluación de pruebas diagnósticas”

Como herramientas de apoyo para el diagnostico existen diversas pruebas que pueden ser serológicas
moleculares o de cualquier índole química para establecer y/o descartar ciertos diagnostico que nosotros
podamos establecer. Sin embargo, algo que no se toma mucho en cuenta o no se considera son las limitaciones
que pueden tener las herramientas diagnosticas, es decir, conocer de ante manos el desempeño que pueden
tener estas herramientas en términos de su capacidad de correctamente identificar individuos que se encuentran
infectados o no infectados. No se considera muchas veces en la práctica clínica o medica el error que pueden
tener presente las diferentes pruebas diagnósticas.

Existen 4 principales medidas de evaluación o parámetros de las pruebas diagnósticas; sensibilidad,


especificidad, valor predictivo positivo o negativo. Estas permiten evaluar el desempeño de las pruebas
diagnósticas. A partir del desempeño podemos determinar lo que se conoce como prevalencia verdadera, es
decir, el numero de individuos positivos del total de la población con todas las correcciones en el desempeño
hechas. Además, se pueden considerar lo que se conoce como uso de pruebas múltiples; es decir, el efecto
que tiene combinar dos o mas pruebas en diferentes formatos en términos de como eso afecta tanto a la
sensibilidad, especificidad y los valores predictivos.

¿Por qué es importante evaluar pruebas diagnósticas?

• El desempeño de una prueba puede ser crítico


• Un resultado diagnóstico tiene consecuencias, por lo tanto, saber si una prueba diagnóstica está
funcionando de forma correcta o no es fundamental para poder determinar cuál es el mejor
tratamiento posible.
Variación y errores en la determinación de la enfermedad

• Para poder evaluar una prueba diagnóstica, siempre van a existir distintos sesgos o desviaciones del
resultado correcto, y esto puede estar dado por variaciones entre los individuos o por errores de
aplicación de las pruebas diagnósticas.
Fuentes de variación y errores:
• Error de muestreo (sesgo de selección) → justo se eligieron a los más sanos o a los más enfermos.
• Variación biológica en la patogenia de las enfermedades (tiempo y espacio). → un individuo infectado
que al momento de realizar una prueba serológica y no presentar aun reacción inmunológica no logra
ser pesquisado o identificado o también en el caso de tuberculosis los animales son identificados
después de dos a tres años.
• Error de medición (prueba diagnóstica). → tiene que ver con los límites de detección que puede tener
una prueba diagnóstica en términos de la cantidad de anticuerpos que puede reconocer o el número de
partículas virales que puede detectar.

Hay que tener en claro cierta terminología que vamos a usar: ¡nos son sinónimos¡
• Estado de salud (binario): Enfermo (D+) o No enfermo (D-). → en términos salud es diferente a si es
positivos o negativos.
• Resultado prueba (binario): Positivo (T+) o Negativo (T-).
• Buscamos que un estado positivo se relacione directamente con el estado de enfermedad y que el
resultado negativo se relacione con el estado de no enfermedad. Hay que tener en cuenta que esto no
siempre ocurre así, existen desviaciones.
• Veremos cómo nosotros podemos medir esas desviaciones en los resultados de las pruebas
diagnósticas.
Validación de una prueba diagnóstica

• “evaluation of a precess to determine ist fitness for a particular use” OIE

Fase 1: Laboratorio, en la cual:

• Optimización y estandarización de los reactivos


• Sensibilidad y especificidad analítica

La sensibilidad analítica es el limite de detección que tiene la prueba diagnostica para encontrar el analito (lo
que busca la prueba diagnóstica, ej: PCR busca ADN o ARN) que se está buscando, ello cual depende bastante
del tipo de prueba diagnóstica. Especificidad analítica es la capacidad que tiene la prueba de detectar el
analito especifico que se busca y no otro, muchas veces virus o bacterias generan respuestas cruzadas que
pueden confundir el diagnostico.

Fase 2: “Campo” validación, que tan bien funciona la prueba diagnostica

• Predicción:
o Repetibilidad (intra – laboratorio) → se obtienen resultados consistentes al repetir múltiples veces
la prueba.
o Reproductividad (inter - laboratorio) → mandar el protocola de la prueba a otro laboratorio con
las mismas muestras y que se obtengan los mismos resultados.
• Exactitud (desempeño de la prueba diagnóstica): se mide a través de
o Sensibilidad (Se)
o Especificidad (Sp)
o Ambas miden el grado de error hecha por la prueba

Clasificando el estado de salud

• Con el uso de pruebas diagnósticas busco facilitar la clasificación de los individuos en estados de salud
o enfermedad.
• Pruebas diagnósticas según el momento en que son utilizadas: 3 tipos
o Clínica, tamiz (subclínico) e investigación.
• ¿Qué tan bien puede una prueba diagnóstica clasificar a un individuo en el grupo de enfermedad o no
enfermedad?
o Idealmente, todos los sujetos que tienen la enfermedad deben ser clasificados por la prueba
diagnóstica como “enfermos” y viceversa. Esta situación ideal comúnmente no ocurre.
o La capacidad de clasificar a los individuos en el estado correcto de la enfermedad depende del
desempeño de las pruebas, entre otras cosas.
o Sin embargo, siempre ocurre un grado de error a los que se denominan falsos positivos y falsos
negativos.
▪ Falsos positivos: dan resultado + a pesar no tener la enfermedad.
▪ Falsos negativos: dan resultado – a pesar de si tener la enfermedad.
Prueba diagnóstica clínica y tamiz:
• En la práctica clínica son las 2 pruebas que comúnmente se utilizan.
• Una prueba clínica es utilizada para determinar la presencia o ausencia de una enfermedad cuando un
sujeto muestra signos o síntomas de la enfermedad. → permiten realizar un diagnostico diferencial, es
decir, con ciertas características de la enfermedad confirmó o descarto a través del uso de la prueba
clínica.
• Una prueba tamiz detecta a individuos asintomáticos que pueden tener la enfermedad. Comúnmente
se utilizan en actividades de vigilancia epidemiológica (búsqueda activa de la infección).
• La prueba clínica se realiza después de que una prueba tamiz da positiva, para establecer un diagnóstico
definitivo.
Ejemplos Prueba tamiz: realizar pruebas antes de la presentación de signos clínicos.

• PAP → Cáncer cervical uterino, realizar exámenes antes de que se presenten signos o síntomas para
detectarlos de forma temprana para tener una mejor probabilidad de éxito en el tratamiento.
• Antígeno prostático → Detectar de forma temprana el cáncer de próstata
• Colesterol sanguíneo→ Enfermedades cardiacas
• Glucosa sanguínea → Diabetes
• Presión ocular → Glaucoma
• Mamografía → Cáncer de pecho

Desempeño de una prueba diagnóstica (sensibilidad y especificidad)

• Independiente del objetivo de la prueba diagnóstica, es importante tener claro qué tan buena es esta
prueba clasificando a los individuos.
• Tenemos que determinar cuál es el error de la prueba al ser utilizada.
• Este error está dado por 2 parámetros; la sensibilidad y la especificidad.
o Sensibilidad: es la habilidad de una prueba de identificar correctamente a aquellos individuos que
tienen la enfermedad.
o Especificidad: es la habilidad de una prueba de identificar correctamente a aquellos individuos
que no tienen la enfermedad.
• La sensibilidad y especificidad son parámetros que conocemos de una prueba diagnóstica antes de
ocuparla.
Determinación de la sensibilidad y especificidad de una nueva prueba

• Depende de si existe la prueba de oro “Gold standard” o no.


o Dos situaciones
▪ Existe una prueba de oro (Gold standard)
▪ No existe “Prueba de oro” → no se ve en este curso
• La prueba de oro es aquella que permite conocer el estado verdadero de salud o enfermedad en los
individuos. Es una prueba que tiene un 100% de sensibilidad y especificidad → es una prueba perfecta
por ejemplo para veterinarios la prueba más confiable es la necropsia (cuando el individuo está muerto).
- Es usualmente invasiva y costosa.
- Permite un punto de comparación con la nueva prueba diagnóstica.
Sensibilidad y especificidad utilizando una prueba de oro

• Una prueba de oro va a conocer de forma perfecta


aquellos individuos que tienen la enfermedad
(positivos) y aquellos que no la tienen (negativos).
• La comparación entre los resultados de la prueba de
oro con los resultados de una nueva prueba diagnóstica
genera una tabla de 2x2 (tabla de contingencia). Esto
nos permite ver qué proporción de individuos fueron
clasificados en forma correcta o incorrecta.

• De esto resulta lo siguiente:


- Verdaderos positivos: individuos enfermos con resultado positivo en la prueba diagnóstica.
- Verdaderos negativos: no están enfermos con resultado negativo en la prueba diagnóstica.
• Las pruebas diagnósticas pueden generar 2 tipos de errores:
- Falsos positivos: no enfermos pero positivos en la prueba diagnóstica de oro → reacción
cruzada con otros MOO. OCURREN POR FALTA DE ESPECIFICIDAD.
- Falsos negativos: enfermos pero negativos en la prueba diagnóstica de oro → la prueba no es
lo suficientemente sensible para detectar a todos los individuos que están enfermos. OCURREN
POR FALTA DE SENCIBILIDAD.
Sensibilidad

• Es la habilidad (o probabilidad de la prueba de identificar


correctamente a aquellos individuos con la enfermedad.
• Verdaderos positivos / total de enfermos.
• La falta de se incrementa la proporción de falsos
negativos en la prueba.
Especificidad

• Es la habilidad (o probabilidad) de una prueba de identificar


en forma correcta aquellos individuos que no tienen la
enfermedad.
• Verdaderos negativos / total de no enfermos.
• La falta de especificidad incrementa la proporción de falsos
positivos a la prueba.
Determinación de la sensibilidad y especificidad de una nueva prueba

• Asumiendo una población de 1000 individuos


• 100 tienen una enfermedad → verdadero estado
• 900 no tienen la enfermedad → verdadero estado
• Una nueva prueba diagnóstica es utilizada

• Si una prueba tiene una sensibilidad de un


80% quiere decir que yo tengo un 80% de
probabilidad de tener un resultado positivo si
es que yo aplicase esa prueba en un individuo
enfermo.
• 89% de probabilidad de obtener un resultado
negativo si es que aplico es prueba en un
individuo que no está enfermo.
• “Si es que” → porque nos habla sobre una
prueba diagnóstica antes de ocuparla.

“Tanto la sensibilidad como la especificidad me dicen cosas de la prueba antes de ocuparla” → si es que se
aplica, como se comporta la prueba.
Ejemplo:

La prueba de q-PCR tiene una sensibilidad de


alrededor del 80% y una especificidad del 98%,
antecedentes que se saben antes de ocuparla.

Si yo multiplico los 12000 test que se hacen al día


por mes (30) implica que se hacen 360000 test al
mes. Esos 12000 test se realizan en recintos
hospitalarios, es decir, que son aplicados en una
población que tiene una mayor probabilidad de estar
infectados.

Si aproximadamente el 30% esta realmente


infectado se habla de 108000 casos al mes.

De los 108000 infectados para saber cuáles me dan positivo se multiplica por la sensibilidad (80% / 0.80) →
(VP), dando como resultado que 86400 van a arrojar resultados positivos, sin embargo 21600 individuos son
falsos negativos (108000 x (1 – 0.80)) y 2160 falsos positivos.

Determinación de la sensibilidad y especificidad en ausencia de una prueba de oro

• No todas las enfermedades tienen una prueba de oro, entonces necesitamos otras herramientas
para calcular sensibilidad (Se) y especificidad (Sp) → Pj: Paratuberculosis
• Los modelos bayesianos de clase latente permiten estimar la Se y Sp sin la necesidad de una
prueba de oro, pero para poder usar este modelo hay que respetar 2 supuestos básicos:
- Existe una diferencia de prevalencia entre las poblaciones.
- La prueba se comporta en forma homogénea entre las poblaciones.
• Los modelos bayesianos son muy difíciles de entender para este curso. Sólo hay que saber que son
una alternativa cuando no tenemos una prueba de oro.
Valores predictivos

• Son características de los resultados de la prueba diagnóstica. Me indican cuánto le debo creer a los
resultados positivos o negativos de la prueba cuando ya la he utilizado. La Se y la Sp son
características de la prueba antes de ocuparla.
• Valor predictivo positivo (VPP): es la proporción de pacientes que dieron positivo a la prueba y
que realmente tienen la enfermedad. Verdaderos positivos / total de positivos de la prueba.
• Valor predictivo negativo (VPN): es la proporción de pacientes que han tenido resultados negativos
a la prueba y que están realmente libres de la enfermedad. Verdaderos negativos / total de
negativos de la prueba.
• VPP y VPN no son características fijas de la prueba, sino que cambian en relación con la población
en donde se ocupa.
Otra interpretación de los valores predictivos:
• Si un individuo da positivo a una prueba ¿cuql es la probabilidad de que tenga la enfermedad?
• Si un individuo da negativo a una prueba, ¿Cuál es la probabilidad de que No tenga la
enfermedad?
Valores predictivos (fórmulas)

• Podríamos calcular directamente VPP y VPN si conociésemos la Se y Sp de la prueba diagnóstica,


así como la prevalencia de la población. Asumiendo una población de 1000 individuos
• 100 tienen una enfermedad → verdadero estado
• 900 no tienen la enfermedad → verdadero estado
• Una nueva prueba diagnóstica es utilizada

• Si yo obtuviera un resultado positivo en la prueba diagnóstica, sólo tengo un 44% de confianza de


que ese resultado positivo es correcto, por lo tanto, no puedo confiar mucho en que los pacientes
con valor positivo estén realmente enfermos. → implica no llegar y creer que el resultado es positivo
puesto que solo un 44% es correcto
• Si obtuviese un resultado negativo, estoy un 98% seguro de que ese resultado es correcto.
Fórmulas alternativas de los valores predictivos:

Valores predictivos dependen de:

• La prevalencia de la enfermedad en la población


sometida a prueba, y la propia prueba (Se y Sp).
• En general, VPP depende más de la Sp y menos de
la Se de la prueba, si la prevalencia de la
enfermedad es baja.
• Si asumimos una Se y Sp constante de 95%
podemos ver que en la medida que va aumentando
la prevalencia, el VPP (azul) tiende a ir aumentando.
Contrariamente que va aumentando la prevalencia,
el VPN (rojo) va disminuyendo.
• La prevalencia tiene una asociación positiva con el VPP y una asociación negativa con el VPN.
• El efecto de la prevalencia es mucho mayor sobre el VPP.
• Cada vez que se es más exitoso en el programa de control el desempeño de la prueba diagnóstico,
específicamente, el desempeño del VPP va a ir disminuyendo, aquí cuando nos acercamos a 5% de
prevalencia de la enfermedad el VPP es muy bajo, alrededor del 10%. Si se llegase a tener un
resultado positivo realmente no se sabe si ese individuo está infectado o no. En la medida que va
disminuyendo la prevalencia cada vez es mas probable que se eliminen individuos que son falsos
positivos.
• El desempeño se una prueba diagnóstica términos de sus valores predictivos no es constante, si no
va a variar con la prevalencia que existe en el rebaño o población, y en la medida que se están
teniendo éxito con un programa de control la prevalencia va a ir disminuyendo y por lo tanto el
desempeño de la prueba diagnóstica también va a ir cambiando y disminuyendo. En la medida que
se va disminuyendo la prevalencia en un rebaño NO se puede mantener misma herramienta
diagnostica.
• En la medida que se disminuyen la prevalencia del rebaño producto del éxito de una prueba control
se van a tener que utilizar herramientas que son mas SENCIBLES que a su vez son mas caras. Este
es el principal problema de porque se llega al control de una enfermedad, pero no se llega a la
erradicación de una enfermedad.
Prevalencia verdadera

• La falta de Se y Sp genera un sesgo en la determinación del verdadero estado de salud de los


individuos.
o El objetivo es identificar a los D+, pero obtengo T+.
o D+ = T+ → si bien enfermedad se correlaciona directamente con positividad NO SON
IGUALES.
• Si se determina la prevalencia basado solamente en los resultados de la prueba, se calcula la:
o Prevalencia aparente (Pr(T+)). → la probabilidad de tener un resultado positivo.

• Basados en la Se y Sp se puede determinar la prevalencia verdadera (Pr(D+)) a partir de la


prevalencia aparente.
• En la medida que baja la Se de una prueba diagnóstica la prevalencia aparente va a ser siempre
menor que la prevalencia verdadera.
Prevalencia verdadera: ejemplo:
La falta de sensibilidad subestima mi
prevalencia real. Basados en el test
serológico el predio tenía un 9% cuando
en realidad el predio tenia casi el doble
de infección (17%).
La falta de especificidad (especificidad
menor a sensibilidad) implica que la
prueba diagnostico sobreestima la
prevalencia verdadera. Esta situación
es MUY RARA porque generalmente
ocurre que la sensibilidad tiende a ser
menor que la especificidad.
Hasta aquí llego a la clase…

Uso de pruebas múltiples

• En vez de utilizar una prueba diagnóstica, vamos a utilizar 2 o más en forma secuencial o simultanea
buscando mejorar los niveles de Se o Sp al combinar estas pruebas.
• Es comúnmente utilizado en la práctica médica.
• El uso de esto depende de:
o Costo, invasividad, volumen de prueba, presencia y capacidad de la infraestructura del
laboratorio, urgencia, etc.
• Puede realizarse de forma secuencial o simultanea
Muestreo secuencial (prueba en dos etapas)

•Después que se realizó la primera prueba (tamiz).


o Los que dieron positivo
o Segunda prueba para reducir los falsos positivos.
• Aumentará la Sp, pero con una Se reducida.
• En una mezcla de pruebas puedo mejorar o la Se o la Sp diagnóstica, pero nunca ambas. Por eso,
tenemos que saber bien qué es lo que buscamos mejorar.
EJEMPLO:
Muestreo secuencial (prueba en dos etapas)
• El individuo es positivo a la enfermedad cuando ambas pruebas dan
resultados positivos

• El sujeto es negativo a la enfermedad cuan cualquiera de las pruebas fue


negativa test

Otros tipos de muestreos en dos etapas


• Negativos a la primera prueba son analizados con una segunda prueba
• ¿Cuál es el efecto de re-evaluar a los negativos de la primera prueba?
• Se encuentran más verdaderos positivos
o La sensibilidad neta será mayor que la sensibilidad de las pruebas individuales
• También se encuentran más falsos positivos
o La especificidad neta será inferior a la especificidad de las pruebas individuales

Muestreo simultaneo (paralelo)


• Cuando dos o más pruebas se aplican al mismo tiempo (en paralelo).
• Un individuo será clasificado como positivo si tiene en cualquiera de las pruebas un resultado positivo
y sólo serán clasificados como negativos aquellos que en ambas pruebas tengan negativo.
• El objetivo es maximizar la probabilidad de que los sujetos con la enfermedad (verdaderos positivos)
sean identificados (aumentar la sensibilidad).
• En consecuencia, también se identifican más falsos positivos (disminución de la especificidad).
Muestreo Simultaneo: cálculo de la sensibilidad neta
• Cuando dos pruebas son aplicadas en forma simultánea, los positivos a la enfermedad corresponden
a aquellos individuos que fueron positivos a cualquiera de las pruebas •
• Regla de la adición de probabilidades

Muestreo Simultaneo: cálculo de la especificidad neta

• Cuando dos pruebas son aplicadas en forma simultánea, los negativos a la enfermedad
corresponden a aquellos individuos que fueron negativos a ambas pruebas.
• Regla de la multiplicación de probabilidades.
Ejemplo de muestreo simultaneo

• En una población de 1000 individuos, la prevalencia de la enfermedad es del 20%


• Se utilizan dos pruebas (A y B) al mismo tiempo
• La prueba A tiene una sensibilidad del 80% y una especificidad del 60%
• La prueba B tiene una sensibilidad del 90% y una especificidad del 90%
• Sensibilidad y especificidad neta del uso simultaneo de las pruebas Ay B

Muestreo en secuencia vs simultaneo ¿Qué se gana y qué se pierde?

• En pruebas simultáneas (paralelo), hay una ganancia en la sensibilidad neta, pero una pérdida
en la especificidad neta, en comparación con cualquiera de las pruebas utilizadas por separadas.
• En pruebas secuenciales cuando se re-muestrean los positivos de la primera prueba, hay una
pérdida de sensibilidad neta, pero una ganancia en especificidad neta, en comparación con
cualquiera de las pruebas utilizadas.

También podría gustarte