Está en la página 1de 57

Curva ROC

• La curva ROC fue desarrollada por ingenieros para medir la eficacia
en la detección de objetos enemigos en campos de batalla durante la
Segunda Guerra Mundial, mediante pantallas de radar, a partir de lo
cual se desarrolló la Teoría de Detección de Señales (TDS).
• Esta curva fue propuesta por primera vez para describir la relación
entre señal y ruido, y se desarrolló en la comparación de la eficacia
de radares. Se necesitaba evaluar la capacidad de un radar para
distinguir entre verdaderas señales y ruido de otros tipos.

• El radar podría equivocarse de dos formas: fallando en la
detección de la señal (falso negativo) o detectando una falsa
(falso positivo). Así, a los radares se les cambiaba el umbral de
detección de señales y este cambio originaba distintas tasas de
errores relacionados entre sí: a medida que el umbral
disminuía, la tasa de falsos negativos descendía (aumenta la
sensibilidad) y aumenta la tasa de falsos positivos
(disminuyendo la especificidad).

• En Medicina el análisis ROC se ha utilizado de forma muy
extensa en Epidemiología e investigación médica.
• Se trata de detectar una enfermedad dada, y la prueba en
cuestión puede equivocarse en el sentido de los falsos
negativos o los falsos positivos; al cambiar el punto de corte
(homólogo del umbral para el radar) cambian las tasas de error,
es decir, la sensibilidad y la especificidad.

• La curva ROC es una representación gráfica de la sensibilidad
frente a (1 - especificidad) para un sistema clasificador binario
según los diferentes puntos de corte o umbral de
discriminación, es decir, valor a partir del cual se acepta que un
caso es un positivo.
• La curva ROC se construye al representar gráficamente en dos
ejes de coordenadas (X, Y), cada uno de los puntos de corte
dados por los falsos positivos (1 - especificidad) en el eje de las
X y la sensibilidad (verdaderos positivos) en el eje de las Y.
• Un espacio ROC representa los intercambios entre verdaderos
positivos y falsos positivos.

representando un 100% de sensibilidad (ningún falso negativo) y un 100% también de especificidad (ningún falso positivo).• El mejor resultado posible de predicción o poder de la prueba se sitúa en la esquina superior izquierda. o coordenada (0. .1) del espacio ROC.

Esta superposición exige que se defina un valor crítico que discrimine a los individuos enfermos de los sanos. es posible que personas que tienen un padecimiento presenten valores normales.• La curva ROC permite entonces seleccionar el mejor punto de corte y observar comparativamente la sensibilidad y especificidad de una prueba. . Además se utilizan para mostrar la relación o comparación entre diferentes valores de sensibilidad y especificidad. Asimismo. • Debe tomarse en cuenta que algunos valores cercanos a los límites de normalidad no necesariamente son manifestaciones de enfermedad.

.

. se modifican tanto la sensibilidad como la especificidad. en 100.• Al definir como valor crítico para el diagnóstico de diabetes tipo 2. 120 o 130 mg/100 ml de glucosa en sangre en ayunas.

disminuye la sensibilidad y aumenta la especificidad. o en otros términos. si éste se desplaza hacia la derecha (valores mayores de glucosa) disminuyen los falsos positivos. pero aumentan los falsos negativos.• El comportamiento de dichas pruebas depende de dónde se coloque el punto de corte o “valor crítico”. .

pero aumentan los falsos positivos.• Si se desplaza hacia la izquierda (valores menores de glucosa). disminuye la especificidad y aumenta la sensibilidad. es decir. disminuyen los falsos negativos. .

.

.

.

cuando se trata de pruebas con resultado cuantitativo. • Pero. puesto que ya se vio que la S y la E de pruebas de este tipo dependen del punto de corte elegido.Comparación de pruebas diagnósticas mediante curva ROC • Lo más natural es que la comparación de la eficacia de dos o más pruebas diagnósticas para detectar una enfermedad o proceso patológico dado. la utilización de la curva ROC correspondiente resulta el modo más adecuado de determinar cuál de las pruebas es más eficaz. . pueda hacerse sobre la base de comparar los valores de S y de E de tales pruebas.

• En todo nuevo procedimiento o con el uso de nuevos equipos de diagnóstico. .• Es posible comprender que la curva ROC que tenga el área mayor será la que corresponda a la prueba más eficaz. y para elegir la mejor prueba diagnóstica (con mejor sensibilidad y especificidad). es indispensable realizar cuanto antes la determinación de su valor real en relación con otros métodos.

.

• Para que este criterio se cumpla. y criterios de elección para los sujetos que son enrolados en el estudio. se debe contar con información sobre los siguientes aspectos: sexo y edad de los sujetos en evaluación. . La sensibilidad o especificidad de una prueba depende de las características de la población estudiada. resumen de los síntomas clínicos iniciales o estadio de la enfermedad. • Características de la población.Condiciones necesarias para la validación de una prueba diagnóstica.

. La sensibilidad y la especificidad pueden representar valores promedio para una población determinada. ej. • Este criterio se cumple cuando se informa sobre la precisión de la prueba en relación con cualquier subgrupo demográfico o clínico (p.• Subgrupos adecuados. . en sujetos sintomáticos y sujetos asintomáticos).

• Para que este criterio se cumpla. todos los sujetos deberían haber sido asignados para recibir tanto la prueba diagnóstica en estudio como el estándar de referencia a través de un procedimiento directo o mediante el seguimiento clínico. Puede producirse cuando los sujetos con los resultados positivos o negativos de una prueba son derivados de forma preferente para verificar el diagnóstico mediante otra prueba considerada el estándar de referencia.• Sesgo de selección. .

Podría introducirse si la PD o el estándar de referencia se realizan sin tomar precauciones para garantizar la objetividad de su interpretación (similar al enmascaramiento utilizado en los ensayos clínicos para tratamiento). .• Sesgo de medición. • Se puede obviar si la PD en evaluación y el estándar de referencia son interpretados de forma separada y enmascarada por personas independientes que desconocen los resultados de una y otro.

• Precisión de los resultados. independientemente de la magnitud encontrada. . La precisión de la sensibilidad y la especificidad dependen del número de pacientes evaluados. Igual que otras medidas. el resultado estimado debe tener los intervalos de confianza o el error estándar reportados.

. No todas las PD dan lugar a un “sí” o un “no” como respuesta. a veces dan lugar a resultados equívocos o indeterminados.• Presentación de resultados indeterminados. • La frecuencia de resultados indefinidos y el modo en el que se usan en el cálculo de la precisión de la prueba constituyen una información de importancia crítica para conocer la eficacia de la misma. • La frecuencia de resultados indeterminados limitará la aplicabilidad de la prueba o la hará más cara si da lugar a otros procedimientos diagnósticos posteriores.

. negativos o indeterminados generados durante el estudio. el trabajo debe reflejar de forma apropiada todos los resultados positivos. así como si los resultados indeterminados se incluyeron o excluyeron al calcular los indicadores de precisión de la prueba.• Para que este criterio se cumpla.

el criterio se cumple cuando se refleja una media que resuma la variabilidad del instrumento. Las pruebas no siempre dan el mismo resultado. al menos alguna de las pruebas debería ser evaluada con alguna medida que resuma la variabilidad interobservador. Para pruebas sin interpretación del observador. Los motivos y el impacto de este asunto deben ser tenidos en cuenta. por motivos relacionados con la variabilidad de éstas o de la interpretación del observador. .• Reproducibilidad de la prueba. • Para que se cumpla este criterio en pruebas que requieren interpretación del observador.

. Una prueba de detección no pretende establecer diagnósticos. tamiz o escrutinio. • Las pruebas de detección identifican a las personas en apariencia sanas que probablemente tienen una enfermedad de aquellas que no la tienen. • Las pruebas de detección representan “la identificación presuntiva de una enfermedad o defecto no reconocido mediante la aplicación de pruebas.Pruebas de detección temprana. los cuales pueden ser aplicados rápidamente. exámenes u otros procedimientos.

• Las pruebas de detección se aplican a población asintomática o grupos de población en riesgo para diagnosticar un padecimiento cuya morbilidad y mortalidad pueden disminuirse si la entidad se detecta y trata en forma oportuna.• Las personas con hallazgos positivos o de sospecha deben ser referidas para que se confirme el diagnóstico y se establezca el tratamiento pertinente. .

• Para decidir si se lleva a cabo una prueba de escrutinio o tamiz han de tomarse en cuenta las siguientes consideraciones: • El padecimiento debe ser muy frecuente para justificar el enorme esfuerzo que tendrá que hacerse para detectarlo. . incapacidad que produce. intensidad de las molestias y costo financiero. • El pronóstico de la entidad tiene que ser lo bastante grave en caso de que se trate en términos de morbilidad.

• Tiene que haber un periodo suficientemente largo entre el momento en que se puede detectar el padecimiento en individuos asintomáticos y la aparición de los primeros síntomas (tiempo de atención). • Ha de existir una diferencia importante en el pronóstico del individuo si se lo atiende en la etapa asintomática o si se trata en la fase de aparición de los primeros síntomas. .

.

barata y segura. ha de ser fácilmente aplicable. .• La prueba diagnóstica debe tener sensibilidad y especificidad alta. • Debe existir algún tratamiento eficaz que altere la historia actual del padecimiento. y tiene que ser aceptada tanto por los pacientes como por quienes la aplican.

. sin embargo. lo más frecuente es que algunas pruebas resulten positivas y otras negativas. la interpretación es directa. entonces la dificultad es mayúscula para establecer un diagnóstico.Pruebas múltiples • Cuando al realizar estudios a un paciente y resultar todos positivos o negativos.

esta decisión depende de la enfermedad en estudio y del paciente a tratar. JUSTO EN EL PROTOCOLO DE INVESTIGACIÓN .• En el proceso diagnóstico es posible realizar las pruebas en serie o en paralelo.

se lleva a cabo la segunda. y si el resultado es positivo. • Aumentan la especificidad y el valor predictivo positivo. • Disminuyen la sensibilidad y el valor predictivo negativo.Pruebas en serie • Se realiza la primera prueba. . y así sucesivamente.

• Implican menor utilización de laboratorio y gabinete. • Mayor seguridad sobre el resultado positivo. • Útiles cuando las disponibles no son muy específicas. . • Limitaciones • Establecer el diagnóstico conlleva más tiempo.• Ventajas • Se inician con las factibles y pertinentes (menos riesgosas y más baratas). • Existe probabilidad de no diagnosticar una enfermedad.

• Aumentan la sensibilidad y el valor predictivo negativo. • Disminuyen la especificidad y el valor predictivo positivo. .Pruebas en paralelo • Se realizan varias pruebas en forma simultánea y cuando una de estas pruebas es positiva. se considera que existe la enfermedad.

• Conllevan mayor utilización de laboratorio y gabinete. • Limitaciones • Generan un número importante de falsos positivos (sobrediagnostican). • Útiles cuando las pruebas disponibles no son muy sensibles.• Ventajas • El diagnóstico se hace con mayor rapidez. . • Indicadas y útiles en caso de urgencia. • Existe mayor probabilidad de diagnosticar una enfermedad. • Los costos son más elevados.

ANEXO 1 .

. • Es posible que dichos estudios dudosos sean de dos clases: • Aquellos en que no puede determinarse con precisión si la alteración existe. en una serie gastroduodenal quizá se observe depósito de material de contraste que genera una imagen parecida a una úlcera duodenal. pero tal vez no sea posible decidir con seguridad si se trata de una úlcera o si sólo es un artefacto del estudio.Casos dudosos • En muchas ocasiones no se puede precisar si un resultado es positivo o negativo. Por ejemplo.

pero no puede establecerse si se trata de un ovario quístico o de un tumor maligno.• Estudios en que es evidente que existe una alteración pero no es posible darle una interpretación precisa. en un estudio ultrasonográfico se observa una imagen francamente alterada de un ovario. Por ejemplo. Ha sido bastante común que estos resultados dudosos se eliminen al analizar los datos de una investigación. • Es claro que los casos dudosos se presentan y no es posible soslayarlos. pero esto no es correcto. .

• A un grupo de 100 personas se aplicó una prueba diagnóstica cuyos resultados fueron los siguientes: • 50 individuos con la enfermedad: • Prueba positiva = 5 verdaderos positivos • Prueba negativa = 0 falsos negativos • Prueba dudosa = 45 dudosos • 50 sujetos sin la enfermedad: • Prueba negativa = 10 verdaderos negativos • Prueba positiva = 0 falsos positivos • Prueba dudosa = 40 dudosos .

cuyos resultados no muestran datos suficientes que permitan confirmar la presencia del padecimiento. hecho evidentemente falso. • Lo adecuado es considerar los resultados dudosos como parte importante de las fórmulas de sensibilidad y especificidad. deben clasificarse como dudosos con el padecimiento (Dp). • Para incluir estos casos. se tiene que S = 100% y E = 100%. Se da este nombre a las pruebas practicadas a personas con la enfermedad. . lo cual significa una eficacia muy alta de la prueba.• Si no se toman en cuenta los casos dudosos.

• Al incluir estos conceptos en las fórmulas de sensibilidad y especificidad se obtiene lo siguiente: . • Los casos dudosos sin el padecimiento (Ds) son aquellos cuyas pruebas. muestran datos que no permiten descartar la presencia de isquemia del miocardio.• En ocasiones. aplicadas a personas sin la enfermedad. una prueba dudosa puede considerarse como verdadera positiva según la precisión con que el investigador desee hacer un diagnóstico.

.

a estos individuos se les practicó previamente colecistografía y ultrasonido. . se realizó un estudio reciente sobre sensibilidad y especificidad en 107 sujetos con probable colecistitis calculosa. a quienes se realizó intervención quirúrgica (con diagnóstico comprobado). y se encontraron los datos que se anotan a continuación.• Por ejemplo.

• En los estudios de colecistografía: • Vp = verdaderos positivos = 25 • Fn = falsos negativos = 7 • Vn = verdaderos negativos = 15 • Fp = falsos positivos = 3 • Dp = dudosos con el padecimiento = 42 • Ds = dudosos sin el padecimiento = 15 .

.

.

.

mientras que la colecistografía es un poco más específica para esta enfermedad. que toman en cuenta los casos dudosos. permite conocer de manera más aproximada la verdadera eficacia diagnóstica de la prueba. • Si se comparan estas dos pruebas diagnósticas. se puede concluir que el ultrasonido es más sensible que la colecistografía para el diagnóstico de colecistitis calculosa.• La aplicación de estas fórmulas. .

.• Los índices de sensibilidad y especificidad de una prueba diagnóstica tienen valores diferentes para cada padecimiento. o sea que es posible que una prueba diagnóstica presente variaciones en su sensibilidad según la enfermedad que se pretende diagnosticar.

ANEXO 2 .

Tamaño de la muestra • Para calcular el número de elementos de una muestra en la que se establece una proporción. que expresa la desviación estándar como porcentaje de la proporción. se ha utilizado el coeficiente de variación. . • El tamaño de la muestra se busca en las tablas en que se incluye este coeficiente de variación y la proporción estimada.

5. el médico prefiera que los límites de confiabilidad no excedan valores fijos. como pueden ser 2. • El tamaño de la muestra en estos casos se puede encontrar en el cuadro elaborado por García Romero.• Es probable que en la práctica. 5 o 10% por encima y por debajo de los valores esperados. .

.

Lo mismo tiene que hacerse si se hallan 5 o 10% por encima o debajo de los valores encontrados. en la línea horizontal del valor de p.• En este cuadro. el tamaño de la muestra ha de buscarse en la columna correspondiente. • Si se desea que al final del estudio los límites de confiabilidad se encuentren entre p ± 0.5% por arriba y abajo del valor encontrado). • Si no se tiene ninguna información previa que permita suponer algunos valores aproximados.025 (2. éstos deben determinarse en un estudio piloto. . los valores de p pueden sustituirse por los de sensibilidad y especificidad esperados.

.• Si la sensibilidad de una prueba es aproximadamente de 0. en el cuadro es posible observar que la muestra debe ser de un mínimo de 144 elementos.05 (85 y 95%).90 ± 0.