Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Notas
ndice
1. INTRODUCCIN 1
2. CLASIFICACIN DE ENFERMEDADES POR DIAGNOSIS 1
3. CRITERIOS DE CALIDAD DE LAS PRUEBAS DIAGNSTICAS 2
4. TIPOS DE PRUEBAS 3
5. PATRN UREO 3
5.1. Diseo de investigacin para evaluar una prueba diagnstica 3
6. PARMETROS DE VALORACIN DE LAS PRUEBAS DIAGNSTICAS 4
6.1. Sensibilidad 5
6.2. Especificidad 5
6.3. Valor predictivo positivo 6
6.4. Valor predictivo negativo 6
6.5. Razones de verosimilitud 7
6.6. Intervalo de confianza (IC) para la sensibilidad y la especificidad 8
6.7. Intervalos de confianza para los coeficientes de probabilidad 9
6.8. Variabilidad de las razones de verosimilitud 9
6.9. Valores predictivos y razones de verosimilitud. Inters en la evaluacin de las pruebas diagnsticas 15
6.10. Falsos positivos frente a falsos negativos. Criterios 19
6.11. Odds ratio diagnstica 19
6.12. Efectividad de una prueba 20
6.13. Eficiencia diagnstica de una prueba 20
6.14. El ndice de Youden (Y) 20
6.15. El efecto de concentracin 21
6.16. Ganancia diagnstica 22
7. COMENTARIOS 24
8. ETAPAS DE UN ESTUDIO DE EVALUACIN DE PRUEBAS DIAGNSTICAS 25
9. SESGOS POTENCIALES DE LOS ESTUDIOS SOBRE PRUEBAS DIAGNSTICAS25
10. EVALUACIN DIAGNSTICA: JERARQUIZACIN 26
BIBLIOGRAFA 26
1. Introduccin
Se trata de estudiar aquellos procedimientos estadsticos que permiten evaluar la validez, es decir cunto se
aproxima una medida al valor real que pretende medir. Son procedimientos muy generales, pero aqu se van
a tratar al hilo del problema de las pruebas diagnsticas (problema muy importante en la prctica y la
investigacin clnica): pruebas para determinar si un individuo tiene, o no, una cierta enfermedad (u otra
caracterstica). Hay que resaltar (y no siempre se hace) que si bien la validez de una prueba depende
exclusivamente de la prueba, las estimaciones numricas que se obtengan de la misma pueden depender
de la prevalencia y de las caractersticas clnicas de los pacientes que se hayan estudiado.
1
Tipo I: Son todas aquellas enfermedades donde la peor equivocacin que se puede cometer en el
diagnstico es un falso negativo.
Tipo II: Son todas aquellas enfermedades donde la peor equivocacin que se puede cometer en el
diagnstico es un falso positivo.
Tipo III: Son las restantes, donde no se puede clasificar claramente como una de las anteriores.
Las enfermedades que se pueden clasificar como Tipo I son:
Una enfermedad que es curable si se detecta a tiempo;
Una enfermedad que es grave y no puede dejarse pasar inadvertida;
Los falsos positivos no traumatizan ni psicolgicamente, ni econmicamente al paciente, pero los
diagnsticos falsos negativos s lo hacen.
Ejemplos: infarto de miocardio, enfermedades venreas y otras enfermedades infecciosas curables, la
fenilcetonuria, el feocromocitoma (curable en el 100% de los casos s es detectado a tiempo), cncer de
mama o de tero, etc.
En cambio, una enfermedad donde para el paciente, un diagnstico falso positivo es ms peligroso que un
falso negativo, se considera como del Tipo II, como ser:
La enfermedad es grave, pero difcilmente curable o sin remisin;
Es muy importante para el paciente o para la poblacin l saberse un verdadero negativo;
Los falsos positivos traumatizan seriamente al paciente, en cambio los falsos negativos no;
El tratamiento de los falsos positivos ocasiona serios perjuicios al paciente;
Ejemplos: estado terminal o sin remisin de la enfermedad, cncer oculto, esclerosis en placas, tratamientos
como radioterapia, quimioterapia, lobectoma, ciruga innecesaria, estadio IV de la sfilis cuando ya no tiene
remedio, etc.
Cuando la enfermedad no puede ser encasillada en ninguno de los dos casos anteriores, entonces se la
considera como del Tipo III, como por ejemplo: lupus eritematoso, ciertas formas de leucemia o linfoma,
diabetes, etc. En el caso del SIDA un falso positivo puede ser muy daino para el paciente, pero un falso
negativo sera muy peligroso para la sociedad y como ambos peligros son graves, lo mejor es clasificarla
como del Tipo III desde un punto de vista tico. Notar que una misma enfermedad puede ser clasificada de
maneras diferentes, de acuerdo al estado de avance que tiene en el paciente. Un cncer que pueda ser
curado si se detecta a tiempo es un claro caso de Tipo I, pero una vez que se produjo una metstasis en el
paciente pasa a ser del Tipo II.
Lo mismo ocurre con los diferentes estados de la sfilis, que se puede curar si es detectada a tiempo, pero
se torna incurable cuando est muy avanzada.
2
Otros factores que se deben valorar son el precio de la prueba as como su inocuidad, ya que pueden existir
mtodos menos invasivos o ms econmicos para obtener una informacin suficiente para nuestros
propsitos.
La calidad de una prueba diagnstica se mide en trminos de validez y seguridad. La validez de una
prueba es el grado en que mide lo que se supone debe medir y para determinarla se debe comparar con
otra prueba de probada eficacia en la enfermedad de estudio o con el verdadero resultado en el caso de
que pueda ser conocido. Estos trminos de comparacin se denominan patrn ureo, gold standard o
criterio de referencia. La validez se mide a travs de la sensibilidad y la especificidad de la prueba.
La seguridad de una prueba es la capacidad para predecir la presencia o ausencia de enfermedad y se
mide en trminos de los valores predictivos, positivo y negativo.
4. Tipos de Pruebas
Pruebas con respuesta dicotmica (positivo, +; negativo, ), por ejemplo, la prueba de embarazo;
Pruebas con respuesta policotmica, por ejemplo, estadios del cncer;
Pruebas con respuesta cuantitativa, por ejemplo, glucosa/diabetes, troponina/IAM. En este caso se
presenta el problema de establecer un punto de corte para dicotomizar la respuesta (+ o ).
5. Patrn ureo
Para identificar la enfermedad se requiere disponer de un diagnstico de certeza, una prueba de referencia,
lo que se conoce con el nombre de patrn ureo (patrn oro, gold standard), para poder ver con respecto
a este patrn la validez de otras pruebas diagnsticas, su calidad, su capacidad para identificar una
enfermedad o para seguir un tratamiento.
1 PATRON DE REFERENCIA
POBLACION PACIENTE
+ Pr(PREPRUEBA)
3 2 4
+ 6
PRUEBA DIAGNOSTICA
Pr(POSTPRUEBA)
5
Figura 1. Esquema de los estudios de evaluacin de pruebas diagnsticas. (1) patrn ureo (gold
standard) vlido; (2) comparacin independiente; (3) espectro de pacientes adecuado; (4)
descripcin completa de los mtodos; (5) presentacin correcta de los resultados; (6) repercusin
sobre el manejo diagnsticoteraputico.
3
Enfermedad Enfermedad
presente ausente, la
detectada por la prueba sugiri su
Muestra (individuos A todos se
prueba presencia
consecutivos con efecta la
las caractersticas prueba y el
establecidas) patrn ureo Enfermedad Enfermedad
presente no ausente, la
detectada por la prueba coincidi
prueba
Figura 2.
De esta manera, al cabo del estudio se dispondr de los datos necesarios para completar la tabla de
contingencia, permitiendo calcular todos los indicadores presentados.
Para minimizar los sesgos, se deben considerar algunas premisas claves, a saber:
1. Seleccin de la muestra: la muestra debe incluir participantes que representen todas las formas clnicas
del dao buscado y respetando la proporcin en que la misma se presenta en la prctica cotidiana. An
pruebas de escasa capacidad detectan aceptablemente los casos graves al compararlas con los sin dao.
El mayor problema se presenta al intentar detectar a los casos de gravedad moderada a leve. Por ello, la
muestra debe obtenerse desde la presentacin consecutiva de casos clnicos que renan las caractersticas
que los hara pasibles de la indicacin de la prueba. Entre ellos, habr casos de todas las formas clnicas e
incluso casos sin dao.
2. Comparacin: la misma debe establecerse con un patrn de referencia apropiado y confiable. El patrn
ureo debe reunir esas caractersticas y todos los participantes deben recibir las dos pruebas (la que se
est investigando y el patrn ureo). Es frecuente observar que si se seleccion un patrn ureo invasivo
y/o costoso, ste se aplique solamente a los que arrojaron un resultado anormal de la prueba en anlisis.
Este proceder impide que se completen los datos de la tabla de contingencia, ya que no se dispondra de
los necesarios para llenar los casilleros c ni d y, por lo tanto, se hace imposible calcular sensibilidad ni
especificidad. A este error de procedimiento (o error sistemtico o sesgo) se lo denomina error de
verificacin (work-up bias).
3. Interpretacin de los resultados: La lectura del resultado de la prueba analizada debe ser realizada
desconociendo el resultado del patrn ureo, para evitar el sesgo hacia una coincidencia esprea.
Los 27 pacientes que, estando enfermos, dieron positiva la prueba diagnstica se consideran verdaderos
positivos (VP). Los seis pacientes enfermos que dieron negativa la prueba de laboratorio son considerados
como falsos negativos (FN). Los tres pacientes no enfermos que dieron positiva la prueba se denominan
falsos positivos (FP). Los 164 pacientes no enfermos que no dieron positivo en la prueba son los verdaderos
negativos (VN).
A continuacin se proceder a definir los parmetros de valoracin de las pruebas diagnsticas.
4
6.1. Sensibilidad
Es el porcentaje de resultados positivos en pacientes con una determinada enfermedad.
Mide el porcentaje de individuos enfermos correctamente diagnosticados
La sensibilidad indica la capacidad de una prueba para detectar a un sujeto enfermo.
La sensibilidad es la probabilidad de que la prueba identifique como enfermo a aquel que realmente lo est.
La sensibilidad expresa cun "sensible" es la prueba a la presencia de la enfermedad.
Una alta sensibilidad indica un bajo nmero de falsos negativos.
La sensibilidad sera la probabilidad de que un paciente enfermo diese la prueba positiva o el porcentaje de
positivos de la prueba en pacientes con la enfermedad,
VP 100
Sensibilidad ( % ) =
TE
En el ejemplo la sensibilidad ( Se ) ser:
27 100
Se = = 81,8%
33
Una sensibilidad del 81,8 % indica que solo el 81,8 % de los pacientes enfermos darn positiva la prueba.
En este caso habr un 18,2 % de falsos negativos (pacientes enfermos que han dado negativa la prueba).
Cuanto ms sensible es una prueba, ms probable es que detecte a las personas con enfermedad. Por ello,
las pruebas con una sensibilidad muy elevada son muy tiles para descartar la presencia de enfermedad.
6.2. Especificidad
Es el porcentaje de resultados negativos en pacientes que no padecen esa enfermedad.
Valora la capacidad de una prueba para detectar correctamente individuos sanos.
La especificidad es la probabilidad de que un individuo sano tenga un resultado negativo.
Una alta especificidad indica una baja frecuencia de falsos positivos.
La especificidad sera la probabilidad de que un paciente sano diese la prueba negativa o el porcentaje de
negatividad de la prueba diagnstica en ausencia de enfermedad, o:
VN 100
Especificidad ( % ) =
TNE
164 100
Es = = 98, 2 %
167
Una especificidad del 98,2 % indica que el 98,2 % de los individuos sanos darn negativa la prueba. En este
caso habr un 1,8 % de falsos positivos (pacientes sanos que han dado positiva la prueba). Las pruebas
muy especficas se usan para confirmar la presencia de una enfermedad. Si la prueba es muy especfica y
da positiva, indica la presencia de enfermedad, ya que apenas produce falsos positivos.
Aunque la sensibilidad y la especificidad son dos ndices de calidad de la prueba, en la prctica clnica las
preguntas a las que interesa responder son: cul es la probabilidad de que est verdaderamente enfermo
si un sujeto ha resultado positivo, Pr ( E + | T + ) ? y, por el contrario, cul es la probabilidad de que
realmente est sano si el sujeto result negativo en la prueba, Pr ( E | T ) ? Estas dos probabilidades se
pueden calcular aplicando el teorema de Bayes, siempre que se conozca la probabilidad de que el sujeto
est enfermo antes de realizar la prueba, o probabilidad preprueba. Si no se dispone de ninguna
informacin adicional sobre el sujeto, dicha probabilidad ser la prevalencia de la patologa en la poblacin,
aplicable slo en el caso de programas de cribado ("screening") sobre la poblacin general, ya que en la
prctica habitual los sujetos candidatos a una prueba diagnstica lo son por las sospechas deducidas de la
anamnesis o por una sintomatologa previa, y por tanto la probabilidad de que padezcan la enfermedad bajo
sospecha ser superior a la prevalencia de sta en la poblacin general.
5
Denominando P a la probabilidad preprueba de padecer la enfermedad, Se a la sensibilidad de la prueba y
Es a su especificidad, las siguientes frmulas permiten calcular la probabilidad postprueba de que el sujeto
est enfermo cuando result positivo o de que est sano cuando result negativo:
Se P
Pr ( E + | T + ) =
Se P + (1 Es )(1 P )
Es P
Pr ( E | T ) =
Es (1 P ) + (1 Se ) P
donde la probabilidad condicional se representa de la forma habitual con el smbolo |
6
164 100
VPN = = 96,5%
170
Un valor predictivo negativo del 96,5 % indica que de cada 100 pruebas negativas, 96,5 pertenecern a
individuos sanos, o lo que es igual, si la prueba da negativa, la probabilidad de no padecer la enfermedad es
del 96.5 %. En este caso hay un 3,5 % de individuos enfermos que sern diagnosticados errneamente
como no enfermos. Esto tampoco significa que haya un 3,5 % de falsos negativos.
El intervalo de confianza al 95 % de los valores predictivos se calculan de acuerdo con las siguientes
expresiones:
VPP (1 VPP )
VPP
a+b
VPN (1 VPN )
VPN
c+d
donde =1,96
Los valores predictivos dependen mucho de la prevalencia de la enfermedad en la poblacin (cociente entre
enfermos y poblacin), no as la sensibilidad y la especificidad, que son independientes de la misma.
Puesto que esos dos ndices VPP y VPN son los que interesan en la prctica clnica, parecera natural
utilizarlos como ndices de comparacin a la hora de evaluar dos mtodos diagnsticos diferentes. Sin
embargo presentan un grave inconveniente, ya que si se calculan a partir de la tabla dependen de la
proporcin de enfermos en la muestra estudiada. Por ello para una determinada prueba resulta necesario
determinar unos ndices de valoracin que, respondiendo a las necesidades reales en cuanto a la
clasificacin de pacientes, sin embargo no dependan de esa proporcin de enfermos en la muestra, tales
como las razones de verosimilitud
prueba positiva, o ndice de eficiencia pronstica ( IEP ) de un resultado positivo. Valores mayores de
CP + indican mejor capacidad para diagnosticar la presencia de enfermedad.
De la misma forma, podemos definir un cociente de probabilidad negativo CP
Pr (T | E )
CP =
Pr (T | NE )
Valores de CP menores indican una mejor capacidad diagnstica de la prueba (mejor capacidad para
diagnosticar la ausencia de enfermedad).
El cociente de probabilidad negativo tambin se conoce como cociente de verosimilitud negativo
( LR , ) , razn de verosimilitud negativa ( RV ) , razn de verosimilitud de exclusin, ndice de
eficiencia pronstica de una prueba negativa. El inverso de este cociente se llama poder (o potencia)
predictiva de una prueba negativa.
Se puede determinar unas frmulas para expresar los cocientes de probabilidad en funcin de la
sensibilidad Se y de la especificidad Es :
7
Se
CP + =
1 Es
1 Se
CP =
Es
La ventaja de los cocientes CP + y CP frente a los valores predictivos positivo y negativo de la prueba
radica en que, a diferencia de stos, no dependen de la proporcin de enfermos en la muestra, sino tan slo
de la sensibilidad y especificidad de sta, de ah su utilidad a la hora de comparar pruebas diagnsticas.
Adems si se conoce o se puede hacer una estimacin de la probabilidad preprueba de que un sujeto
padezca la enfermedad, utilizando los cocientes de probabilidad, al realizar la prueba se podr "corregir" ese
valor de acuerdo con el resultado, de tal manera que la probabilidad aumenta o disminuye segn que el
resultado sea positivo o negativo, aplicando la siguiente frmula
P CP
Pr post =
1 + P ( CP 1)
donde P es la probabilidad preprueba, CP el correspondiente cociente de probabilidad (positivo si
deseamos calcular la probabilidad de que padezca la enfermedad, negativo en caso contrario) y Pr post es la
probabilidad postprueba.
Vase un ejemplo numrico de todo lo anterior:
patologa
enfermo ( E + ) no enfermo ( E )
positiva (T + ) 72 100 positivos: 172
prueba
negativa (T ) 18 150 negativos: 168
total enfermos: 90 no enfermos: 250 total: 340
Tabla 2
Evidentemente los valores de los diferentes ndices son estimaciones realizadas mediante un experimento
diseado al efecto, por lo que es necesario calcular algn indicador de su grado de incertidumbre, como
puede ser un intervalo de confianza del 95 %.
8
n es el nmero de no enfermos.
Para un intervalo de confianza (IC) del 99 % hay que reemplazar 1,96 por 2,576 y para un IC del 99,9% hay
que reemplazar 1,96 por 3,290
Se 1 Es
ln ( CP ) z +
IC [CP ] (1 ) % = e 2 b a
9
Figura 3. Variacin de la razn de verosimilitud en funcin de la sensibilidad para diferentes pruebas
cuya especificidad es igual a 0,90.
Cuando Se = 1 Es = 0,1 , las dos razones de verosimilitud son iguales a 1 la prueba no tiene ningn valor
diagnstico. El valor diagnstico del resultado positivo o negativo de la prueba crece linealmente cuando
la sensibilidad aumenta de 0,10 a 1,00.
10
Cuando Es = 1 Se = 0,8 , las dos razones de verosimilitud son iguales a 1 y por lo tanto en esta situacin la
prueba carece de utilidad diagnstica. Se nota que la progresin de L es muy rpida cuando la
especificidad es superior a 0,7. La razn de verosimilitud negativa se modifica poco cuando Es crece de
0,50 a 1,00, mientras que la razn de verosimilitud positiva L se afectada mucho por variaciones mnimas
de la especificidad cuando sta es muy elevada; as, cuando Es crece de 0,90 a 0,95, L pasa de 8 a 16.
Si la sensibilidad es constante, las dos razones de verosimilitud son funciones hiperblicas de la
especificidad. La razn de verosimilitud positiva L , en particular, crece muy rpidamente y tiende hacia el
infinito cuando la especificidad de una prueba o de un grupo de pruebas tiende hacia 1.
Se dice que la eficacia diagnstica de una prueba, en la investigacin de una enfermedad determinada E ,
est estrechamente ligada al crecimiento de su especificidad, cualidad que, precisamente, es estable en el
caso de los sujetos no afectados por la enfermedad E
Comparando los cocientes de probabilidad de dos pruebas diagnsticas existen cuatro posibles resultados
que podemos reflejar en una grfica. En el eje de las Y representamos la sensibilidad, en el eje de las X
se representa (1especificidad). El punto representa los valores de sensibilidad y (1especificidad)
observados para la prueba A . Se traza una lnea desde el origen (0,0) que pase por el punto A y otra
desde el valor (1,1) que tambin pase por ese punto, quedando dividido el grfico en cuatro zonas como se
ve en la Figura 5, de tal manera que cualquier otra prueba cuyo resultado representemos en esa grfica
estar en alguna de las cuatro zonas
Figura 5. Las zonas corresponden a las siguientes situaciones: 1: en esta regin la prueba B es
siempre superior a la A, tanto para confirmar presencia como ausencia de enfermedad; 2: aqu la
prueba B slo es superior a la A para confirmar ausencia de enfermedad; 3: en esta zona B siempre
es inferior a A; 4: si el resultado de B est en este rea, ser superior a A para confirmar la presencia
de enfermedad.
Supngase ahora que se desea comparar la prueba A con otra prueba B cuya sensibilidad es 0,9 y
especificidad 0,5. Representndolo en la Figura 6 se obtiene:
11
Figura 6. B cae en la zona 2 por lo que es una prueba mejor que A para confirmar la ausencia de
enfermedad, como se puede determinar tambin numricamente al calcular los correspondientes
cocientes de probabilidad CP+ = 1,8 y CP = 0,2.
CP + > 10 CP < 0,1 Generan cambios amplios y a menudo concluyentes desde una
probabilidad preprueba hasta una probabilidad postprueba
5 < CP + < 10 y 0,1< CP < 0, 2 Generan cambios moderados desde la probabilidad preprueba hasta la
probabilidad postprueba
2 < CP + < 5 y 0, 05 < CP < 0, 2 Generan cambios pequeos (pero en ocasiones importantes) de la
probabilidad
1 < CP + < 2 y 0,5 < CP < 1 Alteran la probabilidad en un grado insignificante (y rara vez
importante).
Tabla 4. Interpretacin de los cocientes de probabilidad (segn el Evidence-based Medicine Working
Group)
12
Utilizable para diferentes niveles de resultados de una prueba. Para cada nivel procura una informacin
diferente permitiendo interpretar mejor los resultados de la prueba;
Permite calcular de manera individual el inters de realizar la prueba a partir de la probabilidad inicial de
la enfermedad del paciente.
Los cocientes de probabilidad permiten transformar la probabilidad preprueba en probabilidad postprueba
mediante la relacin:
odds post = CPR odds pre
Recurdese que se denomina odds i al cociente entre la probabilidad de que un evento (en este caso estar
enfermo) ocurra y la probabilidad de que no ocurra, por lo tanto:
p odds
odds = p =
1 p 1 + odds
los subndices post y pre indican postprueba y preprueba respectivamente y el subndice R representa el
resultado obtenido.
En el caso del siguiente ejemplo:
d
Se d r
CP + = = s =
1 Es b b s
r
c
1 Se cr
CP = = s =
Es a a s
r
Los CP de la prueba del ejemplo son
d r 11143
CP + = = = 2, 62
b s 50 12
cr 1143
CP = = = 0,13
a s 9312
supngase que se le aplica la prueba a un anciano al que por su sintomatologa e historia se le estima una
probabilidad alta (por ejemplo, 0,7) de padecer disfuncin ventricular izquierda cmo se modificara esta
probabilidad si se le midiera la concentracin plasmtica del pptido y resultara positiva ( 18,7)? A partir
0, 7
de la probabilidad preprueba, primero se calcula el odds pre = = 2,33 ; como el resultado es positivo
1 0, 7
6,10
CPR = CP + = 2, 62 , por tanto odds post = 2, 62 2,33 = 6,10 y Pr ( post ) = = 0,86 ; si el resultado de
7,10
la prueba hubiera sido negativo CPR = CP = 0,13 y odds post = 0,13 2,33 = 0,30 y por lo tanto
0,30
Pr ( post ) = = 0, 23 .
1,30
13
Figura 7. Nomograma de Fagan (Fagan TJ. Letter: Nomogram for Bayes theorem. N Engl J Med. 1975;
293(5): 257)
Fagan (1975) describi un nomograma para el teorema de Bayes, basado en la capacidad de convertir el
teorema de Bayes en una funcin sumatoria lineal simple. Con un par de trucos matemticos se puede
conseguir esto. Primero, se necesita la versin de probabilidad del teorema de Bayes:
" Odds postprueba " = " Odds preprueba " CP
o de forma simblica:
R
Pr
E E
O = O(E)
R R
Pr
E
Donde E representa enfermedad;
E representa ausencia de enfermedad; y
R es un resultado especfico de la prueba.
Tomando logaritmos, se convierte en una simple suma:
log (" Odds postprueba ") = log (" Odds preprueba ") + log ( CP )
o de forma simblica:
R
E Pr E
log O = log ( O ( E ) ) + log
R Pr R
E
o tambin:
Pr ( postprueba ) = Pr ( preprueba ) x CP
log ( Pr ( postprueba ) ) = log ( Pr ( preprueba ) ) + log ( CP )
14
El nomograma tiene tres columnas: la primera es la probabilidad de tener la enfermedad antes de aplicar la
prueba (prevalencia), la segunda es la razn de verosimilitud ( CP ) y la tercera la probabilidad postprueba
( PPP, VPP ) . Con una regla se traza una lnea entre la probabilidad preprueba y la razn de verosimilitud.
La prolongacin de esta lnea corta en la tercera columna la probabilidad de tener la enfermedad en funcin
del resultado de la prueba,
15
P VPP VPN 1VPN
0,25 0,50 0,86 0,14
0,20 0,43 0,89 0,11
0,10 0,25 0,95 0,05
0,05 0,14 0,97 0,03
0,01 0,03 0,99 0,01
0,00 0,00 1,00 0,00
Tabla 5. Variacin de los valores predictivos de una misma prueba ( L = 3 y = 0,50 ) cuando P
vara de 1 a 0. (1 VPN ) es la probabilidad de sufrir una enfermedad en presencia de una prueba
negativa.
Figura 9. Variacin de los valores predictivos de una prueba cuyas cualidades son
(L =3 y = 0,50 ) , cuando la probabilidad preprueba de la enfermedad vara entre 0 y 1
Las curvas de los valores predictivos en funcin de la probabilidad a priori P son hiprbolas. Los puntos
destacables de estas tres curvas son:
A donde el valor predictivo positivo es igual a 0,50;
B donde el valor predictivo negativo es igual a 0,50;
1
C donde VPP = VPN , cuando P =
1+ L
Para una misma prueba, cuando P disminuye, VPP disminuye y VPN aumenta. Cuando P aumenta,
VPP aumenta y VPN disminuye.
Se nota que el valor predictivo positivo al principio crece rpidamente cuando la probabilidad preprueba
crece entre 0 y 0,50 y despus ms lentamente. El VPP es inferior a 0,50 cuando la probabilidad a priori o
1 1
preprueba es inferior a P1 = , en el ejemplo, donde L = 3 , cuando P es inferior a = 0, 25 (Figura
1+ L 1+ 3
8).
16
1
Cuando la probabilidad preprueba de la enfermedad E es inferior a , el VPP o probabilidad
1+ L
postprueba de la enfermedad es inferior al 50 %, incluso si la prueba da un resultado positivo.
El VPN disminuye cuando crece la probabilidad preprueba de la enfermedad. Es inferior a 0,50 cuando P
1 1
es inferior a P2 = , en el ejemplo P2 = = 0, 666 (Figura 8).
1+ 1 + 0,50
1
As, cuando la probabilidad primaria es superior a P2 = incluso si la prueba da un resultado negativo,
1+
la probabilidad a posteriori o postprueba de la enfermedad es superior al 50 %.
Los dos valores P1 y P2 de la probabilidad primaria, tales que:
1
P1 =
1+ L
1
P2 =
1+
determinan lo que se puede definir como el intervalo de seguridad de la prueba. En efecto, cuando la
probabilidad primaria se sita dentro de este intervalo, un resultado positivo de la prueba da un
VPP superior al 50 % y un resultado negativo da una probabilidad secundaria de la enfermedad inferior al
50 %. Este no es el caso cuando P se sita fuera de este intervalo: si P es inferior a P1 , la probabilidad
postprueba de la enfermedades inferior a 1 cambio sobre dos, incluso si la prueba da un resultado positivo.
Cuando P es superior a P2 , incluso si el resultado de la prueba es negativo, la probabilidad postprueba de
la enfermedad es todava superior a 1 cambio sobre 2 ( > 0,50 ) . Estas consecuencias matemticas del
intervalo de seguridad de la probabilidad primaria, tal como est definido por los lmites P1 y P2 , son de una
importancia capital para la conducta del razonamiento y de la decisin diagnstica.
Figura 10. Comparacin de las curvas VPP y VPN de las pruebas 1 y 2 en funcin de las
variaciones de la probabilidad primaria. Las cualidades diagnsticas respectivas de las dos pruebas
son: para la prueba 1: L = 18; = 0,105 ; Para la prueba 2: L = 3; = 0,50 . Se observa que el
intervalo de seguridad diagnstica para la prueba 1 es mas estrecho que para la prueba 2.
17
La curva del valor predictivo positivo VPP es tanto mayor cuanto ms elevada es L , y la curva del valor
predictivo negativo VPN es tanto menor cuanto ms pequea es . El Intervalo de seguridad diagnstica
es tanto ms amplio cuanto ms elevada es L y ms pequea .
La Figura 11A representa tres pruebas cuya sensibilidad es idntica, 0,90, y cuyas especificidades son
crecientes, 0,80 para la prueba 1, 0,90 para la prueba 2 y 0,98 para la prueba 3.
En la Figura 11B, las tres pruebas tienen una especificidad idntica igual a 0,90, y las sensibilidades son
respectivamente 0,60 para la prueba 1, 0,80 para la prueba 2 y 0,95 para la prueba 3.
En la figura 11A, las tres pruebas tienen una sensibilidad idntica, igual a 090 y una especificidad creciente,
con las cualidades respectivas siguientes:
sensibilidad especificidad L
prueba 1 0,90 0,80 4,5 0,125
prueba 2 0,90 0,90 9,0 0,110
prueba 3 0,90 0,98 45,0 0,100
Tabla 6
La figura 11A muestra que para valores bajos de la probabilidad preprueba P , la eficacia diagnstica del
resultado positivo de la prueba medida por el VPP es tanto mas grande cuanto mas elevados son la
especificada y la razn de verosimilitud positiva. En contra, las variaciones de la especificidad modifican
muy poco la consecuencia del resultado negativo: en este caso el efecto de la probabilidad primaria es
predominante.
Las conclusiones inversas resultan de la figura 11B donde las tres pruebas tienen una especificidad idntica
igual a 0,90 y una sensibilidad creciente:
sensibilidad especificidad L
prueba 1 0,60 0,90 6,0 0,44
prueba 2 0,80 0,90 8,0 0,22
prueba 3 0,95 0,90 9,5 0,055
Tabla 7
Las variaciones de la sensibilidad afectan poco los valores predictivos positivos; en cambio, modifican
considerablemente el efecto de un resultado negativo de la prueba, sobre todo cuando la probabilidad
preprueba de la enfermedad es superior a 0,50 0,60.
En suma, cuando la probabilidad preprueba P es baja, un resultado negativo de la prueba tiene poca
incidencia sobre la decisin diagnstica; el de un resultado positivo de una prueba especfica es elevado. Lo
18
inverso ocurre cuando la probabilidad preprueba es elevada: la consecuencias diagnsticas de un resultado
negativo de una prueba sensible es considerable, el de un resultado positivo es dbil.
En una situacin diagnstica dada, la eleccin de una prueba por el clnico est guiada pues por la
probabilidad preprueba de la enfermedad: si el diagnstico es casi cierto, su confirmacin por una prueba
especfica modifica muy poco su probabilidad; en cambio, el resultado negativo de una prueba sensible
impondra una revisin seria de la toma de decisiones. Para optimizar la toma de decisiones, el clnico debe
pues elegir una prueba cuya sensibilidad y especificidad sean apropiadas a la probabilidad preprueba de la
enfermedad.
La incidencia del resultado de la prueba sobre el proceso decisional traduce la eficacia diagnstica de la
prueba. Esta eficacia est medida sobre el efecto de concentracin y por la nocin de ganancia diagnstica.
Hasta ahora se ha estudiado el caso de un resultado dicotmico, pero en muchas ocasiones las pruebas
diagnsticas son cuantitativas, sobre todo cuando corresponden a determinaciones analticas.
Evidentemente, se pueden utilizar todas las consideraciones hechas hasta el momento si se fija un punto de
corte, un valor determinado de la prueba, que marque el lmite entre sano y enfermo. Pero eso no suele
ser una tarea sencilla. Se puede reflejar esquemticamente en la figura 12:
Figura 12
Existe una zona de posibles resultados de la prueba para la que la distribucin de sujetos sanos y enfermos
se solapan. Si se desea aumentar la probabilidad de detectar pacientes enfermos (en la Figura 12
corresponde a mover el punto de corte hacia la izquierda) se ve como tambin aumentan el nmero de
falsos positivos. Si se desplaza el punto de corte hacia la derecha, disminuirn los falsos positivos, pero a
costa de aumentar el de falsos negativos. Resumiendo, un aumento de la sensibilidad disminuye la
especificidad, y viceversa.
19
ser til para mostrar la fuerza de asociacin entre el resultado de una prueba y la enfermedad. Este ndice
traduce las prestaciones de una prueba con un solo valor que no est influenciado por la prevalencia.
Es la razn entre la odds de estar enfermo si la prueba da positivo y la odds de no estar enfermo si la
prueba da negativo.
VP VPP
DOR = FN = CP +
=
(1 VPP )
FP
VN
CP (1 VPN )
VPN
Los valores de la DOR varan de cero a infinito (cuantos ms altos son los valores, mejor es la prueba). El
valor DOR = 1 significa que la prueba no es discriminante, es la prueba intil. Los valores mayores de 1
significan que es ms probable que la prueba de positivo en el caso de enfermos que en sanos.
Y = 2
( Se + Es ) 1
2
20
6.15. El efecto de concentracin
Se llama efecto de concentracin al aumenta de la densidad o de la probabilidad investigada que es
aportada por el resultado positivo de la prueba. El efecto de la concentracin se traduce por la relacin:
Probabilidad postprueba de M Pr ( M | T + ) VPP
= =
Probabilidad preprueba de M Pr ( M ) P
El efecto de concentracin es precioso en situacin de cribado de una enfermedad cuya prevalencia es muy
baja en la poblacin estudiada.
Por ejemplo, como el feocromocitoma puede ser una causa, rara, de hipertensin arterial, su investigacin
sistemtica se aconseja a causa de las posibilidades teraputicas que aporta la ablacin quirrgica del
tumor. Las pruebas diagnsticas propuestas son la medida de la eliminacin urinaria de los derivados
metoxilados de las catecolaminas. Las cualidades diagnsticas de la prueba en caso de los pacientes
hipertensos son sensibilidad = 0,97; especificidad = 0,95 y razn de verosimilitud positiva = 19,4. Si esta
costosa prueba se aplica al conjunto de los sujetos hipertensos donde la prevalencia del feocromocitoma es
P = 0, 004 , la probabilidad de una causa tumoral cuando la prueba es positiva no rebasa 0,07: por un solo
paciente realmente portador de un tumor, la prueba da pues 13 resultados falsamente positivos. PF Plouin
et al. (1981) han aconsejado aplicar esta prueba bioqumica slo a los hipertensos que presenten la
siguiente trada sintomtica: cefaleas, palpitaciones y crisis de sudoracin. Las cualidades diagnsticas de
la trada han sido obtenidas sobre una muestra de 2585 sujetos hipertensos.
feocromocitoma
presente ausente
presente 10 160 170
trada
ausente 1 2414 2415
11 2574 2585
Tabla 8
21
6.16. Ganancia diagnstica
Se llama ganancia diagnstica a la diferencia entre la probabilidad preprueba de la enfermedad y la
probabilidad postprueba obtenida por el resultado de la prueba. Si el resultado de la prueba es positivo, la
ganancia diagnstica G ( + ) se mide por la diferencia
G ( + ) = Pr ( E + | T + ) Pr ( E + ) = VPP P
Si el resultado de la prueba es negativo, la reduccin de la probabilidad de la enfermedad se mide en valor
absoluto por la diferencia
G ( ) = Pr ( E + ) Pr ( E + | T ) = P (1 VPN )
El conjunto de la ganancia diagnstica alcanzada por la aplicacin de la prueba, o contenido diagnstico
(gamma) de la prueba es igual a la suma de estas dos ganancias diagnsticas:
= G (+) + G ()
= Pr ( E + | T + ) Pr ( E + ) + Pr ( E + ) Pr ( E + | T )
= Pr ( E + | T + ) Pr ( E + | T )
El contenido diagnstico alcanzado por la aplicacin de una prueba se mide por la diferencia entre las
dos probabilidades postprueba de la enfermedad, que son obtenidas respectivamente por el resultado
positivo y negativo de la prueba.
Por ejemplo, una prueba con respuesta dicotmica cuyas cualidades diagnsticas son:
Se = 0,80
Es = 0,90
L = 8
= 0, 222
es aplicable a la investigacin de una enfermedad cuya probabilidad preprueba es 0,30.
Si la respuesta de la prueba es positiva, la probabilidad postprueba de la enfermedad se eleva a:
PL
Pr ( E + | T + ) = VPP =
P ( L 1) + 1
0,30 8
= = 0, 77
( 0,30 7 ) + 1
La ganancia diagnstica aportada por la respuesta positiva de la prueba es:
G ( + ) = VPP P = 0, 77 0,30 = 0, 47
Si la respuesta de la prueba es negativa, la probabilidad de la enfermedad baja a:
P
Pr ( E + | T ) = 1 VPN =
P ( 1) + 1
0,30 0, 222
= = 0, 09
( 0,30 ( 0, 222 1) ) + 1
La ganancia diagnstica obtenida por la respuesta negativa de la prueba, en valor absoluto es:
G ( ) = P (1 VPN ) = 0,30 0, 09 = 0, 21
Las ganancias diagnsticas se pueden visualizar en la Figura 13. En funcin de la probabilidad preprueba
P en abscisas, las dos curvas dan los valores de las probabilidades postprueba de la enfermedad E
segn que el resultado de la prueba sea positivo (curva superior) o negativo (curva inferior). La ganancia
diagnstica G ( + ) aportada por el resultado positivo es igual a la distancia OA; la ganancia G ( ) aportada
por un resultado negativo es igual en valor absoluto a la distancia OB; la ganancia total o contenido
22
diagnstico de la prueba cuando la probabilidad preprueba es 0,30, es igual a la distancia AB entre las
dos curvas: :
= 0, 47 + 0, 21 = 0, 68
Figura 13. Ganancia diagnstica obtenida por la respuesta de una prueba en funcin de la proba-
bilidad preprueba. La figura muestra que la ganancia diagnstica obtenida por la prueba tiende a
anularse cuando la probabilidad primaria de la enfermedad se aproxima a los valores extremos 0 y 1.
El clculo muestra que la ganancia diagnstica aportada por la respuesta positiva de la prueba es mxima
cuando la probabilidad preprueba es igual a:
1
P (+) =
1+ L
1
En el ejemplo, P ( + ) = = 0, 26
1+ 8
En caso de respuesta negativa, la ganancia diagnstica es mxima cuando la probabilidad primaria es:
1
P (+) =
1+ L
1
En el ejemplo, P ( ) = = 0, 68
1 + 0, 222
El contenido diagnstico de la prueba es mximo cuando la probabilidad preprueba de la enfermedad es:
1
Pmx =
1+ L
1
En el ejemplo, Pmx = = 0, 43 .
1 + 8 0, 222
Esta probabilidad es aquella en que los dos valores predictivos positivo VPP y negativo VPN son iguales.
En el ejemplo, cuando P es igual a Pmx = 0, 43 , los dos valores predictivos son VPP = VPN = 0,86 . Es
cuando la probabilidad preprueba est prxima a valores medianos prxima al 50 % cuando la respuesta
de la prueba aporta la informacin diagnstica mas elevada (Figura 14). Este valor Pmx de la probabilidad
23
preprueba es 0,50 cuando el producto L = 1 , es decir cuando las dos razones de verosimilitud L y son
inversas la una de la otra.
Figura 14. Ganancia diagnstica en funcin de la probabilidad preprueba P, aportada por una prueba
cuyas cualidades diagnsticas son L = 8 y = 0,222
G ( + ) es la ganancia diagnstica aportada por una respuesta positiva: su valor mximo se obtiene cuando:
1
P = 0, 26
1+ L
G ( ) es la ganancia diagnstica aportada por una respuesta negativa: su valor mximo se obtiene
cuando:
1
P = 0, 26
1+ L
es la suma de las dos ganancias, su valor mximo se obtiene cuando:
1
P = 0, 43
1+ L
7. Comentarios
Generalmente, sensibilidad y especificidad suelen tener una relacin inversa, es decir, si la sensibilidad de
una prueba es muy alta, es a costa de perder especificidad y viceversa.
Cuando para el diagnstico de una enfermedad existen varias pruebas posibles, la utilizacin de una u otra
se har atendiendo a las necesidades diagnsticas. As en las pruebas de cribado, deteccin o screening,
se utilizan, en general, pruebas de alta sensibilidad, mientras que en las pruebas de confirmacin se utilizan
tcnicas de alta especificidad. Las pruebas con una alta sensibilidad se utilizan cuando se quiere
diagnosticar correctamente a los pacientes enfermos. Por ejemplo, en el diagnstico del cncer de mama se
utiliza un marcador tumoral especfico. Si la paciente tiene cncer pero la prueba diagnstica no es capaz
de detectarla, el tumor avanzar rpidamente y provocar un deterioro en la mujer que har imposible un
tratamiento posterior. Por esta razn la prueba debe detectar a todos los pacientes enfermos, aun a costa
de diagnosticar incorrectamente a alguno sano, pues en las exploraciones complementarias que se realicen
posteriormente, se detectar que el diagnstico inicial era errneo.
Las pruebas con una alta especificidad se utilizan cuando se desea diagnosticar correctamente a todos los
individuos sanos. Por ejemplo, en el diagnstico del embarazo, si la prueba diagnostica incorrectamente a
mujeres no embarazadas, no pasar nada puesto que en pocos das se ver que el diagnstico era
incorrecto.
24
8. Etapas de un estudio de evaluacin de pruebas diagnsticas
Debido a que una misma prueba diagnstica puede ser utilizada para el estudio de varias situaciones
clnicas (por ejemplo, el diagnstico por imagen con resonancia magntica puede aplicarse a gran nmero
de patologas), se tendr que decidir cul se va a evaluar. Para guiar esta decisin se deben tener en
cuenta los siguientes factores:
Frecuencia de la enfermedad o estado. Se priorizarn aquellas aplicaciones que afecten a mayor
nmero de personas;
Coste de la tecnologa: las tecnologas ms caras deben ser evaluadas con el mximo rigor para evitar
gastos innecesarios al sistema sanitario;
Existencia de un criterio de referencia que permita la comparacin;
Impacto potencial sobre el manejo del paciente: se debe hacer mayor esfuerzo en mejorar la calidad de
las pruebas diagnstica de las condiciones clnicas para las que hay tratamiento eficaz;
Impacto potencial sobre el resultado clnico. Se dar prioridad a la evaluacin de aquellas pruebas, que
en definitiva, contribuyan a la mejora del estado de salud de los pacientes;
Existencia de mtodos diagnsticos inadecuados para la situacin clnica bajo estudio. Una vez
decidida la enfermedad o situacin clnica que se va a estudiar, el diseo del estudio ser similar al de
cualquier otro estudio observacional y los pacientes elegidos no debern diferir substancialmente de
aquellos a los que posteriormente se aplicar la prueba. Se deben incluir, por tanto, pacientes con
diversos estadios clnicos de la enfermedad, ya que si se escogieran slo los ms graves, por ejemplo,
daran mayor nmero de positivos, aumentando de una forma ficticia la sensibilidad de la prueba.
La eleccin del criterio de referencia resulta, en ocasiones, muy compleja, bien por ser costoso o
potencialmente perjudicial para el individuo o porque simplemente no se ha desarrollado un mejor mtodo
de diagnstico. Sin embargo, utilizar un criterio de referencia de baja calidad puede conducir, a que la nueva
medida sea considerada falsamente de baja calidad. Por ejemplo, con un patrn ureo de baja sensibilidad
muchos resultados positivos de la nueva prueba sern considerados errneamente falsos positivos,
disminuyendo el valor de la prueba.
25
modo de produccin consecuencias modo de control
6. Sesgo por es una eventualidad que se sobrestima Se y Es repeticin de la prueba si es
resultados no produce en cualquier prueba posible; Inclusin en el estudio
interpretables diagnstica o de referencia de los casos no interpretables
7. Sesgo por diversos observadores que generalmente estudios previos (piloto) de
variabilidad en actan dentro del estudio infraestima Se y Es consistencia inter e
la tienen diferentes Se y Es ; el intraobservadores; correcciones
interpretacin mismo observador cambia su matemticas
de resultados Se y Es dentro del estudio
debido al entrenamiento
Bibliografa
1. Albert A, Harris EK. Multivariate interpretation of clinical laboratory data. New York: Marcel Dekker;
1987.
2. Bermejo Fraile B. Epidemiologa clnica aplicada a la toma de decisiones en medicina. Departamento de
Salud. Gobierno de Navarra; 2001.
www.cfnavarra.es/salud/docencia.investigacion/textos/Monograf_1/Epidemiologia_clinica.pdf
3. Escrig-Sos J, Martnez-Ramos D, Miralles-Tena JM. Pruebas diagnsticas: nociones bsicas para su
correcta interpretacin y uso. Cir Esp 2006;79(5):267-273.
4. Grenier B. Dcision mdicale. Paris: MASSON; 1993.
5. Grimes DA, Schulz KF. Refining clinical diagnosis with likelihood ratios. Lancet. 2005;365(9469):1500-5.
6. Hayden SR, Brown MD. Likelihood ratio: A powerful tool for incorporating the results of a diagnostic test
into clinical decisionmaking. Ann Emerg Med. 1999;33(5):575-80.
7. Redondo Alvaro FL. La lgica en la interpretacin de las pruebas diagnsticas. Madrid: Garsi; 1989.
www.epiredperu.net/epired/ppts/curso_estadistica-scsf/estadistica-scsf-14.pdf
www.vhebron.es/ac/preventiva/docencia/mastphoenix/t06_pru_diagnosticas_diapos_fx.pdf
www.fisterra.com/mbe/investiga/pruebas_diagnosticas/pruebas_diagnosticas2.pdf
http://dxsp.sergas.es/ApliEdatos/Epidat/Ayuda/6-Ayuda%20Pruebas%20diagnsticas.pdf
www.uquebec.ca/reglog/chapitre9.htm
http://www.spieao.uhp-nancy.fr/~kohler/LectureArticle/
www.med.univ.montpl.fr/Enseignement/cycle_2/c-ac-2eCR.htm
26