Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Evaluacion Pruebas Diagnosticas 08 07
Evaluacion Pruebas Diagnosticas 08 07
Notas
ndice
1. INTRODUCCIN
2. CLASIFICACIN DE ENFERMEDADES POR DIAGNOSIS
3. CRITERIOS DE CALIDAD DE LAS PRUEBAS DIAGNSTICAS
4. TIPOS DE PRUEBAS
5. PATRN UREO
1
1
2
3
3
6.1. Sensibilidad
6.2. Especificidad
6.3. Valor predictivo positivo
6.4. Valor predictivo negativo
6.5. Razones de verosimilitud
6.6. Intervalo de confianza (IC) para la sensibilidad y la especificidad
6.7. Intervalos de confianza para los coeficientes de probabilidad
6.8. Variabilidad de las razones de verosimilitud
6.9. Valores predictivos y razones de verosimilitud. Inters en la evaluacin de las pruebas diagnsticas
6.10. Falsos positivos frente a falsos negativos. Criterios
6.11. Odds ratio diagnstica
6.12. Efectividad de una prueba
6.13. Eficiencia diagnstica de una prueba
6.14. El ndice de Youden (Y)
6.15. El efecto de concentracin
6.16. Ganancia diagnstica
5
5
6
6
7
8
9
9
15
19
19
20
20
20
21
22
7. COMENTARIOS
24
8. ETAPAS DE UN ESTUDIO DE EVALUACIN DE PRUEBAS DIAGNSTICAS
25
9. SESGOS POTENCIALES DE LOS ESTUDIOS SOBRE PRUEBAS DIAGNSTICAS25
10. EVALUACIN DIAGNSTICA: JERARQUIZACIN
26
BIBLIOGRAFA
26
1. Introduccin
Se trata de estudiar aquellos procedimientos estadsticos que permiten evaluar la validez, es decir cunto se
aproxima una medida al valor real que pretende medir. Son procedimientos muy generales, pero aqu se van
a tratar al hilo del problema de las pruebas diagnsticas (problema muy importante en la prctica y la
investigacin clnica): pruebas para determinar si un individuo tiene, o no, una cierta enfermedad (u otra
caracterstica). Hay que resaltar (y no siempre se hace) que si bien la validez de una prueba depende
exclusivamente de la prueba, las estimaciones numricas que se obtengan de la misma pueden depender
de la prevalencia y de las caractersticas clnicas de los pacientes que se hayan estudiado.
Tipo I: Son todas aquellas enfermedades donde la peor equivocacin que se puede cometer en el
diagnstico es un falso negativo.
Tipo II: Son todas aquellas enfermedades donde la peor equivocacin que se puede cometer en el
diagnstico es un falso positivo.
Tipo III: Son las restantes, donde no se puede clasificar claramente como una de las anteriores.
Las enfermedades que se pueden clasificar como Tipo I son:
Los falsos positivos traumatizan seriamente al paciente, en cambio los falsos negativos no;
Otros factores que se deben valorar son el precio de la prueba as como su inocuidad, ya que pueden existir
mtodos menos invasivos o ms econmicos para obtener una informacin suficiente para nuestros
propsitos.
La calidad de una prueba diagnstica se mide en trminos de validez y seguridad. La validez de una
prueba es el grado en que mide lo que se supone debe medir y para determinarla se debe comparar con
otra prueba de probada eficacia en la enfermedad de estudio o con el verdadero resultado en el caso de
que pueda ser conocido. Estos trminos de comparacin se denominan patrn ureo, gold standard o
criterio de referencia. La validez se mide a travs de la sensibilidad y la especificidad de la prueba.
La seguridad de una prueba es la capacidad para predecir la presencia o ausencia de enfermedad y se
mide en trminos de los valores predictivos, positivo y negativo.
4. Tipos de Pruebas
Pruebas con respuesta dicotmica (positivo, +; negativo, ), por ejemplo, la prueba de embarazo;
Pruebas con respuesta cuantitativa, por ejemplo, glucosa/diabetes, troponina/IAM. En este caso se
presenta el problema de establecer un punto de corte para dicotomizar la respuesta (+ o ).
5. Patrn ureo
Para identificar la enfermedad se requiere disponer de un diagnstico de certeza, una prueba de referencia,
lo que se conoce con el nombre de patrn ureo (patrn oro, gold standard), para poder ver con respecto
a este patrn la validez de otras pruebas diagnsticas, su calidad, su capacidad para identificar una
enfermedad o para seguir un tratamiento.
1 PATRON DE REFERENCIA
POBLACION
PACIENTE
PRUEBA DIAGNOSTICA
Pr(PREPRUEBA)
Pr(POSTPRUEBA)
Figura 1. Esquema de los estudios de evaluacin de pruebas diagnsticas. (1) patrn ureo (gold
standard) vlido; (2) comparacin independiente; (3) espectro de pacientes adecuado; (4)
descripcin completa de los mtodos; (5) presentacin correcta de los resultados; (6) repercusin
sobre el manejo diagnsticoteraputico.
Muestra (individuos
consecutivos con
las caractersticas
establecidas)
A todos se
efecta la
prueba y el
patrn ureo
Enfermedad
presente
detectada por la
prueba
Enfermedad
ausente, la
prueba sugiri su
presencia
Enfermedad
presente no
detectada por la
prueba
Enfermedad
ausente, la
prueba coincidi
Figura 2.
De esta manera, al cabo del estudio se dispondr de los datos necesarios para completar la tabla de
contingencia, permitiendo calcular todos los indicadores presentados.
Para minimizar los sesgos, se deben considerar algunas premisas claves, a saber:
1. Seleccin de la muestra: la muestra debe incluir participantes que representen todas las formas clnicas
del dao buscado y respetando la proporcin en que la misma se presenta en la prctica cotidiana. An
pruebas de escasa capacidad detectan aceptablemente los casos graves al compararlas con los sin dao.
El mayor problema se presenta al intentar detectar a los casos de gravedad moderada a leve. Por ello, la
muestra debe obtenerse desde la presentacin consecutiva de casos clnicos que renan las caractersticas
que los hara pasibles de la indicacin de la prueba. Entre ellos, habr casos de todas las formas clnicas e
incluso casos sin dao.
2. Comparacin: la misma debe establecerse con un patrn de referencia apropiado y confiable. El patrn
ureo debe reunir esas caractersticas y todos los participantes deben recibir las dos pruebas (la que se
est investigando y el patrn ureo). Es frecuente observar que si se seleccion un patrn ureo invasivo
y/o costoso, ste se aplique solamente a los que arrojaron un resultado anormal de la prueba en anlisis.
Este proceder impide que se completen los datos de la tabla de contingencia, ya que no se dispondra de
los necesarios para llenar los casilleros c ni d y, por lo tanto, se hace imposible calcular sensibilidad ni
especificidad. A este error de procedimiento (o error sistemtico o sesgo) se lo denomina error de
verificacin (work-up bias).
3. Interpretacin de los resultados: La lectura del resultado de la prueba analizada debe ser realizada
desconociendo el resultado del patrn ureo, para evitar el sesgo hacia una coincidencia esprea.
pacientes enfermos
pacientes no enfemos
total
prueba positiva
prueba negativa
total
27 (VP)
6 (FN)
33 (TE)
3 (FP)
164 (VN)
167 (TNE)
30 (TP)
170 (TN)
200 (T)
Tabla 1
Los 27 pacientes que, estando enfermos, dieron positiva la prueba diagnstica se consideran verdaderos
positivos (VP). Los seis pacientes enfermos que dieron negativa la prueba de laboratorio son considerados
como falsos negativos (FN). Los tres pacientes no enfermos que dieron positiva la prueba se denominan
falsos positivos (FP). Los 164 pacientes no enfermos que no dieron positivo en la prueba son los verdaderos
negativos (VN).
A continuacin se proceder a definir los parmetros de valoracin de las pruebas diagnsticas.
6.1. Sensibilidad
Es el porcentaje de resultados positivos en pacientes con una determinada enfermedad.
Mide el porcentaje de individuos enfermos correctamente diagnosticados
La sensibilidad indica la capacidad de una prueba para detectar a un sujeto enfermo.
La sensibilidad es la probabilidad de que la prueba identifique como enfermo a aquel que realmente lo est.
La sensibilidad expresa cun "sensible" es la prueba a la presencia de la enfermedad.
Una alta sensibilidad indica un bajo nmero de falsos negativos.
La sensibilidad sera la probabilidad de que un paciente enfermo diese la prueba positiva o el porcentaje de
positivos de la prueba en pacientes con la enfermedad,
Sensibilidad ( % ) =
VP 100
TE
Se =
27 100
= 81,8%
33
Una sensibilidad del 81,8 % indica que solo el 81,8 % de los pacientes enfermos darn positiva la prueba.
En este caso habr un 18,2 % de falsos negativos (pacientes enfermos que han dado negativa la prueba).
Cuanto ms sensible es una prueba, ms probable es que detecte a las personas con enfermedad. Por ello,
las pruebas con una sensibilidad muy elevada son muy tiles para descartar la presencia de enfermedad.
6.2. Especificidad
Es el porcentaje de resultados negativos en pacientes que no padecen esa enfermedad.
Valora la capacidad de una prueba para detectar correctamente individuos sanos.
La especificidad es la probabilidad de que un individuo sano tenga un resultado negativo.
Una alta especificidad indica una baja frecuencia de falsos positivos.
La especificidad sera la probabilidad de que un paciente sano diese la prueba negativa o el porcentaje de
negatividad de la prueba diagnstica en ausencia de enfermedad, o:
Especificidad ( % ) =
VN 100
TNE
Es =
164 100
= 98, 2 %
167
Una especificidad del 98,2 % indica que el 98,2 % de los individuos sanos darn negativa la prueba. En este
caso habr un 1,8 % de falsos positivos (pacientes sanos que han dado positiva la prueba). Las pruebas
muy especficas se usan para confirmar la presencia de una enfermedad. Si la prueba es muy especfica y
da positiva, indica la presencia de enfermedad, ya que apenas produce falsos positivos.
Aunque la sensibilidad y la especificidad son dos ndices de calidad de la prueba, en la prctica clnica las
preguntas a las que interesa responder son: cul es la probabilidad de que est verdaderamente enfermo
si un sujeto ha resultado positivo, Pr ( E + | T + ) ? y, por el contrario, cul es la probabilidad de que
realmente est sano si el sujeto result negativo en la prueba, Pr ( E | T ) ? Estas dos probabilidades se
pueden calcular aplicando el teorema de Bayes, siempre que se conozca la probabilidad de que el sujeto
est enfermo antes de realizar la prueba, o probabilidad preprueba. Si no se dispone de ninguna
informacin adicional sobre el sujeto, dicha probabilidad ser la prevalencia de la patologa en la poblacin,
aplicable slo en el caso de programas de cribado ("screening") sobre la poblacin general, ya que en la
prctica habitual los sujetos candidatos a una prueba diagnstica lo son por las sospechas deducidas de la
anamnesis o por una sintomatologa previa, y por tanto la probabilidad de que padezcan la enfermedad bajo
sospecha ser superior a la prevalencia de sta en la poblacin general.
Pr ( E + | T + ) =
Se P
Se P + (1 Es )(1 P )
Pr ( E | T ) =
Es P
Es (1 P ) + (1 Se ) P
VPP =
VP
VP + FP
Igualmente se puede calcular en la tabla la proporcin de sujetos verdaderamente sanos sobre el total de
los que dieron negativo, valor predictivo negativo, VPN:
VPN =
VN
VN + FN
VPP ( % ) =
VP 100
TP
VPP =
27 100
= 90 %
30
Un VPP del 90 % indica que de cada 100 pacientes que dan la prueba positiva solo 90 padecen la
enfermedad, o lo que es lo mismo: si la prueba da positiva, la probabilidad de padecer la enfermedad es de
un 90 %. En este caso habr un 10 % de individuos sanos diagnosticados incorrectamente como enfermos.
Pero esto no significa que haya un 10 % de falsos positivos.
VPN ( % ) =
En el ejemplo, el VPN ser:
6
VN 100
TN
VPN =
164 100
= 96,5%
170
Un valor predictivo negativo del 96,5 % indica que de cada 100 pruebas negativas, 96,5 pertenecern a
individuos sanos, o lo que es igual, si la prueba da negativa, la probabilidad de no padecer la enfermedad es
del 96.5 %. En este caso hay un 3,5 % de individuos enfermos que sern diagnosticados errneamente
como no enfermos. Esto tampoco significa que haya un 3,5 % de falsos negativos.
El intervalo de confianza al 95 % de los valores predictivos se calculan de acuerdo con las siguientes
expresiones:
VPP
VPN
donde
VPP (1 VPP )
a+b
VPN (1 VPN )
c+d
=1,96
Los valores predictivos dependen mucho de la prevalencia de la enfermedad en la poblacin (cociente entre
enfermos y poblacin), no as la sensibilidad y la especificidad, que son independientes de la misma.
Puesto que esos dos ndices VPP y VPN son los que interesan en la prctica clnica, parecera natural
utilizarlos como ndices de comparacin a la hora de evaluar dos mtodos diagnsticos diferentes. Sin
embargo presentan un grave inconveniente, ya que si se calculan a partir de la tabla dependen de la
proporcin de enfermos en la muestra estudiada. Por ello para una determinada prueba resulta necesario
determinar unos ndices de valoracin que, respondiendo a las necesidades reales en cuanto a la
clasificacin de pacientes, sin embargo no dependan de esa proporcin de enfermos en la muestra, tales
como las razones de verosimilitud
CP + =
Pr (T + | E )
Pr (T + | NE )
Este cociente CP + se conoce como cociente de probabilidad positivo o tambin como cociente de
verosimilitud de una prueba positiva (likelihood ratio of positive test, LR + o L + ), razn de verosimilitud de
una prueba positiva
( RV + ) ,
( IEP )
CP =
Pr (T | E )
Pr (T | NE )
Valores de CP menores indican una mejor capacidad diagnstica de la prueba (mejor capacidad para
diagnosticar la ausencia de enfermedad).
El cociente de probabilidad negativo tambin se conoce como cociente de verosimilitud negativo
( LR , ) ,
( RV ) ,
eficiencia pronstica de una prueba negativa. El inverso de este cociente se llama poder (o potencia)
predictiva de una prueba negativa.
Se puede determinar unas frmulas para expresar los cocientes de probabilidad en funcin de la
sensibilidad Se y de la especificidad Es :
Se
1 Es
1 Se
CP =
Es
CP + =
La ventaja de los cocientes CP + y CP frente a los valores predictivos positivo y negativo de la prueba
radica en que, a diferencia de stos, no dependen de la proporcin de enfermos en la muestra, sino tan slo
de la sensibilidad y especificidad de sta, de ah su utilidad a la hora de comparar pruebas diagnsticas.
Adems si se conoce o se puede hacer una estimacin de la probabilidad preprueba de que un sujeto
padezca la enfermedad, utilizando los cocientes de probabilidad, al realizar la prueba se podr "corregir" ese
valor de acuerdo con el resultado, de tal manera que la probabilidad aumenta o disminuye segn que el
resultado sea positivo o negativo, aplicando la siguiente frmula
P CP
1 + P ( CP 1)
Pr post =
patologa
prueba
enfermo ( E + )
no enfermo ( E )
positiva (T + )
72
100
positivos: 172
negativa (T )
18
150
negativos: 168
enfermos: 90
no enfermos: 250
total
total: 340
Tabla 2
Aplicando las frmulas anteriores se tiene:
valor estimado
intervalo de confianza al 95 %
0,80
0,72 0,88
0,60
0,54 0,66
2,00
1,66 2,40
0,33
0,22 0,51
sensibilidad
especificidad
CP+
CP
Tabla 3
Evidentemente los valores de los diferentes ndices son estimaciones realizadas mediante un experimento
diseado al efecto, por lo que es necesario calcular algn indicador de su grado de incertidumbre, como
puede ser un intervalo de confianza del 95 %.
es el nmero de enfermos; y
8
Se (1 Se )
m
Es (1 Es )
n
es el nmero de no enfermos.
Para un intervalo de confianza (IC) del 99 % hay que reemplazar 1,96 por 2,576 y para un IC del 99,9% hay
que reemplazar 1,96 por 3,290
CP
donde
2 = 0, 2 , el intervalo de confianza al 95 % es 1, 02
1,96
0,2
= ( 0,92 , 1, 09 )
IC [CP + ] (1 ) % = e
ln ( CP + ) z
IC [CP ] (1 ) % = e
ln ( CP ) z
1 Se Es
+
d
c
Se 1 Es
+
b
a
Se
son funcin lineal de la
1 Es
1 Es
es igualmente una funcin lineal de la sensibilidad, pero
Se
Cuando Es = 1 Se = 0,8 , las dos razones de verosimilitud son iguales a 1 y por lo tanto en esta situacin la
prueba carece de utilidad diagnstica. Se nota que la progresin de L es muy rpida cuando la
especificidad es superior a 0,7. La razn de verosimilitud negativa se modifica poco cuando Es crece de
0,50 a 1,00, mientras que la razn de verosimilitud positiva L se afectada mucho por variaciones mnimas
de la especificidad cuando sta es muy elevada; as, cuando Es crece de 0,90 a 0,95, L pasa de 8 a 16.
Si la sensibilidad es constante, las dos razones de verosimilitud son funciones hiperblicas de la
especificidad. La razn de verosimilitud positiva L , en particular, crece muy rpidamente y tiende hacia el
infinito cuando la especificidad de una prueba o de un grupo de pruebas tiende hacia 1.
Se dice que la eficacia diagnstica de una prueba, en la investigacin de una enfermedad determinada E ,
est estrechamente ligada al crecimiento de su especificidad, cualidad que, precisamente, es estable en el
caso de los sujetos no afectados por la enfermedad E
Comparando los cocientes de probabilidad de dos pruebas diagnsticas existen cuatro posibles resultados
que podemos reflejar en una grfica. En el eje de las Y representamos la sensibilidad, en el eje de las X
se representa (1especificidad). El punto representa los valores de sensibilidad y (1especificidad)
observados para la prueba A . Se traza una lnea desde el origen (0,0) que pase por el punto A y otra
desde el valor (1,1) que tambin pase por ese punto, quedando dividido el grfico en cuatro zonas como se
ve en la Figura 5, de tal manera que cualquier otra prueba cuyo resultado representemos en esa grfica
estar en alguna de las cuatro zonas
Figura 5. Las zonas corresponden a las siguientes situaciones: 1: en esta regin la prueba B es
siempre superior a la A, tanto para confirmar presencia como ausencia de enfermedad; 2: aqu la
prueba B slo es superior a la A para confirmar ausencia de enfermedad; 3: en esta zona B siempre
es inferior a A; 4: si el resultado de B est en este rea, ser superior a A para confirmar la presencia
de enfermedad.
Supngase ahora que se desea comparar la prueba A con otra prueba B cuya sensibilidad es 0,9 y
especificidad 0,5. Representndolo en la Figura 6 se obtiene:
11
Figura 6. B cae en la zona 2 por lo que es una prueba mejor que A para confirmar la ausencia de
enfermedad, como se puede determinar tambin numricamente al calcular los correspondientes
cocientes de probabilidad CP+ = 1,8 y CP = 0,2.
Todas estas consideraciones se refieren nicamente a la capacidad discriminatoria de una prueba. La
decisin sobre qu prueba diagnstica es ms adecuada, siempre es algo ms complicada, puesto que
intervienen otros aspectos, como son el coste de la prueba, los riesgos que supone para el paciente, valorar
las consecuencias que conlleva un falso positivo o un falso negativo...
Evidentemente para comparar los parmetros de dos pruebas diagnsticas habr que considerar que los
valores obtenidos slo son estimaciones y estn sometidos por tanto a posibles errores de muestreo, por lo
que habr que efectuar el correspondiente contraste estadstico para determinar si las diferencias
encontradas son suficientemente importantes como para no poder ser atribuidas al azar.
Si la razn de verosimilitud es igual a 1, la probabilidad del diagnstico es la misma antes y despus de
aplicar la prueba. En este caso la prueba es intil, no tiene capacidad discriminante. Cuanto ms se aleje de
1 el valor de la razn de verosimilitud, mas inters presenta la prueba.
Es independiente de la prevalencia;
Es un buen reflejo del valor de la prueba cualquiera que sea el grupo al que se aplique;
12
Utilizable para diferentes niveles de resultados de una prueba. Para cada nivel procura una informacin
diferente permitiendo interpretar mejor los resultados de la prueba;
Permite calcular de manera individual el inters de realizar la prueba a partir de la probabilidad inicial de
la enfermedad del paciente.
Los cocientes de probabilidad permiten transformar la probabilidad preprueba en probabilidad postprueba
mediante la relacin:
odds =
p
odds
p =
1 p
1 + odds
los subndices post y pre indican postprueba y preprueba respectivamente y el subndice R representa el
resultado obtenido.
En el caso del siguiente ejemplo:
ecocardiograma
normal
disfuncin
total
93
50
r=a+b
143
11
s=c+d
12
t=a+c
94
u=b+d
61
N=a+b+c+d
155
d
Se
d r
= s =
b
1 Es
b s
r
c
1 Se
cr
= s =
CP =
a
Es
a s
r
CP + =
CP + =
d r
11143
=
= 2, 62
b s
50 12
CP =
cr
1143
=
= 0,13
a s
9312
supngase que se le aplica la prueba a un anciano al que por su sintomatologa e historia se le estima una
probabilidad alta (por ejemplo, 0,7) de padecer disfuncin ventricular izquierda cmo se modificara esta
probabilidad si se le midiera la concentracin plasmtica del pptido y resultara positiva ( 18,7)? A partir
0, 7
= 2,33 ; como el resultado es positivo
1 0, 7
6,10
CPR = CP + = 2, 62 , por tanto odds post = 2, 62 2,33 = 6,10 y Pr ( post ) =
= 0,86 ; si el resultado de
7,10
la prueba hubiera sido negativo CPR = CP = 0,13 y odds post = 0,13 2,33 = 0,30 y por lo tanto
de la probabilidad preprueba, primero se calcula el odds pre =
Pr ( post ) =
0,30
= 0, 23 .
1,30
13
Figura 7. Nomograma de Fagan (Fagan TJ. Letter: Nomogram for Bayes theorem. N Engl J Med. 1975;
293(5): 257)
Fagan (1975) describi un nomograma para el teorema de Bayes, basado en la capacidad de convertir el
teorema de Bayes en una funcin sumatoria lineal simple. Con un par de trucos matemticos se puede
conseguir esto. Primero, se necesita la versin de probabilidad del teorema de Bayes:
R
Pr
E
E
O = O(E)
R
R
Pr
E
Donde E
E
R
representa enfermedad;
representa ausencia de enfermedad; y
log (" Odds postprueba ") = log (" Odds preprueba ") + log ( CP )
o de forma simblica:
E
log O = log ( O ( E ) )
R
R
Pr E
+ log
Pr R
E
o tambin:
Pr ( postprueba ) = Pr ( preprueba ) x CP
log ( Pr ( postprueba ) ) = log ( Pr ( preprueba ) ) + log ( CP )
14
El nomograma tiene tres columnas: la primera es la probabilidad de tener la enfermedad antes de aplicar la
( PPP, VPP ) . Con una regla se traza una lnea entre la probabilidad preprueba y la razn de verosimilitud.
La prolongacin de esta lnea corta en la tercera columna la probabilidad de tener la enfermedad en funcin
del resultado de la prueba,
Pr ( M | S ) = VPP =
VPP =
P L
P ( L 1) + 1
VPN =
1 P
P ( 1) + 1
VPP
VPN
1VPN
1,0
0,95
0,90
0,80
0,70
0,666
0,60
0,50
0,45
0,40
0,30
1,0
0,98
0,96
0,92
0,87
0,86
0,82
0,75
0,71
0,67
0,56
0,00
0,095
0,18
0,33
0,46
0,50
0,57
0,666
0,71
0,75
0,82
1,0
0,905
0,82
0,67
0,54
0,50
0,43
0,33
0,29
0,25
0,18
15
VPP
VPN
1VPN
0,25
0,20
0,10
0,05
0,01
0,00
0,50
0,43
0,25
0,14
0,03
0,00
0,86
0,89
0,95
0,97
0,99
1,00
0,14
0,11
0,05
0,03
0,01
0,00
= 0,50 )
cuando P
Figura 9. Variacin de los valores predictivos de una prueba cuyas cualidades son
(L =3
Las curvas de los valores predictivos en funcin de la probabilidad a priori P son hiprbolas. Los puntos
destacables de estas tres curvas son:
1
1+ L
Para una misma prueba, cuando P disminuye, VPP disminuye y VPN aumenta. Cuando P aumenta,
VPP aumenta y VPN disminuye.
Se nota que el valor predictivo positivo al principio crece rpidamente cuando la probabilidad preprueba
crece entre 0 y 0,50 y despus ms lentamente. El VPP es inferior a 0,50 cuando la probabilidad a priori o
preprueba es inferior a P1 =
1
1
, en el ejemplo, donde L = 3 , cuando P es inferior a
= 0, 25 (Figura
1+ 3
1+ L
8).
16
1
, el VPP o probabilidad
1+ L
1
1
, en el ejemplo P2 =
= 0, 666 (Figura 8).
1 + 0,50
1+
1
incluso si la prueba da un resultado negativo,
1+
P1 =
1
1+ L
P2 =
1
1+
determinan lo que se puede definir como el intervalo de seguridad de la prueba. En efecto, cuando la
probabilidad primaria se sita dentro de este intervalo, un resultado positivo de la prueba da un
VPP superior al 50 % y un resultado negativo da una probabilidad secundaria de la enfermedad inferior al
50 %. Este no es el caso cuando P se sita fuera de este intervalo: si P es inferior a P1 , la probabilidad
postprueba de la enfermedades inferior a 1 cambio sobre dos, incluso si la prueba da un resultado positivo.
Cuando P es superior a P2 , incluso si el resultado de la prueba es negativo, la probabilidad postprueba de
la enfermedad es todava superior a 1 cambio sobre 2
intervalo de seguridad de la probabilidad primaria, tal como est definido por los lmites P1 y P2 , son de una
importancia capital para la conducta del razonamiento y de la decisin diagnstica.
17
La curva del valor predictivo positivo VPP es tanto mayor cuanto ms elevada es L , y la curva del valor
predictivo negativo VPN es tanto menor cuanto ms pequea es . El Intervalo de seguridad diagnstica
es tanto ms amplio cuanto ms elevada es L y ms pequea .
prueba 1
prueba 2
prueba 3
sensibilidad
especificidad
0,90
0,80
4,5
0,125
0,90
0,90
9,0
0,110
0,90
0,98
45,0
0,100
Tabla 6
La figura 11A muestra que para valores bajos de la probabilidad preprueba P , la eficacia diagnstica del
resultado positivo de la prueba medida por el VPP es tanto mas grande cuanto mas elevados son la
especificada y la razn de verosimilitud positiva. En contra, las variaciones de la especificidad modifican
muy poco la consecuencia del resultado negativo: en este caso el efecto de la probabilidad primaria es
predominante.
Las conclusiones inversas resultan de la figura 11B donde las tres pruebas tienen una especificidad idntica
igual a 0,90 y una sensibilidad creciente:
prueba 1
prueba 2
prueba 3
sensibilidad
especificidad
0,60
0,90
6,0
0,44
0,80
0,90
8,0
0,22
0,95
0,90
9,5
0,055
Tabla 7
Las variaciones de la sensibilidad afectan poco los valores predictivos positivos; en cambio, modifican
considerablemente el efecto de un resultado negativo de la prueba, sobre todo cuando la probabilidad
preprueba de la enfermedad es superior a 0,50 0,60.
En suma, cuando la probabilidad preprueba P es baja, un resultado negativo de la prueba tiene poca
incidencia sobre la decisin diagnstica; el de un resultado positivo de una prueba especfica es elevado. Lo
18
Figura 12
Existe una zona de posibles resultados de la prueba para la que la distribucin de sujetos sanos y enfermos
se solapan. Si se desea aumentar la probabilidad de detectar pacientes enfermos (en la Figura 12
corresponde a mover el punto de corte hacia la izquierda) se ve como tambin aumentan el nmero de
falsos positivos. Si se desplaza el punto de corte hacia la derecha, disminuirn los falsos positivos, pero a
costa de aumentar el de falsos negativos. Resumiendo, un aumento de la sensibilidad disminuye la
especificidad, y viceversa.
ser til para mostrar la fuerza de asociacin entre el resultado de una prueba y la enfermedad. Este ndice
traduce las prestaciones de una prueba con un solo valor que no est influenciado por la prevalencia.
Es la razn entre la odds de estar enfermo si la prueba da positivo y la odds de no estar enfermo si la
prueba da negativo.
VPP
(1 VPP )
+
CP
FN =
=
DOR =
FP
CP
(1 VPN )
VN
VPN
VP
Los valores de la DOR varan de cero a infinito (cuantos ms altos son los valores, mejor es la prueba). El
valor DOR = 1 significa que la prueba no es discriminante, es la prueba intil. Los valores mayores de 1
significan que es ms probable que la prueba de positivo en el caso de enfermos que en sanos.
3
Se
Es
+ ln
ln
=
1 Es
1 Se
ln
CP +
CP
y que puede interpretarse como la diferencia entre las medias de los resultados entre una poblacin de
enfermos y otra de sanos en una escala normalizada. Si = 1 la prueba no es efectiva y si = 3 es
altamente efectiva.
Eficiencia =
VP + VN
VP + VN + FP + FN
Eficiencia =
Pr ( M ) Se
(1 Pr ( M ) ) Es
En el caso de que la prevalencia de la enfermedad sea 0,50, sera Eficiencia = 0,5 Se + 0,5 Es y
entonces se llamara eficiencia estndar:
Eficiencia estndard =
Se + Es
2
Y = Se + Es 1
Vara de (1) a (+1). Si es inferior o igual a 0, la prueba no tiene ningn valor informativo. La prueba es tanto
de mejor cuanto el ndice de Youden se acerca a 1.
Hay una relacin lineal entre este ndice y la eficiencia estndar, ya que:
Y = 2
( Se + Es ) 1
2
20
Pr ( M | T + )
Probabilidad postprueba de M
VPP
=
=
Probabilidad preprueba de M
P
Pr ( M )
El efecto de concentracin es precioso en situacin de cribado de una enfermedad cuya prevalencia es muy
baja en la poblacin estudiada.
Por ejemplo, como el feocromocitoma puede ser una causa, rara, de hipertensin arterial, su investigacin
sistemtica se aconseja a causa de las posibilidades teraputicas que aporta la ablacin quirrgica del
tumor. Las pruebas diagnsticas propuestas son la medida de la eliminacin urinaria de los derivados
metoxilados de las catecolaminas. Las cualidades diagnsticas de la prueba en caso de los pacientes
hipertensos son sensibilidad = 0,97; especificidad = 0,95 y razn de verosimilitud positiva = 19,4. Si esta
costosa prueba se aplica al conjunto de los sujetos hipertensos donde la prevalencia del feocromocitoma es
P = 0, 004 , la probabilidad de una causa tumoral cuando la prueba es positiva no rebasa 0,07: por un solo
paciente realmente portador de un tumor, la prueba da pues 13 resultados falsamente positivos. PF Plouin
et al. (1981) han aconsejado aplicar esta prueba bioqumica slo a los hipertensos que presenten la
siguiente trada sintomtica: cefaleas, palpitaciones y crisis de sudoracin. Las cualidades diagnsticas de
la trada han sido obtenidas sobre una muestra de 2585 sujetos hipertensos.
feocromocitoma
presente
ausente
trada
presente
ausente
10
160
170
2414
2415
11
2574
2585
Tabla 8
La presencia de la triada sintomtica en el caso de un sujeto hipertenso aumenta la probabilidad del
feocromocitoma a
10
= 0, 06 . La presencia de la triada sintomtica tiene pues un efecto de
170
VPP
0, 06
=
= 14, 7 veces
0, 004
P
Cuando la prueba bioqumica se aplica entonces a los pacientes seleccionados por este criterio clnico (en
la hiptesis de que se mantengan en este grupo las cualidades diagnsticas establecidas en el conjunto de
los hipertensos) su valor predictivo positivo sera entonces:
VPP =
0, 06 19, 4
= 0,55
( 0, 06 18, 4 ) + 1
La prueba esta vez es perfectamente aceptable: por cada enfermo diagnosticado, no da mas que un
resultado falsamente positivo, gracias al efecto de concentracin provocado por el criterio clnico inicial. El
efecto de concentracin obtenido por el conjunto de esta estrategia secuencial es igual a
0,55
= 137,5 veces .
0, 004
La ausencia de la triada sintomtica reduce la probabilidad de feocromocitoma a
un nivel 10 veces mas bajo que en el conjunto de los hipertensos.
21
1
= 0, 0004 , es decir a
2415
G ( + ) = Pr ( E + | T + ) Pr ( E + ) = VPP P
Si el resultado de la prueba es negativo, la reduccin de la probabilidad de la enfermedad se mide en valor
absoluto por la diferencia
G ( ) = Pr ( E + ) Pr ( E + | T ) = P (1 VPN )
El conjunto de la ganancia diagnstica alcanzada por la aplicacin de la prueba, o contenido diagnstico
(gamma) de la prueba es igual a la suma de estas dos ganancias diagnsticas:
= G (+) + G ()
= Pr ( E + | T + ) Pr ( E + ) + Pr ( E + ) Pr ( E + | T )
= Pr ( E + | T + ) Pr ( E + | T )
El contenido diagnstico alcanzado por la aplicacin de una prueba se mide por la diferencia entre las
dos probabilidades postprueba de la enfermedad, que son obtenidas respectivamente por el resultado
positivo y negativo de la prueba.
Por ejemplo, una prueba con respuesta dicotmica cuyas cualidades diagnsticas son:
Se = 0,80
Es = 0,90
L = 8
= 0, 222
es aplicable a la investigacin de una enfermedad cuya probabilidad preprueba es 0,30.
Si la respuesta de la prueba es positiva, la probabilidad postprueba de la enfermedad se eleva a:
Pr ( E + | T + ) = VPP =
=
PL
P ( L 1) + 1
0,30 8
= 0, 77
( 0,30 7 ) + 1
G ( + ) = VPP P = 0, 77 0,30 = 0, 47
Si la respuesta de la prueba es negativa, la probabilidad de la enfermedad baja a:
Pr ( E + | T ) = 1 VPN =
=
P
P ( 1) + 1
0,30 0, 222
= 0, 09
( 0,30 ( 0, 222 1) ) + 1
La ganancia diagnstica obtenida por la respuesta negativa de la prueba, en valor absoluto es:
G ( ) = P (1 VPN ) = 0,30 0, 09 = 0, 21
Las ganancias diagnsticas se pueden visualizar en la Figura 13. En funcin de la probabilidad preprueba
P en abscisas, las dos curvas dan los valores de las probabilidades postprueba de la enfermedad E
segn que el resultado de la prueba sea positivo (curva superior) o negativo (curva inferior). La ganancia
diagnstica G ( + ) aportada por el resultado positivo es igual a la distancia OA; la ganancia G ( ) aportada
por un resultado negativo es igual en valor absoluto a la distancia OB; la ganancia total o contenido
22
diagnstico de la prueba cuando la probabilidad preprueba es 0,30, es igual a la distancia AB entre las
dos curvas: :
= 0, 47 + 0, 21 = 0, 68
Figura 13. Ganancia diagnstica obtenida por la respuesta de una prueba en funcin de la probabilidad preprueba. La figura muestra que la ganancia diagnstica obtenida por la prueba tiende a
anularse cuando la probabilidad primaria de la enfermedad se aproxima a los valores extremos 0 y 1.
El clculo muestra que la ganancia diagnstica aportada por la respuesta positiva de la prueba es mxima
cuando la probabilidad preprueba es igual a:
P (+) =
En el ejemplo, P ( + ) =
1
1+ L
1
= 0, 26
1+ 8
En caso de respuesta negativa, la ganancia diagnstica es mxima cuando la probabilidad primaria es:
P (+) =
En el ejemplo, P ( ) =
1
1+ L
1
= 0, 68
1 + 0, 222
Pmx =
En el ejemplo, Pmx =
1
1+ L
1
= 0, 43 .
1 + 8 0, 222
Esta probabilidad es aquella en que los dos valores predictivos positivo VPP y negativo VPN son iguales.
En el ejemplo, cuando P es igual a Pmx = 0, 43 , los dos valores predictivos son VPP = VPN = 0,86 . Es
cuando la probabilidad preprueba est prxima a valores medianos prxima al 50 % cuando la respuesta
de la prueba aporta la informacin diagnstica mas elevada (Figura 14). Este valor Pmx de la probabilidad
23
preprueba es 0,50 cuando el producto L = 1 , es decir cuando las dos razones de verosimilitud L y
inversas la una de la otra.
son
Figura 14. Ganancia diagnstica en funcin de la probabilidad preprueba P, aportada por una prueba
cuyas cualidades diagnsticas son L = 8 y = 0,222
G ( + ) es la ganancia diagnstica aportada por una respuesta positiva: su valor mximo se obtiene cuando:
P
1
1+ L
= 0, 26
G ( ) es la ganancia diagnstica aportada por una respuesta negativa: su valor mximo se obtiene
cuando:
1
1+ L
= 0, 26
Coste de la tecnologa: las tecnologas ms caras deben ser evaluadas con el mximo rigor para evitar
gastos innecesarios al sistema sanitario;
Impacto potencial sobre el manejo del paciente: se debe hacer mayor esfuerzo en mejorar la calidad de
las pruebas diagnstica de las condiciones clnicas para las que hay tratamiento eficaz;
Impacto potencial sobre el resultado clnico. Se dar prioridad a la evaluacin de aquellas pruebas, que
en definitiva, contribuyan a la mejora del estado de salud de los pacientes;
Existencia de mtodos diagnsticos inadecuados para la situacin clnica bajo estudio. Una vez
decidida la enfermedad o situacin clnica que se va a estudiar, el diseo del estudio ser similar al de
cualquier otro estudio observacional y los pacientes elegidos no debern diferir substancialmente de
aquellos a los que posteriormente se aplicar la prueba. Se deben incluir, por tanto, pacientes con
diversos estadios clnicos de la enfermedad, ya que si se escogieran slo los ms graves, por ejemplo,
daran mayor nmero de positivos, aumentando de una forma ficticia la sensibilidad de la prueba.
La eleccin del criterio de referencia resulta, en ocasiones, muy compleja, bien por ser costoso o
potencialmente perjudicial para el individuo o porque simplemente no se ha desarrollado un mejor mtodo
de diagnstico. Sin embargo, utilizar un criterio de referencia de baja calidad puede conducir, a que la nueva
medida sea considerada falsamente de baja calidad. Por ejemplo, con un patrn ureo de baja sensibilidad
muchos resultados positivos de la nueva prueba sern considerados errneamente falsos positivos,
disminuyendo el valor de la prueba.
no se tiene en cuenta el
espectro clnico de la
enfermedad o comorbilidad
2. Sesgo de la
prueba de
referencia
imperfecta
3. Sesgo de
incorporacin
4. Sesgo de
revisin o
valoracin
ciega
5. Sesgo de
secuencia o
verificacin
diagnstica
consecuencias
sobrestima Se y Es
si se representan los
casos graves;
infraestima Se y Es
si se representan los
casos leves
generalmente
sobrestima Se y Es
pero a veces los
infraestima
sobrestima Se y Es
sobrestima Se y Es
sobrestima Se e
infraestima Es
25
modo de control
representar el espectro
completo en la muestra;
describir el espectro en el
anlisis; anlisis de la prueba
diagnstica en los subgrupos
seguimiento clnicos de los
pacientes para conocer si son
enfermos o no; correcciones
matemticas si se dispone de
un subconjunto de pacientes
con una adscripcin definitiva
conceptualizacin adecuada de
la prueba diagnstica y de la
prueba de referencia.
enmascaramiento de las
personas que interpretan (y
realizan) la prueba diagnstica y
la prueba de referencia
realizacin estndar en todos
los pacientes del estudio; si no
es posible hacerlo: seguimiento
de las pruebas negativas y
correcciones matemticas
modo de produccin
6. Sesgo por
resultados no
interpretables
7. Sesgo por
variabilidad en
la
interpretacin
de resultados
consecuencias
sobrestima Se y Es
generalmente
infraestima Se y Es
modo de control
repeticin de la prueba si es
posible; Inclusin en el estudio
de los casos no interpretables
estudios previos (piloto) de
consistencia inter e
intraobservadores; correcciones
matemticas
Bibliografa
1. Albert A, Harris EK. Multivariate interpretation of clinical laboratory data. New York: Marcel Dekker;
1987.
2. Bermejo Fraile B. Epidemiologa clnica aplicada a la toma de decisiones en medicina. Departamento de
Salud. Gobierno de Navarra; 2001.
www.cfnavarra.es/salud/docencia.investigacion/textos/Monograf_1/Epidemiologia_clinica.pdf
3. Escrig-Sos J, Martnez-Ramos D, Miralles-Tena JM. Pruebas diagnsticas: nociones bsicas para su
correcta interpretacin y uso. Cir Esp 2006;79(5):267-273.
4. Grenier B. Dcision mdicale. Paris: MASSON; 1993.
5. Grimes DA, Schulz KF. Refining clinical diagnosis with likelihood ratios. Lancet. 2005;365(9469):1500-5.
6. Hayden SR, Brown MD. Likelihood ratio: A powerful tool for incorporating the results of a diagnostic test
into clinical decisionmaking. Ann Emerg Med. 1999;33(5):575-80.
7. Redondo Alvaro FL. La lgica en la interpretacin de las pruebas diagnsticas. Madrid: Garsi; 1989.
www.epiredperu.net/epired/ppts/curso_estadistica-scsf/estadistica-scsf-14.pdf
www.vhebron.es/ac/preventiva/docencia/mastphoenix/t06_pru_diagnosticas_diapos_fx.pdf
www.fisterra.com/mbe/investiga/pruebas_diagnosticas/pruebas_diagnosticas2.pdf
http://dxsp.sergas.es/ApliEdatos/Epidat/Ayuda/6-Ayuda%20Pruebas%20diagnsticas.pdf
www.uquebec.ca/reglog/chapitre9.htm
http://www.spieao.uhp-nancy.fr/~kohler/LectureArticle/
www.med.univ.montpl.fr/Enseignement/cycle_2/c-ac-2eCR.htm
26