Evaluacion Pruebas Diagnosticas 08 07

EVALUACIN DE PRUEBAS DIAGNSTICAS
Notas
ndice
1. INTRODUCCIN
2. CLASIFICACIN DE ENFERMEDADES POR DIAGNOSIS
3. CRITERIOS DE CALIDAD DE LAS PRUEBAS DIAGNSTICAS
4. TIPOS DE PRUEBAS
5. PATRN UREO
1
1
2
3
3
5.1. Diseo de investigacin para evaluar una prueba diagnstica
6. PARMETROS DE VALORACIN DE LAS PRUEBAS DIAGNSTICAS
6.1. Sensibilidad
6.2. Especificidad
6.3. Valor predictivo positivo
6.4. Valor predictivo negativo
6.5. Razones de verosimilitud
6.6. Intervalo de confianza (IC) para la sensibilidad y la especificidad
6.7. Intervalos de confianza para los coeficientes de probabilidad
6.8. Variabilidad de las razones de verosimilitud
6.9. Valores predictivos y razones de verosimilitud. Inters en la evaluacin de las pruebas diagnsticas
6.10. Falsos positivos frente a falsos negativos. Criterios
6.11. Odds ratio diagnstica
6.12. Efectividad de una prueba
6.13. Eficiencia diagnstica de una prueba
6.14. El ndice de Youden (Y)
6.15. El efecto de concentracin
6.16. Ganancia diagnstica
5
5
6
6
7
8
9
9
15
19
19
20
20
20
21
22
7. COMENTARIOS
24
8. ETAPAS DE UN ESTUDIO DE EVALUACIN DE PRUEBAS DIAGNSTICAS
25
9. SESGOS POTENCIALES DE LOS ESTUDIOS SOBRE PRUEBAS DIAGNSTICAS25
10. EVALUACIN DIAGNSTICA: JERARQUIZACIN
26
BIBLIOGRAFA
26
1. Introduccin
Se trata de estudiar aquellos procedimientos estadsticos que permiten evaluar la validez, es decir cunto se
aproxima una medida al valor real que pretende medir. Son procedimientos muy generales, pero aqu se van
a tratar al hilo del problema de las pruebas diagnsticas (problema muy importante en la prctica y la
investigacin clnica): pruebas para determinar si un individuo tiene, o no, una cierta enfermedad (u otra
caracterstica). Hay que resaltar (y no siempre se hace) que si bien la validez de una prueba depende
exclusivamente de la prueba, las estimaciones numricas que se obtengan de la misma pueden depender
de la prevalencia y de las caractersticas clnicas de los pacientes que se hayan estudiado.
2. Clasificacin de enfermedades por diagnosis

Debe tenerse muy en cuenta el tipo de enfermedad que se est analizando y el grado de avance de la
misma en el paciente, porque de acuerdo a ello se deber puntualizar en ciertos aspectos, ms que en
otros, como se explicar ms adelante. Por ahora, basta con efectuar una primera clasificacin de las
enfermedades en tres tipos bsicos de acuerdo al siguiente esquema:
1
Tipo I: Son todas aquellas enfermedades donde la peor equivocacin que se puede cometer en el
diagnstico es un falso negativo.
Tipo II: Son todas aquellas enfermedades donde la peor equivocacin que se puede cometer en el
diagnstico es un falso positivo.
Tipo III: Son las restantes, donde no se puede clasificar claramente como una de las anteriores.
Las enfermedades que se pueden clasificar como Tipo I son:
Una enfermedad que es curable si se detecta a tiempo;
Una enfermedad que es grave y no puede dejarse pasar inadvertida;
Los falsos positivos no traumatizan ni psicolgicamente, ni econmicamente al paciente, pero los

diagnsticos falsos negativos s lo hacen.
Ejemplos: infarto de miocardio, enfermedades venreas y otras enfermedades infecciosas curables, la
fenilcetonuria, el feocromocitoma (curable en el 100% de los casos s es detectado a tiempo), cncer de
mama o de tero, etc.
En cambio, una enfermedad donde para el paciente, un diagnstico falso positivo es ms peligroso que un
falso negativo, se considera como del Tipo II, como ser:
La enfermedad es grave, pero difcilmente curable o sin remisin;
Es muy importante para el paciente o para la poblacin l saberse un verdadero negativo;
Los falsos positivos traumatizan seriamente al paciente, en cambio los falsos negativos no;
El tratamiento de los falsos positivos ocasiona serios perjuicios al paciente;

Ejemplos: estado terminal o sin remisin de la enfermedad, cncer oculto, esclerosis en placas, tratamientos
como radioterapia, quimioterapia, lobectoma, ciruga innecesaria, estadio IV de la sfilis cuando ya no tiene
remedio, etc.
Cuando la enfermedad no puede ser encasillada en ninguno de los dos casos anteriores, entonces se la
considera como del Tipo III, como por ejemplo: lupus eritematoso, ciertas formas de leucemia o linfoma,
diabetes, etc. En el caso del SIDA un falso positivo puede ser muy daino para el paciente, pero un falso
negativo sera muy peligroso para la sociedad y como ambos peligros son graves, lo mejor es clasificarla
como del Tipo III desde un punto de vista tico. Notar que una misma enfermedad puede ser clasificada de
maneras diferentes, de acuerdo al estado de avance que tiene en el paciente. Un cncer que pueda ser
curado si se detecta a tiempo es un claro caso de Tipo I, pero una vez que se produjo una metstasis en el
paciente pasa a ser del Tipo II.
Lo mismo ocurre con los diferentes estados de la sfilis, que se puede curar si es detectada a tiempo, pero
se torna incurable cuando est muy avanzada.
3. Criterios de calidad de las pruebas diagnsticas

Capacidad de la prueba para medir efectivamente lo que se quiere medir
Identificacin de los enfermos/sujetos sanos
Enfermo Test positivo
Sujeto sano Test negativo
Test positivo Enfermo
Test negativo Sujeto sano

Una prueba diagnstica es considerada de buena calidad si es capaz de clasificar correctamente a
los miembros de la poblacin a la que se aplica, dando resultados positivos en las personas enfermas y
negativos en las carentes de la enfermedad de estudio. Es un grave error asumir que el resultado de una
prueba diagnstica es una representacin fiel de la situacin real de salud de un individuo. Por el contrario,
el mdico que reconoce las imperfecciones de una prueba se preguntar: a la vista de este resultado, qu
grado de seguridad tengo acerca del estado de salud de este paciente?
La importancia de una prueba diagnstica desde el punto de vista de evaluacin de tecnologas se basa en
varios factores. Al evaluar una prueba diagnstica, no obstante, no debe tenerse en cuenta la calidad de la
prueba aisladamente, sino que se deben valorar tambin las acciones que se van a poner en prctica
cuando el resultado sea anormal. As, una prueba cuyo resultado no tenga influencia sobre el manejo del
paciente ni sobre su estado de salud, tendr poca importancia en salud pblica, y su evaluacin no ser
prioritaria.
Otros factores que se deben valorar son el precio de la prueba as como su inocuidad, ya que pueden existir
mtodos menos invasivos o ms econmicos para obtener una informacin suficiente para nuestros
propsitos.
La calidad de una prueba diagnstica se mide en trminos de validez y seguridad. La validez de una
prueba es el grado en que mide lo que se supone debe medir y para determinarla se debe comparar con
otra prueba de probada eficacia en la enfermedad de estudio o con el verdadero resultado en el caso de
que pueda ser conocido. Estos trminos de comparacin se denominan patrn ureo, gold standard o
criterio de referencia. La validez se mide a travs de la sensibilidad y la especificidad de la prueba.
La seguridad de una prueba es la capacidad para predecir la presencia o ausencia de enfermedad y se
mide en trminos de los valores predictivos, positivo y negativo.
4. Tipos de Pruebas
Pruebas con respuesta dicotmica (positivo, +; negativo, ), por ejemplo, la prueba de embarazo;
Pruebas con respuesta policotmica, por ejemplo, estadios del cncer;
Pruebas con respuesta cuantitativa, por ejemplo, glucosa/diabetes, troponina/IAM. En este caso se
presenta el problema de establecer un punto de corte para dicotomizar la respuesta (+ o ).
5. Patrn ureo
Para identificar la enfermedad se requiere disponer de un diagnstico de certeza, una prueba de referencia,
lo que se conoce con el nombre de patrn ureo (patrn oro, gold standard), para poder ver con respecto
a este patrn la validez de otras pruebas diagnsticas, su calidad, su capacidad para identificar una
enfermedad o para seguir un tratamiento.
1 PATRON DE REFERENCIA
POBLACION
PACIENTE
PRUEBA DIAGNOSTICA
Pr(PREPRUEBA)
Pr(POSTPRUEBA)
Figura 1. Esquema de los estudios de evaluacin de pruebas diagnsticas. (1) patrn ureo (gold
standard) vlido; (2) comparacin independiente; (3) espectro de pacientes adecuado; (4)
descripcin completa de los mtodos; (5) presentacin correcta de los resultados; (6) repercusin
sobre el manejo diagnsticoteraputico.
5.1. Diseo de investigacin para evaluar una prueba diagnstica

El modelo apropiado es un diseo descriptivo, en el cual un grupo de participantes con caractersticas
determinadas acorde a la prueba a probar es sometido a la prueba y concomitantemente al patrn ureo.
Muestra (individuos
consecutivos con
las caractersticas
establecidas)
A todos se
efecta la
prueba y el
patrn ureo
Enfermedad
presente
detectada por la
prueba
Enfermedad
ausente, la
prueba sugiri su
presencia
Enfermedad
presente no
detectada por la
prueba
Enfermedad
ausente, la
prueba coincidi
Figura 2.
De esta manera, al cabo del estudio se dispondr de los datos necesarios para completar la tabla de
contingencia, permitiendo calcular todos los indicadores presentados.
Para minimizar los sesgos, se deben considerar algunas premisas claves, a saber:
1. Seleccin de la muestra: la muestra debe incluir participantes que representen todas las formas clnicas
del dao buscado y respetando la proporcin en que la misma se presenta en la prctica cotidiana. An
pruebas de escasa capacidad detectan aceptablemente los casos graves al compararlas con los sin dao.
El mayor problema se presenta al intentar detectar a los casos de gravedad moderada a leve. Por ello, la
muestra debe obtenerse desde la presentacin consecutiva de casos clnicos que renan las caractersticas
que los hara pasibles de la indicacin de la prueba. Entre ellos, habr casos de todas las formas clnicas e
incluso casos sin dao.
2. Comparacin: la misma debe establecerse con un patrn de referencia apropiado y confiable. El patrn
ureo debe reunir esas caractersticas y todos los participantes deben recibir las dos pruebas (la que se
est investigando y el patrn ureo). Es frecuente observar que si se seleccion un patrn ureo invasivo
y/o costoso, ste se aplique solamente a los que arrojaron un resultado anormal de la prueba en anlisis.
Este proceder impide que se completen los datos de la tabla de contingencia, ya que no se dispondra de
los necesarios para llenar los casilleros c ni d y, por lo tanto, se hace imposible calcular sensibilidad ni
especificidad. A este error de procedimiento (o error sistemtico o sesgo) se lo denomina error de
verificacin (work-up bias).
3. Interpretacin de los resultados: La lectura del resultado de la prueba analizada debe ser realizada
desconociendo el resultado del patrn ureo, para evitar el sesgo hacia una coincidencia esprea.
6. Parmetros de valoracin de las pruebas diagnsticas

Imaginemos que queremos evaluar una tcnica analtica para el diagnstico de una enfermedad (infecciosa,
por ejemplo). Mediante un procedimiento aleatorio seleccionamos 200 personas que son evaluadas desde
el punto de vista clnico, diagnosticndose 33 personas como enfermas. Tras realizar la prueba en todos
ellos el resultado es el siguiente:
pacientes enfermos
pacientes no enfemos
total
prueba positiva
prueba negativa
total
27 (VP)
6 (FN)
33 (TE)
3 (FP)
164 (VN)
167 (TNE)
30 (TP)
170 (TN)
200 (T)
Tabla 1
Los 27 pacientes que, estando enfermos, dieron positiva la prueba diagnstica se consideran verdaderos
positivos (VP). Los seis pacientes enfermos que dieron negativa la prueba de laboratorio son considerados
como falsos negativos (FN). Los tres pacientes no enfermos que dieron positiva la prueba se denominan
falsos positivos (FP). Los 164 pacientes no enfermos que no dieron positivo en la prueba son los verdaderos
negativos (VN).
A continuacin se proceder a definir los parmetros de valoracin de las pruebas diagnsticas.
6.1. Sensibilidad
Es el porcentaje de resultados positivos en pacientes con una determinada enfermedad.
Mide el porcentaje de individuos enfermos correctamente diagnosticados
La sensibilidad indica la capacidad de una prueba para detectar a un sujeto enfermo.
La sensibilidad es la probabilidad de que la prueba identifique como enfermo a aquel que realmente lo est.
La sensibilidad expresa cun "sensible" es la prueba a la presencia de la enfermedad.
Una alta sensibilidad indica un bajo nmero de falsos negativos.
La sensibilidad sera la probabilidad de que un paciente enfermo diese la prueba positiva o el porcentaje de
positivos de la prueba en pacientes con la enfermedad,
Sensibilidad ( % ) =
VP 100
TE
En el ejemplo la sensibilidad ( Se ) ser:
Se =
27 100
= 81,8%
33
Una sensibilidad del 81,8 % indica que solo el 81,8 % de los pacientes enfermos darn positiva la prueba.
En este caso habr un 18,2 % de falsos negativos (pacientes enfermos que han dado negativa la prueba).
Cuanto ms sensible es una prueba, ms probable es que detecte a las personas con enfermedad. Por ello,
las pruebas con una sensibilidad muy elevada son muy tiles para descartar la presencia de enfermedad.
6.2. Especificidad
Es el porcentaje de resultados negativos en pacientes que no padecen esa enfermedad.
Valora la capacidad de una prueba para detectar correctamente individuos sanos.
La especificidad es la probabilidad de que un individuo sano tenga un resultado negativo.
Una alta especificidad indica una baja frecuencia de falsos positivos.
La especificidad sera la probabilidad de que un paciente sano diese la prueba negativa o el porcentaje de
negatividad de la prueba diagnstica en ausencia de enfermedad, o:
Especificidad ( % ) =
VN 100
TNE
En el ejemplo la especificidad ( Es ) ser:
Es =
164 100
= 98, 2 %
167
Una especificidad del 98,2 % indica que el 98,2 % de los individuos sanos darn negativa la prueba. En este
caso habr un 1,8 % de falsos positivos (pacientes sanos que han dado positiva la prueba). Las pruebas
muy especficas se usan para confirmar la presencia de una enfermedad. Si la prueba es muy especfica y
da positiva, indica la presencia de enfermedad, ya que apenas produce falsos positivos.
Aunque la sensibilidad y la especificidad son dos ndices de calidad de la prueba, en la prctica clnica las
preguntas a las que interesa responder son: cul es la probabilidad de que est verdaderamente enfermo
si un sujeto ha resultado positivo, Pr ( E + | T + ) ? y, por el contrario, cul es la probabilidad de que
realmente est sano si el sujeto result negativo en la prueba, Pr ( E | T ) ? Estas dos probabilidades se
pueden calcular aplicando el teorema de Bayes, siempre que se conozca la probabilidad de que el sujeto
est enfermo antes de realizar la prueba, o probabilidad preprueba. Si no se dispone de ninguna
informacin adicional sobre el sujeto, dicha probabilidad ser la prevalencia de la patologa en la poblacin,
aplicable slo en el caso de programas de cribado ("screening") sobre la poblacin general, ya que en la
prctica habitual los sujetos candidatos a una prueba diagnstica lo son por las sospechas deducidas de la
anamnesis o por una sintomatologa previa, y por tanto la probabilidad de que padezcan la enfermedad bajo
sospecha ser superior a la prevalencia de sta en la poblacin general.
Denominando P a la probabilidad preprueba de padecer la enfermedad, Se a la sensibilidad de la prueba y

Es a su especificidad, las siguientes frmulas permiten calcular la probabilidad postprueba de que el sujeto
est enfermo cuando result positivo o de que est sano cuando result negativo:
Pr ( E + | T + ) =
Se P
Se P + (1 Es )(1 P )
Pr ( E | T ) =
Es P
Es (1 P ) + (1 Se ) P
donde la probabilidad condicional se representa de la forma habitual con el smbolo |

As Pr ( E + | T + ) significa: suceso E + (enfermo) condicionado a que haya ocurrido el suceso T +
(resultado positivo en la prueba).
Si se calculan estas probabilidades nicamente con los datos de la tabla, la primera de ellas,
Pr ( E + | T + ) , a la proporcin de sujetos que verdaderamente tienen la enfermedad, de entre los que
dieron positivo, y se conoce como valor predictivo positivo, VPP:
VPP =
VP
VP + FP
Igualmente se puede calcular en la tabla la proporcin de sujetos verdaderamente sanos sobre el total de
los que dieron negativo, valor predictivo negativo, VPN:
VPN =
VN
VN + FN
6.3. Valor predictivo positivo

El valor predictivo positivo es el porcentaje de pacientes enfermos entre todos los pacientes con resultados
positivos. Valora la probabilidad de que una prueba positiva diagnostique correctamente a un individuo
enfermo.
El valor predictivo positivo de una prueba sera la probabilidad de que una prueba positiva correspondiese a
un verdadero enfermo o el porcentaje de pacientes enfermos con resultados positivos con respecto al total
de resultados positivos, o:
VPP ( % ) =
VP 100
TP
En el ejemplo, el VPP ser:
VPP =
27 100
= 90 %
30
Un VPP del 90 % indica que de cada 100 pacientes que dan la prueba positiva solo 90 padecen la
enfermedad, o lo que es lo mismo: si la prueba da positiva, la probabilidad de padecer la enfermedad es de
un 90 %. En este caso habr un 10 % de individuos sanos diagnosticados incorrectamente como enfermos.
Pero esto no significa que haya un 10 % de falsos positivos.
6.4. Valor predictivo negativo

El valor predictivo negativo Indica la frecuencia de pacientes no enfermos entre todos los pacientes con
resultado negativo. Valora la probabilidad de que una prueba negativa diagnostique correctamente a un
individuo sano. El valor predictivo negativo de una prueba ser la probabilidad de que una prueba negativa
diagnosticase correctamente a un individuo sano o el porcentaje de individuos sanos con resultados
negativos con relacin al total de resultados negativos, o:
VPN ( % ) =
En el ejemplo, el VPN ser:
6
VN 100
TN
VPN =
164 100
= 96,5%
170
Un valor predictivo negativo del 96,5 % indica que de cada 100 pruebas negativas, 96,5 pertenecern a
individuos sanos, o lo que es igual, si la prueba da negativa, la probabilidad de no padecer la enfermedad es
del 96.5 %. En este caso hay un 3,5 % de individuos enfermos que sern diagnosticados errneamente
como no enfermos. Esto tampoco significa que haya un 3,5 % de falsos negativos.
El intervalo de confianza al 95 % de los valores predictivos se calculan de acuerdo con las siguientes
expresiones:
VPP
VPN
donde
VPP (1 VPP )
a+b
VPN (1 VPN )
c+d
=1,96
Los valores predictivos dependen mucho de la prevalencia de la enfermedad en la poblacin (cociente entre
enfermos y poblacin), no as la sensibilidad y la especificidad, que son independientes de la misma.
Puesto que esos dos ndices VPP y VPN son los que interesan en la prctica clnica, parecera natural
utilizarlos como ndices de comparacin a la hora de evaluar dos mtodos diagnsticos diferentes. Sin
embargo presentan un grave inconveniente, ya que si se calculan a partir de la tabla dependen de la
proporcin de enfermos en la muestra estudiada. Por ello para una determinada prueba resulta necesario
determinar unos ndices de valoracin que, respondiendo a las necesidades reales en cuanto a la
clasificacin de pacientes, sin embargo no dependan de esa proporcin de enfermos en la muestra, tales
como las razones de verosimilitud
6.5. Razones de verosimilitud

Se puede calcular el cociente entre la tasa de verdaderos positivos y la tasa de falsos positivos:
CP + =
Pr (T + | E )
Pr (T + | NE )
Este cociente CP + se conoce como cociente de probabilidad positivo o tambin como cociente de
verosimilitud de una prueba positiva (likelihood ratio of positive test, LR + o L + ), razn de verosimilitud de
una prueba positiva
( RV + ) ,
razn de verosimilitud de inclusin, potencia (o poder) predictiva de una
prueba positiva, o ndice de eficiencia pronstica
( IEP )
de un resultado positivo. Valores mayores de
CP + indican mejor capacidad para diagnosticar la presencia de enfermedad.

De la misma forma, podemos definir un cociente de probabilidad negativo CP
CP =
Pr (T | E )
Pr (T | NE )
Valores de CP menores indican una mejor capacidad diagnstica de la prueba (mejor capacidad para
diagnosticar la ausencia de enfermedad).
El cociente de probabilidad negativo tambin se conoce como cociente de verosimilitud negativo
( LR , ) ,
razn de verosimilitud negativa
( RV ) ,
razn de verosimilitud de exclusin, ndice de
eficiencia pronstica de una prueba negativa. El inverso de este cociente se llama poder (o potencia)
predictiva de una prueba negativa.
Se puede determinar unas frmulas para expresar los cocientes de probabilidad en funcin de la
sensibilidad Se y de la especificidad Es :
Se
1 Es
1 Se
CP =
Es
CP + =
La ventaja de los cocientes CP + y CP frente a los valores predictivos positivo y negativo de la prueba
radica en que, a diferencia de stos, no dependen de la proporcin de enfermos en la muestra, sino tan slo
de la sensibilidad y especificidad de sta, de ah su utilidad a la hora de comparar pruebas diagnsticas.
Adems si se conoce o se puede hacer una estimacin de la probabilidad preprueba de que un sujeto
padezca la enfermedad, utilizando los cocientes de probabilidad, al realizar la prueba se podr "corregir" ese
valor de acuerdo con el resultado, de tal manera que la probabilidad aumenta o disminuye segn que el
resultado sea positivo o negativo, aplicando la siguiente frmula
P CP
1 + P ( CP 1)
Pr post =
donde P es la probabilidad preprueba, CP el correspondiente cociente de probabilidad (positivo si

deseamos calcular la probabilidad de que padezca la enfermedad, negativo en caso contrario) y Pr post es la
probabilidad postprueba.
Vase un ejemplo numrico de todo lo anterior:
patologa
prueba
enfermo ( E + )
no enfermo ( E )
positiva (T + )
72
100
positivos: 172
negativa (T )
18
150
negativos: 168
enfermos: 90
no enfermos: 250
total
total: 340
Tabla 2
Aplicando las frmulas anteriores se tiene:
valor estimado
intervalo de confianza al 95 %
0,80
0,72 0,88
0,60
0,54 0,66
2,00
1,66 2,40
0,33
0,22 0,51
sensibilidad
especificidad
CP+
CP
Tabla 3
Evidentemente los valores de los diferentes ndices son estimaciones realizadas mediante un experimento
diseado al efecto, por lo que es necesario calcular algn indicador de su grado de incertidumbre, como
puede ser un intervalo de confianza del 95 %.
6.6. Intervalo de confianza (IC) para la sensibilidad y la especificidad

IC 95% ( Se ) = Se 1,96
IC 95% ( Es ) = Es 1,96
donde m
es el nmero de enfermos; y
8
Se (1 Se )
m
Es (1 Es )
n
es el nmero de no enfermos.
Para un intervalo de confianza (IC) del 99 % hay que reemplazar 1,96 por 2,576 y para un IC del 99,9% hay
que reemplazar 1,96 por 3,290
6.7. Intervalos de confianza para los coeficientes de probabilidad

Cun fiables son los coeficientes de probabilidad ( CP ) calculados sobre muestras? Se necesita calcular
su intervalo de confianza que no es fcil para cocientes de probabilidades. Hay varios mtodos aproximados
para muestras grandes.
6.7.1. Si el CP es prximo a 1: mtodo de Miettinen
CP
donde
es el estadstico de asociacin de la tabla 2 x 2.
Por ejemplo, para
2 = 0, 2 , el intervalo de confianza al 95 % es 1, 02
1,96
0,2
= ( 0,92 , 1, 09 )
6.7.2. Si el CP no es prximo a 1: aproximacin de primer orden del desarrollo de Taylor
IC [CP + ] (1 ) % = e
ln ( CP + ) z
IC [CP ] (1 ) % = e
ln ( CP ) z
1 Se Es
+
d
c
Se 1 Es
+
b
a
Si se comparan dos pruebas diagnsticas A y B , se calculan sus cocientes de probabilidad positivos, y se

observa que CPA + > CPB + , se podr afirmar que la prueba A es mejor que la B para confirmar la
presencia de enfermedad. Si en cuanto a los cocientes de probabilidad negativos se observa que
CPA < CPB se podr afirmar que la prueba A es mejor que la B para confirmar la ausencia de
enfermedad.
6.8. Variabilidad de las razones de verosimilitud

La incidencia de las razones de verosimilitud sobre los valores predictivos y sobre la utilizacin diagnstica
de los signos y de las pruebas es tal que resulta til analizar aunque sea brevemente, el respectivo papel de
sus dos componentes, sensibilidad y especificidad.
Si la especificidad es constante, las razones de verosimilitud positivas L =
Se
son funcin lineal de la
1 Es
sensibilidad. Cuando la sensibilidad aumenta, L aumenta en la misma proporcin.

La razn de verosimilitud negativa
1 Es
es igualmente una funcin lineal de la sensibilidad, pero
Se
negativa: cuando aumenta la sensibilidad,
disminuye en la misma proporcin (Figura 3)
Figura 3. Variacin de la razn de verosimilitud en funcin de la sensibilidad para diferentes pruebas

cuya especificidad es igual a 0,90.
Cuando Se = 1 Es = 0,1 , las dos razones de verosimilitud son iguales a 1 la prueba no tiene ningn valor
diagnstico. El valor diagnstico del resultado positivo o negativo de la prueba crece linealmente cuando
la sensibilidad aumenta de 0,10 a 1,00.
Figura 4. Variacin de las razones de verosimilitud en funcin de la especificidad para diferentes

pruebas cuya sensibilidad es igual a 0.80
10
Cuando Es = 1 Se = 0,8 , las dos razones de verosimilitud son iguales a 1 y por lo tanto en esta situacin la
prueba carece de utilidad diagnstica. Se nota que la progresin de L es muy rpida cuando la
especificidad es superior a 0,7. La razn de verosimilitud negativa se modifica poco cuando Es crece de
0,50 a 1,00, mientras que la razn de verosimilitud positiva L se afectada mucho por variaciones mnimas
de la especificidad cuando sta es muy elevada; as, cuando Es crece de 0,90 a 0,95, L pasa de 8 a 16.
Si la sensibilidad es constante, las dos razones de verosimilitud son funciones hiperblicas de la
especificidad. La razn de verosimilitud positiva L , en particular, crece muy rpidamente y tiende hacia el
infinito cuando la especificidad de una prueba o de un grupo de pruebas tiende hacia 1.
Se dice que la eficacia diagnstica de una prueba, en la investigacin de una enfermedad determinada E ,
est estrechamente ligada al crecimiento de su especificidad, cualidad que, precisamente, es estable en el
caso de los sujetos no afectados por la enfermedad E
Comparando los cocientes de probabilidad de dos pruebas diagnsticas existen cuatro posibles resultados
que podemos reflejar en una grfica. En el eje de las Y representamos la sensibilidad, en el eje de las X
se representa (1especificidad). El punto representa los valores de sensibilidad y (1especificidad)
observados para la prueba A . Se traza una lnea desde el origen (0,0) que pase por el punto A y otra
desde el valor (1,1) que tambin pase por ese punto, quedando dividido el grfico en cuatro zonas como se
ve en la Figura 5, de tal manera que cualquier otra prueba cuyo resultado representemos en esa grfica
estar en alguna de las cuatro zonas
Figura 5. Las zonas corresponden a las siguientes situaciones: 1: en esta regin la prueba B es
siempre superior a la A, tanto para confirmar presencia como ausencia de enfermedad; 2: aqu la
prueba B slo es superior a la A para confirmar ausencia de enfermedad; 3: en esta zona B siempre
es inferior a A; 4: si el resultado de B est en este rea, ser superior a A para confirmar la presencia
de enfermedad.
Supngase ahora que se desea comparar la prueba A con otra prueba B cuya sensibilidad es 0,9 y
especificidad 0,5. Representndolo en la Figura 6 se obtiene:
11
Figura 6. B cae en la zona 2 por lo que es una prueba mejor que A para confirmar la ausencia de
enfermedad, como se puede determinar tambin numricamente al calcular los correspondientes
cocientes de probabilidad CP+ = 1,8 y CP = 0,2.
Todas estas consideraciones se refieren nicamente a la capacidad discriminatoria de una prueba. La
decisin sobre qu prueba diagnstica es ms adecuada, siempre es algo ms complicada, puesto que
intervienen otros aspectos, como son el coste de la prueba, los riesgos que supone para el paciente, valorar
las consecuencias que conlleva un falso positivo o un falso negativo...
Evidentemente para comparar los parmetros de dos pruebas diagnsticas habr que considerar que los
valores obtenidos slo son estimaciones y estn sometidos por tanto a posibles errores de muestreo, por lo
que habr que efectuar el correspondiente contraste estadstico para determinar si las diferencias
encontradas son suficientemente importantes como para no poder ser atribuidas al azar.
Si la razn de verosimilitud es igual a 1, la probabilidad del diagnstico es la misma antes y despus de
aplicar la prueba. En este caso la prueba es intil, no tiene capacidad discriminante. Cuanto ms se aleje de
1 el valor de la razn de verosimilitud, mas inters presenta la prueba.
CP + > 10 CP < 0,1
Generan cambios amplios y a menudo concluyentes desde una

probabilidad preprueba hasta una probabilidad postprueba
5 < CP + < 10 y 0,1< CP < 0, 2 Generan cambios moderados desde la probabilidad preprueba hasta la
probabilidad postprueba
2 < CP + < 5 y 0, 05 < CP < 0, 2 Generan cambios pequeos (pero en ocasiones importantes) de la
probabilidad
Alteran la probabilidad en un grado insignificante (y rara vez
1 < CP + < 2 y 0,5 < CP < 1
importante).
Tabla 4. Interpretacin de los cocientes de probabilidad (segn el Evidence-based Medicine Working
Group)
Ventajas de la razn de verosimilitud
Es independiente de la prevalencia;
Es un buen reflejo del valor de la prueba cualquiera que sea el grupo al que se aplique;
Resumen la informacin en slo parmetro;
12
Utilizable para diferentes niveles de resultados de una prueba. Para cada nivel procura una informacin
diferente permitiendo interpretar mejor los resultados de la prueba;
Permite calcular de manera individual el inters de realizar la prueba a partir de la probabilidad inicial de
la enfermedad del paciente.
Los cocientes de probabilidad permiten transformar la probabilidad preprueba en probabilidad postprueba
mediante la relacin:
odds post = CPR odds pre

Recurdese que se denomina odds i al cociente entre la probabilidad de que un evento (en este caso estar
enfermo) ocurra y la probabilidad de que no ocurra, por lo tanto:
odds =
p
odds
p =
1 p
1 + odds
los subndices post y pre indican postprueba y preprueba respectivamente y el subndice R representa el
resultado obtenido.
En el caso del siguiente ejemplo:
ecocardiograma
normal
disfuncin
total
pptido natriurtico tipo B (pmol/L)

normal ( <18,7)
elevado ( 18,7)
total
a
93
50
r=a+b
143
11
s=c+d
12
t=a+c
94
u=b+d
61
N=a+b+c+d
155
Tabla 5. Resultados de la evaluacin del pptido natriurtico tipo B
d
Se
d r
= s =
b
1 Es
b s
r
c
1 Se
cr
= s =
CP =
a
Es
a s
r
CP + =
Los CP de la prueba del ejemplo son
CP + =
d r
11143
=
= 2, 62
b s
50 12
CP =
cr
1143
=
= 0,13
a s
9312
supngase que se le aplica la prueba a un anciano al que por su sintomatologa e historia se le estima una
probabilidad alta (por ejemplo, 0,7) de padecer disfuncin ventricular izquierda cmo se modificara esta
probabilidad si se le midiera la concentracin plasmtica del pptido y resultara positiva ( 18,7)? A partir
0, 7
= 2,33 ; como el resultado es positivo
1 0, 7
6,10
CPR = CP + = 2, 62 , por tanto odds post = 2, 62 2,33 = 6,10 y Pr ( post ) =
= 0,86 ; si el resultado de
7,10
la prueba hubiera sido negativo CPR = CP = 0,13 y odds post = 0,13 2,33 = 0,30 y por lo tanto
de la probabilidad preprueba, primero se calcula el odds pre =
Pr ( post ) =
0,30
= 0, 23 .
1,30
13
Figura 7. Nomograma de Fagan (Fagan TJ. Letter: Nomogram for Bayes theorem. N Engl J Med. 1975;
293(5): 257)
Fagan (1975) describi un nomograma para el teorema de Bayes, basado en la capacidad de convertir el
teorema de Bayes en una funcin sumatoria lineal simple. Con un par de trucos matemticos se puede
conseguir esto. Primero, se necesita la versin de probabilidad del teorema de Bayes:
" Odds postprueba " = " Odds preprueba " CP

o de forma simblica:
R
Pr
E
E
O = O(E)
R
R
Pr
E
Donde E
E
R
representa enfermedad;
representa ausencia de enfermedad; y
es un resultado especfico de la prueba.

Tomando logaritmos, se convierte en una simple suma:
log (" Odds postprueba ") = log (" Odds preprueba ") + log ( CP )
o de forma simblica:
E
log O = log ( O ( E ) )
R
R
Pr E
+ log
Pr R
E

o tambin:
Pr ( postprueba ) = Pr ( preprueba ) x CP
log ( Pr ( postprueba ) ) = log ( Pr ( preprueba ) ) + log ( CP )
14
El nomograma tiene tres columnas: la primera es la probabilidad de tener la enfermedad antes de aplicar la
prueba (prevalencia), la segunda es la razn de verosimilitud ( CP ) y la tercera la probabilidad postprueba
( PPP, VPP ) . Con una regla se traza una lnea entre la probabilidad preprueba y la razn de verosimilitud.
La prolongacin de esta lnea corta en la tercera columna la probabilidad de tener la enfermedad en funcin
del resultado de la prueba,
Figura 8. Nomograma de Fagan. Para una prevalencia de 34 % se observa como mejora la

probabilidad postprueba de las variables estudiadas
6.9. Valores predictivos y razones de verosimilitud. Inters en la evaluacin de las

pruebas diagnsticas
P Se
P Se + (1 P )(1 Es )
Pr ( M | S ) = VPP =
VPP =
P L
P ( L 1) + 1
VPN =
1 P
P ( 1) + 1
VPP
VPN
1VPN
1,0
0,95
0,90
0,80
0,70
0,666
0,60
0,50
0,45
0,40
0,30
1,0
0,98
0,96
0,92
0,87
0,86
0,82
0,75
0,71
0,67
0,56
0,00
0,095
0,18
0,33
0,46
0,50
0,57
0,666
0,71
0,75
0,82
1,0
0,905
0,82
0,67
0,54
0,50
0,43
0,33
0,29
0,25
0,18
15
VPP
VPN
1VPN
0,25
0,20
0,10
0,05
0,01
0,00
0,50
0,43
0,25
0,14
0,03
0,00
0,86
0,89
0,95
0,97
0,99
1,00
0,14
0,11
0,05
0,03
0,01
0,00
Tabla 5. Variacin de los valores predictivos de una misma prueba ( L = 3 y
= 0,50 )
cuando P
vara de 1 a 0. (1 VPN ) es la probabilidad de sufrir una enfermedad en presencia de una prueba

negativa.
Figura 9. Variacin de los valores predictivos de una prueba cuyas cualidades son
(L =3
y = 0,50 ) , cuando la probabilidad preprueba de la enfermedad vara entre 0 y 1
Las curvas de los valores predictivos en funcin de la probabilidad a priori P son hiprbolas. Los puntos
destacables de estas tres curvas son:
A donde el valor predictivo positivo es igual a 0,50;
B donde el valor predictivo negativo es igual a 0,50;
C donde VPP = VPN , cuando P =
1
1+ L
Para una misma prueba, cuando P disminuye, VPP disminuye y VPN aumenta. Cuando P aumenta,
VPP aumenta y VPN disminuye.
Se nota que el valor predictivo positivo al principio crece rpidamente cuando la probabilidad preprueba
crece entre 0 y 0,50 y despus ms lentamente. El VPP es inferior a 0,50 cuando la probabilidad a priori o
preprueba es inferior a P1 =
1
1
, en el ejemplo, donde L = 3 , cuando P es inferior a
= 0, 25 (Figura
1+ 3
1+ L
8).
16
Cuando la probabilidad preprueba de la enfermedad E es inferior a
1
, el VPP o probabilidad
1+ L
postprueba de la enfermedad es inferior al 50 %, incluso si la prueba da un resultado positivo.

El VPN disminuye cuando crece la probabilidad preprueba de la enfermedad. Es inferior a 0,50 cuando P
es inferior a P2 =
1
1
, en el ejemplo P2 =
= 0, 666 (Figura 8).
1 + 0,50
1+
As, cuando la probabilidad primaria es superior a P2 =
1
incluso si la prueba da un resultado negativo,
1+
la probabilidad a posteriori o postprueba de la enfermedad es superior al 50 %.

Los dos valores P1 y P2 de la probabilidad primaria, tales que:
P1 =
1
1+ L
P2 =
1
1+
determinan lo que se puede definir como el intervalo de seguridad de la prueba. En efecto, cuando la
probabilidad primaria se sita dentro de este intervalo, un resultado positivo de la prueba da un
VPP superior al 50 % y un resultado negativo da una probabilidad secundaria de la enfermedad inferior al
50 %. Este no es el caso cuando P se sita fuera de este intervalo: si P es inferior a P1 , la probabilidad
postprueba de la enfermedades inferior a 1 cambio sobre dos, incluso si la prueba da un resultado positivo.
Cuando P es superior a P2 , incluso si el resultado de la prueba es negativo, la probabilidad postprueba de
la enfermedad es todava superior a 1 cambio sobre 2
( > 0,50 ) . Estas consecuencias matemticas del
intervalo de seguridad de la probabilidad primaria, tal como est definido por los lmites P1 y P2 , son de una
importancia capital para la conducta del razonamiento y de la decisin diagnstica.
Intervalo de seguridad diagnstica

Figura 10. Comparacin de las curvas VPP y VPN de las pruebas 1 y 2 en funcin de las
variaciones de la probabilidad primaria. Las cualidades diagnsticas respectivas de las dos pruebas
son: para la prueba 1: L = 18; = 0,105 ; Para la prueba 2: L = 3; = 0,50 . Se observa que el
intervalo de seguridad diagnstica para la prueba 1 es mas estrecho que para la prueba 2.
17
La curva del valor predictivo positivo VPP es tanto mayor cuanto ms elevada es L , y la curva del valor
predictivo negativo VPN es tanto menor cuanto ms pequea es . El Intervalo de seguridad diagnstica
es tanto ms amplio cuanto ms elevada es L y ms pequea .
Figura 11. Variaciones de la probabilidad postprueba de la enfermedad E en funcin de la

probabilidad preprueba P y de las cualidades diagnsticas de la prueba (Sox H.C. Ann Inter Med
1986;104:60-6).
La Figura 11A representa tres pruebas cuya sensibilidad es idntica, 0,90, y cuyas especificidades son
crecientes, 0,80 para la prueba 1, 0,90 para la prueba 2 y 0,98 para la prueba 3.
En la Figura 11B, las tres pruebas tienen una especificidad idntica igual a 0,90, y las sensibilidades son
respectivamente 0,60 para la prueba 1, 0,80 para la prueba 2 y 0,95 para la prueba 3.
En la figura 11A, las tres pruebas tienen una sensibilidad idntica, igual a 090 y una especificidad creciente,
con las cualidades respectivas siguientes:
prueba 1
prueba 2
prueba 3
sensibilidad
especificidad
0,90
0,80
4,5
0,125
0,90
0,90
9,0
0,110
0,90
0,98
45,0
0,100
Tabla 6
La figura 11A muestra que para valores bajos de la probabilidad preprueba P , la eficacia diagnstica del
resultado positivo de la prueba medida por el VPP es tanto mas grande cuanto mas elevados son la
especificada y la razn de verosimilitud positiva. En contra, las variaciones de la especificidad modifican
muy poco la consecuencia del resultado negativo: en este caso el efecto de la probabilidad primaria es
predominante.
Las conclusiones inversas resultan de la figura 11B donde las tres pruebas tienen una especificidad idntica
igual a 0,90 y una sensibilidad creciente:
prueba 1
prueba 2
prueba 3
sensibilidad
especificidad
0,60
0,90
6,0
0,44
0,80
0,90
8,0
0,22
0,95
0,90
9,5
0,055
Tabla 7
Las variaciones de la sensibilidad afectan poco los valores predictivos positivos; en cambio, modifican
considerablemente el efecto de un resultado negativo de la prueba, sobre todo cuando la probabilidad
preprueba de la enfermedad es superior a 0,50 0,60.
En suma, cuando la probabilidad preprueba P es baja, un resultado negativo de la prueba tiene poca
incidencia sobre la decisin diagnstica; el de un resultado positivo de una prueba especfica es elevado. Lo
18
inverso ocurre cuando la probabilidad preprueba es elevada: la consecuencias diagnsticas de un resultado

negativo de una prueba sensible es considerable, el de un resultado positivo es dbil.
En una situacin diagnstica dada, la eleccin de una prueba por el clnico est guiada pues por la
probabilidad preprueba de la enfermedad: si el diagnstico es casi cierto, su confirmacin por una prueba
especfica modifica muy poco su probabilidad; en cambio, el resultado negativo de una prueba sensible
impondra una revisin seria de la toma de decisiones. Para optimizar la toma de decisiones, el clnico debe
pues elegir una prueba cuya sensibilidad y especificidad sean apropiadas a la probabilidad preprueba de la
enfermedad.
La incidencia del resultado de la prueba sobre el proceso decisional traduce la eficacia diagnstica de la
prueba. Esta eficacia est medida sobre el efecto de concentracin y por la nocin de ganancia diagnstica.
Hasta ahora se ha estudiado el caso de un resultado dicotmico, pero en muchas ocasiones las pruebas
diagnsticas son cuantitativas, sobre todo cuando corresponden a determinaciones analticas.
Evidentemente, se pueden utilizar todas las consideraciones hechas hasta el momento si se fija un punto de
corte, un valor determinado de la prueba, que marque el lmite entre sano y enfermo. Pero eso no suele
ser una tarea sencilla. Se puede reflejar esquemticamente en la figura 12:
Figura 12
Existe una zona de posibles resultados de la prueba para la que la distribucin de sujetos sanos y enfermos
se solapan. Si se desea aumentar la probabilidad de detectar pacientes enfermos (en la Figura 12
corresponde a mover el punto de corte hacia la izquierda) se ve como tambin aumentan el nmero de
falsos positivos. Si se desplaza el punto de corte hacia la derecha, disminuirn los falsos positivos, pero a
costa de aumentar el de falsos negativos. Resumiendo, un aumento de la sensibilidad disminuye la
especificidad, y viceversa.
6.10. Falsos positivos frente a falsos negativos. Criterios

1. Gravedad o importancia en salud pblica. Si el evento puede ser tratado y detectado evitando
complicaciones posteriores han de utilizarse pruebas que minimicen el nmero de falsos negativos, es
decir, se elegirn pruebas con alta sensibilidad;
2. Coste de las distintas pruebas, exmenes y cuidados mdicos y de enfermera requeridos. Si el coste
de todos ellos es alto han de minimizarse el nmero de falsos positivos, eligiendo pruebas con alta
especificidad;
3. Consecuencias psicosociales. Si la enfermedad diagnosticada conlleva consecuencias al creer que uno
est enfermo por ejemplo en el caso de VIH+ han de minimizarse los falsos positivos, eligiendo pruebas
de alta especificidad;
4. Prevalencia de la enfermedad. Si es baja se ha de maximizar la especificidad para que aumente la
eficiencia del programa.
6.11. Odds ratio diagnstica

La odds ratio diagnstica (DOR) es conocida como un ndice estadstico en los estudios epidemiolgicos
casos/controles representando la fuerza de asociacin entre el factor de riesgo y la enfermedad. Aqu podra
19
ser til para mostrar la fuerza de asociacin entre el resultado de una prueba y la enfermedad. Este ndice
traduce las prestaciones de una prueba con un solo valor que no est influenciado por la prevalencia.
Es la razn entre la odds de estar enfermo si la prueba da positivo y la odds de no estar enfermo si la
prueba da negativo.
VPP
(1 VPP )
+
CP
FN =
=
DOR =
FP
CP
(1 VPN )
VN
VPN
VP
Los valores de la DOR varan de cero a infinito (cuantos ms altos son los valores, mejor es la prueba). El
valor DOR = 1 significa que la prueba no es discriminante, es la prueba intil. Los valores mayores de 1
significan que es ms probable que la prueba de positivo en el caso de enfermos que en sanos.
6.12. Efectividad de una prueba

La efectividad de la prueba, cuya distribucin es aproximadamente normal, se define como
3
Se
Es
+ ln
ln
=
1 Es
1 Se
ln
CP +
CP
y que puede interpretarse como la diferencia entre las medias de los resultados entre una poblacin de
enfermos y otra de sanos en una escala normalizada. Si = 1 la prueba no es efectiva y si = 3 es
altamente efectiva.
6.13. Eficiencia diagnstica de una prueba

Es el porcentaje de pacientes correctamente clasificados, o la probabilidad de que esa prueba diagnstica
acierte en sus conclusiones:
Eficiencia =
VP + VN
VP + VN + FP + FN
Si se tiene en cuenta la prevalencia, la expresin sera:
Eficiencia =
Pr ( M ) Se
(1 Pr ( M ) ) Es
En el caso de que la prevalencia de la enfermedad sea 0,50, sera Eficiencia = 0,5 Se + 0,5 Es y
entonces se llamara eficiencia estndar:
Eficiencia estndard =
Se + Es
2
que tambin se conoce como valor predictivo global y exactitud diagnstica
6.14. El ndice de Youden (Y)

Este ndice clnico fue propuesto por Youden (1950) para analizar la capacidad del mtodo de diagnstico,
usando un nico valor en reemplazo de la forma dual de hacerlo (sensibilidad y especificidad). La idea es
mezclar los dos ndices anteriores para hacer el estudio de calidad. Se define como:
Y = Se + Es 1
Vara de (1) a (+1). Si es inferior o igual a 0, la prueba no tiene ningn valor informativo. La prueba es tanto
de mejor cuanto el ndice de Youden se acerca a 1.
Hay una relacin lineal entre este ndice y la eficiencia estndar, ya que:
Y = 2
( Se + Es ) 1
2
20
6.15. El efecto de concentracin

Se llama efecto de concentracin al aumenta de la densidad o de la probabilidad investigada que es
aportada por el resultado positivo de la prueba. El efecto de la concentracin se traduce por la relacin:
Pr ( M | T + )
Probabilidad postprueba de M
VPP
=
=
Probabilidad preprueba de M
P
Pr ( M )
El efecto de concentracin es precioso en situacin de cribado de una enfermedad cuya prevalencia es muy
baja en la poblacin estudiada.
Por ejemplo, como el feocromocitoma puede ser una causa, rara, de hipertensin arterial, su investigacin
sistemtica se aconseja a causa de las posibilidades teraputicas que aporta la ablacin quirrgica del
tumor. Las pruebas diagnsticas propuestas son la medida de la eliminacin urinaria de los derivados
metoxilados de las catecolaminas. Las cualidades diagnsticas de la prueba en caso de los pacientes
hipertensos son sensibilidad = 0,97; especificidad = 0,95 y razn de verosimilitud positiva = 19,4. Si esta
costosa prueba se aplica al conjunto de los sujetos hipertensos donde la prevalencia del feocromocitoma es
P = 0, 004 , la probabilidad de una causa tumoral cuando la prueba es positiva no rebasa 0,07: por un solo
paciente realmente portador de un tumor, la prueba da pues 13 resultados falsamente positivos. PF Plouin
et al. (1981) han aconsejado aplicar esta prueba bioqumica slo a los hipertensos que presenten la
siguiente trada sintomtica: cefaleas, palpitaciones y crisis de sudoracin. Las cualidades diagnsticas de
la trada han sido obtenidas sobre una muestra de 2585 sujetos hipertensos.
feocromocitoma
presente
ausente
trada
presente
ausente
10
160
170
2414
2415
11
2574
2585
Tabla 8
La presencia de la triada sintomtica en el caso de un sujeto hipertenso aumenta la probabilidad del
feocromocitoma a
10
= 0, 06 . La presencia de la triada sintomtica tiene pues un efecto de
170
concentracin de la probabilidad del feocromocitoma en el caso de tales hipertensos, igual a:
VPP
0, 06
=
= 14, 7 veces
0, 004
P
Cuando la prueba bioqumica se aplica entonces a los pacientes seleccionados por este criterio clnico (en
la hiptesis de que se mantengan en este grupo las cualidades diagnsticas establecidas en el conjunto de
los hipertensos) su valor predictivo positivo sera entonces:
VPP =
0, 06 19, 4
= 0,55
( 0, 06 18, 4 ) + 1
La prueba esta vez es perfectamente aceptable: por cada enfermo diagnosticado, no da mas que un
resultado falsamente positivo, gracias al efecto de concentracin provocado por el criterio clnico inicial. El
efecto de concentracin obtenido por el conjunto de esta estrategia secuencial es igual a
0,55
= 137,5 veces .
0, 004
La ausencia de la triada sintomtica reduce la probabilidad de feocromocitoma a
un nivel 10 veces mas bajo que en el conjunto de los hipertensos.
21
1
= 0, 0004 , es decir a
2415
6.16. Ganancia diagnstica

Se llama ganancia diagnstica a la diferencia entre la probabilidad preprueba de la enfermedad y la
probabilidad postprueba obtenida por el resultado de la prueba. Si el resultado de la prueba es positivo, la
ganancia diagnstica G ( + ) se mide por la diferencia
G ( + ) = Pr ( E + | T + ) Pr ( E + ) = VPP P
Si el resultado de la prueba es negativo, la reduccin de la probabilidad de la enfermedad se mide en valor
absoluto por la diferencia
G ( ) = Pr ( E + ) Pr ( E + | T ) = P (1 VPN )
El conjunto de la ganancia diagnstica alcanzada por la aplicacin de la prueba, o contenido diagnstico
(gamma) de la prueba es igual a la suma de estas dos ganancias diagnsticas:
= G (+) + G ()
= Pr ( E + | T + ) Pr ( E + ) + Pr ( E + ) Pr ( E + | T )
= Pr ( E + | T + ) Pr ( E + | T )
El contenido diagnstico alcanzado por la aplicacin de una prueba se mide por la diferencia entre las
dos probabilidades postprueba de la enfermedad, que son obtenidas respectivamente por el resultado
positivo y negativo de la prueba.
Por ejemplo, una prueba con respuesta dicotmica cuyas cualidades diagnsticas son:
Se = 0,80
Es = 0,90
L = 8
= 0, 222
es aplicable a la investigacin de una enfermedad cuya probabilidad preprueba es 0,30.
Si la respuesta de la prueba es positiva, la probabilidad postprueba de la enfermedad se eleva a:
Pr ( E + | T + ) = VPP =
=
PL
P ( L 1) + 1
0,30 8
= 0, 77
( 0,30 7 ) + 1
La ganancia diagnstica aportada por la respuesta positiva de la prueba es:
G ( + ) = VPP P = 0, 77 0,30 = 0, 47
Si la respuesta de la prueba es negativa, la probabilidad de la enfermedad baja a:
Pr ( E + | T ) = 1 VPN =
=
P
P ( 1) + 1
0,30 0, 222
= 0, 09
( 0,30 ( 0, 222 1) ) + 1
La ganancia diagnstica obtenida por la respuesta negativa de la prueba, en valor absoluto es:
G ( ) = P (1 VPN ) = 0,30 0, 09 = 0, 21
Las ganancias diagnsticas se pueden visualizar en la Figura 13. En funcin de la probabilidad preprueba
P en abscisas, las dos curvas dan los valores de las probabilidades postprueba de la enfermedad E
segn que el resultado de la prueba sea positivo (curva superior) o negativo (curva inferior). La ganancia
diagnstica G ( + ) aportada por el resultado positivo es igual a la distancia OA; la ganancia G ( ) aportada
por un resultado negativo es igual en valor absoluto a la distancia OB; la ganancia total o contenido
22
diagnstico de la prueba cuando la probabilidad preprueba es 0,30, es igual a la distancia AB entre las
dos curvas: :
= 0, 47 + 0, 21 = 0, 68
Figura 13. Ganancia diagnstica obtenida por la respuesta de una prueba en funcin de la probabilidad preprueba. La figura muestra que la ganancia diagnstica obtenida por la prueba tiende a
anularse cuando la probabilidad primaria de la enfermedad se aproxima a los valores extremos 0 y 1.
El clculo muestra que la ganancia diagnstica aportada por la respuesta positiva de la prueba es mxima
cuando la probabilidad preprueba es igual a:
P (+) =
En el ejemplo, P ( + ) =
1
1+ L
1
= 0, 26
1+ 8
En caso de respuesta negativa, la ganancia diagnstica es mxima cuando la probabilidad primaria es:
P (+) =
En el ejemplo, P ( ) =
1
1+ L
1
= 0, 68
1 + 0, 222
El contenido diagnstico de la prueba es mximo cuando la probabilidad preprueba de la enfermedad es:
Pmx =
En el ejemplo, Pmx =
1
1+ L
1
= 0, 43 .
1 + 8 0, 222
Esta probabilidad es aquella en que los dos valores predictivos positivo VPP y negativo VPN son iguales.
En el ejemplo, cuando P es igual a Pmx = 0, 43 , los dos valores predictivos son VPP = VPN = 0,86 . Es
cuando la probabilidad preprueba est prxima a valores medianos prxima al 50 % cuando la respuesta
de la prueba aporta la informacin diagnstica mas elevada (Figura 14). Este valor Pmx de la probabilidad
23
preprueba es 0,50 cuando el producto L = 1 , es decir cuando las dos razones de verosimilitud L y
inversas la una de la otra.
son
Figura 14. Ganancia diagnstica en funcin de la probabilidad preprueba P, aportada por una prueba
cuyas cualidades diagnsticas son L = 8 y = 0,222
G ( + ) es la ganancia diagnstica aportada por una respuesta positiva: su valor mximo se obtiene cuando:
P
1
1+ L
= 0, 26
G ( ) es la ganancia diagnstica aportada por una respuesta negativa: su valor mximo se obtiene
cuando:
1
1+ L
= 0, 26
es la suma de las dos ganancias, su valor mximo se obtiene cuando:

1
P
= 0, 43
1+ L
7. Comentarios
Generalmente, sensibilidad y especificidad suelen tener una relacin inversa, es decir, si la sensibilidad de
una prueba es muy alta, es a costa de perder especificidad y viceversa.
Cuando para el diagnstico de una enfermedad existen varias pruebas posibles, la utilizacin de una u otra
se har atendiendo a las necesidades diagnsticas. As en las pruebas de cribado, deteccin o screening,
se utilizan, en general, pruebas de alta sensibilidad, mientras que en las pruebas de confirmacin se utilizan
tcnicas de alta especificidad. Las pruebas con una alta sensibilidad se utilizan cuando se quiere
diagnosticar correctamente a los pacientes enfermos. Por ejemplo, en el diagnstico del cncer de mama se
utiliza un marcador tumoral especfico. Si la paciente tiene cncer pero la prueba diagnstica no es capaz
de detectarla, el tumor avanzar rpidamente y provocar un deterioro en la mujer que har imposible un
tratamiento posterior. Por esta razn la prueba debe detectar a todos los pacientes enfermos, aun a costa
de diagnosticar incorrectamente a alguno sano, pues en las exploraciones complementarias que se realicen
posteriormente, se detectar que el diagnstico inicial era errneo.
Las pruebas con una alta especificidad se utilizan cuando se desea diagnosticar correctamente a todos los
individuos sanos. Por ejemplo, en el diagnstico del embarazo, si la prueba diagnostica incorrectamente a
mujeres no embarazadas, no pasar nada puesto que en pocos das se ver que el diagnstico era
incorrecto.
24
8. Etapas de un estudio de evaluacin de pruebas diagnsticas

Debido a que una misma prueba diagnstica puede ser utilizada para el estudio de varias situaciones
clnicas (por ejemplo, el diagnstico por imagen con resonancia magntica puede aplicarse a gran nmero
de patologas), se tendr que decidir cul se va a evaluar. Para guiar esta decisin se deben tener en
cuenta los siguientes factores:
Frecuencia de la enfermedad o estado. Se priorizarn aquellas aplicaciones que afecten a mayor

nmero de personas;
Coste de la tecnologa: las tecnologas ms caras deben ser evaluadas con el mximo rigor para evitar
gastos innecesarios al sistema sanitario;
Existencia de un criterio de referencia que permita la comparacin;
Impacto potencial sobre el manejo del paciente: se debe hacer mayor esfuerzo en mejorar la calidad de
las pruebas diagnstica de las condiciones clnicas para las que hay tratamiento eficaz;
Impacto potencial sobre el resultado clnico. Se dar prioridad a la evaluacin de aquellas pruebas, que
en definitiva, contribuyan a la mejora del estado de salud de los pacientes;
Existencia de mtodos diagnsticos inadecuados para la situacin clnica bajo estudio. Una vez
decidida la enfermedad o situacin clnica que se va a estudiar, el diseo del estudio ser similar al de
cualquier otro estudio observacional y los pacientes elegidos no debern diferir substancialmente de
aquellos a los que posteriormente se aplicar la prueba. Se deben incluir, por tanto, pacientes con
diversos estadios clnicos de la enfermedad, ya que si se escogieran slo los ms graves, por ejemplo,
daran mayor nmero de positivos, aumentando de una forma ficticia la sensibilidad de la prueba.
La eleccin del criterio de referencia resulta, en ocasiones, muy compleja, bien por ser costoso o
potencialmente perjudicial para el individuo o porque simplemente no se ha desarrollado un mejor mtodo
de diagnstico. Sin embargo, utilizar un criterio de referencia de baja calidad puede conducir, a que la nueva
medida sea considerada falsamente de baja calidad. Por ejemplo, con un patrn ureo de baja sensibilidad
muchos resultados positivos de la nueva prueba sern considerados errneamente falsos positivos,
disminuyendo el valor de la prueba.
9. Sesgos potenciales de los estudios sobre pruebas diagnsticas

modo de produccin
1. Sesgo de
seleccin
no se tiene en cuenta el
espectro clnico de la
enfermedad o comorbilidad
2. Sesgo de la
prueba de
referencia
imperfecta
no se dispone de una buena

prueba de referencia y se usa
la disponible (aunque no
clasifique bien y discrimine
correctamente sanos y
enfermos).
elementos de la prueba
diagnstica forma parte de la
prueba de referencia
la interpretacin de la prueba
diagnstica y la prueba de
referencia se realiza
conociendo el otro resultado,
es decir, de modo no ciego
el resultado de la prueba
diagnstica condiciona la
realizacin de una prueba de
referencia
3. Sesgo de
incorporacin
4. Sesgo de
revisin o
valoracin
ciega
5. Sesgo de
secuencia o
verificacin
diagnstica
consecuencias
sobrestima Se y Es
si se representan los
casos graves;
infraestima Se y Es
si se representan los
casos leves
generalmente
sobrestima Se y Es
pero a veces los
infraestima
sobrestima Se y Es
sobrestima Se y Es
sobrestima Se e
infraestima Es
25
modo de control
representar el espectro
completo en la muestra;
describir el espectro en el
anlisis; anlisis de la prueba
diagnstica en los subgrupos
seguimiento clnicos de los
pacientes para conocer si son
enfermos o no; correcciones
matemticas si se dispone de
un subconjunto de pacientes
con una adscripcin definitiva
conceptualizacin adecuada de
la prueba diagnstica y de la
prueba de referencia.
enmascaramiento de las
personas que interpretan (y
realizan) la prueba diagnstica y
la prueba de referencia
realizacin estndar en todos
los pacientes del estudio; si no
es posible hacerlo: seguimiento
de las pruebas negativas y
correcciones matemticas
modo de produccin
6. Sesgo por
resultados no
interpretables
7. Sesgo por
variabilidad en
la
interpretacin
de resultados
es una eventualidad que se

produce en cualquier prueba
diagnstica o de referencia
diversos observadores que
actan dentro del estudio
tienen diferentes Se y Es ; el
mismo observador cambia su
Se y Es dentro del estudio
debido al entrenamiento
consecuencias
sobrestima Se y Es
generalmente
infraestima Se y Es
modo de control
repeticin de la prueba si es
posible; Inclusin en el estudio
de los casos no interpretables
estudios previos (piloto) de
consistencia inter e
intraobservadores; correcciones
matemticas
10. Evaluacin diagnstica: jerarquizacin

Nivel 1: Prestaciones tcnicas. Las pruebas cumplen los criterios de calidad aceptables
Nivel 2: Prestaciones diagnsticas. Los resultados de las pruebas diagnsticas permiten hacer diagnsticos
precisos, es decir permiten identificar enfermos y no enfermos (eficiencia, valor predictivo, sensibilidad,
especificidad, razn de verosimilitud, rea bajo la curva ROC)
Nivel 3 Impacto diagnstico. Los resultados modifican la confianza que se tiene en el diagnstico y evitan
otros estudios
Nivel 4: Impacto teraputico. Los resultados de las pruebas intervienen en las decisiones teraputicas y en
que proporcin
Nivel 5: Impacto de los resultados. Los resultados de las pruebas contribuyen a mejorar el estado de salud
de los pacientes
Nivel 6: Impacto en la salud pblica. Anlisis coste beneficio y coste eficacia desde el punto de vista de la
sociedad
Bibliografa
1. Albert A, Harris EK. Multivariate interpretation of clinical laboratory data. New York: Marcel Dekker;
1987.
2. Bermejo Fraile B. Epidemiologa clnica aplicada a la toma de decisiones en medicina. Departamento de
Salud. Gobierno de Navarra; 2001.
www.cfnavarra.es/salud/docencia.investigacion/textos/Monograf_1/Epidemiologia_clinica.pdf
3. Escrig-Sos J, Martnez-Ramos D, Miralles-Tena JM. Pruebas diagnsticas: nociones bsicas para su
correcta interpretacin y uso. Cir Esp 2006;79(5):267-273.
4. Grenier B. Dcision mdicale. Paris: MASSON; 1993.
5. Grimes DA, Schulz KF. Refining clinical diagnosis with likelihood ratios. Lancet. 2005;365(9469):1500-5.
6. Hayden SR, Brown MD. Likelihood ratio: A powerful tool for incorporating the results of a diagnostic test
into clinical decisionmaking. Ann Emerg Med. 1999;33(5):575-80.
7. Redondo Alvaro FL. La lgica en la interpretacin de las pruebas diagnsticas. Madrid: Garsi; 1989.
www.epiredperu.net/epired/ppts/curso_estadistica-scsf/estadistica-scsf-14.pdf
www.vhebron.es/ac/preventiva/docencia/mastphoenix/t06_pru_diagnosticas_diapos_fx.pdf
www.fisterra.com/mbe/investiga/pruebas_diagnosticas/pruebas_diagnosticas2.pdf
http://dxsp.sergas.es/ApliEdatos/Epidat/Ayuda/6-Ayuda%20Pruebas%20diagnsticas.pdf
www.uquebec.ca/reglog/chapitre9.htm
http://www.spieao.uhp-nancy.fr/~kohler/LectureArticle/
www.med.univ.montpl.fr/Enseignement/cycle_2/c-ac-2eCR.htm
26

Evaluacion Pruebas Diagnosticas 08 07

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Evaluacion Pruebas Diagnosticas 08 07

Cargado por

Copyright:

Formatos disponibles

EVALUACIN DE PRUEBAS DIAGNSTICAS

5.1. Diseo de investigacin para evaluar una prueba diagnstica

6. PARMETROS DE VALORACIN DE LAS PRUEBAS DIAGNSTICAS

2. Clasificacin de enfermedades por diagnosis

Una enfermedad que es curable si se detecta a tiempo;

Una enfermedad que es grave y no puede dejarse pasar inadvertida;

Los falsos positivos no traumatizan ni psicolgicamente, ni econmicamente al paciente, pero los

La enfermedad es grave, pero difcilmente curable o sin remisin;

Es muy importante para el paciente o para la poblacin l saberse un verdadero negativo;

El tratamiento de los falsos positivos ocasiona serios perjuicios al paciente;

3. Criterios de calidad de las pruebas diagnsticas

Identificacin de los enfermos/sujetos sanos

Enfermo Test positivo

Sujeto sano Test negativo

Test positivo Enfermo

Test negativo Sujeto sano

Pruebas con respuesta policotmica, por ejemplo, estadios del cncer;

5.1. Diseo de investigacin para evaluar una prueba diagnstica

6. Parmetros de valoracin de las pruebas diagnsticas

En el ejemplo la sensibilidad ( Se ) ser:

En el ejemplo la especificidad ( Es ) ser:

Denominando P a la probabilidad preprueba de padecer la enfermedad, Se a la sensibilidad de la prueba y

donde la probabilidad condicional se representa de la forma habitual con el smbolo |

Pr ( E + | T + ) , a la proporcin de sujetos que verdaderamente tienen la enfermedad, de entre los que

dieron positivo, y se conoce como valor predictivo positivo, VPP:

6.3. Valor predictivo positivo

En el ejemplo, el VPP ser:

6.4. Valor predictivo negativo

6.5. Razones de verosimilitud

razn de verosimilitud de inclusin, potencia (o poder) predictiva de una

prueba positiva, o ndice de eficiencia pronstica

de un resultado positivo. Valores mayores de

CP + indican mejor capacidad para diagnosticar la presencia de enfermedad.

razn de verosimilitud negativa

razn de verosimilitud de exclusin, ndice de

donde P es la probabilidad preprueba, CP el correspondiente cociente de probabilidad (positivo si

6.6. Intervalo de confianza (IC) para la sensibilidad y la especificidad

6.7. Intervalos de confianza para los coeficientes de probabilidad

es el estadstico de asociacin de la tabla 2 x 2.

Por ejemplo, para

6.7.2. Si el CP no es prximo a 1: aproximacin de primer orden del desarrollo de Taylor

Si se comparan dos pruebas diagnsticas A y B , se calculan sus cocientes de probabilidad positivos, y se

6.8. Variabilidad de las razones de verosimilitud

sensibilidad. Cuando la sensibilidad aumenta, L aumenta en la misma proporcin.

negativa: cuando aumenta la sensibilidad,

disminuye en la misma proporcin (Figura 3)

Figura 3. Variacin de la razn de verosimilitud en funcin de la sensibilidad para diferentes pruebas

Figura 4. Variacin de las razones de verosimilitud en funcin de la especificidad para diferentes

CP + > 10 CP < 0,1

Generan cambios amplios y a menudo concluyentes desde una

Resumen la informacin en slo parmetro;

odds post = CPR odds pre

pptido natriurtico tipo B (pmol/L)

Tabla 5. Resultados de la evaluacin del pptido natriurtico tipo B

Los CP de la prueba del ejemplo son

" Odds postprueba " = " Odds preprueba " CP

es un resultado especfico de la prueba.

prueba (prevalencia), la segunda es la razn de verosimilitud ( CP ) y la tercera la probabilidad postprueba

Figura 8. Nomograma de Fagan. Para una prevalencia de 34 % se observa como mejora la

6.9. Valores predictivos y razones de verosimilitud. Inters en la evaluacin de las

Tabla 5. Variacin de los valores predictivos de una misma prueba ( L = 3 y

vara de 1 a 0. (1 VPN ) es la probabilidad de sufrir una enfermedad en presencia de una prueba

y = 0,50 ) , cuando la probabilidad preprueba de la enfermedad vara entre 0 y 1

A donde el valor predictivo positivo es igual a 0,50;