Documentos de Académico
Documentos de Profesional
Documentos de Cultura
401
Rev Méd Chile 2008; 136: 401-404
Paciente: Niños con sospecha de influenza Inicialmente los estudios que evalúan las propie-
Intervención: Test rápido de influenza dades de un test diagnóstico se realizan con un diseño
Comparación: Estándar de oro (Gold standard) conocido como “corte transversal” en que todos los
Outcome: Diagnóstico de influenza pacientes son sometidos al test y al Gold Standard
como es el caso del artículo seleccionado. Este tipo de
En relación a esta pregunta, Ud. realiza una diseño es muy apropiado y frecuentemente utilizado
búsqueda4 en Clinical Queries de PubMed, seleccio- para evaluar la exactitud del test para diagnosticar la
nando “diagnosis” y “narrow, specific” con los térmi- enfermedad o condición de interés7.
nos MeSH “Influenza, Human” AND “Immunoassay”. Sin embargo, debemos considerar que el fin
Con esta búsqueda, Ud. obtiene 50 referencias de las último de aplicar un examen diagnóstico a nues-
cuales selecciona el artículo: “Bedside diagnosis of tros pacientes es que obtengan un beneficio en
Influenzavirus Infections in Hospitalized Children”5, comparación a no ser sometidos al examen, es
ya que le parece que podría entregar la información decir, debemos considerar el impacto del test
más relevante y adecuada para responder su pregun- sobre aquellos outcomes relevantes para el pa-
ta. Resumimos el estudio en el siguiente cuadro: ciente. La manera más rigurosa de evaluar este
impacto o beneficio del test es mediante un
Población (P) Inclusión (233 pacientes): ensayo clínico en que los pacientes son distribui-
1. Menores de 19 años hospitaliza- dos aleatoriamente a recibir el test, a no recibirlo o
dos con síntomas respiratorios recibir métodos diagnósticos alternativos. De esta
(rinorrea, odinofagia, tos, taquip- forma, se pueden medir los outcomes derivados
nea o apnea) de la conducta clínica adoptada en los distintos
2. Menores de 3 años hospitaliza- grupos según el resultado del test: mortalidad,
dos con fiebre. morbilidad, costo, satisfacción, etc. Es así como
Exclusión: los ensayos clínicos randomizados (ECR) son
1. Contacto con el paciente poste-
considerados la mejor evidencia para evaluar un
rior a las 24 horas de ingreso.
test diagnóstico. A pesar de esto, no todos los test
2. Rechazo a participar
son ni deben ser sometidos a un complejo y
3. Imposibilidad de contactar a los
costoso ECR. Este es el caso de tests simples que
padres
ayudan al diagnóstico de patologías con trata-
Intervención (I) QuickVue Influenza test. (Test rápi-
miento claramente beneficioso, como por ejemplo
do para influenza, tomado al lado de
una radiografía de tórax en una neumonía. Este
la cama del enfermo).
examen claramente ayuda en el diagnóstico de
Comparación (C)
neumonía y la conducta clínica que deriva de su
(Gold Standard) 1. Cultivo positivo o
2. Dos PCRs consecutivas positivas
resultado, el uso de antibióticos, sin duda alguna
para influenza A o B. beneficiará al paciente. Distinto es el caso de
Outcome (O) Diagnóstico de influenza. exámenes más invasivos y de alto costo en que es
perentorio conocer todas o la mayor cantidad de
consecuencias sobre el paciente derivadas de la
aplicación del test. Otra situación en que es crucial
realizar un ECR, es la evaluación de un nuevo test
VALIDEZ DE LOS RESULTADOS DE UN ESTUDIO DE DIAGNÓSTICO de screening. Previo a la implementación de un
examen a un gran número de pacientes aparente-
Al igual que en el análisis critico de estudios sobre mente sanos, se debe tener certeza y por lo tanto,
intervenciones terapéuticas6, una vez que deter- haber demostrado, que los beneficios sobre el
minamos que un estudio sobre un test diagnóstico bienestar de los pacientes sobrepasan los poten-
es potencialmente relevante para nuestro queha- ciales riesgos de un screening (costo, falsos
cer clínico, debemos decidir si los resultados del positivos y sus consecuencias, etc.)7,8.
estudio son válidos. Esta validez se refiere a que la Volviendo a la evaluación de un estudio acerca
metodología utilizada en el estudio nos dé la de la exactitud de un test con un diseño de corte
suficiente confianza de que se evitaron los sesgos transversal, situación a la que los clínicos se ven
propios de estos diseños. enfrentados con alta frecuencia, se deben respon-
MEDI C I N A B A S A D A
402 E N EVI D E N C I A
VALIDEZ DE ESTUDIOS DE TESTS DIAGNÓSTICOS - L Valenzuela et al
der las siguientes preguntas para determinar la ca cotidiana en que se utilizará posteriormente el test.
validez de sus resultados: Esta población de “incertidumbre diagnóstica” es
donde un nuevo examen tendrá su mayor utilidad ya
Criterios de validez en un estudio de un test que permitirá discriminar entre enfermedades distin-
diagnóstico tas, pero parecidas en su presentación clínica10.
¿Se incluyó un espectro apropiado de pacientes En nuestro ejemplo, los 233 pacientes ingresados
similares a los cuales se aplicará el test en la al estudio para el test rápido de influenza presenta-
práctica clínica? ban un cuadro de enfermedad respiratoria alta
caracterizado por rinorrea, odinofagia, tos, taquip-
¿Hubo comparación ciega con un estándar de nea o apnea, síntomas que pueden corresponder a
oro (gold standard) independiente y adecuado? una gama amplia de patologías entre las que se
¿Se realizó el gold standard independientemen- incluye la influenza. La población seleccionada
te del resultado del test? corresponde, por lo tanto, a un espectro de pacien-
tes con suficiente incertidumbre diagnóstica como
A continuación describimos y explicamos la para determinar el poder diagnóstico del test.
importancia de cada una de estas preguntas:
b) ¿Hubo comparación ciega con un gold stan-
a) ¿Se incluyó un espectro apropiado de pacientes dard independiente y adecuado? En realidad de-
similares a los cuales se aplicará el test en la práctica bemos responder a 3 preguntas en este punto.
clínica? Si el test es aplicado a pacientes con una 1) ¿El gold standard utilizado es el más adecuado
enfermedad en estadio tardío (muy enfermos) y en para certificar el diagnóstico o condición? Para
pacientes sanos, los resultados no serán reales ni evaluar la precisión de un test diagnóstico es
aplicables, ya que es muy probable que cualquier necesario compararlo con la “verdad” (es decir, lo
test pesquise a los “muy enfermos” y no pesquise a más cercano a la verdad disponible). Esta “ver-
los sanos, dando una falsa impresión de las propie- dad” suele ser el patrón de oro o gold standard,
dades del test. Una situación que ejemplifica muy que debe estar aceptado como tal por la comuni-
bien este punto y que es frecuentemente citada, es dad médica para considerarlo adecuado. Si el gold
lo que ocurrió con el antígeno carcinoembrionario standard utilizado no parece el más apropiado, es
(ACE) en pacientes con cáncer colorectal9. La improbable que el artículo entregue resultados
evaluación incluyó a pacientes en etapa avanzada de válidos para nuestros propósitos. En ocasiones no
cáncer colorectal y a pacientes con otras patologías. existe un único gold standard, en estos casos, la
En 35 de los 36 pacientes con cáncer avanzado, los combinación de exámenes como gold standard
niveles de ACE resultaron elevados, no así en los permite aumentar la precisión del diagnóstico.
otros pacientes. Esto llevó a plantear la posible 2) Además de ser adecuado, el gold standard debe
utilidad del ACE como herramienta diagnóstica para ser independiente del test. Esta independencia se
el cáncer colorectal. Sin embargo, estudios posterio- refiere a que el test no sea parte del gold standard
res en pacientes en etapa más temprana de cáncer utilizado, es decir, que este gold standard no
colorectal y por lo tanto, “menos enfermos”, y en “contenga” al test como criterio, lo cual llevaría a
pacientes con otro cáncer o patología gastrointesti- sobredimensionar el poder diagnóstico del test.
nal, es decir, condiciones potencialmente confun- Por ejemplo, un estudio evaluó la utilidad de la
dentes con un cáncer colorectal, cuestionaron medición de amilasa sérica y urinaria en el
fuertemente la exactitud y utilidad diagnóstica del diagnóstico de pancreatitis aguda, considerando
ACE. Consecuentemente, el ACE fue abandonado como gold standard más adecuado un listado de
como examen diagnóstico, probándose su utilidad criterios dentro de los cuales se incluían la amilasa
sólo como un elemento en el seguimiento de sérica y urinaria, lo que produce un falso aumento
pacientes con cáncer colorectal conocido. del poder discriminatorio del test.
En resumen, un espectro apropiado de pacientes, 3) Si el gold standard parece el más adecuado y es
debe incluir a pacientes que comparten síntomas, independiente, la siguiente pregunta es si los
pero que portan distintas patologías y excluir a los resultados del test y del gold standard fueron
extremos, es decir, a los sanos y a los muy enfermos. evaluados en forma ciega entre sí, es decir, que
Esto hará que la población de estudio se asemeje a la el investigador que interpreta el test no está en
población de “incertidumbre diagnóstica” de la prácti- conocimiento del resultado ni había aplicado el
MED I C I N A B A S A D A
E N EVI D E N C I A
403
Rev Méd Chile 2008; 136: 401-404
gold standard. Esto permite disminuir el sesgo resultado positivo en el test, especialmente si el gold
de “sobreinterpretación” cuando el test diagnós- standard es invasivo o presenta riesgos importantes;
tico es positivo y de “subinterpretación” cuando esto se denomina sesgo de verificación. Este sesgo
el test diagnóstico es negativo. Cuanto más hará inevitablemente aparecer con mayor poder
probable sea que los resultados de un test diagnóstico al test al seleccionar pacientes con mayor
puedan influir en la interpretación del otro, más probabilidad de tener un gold standard positivo.
importante es la interpretación ciega de ambos. Volviendo a nuestro estudio, a los 233 pacien-
tes enrolados se les aplicaron ambos exámenes. A
En nuestro artículo para el escenario clínico de todos se les tomaron dos muestras nasales y se les
influenza, la infección fue definida como la presencia aplicó tanto el test rápido como el gold standard.
de un cultivo positivo o 2 PCRs consecutivas positivas En resumen, en nuestro escenario clínico, el
para influenza A o B, actualmente aceptadas por la artículo analizado cumple con todos los criterios
comunidad médica como diagnóstico de certeza. El de validez, por lo que podemos asumir que los
gold standard utilizado no incluye de modo alguno al resultados que nos presentarán los autores serán
test rápido en estudio, por lo que podemos confirmar “creíbles”, al reducirse la posibilidad de sesgo.
su independencia. Por otro lado, a los pacientes
ingresados a este estudio se les tomaron 2 muestras
nasales, en dos tórulas separadas. La tórula para el test CONCLUSIONES
rápido era analizada por un investigador al lado de la
cama del enfermo y la tórula para el cultivo y PCR por Al realizar el análisis crítico de estudios sobre tests
un tecnólogo del laboratorio que no sabía el resultado diagnósticos, se debe evaluar la validez de los
del test rápido, existiendo por lo tanto, una compara- resultados. Para tales efectos se deben considerar las
ción ciega. tres preguntas anteriormente analizadas, referentes al
espectro de pacientes estudiados, a la comparación
c) ¿Se realizó el gold standard sin considerar el ciega entre test y gold standard y a la independencia
resultado del test? Es importante que a todos los de este último, y a la presencia o ausencia de sesgo
pacientes, sin importar el resultado del test en de verificación. Si se cumplen los criterios menciona-
evaluación, se les aplique el gold standard. Puede dos, se puede concluir que los resultados del estudio
ocurrir que las propiedades del test diagnóstico se probablemente representen una estimación no sesga-
alteren si el resultado de éste influye sobre la decisión da de las características del test.
de qué pacientes serán sometidos a continuación al En próximos artículos de esta serie se analizará
gold standard. En algunos estudios se aplica el gold la interpretación de los resultados y su aplicabili-
standard sólo a los pacientes que presentan un dad en la clínica diaria.
MEDI C I N A B A S A D A
404 E N EVI D E N C I A