Cap7 Salud

C A P Í T U L O 7
Lectura crítica de estudios

de pronóstico. Estudios de cohortes
Víctor Abraira Santos ■ Alfonso Muriel García ■ M.ª Luisa Montes Ramírez
OB J ETIV OS D EL CA PÍ TULO
• Comprender los términos claves de un artículo sobre pronóstico, en particular

los de las categorías a y b de la clasificación mencionada en la introducción.
• Mejorar la capacidad de realizar la lectura crítica de un artículo sobre factores
pronósticos.
• Explicar por qué son tan importantes para justificar las decisiones sobre el manejo
del paciente.
Introducción
En medicina, el pronóstico se refiere a la estimación del riesgo de futuros acontecimientos en
personas con una enfermedad, o condición de salud determinada y su relación con determinadas
características actuales (1). Realizar apreciaciones pronósticas que informen al paciente y a su
entorno sobre la evolución más probable de la enfermedad y ayuden a la toma de decisiones sobre la
realización de las distintas intervenciones posibles es una de las funciones básicas de la medicina y de
los médicos. Las intervenciones terapéuticas se encaminan, precisamente, a modificar el pronóstico
espontáneo o historia natural de la enfermedad, transformándolo en un sentido positivo. Sin duda,
la primera preocupación de una persona enferma es conocer en qué medida la enfermedad puede
interferir en su expectativa de vida, por lo tanto, el estudio de la mortalidad y el tiempo que trans-
curre entre el comienzo de la enfermedad, o su diagnóstico y/o la instauración del tratamiento y la
muerte, o tiempo de supervivencia, constituyen la prioridad para cualquier estudio de pronóstico.
Pero también forman parte del mismo otras consecuencias de la enfermedad (remisión, recidiva,
complicaciones, secuelas, etc.) que interesan al paciente y forman parte del proceso de toma de
decisiones del médico.
Con muchos puntos en común con el pronóstico, está el problema de los factores de riesgo para
enfermar, en el que también se trata de estimar el riesgo de un acontecimiento futuro, aunque en
este caso el acontecimiento de interés es enfermar entre personas de la población general, o de un
cierto subgrupo de ella, en lugar de muerte o complicaciones en personas enfermas. Por lo tanto,
los estudios para estimar factores de riesgo y factores pronósticos tienen muchas similitudes, en
ambos casos el diseño óptimo es un estudio de cohortes, es decir, un estudio en el que se selecciona
un grupo de individuos, bien definido, representativo de la población de estudio, al que se sigue
durante un tiempo suficientemente prolongado para observar el evento de interés. Idealmente son
estudios prospectivos, aunque a veces son retrospectivos o mixtos. En ocasiones, en lugar de un
único grupo se seleccionan grupos con distintos niveles del factor, sobre todo en el estudio de los
© 2022. Elsevier España, S.L.U.

Descargado Reservados
para Daniela todos los derechos
Diaz (chingd@uninorte.edu.co) en University of the North de 67
ClinicalKey.es por Elsevier en septiembre 12, 2021. Para uso personal exclusivamente. No se
permiten otros usos sin autorización. Copyright ©2021. Elsevier Inc. Todos los derechos
reservados.
68 Lectura crítica de la evidencia clínica
factores de riesgo, debido a que se trata de predecir enfermedades, en general con baja probabilidad,
mientras que los factores pronósticos predicen eventos, en general de mayor probabilidad.
Hemingway et al. (1) propusieron la siguiente clasificación de los estudios de pronóstico en
cuatro categorías distintas, aunque interrelacionadas:
1. Investigación fundamental en pronóstico, en la que se trata de estudiar el curso natural, o con el
cuidado habitual, de la enfermedad y sus variaciones. El resultado de esta investigación se expresa
como riesgo (o frecuencia) absoluto de uno, o más eventos, entre las personas que comparten
características demográficas y clínicas; es, por lo tanto, el pronóstico promedio de un determinado
grupo de interés, también llamado riesgo basal. Esta investigación proporciona respuestas iniciales
a la pregunta «¿cuál es el pronóstico de las personas con una determinada enfermedad?». Por
ejemplo, en promedio, cerca del 15% de las personas de 65 años de edad o más ingresadas en
2006 en EE. UU. murieron con un ataque al corazón dentro de los 30 días siguientes al de su
ingreso en el hospital, en comparación con un promedio del 19% en 1995 (2).
2. Investigación en factores pronósticos, en la que se trata de identificar factores específicos (tales
como biomarcadores, fármacos, otras enfermedades, signos…) asociados con el pronóstico. El
resultado de esta investigación se puede expresar, bien como riesgo relativo de sufrir el evento de
los pacientes con un nivel del factor respecto al que se toma como referencia —p. ej., en pacientes
con linfoma esplénico de la zona marginal, los que presentan adenopatía extrahiliar tienen un
riesgo de muerte por la enfermedad 2,1 veces mayor que los que no la presentan (3)—, o bien en
términos absolutos mostrando los riesgos, o más frecuentemente las curvas de supervivencia, para
los pacientes con distintos valores del factor. En el mismo artículo sobre el linfoma se presentan
las curvas de supervivencia de los tres estratos creados con el índice propuesto por los autores.
3. Investigación sobre modelos pronósticos, que trata de desarrollar, validar y evaluar el impacto de
modelos estadísticos para predecir el riesgo individual de un futuro evento. Es importante
enfatizar la necesidad de validación y evaluación del impacto, porque, aunque se han propues-
to muchos modelos pronósticos, relativamente pocos son validados externamente y muy
pocos evalúan el impacto de su uso (4). El resultado de esta investigación se puede presentar
en forma de una fórmula, o gráfica (nomograma) (5), que permite calcular la probabilidad
futura del evento para un individuo en función de los valores observados de los factores, o
bien como una puntuación obtenida de la fórmula, con sus puntos de corte para generar
grupos de riesgo (6). El uso de los modelos pronósticos para hacer predicciones individuales
es más preciso, y en general preferible, a la creación de grupos de riesgo, aunque los grupos de
riesgo pueden informar para opciones de tratamiento y permitir la estratificación por riesgo
de gravedad en los ensayos clínicos (4). Este tipo de investigación es tratada en el capítulo
dedicado a reglas de predicción clínica.
4. Investigación sobre medicina estratificada. La medicina estratificada pretende seleccionar
tratamientos en función de características de los pacientes que predigan la respuesta. La
investigación en pronóstico es un componente principal de esta medicina (7).
Escenario
Carmen es una mujer de 60 años a la que se le acaba de diagnosticar un adenocarcinoma de
estómago en estadio T2 N0 M0. Su oncóloga le ha explicado que el primer paso del tratamiento
es la cirugía de resección del tumor y después es posible que se requiera quimioterapia adyuvante.
Carmen quiere saber con más exactitud si será preciso recibir quimioterapia adyuvante con todo
lo que ello conlleva, pues tiene un pequeño negocio familiar que lleva ella directamente y necesita
decidir qué hacer con él. La oncóloga le explica que esto depende de la verdadera extensión del
adenocarcinoma y que antes de la operación es muy difícil de determinar. Carmen insiste en saber si
no existen otros datos, en el TAC o los análisis, que puedan ayudar a predecir mejor su pronóstico;
necesita organizarse y tomar decisiones importantes sobre su situación laboral desde el principio sin
Descargado para Daniela Diaz (chingd@uninorte.edu.co) en University of the North de

reservados.
7. Lectura crítica de estudios de pronóstico. Estudios de cohortes 69
esperar a después de la cirugía. Su oncóloga le dice que va a revisar estudios recientes pues recuerda
haber leído algo sobre un marcador en sangre.
En una búsqueda en PubMed encuentra un artículo sobre el valor pronóstico del dímero-D en
pacientes con cáncer gástrico antes de la cirugía (8).
Liu L, Zhang X, Yan B, Gu Q, Zhang X, Jiao J, et al. Elevated Plasma D-Dimer Levels Correlate
with Long Term Survival of Gastric Cancer Patients. PLoS ONE 2014;9:e90547.
Tras hacer una lectura crítica lo comenta con Carmen, y dado que es una prueba sencilla y barata
deciden hacerla; el resultado es de 1,15 µg/ml.
■ ¿Crees que la determinación del dímero-D puede ayudar a predecir el pronóstico de los
pacientes con carcinoma gástrico?

■ En el caso de Carmen, ¿crees que es aplicable esta prueba?, ¿le puede ayudar a clarificar su
pronóstico y tomar las decisiones personales que necesita?
Puntos clave de la lectura crítica de estudios

de factores pronósticos
EN EL DISEÑO
Como se ha dicho en la introducción, y señalando ahora en negrita los puntos clave para la evaluación
crítica de artículos de este tipo, el diseño óptimo para establecer factores pronósticos es un estudio de
cohortes, es decir, un estudio en el que se selecciona un grupo de pacientes bien definido, representa-
tivo de la población de estudio, en un momento homogéneo de la enfermedad, al que se sigue en el
tiempo para observar el evento o eventos de interés durante un tiempo suficientemente prolongado.
Que un grupo de pacientes esté bien definido y sea representativo de la población de interés
depende de la pregunta de investigación. Por ejemplo, para responder a la pregunta de si el uso de
antipsicóticos atípicos aumenta el riesgo (es factor pronóstico) de padecer fractura de cadera en
ancianos, se debe comparar la frecuencia de fracturas en un grupo de ancianos que toman antipsicóticos
atípicos, con la de otro grupo que no los toma; ahora bien, este grupo puede estar formado por ancianos
que no tomen antipsicóticos, o por ancianos que tomen otro tipo de antipsicóticos. Es representativo,
según el caso, un grupo de ancianos de la población general, o de ancianos con demencia (9). Debe
considerarse la proporción de personas elegibles que participan en el estudio, así como la descripción de
la población fuente, los criterios de inclusión y exclusión y el marco de muestreo y reclutamiento (10).
Otro elemento clave para la validez de estos estudios es que, en el comienzo del seguimiento,
los pacientes se encuentren en un momento homogéneo de la enfermedad. Es fácil de entender
que si, por ejemplo, se quieren estudiar factores pronósticos para pacientes infectados por el VIH,
daría lugar a errores (efecto cohorte) introducir en la cohorte pacientes naive (que no han recibido
© Elsevier. Fotocopiar sin autorización es un delito.
ningún tratamiento antirretroviral) junto con pacientes multitratados.

El elemento clave más relevante de estos estudios, que condiciona todos los demás, es la elección
del evento. Como ya se ha mencionado, con frecuencia es la muerte, pero también hay otros eventos
de interés, como remisión, recidiva, rechazo del trasplante, aparición de la enfermedad, por ejem-
plo, en paciente con VIH, etc. El artículo debe tener una definición clara y precisa del evento, o
eventos, de interés (p. ej., si fuera muerte, especificar si es por todas las causas o por alguna causa
específica o, si fuera recidiva, cómo se determina, si clínica, radiológica o histológicamente). El
lector crítico debe considerar la pertinencia y relevancia de estas definiciones. Véanse por ejemplo
las definiciones de evento recomendadas por la agencia gubernamental norteamericana Food and
Drug Administration de EE. UU. (FDA) para tratamientos oncológicos (11). Otro elemento clave
en relación con el diseño del estudio es la forma en que se han recogido las variables; deberían
recogerse con procedimientos homogéneos y estandarizados (muy relevante en estudios retros-
pectivos y multicéntricos), sobre todo en aquellas que tengan elementos subjetivos (dolor, calidad de
vida, etc.), necesiten interpretación (pruebas de imagen) o tengan complejidades técnicas (pruebas

reservados.
de laboratorio). Estos procedimientos deben garantizar la independencia (ceguera) entre los regis-
tros del evento y del factor.
El tiempo de seguimiento debe ser suficiente para que se pueda observar el número de eventos
necesario de acuerdo a la potencia estadística preestablecida. Esto depende, naturalmente, de la
naturaleza de la enfermedad y la frecuencia del evento estudiado. Por ejemplo, un período de segui-
miento de 5 años puede ser apropiado para el estudio de la supervivencia en muchas variedades de
cáncer, sin embargo, es un tiempo claramente insuficiente para valorar la supervivencia de enfermos
en tratamiento substitutivo por insuficiencia renal. Por el contrario, un seguimiento de 30 días es
adecuado para estudiar la supervivencia a un episodio agudo de tromboembolismo pulmonar. En
aquellos estudios que precisen un tiempo de seguimiento largo hay que prestar atención a la posible
pérdida de pacientes y sus causas, sobre todo a aquellas relacionadas con el evento o el factor, ya
que pueden introducir sesgos. Es deseable, para ayudar a evaluar su validez, que todo artículo de
pronóstico cuantifique las pérdidas en el seguimiento, describa las situaciones que las provocan
(abandono del estudio u ocurrencia de alguna otra circunstancia que impide la observación del
evento) y las características de los pacientes afectados (12).
EN LOS RESULTADOS
En cuanto a los resultados de estos estudios, como se dijo en el apartado «Introducción», se pueden
expresar de varias maneras: como riesgo (o frecuencia) absoluto de sufrir el evento en la población
de interés, mostrando la evolución del riesgo o la supervivencia (curvas de riesgo o supervivencia), o
como riesgo relativo de los pacientes de un nivel del factor respecto al que se toma como referencia.
Para estimar el riesgo absoluto se suelen usar dos índices: incidencia acumulada y densidad (o tasa)
de incidencia. La incidencia acumulada es la proporción de individuos que desarrollan el evento
durante el período de seguimiento. Como proporción no tiene dimensiones y su valor oscila entre
0 y 1, aunque también se suele expresar como porcentaje. Depende del tiempo de seguimiento, que
se debe hacer explícito. El resultado del ejemplo citado en el apartado «Introducción» (el 15% de
las personas de 65 años de edad o más ingresadas en 2006 en EE. UU. murieron con un ataque al
corazón dentro de los 30 días siguientes al de su ingreso) es una incidencia acumulada. La principal
limitación de este índice proviene del llamado efecto de cohorte fija: presenta cierta indeterminación
si hay pérdidas en el seguimiento. Para evitar esta limitación se puede usar otro índice, la densidad,
o tasa, de incidencia, que es el cociente entre el número de eventos ocurridos durante el período de
seguimiento y la suma de todos los tiempos de observación. Tiene dimensión de inversa del tiempo,
un rango ilimitado a partir de 0 y no depende del tiempo de seguimiento, asumiendo estacionariedad,
es decir, que el riesgo es constante a lo largo del tiempo. Esta asunción no siempre es razonable.
Sin embargo, en general, el resultado de interés no es la frecuencia de ocurrencia de los eventos sino
el tiempo hasta que ocurren. En este caso, los resultados se suelen expresar, generalmente en forma
gráfica, mediante la denominada función de supervivencia que da, para cada tiempo t, la probabilidad
de que el evento ocurra (el paciente sobreviva, si el evento es muerte) en un tiempo igual o mayor
que t. La figura 4 del artículo que se propone para la lectura (8) en el escenario muestra curvas de
supervivencia de pacientes con cáncer gástrico estatificados por diseminación peritoneal y valores del
dímero-D. La principal dificultad para estudiar el tiempo hasta la ocurrencia de un evento es que,
en general, al final del período de seguimiento siempre hay individuos en los que no se ha podido
observar el evento y, por lo tanto, en los que el tiempo hasta su ocurrencia es desconocido, si bien se
tiene una información parcial sobre él, es mayor o igual que el tiempo observado. A este fenómeno se
le denomina censura. La función de supervivencia se suele estimar por el método de Kaplan-Meier,
que tiene en cuenta la información contenida en las censuras, asumiendo, y es importante resaltarlo
porque es un punto crítico para la validez de la estimación, que las censuras son no informativas o,
dicho de otro modo, que los individuos censurados tienen el mismo riesgo de ocurrencia del evento
que los que siguen en observación más allá de ese tiempo. La importancia de esta asunción es tanto

reservados.
mayor cuanto mayor sea el número de censuras. Nótese que esta asunción no es trivial y se violaría, por
ejemplo, si los pacientes que abandonan el estudio están más graves, o menos, que los que continúan o,
en otro ejemplo, si el evento fuera progresión de la enfermedad, la muerte sin progresión seguramente
no cumple con esa asunción. Aunque excede los objetivos de este texto profundizar en ello, hay que
distinguir entre censura (circunstancia que impide la observación del evento, pero se supone que este
ocurrirá en el futuro) y evento competitivo (circunstancia que impide que el evento ocurra) y conviene
señalar que, aunque relativamente poco usados, existen métodos para manejar la ocurrencia de eventos
competitivos (13,14). En el ejemplo anterior, la muerte sin progresión sería mejor considerarla un
evento competitivo que una censura. Un ejemplo de estos métodos puede verse en el reanálisis (15)
de un ensayo clínico sobre dos tipos de diálisis renal en el que se consideró el trasplante como evento
competitivo en lugar de censura como en el análisis original (16).
La otra forma de expresar el resultado de un estudio sobre factores pronósticos es mediante el
riesgo relativo, hazard ratio (HR), de los pacientes de un nivel del factor respecto al que se toma
como referencia. Es un cociente entre dos riesgos, por lo tanto, es igual a 1 si en ambos niveles del
factor los pacientes tuvieran el mismo riesgo, es decir, si el factor estudiado no fuera un factor de
riesgo, mayor que 1 si fuera factor de riesgo y menor que 1 si fuera factor de protección. El riesgo,
en estos análisis, se define como la probabilidad por unidad de tiempo (tasa instantánea de eventos)
de que un individuo que está en observación en el tiempo t, tenga el evento justo en ese tiempo,
condicionado a que el evento no ocurrió antes. Puede ser, y de hecho suele serlo, variable en el
tiempo. Sin embargo, el modelo de regresión de Cox, que es el método usado casi en exclusiva en la
investigación clínica (12) para estimar el riesgo relativo, asume que, aunque el riesgo pueda variar,
el riesgo relativo es constante. Esta asunción no siempre se cumple, no se cumpliría por ejemplo en
un estudio en el que al final del seguimiento a todos los pacientes les haya ocurrido el evento. Es
por lo tanto necesario evaluarla. Hay distintos procedimientos gráficos y estadísticos para hacerlo,
pero el más sencillo es la inspección visual de las curvas de supervivencia. Si se cumple la asunción
de riesgo relativo constante, las curvas se separan según avanza el tiempo; que las curvas converjan
o, en el caso extremo, se corten es un indicador de que la asunción no se cumple. En la figura 7.1
se muestran curvas que cumplen la asunción y en la figura 7.2 curvas que no la cumplen.
Figura 7.1 Curvas de supervivencia en las que se cumple la asunción de riesgo relativo constante, o riesgo
proporcional. Obsérvese cómo se separan según avanza el tiempo.

reservados.
Figura 7.2 Curvas de supervivencia en las que no se cumple la asunción de riesgo relativo constante. Este
sería un caso extremo en el que las curvas llegan a cruzarse, por lo que, para tiempos menores del punto
en el que se cruzan (150 meses), el riesgo de evento para los pacientes sin ganglios (línea negra) es menor
(supervivencia mayor) que para los pacientes con ganglios (línea celeste); por lo tanto, el riesgo relativo es
menor que 1 y, sin embargo, para tiempos mayores que 150, la relación se invierte y el riesgo relativo es mayor
que 1, es decir, no es constante.
PRECISIÓN
Es importante destacar también que los índices citados en el apartado «En los resultados» se calculan a
partir de muestras, es decir, un subconjunto de los pacientes de interés en lugar de todos ellos, por tanto
presentan una imprecisión que se debe cuantificar por el intervalo de confianza (intervalo dentro del
cual se puede asegurar, con una probabilidad determinada, habitualmente el 95%, que se encontraría
el índice si se hubieran estudiado todos los pacientes, asumiendo que el estudio sea válido). En el caso
de las curvas de supervivencia, la anchura del intervalo de confianza aumenta según avanza el tiempo
como consecuencia de la disminución del número de pacientes. En algunos estudios, la anchura al
final del tiempo de seguimiento es tan grande, aunque con demasiada frecuencia no mostrada (12),
que se hace difícil la interpretación de la curva. Una de las razones por las que no siempre se muestran
los intervalos de confianza es que cuando se presentan varias curvas en la misma gráfica, esta podría
llegar a ser engorrosa si se mostraran. Un modo alternativo de presentar la precisión en estos casos
es incluir debajo del eje del tiempo el número de pacientes que permanecen en el estudio en cada
tiempo. Como ayuda a la interpretación de cómo afecta este número a la precisión, se puede usar la
recomendación de Pockoc et al. (17) de acortar la gráfica en el punto en el que queden menos del
20-10% de los pacientes que empezaron el estudio. Recomiendan tal restricción solo para la gráfica;
para el análisis se deberían incluir todos los pacientes. Es una recomendación generalmente no seguida
en los artículos, pero que puede ser útil en la lectura crítica. En la figura 7.3 se muestran dos curvas
con sus intervalos de confianza al 95% y se observa este aumento de la anchura del intervalo según
avanza el tiempo. También se presenta el número de pacientes que permanece en el estudio.
CONFUSIÓN E INTERACCIÓN
La mayor amenaza para el estudio de asociaciones entre variables mediante estudios observacionales
es la confusión. Existe confusión cuando la asociación entre dos variables difiere según que se con-

reservados.
Figura 7.3 Curvas de supervivencia con sus intervalos de confianza al 95% (IC 95%), en los que se observa
el aumento de anchura según avanza el tiempo.
sidere, o no, otra variable. A esta última variable se la denomina variable de confusión. Para que una
variable sea de confusión debe estar asociada al factor y al evento, siendo causa común (o marcador),
no consecuencia, de ambos. Por ejemplo, en el estudio para la estratificación pronóstica de pacientes
con linfoma esplénico de la zona marginal (3), se encontró que los pacientes con concentración sérica
elevada de la lactato deshidrogenasa (LDH) tienen un riesgo de muerte por la enfermedad 3,38 veces
mayor que los que no la tienen. Sin embargo, como la supervivencia puede depender no solo de la
LDH, sino también de otras variables como la edad, o los niveles de otros componentes sanguíneos,
podría ocurrir que, si los pacientes con niveles altos de LDH fueran también diferentes respecto a esas
otras variables, esa estimación del riesgo relativo esté equivocada (confundida). En efecto, cuando se
consideran otras variables el riesgo relativo de la LDH cambia a 2,47. La manera más usada y sencilla
de controlar la confusión es, como se hizo en ese estudio, mediante modelos de regresión, en los que
se incluyen la variable de interés y las variables de confusión que se quieran considerar. Una medida
habitual para evaluar la confusión es comparar los efectos crudos (sin considerar otras variables) y
ajustados (considerándolas), diferencias mayores del 10% indican presencia de confusión. Hay que
resaltar que la confusión es un problema crucial cuando se estudian asociaciones causales, por ello el
diseño óptimo para evaluar el efecto de un tratamiento es el ensayo clínico, en el que la asignación
aleatoria del tratamiento a los pacientes trata justamente de evitar su asociación con cualquier otra
variable para impedir la confusión; y se han desarrollado complejos sistemas de análisis (18) para
controlar la confusión en los diseños observacionales de evaluación de efectos de los tratamientos. Sin
embargo, no es tan crítico en estudios de pronóstico, por ejemplo, cuando se encuentra que el estado
civil es un factor pronóstico para la supervivencia al cáncer de mama (19), probablemente no se ha
encontrado una asociación causal y hay algún factor, o varios (psicológicos, de comportamiento…),
distinto entre las mujeres casadas y no casadas que es el causante de la diferencia en mortalidad y
que, por lo tanto, sería un factor de confusión para esa asociación. A pesar de estar probablemente

reservados.
confundida, la información pronóstica que ofrece ese hallazgo es útil tanto para informar a los
pacientes, como para generar ideas sobre los factores causales.
Otra dificultad que se puede presentar con los resultados de un estudio de pronóstico es la exis-
tencia de interacción o modificación del efecto. Existe interacción cuando la asociación entre dos
variables, en este caso factor y evento, varía según los diferentes niveles de otra u otras variables.
El análisis más sencillo de interacción se hace mediante el análisis de subgrupos creados según los
niveles de la variable modificadora de efecto, para ello hay que evaluar el efecto del factor en las dis-
tintas categorías de la variable modificadora de efecto, por ejemplo el efecto de la diabetes mellitus
(DM) sobre eventos cardiovasculares puede ser distinto si el paciente ha tenido, o no, enfermedad
cardiovascular previa (CVD), si fuera así, el efecto de la DM debería ser mostrado no como un
riesgo relativo, sino como dos: uno para los pacientes con CVD previa y otro para los pacientes
sin CVD previa (20). Se dice que hay interacción entre la DM y la CVD o que la CVD modifica
el efecto de la DM. Esta manera de analizarlo, muy utilizada en ensayos clínicos, presenta dos
dificultades: está restringida a variables modificadoras categóricas, es decir, no es posible realizarlo
para variables continuas y no contrasta estadísticamente si los efectos son distintos. Para evaluar
estadísticamente la interacción entre un factor y una variable modificadora del efecto se suelen usar
modelos de regresión en los que se incluyen como variables independientes el factor, la variable
modificadora y el producto de las dos anteriores; la significación obtenida para este producto con-
trasta estadísticamente la interacción entre el factor y la variable. Si existe interacción, el efecto del
factor no es único, sino que será distinto según los valores de la variable considerada, análogo a la
consideración realizada anteriormente en el caso de análisis de subgrupos. Si la interacción se realiza
con una variable continua el efecto será distinto según cada valor de la variable, una alternativa de
presentación podría ser mostrar el efecto del factor mediante un gráfico en el que en el eje de X se
muestre la variable modificadora y en el eje de ordenadas el efecto.
Utilidad del pronóstico

Como ya se ha señalado, el objetivo de la investigación en factores pronósticos es obtener informa-
ción que permita informar al paciente y a su entorno sobre la evolución más probable de la enfer-
medad y ayude a la toma de decisiones sobre la realización de las distintas intervenciones posibles;
también es útil para estratificar pacientes en los ensayos clínicos según su pronóstico inicial. Por
ello, y como también se ha señalado, no es tan crítico como en los estudios de tratamiento, obtener
estimadores exentos de confusión, aunque sí es conveniente controlar por factores pronósticos ya
conocidos. En el artículo citado sobre estado marital y cáncer de mama (19), el riesgo relativo que se
comunica está ajustado por factores demográficos, de tumor y de tratamiento, para asegurar que
su valor pronóstico se añade al de los otros factores.
Con las técnicas genéticas se están proponiendo una gran cantidad de nuevos marcadores
pronósticos, de los que conviene evaluar si añaden, y cuánto, valor pronóstico a los anteriores.
Además de la estimación ajustada por los factores conocidos, se han desarrollado técnicas específicas
para hacer esa evaluación. Una de ellas es el índice de mejoría neta de la reclasificación (NRI) (21),
propuesto para la situación en que a un modelo pronóstico existente se le añade una nueva variable,
pero que no hay inconveniente en aplicarlo a la comparación de dos modelos distintos, siempre
que se puedan aplicar los dos a los mismos pacientes. Sin entrar en demasiados detalles, el NRI
exige estimar las probabilidades de evento predichas por ambos modelos y clasificar con ellas a los
sujetos en categorías de riesgo. El NRI se define como la diferencia de las proporciones de sujetos
con evento que «suben» de categoría con el nuevo modelo (el nuevo modelo les asigna una categoría
de mayor riesgo que el viejo) y los que «bajan» (pasan a una categoría de menor riesgo con el nuevo
modelo), menos esa misma diferencia en los sujetos sin evento. Es decir, el NRI cuantifica lo que
mejora la clasificación para los eventos, descontando lo que empeora para los no eventos. Es por
tanto un índice muy intuitivo de la mejora que el nuevo marcador supone respecto al anterior.

reservados.
Artículo
Liu L, Zhang X, Yan B, Gu Q, Zhang X, Jiao J, et al. Elevated Plasma D-Dimer Levels Correlate
with Long Term Survival of Gastric Cancer Patients. PLoS ONE 2014;9:e90547. Disponible en:
http://dx.plos.org/10.1371/journal.pone.0090547.
Plantilla CASPe contestada para este artículo concreto

En el cuadro 7.1 se muestra la plantilla CASPe contestada para este artículo concreto.
CUADRO 7.1 ■ Evaluación crítica del artículo propuesto (plantillas CASPe)
A) ¿Son válidos los resultados?

Preguntas «de eliminación»
1. ¿Fue una muestra Sí ✓ No sé No
representativa y bien definida Son 247 pacientes con cáncer gástrico probado patológicamente
de pacientes en un momento y sin terapia paliativa previa atendidas en un hospital de
similar en el curso de la Shanghái entre 2002 y 2004. La quimioterapia adyuvante fue
enfermedad? permitida si habían pasado más de 6 meses.
PISTAS: De ellos, 237 recibieron algún tratamiento quirúrgico (168
• ¿De qué ámbito son gastrectomía radical, 46 gastrectomía paliativa y 23 laparotomía
los pacientes: primaria exploratoria). Después de la cirugía 50 pacientes fueron
o especializada? confirmados como diseminación peritoneal.
• ¿En qué punto de su curso clínico
se incluyen en el estudio?
2. ¿Fue el seguimiento lo Sí ✓ No sé No
suficientemente prolongado Siguen a los pacientes mediante la historia del hospital,
y completo? el Registro de Cáncer de Shanghái o mediante contacto
PISTAS: con los familiares.
• El intervalo temporal entre un El tiempo fue definido como el intervalo entre la fecha de cirugía
factor pronóstico y un resultado y el último seguimiento o muerte debido a cáncer gástrico.
es variable y puede ser muy Los pacientes fueron observados hasta 31/12/2010.
largo. En resultados dicen que la mediana de seguimiento fue 37 meses
• ¿Se pierden pacientes? ¿Se (1-48).
investigan sus características?
¿Merece la pena continuar?
Preguntas detalladas
3. ¿Se utilizaron criterios Sí ✓ No sé No
objetivos y no sesgados Los niveles de dímero-D fueron obtenidos 2 días antes
para los resultados? de la cirugía con un método de ensayo de fluorescencia
PISTA: los resultados a veces son ligado a enzima.
objetivos (p. ej., muerte), otras Se consideran normales valores de dímero-D menores a 0,5.
no tanto (p. ej., calidad de vida). El evento principal es muerte relacionada con el cáncer gástrico.
¿Se valoraron de modo «ciego»? No evalúan el riesgo competitivo de muerte, lo definen como
censura.
Se considera más robusto utilizar muerte por cualquier causa.
El punto de corte óptimo, un valor de 1.465, fue calculado basado
en la curva ROC, no se dice qué método es utilizado para decir
qué es mejor (maximizar sensibilidad, especificidad, la suma…).
(Continúa)
reservados.
4. ¿Se hizo un ajuste por Sí No sé No ✓

los factores pronósticos No dan detalle de qué variables analizaron.
importantes? Muestran en la tabla 5 el resultado de los factores pronósticos
PISTA: en muchos estudios de univariables, pero no nos dicen si otras variables fueron evaluadas.
pronóstico al grupo de pacientes El modelo final lo componen el estadio (T1, T2, T3, T4),
se le divide en subgrupos las metástasis de nodos linfáticos, el tamaño del tumor
de factores pronósticos (< o > 5 cm), la diseminación peritoneal y el dímero-D
(o tratamientos) sospechados. con el punto de corte de 1.465.
Si se hizo esto, ¿se controlaron Notar que todas las variables son significativas y que no hacen
por otros factores? mención a la posible existencia de interacción o confusión,
aunque en el texto dicen en la página 6 que el HR es 3,86
a comienzo de párrafo y después dicen 2,28, que coincide
con el HR del modelo multivariable.
B) ¿Cuáles son los resultados?
5. ¿Cuál es la probabilidad Se presenta mediante curva de supervivencia por el método
del(los) evento(s) de Kaplan-Meier y nos dan la mediana de supervivencia.
en un período de tiempo En los pacientes con dímero-D bajos la mediana es 48,02 (43,8;
determinado? 52,3) vs. 22,9 (17,5; 28,4) en pacientes con dímero-D > 1.465.
PISTAS: En términos de HR es 2,28 (1,36; 3,81).
• La probabilidad varía
en el tiempo.
• ¿Se presentan «curvas
de supervivencia»?
• ¿Se presentan para los distintos
factores pronósticos?
6. ¿Cuán precisas son las (v. pregunta 5.)
estimaciones? Se debería añadir el intervalo de confianza de las curvas o individuos
PISTA: ¿se dan los intervalos en riesgo en los gráficos de la figura 4.
de confianza?
C) ¿Son los resultados aplicables en tu medio?
7. ¿Son los pacientes del Sí No sé ✓ No
estudio similares a los míos? Carmen es mujer (representan el 33%), con una edad media
PISTA: considera si: similar a la del estudio y con un estadiaje inicial de la
• Los pacientes del estudio pueden enfermedad bien representado entre los sujetos del estudio. Sin
ser suficientemente diferentes embargo, es importante destacar que el estudio está realizado
de los de tu área. en sujetos asiáticos y no se sabe bien si podría existir alguna
• Tu medio parece ser muy diferente variabilidad genética en la síntesis de dímero-D relacionada
al del estudio. con la raza.
8. ¿Conducen los resultados Sí ✓ No sé No
a seleccionar o a evitar Los autores sugieren que podría ser de gran ayuda para predecir
un tratamiento? la diseminación y la supervivencia a medio plazo. En el caso
de Carmen, si decidimos que el factor racial no supone una
enorme diferencia, podría ayudarle a contemplar un tratamiento
menos agresivo y con menos probabilidad de muerte a 4 años.
9. ¿Son útiles los resultados Sí ✓ No sé No
para tranquilizar o aconsejar En el caso de Carmen, aunque no determinante, permite predecir
a los pacientes? una probabilidad de supervivencia aproximada (a partir de la
gráfica, teniendo solo en cuenta el resultado de la prueba) a 1 año
del 90% y a 2 años del 70%, y esta información podría ayudar a Carmen
a decidir mejor sobre su futuro próximo y el de su negocio.

reservados.
Bibliografía
1. Hemingway H, Croft P, Perel P, Hayden JA, Abrams K, Timmis A, et al. Prognosis research strategy
(PROGRESS) 1: A framework for researching clinical outcomes. BMJ 2013;346:e5595.
2. Krumholz HMM, Wang YP, Chen JM, Drye EEMS, Spertus JAM, Ross JSMM, et al. Reduction in
Acute Myocardial Infarction Mortality in the United States: Risk-Standardized Mortality Rates From
1995-2006. JAMA 2009;302:767-73.
3. Montalbán C, Abraira V, Arcaini L, Domingo-Domenech E, Guisado-Vasco P, Iannito E, et al. Risk
stratification for Splenic Marginal Zone Lymphoma based on haemoglobin concentration, platelet count,
high lactate dehydrogenase level and extrahilar lymphadenopathy: development and validation on 593
cases. Br J Haematol 2012;159:164-71.
4. Steyerberg EW, Moons KG, van der Windt DA, Hayden JA, Perel P, Schroter S, et al. Prognosis Research
Strategy (PROGRESS) 3: Prognostic model research. PLoS Med 2013;10:e1001381.
5. Semeraro F, Parrinello G, Cancarini A, Pasquini L, Zarra E, Cimino A, et al. Predicting the risk of diabetic
retinopathy in type 2 diabetic patients. J Diabetes Complications 2011;25:292-7.
6. Chen H, Bai M, Qi X, Liu L, He C, Yin Z, et al. Child-Na score: a predictive model for survival in
cirrhotic patients with symptomatic portal hypertension treated with TIPS. PLoS ONE 2013;8:e79637.
7. Hingorani AD, Windt DA, Riley RD, Abrams K, Moons KG, Steyerberg EW, et al. Prognosis research
strategy (PROGRESS) 4: Stratified medicine research. BMJ 2013;346:e5793.
8. Liu L, Zhang X, Yan B, Gu Q, Zhang X, Jiao J, et al. Elevated Plasma D-Dimer Levels Correlate with
Long Term Survival of Gastric Cancer Patients. PLoS ONE 2014;9:e90547.
9. Paula AR, Jerry HG, Kathy S, Muhammad M, David LS, Susan G, et al. Reader’s guide to critical appraisal
of cohort studies: 1. Role and design. BMJ 2005;330:895-7.
10. Hayden J, van der Windt D, Cartwright J, Côté P, Bombardier C. Assessing Bias in Studies of Prognostic
Factors. Ann Intern Med 2013;158:280-6.
11. U. S. Department of Health and Human Services Food and Drug Administration. Guidance for Industry.
Clinical Trail Endpoints for the Approval of Cancer Drugs and Biologics. Disponible en: http://www.fda.
gov/downloads/drugsGuidanceComplianceRegulatoyInformation/Guidance/UCM071590.pdf. 2007.
12. Abraira V, Muriel A, Emparanza JI, Pijoán JI, Royuela A, Plana MN, et al. Reporting quality of survival
analyses in medical journals still needs improvement. A minimal requirements proposal. J Clin Epidemiol
2013;66:1340-6.
13. Gooley TA, Leisenring W, Crowley J, Storer BE. Estimation of failure probabilities in the presence of
competing risks: new representations of old estimators. Stat Med 1999;18:695-706.
14. Fine JP, Gray RJ. A Proportional Hazards Model for the Subdistribution of a Competing Risk. J Am Stat
Assoc 1999;94:496-509.
15. Maduell F, Moreso F, Mora-Macià J, Pons M, Ramos R, Carreras J, et al. Reanálisis del estudio ESHOL:
mortalidad por todas las causas considerando riesgos de competición y tiempo-dependientes para trasplante
renal. Nefrología 2016;36:89-216.
16. Maduell F, Moreso F, Pons M, Ramos R, Mora-Macià J, Carreras J, et al. High-Efficiency Postdilution Online
Hemodiafiltration Reduces All-Cause Mortality in Hemodialysis Patients. J Am Soc Nephrol 2013;24:487.
17. Pocock SJ, Clayton TC, Altman DG. Survival plots of time-to-event outcomes in clinical trials: good
practice and pitfalls. Lancet 2002;359:1686-9.

18. Muriel A, Hernández D, Abraira V. Modelos estructurales marginales: una herramienta útil que propor-
ciona evidencia a los estudios observacionales. Nefrología 2011;2(Supl Ext):7-13.
19. Aizer AA, Chen MH, McCarthy EP, Mendu ML, Koo S, Wilhite TJ, et al. Marital status and survival
in patients with cancer. J Clin Oncol 2013;31:3869-76.
20. Becker A, Bos Gt, de Vegt F, Kostense PJ, Dekker JM, Nijpels G, et al. Cardiovascular events in type 2
diabetes: comparison with nondiabetic individuals without and with prior cardiovascular disease: 10-year
follow-up of the Hoorn Study. Eur Heart J 2003;24:1406-13.
21. Pencina MJ, D’Agostino RB, Steyerberg EW. Extensions of net reclassification improvement calculations
to measure usefulness of new biomarkers. Stat Med 2011;30:11-21.
Cómo citar este capítulo:

Abraira V, Muriel A, Montes M. Lectura crítica de estudios de pronóstico. Estudios de cohortes. En: Cabello
Juan B, editor. Lectura crítica de la evidencia clínica, 2.ª ed. Barcelona: Elsevier; 2022. p. 67-77.

reservados.

Cap7 Salud

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Cap7 Salud

Cargado por

Copyright:

Formatos disponibles

C A P Í T U L O 7

Lectura crítica de estudios

• Comprender los términos claves de un artículo sobre pronóstico, en particular

© 2022. Elsevier España, S.L.U.

Descargado para Daniela Diaz (chingd@uninorte.edu.co) en University of the North de

pacientes con carcinoma gástrico?

pronóstico y tomar las decisiones personales que necesita?

Puntos clave de la lectura crítica de estudios

ningún tratamiento antirretroviral) junto con pacientes multitratados.

Descargado para Daniela Diaz (chingd@uninorte.edu.co) en University of the North de

Descargado para Daniela Diaz (chingd@uninorte.edu.co) en University of the North de

Descargado para Daniela Diaz (chingd@uninorte.edu.co) en University of the North de

Descargado para Daniela Diaz (chingd@uninorte.edu.co) en University of the North de

Descargado para Daniela Diaz (chingd@uninorte.edu.co) en University of the North de

Utilidad del pronóstico

Descargado para Daniela Diaz (chingd@uninorte.edu.co) en University of the North de

Plantilla CASPe contestada para este artículo concreto

CUADRO 7.1 ■ Evaluación crítica del artículo propuesto (plantillas CASPe)

A) ¿Son válidos los resultados?

4. ¿Se hizo un ajuste por Sí No sé No ✓

Descargado para Daniela Diaz (chingd@uninorte.edu.co) en University of the North de

practice and pitfalls. Lancet 2002;359:1686-9.

Cómo citar este capítulo:

Descargado para Daniela Diaz (chingd@uninorte.edu.co) en University of the North de

También podría gustarte