Está en la página 1de 16

C A P Í T U L O

7
Lectura crítica de estudios
de pronóstico. Estudios de cohortes
Víctor Abraira, Alfonso Muriel García
y María Luisa Montes Ramírez

OBJETIVOS DEL CAPÍTULO


• Describir y clasificar los tipos de estudios de pronóstico.
• Tratar los aspectos clave de la evaluación de la validez de los estudios
de pronóstico.
• Reflexionar acerca de la importancia de los estudios de pronóstico
para justificar las decisiones sobre el manejo del paciente.

INTRODUCCIÓN

En medicina, el pronóstico se refiere a la estimación del riesgo de futuros


acontecimientos en personas con una enfermedad o condición de salud
determinada, y su relación con determinadas características actuales (1).
Realizar apreciaciones pronósticas que informen al paciente y a su entorno
sobre la evolución más probable de la enfermedad y ayuden a la toma de
decisiones sobre la realización de las distintas intervenciones posibles es
una de las funciones básicas de la medicina y de los médicos. Las inter-
venciones terapéuticas se encaminan, precisamente, a modificar el pronós-
tico espontáneo o historia natural de la enfermedad, transformándolo en
un sentido positivo. Sin duda, la primera preocupación de una persona
enferma es conocer en qué medida la enfermedad puede interferir su
expectativa de vida; por tanto, el estudio de la mortalidad y del tiempo
que transcurre entre el comienzo de la enfermedad o su diagnóstico y/o
la instauración del tratamiento y la muerte, o tiempo de supervivencia,
­constituyen la prioridad para cualquier estudio de pronóstico. Pero también

© 2015. Elsevier España, S.L.U. Reservados todos los derechos


102 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA

forman parte del mismo otras consecuencias de la enfermedad (remisión,


recidiva, complicaciones, secuelas, etc.) que interesan al paciente y forman
parte del proceso de toma de decisiones del médico.
Con muchos puntos en común con el pronóstico, está el problema de los
factores de riesgo para enfermar, en el que también se trata de estimar el
riesgo de un acontecimiento futuro, aunque en este caso el acontecimiento
de interés es enfermar entre personas de la población general, o de un
cierto subgrupo de ella, en lugar de muerte o complicaciones en personas
enfermas. Por lo tanto, los estudios para estimar factores de riesgo y factores
pronósticos tienen muchas similitudes. En ambos casos, el diseño óptimo
es un estudio de cohortes, es decir, un estudio en el que se selecciona un
grupo de individuos, bien definido, representativo de la población de
estudio, al que se sigue durante un tiempo suficientemente prolongado
para observar el evento de interés. Idealmente son estudios prospectivos,
aunque a veces son retrospectivos o mixtos. En ocasiones, en lugar de un
único grupo se seleccionan grupos con distintos niveles del factor, sobre
todo en el estudio de los factores de riesgo, debido a que se trata de predecir
enfermedades, en general con baja probabilidad, mientras que los factores
pronósticos predicen eventos, en general de mayor probabilidad.
Recientemente se ha propuesto una clasificación de los estudios de
pronóstico en cuatro categorías distintas, aunque interrelacionadas (1):
• Investigación fundamental en pronóstico, en la que se trata de estudiar
el curso natural, o con el cuidado habitual, de la enfermedad y sus
variaciones. El resultado de esta investigación se expresa como riesgo
(o frecuencia) absoluto de uno, o más eventos, entre las personas
que comparten características demográficas y clínicas; es, por lo tanto,
el pronóstico promedio de un determinado grupo de interés, también
llamado riesgo basal. Esta investigación proporciona respuestas
iniciales a la pregunta «¿cuál es el pronóstico de las personas
con una determinada enfermedad?». Por ejemplo, en promedio,
cerca del 15% de las personas de 65 años de edad o más, ingresadas
en 2006 en EE. UU., murieron con un ataque al corazón dentro de
los 30 días siguientes al de su ingreso en el hospital, en comparación
con un promedio del 19% en 1995 (2).
• Investigación en factores pronósticos, en la que se trata de identificar
factores específicos (como biomarcadores, fármacos, otras
enfermedades, signos, etc.) asociados con el pronóstico. El resultado
de esta investigación se puede expresar bien como RR de sufrir
el evento de los pacientes con un nivel del factor respecto al que
se toma como referencia —p. ej., en pacientes con linfoma esplénico
de la zona marginal, los que presentan adenopatía extrahiliar tienen
un riesgo de muerte por la enfermedad 2,1 veces mayor que los que
no la presentan (3)—, bien en términos absolutos mostrando los riesgos,
7.  Lectura crítica de estudios de pronóstico. Estudios de cohortes 103

o más frecuentemente las curvas de supervivencia, para los pacientes


con distintos valores del factor. En el artículo que se usará para hacer
la lectura crítica (4) se usan ambas presentaciones.
• Investigación sobre modelos pronósticos, que trata de desarrollar, validar
y evaluar el impacto de modelos estadísticos para predecir el riesgo
individual de un futuro evento. Es importante enfatizar la necesidad
de validación y evaluación del impacto, porque, aunque se han
propuesto muchos modelos pronósticos, relativamente pocos son
validados externamente y muy pocos evalúan el impacto de su uso
(5). El resultado de esta investigación se puede presentar en forma
de una fórmula, o gráfica (nomograma) (6), que permite calcular
la probabilidad futura del evento para un individuo en función de los
valores observados de los factores, o bien como una puntuación
obtenida de la fórmula, con sus puntos de corte para generar
grupos de riesgo (7). El uso de los modelos pronósticos para hacer
predicciones individuales es más preciso y, en general, preferible a la
creación de grupos de riesgo, aunque los grupos de riesgo pueden
informar para opciones de tratamiento y permitir la estratificación
por riesgo de gravedad en los EC (5). Este tipo de investigación es
tratada en el capítulo 8 dedicado a las reglas de predicción clínica.
• Investigación sobre medicina estratificada. La medicina estratificada
pretende seleccionar tratamientos en función de características
de los pacientes que predigan la respuesta. La investigación en
pronóstico es un componente principal de esta medicina (8).

ESCENARIO

Carmen es una mujer de 60 años a la que se le acaba de diagnosticar un


adenocarcinoma de estómago en estadio T2 N0 M0. Su oncóloga le ha expli-
cado que el primer paso del tratamiento es la cirugía de resección del tumor y
© Elsevier. Fotocopiar sin autorización es un delito.

después es posible que se requiera quimioterapia adyuvante. Carmen quiere


saber con más exactitud si será preciso recibir quimioterapia adyuvante, con
todo lo que ello conlleva, pues tiene un pequeño negocio familiar que lleva
ella directamente y necesita decidir qué hacer con él. La oncóloga le explica
que esto depende de la verdadera extensión del adenocarcinoma y que
antes de la operación es muy difícil de determinar. Carmen insiste en saber
si no existen otros datos, en la tomografía computarizada o los análisis, que
puedan ayudar a predecir mejor su pronóstico; necesita organizarse y tomar
decisiones importantes sobre su situación laboral desde el principio y no
esperar a después de la cirugía. Su oncóloga le dice que va a revisar estudios
recientes, pues recuerda haber leído algo sobre un marcador en sangre.
En una búsqueda en PubMed encuentra un artículo reciente sobre el
valor pronóstico del dímero-D en pacientes con cáncer gástrico antes de la
104 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA

cirugía. Tras hacer una lectura crítica, lo comenta con Carmen y, dado que es
una prueba sencilla y barata, deciden hacerla; el resultado es de 1,15 mg/ml.
• ¿Crees que la determinación del dímero-D puede ayudar a predecir el
pronóstico de los pacientes con carcinoma gástrico?
• En el caso de Carmen, ¿crees que es aplicables esta prueba? ¿Puede
ayudarla a clarificar su pronóstico y tomar las decisiones personales
que necesita?

PUNTOS CLAVE DE LA LECTURA CRÍTICA


DE ESTUDIOS DE FACTORES PRONÓSTICOS

EN EL DISEÑO
Como se ha dicho en la introducción, y señalando en negrita los puntos
clave para la evaluación crítica de artículos de este tipo, el diseño óptimo
para establecer factores pronósticos es un estudio de cohortes, es decir,
un estudio en el que se selecciona un grupo de pacientes bien definido,
representativo de la población de estudio, en un momento homogéneo
de la enfermedad, al que se sigue en el tiempo para observar el evento o
eventos de interés durante un tiempo suficientemente prolongado.
Que un grupo de pacientes esté bien definido y sea representativo de la
población de interés depende de la pregunta de investigación. Por ejem-
plo, para responder a la pregunta de si el uso de antipsicóticos atípicos
aumenta el riesgo (es factor pronóstico) de padecer fractura de cadera
en ancianos, se debe comparar la frecuencia de fracturas en un grupo de
ancianos que toman antipsicóticos atípicos con la de otro grupo que no los
toma; ahora bien, este grupo puede estar formado por ancianos que no
tomen antipsicóticos o por ancianos que tomen otro tipo de antipsicóticos.
Es representativo, según el caso, un grupo de ancianos de la población
general o de ancianos con demencia (9).
Otro elemento clave para la validez de estos estudios es que, en el comienzo
del seguimiento, los pacientes se encuentren en un momento homogéneo de
la enfermedad. Es fácil de entender que si, por ejemplo, se quieren estudiar
factores pronósticos para pacientes infectados por el VIH, daría lugar a errores
(efecto cohorte) introducir en la cohorte pacientes naïve (que no han recibido
ningún tratamiento antirretroviral) junto con pacientes multitratados.
El elemento clave más relevante de estos estudios, que condiciona to-
dos los demás, es la elección del evento. Como ya se ha mencionado, con
frecuencia es la muerte, pero también hay otros eventos de interés, como
remisión, recidiva, rechazo del trasplante, aparición de la enfermedad, por
ejemplo, en pacientes con VIH, etc. El artículo debe tener una definición
clara y precisa del evento, o eventos, de interés (p. ej., si fuera muerte, es-
pecificar si es por todas las causas o por alguna causa específica o, si fuera
7.  Lectura crítica de estudios de pronóstico. Estudios de cohortes 105

recidiva, cómo se determina, si clínica, radiológica o histológicamente). El


lector crítico debe considerar la pertinencia y relevancia de estas definicio-
nes. Véanse, por ejemplo, las definiciones de evento recomendadas por la
agencia gubernamental norteamericana FDA para tratamientos oncológicos
(10). Otro elemento clave en relación con el diseño del estudio es la forma
en que se han recogido las variables, con procedimientos homogéneos y
estandarizados (muy relevante en estudios retrospectivos y multicéntricos),
sobre todo en aquellas que tengan elementos subjetivos (dolor, calidad de
vida, etc.), necesiten interpretación (pruebas de imagen) o tengan com-
plejidades técnicas (pruebas de laboratorio). Estos procedimientos deben
garantizar la independencia (ceguera) respecto al evento y al factor.
El tiempo de seguimiento debe ser suficiente para que se pueda observar
el número de eventos necesario de acuerdo con la potencia estadística prees-
tablecida. Esto depende, naturalmente, de la naturaleza de la enfermedad y
la frecuencia del evento estudiado. Por ejemplo, un período de seguimiento
de 5 años puede ser apropiado para el estudio de la supervivencia en muchas
variedades de cáncer, sin embargo, es un tiempo claramente insuficiente
para valorar la supervivencia de enfermos en tratamiento sustitutivo por
insuficiencia renal. Por el contrario, un seguimiento de 30 días es adecuado
para estudiar la supervivencia a un episodio agudo de tromboembolismo
pulmonar. En aquellos estudios que precisen un tiempo de seguimiento largo,
hay que prestar atención a la posible pérdida de pacientes y sus causas, sobre
todo a aquellas relacionadas con el evento o el factor. Sería deseable, para
ayudar a evaluar su validez, que todo artículo de pronóstico cuantificara
las pérdidas en el seguimiento, describiera las situaciones que las provocan
(abandono del estudio u ocurrencia de alguna otra circunstancia que impide
la observación del evento) y las características de los pacientes afectados (11).

EN LOS RESULTADOS
En cuanto a los resultados de estos estudios, como se dijo en el apartado
© Elsevier. Fotocopiar sin autorización es un delito.

«Introducción» se pueden expresar de varias maneras: como riesgo (o


frecuencia) absoluto de sufrir el evento en la población de interés, mostran-
do la evolución del riesgo o la supervivencia (curvas de supervivencia) a lo
largo del tiempo, o como RR de los pacientes de un nivel del factor respecto
al que se toma como referencia. Para estimar el riesgo absoluto se suelen
usar dos índices: incidencia acumulada y densidad (o tasa) de incidencia.
La incidencia acumulada es la proporción de individuos que desarrollan
el evento durante el período de seguimiento. Como proporción no tiene
dimensiones y su valor oscila entre 0 y 1, aunque también se suele expresar
como porcentaje. Depende del tiempo de seguimiento, que se debe hacer
explícito. El resultado del ejemplo citado en el apartado «Introducción»
(el 15% de las personas ≥ 65 años de edad ingresadas en 2006 en EE. UU.
murieron con un ataque al corazón dentro de los 30 días siguientes al de su
ingreso) es una incidencia acumulada. La principal limitación de este índice
106 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA

proviene del llamado efecto de cohorte fija: presenta cierta indeterminación


si hay pérdidas en el seguimiento. Para evitar esta limitación se puede usar
otro índice: la densidad, o tasa, de incidencia, que es el cociente entre
el número de eventos ocurridos durante el período de seguimiento y la
suma de todos los tiempos de observación. Tiene dimensión de inversa
del tiempo, un rango ilimitado a partir de 0, y no depende del tiempo de
seguimiento, asumiendo estacionariedad, es decir, riesgo constante a lo
largo del tiempo. Esta asunción no siempre es razonable.
Sin embargo, en general, el resultado de interés no es la frecuencia de
ocurrencia de los eventos, sino el tiempo hasta que ocurren. En este caso,
los resultados se suelen expresar, generalmente en forma gráfica, mediante
la denominada función de supervivencia, que da, para cada tiempo t, la
probabilidad de que el evento ocurra (el paciente sobreviva, si el evento es
muerte) en un tiempo igual o mayor que t. La figura 4 del artículo que se
propone como ejemplo (4) muestra curvas de supervivencia de pacientes
con cáncer gástrico estratificados por diseminación peritoneal y valores del
dímero-D. La principal dificultad para estudiar el tiempo hasta la ocurrencia
de un evento es que, en general, al final del período de seguimiento siempre
hay individuos en los que no se ha podido observar el evento y, por lo tanto,
se desconoce el tiempo transcurrido hasta su ocurrencia, si bien se tiene una
información parcial sobre él (si es mayor o igual que el tiempo observado).
A este fenómeno se le denomina censura. La función de supervivencia se suele
estimar por el método de Kaplan-Meier, que tiene en cuenta la información
contenida en las censuras, asumiendo, y es importante resaltarlo porque es un
punto crítico para la validez de la estimación, que las censuras son no informa-
tivas o, dicho de otro modo, que los individuos censurados tienen el mismo
riesgo de ocurrencia del evento que los que siguen en observación más allá
de ese tiempo. La importancia de esta asunción es tanto mayor cuanto mayor
sea el número de censuras. Nótese que esta asunción no es trivial y se violaría,
por ejemplo, si los pacientes que abandonan el estudio están más graves, o
menos, que los que continúan o, en otro ejemplo, si el evento fuera progresión
de la enfermedad; la muerte sin progresión seguramente no cumple con esa
asunción. Aunque excede los objetivos de este texto profundizar en ello, hay
que distinguir entre censura (circunstancia que impide la observación del
evento, pero se supone que este ocurrirá en el futuro) y evento competitivo
(circunstancia que impide que el evento ocurra), que requiere un tratamiento
estadístico distinto. La muerte sin progresión en el ejemplo anterior sería mejor
considerarla un evento competitivo que una censura.
La otra forma de expresar el resultado de un estudio sobre factores pro-
nósticos es mediante el RR, HR en inglés, de los pacientes de un nivel del
factor respecto al que se toma como referencia. Es un cociente entre dos
riesgos, por lo tanto, es igual a 1 si en ambos niveles del factor los pacientes
tuvieran el mismo riesgo, es decir, si el factor estudiado no fuera un factor de
riesgo, mayor que 1 si fuera factor de riesgo y menor que 1 si fuera factor
7.  Lectura crítica de estudios de pronóstico. Estudios de cohortes 107

de protección. El riesgo, en estos análisis, se define como la probabilidad


por unidad de tiempo (tasa instantánea de eventos) de que un individuo
que está en observación en el tiempo t tenga el evento justo en ese tiempo,
condicionado a que el evento no ocurrió antes. Puede ser, y de hecho suele
serlo, variable en el tiempo. Sin embargo, el modelo de regresión de Cox,
que es el método usado casi en exclusiva en la investigación clínica (11) para
estimar el RR, asume que, aunque el riesgo pueda variar, el RR es constante.
Esta asunción no siempre se cumple, no se cumpliría, por ejemplo, en un es-
tudio en el que al final del seguimiento a todos los pacientes les haya ocurrido
el evento. Es, por lo tanto, necesario evaluarla. Hay distintos procedimientos
gráficos y estadísticos para hacerlo, pero el más sencillo es la inspección visual
de las curvas de supervivencia. Si se cumple la asunción de RR constante, las
curvas se separan según avanza el tiempo; que las curvas converjan o, en el
caso extremo, se corten es un indicador de que la asunción no se cumple. En
la figura 7-1 se muestran curvas que cumplen la asunción, y en la figura 7-2
curvas que no la cumplen.

PRECISIÓN
Es importante destacar también que los índices citados en el apartado ante-
rior se calculan a partir de muestras, es decir, un subconjunto de los pacientes
de interés en lugar de todos ellos; por tanto, presentan una imprecisión que
se debe cuantificar por el intervalo de confianza (intervalo dentro del cual se
© Elsevier. Fotocopiar sin autorización es un delito.

FIGURA 7-1  Curvas de supervivencia en las que se cumple la asunción de riesgo relativo
constante, o riesgo proporcional. Obsérvese cómo se separan según avanza el tiempo.
108 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA

FIGURA 7-2  Curvas de supervivencia en las que no se cumple la asunción de riesgo relativo
constante. Este sería un caso extremo en el que las curvas llegan a cruzarse, por lo que, para
tiempos menores del punto en el que se cruzan (150 meses), el riesgo de evento para los pacientes
sin ganglios (línea negra) es menor (supervivencia mayor) que para los pacientes con ganglios
(línea naranja); por lo tanto, el riesgo relativo es menor que 1 y, sin embargo, para tiempos mayores
que 150, la relación se invierte y el riesgo relativo es mayor que 1, es decir, no es constante.

puede asegurar, con una probabilidad determinada, habitualmente el 95%,


que se encontraría el índice si se hubieran estudiado todos los pacientes, asu-
miendo que el estudio sea válido). En el caso de las curvas de supervivencia,
la anchura del intervalo de confianza aumenta según avanza el tiempo como
consecuencia de la disminución del número de pacientes. En algunos estudios,
la anchura al final del tiempo de seguimiento es tan grande, aunque con de-
masiada frecuencia no mostrada (11), que se hace difícil la interpretación de la
curva. Una de las razones por las que no siempre se muestran los intervalos de
confianza es que, cuando se presentan varias curvas en la misma gráfica, esta
puede llegar a ser engorrosa. Un modo alternativo de presentar la precisión
en estos casos es incluir debajo del eje del tiempo el número de pacientes que
permanecen en el estudio en cada tiempo. Como ayuda a la interpretación de
cómo afecta este número a la precisión, se puede usar la recomendación
de Pocock et al. (12) de que cuando en cada rama quedan menos del 10-20% de
los pacientes que empezaron el estudio, la precisión de la estimación ya no es
buena. En la figura 7-3 se muestran dos curvas con sus IC 95% y se observa
este aumento de la anchura del intervalo según avanza el tiempo. También
se presenta el número de pacientes que permanece en el estudio.
7.  Lectura crítica de estudios de pronóstico. Estudios de cohortes 109

FIGURA 7-3  Curvas de supervivencia con sus intervalos de confianza al 95% (IC 95%),
en los que se observa el aumento de anchura según avanza el tiempo.

CONFUSIÓN E INTERACCIÓN
La mayor amenaza para el estudio de asociaciones entre variables me-
diante estudios observacionales es la confusión. Existe confusión cuando
© Elsevier. Fotocopiar sin autorización es un delito.

la asociación entre dos variables difiere según que se considere, o no, otra
variable. A esta última variable se le denomina variable de confusión. Para
que una variable sea de confusión debe de estar asociada al factor y a la va-
riable evento. Por ejemplo, en el estudio para la estratificación pronóstica
de pacientes con linfoma esplénico de la zona marginal (3), se encontró que
los pacientes con concentración sérica elevada de la lactato deshidrogenasa
(LDH) tienen un riesgo de muerte por la enfermedad 3,38 veces mayor que
los que no la tienen. Sin embargo, como la supervivencia puede depender no
solo de la LDH, sino también de otras variables, como la edad, o los niveles
de otros componentes sanguíneos, podría ocurrir que, si los pacientes con
niveles altos de LDH fueran también diferentes respecto a esas otras varia-
bles, esa estimación del RR esté equivocada (confundida). En efecto, cuando
se consideran otras variables, el RR de la LDH cambia a 2,47. La manera más
usada y sencilla de controlar la confusión es, como se hizo en ese estudio,
110 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA

mediante modelos de regresión, en los que se incluyen la variable de interés


y las variables de confusión que se quieran considerar. Una medida habitual
para evaluar la confusión es comparar los efectos crudo (sin considerar
otras variables) y ajustado (considerándolas); diferencias mayores del 10%
indican presencia de confusión. Hay que resaltar que la confusión es un
problema crucial cuando se estudian asociaciones causales; por ello, el
diseño óptimo para evaluar el efecto de un tratamiento es el EC, en el que
la asignación aleatoria del tratamiento a los pacientes trata justamente de
evitar su asociación con cualquier otra variable para impedir la confusión;
y se han desarrollado complejos sistemas de análisis (13) para controlar
la confusión en los diseños observacionales de evaluación de efectos de
los tratamientos. Sin embargo, no es tan crítico en estudios de pronóstico,
por ejemplo, cuando se encuentra que el estado civil es un factor pronós-
tico para la supervivencia al cáncer de mama (14) probablemente no se ha
encontrado una asociación causal y hay algún factor, o varios (sicológicos, de
comportamiento…), distinto entre las mujeres casadas y no casadas que es el
causante de la diferencia en mortalidad y que, por lo tanto, sería un factor de
confusión para esa asociación. A pesar de estar probablemente confundida,
la información pronóstica que ofrece ese hallazgo es útil tanto para informar
a los pacientes, como para generar ideas sobre los factores causales.
Otra dificultad que se puede presentar con los resultados de un estudio
de pronóstico es la existencia de interacción o modificación del efecto. Existe
interacción cuando la asociación entre dos variables, en este caso factor y
evento, varía según los diferentes niveles de otra u otras variables. El aná-
lisis más sencillo de interacción se hace mediante el análisis de subgrupos
creados según los niveles de la variable modificadora de efecto. Para ello
hay que evaluar el efecto del factor en las distintas categorías de la variable
modificadora de efecto; por ejemplo, el efecto de la diabetes mellitus (DM)
sobre eventos cardiovasculares puede ser distinto si el paciente ha tenido
o no enfermedad cardiovascular previa (ECV). Si fuera así, el efecto de la
DM debería ser mostrado no como un RR, sino como dos: uno para los
pacientes con ECV previa y otro para los pacientes sin ECV previa (15). Se
dice que hay interacción entre la DM y la ECV, o que la ECV modifica el
efecto de la DM. Esta manera de analizarlo, muy utilizada en EC, presenta
dos dificultades: está restringida a variables modificadoras categóricas, es
decir, no es posible realizarla para variables continuas y no cuantifica es-
tadísticamente si los efectos son distintos. Para evaluar estadísticamente
la interacción entre un factor y una variable modificadora del efecto se
suelen usar modelos de regresión en los que se incluyen como variables
independientes el factor, la variable modificadora y el producto de las dos
anteriores. La significación obtenida para este producto contrasta estadís-
ticamente la interacción entre el factor y la variable. Si existe interacción, el
efecto del factor no es único, sino que será distinto según los valores de la
variable considerada, análogo a la consideración realizada anteriormente
en el caso de análisis de subgrupos. Si la interacción se realiza con una
7.  Lectura crítica de estudios de pronóstico. Estudios de cohortes 111

variable continua, el efecto será distinto según cada valor de la variable.


Una alternativa de presentación podría ser mostrar el efecto del factor
mediante un gráfico en el que en el eje de abscisas se muestre la variable
modificadora y en el eje de ordenadas, el efecto.

UTILIDAD DEL PRONÓSTICO

Como ya se ha señalado, el objetivo de la investigación en factores pronós-


ticos es obtener información que permita informar al paciente y a su entorno
sobre la evolución más probable de la enfermedad y que ayude a la toma
de decisiones sobre la realización de las distintas intervenciones posibles;
también es útil para estratificar pacientes en los EC según su pronóstico
inicial. Por ello, y como también se ha señalado, no es tan crítico como en los
estudios de tratamiento obtener estimadores exentos de confusión, aunque sí
es conveniente controlar por factores pronósticos ya conocidos. En el artículo
citado sobre estado marital y cáncer de mama (14), el RR que se comunica
está ajustado por factores demográficos, de tumor y de tratamiento, para
asegurar que su valor pronóstico se añade al de los otros factores.
Con las técnicas genéticas, se está proponiendo una gran cantidad de
nuevos marcadores pronósticos, de los que conviene evaluar si añaden, y
cuánto, valor pronóstico a los anteriores. Además de la estimación ajustada por
los factores conocidos, se han desarrollado técnicas específicas para hacer esa
evaluación. Una de ellas es el índice de mejoría neta de la reclasificación (NRI)
(16), propuesto para la situación en que a un modelo pronóstico existente se
le añade una nueva variable, pero que no hay inconveniente en aplicarlo a la
comparación de dos modelos distintos, siempre que se puedan aplicar los dos
a los mismos pacientes. Sin entrar en demasiados detalles, el NRI exige estimar
las probabilidades de evento predichas por ambos modelos y clasificar con
ellas a los sujetos en categorías de riesgo. El NRI se define como la diferencia
© Elsevier. Fotocopiar sin autorización es un delito.

de las proporciones de sujetos con evento que «suben» de categoría con el


nuevo modelo (el nuevo modelo les asigna una categoría de mayor riesgo
que el viejo) y los que «bajan» (pasan a una categoría de menor riesgo con el
nuevo modelo), menos esa misma diferencia en los sujetos sin evento. Es decir,
el NRI cuantifica lo que mejora la clasificación para los eventos, descontando
lo que empeora para los no eventos. Es, por tanto, un índice muy intuitivo de
la mejora que el nuevo marcador supone respecto al anterior.

ARTÍCULO

Liu L, Zhang X, Yan B, Gu Q, Zhang X, Jiao J, et al. Elevated Plasma D-


Dimer Levels Correlate with Long Term Survival of Gastric Cancer Patients.
PLoS ONE. 2014; 9:e90547. Disponible en: http://dx.plos.org/10.1371/
journal.pone.0090547.
112 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA

PLANTILLA CASPE CONTESTADA


PARA ESTE ARTÍCULO CONCRETO

En el cuadro 7-1 se muestra la plantilla CASPe contestada para este


artículo concreto.

CUADRO 7-1

E VA L U A C I Ó N C R Í T I C A D E L A R T Í C U L O
PROPUESTO (PLANTILLA CASPE)
A)  ¿Son válidos los resultados?
Preguntas de eliminación
1. ¿Fue una muestra Sí ✓ No sé No
representativa y bien definida Son 247 pacientes con cáncer gástrico
de pacientes en un momento probado patológicamente y sin terapia
similar en el curso de la paliativa previa atendidos en un
enfermedad? hospital de Shanghái entre 2002 y 2004.
PISTAS: Se permitió quimioterapia adyuvante si
– ¿De qué ámbito son los habían pasado más de 6 meses.
pacientes: atención primaria De ellos, 237 recibieron algún
o especializada? tratamiento quirúrgico (168
– ¿En qué punto de su gastrectomía radical, 46 gastrectomía
curso clínico se incluyen en el paliativa y 23 laparotomía exploratoria).
estudio? Después de la cirugía, 50 pacientes
fueron confirmados como diseminación
peritoneal

2. ¿Fue el seguimiento lo Sí ✓ No sé No
suficientemente prolongado Siguen a los pacientes mediante la
y completo? historia del hospital, el Registro de
PISTAS: Cáncer de Shanghái o el contacto con los
– El intervalo temporal entre un familiares.
factor pronóstico y un resultado El tiempo fue definido como el
es variable y puede ser muy intervalo entre la fecha de cirugía y el
largo último seguimiento o muerte debido a
– ¿Se pierden pacientes? ¿Se cáncer gástrico. Los pacientes fueron
investigan sus características? observados hasta el 31/12/2010
En resultados dicen que la mediana de
seguimiento fue 37 meses (1-48)
7.  Lectura crítica de estudios de pronóstico. Estudios de cohortes 113

CUADRO 7-1 (cont.)


Preguntas detalladas
3. ¿Se utilizaron Sí ✓ No sé No
criterios objetivos y Los niveles de dímero-D fueron obtenidos 2 días
no sesgados para los antes de la cirugía con un método de ensayo de
resultados? fluorescencia ligado a enzimas.
PISTA: los resultados a veces Se considera normal valores de dímero-D
son objetivos (p. ej., muerte), menores de 0,5.
otras no tanto (p. ej., calidad El evento principal es muerte relacionada con
de vida). ¿Se valoraron de el cáncer gástrico.
modo «ciego»? No evalúan el riesgo competitivo de muerte, lo
definen como censura.
Se considera más robusto utilizar muerte por
cualquier causa.
El punto de corte óptimo, un valor de 1.465,
fue calculado basado en la curva ROC. No se
dice qué método se ha utilizado para decir que es
mejor (maximizar sensibilidad, especificidad, la
suma…)

4. ¿Se hizo un ajuste Sí No sé No ✓


por los factores No dan detalle de qué variables analizaron.
pronósticos En la tabla 5 del artículo original se muestra el
importantes? resultado de los factores pronósticos univariables,
PISTA: en muchos estudios pero no nos dicen si fueron evaluadas otras
de pronóstico el grupo variables.
de pacientes se divide en El modelo final lo componen el estadio (T1,
subgrupos de factores T2, T3, T4), las metástasis de nodos linfáticos, el
© Elsevier. Fotocopiar sin autorización es un delito.

pronósticos (o tratamientos) tamaño del tumor (< o > 5 cm), la diseminación


sospechados. Si se hizo esto, peritoneal y el dímero-D con el punto de corte de
¿se controlaron por otros 1.465.
factores? Nota que todas las variables son significativas
y que no hacen mención a la posible existencia de
interacción o confusión, aunque en el texto dicen,
en la página 6, que el HR es 3,86 al comienzo del
párrafo y después dicen 2,28, que coincide con el
HR del modelo multivariable

(Continúa)
114 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA

CUADRO 7-1 (cont.)


B)  ¿Cuáles son los resultados?
5. ¿Cuál es la Se presenta mediante curva de supervivencia por
probabilidad del(los) el método de Kaplan-Meier y nos dan la mediana
evento(s) en un de supervivencia.
período de tiempo En los pacientes con niveles de dímero-D bajos,
determinado? la mediana es 48,02 (43,8; 52,3) frente a 22,9 (17,5;
PISTAS: 28,4) en pacientes con dímero-D > 1.465
– La probabilidad varía En términos de HR, es 2,28 (1,36; 3,81)
en el tiempo
– ¿Se presentan
«curvas de
supervivencia»?
– ¿Se presentan para
los distintos factores
pronósticos?
6. ¿Cuán precisas son (v. pregunta 5.)
las estimaciones? Se debería añadir el intervalo de confianza de las
PISTA: ¿se dan los curvas o individuos en riesgo en los gráficos de la
intervalos de confianza? figura 4 del artículo original

C)  ¿Son los resultados aplicables en tu medio?


7. ¿Son los pacientes Sí No sé ✓ No
del estudio similares Carmen es mujer (representan el 33%), con
a los míos? una edad media similar a la del estudio y con
PISTA: considera si: un estadiaje inicial de la enfermedad bien
– Los pacientes del representado entre los sujetos del estudio. Sin
estudio pueden ser embargo, es importante destacar que el estudio
suficientemente está realizado en sujetos asiáticos y no se sabe bien
diferentes de los de si podría existir alguna variabilidad genética en la
tu área síntesis de dímero-D relacionada con la raza
– Tu medio parece ser
muy diferente al del
estudio
7.  Lectura crítica de estudios de pronóstico. Estudios de cohortes 115

CUADRO 7-1 (cont.)

8. ¿Conducen los Sí ✓ No sé No
resultados a Los autores sugieren que podría ser de gran ayuda
seleccionar o a evitar para predecir la diseminación y la supervivencia
un tratamiento? a medio plazo. En el caso de Carmen, si
decidimos que el factor racial no supone una
enorme diferencia, podría ayudarla a contemplar
un tratamiento menos agresivo y con menos
probabilidad de muerte a 4 años

9. ¿Son útiles los Sí ✓ No


resultados para En el caso de Carmen, aunque no determinante,
tranquilizar o permite predecir una probabilidad de
aconsejar a los supervivencia aproximada (a partir de la gráfica,
pacientes? teniendo solo en cuenta el resultado de la prueba)
a 1 año del 90% y a 2 del 70%, y esta información
podría ayuda a Carmen a decidir mejor sobre su
futuro próximo y el de su negocio
HR, hazard ratio; ROC, receiver operador characteristic.

Bibliografía
1. Hemingway H, Croft P, Perel P, Hayden JA, Abrams K, Timmis A, et al. Prognosis re-
search strategy (PROGRESS) 1: A framework for researching clinical outcomes. BMJ.
2013;346:e5595.
2. Krumholz HMM, Wang YP, Chen JM, Drye EEMS, Spertus JAM, Ross JSMM, et al. Re-
© Elsevier. Fotocopiar sin autorización es un delito.

duction in Acute Myocardial Infarction Mortality in the United States: Risk-Standardized


Mortality Rates From 1995-2006. JAMA. 2009;302:767-773.
3. Montalbán C, Abraira V, Arcaini L, Domingo-Domenech E, Guisado-Vasco P, Iannito E,
et al. Risk stratification for Splenic Marginal Zone Lymphoma based on haemoglobin
concentration, platelet count, high lactate dehydrogenase level and extrahilar lymphade-
nopathy: development and validation on 593 cases. Br J Haematol. 2012;159:164-171.
4. Liu L, Zhang X, Yan B, Gu Q, Zhang X, Jiao J, et al. Elevated Plasma D-Dimer Levels Co-
rrelate with Long Term Survival of Gastric Cancer Patients. PLoS ONE. 2014;9:e90547.
5. Steyerberg EW, Moons KG, van der Windt DA, Hayden JA, Perel P, Schroter S, et al.
Prognosis Research Strategy (PROGRESS) 3: Prognostic model research. PLoS Med.
2013;10:e1001381.
6. Semeraro F, Parrinello G, Cancarini A, Pasquini L, Zarra E, Cimino A, et al. Predicting
the risk of diabetic retinopathy in type 2 diabetic patients. J Diabetes Complications.
2011;25:292-297.
7. Chen H, Bai M, Qi X, Liu L, He C, Yin Z, et al. Child-Na score: a predictive model for
survival in cirrhotic patients with symptomatic portal hypertension treated with TIPS.
PLoS ONE. 2013;8:e79637.
116 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA

8. Hingorani AD, Windt DA, Riley RD, Abrams K, Moons KG, Steyerberg EW, et al. Prognosis
research strategy (PROGRESS) 4: Stratified medicine research. BMJ. 2013;346:e5793.
9. Paula AR, Jerry HG, Kathy S, Muhammad M, David LS, Susan G, et al. Reader’s guide to
critical appraisal of cohort studies: 1. Role and design. BMJ. 2005;330:895-897.
10. U.S. Department of Health and Human Services Food and Drug Administration. Guidance
for Industry. Clinical Trail Endpoints for the Approval of Cancer Drugs and Biologics.
2007 [Visitado el 08/09/2014]. Disponible en: http://www.fda.gov/downloads/drugs-
GuidanceComplianceRegulatoyInformation/Guidance/UCM071590.pdf.
11. Abraira V, Muriel A, Emparanza JI, Pijoán JI, Royuela A, Plana MN, et al. Reporting quality
of survival analyses in medical journals still needs improvement. A minimal requirements
proposal. J Clin Epidemiol. 2013;66:1340-1346.
12. Pocock SJ, Clayton TC, Altman DG. Survival plots of time-to-event outcomes in clinical
trials: good practice and pitfalls. Lancet. 2002;359:1686-1689.
13. Muriel A, Hernández D, Abraira V. Modelos estructurales marginales: una herramienta
útil que proporciona evidencia a los estudios observacionales. Nefrología. 2011;2(Supl
Ext):7-13.
14. Aizer AA, Chen MH, McCarthy EP, Mendu ML, Koo S, Wilhite TJ, et al. Marital status and
survival in patients with cancer. J Clin Oncol. 2013;31:3869-3876.
15. Becker A, Bos Gt, de Vegt F, Kostense PJ, Dekker JM, Nijpels G, et al. Cardiovascu-
lar events in type 2 diabetes: comparison with nondiabetic individuals without and
with prior cardiovascular disease: 10-year follow-up of the Hoorn Study. Eur Heart J.
2003;24:1406-1413.
16. Pencina MJ, D’Agostino RB, Steyerberg EW. Extensions of net reclassification improvement
calculations to measure usefulness of new biomarkers. Stat Med. 2011;30:11-21.

Cómo citar este capítulo:


Abraira V, Muriel A, Montes ML. Lectura crítica de estudios de pronóstico: estudios de
cohortes. En: Cabello Juan B, editor. Lectura crítica de la evidencia clínica. Barcelona: Elsevier;
2015. p. 101-116.

También podría gustarte