Está en la página 1de 13

Tema 5.

Regresión de Cox 11/03/19


Néstor Sánchez Maria Ripoll

TEMA 5: REGRESIÓN DE COX


Índice:

Análisis de supervivencia
1 Variable de interés
2 Requisitos análisis de supervivencia
3 Características de variables “tiempo entre dos eventos”
3.1 Asimetría
3.2 Censura
3.3 Truncamiento
4 Partes del análisis de supervivencia
4.1 Análisis univariado
4.2 Análisis bivariado
4.3 Análisis multivariado
5. Ventajas de Cox
6. Requisitos Cox
7. Interpretación regresión de Cox
8. Confusión en Cox

Análisis de supervivencia
El análisis de supervivencia es una herramienta imprescindible para la epidemiología. Aunque se siga denominando
“análisis de supervivencia”, no siempre se mira la supervivencia de los individuos, sino que se puede mirar cualquier
tipo de evento.

La gran diferencia entre la regresión de Cox y los demás modelos de regresión (linear o logístico) es que en Cox se
tiene en cuenta el tiempo del evento (el tiempo transcurrido hasta la aparición de un suceso), en cambio los demás
modelos hacían la predicción del evento según las variables explicativas en un momento puntual.

Se mira el tiempo que pasa hasta el evento.


Ejemplos:

Tiempo des de una intervención hasta la muerte.


Tiempo des del alta hasta la re hospitalización.
Tiempo des de la cirugía hasta la recaída.

1. Variable de interés
En las demás regresiones (análisis de correlación) teníamos las variables independientes (dieta, tabaco, ejercicio…)
y esto nos daba la relación con una variable dependiente (infarto agudo de miocardio).
(En regresión logística o linear solo interesa si aparece o no el evento).

Y (Variable respuesta, dependiente, evento): Infarto agudo de miocardio.


B0: Valor basal.
B1 (variable explicativa o independiente): Dieta.
B2: Ejercicio.

1
DR
Tema 5. Regresión de Cox 11/03/19
Néstor Sánchez Maria Ripoll

En el caso de los análisis de supervivencia se


añade el tiempo hasta el evento.
Por ejemplo el tiempo que ha pasado hasta que un individuo ha tenido un infarto agudo de miocardio.

El desenlace de interés (variable dependiente o evento) no es una cantidad numérica ni una cualidad
dicotómica (Sí/No) sino la combinación de ambas cosas:

1. La variable categórica es una variable dicotómica e indica si se ha producido o no el evento (infarto agudo de
miocardio, etc).
2. La variable numérica indica cuánto tiempo ha pasado hasta que se ha producido el evento (desenlace).

En las variables explicativas (independientes) siempre vamos a tener una continua que es el tiempo y las
variables de la exposición (dieta, tabaco, etc).

*Expresión matemática del modelo de Cox: (No necesario saber)

En este modelo se expresa la función de riesgo instantáneo del evento (variable dependiente) (lambda) en
función del tiempo (t) y de las variables independientes X1, … , Xn).

: Riesgo base (Riesgo de aparición del evento cuando todas las variables explicativas tienen valor 0). Es
la única expresión que depende del tiempo.

2. Requisitos para disponer de los datos adecuados para un análisis de


supervivencia:
- Definir el origen o inicio de seguimiento.
- Definir la escala del tiempo (meses, años…)  Depende del evento estudiado. (En gripe se definiría la
escala en días).
- Definir el evento.

2
DR
Tema 5. Regresión de Cox 11/03/19
Néstor Sánchez Maria Ripoll

3. Características entre las variables “tiempo entre dos eventos”:


3.1 Asimetría. El tiempo es unidireccional. La distribución del tiempo es siempre asimétrica porque
tendrás más gente en el inicio del estudio que en el final.

Ni la media, desviación típica, ni distribución normal pueden resumir bien el tiempo de supervivencia.

Esta asimetría puede complicar el modelo y la predicción.


(a diferencia por ejemplo del colesterol que puede disminuir o aumentar y puede seguir una distribución
normal).

3.2 Censura: Ocurre cuando no vemos el evento.

Los datos censurados afectan al cálculo del análisis de supervivencia porque no sabremos cuál es la
supervivencia de los que se pierden durante el estudio (tal vez fuera del estudio fallecen) o tal vez los
que están vivos al final del estudio, cuando este finaliza, fallecen. Por lo tanto, los datos censurados
son todos aquellos que no presentan el evento (fallecimiento, aparición enfermedad, etc) durante el
estudio de supervivencia.

El tiempo exacto hasta que ocurre el evento no se observa porque:

- La persona ha desarrollado el evento antes de entrar en el estudio. (No se sabe el tiempo


transcurrido entre la exposición y el evento)
- Se finaliza el estudio sin que el evento haya ocurrido. (Puede que ocurra más tarde).
- La persona ha abandonado el estudio (podría haber desarrollado el evento fuera del estudio, pero
no lo podemos observar).

En un estudio se suele marcar un inicio y un final en el tiempo de seguimiento, para observar los
eventos en su totalidad (sin censuras) requeriría un largo período y restaría actualidad y valor
científico a los resultados obtenidos.

3
DR
Tema 5. Regresión de Cox 11/03/19
Néstor Sánchez Maria Ripoll

Hay que tener en cuenta estos datos censurados al hacer el estudio de supervivencia.

Los sujetos 1 y 6 finaliza el estudio sin


presentar el evento de interés y lo desarrolla
cuando ya no le seguimos (censura).

El sujeto 4 abandona el estudio y puede ser


que desarrolle el evento de interés, pero no
lo observamos (censura).

3.3 Truncamiento: Es una condición cuyo efecto es filtrar la presencia de ciertos individuos de forma
que el investigador no sabe de su existencia.
Es decir que el truncamiento tiene lugar cuando sólo se observa una parte de los individuos que
presentan la característica estudiada y del resto no se realiza ningún seguimiento, y por lo tanto no se
obtiene información sobre ellos.

Ocurre cuando por ejemplo se miran personas a partir de los 65 años para analizar la esperanza de
vida a partir de esa edad. Como muestra escoges un geriátrico. El problema es que no todas esas
personas entran en el geriátrico cuando tienen 65 años, es decir que hay personas que ya tienen 65
años y que no han entrado, o que han fallecido antes de los 65 años, por lo que no se ha podido
obtener información de esas personas y el estudio se ve truncado ya que no se sabe de la existencia
de personas que aportarían información al estudio.

- Truncamiento por la izquierda (entrada tardía en el estudio)

Existe cuando es necesario que el individuo tenga una exposición concreta (edad >65 años) para
que sea considerado en el estudio. Sucede si se empieza observar al sujeto posteriormente a la
exposición (tener 65 años).

4
DR
Tema 5. Regresión de Cox 11/03/19
Néstor Sánchez Maria Ripoll

** Si se coge el tiempo de referencia inicial los 65 años, no todos empezarán el estudio con 65
años por lo que habrá un truncamiento por la izquierda.

- Truncamiento por la derecha

Solo se observa a los individuos que presentan la exposición o el evento de interés (65 años).

TIPOS DE OBSERVACIONES

Cuatro posibles tipos de individuos que se pueden encontrar en estudios de supervivencia:

No truncada, no censurada: Sería el ejemplo de un estudio que coge al individuo con 65 años (I; exposición) y
llega a observar a lo largo del tiempo cómo llega a desarrollar el evento dentro del estudio.

No truncada, censurada: El estudio coge al individuo con 65 años (exposición) pero el estudio finaliza antes de
que se haya podido observar el evento (dato censurado).

Truncada, no censurada: El estudio coge a un individuo mayor de 65 años (ya presentaba la exposición –
truncado a la izquierda-) y se llega a ver en el estudio cómo desarrolla el evento.

Truncada, censurada: Se empieza a observar al sujeto posteriormente a la exposición (mayor de 65 años –


truncado a la izquierda-) y no se llega a ver el evento antes de que finalice el tiempo de seguimiento (dato
censurado)

5
DR
Tema 5. Regresión de Cox 11/03/19
Néstor Sánchez Maria Ripoll

4. Tres partes del análisis de superviviencia:

4.1 Análisis univariado (Estadística descriptiva): Medidas de centralización y dispersión. Se


describe una variable (el riesgo de que te suceda un evento) a lo largo del tiempo, no se compara nada.

Se usan tablas de Kaplan-Meier, estadísticos de supervivencia y gráficos.

Es la descripción y resumen de los tiempos de vida a partir de la estimación e interpretación de las


funciones de supervivencia y de riesgo. Estos análisis también permiten predecir el comportamiento
futuro de pacientes con características similares.

Eje x: Tiempo
Eje y: Supervivencia (0-1.0)

Las funciones de supervivencia y de riesgo son inversamente proporcionales. Cuando el riesgo es mayor, la
supervivencia disminuye.

Kaplan-Meier es un estimador que indica la supervivencia media en cada momento del individuo. Al
principio del estudio (t=0, supervivencia = 1.0) están todos los individuos y poco a poco van ocurriendo
eventos que hacen disminuir la supervivencia a medida que va avanzando el tiempo. La supervivencia
nunca se incrementa.
El estimador de supervivencia indica la probabilidad de estar vivo en un momento determinado. (La
estimación de supervivencia en el tiempo 30 es de 0.11 aproximadamente, 11% de probabilidad de estar
vivo en ese momento, es decir, la probabilidad de que no te haya pasado el evento).

Función riesgo: Al principio nadie está en riesgo y a medida que va pasando el tiempo el riesgo aumenta.
Es la probabilidad de que te pase el evento a lo largo del tiempo. Puede tener diferentes distribuciones
según el evento, por ejemplo en la gripe el riesgo aumenta durante el invierno.

6
DR
Tema 5. Regresión de Cox 11/03/19
Néstor Sánchez Maria Ripoll

Intervalo de confianza de la función de supervivencia

La función de supervivencia puede calcularse cada


instante y indica la probabilidad de que un paciente
sobreviva al evento.

En esta gráfica se puede estimar la probabilidad de


supervivencia en un instante concreto con un 95% de
confianza (habrá un margen de error del 5% en la
estimación).

Intervalo de confianza de la función


de riesgo

Riesgo acumulado: A lo largo del estudio cómo va


aumentando el riesgo (mientras supervivencia
disminuye).

Riesgo no acumulado: El riesgo de que te pase el


evento en cada momento concreto. (Por ejemplo
una forma de pico para la gripe en invierno).

La función de riesgo puede tener diferentes distribuciones.


La forma de bañera es muy típica de vida humana. A medida que van pasando los años, el riesgo de morir
aumenta.

4.2 Análisis bivariado (Comparativa, regresión logística ): Se comparan dos grupos y se analiza
si se distribuyen de forma diferente, es decir, si las funciones de supervivencia difieren desde un
punto de vista estadístico.
Para hacer la comparación se usan diversas pruebas estadísticas con contraste de hipótesis (permite
obtener p-valor).
La prueba estadística más usada es log-rank (test de riesgos proporcionales) que permite comparar las
distribuciones de supervivencia entre dos muestras y se basa en el modelo de Chi cuadrado.

7
DR
Tema 5. Regresión de Cox 11/03/19
Néstor Sánchez Maria Ripoll

4.3 Análisis Multivariado (Explicativa):

Se añade más variables y se describe, se compara y se explica. Medidas de dependencia, centralización,


dispersión entre las variables independientes y la dependiente. (Ejemplo: Nube de puntos).
Se usa para identificar, evaluar la relación (si las variables explicativas son significativas en relación al
evento o no con un p-valor y IC 95%) y predecir un evento de interés según las variables explicativas
(predictores).

La regresión de Cox es el modelo más usado en el análisis multivariado del análisis de supervivencia para
evaluar variables dependientes (dicotómica) del tipo “tiempo hasta un suceso o evento”, y es el
equivalente en análisis de la supervivencia al modelo de regresión lineal y guarda reminiscencias con una
regresión logística de las tasas de riesgo (tiene en cuenta el tiempo).

En el caso de la estimación de supervivencia, el modelo de regresión de Cox también permite predecir las
probabilidades de supervivencia (permanencia libre del evento concreto) para un determinado sujeto
según el patrón de valores que presenten sus variables pronósticas, es decir según si tiene o no los factores
de riesgo que predicen el desarrollo del evento.

Se pueden analizar las posibles interacción y confusiones: Se ajusta por diferentes variables confusoras. Se
varían las variables y se observa la variación del riesgo (modelar).

La interpretación de una regresión de Cox es muy parecida a la de la regresión logística pero difiere en
algunos aspectos:

- La regresión logística el parámetro de asociación que se obtiene es la odds ratio (log de odds
ratio), en cambio en la regresión de Cox se obtiene un riesgo.
- No se trata sólo de saber el efecto sobre la supervivencia a un tiempo determinado (por ejemplo,
supervivencia a los 5 años –regresión logística mira solo a términos finales y no lo que pasa
entremedio-), sino de valorar cuál es el efecto sobre la función de supervivencia (a lo largo de
todo el periodo, sea cual sea el punto temporal que se elija).
Si sólo interesase estudiar el efecto sobre la supervivencia en un punto del tiempo (por ejemplo, a
los 5 años), entonces bastaría con un análisis de regresión logística, porque la variable de
respuesta sería dicotómica (sí sobreviven o no sobreviven).

Si al final del estudio haces regresión logística, te va a


dar mismo valor supervivencia (ex: 55%). Lo que te
indica la regresión logística es que el tratamiento A y el
tratamiento B no tienen diferencias (a nivel totalitario;
en un punto determinado, de los dos grupos llegan
vivos la mitad, pero induce a error ya que no considera
la tasa instantánea).

5. Ventajas de Cox:
- Sólo la regresión de Cox permite afirmar que una supervivencia más ventajosa puede ser
atribuida a un determinado tratamiento. (Por la función de supervivencia)

8
DR
Tema 5. Regresión de Cox 11/03/19
Néstor Sánchez Maria Ripoll

- Por ejemplo, comprueba que, a igualdad de edad, sexo, estadio tumoral, etc, los pacientes que
fueron tratados con trasplante hepático sobrevivieron más en cualquier punto posible dentro del
seguimiento que ha existido en el estudio.

*(info extra) En general en la modelización (linear, logística, cox..) la idea central es comparar dos perfiles
controlando las variables confusoras y analizando las variables explicativas de interés manteniendo
constantes las demás. De esta manera se puede observar la interacción entre dos medicamentos, o si una
variable está confundiendo.

Hazard Ratio: División de riesgos.


(Cox lo que hace es hacer las divisiones de riesgo, pero añadiendo más variables y te da un hazard ratio
conforme al perfil que le estás dando
–multivariado-, y se contraponen dos perfiles –grupo A, grupo B-).

- “hazard”  Tasa instantánea () (riesgo en un momento dado de tener el evento).


Se obtiene un riesgo, pero se puede deducir la supervivencia ya que están estrechamente
relacionados (inversamente proporcionales). A partir de una fórmula matemática se puede
convertir de uno al otro de manera directa.
Se comparan dos grupos y como es instantáneo, se mira en un momento concreto.

Cox hace un Hazard riesgo proporcional  el riesgo será diferente en cada instante. Cuando se
modera con Cox, te busca un riesgo que más o menos es estable a lo largo del tiempo, es decir
que hace un promedio ponderando la HR de los diversos momentos en los que se produce un
evento (a los 2 años, 4, etc) porque como ha sucedido un evento, el riesgo varía). Es como si se
hicieran muchas regresiones logísticas, una para cada momento que se observa una muerte.

Si miramos a los 2 años, el individuo 1 no consta en el estudio (ha abandonado el estudio –dato
censurado-). Cuando calculamos el riesgo instantáneo a los 2 años , no tenemos en cuenta
a este individuo.

Ejemplo cálculo del hazard (grupo a)

1 muerto (a los 2 años)

Total a riesgo: 5 individuos (No se cuenta el que ha


abandonado el estudio al año y medio porque no se
puede observar –dato censurado- )

9
DR
Tema 5. Regresión de Cox 11/03/19
Néstor Sánchez Maria Ripoll

Cálculo del Hazard ratio a los 2 años (HR): (Cálculo no sale en el examen)

Interpretación: El grupo b tiene una mortalidad 1,67


veces mayor (67% superior) que el grupo a. (A los dos
años, tasa instantánea)

6. Requisitos Cox:

- El suceso debe ser irreversible. (Solo cuenta si ha tenido el evento. Por ejemplo, si tiene la gripe,
ya no se tiene en cuenta cuando se recupera como sujeto sano).
- Debe ocurrir una sola vez (No se mira si ha tenido el evento dos veces)

10
DR
Tema 5. Regresión de Cox 11/03/19
Néstor Sánchez Maria Ripoll

- La censura no informativa: La persona que pierdes (abandona el estudio, muere, etc), el motivo
de su pérdida no debe estar relacionada con el evento estudiado.
- Cox asume que existe cierta constancia o proporcionalidad entre las razones de riesgo (Hazard) a
lo largo del tiempo del estudio.
A este supuesto se le llama proporcionalidad de los Hazards.
Si a los 3 meses el hazard de un grupo es el doble que el del otro, en los otros momentos del
tiempo también habrá una HR (razón) aproximadamente igual a 2.
En estas dos funciones de supervivencia y riesgo se puede observar la proporcionalidad.

En estos casos la razón de riesgo cambia de una mitad a otra del seguimiento. Se tendría que calcular la hazard
ratio de la primera mitad y la hazard ratio de la segunda y comparar.

7. Interpretación de una regresión de Cox:

(SPSS)

11
DR
Tema 5. Regresión de Cox 11/03/19
Néstor Sánchez Maria Ripoll

Los resultados son muy parecidos a los de una regresión logística. La diferencia es que en “Exp(B)” no es una odds ratio
sino que es una Hazard ratio (quita el logaritmo y se hace una transfomación de Beta con la exponencial para que tenga
la medida que tenía anteriormente, es decir que le saca el logaritmo para hacer la interpretación más intuitiva), y
corresponde a la hazard ratio global (promedio ponderado que calcula Cox).

Las variables estarían en donde pone “grupo”.


Expo(B) = 1,234  Significa que tiene un 23,4% más un grupo que el otro. (división de tasas instantáneas).
Variable grupo: B (beta) de 0,2.
ET (pruebas de significación): 0,765  Si ET>0,05 no es significativo. (Intervalo de confianza de esta Beta contiene el 0 y
por lo tanto no me está explicando el evento).
Gl (grado de libertad): 1

Como ET da no significativo, la diferencia observada en Expo(B) (Hazard ratio) del 23,4% se debe al azar. Si se debiera a
otras causas, saldría significativo.

Puntos a tener en cuenta:

RR no es lo mismo que HR
RR= 0,5 en un año significa que el riesgo de que el paciente muera antes de acabar el año es la mitad con el tratamiento
que con el control. (No tiene en cuenta el tiempo en el que se producen los sucesos).

HR (ponderada con Cox)= 0,5 implica que en cualquier momento del año, ya que es un promedio, el riesgo de morir de
un paciente es la mitad con el tratamiento que con el control. El tiempo es absolutamente decisivo.

8. Confusión en Cox

Exp(B) (HR): 1,892.


ET: 0,146 (Significativo)

Cuando estratificamos por edad y no solo por tratamiento, vemos que era una variable confusora porque ya no da
significativo.

12
DR
Tema 5. Regresión de Cox 11/03/19
Néstor Sánchez Maria Ripoll

13
DR

También podría gustarte