Documentos de Académico
Documentos de Profesional
Documentos de Cultura
archivoPDF PDF
archivoPDF PDF
la regresión de Cox
Alfonso Luis Palmer Pol y Jose Maria Losilla Vidal
El tercer aspecto fundamental del modelo consiste en estudiar los modelos que pueden
utilizarse para representar los efectos de un conjunto de variables explicativas sobre la variable
tiempo de supervivencia. Suponemos así que para cada sujeto tenemos un vector de variables
explicativas o concomitantes. Las componentes de dicho vector pueden representar tratamientos,
propiedades intrínsecas de los sujetos o variables exógenas.
Por otra parte dichas variables pueden ser clasificadas como dependientes o independientes
del tiempo.
En el análisis de datos de supervivencia hay dos familias de modelos que han sido
extensamente usados:
En el modelo de vida acelerado ('accelerated life model') la relación entre la función de
supervivencia para dos grupos (codificados por 1,0) viene determinada por una constante k tal
que
En el modelo de azar proporcional ('proportional hazards model') se utiliza la función de azar
de manera que
donde h(t) es el valor de la función de riesgo para un individuo con vector concomitante x, h o(t)
es una función arbitraria de azar de linea base y B es un vector de coeficientes de regresión
desconocidos que parametrizan el modelo.
El modelo presupone, en primer lugar, una relación multiplicativa entre la función arbitraria
de azar y la función log-lineal de las covariates. Estees el denominado supuesto de proporcionalidad
según el cual el ratio de azar es constante, para todo par de observaciones, en cualquier instante
t. Asimismo, presupone un efecto log-lineal de las covariates sobre la función de azar, es decir
que las covariates actúan sobre la función de azar de forma multiplicativa
Una ventaja fundamental de la formulación de Cox radica en el hecho que puede realizarse
una inferencia de los efectos de la información concomitante sin conocer la forma de la
distribución de supervivencia.
A partir de la ecuación [11 dividiendo ambos miembros por h0(t) y tomando logaritmos
neperianos obtenemos:
[21
En la ecuación [2], h0(t) representa el valor de la función de azar para cada individuo cuando todas
las variables independientes toman el valor nulo. En la ecuación [3], h0(t) representa el valor de
la función de azar cuando todas las variables independientes toman su valor promedio. Así pues
el ratio de azar o índice pronóstico representa el ratio de riesgo de cambio para un sujeto con
valores pronóstico x l ,....,xn, respecto a un sujeto con valores pronóstico promedio para todas las
variables (lo que Adolphe Quetelet definió en 1835 como "el hombre promedio").
Los parámetros del modelo de Cox no pueden ser estimados por el método de máxima
verosimilitud al ser desconocida la forma específica de la función arbitraria de azar.
Cox (1975) propuso un método de estimación denominado verosimilitud parcial siendo las
verosimilitudes condicionales y marginales casos particulares del anterior.
El método de verosimilitud parcial se diferencia del método de verosimilitud ordinario en el
sentido de que mientras el método ordinario se basa en el producto de las verosimilitudes para
todos los individuos de la muestra, el método parcial se basa en el producto de las verosimilitudes
de todos los sucesos ocurridos.
Para estimar los coeficientes B en el modelo de Cox, en ausencia de conocimiento de h0(t),
éste propuso la siguiente función de verosimilitud:
[4]
Esta expresión L(B) no es una verdadera función de verosimilitud ya que no puede derivarse
como la probabilidad de algún resultado observado bajo el modelo de estudio, si bien, como
indica Cox (1975), puede tratarse como una función de verosimilitud ordinaria a efectos de
realizar estimaciones de B.
Dichas estimaciones son consistentes (Cox, 1975; Tsiatis, 1981) y eficientes (Efron, 1977).
La estimación de los parámetros Bj puede realizarse por medio del método de regresión
stepwise donde el orden de entrada de cada variable viene determinado por hacer máximo el valor
del logaritmo de la función de verosimilitud LL(Bj).
La primera variable x 1 en la ecuación será aquella tal que LL(B 1) maximiza la función
LL(Bj). La segunda variable x2 incluída en la ecuación será aquella variable de las p-1 restantes
cuyo valor LL(B 1,B2) es máximo.
El proceso de inclusión continúa hasta que la inclusión de una variable k ya no produce un
incremento significativo.
Pruebas de hipótesis del modelo
Una vez obtenida la expresión de verosimilitud parcial para el problema de estudio ésta se
resuelve como si fuera una expresión de verosimilitud ordinaria completa. Para ello se calcula
el vector de puntuaciones o vector de primeras derivadas determinado por:
El vector U(B) tiene media=0 y matriz de covariancias I(B) denominada matriz de información
esperada o de Fisher, cuyos elementos vienen dados por:
se distribuye asintóticamente según una distribución de ji- cuadrado con k (número de covariates
en el modelo) grados de libertad.
Este resultado permite probar la hipótesis nula según la cual el vector B de coeficientes de
regresión es un vector nulo.
Los coeficientes de regresión indican la relación existente entre la covariate correspondiente y
la función de azar. Un valor positivo del coeficiente supone un aumento en el valor de la función
de azar para el sujeto, lo que conlleva una relación negativa con el tiempo de supervivencia. Un
coeficiente negativo tiene una interpretación opuesta a la explicada.
Estratificación
El modelo de azar proporcional requiere que para todo par de individuos en cualquier instante
t el ratio entre sus tasas de azar sea constante:
donde i,j son dos individuos y la constante c puede depender de variables explicativas pero no
del tiempo.
Cuando tengamos un factor que produce funciones de azar que difieren significativamente
de la proporcionalidad en sus diferentes niveles, la estrategia a seguir (Kalbfleisch, Prentice,
1980) consiste en definir una función de azar para cada uno de los k niveles del factor:
para j= 1,2,._k. Las funciones de azar de linea base h o,(t) son arbitrarias y no están relacionadas
entre sí, mientras que los coeficientes de regresión son iguales para todos los estratos.
Referencias
COX, D.R. (1972). Regression models and life-tables. Journal of the Royal Statistical Society,
Series B 34, 187-202.
COX, D.R. (1975). Partial likelihood. Biometrika 62, 269-276.
EFRON, B. (1977). The efficiency of Cox's likelihood function for censored data. Journal of the
American Statistical Association 72, 557-565.
KALBFLEISCH, J.D.- PRENTICE, R.L. (1980). The statistical analysis offailure time data.
N.Y.: John Wiley and Sons.
PALMER, A. (1988). Análisis de la supervivencia. Barcelona: Universidad Autónoma de
Barcelona.
TSIATIS, A. (1981). A large sample study of Cox's regression model. Annals of Statistics 9, 93-
108.