Está en la página 1de 2

S-PLUS en los estudios de supervivencia

Guadalupe Gómez, Carles Serrat y Klaus Langohr

Introducción
El análisis de la supervivencia comprende un conjunto de procedimientos estadísticos para analizar datos para
los cuales la variable respuesta mide el tiempo entre dos sucesos. Entre otros, estos procedimientos se aplican en
aquellos ensayos clínicos en los que la variable respuesta mide el tiempo transcurrido entre el inicio del
tratamiento y un cierto suceso tal como la remisión de un cáncer, la recuperación de un transplante de corazón, o
la muerte debida al SIDA. Las siguientes tres características convierten este tipo de análisis en una disciplina per
se: la presencia de observaciones censuradas, la no normalidad de las variables y el desarrollo de modelos
semiparamétricos. La censura se produce como consecuencia de que las respuestas son tiempos que se miden
secuencialmente. Cualquier variable puede en general medirse instantáneamente, sin embargo, en supervivencia
las observaciones grandes tardan más tiempo en medirse que las pequeñas. Por ejemplo, si el suceso de interés es
la muerte, todos aquellos individuos vivos al finalizar el estudio contribuyen una información parcial sobre la
realización del suceso, a saber, que el tiempo hasta el mismo excede el período observado. Esta falta de
información acarrea problemas técnicos considerables. La mayoría de los métodos usados en análisis de
supervivencia presuponen que los individuos censurados están sujetos a la misma probabilidad de muerte que los
que permanecen en el estudio. Ésta es la llamada condición de no informatividad. Los objetivos básicos en los
estudios de supervivencia son los siguientes: la descripción y resumen de los tiempos de vida, usualmente a
partir de la estimación e interpretación de las funciones de supervivencia y riesgo, la comparación de las
distribuciones de los tiempos de supervivencia correspondientes a dos poblaciones (tratamientos) y el
establecimiento y comprensión de la relación que pueda existir entre los tiempos de vida y las variables
explicativas.
Técnicas de análisis de supervivencia y S-PLUS
S-PLUS proporciona las funciones que permiten realizar los análisis citados en los objetivos del párrafo anterior.
La función Surv(tiempo, censura) identifica la variable tiempo como un tiempo de supervivencia y la
variable censura como el indicador de censura asociado. Los estimadores no paramétricos de Kaplan y Meier
y de Fleming-Harrington se pueden obtener con la función survfit, permitiendo, a su vez, estimar las
varianzas según la fórmula de Greenwood y de Tsiatis. Esta función permite también la estimación de la función
de supervivencia para cada grupo y en todos los casos el objeto resultante incluye la información necesaria para
la obtención de gráficos asociados (véase el ejemplo en el apartado siguiente). Para la comparación de curvas de
supervivencia se utiliza la función survdiff que implementa las pruebas de hipótesis de la familia Gρ de
Fleming y Harrington (por defecto ρ = 0 estima la prueba log-rank o de Mantel-Haenszel). El enfoque
paramétrico, vía maximización de la verosimilitud, también es posible con la función survReg la cuál,
después de una transformación de los datos iniciales, ajusta los nuevos datos según un modelo lineal general.
Para estudiar la relación entre las variables explicativas y los tiempos de fallo, sin asumir un modelo
paramétrico, se propone la estimación semiparamétrica del modelo de Cox o modelo de riesgos proporcionales
(coxph). El estimador permite calcular los efectos de las covariantes y el correspondiente riesgo relativo de
cada categoría con respecto de la categoría de referencia. Los resultados obtenidos permiten la comparación
entre modelos anidados y la determinación de la mejora significativa en la incorporación sucesiva de
covariantes. Para el desarrollo de nuevas técnicas en análisis de la supervivencia, S-PLUS también facilita las
herramientas de programación para la implementación de nuevas funciones y librerías que, aprovechando de
antemano el potencial de las existentes, permitan el uso de nuevas metodologías.
Ejemplo
En el siguiente ejemplo los datos provienen de un estudio sobre el cáncer de boca, en el cuál se ha comparado la
supervivencia de dos grupos: uno con un perfil diploid de ADN y otro con un perfil aneuploid (Klein y
Moeschberger, 1997). Con las siguientes instrucciones de S-PLUS obtenemos, por un lado, el gráfico que
muestra las curvas de supervivencia según el estimador de Kaplan-Meier para ambos grupos y, por otro lado, la
comparación de ambas curvas utilizando la prueba de log-rank. Se puede ver que la mejor supervivencia para el
grupo con el perfil de ADN aneuploid según el grafico no resulta significativa al nivel de 95% (p>0.05):
> survobj<-survfit(Surv(time,cens)~treat) F u n cio n e s d e S u p e rv ive n cia

> plot(survobj,axes=F,xlab="Semanas", 1 .0

ylab="Supervivencia",lty=1:2) 0 .9
P e rfil d e A D N a ne u plo id
P e rfil d e A D N d ip lo id
0 .8
> axis(1,at=seq(0,400,25)) 0 .7

S u p ervive n cia
> axis(2,at=seq(0,1,0.1)) 0 .6

> title("Funciones de Supervivencia") 0 .5

0 .4

> legend(200,0.9,c("Perfil de ADN aneuploid", 0 .3

0 .2
"Perfil de ADN diploid"),lty=1:2) 0 .1

0 .0

0 25 50 75 1 00 1 25 1 50 1 75 2 00 2 25 2 50 2 75 3 00 3 25 3 50 3 75 4 00
S e m an a s

> survdiff(Surv(time,cens)~treat)
survdiff(formula = Surv(time, cens) ~ treat)

N Observed Expected (O-E)^2/E (O-E)^2/V


treat=1 52 31 36.6 0.843 2.79
treat=2 28 22 16.4 1.873 2.79

Chisq= 2.8 on 1 degrees of freedom, p=0.0949

Bibliografía
[1] Everitt, B.S. (2002). A Handbook of Statistical Analyses using S-Plus. Chapman & Hall/CRC Press. 2nd.
Edition.
[2] Klein, J.P. and Moeschberger, M.L. (1997). Survival Analysis. Techniques for Censored and Truncated Data.
Springer-Verlag
[3] Venables, W.N. and Ripley, B.D. (1999) Modern Applied Statistics with S-PLUS. Springer-Verlag.

También podría gustarte