Documentos de Académico
Documentos de Profesional
Documentos de Cultura
NOCIONES DE ESTADISTICA
PARA FARMACOLOGIA CLINICA
Esta guía tiene la única pretensión de ser un material de consulta básico sobre
determinados conocimientos estadísticos que son requeridos para la interpretación
de la bibliografía que se emplea como material didáctico durante la cursada de la
materia Farmacología Clínica. Teniendo en cuenta que el conocimiento estadístico
que el alumno puede poseer acerca del temario a tratar excede las exigencias de
un curso de grado, fue la intención en la elaboración de esta guía el hacer un
abordaje lo más sencillo posible de dicho temario tratando de evitar tener que dar
sustento a las explicaciones con demostraciones que requieran un conocimiento y
un manejo matemático de mayor profundidad. Sería nuestra mayor gratificación
que este apunte sirviera para estimular al alumno a profundizar no solo en estos,
sino en todos los aspectos que abarcan a la Farmacología Clínica.
PARTE II
“Utiliza la estadística como un borracho las farolas: como apoyo en vez de como fuente de luz”.
(Andrew Lang, 1844-1912)
ES ( =
• La desviación estándar (s) es una medida de la dispersión de los datos. Cuanto mayor sea la
dispersión, mayor es la desviación estándar, mientras que el error estándar de la media cuantifica
las oscilaciones de la media muestral alrededor de la media poblacional.
• La desviación estándar es un índice para usar cuando se pretende describir la variabilidad de una
variable continua en una muestra.
• El error estándar de la media se debe usar cuando se pretende cuantificar el error cometido al
estimar la media poblacional mediante la media muestral.
Ahora debemos determinar a cuántos errores estándares está del origen o ventro
de la curva esa diferencia; o lo que es lo mismo, cuál es para esa diferencia el
error relativo:
una excreción igualmente más alta. Puesto que la curva normal es simétrica, esta
probabilidad será justamente igual a la que acabamos de calcular. La suma 0.0548
+ 0.0548 = 0.1096 indicará, por lo tanto, la probabilidad que los valores medios de
dos muestras extraídas al azar de un mismo universo difieran en los gramos de
nitrógeno excretados tanto o más de lo que difieren las dos muestras
consideradas.
Esta probabilidad se representa comúnmente con la letra p, de modo que en este
caso tenemos un p = 0.1096. La interpretación correspondiente a este valor de p
es la siguiente: sobre cada 100 operaciones de extracción de pares de muestras al
azar de un mismo universo, en 11 veces aproximadamente, los valores medios
diferirán en 0.71 g o más. Puesto que esto ocurrirá más bien frecuentemente, no
hay evidencias suficientes sino para inferir que estas muestras de estos dos
grupos etarios distintos no son otra cosa que muestras al azar de un mismo
universo.
En el caso de este ensayo debe tenerse en cuenta que la diferencia de edad entre
los dos grupos estudiados era poca ya que eran estudiantes del primer año de
Medicina.
Si en vez de tomar dos grupos seleccionados por edad se toman dos grupos
seleccionados por peso, o sea que contengan a los 30 estudiantes más pesados y
a los 30 estudiantes más livianos, los resultados ahora son los siguientes:
Para los 30 estudiantes más pesados la media es de 8.48 g de nitrógeno y el error
estándar correspondiente es 0.39 g de nitrógeno. Para los 30 estudiantes más
livianos la media es de 6.71 g de nitrógeno y el error estándar es 0.25 g de
nitrógeno.
Diferencia de medias = 1.78 g
Error estándar de la diferencia de medias = 0.45
En este caso el error relativo es 1.78/0.45 = 3.87
Ahora, consultando la tabla (curva) de distribución normal el valor p que se
determina es p = 2 (0.5-0.49995) = 0.0001
Este resultado indica que por cada 10.000 pares de muestras extraídas al azar en
un mismo universo, en solo 1, de acuerdo con las fluctuaciones estadísticas, debe
esperarse una diferencia en los valores medios igual o mayor que la observada en
la muestra en estudio.
Como se ve la ocurrencia de esta diferencia es altamente improbable, entonces se
concluye que las dos muestras no eran muestras al azar de un mismo universo
sino que, por el contrario, eran muestras de alguna manera “seleccionadas”.
Finalmente, puesto que las muestras fueron seleccionadas de acuerdo con el
peso, puede afirmarse que las mismas indican la existencia de una relación entre
el peso y la excreción de nitrógeno. Esta conclusión podría expresarse de otra
forma diciendo que las dos muestras representan dos sub-universos diferentes: el
de las personas pesadas y el de las personar livianas, y que estos dos sub-
universos son significativamente distintos en cuanto a la excreción de nitrógeno en
orina.
Las diferencias observadas entre ambos grupos entonces, no fueron producto del
azar.
Debemos observar que el tamaño de la muestra sobre la cual se basan las
proporciones influyen en la significación de las diferencias, pues el valor:
diferencia de medias/error estándar de la diferencia será menor cuando se trate de
una muestra grande.
existe esa diferencia, sino tan sólo de que no puede descartarse la posibilidad de
que exista dicha diferencia, en especial en aquellos estudios en que se han
incluido pocos individuos.
La utilidad del valor p reside en que es una medida de la influencia del AZAR en la
posible asociación entre las variables analizadas; este azar debe ser siempre
contemplado, evaluado y cuantificado mediante el valor de p. El valor p NO es un
indicador de fuerza de asociación entre variables, ni de su importancia. Los
valores de “p” deben ser considerados solo como una guía y no como base de
conclusiones definitivas e irrevocables. Antes de tomar decisiones o cambiar
conductas clínicas basadas en un “valor de p”, se ha de considerar también la
VALIDEZ EXTERNA (generalización de los resultados obtenidos en ese estudio
particular respecto de la población inicial) y, si esas conclusiones pueden ser
extrapoladas a otros pacientes considerados o a otra realidad laboral (que pueden
ser distintas a la descrita en el estudio publicado y contemplado por nosotros). Por
todo ello, más apropiado que hablar de “SIGNIFICACIÓN ESTADÍSTICA” resulta
más correcto utilizar el concepto de “RELEVANCIA CLÍNICA”; porque la relevancia
clínica de un fenómeno va más allá de cálculos matemáticos y depende de…
1. La gravedad del problema,
2. La morbilidad y mortalidad generada por el mismo,
3. La magnitud de la diferencia,
4. La vulnerabilidad,
5. Los costes involucrados, etc.
Relative Risk =
Función de supervivencia
S(tj) es la probabilidad de estar vivo en el tiempo tj, que se calcula a partir de S (tj-1)
que representa la probabilidad de estar vivo en tj-1; y utilizando nj que es el
número de pacientes vivos justo antes de tj; y dj que es el número de eventos
ocurridos en tj. En esta ecuación t0 = 0 y S(t0) = 1 (Probabilidad de supervivencia a
t0 = 1).
Función de riesgo
ANALISIS DE SUPERVIVENCIA
En muchos estudios, especialmente los relacionados con el cáncer, la variable
principal que se pretende valorar suele ser el tiempo que transcurre hasta la
ocurrencia de un suceso. A este tiempo, normalmente se le llama “supervivencia”,
aunque el suceso en cuestión no tiene por qué ser necesariamente la defunción.
La supervivencia puede entenderse como el tiempo que transcurre hasta que
sucede un “evento” de interés: recaída, alta médica, manifestación de los primeros
síntomas de una determinada enfermedad, etc. Cuando se trata de enfermedades
graves, el análisis de supervivencia deriva en la estimación de probabilidades de
mantenerse con vida durante determinados períodos de tiempo, logrando así
información del grado de severidad de la enfermedad, algo que a menudo se
desconoce.
Por lo tanto, el análisis de la supervivencia es una técnica muy apropiada para
analizar respuestas binarias (sí/no; fallecido/vivo) en estudios longitudinales o de
seguimiento que se caractericen por:
1- Duración variable del seguimiento: los estudios de seguimiento tienen fechas
muy bien definidas de inicio y de cierre, pero los sujetos se incorporan al estudio
en distintos momentos. En general, los sujetos son incorporados progresivamente
al estudio, de manera que la fecha de entrada, que marca el comienzo del
seguimiento del sujeto, no coincide con la fecha de inicio del estudio. Los sujetos
son seguidos de forma periódica. Las últimas noticias, que marcan el final del
seguimiento, proporcionan la fecha de la última observación y el estado “di” del
sujeto que, si el “evento” a considerar es la muerte del sujeto, puede ser “muerto”
(di=1) si el “evento” se ha producido o “vivo” (di=O) en caso contrario. La
diferencia respecto a la fecha de entrada es el tiempo de participación ti del sujeto
que se llama tiempo de supervivencia si el estado del sujeto es “muerto”. Si el
estado es “vivo” se trata de un tiempo incompleto (tiempo “censurado”) que aporta
una información parcial sobre su tiempo de supervivencia pero que es también
utilizado para estimar las probabilidades de supervivencia. Estas observaciones
reciben el nombre de observaciones incompletas por la derecha o simplemente
observaciones incompletas. El hecho de fijar una fecha de cierre del estudio
produce observaciones incompletas de tipo aleatorio (random censoring). Se trata
de los sujetos “retirados vivos”, es decir, de los sujetos que han sido seguidos
regularmente y que en el momento de la última observación programada (que
coincide aproximadamente con la fecha de cierre) aún no se ha producido el
acontecimiento terminal.
2- Observaciones incompletas: las técnicas de análisis de la supervivencia, a
diferencia de las técnicas estadísticas clásicas, están especialmente diseñadas
para la variable dependiente tiempo de supervivencia, cuyas medidas se obtienen
a partir de seguimientos de duración variable y se caracterizan por la existencia de
tiempos incompletos. En la fecha de cierre del estudio puede que aún no se haya
producido el evento de interés (recidiva, recaída, muerte, etc.) en ciertos sujetos.
Asimismo, a lo largo del estudio se puede perder el contacto con algunos sujetos
(sujetos perdidos) por cambio de lugar de residencia, muerte por causas no
relacionadas con la investigación, o simplemente porque han debido ser retirados
del estudio por diferentes motivos. Estas observaciones “incompletas” dan lugar a
lo que se llama “datos censurados”, y el análisis de supervivencia se caracteriza
por incluir la información que aportan estos datos. Aunque los tiempos incompletos
generados por los sujetos perdidos intervienen en el análisis de la misma manera
que los generados por los sujetos retirados vivos, conviene distinguir estas dos
Tiempo
Tiempo de supervivencia (D)
Método de Kaplan-Meier
Dicho método calcula la supervivencia cada vez que un paciente experimenta el
evento, generando las probabilidades en cada momento. Las probabilidades de
supervivencia se calculan a partir del número de pacientes en riesgo justo en el
momento de producirse el evento. Más que los valores concretos de probabilidad,
lo que debe centrar el interés del investigador a la hora de interpretar los
resultados es la tendencia observada en la curva y su inclinación, que informa de
la aceleración que experimenta el tiempo con relación a la probabilidad de
supervivencia del paciente.
EJEMPLO
Supongamos un estudio clínico en el que se comparan dos tratamientos,
tratamiento 0 (convencional) y tratamiento 1(experimental), contra un determinado
tipo de cáncer. A los 10 años se analiza cuántos de los pacientes tratados de una
forma u otra han presentado metástasis y cuántos no la han presentado. En cada
tratamiento, de los 20 pacientes tratados, a los 10 años, 10 pacientes presentan
metástasis y 10 no.
Pacientes Tratamiento 0 10 10
Pacientes Tratamiento 1 10 10
Esto daría un Odds ratio (OR) de 1. Sin más perspectiva temporal que esta, no
habría ventaja de un tratamiento respecto del otro. El Odds ratio es una mirada a
una relación en un momento temporal, prescindiendo de lo que ha pasado en el
recorrido hasta llegar allí. Es una mirada estática. El Hazard ratio (HR) es, por el
contrario, una mirada dinámica, es una mirada al recorrido, es una relación entre
recorridos. Diferentes estudios pueden tener un mismo OR pero HR muy
diferentes como se verá en este ejemplo.
Analicemos ahora la información no al finalizar los 10 años, sino durante los 10
años. Veamos el recorrido de cada tratamiento durante esos 10 años.
Supongamos que las 10 metástasis de cada grupo de tratamiento se producen a
lo largo de estos años según uno de los tres patrones distintos A, B, y C que se
muestran a continuación:
Tratamiento 0: 1, 2, 2, 3, 3, 4, 4, 5, 7, 8
Tratamiento 1: 1, 1, 2, 3, 4, 4, 4, 5, 7, 9
HR = 0,98 ( 1)
Tratamiento 0: 1, 2, 2, 3, 3, 4, 4, 5, 7, 8
Tratamiento 1: 3, 5, 6, 7, 7, 8, 9, 9, 9, 9
HR = 0,77
Tratamiento 0: 3, 5, 6, 7, 7, 8, 9, 9, 9, 9
Tratamiento 1: 1, 2, 2, 3, 3, 4, 4, 5, 7, 8
HR = 1,30
Censurado
Situación A
KAPLAN- MEIER
Tabla de supervivencia
Proporción acumulada que sobrevive
hasta el momento
Nº de eventos Nº de casos que
Tratamiento Tiempo Estado Estimación Error típico acumulados permanecen
2 2,000 1 . . 2 18
6 4,000 1 . . 6 14
11 10,000 0 . . 10 9
12 10,000 0 . . 10 8
13 10,000 0 . . 10 7
14 10,000 0 . . 10 6
15 10,000 0 . . 10 5
16 10,000 0 . . 10 4
17 10,000 0 . . 10 3
18 10,000 0 . . 10 2
19 10,000 0 . . 10 1
20 10,000 0 . . 10 0
1 1 1,000 1 . . 1 19
5 4,000 1 . . 5 15
6 4,000 1 . . 6 14
11 10,000 0 . . 10 9
12 10,000 0 . . 10 8
13 10,000 0 . . 10 7
14 10,000 0 . . 10 6
15 10,000 0 . . 10 5
16 10,000 0 . . 10 4
17 10,000 0 . . 10 3
18 10,000 0 . . 10 2
19 10,000 0 . . 10 1
20 10,000 0 . . 10 0
Comparaciones globales
Chi-cuadrado gl Sig.
Tratamiento 0
Tiempo de Prob. supervivencia Probabilidad de
supervivencia
Metástasis Pacientes en riesgo supervivencia
Pk=Pk-1[(rk-fk)/rk]
(años)
0 0 20 P0= 1 1,00
1 1 19 P1= 1 x [(20-1)/20] 0,95
2 2 17 P2= 0,95 x [(19-2)/19] 0,85
3 2 15 P3= 0,85 x [(17-2)/17] 0,75
4 2 13 P4= 0,75 x [(15-2)/15] 0,65
5 1 12 P5= 0,65 x [(13-1)/13] 0,60
6 0 12 P6= 0,60 x [(12-0)/12] 0,60
7 1 11 P7= 0,60 x [(12-1)/12] 0,55
8 0 10 P8= 0,55 x [(11-1)/11] 0,50
9 0 10 P9= 0,50 x [(10-0)/10] 0,50
10 0 10 P10= 0,50 0,50
Tratamiento 1
Tiempo de Prob. supervivencia Probabilidad de
supervivencia
Metástasis Pacientes en riesgo supervivencia
Pk=Pk-1[(rk-fk)/rk]
(años)
0 0 20 P0= 1 1,00
1 2 18 P1= 1 x [(20-2)/20] 0,90
2 1 17 P2= 0,90 x [(18-1)/18] 0,85
3 1 16 P3= 0,85 x [(17-1)/17] 0,80
4 3 13 P4= 0,80 x [(16-3)/16] 0,65
5 1 12 P5= 0,65 x [(13-1)/13] 0,60
6 0 12 P6= 0,60 x [(12-0)/12] 0,60
7 1 11 P7= 0,60 x [(12-1)/12] 0,55
8 1 10 P8= 0,55 x [(11-1)/11] 0,50
9 0 0 P9= 0,50 x [(10-0)/10] 0,50
10 0 0 P10= 0,50 0,50
REGRESION DE COX
Global (puntuación) Cambio desde el paso anterior Cambio desde el bloque anterior
Variables en la ecuación
Situación B
KAPLAN-MEIER
Tabla de supervivencia
2 2,000 1 . . 2 18
4 3,000 1 . . 4 16
11 10,000 0 . . 10 9
12 10,000 0 . . 10 8
13 10,000 0 . . 10 7
14 10,000 0 . . 10 6
15 10,000 0 . . 10 5
16 10,000 0 . . 10 4
17 10,000 0 . . 10 3
18 10,000 0 . . 10 2
19 10,000 0 . . 10 1
20 10,000 0 . . 10 0
1 1 3,000 1 ,950 ,049 1 19
4 7,000 1 . . 4 16
7 9,000 1 . . 7 13
8 9,000 1 . . 8 12
9 9,000 1 . . 9 11
11 10,000 0 . . 10 9
12 10,000 0 . . 10 8
13 10,000 0 . . 10 7
14 10,000 0 . . 10 6
15 10,000 0 . . 10 5
16 10,000 0 . . 10 4
17 10,000 0 . . 10 3
18 10,000 0 . . 10 2
19 10,000 0 . . 10 1
20 10,000 0 . . 10 0
Comparaciones globales
Chi-cuadrado gl Sig.
Tratamiento 0
Prob. supervivencia Supervivencia
Tiempo de supervivencia Metástasis Pacientes en riesgo
(años) Pk=Pk-1[(rk-fk)/rk] acumulada
0 0 20 P0=1 1,00
1 1 19 P1= 1 x [(20-1)/20] 0,95
2 2 17 P2= 0,95 x [(19-2)/19] 0,85
3 2 15 P3= 0,85 x [(17-2)/17] 0,75
4 2 13 P4= 0,75 x [(15-2)/15] 0,65
5 1 12 P5= 0,65 x [(13-1)/13] 0,60
6 0 12 P6= 0,60 x [(12-0)/12] 0,60
7 1 11 P7= 0,60 x [(12-1)/12] 0,55
8 0 10 P8= 0,55 x [(11-1)/11] 0,50
9 0 0 P9= 0,50 x [(10-0)/10] 0,50
10 0 0 P10= 0,50 x [(10-0)/10] 0,50
Tratamiento 1
Prob. supervivencia Supervivencia
Tiempo de supervivencia Metástasis Pacientes en riesgo
(años) Pk=Pk-1[(rk-fk)/rk] acumulada
0 0 20 P0=1 1,00
1 0 20 P1=1 1,00
2 0 20 P2=1 1,00
3 1 19 P3= 1 x [(20-1)/20] 0,95
4 0 19 P4= 0,95 x [(19)/19] 0,95
5 1 18 P5= 0,95 x [(19-1)/19] 0,90
6 1 17 P6= 0,90 x [(18-1)/18] 0,85
7 2 15 P7=0,85 x [(17-2)/17] 0,75
8 1 14 P8= 0,75 x (15-1)/15] 0,70
9 4 10 P9= 0,70 x (14-4)/14] 0,50
10 0 10 P10= 0,50 x (10-0)/10] 0,50
REGRESION DE COX
Pruebas omnibus sobre los coeficientes del modeloa
-2 log de la Global (puntuación) Cambio desde el paso anterior Cambio desde el bloque anterior
Variables en la ecuación
En C los perfiles de los dos tratamientos también son muy distintos. Pero ahora
ocurre justo todo lo contrario (observemos que los datos son los mismos que en B
pero invertidos). El tratamiento 1 tiene ahora mayor riesgo que el tratamiento 0. El
HR (Tto 1/Tto 0) es ahora 1,30.
Situación C
KAPLAN MEIER
Tabla de supervivencia
4 7,000 1 . . 4 16
7 9,000 1 . . 7 13
8 9,000 1 . . 8 12
9 9,000 1 . . 9 11
11 10,000 0 . . 10 9
12 10,000 0 . . 10 8
13 10,000 0 . . 10 7
14 10,000 0 . . 10 6
15 10,000 0 . . 10 5
16 10,000 0 . . 10 4
17 10,000 0 . . 10 3
18 10,000 0 . . 10 2
19 10,000 0 . . 10 1
20 10,000 0 . . 10 0
1 1 1,000 1 ,950 ,049 1 19
2 2,000 1 . . 2 18
4 3,000 1 . . 4 16
6 4,000 1 . . 6 14
11 10,000 0 . . 10 9
12 10,000 0 . . 10 8
13 10,000 0 . . 10 7
14 10,000 0 . . 10 6
15 10,000 0 . . 10 5
16 10,000 0 . . 10 4
17 10,000 0 . . 10 3
18 10,000 0 . . 10 2
19 10,000 0 . . 10 1
20 10,000 0 . . 10 0
Comparaciones globales
Chi-cuadrado gl Sig.
Tratamiento 0
Prob. supervivencia Supervivencia
Tiempo de supervivencia Metástasis Pacientes en riesgo
(años) Pk=Pk-1[(rk-fk)/rk] acumulada
0 0 20 P0=1 1,00
1 0 20 P1= 1 1,00
2 0 20 P2= 1 1,00
3 1 19 P3= 1 x [(20-1)/20] 0,95
4 0 19 P4= 0,95 x [19/19] 0,95
5 1 18 P5= 0,95 x [(19-1)/19] 0,90
6 1 17 P6= 0,90 x [(18-1)/18] 0,85
7 2 15 P7= 0,85 x [(17-2)/17] 0,75
8 1 14 P8= 0,75 x [(15-1)/15] 0,70
9 4 10 P9= 0,70 x [(14-4)/14] 0,50
10 0 10 P10= 0,50 x [10/10] 0,50
Tratamiento 1
Prob. supervivencia Supervivencia
Tiempo de supervivencia Metástasis Pacientes en riesgo
(años) Pk=Pk-1[(rk-fk)/rk] acumulada
0 0 20 P0=1 1,00
1 1 19 P1= 1 x [(20-1)/20] 0,95
2 2 17 P2= 0,95 x [(19-2)/19] 0,85
3 2 15 P3= 0,85 x [(17-2)/17] 0,75
4 2 13 P4= 0,75 x [(15-2)/15] 0,65
5 1 12 P5= 0,65 x [(13-1)/13] 0,60
6 0 12 P6= 0,60 x [(12-0)/12] 0,60
7 1 11 P7= 0,60 x [(12-1)/12] 0,55
8 0 10 P8= 0,55 x [(11-1)/11] 0,50
9 0 10 P9= 0,50 x [(10-0)/10] 0,50
10 0 10 P10= 0,50 0,50
REGRESION DE COX
Pruebas omnibus sobre los coeficientes del modeloa
Global (puntuación) Cambio desde el paso anterior Cambio desde el bloque anterior
-2 log de la
verosimilitud Chi-cuadrado gl Sig. Chi-cuadrado gl Sig. Chi-cuadrado gl Sig.
Variables en la ecuación
El HR, por lo tanto, cuantifica la posición relativa de una función de riesgo respecto
de la otra. Es un cociente de funciones. Tiene en cuenta no el final de un recorrido
sino la dinámica de ese recorrido. Esto es un elemento claramente diferencial
respecto del OR que mira las cosas en un punto estático.
REGRESION LOGISTICA
Los datos de seguimiento de un ensayo clínico podrían analizarse usando un
modelo de regresión logística, que es uno de los procedimientos estadísticos
más empleados en medicina. Este método está indicado cuando se desea conocer
cómo una serie de factores influyen en una respuesta que está medida como
variable categórica dicotómica, es decir, con 2 posibilidades, como sería por
ejemplo: desarrollar o no desarrollar una neoplasia gástrica. Las variables que son
candidatas a predecir la aparición de un fenómeno se utilizarían como variables
independientes en un modelo de regresión logística (por ejemplo, en el caso de
desarrollo de una neoplasia gástrica un predictor o variable independiente podría
ser el grado de consumo de un conservante x). Una limitación que presenta
muchas veces la regresión logística es que no tiene en cuenta cuánto tiempo ha
tardado cada sujeto en desarrollar el efecto de interés (la neoplasia gástrica, en
nuestro ejemplo), pues sólo considera si se ha desarrollado o no este efecto, sin
importar el cuándo. Si se supiese el tiempo exacto en que cada sujeto desarrolla el
evento y, como es lógico y esperable, estos tiempos fuesen distintos de un sujeto
a otro, no sería óptimo utilizar una regresión logística, porque ésta no tiene en
cuenta el tiempo que tarda en desarrollarse el evento. Otro aspecto que debe
tenerse en cuenta es que la regresión logística, en vez de calcular el “relative risk”
(RR), estima los Odds ratios (OR). Si el OR = 1, esto significa que la cantidad de
veces que el evento ocurre ante la presencia de otra variable vs. las veces que
ocurre en ausencia de esa variable, es 1:1, que es lo mismo que decir que
aparecerá tantas veces cuando la variable esté presente como cuando la variable
no se presente.
En un estudio de cohortes la interpretación del OR es similar al del RR, pero el OR
tiende a alejarse más del valor nulo (1) tanto para valores inferiores a 1 (serán
inferiores con el OR más que con el RR) como para valores superiores a 1 (serán
superiores con el OR más que con el RR). Sólo cuando el riesgo global de la
enfermedad sea bajo (< 10%) la diferencia entre RR y OR puede considerarse
insignificante, pero si el riesgo absoluto de la enfermedad es alto, el OR puede
suponer una gran exageración del RR.
Regresión de Cox
La regresión de Cox (proportional hazards model) es, en muchos aspectos,
bastante similar a la regresión logística. Sin embargo, a diferencia de la regresión
logística, la regresión de Cox, además de considerar si se produce o no un
desenlace o efecto, tiene en cuenta el tiempo que ha tardado en producirse. Su
uso está indicado cuando la variable dependiente (el efecto o desenlace) sea de
tipo dicotómico (sí o no) y esté relacionada con la supervivencia de un grupo de
sujetos o, en general, con el tiempo que transcurre hasta que se produce en ellos
el suceso o evento.
El modelo de Cox es el enfoque multivariado más comúnmente utilizado para el
análisis de los datos de tiempo de sobrevida en la investigación clínica. Se basa
en la suposición de que los riesgos permanecen proporcionalmente constantes por
lo que se denomina más correctamente como “Modelo de riesgos proporcionales
de Cox” (Cox proportional hazards model). Matemáticamente, el modelo de Cox se
expresa por la siguiente ecuación:
ver(*1)
donde,
t es la función de riesgo (Hazard)
es el valor de una constante que especifica el riesgo basal, en ausencia de
cualquier factor o variable explicativa
Xn son las diferentes variables explicativas cuyo efecto pretende probarse
n son los pesos o coeficientes de regresión estimados para cada variable
explicativa
BIBLIOGRAFIA
- Clark TG, Bradburn MJ, Love SB, Altman DG. Survival analysis part I: basic
concepts and first analysis. Br J Cancer 2003; 89: 232–238.
- Bradburn MJ, Clark TG, Love SB, Altman DG. Survival analysis part II:
Multivariate data analysis – an introduction to concepts and methods. Br J Cancer
2003; 89: 431–436.