Nociones de Estadistica Ii

FARMACOLOGÍA CLÍNICA
NOCIONES DE ESTADISTICA
PARA FARMACOLOGIA CLINICA
Cátedra de Farmacología, Facultad de Farmacia y Bioquímica, UBA

Esta guía tiene la única pretensión de ser un material de consulta básico sobre
determinados conocimientos estadísticos que son requeridos para la interpretación
de la bibliografía que se emplea como material didáctico durante la cursada de la
materia Farmacología Clínica. Teniendo en cuenta que el conocimiento estadístico
que el alumno puede poseer acerca del temario a tratar excede las exigencias de
un curso de grado, fue la intención en la elaboración de esta guía el hacer un
abordaje lo más sencillo posible de dicho temario tratando de evitar tener que dar
sustento a las explicaciones con demostraciones que requieran un conocimiento y
un manejo matemático de mayor profundidad. Sería nuestra mayor gratificación
que este apunte sirviera para estimular al alumno a profundizar no solo en estos,
sino en todos los aspectos que abarcan a la Farmacología Clínica.

PARTE II
Autores: Bioq. Esteban Otamendi

Farm. Carlos Paván

“Utiliza la estadística como un borracho las farolas: como apoyo en vez de como fuente de luz”.
(Andrew Lang, 1844-1912)
NIVEL DE SIGNIFICACION ESTADISTICA
Un “test de hipótesis” es un procedimiento que permite decidir, controlando cierto

riesgo, la veracidad o falsedad de hipótesis referentes a una población,
examinando una muestra aleatoria de ella.
Dada una hipótesis estadística, existe siempre otra complementaria, de modo que,
si una es verdadera la otra es falsa. A una la llamamos “hipótesis nula” (H 0) y a la
otra “hipótesis alternativa” (H1) (hipótesis nula: plantea una diferencia nula entre el
valor observado y el especificado, o entre el muestral respecto del poblacional).
Para plantear estas hipótesis se utilizan parámetros poblacionales (cuyos valores
se desconocen porque para ello deberíamos considerar toda la población de
observaciones, lo cual es imposible). Tomando una muestra aleatoria se estiman
estos parámetros, y se decide si la hipótesis nula (H0) es verdadera o falsa. Esta
decisión puede ser correcta o incorrecta y se plantean cuatro casos posibles.
1- H0 es verdadera y nosotros, basándonos en la muestra, decidimos que H 0 es
verdadera  decisión correcta.
2- H0 es verdadera y, basándonos en la muestra, decidimos que H0 es falsa 
decisión incorrecta, esto se denomina “error de tipo I”.
3- H0 es falsa y decidimos que H0 es falsa  decisión correcta.
4- H0 es falsa y, basándonos en la muestra, decidimos que H 0 es verdadera 
decisión incorrecta, esto se denomina “error de tipo II”
Rechazar H0 es equivalente a decir que H0 es falsa y, por lo tanto, H1 es verdadera.
En la investigación biomédica el método de inferencia tradicionalmente más
utilizado ha sido la formulación inicial de una hipótesis (hipótesis nula H0) que
tratamos de refutar con los datos recogidos mediante el uso de pruebas
estadísticas de significación o de intervalos de confianza. En el caso de un ensayo
clínico diseñado para comparar la eficacia clínica de dos tratamientos A y B,
expresada en términos de diferencias, la hipótesis nula H0 se puede formular de la
siguiente manera:

H0 :”Toda diferencia observable entre la eficacia de ambos tratamientos es debida

simplemente al azar o a la variabilidad biológica, ya que el efecto de los
tratamientos en estudio no difiere sustancialmente de uno a otro”.
Con los datos que recogemos en el ensayo y mediante la aplicación de pruebas
estadísticas de significación (pruebas que cuantifican la fuerza de la evidencia en
contra de dicha hipótesis en términos de probabilidad) pretendemos rechazar H 0 y
en consecuencia aceptar la hipótesis alternativa H1. En este caso la hipótesis
alternativa podría formularse como: H1:”Además de la variabilidad biológica, los
dos grupos estudiados difieren también en otro factor o característica, que es
precisamente el efecto del tratamiento en estudio”.
Si la diferencia observada es consistente y, a la vez, demasiado grande para ser
explicable simplemente por la variabilidad biológica y el azar, se habla de
diferencia estadísticamente significativa y se expresa en términos de la
probabilidad que existe de que, si H0 es cierta, se observe una diferencia como
mínimo tan grande como la observada. Esta probabilidad se mide con el valor p o
nivel de significación estadística. Cuanto menor sea este valor más fuerte será la
evidencia en contra de H0. Entonces se denomina nivel de significación de un
test de hipótesis a la probabilidad de cometer error de tipo I o sea la probabilidad
de rechazar H0 siendo verdadera. El nivel de significación (nivel ) se establece de
manera arbitraria en 0,05 o 0,01 y determinará cuanta evidencia en contra de H 0
se aceptará como decisiva para rechazarla. Un valor de p inferior a este valor
significa una baja probabilidad de que la diferencia observada entre los
tratamientos sea debida al azar, y por lo tanto permite rechazar la hipótesis nula.
Cuanto menor sea el valor p, más significativo será el resultado.
Así, se suele decir que valores altos de p no permiten rechazar la hipótesis nula
H0 mientras que valores bajos de p rechazan H0.
Un valor p inferior al nivel de significación nos indica que lo más probable es que
la hipótesis nula sea falsa. Sin embargo, también es posible que estemos ante una
observación atípica, por lo que estaríamos cometiendo el error estadístico de
rechazar la hipótesis nula cuando ésta es cierta basándonos en que hemos tenido
la mala suerte de encontrar una observación atípica. Este tipo de errores es

subsanable rebajando el valor p; un valor p de 0,05 es usado habitualmente en

investigaciones sociológicas mientras que valores p de 0,01 se pueden utilizar en
investigaciones médicas, en las que cometer un error puede acarrear
consecuencias graves. También se puede tratar de subsanar dicho error
aumentando el tamaño de la muestra obtenida, lo que reduce la posibilidad de que
el dato obtenido sea casualmente raro.
Veamos un ejemplo numérico para visualizar más ampliamente el concepto de
significación estadística:
De todo lo anteriormente dicho, con respecto a la utilización del valor p, se puede
inferir que una de las pruebas más importantes que derivan del análisis estadístico
es la de establecer si la diferencia entre valores medios de dos muestras es lo
suficientemente grande como para justificar la conclusión de que las muestras
representan dos universos diferentes.
En algunos problemas los límites de seguridad para las verdaderas medias de las
dos muestras son tan acentuadamente diferentes que no hay lugar a dudas, en la
mente del analista, de que las muestras representan universos diferentes. Sin
embargo, en la mayoría de los casos los intervalos de seguridad para las dos
muestras se superponen y es difícil extraer conclusiones. Por esta razón, debe
desarrollarse un método para determinar si la probabilidad de una diferencia
encontrada durante la extracción /o el análisis de muestras de un mismo universo
(en el caso de la investigación clínica, un grupo de pacientes que presentan las
mismas condiciones, tratamientos, etc.) sea o no estadísticamente significativa.
Las diferencias de los valores medios de pares de grandes muestras (
extraídas de un mismo universo tendrán una distribución aproximadamente
normal. La media de esta distribución será cero; y, para muestras independientes,
el error estándar (ES) de la distribución ( en pares repetidos de muestras
se calcula como:
ES ( =
Error estándar de la media ES =

• La desviación estándar (s) es una medida de la dispersión de los datos. Cuanto mayor sea la
dispersión, mayor es la desviación estándar, mientras que el error estándar de la media cuantifica
las oscilaciones de la media muestral alrededor de la media poblacional.
• Son, por tanto, índices conceptualmente diferentes, aunque directamente relacionados.
• La desviación estándar es un índice para usar cuando se pretende describir la variabilidad de una
variable continua en una muestra.
• El error estándar de la media se debe usar cuando se pretende cuantificar el error cometido al
estimar la media poblacional mediante la media muestral.
Considere un experimento donde se toman muestras de orina de 24 hs a 300

estudiantes universitarios para calcular los gramos de nitrógeno excretados.
Se analizan los resultados de dos subgrupos de individuos pero no al azar sino
agrupados por edad. El valor medio de los gramos de nitrógeno excretado por los
30 estudiantes más jóvenes fue de 7.98 g, con una desviación estándar de 1.64 g;
los valores respectivos para los 30 estudiantes de mayor edad fue de 8.69 g y 1.80
g. : la pregunta es: ¿Son fundamentalmente diferentes estos dos grupos de
estudiantes diferenciados por edad?, en otras palabras: al considerar dos
muestras agrupadas por edades en relación con la excreción de nitrógeno, es la
respuesta diferente de la que debería esperarse si las muestras se extrajeran
completamente al azar?. Para contestar esta pregunta es necesario calcular cuál
es la probabilidad de que dos muestras extraídas al azar del mismo universo (o
condición) difieran tanto o más de lo que difieren las dos muestras que estamos
considerando. Como ya hemos visto para un mismo “universo” debe esperarse
que la diferencia entre los valores medios de las muestras extraídas al azar sea
cero. Hay sin embargo, entre las medias de los valores de nitrógeno de los dos
grupos etarios analizados una diferencia de 0.71g. Debemos calcular el error
estándar de la curva de las diferencias para poder hacer una estimación del
significado de la diferencia obtenida.
El error estándar de la media correspondiente a la muestra de los 30 estudiantes
más jóvenes es = 1.64/ = 0.30 g, y para los 30 estudiantes de mayor edad
es = 1.80/ = 0.33 g.
El error estándar de la diferencia es = = 0.45 g.

Ahora debemos determinar a cuántos errores estándares está del origen o ventro
de la curva esa diferencia; o lo que es lo mismo, cuál es para esa diferencia el
error relativo:
Error relativo = Diferencia de medias/ Error estándar de la diferencia = 0.71/0.45 =

1.6 (ver fig. 1)
Si consultamos la tabla de las áreas de la curva normal estándar (distribución

ideal), encontramos que el área comprendida entre el centro de la curva y una
desviación relativa de 1.6 es 0.4452. Entonces el área situada más allá de esta (el
área rayada) representa la probabilidad de que la media del grupo de estudiantes
de mayor edad difiera en 0.71g o más de la media correspondiente al grupo más
joven; se puede calcular (sabiendo que el área total bajo la curva = 1, la mitad de
la curva tiene un área = 0.5) lo siguiente: 0.5 – 0.4452 = 0.0548. Esto significa que
hay 5 posibilidades de cada 100 que al extraer muestras al azar se obtenga una
diferencia igual o mayor que 0.71g.
Estamos considerando ahora solamente la posibilidad que el grupo de mayor edad
tenga un valor para nitrógeno mayor que el correspondiente al grupo más joven.
Debemos considerar asimismo la probabilidad de que el grupo más joven tenga

una excreción igualmente más alta. Puesto que la curva normal es simétrica, esta
probabilidad será justamente igual a la que acabamos de calcular. La suma 0.0548
+ 0.0548 = 0.1096 indicará, por lo tanto, la probabilidad que los valores medios de
dos muestras extraídas al azar de un mismo universo difieran en los gramos de
nitrógeno excretados tanto o más de lo que difieren las dos muestras
consideradas.
Esta probabilidad se representa comúnmente con la letra p, de modo que en este
caso tenemos un p = 0.1096. La interpretación correspondiente a este valor de p
es la siguiente: sobre cada 100 operaciones de extracción de pares de muestras al
azar de un mismo universo, en 11 veces aproximadamente, los valores medios
diferirán en 0.71 g o más. Puesto que esto ocurrirá más bien frecuentemente, no
hay evidencias suficientes sino para inferir que estas muestras de estos dos
grupos etarios distintos no son otra cosa que muestras al azar de un mismo
universo.
En el caso de este ensayo debe tenerse en cuenta que la diferencia de edad entre
los dos grupos estudiados era poca ya que eran estudiantes del primer año de
Medicina.
Si en vez de tomar dos grupos seleccionados por edad se toman dos grupos
seleccionados por peso, o sea que contengan a los 30 estudiantes más pesados y
a los 30 estudiantes más livianos, los resultados ahora son los siguientes:
Para los 30 estudiantes más pesados la media es de 8.48 g de nitrógeno y el error
estándar correspondiente es 0.39 g de nitrógeno. Para los 30 estudiantes más
livianos la media es de 6.71 g de nitrógeno y el error estándar es 0.25 g de
nitrógeno.
Diferencia de medias = 1.78 g
Error estándar de la diferencia de medias = 0.45
En este caso el error relativo es 1.78/0.45 = 3.87
Ahora, consultando la tabla (curva) de distribución normal el valor p que se
determina es p = 2 (0.5-0.49995) = 0.0001
Este resultado indica que por cada 10.000 pares de muestras extraídas al azar en
un mismo universo, en solo 1, de acuerdo con las fluctuaciones estadísticas, debe

esperarse una diferencia en los valores medios igual o mayor que la observada en
la muestra en estudio.
Como se ve la ocurrencia de esta diferencia es altamente improbable, entonces se
concluye que las dos muestras no eran muestras al azar de un mismo universo
sino que, por el contrario, eran muestras de alguna manera “seleccionadas”.
Finalmente, puesto que las muestras fueron seleccionadas de acuerdo con el
peso, puede afirmarse que las mismas indican la existencia de una relación entre
el peso y la excreción de nitrógeno. Esta conclusión podría expresarse de otra
forma diciendo que las dos muestras representan dos sub-universos diferentes: el
de las personas pesadas y el de las personar livianas, y que estos dos sub-
universos son significativamente distintos en cuanto a la excreción de nitrógeno en
orina.
Las diferencias observadas entre ambos grupos entonces, no fueron producto del
azar.
Debemos observar que el tamaño de la muestra sobre la cual se basan las
proporciones influyen en la significación de las diferencias, pues el valor:
diferencia de medias/error estándar de la diferencia será menor cuando se trate de
una muestra grande.
Finalmente, y a modo de corolario…

El “valor de p”, debe ser valorado con precaución y teniendo en cuenta el contexto
del estudio, su diseño, las características de la muestra o la población analizada,
los potenciales sesgos, etc. Un valor de significación estadística p > 0,05 se
etiqueta como no significativo. A estudios que comparan tratamientos y que
arrojan este resultado se los suele denominar como negativos, un término que
implica erróneamente que los tratamientos son iguales, cuando lo único que
sucede es que no se ha podido demostrar una diferencia. Ambos conceptos son
distintos. Un resultado que no alcance significación estadística quiere decir que (si
en realidad no existe tal diferencia), es probable que la diferencia observada en el
estudio pueda haberse producido simplemente por el AZAR (variabilidad
aleatoria). No debe interpretarse como indicativo de que fehacientemente no

existe esa diferencia, sino tan sólo de que no puede descartarse la posibilidad de
que exista dicha diferencia, en especial en aquellos estudios en que se han
incluido pocos individuos.
La utilidad del valor p reside en que es una medida de la influencia del AZAR en la
posible asociación entre las variables analizadas; este azar debe ser siempre
contemplado, evaluado y cuantificado mediante el valor de p. El valor p NO es un
indicador de fuerza de asociación entre variables, ni de su importancia. Los
valores de “p” deben ser considerados solo como una guía y no como base de
conclusiones definitivas e irrevocables. Antes de tomar decisiones o cambiar
conductas clínicas basadas en un “valor de p”, se ha de considerar también la
VALIDEZ EXTERNA (generalización de los resultados obtenidos en ese estudio
particular respecto de la población inicial) y, si esas conclusiones pueden ser
extrapoladas a otros pacientes considerados o a otra realidad laboral (que pueden
ser distintas a la descrita en el estudio publicado y contemplado por nosotros). Por
todo ello, más apropiado que hablar de “SIGNIFICACIÓN ESTADÍSTICA” resulta
más correcto utilizar el concepto de “RELEVANCIA CLÍNICA”; porque la relevancia
clínica de un fenómeno va más allá de cálculos matemáticos y depende de…
1. La gravedad del problema,
2. La morbilidad y mortalidad generada por el mismo,
3. La magnitud de la diferencia,
4. La vulnerabilidad,
5. Los costes involucrados, etc.
Entonces un resultado estadísticamente significativo (p < 0,05) pero sin relevancia

clínica no deja de ser una ANECDOTA, mientras que, un hallazgo clínicamente
relevante sin significación estadística (p > 0,05) no puede ser asumido como
concluyente pues no podremos atribuir con seguridad el hallazgo clínico a la
intervención realizada (pues no podremos descartar la influencia del AZAR).

CONCEPTO DE: ODDS, ODDS RATIO, RELATIVE RISK, HAZARD Y HAZARD

RATIO.
Se denominan caracteres a los aspectos observables de los fenómenos que son
objeto de estudio y se aplica el término variable al resultado de la observación de
dichos caracteres. Cuando la variable estudiada describe la intervención realizada
por el investigador y se la considera la causa del fenómeno observado hablamos
de variable explicativa o independiente. A la variable que describe el resultado de
la intervención la llamamos variable dependiente.
La razón (ratio) es un quebrado cuyo denominador no contiene al numerador.
Cuando en una razón, el numerador es la probabilidad (p) de que ocurra un
suceso y el denominador es la probabilidad de que no ocurra (1-p), a tal razón se
la conoce como “odds” (ventaja en inglés). A la razón de dos odds se la conoce
como “odds ratio” (razón de ventajas).
Por otra parte, las tasas son medidas que expresan el cambio de una magnitud
por unidad de cambio en otra magnitud (ej.: la tasa de incidencia expresa un
cambio en el estado de salud por personas-tiempo).
Consideremos un ensayo clínico en el que se compara el uso de un nuevo
antineoplásico (tratamiento experimental) versus el uso del antineoplásico
convencional (tratamiento estándar), considerándose como “evento” (o progresión)
el aumento de tamaño del tumor existente o la aparición de un nuevo foco tumoral.
Progresan No progresan Total

TTo experim (Expuestos) a b a+b
TTo std (No expuestos) c d c+d
Total a+c b+d N
- El “Odds” es el cociente entre el número (o porcentaje) de individuos que

desarrollan un efecto y el número (o porcentaje) de los que no lo desarrollan.
Odds TTo experimental = Odds TTo estándar =

- El “Odds ratio” se define como la posibilidad de que una condición de salud o

enfermedad se presente en un grupo de población frente al riesgo de que ocurra
en otro.
Odds ratio =
- “Hazard” (riesgo) es la proporción de ocurrencia de un evento, para ser más

exactos: es la probabilidad de que un individuo que está bajo observación en un
momento t tenga un evento en ese momento. Representa la tasa de eventos
instantánea para una persona que ha sobrevivido hasta el tiempo t. El riesgo
absoluto mide la incidencia del daño en el total de una población, dicho de otra
manera, el riesgo absoluto es la probabilidad que tiene un sujeto de sufrir un
evento a lo largo de cierto tiempo, mientras que el riesgo relativo compara la
frecuencia con que ocurre el daño entre los que tienen el factor de riesgo y los que
no lo tienen.
- “Relative risk” (riesgo relativo) es el cociente entre el riesgo en el grupo que

posee el factor de exposición o factor de riesgo y el riesgo en el grupo de
referencia (que no tiene el factor de exposición) como índice de asociación. El
“relative risk” es una medida de cuántos eventos han ocurrido en un ensayo,
expresado como un cociente de la proporción de eventos que ocurren en el grupo
de tratamiento experimental en comparación con la del grupo de tratamiento
control. Precisamente como no considera el tiempo de aparición de los eventos
debe ser calculado, por lo general, al final del estudio y se expresa como si
hubiese ocurrido durante la etapa media del ensayo. Esto se debe a que podría
incurrirse en una “trampa” en un ensayo clínico al seleccionar un punto en el
tiempo para expresar la relación “riesgo relativo” de un evento. Esto podría resultar
engañoso, ya que podría seleccionarse el punto en el tiempo en el que hubo
mayor diferencia entre el tratamiento experimental y el tratamiento control. Por eso
el “riesgo relativo” sólo debe ser calculado al final del ensayo clínico, y el punto en
el que el ensayo finaliza o es detenido debe ser pre-especificado (en vez de ser

elegido selectivamente después de ver los resultados!). Utilizando los datos de

sobrevida y los “hazard ratio” se previene, en cierta medida, este tipo de sesgo.
Riesgo de progresión TTo exp =
Riesgo de progresión TTo std =
Relative Risk =
El “Relative risk” (RR) posibilita:

 Identificar la magnitud o “fuerza de la asociación”, lo que permite comparar
la frecuencia con que ocurre el evento entre los que tienen el factor de
riesgo y los que no lo tienen.
 Un RR=1 indica que no hay asociación entre la presencia del factor de
riesgo y el evento.
 Un RR>1 indica que existe asociación positiva, es decir, que la presencia
del factor de exposición se asocia a una mayor frecuencia de suceso del
evento  factor de riesgo
 El RR<1 indica que existe una asociación negativa, la presencia del factor
de exposición se asocia a una menor frecuencia de suceso del evento
entonces no existe factor de riesgo lo que existe es un factor de
protección.
- El “hazard ratio” (cociente de riesgo) se calcula a partir de las “hazard rates”

(tasas de riesgo), una descripción precisa de tasa de riesgo sería: "es la tasa de
eventos condicional instantánea calculada en función del tiempo”. Los “hazard

rates” son las probabilidades condicionales de presentar el evento en el siguiente

instante de tiempo, con la condición de que no se haya presentado antes del inicio
de ese instante.
El “hazard ratio” se utiliza comúnmente en la presentación de resultados en
ensayos clínicos que involucran datos de supervivencia, y permiten la evaluación
de hipótesis. No debe ser considerado igual al “relative risk”. El “hazard ratio” es
una expresión del riesgo u ocurrencia de eventos que suceden en el brazo
de tratamiento experimental como una proporción del riesgo de los eventos
que ocurren en el brazo de tratamiento control. Cuando el “hazard ratio” se
emplea en un análisis de supervivencia refleja el análisis del tiempo que se
ha sobrevivido a la ocurrencia de un evento, por lo tanto, va a permitir
comparar ambos grupos y mostrar el efecto que ejercen las “diferencias” o
“covariables” de los tratamientos sobre el riesgo de ocurrencia del evento.
Ejemplo:
Se utilizan 2 tratamientos A y B en pacientes, siendo uno de ellos un tratamiento
experimental y el otro el tratamiento control. Si a un grupo de 1.000 pacientes se
les da el tratamiento A (control) y en el mes 1, mueren 20; entonces la tasa de
riesgo (hazard rate) para el mes 1 sería 20/1000. Si en el mes 2, mueren 20; la
tasa de riesgo (hazard rate) para el mes 2 es 20/980 y así sucesivamente. En este
caso el “hazard rate” es el número de pacientes que mueren dividido el número de
pacientes que siguen vivos en el inicio de cada intervalo de tiempo (1 mes).
Al observar la tasa de riesgo (hazard rate) en pequeños incrementos de tiempo
(que dan una aproximación de la tasa de eventos instantáneo) es posible
comparar esa tasa con la tasa que ocurre en el grupo de pacientes que recibieron
el tratamiento experimental B (Ej: hazard rate de B: mes 1 = 30/1000; mes 2 =
35/970; etc.). Entonces en diferentes puntos de tiempo se puede calcular la
relación de las tasas de riesgo entre ambos tratamientos. Si el patrón de eventos
es similar en cada grupo se puede suponer que esta relación permanece
constante. Así, el “hazard ratio” es la relación entre las tasas de riesgo; es decir,
una relación (o cociente) de la tasa (velocidad) a la que los pacientes de los dos
grupos están experimentando eventos.

Interpretación del hazard ratio
¿Qué significa HR= = 0.8 para un tratamiento experimental (fármaco B)
frente al tratamiento estándar (fármaco A)?

Significa que el riesgo de ocurrencia del “evento” (evento: puede ser recidiva,
muerte, cirugía, etc.) con el tratamiento experimental (fármaco B) es el 80% del
riesgo de ocurrencia del “evento” con el tratamiento estándar (fármaco A) en
cualquier momento del período de seguimiento. Dicho de otra manera, el fármaco
B reduce en un 20% el riesgo de ocurrencia del evento que tendrían los pacientes
al ser tratados con el fármaco A en cualquier momento del período de
seguimiento.
¿Y si el HR=1.25?
La interpretación correcta es que una razón de riesgo de 1.25 significa que el
tratamiento con el fármaco B va a hacer que el paciente tenga un riesgo de
ocurrencia del evento de 25% más con el fármaco B, y que un paciente tratado
con el fármaco B que aún no ha presentado el evento por un cierto tiempo, tiene
un 25% más de posibilidades de presentar el evento en el siguiente punto en el
tiempo en comparación con alguien que ha sido tratado con el fármaco A
(tratamiento estándar).
Función de supervivencia y función de riesgo

El “Hazard” (riesgo) por lo general se denota como h(t). Supongamos que K
pacientes presentan eventos durante el período de seguimiento de un ensayo
clínico a distintos tiempos, t1 < t2 < t3 < t4 < t5 <... < tk. Como se supone que los
eventos se producen independientemente uno de otro, las probabilidades de
sobrevivir de un intervalo de tiempo al siguiente se calculan gracias a una ley (ley
multiplicativa de las probabilidades) que nos dice que esta probabilidad es igual a
la probabilidad de sobrevivir hasta el momento anterior tj–1 por la probabilidad
condicionada de sobrevivir un tiempo tj después de haber sobrevivido un tiempo
tj–1. Esto nos da la probabilidad de supervivencia acumulada. Entonces, según la
ecuación:

Función de supervivencia
S(tj) es la probabilidad de estar vivo en el tiempo tj, que se calcula a partir de S (tj-1)
que representa la probabilidad de estar vivo en tj-1; y utilizando nj que es el
número de pacientes vivos justo antes de tj; y dj que es el número de eventos
ocurridos en tj. En esta ecuación t0 = 0 y S(t0) = 1 (Probabilidad de supervivencia a
t0 = 1).
Función de riesgo
ANALISIS DE SUPERVIVENCIA
En muchos estudios, especialmente los relacionados con el cáncer, la variable
principal que se pretende valorar suele ser el tiempo que transcurre hasta la
ocurrencia de un suceso. A este tiempo, normalmente se le llama “supervivencia”,
aunque el suceso en cuestión no tiene por qué ser necesariamente la defunción.
La supervivencia puede entenderse como el tiempo que transcurre hasta que
sucede un “evento” de interés: recaída, alta médica, manifestación de los primeros
síntomas de una determinada enfermedad, etc. Cuando se trata de enfermedades
graves, el análisis de supervivencia deriva en la estimación de probabilidades de
mantenerse con vida durante determinados períodos de tiempo, logrando así
información del grado de severidad de la enfermedad, algo que a menudo se
desconoce.
Por lo tanto, el análisis de la supervivencia es una técnica muy apropiada para
analizar respuestas binarias (sí/no; fallecido/vivo) en estudios longitudinales o de
seguimiento que se caractericen por:
1- Duración variable del seguimiento: los estudios de seguimiento tienen fechas
muy bien definidas de inicio y de cierre, pero los sujetos se incorporan al estudio
en distintos momentos. En general, los sujetos son incorporados progresivamente
al estudio, de manera que la fecha de entrada, que marca el comienzo del

seguimiento del sujeto, no coincide con la fecha de inicio del estudio. Los sujetos
son seguidos de forma periódica. Las últimas noticias, que marcan el final del
seguimiento, proporcionan la fecha de la última observación y el estado “di” del
sujeto que, si el “evento” a considerar es la muerte del sujeto, puede ser “muerto”
(di=1) si el “evento” se ha producido o “vivo” (di=O) en caso contrario. La
diferencia respecto a la fecha de entrada es el tiempo de participación ti del sujeto
que se llama tiempo de supervivencia si el estado del sujeto es “muerto”. Si el
estado es “vivo” se trata de un tiempo incompleto (tiempo “censurado”) que aporta
una información parcial sobre su tiempo de supervivencia pero que es también
utilizado para estimar las probabilidades de supervivencia. Estas observaciones
reciben el nombre de observaciones incompletas por la derecha o simplemente
observaciones incompletas. El hecho de fijar una fecha de cierre del estudio
produce observaciones incompletas de tipo aleatorio (random censoring). Se trata
de los sujetos “retirados vivos”, es decir, de los sujetos que han sido seguidos
regularmente y que en el momento de la última observación programada (que
coincide aproximadamente con la fecha de cierre) aún no se ha producido el
acontecimiento terminal.
2- Observaciones incompletas: las técnicas de análisis de la supervivencia, a
diferencia de las técnicas estadísticas clásicas, están especialmente diseñadas
para la variable dependiente tiempo de supervivencia, cuyas medidas se obtienen
a partir de seguimientos de duración variable y se caracterizan por la existencia de
tiempos incompletos. En la fecha de cierre del estudio puede que aún no se haya
producido el evento de interés (recidiva, recaída, muerte, etc.) en ciertos sujetos.
Asimismo, a lo largo del estudio se puede perder el contacto con algunos sujetos
(sujetos perdidos) por cambio de lugar de residencia, muerte por causas no
relacionadas con la investigación, o simplemente porque han debido ser retirados
del estudio por diferentes motivos. Estas observaciones “incompletas” dan lugar a
lo que se llama “datos censurados”, y el análisis de supervivencia se caracteriza
por incluir la información que aportan estos datos. Aunque los tiempos incompletos
generados por los sujetos perdidos intervienen en el análisis de la misma manera
que los generados por los sujetos retirados vivos, conviene distinguir estas dos

fuentes de censura porque un número importante de sujetos perdidos puede

producir un sesgo de tal magnitud que invalide las conclusiones del estudio. Para
que estas observaciones incompletas aleatorias permitan estimar sin sesgo las
probabilidades de supervivencia es necesario que se cumpla el supuesto de
independencia entre los tiempos incompletos y los tiempos de supervivencia que
se habrían observado si el seguimiento de estos sujetos no se hubiera
interrumpido (vale la pena comentar que los tiempos censurados por la derecha
están subestimando la verdadera supervivencia del sujeto, y por tanto, que los
estudios de supervivencia normalmente subestiman la supervivencia de la
población).
FECHA DE ENTRADA FECHA ÚLTIMA OBSERVACIÓN

FECHA INICIO FECHA CIERRE
Tiempo
Tiempo de supervivencia (D)
Tiempo incompleto (C) (A) Perdido
Tiempo incompleto (C) (A) Retirado vivo
DURACIÓN DEL ESTUDIO
Representación de los tiempos de participación de los sujetos
Dos supuestos fundamentales para el análisis de supervivencia:

1- La censura debe tener un carácter aleatorio; no debe ser una censura
“informativa” (los datos censurados “informativos” son, por ejemplo, pacientes que
han fallecido por un motivo que no es la neoplasia en estudio, o aquellos que
salen del estudio porque la situación clínica ha empeorado, o han presentado un
efecto adverso grave. Esto los hace no comparables a los que se han quedado en
el estudio. Los fallecidos por un accidente de tráfico es un caso de tiempo
censurado (tiempo incompleto) “informativo” cuando realmente el “evento” a
considerar es la defunción por cáncer. Los datos censurados deben ser

representativos de los datos no censurados. No debe existir relación entre las

posibles fuentes de censura y las diferentes variables implicadas a considerar en
el análisis.
2- Proporcionalidad. Los efectos de las variables implicadas deben ser constantes
a lo largo del tiempo, sin mediar interacción alguna. Ello se traduce en que a nivel
gráfico las funciones deben transcurrir paralelas.
La interpretación de los resultados consiste en conocer la probabilidad de

supervivencia de un paciente en un momento o intervalo determinado, su tiempo
de supervivencia medio, así como la ventaja o desventaja de poseer una
característica o de haber sido sometido a un determinado tratamiento.
Los datos de supervivencia se pueden dar y estudiar con dos tipos de
probabilidades diferentes: supervivencia y riesgo.
La función de supervivencia indica la probabilidad de que un paciente supere
cierto tiempo de vida (la “probabilidad de supervivencia” o función de
supervivencia S(t) es la probabilidad de que un individuo sobreviva desde la fecha
de entrada en el estudio hasta un determinado momento t en el tiempo).

La función de riesgo (hazard function) representa la probabilidad de que a un

individuo que está siendo observado en el tiempo t le suceda el evento en ese
momento.
Mientras que la función de supervivencia se centra sobre todo en la “no
ocurrencia” del evento (el paciente no ha fallecido; o no ha recidivado), la función
de riesgo se centra en la “ocurrencia” del evento (proporciona información tan
valiosa como la tasa de incidencia, es decir, puede contestarnos preguntas como
“¿en qué momento voy a tener el pico de recidivas?” que pueden implicar cambios
en el quehacer clínico diario).
Los dos métodos estadísticos más usuales para calcular las funciones de
supervivencia y de riesgo son el de Kaplan-Meier y el de tablas de vida o
método Actuarial.
Método de Kaplan-Meier
Dicho método calcula la supervivencia cada vez que un paciente experimenta el
evento, generando las probabilidades en cada momento. Las probabilidades de
supervivencia se calculan a partir del número de pacientes en riesgo justo en el
momento de producirse el evento. Más que los valores concretos de probabilidad,
lo que debe centrar el interés del investigador a la hora de interpretar los
resultados es la tendencia observada en la curva y su inclinación, que informa de
la aceleración que experimenta el tiempo con relación a la probabilidad de
supervivencia del paciente.
Pk = Pk-1 [(rk - fk)/ rk]
Pk es la probabilidad de sobrevivir el k-ésimo mes

Pk-1 es la probabilidad de sobrevivir del mes anterior al k-ésimo mes
rk es el número de casos en riesgo, es decir, que aún no han recaído justo antes
del k-ésimo mes
fk es el número de eventos registrados el día k

Para cada momento la probabilidad de supervivencia se calcula multiplicando la

supervivencia en el momento anterior por la tasa de supervivencia en dicho
momento.
-En el denominador de la ecuación tendríamos el nº de pacientes que continuaban
en el estudio en el momento anterior (casos expuestos a riesgo) y en el numerador
ese mismo valor menos el nº de pacientes que sufren el evento en ese momento. -
Los valores de supervivencia se calculan sólo para aquellos momentos en los que
algún sujeto sufre el evento. En el resto de momentos se asume que la
probabilidad de supervivencia es la misma que en el momento
inmediatamente anterior.
Procedimiento para el cálculo:
1° Ordenar los sujetos en función del tiempo de supervivencia de cada uno
2° Calcular la probabilidad de supervivencia utilizando la fórmula.
Lo que se calcula de este modo es una función de probabilidad, que se materializa
en una probabilidad condicional en diferentes momentos o períodos de tiempo.
Método de Tablas de Vida o Actuarial

Consiste en agrupar el tiempo de participación de cada sujeto en intervalos de
tiempo predeterminados y calcular las probabilidades de supervivencia mediante
el producto de las estimaciones de las probabilidades condicionadas de
supervivencia correspondientes a cada uno de los diferentes intervalos de tiempo.
La agrupación en intervalos tiene el inconveniente de dar estimaciones poco
precisas cuando el número de sujetos no es suficientemente grande. Sin embargo,
para muestras grandes es más recomendable porque influye poco sobre las
estimaciones y tiene la ventaja de presentar una curva de supervivencia muy clara
y una tabla de fácil interpretación que sintetiza muy bien la evolución de la
supervivencia de los sujetos estudiados.
Veamos ahora un ejemplo donde se puedan visualizar los conceptos de Odds

Ratio, Hazard Ratio y curva de supervivencia:

EJEMPLO
Supongamos un estudio clínico en el que se comparan dos tratamientos,
tratamiento 0 (convencional) y tratamiento 1(experimental), contra un determinado
tipo de cáncer. A los 10 años se analiza cuántos de los pacientes tratados de una
forma u otra han presentado metástasis y cuántos no la han presentado. En cada
tratamiento, de los 20 pacientes tratados, a los 10 años, 10 pacientes presentan
metástasis y 10 no.
Tiempo transcurrido: 10 años Metástasis No metástasis
Pacientes Tratamiento 0 10 10
Pacientes Tratamiento 1 10 10
Esto daría un Odds ratio (OR) de 1. Sin más perspectiva temporal que esta, no
habría ventaja de un tratamiento respecto del otro. El Odds ratio es una mirada a
una relación en un momento temporal, prescindiendo de lo que ha pasado en el
recorrido hasta llegar allí. Es una mirada estática. El Hazard ratio (HR) es, por el
contrario, una mirada dinámica, es una mirada al recorrido, es una relación entre
recorridos. Diferentes estudios pueden tener un mismo OR pero HR muy
diferentes como se verá en este ejemplo.
Analicemos ahora la información no al finalizar los 10 años, sino durante los 10
años. Veamos el recorrido de cada tratamiento durante esos 10 años.
Supongamos que las 10 metástasis de cada grupo de tratamiento se producen a
lo largo de estos años según uno de los tres patrones distintos A, B, y C que se
muestran a continuación:
Tiempo hasta metástasis (años):
Tratamiento 0: 1, 2, 2, 3, 3, 4, 4, 5, 7, 8
Tratamiento 1: 1, 1, 2, 3, 4, 4, 4, 5, 7, 9
HR = 0,98 ( 1)

Tratamiento 0: 1, 2, 2, 3, 3, 4, 4, 5, 7, 8
Tratamiento 1: 3, 5, 6, 7, 7, 8, 9, 9, 9, 9
HR = 0,77
Tratamiento 0: 3, 5, 6, 7, 7, 8, 9, 9, 9, 9
Tratamiento 1: 1, 2, 2, 3, 3, 4, 4, 5, 7, 8
HR = 1,30
La relación entre los tratamientos es completamente distinta en A, B y C.

En A el perfil es muy similar en ambos tratamientos, es prácticamente igual. El HR
(Tto 1/Tto 0) es prácticamente 1. Observemos la curva de supervivencia. En
ambos casos, la función de un tratamiento y la del otro son prácticamente iguales.
El HR lo que hace es establecer una relación entre ambas curvas, entre ambas
funciones, es una cuantificación relativa de una función respecto de la otra, y, en
este caso, la relación es 1, porque están prácticamente solapadas:
Resumen del procesamiento de los casos
Censurado
Tratamiento Nº total Nº de eventos Nº Porcentaje

0 20 10 10 50,0%
1 20 10 10 50,0%
Global 40 20 20 50,0%
Situación A
KAPLAN- MEIER
Tabla de supervivencia
Proporción acumulada que sobrevive
hasta el momento
Nº de eventos Nº de casos que
Tratamiento Tiempo Estado Estimación Error típico acumulados permanecen
0 1 1,000 1 ,950 ,049 1 19
2 2,000 1 . . 2 18
3 2,000 1 ,850 ,080 3 17

4 3,000 1 . . 4 16

5 3,000 1 ,750 ,097 5 15
6 4,000 1 . . 6 14
7 4,000 1 ,650 ,107 7 13
8 5,000 1 ,600 ,110 8 12
9 7,000 1 ,550 ,111 9 11
10 8,000 1 ,500 ,112 10 10
11 10,000 0 . . 10 9
12 10,000 0 . . 10 8
13 10,000 0 . . 10 7
14 10,000 0 . . 10 6
15 10,000 0 . . 10 5
16 10,000 0 . . 10 4
17 10,000 0 . . 10 3
18 10,000 0 . . 10 2
19 10,000 0 . . 10 1
20 10,000 0 . . 10 0
1 1 1,000 1 . . 1 19
2 1,000 1 ,900 ,067 2 18
3 2,000 1 ,850 ,080 3 17
4 3,000 1 ,800 ,089 4 16
5 4,000 1 . . 5 15
6 4,000 1 . . 6 14
7 4,000 1 ,650 ,107 7 13
8 5,000 1 ,600 ,110 8 12
9 7,000 1 ,550 ,111 9 11
10 9,000 1 ,500 ,112 10 10
11 10,000 0 . . 10 9
12 10,000 0 . . 10 8
13 10,000 0 . . 10 7
14 10,000 0 . . 10 6
15 10,000 0 . . 10 5
16 10,000 0 . . 10 4
17 10,000 0 . . 10 3
18 10,000 0 . . 10 2
19 10,000 0 . . 10 1

20 10,000 0 . . 10 0
Comparaciones globales
Chi-cuadrado gl Sig.
Log Rank (Mantel-Cox) ,001 1 ,976
Prueba de igualdad de distribuciones de supervivencia para diferentes niveles de Tratamiento.
Tratamiento 0
Tiempo de Prob. supervivencia Probabilidad de
supervivencia
Metástasis Pacientes en riesgo supervivencia
Pk=Pk-1[(rk-fk)/rk]
(años)
0 0 20 P0= 1 1,00
1 1 19 P1= 1 x [(20-1)/20] 0,95
2 2 17 P2= 0,95 x [(19-2)/19] 0,85
3 2 15 P3= 0,85 x [(17-2)/17] 0,75
4 2 13 P4= 0,75 x [(15-2)/15] 0,65
5 1 12 P5= 0,65 x [(13-1)/13] 0,60
6 0 12 P6= 0,60 x [(12-0)/12] 0,60
7 1 11 P7= 0,60 x [(12-1)/12] 0,55
8 0 10 P8= 0,55 x [(11-1)/11] 0,50
9 0 10 P9= 0,50 x [(10-0)/10] 0,50
10 0 10 P10= 0,50 0,50
Tratamiento 1
Tiempo de Prob. supervivencia Probabilidad de
supervivencia
Metástasis Pacientes en riesgo supervivencia
Pk=Pk-1[(rk-fk)/rk]
(años)
0 0 20 P0= 1 1,00
1 2 18 P1= 1 x [(20-2)/20] 0,90
2 1 17 P2= 0,90 x [(18-1)/18] 0,85
3 1 16 P3= 0,85 x [(17-1)/17] 0,80
4 3 13 P4= 0,80 x [(16-3)/16] 0,65
5 1 12 P5= 0,65 x [(13-1)/13] 0,60
6 0 12 P6= 0,60 x [(12-0)/12] 0,60
7 1 11 P7= 0,60 x [(12-1)/12] 0,55
8 1 10 P8= 0,55 x [(11-1)/11] 0,50
9 0 0 P9= 0,50 x [(10-0)/10] 0,50
10 0 0 P10= 0,50 0,50

La Función de Impacto representa la Función de riesgo acumulado [H(t)].

Realizando la derivada (o sea la pendiente) de la Función de riesgo acumulado se
obtiene la Función de riesgo [h(t)].

REGRESION DE COX
Pruebas omnibus sobre los coeficientes del modeloa
Global (puntuación) Cambio desde el paso anterior Cambio desde el bloque anterior
-2 log de la verosimilitud Chi-cuadrado gl Sig. Chi-cuadrado gl Sig. Chi-cuadrado gl Sig.
137,312 ,001 1 ,977 ,001 1 ,977 ,001 1 ,977
Variables en la ecuación
95,0% IC para Exp(B)
B ET Wald gl Sig. Exp(B) Inferior Superior
Tratamiento -,013 ,447 ,001 1 ,977 ,987 ,411 2,372
El Exp(B) es el HR en este caso 0.987.
En B los perfiles de un tratamiento y del otro son, ahora, muy distintos. El

tratamiento 1 tiene menor riesgo que el tratamiento 0. La curva de supervivencia
del tratamiento 1 irá entonces lógicamente por encima. El HR (Tto 1/Tto 0) es
0,77. Comparemos la función de supervivencia entre ambos tratamientos:
Situación B
KAPLAN-MEIER
Proporción acumulada que Nº de casos

sobrevive hasta el momento Nº de eventos que
0 1 1,000 1 ,950 ,049 1 19
2 2,000 1 . . 2 18
3 2,000 1 ,850 ,080 3 17
4 3,000 1 . . 4 16
5 3,000 1 ,750 ,097 5 15

6 4,000 1 . . 6 14

7 4,000 1 ,650 ,107 7 13
8 5,000 1 ,600 ,110 8 12
9 7,000 1 ,550 ,111 9 11
10 8,000 1 ,500 ,112 10 10
11 10,000 0 . . 10 9
12 10,000 0 . . 10 8
13 10,000 0 . . 10 7
14 10,000 0 . . 10 6
15 10,000 0 . . 10 5
16 10,000 0 . . 10 4
17 10,000 0 . . 10 3
18 10,000 0 . . 10 2
19 10,000 0 . . 10 1
20 10,000 0 . . 10 0
1 1 3,000 1 ,950 ,049 1 19
2 5,000 1 ,900 ,067 2 18
3 6,000 1 ,850 ,080 3 17
4 7,000 1 . . 4 16
5 7,000 1 ,750 ,097 5 15
6 8,000 1 ,700 ,102 6 14
7 9,000 1 . . 7 13
8 9,000 1 . . 8 12
9 9,000 1 . . 9 11
10 9,000 1 ,500 ,112 10 10
11 10,000 0 . . 10 9
12 10,000 0 . . 10 8
13 10,000 0 . . 10 7
14 10,000 0 . . 10 6
15 10,000 0 . . 10 5
16 10,000 0 . . 10 4
17 10,000 0 . . 10 3
18 10,000 0 . . 10 2
19 10,000 0 . . 10 1
20 10,000 0 . . 10 0


Tratamiento 0
Prob. supervivencia Supervivencia
Tiempo de supervivencia Metástasis Pacientes en riesgo
(años) Pk=Pk-1[(rk-fk)/rk] acumulada
0 0 20 P0=1 1,00
1 1 19 P1= 1 x [(20-1)/20] 0,95
2 2 17 P2= 0,95 x [(19-2)/19] 0,85
3 2 15 P3= 0,85 x [(17-2)/17] 0,75
4 2 13 P4= 0,75 x [(15-2)/15] 0,65
5 1 12 P5= 0,65 x [(13-1)/13] 0,60
6 0 12 P6= 0,60 x [(12-0)/12] 0,60
7 1 11 P7= 0,60 x [(12-1)/12] 0,55
8 0 10 P8= 0,55 x [(11-1)/11] 0,50
9 0 0 P9= 0,50 x [(10-0)/10] 0,50
10 0 0 P10= 0,50 x [(10-0)/10] 0,50
Tratamiento 1
0 0 20 P0=1 1,00
1 0 20 P1=1 1,00
2 0 20 P2=1 1,00
3 1 19 P3= 1 x [(20-1)/20] 0,95
4 0 19 P4= 0,95 x [(19)/19] 0,95
5 1 18 P5= 0,95 x [(19-1)/19] 0,90
6 1 17 P6= 0,90 x [(18-1)/18] 0,85
7 2 15 P7=0,85 x [(17-2)/17] 0,75
8 1 14 P8= 0,75 x (15-1)/15] 0,70
9 4 10 P9= 0,70 x (14-4)/14] 0,50
10 0 10 P10= 0,50 x (10-0)/10] 0,50


REGRESION DE COX
-2 log de la Global (puntuación) Cambio desde el paso anterior Cambio desde el bloque anterior
verosimilitud Chi-cuadrado gl Sig. Chi-cuadrado gl Sig. Chi-cuadrado gl Sig.
136,788 ,344 1 ,557 ,341 1 ,559 ,341 1 ,559
a. Bloque inicial número 1. Método = Introducir
Tratamiento -,262 ,448 ,342 1 ,559 ,769 ,320 1,852
En este caso el HR es 0.769.
En C los perfiles de los dos tratamientos también son muy distintos. Pero ahora
ocurre justo todo lo contrario (observemos que los datos son los mismos que en B
pero invertidos). El tratamiento 1 tiene ahora mayor riesgo que el tratamiento 0. El
HR (Tto 1/Tto 0) es ahora 1,30.
Situación C
KAPLAN MEIER
Proporción acumulada que Nº de casos

sobrevive hasta el momento Nº de eventos que
0 1 3,000 1 ,950 ,049 1 19
2 5,000 1 ,900 ,067 2 18
3 6,000 1 ,850 ,080 3 17
4 7,000 1 . . 4 16
5 7,000 1 ,750 ,097 5 15
6 8,000 1 ,700 ,102 6 14

7 9,000 1 . . 7 13
8 9,000 1 . . 8 12
9 9,000 1 . . 9 11
10 9,000 1 ,500 ,112 10 10
11 10,000 0 . . 10 9
12 10,000 0 . . 10 8
13 10,000 0 . . 10 7
14 10,000 0 . . 10 6
15 10,000 0 . . 10 5
16 10,000 0 . . 10 4
17 10,000 0 . . 10 3
18 10,000 0 . . 10 2
19 10,000 0 . . 10 1
20 10,000 0 . . 10 0
1 1 1,000 1 ,950 ,049 1 19
2 2,000 1 . . 2 18
3 2,000 1 ,850 ,080 3 17
4 3,000 1 . . 4 16
5 3,000 1 ,750 ,097 5 15
6 4,000 1 . . 6 14
7 4,000 1 ,650 ,107 7 13
8 5,000 1 ,600 ,110 8 12
9 7,000 1 ,550 ,111 9 11
10 8,000 1 ,500 ,112 10 10
11 10,000 0 . . 10 9
12 10,000 0 . . 10 8
13 10,000 0 . . 10 7
14 10,000 0 . . 10 6
15 10,000 0 . . 10 5
16 10,000 0 . . 10 4
17 10,000 0 . . 10 3
18 10,000 0 . . 10 2
19 10,000 0 . . 10 1
20 10,000 0 . . 10 0

Tratamiento 0
0 0 20 P0=1 1,00
1 0 20 P1= 1 1,00
2 0 20 P2= 1 1,00
3 1 19 P3= 1 x [(20-1)/20] 0,95
4 0 19 P4= 0,95 x [19/19] 0,95
5 1 18 P5= 0,95 x [(19-1)/19] 0,90
6 1 17 P6= 0,90 x [(18-1)/18] 0,85
7 2 15 P7= 0,85 x [(17-2)/17] 0,75
8 1 14 P8= 0,75 x [(15-1)/15] 0,70
9 4 10 P9= 0,70 x [(14-4)/14] 0,50
10 0 10 P10= 0,50 x [10/10] 0,50
Tratamiento 1
0 0 20 P0=1 1,00
1 1 19 P1= 1 x [(20-1)/20] 0,95
2 2 17 P2= 0,95 x [(19-2)/19] 0,85
3 2 15 P3= 0,85 x [(17-2)/17] 0,75
4 2 13 P4= 0,75 x [(15-2)/15] 0,65
5 1 12 P5= 0,65 x [(13-1)/13] 0,60
6 0 12 P6= 0,60 x [(12-0)/12] 0,60
7 1 11 P7= 0,60 x [(12-1)/12] 0,55
8 0 10 P8= 0,55 x [(11-1)/11] 0,50
9 0 10 P9= 0,50 x [(10-0)/10] 0,50
10 0 10 P10= 0,50 0,50


REGRESION DE COX
Global (puntuación) Cambio desde el paso anterior Cambio desde el bloque anterior
-2 log de la
verosimilitud Chi-cuadrado gl Sig. Chi-cuadrado gl Sig. Chi-cuadrado gl Sig.
136,788 ,344 1 ,557 ,341 1 ,559 ,341 1 ,559
Tratamiento ,262 ,448 ,342 1 ,559 1,300 ,540 3,127
El HR, por lo tanto, cuantifica la posición relativa de una función de riesgo respecto
de la otra. Es un cociente de funciones. Tiene en cuenta no el final de un recorrido
sino la dinámica de ese recorrido. Esto es un elemento claramente diferencial
respecto del OR que mira las cosas en un punto estático.
ANALISIS DE VARIABLES: TESTS PARAMETRICOS Y NO PARAMETRICOS
Los ensayos o tests paramétricos cumplen con las siguientes características:

 Permiten contrastar hipótesis referidas a algún parámetro (, 2, , , etc.).
 Exigen el cumplimiento de determinados supuestos sobre las poblaciones
originales de las que se extraen los datos (generalmente normalidad y
homocedasticidad - dos poblaciones son homocedásticas si tienen la
misma varianza).
 Analizan datos obtenidos con una escala de medida de intervalo o razón.
Estas tres características combinadas permiten agrupar estos procedimientos
estadísticos en una gran familia de técnicas de análisis denominada contrastes
paramétricos (o pruebas paramétricas). Son, sin duda, las técnicas estadísticas
más frecuentemente utilizadas por analistas e investigadores en todo tipo de áreas

científicas, pero su utilidad se ve reducida, fundamentalmente, por dos razones:

por un lado, exigen el cumplimiento de algunos supuestos que en ocasiones
pueden resultar demasiado exigentes; por otro, obligan a trabajar con unos niveles
de medida que, especialmente en las ciencias sociales y de la salud, no siempre
resulta fácil alcanzar.
Afortunadamente, los contrastes paramétricos no son los únicos disponibles.

Existen contrastes que permiten poner a prueba hipótesis no referidas a
parámetros poblacionales; existen también contrastes que no necesitan establecer
supuestos exigentes sobre las poblaciones de donde se extraen las muestras; y
existen, por último, contrastes que no necesitan trabajar con datos obtenidos con
una escala de medida de intervalo o razón. Esta otra familia de contrastes se
conoce con el nombre de contrastes no paramétricos (o pruebas no
paramétricas).
En los ensayos de sobrevida, la variable aleatoria es el tiempo y no se puede

asegurar la normalidad de esta variable por lo que hay que aplicar análisis
estadísticos no paramétricos.
Tests no-paramétricos básicos:

 Pruebas para una muestra: Chi-cuadrado (2) (bondad de ajuste con
variables categóricas), Binomial (proporciones y cuantiles), Rachas
(aleatoriedad) y Kolmogorov-Smirnov (bondad de ajuste con variables
cuantitativas).
 Pruebas para dos muestras independientes: U de Mann-Whitney,
Kolmogorov-Smirnov, Reacciones extremas de Moses y Rachas de Wald-
Wolfowitz.
 Pruebas para varias muestras independientes: H de Kruskal-Wallis y
Mediana.
 Pruebas para dos muestras relacionadas: Wilcoxon, Signos y McNemar.

 Pruebas para varias muestras relacionadas: Friedman, W de Kendall y Q de

Cochran.
REGRESION LOGISTICA
Los datos de seguimiento de un ensayo clínico podrían analizarse usando un
modelo de regresión logística, que es uno de los procedimientos estadísticos
más empleados en medicina. Este método está indicado cuando se desea conocer
cómo una serie de factores influyen en una respuesta que está medida como
variable categórica dicotómica, es decir, con 2 posibilidades, como sería por
ejemplo: desarrollar o no desarrollar una neoplasia gástrica. Las variables que son
candidatas a predecir la aparición de un fenómeno se utilizarían como variables
independientes en un modelo de regresión logística (por ejemplo, en el caso de
desarrollo de una neoplasia gástrica un predictor o variable independiente podría
ser el grado de consumo de un conservante x). Una limitación que presenta
muchas veces la regresión logística es que no tiene en cuenta cuánto tiempo ha
tardado cada sujeto en desarrollar el efecto de interés (la neoplasia gástrica, en
nuestro ejemplo), pues sólo considera si se ha desarrollado o no este efecto, sin
importar el cuándo. Si se supiese el tiempo exacto en que cada sujeto desarrolla el
evento y, como es lógico y esperable, estos tiempos fuesen distintos de un sujeto
a otro, no sería óptimo utilizar una regresión logística, porque ésta no tiene en
cuenta el tiempo que tarda en desarrollarse el evento. Otro aspecto que debe
tenerse en cuenta es que la regresión logística, en vez de calcular el “relative risk”
(RR), estima los Odds ratios (OR). Si el OR = 1, esto significa que la cantidad de
veces que el evento ocurre ante la presencia de otra variable vs. las veces que
ocurre en ausencia de esa variable, es 1:1, que es lo mismo que decir que
aparecerá tantas veces cuando la variable esté presente como cuando la variable
no se presente.
En un estudio de cohortes la interpretación del OR es similar al del RR, pero el OR
tiende a alejarse más del valor nulo (1) tanto para valores inferiores a 1 (serán
inferiores con el OR más que con el RR) como para valores superiores a 1 (serán

superiores con el OR más que con el RR). Sólo cuando el riesgo global de la
enfermedad sea bajo (< 10%) la diferencia entre RR y OR puede considerarse
insignificante, pero si el riesgo absoluto de la enfermedad es alto, el OR puede
suponer una gran exageración del RR.
Regresión de Cox
La regresión de Cox (proportional hazards model) es, en muchos aspectos,
bastante similar a la regresión logística. Sin embargo, a diferencia de la regresión
logística, la regresión de Cox, además de considerar si se produce o no un
desenlace o efecto, tiene en cuenta el tiempo que ha tardado en producirse. Su
uso está indicado cuando la variable dependiente (el efecto o desenlace) sea de
tipo dicotómico (sí o no) y esté relacionada con la supervivencia de un grupo de
sujetos o, en general, con el tiempo que transcurre hasta que se produce en ellos
el suceso o evento.
El modelo de Cox es el enfoque multivariado más comúnmente utilizado para el
análisis de los datos de tiempo de sobrevida en la investigación clínica. Se basa
en la suposición de que los riesgos permanecen proporcionalmente constantes por
lo que se denomina más correctamente como “Modelo de riesgos proporcionales
de Cox” (Cox proportional hazards model). Matemáticamente, el modelo de Cox se
expresa por la siguiente ecuación:
ver(*1)
En esta ecuación, la función de riesgo h(t) depende de, o es determinada por, un

conjunto de covariables p (x1, x2, ..., xp), cuyo impacto se mide por la
envergadura de los respectivos coeficientes (b1, b2, ..., bp).
El parámetro de asociación que se obtiene con la regresión logística es el Odds
ratio (OR); en cambio, el que se obtiene en la regresión de Cox es el Hazard
ratio (HR).

Análisis multivariante con regresión de Cox

La gran ventaja que presentan tanto la regresión logística como la regresión de
Cox es que permiten aplicar un procedimiento multivariante incluyendo en el
análisis no sólo la exposición principal, sino también todos los posibles “factores
de confusión” como otras tantas variables independientes. Esto permite estimar
cuál sería el efecto de una exposición a igualdad de los otros posibles factores
causales del resultado o evento que se valora y, por tanto, pasar de una simple
asociación a una relación que ya podría ser de causa-efecto, pues apunta más
hacia una explicación verdaderamente causal de la exposición en estudio sobre el
desenlace o efecto. También permite valorar (mediante un término multiplicativo
introducido como variable independiente) si una de las variables independientes
interacciona con otra y modifica su efecto. Por otra parte, todas las variables que
sean candidatas a predecir la aparición de un fenómeno a lo largo del tiempo
podrán utilizarse como variables independientes en un modelo de regresión de
Cox, y esto permite también usar el análisis de regresión de Cox con finalidades
predictivas.
Comparación de curvas de supervivencia

La comparación de curvas de supervivencia (hipótesis de igualdad de funciones)
puede realizarse por varios procedimientos:
- Prueba de Log-rank (equivalente a la de Mantel y Haenszel para combinar
tablas 2 x 2) es una prueba no paramétrica. Las curvas pueden corresponder a
dos grupos de pacientes con diferentes tratamientos, o dos grupos de pronóstico
diferente. El método calcula para cada tiempo el número de “eventos” que se
esperarían asumiendo que no hay diferencias entre ambos grupos. Se obtiene un
valor final que puede compararse mediante una distribución de 2 y que puede dar
un valor de p que permita valorar la existencia de diferencias estadísticamente
significativas entre ambas curvas.
- Prueba de Gehan (generalización de la de Wilcoxon)
- Regresión de Cox (Modelo de Riesgos Proporcionales de Cox): se trata de
un modelo semiparamétrico, ya que no exige ninguna forma para la función de

riesgo (puede ser creciente o decreciente, etc.) pero, en cambio, define un

parámetro, el hazard ratio, que es la razón entre ambas funciones de riesgo. El
modelo de Cox no impone como premisa una forma para la función de riesgo, pero
sí asume que la razón de riesgo toma el mismo valor durante todo el período de
seguimiento. El modelo de riesgos proporcionales de Cox, sin imponer
condiciones sobre la forma de la supervivencia, permite al investigador disponer
de un estimador del efecto de un tratamiento, junto con su intervalo de confianza,
a partir del cual puede evaluar tanto la significación estadística como la relevancia
clínica.
El modelo general de la función de riesgo de la regresión de Cox se representa
como t y representaría el riesgo de fallecer (recaer, etc.) en el momento “t”,
obtenido a partir del seguimiento de un grupo de sujetos. Podría ser expresado del
siguiente modo:
Ln (t) =  + 1X1+ 2X2 + … + nXn ver(*2)
donde,
t es la función de riesgo (Hazard)
 es el valor de una constante que especifica el riesgo basal, en ausencia de
cualquier factor o variable explicativa
Xn son las diferentes variables explicativas cuyo efecto pretende probarse
n son los pesos o coeficientes de regresión estimados para cada variable
explicativa
(*1) y (*2) es la misma ecuación expresada de dos maneras distintas.
“En la ciencia, no existe la certeza absoluta, el conocimiento científico es hipotético, se basa en la

conjetura. En consecuencia, no pueden existir autoridades”
(Karl R. Popper, 1902-1994)

BIBLIOGRAFIA
- Bakke O, Cladellas X, García Alonso F. Ensayos clínicos con medicamentos.

Barcelona: Mosby-Doyma Libros; 1994.
- Doménech Massons Josep María. Una aplicación del análisis de la supervivencia

en ciencias de la salud, anuario de psicología, ISSN 0066-5126, Nº
55, 1992, págs. 109-142
- Llopis Péres J. La estadística: una orquesta hecha Instrumento. Disponible en:

https://estadisticaorquestainstrumento.wordpress.com. Accedido 11/06/2015.
- Huldah Bancroft. Introducción a la Bioestadística.Buenos Aires: Eudeba; 1974.
- Clark TG, Bradburn MJ, Love SB, Altman DG. Survival analysis part I: basic
concepts and first analysis. Br J Cancer 2003; 89: 232–238.
- Bradburn MJ, Clark TG, Love SB, Altman DG. Survival analysis part II:
Multivariate data analysis – an introduction to concepts and methods. Br J Cancer
2003; 89: 431–436.
- Altman D. Practical Statistics for Medical Research.London: Chapman & Hall,

1991.
- Vermorken JB, Remenar E, van Herpen C et al. Cisplatin, fluorouracil, and

docetaxel in unresectable head and neck cancer. N Engl J Med 2007; 357: 1695–
1704.
- Rial, A. y Varela, J. (2008). Estadística Práctica para la Investigación en Ciencias

de la Salud. Coruña: Netbiblo. Páginas 247-273.

Nociones de Estadistica Ii

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Nociones de Estadistica Ii

Cargado por

Copyright:

Formatos disponibles

FARMACOLOGÍA CLÍNICA

Cátedra de Farmacología, Facultad de Farmacia y Bioquímica, UBA

Cátedra de Farmacología, Facultad de Farmacia y Bioquímica, UBA

Autores: Bioq. Esteban Otamendi

Cátedra de Farmacología, Facultad de Farmacia y Bioquímica, UBA

NIVEL DE SIGNIFICACION ESTADISTICA

Un “test de hipótesis” es un procedimiento que permite decidir, controlando cierto

Cátedra de Farmacología, Facultad de Farmacia y Bioquímica, UBA

H0 :”Toda diferencia observable entre la eficacia de ambos tratamientos es debida

Cátedra de Farmacología, Facultad de Farmacia y Bioquímica, UBA

subsanable rebajando el valor p; un valor p de 0,05 es usado habitualmente en

Error estándar de la media ES =

Cátedra de Farmacología, Facultad de Farmacia y Bioquímica, UBA

• Son, por tanto, índices conceptualmente diferentes, aunque directamente relacionados.

Considere un experimento donde se toman muestras de orina de 24 hs a 300

Cátedra de Farmacología, Facultad de Farmacia y Bioquímica, UBA

Error relativo = Diferencia de medias/ Error estándar de la diferencia = 0.71/0.45 =

Si consultamos la tabla de las áreas de la curva normal estándar (distribución

Cátedra de Farmacología, Facultad de Farmacia y Bioquímica, UBA

Cátedra de Farmacología, Facultad de Farmacia y Bioquímica, UBA

Finalmente, y a modo de corolario…

Cátedra de Farmacología, Facultad de Farmacia y Bioquímica, UBA

Entonces un resultado estadísticamente significativo (p < 0,05) pero sin relevancia

Cátedra de Farmacología, Facultad de Farmacia y Bioquímica, UBA

CONCEPTO DE: ODDS, ODDS RATIO, RELATIVE RISK, HAZARD Y HAZARD

Progresan No progresan Total

- El “Odds” es el cociente entre el número (o porcentaje) de individuos que

Odds TTo experimental = Odds TTo estándar =

Cátedra de Farmacología, Facultad de Farmacia y Bioquímica, UBA

- El “Odds ratio” se define como la posibilidad de que una condición de salud o

- “Hazard” (riesgo) es la proporción de ocurrencia de un evento, para ser más

- “Relative risk” (riesgo relativo) es el cociente entre el riesgo en el grupo que

Cátedra de Farmacología, Facultad de Farmacia y Bioquímica, UBA

elegido selectivamente después de ver los resultados!). Utilizando los datos de

Riesgo de progresión TTo exp =

Riesgo de progresión TTo std =

El “Relative risk” (RR) posibilita:

- El “hazard ratio” (cociente de riesgo) se calcula a partir de las “hazard rates”

Cátedra de Farmacología, Facultad de Farmacia y Bioquímica, UBA

rates” son las probabilidades condicionales de presentar el evento en el siguiente

Cátedra de Farmacología, Facultad de Farmacia y Bioquímica, UBA

Interpretación del hazard ratio

¿Qué significa HR= = 0.8 para un tratamiento experimental (fármaco B)

frente al tratamiento estándar (fármaco A)?

Función de supervivencia y función de riesgo

Cátedra de Farmacología, Facultad de Farmacia y Bioquímica, UBA

Cátedra de Farmacología, Facultad de Farmacia y Bioquímica, UBA

Cátedra de Farmacología, Facultad de Farmacia y Bioquímica, UBA

fuentes de censura porque un número importante de sujetos perdidos puede

FECHA DE ENTRADA FECHA ÚLTIMA OBSERVACIÓN

Tiempo incompleto (C) (A) Perdido

Tiempo incompleto (C) (A) Retirado vivo

DURACIÓN DEL ESTUDIO

Representación de los tiempos de participación de los sujetos

Dos supuestos fundamentales para el análisis de supervivencia:

Cátedra de Farmacología, Facultad de Farmacia y Bioquímica, UBA

representativos de los datos no censurados. No debe existir relación entre las

La interpretación de los resultados consiste en conocer la probabilidad de

Cátedra de Farmacología, Facultad de Farmacia y Bioquímica, UBA

La función de riesgo (hazard function) representa la probabilidad de que a un

Pk = Pk-1 [(rk - fk)/ rk]

Pk es la probabilidad de sobrevivir el k-ésimo mes

Cátedra de Farmacología, Facultad de Farmacia y Bioquímica, UBA