Está en la página 1de 9

Estudios de tratamiento

Validez interna:

Es la medida en que los autores fueron capaces de evitar el sesgo. Este concepto es transversal para todos los tipos de
estudios, tanto estudios de diagnóstico como de tratamiento.

El sesgo es el error sistemático, esto quiere decir que tiene una dirección y un sentido, es por esto que cuando está presente
en un estudio desvía el resultado obtenido del resultado real.

El error por azar no es evitable.

El concepto de validez interna es el mismo, pero dependiendo del estudio se deben hacer diferentes preguntas para poder
evaluar la validez interna.

¿Cómo evaluar la validez interna en un estudio de tratamiento?


Para esto se debe hacer las siguientes preguntas:

1. ¿Cuál es el diseño del estudio?


2. ¿Fue la asignación de los pacientes a los grupos del estudio aleatoria (randomizada)?
3. ¿La secuencia de randomización fue oculta?
4. ¿Eran los grupos similares al inicio del estudio?
5. ¿Fueron todos los participantes ciegos a la intervención?
6. ¿Fue completo el seguimiento de los pacientes?
7. ¿Fueron todos los pacientes analizados en los grupos a los que fueron asignados inicialmente (análisis por intención
de tratar)?
8. ¿Fueron los grupos en estudio tratados igual en todo menos en la intervención?

Diseño del estudio:


El mejor diseño para estudios de terapia son estudios clínicos randomizados (RCT) o una revisión sistemática de estudios
randomizados.

En la tabla se ve la
jerarquía de la evidencia
pensando en la cantidad
de sesgo que puede
tener un estudio. Los
estudios clínicos
randomizados y las
revisiones sistémicas
son los dos que tienen menos sesgo, luego vienen los estudios observacionales, luego los reportes de casos y al final la
experiencia clínica.

¿Fue la asignación de los pacientes a los grupos de estudio aleatoria (randomizada)?


Esta pregunta es central y muchas de las otras preguntas se relacionan con lo mismo.

Esto es muy importante ya que para poder atribuir causalidad y decir que la diferencia del outcome se debe a la intervención
se necesita de 2 grupos idénticos en los factores conocidos y desconocidos, ya que, si los grupos son idénticos y lo único
que los diferencia es haber sido intervenidos o no, se puede atribuir la diferencia en el outcome a la intervención, y por eso
la randomización es vital, porque hace posible atribuir causalidad a la intervención, dándole el adjetivo de pilar fundamental
que hace mejor al diseño.
Para poder hacer la randomización se genera una secuencia de randomización, que es al azar e impredecible, esto quiere
decir que cada individuo tiene la misma probabilidad de quedar en el grupo control como en el grupo experimental.

Esta asignación debiera ser oculta para los investigadores que distribuyen a los pacientes, hasta que el reclutamiento de los
pacientes esté completo, esto porque por ejemplo si yo mido una droga que disminuye el riesgo de infarto y resulta que
llega un paciente diabético, hipertenso, gordito y fumador, a este paciente le toco intervención, pero pienso que este
paciente me convendría más en el grupo placebo que en el de intervención, porque tiene muchos factores de riesgo. El
paciente que le sigue es flaco, no fuma, no es diabético, es hipertenso pero controlado y le tocó placebo, yo como
investigador que quiere demostrar una diferencia, podría cambiar a estos pacientes, dejar al que me gusta más en
intervención y al que me gusta menos en el grupo placebo, uno piensa que eso es demasiado poco ético, pero pasa, y por
eso es importante que los investigadores no conozcan la secuencia de randomización, para que no puedan mover a los
pacientes según su conveniencia

La randomización es super importante, se ha visto que si la generación de la secuencia es un poco inadecuada no tiene un
efecto significativo en los resultados, sin embargo, si el ocultamiento es inadecuado, se ha visto que se exagera el efecto
de la intervención en aproximadamente un 30%. Debemos recordar que el sesgo tiene dirección y sentido, entonces cuando
identifico un sesgo en un estudio, puedo predecir como este sesgo va a intervenir en los resultados, y en este caso,
sobreestimaría la efectividad de la intervención

En el paper idealmente se debe pedir que esté explicito como se hizo la secuencia de randomización y como se ocultó, si
queda poco claro o no se menciona, yo debiera asumir que hay una falla metodológica ahí, no debiera pensar que no lo
dijeron, sino que no se hizo

Otra pregunta es:

¿Eran los grupos similares al inicio del estudio?

Esta duda viene a comprobar que los grupos sean similares,


y con eso afirmar que están bien randomizados, porque la
gracia de la randomización es que reparte equitativamente
los factores de riesgo, por lo que se espera que sean iguales
entre los 2 grupos.

Normalmente esto está en la tabla 1 de los papers, donde


nos muestran las variables demográficas, los factores de
riesgo, y las variables clínicas que se relacionan al outcome.

En este caso la tabla 1 muestra edad, sexo, etiología de la


cirrosis, el puntaje de CHILD, si hay ascitis, niveles de
albúmina, etc. También muestra el grupo de intervención y
el grupo control, y si la randomización está bien hecha se
espera que sean iguales, que no haya diferencias
significativas.

En la nota de la tabla decía que efectivamente las


características basales no tenían diferencias significativas
entre los 2 grupos.

¿Fueron todos los participantes en el estudio ciegos a la intervención?

Ser ciego es distinto al ocultamiento, ya que tiene que ver con los participantes del estudio más que con los investigadores.
Es el desconocimiento de la intervención que están recibiendo los grupos estudiados, por parte de los participantes de un
estudio. Ojo que los participantes del estudio es mucho más que el doctor y el paciente, podría ser el estadístico que analiza
los datos, los adjudicadores de eventos, investigadores, todos pueden ser ciegos. Antes se decía que un estudio era simple
o doble ciego, y doble ciego solo dice que hay 2 ciegos sin explicitar quiénes son, y a veces hay más personas que deberían
ser ciegas y no solo 2. Entonces, más que ser ciego, se le pide a un estudio bien hecho que todas las personas que puedan
ser ciegas lo sean. Las que puedan ser ciegas, porque no siempre se logra.

- ¿Cómo se logra? Normalmente en un estudio de terapia se usa el placebo, que puede ser una pastilla cuyo color,
tamaño, sabor sea idéntica a la intervención, pero no tiene el principio activo. Eso funciona muy bien pero a veces
no se puede, por ejemplo, si la intervención es una cirugía, ¿cómo se hace para que el paciente y el tratante sean
ciegos? eso es imposible. Pero en esos casos, sí pueden ser ciegos los analistas de datos.
- Los RCT no ciegos tienden a sobrestimar el efecto de la intervención: como tienen dirección y sentido se pueden
predecir.

¿Fueron todos los pacientes analizados en los grupos a los que fueron asignados inicialmente?

Esto es importante, y a un estudio bien hecho se le pide que se haga el análisis por intención de tratar (AIT), que significa
que cada paciente debe ser analizado en el grupo al que inicialmente fue asignado, entonces, si un paciente estaba en el
grupo de intervención, se tomó el medicamento 2 días y lo suspendió por efectos adversos, el resultado que tenga ese
paciente sea positivo o negativo, hay que incorporarlo en el análisis del grupo intervenido, aunque haya tomado 2 días el
medicamento de un total de 6 meses por ejemplo, porque ese paciente había sido asignado en el grupo de intervención.
Esto es importante porque hay que recordar que la randomización es fundamental para poder atribuir causalidad, y si se
empiezan a sacar pacientes de los grupos no por azar, se desarma la randomización, entonces si yo no hago el análisis con
la intención de tratar no podre atribuir causalidad, ya que no habría forma de demostrar que mis grupos siguen siendo
idénticos.

El análisis por protocolo es menos adecuado, y se refiere a cuando quito a las personas que no siguieron el protocolo y
analizo solo a aquellas que recibieron la intervención con la cual fueron asignados. En el ejemplo anterior, el paciente que
tomo 2 días el medicamento de 6 meses debería sacarse, ya que no siguió el protocolo, y no se incluiría en el análisis.

El AIT tiene la ventaja de simular la clínica realmente, ya que si le digo a un paciente que siga un esquema antibiótico por
10 días es probable que un porcentaje siga el esquema completo y otro porcentaje lo suspenda antes de tiempo. Permite
simular como funciona realmente la medicina, la magnitud del efecto que muestra es más cercano a la realidad. El análisis
por protocolo va a sobreestimar el efecto real de una intervención.

¿Fue completo el seguimiento de los pacientes?

Siguiendo esta línea, un estudio ideal sería uno en que yo randomizo los pacientes, hago un grupo intervención y uno
control, aplico la intervención y el placebo, los sigo por un tiempo y no se pierde ninguno, es decir, si inicio con 100 puedo
seguir a los 100 hasta el final. Este último punto es casi imposible en la realidad, por lo que siempre existe una perdida, la
pregunta es cuánta perdida puedo tolerar, lo aceptado es entre un 10 – 20%. Si yo quiero saber cuántas fueron realmente
las perdidas puedo hacer un ejercicio matemático para corregir las perdidas:

¿Cómo corregir las perdidas?

- Realizar un análisis del peor escenario y compararlo con el análisis por intención de tratar. El peor escenario para
la droga, es decir, esperando que este falle.
- Peor escenario: asume que todos los que se perdieron del grupo intervención tuvieron el outcome negativo y asume
que todos los que se perdieron del grupo control no tuvieron outcome negativo. Probablemente no es la realidad,
pero si es el peor escenario. Ahí yo comparo este escenario con el análisis por intención de tratar,

Entonces, por ejemplo, estoy probando el efecto de la aspirina para prevenir infartos, la perdida fue 10% en ambos grupos.
Entonces imagínense el análisis por intención de tratar:
Tenía 1000 pacientes en cada grupo, es
decir, 1000 pacientes en aspirina y 1000
pacientes en placebo. Las pérdidas fueron
de 10% en ambos grupos, entonces según
el análisis de intención de tratar: 20
pacientes de aspirina se infartaron y 40
pacientes del grupo placebo, eso da un RR
de 0,5 que significa que tomar aspirina
disminuye en un 50% el riesgo de tener un IAM.

Si hago el análisis en el peor escenario, recuerden que se me perdieron 10%, entonces serian 100 pacientes. Entonces los
100 pacientes que se perdieron del grupo aspirina se infartaron, entonces 120 se infartaron y de los 100 pacientes que se
perdieron en el grupo control, ninguno se infartó. Ahora al calcular el RR =3 que significa que tomar aspirina aumenta 3
veces el riesgo de tener infarto.

Entonces esta pérdida del 10% ¿será importante? Probablemente si, ya que está perdida fue de tal magnitud que cambio
los resultados del estudio, ya que en un grupo me dice que disminuyo el riesgo y en otro lo aumentó.

Imagínense ahora una perdida, pero del 1%, entonces ya no son 100 pacientes, sino 10. Entonces aquí el peor escenario es
que los 10 que se perdieron, se infartaron y que los 10 que se perdieron del grupo control no se infartaron, entonces tendría
un RR de 0,75.

Entonces el análisis por intención de tratar me dice


que el riesgo relativo es de un 50% y el riesgo
relativo en el peor escenario es de un 75%. Por lo
que se podría concluir que aquí la perdida no fue
tan importante como para sesgar
considerablemente los resultados del estudio ya
que el sentido de la diferencia se mantiene, se
refiere a que en ambos escenarios la muestra
disminuye el riesgo, es decir, tomar aspirina disminuye el riesgo de tener infarto, en mayor o menor magnitud, pero lo
disminuye, entonces igual se puede sacar una conclusión valida. En cambio, con el 10% de las pérdidas se podría decir
“toma aspirina ya que o disminuye el riesgo a la mitad o lo aumenta 3 veces” y nadie daría la indicación, obviamente.

¿Fueron los grupos en estudio tratados igual en todo menos en la intervención?

Recuerden que yo quiero que los pacientes sean idénticos y que lo único que los diferencie sea la intervención, entonces si
al hacer la randomizacion, logro tener 2 grupos idénticos y hago una intervención voy a poder decir que la diferencia de
resultados es por la intervención. En cambio, si los grupos están llenos de co-intervenciones diré ¿las diferencias que hay
es por co-intervencion o por la intervención?

Por ejemplo, en el caso de la aspirina para ver si los pacientes se infartan menos, y además al grupo control le agrego el
cese de tabaquismo, disminución del colesterol, etc, no sabré si se infartaron menos por la aspirina o por las otras
intervenciones que hice. Por eso si se hacen cointervenciones deben ser similares en los grupos.

Conclusiones validez interna.

Para analizar el riesgo de sesgo en un estudio de terapia es necesario tener en cuenta:

- Diseño del estudio.


- Randomización y ocultamiento de estas.
- Grupos similares al inicio del estudio.
- Participantes ciegos.
- Cointervenciones similares en ambos grupos.
- Análisis por intención de tratar.
- Fue completo el seguimiento.

Calcular e interpretar resultados.

Hay que construir la tabla de 2x2:

Los resultados se pueden expresar en forma


absoluta o relativa:

- Absoluta:
o RRA: reducción de riesgo absoluto.
o NNT: número necesario a tratar.
- Relativo:
o RR: riesgo relativo.
o RRR: reducción de riesgo
relativo (es como el espejo del
riesgo relativo).

Ejercicio de RCT: compara la eficacia de una


nueva droga A, versus placebo, en la
prevención de AVE en pacientes con antecedentes de TIA.

Entonces, para interpretar los resultados hay


que comprender de donde salen las fórmula,
más que aprenderlas de memoria.

De los 260 pacientes que recibieron la droga A,


10 tuvieron un AVE, y de los 522 pacientes que
recibieron placebo, 42 tuvieron un AVE. Cada grupo tiene un riesgo de desarrollar una variable. En el caso de la droga A
es de un 3,8% y en el caso del placebo fue un 8%.

Después yo puedo relacionar los riesgos de cada grupo de distintas maneras y eso es lo que me va a dar las distintas
opciones de resultado. Entonces:

- RRA: es la diferencia (una resta) existente entre el riesgo del grupo


control y el riesgo del grupo intervenido.

Reducción de riesgo absoluto (RRA), al riesgo de uno le resto el riesgo del otro, y eso da 0.042, lo que significa que el
tratamiento A reduce el riesgo absoluto en un 4.2%, dijimos que de 8% que era el riesgo basal, lo disminuyó a 3.8% en 4.2%.

Otra manera de interpretarlo es que la intervención, en este caso la droga A, disminuye 4.2 eventos por cada 100 pacientes
tratados.

Esa es la primera manera de expresar los resultados, RRA que es una resta entre el riesgo de los 2 grupos.

Está el NNT

Para que les salga fácil si yo les digo:


• La reducción del riesgo absoluto es de 50%, o sea, disminuye a la mitad el riesgo ¿Cuántos pacientes voy a tener
que tratar para prevenir 1 evento? Pareciera ser bien intuitivo que es 2, porque 50% mas 50% completo el entero
en el fondo, entonces si la reducción del riesgo absoluto es 50% necesito 2 pacientes.
• Si la reducción del riesgo absoluto fue de 25% ¿Cuántos pacientes voy a tener que tratar para prevenir 1 evento?
Necesito 4 pacientes porque tengo que sumar 4 veces este 25% completo el entero.
• Si la reducción del riesgo absoluto fue de un 10% ¿Cuántos pacientes voy a tener que tratar para prevenir 1 evento?
Necesito 10 pacientes, porque sumando 10 veces este 10% completo el entero, entonces NNT es super simple ya
que se divide 100 partido en la reducción de riesgo absoluto (RRA), expresado como porcentaje.

En este caso como el RRA es 4,2, queda 100/4,2 = 24.

Ojo que los NNT pueden dar números con decimales, pero siempre la
manera correcta de expresarlo es con numero entero, y se aproxima al
entero mayor. Porque cuando yo trate a las personas, no puedo tratar a
0,1 personas, necesito tratar enteros, entonces, aunque sea un decimal
pequeño siempre aproximar al entero más cercano.

En este caso entonces debo decir:

“Es necesario tratar a 24 pacientes para prevenir un AVE en pacientes que han tenido un TIA en el último año”

Estas eran las 2 formas de ver e interpretar resultados absolutos.

Interpretación de resultados relativos.


Recuerden cada grupo tiene su riesgo.

¿Qué tengo que hacer en el RR?

Ahora no es una diferencia porque es una medida relativa, ahora tengo que dividir, RR es el cociente entre el riesgo del
grupo intervenido y el riesgo del grupo control.

Entonces, RR es el cociente entre el riesgo del grupo intervenido


y el riesgo del grupo control.

Entonces divido el riesgo del grupo intervenido que en este caso


es 4,2 por el riesgo del grupo control que es 8 y eso me da el RR.

Ahora me pregunto, ¿Qué espero del riesgo relativo, que sea


muy alto, muy bajo o que sea 1?

Esa respuesta depende de la naturaleza del outcome, por ejemplo, si estoy midiendo mortalidad espero cierto número, en
cambio, si estoy midiendo un outcome positivo espero que sea justamente lo contrario.

• Un RR igual a 1 significa que el riesgo de desarrollar el outcome, en cualquiera de los grupos, ya sea experimental
o grupo control, es el mismo.
- Si tengo un RR = 1 significa que no hay una diferencia entre los dos grupos y por eso se dice que es la línea de
no efecto
• Un RR menor a 1 indica que la frecuencia del outcome disminuye al aplicar la intervención
- Si el outcome es negativo como mortalidad, a mí me gustaría que mi RR sea muy pequeño (0,00...) porque
significa que la intervención disminuye mucho el riesgo de morir.
• Un RR mayor a 1 indica que la frecuencia del outcome aumenta al aplicar la intervención.
- Si estoy midiendo un outcome positivo, por ejemplo, alivio del dolor, me gustaría tener un RR gigante (ej:10)
porque eso significa que el riesgo de desarrollar el outcome es mucho mayor al aplicar la intervención.

El RR va a ser bueno o malo dependiendo del tipo de outcome que estoy midiendo.
En este caso el RR era 0,47, esto significa que el riesgo de presentar un AVE que tiene un individuo en el grupo experimental
luego de recibir la intervención es el 47% del riesgo que tienen los que no la recibieron. En el fondo, el RR es el porcentaje
de riesgo con el que me quedo después de haber recibido la intervención.

En este caso mi riesgo basal de tener AVE era de 8%, recibí una intervención que es la droga A y ahora me quedo con un
47% de ese riesgo, que es 4,2.

Reducción del riesgo relativo (RRR)


Es una estimación del porcentaje de reducción del riesgo basal en un
determinado grupo. Es muy simple porque es una resta de 1 – RR.

Entonces si mi RR era 0,47, mi RRR es 0,53 o 53%.

Entonces la intervención redujo en un 53% el RR de presentar un AVE.

¿Cuál es la mejor manera de expresar los resultados?


Hemos visto 4 formas de expresar los resultados y uno podría preguntarse cuál es la mejor manera y la verdad es que no
hay una mejor, son complementarias.

Entonces, RR es el cociente entre el riesgo del grupo intervenido


y el riesgo del grupo control.

Entonces divido el riesgo del grupo intervenido que en este caso


es 4,2 por el riesgo del grupo control que es 8 y eso me da el RR.

Ahora me pregunto, ¿Qué espero del riesgo relativo, que sea


muy alto, muy bajo o que sea 1?

Esa respuesta depende de la naturaleza del outcome, por ejemplo, si estoy midiendo mortalidad espero cierto número, en
cambio, si estoy midiendo un outcome positivo espero que sea justamente lo contrario.

• Un RR igual a 1 significa que el riesgo de desarrollar el outcome, en cualquiera de los grupos, ya sea experimental
o grupo control, es el mismo.
- Si tengo un RR = 1 significa que no hay una diferencia entre los dos grupos y por eso se dice que es la línea de
no efecto
• Un RR menor a 1 indica que la frecuencia del outcome disminuye al aplicar la intervención
- Si el outcome es negativo como mortalidad, a mí me gustaría que mi RR sea muy pequeño (0,00...) porque
significa que la intervención disminuye mucho el riesgo de morir.
• Un RR mayor a 1 indica que la frecuencia del outcome aumenta al aplicar la intervención.
- Si estoy midiendo un outcome positivo, por ejemplo, alivio del dolor, me gustaría tener un RR gigante (ej:10)
porque eso significa que el riesgo de desarrollar el outcome es mucho mayor al aplicar la intervención.

El RR va a ser bueno o malo dependiendo del tipo de outcome que estoy midiendo.

En este caso el RR era 0,47, esto significa que el riesgo de presentar un AVE que tiene un individuo en el grupo experimental
luego de recibir la intervención es el 47% del riesgo que tienen los que no la recibieron. En el fondo, el RR es el porcentaje
de riesgo con el que me quedo después de haber recibido la intervención.

En este caso mi riesgo basal de tener AVE era de 8%, recibí una intervención que es la droga A y ahora me quedo con un
47% de ese riesgo, que es 4,2.
Reducción del riesgo relativo (RRR)
Es una estimación del porcentaje de reducción del riesgo basal en un
determinado grupo. Es muy simple porque es una resta de 1 – RR.

Entonces si mi RR era 0,47, mi RRR es 0,53 o 53%.

Entonces la intervención redujo en un 53% el RR de presentar un AVE.

¿Cuál es la mejor manera de expresar los resultados?


Hemos visto 4 formas de expresar los resultados y uno podría preguntarse cuál es la mejor manera y la verdad es que no
hay una mejor, son complementarias.

• RR (riesgo relativo):
o Al ser más independiente del riesgo nasal, tiene la ventaja de ser aplicable a poblaciones con distinto
riesgo
o Pero, tiende a sobreestimar el efecto real de la intervención. Es decir, inflan el resultado.

Un visitador médico que quiere que yo indique un medicamento, no me va a hablar de números absolutos ni decir que
tiene un NNT de 24, me va a decir que el riesgo disminuye a la mitad, haciéndolo sonar más bonito.

• RRA (reducción del riesgo absoluto):


o Al ser dependiente del riesgo basal, no puede ser aplicado a poblaciones con diferente riesgo que la
estudiada.
o Da una idea más real de la magnitud del beneficio de la intervención.

Son complementarias, teniendo todos los resultados a la mano uno tiene una mejor idea de la idea real de si sirve o no.
Teniendo a mano la tablita de 2x2 se puede calcular.

Entonces:

• RRA: 4.2%, de mi 8% basal bajé a 3.8. Se redujo un 4.2%


• RR: 47%

Si yo lo replico en una población dónde el riesgo basal de la población de tener un AVE (prevención primaria, por ejemplo:
en pacientes con HTA que nunca han tenido ACV) es de 0.01 (mucho menor que el ejemplo anterior), a diferencia de la
población anterior, que tenía riesgo de tener un TIA, y por eso su riesgo era mayor.

• RR: 47%, yo aplico este RR de 47%, cercano a la mitad, en esta población con riesgo de 0.01.
• RRA: 0.005. Eso es lo que me queda después de aplicar el RR de 47%. ¿Vale la pena usar la droga A? No, ya que la
magnitud del efecto es muy pequeño. Necesitaría 200 pacientes para prevenir un AVE, no 24.

Conclusiones resultados

Los resultados de un estudio de terapia se pueden expresar en forma absoluta o relativa (2 formas):

• Absoluta:
o RRA: reducción de riesgo absoluto
o NNT: número necesario a tratar
• Relativa:
o RR: riesgo relativo
o RRR: reducción de riesgo relativo

Hay que saber calcularlas todas, tienen sus ventajas y desventajas todas.

Las medidas absolutas:


• Son dependientes del riesgo basa, por lo que no pueden ser aplicadas a poblaciones con diferente riesgo que la
estudiada.
• Da una idea más real de la magnitud del beneficio de la intervención.

Las medidas relativas:

• Se podrían aplicar a otras poblaciones


• Tienden a inflar los resultados.

Objetivos (cumplidos)

Al final de esta clase los alumnos e internos habrán:

• Conocido como hacer el análisis crítico de la validez.


• Aprendido a calcular los resultados de un estudio de terapia
• Interpretado los resultados de un estudio de terapia.

Respecto al trabajo y ejercicio que deben hacer, es similar al de diagnóstico, dónde deben calcular todo esto. Para evitar
que tengan problemas con decimales yo les puse como deben exactamente expresar los resultados: decimales hasta la
centésima y sin aproximar, puse hasta un ejemplo por si les quedan dudas.

También podría gustarte