Está en la página 1de 18

TEMAS ESTUDIOS EXPERIMENTALES.

EL ENSAYO CLÍNICO (I Y II): ETAPAS DEL


DISEÑO BÁSICO. ANÁLISIS DE DATOS Y ALTERNATIVAS DE DISEÑO
11-12

Los estudios experimentales son aquellos caracterizados por la existencia de manipulación. Por definición
siempre son longitudinales, con sentido hacia delante y prospectivos. La base de un estudio experimental es
comparar la frecuencia de un cierto desenlace entre, al menos, dos grupos: uno es el llamado grupo de
intervención (porque recibe la intervención cuyo efecto se desea valorar). El otro es el grupo control, que no
recibe dicha intervención. Si la intervención produce el efecto esperado, la frecuencia del desenlace será
diferente en los sujetos que reciben la intervención con respecto a los que no la reciben. La validez del estudio
dependerá de que los dos grupos sean comparables, es decir, semejantes en todo salvo en la intervención. Si
ésa es la única diferencia existente entre ambos grupos, las diferencias observadas entre ellos con respecto a la
frecuencia del desenlace solo se podrán atribuir a la intervención.
La existencia de manipulación hace que los estudios experimentales estén sujetos a importantes restricciones
éticas, que en muchos casos dificultan o impiden su puesta en marcha. Los estudios experimentales tienen tres
grandes aplicaciones:
 Valorar el efecto beneficioso de una Intervención. Es su aplicación principal. La intervención puede ser
preventiva, diagnóstica o terapéutica. En ocasiones el tipo de intervención es compleja, abarcando varios
de los aspectos anteriores: política sanitaria, programas de salud, sistemas de administración y gestión de
servicios sanitarios, etc.
 Valorar el efecto metabólico de una Intervención. Se refiere a intervenciones terapéuticas principalmente
y su estudio inicial antes de su aplicación al paciente. Está relacionada fundamentalmente con el estudio
de la seguridad y farmacocinética de una intervención (absorción, distribución, metabolismo,
biotransformación, biodisponibilidad y excreción).
 Valorar los posibles efectos adversos de una Intervención. Por razones de tipo ético este difícilmente
puede ser un objetivo primario de un estudio experimental; su valoración suele ser secundaria al estudio de
los efectos beneficiosos de dicha intervención.

Es habitual clasificar los estudios experimentales en tres grandes grupos: ensayos clínicos, estudios de campo
y ensayos comunitarios:

a) Se habla de ensayos clínicos cuando un tratamiento u otra intervención se aplican a sujetos enfermos
con una intención diagnóstica, terapéutica o de prevención secundaria (tratamiento precoz) o terciaria
(rehabilitación y reinserción del sujeto).
b) Se habla de ensayos de campo cuando una medida de prevención primaria (destinada a que no se
produzca la enfermedad) se aplica a sujetos sanos. En los ensayos de campo también pueden evaluarse
medidas de prevención secundaria destinadas al cribado y diagnóstico precoz de la enfermedad
durante una fase preclínica.
c) Los ensayos comunitarios son estudios experimentales en los que la intervención se aplica de forma
conjunta a grupos de individuos, agregados por circunstancias muy diferentes: municipios, distritos,
provincias, colegios, clases, hospitales, etc. Por ejemplo, para valorar si una intervención informativa-
educativa en los centros escolares mejora los hábitos dietéticos de los alumnos, se toma un conjunto
de centros y se reparte en dos grupos: en unos centros se aplica esta intervención y en otros no. Al
cabo de unos meses se comprueba si los hábitos dietéticos de los niños que asisten a los centros
escolares en los que se ha aplicado la intervención han mejorado con respecto a aquellos donde no se
ha aplicado.
De los tres grupos anteriores, el más empleado es, sin duda, el ensayo clínico. Por ello, aunque la mayoría de
los conceptos que se exponen seguidamente son igualmente aplicables a los otros dos grupos, de aquí en
adelante vamos a referirnos específicamente a los ensayos clínicos, como modelo de estudio experimental en
seres humanos.

1
EL ENSAYO CLÍNICO
1. CONCEPTOS GENERALES
En un sentido amplio, un ensayo clínico (EC) es un estudio experimental en el que una o más personas
enfermas son voluntariamente expuestas a una intervención con el objeto de cuantificar la aparición de uno o
más efectos causalmente relacionados con ella. En todo EC subyace una hipótesis de causalidad:
intervención efecto
Es importante diferenciar la intervención propia de un EC de la intervención propia de la práctica clínica. Esta
última se basa en la administración a pacientes de sustancias u otras intervenciones, legalmente autorizadas,
con el fin de obtener un beneficio para ellos. Sin embargo, en un EC, la finalidad no es obtener un beneficio
para los pacientes que participan en él, sino demostrar y cuantificar que ese beneficio existe para pacientes con
características similares a los incluidos en el EC. En teoría, las intervenciones propias de la práctica clínica
deberían ser la consecuencia natural de los EC, como se representa en el siguiente esquema:

Habitualmente, la definición anterior de EC suele restringirse a aquel estudio en el que se incluyen al menos
dos grupos de enfermos: un grupo experimental o de intervención (sometido a la intervención bajo estudio),
cuyos resultados se comparan con los obtenidos en otro grupo de enfermos, denominado grupo control (sobre
el que no se aplica la intervención bajo estudio). Algunos autores hablan en este caso de EC controlado.
Finalmente, la definición más restrictiva es la que habla de EC solo cuando la asignación de los sujetos a los
grupos de comparación se hace de forma aleatoria. Algunos autores hablan entonces de EC controlado
aleatorizado (en inglés, RCT: randomized controlled trial).
El diseño de un EC debe ser capaz de dar una respuesta a una pregunta de investigación. Esta pregunta, a su
vez, se plantea a partir de una hipótesis causal previa, que es el punto de partida de todo EC (no puede
diseñarse un EC sin una hipótesis causal previa). La pregunta de investigación debe contener cinco elementos:

P oblación A qué población quiero aplicar los resultados del estudio.


I ntervención Para qué intervención quiero demostrar su efecto sobre los sujetos de la
población.
C omparación Con respecto a qué alternativa se compara el efecto de la intervención (grupo
control).
O utcome Cuál es el desenlace cuya magnitud quiero comparar entre los dos grupos (el de
intervención y el control).
T iempo Durante cuánto tiempo he de observar a los dos grupos de sujetos para poder
comparar los resultados entre ambos.

Las iniciales en inglés de los cinco elementos anteriores forman el acrónimo PICOT, que debe aparecer en
toda pregunta de investigación de un EC bien formulada.
Es importante resaltar que el grupo control, por definición, es aquél que no recibe la intervención objeto de
estudio. Ello no quiere decir que no reciba intervención alguna, pues, si existe una intervención alternativa
cuya eficacia está reconocida, no sería ético privar a los sujetos del grupo control de dicha intervención. Por
ello, es muy frecuente que los EC comparen la “intervención novedosa” (administrada al grupo de
intervención), frente a la “intervención tradicional o estándar” (administrada al grupo control). solo cuando no
existe dicha intervención estándar está justificado no someter al grupo control a intervención alguna, o
administrarle un placebo (ver más adelante).

2
Los EC son el mejor instrumento para demostrar una hipótesis de causalidad sobre seres humanos, pues
reducen al mínimo la presencia de sesgos. Hay dos premisas fundamentales que garantizan la validez interna
de un EC:
1) Que los grupos de intervención y control sean comparables entre sí. Ello quiere decir que todos los
factores pronóstico de la enfermedad (conocidos y desconocidos) deben estar igualmente repartidos
entre ellos antes de iniciar el tratamiento. La existencia de diferencias entre ambos grupos, en cuanto a
la distribución de los factores pronósticos depende de dos factores:
─ Que existan sesgos (errores sistemáticos).
─ Que existan errores aleatorios (que, simplemente por azar, los dos grupos son diferentes).
2) Que las mediciones de todas las variables de interés en los dos grupos han de tener el mismo grado de
fiabilidad y validez.
Los principales inconvenientes de los EC son su escasa factibilidad (derivada de la necesidad de salvaguardar
los principios éticos y de su elevado coste), y la generalmente baja validez externa de sus resultados (al
trabajar con poblaciones muy seleccionadas, es difícil extrapolar los resultados a otras poblaciones más
amplias).

2. LEGISLACIÓN Y ÉTICA
Una vez que se tienen la hipótesis y los objetivos de trabajo y se ha decidido realizar un EC, es necesaria la
aprobación del protocolo de estudio por los Comités Éticos de Investigación y la Agencia Española de
Medicamentos y Productos Sanitarios, tal y como establece el Real Decreto 1090/2015, de 4 de diciembre, por
el que se regulan los ensayos clínicos con medicamentos, los Comités de Ética de la Investigación con
medicamentos y el Registro Español de Estudios Clínicos. Este Real Decreto incorpora las directrices del
Reglamento (UE) n.º 536/2014 del Parlamento Europeo y del Consejo, de 16 de abril de 2014, sobre los
ensayos clínicos de medicamentos de uso humano, y por el que se deroga la Directiva 2001/20/CE.
El principio ético fundamental que debe regir todo estudio experimental en humanos es el de Equidad,
también llamado clinical equipoise (equilibrio clínico): la existencia de una total incertidumbre, establecida
por un panel de expertos, sobre cuál de las diferentes estrategias es preferible para obtener el máximo
beneficio en los participantes del estudio. Así, antes del inicio del estudio, no debería haber razones fundadas
para preferir pertenecer a uno u otro grupo de estudio (el de intervención o el control), porque, a priori, no se
sabe cuál de las dos estrategias dará un mejor resultado. En consonancia con este principio se sitúan los demás
requisitos éticos que deben ser refrendados por el comité ético de evaluación:
• Justicia: todas las personas merecen ser tratadas con consideración y respeto, sin diferencias entre ellas,
con especial protección a los menos favorecidos.
• No maleficencia: No realizar prácticas dañinas, aunque el paciente lo pida. Es maleficencia la realización
de un EC que no va a tener validez científica.
• Beneficencia: Las personas deben ser tratadas protegiéndolas de los daños y asegurando su bienestar, lo
cual implica no perjudicar, maximizando el beneficio y minimizando los riesgos.
• Autonomía: Tratar a las personas como seres autónomos y proteger a las personas con autonomía
disminuida (por ignorancia, inmadurez o incapacidad psíquica). Para cumplir este principio es preciso
obtener el consentimiento de los posibles participantes en el estudio, antes de incluirlos. El
consentimiento a participar en un EC debe ser:
 Informado: Verbalmente y por escrito.
 Comprendido: La información debe adaptarse a la capacidad de comprensión del paciente.
Después de informar, hay que dejarle al paciente un período de reflexión.
 Competente (legalmente): Para sujetos menores de edad e incapacitados, se requiere el
consentimiento de un representante legal.
 Voluntario: En ausencia de controles externos (coerción, manipulación o persuasión), y auténtico
(que no contradiga el sistema de valores del que lo da).

3
En 1964, la Asociación Médica Mundial (AMM) promulgó la llamada Declaración de Helsinki: un cuerpo de
principios éticos que deberían guiar la experimentación con seres humanos. Desde entonces, este documento
ha sido objeto de siete revisiones, la última de las cuales fue realizada en la 64 Asamblea General de la AMM,
en Fortaleza (Brasil) (2013). Aunque sus principios no son de obligado cumplimiento, es unánimemente
reconocido por la comunidad científica como el principal instrumento a tener en cuenta para garantizar el
cumplimiento de los principios éticos en la investigación con seres humanos.

3. TIPOS DE ENSAYOS CLÍNICOS. Los EC Controlados (con grupo de control interno) pueden
clasificarse atendiendo a distintos criterios:

3.1. EN FUNCIÓN DE LAS CARACTERÍSTICAS DEL GRUPO CONTROL


a) ENSAYOS CON GRUPOS PARALELOS
Los sujetos siempre pertenecen al mismo grupo de comparación. Pueden ser simples o factoriales. En los
primeros solo hay dos grupos de comparación (el experimental y el control). Por su parte, los ensayos
factoriales valoran el efecto de dos o más intervenciones, sin necesidad de aumentar excesivamente el tamaño
muestral que se requeriría para evaluar por separado el efecto de cada intervención. En la situación más
sencilla (dos intervenciones: A y B), los participantes son asignados aleatoriamente a cuatro grupos de
comparación: 1: los que solo reciben la intervención A (y un placebo de B); 2: los que solo reciben la
intervención B (y un placebo de A); 3: los que reciben las dos intervenciones; 4: los que no reciben ninguna (y
los placebos de A y B). Si A y B son dos intervenciones independientes, el efecto de A se valora comparando
los grupos 1+3 frente a los grupos 2+4; por su parte, el efecto de B se valora comparando los grupos 2+3
frente a los grupos 1+4. Estas comparaciones son válidas si no hay interacción entre las intervenciones; es
decir, si la magnitud del efecto de una de ellas no cambia en función de la presencia de la otra. No obstante,
este estudio también permite cuantificar la posible interacción entre las dos intervenciones, en caso de haberla.
Un ejemplo de estudio factorial es el llevado a cabo en el Physician Health Study. En él se evaluaron
simultáneamente dos intervenciones para reducir el riesgo de cáncer y de enfermedad cardiovascular: la
aspirina y el uso de un suplemento con beta carotenos. Este ejemplo ilustra otra de las ventajas de los diseños
factoriales: si se decide interrumpir una de las intervenciones (por ejemplo, por haber quedado claramente
manifiesta su eficacia o sus efectos adversos antes del fin previsto del estudio), puede continuarse el estudio
con la otra intervención.
b) ENSAYOS CRUZADOS
Los sujetos van perteneciendo sucesivamente a los distintos grupos de comparación. Por ejemplo, si
inicialmente se establecen dos grupos de comparación A y B, al final de un primer período de estudio, los
sujetos asignados inicialmente al grupo A pasan a pertenecer al grupo B, y viceversa. Entre los dos períodos
de estudio se intercalan períodos de blanqueo, con placebo, con objeto de que el efecto del primer tratamiento
desaparezca antes de iniciar el segundo. En realidad, en estos estudios, se comparan los distintos efectos
producidos por los diferentes tratamientos en el mismo sujeto, aunque en todo momento se dispone de los
grupos de comparación de forma concurrente.
Esta estrategia solo es útil cuando la enfermedad es estable a lo largo del tiempo, o se presenta de forma
episódica o recurrente (por ejemplo, crisis epilépticas, ataques de artritis o jaqueca, trastornos menstruales,
etc.). Son ensayos más largos que los paralelos, con el consiguiente problema de pérdidas, pero permiten a
cambio reclutar menos pacientes y disminuir la variabilidad intersujetos (ruido de fondo). Es más fácil
desenmascarar el cegamiento y es difícil descartar la existencia de efectos residuales del tratamiento
precedente.
c) ENSAYOS EN UN SOLO PACIENTE
En este diseño, un único paciente es alternativamente sometido a, al menos, dos intervenciones diferentes (o
una intervención frente a un placebo), con una secuencia temporal asignada aleatoriamente. El objetivo es
comparar la eficacia de ambas intervenciones en un paciente en concreto, y no en un grupo de pacientes, bajo
el razonamiento de que lo que es bueno en promedio (para un grupo de personas) no tiene por qué serlo para
todos los sujetos que componen el grupo. En este diseño, la unidad de estudio no es la persona, sino los

4
períodos de estudio, comparados por pares: cada par consta de un período en el que se administra una
intervención y otro en el que se administra la otra intervención (o un placebo). El estudio debe hacerse con
asignación aleatoria de las intervenciones en cada par y, si es posible, con cegamiento doble.
Los requisitos para la aplicación de este diseño son: 1) que se aplique para valorar el efecto de intervenciones
sobre enfermedades crónicas y estables; 2) que estas enfermedades presenten síntomas fácilmente
reconocibles por el paciente, repetibles y reversibles; y 3) que respondan de forma rápida a tratamientos que,
por otra parte, no dejen efectos prolongados sobre el paciente tras su interrupción.
Este diseño está especialmente indicado para enfermedades raras, en las que se desconoce la mejor alternativa
terapéutica, y en aquellas para las que existe constancia de una gran variabilidad intraindividual en la
respuesta a las posibles intervenciones. También está indicado para valorar la eficacia de diferentes
intervenciones orientadas a paliar sintomatología subjetiva (por ejemplo, dolor), de pacientes con
enfermedades crónicas (asma, fibromialgia, insomnio, etc.).

3.2. EN FUNCIÓN DEL MÉTODO DE ASIGNACIÓN DE LOS PARTICIPANTES A LOS GRUPOS


DEL ESTUDIO.
En todos los EC controlados, independientemente de que sean en paralelo o cruzados, siempre se dispondrá, al
menos, de dos grupos, experimental y control. La forma de asignar los sujetos del estudio a ambos grupos
determina que hablemos de EC controlado con asignación aleatoria o EC controlado sin asignación aleatoria.

a) ASIGNACIÓN NO ALEATORIA
Los sujetos son asignados a los grupos de estudio por un método que no depende del azar. En general, la
asignación no aleatoria dificulta que se cumpla la premisa de comparabilidad de los grupos de estudio. Los
métodos de asignación no aleatoria son variados:
─ Sistemática: Según un orden preestablecido (por ejemplo, la alternancia, el día de la semana, la fecha de
nacimiento del paciente, etc.).
─ A juicio del investigador.
─ Voluntaria: A elección del paciente: Da lugar al sesgo del voluntario.
─ Ensayos pre-post: Se compara la frecuencia del desenlace en los mismos sujetos antes y después de
aplicarles, a todos ellos, una intervención. El grupo control son los propios pacientes antes de recibir la
intervención. Evidentemente, los pacientes antes y después de recibir una intervención no son
intercambiables, pues entre ellos puede haber diferencias debidas a todos los factores que, además de la
intervención, pueden haber cambiado con el tiempo.

b) ASIGNACIÓN ALEATORIA
Los sujetos son asignados a los grupos de estudio por un método que depende del azar. La probabilidad de
cada sujeto de pertenecer a cada grupo de comparación se fija de antemano y se aplica por igual a cada uno de
los sujetos del estudio. La asignación aleatoria es, en general, la mejor estrategia para lograr la comparabilidad
de los grupos de estudio y garantiza que, si existen diferencias en la distribución de factores pronóstico, éstas
serán debidas exclusivamente al azar. Para realizar la asignación aleatoria hay que tener en cuenta dos
factores:

b1) El tamaño deseado para cada grupo


En el caso más sencillo (dos grupos: experimental y control), es habitual preferir que ambos grupos tengan
igual tamaño, en cuyo caso pexp=pcon=0,5; o bien elegir que ambos grupos tengan tamaños desiguales (pexp
≠ pcon). Por ejemplo, si queremos que solo un tercio de la muestra pertenezca al grupo experimental, entonces
pexp=0,33 y pcon=0,66.

b2) El método de asignación aleatoria. Hay varias posibilidades:

5
Asignación aleatoria simple: Se suele hacer mediante tablas de números aleatorios o empleando el ordenador.
Presenta varios inconvenientes:
 No garantiza que los tamaños finales de los grupos de comparación sean los deseados.
 No garantiza que no existan diferencias en los factores pronóstico debidas al azar. Estos dos
inconvenientes se mitigan a medida que el tamaño de los grupos es mayor.
 No elimina la probabilidad de que muchos pacientes se asignen consecutivamente al mismo grupo.
En general, para tamaños muestrales mayores a 100 sujetos en cada grupo de comparación, la asignación
aleatoria simple funciona bastante bien, siempre que no se hayan planificado análisis intermedios.

Asignación aleatoria por bloques: Se basa en repartir la muestra prefijada en n bloques de igual o distinto
tamaño, y hacer, dentro de cada bloque, un reparto de los sujetos a los grupos de comparación eligiendo al
azar una de todas las posibilidades de reparto en subgrupos que se puedan dar dentro de cada bloque
(dependiendo del tamaño de los bloques se dispone de un número fijo de posibilidades). Hay muchas formas
de aplicar este procedimiento. Imaginemos el caso más sencillo: bloques de tamaño fijo, dos grupos de
comparación (A y B) del mismo tamaño (p(A) = p(B) = 0,5). Supongamos que el tamaño muestral prefijado es
de 40 sujetos, que queremos repartir a al azar en dos grupos (A y B), de 20 sujetos cada uno. Dividiendo 40 en
bloques de 4 sujetos necesitaríamos 10 bloques. Como cada bloque contiene 4 sujetos, dos de ellos deben
asignarse al grupo A y otros dos al B. ¿De cuántas formas puede hacerse este reparto (2 A y 2 B dentro de
cada bloque)?: De seis formas distintas (seis tipos de bloques), que numeramos del 1 al 6:
Tipo 1: AABB; Tipo 2: BBAA; Tipo 3: ABAB; Tipo 4: BABA; Tipo 5: ABBA; Tipo 6: BAAB
Ahora se trata de ir eligiendo al azar, sucesivamente, 10 números del 1 al 6 (imaginemos 10 tiradas de un
dado). Obtendremos una secuencia aleatoria de números, por ejemplo ésta: 3,2,4,4,1,6,3,4,2,5. Como cada
número se corresponde con un tipo particular de bloque, el resultado es la siguiente secuencia aleatoria de "A"
y "B":

ABAB BBAA BABA BABA AABB BAAB ABAB BABA BBAA ABBA.

Puede comprobarse como el número final de A y B es el que habíamos prefijado (20). Por lo demás, solo
puede haber 4 A o 4 B seguidas (hemos eliminado la existencia de rachas en la secuencia). Finalmente, aunque
detuviéramos el estudio antes de haber alcanzado el tamaño muestral prefijado, seguiríamos teniendo el
mismo número de A y B: p(A) = p(B) = 0,5, independientemente del tamaño muestral final.

Asignación aleatoria estratificada: Primero se clasifica la muestra de pacientes en varios estratos, definidos
en función de la magnitud de uno o varios factores pronósticos conocidos. Después se hace una asignación
aleatoria (generalmente por bloques), separadamente dentro de cada uno de los estratos. Este tipo de muestreo
elimina la desigualdad, debida al azar, de los factores pronósticos conocidos por los que se ha estratificado. Se
emplea cuando el tamaño del estudio es pequeño, pues cuando es grande ya se ha dicho que las desigualdades
por azar tienden a ser cada vez menores. Imaginemos una población de 40 personas, 30 mujeres y 10 varones.
Sabemos que la variable sexo es un factor pronóstico importante, por lo que su distribución debe ser idéntica
en los grupos de comparación. Si, para distribuir la muestra anterior en dos grupos (A y B), empleamos una
asignación simple o por bloques, es posible que, por azar, la proporción de mujeres (que en la muestra total es
del 75%) no sea igual en A y B (por ejemplo, puede que, por azar, la mayor parte de los varones hayan caído
en B) con lo que la comparabilidad entre grupos queda comprometida. Para evitar esto es preferible hacer dos
asignaciones aleatorias por bloques de forma separada: una para las mujeres (en la que 15 de ellas acabarán
siendo asignadas a A y otras tantas a B), y otra para varones (en la que 5 varones acabarán asignados a A y
otros tantos a B). De esta forma, nos aseguramos de que tanto en el grupo A como en el B habrá 15 mujeres y
5 varones, con lo que la proporción de mujeres (75%) será idéntica en ambos grupos.

Asignación aleatoria apareada: Es la situación extrema de la estratificación: por cada sujeto del grupo de
intervención se tomará un control (o más), con idénticos factores pronóstico. En el caso más simple (dos
grupos, A y B), se definen N pares de sujetos y cada sujeto del par se asigna al azar a recibir A o B. Este tipo

6
de asignación es típica de estudios en gemelos o en pares de órganos o estructuras del mismo sujeto (ojo
derecho-ojo izquierdo, brazo derecho-brazo izquierdo, etc.).

Diseño de Zelen: A diferencia de los restantes procedimientos de asignación aleatoria, en los que la
asignación siempre es posterior a la obtención del consentimiento a participar en el estudio (solo se asigna al
azar a los sujetos dispuestos a participar), en este procedimiento se hace a la inversa: primero se asigna al azar
a la población candidata a participar y luego se les solicita el consentimiento. Esta técnica solo puede aplicarse
cuando la intervención del estudio se compara con “la intervención convencional o estándar” (la que se
aplicaría si no se estuviera llevando a cabo ensayo alguno). En el diseño de Zelen con consentimiento simple,
a los sujetos asignados al grupo control (intervención habitual), no se les solicita su consentimiento a recibir la
intervención (pues, se hiciera o no el ensayo, esta es la intervención que iban a recibir), ni se les informa sobre
la existencia de una intervención experimental. Únicamente se les pide permiso para disponer de sus datos. A
los sujetos aleatoriamente asignados al grupo experimental sí se les solicita su consentimiento. En el caso de
que rechacen recibir la intervención experimental se les ofrece la intervención habitual pero, a efectos del
análisis de los datos, siguen quedando incluidos en el grupo experimental (es el llamado "análisis por
intención de tratar", que se verá más adelante). Esto garantiza la comparabilidad de los dos grupos (asignados
al azar), aunque, obviamente, la potencia del ensayo para detectar el efecto de la intervención experimental
disminuye conforme más sujetos asignados a recibir dicha intervención la rechacen. Los problemas éticos
inherentes a este diseño (los sujetos del grupo control participan en el ensayo sin conocer las características
del mismo), se soslayan en el diseño de Zelen con doble consentimiento: el consentimiento posterior a la
asignación se solicita a ambos grupos. La ventaja del diseño de Zelen es su mayor validez externa, al
minimizar las pérdidas por falta de consentimiento y permitir realizar el ensayo en un contexto más parecido
al de la práctica clínica habitual, sobre muestras más representativas de la población elegible. También se ha
argumentado que el diseño de Zelen reduce la ansiedad, la confusión y la desconfianza en los cuidados
habituales que podrían generarse si se solicitara el consentimiento previo a la aleatorización.

Asignación aleatoria por conglomerados (clusters): En estos estudios la unidad de asignación aleatoria es el
grupo y no el individuo. Por ejemplo, para comparar el efecto de distintas intervenciones encaminadas al
abandono del hábito tabáquico, los terapeutas participantes en el estudio (y no sus pacientes fumadores) son
aleatoriamente asignados para administrar los distintos tipos de intervenciones. Generalmente, esta estrategia
se aplica para evitar el sesgo por contaminación: en una asignación aleatoria individual, un fumador asignado
a no recibir una cierta intervención antitabáquica podría “contaminarse” del efecto de esa intervención si ésta
se administra a sujetos próximos a él (por ejemplo, si comparten la consulta del mismo terapeuta).
Sea cual sea el método de asignación aleatoria, es esencial que la secuencia de asignación aleatoria sea
totalmente desconocida, ciega, para las personas que van a asignar a los pacientes a los grupos del EC. Es lo
que se conoce como ocultación de la secuencia de aleatorización (OSA). Cuando el médico recluta al
paciente para participar en el EC (porque cumple los criterios de selección y da su consentimiento informado),
no debe saber a qué grupo va a ser asignado este paciente (si al grupo experimental o al grupo control, en la
situación más sencilla). Una vez obtenido el consentimiento, el médico se pondrá en contacto con el centro de
control del EC, que es quien entonces le indicará (en función de la secuencia aleatoria previamente generada),
a qué grupo debe ir asignado ese paciente. Si en un EC la secuencia de aleatorización no permanece oculta
para el responsable de la asignación, es probable que se produzcan desequilibrios en esta asignación y que,
con ello, se pierda la comparabilidad entre grupos que se ha pretendido lograr mediante la asignación
aleatoria. Por ejemplo, si un médico sabe que el próximo paciente a reclutar para el EC va a ser asignado a un
grupo concreto, y sabe (o sospecha, en caso de sea un estudio con doble cegamiento), cuál es ese grupo (el
experimental o el control), es posible que ese conocimiento influya en la atención que vaya a dispensar a ese
paciente o incluso conduzca a un cambio de grupo o a la exclusión de ese paciente para el EC. Por eso, la
existencia de un procedimiento que garantice la OSA es uno de los principales criterios de calidad de un EC.

c) ASIGNACIÓN POR MINIMIZACIÓN: Cuando el número de participantes en un EC es muy pequeño,


es altamente probable que el azar no haga bien su tarea, es decir, que precisamente por azar, los dos grupos de
comparación no sean similares con respecto a importantes factores pronósticos del desenlace (es algo parecido
a cuando se reparten al azar solo 10 cartas en dos grupos de 5: lo más probable es que el valor de ambos
grupos de 5 cartas sea muy diferente). En esta situación, es frecuente emplear una asignación por

7
minimización: se trata de repartir a los pacientes de forma que nos aseguremos de que, al final del proceso, los
dos grupos de pacientes serán muy semejantes al menos con respecto a los principales factores pronóstico.
Para ello hay diversos procedimientos. A continuación, se describe uno de los más empleados:
1) Se eligen los dos o tres factores cuya distribución se pretende que sea similar entre ambos grupos
(experimental y control). Por ejemplo, imaginemos que queremos que los grupos sean lo más parecidos
posibles al menos con respecto a la edad (<65, 65 o más), el sexo (varón, mujer) y el estadío de la
enfermedad (I, II, III).
2) Se le asigna un valor numérico a cada categoría de las tres variables. Por ejemplo:

<65: 1 varón: 1 estadío I: 1


65 o más: 2 mujer: 2 estadío II: 2
estadío III: 3
3) El primer paciente reclutado para el EC se asigna al azar a uno de los dos grupos (experimental o control).
A partir de este momento se empieza a contar la puntuación de cada grupo. Por ejemplo, si el primer
paciente es una mujer de 68 años en estadío III, y ha sido asignada por azar al grupo control, tendremos la
siguiente situación: grupo experimental: 0 puntos / grupo control: 7 puntos.
4) Para asignar al segundo paciente, se cuentan sus puntos y se asigna al grupo que tenga menos, para tratar
de equilibrarlo con el otro. Por ejemplo, si el segundo paciente es un varón de 60 años y estadío I, se
asignaría al grupo experimental, y entonces tendríamos: grupo experimental: 3 puntos / grupo control: 8
puntos.
5) Se repite el proceso sucesivamente, asignando al siguiente paciente a aquel grupo que tenga menos puntos,
a fin de igualarlo con el otro. En caso de que haya un empate a puntos entre ambos grupos, el siguiente
paciente es nuevamente asignado al azar.
6) Al final del proceso de asignación, el objetivo debe ser que la puntuación final de ambos grupos sea muy
parecida entre sí (idealmente, debería ser la misma). Entonces, la distribución de las tres variables entre
los dos grupos será también muy parecida entre sí.

3.3. EN FUNCIÓN DE LA EXISTENCIA DE ENMASCARAMIENTO:


El conocimiento de la pertenencia al grupo experimental o al grupo control puede influir en la valoración de
los efectos de la intervención. Por eso, es preferible ocultar ese conocimiento al máximo número de personas
implicadas en el EC. Es lo que se conoce como enmascaramiento o cegamiento. Así, los EC se clasifican en
dos grupos:
a) SIN CEGAMIENTO O ABIERTOS: Todas las personas implicadas en la realización del estudio
conocen a qué grupo pertenece cada uno de los participantes.
b) CON CEGAMIENTO: Algunas de las personas implicadas en la realización del estudio desconocen
a qué grupo pertenece cada uno de los participantes. Hay varios niveles de cegamiento:
─ Simple: Una de las partes involucradas, generalmente los pacientes, no saben al grupo de
comparación al que pertenecen.
─ Doble: Ni los pacientes ni los investigadores/médicos que asignan los sujetos a los grupos,
administran la intervención y valoran el desenlace conocen a qué grupo pertenece cada
paciente.
─ Evaluación ciega por terceros: Cuando el investigador y/o los pacientes saben a qué grupo
pertenecen estos últimos, es posible que una tercera persona, no vinculada al estudio, realice la
valoración del desenlace en cada paciente.
─ Triple: El analista de la información desconoce a qué grupo pertenecen los pacientes.

Para poder mantener el enmascaramiento, es necesario que las intervenciones aplicadas a los grupos de
comparación sean “aparentemente” iguales, lo que no siempre es posible. A tal efecto, es posible el empleo de
un placebo: un preparado sin sustancias farmacológicamente activas, pero de idéntica apariencia y otras

8
características organolépticas que el preparado de experimentación, utilizado para tratar a los sujetos del
grupo control. El empleo de placebos en los EC tiene dos objetivos, relacionados entre sí:
1) Como ya se ha mencionado anteriormente, posibilitar el cegamiento.
2) Controlar el efecto placebo: efecto beneficioso sobre la salud que no depende de las propiedades
farmacológicas de un tratamiento, sino de la sensación psicológica de "recibir un tratamiento". Si a un
grupo de enfermos se les administra un tratamiento y se observa una mejoría en sus síntomas, parte de esa
mejoría puede deberse no a las propiedades farmacológicas del tratamiento, sino a otros factores, entre los
que se encuentran una mejoría espontánea (habrían mejorado aunque no hubieran sido tratados) y, por
supuesto, al efecto placebo del tratamiento. La única forma de saber qué parte de la mejoría observada
depende solo de las propiedades farmacológicas del tratamiento y no de esos otros factores es comparar el
nivel de mejoría de los pacientes tratados con el tratamiento bajo estudio con el nivel de mejoría de los
pacientes tratados solo con placebo. La diferencia entre ambos niveles de mejoría será atribuible
exclusivamente a las propiedades farmacológicas del tratamiento.

El empleo de placebos no debe contravenir el requerimiento ético de clinical equipoise:


 Cuando es ético comparar una intervención frente a la ausencia de intervención alguna, es muy
recomendable administrar únicamente un placebo al grupo control, siempre que sea posible.
 Cuando no es ético comparar una intervención frente a la ausencia de intervención alguna, porque ya
existe un tratamiento estándar de eficacia probada, no es ético administrar únicamente placebo al grupo
control. En este caso es posible utilizar la técnica de doble placebo o doble simulación: Los sujetos del
grupo de intervención reciben la intervención más un placebo del tratamiento estándar; los sujetos del
grupo control reciben el tratamiento estándar más un placebo de la intervención.

3.4. EN FUNCIÓN DE LOS OBJETIVOS DEL ENSAYO:


a) CON FINES TERAPÉUTICOS: Se realizan sobre pacientes. Estos a su vez podrían subdividirse en
explicativos y pragmáticos:
─ Explicativos: El efecto del tratamiento se valora en condiciones lo más experimentales posibles, para
garantizar la máxima validez interna.
─ Pragmáticos: Intenta remedar la práctica clínica todo lo posible, para garantizar la máxima validez
externa.

EXPLICATIVOS PRAGMÁTICOS
Objetivo Aumentar conocimiento Ayudar en las decisiones
Centro de interés Eficacia Efectividad
Enmascaramiento Si A menudo no
Placebo/control Sí A menudo no
Dosis de tratamiento Fija A menudo variable
Criterios de selección Restrictivos Amplios
Otros tratamientos Se evitan A menudo se permiten
Muestra de sujetos Homogénea/Cumplidora Heterogénea/Representativa
Variables de respuesta Acción farmacológica Efecto terapéutico

b) SIN FINES TERAPÉUTICOS: Se realizan sobre voluntarios sanos, económicamente incentivados, y su


finalidad no es demostrar la utilidad terapéutica de un fármaco, sino otras cuestiones relacionadas:
tolerabilidad, dosis máxima tolerada, farmacocinética, farmacodinamia, biodisponibilidad, bioequivalencia,
etc. Se considera asumible un riesgo de 1 a 100 por 1000 de sufrir una complicación leve y de 1-100 por
100.000 de sufrir una complicación grave.

9
3.5. EN FUNCIÓN DE LA HIPÓTESIS DE PARTIDA DEL EC
a) ENSAYOS DE SUPERIORIDAD: En la mayoría de EC, la hipótesis que se pretende demostrar es que el
tratamiento experimental es superior a la estrategia convencional (tratamiento de eficacia contrastada), o a la
ausencia de intervención (en caso de que no exista un tratamiento preexistente de eficacia contrastada), tanto
de un punto de vista estadístico, como clínico. Para esto último, es necesario definir un "umbral de
significación clínica": la mínima diferencia a favor del tratamiento experimental que se desea demostrar.
Supongamos que el parámetro de interés es la RAR (la reducción absoluta del riesgo de muerte atribuible a la
intervención experimental). Antes de iniciar el estudio, los investigadores deben fijar, para este parámetro, el
umbral de relevancia clínica: a partir de qué valor de RAR la intervención experimental produce una
reducción relevante en el riesgo de muerte. Definido éste, el resultado del EC se interpretará a dos niveles:

- Obtención de diferencias estadísticamente significativas entre las dos intervenciones: A partir del
siguiente contraste de hipótesis:
- Hipótesis nula: las dos intervenciones son igual de eficaces: RAR=0
- Hipótesis alternativa: una intervención es más eficaz que la otra: RAR ≠ 0.

Para aceptar la hipótesis alternativa de superioridad, el intervalo de confianza del parámetro estimado
(en nuestro caso, la RAR), no debe incluir a su valor nulo (0, para la RAR).

Aunque se llaman ensayos de superioridad, su hipótesis alternativa (que una intervención es más
eficaz que la otra) puede ser cierta si la intervención experimental es mejor o es peor que la control (y,
obviamente, no es lo mismo una cosa que otra). Por eso, en estos ensayos, los intervalos de confianza
se construyen a dos colas.

- Obtención de diferencias clínicamente relevantes: Diremos que el estudio demuestra la existencia


de diferencias clínicamente relevantes cuando todo el intervalo de confianza del parámetro estimado
se sitúa por encima del umbral de relevancia clínica.

b) ENSAYOS DE NO INFERIORIDAD: La hipótesis que se pretende demostrar en este EC es que el


tratamiento experimental no es peor que el tratamiento estándar (o tratamiento control). Esto puede ser
relevante cuando el tratamiento experimental presente otras ventajas con respecto al estándar (más barato, más
fácil de administrar, menos efectos adversos, etc.). En estos ensayos, la hipótesis nula es que el fármaco
experimental es inferior al control, mientras que la hipótesis alternativa es que el fármaco experimental NO es
inferior (puede ser igual o incluso mejor).

El principio fundamental de estos EC es definir el llamado margen o límite de no inferioridad, o valor delta: la
máxima diferencia entre los tratamientos que se considerará clínicamente irrelevante. El EC dará un resultado
significativo (es decir, rechazará la hipótesis nula de inferioridad), cuando el Intervalo de Confianza del
parámetro estimado no contenga al valor delta, quedando todo él por encima del valor delta (cuando éste es un
valor inferior al nulo), o por debajo del valor delta (cuando éste es un valor superior al nulo), sin que nos
importe que el valor nulo del parámetro quede o no incluido en dicho intervalo. Por ejemplo, si en un ensayo
de no inferioridad de un nueva pauta de quimioterapia frente a la pauta convencional, en relación con el riesgo
de recidiva tumoral, fijamos un valor delta para la RAR de -2% (es decir, aceptamos como clínicamente
irrelevante que el riesgo de recidiva con la nueva pauta supere en dos puntos porcentuales al de la pauta
estándar), diremos que la nueva pauta es no inferior a la estándar si el límite inferior del intervalo de confianza
de la RAR queda por encima de -2% (por ejemplo, de -1,5 a 3,5%), aunque el 0 esté incluido dentro de este
intervalo.

Puesto que en un ensayo de no inferioridad la hipótesis alternativa es, simplemente, que la intervención
experimental no es inferior que la control, nos da igual que sea porque es igual o porque es mejor que la
control. Por eso, los intervalos de confianza se pueden construir a una cola (con solo un límite, más cercano a
la estimación puntual que si fuera a dos colas).

En los ensayos de no inferioridad se suele preferir el análisis por protocolo al de por intención de tratar, pues

10
el segundo tiende a minimizar las diferencias entre grupos, lo que favorece rechazar erróneamente la hipótesis
nula (aumentando así el error alfa del estudio).

3.6. EN FUNCIÓN DE LA PREDETERMINACIÓN O NO DEL TAMAÑO MUESTRAL. En función de


que se predetermine o no el tamaño de muestra necesario se definen dos tipos de EC:
a) ENSAYOS SECUENCIALES: No se predetermina tamaño de muestra, sino que se van reclutando sujetos,
que se van asignando a los grupos experimental o control. De forma previamente planificada, se van
realizando análisis intermedios (ver más adelante), en función de cuyos resultados se decide continuar con el
reclutamiento de pacientes o detener el EC. Este tipo de EC se justifica en que, si a priori la ignorancia sobre
el efecto de un fármaco puede ser total, ésta va desapareciendo a medida que el estudio progresa y se obtiene
información, que puede permitir detener el ensayo en cuanto que ésta sea suficiente, sin incurrir en un
problema ético (por ejemplo, si un fármaco se demuestra eficaz, conviene parar el EC lo más rápidamente
posible, para no privar al grupo control de este avance). Los ensayos secuenciales están especialmente
indicados cuando tienen un único objetivo, se prevé que el tamaño muestral final va a ser grande, la duración
del ensayo es prolongada (>2 años) y el intervalo entre la asignación del tratamiento y la obtención de la
respuesta es breve.

b) ENSAYOS NO SECUENCIALES: Son los ensayos clásicos, en los que existe un tamaño de muestra
prefijado. Para calcular el tamaño de muestra, inicialmente se suele fijar en 0,05 el error alfa (o tipo I)
aceptable (la probabilidad de rechazar la hipótesis nula -que en un ensayo de superioridad sería la igualdad de
resultados entre los dos grupos-, cuando ésta es cierta), y en 0,8 la potencia del estudio (1 - error beta o tipo
II): la probabilidad de detectar diferencias entre grupos cuando estas realmente existen). A menor error alfa y
mayor potencia deseada, mayor debe ser el tamaño muestral. A partir de aquí, el tamaño muestral requerido
depende de dos valores:
─ El más importante es la sensibilidad del estudio, o sea, la mínima diferencia entre los grupos de
comparación que interesa detectar y que, a su vez, depende de la relevancia clínica de los resultados. Así,
para predeterminar la sensibilidad del estudio, habría que determinar cuál es la diferencia más pequeña
entre tratamientos que tiene relevancia clínica (que justificaría decantarse por uno de ellos). Cuanta más
pequeña sea la diferencia que se pretende detectar, mayor debe ser el tamaño de los grupos.
─ La frecuencia esperada de aparición del desenlace en el grupo control que se quiere evitar mediante la
intervención: Cuanto mayor sea ésta, menor tamaño muestral será necesario. Por esta razón, interesa que
la población elegible esté formada por sujetos con una elevada probabilidad de desarrollar el desenlace
que se quiere evitar.
Por ejemplo, la siguiente tabla (tomada de: Haynes et al. "Clinical Epidemiology"), muestra cómo varían los
tamaños muestrales requeridos en cada uno de los dos grupos de un EC (intervención y control), en función de
los dos valores anteriores:
RRR
20% 25% 30% 35% 40%
Frecuencia 0,60 270 173 120 88 67
del desenlace 0,55 324 205 148 105 79
esperado en 0,50 388 247 170 124 93
los controles 0,45 466 298 203 146 111
0,40 564 356 244 176 133
En general, el tamaño deseado para realizar el EC es la principal variable que se ha de considerar a la hora de
decidir si éste debe ser unicéntrico (sólo hay un centro participante) o multicéntrico (hay más de un centro
participante).

3.7. EN FUNCIÓN DE LA FASE DE APLICACIÓN EN EL DESARROLLO DE UN FÁRMACO


Muchos EC se aplican en el desarrollo de nuevos fármacos, que consta de cuatro fases consecutivas:

11
1) FASE 1: Trata de contrastar la seguridad y tolerancia del fármaco, así como estudiar su farmacocinética
y farmacodinamia en seres humanos. Para ello se administra el fármaco a una muestra de voluntarios
sanos (n=30-100), salvo cuando el riesgo de efectos secundarios sea muy elevado (por ejemplo,
quimioterapia en pacientes con cáncer). Son estudios abiertos, de corta duración (de 9 a 18 meses).
2) FASE 2 (Estudios terapéuticos exploratorios): Trata de evaluar de forma preliminar la eficacia del
fármaco, sus indicaciones, la dosis ideal, el mecanismo de acción, su seguridad, y la farmacocinética de
dosis múltiples. Para ello se administra a una muestra de pacientes (n=100-400). Los criterios de
inclusión/exclusión son estrictos y la duración del estudio es de 1 a 3 años. Dentro de ella pueden
diferenciarse dos fases:
─ Fase IIa: Estudios piloto, no controlados, en poblaciones de pacientes muy seleccionadas.
─ Fase IIb: Ensayos controlados con placebo y enmascarados para demostrar la eficacia de una forma
más rigurosa (pivotal trials).

3) FASE 3 (Estudios terapéuticos confirmatorios): Trata de confirmar los objetivos anteriores, de cara a
establecer la relación beneficio/riesgo sobre la que se va a sustentar la aprobación del fármaco para su uso
en la práctica clínica. También va a valorar la seguridad a largo plazo, las interacciones con otros
medicamentos, la farmacocinética clínica, la biodisponibilidad y la formulación definitiva del preparado
comercial. Se realiza sobre una muestra amplia de pacientes (N=1.000-3.000). Se trata de EC
aleatorizados, doble ciego, con placebo y/o fármaco de referencia. Los criterios de inclusión/exclusión son
menos estrictos y duran de 2 a 4 años.
4) FASE 4: Trata de contrastar la efectividad del fármaco (en condiciones reales de uso), la presencia de
efectos adversos de baja incidencia, la existencia de nuevas indicaciones, nuevas formulaciones o vías de
administración, así como la efectividad y seguridad en grupos especiales de pacientes. El tamaño de
muestra es muy grande (n>5.000). Habitualmente en esta fase se realizan estudios observacionales,
aunque también se pueden hacer EC aleatorizados doble ciego, con fármaco de referencia. El tiempo es
ilimitado (el que esté el producto en el mercado). La fase 4 siempre es posterior a la comercialización.

4. ETAPAS EN EL DISEÑO DE UN ENSAYO CLÍNICO


En la planificación y realización de un EC deben tenerse en cuenta una serie de etapas, que se describen de
forma resumida a continuación.

4.1 PLANTEAMIENTO DE LA HIPÓTESIS Y OBJETIVOS DEL ESTUDIO: La hipótesis refleja las


expectativas a priori que los investigadores tienen sobre los resultados esperables del estudio. Los objetivos
son la forma concreta, cuantificable, de verificar o rechazar la hipótesis. Una hipótesis (y sus correspondientes
objetivos asociados) será válida si cumple los siguientes requisitos:
 Es éticamente aceptable (se ajusta al principio de clinical equipoise).
 Es científicamente relevante.
 Es posible darle respuesta con suficiente factibilidad.
Generalmente, todo EC suele tener un Objetivo Primario y uno o varios Objetivos Secundarios. Todos ellos
deben especificarse de antemano.

4.2. ELECCIÓN DEL TIPO DE ENSAYO CLÍNICO: En función de todos los criterios comentados en la
sección anterior.

4.3. APROBACIÓN DEL COMITÉ ÉTICO: Ningún EC podrá realizarse en España sin la aprobación de un
Comité Ético y de la Agencia Española de Medicamentos y Productos Sanitarios. El Real Decreto 1090/2015
define la composición y funciones de los Comités Éticos de Investigación Clínica, así como los criterios que
se deben aplicar para la evaluación de los EC.

4.4. DEFINICIÓN DE LA POBLACIÓN DE ESTUDIO

12
El punto de partida es la identificación de una población evaluada para la inclusión en el estudio. Esta
población debe reunir dos características:
 Presentar la condición cuyo desenlace se desea modificar mediante la intervención (por ejemplo,
padecer una cierta enfermedad, si lo que se está evaluando es el efecto de un fármaco nuevo para
curarla; o no presentarla, si lo que se está ensayando es una vacuna para su prevención).
 Ser accesible a los investigadores (por ejemplo, por acudir al hospital donde éstos trabajan, o pertenecer
a un cierto colectivo profesional fácilmente accesible para ellos, etc.).
Los investigadores aplicarán a esta población un conjunto de criterios de selección, que se establecen a fin de
alcanzar los siguientes objetivos:
a) Aumentar su homogeneidad: La mayor homogeneidad elimina el efecto de terceras variables que
puedan influir en el efecto bajo estudio y que, a su vez, puedan repartirse de forma desigual entre los
grupos de comparación, aunque sea por azar. Así, a mayor homogeneidad, mayor validez interna del
estudio, pero menor validez externa, porque siempre será más difícil extrapolar los resultados a la
población general, que es de por sí heterogénea. En términos generales, la heterogeneidad de los
participantes disminuye la sensibilidad en la detección de efectos y puede conllevar mayores
problemas a la hora de garantizar la comparabilidad entre los grupos, como consecuencia de una
distribución desigual de los factores pronóstico.
b) Asegurar el cumplimiento de los principios éticos del ensayo: Eliminar del ensayo a los sujetos que
presenten alguna contraindicación para la intervención, a los que presenten alguna condición que
vulnere el principio de clinical equipoise y, en general, aquellos sobre los que existan dudas o
incertidumbre acerca de la frecuencia e intensidad de sus posibles efectos adversos (embarazadas,
niños, inmunodeprimidos).
c) Aumentar el cumplimiento de la intervención: Se suele excluir a los sujetos potencialmente malos
cumplidores (ancianos, analfabetos, personas con incapacidades psíquicas, etc.).
d) Facilitar el seguimiento y la valoración de los efectos: Se excluyen sujetos con dificultades para
desplazarse, que vivan alejados del centro de referencia, sin teléfono de contacto, etc.
e) Maximizar el efecto de la intervención: Si el objetivo de una intervención es reducir los niveles de
colesterol, podría considerarse como criterio de selección incluir solo a los pacientes con niveles muy
elevados de colesterol, en los que se prevé que la intervención producirá una reducción de mayor
magnitud y, en consecuencia, más fácilmente detectable.

Los sujetos de la población evaluada que cumplen los criterios de selección pasan a formar parte de la
población elegible: aquella que puede participar en el EC y a la que se podrán extrapolar sus resultados. Uno
de los temas más debatidos es la medida en que los resultados de un EC son generalizables o extrapolables a
otras poblaciones. En general, cuanto más restrictivos sean los criterios de selección, menor será la
extrapolabilidad de sus resultados a poblaciones distintas de la realmente estudiada. Además de este factor, la
extrapolabilidad de los resultados a otras poblaciones depende también de la reproducibilidad de la
intervención y de que los efectos de ésta sean más o menos heterogéneos entre los sujetos.
Una vez seleccionada la población elegible, es necesario plantease a cuántos sujetos de la misma debemos
incluir en el estudio para que el efecto que se quiere valorar se estime con la suficiente precisión (tamaño
muestral; ver apartado 3.6.).

4.5. OBTENCIÓN DEL CONSENTIMIENTO DE LOS PARTICIPANTES

4.6. PERÍODO DE BLANQUEO O DE LAVADO (wash-out period): Siempre que sea éticamente
aceptable, se debe retirar la medicación previa antes de iniciar el estudio y mantener a los pacientes sin
tratamientos durante un período, hasta que los efectos de éstos hayan desparecido.

4.7. PERÍODO DE PREINCLUSIÓN (run-in period): En algunos casos puede ser útil mantener a todos los
pacientes bajo los efectos de un placebo antes de iniciar el estudio, para valorar el nivel de seguimiento del

13
tratamiento. Solo los sujetos que demuestran un aceptable nivel de cumplimiento son aceptados para proseguir
el estudio.

4.8. MEDICIÓN DE LA SITUACIÓN BASAL DE LOS PARTICIPANTES: La medición de las variables


de los pacientes en situación basal (es decir, antes de la intervención), no se suele hacer en un único momento,
sino a lo largo del proceso de selección de los pacientes. Hay que tener en cuenta que algunas de las variables
basales del paciente (por ejemplo la edad o la gravedad de la patología de base) pueden ser criterios de
selección de la población de estudio. Otras variables basales, sin embargo, solo serán valoradas una vez
reclutado el paciente y obtenido su consentimiento. Las variables que se miden son fundamentalmente de dos
tipos:
─ Las que informan sobre la situación basal de la enfermedad del paciente.
─ Las relacionadas con el desenlace que se pretende investigar: los factores pronóstico.
La medición y presentación tabulada de estas variables en los grupos de comparación es fundamental para
poder demostrar a posteriori que los grupos son comparables.
4.9. ASIGNACIÓN DE LOS SUJETOS A LOS GRUPOS DEL ESTUDIO: Salvo en el diseño de Zelen,
siempre es posterior a la obtención del consentimiento informado. Ya se ha comentado anteriormente la
importancia de que la asignación sea aleatoria y del mantenimiento de la ocultación de la secuencia de
aleatorización, así como las principales técnicas de aleatorización.

4.10. INTERVENCIÓN: A los pacientes se les aplica la intervención programada en cada grupo. Si el grupo
control es de no intervención, se le administrará, si es posible, un placebo. Es fundamental que la intervención,
sea del tipo que sea, se aplique de la forma más estandarizada posible, siguiendo un protocolo escrito
previamente aprobado.

4.11. SEGUIMIENTO: El seguimiento es la monitorización de todos los participantes durante el período de


estudio. Debe ser uniforme y homogéneo para todos los grupos de comparación. Ha de estar protocolizado
antes de su inicio en los siguientes términos:
─ Duración mínima y máxima prevista. ─ Instrumentos de medida.
─ Número de contactos con los participantes. ─ Variables que se van a medir en cada contacto.
─ Tipo de contactos.

El seguimiento tiene tres grandes objetivos:

a) MONITORIZACIÓN DEL CUMPLIMIENTO DE LA INTERVENCIÓN: Necesaria cuando la


intervención es autoadministrada a lo largo de un período de tiempo, como es el caso de la mayoría de
fármacos y agentes químicos. Hay muchas maneras de evaluar si un paciente ha cumplido con el plan
terapéutico prescrito; la más utilizada es el recuento de comprimidos, aunque también se pueden realizar
determinaciones bioquímicas.

b) EVALUACION DEL DESENLACE: El protocolo del EC debe especificar cuál es el desenlace primario
(el que justifica el que se lleve a cabo el mismo, en el que se sustenta la verificación de la hipótesis de partida
y sobre el que se basa el cálculo del tamaño muestral), y cuál o cuáles son los desenlaces secundarios. En
muchos ensayos también se especifican desenlaces intermedios (generalmente, el comportamiento de
biomarcadores que, en función de la hipótesis causal propuesta, deberían ser mediadores del resultado final del
ensayo). En ocasiones, el desenlace primario es una combinación de diversos desenlaces, todos ellos
clínicamente relevantes. El empleo de desenlaces primarios compuestos permite reducir el tamaño muestral, al
aumentar la incidencia esperada del desenlace.

Una vez establecidos los desenlaces objeto de interés, el protocolo del EC debe especificar qué variables se
van a definir para cuantificarlos, las fuentes de información, los métodos de recogida de la misma y las
personas encargadas de hacerlo, así como, en su caso, la periodicidad con la que se van a realizar las
determinaciones.

14
c) MONITORIZACIÓN DE ACONTECIMIENTOS ADVERSOS: Llamamos efecto adverso a cualquier
efecto perjudicial o no deseado que ocurre tras la administración de un agente terapéutico. La recogida de
acontecimientos adversos puede darse en dos circunstancias:
→ Cuando el acontecimiento adverso es, precisamente, el efecto que se desea investigar. Esto ocurre en las
fases 1 y 4 (farmacovigilancia) de la investigación de un fármaco.
→ Cuando el acontecimiento es un efecto colateral al efecto terapéutico que se pretende investigar. Esta
evaluación debe efectuarse siempre en todos los EC, correspondientes a cualquier fase del desarrollo del
fármaco. La determinación de la relación causa-efecto entre un acontecimiento adverso y la
administración de un fármaco es un problema de difícil solución, especialmente en los estudios
observacionales. Su constatación depende de cinco factores:
 Consistencia
 Fuerza de la asociación
 Especificidad
 Secuencia temporal correcta
 Plausibilidad biológica

Existe un gran número de algoritmos que permiten adscribir, a cada posible secuencia causa-efecto
adverso, un cierto grado de incertidumbre. Puesto que la aparición de acontecimientos adversos es posible
en cualquier EC, es obligatorio concertar una póliza de seguro, que cubra los posibles daños y perjuicios
derivados de participar en el estudio.

4.12. FINALIZACION DEL ENSAYO CLINICO: La finalización del EC es la suma de los puntos finales
del ensayo correspondientes a cada uno de los pacientes. Estos puntos finales (end points), vienen
determinados por cualquiera de los siguientes factores:

a) Para todos los pacientes incluidos en el EC:


─ Se ha alcanzado el período máximo de duración del EC (medido en tiempo desde el inicio para cada
paciente).
─ No se ha alcanzado el período máximo de duración programada, pero el Comité de Seguimiento del EC
decide interrumpirlo, bien por la obtención precoz, a través de los análisis intermedios, de resultados
epidemiológica y estadísticamente significativos que justifiquen la interrupción, o bien por la aparición de
una tasa inaceptable de efectos adversos.
b) Para cada paciente incluido en el EC:
─ Aparición del desenlace de interés.
─ El Comité de Seguimiento decide retirar a un paciente del EC (withdrawal), porque se desvía del
protocolo. La razón más frecuente para que ocurra esto es que aparezca un efecto adverso que haga que el
paciente deje de tomar el fármaco asignado, pero puede haber otras razones.
─ Pérdida del seguimiento (drop-out), que impide poder valorar si un paciente ha desarrollado o no el
desenlace de interés. Esto puede ocurrir cuando el paciente fallece o cuando decide abandonar el estudio
sin contactar con el Comité de Seguimiento.
Una vez concluido el estudio, los investigadores deben representar gráficamente toda la secuencia de selección
de los participantes, desde el inicio del estudio hasta su finalización. Es lo que se conoce como el flujo de
participantes, indispensable en toda publicación de un EC (ver guía CONSORT).

4.13. ANÁLISIS DE DATOS


Hay que tener en cuenta los siguientes factores:

15
a) TIPO DE VARIABLES DE EFECTO: Los parámetros que se van a estimar en el análisis de un EC
pueden ser muy diferentes en función del tipo de EC y de las variables de resultado que se hayan pre
especificado. En el apartado j) se comentarán algunos de estos parámetros, específicamente para variables
de resultado dicotómicas.
b) NUMERO DE GRUPOS DE COMPARACIÓN: Dos o más de dos (por ejemplo, diseños factoriales).
c) FUENTES DE VARIABILIDAD QUE INTERESA CUANTIFICAR: En general, hay dos fuentes de
variabilidad en las estimaciones del efecto, cuya magnitud debe tenerse en cuenta:
─ Variabilidad intrasujeto: Es la variación de la medida de los efectos en los diferentes momentos del
seguimiento de los pacientes en los que se hacen las mediciones.
─ Variabilidad intersujetos: Es la que depende de las características que diferencian a los sujetos entre
sí, dependiente, a su vez, de los factores o grupos en los que se ha categorizado a la población.

d) SIGNIFICACIÓN ESTADÍSTICA VERSUS SIGNIFICACIÓN CLÍNICA: La significación


estadística hace referencia a la medida en que las diferencias obtenidas en la estimación del efecto entre
los grupos de comparación pueden ser atribuidas al azar o no, independientemente de la magnitud de estas
diferencias. La significación clínica hace referencia a la medida en que la magnitud de las diferencias en la
estimación del efecto entre los grupos de comparación es clínicamente relevante o no, independientemente
de la significación estadística alcanzada.

e) VALORACIÓN DE EFECTOS AISLADOS O DE INTERACCIONES ENTRE


INTERVENCIONES: En los ensayos factoriales, el objetivo es analizar no solo el efecto de cada
intervención por separado, sino la modificación de dicho efecto cuando las intervenciones se aplican sobre
los mismos sujetos o, dicho en otros términos, las interacciones entre sustancias.

f) ANÁLISIS INTERMEDIOS: Independientemente de que el ensayo sea secuencial (donde son


obligados), o no, es posible planificar de antemano la realización de análisis de datos intermedios, antes de
alcanzar el tamaño muestral final. Su objetivo es decidir si el ensayo debe continuar o si, a partir de los
resultados obtenidos en dichos análisis, se puede extraer ya una conclusión que justifique la paralización
del ensayo (dejando así de reclutar pacientes y abriendo el ensayo, si era enmascarado). El problema de
los análisis intermedios es que suponen aumentar el número de test estadísticos realizados, y cuanto mayor
sea su número, mayor es la probabilidad de detectar por casualidad una diferencia estadísticamente
significativa (aumento del error alfa): es decir, detectar diferencias entre tratamientos cuando realmente no
las hay. Por ello, en cada análisis intermedio hay que pre-especificar un valor alfa a partir del que se va a
establecer la significación estadística, y que será menor al alfa habitual para una única prueba (0,05), de
forma que la suma de todos los errores alfa del conjunto de análisis intermedios planificados no lo supere.

g) CONTROL DE LA FALTA DE ADHERENCIA AL TRATAMIENTO: No todos los pacientes


aleatoriamente asignados a cada uno de los brazos de un EC cumplen el protocolo de actuación. Es
frecuente que algunos de los pacientes dejen de tomar el tratamiento asignado o incluso cambien de
tratamiento. En esta situación se pueden plantear dos estrategias de análisis de los datos:

- Análisis por intención de tratar: Valorar las estimaciones de efecto en relación con todos los pacientes
asignados aleatoriamente a cada grupo, con independencia de que hayan cumplido o no el protocolo.

- Análisis por protocolo: Restringir el análisis únicamente a los sujetos que han cumplido el protocolo del
estudio.

Al mantener la comparación entre grupos repartidos al azar, la primera estrategia respeta el principio de
comparabilidad de los grupos, lo que aumenta la validez interna del ensayo. Cuando se analizan solo los
sujetos que han cumplido el protocolo se pierde esta comparabilidad, pues la no adherencia al mismo no
es un fenómeno aleatorio; puede estar asociada al desenlace bajo estudio. Sin embargo, si el volumen de
incumplidores es elevado, el ensayo pierde la capacidad para detectar el verdadero efecto de la
intervención experimental sobre el desenlace.

16
h) CONTROL DE LAS PÉRDIDAS DEL SEGUIMIENTO: En los sujetos que se pierden del estudio
durante el seguimiento no es posible saber si acabarán desarrollando o no los desenlaces de interés. Si las
pérdidas están relacionadas tanto con el grupo de comparación como con el desenlace, la estimación del
efecto de la intervención estará sesgada. Es pues necesario minimizar este problema, uno de los
principales que pueden aparecer en un EC, haciendo un seguimiento lo más exhaustivo posible de todos
los participantes (incluso de los que no se adhieren al protocolo). No obstante, ante la existencia de
pérdidas, es recomendable aplicar las siguientes estrategias de análisis:

1. Recoger toda la información posible sobre los sujetos perdidos. Ello permitirá determinar si son
diferentes de los no perdidos, identificar los factores asociados a las pérdidas y si éstas pueden estar
relacionadas con los desenlaces de interés.

2. Imputar los valores de los desenlaces en los sujetos que han abandonado el estudio (análisis de
imputación múltiple).

3. Hacer un análisis de sensibilidad: Simular un rango de aparición de desenlaces en los sujetos que han
abandonado el estudio para obtener, a partir de ellos, un rango de valores plausibles para la estimación del
efecto de la intervención.

i) ANÁLISIS DE SUBGRUPOS: En muchas ocasiones, en el protocolo de un EC se puede plantear como


hipótesis adicional (objetivo secundario), que el efecto de la intervención pueda variar en función de
subgrupos de pacientes (por ejemplo, que sea mayor en hombres que en mujeres o en estadios leves que en
avanzados). En esta situación, el investigador puede planificar la realización de análisis para valorar este
fenómeno, que en epidemiología se denomina modificación de efecto. El análisis de subgrupos está sujeto
a múltiples errores (por ejemplo, se aumenta la probabilidad de cometer errores tanto de tipo I como de
tipo II), especialmente si los subgrupos se definen "a posteriori" (es decir, una vez concluido el EC). Por
ello, la definición de los subgrupos de interés debe especificarse antes de la realización del ensayo y, en
cualquier caso, siempre tendrá un objetivo exploratorio, nunca confirmatorio.

j) ANÁLISIS PARA VARIABLES DICOTÓMICAS: La mayoría de ensayos clínicos se construyen a


partir de cohortes fijas (ver el concepto en el siguiente tema). Para la situación más sencilla, en la que hay
una variable de desenlace dicotómica (por ejemplo, la defunción) y dos grupos de comparación
(intervención y control), la tabla de datos tendría la siguiente estructura:

Desenlace No desenlace Total


Intervención a b n1
Control c d n0
A partir de esta tabla pueden obtenerse las siguientes estimaciones:
IAe = a/n1

IAo = c/n0
Suponiendo que la intervención reduce la incidencia del desenlace (muertes, en el ejemplo), las
estimaciones que se podrían calcular a partir de las dos incidencias acumuladas anteriores serían las
siguientes (ver fórmulas en el tema 10): RR, RRR, RAR y NNT.

5. VALORACIÓN DE LA CALIDAD DE UN ENSAYO CLÍNICO


Desde hace ya algunos años, a los autores de EC se les recomienda que, a la hora de redactar los resultados del
estudio de cara a su publicación, utilicen las normas CONSORT (CONsolidated Standards of Reporting
Trials), elaboradas en 1996 y actualizadas por última vez en 2010. El cumplimiento de los protocolos
establecidos en esta guía es un requisito exigido cada vez con mayor frecuencia por parte de los editores de las
revistas científicas, para aceptar la publicación del EC.

17
Por lo demás, es frecuente el empleo de diversas herramientas para valorar la calidad de un EC. Una de las
más empleadas, aunque no muy fiable, es la escala de Jadad, que valora la calidad del EC un ensayo en un
rango de 0 a 5 puntos en función de que cumpla o no los siguientes criterios:
- Si el estudio fue aleatorizado.
- Si se describió y es adecuado el método para generar la secuencia de aleatorización.
- Si el estudio fue doble ciego.
- Si las condiciones de enmascaramiento son adecuadas.
- Si están descritas las pérdidas y retiradas.

En general, se considera que el ensayo es de pobre calidad si la puntuación es inferior a 3.

Otra herramienta muy empleada para valorar la calidad de un EC es la evaluación del riesgo de sesgo de la
Colaboración Cochrane.

18

También podría gustarte