Está en la página 1de 13

Epidemiologa y Estadstica

ndice
TEMA 1. ESTUDIO DE UN TEST. PARMETROS DE USO. ..................................................3
1.1. Estudio de un test. .....................................................................................................3
1.2. Relacin entre prevalencia y valores predictivos........................................................3
1.3. Aceptabilidad de un mtodo diagnstico. ..................................................................3
1.4. Screening. ...................................................................................................................4
TEMA 2. TIPOS DE ESTUDIOS EPIDEMIOLGICOS. ...........................................................4
2.1. Estudios descriptivos. .................................................................................................4
2.2. Estudios analticos. .....................................................................................................4
TEMA 3. ENSAYO CLNICO ......................................................................................................6
3.1. Introduccin. ..............................................................................................................6
3.2. Etapas en la realizacin de un ensayo clnico. ............................................................7
3.3. Tipos de ensayos clnicos. ..........................................................................................8
TEMA 4. VALIDEZ Y FIABILIDAD DE LOS ESTUDIOS EPIDEMIOLGICOS. .....................9
4.1. Tipos de Error. ...........................................................................................................9
4.2. Validez y fiabilidad. ...................................................................................................10
4.3. Validez de un test diagnstico. .................................................................................10
TEMA 5. ESTADSTICA DESCRIPTIVA. ................................................................................10
5.1. Variables. ..................................................................................................................10
5.2. Sntesis de los datos. ................................................................................................10
5.3. Distribucin normal o de Gauss. ..............................................................................11
TEMA 6. CONTRASTE DE HIPTESIS. ................................................................................11
6.1. Hiptesis nula, hiptesis alternativa y grado de significacin estadstica. .................11
6.2. Errores alfa y beta. ...................................................................................................12
6.3. Pruebas de significacin estadstica. .........................................................................12
TEMA 7. ANLISIS DE CORRELACIN Y REGRESIN. ....................................................13
TEMA 8. TAMAO MUESTRAL. .............................................................................................13

Pg. 1

miniMANUAL CTO

Pg. 2

Epidemiologa y Estadstica
TEMA 1. ESTUDIO DE UN TEST.
PARMETROS DE USO.
1.1.

Estudio de un test.

La actividad epidemiolgica estudia la frecuencia de enfermedad.


Sin embargo, todas sus medidas son realmente de la frecuencia de
diagnsticos de enfermedad, de ah la importancia de conocer la
autntica correspondencia entre el diagnstico y la realidad patolgica. Muy pocas pruebas diagnsticas, quiz ninguna, identican
con certeza si el paciente tiene o no la enfermedad.
La ecacia de una prueba diagnstica depende de su capacidad
para detectar correctamente la presencia o ausencia de la enfermedad que se estudia, lo que se expresa matemticamente en cuatro
ndices como: sensibilidad, especicidad, valor predictivo positivo
y valor predictivo negativo.
Estos ndices se obtienen a partir del anlisis de una serie de
pacientes a los que se les realiza una prueba diagnstica (prueba
problema), comparndose los resultados con los de una prueba
de superior rendimiento diagnstico (prueba de referencia). Los
resultados obtenidos se expresan de la siguiente manera:
Tabla 1.

VP
a

FP
b

Total positivos
a+b

FN
c

VN
d

Total
negativos
c+d

Total de
enfermos
a+c

Total de
sanos
b+d

TOTAL
INDIVIDUOS
a+b+c+d

Verdaderos positivos. Resultados positivos en sujetos enfermos.


Verdaderos negativos. Resultados negativos en sujetos sanos.
Falsos positivos. Resultados positivos en sujetos sanos.
Falsos negativos. Resultados negativos en sujetos enfermos.

Sensibilidad (S). Se dene como la probabilidad de que un


individuo enfermo tenga un test +. La sensibilidad indica la
proporcin del total de enfermos que el test es capaz de detectar
(MIR 03-04, 143; MIR 00-01F, 238; MIR 98-99F, 205).
Especicidad (E). Probabilidad de que un individuo sano tenga
un test -. La especicidad indica la proporcin de individuos
sanos conrmados como tales por el resultado negativo del test
(MIR 98-99F, 208).
Tasa de falsos negativos (TFN). Es la probabilidad de que un
individuo estando enfermo sea clasicado como sano.
Tasa de falsos positivos (TFP). Es la probabilidad de que a un
individuo sano se le clasique como enfermo.
Razn de probabilidad positiva. Compara la probabilidad de que
un paciente enfermo presente un resultado positivo comparado
con la probabilidad de que el resultado positivo se presente en un
individuo sano (MIR 99-00F, 209; MIR 98-99, 198; MIR 98-99, 201).
RP+ = S/1-E

Razn de probabilidad negativa. Compara la probabilidad


de que un paciente enfermo presente un resultado negativo
comparado con la probabilidad de que el resultado negativo se
presente en un individuo sano.
RP- = 1-S/E

Valor predictivo positivo. Se trata de la proporcin de verdaderos


positivos entre aquellos que han sido identicados como positivos en una prueba de test (MIR 03-04, 135; MIR 01-02, 205;
MIR 99-00, 239; MIR 98-99, 199; MIR 98-99F, 204; MIR 97-98,
81; MIR 96-97, 138; MIR 96-97, 139; MIR 95-96, 30; MIR 95-96F,
60; MIR 94-95, 60).
Valor predictivo negativo. Se trata de la proporcin de verdaderos negativos entre aquellos que han sido identicados como

*
*

negativos en un test (MIR 03-04, 135; MIR 02-03, 28; MIR 00-01,
217; MIR 94-95, 236).
Valor global (eciencia) del test. Indica la proporcin de resultados vlidos entre el conjunto de resultados.
Sensibilidad + Tasa de falsos negativos = 100%.
Especicidad + Tasa de falsos positivos = 100% (MIR 96-97, 152;
MIR 95-96F, 54).

El resultado de un test puede ser continuo (p. ej. niveles de


glucemia en mg/dl) y entonces hay que decidir cul se considerar
como resultado positivo, hay que elegir un punto de corte.
El punto de corte escogido determinar la sensibilidad y especicidad de la prueba (si escogemos 70, la prueba ser muy sensible y poco especca; si escogemos 140, ser poco sensible y muy
especca) (MIR 96-97, 142).
Para determinar el punto de corte se pueden utilizar las curvas
de caractersticas operativas para el receptor (COR). Se seleccionan
varios puntos de corte y se estima la sensibilidad y especicidad
para cada uno de ellos. Posteriormente, se representa grcamente
la sensibilidad en funcin de (1-Especicidad). La prueba ideal se
sita en el ngulo superior izquierdo (S y E = 1).
Una prueba sin ningn valor sigue la diagonal que va del ngulo
inferior izquierdo al ngulo superior derecho (cada incremento
de la sensibilidad se asocia a una prdida de igual magnitud de
especicidad).
De esta forma, la sensibilidad y la especicidad son valores interdependientes, de forma que si aumenta la sensibilidad disminuye
la especicidad y viceversa. Si se adoptan criterios de diagnstico
muy estrictos disminuye la sensibilidad (hay menos enfermos que
cumplen estos criterios), y paralelamente aumenta la especicidad
(pocos sanos cumplen estos criterios) (MIR 01-02, 206; MIR 99-00F,
217; MIR 99-00F, 203; MIR 98-99F, 209; MIR 96-97, 147; MIR 96-97F,
216; MIR 96-97F, 197).

1.2.

Relacin entre prevalencia y valores predictivos.

Los valores predictivos de un test son variables, dependen de la


prevalencia de la enfermedad en la poblacin. La sensibilidad y la
especicidad son caractersticas propias del test y no se modican
con cambios en la prevalencia.
Si la prevalencia de la enfermedad aumenta, aumenta el valor
predictivo positivo, mientras que disminuye el valor predictivo negativo (MIR 99-00F, 203; MIR 97-98, 63; MIR 97-98, 87; MIR 97-98F,
69; MIR 95-96, 151).
Si la prevalencia de la enfermedad disminuye, aumenta el valor
predictivo negativo y disminuye el valor predictivo positivo (MIR
96-97, 147; MIR 95-96, 95).

1.3.

Aceptabilidad de un mtodo diagnstico.

No existe un parmetro gua til para todas las situaciones. La


aceptabilidad de un test depende de la patologa estudiada y de las
condiciones reales en el medio y en la colectividad.
Si lo que interesa es detectar el mayor nmero posible de enfermos, se debe usar un test con alta sensibilidad. As se nos escaparn
pocos, aunque al precio de bastantes falsos positivos. Elegiremos
un test sensible cuando:
La enfermedad sea grave y no pueda pasar desapercibida.
La enfermedad sea tratable.
Los resultados falsamente positivos no supongan un traumatismo psicolgico en los individuos examinados (MIR 98-99,
200).
Si lo que quieres es asegurar el diagnstico, debes usar un test
cuya especicidad sea mxima.
Utilizaremos un test lo ms especco posible cuando:
La enfermedad sea importante, pero difcil de curar o incurable.
Los resultados falsamente positivos puedan suponer un trauma
psicolgico para el individuo examinado.

Pg. 3

miniMANUAL CTO

El tratamiento de los falsos positivos pudiera tener graves consecuencias (MIR 02-03, 49; MIR 01-02, 203; MIR 00-01, 210; MIR
96-97, 130; MIR 95-96F, 49).

1.4.

Screening.

Estrategia de deteccin precoz de la enfermedad. Lo ideal es aplicar


primero un test muy sensible (detecta todos los casos posibles de
enfermedad se obtienen muchos FP y pocos FN) y en una segunda
fase aplicar un test muy especco (se conrma el diagnstico de
esos posibles enfermos se obtienen muy pocos FP).
En la puesta en marcha de un programa de screening deben
tenerse en cuenta criterios dependientes de la enfermedad, del test
y de la poblacin diana.
1) Criterios dependientes de la enfermedad.
La enfermedad debe ser comn y grave.
Debe conocerse la historia natural de la enfermedad.
El tratamiento, en el estado presintomtico, debe reducir la
morbimortalidad en mayor medida que el tratamiento despus
de la aparicin de los sntomas.
2)

Criterios dependientes del test.


De fcil aplicacin.
Coste razonable dentro del presupuesto de salud.
Inocua para la poblacin.
Conabilidad o capacidad de repeticin.
Validez. Se reere a la capacidad del test de medir lo que realmente deseamos medir. El concepto de validez incluye los de
sensibilidad, especicidad y valor predictivo.

3) Criterios dependientes de la poblacin diana.


El riesgo de ser afectado por la enfermedad debe ser alto.
La informacin demogrca debe estar disponible en la comunidad.
La comunidad debe sentir la necesidad de programas de salud
pblica.
(MIR 98-99F, 213; MIR 97-98, 66; MIR 96-97, 145; MIR 95-96,
109; MIR 95-96F, 188).

TEMA 2. TIPOS DE ESTUDIOS


EPIDEMIOLGICOS.
2.1.

Estudios descriptivos.

Los objetivos de los estudios descriptivos son:


1. Describir las caractersticas y la frecuencia de un problema de
salud, en funcin de las caractersticas de PERSONA (edad, sexo,
estado civil...), de LUGAR (rea geogrca...) y de TIEMPO de
aparicin del problema y su tendencia.
2. Servir de base para estudios analticos.
1. Series de casos clnicos. Describen las caractersticas de
un grupo de enfermos. Son estudios longitudinales, ya que
contienen informacin adquirida a lo largo del tiempo. Su
principal ventaja es que permiten generar nuevas hiptesis,
mientras que el mayor inconveniente es que no presentan
grupo control, por lo que cualquier FR puede ser un hallazgo
casual.
2. Estudios ecolgicos. Pueden ser transversales o longitudinales. Son estudios en los que la unidad de anlisis son grupos
de individuos (MIR 04-05, 194), no individuos (p.ej. clases
de una escuela, ciudades, regiones). Son tiles cuando no
se pueden hacer mediciones de exposicin individuales
(contaminacin del aire, ruidos, etc.).
Ventajas. Permiten describir diferencias en poblaciones
que habrn de ser estudiadas con ms detalle posteriormente (MIR 00-01, 198).
Limitaciones. Los datos son promedios de poblaciones.
Se usan medidas aproximadas de exposicin (impuestos
por alcohol, ventas de cajetillas de cigarrillos...) y de
enfermedad (mortalidad en vez de incidencia...) lo que
limita el valor de los hallazgos.

Pg. 4

3. Estudios transversales o de prevalencia. Son estudios descriptivos y transversales, ya que estudian la relacin entre una
enfermedad y algunas variables en un momento concreto del
tiempo. Buscan hallar una posible relacin entre un FR y una
enfermedad, que luego habr de ser vericada por estudios
analticos (MIR 00-01, 195; MIR 00-01F, 240).
Caractersticas. Es de corte o transversal, ya que enfermedad y caractersticas se miden simultneamente.
Ventajas. No tienen problemas ticos, son de duracin
mnima, su coste es bajo y son de fcil reproductibilidad.
Son tiles para el estudio de enfermedades crnicas en la
poblacin (MIR 99-00F, 205; MIR 95-96, 37).
Inconvenientes. No es til para estudiar enfermedades
raras, no permite ver el mecanismo de produccin de la
enfermedad y no sirve para comprobar una hiptesis previa
de causalidad (no es posible conocer la secuencia temporal
porque la informacin sobre el factor de riesgo y la enfermedad se recogen a la vez) (MIR 01-02, 202; MIR 97-98, 62;
MIR 96-97F, 214; MIR 95-96, 29).
Anlisis de las medidas de enfermedad. Con el estudio de prevalencia, la medida que se obtiene es la RAZN DE PREVALENCIA
de individuos expuestos (MIR 96-97, 136; MIR 95-96F, 53).

2.2.

Estudios analticos.

Los estudios analticos (intentan establecer una relacin de causalidad entre el factor de riesgo y la enfermedad) se pueden clasicar en
experimentales y observacionales. En los estudios experimentales
es el investigador el que asigna el factor de estudio (qu frmaco,
vacuna, campaa de educacin... cunto tiempo, cundo, cunta
dosis recibirn los individuos...) mientras que en los observacionales, el investigador se limita a observar qu es lo que sucede en un
grupo de individuos, sin manipular el estudio.

2.2.1. Estudios analticos experimentales.


TERMINOLOGA.
Decimos que un estudio es experimental cuando cumple dos
condiciones:
Asignacin por parte del investigador del factor de estudio.
Aleatorizacin de la muestra, de modo que los participantes son
adscritos al azar a uno u otro grupo de estudio.
LIMITACIONES.
Problemas ticos. Es el principal inconveniente de este tipo de estudios. No es admisible exponer a unos sujetos a un factor de riesgo
que presumiblemente es el causante de una enfermedad.
VENTAJAS.
Son los estudios que mejor valoran la utilidad de una intervencin y aportan mayor evidencia causal (MIR 02-03, 27).
Permiten un gran control sobre cualquier efecto que no sea el
estudiado.
Permiten el empleo de tcnicas de enmascaramiento.

Figura 1.

Ensayo clnico aleatorio.

Epidemiologa y Estadstica
1. Ensayo clnico aleatorio. Es, con mucho, el estudio experimental
ms frecuente. La asignacin aleatorizada del factor de estudio
(un frmaco o intervencin sanitaria) se hace sobre los individuos. Es el que ofrece la mejor evidencia de una posible relacin
causa-efecto y la ecacia de una actuacin (MIR 99-00, 229; MIR
98-99, 259; MIR 97-98, 78; MIR 97-98F, 74; MIR 96-97F, 211; MIR
96-97, 144) (ampliar estudio en Tema 8).
2. Ensayo de campo. Es un estudio experimental que valora la ecacia de una medida preventiva. En general, estos estudios son
ms caros que los ensayos clnicos y requieren mayor nmero
de individuos. Las principales diferencias respecto a los ensayos
clnicos son:
Se hacen sobre individuos sanos.
Valoran la ecacia de las medidas preventivas (MIR 99-00,
242).

2.2.2. Estudios analticos cuasiexperimentales.


Se diferencian de los estudios experimentales puros en que no hay
asignacin al azar (aleatorizacin).
1. Ensayo comunitario de intervencin. Son una variedad de los
ensayos de campo (MIR 00-01, 194).
Se aplica a individuos sanos.
Valora la ecacia de medidas preventivas.
No se aplica aleatorizacin individual.
2. Ensayos antes-despus. En este tipo de estudios, el frmaco (o
medida en general) se administra a los individuos y se compara
el resultado con la situacin basal. Los estudios antes-despus
tienen la ventaja de que son ms fciles de hacer, pero tienen el
inconveniente grave de que, al no disponer de grupo de control,
los resultados son difciles de interpretar.

3. Estudios controlados no aleatorios. Se realizan cuando la asignacin aleatoria, o no ofrece ventajas, o no se puede hacer.

2.2.3. Estudios analticos observacionales.


1. ESTUDIOS DE COHORTES.
DESCRIPCIN.
Partiendo de un grupo de individuos expuestos al factor de riesgo
(cohorte expuesta), y de otros comparables en todo pero que no
estn expuestos al FR (cohorte no expuesta), se estudia la incidencia
de la enfermedad en ambas cohortes (MIR 04-05, 194; MIR 03-04,
132; MIR 01-02, 199; MIR 00-01F, 237; MIR 94-95, 239).
El Riesgo relativo (RR) es la medida de asociacin en los estudios de cohortes. Mide la fuerza de la asociacin entre el factor de
riesgo y la enfermedad. Puede variar entre 0 e innito (MIR 03-04,
136; MIR 03-04, 149; MIR 03-04, 152; MIR 02-03, 29; MIR 00-01, 193;
MIR 98-99F, 211; MIR 96-97, 129).
Responde a la pregunta: Cunto ms frecuente es la enfermedad entre los expuestos a un factor de riesgo, respecto a los no
expuestos?

Su signicado vara dependiendo del valor que tome:


RR > 1 Factor de riesgo (FR).
RR = 1 Indiferente. La incidencia es igual en expuestos y no
expuestos.
RR < 1 Factor de proteccin.

Incidencia en expuestos: Ie = a/a+b


Incidencia en no expuestos: Io = c/c+d
(MIR 01-02, 212; MIR 99-00F, 211; MIR 99-00F, 198; MIR 97-98F,
83).
Otras medidas utilizadas en los estudios de cohortes son las
de impacto:

ESTUDIOS EPIDEMIOLGICOS

ESTUDIOS ANALTICOS
(analizan hiptesis)

ESTUDIOS DESCRIPTIVOS
(describen una situacin)

- Series de casos clnicos.


- Estudios ecolgicos.
- Estudios descriptivos de mortalidad.
- Estudios descriptivos de morbilidad.
- Estudios de prevalencia (estudios transversales).

Existe asignacin controlada


del factor de estudio?
SI

NO

Existe asignacin
aleatoria de los sujetos?

ESTUDIO OBSERVACIONAL

SI

NO

ESTUDIO EXPERIMENTAL

ESTUDIO CUASI-EXPERIMENTAL

Eleccin de los sujetos


en funcin de?

Enfermedad
(efecto)
- Ensayo clnico.
- Ensayo de campo.
- Ensayo clnico cruzado.

- Ensayo comunitario de intervencin.


- Estudio antes-despus.
- Estudios controlados no aleatorizados.

Exposicin
al factor

Existe hitoria previa


de exposicin?
SI

NO

Estudio de
casos-controles

Estudio de prevalencia
(transversal)

Estudio de
cohortes

Figura 2. Tipos de estudios epidemiolgicos.

Pg. 5

miniMANUAL CTO
El Riesgo atribuible una medida que informa sobre el exceso
de riesgo en los individuos expuestos frente a los no expuestos al
factor de riesgo. Indica la incidencia acumulada en el grupo de expuestos que se debe exclusivamente al factor de riesgo. Representa
el descenso en el nmero de casos nuevos entre los expuestos si
se evitara el FR (MIR 03-04, 127; MIR 03-04, 152; MIR 00-01F, 249;
MIR 94-95, 237).
RA = Ie - Io
La Fraccin etiolgica del riesgo es la proporcin de la enfermedad que se debe a la exposicin, es decir, la proporcin de casos
nuevos de enfermedad, entre los expuestos, que se evitara si eliminsemos el factor de riesgo (MIR 02-03, 39; MIR 98-99, 193).

CARACTERSTICAS DE LOS ESTUDIOS DE COHORTES.


Son estudios longitudinales, de seguimiento.
Es prospectivo (excepto en los estudios de cohortes histricas).
Va de la causa al efecto (enfermedad).
VENTAJAS.
Es el mejor estudio para comprobar hiptesis previas de causalidad, cuando, por razones ticas, no es posible realizar un
estudio experimental.
Es el mejor para el estudio de la multiefectividad del factor de
riesgo (todos los efectos del factor de riesgo).
La posibilidad de sesgos es baja.
Sirven para el estudio de exposiciones raras.
INCONVENIENTES.
No es bueno para el estudio de enfermedades raras (MIR 01-02,
198).
No es bueno para el estudio de enfermedades de largo perodo
de incubacin.
El coste es alto.
No sirve para el estudio de la multicausalidad de la enfermedad.
Son difcilmente reproducibles.
Anlisis de las medidas de la enfermedad. Los estudios de
cohortes son los que permiten saber cul es la incidencia de la
enfermedad. Las medidas que se obtienen son:
Riesgo relativo. Es la medida de la fuerza de la asociacin.
Diferencia de incidencias o riesgo atribuible. Informa sobre el
exceso de riesgo de enfermar.
Fraccin atribuible. Estima la proporcin de la enfermedad entre
los expuestos, que es debida al factor de riesgo.
(MIR 99-00, 235)
2. ESTUDIOS DE COHORTES HISTRICAS (retrospectivas).
El investigador identica, mediante registros, una cohorte expuesta en el pasado a un factor de riesgo, y otra cohorte no expuesta.
Mediante dichos registros (p.ej. historias clnicas) sigue la evolucin de ambas cohortes, comparando los resultados (MIR 04-05,
196).
Por ejemplo: Los trabajadores que son despedidos, sufren una
mayor morbilidad que los que no son despedidos?
En 1989 se dise un estudio de cohortes retrospectivo, consistente en identicar a los trabajadores despedidos de una fbrica.
De esa misma localidad, se identic a otro grupo de trabajadores
que siguieron trabajando. Mediante las historias clnicas, se estudi
la morbilidad de ambas cohortes.
3. ESTUDIO DE CASOS-CONTROLES.
DESCRIPCIN.
Partiendo de un grupo de individuos enfermos (casos), y de otros
comparables a ellos en todo, pero que no tienen la enfermedad
(controles), se estudia la exposicin, en ambos, a distintos factores
de riesgo (MIR 04-05, 193; MIR 03-04, 129; MIR 03-04, 137; MIR 0102, 196; MIR 00-01, 197; MIR 95-96F, 56).
La Odds Ratio es la medida bsica de los estudios casos-controles. Su signicado es idntico al del RR, aunque no puede calcularse
como l, ya que en los estudios casos-controles no puede calcularse

Pg. 6

la incidencia de la enfermedad. Para que la OR sea un buen estimador del RR es necesario que los controles sean representativos de
la poblacin de la que han surgido los casos y que la enfermedad
tenga una incidencia baja, inferior al 10%. (MIR 02-03, 36; MIR 0001, 196; MIR 99-00F, 209).

CARACTERSTICAS DE LOS ESTUDIOS DE CASOS Y CONTROL.


Es un estudio longitudinal.
Es retrospectivo.
Va del efecto (enfermedad) a la causa.
VENTAJAS.
Es de corta duracin.
Es ideal para el estudio de enfermedades raras.
Es el mejor para el estudio de enfermedades de largo perodo
de induccin.
El coste es bajo.
Es el mejor para el estudio de la multicausalidad de la enfermedad (los posibles factores de riesgo de una determinada
enfermedad).
Es el mejor para formular nuevas hiptesis etiolgicas.
INCONVENIENTES (MIR 04-05, 206).
No es bueno para comprobar hiptesis previas de causalidad.
No permite el estudio de la multiefectividad del factor de riesgo.
La posibilidad de sesgos es muy alta, su control difcil.
Anlisis de las medidas de la enfermedad. En los estudios de
casos-controles no puedes obtener informacin sobre la incidencia
de la enfermedad, ya que partes de una poblacin seleccionada.
Tampoco tienes informacin sobre la prevalencia, ya que el nmero de enfermos slo depende de los que t elijas. Debido a ello, la
fuerza de la asociacin no se puede calcular directamente, como en
el estudio de cohortes, sino de forma indirecta mediante la ODDS
RATIO (MIR 99-00, 234).
Tabla 2. Diferencias entre los estudios de cohortes y los de
casos y controles.

Definida

Indefinida

No

Varios

Uno

Una

Varias

Poco til

Muy til

Muy til

Poco til

Pocos

Muchos

Muchos

Pocos

Elevado

Bajo

Larga

Corta

Regular

Mala

TEMA 3. ENSAYO CLNICO


3.1.

Introduccin.

Un ensayo clnico es un experimento cuidadosa y ticamente


diseado con el n de dar respuesta a preguntas que tienen que
ver con la utilidad de procedimientos diagnsticos, teraputicos y
prolcticos en el ser humano. Los ensayos clnicos son estudios
prospectivos y experimentales en los que, una vez seleccionada
la muestra, se divide aleatoriamente en dos grupos de pronstico
comparable que idealmente slo se diferencian en la intervencin

Epidemiologa y Estadstica
teraputica que van a recibir (MIR 04-05, 207; MIR 04-05, 200; MIR
99-00F, 216; MIR 96-97F, 198; MIR 96-97F, 211; MIR 95-96F, 48).
Teniendo en cuenta los objetivos perseguidos en el desarrollo
de un medicamento, se distinguen 4 fases:
Ensayo en fase I: es la primera vez que un frmaco se da a humanos. Generalmente se realiza con voluntarios sanos (n=20-80)
y sin grupo control. El principal objetivo es evaluar la toxicidad
y conocer la dosis nica aceptable no txica.
Ensayo en fase II: el principal objetivo es aportar informacin sobre la relacin dosis/respuesta, proporcionando una informacin
preliminar sobre la ecacia. Se hacen en pacientes (n=100-200).
No necesariamente tienen que ser comparativos (MIR 04-05, 216;
MIR 02-03, 23).
Ensayo en fase III: es el prototipo del ensayo clnico (MIR 0405, 201). Suele ser comparativo con la teraputica de referencia
o con un placebo. Es la investigacin clnica ms extensa y
rigurosa sobre un tratamiento mdico. Sirve para establecer la
ecacia de un nuevo frmaco y la existencia de efectos adversos
frecuentes.
Ensayo en fase IV: tambin se denomina farmacovigilancia y
consiste en el seguimiento postcomercializacin de un nmero
muy elevado de pacientes con el n de detectar efectos adversos
poco frecuentes o de aparicin tarda. La Fase IV tambin sirve
para evaluar interacciones entre medicamentos y sugerir nuevas
indicaciones de frmacos ya aceptados para otro n.

tendr mayor validez externa. Sin embargo, la muestra ser heterognea, se necesita un mayor tamao muestral y los resultados son
confusos si slo es ecaz en subgrupos de pacientes. Se utilizan en
las fases III y IV.
En esta etapa, tambin hay que determinar el tamao muestral.
Este ha de ser suciente para obtener un IC del 95 % de la ecacia
cuyos lmites sean clnicamente relevantes.

As la Farmacovigilancia es la recogida de datos sobre seguridad de frmacos una vez que se autoriza su comercializacin. Su
objetivo es detectar reacciones adversas poco frecuentes que no
han sido identicadas durante el desarrollo del ensayo, dado que
este se ha realizado en una poblacin limitada (generalmente n <
2000). El Sistema Espaol de Farmacovigilancia recibe informacin
de diferentes fuentes; entre ellas, y principalmente, la Noticacin
Espontnea de reacciones adversas.
La noticacin espontnea de reacciones adversas supone la recogida y noticacin, mediante las tarjetas amarillas, de las reacciones
adversas que aparecen durante la prctica clnica. (MIR 04-05, 209)
En general, se acepta cualquier reaccin adversa. Sin embargo,
las de mayor inters son las reacciones adversas graves, inesperadas o
raras, y aquellas de frmacos de comercializacin reciente (menos de 3
aos). El programa de Noticacin Espontnea est dirirgido especialmente a mdicos, aunque incluye a otros profesionales sanitarios.

3.2.3. Aleatorizacin.
Consiste en asignar por azar, sin que inuya ningn factor, los pacientes de la muestra a los dos grupos de intervencin de modo que,
si el tamao muestral es sucientemente grande, se consiga una distribucin homognea de las variables predictoras en ambos grupos.
Se puede realizar de tres formas diferentes (MIR 02-03, 42):
Aleatorizacin simple: cada paciente tiene la misma probabilidad de ser asignado a cualquiera de los grupos de tratamiento.
Con este mtodo, existe riesgo de desigualdad numrica entre
grupos.
Aleatorizacin por bloques: se establecen bloques de aleatorizacin, de modo que en cada bloque la mitad de los pacientes
reciba el tratamiento experimental y la otra mitad el control. Con
este tipo de aleatorizacin se evita la desigualdad numrica entre
los distintos grupos, por lo que es especialmente til cuando el
tamao muestral no es muy grande.
Aleatorizacin estraticada: los pacientes son divididos en grupos
(estratos) homogneos respecto a alguna variable de inters pronstico y posteriormente son asignados aleatoriamente a uno de
los dos grupos de intervencin (MIR 04-05, 197; MIR 02-03, 24).

3.2.

Etapas en la realizacin de un ensayo clnico.

A continuacin se desarrollan los pasos a seguir para la realizacin


de un ensayo clnico en fase III con dos grupos de intervencin.

3.2.1. Seleccin de la cohorte de estudio.


Consiste en la eleccin de un grupo de sujetos adecuados para
la evaluacin del medicamento, de los cuales se extrapolarn los
resultados del ensayo clnico. Mediante la formulacin de los
criterios de inclusin se establecen las caractersticas clnicas y
sociodemogrcas de los enfermos en los que se emplear el frmaco. Los criterios de exclusin se utilizan para desdear a aquellos
enfermos con criterios de inclusin, pero que presentan alguna
contraindicacin, condiciones que pueden afectar a la variable
resultado o alguna caracterstica que le haga complicado de ser
estudiado (MIR 01-02, 211).
En funcin de los criterios de inclusin, podemos dividir los EC
en dos grandes grupos:
EC pragmticos: se acercan lo ms posible a la poblacin general. Los criterios de inclusin son muy laxos (prcticamente los
nicos son los diagnsticos) (MIR 03-04, 257; MIR 00-01, 200).
EC explicativos: los criterios de inclusin son muy estrictos, por lo
que la poblacin no es exactamente igual a la poblacin general.
Cuando los criterios de inclusin son muy estrictos, el EC presenta una muestra ms homognea y se necesita menor tamao
muestral para detectar las diferencias. Adems, hay mayor validez
interna. Sin embargo, existe una clara limitacin a la hora de generalizar los resultados y de reclutar a los pacientes. Se utilizan, sobre
todo, en las fases II y III.
En cambio, cuando no son estrictos, el reclutamiento se ver
facilitado, se podr generalizar los resultados con mayor facilidad y

3.2.2. Medicin de variables basales.


Consiste en determinar una serie de variables en los sujetos que
cumplen los criterios de inclusin y han aceptado participar en el estudio (consentimiento informado), con los siguientes propsitos:
Denir las caractersticas de la poblacin a la que podr extrapolarse el resultado del ensayo clnico.
Aportar una serie de datos que nos permitan posteriormente
vericar que la aleatorizacin ha sido ecaz y hacer anlisis
estraticado (Ej. por edad) en caso de diferencias entre los dos
grupos (MIR 01-02, 216; MIR 00-01F, 243).
Demostrar que el evento resultado, cuya frecuencia se pretende
disminuir con el frmaco estudiado, no est presente al comienzo del estudio.
Registrar posibles predictores del evento inters, de modo que
se pueda evaluar su interaccin con el frmaco estudiado si la
aleatorizacin no los ha distribuido homogneamente entre los
distintos grupos de estudio.

En general, diremos que la aleatorizacin debe conseguir asignar


los tratamientos de forma desconocida e impredecible. Debe ser
un proceso reproducible y estar documentado. Ha de basarse en
propiedades matemticas conocidas. No debe ser prevista la secuencia de los tratamientos, y nalmente, debe ser posible detectar
los fallos de la asignacin.
Para evitar sesgos en la aleatorizacin es importante que quien
decide la inclusin de los paciente en el ensayo y quien lleva a cabo
la aleatorizacin, desconozcan la secuencia de aleatorizacin hasta
que se aplique a cada uno de los enfermos reclutados. En caso de no
hacerse ocultacin de la secuencia de aleatorizacin, existe la posibilidad de seleccionar incorrectamente a los sujetos del ensayo y perder la
comparabilidad de los dos grupos de tratamiento. La ocultacin de la
secuencia de aleatorizacin se puede conseguir mediante un sistema
de aleatorizacin centralizado en un lugar distinto a aquel en el que se
lleva a cabo el ensayo o mediante sobres numerados secuencialmente,
opacos y lacrados, que contengan el tratamiento y que slo se abran
tras la inclusin del paciente en el EC (MIR 01-02, 211).

3.2.4. Aplicacin de la intervencin.


Es importante evitar que tanto investigadores como otros proveedores de cuidados traten de forma diferente a los dos grupos de
intervencin. Para evitar esto, el llamado sesgo de cointervencin,
y que la medicin de la variable resultado pueda estar sesgada por
el mismo motivo, utilizaremos el enmascaramiento. Los tipos de
enmascaramiento son:
Simple ciego: el paciente desconoce el grupo de tratamiento al
que est asignado.

Pg. 7

miniMANUAL CTO

Doble ciego: paciente, personal sanitario y evaluador de la


variable resultado lo desconocen.
Triple ciego: adems de los anteriores, el analista de los datos
desconoce el tipo de tratamiento de cada uno de los grupos.

Tanto las reacciones adversas especcas como la falta de ecacia


y los cambios analticos especcos pueden desenmascarar un EC.
Otro aspecto a considerar en esta fase del ensayo clnico es que,
siempre que exista un tratamiento ecaz, hay que administrarlo al
grupo control, as que lo que se determinar con el ensayo clnico ser
la ecacia relativa del nuevo frmaco. En caso de no existir alternativa
teraputica previa, se medir la ecacia en trminos absolutos.

3.2.5. Anlisis de los resultados.


En este punto se deben tener en cuenta los siguientes aspectos:
Las prdidas de sujetos incluidos en el ensayo clnico ocurridas antes de la aleatorizacin van a afectar a la capacidad de
generalizacin de los resultados, mientras que las prdidas
postaleatorizacin pueden afectar a la validez interna (MIR
00-01, 203; MIR 00-01F, 242).
El anlisis estadstico de los ensayos clnicos es muy parecido
al de los estudios de cohortes, pero es ms frecuente el uso de
mtodos no paramtricos y, al tener importancia no slo que
ocurra la variable resultado, sino cundo ocurre, es frecuente
el uso de anlisis de supervivencia.
Comparaciones mltiples: al aumentar el nmero de comparaciones, aumenta la posibilidad de resultados falsamente positivos.
Anlisis de subgrupos: puede ocasionar problemas, especialmente cuando no se tiene previsto desde el principio. Produce
comparaciones mltiples, aumenta la probabilidad de resultados espreos, y por tanto, sus resultados deben interpretarse
con precaucin (MIR 00-01F, 244).
Anlisis por intencin de tratar frente a anlisis por protocolo
(MIR 04-05,198; MIR 01-02, 208; MIR 98-99, 194; MIR 97-98,
86):
- Por protocolo: incluye slo a aquellos pacientes que han
cumplido los requisitos del protocolo y/o han nalizado el
estudio.
- Por intencin de tratar: el anlisis incluye a todos los pacientes que han sido seleccionados y en el grupo en el que
fueron asignados, aunque no hayan nalizado el estudio o
hayan cambiado de grupo.

Los anlisis intermedios se realizan durante las fases III y IV


del estudio. Estn justicados para evitar que los pacientes del
grupo control no se benecien del tratamiento. Sin embargo,
el realizar muchos anlisis intermedios aumenta el riesgo de
cometer un error tipo I, debe estar previsto en el protocolo del
estudio, se debe mantener la condencialidad de los resultados
y debe haber una penalizacin estadstica porque, de nuevo, se
estn realizando comparaciones mltiples (MIR 04-05, 203; MIR
04-05, 199; MIR 02-03, 26).
La magnitud del efecto del tratamiento en los ensayos clnicos
se puede expresar de varias formas:
- El riesgo relativo: cociente entre el riesgo de sufrir un determinado evento en el grupo expuesto a un determinado tratamiento y el riesgo de sufrir el mismo evento en el grupo control (no
expuesto al tratamiento) (MIR 02-03, 29; MIR 01-02, 209).
- La reduccin absoluta del riesgo (RAR), que es la diferencia
entre el porcentaje de eventos en el grupo control y el porcentaje de eventos en el grupo experimental (MIR 00-01, 204).
- La reduccin relativa del riesgo (RRR) es la diferencia entre el
porcentaje de eventos en el grupo control y el porcentaje de
eventos en el grupo experimental, dividido por el porcentaje
de eventos en el grupo control.
- El nmero necesario de pacientes a tratar (NNT), que se obtiene
como el inverso de la RAR multiplicado por 100 y es el nmero
de pacientes que se deben tratar para prevenir un suceso indeseable adicional (MIR 03-04, 127; MIR 02-03, 47; MIR 01-02,
207; MIR 00-01, 218; MIR 99-00F, 199; MIR 98-99, 197).
Interpretacin de los resultados. Veamos algunos ejemplos para
analizar los resultados desde un punto de vista crtico:
- En un estudio se presentan los siguientes resultados: mortalidad con placebo 2%, mortalidad con frmaco a estudio

Pg. 8

3.3.

1%. La reduccin relativa del riesgo (RRR) es del 50%. La


reduccin absoluta del riesgo (RAR) es del 1%. El nmero
necesario de pacientes a tratar para evitar un evento (NNT
determinado por el cociente 100/RAR. En el ejemplo anterior
100/1) sera de 100. Es decir, tendramos que tratar a 100
pacientes con el frmaco a estudio para evitar un evento.
En otro estudio de otro frmaco usado para la misma enfermedad que en el ejemplo anterior se presentan los siguientes
resultados: mortalidad con placebo 50%, mortalidad con
frmaco a estudio 25%. La reduccin relativa del riesgo (RRR)
es del 50%, es decir, la misma que en el ejemplo anterior.
Sin embargo, cuando se analizan los otros dos parmetros
se obtienen diferencias muy importantes. En este segundo
ejemplo, la reduccin absoluta del riesgo (RAR) es del 25%,
y el nmero necesario de pacientes a tratar para evitar un
evento (NNT 100/25) es de 4. Es decir, tendramos que
tratar a 4 pacientes con el frmaco a estudio para evitar un
evento. El NNT y la RAR son variables que dan datos muy
importantes sobre el impacto derivado de la aplicacin de
una medida en una poblacin concreta (un frmaco es
este caso). Sin embargo, la RRR aporta informacin sobre
la disminucin del riesgo individual de que se produzca un
evento en un individuo en concreto. Por lo tanto, el NNT y
la RAR son las variables que aportan una visin ms global
sobre una nueva medida teraputica. En ellas (ms que en
la RRR), debera fundamentarse la decisin de incluir o no
las nuevas estrategias teraputicas en la prctica clnica
habitual.
Tambin se debe tener en cuenta la relevancia clnica de una
medida. Vemoslo en el siguiente ejemplo: observamos un
estudio en el que se compara la desaparicin del inltrado
neumnico a los 5 das de tratamiento antibitico con eritromicia o con levooxacino. Con el primero se produce en
el 80% de los casos y con el segundo en el 81%. En el estudio
se concluye que existen diferencias estadsticamente signicativas con p< 0.05 a favor de levooxacino. Al analizar los
datos desde un punto de vista crtico no parece que dicho
tratamiento tenga una importancia clnica signicativa, ya
que la variable a estudio no es una variable de peso (como
sera, por ejemplo, la mortalidad o la necesidad de intubacin orotraqueal), y por otra, que las diferencias observadas
son muy pequeas.
A la hora de aplicar las opciones teraputicas ofrecidas en los
ensayos clnicos a nuestra prctica clnica habitual, se debe
valorar si los pacientes incluidos en los estudios se parecen a
los pacientes que atendemos en nuestro medio sanitario. En
caso de ser poblaciones similares, los datos seran extrapolables a nuestros pacientes, pero no sera as en caso de ser
poblaciones con marcadas diferencias basales. Un ejemplo
muy claro seran los ancianos. En la mayora de los estudios
los pacientes de ms de 75 aos son excluidos. En caso de
que observramos esto en un estudio, siendo acorde a la
Medicina Basada en la Evidencia, no podramos extender
estas medidas a los ancianos al no haberse demostrado en
ellos el benecio.

Tipos de ensayos clnicos.

Diseo clsico o en paralelo: el grupo control recibe el tratamiento a la vez que el grupo experimental, con el n de controlar
el efecto de factores pronsticos que pudieran cambiar a lo
largo del tiempo. El anlisis de los datos consiste en comparar
la diferencia en la variable resultado entre ambos grupos con la
variabilidad esperable dentro de cada grupo por el mero efecto
del azar. Los hallazgos sern estadsticamente signicativos
cuando la variabilidad intergrupo sea sucientemente mayor
que la intragrupal.
Diseo cruzado o intrapaciente: consiste en que un mismo
paciente va a recibir los dos tratamientos objeto de comparacin
en dos momentos distintos, de modo que cada paciente sirve
de control a s mismo, lo cual reduce la variabilidad intragrupal
y consigue un control perfecto de los factores pronsticos de
carcter perenne, como el sexo, la raza, etc. Uno de los problemas es el efecto carry-over o de arrastre (el efecto de uno
puede inuir sobre la toma del otro), por lo que debe haber un

Epidemiologa y Estadstica
perodo de lavado entre la administracin de los dos frmacos,
de modo que el primer frmaco haya sido totalmente aclarado
del organismo antes de administrar el segundo (MIR 04-05, 205;
MIR 03-04; 134; MIR 03-04, 138; MIR 02-03, 45; MIR 01-02, 217;
MIR 00-01F, 240).

El error aleatorio no afecta a la validez interna de un estudio,


pero reduce la posibilidad de elaborar conclusiones sobre la
relacin exposicin-enfermedad, aunque no altera el sentido
de la asociacin.
Los errores aleatorios, a diferencia de los errores sistemticos, se
pueden minimizar aumentando el tamao de la muestra (MIR
97-98F, 67; MIR 96-97F, 206).
2. Errores sistemticos o sesgos. Son los errores producidos
cuando hay un fallo en el diseo o en la ejecucin del estudio,
que hace que los resultados de la muestra sean diferentes de la
poblacin de la que proceden. No se relacionan con el tamao
de la muestra y, cuando no se controlan, tienden a invalidar
las condiciones de un estudio, es decir, la existencia de sesgos
conduce a la elaboracin de conclusiones incorrectas sobre la
relacin entre una exposicin y una enfermedad.

Figura 3.

Ensayo clnico cruzado.

Diseo secuencial: consiste en introducir pares de pacientes


randomizados a los dos tratamientos hasta que la diferencia
entre los distintos tratamientos favorece a uno u otro (exceso de
preferencias), momento en el que el ensayo clnico se detiene
(MIR 02-03, 22; MIR 00-01F, 241).

Uso compasivo de medicamentos: es un tipo de ensayo clnico


que se realiza en un paciente nico. Tambin precisa consentimiento informado. Consiste en aplicar una medida teraputica
en una enfermedad para la cul, el frmaco o medida en cuestin, no tiene aprobado su uso, pero se presupone ecaz para
el tratamiento de esa enfermedad, aunque todava no est lo
sucientemente demostrado. Suele utilizarse en enfermedades
graves, sin tratamiento estndar o cuando han fracasado el resto
de medidas con ecacia contrastada. Un ejemplo sera el uso
de sildenalo en la hipertensin pulmonar primaria que no
responde a prostaglandinas o calcioantagonistas.

Diseo factorial: en ese tipo de diseo se evalan simultneamente


dos tratamiento distintos en una misma muestra de sujetos, asignndose aleatoriamente a los sujetos a uno de los cuatro grupos
posibles: A, B, A+B y placebo. Con este diseo se puede evaluar la
interaccin entre los dos tratamientos, aunque hay que asumir
que los dos tratamientos no interaccionan entre s.

TEMA 4. VALIDEZ Y FIABILIDAD DE LOS


ESTUDIOS EPIDEMIOLGICOS.
Cuando realizamos un estudio de investigacin clnica casi nunca
trabajamos con poblaciones completas. Lo que hacemos es, partiendo de observaciones realizadas en un grupo reducido de personas
(la llamada muestra), generalizar o extrapolar nuestros resultados
a colectivos ms amplios.
El hecho de que no trabajemos con poblaciones completas,
sino con muestras, puede introducir en nuestras observaciones
errores producidos por el azar, a los que llamamos errores aleatorios. Existen adems otros tipos de errores no relacionados con el
hecho de trabajar con muestras, y que son conocidos como errores
sistemticos o sesgos.

4.1.

Tipos de Error.

1. Error aleatorio. Es el error que puede atribuirse a la variabilidad


aleatoria que conlleva siempre un proceso de muestreo. El azar
hace que la muestra con la que vamos a trabajar no sea representativa.

TIPOS DE ERRORES SISTEMTICOS.


1. Sesgo de seleccin (MIR 02-03, 40; MIR 94-95, 235). Se produce
cuando se asignan sujetos al grupo control que dieren signicativamente, en alguna caracterstica clave, del grupo problema.
Este tipo de sesgos se pueden controlar mediante un proceso
de aleatorizacin en la constitucin de los distintos grupos de
estudio (MIR 95-96, 34). Son ejemplos de este tipo de sesgo:
Sesgo de autoseleccin o del voluntario. La participacin
o autoderivacin del individuo al estudio compromete su
validez.
Sesgo diagnstico o sesgo de Berkson. Es el que se produce
cuando, para saber qu ocurre en la poblacin, eliges una
muestra hospitalaria de esa poblacin y el factor de riesgo
que estamos estudiando se asocia a una mayor probabilidad
de hospitalizacin. Tambin se incluye en este tipo de sesgo
aquel que puede surgir al elegir como control pacientes
con alguna enfermedad que tambin se asocia al factor de
exposicin estudiado.
Sesgo del obrero sano. La salida del trabajador enfermo del
mercado laboral compromete la validez del estudio.
Falacia de Neyman. Se produce en los estudios casos y controles al seleccionar casos prevalentes (ya existentes) en vez
de casos incidentes (casos nuevos). Esto conlleva que en los
casos sea menos frecuente la exposicin a aquellos FR que
disminuyen la supervivencia.
Ejemplo. Queremos estudiar si la actividad fsica tiene algn
efecto sobre la frecuencia de insuciencia coronaria. Comparamos personas con actividad y personas sedentarias. Un sesgo de
seleccin sera cuando la inactividad de los sedentarios fuese a
consecuencia de padecer la enfermedad cardaca.
2. Sesgo de informacin. Se produce cuando hay un error sistemtico en la medicin de alguna variable clave del estudio. La
clasicacin incorrecta puede afectar de igual manera a todos
los grupos de estudio o no. Los sesgos de informacin debidos
al investigador o a los participantes en el estudio se controlan
mediante tcnicas de enmascaramiento (MIR 00-01, 201).
Clasicacin incorrecta diferencial. La probabilidad de clasicacin errnea de la exposicin (en un estudio de casos
y control) afecta de manera desigual a sanos y enfermos o
la clasicacin de enfermo o no enfermo (en un estudio de
cohortes) se hace de manera distinta, segn se est o no
expuesto al factor de estudio. Este tipo de sesgo produce una
sub o sobreestimacin del efecto del factor de exposicin en
la enfermedad. Dentro de este grupo cabe destacar:
Sesgo de memoria. Se produce en los estudios de casos
y controles. El hecho de padecer la enfermedad hace que
ests ms motivado para recordar posibles antecedentes
de exposicin.
Sesgo de atencin o efecto Hawthorne. Los participantes
en un estudio pueden modicar su comportamiento si
saben que estn siendo observados.
Clasicacin incorrecta no diferencial. La probabilidad de
clasicacin errnea ocurre en todos los grupos de estudio
de manera similar. El error de clasicacin no diferencial
produce una infraestimacin del efecto del factor de exposicin estudiado en la enfermedad (MIR 99-00F, 200).

Pg. 9

miniMANUAL CTO
Ejemplo. Queremos estudiar el efecto del tabaco sobre la aparicin de bronquitis crnica, comparndose un grupo de fumadores
y otro de no fumadores. Existe la posibilidad de que los fumadores
sean diagnosticados ms fcilmente de bronquitis crnica que los
no fumadores, simplemente por el hecho de que fumar se considera
que est asociado a la bronquitis crnica.

tieses el estudio en condiciones similares. Es el grado de ausencia


de error aleatorio (MIR 96-97F, 223).

Tabla 3. Tipos de error.

Simtrico.
Incorregible.
Impredecible.
Estimable por
estadstica.

Asimtrico.
Corregible.

Predecible.

Prevencin y

control por
epidemiologa.

NO

SI

Tamao muestral.

Sesgo de seleccin:
- Aleatorizacin.
Sesgo de clasificacin:
- Enmascaramiento.
Factor de confusin:
- Aleatorizacin.
- Apareamiento.
- Restriccin.
- Estratificacin.
- Anlisis multivariante.

Figura 4.
3. Factor de confusin (confounding). Un factor de confusin
es una variable extraa al estudio que modica los resultados
que se obtienen. Todo factor de confusin debe cumplir tres
condiciones (MIR 04-05, 208; MIR 03-04, 147; MIR 02-03, 43;
MIR 01-02, 200; MIR 00-01F, 236; MIR 00-01, 208):
Ser un factor de riesgo para la enfermedad.
Estar asociado con la exposicin.
No ser un paso intermedio entre la exposicin y la enfermedad (MIR 97-98, 88).
Para prevenir los sesgos de confusin tenemos distintas
tcnicas (MIR 01-02, 215):
Fase de diseo: aleatorizacin (estudios experimentales), apareamiento y restriccin (MIR 00-01, 219; MIR 99-00F, 206).
Fase de anlisis estadstico: anlisis estraticado (dividir los
datos globales en dos grupos segn la presencia o no del
factor de confusin) y anlisis multivariante (MIR 98-99F,
217; MIR 98-99F, 214; MIR 96-97F, 207; MIR 94-95, 233).
Ejemplo. Queremos saber si existe relacin entre el alcohol y
el cncer de pulmn. La OR cruda es de 2,4. Sospechamos que
el tabaco puede actuar como factor de confusin. Al estraticar
observamos que:
OR cruda: 2,4
OR en fumadores: 1
OR en no fumadores: 1
El tabaco es un factor de confusin, puesto que el valor de la OR
se ha modicado en los estratos (de 2,4 a 1). La verdadera OR entre
alcohol y Ca. de pulmn es de 1.

4.2.

Validez y fiabilidad.

Validez. El estudio mide lo que realmente se propone medir. Es el


grado de ausencia de error sistemtico. Tambin recibe el nombre
de exactitud.

Validez interna. Es el grado de validez del resultado para los pacientes del estudio. Se dice que un estudio tiene validez interna,
cuando los resultados del estudio son aplicables a los individuos
del estudio.
Validez externa. Se dice que un estudio tiene validez externa
cuando los resultados del estudio son aplicables a otros individuos
distintos de los del estudio (MIR 96-97, 151; MIR 95-96F, 63).

Fiabilidad. Es el grado de reproductibilidad de un estudio, es


decir, el grado de similitud que presentaran los resultados si repi-

Pg. 10

4.3.

Tipos de error.

Validez de un test diagnstico.

Para conocer si una prueba diagnstica es til, se comparan sus resultados con los de otra prueba que acta como patrn de referencia
(gold standard). El grado en el que las medidas de la prueba evaluada se
correlacionan con la de referencia se denomina validez de criterio.
La prueba de referencia debe haber sido aceptada como tal por
la comunidad cientca, se debe aplicar a toda la serie de casos
estudiados y no tiene que incorporar informacin procedente de
la prueba que evala.
El valor real de la prueba slo podr ser establecido si el estudio
se realiza en condiciones semejantes a la prctica clnica habitual,
es decir, incorporando un amplio espectro de pacientes a los que,
en condiciones normales, se les aplicara dicho procedimiento
diagnstico (MIR 02-03, 50; MIR 01-02, 204; MIR 00-01F, 235; MIR
00-01, 212; MIR 96-97, 151).

TEMA 5. ESTADSTICA DESCRIPTIVA.


5.1.

Variables.

Una variable es una caracterstica observable que se desea estudiar en


una muestra de individuos, pudiendo tomar diferentes valores.
1. Tipos de variables.
Tabla 4. Tipos de variables.

Nominal dicotmica

Sexo

5.2.

Nominal no dicotmica

Raza

Ordinal

Nivel socioeconmico

Discreta

N episodicos de asma/sem

Continua

Uricema

Sntesis de los datos.

1. Medidas de localizacin o tendencia central. Las medidas de


centralizacin nos indican alrededor de qu valores se agrupan
los datos observados. Distinguimos:

Epidemiologa y Estadstica

Media aritmtica. Es la medida de centralizacin ms comn. Se calcula sumando los valores numricos de todas
las observaciones y dividiendo el total por el nmero de
observaciones.
La media aritmtica verica la propiedad de equilibrar las desviaciones positivas y negativas de los datos respecto a su valor,
es decir, (xi -) = 0. Acta, por tanto, como centro geomtrico
o centro de gravedad para el conjunto de puntos.
Mediana. Es el valor numrico que divide al conjunto de datos
ordenados en dos partes iguales, es decir, el 50% de los datos
ser menor que ella y el 50% de los datos mayor. En una distribucin simtrica, la mediana coincide con la media aritmtica,
pero no en una asimtrica (MIR 04-05, 256; MIR 98-99, 211;
MIR 97-98, 77; MIR 96-97F, 204).
Moda. Es el valor ms corriente o el valor de la variable que
se presenta con mayor frecuencia. Pueden existir distribuciones con ms de una moda.
Parmetros de posicin: cuartiles, deciles, percentiles.
Valores que dividen el conjunto de las observaciones en
cuatro, diez o cien partes iguales.
Por ejemplo:

CARACTERSTICAS.
Corresponde a variables cuantitativas continuas.
Se caracteriza por dos medidas: media y desviacin tpica.
Es unimodal.
Es simtrica alrededor de la media. Por tanto, media, mediana
y moda coinciden (MIR 96-97F, 220).
Tiene forma acampanada, sin un pico excesivo.
Va desde - innito a + innito (asinttica al eje de abscisas).
El rea bajo la curva = 1.
El 50% de las observaciones se encuentran por debajo de la
media aritmtica y el 50% por encima. El 68% de las observaciones
se encuentran dentro del intervalo S; el 95% dentro del intervalo
1,96 S y el 99% dentro del intervalo 2,57 S (MIR 98-99F, 219; MIR
98-99, 207; MIR 96-97F, 217; MIR 96-97, 146; MIR 95-96, 45).

Q2=D5=Pc50= Mediana. El 50% de las observaciones sern


inferiores al segundo cuartil, quinto decil o percentil 50 (MIR
97-98F, 73; MIR 96-97F, 203; MIR 95-96, 31).
2. Medidas de dispersin o variabilidad. Junto a las medidas de
tendencia central, completan la informacin sobre la distribucin de la variable (indican si los valores de la variable estn
muy dispersos o se concentran alrededor de la medida de centralizacin).
Rango o Recorrido. Diferencia entre el valor mximo y el
mnimo observado en una serie.
R = Mx. - Mn.

Desviacin media. Es la media de las desviaciones respecto


a la media aritmtica.
Varianza. Se dene como la media del cuadrado de las desviaciones de los elementos respecto a la media aritmtica.
Desviacin tpica o estndar. Es la raz cuadrada positiva de
la varianza. Es, junto con la anterior, la medida de dispersin
ms usada.
La desviacin tpica es una medida complementaria de la media aritmtica; mientras que sta da una idea de la magnitud
general de la distribucin, la desviacin estndar muestra
cmo se distribuyen los valores alrededor de la media.
Rango intercuartlico. Es la diferencia entre el percentil 75 y
el 25. Es, junto con el rango, la medida de dispersin usada
para los datos asimtricos.
Coeciente de variacin (CV). Es una medida de dispersin
adimensional. Es el porcentaje que representa la desviacin
estndar sobre la media. Es el mtodo de eleccin para
comparar la variabilidad o dispersin relativa de variables
que estn expresadas en las mismas o en diferentes unidades
(MIR 96-97, 153).

Figura 5.

Distribucin normal.

Tipicacin. La distribucin normal viene denida por la media


y la desviacin tpica; pueden existir, por tanto, innitas curvas de
este tipo, tantas como innitos valores puedan tomar la media y
la desviacin tpica. La distribucin normal tipicada tiene una
media= 0 y una desviacin tpica =1 [N (0,1)] y se encuentra tabulada. Nosotros podemos transformar cualquier variable aleatoria
que se distribuya normalmente a una normal tipicada mediante
la siguiente transformacin:

TEMA 6. CONTRASTE DE HIPTESIS.


6.1.

Hiptesis nula, hiptesis alternativa y grado de


significacin estadstica.

Para su comprensin, partiremos de un caso prctico. Se compara


un tratamiento nuevo (N) contra la HTA con uno tradicional (T)
en dos series de individuos. Tras cierto tiempo, N controla al 70%
de los individuos y T al 30%. El problema consiste en saber si esto
es debido a una real mayor ecacia de N o se debe simplemente
a diferencias que el azar puede establecer (variaciones aleatorias
del muestreo), sin que existan diferencias reales en el control de
hipertensos entre ambos tratamientos.
Para abordar este problema, se consideran dos hiptesis:
Hiptesis nula (H0). No existen diferencias entre los dos tratamientos (N=T).
Hiptesis alternativa (H1). S existen diferencias entre los dos
tratamientos (N T).

Media

Desviacin tpica o
estndar

Estas dos hiptesis son mutuamente excluyentes, de forma que


slo hay dos decisiones posibles:

Mediana

Rango intercuartlico
Rango

Tabla 5. Formas de medida.

5.3.

Distribucin normal o de Gauss.

Es seguida por una inmensa cantidad de variables biolgicas cuyas


medidas se agrupan alrededor de un valor central, y que presentan
una frecuencia cada vez menor a medida que se alejan de dicho
valor medio.

Rechazar H0 aceptar H1.


No rechazar H0 no poder aceptar H1.

Previamente al ensayo de una hiptesis, se ja la probabilidad


mxima de que los resultados diferentes observados entre los dos
grupos puedan ser debidos simplemente al azar (H0 cierta), que
suele ser por convenio del 5%. A continuacin, se calcula cul es la
probabilidad de que las diferencias que nosotros hemos observado
puedan ser explicadas por azar. Esta probabilidad es el valor de la p

Pg. 11

miniMANUAL CTO
o grado de signicacin estadstica. As, cuanto menor sea p, es decir,
cuanto menor sea la probabilidad de que el azar sea el responsable de
las diferencias, mayor ser la evidencia contra H0 y a favor de H1.

(MIR 04-05, 213; MIR 03-04, 145; MIR 99-00F, 208; MIR 98-99, 213; MIR
98-99, 212; MIR 97-98, 69; MIR 97-98F, 77; MIR 97-98F, 70; MIR 96-97F,
200; MIR 95-96, 47; MIR 95-96F, 57; MIR 94-95, 234, MIR 94-95, 232).

De tal forma, si:


p <0,05 Diferencias reales. Poca probabilidad de que se deban
al azar. Se acepta H1. Resultado estadsticamente signicativo.
Rechazo de Ho.
p >0,05 No existe suciente evidencia como para decir que
ambos tratamientos son diferentes. Las diferencias pueden deberse al azar con una probabilidad mayor al nivel de exigencia.
No se rechaza H0. (MIR 03-04, 153; MIR 99-00F, 212; MIR 98-99,
208; MIR 97-98, 75; MIR 97-98, 73; MIR 97-98, 68; MIR 97-98F, 65;
MIR 96-97, 132; MIR 96-97F, 222; MIR 96-97F, 219; MIR 95-96F,
55; MIR 94-95, 224).

b) Datos independientes. En distintas muestras se estudia si existen


diferencias signicativas en la variable a estudio.

6.2.

Errores alfa y beta.

Error tipo I. Se rechaza H0 siendo cierta. (Se acepta que hay diferencias y, de hecho, no las hay). Es como un falso positivo: dar como
signicativo algo que no es. Se denomina a la probabilidad de
cometer el error tipo I. El valor de la p coincide con la probabilidad
de cometer el error tipo I (MIR 04-05, 212; MIR 02-03, 35; MIR 01-02,
213; MIR 00-01, 202; MIR 99-00, 230).
Cuando entre los distintos grupos de estudio se comparan ms
de una variable de resultado, aumenta la posibilidad de resultados
falsamente positivos. Para evitarlo, se aumenta la exigencia del nivel
de signicacin como sigue (MIR 00-01F, 244; MIR 97-98, 68):
P=0,05/n de comparaciones

Error tipo II. No se rechaza H0 y sta es falsa. (No se aceptan


las diferencias y s las hay). Sera como un falso negativo: damos
como no signicativo algo que lo es. Se denomina a la probabilidad de cometer un error tipo II (MIR 00-01, 206; MIR 98-99, 203;
MIR 95-96F, 61).
Poder o potencia del test. Lo complementario del error es la
potencia o poder estadstico de un test (1- ): capacidad que tiene
un test de detectar una diferencia cuando sta existe en realidad,
es decir, corresponde a la probabilidad que tengo de demostrar la
hiptesis alternativa, siendo cierta (MIR 01-02, 210; MIR 98-99, 209;
MIR 97-98F, 75; MIR 95-96, 46).
Tabla 6 . Contraste de hiptesis.

6.3.

EXISTE
DIFERENCIA
Ho falsa

NO EXISTE
DIFERENCIA
Ho cierta

HAY
DIFERENCIAS
SIGNIFICATIVAS.
Rechazo Ho.

1Poder
estadstico o
potencia del
test

Error tipo I o
error alfa

NO HAY
DIFERENCIAS
SIGNIFICATIVAS.
No rechazo Ho.

Error tipo II o
error beta

Figura 6.

Test paramtricos.

2) Test no paramtricos.
Son pruebas que no dependen de la distribucin de la variable
y no precisan condicin previa de normalidad. Estas pruebas
no manejan los valores cuantitativos que toma la variable en
cuestin, sino nicamente sus rangos. Son pruebas de menor
precisin que las paramtricas, por lo que solamente demostrarn como signicativas diferencias mayores. Por lo tanto,
generalmente se preere utilizar pruebas paramtricas (t de
Student, anlisis de la varianza, etc.) y el uso de los test no paramtricos se limita a estudios con tamaos muestrales menores
de 30, en los que las poblaciones no puedan ser consideradas
como normales, o bien, cuando la variable represente solamente
una medida aproximada del carcter, sin una valoracin exacta.
Si las muestras son mayores de 30, no existe inconveniente en
utilizar pruebas paramtricas (MIR 94-95, 230).

1-

Pruebas de significacin estadstica.

Asociacin estadstica entre dos variables. El objetivo es demostrar


o no la asociacin estadstica entre dos variables observadas en
una muestra.
1) Test paramtricos.
a) Datos apareados. En una nica muestra, se estudia si existe una
diferencia signicativa en la variable a estudio antes y despus
de algn acontecimiento relevante.
Variable a estudio cualitativa de dos o ms categoras: test
de Mc Nemar.
Variable a estudio cuantitativa: t de Student apareada.
Variable a estudio cuantitativa (varias medidas repetidas):
ANOVA para medidas repetidas.

Pg. 12

Figura 7.

Test no paramtricos.

Epidemiologa y Estadstica
3) Anlisis multivariante.
Son un conjunto de test estadsticos que se aplican cuando se
intenta establecer la asociacin estadstica entre tres o ms
variables. Ejemplo: se desea saber si existe una relacin entre la
infeccin de herida quirrgica, la administracin de prolaxis
y el tipo de ciruga (MIR 01-02, 214; MIR 95-96F, 50).

TEMA 7. ANLISIS DE CORRELACIN


Y REGRESIN.
Sirven para estudiar la relacin entre dos variables cuantitativas.
Anlisis de regresin. Es til para determinar la posible forma
de la relacin entre variables y, por tanto, se puede usar para hacer
predicciones o estimar el valor de una variable que corresponde
para un valor de la otra. En este anlisis disponemos de dos variables de inters, X e Y. La variable X se llama variable independiente
o explicativa y es controlada por el investigador. La variable Y se
llama dependiente.
Con el anlisis de regresin lineal obtenemos una ecuacin
del tipo:
Y = + X, donde y son los coecientes de regresin.
El coeciente representa el punto en el que la lnea corta el
eje vertical (valor de Y para X = 0). El coeciente es la pendiente
de la recta que muestra la cantidad que cambia Y por una unidad
de cambio de X (MIR 97-98F, 71).
Anlisis de correlacin. Estudia tambin la relacin entre dos
variables cuantitativas, aunque aqu no se habla de variable dependiente ni independiente. El coeciente de correlacin de Pearson
mide la intensidad de la relacin lineal entre las dos variables
cuantitativas. Las caractersticas del coeciente de correlacin son
las siguientes:
Vara entre -1 y + 1 -1 r +1
Para r = 1, hay una relacin perfecta entre x e y, es decir, todos
los puntos (x,y) estn en una lnea recta.
Un valor positivo de r indica que, a medida que aumenta una
variable, lo hace la otra o que, a medida que disminuye una,
tambin lo hace la otra. Un coeciente de correlacin negativo
indica que a medida que disminuye una variable aumenta la
otra o viceversa.
r = 0 indica que no hay correlacin lineal.

excesivo aumenta innecesariamente el coste. Manejar muestras es


ms barato, rpido, fcil y sucientemente preciso y exhaustivo.
Los datos obtenidos en la muestra se generalizarn a la poblacin
original utilizando ciertas pruebas estadsticas con una mnima
probabilidad de error (<5% habitualmente).
Hay dos campos en la inferencia estadstica donde vamos a
desarrollar el clculo del tamao muestral:
Estimacin de parmetros. El tamao depender de:
- La variabilidad del parmetro que se desea estimar (sta
debe ser previamente conocida, o bien, aproximarse a partir
de datos preexistentes o estudios pilotos).
- La precisin con que se desee obtener la estimacin (amplitud deseada del intervalo de conanza, teniendo en
cuenta que a mayor precisin, mayor nmero de sujetos se
necesitarn).
- El nivel de conanza o error tipo (el error tipo no se utiliza
en la estimacin del tamao muestral (MIR 98-99, 205).
Contraste de hiptesis: se utiliza para estudios comparativos y el
tamao de la muestra indica el nmero aproximado de sujetos
que se necesitan para detectar una diferencia determinada, si
existe, con unos mrgenes de error previamente denidos. Los
factores a tener en cuenta para determinar el tamao muestral
son:
- Objetivo del estudio y variable principal.
- Magnitud del efecto que queremos detectar (delta).
- Variabilidad de la variable principal.
- Error tipo I o alfa asumido (0,05).
- Error tipo II o beta asumido (0,2-0,1).
- Poder estadstico (1-beta:80-90%).
- Proporcin de pacientes en los distintos grupos.
- Proporcin de prdidas (d): deberemos multiplicar el tamao calculado por: 1/(1-d).
- Tipo de comparacin (test unilateral o de una cola, cuando se
presupone que la diferencia entre los grupos, ser siempre a
favor de uno de ellos; test bilateral o de dos colas, cuando no
se presupone la direccin de la diferencia; el test bilateral es
ms conservador y requiere de mayor tamao muestral).
(MIR 04-05, 211; MIR 02-03, 32; MIR 02-03, 37; MIR 01-02, 218; MIR
00-01F, 239; MIR 00-01, 205; MIR 00-01, 207; MIR 99-00F, 199; MIR
98-99, 197, MIR 98-99F, 220; MIR 96-97F, 218, MIR 94-95, 221).

(MIR 04-05, 210; MIR 98-99, 206; MIR 98-99F, 222; MIR 97-98F, 82;
MIR 96-97, 154; MIR 96-97F, 199).

Figura 8 . Distintos tipos de relacin entre las variables.

TEMA 8. TAMAO MUESTRAL.


Para realizar un estudio sobre una poblacin es necesario trabajar
con una muestra, ya que abarcar a todos los miembros de una
comunidad es prcticamente imposible.
El tamao de la muestra se determina en el diseo del estudio, de modo que sea apropiado para los objetivos buscados y los
condicionamientos que se est dispuesto a asumir. Un nmero
insuciente de participantes impedir encontrar las diferencias
buscadas, concluyendo errneamente que no existen, y un nmero

Pg. 13

También podría gustarte