Está en la página 1de 55

• • • • • • • •• • • • •

• • • • • •••••••• • • •
• • • •
••• • •
••••••• ••••• ••••••••. .
,...................

....
••••••
,
••
······ ···········
••••• •••••••••
••••••••••••••••••
••••••• •••••••••••••••
••••••••••••••••••••• ••
••••••••••••••••••••••
············· ······
•••••••••••••••••••••
•••••••••••• •··
•••
••••••••••
••••• ••••••••••••••••••
••••••••••••• •• •••••••
•••••••••••• ••••••••••
••••••••••••••••••••• ••
••••••••••••••
•••••• ••••••••
•••• ••••••••••
••• •••••••••••••••••••
•••••••••••• ••••••••••
•••••••••••••••••••••
•••• •••••••• ••••••••
••••••••••••••••••••• ••
1
.....
···············
,,•.•....•.............
•••••••••

••••••••••••••••••••
•••••••••••

• • • • • • • • • • • • • • • • • •• •• ••
••
• •

••• ••• ••• ••• ••• ••• ••• ••• ••• ••• ••• ••• ••• ••• ••• ••• ••• •• • •
• •

•• • • • • • • • • • • • • • •
••• • • • • • • • • • • • • • • •
••• • • • • • • • • • • • • •
••• • • • • • • • • • •
•••• • • • • • • •
•••• • • • • • • •
•••• • • • • • • • • • •
••••• • • • • • • •
••• • • • • • •
••• • • • • •
• • • • • • • • •
• • • • •
• • • • •
• •
Manual CTO
de Medicina y Cirugía

2. a edición

• Estadística y epidemiología

Revisor
Luis Cabeza Osorio

Autores
Manuel Moreu Gamazo
Antonio Martín Conejero

Grupo CTO
• • Editorial
NOTA

La medicina es una ciencia sometida a un cambio constante. A medida que la investigación y la experiencia
clínica amplían nuestros conocimientos, son necesarios cambios en los tratamientos y la farmacoterapia.
Los editores de esta obra han contrastado sus resultados con fuentes consideradas de confianza,
en un esfuerzo por proporcionar información completa y general, de acuerdo con los criterios aceptados
en el momento de la publicación. Sin embargo, debido a la posibilidad de que existan errores humanos
o se produzcan cambios en las ciencias médicas, ni los editores ni cualquier otra fuente implicada
en la preparación o la publicación de esta obra garantizan que la información contenida en la misma sea
exacta y completa en todos los aspectos, ni son responsables de los errores u omisiones ni de los resultados
derivados del empleo de dicha información. Por ello, se recomienda a los lectores que contrasten dicha
información con otras fuentes. Por ejemplo, y en particular, se aconseja revisar el prospecto informativo
que acompaña a cada medicamento que deseen administrar, para asegurarse de que la información
contenida en este libro es correcta y de que no se han producido modificaciones en la dosis recomendada
o en las contraindicaciones para la administración. Esta recomendación resulta de particular importancia
en relación con fármacos nuevos o de uso poco frecuente. Los lectores también deben consultar
a su propio laboratorio para conocer los valores normales.

No está permitida la reproducción total o parcial de este libro, su tratamiento informático, la transmisión
de ningún otro formato o por cualquier medio, ya sea electrónico, mecánico, por fotocopia, por registro
y otros medios, sin el permiso previo de los titulares del copyright.

© CTO EDITORIAL, S.L. 2016

Diseño y maquetación: CTO Editorial

C/ Francisco Silvela, 106; 28002 Madrid


Tfno.: (0034) 91 782 43 30- Fax: (0034) 91 782 43 43
E-mail: ctoeditorial@ctomedicina.com
Página Web: www.grupocto.es

ISBN Estadística y epidemiología: 978-84-16527-20-5


ISBN Obra completa: 978-84-16527-11-3
Depósito legal: M-26880-2015
Estadística y epidemiología

Manual CTO
de Medicina y Cirugía

2.a edición
Q) _
.. ce
C')
o
(.) -o
·-
·-
-o
E
-e
Q)

c..
Q)

>-

e
,_ -e
ce
_
(..)

. en
+--'

ce
+--'
05. Medidas de impacto o del efecto . .
5.1.

5.2.
Diferencia de incidencias
o riesgo atribuible (RA) .......................................................................
Fracción atribuible en expuestos (FAE)
o fracción etiológica del riesgo .....................................................
12

12

12
en
LU 5.3. Reducción absoluta del riesgo (RAR) ..................................... 12
5.4. Reducción relativa del riesgo (RRR) ...................................... 12
5.5. Número de sujetos necesario para trat ar ..................... 12

01 . Estudio de un test.
06. Tipos de estudios epidemiológicos ... 14
Parámetros de uso..... . 1
6.1. Estudios descriptivos .......................................................................................... 14
1.1. Estudio de un test.
6.2. Estudios analíticos ...................................................................................... 1s
1.2. Relación entre prevalencia
y valores predictivos ..... 2
1.3. Aceptabilidad de un método diagnóstico ..... 3
07. Validez y fiabilidad de los estudios
1.4. Screening ..... 3
1.5. Coeficiente Kappa 3
epidemiológicos ................... ..... ............ 18
7.1. Tipos de error ............................... 18
7.2. Validez y fiabilidad .......................... ... 19
02. Conceptos 7.3. Validez de un test diagnóstico ...................................................... 20
y uso de la epidemiología 5
2.1. Concepto de epidemiología ..... S
08. Ensayo clínico . ...... . ......................... ..... . ............... ...... .. 21
2.2. Indicadores de riesgo.
Causas de enfermedad .... S 8.1. Introducción ......... ................................................................. ....................... 21
8.2. Etapas en la realización de un ensayo clínico ......... 21
8.3. Tipos de ensayos cl ínicos ....... ...... ................ .......... 23
03. Medidas de frecuencia 8.4. Estudios de bioequivalencia ........ 24
de la enfermedad ...................... ........ ...................... ............ 7 8.5. Ensayo clínico de tamaño único ................................... 24
8.6. Recomendaciones para la publicación
3.1. Formas básicas de medida.... . . .................................. 7
de ensayos clínicos
3.2. Medidas de frecuencia de la enfermedad..... 7 (recomendaciones CONSORT) ........................................................... 2S

04. Medidas de asociación ...................................................... 9 09. Niveles de calidad de la evidencia


4.1. Riesgo relativo (RR) ................................ . 9 científica ............ ...... ...... ............ . ........ .. ............ .. 28
4.2. Odds ratio (razón de desventaja) (OR) ......................... 9
9.1 . Metanálisis ............................................................................. 28
4.3 . Razón de p revalencia .................................. 10
9.2. Factores determinantes de la calidad
de la evidencia científica .................................................................................. 28
9.3. Escalas de gradación
de la evidencia científica . .... ..... .......................... 28
,.
Estadística y epidemiología 11n d i C 8

1 O. Estadística. Generalidades .... 30 14. Estimación de parámetros.


10.1. Tipos de estadística . ............... .................................................................. 30 Estadística inferencia! . 39
10.2. Población y muestra ..... . 30 14.1. Estimación de medias ........... . .. ............................................................. 39
10.3. Variables . .. ... ..... . ........................................................................................ 30 14.2. Estimación de un porcentaje .................................................................. 40
14.3. Estimación de medidas de asociación .. ........................ 40

11. Estadística descriptiva 32


11.1. Representación gráfica .................................................................................... 32 15. Contraste de hipótesis . 41
11.2. Síntesis de los datos..... ........................................................ 33 15.1. Hipótesis nula, hipótesis alternativa
y grado de significación estadística ..................... . ... 41

15.2. Errores a y JJ ······························ ······························ ·············································· 4 1


12. Probabilidad ..... 35 15.3. Pruebas de significación estadística .......... ................. 42
12.1. Probabilidad ............................................................................................................................... 35
12.2. Probabilidad condicionada ....................................................................... 35
12.3. Regla de la multiplicación ....................................................................... 35 16. Análisis de correlación
12.4. Regladelasuma ....... . ............ ............................................................................. 36 y de regresión 45
16.1. Análisis de correlación y de regresión .................................. 45

13. Principales leyes de distribución


de variables aleatorias .... 37 17. Tamaño muestra 47
13.1 . Principales leyes de distribución 17.1. Tamaño muestra!.. ....................................................................................................... 47
de variables aleatorias ................................................................................. 37
13.2. Distribución binomial . . .. . m. 37
13.3. Distribución de Poisson .. .......................................................................... 37 Bibliografía . 49
13.4. Distribución normal o de Gauss .. ................................... .................. 37
Estadística y epidemiología •

Estudio de un test.
Parámetros de uso

Enfermo Sano
Este es un tema sencillo.
ORIENTACIÓN Hay que conocer los diferentes VPa FP b Total de positivos

ENARM conceptos, así como resolver


las tablas.
a+b

FN e VNd Total de negativos


c+d

Tota l de enfermos Tota l de sanos Total de individuos


1.1. Estudio de un test a+c b+d a +b +e+ d

Verdaderos positivos: resultados positivos en sujetos enfermos. Verdaderos


negativos: resultados negativos en sujetos sanos
La actividad epidemiológica estudia la frecuencia de enfermedad. Sin Falsos positivos: resultados positivos en sujetos sanos. Falsos negativos:
embargo, todas sus medidas son realmente de la frecuencia de diagnós- resultados negativos en sujetos enfermos
ticos de enfermedad, de ahí la importancia de conocer la auténtica co- Tabla 1. Resultado de la prueba diagnóstica eval uada
rrespondencia entre el diagnóstico y la realidad patológica. Muy pocas
pruebas diagnósticas, quizá ninguna, identifican con certeza si el pacien- Individ uos sanos con test(-) VN d
E=
te padece o no la enfermedad. Total sanos VN + FP b+d

La eficacia de una prueba d iagnóstica depende de su capacidad para


detectar correctamente la presencia o la ausencia de la enfermedad Tasa de falsos negat ivos (TFN): es la probabilidad de que un indi-
que se estud ia, lo que se expresa matemáticamente med iante los cua- viduo, estando enfermo, sea clasificado como sano.
tro índices siguientes: sens ibilidad, especificidad, valor pred ictivo po-
sitivo y valor predictivo negativo. Los dos primeros marcan lo que se Individuos enfermos con test(-) FN e
TFN =
denomina val idez interna del test y los dos segundos, la validez externa; Total enfermos VP+ FN a+c
esto es, la que se obtiene al aplicar esa prueba en un entorno poblacio-
nal determinado.
Tasa de falsos positivos (TFP): mide la probabilidad de que a un
Los citados índices se obtienen a pa rtir del anál isis de una serie de pa- individuo sano se le clasifique como enfermo.
cientes a los que se les rea liza una prueba d iagnóstica (prueba problema),
comparándose los resultados con los de una prueba de superior rendi- Individuos sanos con test(+) FP b
TFP =
miento diagnóstico (prueba de referencia). Los resu ltados obtenidos se Total sanos VN + FP b+d
expresan de la siguiente manera (Tabla 1 ):
Sensibilidad (S): se define como la probabilidad de que un indivi-
duo enfermo tenga un test positivo. La sensibilidad indica la propor- Razón de probabil idad positiva: compara la probabilidad de que
ción del total de enfermos que el test es capaz de detectar: un paciente enfermo presente un resu ltado positivo frenta a la proba-
bil idad de que el resu ltado positivo se presente en un ind ividuo sano.
Individuos enfermos con test(+) VP a
S= Probabilidad test (+) en enfermos VP/enfermos
Total enfermos VP+ FN a+c RP(+)=
Probabilidad test (+) en sanos FP/sanos

Especificidad (E): es la probabilidad de que un individuo sano tenga


S
un test negativo. La especificidad indica la proporción de individuos RP+=
sanos confirmados como tales por el resultado negativo del test. 1 -E
Manual CTO de Medicina y Cirugía, 2.a edición

Razón de probabilidad negativa: re laciona la probabilidad de que ellos. Posteriormente, se representa gráficamente la sensibilidad en fu n-
un paciente enfermo presente un resultado negativo con la probabi- ción de (1-Especificidad). La prueba idea l se sitúa en el ángulo superior
lidad de que el resultado negativo se dé en un individuo sano. izq uierdo (S y E= 1). En general, para hacer la elección del mejor punto de
corte se suele emplear lo que se denom ina área bajo la curva COR (o ROC
Probabilidad test (-) en en fermos FN/enfermos en su terminolog ía inglesa), a mayor área bajo la curva, mejor capacidad
RP (-) =
Probabilidad test (-) en sanos VN/sanos de discriminación de esa pru eba.

100
1 -S
RP (-) =
E S

Valor predictivo positivo: se trata de la proporción de verdaderos


positivos entre aquellos que han sido identificados como positivos
en una prueba de test.

VPP=
VP a o 1 -E 100
VP + FP a+ b
Una prueba sin ningún valor sigue la diagona l que va del ángulo inferior
izquierdo al ángu lo superior derecho (cada incremento de la sensibilidad
Valor predictivo negativo: se trata de la proporción de verdaderos se asocia a una pérd ida de igual magnitud de la especificidad).
negativos entre aquellos que han sido identificados como negativos
en un test. De esta form a, la sensibilidad y la especificidad son va lores interdepen-
dientes, de manera que si au m enta la sensibilidad, dism inuye la especifi-
VN d cidad y viceversa.
VPN =
VN + FN e+ d
Si se adoptan criterios de diagnóstico muy estrictos, decrece la sensibili-
dad (hay menos enfermos que cumplen estos criterios), y para lelamente
Valor global (eficiencia) del test: indica la proporción de resu lta- se incrementa la especificidad (pocos sanos cumplen los citados crite-
dos válidos entre el conjunto de resultados. rios).

VP+VN a+d
VGT=
VP + VN + FP + FN Tota l 1.2. Relación entre prevalencia
y valores predictivos
Sensibilidad +tasa de falsos negativos= 100%.
Especificidad +tasa de falsos positivos= 100%. Los va lores predictivos de un test son variables, dependen de la preva-
lencia de la enfermedad en la población. La sensibil idad y la especificidad
son características propias del test y no se modifican con cambios en la
prevalencia.
La sensibili dad y la especificidad clasifican a los suje-
tos en fu nción del estatus de enferm edad. Los valores
predictivos lo hacen en función del resultado del test. Si la preva lencia de la enfermedad aumenta, se incrementa el valor pre-
dictivo positivo, mientras que dismin uye el va lor pred ictivo negativo.

El resultado de un test puede ser cont inuo (por ej.: niveles de glucemia Esto es fáci l de entender, por ejemplo, en el caso del VPP, si en una pobla-
en mg/dl) y entonces hay que decidir cuá l se considera rá como resu ltado ción la prevalencia de una enfermedad es elevada, tendrá mayor proba-
positivo del mismo, por lo que es necesario elegir un punto de corte. bilidad de hacer test a individuos realmente enfermos, lo que dism inu irá
la tasa de falsos posit ivos y, por ello, aumentará el VPP.

E
Por el contrari o, si la prevalencia de una enfermedad es muy pequeña,
se pu ede tener una alta probabilidad de realizar test que den resulta-
70 140 dos falsos pos itivos, porq ue en la mayor parte el test se estará aplican-
do sobre individuos sanos, incluso con cifras de buena sensibi lidad
El punto de corte escogido determinará la sensibilidad y la especificidad de l test, el VPP disminuye, en ocasio nes notablemente. Por eso es tan
de la prueba (si elegimos 70, la prueba será muy sensible y poco específi- importante conocer no sólo los valores de se nsibili dad y especificad
ca; si se selecciona 140, será poco sensible y muy específica). sino el ámbito en el que se aplican para entender los conceptos de
VPP yVPN.
Para determinar el punto de corte se pueden ut ilizar las curvas de Ca rac-
terísticas Operativas para el Receptor (COR). Se seleccionan varios puntos Por el contrario, si la preva lencia de la enfermedad decrece, aumenta el
de corte y se estima la sensibilidad y la especificidad para cada uno de va lor predictivo negativo y se reduce el va lor predictivo posit ivo.

01 · Estudio de un test. Parámetros de uso


Estadística y epidemiología 1 01
Criterios dependientes de la enfermedad
i PREVALENCIA: i VPP Y -!- VPN
-!- PREVALENCIA: -!- VPP Y i VPN Los criterios dependientes de la enferm edad son los sigu ientes:
La enfermedad debe ser común y grave.
Ha de conocerse la historia natural de la enferm edad.
El tratamiento, en el estado presintomático, tiene que reducir la
1.3. Aceptabilidad de un método morbimorta lidad en mayor med ida que el tratamiento después de
la aparición de los síntomas.
diagnóstico
Criterios dependientes del test
No existe un parámetro gu ía úti l para todas las situaciones. La aceptabi-
lidad de un test depende de la patología estudiada y de las condiciones Los criterios depend ientes del test son :
rea les en el medio y en la colectividad. De fácil aplicación.
Coste razonable dentro del presupuesto de salud.
Si lo que interesa es detectar el mayor número posible de enfermos, se Inocuo para la población.
debe usar un test con alta sensibil idad. Así se escaparán pocos enfermos, Confiabi lidad o capacidad de repetición.
aunque con un coste de obtención de bastantes "fa lsos positivos'~ Validez: se refiere a la capacidad del test de medir lo que realmente
se desea medir. El concepto de validez incluye los de sensibilidad,
Se elegirá un test sensible cuando: especificidad y va lor p redictivo; ya se han mencionado previamente
La enfermedad sea grave y no pueda pasar desapercibida . los conceptos de validez interna y externa.
La enfermedad sea tratable.
Los resultados falsamente positivos no suponga n un trauma psicoló- Criterios dependientes de la población diana
gico en los individ uos exam inados.
Estos criterios se deta llan a continuación:
El riesgo de ser afectado por la enfermedad debe ser alto.
La información demog ráfica t iene que estar disponible en la comu-
Como un test sensible da muchos fa lsos positivos,
la rentabilidad del m ismo es que su res ul tado sea nidad.
negativo . La comunidad ha de sentir la necesidad de programas de salud pú-
blica.

Si lo que se quiere es "asegurar" el diagnóstico, se ha de emplear un test


cuya especificidad sea máxima. Se uti lizará un test lo más específico po- 1.5. Coeficiente Kappa
sible cuando:
La enfermedad sea importante, pero difícil de curar o incurable.
Los resu ltados falsamente positivos puedan suponer un trauma psi- El coeficiente Kappa es la medida del grado de concordancia no alea-
cológico para el individuo examinado. toria entre varios observadores o entre distintas med iciones de la misma
El tratamiento de los falsos positivos pud iera tener graves consecuencias. variable. Varía de -1 a + 1.
k= -1. Discrepan más med iciones de lo esperado por azar.
k = O. Concordancia debida al azar.
1.4. Screening k=+ 1. Concordancia completa.

Ejemplo: dos oftalmólogos rev isaron la misma serie de 100 fotogra-


El screening es una estrategia de detección precoz de la enfermedad. Lo fías de fondo de ojo para determinar el g rado de retinopatía . Se desea
ideal es aplicar primero un test muy sensible (que detecta todos los casos medir el grado de coincidenc ia, concordanc ia entre los dos observa-
posibles de enfermedad; por tanto se obtienen muchos FP y pocos FN) y dores.
en una segunda fase, aplicar un test muy específi co (con el que se confir-
ma el diagnóstico de esos posibles enferm os; se obtienen muy pocos FP). El índice Kappa sirve para medir la concordancia cuando la variable de
estud io es cuantitativa. Sin embargo, si de lo que se trata es de comparar
En la puesta en marcha de un programa de screening deben tenerse en concordancias, el índice más apropiado para cuantificar la concordancia
cuenta los criterios dependientes de la enfermedad, del test y de la po- entre diferentes mediciones de una variable numérica es el llamado coe-
blación diana que se detallan a continuación. ficiente de correlación intraclase.

" Los valores predictivos dependen de la prevalencia. El positivo


Ideas clave Z: se refiere a la probabilidad de ser enfermo cuando el test es po-
sitivo y el VPN, a la probabilidad de estar sano cuando el test ha
" La sensibilidad y la especificidad se refieren respectivamente a sido negativo.
la capacidad del test para detectar correctamente a los indivi-
duos enfermos y a los sanos. La sensibilidad y la especificidad " Los test sensibles sirven para descarta r enfermedad. Los especí-
no dependen de la prevalencia. ficos, para confirmar enfermedad.
Manual CTO de Medicina y Cirugía, 2 .a edición

" Las curvas COR representan la relación recíproca entre sensibili- " La prevalencia va a determinar el tipo de test más útil en una
dad y especificidad. Cuanto mayor es el área bajo la curva COR, comunidad. Si la prevalencia es alta, se realizará un test sensible.
mejor será el test. Si es baja, uno específico.

1) Se puede descartar por completo estenosis coronaria porque la


Casos clínicos prueba es negativa.
2) No se puede excluir la estenosis coronaria porque el valor pre-
La probabilidad de padecer estenosis coronaria en hombres de dictivo positivo de la prueba es alto.
más de 65 años, con angina de pecho de esfuerzo típica, es ma- 3) No se puede excluir la estenosis coronaria porque el valor pre-
yor del 90%. A un paciente de estas características se le practica dictivo negativo de la prueba es bajo.
un ECG de esfuerzo que resulta negativo. La sensibilidad es del 4) Se podría descartar el diagnóstico de estenosis coronaria si la
80% y su especificidad del 90%. ¿Cuál de las siguientes afirma- especificidad de la prueba fuera del 100%.
ciones es correcta?
RC: 3

Which is the closest to the sensitivity of the clinical diagnosis


Case Study of ulcus?

You are comparing the clinical diagnosis of gastroduodenal ul- 1) 3%.


cus and its prevalence in a series of 10,000 autopsies. When yo u 2) 43%.
begin to analyze the data yo u plot the following table: 3) 87%.
4) 100%.
Ulcus Non-ulcus
Correct answer: 2
Ulcus 130 20
Non-ulcus 170 9.680

01 · Estudio de un test. Parámetros de uso


_Estadística y ep idemio1ngía___,

Conceptos
y uso de la epidemiología

Se deben reconocer los criterios


2.2. Indicadores de riesgo. Causas
ORIENTACIÓN
de causalidad; en especial, de enfermedad
ENARM la demostración experimental.

Conceptos
2.1. Concepto de epidemiología
Riesgo: es la probabilidad de desarrollar una enfermedad por estar
expuesto a ciertos factores.
Etimológicamente, la palabra epidem iología procede del griego y signifi- Causa: es la condición que, sola o acompañada de otras condicio-
ca tratado sobre el pueblo (epi: sobre, demo: pueblo, lagos: tratado). nes, inicia o permite iniciar una secuencia de acontecimientos que
producen un determinado efecto.
Se puede definir la epidemiología como la ciencia que estudia la dis- Factor de riesgo: variable endógena o exógena al individuo, con-
tribución y los determinantes del fenómeno salud-enfermedad en las trolable, que precede al comienzo de la enfermedad y que está aso-
poblaciones humanas. La comunidad sustituye al individuo a la hora de ciada a un incremento de la probabil idad de aparición de la mis-
buscar la respuesta a ciertas preguntas sobre la etiología y la prevención ma, y a la que se puede atribuir "responsabilidad" en la enfermedad
de la enfermedad, así como acerca de los recu rsos necesarios para los (por ejemplo: tabaco como factor de riesgo de cáncer de pulmón).
cuidados de salud de esa población. Marcador de riesgo: variable no controlable, endógena al ind ividuo
(constitucional), y cuya presencia anuncia a los individuos particular-
La epidemiología se ocupa de los dos aspectos fundamentales si- mente vulnerables (por ej.: sexo femenino como marcador de riesgo
guientes: de cáncer de mama).
Estudiar la distribución de las enfermedades en relación con las va- Indicador de riesgo: variable sin relación causal con el problema,
riables lugar, tiempo y persona. Es lo que se denomina epidem iolo- pero cuya presencia alerta precozmente sobre el padecimiento.
gía descript iva. (por ejemplo: manchas de Koplik como signo precursor de la apari-
Buscar los factores que determinan la distribución encontrada e ción del sarampión).
identificar las asociaciones causa les. Es lo que hace la llamada epi-
demiología analítica. Criterios epidemiológicos de causalidad

Las principales posibil idades de aplicación de la epidemiología son las La existencia de asociación estadística no es sinónimo de causalidad, sino
que se enumeran a continuación: que para que se dé deben cumplirse los denominados criterios de causa-
Establecer el diagnóstico de salud de una comun idad. lidad, que son los que se definen a continuación:
Conocer los factores causales de una enfermedad y las probabilida- Fuerza de asociación: es un criterio muy importante, consistente en
des de enfermar. cuántas veces más riesgo de enfermedad tienen las personas expues-
Evaluar la eficacia/efectividad/eficiencia de los procedimientos pre- tas al factor estud iado que las no expuestas (véase el Capítulo 4).
ventivos y terapéuticos de los servicios de sa lud. Efect o dosis-respuesta: es decir, que la asociación tenga coheren-
cia interna, que al incrementarse la presencia del factor de riesgo
Los pasos fundamenta les dentro del método epidemiológico son los si- aumente la de la enfermedad.
guientes: Secuencia temporal: la exposición al presunto factor de riesgo
1. Observar un fenómeno. debe preceder al efecto.
2. Elaborar una hipótesis. Coherencia externa o consistencia de los resultados: los resul-
3. Probar la hipótesis. tados deben ser concordantes con los obtenidos en otros estudios
4. Em itir un informe o ley. (reproductibilidad).
Manual CTO de Medicina y Cirugía, 2.a edición

Ausencia de distorsiones metodológicas en el estudio: debidas sa (causa necesa ria), ocurre el efecto. Hay especificidad de causa (el
a sesgos. efecto t iene una ún ica causa) y ta m bién de efecto (cada causa pro-
Ausencia de explicaciones alternativas: es decir, ausencia de otras d uce un único efecto).
hipótesis que expliquen los res ultados. Multicausal: postul a que hay plura lidad de causas y mu ltiplicidad
Plausibilidad biológica: que los resultados sean compatibles con el de efectos, formando redes causa les, de forma q ue diferentes cau-
marco de los conocim ientos científi cos previos. sas prod ucen el m ism o efecto y una ún ica ca usa ocasiona varios
Efecto de la cesación o reversibilidad: es decir, que exista una dis- efectos.
minución del riesgo tras la reducc ión de la exposición al presunto Determinista modificado (Rothman): en este modelo se distin-
facto r de riesgo. guen tres t ipos de causas:
Demostración experimental: es la prueba causal por excelencia, Causa suficiente: es aq uel la q ue inevitablemente produce el
pero su realizac ión p lantea en ocasiones problemas éti cos. efecto cua ndo se presenta.
Causa complementaria o contribuyente: son aquellas causas
Modelos causales que forma n parte de una causa suficiente.
Causa necesaria: es la que debe esta r presente inevita-
Los modelos causales son los siguientes: b lemente pa ra que se prod uzca el efecto. Por tanto, ha de
Determinista o unicausal: este modelo dice que siem pre que se for m ar parte de todas las ca usas suficientes de una enfer-
presente la ca usa (causa suficiente) y sólo cuando se presente la ca u- medad .

" El principal inconveniente de la demostración experimental son


Ideas clave ~ los problemas éticos.

" La demostración experimental supone la m ejor evidencia de


causal idad.

02 · Conceptos y uso de la epidemiología


Estad íst ie a y e_pid e mi o 1o gf-íL-Wa.' ________.

Medidas de frecuencia
de la enfermedad

Su va lor es más alto a mayor in cidencia y duración de la enfer-


En este tema es importante
ORIENTACIÓN conocer los conceptos de medad.

ENARM incidencia, de prevalencia


y de densidad de incidencia. N. 0 total de casos de enfermedad
Pv= --------------------------
Población en ese momento

3.1. Formas básicas de medida Incidencia acumulada: se define como el número de casos nuevos
de una enfermedad que se producen en un periodo de tiempo. Es
la probabilidad de que un individuo desarrolle la enfermedad en ese
Las formas básicas de medida son las siguientes: periodo.
Número: es un valor absoluto. Al no conocer el denominador no se
puede saber la importancia relativa del problema . N. 0 casos nuevos en un periodo de tiempo
Razón: es el cociente en el que el numerador no está incluido en
lA =
Población en riesgo al inicio de ese periodo
el denominador, es decir, cociente entre dos entidades que poseen
caracteres distintos. Sus valores oscilan entre O e infinito.
Fórmula: R = a/b La incidencia acumulada se puede re lacionar con la prevalencia se-
Ejemplo: razón de hombres/mujeres. gún las sigu ientes fórmu las:

Proporción: es el cociente en el cual el numerador está incluido en Pv < 10%:


el denominador. Sus valores oscilan entre O y l. Es adimensional.
Fórmula: P = a/a+b Pv = 1 x duración media de la enfermedad
Ejemplo: proporción de aprobados en un examen .

Tasa: mide la ocurrencia de un suceso durante un periodo de tiem- Pv > 10%:


po en una población determinada. Es un cociente en el que el nu-
merador está inclu ido en el denominador pero donde, a diferencia 1X D
Pv =
de la proporción, el tiempo también está incluido en éste. Tiene, por 1 + (1 X D )
tanto, dimensión temporal.
Fórmula: T = a/persona x tiempo.
Ejemplo: 300 ca. pulmón/1 00.000 personas-año. Densidad de incidencia: se define como el número de casos nue-
vos de la enfermedad que se producen en un periodo de tiempo, te -
niendo en cuenta la información que aporta el sumatorio de riesgo
3.2. Medidas de frecuencia de cada uno de los individuos.

de la enfermedad N.0 casos nuevos


DI=
Personas x tiempo
Las medidas de frecuencia de la enfermedad se llevan a cabo con los
siguientes indicadores:
Prevalencia: es el número total de casos entre el tota l de la po- Personas x tiempo: es una unidad de medida de la población en
blación. No hace distinción entre casos antiguos y nuevos y nos riesgo. Se obtiene sumando la cantidad de tiempo que cada indivi-
describe la situación en un momento determinado del tiempo. duo ha estado expuesto al factor de estudio.
Manual CTO de Medicina y Cirugía, 2.a edición

Ejemplo: La densidad o tasa de incidencia, por tanto, expresa los casos nuevos de en-
fermedad que se producen en un periodo de tiempo que corresponde al
1 año sumatorio de los periodos individuales de riesgo. Es decir, que si se lee que la

2 4 años densidad de incidencia es de 2 por 1.000 personas-año, quiere decir que apa-
recen de media dos casos por cada 1.000 individuos en un año de exposición,
3 5 años
su mando los t iempos de exposición de todos los individuos de la cohorte.
4 2 años
5 8 años Este concepto se conoce también con el nombre de fuerza de la morbilidad.

<años> TOTAL: 20 años

Hay que observar que en las preguntas en las que a


2 casos partir de datos se pide ca lcular inc idencias, en el de-
DI= - -- - - - -- O, 1 personas-año nominador habrá que restar los enfermos al inic io del
20 personas-año periodo, mientras que no habrá que restar los si lo que
se pregu nta es la preva lenc ia.

Cálculo Significado
Prevalencia Casos existentes Proporción de individuos enfermos en una población
en un momento concreto
Población total

Incidencia Casos nuevos observados Riesgo individual de enfermar


acumulada
Población susceptible al comienzo
del periodo

Densidad Casos nuevos observados Velocidad con que determinada enfermedad apa rece
de incidencia en una población
Su ma de los periodos de riesgo

Tabla 2. Medidas de frecuencia de la enfermedad

" La prevalencia o probabilidad pretest se refiere a la cantidad de


Ideas clave ;¿S enfermos en una población, no sólo a los casos nuevos.

" La incidencia es sinónimo de riesgo, porque se refiere a los nue- " Es importante conocer los aspectos de incidenci a, prevalencia y
vos casos debidos a una enfermedad. d ensidad de incidencia .

" Como incidencia es riesgo, todos los parámetros que incluyen


el término riesgo (RR, RAE, RRR, RAR) se calculan utilizando in-
cidencias.

03 · Medidas de frecuencia de la enfermedad


_Estadistica y epidemiolog[a___

. . ;

Medidas de 8SOCI8CIOn

Total
Sin duda, lo más importante FR a b a+b
es el concepto del riesgo
relativo. No FR e d c+d
Total a+c b+d a+b+c+d
Tabla 3. Cálculo del RR
Las medidas de asociación sirven para cua ntificar cuánto y cómo se aso-
cia un factor de riesgo a una enfermedad, a partir de la frecuencia con
la que aparece el evento resultado en un grupo expuesto a un factor 4.2. Odds ratio
de ri esgo, fre nte al grupo que no está expuesto a dicho fa ctor. Es decir,
se emplean para decir si un factor ana lizado es protector o de riesgo y
(razón de desventaja) (OR)
se utilizan pa ra cuantificar la asociación entre factor de riesgo y evento
res ultado. La odds ratio es una razón. Constituye la med ida básica de los estudios
casos-controles. Su significado es idéntico al del RR, au nque no puede
calcula rse como este, ya que en los estudios casos-controles no es po-
4.1. Riesgo relativo (RR) sible va lorar la incidencia de la enfermedad. Pa ra que la OR sea un buen
estimador del RR es necesa rio que los controles sean representativos de
la población de la cua l han surg ido los casos y que la enfermedad tenga
El riesgo rela ti vo es la medida de asociació n en los estudios de cohortes. una prevalencia baja, inferior al 10%.
Mide la "fuerza de la asociación" entre el fa ctor de riesgo y la enfermedad.
Puede variar entre Oe infin ito.

\ E(riesgo relativo responde a la preg unta : ¿cuánto más frecuente es la Odds de exposición Casos expuestos
enfermedad entre los expuestos a un factor de riesgo respecto a los no en los casos Casos no expuestos
expuestos? OR
Controles expuestos
Odds de exposición
Su sign ificado varía depend iendo de l va lor que tome: en los controles Controles no
RR > 1: factor de riesgo (FR). expuestos
RR = 1: indiferente: la incidencia es ig ual en expuestos y en no ex-
puestos.
RR < 1: factor de protección. Casos Controles
Total
(enfermos) (sanos)
Incidencia en expuestos
RR = FR a b a+b
Incidencia en no expuestos
No FR e d c+d

TOTAL a+c b+d a+b+c+d


Incidencia en expuestos: 1. =ala+ b
Incidencia en no expuestos: 10 =c/c+ d Tabla 4. Cálculo de la OR

1. a/a + b a/c axd


OR=
lo c/c+ d b/d bxc
Manual CTO de Medicina y Cirugía, 2. a edición

4.3. Razón el número de veces más que padecen la enfermedad los expuestos fren-
te a los no expuestos.
de prevalencia
Enfermos expuestos
R. Pv =
La razón de prevalecencia es la medida de asociación de los estudios Enfermos no expuestos
transversales. Su interpretación es simi lar a la del riesgo relativo, es decir,

" Cuando en una pregunta, además del RR, se proporcione un


Ideas clave J!!S intervalo de confianza, hay que fijarse en este último. Si el in-
tervalo incluye el 1, entonces se dice que el RR no ha sido signi-
" El RR es la medida de asociación de los estudios prospectivos, es ficativo.
decir, de cohortes y de los ensayos clínicos.
" La ORes la medida de asociación de los diseños retrospectivos
" Es importante conocer los valores posibles, así como el signifi- o de casos y controles. Su mayor utilidad es cuando la enferme-
cado de RR menor, igual o mayor de 1. dad de estud io es poco preva lente.

Para determinar si la ingesta total de líquidos reduce el ries-


Casos clínicos go de padecer cáncer de vejiga urinaria, se estudió durante
1O años la frecuencia de este cáncer en un grupo de 47.909
En un estudio de seguimiento a largo plazo de pacientes con hombres que no lo tenían al inicio del estudio. De todos ellos
fibrilación auricular crónica en la práctica clínica habitual, se se había obtenido información sobre el consumo de líquidos,
ha documentado un riesgo relativo de padecer una hemo- y se comparó la frecuencia de enfermedad según el volumen
rragia intracraneal para anticoagulantes orales (en compa- de líquidos consumidos, agrupado por quintiles. Entre los re-
ración con antiagregantes plaquetarios} de 3 (intervalos de sultados, destacaba que la ingesta total de líquidos se asoció
confianza del 95% 1,5-6}. ¿Cuál de las siguientes afirmacio- con el cáncer de vejiga, de forma que para el quintil superior
nes es cierta? (ingestión> 2.531 mi de líquidos por día) se calculó un riesgo
relativo de 0,51 (intervalo de confianza al 95%: 0,32 a 0,80) al
1) Los intervalos de confianza del riesgo relativo estimado con- compararlo con el quintil inferior (< 1.290 mi por día). Señale la
firman que las diferencias no alcanzan la significación esta- respuesta correcta:
dística.
2) El riesgo relativo estimado significa que la incidencia de hemo- 1) Los autores han realizado un estudio de casos y controles.
rragia intracraneal es un 3% superior en el grupo tratado con 2) El valor de "p'; obtenido a partir del estadístico de la compara-
anticoagulantes orales. ción de las medidas de frecuencia de cáncer de vejiga entre los
3) El riesgo relativo estimado significa que existe una alta propor- dos grupos de ingesta citados, debe ser mayor de 0,005.
ción (superior al 3%) de pacientes tratados con anticoagulantes 3) Se ha detectado un menor riesgo de padecer cáncer de vejiga
orales que presentaron hemorragia intracraneal. en las personas que consumían mayor volumen de líquidos por
4) El riesgo relativo estimado significa que la incidencia de hemo- día.
rragia intracraneal entre los pacientes tratados con anticoagu- 4) El intervalo de confianza nos da una idea del grado de precisión
lantes orales ha sido tres veces superior a la de los tratados con estadística del estudio, de forma que cuanto más amplio, me-
antiagregantes plaquetarios. nos error aleatorio.

RC: 4 RC: 3

3) Cohort studies are unable to establish causal relationships


Case Study between variables.
4) We cannot say that causality is responsible for the relationship
You are reading a cohort study, which evaluates the effect of between the two variables, as the RR confidence interval inclu-
nonsteroidal anti-inflammatory drugs (NSAIDs) on decompen- des the value 1.
sating heart failure (HF). The relative risk (RR) is 1.25 (0.7-2.2).
Which of the following is true: Correct answer: 4

1) The use of NSAIDs causes decompensating heart failure, beca u-


se the RR confidence interval does not atta in O. We performed a retrospective cohort study to determine
2) The relationship between the use of NSAIDs and the Cl appears whether patients taking antipsychotics have an increased risk
to be accounted for by causality, but before asserting that the of sudden death than the population without antipsychotics.
relationship is causal, it should be carefully evaluated whether Once the adjustment for potential confounders was made we
the study has bias or confounding factors. obtained a relative risk of 2.39 (confidence interval1.77 to 3.22

04 · Medidas de asociación
Estadística y epidemiología 1 04
with a 95% confidence) . What is the correct interpretation of 3) The result is not interpretable because we have not randomly
the result? allocated treatments.
4) The result supports the hypothesis that the use of antipsycho-
1) The result is consistent with an increased risk associated with tics increases the risk of sudden death.
the use of antipsychotics, but not statistically significant.
2) The result suggests that antipsychotics protect against the risk Correct answer: 4
of sud den death.
.--.___E...___stadística y epidemiología_

Medidas de impacto
o del efecto

S.3. Reducción absoluta


DRI[Nli\CION Los conceptos m ás im portantes
ENARM son el NNT, la RAR y la RRR. del riesgo (RAR)

Cua ndo se evalúa una med ida preventiva, como un factor protector o
el resultado de un fármaco frente a placebo en un ensayo clínico, el be-
S.1. Diferencia de incidencias o riesgo neficio de dicha medida se cuantifica como una reducción del número
de enfermos nuevos. Este concepto est á representado por la reducción
atribuible (RA) absoluta del riesgo (RAR).

Es una med ida que informa sobre el exceso de riesgo en los individuos RAR = 1o - 1e
expuestos frente a los no expuestos al factor de riesgo. Indica la inciden-
cia acumulada en el grupo de expuest os que se debe exclusivamente al
factor de riesgo. Representa el descenso en el nú mero de casos nuevos S.4. Reducción relativa
entre los expuestos si se evita ra el FR.
del riesgo (RRR)

De nuevo se emplea para calcular el beneficio de una medida pre-


ventiva .
S.2. Fracción atribuible en expuestos
En este caso, se expresa como porcentaje de casos evitados por haber
(FAE) o fracción etiológica del riesgo sido expuestos a d icho factor protector:

1 - 1
o e
La fracción atributi ble en expuestos es la propo rci ó n de la enfermedad RRR =
que se debe a la exposición; es decir, la proporción de casos nuevos de
enfermedad, entre los expuestos, que se evitaría si se eliminase el fa ctor
de riesgo. Por tanto, estas dos medidas son muy importantes a la hora
de eva luar, en términos de sa lud pública, cuá l puede ser el impacto con S.S. Número de sujetos necesario
determinadas medidas, ca lcula r los costes y determ inar prioridades.
para tratar
1 - 1
e o
FAE =
A partir de los parámetros anteriores, puede calcu larse el número de suje-
tos que deberían exponerse al factor preventivo o terapéutico para con -
seguir una curación .

M ientras que el riesgo atribuibl e mi de cuá ntos ca- 100


sos se deben exc lusivamente a un factor de riesgo, la NNT=
1 - 1
fracc ió n atribuibl e hace referencia al porcentaje de o e
enfermedad atribuibl e directamente a dicho factor.
Estadística y epidemiología 1 05
" La RRR y la RAR sirven para cuantificar la relevancia clí-
Ideas clave RS nica de una medida terapéutica. Su cálculo se realiza
mediante una resta de incidencias.
" El NNT siempre se pregunta de la misma forma: "¿a cuántos pa-
cientes se debería tratar para conseguir un evento?': " El RA y la FAE cuantifican cuánto de la enfermedad se debe a
un factor de riesgo, en el grupo de sujetos expuestos a dicho
" El NNT es tanto mejor cuanto menor sea. factor.

relativo de 0,66. Suponiendo que estos datos se pudieran extra-


Casos clínicos polar a la práct ica habitual, ¿a cuántos pacientes y durante cuánto
tiempo deberíamos tratar con clortalidona para evitar un AVC?
En un ensayo clínico controlado, aleatorizado y enmascarado a
doble ciego en pacientes con hipertensión arterial, se comparó 1) A 50 pacientes dura nte un año.
el riesgo de aparición de accidente vascular cerebral (AVC) en un 2) A 34 pacientes dura nte cinco años.
grupo tratado con clortalidona y en otro tratado con placebo. A 3) A 50 paci entes dura nte cinco años.
los cinco años, en el grupo tratado con clortalidona, al compararlo 4) A 34 pacientes durante cinco años.
con el grupo placebo, se constató una reducción del riesgo de AVC
del6% al4%, una reducción relativa del riesgo del34% y un riesgo RC: 3
• Estadística y epidemiología_

Tipos de estudios epidemiológicos

Se encuentran dos tipos de cuestiones a tener en cuenta y que son características. Por una parte,
ORIENTACIÓN las que se refieren a temas concretos o aspectos teóricos de los diferentes tipos de estudios.
ENARM Por otra, un tipo de cuestiones más "clínico": a partir de un estudio se pide que se indique
de qué tipo de estudio se trata.

6.1. Estudios descriptivos Los estudios ecológ icos permiten estudiar grandes grupos poblacio-
na les en poco t iempo y con un coste re lativa mente m uy bajo ya que,
en general, utilizan estad ísticas existentes recolectadas con otros fines.
Los objetivos de los estud ios descriptivos son los sig uientes: Sin emba rgo, dado que son uno de los peores estudios en la esca la de
Describir las ca racterísticas y la frec uencia de un problema de sa lud, causa lidad, deben ser considerados únicamente para sugerir hipóte-
en func ión de las ca racterísticas de la persona (edad, sexo, estado sis, que tendrán necesa ri amente que ser verifi cadas med iante otros
civil. ..), del lugar (área geográfica ... ) y del tiempo de aparición del estudios más rigurosos de base ind ivid ual, rea lizados posteriormente.
problema y su tendencia. Ventajas: perm iten describi r d ife rencias en poblaciones que
Servir de base pa ra estudios analíticos. habrá n de ser estudiadas con más deta lle posteriormente.
Limitaciones: los datos son promed ios de poblaciones. Se usan
Los tipos de estudios descriptivos son los que se citan a continuación: med idas aproximadas de exposición (im puest os por alcohol,
Series de casos clínicos: describen las características de un grupo ventas de cajeti llas de cigarrillos ...) y de enfermedad (mortalidad
de enfermos. Son estudios long itud inales ya que contienen infor- en vez de incidencia...), lo que li mit a el valor de los hallazgos.
mación adqui rida a lo largo del ti empo. Su principa l ventaja es que Los principa les problemas de este tipo de estudios son que se
perm iten generar nuevas hi pótesis, mientras q ue el mayor inconve- ignora la variabilidad ind ivid ual de los integrantes de los con-
nient e es que no presenta n g ru po co ntrol, por lo q ue cua lq uier FR g lo merados y que no es posible correg ir por d iferencias en otras
puede ser un hallazgo casual. va ri ables que pud ieran esta r t am bién asociadas con la exposi-
Estudios ecológicos: los cong lomerados pueden esta r constituidos ció n y el evento en estu d io.
por gru pos poblaciona les, comunidades, reg io nes, o pa íses. La ca-
racterística principa l de este tipo de estudios es q ue se cuenta con Estudios transversales o de prevalencia: son estudi os descripti-
info rm ació n sobre la exposición o el evento para el cong lomerado vos y transversa les, ya que analiza n la relació n ent re una enfe rm edad
en su t ot alidad, desconociéndose la información a nivel individual y alg unas va riables en un mom ento concret o del ti em po. Busca n
para cada uno de los miembros del gru po. Son estudi os en los que hallar una posibl e relació n entre un FR y una enfe rm edad, que luego
la unidad de análi sis son gru pos de individuos, no individuos (po r ej.: habrá de ser verifi cada por estudios analít icos.
clases de una escuela, ciudades, reg iones). Características: es de"corte" o transversa l, ya q ue enfermedad y
Son útiles cuando no se pueden hacer medicio nes de exposición ca ract erísti cas se mide n simultánea mente.
individua les (contaminación del aire, ruidos, etc.). En este t ipo de es- Ventajas: no ti enen problemas éticos, son de duración m ínima,
t udios es com ún asig nar la misma exposició n (exposición promedio) su cost e es baj o y son de fác il reprod ucibilidad. Son út iles para el
a todo el cong lo merado, no considerando la variación individ ua l de estudi o de enferm edades crónicas en la població n.
cada m iembro del mismo. Ig ual sucede con la med ició n del evento; Inconvenientes: no es út il pa ra estud iar en fermedades raras,
dado que sólo se cuent a con el número de eventos reg istrados para el ya q ue no permite ver el mecan ismo de prod ucción de la en-
conglomerado, no es posible discerni r los eventos que se presenta ron fe rm edad y no sirve para com probar una hipótesis previa de
en los sujetos expuestos de los q ue ocurrieron en los no expuestos, causa lidad (es imposible conocer la secuencia tempora l porque
por lo q ue es frecuente atribuir la totalidad de eventos a la exposición la información sobre el factor de riesgo y la enfermedad se re-
promed io que se reg istró en el interior del conglomerado. cogen a la vez).
Estadística y epidemiología 1 06
Análisis de las medidas de enfermedad: con el estudio de preva- Por ejemplo, la evaluación de la eficacia de una campaña de vacu-
lencia, la medida que se obtiene es la razón de prevalencia de indi- nación en 10.000 niños, de forma que 5.000 reciben aleatoriamente
viduos expuestos. una vacuna y los otros 5.000, un placebo.

Estudios analíticos cuasiexperimentales


6.2. Estudios analíticos
Se diferencian de los estud ios experimentales puros en que no hay asig-
nación al azar (aleatorización). Sus tipos son los sigu ientes:
Los estudios analíticos intentan establecer una relac ión de causalidad en- Ensayo comunitario de intervención: es una variedad de los en-
tre el factor de riesgo y la enfermedad; se pueden clasificar en experimen- sayos de campo:
tales y observacionales. En los primeros es el investigador el que asigna el Se trabaja con individuos sanos.
factor de estudio (qué fármaco, vacuna, campaña de educación ..., cuánto Valora la eficacia de medidas preventivas.
tiempo, cuándo, cuánta dosis recibirán los individuos ...), mientras que en No se aplica aleatorización individual.
los segundos, el investigador se limita a observar qué es lo que sucede en
un grupo de individuos, sin manipular el estudio. Por ejemplo, una campaña san itaria de agua fluorada en una comu-
nidad y de agua clorada en la otra, comparando la frecuencia de ca-
Estudios analíticos experimentales ries en los dos grupos.
Ensayos antes-después: en este tipo de estudios, el fármaco (o
Se dice que un estudio es experimenta l cuando cumple las dos condicio- medida en general) se administra a los individuos y se compara el
nes siguientes: resultado con la situación basa l. Los estudios antes-después tienen
Asignación por parte del investigador del factor de estudio. la ventaja de que son más fáciles de hacer, pero poseen el inconve-
Aleatorización de la muestra de modo que los participantes son ads- niente grave de que, al no disponer de grupo de control, los resulta-
critos al azar a uno u otro grupo de estudio. dos son difíciles de interpretar.
Por ejemplo, a un grupo de pacientes cardiópatas se les administra
Limitaciones un lECA, comparando laTA media en el conjunto antes y después de
admin istrar el tratamiento.
Los problemas éticos son el principa l inconveniente de este tipo de es- Estudios controlados no aleatorios: se realizan cuando la asigna-
tudios. No es admisible exponer a unos sujetos a un factor de riesgo que ción aleatoria no ofrece ventajas o no se puede hacer.
presumiblemente es el causante de una enfermedad. Por ejemplo, se quiere hacer un ensayo en pacientes cardiópatas.
A un grupo se le administra lECA (se trata de pacientes no dislipé-
Ventajas micos) y al otro (que además son dislipémicos), lECA más estatinas.
Aquí no hay asignación aleatorizada, sino que la inclusión en uno u
Son los estudios que mejor valoran la utilidad de una intervención y otro grupo de estudio se ha hecho tomando como base los factores
aportan mayor evidencia causal. de riesgo que presentan los pacientes.
Permiten un gran control sobre cualqu ier efecto que no sea el estu-
diado. Estudios analíticos observacionales
Posibilitan el empleo de técnicas de enmascaram iento.
Los tipos de estudios analíticos observacionales son los que se enumeran
Los tipos de estudios analíticos experimenta les son los siguientes: a continuación.
Ensayo clínico aleatorio: es, con mucho, el estudio experimenta l
más frecuente. La asignación aleatorizada del factor de estudio (un Estudios de cohortes (Figura 1)
fármaco o una intervención sanitaria) se hace sobre los individuos.
Es el mejor para demostrar causalidad y la eficacia de una actua- Partiendo de un grupo de ind ividuos expuestos al factor de riesgo (co-
ción. Por ejemplo, la asignación aleatorizada de un antirretroviral o horte expuesta), y de otro conjunto comparable en todo pero cuyos in-
un placebo a un grupo de pacientes con VIH (ampliar estudio en dividuos no están expuestos al FR (cohorte no expuesta), se estudia la
el Capítulo 8). incidencia de la enfermedad en ambas cohortes. Por ejemplo, se sigue a
un grupo de fumadores y a otro de no fumadores a lo largo del tiempo,
observando el número de casos nuevos de cáncer de pulmón que apare-
No siempre que se evalúan dos tratamientos se está cen en cada grupo de pacientes.
ante un ensayo clínico. Si los pacientes no fueron Características:
asignados por el investigador y este no introdujo el Son estudios longitud inales, de segu imiento.
factor de estudio, nos encontramos ante un estudio
Es prospectivo (excepto en los estudios de cohortes históricas).
de cohortes.
Va de la causa al efecto (enfermedad).

Ensayo de campo: es un estudio que valora la eficacia de una medi- Ventajas:


da preventiva. En general, estos estud ios son más caros que los ensa- Es el mejor estudio para comprobar hipótesis previas de causali-
yos clín icos y requieren mayor número de individuos. Las principales dad cuando, por razones éticas, no es posible realizar un estudio
diferencias respecto a los ensayos clínicos son : experimental.
Se hacen sobre individuos sanos. Es el mejor para el estudio de la "mu ltiefectividad del factor de
Valoran la eficacia de las med idas preventivas. riesgo" (todos los efectos del factor de riesgo).
Manual CTO de Medicina y Cirugía, 2. 8 edición

La posibilidad de sesgos es baj a. Característ icas:


Sirve pa ra el estu dio de exposicio nes raras. Es un estudio long itu dinal.
Es retrospectivo.
Va de l efecto (enfermedad) a la causa.

- r--------,..--~

L..._.:..
FRG:l
(e_:xp:_u_e_st_o_:s):....~t---
Enfermos

Sanos Ventajas:
Es de corta duración.
Es idea l pa ra el estud io de enfermedades raras.

-
Es el mejor para el estudio de enfermedades de largo periodo
r---:::--
FRe
- -1---- -+- Enfermos de ind ucción.
(no expuestos)
L__ _ _ _ _ _J-- -+- Sanos El coste es baj o.
Es el más adecuado pa ra el estudio de la mu lt icausa lidad de la
Inicio enfermedad (los posibles facto res de riesgo de una determina-
Figura 1. Estudio de cohortes da enfermedad).
Es el mejor pa ra formular nuevas hipotesis etiológicas.
Inconvenientes:
No es bueno para el estud io de enfermedades ra ras.
No es adecuado para el estud io de enfermedades de largo pe- Mj¡iM
riodo de incubación. Mí;M
El coste es alto.
No sirve para el estudio de la "multicausalidad de la enferme-
dad':
Es d ifíc il mente reproducible. Mj¡A+
Inicio
Análisis de las medidas de la enfermedad: los estud ios de cohortes
son los q ue perm iten saber cuá l es la incidencia de la enfermedad. Las Fig ura 2. Estudio de casos-controles
medidas que se obtienen son:
Riesgo relativo: es la med ida de la fue rza de la asociación. Inconvenientes:
Diferencia de incidencias o riesgo atribuible: informa sobre el ex- No es bueno pa ra comprobar hipotes is previas de causalidad.
ceso de riesgo de enferma r. No perm ite el estudio de la "mu lt iefectividad del factor de riesgo':
Fracción atribuible: estima la proporció n de la enfermedad entre La posibil idad de sesgos es muy alta, su control difícil.
los expuestos q ue es debida al factor de riesgo.
Análisis de las medidas de la enfermedad: en los est ud ios de casos-
controles no es posib le o btener información sobre la incidencia de la
Es necesa rio darse cuenta de que como en un estud io enferm edad, ya que se parte de una pob lacio n seleccio nada. Ta m poco
de cohorte todos los suj etos están sa nos en el mo- _._.;;::.._, . ,.,~. se tiene info rm ación acerca de la preva lencia, ya que el número de pa-
mento ini cial, los enfermos que vayan aparec iendo cientes sólo depende de los q ue se elijan. Debido a ello, la fu erza de la
serán nuevos; es dec ir, incidentes. Por ell o, la med ida
asociacion no se pued e ca lcul ar d irecta mente, co mo en el estud io de
de frecuencia es la incidencia y la de asociación, el
coho rtes, sino de for ma ind irecta m ed iante la odds rat io.
ri esgo re lativo.

En la Tabla S se exponen las d ife rencias fu nda mentales entre los dos ti-
Estudios de cohortes históricas (retrospectivas) pos de estudios ana lít icos observacio nales.

El investigador identifica, media nte reg istros, una cohorte expuest a en


el pasado a un factor de riesgo, y otra coho rte no expuesta. Med iante Características Cohortes Casos-controles
dichos registros (por ej.: historias clínicas) sig ue la evolución de ambas Población en riesgo Defi nida Indefinida
cohortes, compa rando los resultados. Cá lcu lo de la incidencia Sí No
N° de efectos medibles Varios Uno
Por ejemplo, se selecciona una muestra de 100 histori as clín icas de un hos-
N.0 de exposiciones Una Varias
pital que se divide en dos grupos en fu nció n del antecedente de tabaqu is- posibles a estudiar
mo o no. Se observa en cada grupo la frecuencia de cá ncer de laringe. Enfermedades raras Poco úti l Muy útil
Exposiciones raras Muy útil Poco útil
Estudio de casos-controles (Figura 2) Sesgos posibles Pocos Muchos
N. 0 de sujetos en estudio Muchos Pocos
Partiendo de un grupo de ind ividuos enfermos (casos), y de otro com-
parable a ellos en todo, pero que no t ienen la enfermedad (controles), se Coste Elevado Bajo
estudia la exposición, en ambos, a d istintos factores de riesgo. Por ejem- Duración Larga Corta
plo, se comparan los factores de riesgo a los que ha estado expuesto un Evidencia causal Regular Mala
grupo de pacientes con cáncer de páncreas frente a los factores a los que ·Tabla S. Diferencias entre los estudios de cohortes y los de casos-
ha estado un grupo de individuos sanos. controles

06 · Tipos de estudios epidemiológicos


Estadística y epidemiología 1 06
Ideas clave z tiempo O, nadie presenta el evento final de estudio. Son los me-
jores estudios de entre los observacionales para verificar causa-
lidad. La medida de asociación es el RR.
" Los estudios experimenta les son aquellos en los que el inves-
tigador forma parte "activa" del estudio al asignar el factor de " Los estudios de casos-controles son retrospectivos porque la
estud io. La aleatorización de la muestra es otra condición indis- selección de pacientes se hace en función de si están enfermos
pensable. o no (enfermedad hacia FR) . En este estudio a tiempo O, ya hay
sujetos portadores del evento final de estudio. Son los mejores
" Los estudios observacionales son aquellos en los que el inves- para enfermedades raras y su principal limitación es la relativa
tigador se limita a "observar" a los sujetos enfermos-sanos (es- validez por la facilidad para cometer sesgos. La medida de aso-
tudio de casos y controles), a sujetos expuestos-no expuestos ciación es la OR.
(cohortes) o a observar cuántos sujetos están enfermos en una
comunidad (transversal). " Los estudios transversales o de prevalencia se caracterizan por
la ausencia de seguimiento. En estos estudios sólo "se ve" a los
" Los estudios de cohortes son prospectivos porque se empieza a sujetos una única vez. La medida de frecuencia de enfermedad
partir del factor de riesgo (FR hacia enfermedad). Es decir, que a es la prevalencia .

¿A qué tipo de estudio corresponde el estudio de Framingham,


Casos clínicos , que empezó en 1949 para identificar factores de riesgo de enfer-
medad coronaria, en el que, de entre 10.000 personas que vivían
Para tratar de establecer una relación causal entre el consumo de en Framingham de edades comprendidas entre los 30 y los 59
benzodiacepinas durante el embarazo y el riesgo de fisura pala- años, se seleccionó una muestra representativa de ambos sexos,
tina en el recién nacido, se seleccionaron madres de recién na- reexaminándose cada dos años en busca de señales de enferme-
cidos con fisura palatina y se compararon con madres de recién dad coronaria?
nacidos sanos en cuanto a los antecedentes de toma de benzo-
diacepinas. ¿Cuál es el tipo de diseño de estudio empleado? 1) Ensayo clínico.
2) Estudio de cohortes.
1) Casos y controles. 3) Estudio de prevalencia.
2) Estudio de cohortes. 4) Estudio de casos y controles.
3) Ensayo clínico aleatorizado.
4) Estudio ecológico. RC: 2

RC: 1

3) Cohort study.
Case Study . 4) Case-control study.

A study without manipulation in the main variable that starts Correct answer: 3
with patients without disease is a:

1) Quasi-experimental study.
2) Experimental study.
• Estadística y epidemiología_

Validez y fiabilidad de los estudios


epidemiológicos

de conclusiones incorrectas sobre la re lación entre una exposición


Suelen presentarse estudios
y una enfermedad.
en los que se ha cometido algún
error sistemático y puede
no ser sencillo identificar
el posible sesgo
que se ha cometido. La mayoría de los sesgos acontecen hab itualmente en
los estudios de casos-controles (retrospectivos).

Cuando se real iza un estud io de investigación clínica, cas i nunca se Tipos de errores sistemáticos
trabaj a con poblaciones completas. Lo que se hace es, partiendo de
observaciones rea lizadas en un grupo red ucido de personas (la llama- Sesgo de selección
da muestra), genera lizar o extrapola r los resu ltados obtenidos a co-
lectivos más amplios. El hecho de que no se trabaje con poblaciones Se prod uce cuando se asignan sujetos al grupo control que difieren sig-
completas, sino con muestras, puede introducir en las observaciones nificativamente, en alg una ca racterística clave, del grupo problema. Este
errores produc idos por el aza r, a los que se les llama errores aleatorios. t ipo de sesgos se puede co ntrolar med iante un proceso de aleatorización
Existen además otros t ipos de errores no re lacionados con el hecho de en la constit ución de los distintos grupos de est ud io.
trabajar con muestras, y que son conocidos como errores sistemáticos
o sesgos. Son ejemplos de este t ipo de sesgo los siguientes:
Sesgo de autoselección o del voluntario: la participación o auto-
derivación del individuo al estud io compromete su validez.
7 .1. Tipos de error Sesgo diagnóstico o sesgo de Berkson: es el que se produ-
ce cuando, para saber qué ocurre en la población, se elige una
muestra hospitalaria de esa población y el factor de riesgo que
Los tipos de error son los siguientes: se está estud iando se asocia a una mayor probabilidad de hos-
Error aleatorio: es el error que puede atribu irse a la variabi lidad pital ización. Tamb ién se incluye en este t ipo de sesgo aquel que
aleatoria que con lleva siempre un proceso de muestreo. El azar puede surgir al seleccionar como control a pacientes con alguna
hace que la muestra con la que se va a a trabajar no sea repre- enfermedad que también se asocia al factor de exposición estu-
sentativa. El error aleatorio no afecta a la validez interna de un es- diado.
tudio, pero reduce la posibilidad de elaborar conclusiones sobre Sesgo del obrero sano: la salida del trabajador enfermo del merca-
la relación exposición-enfermedad, aunque no altera el sentido do laboral compromete la validez del estudio.
de la asociación. Los errores aleatorios, a diferencia de los errores Falacia de Ney man: se produce en los estudios de casos-con-
sistemáticos, se pueden minimizar aumentando el tamaño de la troles al seleccionar casos prevalentes (ya existentes) en vez de
muestra. casos incidentes (casos nuevos). Esto conlleva que en los casos
Errores sistemáticos o sesgos: son los errores producidos cuan- sea menos frecuente la exposición a aquel los FR que disminuyen
do hay un fallo en el diseño o en la ejecución del estud io que hace la supervivencia; esto es, los casos rep resentarían a individuos con
que los resultados de la muestra sean d iferentes de la población de rasgos de mayor resistencia a la enfermedad o formas menos gra-
la que proceden. No se relac ionan con el tamaño de la muestra y, ves de esta.
cuando no se controlan, tienden a inva lida r las condiciones de un Por ejemplo: se quiere estud iar si la actividad física tiene algú n efecto
estudio; es decir, la existencia de sesgos conduce a la elaboración sobre la frecuenc ia de la insuficiencia coronaria. Se compara a per-
Estadística y epidemiología 1 01
sonas con actividad y a personas sedentarias. Un sesgo de selección Ser un factor de riesgo para la enfermedad.
sería cuando la inactividad de los sedentarios fuese a consecuencia Estar asociado con la exposición.
de padecer la enfermedad cardíaca. No ser un paso intermedio entre la exposición y la enfermedad.

Sesgo de información Para prevenir los sesgos de confusión, existen distintas técnicas:
Fase de diseño: aleatorización (estudios experimentales), aparea-
Tiene lugar cuando hay un error sistemático en la medición de alguna miento y restricción.
va riable clave del estudio. La clasificación incorrecta puede o no afectar Fase de análisis estadíst ico: análisis estratificado (se dividen los da-
de igua l manera a todos los grupos de estudio. Los sesgos de información tos globales en dos grupos, según la presencia o no del factor de
debidos al investigador o a los participantes en el estud io se controlan confusión) y anál isis mu ltiva ri ante.
mediante técnicas de enmascaramiento.
Clasificación incorrecta diferencial: la probabilidad de clasifica- Ejemplo: se desea saber si existe relación entre el alcohol y el cáncer de
ción errónea de la exposición (en un estudio de casos-controles) pulmón. La OR cruda es de 2,4.
afecta de forma desigual a sanos y enfermos o la clasificación de en-
fermo o no enfermo (en un estudio de cohortes) se hace de manera Se sospecha que el tabaco puede actuar como factor de confusión. Al
distinta, según se esté o no expuesto al factor de estudio. Este tipo estratificar, se observa lo siguiente:
de sesgo produce una subestimación o sobreestimación del efecto OR cruda : 2,4.
del factor de exposición en la enfermedad. Dentro de este grupo ORen fumadores: 1,S.
cabe destacar: ORen no fumadores: 1,5.
Sesgo de memoria : se produce en los estud ios de casos-
controles. El hecho de padecer la enfermedad hace que se El tabaco es un facto r de confusión, puesto que el valor de la OR se ha
esté más motivado para recordar posibles antecedentes de modificado en los estratos (de 2,4 a 1,5). La verdadera OR entre alcohol y
exposición . cáncer de pulmón es de 1,5.
Sesgo de atención o efecto Hawthorne: los participantes en
un estud io pueden mod ifica r su com portamiento si saben que
están siendo observados. 7 .2. Validez y fiabilidad
Clasificación incorrecta no diferencial: la probabilidad de clasifica-
ción errónea ocurre en todos los grupos de estudio de forma similar. Se definen los siguientes conceptos:
El error de clasificación no diferencial ocasiona una infraestimación Validez: el estudio cuantifica lo que realmente se propone medir. Es
(hace que la med ida de asociación tienda a 1) del efecto del factor el grado de ausencia de error sistemático. También recibe el nombre
de exposición estudiado en la enfermedad. de exactitud.
Por ejemplo: se quiere estudiar el efecto del tabaco sobre la apari- Validez interna: es el grado de validez del resultado para los
ción de bronquitis crón ica, comparándose a un grupo de fumadores pacientes del estudio. Se dice que un estudio tiene validez in-
y a otro de no fumado res. Existe la posibilidad de que los fumadores terna cuando los resu ltados del mismo son aplicables a los indi-
sean diagnosticados más fácilmente de bronquitis crón ica que los viduos del citado estudio.
no fumadores, simplemente por el hecho de que fumar se considera Validez externa: un estud io tiene va lidez externa cuando los
que está asociado a est a patolog ía (Tabla 6). resultados del mismo son aplicables a otros ind ividuos distintos
de los del estud io.
Factor de confusión ( confounding)
Fiabilidad: es el grado de reproductibilidad de un estudio, es decir,
Un factor de confusión es una variable extraña al estudio que modifica el grado de simil itud que presentarían los resultados si se repitiese el
los resultados que se obtienen. Todo factor de confusión debe cumplir estudio en condiciones similares. Es decir, es el grado de ausencia de
tres condiciones: error aleatorio.

Características Afecta a la validez interna Solución o control


Error aleatorio Simétrico NO i tamaño muestra!
Incorregible
Impredecible
Estimable por estadística
Sesgo o error sistemático Asimétrico sr Sesgo de selección: aleatorización
Corregible Sesgo de clasificación: enmascaramiento
Predecible Factor de confusión:
Prevención y control por epidem iología Aleato rización
- Apareamiento
- Restricción
- Estratificación
- Análisis multivariante
Tabla 6. Tipos de error
Manual CTO de Medicina y Cirugía, 2 .a edición

7 .3. Validez de un test


o
diagnóstico

Para conocer si una pru eba diag nóstica es út il, se co mpa ran sus res ulta- o lA\
~
dos con los de otra pru eba que actú a co mo patrón de referencia (gold
standard). El grado en el que las med idas de la prueba eva luada se corre-
lacionan con las de referencia se denomina va lidez de criterio (Figura 3).

La prueba de referencia debe haber sido aceptada como ta l por la com u-


nidad científica, se ha de aplicar a toda la serie de casos estud iados y no
puede incorporar información procedente de la prueba que eva lúa. o
El valor real de la prueba sólo podrá ser establecido si el estud io se lleva Validez o exactitud Precisión o fiabilidad
a cabo en cond iciones semejantes a la práctica cl ín ica habit ual; es decir, · Grado de ausencia de sesgos · Grado de ausencia de error aleatorio
· No aumenta al crecer n · Aumenta al crecer n
incorporando un ampl io espectro de pacientes a los que en condiciones
normales se les aplica ría dicho procedim iento diag nóstico. Figura 3. Va lidez y fi abilidad

" Los errores de clasificación se deben a un error al incluir a los


Ideas clave PiS pacientes en los diferentes grupos de estudio, ya sea porque los
sanos (controles) no recuerdan el antecedente de la exposición
" Los errores aleatorios son errores producidos por el azar. Son (sesgo de memoria), o porque varían su comportamiento al
una falta de precisión, no afectan a la validez interna y se corri- sentirse observados.
gen aumentando el tamaño de la muestra.
" En los ensayos clínicos, se pueden controlar los sesgos de cla sifi-
" Los errores sistemáticos o sesgos no se deben al azar, afectan a cación mediante las técnica s de ciego o enmascaramiento; y los
la validez de los estudios y no se corrigen aumentando el tama- de selección, por medio de la aleatorización.
ño de la muestra.
" El sesgo de confusión se debe a la existencia de un factor de con-
" Los sesgos de selección se deben al hecho de elegir mal la fu sión, que es esencialmente un factor que está desigualmente
muestra del estudio, bien por escoger controles hospitalarios distribuido entre los dos grupos de pacientes del estudio y que
(Berkson), por disponer de pocos casos enfermos al estudiar en- se relaciona etiológicamente con la enfermedad final. Los sesgos
fermedades de rápida mortalidad (Neyman), o por seleccionar de confusión se controlan mediante asignación aleatoria, aparea-
voluntario s. miento, restricción, análisis multivariante y análisis estratificado.

3) Un error aleatorio.
Casos clínicos 4) Sesgo de observación .

En un estudio de casos y controles se encontró una asociación RC: 2


entre la ingesta de alcohol y el desarrollo de cáncer esofágico.
Dado que el consumo de tabaco se encontró asociado tanto a Suponga que, en la lectura de un ensayo clínico cuya variable
la ingesta de alcohol como al desarrollo de cáncer de esófago, principal de respuesta es la mortalidad a cinco años, observa
el consumo de tabaco en este estudio debe considerarse como: usted que los pacientes de un grupo tienen una media de edad
al inicio del tratamiento de 64 años y los del otro de 52 años,
1) Un factor (sesgo) de confusión. no siendo estadísticamente significativas estas diferencias.
2) Un sesgo de infor maci ón . ¿Cómo cree que podría afectar este hecho a los resultados del
3) Un sesgo de memoria. ensayo?
4) Un sesgo de fa lacia ecológ ica.
1) De ninguna forma, ya que las diferencias inicia les en la edad se
RC: 1 deben al azar.
2) Inva lida el estud io, ya que los grupos no ti enen inicialmente el
En un estudio de casos y controles se estudia la relación ente mismo pronóstico.
cáncer de cavidad bucal (efecto) y consumo de bebidas alcohó- 3) Invalida el estud io, ya q ue sign ifi ca q ue la asignación al azar de
licas (exposición). ¿Cómo definiría el fenómeno que puede pro- los pacientes a los grupos (aleatorización) no ha producido gru-
ducir el hecho de que el hábito de fumar se asocie a la aparición pos inicialmente homogéneos y, por tanto, ha sido incorrecta.
de cáncer bucal y t ambién a un mayor consumo de bebidas al- 4) Haría necesario uti lizar alg una técn ica estadística que permita
cohólicas? comparar la morta lidad entre grupos, teniendo en cuenta las
posibles diferencias entre ellos en las características basa les.
1) Sesgo de información.
2) Sesgo por factor de confusión. RC:4

07 · Validez y fiabilidad de los estudios


epidemiológicos
_Estad ísti ca_y_epidemiDlugia _ .

Ensayo clínico

tigación cl ínica más extensa y rig urosa sobre un tratamiento médico.


Uno de los temas más
Sirve para establecer la eficacia de un nuevo fármaco y la existencia de
importantes en el ensayo
clínico, ya sea por sus efectos adversos frecuentes. Un paciente debe conocer que probable-
conceptos teóricos ya sea por mente ha recib ido placebo, pero no si lo ha rec ibido con certeza o no.
el tipo de ensayo que se trate. Lo idea l es comparar frente al mejor t ratam iento, a la mejor alternativa
existente. Se realiza en un grupo mayor de pacientes (varias decenas
de miles), seleccionados con unos criterios de inclusión/exclusión más
laxos, que norma lmente se encuentran polimedicados y que permi-
8.1. Introducción tan hacer una extrapolación de los resultados al resto de la población
(validez externa). Es posible, a su vez, d istinguir las fases lila y lllb. La pri-
mera incluye EC que se llevan a cabo una vez determinada la eficacia
Un ensayo clínico es un experimento cuidadosa y éticamente diseñado terapéutica, pero antes de ser enviada a las Autoridades Reguladoras
con el fin de dar respuesta a preguntas que tienen que ver con la util idad la solicitud de aplicación del nuevo compuesto, y constituyen la evi-
de procedimientos diagnósticos, terapéuticos y profilácticos en el ser hu- dencia de efectividad terapéutica que se exige para la tramitación del
mano. expediente del nuevo compuesto. Con frecuencia son considerados
como pivota! tria ls. La segunda comprende estudios que se realizan
Los ensayos clínicos son estudios prospectivos y experimenta les en los una vez aceptada la tramitación y antes de la aprobación y comerciali-
que, una vez seleccionada la muestra, se divide aleatoriamente en dos zación del nuevo compuesto.
grupos de pronóstico comparable que idea lmente sólo se diferencian en Ensayo en f ase IV: también se denomina farmacovigilancia, y con-
la intervención terapéutica que van a recibir. siste en el seguimiento, posterior a la comercialización del fármaco,
de un número muy elevado de pacientes con el fin de detectar efec-
Teniendo en cuenta los objetivos perseguidos en el desarrollo de un me- tos adversos poco frecuentes o de aparición tardía. La fase IV tam-
dicamento, se distinguen cuatro fases: bién sirve para evaluar interacciones entre medicamentos y sugerir
Ensayo en fase 1: es la primera vez que un fármaco se administra a nuevas indicaciones de fármacos ya aceptados para otro fin.
humanos. Genera lmente, se rea liza con voluntarios sanos (n = 20-
80) y sin grupo contro l. Suelen ser EC abiertos, no aleatorizados y, Así, la farmacovigilancia es la recog ida de datos sobre seguridad de fár-
muchas veces, no comparativos. El principa l objetivo es eva luar la macos una vez que se autoriza su comerc ialización . Su objetivo es detec-
toxicidad y conocer la dosis única aceptable no tóxica . Se lim itan al ta r reacciones adversas poco frecuentes que no han sido identificadas
terreno experi mental y/o a sus efectos fa rmacocinéticos y farmaco- durante el desarrollo del ensayo, dado que este se ha real izado en una
dinámicos. población limitada (generalmente n < 2.000).
Ensayo en fase 11: el principal objetivo es aportar información so-
bre la relación dosis/respuesta, proporcionando una información En genera l, se acepta cua lquier reacción adversa. Sin embargo, las de
preliminar acerca de la eficacia. Se lleva a cabo en pacientes (n = mayor interés son las reacciones adversas graves, inesperadas o raras y
100-200). No necesariamente tienen que ser comparativos. Ge neral- aquellas de fármacos de comerc ialización reciente (menos de tres años).
mente, este t ipo de EC es contro lado y con asignación aleatoria del
tratamiento. Algunas clasificaciones d istinguen a su vez una fase lla
(estudios piloto realizados en pocos pacientes con crite rios de in- 8.2. Etapas en la realización
clusión/exclus ión más estrictos) y una fase llb (que evalúa la eficacia
y la seguridad en un mayor número de pacientes y representa una
de un ensayo clínico
demostración más rigurosa de la eficacia del nuevo compuesto).
Ensayo en fase 111: es el prototipo del ensayo clínico. Suele ser com- A continuación se desarrollan los pasos a segu ir para la realización de un
parativo con la terapéutica de referencia o con un placebo. Es la inves- ensayo clín ico en fase 111con dos grupos de intervención .
Manual CTO de Med icina y Cirugía, 2. a edición

Selección de la cohorte de estudio Se puede rea lizar de tres fo rmas d iferentes:


Al eatorización sim ple: cada paciente t iene la m isma probabilidad
Consiste en la elección de un g rupo de sujetos adecuados pa ra la eva- de ser asignado a cualquiera de los grupos de tratamiento. Con este
luación del med icamento, de los cuales se extrapolarán los resu ltados método, existe riesgo de desig ualdad numérica entre grupos.
del ensayo clínico. Med iante la fo rmulación de los criterios de inclusión, Al eatorizaci ón por bloques: se establecen bloques de aleatoriza-
se establecen las características clín icas y sociodemog ráfi cas de los pa- ción, de modo que en cada uno de ellos la m itad de los pacientes
cientes en los que se emplea rá el fá rmaco. Los criterios de exclusión se rec iba el tratamiento experimental y la otra mitad, el control. Con
usan pa ra rechazar a aq uellos pacie ntes con criterios de inclusión pero este t ipo de aleatorización se evita la desigualdad numérica entre los
que presentan alguna contraindicación, cond iciones que pueden afecta r distintos grupos, por lo que es especialmente úti l cuando el tamaño
a la variable resu ltado o alguna característica que haga comp licado su muestra! no es muy grande.
estudio. Aleatoriza ción est ratificada: los pacientes son divididos en grupos
(estratos) homogéneos respecto a alguna variable de interés pro-
En función de los criterios de inclusión, se puede dividir los EC en dos nóstico y posteriormente son asignados aleatoriamente a uno de los
grandes grupos: dos grupos de intervención (Figura 4).
EC pragmáticos: se acercan lo más posible a la población genera l.
Los criterios de inclusión son muy laxos (prácticamente los únicos
son los diagnósticos). Pacientes totales
EC explicat ivos: los criterios de inclusión son muy estrictos,
por lo que la muestra no es exactamente igual a la población general.
Obesos No obesos
Si los criterios de inclusión son muy estrictos, el EC presenta una muestra
más homogénea y se necesita menor tamaño muestra ! para detectar las
d iferencias. Además, hay mayor validez interna. Sin emba rgo, existe una
clara limitación a la hora de genera lizar los resu ltados y de reclutar a los
pacientes. Se uti lizan, sobre todo, en las fases 11 y 11 1. En cambio, cuando Figura 4. Aleat orizació n estratifica da
no son estrictos, el reclutamiento se verá facilitado, se podrán generali-
zar los resultados con mayor facilidad y tendrá mayor validez externa. Sin En general, la aleatorización debe consegu ir asignar los tratamientos de
embargo, la muestra será heterogénea, por lo que se necesita un mayor forma desconocida e impredecible, tiene que ser un proceso reprodu-
tamaño muestra! y los resu ltados son confusos si sólo es eficaz en sub- cible y estar documentado, ha de basarse en propiedades matemáticas
grupos de pacientes. Se emplean en las fases 11 1y IV. conocidas, no debe ser prevista la secuencia de los tratamientos y, final-
mente, ha de ser posible detectar los fallos de la asignación. Para evitar
En esta etapa, también hay que determinar el tamaño muestra!. Este ha sesgos en la aleatorización es importante que quien decide la inclusión
de ser suficiente para obtener un IC del 95% de la eficacia cuyos límites de los pacientes en el ensayo y la persona que lleva a cabo la aleato riza-
sean clínicamente relevantes. ción desconozcan la secuencia de aleatorización hasta que se aplique a
cada uno de los pacientes reclutados. En caso de no hacerse ocultación
Medición de variables basales de la secuencia de aleatorización, existe la posibi lidad de seleccionar
incorrectamente a los sujetos del ensayo y perder la comparabilidad de
La medición de variables basales consiste en determinar una serie de va - los dos grupos de tratamiento. La ocu ltación de la secuencia de alea-
riables en los sujetos que cumplen los criterios de inclusión y que han torización se puede conseguir mediante un sistema de aleato rizaci ón
aceptado pa rticipar en el estudio (consentimiento informado), con los centralizado en un lugar d istinto a aquel en el que se lleva a cabo el
siguientes propósitos: ensayo o mediante sobres numerados secuencialmente, opacos y lacra-
Defin ir las ca racterísticas de la población a la que podrá extrapolarse dos, que contengan el tratamiento y que sólo se abran tras la inclusió n
el resultado del ensayo clín ico. del paciente en el EC.
Aportar una serie de datos que permitan posteriormente verificar
que la aleatorización ha sido eficaz y hacer el aná lisis estratificado Aplicación de la intervención
(por ejemplo: por edad), en caso de d iferencias entre los dos grupos.
Demostrar que el evento resu ltado, cuya frecuencia se pretende dis- Es importante evitar que tanto investigadores como otros proveedores de
minu ir con el fármaco estudiado, no está presente al comienzo del cuidados traten de forma diferente a los dos grupos de intervención. Para
estudio. evitar este hecho, llamado sesgo de cointervención, y que la medición de
Registrar posibles predictores del evento interés, de modo que se la variable resultado pueda estar sesgada por el m ismo motivo, se utiliza el
pueda eva luar su interacción con el fármaco estudiado, si la aleato- enmascaramiento. Los tipos de enmascaram iento son los siguientes:
rizac ión no los ha d istribuido homogéneamente entre los distintos Simple ciego: el paciente desconoce el grupo de tratamiento al que
grupos de estud io. está asignado.
Doble ciego: paciente, persona l sanitario y evaluador de la variable
Aleatorización resu ltado lo desconocen.
Triple ci ego: además de los anteriores, el analista de los datos no
La aleatorización consiste en asignar por azar, sin que influya ningún fac- sabe el t ipo de tratamiento de cada uno de los grupos.
tor, los pacientes de la muestra a los dos g rupos de intervención de modo
que, si el tamaño muestra! es suficientemente grande, se consiga una Tanto las reacciones adversas específicas como la falta de eficacia y los
distribución homogénea de las variables pred ictoras en ambos grupos. cambios analíticos específicos pueden desenmascarar un EC. Otro aspec-

08 · Ensayo clínico
Estadística y epidemiología 1 08
toa considerar en esta fase del ensayo clín ico es que siempre que exista ción estadística porque, de nuevo, se están rea lizando comparacio-
un tratamiento eficaz, hay que administra rl o al grupo control, así que lo nes múltiples.
que se determina rá con el ensayo clínico será la eficacia relativa del nue- La magnitud del efecto del tratamiento en los ensayos clínicos se
vo fármaco. En caso de no existir alternativa terapéutica previa, se medirá puede expresar de va rias formas:
la eficacia en términos absolutos. El ri esgo relativo: cociente entre el riesgo de sufrir un deter-
m inado evento en el grupo expuesto a un determinado trata-
Análisis de los resultados (Tabla 7J m iento y el de sufrir el mismo evento en el g rupo control (no
expuesto al tratamiento).
En este punto se deben tener en cuenta los siguientes aspectos: La reducción absoluta del riesgo (RAR): que es la diferencia
Las pérdidas de sujetos incluidos en el ensayo clínico ocurridas antes entre el porcentaje de eventos en el grupo control y el mismo
de la aleatorización va n a afectar a la capacidad de generalización de porcentaje en el grupo experimental.
los resultados, mientras que las pérdidas postaleatorización pueden La reducción relativa del ri esgo (RRR): se define como la di-
afectar a la validez interna. ferencia entre el porcentaje de eventos en el grupo control y
El análisis estadístico de los ensayos clínicos es muy parecido al de el mismo porcentaje en el grupo experimenta l, dividido por el
los estudios de cohortes, pero es más frecuente el uso de métodos porcentaje de eventos en el grupo contro l.
no paramétri cos y, al tener importancia no sólo que ocu rra la varia- El número necesa rio de pacient es a trat ar (NNT): que se ob-
ble resultado, sino cuándo ocu rre, es frecuente el empleo de análisis tiene como el inverso de la RAR multiplicado por 100, y es el nú-
de supervivencia. mero de pacientes que se deben tratar para prevenir un suceso
Compa raciones múltiples: al aumentar el número de comparacio- indeseable adicional.
nes, se incrementa la posibi lidad de resultados falsamente positivos.
Análisis de subgrupos: puede ocasionar problemas, especial-
mente cuando no se tiene previsto desde el principio. Produce 8.3. Tipos de ensayos clínicos
comparaciones múltiples, aumenta la probabil idad de resul t ados
espurios y, por tanto, sus resultados deben interpretarse con pre-
caución. Los tipos de ensayos clínicos son los siguientes:
Análisis por intención de tratar frente a análisis por protocolo: Di seño clá sico o en paralelo: el grupo control recibe el tratamiento
Por p rot ocolo: incluye sólo a aquellos pacientes que han cum- a la vez que el grupo experimental con el fin de controlar el efecto de
plido los requisitos del protocolo y/o han finalizado el estudio. factores pronósticos que pudieran cambiar a lo largo del tiempo. El
Por intención de t rata r: el anál isis incluye a todos los pacien- análisis de los datos consiste en comparar la diferencia en la variable
tes que han sido seleccionados y en el grupo en el que fueron resultado entre ambos grupos con la variabil idad esperable dentro
asignados, aunque no haya n fina lizado el estud io o hayan cam- de cada grupo por el mero efecto del aza r. Es muy apropiado en los
biado de grupo. casos de enfermedades agudas (Figura 5).

Pragmáticos Muestra heterogénea, validez externa


Explicativos Muestra homogénea, validez interna
Cruzado Cada grupo toma ambos fármacos con periodo
de lavado
Paralelo Cada grupo toma un ún ico fármaco
Por intención Todos los sujetos incluidos son analizados
de tratar

Por protocolo Sólo se analizan los que terminan el estudio


De tamaño Tamaño muestra! conocido a priori Resu lta do 1 Resu ltado 2
predeterminado
Comparación .....: - - - - - '
Secuenciales Incorporación progresiva de pacientes al estudio
De superioridad Demostrar que un fármaco es mejor que otro Figura S. Ensayo clín ico parale lo

De no inferioridad Se supone una eficacia similar, el nuevo


fármaco tiene otras ventajas Di seño cruzado o int rapacient e: consiste en que un mismo pa-

Enmascarados ciente va a recibir los dos tratamientos objeto de comparación en


Empleo de técnicas de ciego para evitar sesgos
dos momentos distint os, de modo que el propio paciente sirve de
Abiertos No enmascarados control a sí mismo, lo que permite lleva r a cabo el estudio con un
Tabla 7. Clas ificación de los ensayos clínicos tamaño muestra ! menor al del diseño clásico al reduc ir la variabilidad
(Figura 6).
Los análisis intermedios se realizan durante las fases 11 1 y IV del estu- Uno de los problemas es el efecto carry-overo de arrastre (el efecto
dio. Están justificados para evitar que los pacientes del grupo control de uno puede influir sobre la toma del otro), por lo que debe haber
no se beneficien del tratamiento. Sin embargo, el realizar muchos un periodo de lavado entre la administración de ambos fármacos,
análisis intermedios aumenta el riesgo de cometer un error tipo 1, o entre las intervenciones terapéuticas, de modo que el primero
debe estar previsto en el protocolo del est udio, se ha de mantener haya sido totalmente aclarado del organismo antes de administrar
la confidencialidad de los resultados y tiene que haber una penaliza- el segundo.
Manual CTO de Medicina y Cirugía, 2. a edición

1 d"!!.fU!M 25-50% de las d ife rencias detectadas en estud ios de superiori-


dad previos.
t
W1:Hi 1•1:!111·lih Análisis de las variables: el aná lisis que suele real izarse es "por
protocolo". Est e análisis permite aumentar las diferencias entre
los tratam ientos, lo que dificulta poder conclui r que dos trata-
mientos son equiva lentes, manten iendo la posición más cauta
en la interpretació n de los resul tados.

Periodo de blanqueo
8.4. Estudios de bioequivalencia
Resultado 2
Los estud ios de bioeq uiva lencia son ensayos cl ín icos en los que su objeti-
'------1~ Comparación~---'
vo es la demostración de la similitud en biodisponi bilidad de dos formu-
Fig ura 6. Ensayo clínico cruzado laciones de un m ism o principio activo a pa rtir de la compa ración de sus
característi cas farmacocinéti cas.
Diseño secuencial: consiste en introducir pares de pacientes alea-
torizados a los dos tratamientos hasta q ue la diferencia entre los dis- En la mayoría de los casos, el d iseño de los estud ios de bioequivalencia
tintos tratam ientos favorezca a uno u otro (exceso de preferencias), es el de un ensayo clínico cruzado y con asignación aleat oria de dos se-
momento en el que el ensayo clínico se detiene. cuencias de tratam iento.
Diseño factorial: en ese tipo de diseño se eval úan simul táneamen-
te dos tratamientos distintos en una m isma muestra de sujetos, asig- Con el fi n de red ucir la va riabi lidad de la muestra, se suelen elegir pa ra
nándose aleatoriamente a los suj etos a uno de los cuatro grupos pa rticipar en el estud io voluntarios sa nos (no persig uen, por ta nto, com-
posibles: A, B, A + By placebo (Tabla 8). Con este d iseño es posible pa rar la eficacia de dos fo rmas de tratam ient o, depend iendo el tamaño
eva luar la interacció n ent re los dos tratam ientos, au nque hay que de la muestra de la va riabilid ad interind ividua l (diferente farmacocinética
asum ir q ue entre am bos no hay interaccio nes. La eva luación de dos para cada sujet o) qu e se haya o bservado en estud ios piloto previos.
o más interve nciones puede hacerse mediante un diseño de t ipo
pa ralelo. La demostració n de bioequiva lencia se o bt iene mediante la compara-
Sin em ba rgo, esto es posibl e qu e requiera un gran ta maño mu estral ción de los perfil es farm acocinéticos de los fá rm acos estu d iados. Para
y sea inefi ciente, especialmente si hay t ambién interés en considerar ello, después de la admini stración de cada formulació n, es necesa rio sa-
combinacio nes de las int ervencio nes. ber qué ca ntidad de fárm aco existe en el organ ismo y cómo va variando
El diseño más apropiado en esta situació n es de t ipo factor ial, donde a lo largo del t iem po.
se pueden asignar de manera aleat oria dos o más intervencio nes de
forma independ iente, de ta l modo q ue los sujetos pueden no recib ir El proced im iento más habit ual consiste en la obtención de sucesivas de
ning una intervención, una de ellas o eventualmente todas. muestras de sangre. Es m ucho menos frecuente que sea necesa ria la de-
terminación del fá rmaco en orina o en otras muestras bio lóg icas.

Tratamiento Placebo

B 8.5. Ensayo clínico de tamaño único


Placebo A Placebo
Cada paciente se asigna a uno de los 4 grupos resu ltantes El ensayo clín ico de tamaño ún ico (n: 1) se basa en mod ificar el t ratam ien-
Tabla 8. Ensayo clíni co de di seño factorial to de una enfe rm edad de un paciente a lo largo de una seri e determ ina-
da de peri odos de t iempo. El fin del estudio es confirmar la efi cacia o no
Diseño de no-inferioridad: habitualmente los ensayos clínicos se del trat amiento en un único paciente.
rea liza n con el fin de demostrar la superiorid ad de un fárm aco con
respecto a otro. Sin embargo, puede ser útil probar que dos fármacos Como en este caso hay un único paciente, no es posible comparar-
son al menos ig ualmente eficaces, con lo cual se podrá emplear, por lo con ot ros, po r lo que aquí se com para n peri odos de t ratamiento
ejem plo, el más barato. Es decir, im porta q ue NO sea inferior, de mane- para el mismo paciente. Por ejemplo, el paciente L.G. recibe duran-
ra que si es ig ual o superior se considera q ue el fármaco experimenta l te un t iempo el t rata miento A y luego el B. Es decir, en un ensayo n: 1,
es "no-i nferior" compa rado con el g rupo control. Se denom ina equiva- la unidad experi menta l es el periodo de t ratam iento y no el pacien-
lente terapéutico a un fá rmaco d iferente en su estructu ra quím ica del te. Se compara la eficacia del tratamiento A frente al B en el señor L.
original, pero del que se espera un efecto terapéutico y un perfil de Por supuesto, la secuencia de tratamientos puede hacerse al azar
efectos adversos sim ilares cuando se ad ministra a un paciente. y con técnicas de enmasca ramiento. El ensayo clínico n: 1 es m uy útil para:
La eq uivalencia terapéut ica se defi ne a pa rt ir de los estudios de no- Eva luar el t ratam iento si ntomático en enfermedades en las q ue no
inferioridad. En estos estud ios es importa nte tener en cuenta dos se haya encontrado una intervención eficaz en ensayos convencio-
aspectos: na les, como por ejem p lo en enfermedades raras.
Valor delta: es la máxima d iferencia clínica que se acepta para En aq uel las situaciones en las que exista una gran variabi lidad inte-
definir dos t ratam ientos co mo equiva lentes, que es d istinta para rindividua l en la respuesta al trata miento, como en el caso de trata-
cada t ipo de fá rm aco analiza do. Habitua lmente se considera un mient o con d icu marínicos.

08 · Ensayo clínico
Estadística y epidemiología 1 08
Tratam iento sinto m ático de enfe rmeda des co n im portante com po- Se ha demostrad o qu e la imp lem ent ación d e los criterios CONSORT
nente subjet ivo, como por ej em p lo m ig ra ñas, do lores arti cu lares en mejo ra la ca lida d de la in fo rmació n publ ica d a en los estu di os aleato-
la artros is, fi brom ialgia .. rios.

Es necesario que la cond ición estu d iada sea crón ica, con síntomas re-
petidos pero reversibles y con respuesta al t ratam iento evaluable por el Valorados: elegibilidad (n= ... )
paciente (por ej., cefalea tens iona l). Se evalúa, po r ta nto, un tra tam iento
sintomático y no cura ti vo.
Excluidos (n= ..• )
Por las característi cas del estu d io es evide nte que las co nclusio nes obte- Sin criterios de inclusión (n=...)
Rechazan participar (n= ...)
nidas no son generalizables a todos los pa cient es co n la m isma enfe rme- Otras razones (n= ...)
dad o síntoma.

Aleatorizados (n=...)
8.6. Recomendaciones
para la publicación de ensayos 2 Asignados a la intervención (n= ...)
Reciben intervención asignada (n= ...)
clínicos (recomendaciones CONSORT) No reci ben intervención asignada (razón) (n=...)

Los estudios aleatorizados rep resenta n el patrón de refe rencia para cono- 3 Perdi dos seguimiento (razón) (n= ...)
Intervención no continuada (razón) (n= ...)
ce r la eficacia de un determ inado trata miento. Sin embargo, la calidad de
los estu dios puede no ser óptima. La declaració n CONSORT (Consolida-
ted Standards of Reporting Tria/s) persigue mej o rar la m etodolog ía de los 4 Anal iza dos (n= ...)
ensayos clínicos, ya q ue permit e p resentar de forma sist ema t izada y co n Excluidos del anál isis (razón) (n= .. )
total transpa rencia los resu ltados pa ra mej ora r su va lidez. Se basa en el
seguimiento de una lista de variab les en fu nció n de la evidencia (Tabla 9) Figura 7. Diag rama de fl ujo de los sujetos participantes en las diferentes
y un diagrama de flujo (Figura 7) du rante el proceso de escritu ra, revisión fases de un estu dio aleato rizado: (1) Periodo de inclusión, (2) As ig nación
y aná lisis de los ensayos clínicos. a la intervención, (3) Seg uimiento, (4) Anál isi s

Variable (número) Descripción


Título y resumen (1) Cómo se asignó a los pacientes a la intervención ("asignación aleatorizada': "aleatorizados"
o "asignados aleatoriamente")
Int roducción Antecedentes (2) Antecedentes científicos y explicación de la hipótesis
Métodos Participantes (3) Criterios de elegibilidad de los participantes y situación y lugar donde los datos se obtuvieron
Intervenciones (4) Deta lles precisos de las interve nciones planeadas en cada grupo y cómo y cuá ndo se realiza ron
fi nalmente
Objetivos (S) Objetivos e hi pótesis específicos
Resultados (6) Defi nición clara de los objetivos de valoración de res ultados pri marios y secundarios y, en su caso,
de los métodos utilizados para mejorar la calidad de las mediciones (por ej.: observaciones
múltiples, entrenamiento de los valoradores)
Tamaño de muestra (7) Cómo se determinó el tamaño muestra! y, en su caso, explicación de cualqu ier anál isis interno
y de las reg las pa ra la fina lización del estudio
Aleatorización Generación Método utilizado para generar la secuencia de asignación aleatoria, incl uyen do los detalles
de la de cualquier rest ricc ión (por ej.: bloques, estratificación)
consecuencia (8)
Ocultación Método utilizado para implementar la secuencia de asignación aleatoria (sistemas ce rrados
de la asignación numerados, central telefónica) especifican do si la secuencia perm aneció ocu lta hasta el momento
(9) de la asignación a la intervención
Implementación Quién generó la secuencia de asignación, quién incl uyó a los participantes y quién asignó
(10) a los participantes a sus grupos respectivos
Cegamiento (enmascaramiento) Especifica r si los pa rticipantes, las personas que realiza ron o asignaron la inte rvención y las que
(11) valoraron los resultados conocían a qué gru po estaban asignados los pacientes. En caso contra rio,
cómo se va loró el éxito del enmasca ramiento
Métodos estadísticos (12) Métodos estadísticos uti lizados para comparar la variable de valorac ión de resu ltado pri maria
entre los grupos. Métodos empleados en los aná lisis adicionales, como los análisis de subgrupos
y ajustes
Tabla 9. Li sta de variabl es CONSORT (contin úa en la página siguiente)
Manual CTO de Medicina y Cirugía, 2.a edición

Variable (número) descripción


Resultados Flujo de participantes (13) Flujo de participantes en cada fase del estudio (se recomienda enca recidamente usar un diagrama).
De forma específica se debe detallar en cada grupo el número de pacientes asignados a cada
tratamiento, los que recibieron el tratami ento previsto, los que completaron el protocolo de estudio
y los que fueron ana lizados para la variable principal de resultado. Describir las desviaciones
del protocolo inicial y sus razones
Selección (14) Fechas que definan los periodos de selección y segu imiento
Datos basales (1 S) Características demográficas y clín icas basales de cada grupo
Números analizados (16) Número de participantes (denominador) de cada grupo incluido en cada análisis especificando si el
análisis se realizó por intención de tratar. Si es posible, indicar los resultados con números absolutos
(por ej.: 10/20, no 50%)
Resultados y estimaciones (17) Para cada va riable de va loración de resultado primaria y secu ndaria, indicar resumidamente
los resultados en cada grupo y la estimación de la importancia del efecto y de su precisión (por ej.:
1Cdel 95%)
Análisis secundarios (18) Valorar la presencia de multipl icidad presentando cualquier otro aná lisis realizado, incluyendo
análisis de subgrupos y ajustes, indicando los que fueron preespecificados y los de ca rácter
exploratorio
Acontecimientos adversos (19) Indicar todos los acontecimientos adversos importantes o los efectos secundarios en cada grupo
de intervención
Discusión Interpretación (20) Interpretación de resu ltados en la que se tenga en cuenta la hipótesis del estudio, las posibles
fuentes de sesgos o imprecisiones y los peligros asociados con la multiplicidad de análisis
y de resu ltados
Generabilidad (21) Generabilidad (validez externa) de los resultados del estudio
Evidencia global (22) Interpretación general de los resultados en el contexto de la evidenci a actualmente disponible

Tabla 9. Li sta de variables CONSORT (continuación)

" Un aspecto importante es manejar las pérdidas que se produ-


Ideas clave RS cen en un ensayo clínico. Lo mejor es tenerlas previstas a priori.
Si aún así se produjeran, sería conveniente realizar un nuevo es-
" El objetivo de la fase 1del ensayo clínico es determinar las pro- tudio con el tamaño apropiado. Sin embargo, no todas las pér-
piedades farmacodinámicas del fármaco, así como la dosis tóxi- didas afectan de igual manera al EC. Si las pérdidas se producen
ca del mismo. antes de la asignación del factor de estudio, no necesariamente
se ve afectada la validez del mismo, al contrario que si se produ-
" En una fase 11 se establece la dosis eficaz del fármaco. cen después de tal asignación.

" La fase 111 se caracteriza porque se compara la eficacia de otro " Los EC se dividen en:
fármaco con la del que se está investigando. Tras esta fase, el 1. Pragmáticos (muestra heterogénea) y explicativos (mues-
fármaco se introduce en el mercado. tra homogénea) .
2. Cruzado (cada grupo de sujetos toma los dos fármacos con
" La fase IV es la fase de la farmacovigilancia . En este caso, se re- un tiempo de lavado) y paralelo (cada grupo de tratamien-
gistra la aparición de efectos secundarios infrecuentes. La no- to toma un único fármaco) .
tificación en la práctica clínica de posibles eventos adversos se 3. Por intención de tratar (todos los sujetos incluidos en el es-
realiza mediante la tarjeta amarilla. tudio son analizados) y por protocolo (sólo se analizan los
que finalizan el estudio).
" La correcta secuencia en un ensayo clínico es: 4. De tamaño predeterminado (se conocen a priori el tamaño
1. Los pacientes cumplen los criterios de inclusión y exclu - de la muestra) o secuenciales (los pacientes van incorpo-
sión. rándose al estudio progresivamente).
2. Firman el consentimiento informado (sabiendo que po- S. De superioridad (interesa demostrar que un fármaco es
siblemente reciban placebo, si uno de los tratamientos mejor que otro) y de no-inferioridad (se supone una efica-
lo es). cia similar, la ventaja del nuevo fármaco es ser más barato,
3. Sean asignados a uno u otro grupo de intervención (prefe- tener una administración más fácil. .. ).
riblemente mediante aleatorización). 6. Enmascarados (se han realizado técnicas de ciego para evi-
tar sesgos) o abiertos (no enmascarados).

08 · Ensayo clínico
Estadística y epidemiología 1 08
2) De nin guna forma, si en el diseño del estudio se habían previs-
Casos clínicos to las pérdid as y, por t anto, se incluyó un número de pacientes
mayor para compensarlas.
En un estudio de seguimiento a largo plazo de pacientes con 3) Aumentando la probabi lidad de un resultado negativo falso al
fibrilación auricular, en la práctica clínica habitual, se ha docu- reducirse la muestra, pero si n que este hecho aumente las posi-
mentado un riesgo relativo de padecer un accidente vascular bilidades de sesgos.
cerebral, para anticoagulantes orales (en comparación con an- 4) Si el estud io era a doble ciego, el hecho no tiene importan cia,
tiagregantes plaquetarios), de 0,57 (intervalo de confianza al pero si el investigador conocía el tratamiento de cada paciente,
95% 0,40-0,80). La incidencia de accidente vascular cerebral entonces pudo haber sesgado los res ultados.
durante los dos primeros años de seguimiento es de un 2% y
un 3,5% respectivamente. Supon iendo que estos resultados RC: 1
sean válidos, ¿a cuántos pacientes habría que tratar con anti-
coagulantes orales, en lugar de antiagregantes, para evitar un Los ensayos clínicos de fase 11:
accidente vascular cerebral?
1) Se suelen realizar en grupos de paci entes no muy numerosos.
1) 50-60. 2) Regula rmente son estudios observaciona les.
2) 60-70. 3) Su obj etivo principa l es confirmar la efectividad de un medica-
3) 70-80. mento en una pato logía concreta.
4) 80-90. 4) Su objetivo principa l es eval uar la seguridad y tolerabilidad de
un med icamento.
RC: 2
RC: 1
Suponga que, en la lectura de un ensayo clínico en el cual se
han incluido SO pacientes por grupo, observa usted que los re- ¿A qué tipo de ensayo clínico nos referimos cuando los criterios de
sultados se refi eren a 47 pacientes en un grupo y 42 en el otro. inclusión se ajustan a las indicaciones, con criterios de exclusión me-
Con respecto a los pacientes que faltan, el autor comunica que nos restrictivos para incluir una amplia representación de la enfer-
fueron retirados por no seguir el tratamiento y que no hay di- medad en estudio y fundamentar así el registro de un medicamento?
ferencias estadísticamente significativas entre g rupos en cuanto
al porcentaje de pérdidas de pacientes. ¿Cómo cree que podría 1) Estud io en fase l.
afectar este hecho a los resultados del ensayo? 2) Estudio en fase 11.
3) Estudio en fase 111.
1) La val idez del estudio podría ser dudosa, ya que la pérdida de 4) Estudio en fase IV.
pacientes tal vez esté re lacionada con los efectos de los t rata-
mientos. RC: 3
• Estadística y epidemiología

Niveles de calidad de la evidencia


científica

dos los estudios existentes. Del m ismo modo que en el modelo de efec-
Este es un tema importante
tos fijos, el efecto g loba l se estima aquí como una media ponderada de
y sencillo. Hay que conocer
los diferentes conceptos, así los estimadores ind ividua les.
como resolver tablas que incluyan
los conceptos anteriores. M ientras que algunos autores defienden la uti lización del modelo de
efectos aleatori os en todos los casos, ot ros hacen hincapié en sus posi-
bles deficiencias, como el hecho de que es menos preciso, proporcio-
nando intervalos de confianza más amplios que el modelo de efectos
9.1. Metanálisis fijos. Si las discrepancias son muy grandes, el modelo de efectos alea-
torios se convierte en la alternativa al modelo más sencil lo con efectos
fijos para combinar los resultados. En el de efectos fijos, la genera liza-
El metanálisis es un análisis estadístico que combina o integra los resul- ción se limita a la población de estudios de características simi lares a
tados de varios ensayos cl ínicos independientes que el ana lista considera los incluidos en el metaná lisis. En el modelo de efectos aleatorios, por el
que se pueden combinar. Añade a la mera revis ión de los datos, un análisis contrario, los resultados pueden genera lizarse a una población mayor
estad íst ico de los mismos para dar un resu ltado conjunto de todos los es- de posibles estudios.
tud ios revisados. Es un estud io observacional (de ensayos clínicos), lo que
implica que está sometido a los mismos sesgos de los citados estudios.
9.2. Factores determinantes
No puede tener mayor fortaleza metodológica que los estud ios prima-
rios. Si anal iza ensayos clínicos (EC) de buena ca lidad, obtendrá resu lta-
de la calidad de la evidencia científica
dos fiables y viceversa.
Los aspectos del diseño de un estud io epidemiológ ico que están asocia-
Métodos estadísticos para la combinación dos a una mayor calidad y rigor científico son los sig uientes:
El sentido prospectivo del estud io (secuencia tempora l).
de los resultados de diferentes estudios
La asignación aleatoria a los grupos experiment al y co nt rol.
La existencia de un grupo control concurrente.
Los métodos estadísticos más utilizados en la práctica pueden clasifica rse en El enmascaramiento de pacientes e investigadores participa ntes.
dos grupos, según se tenga en cuenta o no la heterogeneidad entre estud ios La inclusión en el estud io de un número suficiente de pacientes
en el aná lisis: los modelos de efectos fijos y los modelos de efectos aleatorios. como para detectar, en caso de haberlas, diferencias estadísticamen-
te significativas entre los distintos grupos del estudio.
Modelos de efectos fijos

En el modelo de efectos fijos se asume que no existe heterogeneidad 9.3. Escalas de gradación
entre los estudios incluidos en la revisión, de modo que todos ellos esti-
man el mismo efecto, y las diferencias observadas se deben únicamente
de la evidencia científica
al azar. El efecto g loba l puede estimarse como un promed io ponderado
de los efectos ind ividua les de cada estud io. Todas las esca las de gradac ión son muy sim il ares entre sí y presen-
tan al metanálisis de EC contro lados y aleatorizados como el estu-
M odelos de efectos aleatorios dio más riguroso y que aporta mayor evidencia causa l. La medic ina
basada en la evidencia persigue la int egración de la maestría clí-
Por el contrario, con un modelo de efectos aleatorios se asume que los nica individua l con las mejores evidencias cient íficas disponibles
estudios incluidos en la revisión constituyen una muestra aleatoria de to- (Tablas 1 O y 11 ).
Estadística y epidemiología 1 09
La calidad de la evidencia científica se clasifica en tres grados de reco- Regular (grado B): hay cierta evidencia científica (no concluyente)
mendación para la adopción de una med ida sa nitaria : para recomendar o desaconsejar la adopción del procedimiento
Buena (grado A): existe adecuada eviden c ia científica para re- médico.
co mendar o desaconsejar la adopción del procedimiento mé- Mala (grado C): existe insuficiente evidencia científica para reco-
dico. mendar o desaconsejar la adopción del procedimiento médico.

Fuerza de la recomendación
A Existe adecuada evidencia científica para adoptar una práctica 1, 11- 1
B Existe cierta evidencia para recomendar la práctica 11- 1' 11- 2
e Hay insuficiente evidencia pa ra recomendar o no recomendar la práctica 111
D Existe cierta evidencia para no recomendar la práctica 11- 1' 11- 2
E Existe adecuada evidencia científica para no adoptar la práctica 1, 11- 1
Tabla 1O. Fuerza de recomendación clínica basada en los ni veles de evidencia

Niveles de evidencia
Grado 1 Evidencia obtenida a partir de al menos un ensayo clínico aleatorizado y contro lado bien diseñado
Grado 11 - 1 Evidencia obtenida a partir de ensayos clínicos no aleatorizados y bien diseñados
Grado 11- 2 Evidencia obtenida a partir de estudios de cohortes (2a: prospectivo y 2b: retrospectivo)
Grado 11- 3 Evidencia obtenida a partir de múltiples series comparadas en el tiempo, con o sin grupo control. Incluye resultados "d ramáticos"
producidos por experimentos no controlados (por ej., penicilina en los años cuarenta)
Grado 111 Opiniones basadas en experiencias clínicas, estudios descriptivos o informes de comités de ética
Tabla 11. Gradación de la evidencia científica

" Si está realizado correctamente, es el estudio que aporta mayor


Ideas clave ff5 evidencia científica.

" El metanálisis es un estudio en el que se realiza una combina- " Una limitac ión importante se debe a que sólo se publican resul-
ción estadística de los resultados de ensayos previos similares. tados favorables (sesgo de publicación).
• Estadística y epidemiologia_

Estadística. Generalidades

Muestreos probabilísticos: en ellos se conoce la probabilidad de


En este tema sólo hay que saber
ORIENTACIÓN dos cuestiones, qué son que un individ uo sea eleg ido para la muestra. Son interesantes para

ENARM los tipos de muestreo y los tipos


de variables.
usar estadística matemática con ellos. La elección de la muestra se
hace aleatoriamente. La est adística inferencia! exige este tipo de
muestreo.
Muestreos no probabilísticos: en el los no se conoce la proba-
Se define la estadística como el método de razonamiento que permite bi lid ad. Son muestreos que muy pos ibl emente esconden ses-
interpreta r un conjunto de datos cuyo carácter esencial es la va ri abilidad. gos. En principio, no se pueden extrapolar los resultados a la
pob lación.

1 0.1. Tipos de estadística Los muestreos con la menor posibil idad de sesgo (probabilísticos) son
los siguientes: aleatori o simple, sistemático, estratificado y por grupos o
cong lomerados.
Existen dos tipos de estadística: Muestreo aleatorio simple: es aquel tipo de muestreo en el que
Estadística descriptiva: organ ización, presentación y síntesis de los cada individuo t iene las mismas posibilidades de ser elegido para
datos de una manera científi ca y lóg ica. forma r parte de la muestra.
Estadística inferencia!: bases lógicas med iante las cua les se esta- Muestreo aleatorio estratificado: en él la población se divide en
blecen conclusiones relacionadas con poblaciones, a pa rtir de los estratos. La muestra se obtiene seleccionado de cada estrato un
resu ltados obtenidos en muestras; trabaja con los datos que le pro- número proporcional a la población que representa. Con este tipo
porciona la estadística descriptiva y es la parte de la estadística fun- de muestreo se asegura que la muestra tenga la misma proporción
damental para la medicina cl íni ca. Se basa en dos pilares básicos, de una(s) variable(s) que la población de la que procede y que po-
que son el contraste de hipótesis y la estimación de intervalos de dría tratarse de una variable pronóstico diferente en los grupos de
confianza. estudio.
Muestreo sistemático: el proceso de selección em pleado se basa
en alguna reg la sistemática sim ple, como por ejemplo, eleg ir uno de
1 0.2. Población y muestra cada n individuos.
Muestreo por conglomerados: en este tipo, la selección se real i-
za fundamenta lmente con el objetivo de reducir costes, utilizando
La población es el conjunto de todos los individuos, genera lmente inac- como base del muestreo al grupo de sujetos.
cesible, que tienen en común alguna característica observable y del que
se pretende obtener una serie de conclusiones. Por último, ind ividuo será cada uno de los componentes de la población
y de la muestra. Al número de individuos que forman la muestra se le
Se denom ina muestra al conjunto menor de individuos, accesible y limi- llama tamaño mu estra ! (n).
tado, sobre el que se rea liza el estudio co n idea de obtener co nclusiones
genera lizab les a la población.
1 0.3. Variables
El proceso de selección de los ind ividuos se puede rea lizar mediante dis-
tintas técn icas de muestreo. Los t ipos de muestreos se detallan a conti-
nuación. Es importante conocer que el tipo de muestreo más importante Una variable es una característica observable que se desea estudiar en
es el muestreo probabilístico, en el que todos los elementos de la pobla- una muestra de individuos, pudiendo tomar diferentes valores. Los tipos
ción tienen la misma probabilidad de ser incluidos en la muestra: de variables están recog idos en la Tabla 12.
Estadística y epidemiología 1 10
Variable Subtipo Ejemplo

Cualitativa Nominal dicotómica Sexo


Nominal no dicotómica Raza
Ordinal Nivel socioeconómico

Cuantitativa Discreta N° episodios de asma/sem.


Contin ua Uri cem ia
Tabla 12. Tipos de variables

estratificado debe realizarse cuando haya en la muestra una hi-


Ideas clave 16 potética variable pronóstica que pudiera influir en el desarrollo
de la enfermedad.
" La obtención de una muestra a partir de la población puede hacer-
se de forma probabilística (mediada por el azar) y no probabilística. " Las variables son características observables. Pueden ser
cuantitativas o cualitativas, en función de que la variable ana-
" Los tipos de muestreo probabilístico son el muestreo aleatorio lizada pueda cuantificarse o expresarse en función de una ca-
simple, el estratificado, el sistemático y por conglomerados. El racterística.
• Estadística y epidemiología_

Estadística descriptiva

Oceanía
Lo más importante de este tema
8%
ORIENTACIÓN es conocer la definición de los
ENARM parámetros de tendencia central
y de los de dispersión.
Europa
7%
Asia
28,5%

Antártida
Se p uede cons ide rar la est adíst ica descr ipti va co m o el co nj unto d e 9%
técnicas que fac ilita n la o rga nizac ió n, resu m en y co municac ió n de
datos.

11.1. Representación gráfica


África
20,5%

La representación g ráfica de los datos obten idos en cua lquier estudio fa- América
28%
cilita un aná li sis visua l. Seg ún la natu raleza de las variables estu d iadas, se
util izan diferentes tipos de representación. Figura 9. Diagrama sect ori al

Variables cualitativas En ambos casos, se debe cum p lir el prin cipi o de proporcio nal idad de las
áreas a las frecuencias ab solutas. En los d iag ramas de sect ores, el ángu lo
Se emplea n: ce ntral es propo rcio nal a la frec uencia absoluta co rrespo nd iente, por lo
Diag rama de ba rras (Figura 8). que también lo es su área. Los d iag ramas de ba rras ti enen una base co ns-
Diag rama sectoria l (paste l) (Figura 9). tante y una altura proporcio nal a la frecuencia absoluta cor respond iente
(también su área lo es a la frecuencia ab soluta).

Variables cuantitativas discretas


0,5

Diagrama de barra s: en un diagrama, sobre el va lor que puede to-


0,4 mar la variable, se levanta una ba rra cuya altura mide exactamente
la frecuencia absolut a del va lor. También es posible rep resentar la
frec uencia re lativa y/o los porcentajes.
0,3

Variables cuantitativas continuas (Figura lO)


0,2
Histograma: es un gráfi co q ue est á fo rmado por rectáng ulos adya-
ce ntes q ue t ienen por base cada uno de los interva los y por altura,
0,1
las frecuencias absolutas. La superfi cie de ca da rect áng ulo es pro-
porcio nal a la frecuencia de cada una de las clases, y el área total lo
o será al número de ind ividuos en la muestra .
L M X V S D
Polígono de frecuencias: es una línea quebrada q ue une los puntos
Figura 8. Diag rama de ba rras med ios de las barras superiores de los rectá ng ulos del histog rama.
Estadística y epidemiología 11
distintas: la media utiliza todos los datos y es, por tanto, preferible si los
datos son homogéneos; tiene el inconveniente de que es muy sensible
a observaciones atípicas, y un error de datos o un valor anormal puede
modificarla totalmente.

Por el contrario, la mediana emplea menos información que la media, ya


que sólo tiene en cuenta el orden de los datos y no su magnitud, pero,
en contrapartida, no se ve alterada si una observación (o, en general, una
pequeña parte de observaciones) es extrema o contiene errores grandes
de medida o de transcripción.

En consecuencia, es siempre recomendable ca lcu lar la media y la media-


na, puesto que ambas medidas diferirán mucho cuando la distribución
sea muy asimétrica (Figura 11 ), lo que sugiere heterogeneidad en los
9,5 19,5 29,5 39,5 49,5 59,5 69,5 79,5
datos.
Figura 1O. Histograma y polígono de frecuenc ias

11.2. Síntesis de los datos

Medidas de localización o tendencia central

Las medidas de centralización indican alrededor de qué valores se agru-


Moda t Media

pan los datos observados. Se distinguen las siguientes: Mediana


Media aritmética: es la medida de centralización más común. Se
ca lcula sumando los va lores numéricos de todas las observaciones y Figura 11. Distribución as imétrica
dividiendo el total por el número de observaciones.
Medidas de dispersión o variabilidad
x= Junto a las medidas de tendencia central, las medidas de dispersión o
n
variabilidad completan la información sobre la distribución de la variable
(ind ican si los va lores de la m isma están muy dispersos o se concentran
La media arit mética verifica la propiedad de eq ui librar las desviacio- alrededor de la medida de central ización) (Tabla 13).
nes positivas y negativas de los datos respecto a su va lor, es decir,
I (x, - x) =O. Actúa, por tanto, como centro geométrico o centro de
"g ravedad" para el conju nto de puntos. Medida de centralización Medida de dispersión
Mediana: es el valor numérico que divide al conjunto de datos orde-
Distribución Media Desviación típica
nados en dos partes iguales, es decir, el SOo/o de los datos será menor
homogénea o estándar
que ella y el resto, mayor. En una d istribución simétrica, la mediana
coincide con la media aritmética, pero no así en una asimétrica. Distribución Mediana Rango intercuartílico
asimétrica
Moda: es el va lor más corriente o el valor de la variable que se pre-
senta con mayor frecuencia. Pueden existir distribuciones con más Tabla 13. Formas de med ida
de una moda.
Parámetros de posición: cuartiles, deciles, percentil es. Son valores Rango o recorrido: diferenc ia entre el valor máximo y el mínimo
que dividen el conjunto de las observaciones en cuatro, d iez o cien observado en una seri e.
partes igua les, respectivamente. Por ejemplo:
R = Máx. - Mín.
Q2 = OS = PeSO= mediana
Desviación media: es la media de las desviaciones respecto a la me-
El SOo/o de las observaciones será inferior al segundo cuartil, quinto d ia aritmética.
decil o percentil 50.
Media geométrica: muy utilizada en Microbiología y Serología, cu- - x-'-
L.-'I-x'-i_ 1
Dm= -
yos datos t ienen una marcada asimetría positiva (hacia la derecha). n
Por ejemplo: títu los de anticuerpos.
Varianza: se define como la media del cuadrado de las desviaciones
Comparación de medidas de centralización de los elementos respecto a la media aritmética.

Aunque desde un punto de vista pu ramente descri ptivo, estas medidas L. (xi - x) 2
proporcionan información complementaria, sus propiedades son muy n
Manual CTO de Medicina y Cirugía, 2.a edición

Desviación típi ca o estándar: es la raíz cuadrada positiva de la va- ción estánda r sobre la media. Es el método de elección para com-
rianza. Es, junto con esta, la med ida de dispersión más utilizada. pa rar la variabilidad o d ispersión relativa de variables que estén
expresadas en las mismas o en d ifere ntes un idades.

~
s = V s2 =
J L:(xi -x?
n (V= - -X- - ~ 00

La desviación típica es una medida complementaria de la media arit- Propiedades de media y varianza
mética; mientras que esta da una idea de la magnitud genera l de la
distribución, la desviación estánda r muestra cómo se distribuyen los Si a todos los va lores de una distribución se les suma una constante,
valores alrededor de la media. su media queda aumentada en ese va lor, mientras que su varianza
Rango intercuartílico: es la diferencia entre el percentil 75 y el 25. no se modifica.
Es, junto con el rango, la medida de dispersión usada para los datos Si a todos los va lores de una distribu ción se les multiplica por una
asimétricos. constante, su med ia y su desviación t ípica quedan mu lt iplicadas por
Coeficiente de variación (CV): es una med ida de d ispersión ad i- la constante, mientras q ue su va rianza queda multiplicada por el
mensional. Se define como el porcentaje que representa la desvia- cuad rado de esa constante.

rámetro de tendencia central la med ia y de dispersión, la des-


Ideas clave J!iS viación típica .

" La forma de representación gráfica va a depender del tipo de va- " En distribuciones asimétricas, se emplea la mediana como pa-
riable. Para las cua litativas y las cuantitativas discretas, se emplea rámetro de tendencia centra l y el ra ngo como parámetro de
el diagrama sectorial y el diagrama de barras. Para las cuantitativas dispersión.
continuas se ut iliza el histograma y el polígono de frecuenc ias.
" En la distribución de Gauss, media, mediana y moda coinciden
" Para definir correctamente una variable en una muestra se ne- en el mismo valor.
cesitará un parámetro que sirva para aglutinar todos los valores
de dicha muestra (parámetro de tendencia central) y otro que " El coeficiente de variación es el parámetro que se emplea pa ra
sirva para informar de lo agregados o no que están los valores decir si una distribución es homogénea o dispersa. Además, in-
(parámetro de dispers ión). forma de cuál de entre dos distribuciones muestra una mayor
variabilidad (dispersión).
" El tipo de distribución más frecuente es la normal o de Gauss,
que es simétrica . En distribuciones simétricas se usará como pa-

En un estudio en el cual se ha medido la intensidad de dolor en


Casos clínicos un grupo de 145 pacientes con artritis reumatoide mediante una
escala de O (ausencia de dolor) a 1O (dolor de intensidad máxi-
Un niño de S años pesa 20 kg. Según las tablas de Tanner-White- ma), se informa de que la mediana es de 6. ¿Cuál el significado
house, este valor corresponde aproximadamente al percentil 75 de este valor?
de la distribución del peso en niños de dicha edad. ¿Qué significa
esta expresión? 1) La mitad de los sujetos de la muestra tienen valores de intensi-
dad de dolor iguales o inferiores a 6.
1) El 75% de los niños de 5 años pesan aproximadamente 20 kg. 2) El va lor 6 indica la intensidad de dolor que puede considerarse
2) El niño pesa un 75% más que el promedio de los niños de su normal en la escala utilizada.
edad. 3) El valor 6 de la escala ha sido la puntuación obtenida con mayor
3) El 75% de los niños de 5 años pesan menos de 20 kg. frecuencia por los sujetos de la muestra.
4) El niño tiene un peso que es un 75% superior a la mediana del 4) El valor 6 es la media aritmética de las puntuaciones obtenidas
peso de los niños de su edad . por los sujetos de la muestra.

RC: 3 RC: 1

11 · Estadística descriptiva
Estadística y epidemiología - ..

Probabilidad

Si A es el suceso complementario de A, que sucede siempre que no


Todo el tema se puede resumir
ORIENTAC I ÓN lo hace A, entonces: P(A) = 1 - P(A).
en dos fórmulas,
ENARM que son la de la suma
y la de la multiplicación.
Dos sucesos son mutuamente excluyentes (incompatibles) cuan-
do no pueden ocurrir a la vez (por ej., ser mujer y tener cáncer de
próstata).

P(A n B) = P(A y B) = o
12.1. Probabilidad
Dos sucesos son independientes cuando la probabilidad de apari-
ción de uno de ellos no está relacionada o no se modifica por la
Se supone una población finita con N elementos, k de los cuales tienen aparición del otro (por ej., efectos secunda rios de un fármaco en dos
la característica A. Se conoce como probabilidad de la característica A en pacientes).
la población a: P (A)= k/N. La probabilidad se define, desde un punto de
vista óptimo, en t érminos de frecuencia re lativa. P(A n B) = P(A y B) = P(A) x P(B)

Número de veces que ocurre A


P(A) =
Número de veces que puede ocurrir A 12.2. Probabilidad condicionada

De esta forma: La probabilidad de A cond icionada a la ocurrencia de 8 se define consi-


derando ún icame nte los casos en los q ue apa rece 8, y viendo en cuántos
Casos favorab les de estos casos t iene lugar el suceso A. Es la probabi lidad de que suceda A,
P(A) =
Casos posibles una vez que ya ha sucedido B.

P(A n B) P(A) x P(B!A)


Propiedades (Figura 12)
P(A/8) =
P(B) P(B)

La probabilidad es un valor entre Oy 1, es decir, O:> P(A)::; l .


Se llama suceso seguro E al que ocurre siempre, entonces: P(E) = l.
12.3. Regla
de la multiplicación

Reg la Reg la Es la probabilidad de que sucedan A


de la multiplicación de la suma y B.

P(A n 8) = P(A/8) x P(8)

An B (Ay B)
Si dos sucesos son independientes,

Au B (A o B)
entonces:

Figura 12. Reglas de la probabilidad P(A n 8) = P(A) x P(8)


Manual CTO de Medicina y Cirugía, 2. 8 edición

12.4. Regla de la suma Si dos sucesos son mutuam ente excluyentes (o bien se da A o bien ocu-
rre 8), entonces:

Esta reg la nos indica la probabilidad de que suceda A o de que suceda B: P(Au8) = P(A) + P(8)

P(A u 8) = P(A) + P(8) - P(A n 8)

" La multiplicación se aplica cuando se pregunta por la probabili-


Ideas clave RS dad de que ocurra un evento y el otro (probabilidad de que un
sujeto tenga cáncer de pulmón y de laringe) .
" La fórmula de la suma se debe aplicar cuando se pregunta cuál es
la probabilidad de que ocurra un evento u otro (por ejemplo, pro-
babi lidad de que un sujeto tenga cáncer de pulmón o de laringe).

12 · Probabilidad
Estadística y epidemiología •

Principales leyes de distribución


de variables aleatorias

la probabilidad de éxito muy baja. Es, por consiguiente, la ley adecuada


Se debe saber interpretar
para los "sucesos raros': cuando p <O, 1 y n x p < 5.
los intervalos de una muestra
a partir de la curva de Gauss
y manejar perfectamente esta
distribución. 13.4. Distribución normal o de Gauss

Este t ipo de distribución es seguida por una inmensa cantidad de varia-


13.1. Principales leyes de distribución bles biológicas cuyas medidas se agrupan alrededor de un va lor central,
y que presentan una frecuencia cada vez menor a med ida que se alejan
de variables aleatorias de dicho va lor.

Una vez que se ha eleg ido la muestra y recog ido los datos, el siguiente paso Características
es inferir las propiedades de la población a partir de la m uestra. El instru-
mento conceptua l que permitirá esta generalización es un modelo de la Las características de la d istribución norm al o de Gauss son las sigu ientes:
población, es decir, una represe ntac ión simbólica de su co m portam iento. Corresponde a variab les cuantitativas con ti nuas.
Se caracteriza por dos med idas: med ia y desviación típica.
Existen tres leyes teó ricas q ue tienen la particularidad de ser seguidas por Es unimodal.
una inmensa mayoría de los fenómenos biológ icos habituales; estas leyes Es simétrica alrededor de la media. Por tanto, media, mediana y
son las siguientes: moda coinciden.
Distribución binomial (distribuciones discretas). Tiene forma acampanada, sin un pico excesivo.
Distribución de Poisson o de los sucesos raros (distribuciones discretas). Va desde- oo a + oo (asintótica al eje de abscisas).
Distribución normal o de Gauss (distribuciones continuas). El área bajo la cu rva tiene un va lor igual a l.

El 50% de las observaciones se encuentran por debajo de la media arit-


13.2. Distribución binomial mética y el 50% por encima. El 68% de las m ismas están dentro del in-
tervalo x ± s; el 95% dentro del intervalo x ± 1,96s y el 99% dentro del
intervalo x ± 2,57 s.
Es una ley teórica de aplicación siempre que se conozca, de entrada, la
probabi lidad de aparición de un fenóme no bio lóg ico (p). El resultado es Tipificación
dicotómico y puede ser eva luado co m o "éxito o co n fracaso': La variab le
de interés es el número de éxitos alcanzados en n pruebas. La distribución normal viene defin ida por la med ia y por la desviación
t ípica; pueden existir, por tanto, infin itas curvas de este t ipo, tantas como
La distri bución binom ial co nstitu ye siempre un diagrama de barras dis- va lores puedan toma r la med ia y la desviación típica (Figura 13). La dis-
continuo se aplica a va ri ables d iscretas. tribución norma l tip ificada t iene una media ig ual a O y una desviación
típica cuyo va lor es 1 [N (O, 1)] y se encue ntra tabu lada. Es posible trans-
formar cua lquier variable aleatoria q ue se distribuya normalmente a una
13.3. Distribución de Poisson normal tipificada med iante la sigu iente ecuación:

Xi -x
En general, se empleará la d istribución de Poisson como aproximación de Z=
experimentos binomiales donde el número de pruebas es muy alto, pero
Manual CTO de Medicina y Cirugía, 2. 8 edición

68%
Ideas clave RS
" La distribución normal o de Gauss es una curva de probabili-
dad continua con forma de campana.

" Los tres parámetros de tendencia central: med ia, mediana y


moda, coinciden en el mismo valor.

" Los límites de dicha campana son+/-= y su área es l.

" Siempre se cumple que en el intervalo media +/- 1,96 s está


incluido el 95% de la muestra.

3s 2s 1s X 1s 2s 3s

95%
99,7%

Figura 13. Distribución normal

2) El rango de valores de IMC observado en las 275 mujeres va des-


Casos clínicos de 19 a 35 .
3) Aproximadamente, el95% de las mujeres estudiadas tienen va-
En una muestra aleatoria extraída de población sana se encuen- lores de IMC situados entre 19 y 35.
tra que una variable bioquímica tiene como media 90 y como 4) Aproximadamente, el 95% de las mujeres estudiadas tienen va-
desviación típica 1O. La afirmación: "aproximadamente el 95% lores de IMC situados entre 23 y 31.
de los individuos sanos tiene un valor de esa variable compren-
dido entre 70 y 11 O" es correcta: RC: 3

1) Siempre. Un estudio realizado sobre una muestra de 200 sujetos infor-


2) Nunca. ma de que su edad media es de 45 años, con una desviación
3) Sólo si la variable tiene distribución normal. estándar de 8 años. ¿Cuál de las siguientes afirmaciones es
4) Sólo si la variable tiene distribución normal y la muestra es sufi- correcta?
cientemente grande.
1) La mayoría de sujetos tienen entre 37 y 53 años.
RC: 4 2) Aproximadamente, el 95% de los sujetos tienen entre 29 y 61
años.
En un estudio sobre 275 mujeres premenopáusicas, se informa 3) Se tiene un 95% de confianza de que la verdadera edad media
de que su índice de masa corporal (IMC) sigue una distribución se sitúe entre 29 y 61 años.
normal, con una media de 27 y una desviación típica de 4. ¿Cuál 4) Se tiene un 95% de confianza de que la verdadera edad media
de las siguientes afirmaciones es cierta? se sitúe entre 37 y 53 años.

1) El rango de valores de IMC observado en las 275 mujeres va des- RC: 2


de 23 a 31.

13 · Principales leyes de distribución


de variables aleatorias
_fstadlst iea y epi demi olug_í____
a ----·

Estimación de parámetros.
Estadística inferencial

normal cuya media, la media de las medias, es la media poblacional (!l) y


Para abordar con garantías
ORIENTAC I ÓN de éxito este tema se debe cuya desviación típica se conoce como "error estándar de la media"; por

ENARM conocer muy bien el tema


anterior.
tanto, es la dispersión de las medias muestrales con respecto a la media
poblaciona l. Se calcula mediante la fórmula (Figura 14):

La tarea fundamenta l de la estadística inferencia! es hacer inferencias


acerca de la población a partir de una muestra extraída de la misma.

x,
14.1. Estimación de medias

En este caso, se quiere conocer la media poblacional a partir de la media


muestra l. Pa ra ello, se pueden aplicar:
Estimación puntual: la media muestra! es un buen estimador de la
media poblacional (!l).
Estimación por intervalos: el valor numérico de los estimadores pun-
tuales determinados en muestras diferentes puede variar. Es decir, si se
repiten los cá lculos con otra muestra distinta de la misma población,
el resultado de la media muestral podría ser diferente. Por tanto, sería
mejor que, además, se aportase un intervalo que presumiblemente
incluya también el parámetro de la población. Por ello, es preferible la
estimación por interva los, ya que entonces se indican límites devalo-
res dentro de los cuales el parámetro poblacional tiene la probabilidad
x, x_
de estar. Al interva lo alrededor del estadístico muestra! se le denomina
intervalo de confianza, y a sus límites, límites de confianza. El cá lculo Figura 14. Cálcu lo del error estándar de la media
de los límites de confianza comprende el empleo del error estándar de
la med ia y los principios de la distribución normal. o
eem=
El nivel de confianza 1 - a da la probabilidad que hay de que la media
poblacional, 1-1, pertenezca a ese intervalo; es frecuente expresarlo en
porcentajes. Son equivalentes las expresiones "n ivel de confianza 1 -
a"y "sign ificación a "; así, suele hablarse de obtener un intervalo con o= desviación típica poblacional
un nivel de confianza del 95% o para una significación a= 0,05 (este
va lor de a indica la probabil idad que hay de errar en la estimación. A Si se construye un interva lo de confianza del 95%, se concluye que en el
veces esa probabilidad se indica con la letra P). 95% de las ocasiones la media poblaciona l estará entre:

Error estándar de la media


o
_ X± 1,96 X
De una población pueden extraerse infinitas muestras, cada una de ellas
con su media. Este conjunto de med ias se distribuye según una curva
Manual CTO de Medicina y Cirugía, 2.a edición

Mientras que en un 5% de las ocasiones esta rá equivocado. Si se estable- En caso de m uestras peq ueñas (n < 100), la esti mación de un por-
ce el nivel de confianza en el 99%, la med ia poblacion al se situará en un centaj e pob laciona l sig ue una distribución bi nom ial y su cá lculo está
99% de las ocasiones entre: tabu lado.

a En caso de muestras grandes (n > 100) y si n x p > 5 y n x (1 - p) > 5, la


_ X± 2,57 X
distribución binomial se pu ede aproximar a la di stribución normal y la
estimación del porcentaj e poblacional sería :

p ± 1,96 x eep, p < 0,05


En el caso de que se desconozca el va lor del parámetro a (que es lo más
habitual en la práctica) o cuando n < 30, los límites de confianza se ca lcu- p ± 2,57 x eep, p < 0,01
larían sigu iendo:
donde:
p: proporción (en ta nto por uno) hallada en la mu estra.
_x ± t x
eep: error está ndar del porce ntaje.

~ n-p)
eep = Y n
Donde el va lor t corresponde a los valores tabu lados de la distribución
teórica t de Stu dent.

No ti ene nada que ver la desv iac ión típi ca de los va- 14.3. Estimación de medidas
lores de la va riabl e de la muestra o en la pobl ación
con el error estándar de las med ias muestra les alrede- de asociación
dor de la medi a pobl acional.

Independientemente de l t ipo de es tu d io epidemiológ ico y de l pa -


rámetro uti lizado pa ra medir la fue rza de asoc iación (RR, OR, RP), la
14.2. Estimación de un porcentaje esti mación de las med idas de asociac ión ha de ser extrapo lada a
la població n ge neral med iante la construcc ión de un intervalo de
confianza .
Si se estudia una vari able cualitativa, el objetivo será aplica r a la pob lación
el porcentaje o proporción obtenido en la mu estra co n un margen de Si el IC incluye el 1 (efecto neutro del factor de estudio), se habla de un
tolerancia (interva lo de confianza) . result ado no significativo.

" La curva de probabilidades de los intervalos de confianza sigue


Ideas clave ES otra cu rva de Gauss, por lo que se puede decir que, en el inter-
·valo media+/ - 2 eem, estará incluida la media poblacional con
" La estadística inferencia! o analítica se encarga de, a partir de la una probabilidad del 95%.
muestra, extrapolar datos a la población.
" Los intervalos así obtenidos se denominan intervalos de con-
" El parámetro de dispersión qu e se emplea para el cálculo de los fi anza del 95%.
intervalos de confianza de medias es el error estándar de la me-
dia. " El 5% restante es la probabilidad de que el intervalo esté mal
estimado. A este error se le llama a .

Si la media es 25, la desviación estándar es 5 y el tamaño mues-


Casos clínicos t ra ! es de 101. ¿Cuál será el intervalo que incluya el verdadero
valor poblacional con una probabilidad del 95%?
Si la media es 25, la desviación estándar es 5 y el tamaño mues-
tra! es de 101, ¿cuál será el error estándar de la media? 1) 23-27.
2) 23,5-26,5.
1) 5/5. 3) 24-26.
2) 5/1 O. 4) 25.
3) 10/5.
4) 0,05 . RC: 3

RC: 2

14 · Estimación de parámetros.
Estadística inferencia!
ía -----·
Estadística y epidemiolog~

Contr aste de hipóte sis

OHIENTACIÓ N Lo que hay que tener claro de este tema es el significado de los errores a y ~, y del poder
de un test estadístico y sobre cómo se modifican Jos parámetros anteriores en función
ENARM del tamaño de la muestra.

15.1. Hipótesis nula, hipótesis De tal forma, si :


p < 0,05 ~ diferencias rea les. Poca probabilidad de que se deban
alternativa y grado de significación al azar. Se acepta H,. El resu ltado es estadísticamente significativo.
estadística Rechazo de H0 .
p > 0,05 ~ no existe suficiente evidencia como para decir que ambos
tratamientos son distintos. Las diferencias pueden deberse al azar, con
Para la comprensión de este concepto, se parti rá de un caso práctico. una probabilidad mayor al nivel de exigencia. No se rechaza H0 .
Se compara un tratamiento nuevo (N) contra la HTA con uno tradiciona l
(T) en dos series de individuos. Tras cierto tiempo, N controla al 70% de
los ind ividuos y T al 30%. El problema consiste en saber si este hecho es 15.2. Errores a y ~
debido a una mayor eficacia rea l de N o lo es simplemente por diferen-
cias que el azar puede establecer (variaciones aleatorias del muestreo),
sin que exist an d iferencias reales en el control de hipertensos entre am- Error tipo 1: se rechaza H0 siendo cierta (se acepta que hay diferen-
bos tratamientos. cias y, de hecho, no las hay). Es como un falso positivo: dar como
significativo algo que no lo es. Se denomina a a la probabilidad de
Para abordar este problema, se consideran dos hi pótesis: cometer el error ti po l. El va lor de p coincide con la probabilidad de
Hipótesis nula (H 0 ): no existen diferencias entre los dos tratamien- cometer el error tipo l.
tos (N= T). Cuando entre los distintos grupos de estudio se compara más de
Hipótesis alternativa (H,): sí existen diferencias entre los dos trata- una variable de resu ltado, aumenta la posibilidad de resultados fal-
m ientos (N oF- T). samente positivos. Para evitarlo, se incrementa la exigencia del nivel
de sign ificación como sigue :
Estas dos hipótesis son mutuamente excluyentes, de forma que sólo hay
dos decisiones posibles: 0,05
p=
Rechazar H0 ~ acepta r H 1. n.o de comparaciones
No rechazar H0 ~ no poder aceptar H 1.

Previamente al ensayo de una hipótesis, se fija la probabilidad máxima de Error t ipo 11: no se rechaza H0 y esta es falsa (no se aceptan las d i-
que los resultados diferentes observados entre los dos grupos puedan ser ferencias y sí las hay). Sería como un falso negativo: se da como no
debidos simplemente al azar (HO cierta), que suele ser por convenio del significativo algo que lo es. Se denomina ~ a la probabi lidad de co-
5%. A continuación, se ca lcula cuál es la probabilidad de que las d iferen - meter un error t ipo 11.
cias que se han observado puedan ser explicadas por aza r. Esta probabi- Poder o potencia del test : lo complementario del error~ es la "po-
lidad es el va lor de la p o "grado de significación estadística': Así, cuanto ten cia o poder estadístico de un test" (1- ~) que se define como la
menor sea p, es decir, cuanto más baja sea la probabil idad de que el azar capacidad que t iene un test de detectar una d iferencia cuando esta
sea el responsable de las diferencias, mayor será la evidencia contra H0 y existe en rea lidad; es decir, corresponde a la probabilidad que se t ie-
a favor de H,. ne de demostrar la hipótesis alternativa, siendo cierta (Tabla 14).
Manual CTO de Medicina y Cirugía, 2. 8 edición

Realidad Datos apareados: en una ún ica muestra se estudia si existe una


Existe diferencia No existe dife rencia significativa en la variable resultado antes y después de
diferencia alg ún acontecimiento relevante.
Va riable resultado cualitativa de dos o más categorías: test de
H0 falsa H0 cierta
McNemar.
Resultados Hay diferencias 1- ~ Errortipo 1 Variable resultado cuantitativa: t de Student apareada.
del test significativas Poder estadístico o error a. Va riabl e resultado cuantitativa (varias medidas repetidas): ANO-
o potencia del VA para medidas repetidas.
Rechazo HO test

No hay diferencias Error tipo 11 1 -a. Test no paramétricos: son pru ebas que no d ependen de la distri-
significativas o error ~ b ución de la va ri able y no precisa n condición previa de normalidad
{Figura 16). Estas pruebas no manejan los va lores cuantitativos
No rechazo HO que toma la variable en cuestión, sino únicamente sus rangos. Son
Tabla 14. Contraste de hipótesis pruebas de menor precisión que las paramétricas, por lo que so-
lamente demostra rán como sign ificativas d iferencias mayores. Por
tanto, generalm ente se prefiere uti lizar p ru ebas para métricas (t de
1 5.3. Pruebas de significación Stud ent, aná lisis de la va ri anza, etc.) y el uso de los t est no para-
métricos se lim ita a estud ios con tamaños muestra les menores de
estadÍStica {Figura 15)
- Asociación estadística entre dos variables: el objetivo es demos-
30, en los que las poblaciones no puedan ser consideradas como
normal es, o bi en cuando la va riable represente ún ica m ente una
medida aproximada del ca rácter, sin una valoración exacta. Si las
trar o no la asociación estadística entre dos variables observadas en muestras son mayores de 30, no existe inconveniente en utilizar
una muestra. pruebas paramétricas.

N > 30 < 30 (No paramétncas)

DICOTÓMICAS No dependen de la
(sexo (V/H, DISTRIBUCIÓN
enfermo, No necesitan de la
CUALITATIVA (" si/no ...) normalidad de la población
> 2 CATEGOR[AS

1
· Se toma sólo su RANGO
(raza, nivel
socioeconómico) · Más EXIGENTES, menos
POTENTES

VARIABLES
INDEPENDIENTES

Medidas en
grupos diferentes

CUANTITATIVA Rho Spearman


(talla, peso,
glucemia ...)

CUALITATIVA +
- CUALITATIVA
VARIABLES
DEPENDIENTES
--._ CUALITATIVA +
Medidas en los CUANTITATIVA
MISMOS
sujetos en momentos
diferentes se repite
medida
L
ANOVA: análisis de la varianza

Figura 1S. Pruebas de asociación estad ística

15 · Contraste de hipótesis
Estadística y epidemiología 1 15
Cualitativa con cuantitativa si n < 30 apa recen los síntomas .. . Uno de los aná lisis estadísticos más fre-
Cualitativa con ordinal
cuentemente empleados es el de Kaplan-Meier. La ca racterística
distintiva del análi sis con este método es que la proporción acu-
2 categorías mulada que sobrevive se calc ul a para el tiempo de superviven-
Más de 2 categorías
(variables dicotómicas)
cia individual de cada paciente. Para saber si hay diferencias en el
t iempo en el q ue se produce el evento para los dos grupos de tra-
U Cle Mann-Whítney Test ae Krusl<ai·Wa lis tamiento hay que usar test específicos para tal fin como son el test
Test de Wílcoxon Test de Fríedman
(tanto para datos apareados (sí datos apareados)
de Breslow o el Logra nk.
como no apareados)
La Figura 17 resume los test estadísti cos más empleados.
Ordinal con ordinal

Rho de Spearman Tau de Kendall

Figura 16. Test no paramétricos


(si pequeño tamaño
muestral)
Análisis multivariante: es un conju nto de test estadísticos que se
aplica cuando se intenta establecer la asociación estad ísti ca entre Cualitativa con cuantitativa
dos va riables, pero controlando el efecto de terceros factores que
podrían actua r como factores de confusión. Un tipo de test mu lti- 2 categorías
Más de 2 categorías
va riante frecuentemente empleado es el test de reg resión log ística . (variables dicotómicas)
Por ejemplo: se desea saber si existe una rel ación entre la infección
de herida qu irúrg ica y el tipo de cirug ía, controla ndo que la profil axis t de Student (si datos apareados,
antibiótica empleada no actúe como factor confusor. t de Student para datos
a¡:>areados)
Análisis de supervivencia: en ocasiones, para saber si por ejemplo
un fármaco es mejor que otro se necesita conocer la id ea dinámica
de cómo fallecen los pacientes incluidos en uno u otro grupo de
tratamiento a lo largo del tiempo. Es decir, no sólo importa si fallecen Coeficiente
Regresión
o no, sino el ti empo en el que se produce en evento. de correlación de Pearson

Esta idea es extra polab le a otras situaciones como por ejempl o,


tiempo hasta que se produce la cu raci ón, t iempo hasta que des- Figura 17. Test estad ísticos más empleados

" Ambos errores a y 13 son dos formas diferentes de errores alea-


Ideas clave RS torios, por lo que se podrán reducir si se aumenta el tamaño de
la muestra.
" El contraste de hipótesis se basa en intentar rechazar H0 (no hay
diferencias) para así aceptar H, (sí existen diferencias). " Si verdaderamente hay diferencias reales en los resultados ob-
tenidos y estas diferencias son detectadas por el test, entonces
" Cualquier resultado observado en un estudio puede atribuirse se está en la situación de acierto que se conoce como poder o
al azar. El valor de p, o nivel de significación, se refiere a la proba- potencia del test.
bilidad de que el azar explique un resultado obtenido.
" Los test estadísticos que se van a emplear dependerán del tipo
" Si la p < 0,05, se admite poca probabilidad de azar y entonces de variable que se haya utilizado:
se habla de que hay diferencias estadísticamente significativas. Cuali + cuali: Chi cuadrado.
Cuanti + cuali dicotómica: t de Student (equivalente no pa ra-
" Si la p > 0,05, la probabilidad de azar es demasiado grande métrico: Wilcoxon, U de Mann-Whitney).
como para que se afirme que hay diferencias significativas en Cuanti + cuali no dicotómica: ANOVA (equivalente no para-
los resultados obtenidos. métrico: Kruskaii-Wallis, Friedman).
Cuanti + cuanti : correlación de Pearson (equivalente no pa-
" La probabilidad que existe de que yo afirme que hay diferen- ramétrico: Spearman).
cias, cuando en realidad no las hay, equivale a la probabilidad p
y se llama error a o tipo l. " Los test para métricos son mejores, pero sólo pueden realizarse
cuando la distribución de estudio sea la normal.
" Por el contrario, si verdaderamente existen diferencias y no se
detectan, se estará incurriendo de nuevo en un error, que en
este caso es el 13 o tipo 11.
Manual CTO de Medicina y Cirugía, 2.a edición

1) Regresión logística.
Casos clínicos 2)
3)
Prueba de la t .
Prueba de chi cuadrado.
Un investigador está interesado en determinar si existe una aso- 4) Correlación de Pearson .
ciación entre las cifras de tensión arterial diastólica (medida en
mm de Hg) y los niveles de colesterol (medidos en mg/ml). Para RC: 4
ello, ha realizado estas mediciones a 230 voluntarios. ¿Qué prueba
estadística es la más apropiada para examinar dicha asociación?

15 · Contraste de hipótesis
Estadística y epidemiología •

Análisis de correlación
y de regresión

También es más eficaz cuando la predicción se obtiene a partir de


Los aspectos más importantes
va lores de x próximos a la med ia (Figura 18).
de este tema son
la interpretación correcta
del coeficiente r y de los valores
a y f3 de la regresión lineal.
y= a+ px

16.1. Aná lisis de correlación


y de regresión a

Los análisis de correlación y de regresión sirven para estudiar la relación


entre dos variables cuantitativas. Figura 18. Recta de regresión lineal
Análisis de regresión: es útil para determinar la posible forma de
relación entre variables y, por tanto, se puede usar para hacer predic- Análisis d e correlación : estudia también la relación entre dos
ciones o para estimar el valor de una variable que corresponde para variables cuantitativas, aunque aquí no se habla de variable de-
un valor de la otra . pendiente ni independiente. El coeficiente de correlación de
En este análisis se dispone de dos variables de interés, x e y. Pearson mide la intensidad de la relación lineal entre las dos va-
La variable x se llama variable independiente o exp licativa y es riables cuantitativas.
contro lada por el investigador. La variab le y se denomina de- Las características de l coeficiente de co rrelación son las siguien-
pendiente. tes:
Con el análisis de regresión lineal, se obtiene una ecuación del Varía entre- 1 y+ 1 ~ -1 ~ r ~ + l.
tipo: Para r = ± 1, hay una re lación perfecta entre x e y, es decir, todos
los puntos (x,y) están en una línea recta.
y=a+~x

donde u y~ son los coeficientes de regres ión. Un valor positivo de r indica que a med ida que aumenta una va -
riable, lo hace la otra, o que conforme disminuye una, también
El coeficiente a representa el punto en el que la línea corta el eje lo hace la otra. Un coeficiente de correlación negativo denota
vertical (valor de y para x = 0). El coeficiente ~ es la pendiente de que a medida que disminuye una variable, aumenta la otra o
la recta que muestra la cantidad que varía y por una unidad de viceversa.
cambio de x. r =O ind ica que no hay correlación lineal.
La recta de regresión es más potente para hacer pred icciones
cuando el coeficiente de correlación (r) está próximo a + 1 o La Figura 19 resume los distintos tipos de relación entre las varia -
a-1. bles.
Manual CTO de Medicina y Cirugía, 2.a edición

A l. B
• J •
..
. .. .. . ·.. . . ...... .
• • "1 • •
~ • • • • • 1, • • • •
• : "1 • • •• • • • • 1· • •• • •
y - . ~ - •• -ro :- =- y - ...!. -:-". _:_, -; :_:_: ~ : _.

. ·. : :. :J ·.. Relación lineal


• •• : • r •
Falta

·....
• • • 1 .1 •
positiva de relación
.. 1•

.. ..·
1
Relación lineal .. ·¡· · . Relación
....
• • • 1
negativa
.... :. ...., : ... ... no lineal

: . : ... 1: .
• •: •• ·1 • •• 1
y - .-:-·T.-:-.- y .
..
• •1 • :
. ••• .·....
. T
... .·.
1' •• ·: •••
e D

Figura 19. Distintos tipos de relación entre las va ri ables

o débil de la correlación, considerándose fuerte cuando esta es


Ideas clave J6 mayor de 0,7.

" Los test de correlación y de regresión sirven para establecer aso- " Una r de 1 o de -1 implica una correlación cuya nube de disper-
ciación entre dos variables cuantitativas. sión se aproxima a la línea recta.

" El análisis del test de correlación se basa en la interpretación del " Cuando la correlación es fuerte, podrá entonces hacerse el test
coeficiente r. El valor de r está comprendido entre -1 y +1. Un de regresión lineal, cuya fórmula es y= a + ¡)x, donde ¡) es la
valor positivo significa que si la variable "n" aumenta, la variable pendiente de la recta y a el punto de corte de esta en el eje de
"m" lo hará también. El valor absoluto de la restablece lo fuerte ordenadas.

1) El consumo de tabaco es la causa de que disminuya el HDL-Col.


Casos clínicos 2) El consumo de tabaco es la causa de la disminución del HDL-
Col, porque la correlación es estadísticamente significativa.
Un estudio relaciona las concentraciones de colesterol ligado a 3) El consumo de tabaco no es la causa del HDL-Col, porque la co-
las lipoproteínas de alta densidad (HOL-Col) con el número de rrelación es negativa.
cigarrillos fumados en la actualidad, en una muestra de 100 indi- 4) Se ha observado una débil correlación negativa, estadística-
viduos. El coeficiente de correlación es- O, 1S (p < 0,05). ¿Cuál de mente significativa .
las siguientes afirmaciones es correcta?
RC: 4

16 · Análisis de correlación y de regresión


Tamaíio muestral

Ejemplo: ¿A cuántas personas se tendrían que estudia r para cono-


1

ORIENT/\CION
Tema relativamente complejo. cer la prevalencia de esqu izofren ia en un área residencial de Madrid?
ENARM
Seguridad = 95%; precisión = 5%; proporción esperada = próxima
al 10%:

17 .1. Tamaño muestra! n: (22 X p X q)/d2= (4 X 0,1 X 0,9)/0,052 = 144 donde

22 ya que la seguridad es del 95%.


Para realizar un estudio sobre una población es necesario trabajar con p = proporción esperada (en este caso, 10% =O, 1).
una muestra, ya que abarca r a todos los miembros de una comunidad es q = 1- p (en este caso 1-0,1 = 0,9).
prácticamente imposible. d = precisión (en este caso, se desea un 5%: 0,05).

El tamaño de la muestra se determina en el diseño del estudio de modo Para estimar una media se debe conocer:
que sea apropiado pa ra los obj etivos buscados en el mismo y con los El nivel de confianza o seguridad (1-a), habitualmente 95%.
condicionamientos que se está dispuesto a asum ir. Un número insufi- La precisión con que se desea estima r el parámetro.
ciente de participantes imped irá encontrar las diferencias buscadas, con - Una idea de la va rianza de la variable cuantitativa que se supone
cluyendo erróneamente que no existen, mientras que un número excesi- existe en la población.
vo, aumenta innecesariamente el coste.
Ejemplo: Si se desea conocer la media de la colesterolemia basal de
Maneja r muestras es más barato, rápido, fácil y suficientemente preciso y una población, con una seguridad del 95% y una precisión de ± 4
exhaustivo que manejar poblaciones. Los datos obtenidos en la muestra mg/d l, y se tiene información por un estudio piloto o revisión biblio-
se generalizarán a la población original utilizando ciertas pruebas estadís- gráfica de que la varianza es de 300 mg/dl:
ticas con una mínima probabilidad de error(< 5% habitualmente).
n: (22 x 300) 1 42 = 75
Hay dos campos en la inferencia estadística donde se va a desarrollar el
cá lcu lo del tamaño muestra!:
Estimación de parámetros: el tamaño dependerá de la variab il idad La precisión está en el denom inador y al cuadrado, lo
del parámetro que se desea estimar (esta ha de ser previamente co- que significa que cuanto más preciso se pretenda ser,
más pequeño será el número del denomi nador y, por
nocida, o bien aproximarse a partir de datos preexistentes o estudios
el lo, el tamaño muestra ! requerido será más grande.
pi lotos), de la precisión con que se pretenda obtener la estimación
(a mplitud deseada del interva lo de confianza, t en iendo en cuenta
que a mayor precisión, se necesitará un número más alto de sujetos)
y del nivel de confianza.
Para estimar una proporción se debe conocer: En la estimación de parámetros, NO se necesita co-
nocer el error 13 para estimar el tamaño muestra!.
El nivel de confianza o seguridad (1-a). Pa ra una seguridad del
95% = 2; para una seg uridad del99% = 2,6.
La precisión que se desea para el estudio.
Una idea del valor aproximado del parámetro que se quiere me- Contraste de hipótesis: se uti liza para estudios comparativos y,
dir, revisando la literatura o los estudios previos. En caso de no te- en él, el tamaño de la muestra indica el número aproximado de
ner dicha información, se empleará el va lor p = 0,05 (5%). En este sujetos que se neces itan para detectar una diferencia determinada,
caso, se necesita mayor n, pero garantiza rá una mejor estimación. si existe, con unos márgenes de error previamente definidos. Los
Manual CTO de Medicina y Cirugía, 2.a edición

factores a tener en cuenta para determinar el tamaño muestra! son La proporción de pérdidas (d): se deberá mu ltiplicar el tamaño
los siguientes: ca lcu lado por: 1/(1 - d).
La magn itud de la diferencia a detectar que tenga interés clí- La defin ición de si la hipótesis va a ser unilateral o bilateral.
nicamente relevante. Se pueden compara r dos proporciones o Bilateral: cualquiera de los dos parámetros a comparar
dos med ias. (medias o proporciones) puede ser mayor o menor que el
Tener una idea aproximada de los parámetros de la va ri able que otro. No se establece dirección. H0 diferente de H,.
se estudia (bibliografía, estud ios previos). Unilateral: cuando se considera que uno de los pa ráme-
La variabilidad de la variable principal. tros debe ser mayor que el otro, indicando, por tanto, una
La seguridad del estud io (riesgo de cometer un error a: 5%). dirección de las diferencias. Sólo H0 >o< H,.
El poder estadístico (1 - ~: 80% al menos) (riesgo de cometer un
error~:O, 1- 0,2). La hipótesis bilatera l es una hipótesis más conservadora y dism inuye el
La proporción de pacientes en los distintos grupos que respon- riesgo de cometer un error de tipo l.
derá a cada tratamiento.

cuantitativa (media). En ambos casos es preciso saber el nivel de


Ideas clave J!!S confianza y la precisión con la que se desea el estudio. Evidente-
mente, en el caso de la proporción, se necesitará conocer la pro-
" Lo primero que se debe hacer cuando se pregunte sobre tama- porción esperable y en el de las medias, la varianza esperable.
ño muestra! es conocer si se trata de una estimación de paráme-
tros o de un contraste de hipótesis, para así saber qué es lo que " En los casos de contraste de hipótesis, los aspectos más impor-
se necesita en el estudio. tantes a tener en cuenta son los errores alfa y beta del estud io,
la magnitud de la diferencia a detectar clínicamente relevante,
" Si se trata de un intervalo de confianza, entonces se debe cono- la proporción de pacientes en los distintos grupos que respon-
cer si se trata de una variable cualitativa (proporción) o de una derán a cada tratamiento y la proporción de pérdidas.

1) Proporción de sujetos que se espera encontrar con el problema


Casos clínicos de salud.
2) El error tipo l.
3) El número de no respuestas esperado.
Para calcular el número mínimo de sujetos que es necesario in- 4) El error tipo 11.
cluir en un estudio sobre la prevalencia de un problema de salud,
se han de realizar las siguientes asunciones, EXCEPTO: RC: 4

17 · Tamaño muestra!
Estadística y epidemiología J Bibliografía

Bibliografía
Estadística y epidemiología

0i1 Dawson/Trapp. Bioestadística médica. 4.• ed. Manual Moderno, 0i1 Grupo CTO. Manual UO de Estadística y epidemiología. Planifica-
2005. ción y gestión. 9.• ed. CTO Editorial, Madrid, 2014.

[lil Hernández Aguado. Manual de Epidemiología y Salud Pública. 2.• [lil Ruiz, Morillo. Epidemiología clínica. Editorial médica Panamerica-
ed. Editorial médica Panamericana, 2011 . na, 2004.

OJ Greenberg. Epidemiología médica. 4.• ed. Manual Moderno, 2005.

También podría gustarte