Está en la página 1de 60

MANUAL ENARM

ESTADÍSTICA Y EPIDEMIOLOGÍA
(edición 2022)

ISBN
978-84-18767-07-4

DEPÓSITO LEGAL
M-26692-MMXIX

ACADEMIA AMIR MÉXICO S. DE R. L. DE C. V.


www.amirmexico.com
info@amirmexico.com

DISEÑO Y MAQUETACIÓN
Iceberg Visual Diseño, S.L.N.E.

La protección de los derechos de autor se extiende tanto al contenido redaccional


de la publicación como al diseño, ilustraciones y fotografías de la misma, por lo
que queda prohibida su reproducción total o parcial sin el permiso del propietario
de los derechos de autor.

Este manual ha sido impreso con papel ecológico, soste-


nible y libre de cloro, y ha sido certificado según los es-
tándares del FSC (Forest Stewardship Council) y del PEFC
(Programme for the Endorsement of Forest Certification).
AUTORES

DIRECCIÓN LUIS GUILLERMO MORENO MADRIGAL EDUARDO FRANCO DÍEZ


EDITORIAL Dirección Académica AMIR México. H. U. Ramón y Cajal, Madrid.
JAIME CAMPOS PAVÓN AIDA SUÁREZ BARRIENTOS
H. U. 12 de Octubre, Madrid. Clínica Universidad de Navarra, Madrid.
BORJA RUIZ MATEOS
H. Infanta Cristina. Parla, Madrid y
H. Central de la Cruz Roja. Madrid.

AUTORES ALEDO-SERRANO, ÁNGEL (2) ALONSO GARCÍA-POZUELO, JAVIER (52)


ARREO DEL VAL, VIVIANA (4) DORANTES VALDÉS, BENJAMÍN (65)
CORRALES BENÍTEZ, CARLOS (17) HERNÁNDEZ ESQUIVEL, CARLOS ARTURO (58)
FRANCO DÍEZ, EDUARDO (7) MORENO MADRIGAL, LUIS GUILLERMO (77)
RUIZ MATEOS, BORJA (42) RANGEL SELVERA, OMAR ALEJANDRO (81)
SESMA ROMERO, JULIO (43) ZÚÑIGA DOMÍNGUEZ, LIZBETH ADRIANA (51)

5
RELACIÓN GENERAL DE AUTORES
ESPAÑA
ADEVA ALFONSO, JORGE (1) GALLO SANTACRUZ, SARA (24) ORTIZ SALVADOR, JOSÉ MARÍA (15)
ALEDO-SERRANO, ÁNGEL (2) GANDÍA GONZÁLEZ, MARÍA LUISA (4) OTAOLA ARCA, HUGO (36)
ALONSO PEREIRO, ELENA (3) GARCÍA CARRERAS, ALEJANDRO (1) PADULLÉS CASTELLÓ, BERNAT (10)
ALONSO SANZ, JAVIER (4) GARCÍA SEBASTIÁN, CRISTINA (7) PANADÉS-DE OLIVEIRA, LUISA (13)
ÁLVAREZ ANDRÉS, EVA (5) GARCÍA-ESCRIBANO MARTÍN, FLORENCIO (13) PARRA DÍAZ, PAULA CAROLINA
AMMARI SÁNCHEZ-VILLANUEVA, FADI (6) GARROTE GARROTE, MARÍA (21) PASCUAL GUARDIA, SERGI (37)
AMORES LUQUE, MIGUEL CAYETANO (7) GIMÉNEZ VALLEJO, CARLOS (25) PASCUAL MARTÍNEZ, ADRIANA (38)
ANTÓN MARTIN, MARÍA DEL PILAR (8) GÓMEZ ROMERO, MARÍA (26) PÉREZ SÁNCHEZ, EZEQUIEL JESÚS (39)
ANTÓN SANTOS, JUAN MIGUEL (9) GÓMEZ SERRANO, MANUEL (13) PÉREZ TRIGO, SILVIA (12)
ARREO DEL VAL, VIVIANA (4) GÓMEZ-MAYORDOMO, VÍCTOR (13) PINILLA SANTOS, BERTA (40)
BALBACID DOMINGO, ENRIQUE J. (4) GÓMEZ-PORRO SÁNCHEZ, PABLO (22) PINTOS PASCUAL, ILDUARA (17)
BATALLER TORRALBA, ÁLEX (10) GONZÁLEZ ROCAFORT, ÁLVARO (4) PIRIS BORREGAS, SALVADOR (12)
BENAVENT NÚÑEZ, DIEGO (4) GREDILLA-ZUBIRÍA, ÍÑIGO (27) PLASENCIA RODRÍGUEZ, CHAMAIDA (4)
BENÍTEZ, LETICIA GUIJARRO VALTUEÑA, AINHOA (22) RAMIRO MILLÁN, PATRICIA (41)
BERNAL BELLO, DAVID (11) HERNÁNDEZ ONTORIA, MARÍA (12) RAMOS JIMÉNEZ, JAVIER (7)
BUZÓN MARTÍN, LUIS (1) HONRUBIA LÓPEZ, RAÚL (28) RODRÍGUEZ DOMÍNGUEZ, VÍCTOR (4)
CABRERA MARANTE, ÓSCAR (12) IBÁÑEZ-SANZ, GEMMA (29) RODRÍGUEZ-BATLLORI ARÁN, BEATRIZ (9)
CAMPOS PAVÓN, JAIME (12) LALUEZA BLANCO, ANTONIO (12) RODRÍGUEZ-MONSALVE, MARÍA (22)
CANO-VALDERRAMA, ÓSCAR (13) LÓPEZ-SERRANO, ALBERTO (30) RUIZ MATEOS, BORJA (42)
CARDOSO LÓPEZ, ISABEL (14) LOUREIRO AMIGO, JOSÉ (49) SÁNCHEZ VADILLO, IRENE (4)
CERVERA YGUAL, GUILLERMO (15) LOZANO GRANERO, CRISTINA (7) SESMA ROMERO, JULIO (43)
CÍVICO ORTEGA, JESÚS ANTONIO (16) LUENGO ALONSO, GONZALO (12) SEVILLA-RIBOTA, SERGIO (9)
COBREROS PÉREZ, ÁLVARO MAEZTU, MIKEL (31) SOUTO SOTO, AURA DANIELA (22)
CORRALES BENÍTEZ, CARLOS (17) MANJÓN RUBIO, HÉCTOR (7) SUÁREZ BARRIENTOS, AIDA (44)
CUENCA RAMÍREZ, MARÍA DESAMPARADOS (18) MARCO ALACID, CRISTIAN (32) TABEAYO ÁLVAREZ, ELOY (4)
CUESTA HERNÁNDEZ, MARTÍN (13) MARTÍN RUBIO, INÉS (22) TAJIMA POZO, KAZUHIRO (20)
CUÑO ROLDÁN, JOSÉ LUIS (11) MARTÍNEZ DÍEZ, JAVIER (33) TARAMINO PINTADO, NOELIA (12)
DÁVILA GONZÁLEZ, PABLO (19) MARTÍNEZ DÍEZ, JOSÉ MANUEL (4) TEIGELL MUÑOZ, FRANCISCO JAVIER (9)
DE MIGUEL-CAMPO, BORJA (12) MARTÍNEZ-FIDALGO VÁZQUEZ, CONCEPCIÓN (9) TORRES FERNÁNDEZ, DAVID (12)
DELGADO LAGUNA, ANA (20) MARTOS GISBERT, NATALIA (5) TOUZA FERNÁNDEZ, ALBERTO (45)
DELGADO MÁRQUEZ, ANA MARÍA (48) MASANA FLORES, ELENA (34) UDONDO GONZÁLEZ DEL TÁNAGO, MARÍA (31)
ESTEBAN-SÁNCHEZ, JONATHAN (21) MOGAS VIÑALS, EDUARD (35) VALTUEÑA SANTAMARÍA, JARA (46)
FERRE-ARACIL, CARLOS (22) MONJO HENRY, IRENE (4) VÁZQUEZ GÓMEZ, FELISA (47)
FORTUNY FRAU, ELENA (23) MUERTE MORENO, IVÁN (13) VÁZQUEZ GÓMEZ, JULIO ALBERTO (47)
FRANCO DÍEZ, EDUARDO (7) NAVARRO ÁVILA, RAFAEL JOSÉ (12) VILLANUEVA MARTÍNEZ, JAVIER (9)

(1) H. G. U. Gregorio Marañón. Madrid. (19) H. de Manacor. Mallorca. (35) H. U. Vall d’Hebron. Barcelona.
(2) H. Ruber Internacional. Madrid. (20) H. U. Fundación Alcorcón. Madrid. (36) Clínica Alemana. Santiago de Chile, Chile.
(3) H. U. del Sureste. Arganda del Rey, Madrid. (21) H. U. de Getafe. Madrid. (37) Parc de Salut Mar. Barcelona.
(4) H. U. La Paz. Madrid. (22) H. U. Puerta de Hierro. Madrid. (38) H. U. Infanta Elena. Madrid.
(5) H. U. Severo Ochoa. Madrid. (23) H. U. Son Espases. Palma de Mallorca. (39) Instituto de Neuropsiquiatría y Adicciones,
(6) H. U. Virgen del Rocío. Sevilla. (24) H. Can Misses. Ibiza. PSMAR. Barcelona.

(7) H. U. Ramón y Cajal. Madrid. (25) Centre d’Ophtalmologie Sainte Odile. (40) Psiquiatra en ámbito privado. Madrid.

(8) Phoenix Children´s Hospital. Phoenix, EE.UU. Alsacia, Francia. (41) H. C. U. Lozano Blesa. Zaragoza.

(9) H. Infanta Cristina. Parla, Madrid. (26) H. U. Joan XIII. Tarragona. (42) H. Infanta Cristina. Parla, Madrid y
(27) H. Quironsalud A Coruña. La Coruña. H. Central de la Cruz Roja. Madrid.
(10) H. Clinic. Barcelona.
(28) H. U. Infanta Sofía. Madrid. (43) H. G. U. de Alicante. Alicante.
(11) H. U. de Fuenlabrada. Madrid.
(29) H. U. de Bellvitge. L’Hospitalet de Llobregat, Bar- (44) Clínica U. de Navarra. Madrid.
(12) H. U. 12 de Octubre. Madrid.
celona. (45) H. U. de Torrejón. Torrejón, Madrid y
(13) H. C. San Carlos. Madrid. H. HM Puerta del Sur. Móstoles, Madrid.
(30) H. U. San Juan de Alicante. Alicante.
(14) H. Vithas Ntra. Sra. de América. Madrid. (46) H. C. U. de Valladolid. Valladolid.
(31) H. U. de Basurto. Bilbao.
(15) H. Central U. de Valencia. Valencia. (47) H. Infantil U. Niño Jesús. Madrid.
(32) H. Virgen de los Lirios. Alcoy, Alicante.
(16) H. U. Virgen de la Victoria. Málaga. (48) H. U. Rey Juan Carlos. Móstoles, Madrid.
(33) H. U. Central de Asturias. Oviedo.
(17) H. U. Fundación Jiménez Díaz. Madrid. (49) H. Moisès Broggi. Sant Joan Despí, Barcelona.
(34) H. U. Virgen de las Nieves. Granada.
(18) H. U. Doctor Peset, Valencia.

6
MÉXICO
AGUILAR NÁJERA, OCTAVIO (50) GONZÁLEZ CHÁVEZ, ALBERTO MANUEL (67) PAZ GUZMÁN, JOSÉ DANIEL (78)
ALEMÁN GARAY, EDUARDO MOISÉS (51) GONZÁLEZ LAUREANI, JESÚS (63) PÉREZ GUZMÁN, MIREYA CITLALI (79)
ALONSO GARCÍA-POZUELO, JAVIER (52) GONZÁLEZ PÉREZ, ITZEL (68) PÉREZ PÉREZ, JOSÉ RENAN (80)
AMARO GUTIÉRREZ, NÉSTOR (51) GUAKIL SAKRUKA, LINDA (69) RAMÍREZ HINOJOSA, JUAN PABLO (63)
AQUINO RAMOS, ALEJANDRA LUCÍA (53) GUERRA BLANCO, PALOMA (70) RANGEL SELVERA, OMAR ALEJANDRO (81)
ARCEO OLAIZ, RICARDO ANTONIO (54) HERNÁNDEZ ESQUIVEL, CARLOS ARTURO (58) REBULL ISUSI, JUAN MANUEL (82)
BAHENA LÓPEZ, JOSÉ EDUARDO (55) HERNÁNDEZ VEGA, BRENDA (71) RODRÍGUEZ GUTIÉRREZ, GEORGINA (74)
BENARDETE HARARI, DENISE NIZA (56) HINOJOSA AMAYA, JOSÉ MIGUEL (72) ROMERO BARBA, ROSA NALLELY (70)
CAMACHO ROSAS, LAURA HAYDEE (57) INTRIAGO ALOR, MARIELLE (73) RUIZ MATA, JUAN MANUEL (83)
CANTORAL FARFÁN, EMILIA (58) ISLAS ESCOTO, SANTIAGO (51) SANTOS GRAPAIN, SANTIAGO (51)
CASTILLO BÁRCENA, EDGAR DAVID (59) LARA MARTÍNEZ, ALDO ENRIQUE (74) TORRES VÁZQUEZ, JUAN AGUSTÍN (84)
CHÁVEZ DELGADO, NALLELY EDUVIGES (60) LÓPEZ GONZÁLEZ, BERENICE (75) TOVAR UGALDE, MARTHA SARAI (85)
CHIAPAS GASCA, KARLA (61) MÁRQUEZ GONZÁLEZ, STEPHANY MICHELLE (61) VALDÉS FERRER, SERGIO IVÁN (50)
CRUZ GÓMEZ, CLAUDIA NAYELI (62) MARTÍN MARTÍN, MARÍA ASUNCIÓN (76) VELÁZQUEZ GUTIÉRREZ, CARLOS NORMAN (79)
DELANO ALONSO, ROBERTO (63) MARTÍNEZ CASTAÑEDA, ERIKA ADRIANA (74) VIDAL ROJO, PAOLA (86)
DÍAZ ESPINOZA, JORGE LUIS (64) MERAZ ÁVILA, DIEGO (56) VILLANUEVA RODRÍGUEZ, LUISA GERALDINE (56)
DORANTES VALDÉS, BENJAMÍN (65) MORENO MADRIGAL, LUIS GUILLERMO (77) ZARAGOZA CARRILLO, RICARDO EMMANUEL (87)
DURÁN PIÑA, ELIZABETH ANDREA (51) MUÑOZ CASTAÑEDA, WALLACE RAFAEL A (74) ZENTENO RUIZ, JUAN CARLOS (88)
GARCÍA ALBISUA, ANA MERCEDES (66) PALACIOS GARCÍA, ALBERTO AGUSTÍN (50) ZÚÑIGA DOMÍNGUEZ, LIZBETH ADRIANA (51)

(50) Inst. Nacional de Ciencias Médicas y Nutrición (63) H. Gral. Dr. Manuel Gea González. CDMX. (76) Neonatología, Unidad Médica de Alta Especiali-
Salvador Zubirán. CDMX. (64) Facultad de Medicina UNAM. CDMX. dad IMSS. Mérida, Yucatán.
(51) H. General de México. CDMX. (65) Depto. de Farmacología. Facultad de Medicina (77) H. Gral. Regional 1 Dr. Carlos Mac Gregor Sán-
(52) Dirección académica AMIR Rep. Dominicana. UNAM. CDMX. chez Navarro, IMSS. CDMX.

(53) CMN 20 de Noviembre del ISSSTE. CDMX. (66) Asociación Para Evitar la Ceguera en México. (78) H. Gral. de Zona 33 IMSS. Monterrey, Nuevo León.

(54) H. del Niño y del Adolescente Morelense. Estado CDMX. (79) Centro Médico ABC. CDMX.
de Morelos. (67) H. Español de México. CDMX. (80) Inst. Mexicano del Seguro Social /
(55) Inst. Nacional de Cardiología Ignacio Chávez. (68) ISSEMYM Tlalnepantla. CDMX. H. General Regional 200. CDMX.
CDMX. (69) Fund. H. Ntra. Sra. de La Luz I.A.P. CDMX. (81) Inst. de Seg. y Serv. Soc. de los Trabajadores
(56) H. Ángeles Lomas. CDMX. del Estado de Nuevo León “ISSSTELEON”.
(70) Centro Médico Nacional de Occidente. Guadala-
(57) Centro Dermatológico Dr. Ladislao de la Pascua. jara, Jalisco. (82) H. Ángeles Acoxpa. CDMX.
CDMX. (71) Depto. de Psiquiatría y Salud Mental. (83) H. Juárez de México. CDMX.
(58) H. Gral. de Zona 32, IMSS. CDMX. Facultad de Medicina UNAM. CDMX. (84) Centro Universitario de la Costa,
(59) H. San Ángel Inn Universidad. CDMX. (72) H. Universitario Dr. José E. González. U. de Guadalajara. Guadalajara, Jalisco.

(60) H. de Especialidades Centro Médico Siglo XXI Monterrey, Nuevo León. (85) H. Ángeles Metropolitano. CDMX.
Bernardo Sepúlveda. CDMX. (73) Centro Médico Nacional Siglo XXI. CDMX. (86) H. Infantil Privado, Star Médica. CDMX.
(61) H. Regional Lic. Adolf López Mateos del ISSSTE. (74) H. Médica Sur. CDMX. (87) H. Civil de Guadalajara Fray Antonio Alcalde.
CDMX. (75) Inst. Nacional de Enfermedades Respiratorias. Guadalajara, Jalisco.
(62) Servicios de Atención Psiquiátrica de la Secreta- CDMX. (88) Fundación de Asistencia Privada.
ria de Salud. CDMX. Conde de Valencia. CDMX.

7
ORIENTACIÓN ENARM
Importancia ENARM
Rendimiento por asignatura
Número medio de preguntas (importancia de la asignatura
(preguntas por página)
en el ENARM)

1,4 5 1,1 %

9
ÍNDICE

ESTADÍSTICA ........................................................................................................................................................13
TEMA 1 ESTADÍSTICA DESCRIPTIVA .............................................................................................................13
1.1. Técnicas de muestreo estadístico............................................................................................................ 13
1.2. Tipos de variables................................................................................................................................... 15
1.3. Medidas de análisis de los datos............................................................................................................. 16
1.4. Principales distribuciones de probabilidad............................................................................................... 18
TEMA 2 ESTADÍSTICA INFERENCIAL .............................................................................................................19
2.1. Estadística inferencial para variables cuantitativas ................................................................................... 19
2.2. Estadística inferencial para variables cualitativas ..................................................................................... 19
2.3. Cálculo del tamaño muestral para estudios de inferencia ....................................................................... 20
TEMA 3 CONTRASTE DE HIPÓTESIS ..............................................................................................................21
3.1. Errores en contraste de hipótesis ............................................................................................................ 21
3.2. Cálculo del tamaño muestral en el contraste de hipótesis ....................................................................... 22
3.3. Tests para contraste de hipótesis ............................................................................................................ 22
TEMA 4 PROBABILIDADES ............................................................................................................................27

EPIDEMIOLOGÍA ...................................................................................................................................................29
TEMA 5 ESTUDIOS DE VALIDACIÓN DE UNA PRUEBA DIAGNÓSTICA ..........................................................29
5.1. Parámetros de validez de una prueba diagnóstica .................................................................................. 29
5.2. Curvas ROC (de rendimiento diagnóstico) .............................................................................................. 31
5.3. Test de tamizaje y test de confirmación .................................................................................................. 31
TEMA 6 MEDIDAS EN EPIDEMIOLOGÍA ........................................................................................................33
6.1. Medidas de frecuencia de una enfermedad ............................................................................................ 33
6.2. Medidas de fuerza de asociación (medidas de efecto) ............................................................................ 33
6.3. Modelos de causalidad / Modelos causales ............................................................................................. 35
6.4. Criterios de causalidad de Bradford Hill .................................................................................................. 35
6.5. Medidas de impacto .............................................................................................................................. 35
TEMA 7 TIPOS DE ESTUDIOS EPIDEMIOLÓGICOS .........................................................................................38
7.1. Estudios no experimentales/observacionales ........................................................................................... 38
7.2. Estudios experimentales ......................................................................................................................... 40
7.3. Niveles de evidencia científica ................................................................................................................ 41
7.4. Fases de realización de los estudios epidemiológicos .............................................................................. 43
7.5. Fases de desarrollo de un tratamiento (fases del ensayo clínico).............................................................. 44
7.6. Diseños especiales en estudios experimentales ....................................................................................... 45
7.7. Realización de muchas comparaciones en los estudios epidemiológicos.................................................. 47
7.8. Estudios de bioequivalencia.................................................................................................................... 47
TEMA 8 ERRORES EN LOS ESTUDIOS EPIDEMIOLÓGICOS ............................................................................50
8.1. Errores aleatorios ................................................................................................................................... 50
8.2. Errores sistemáticos (sesgos)................................................................................................................... 50

VALORES NORMALES EN ESTADÍSTICA Y EPIDEMIOLOGÍA ..................................................................................54

BIBLIOGRAFÍA .......................................................................................................................................................55

RESPUESTAS ENARM ............................................................................................................................................56

11
CURIOSIDAD

Charles Spearman (Londres, 1863-1945), a quien hoy recordamos por el


test de correlación de la “ρ” de Spearman, se dedicó fundamentalmente
a lo largo de su vida al campo de la Psicología. Desarrolló la teoría
bifactorial de la inteligencia (otra de sus aportaciones a la Estadística es
el análisis factorial), por la cual existen dos factores que determinan la
inteligencia de cada sujeto y que debían residir en partes distintas del
cerebro: el factor G (genético y heredado), y el factor S (especial, que
hace referencia a la capacidad concreta de cada sujeto para lidiar con
cada problema específico).

12
ESTADÍSTICA

Tema 1
Estadística descriptiva

El objetivo de la Estadística es el estudio de una o varias carac-


terísticas (variables) en una o varias poblaciones diana. Habitual-
mente el estudio de todos los individuos de dichas poblaciones
es imposible por problemas logísticos, así que se suele estu-
diar sólo a un grupo reducido de individuos de cada población Población diana
(muestra).
La Estadística descriptiva se ocupa de estudiar las variables
que nos interesan de dicha muestra; como podemos estudiar Técnica de muestreo
a cada uno de los individuos de la muestra, todos los datos
que obtengamos serán verídicos y no tendremos que extrapolar
nuestros resultados, por lo que en Estadística descriptiva no Muestra
existe probabilidad de cometer errores.
La Estadística inferencial intenta extrapolar cómo serían los
resultados de la población objetivo si fuéramos capaces de es- Estadística descriptiva
tudiar a todos sus individuos. Para ello parte de los resultados
obtenidos en la muestra. Así, los resultados estarán sujetos a
una probabilidad de error, ya que si la muestra seleccionada Resultados de la muestra
no fuera representativa de la población, sus resultados no serían
extrapolables a la misma.
Estadística inferencial
Por último, el contraste de hipótesis compara los resultados Probabilidad de error
de varias variables en una única población, o bien los resultados
obtenidos para la misma variable en varias poblaciones. Al igual
que en Estadística inferencial, para obtener los datos poblacio- Resultados de la población
nales se parte de resultados de las muestras estudiadas, por lo
que existe probabilidad de error.
Contraste de hipótesis
Probabilidad de error

Comparación de resultados

Recuerda que...
Conceptos básicos
Figura 1. Esquema de realización de un estudio estadístico.
- Individuo: cada uno de los elementos que componen una pobla-
ción. Es la unidad básica del muestreo. No tiene por qué ser una
persona, puede ser cualquier elemento que podamos contar. 1.1. Técnicas de muestreo estadístico
- Población: conjunto de todos los elementos que cumplen ciertas
propiedades, entre las cuales se desea estudiar un determinado
fenómeno o variable. El muestreo consiste en la selección de una muestra a partir de
- Muestra: subconjunto de la población mediante el cual obtenemos una población. El objetivo del muestreo es que la muestra esco-
conclusiones de la misma, dicho de otra forma, parte de la pobla- gida sea representativa de la población (esto es, que encierre
ción que es sometida a un estudio. Para que estas conclusiones toda la variabilidad posible que existe en la población), para
sean válidas, la muestra debe ser representativa de la población. que los resultados obtenidos en la muestra sean extrapolables
a la población.

13
Manual ENARM · Estadística y Epidemiología

Antes de realizar la técnica de muestreo deseada, la estratifi- Ejemplo: para obtener una muestra de cinco individuos en
cación nos puede ayudar a controlar una determinada variable una población de 100 personas, se asigna a cada persona,
que no queremos que influya en nuestros resultados para evitar de forma aleatoria, un número del 1 al 100. Se introducen en
que dicha variable actúe como factor de confusión (se estu- una urna 100 pelotas numeradas, y la regla matemática va a
dia en el tema 8. Errores en estudios epidemiológicos). La ser “i + 10·x” (siendo “i” el número aleatorio obtenido, y “x” el
estratificación consiste en la división de la población en varias número que va a ocupar cada individuo en nuestra muestra).
categorías según la variable mencionada, de modo que, una vez Se saca una pelota de la urna y el número obtenido es el 17.
dividida la población, elegiremos sólo a individuos de entre las Los individuos elegidos serán el 27, 37, 47, 57, 67.
categorías de la variable que nos interese. - Muestreo estratificado.
Ejemplo: nos interesa contrastar si la mortalidad de COVID 19 es Se denomina muestreo estratificado a aquel en el que, tras
mayor en pacientes con hipertensión arterial, pero tenemos un realizar estratificación de una determinada variable, se elige
posible factor de confusión, el tipo de tratamiento, la asociación una muestra al azar de cada una de las categorías estudiadas
con daño cardiovascular y los años de evolución. Así que, antes de la variable.
de realizar el estudio y escoger la muestra de los que ingresen al - Muestreo por conglomerados.
hospital, interrogamos los años de evolución de la enfermedad Los conglomerados son grupos de individuos ya presentes de
y el tipo de tratamiento. En este caso no podríamos descartar manera natural en la población y que encierran, en sí mismos,
un daño cardiovascular con certeza, pero los años de evolución toda la variabilidad que posee la población diana. Son por
podrían ayudarnos e indicarnos si la hipertensión es un factor tanto muestras perfectas que ya existen de manera natural.
de riesgo independiente o solo se presentan en hipertensos con En el caso de identificar conglomerados en una población, se
mayor tiempo de evolución que posiblemente se asocie a una podría numerar a cada conglomerado y seleccionar, de ma-
enfermedad cardiovascular. nera aleatoria, el o los conglomerados necesarios.
En ocasiones estudiar un conglomerado entero puede resul-
tar muy costoso por tener éste demasiado tamaño muestral.
Técnicas de muestreo probabilístico En ese caso podemos, dentro del conglomerado, realizar un
El muestreo probabilístico utiliza el azar para elegir la muestra muestreo aleatorio para seleccionar un menor número de in-
de entre la población, lo cual permite conocer las probabilida- dividuos; como hemos realizado dos técnicas de muestreo una
des que tiene cada individuo de salir elegido. La utilización del detrás de otra, este tipo de muestreo se llama bietápico.
azar para escoger la muestra (en lugar de cualquier criterio que Ejemplo: en una ciudad existen 10 hospitales que atienden un
defina el investigador) hace que existan más probabilidades de espectro de pacientes similar. Si queremos estudiar la pobla-
que la muestra sea representativa de la población, por lo que ción hospitalizada de dicha ciudad, en lugar de escoger una
las técnicas probabilísticas son mejores. muestra de pacientes de los 10 hospitales, podríamos elegir al
azar un único hospital (conglomerado) y estudiar a los pacien-
Ejemplo: si de una población de 100 personas queremos coger
tes ingresados en él.
15 al azar, cada individuo tendrá 15/100 (15 %) de probabili-
dades de salir escogido.
- Muestreo aleatorio simple. Técnicas de muestreo no probabilístico
Se asigna un número a cada individuo de la población, y pos- Los participantes en el estudio se seleccionan siguiendo criterios
teriormente se escogen tantos números sean necesarios para no aleatorios que define el investigador, por lo que, aunque se
completar el tamaño muestral requerido. procura que la muestra sea representativa, las probabilidades
Ejemplo: para obtener una muestra de cinco individuos en de que no lo sea serán altas y la capacidad para extrapolar
una población de 100 personas, se asigna a cada persona un los resultados a la población será menor que con los métodos
número del 1 al 100. Se introducen en una urna 100 pelotas probabilísticos. Por lo tanto, son peores que las técnicas pro-
numeradas, y se sacan de la urna cinco pelotas. babilísticas.
El muestreo aleatorio simple puede realizarse sin reposición La técnica no probabilística más utilizada es el muestreo de
de elementos (los individuos escogidos no pueden volver a casos consecutivos, que es la técnica de muestreo habitual
ser elegidos) o con reposición de elementos (los individuos de los ensayos clínicos.
escogidos vuelven a ser introducidos en la población de la
- Muestreo de casos consecutivos.
que se obtiene la muestra, de modo que podrían volver a salir
Consiste en reclutar a todos los individuos de la población
elegidos). El muestreo con reposición de elementos es mejor
accesible que cumplan los criterios de selección del estudio
porque se garantiza que en cada extracción de un individuo
dentro de un intervalo de tiempo específico o hasta alcanzar
las probabilidades de salir elegido sean las mismas, pero en
un determinado número. Si se lleva a cabo de manera ade-
poblaciones pequeñas existirá el riesgo de que un mismo in-
cuada, la representatividad de la muestra puede ser semejante
dividuo salga elegido varias veces. Por tanto, el muestreo con
a la de un muestreo probabilístico.
reposición de elementos suele utilizarse en poblaciones gran-
- Muestreo de conveniencia o accidental.
des, donde la probabilidad de salir elegido dos veces es tan
Método sencillo y económico, que consiste en seleccionar
baja que el riesgo que se corre es pequeño.
sujetos accesibles, que estén a mano del investigador. Si el
- Muestreo aleatorio sistemático.
fenómeno estudiado no es suficientemente homogéneo en la
Se asigna un número a cada individuo de la población de ma-
población, las posibilidades de sesgo son muy elevadas.
nera aleatoria (en el muestreo aleatorio simple no hacía falta
- Muestreo a criterio o intencional.
que esta asignación fuera aleatoria). Posteriormente, en vez
En este tipo de muestreo el investigador incluye grupos de
de escoger “n” números, se escoge sólo uno, y a partir de él
individuos que juzga típicos o representativos de la población,
se obtiene el resto mediante una regla matemática.
suponiendo que los errores en la selección se compensarán
Siempre y cuando se cumpla la premisa de ordenar a los in-
unos con otros.
dividuos de la población inicialmente al azar, esta técnica es
equivalente al muestreo aleatorio simple.

14
Tema 1 · Estadística descriptiva

1.2. Tipos de variables Pronóstico en intervención quirúrgica

Variables cualitativas (categóricas)


35
Hacen referencia a características que no se expresan mediante
valores numéricos (p. ej., el color de pelo, la raza…). 30
- Variables cualitativas ordinales.
Cuando los distintos valores de una variable cualitativa siguen un 25
orden, nos interesará asignar a cada valor un número arbitrario 20
(que nos inventamos) en función del orden que ocupa cada ca-
tegoría. Esto es así porque los tests estadísticos que se utilizan 15
para las variables que se expresan con números son más poten-
tes que los tests empleados para variables cualitativas “puras”. 10
Se distinguen de las variables cuantitativas en que los números 5
asignados no cumplen propiedades matemáticas.
Ejemplo: escala del dolor: leve = 1, moderado = 2, intenso = 0
3. Tener un dolor “2” no significa tener el doble de dolor que
un dolor “1”. Complicaciones mayores Sin complicaciones
- Variables cualitativas nominales.
Los valores de la variable no siguen un orden, y por tanto los Complicaciones menores Exitus
nombraremos con palabras y no con números (p. ej., el color
de pelo). Figura 2. Diagrama de rectángulos y diagrama de sectores.

Cuando una variable cualitativa sólo puede tomar dos valores - Diagrama de barras.
(p. ej., sexo: masculino o femenino) se denomina dicotómica Como el diagrama de rectángulos, pero cada “rectángulo”
o binaria. Si puede tomar más de dos valores se denomina no (en este caso barra) representa un intervalo de valores; las
dicotómica. barras están pegadas entre sí (a diferencia de los rectángulos)
porque los intervalos representados por cada uno se solapan
en los extremos. ¡Ojo! Cada intervalo podría abarcar sólo un
Recuerda que... valor, como en el ejemplo de la figura 3.
Las variables expresadas como porcentajes
suelen ser variables cualitativas.
419

Ejemplo: si la prevalencia de EPOC es del 10 %,


375

la variable es tener o no tener EPOC, esto es, cualitativa. 400

Variables cuantitativas 300


255

Hacen referencia a características que se expresan mediante va-


215
Recuento

lores numéricos (p. ej., la tensión arterial, la temperatura…).


Dichos valores numéricos cumplen las propiedades matemáticas 200
de los números (p. ej., tener cuatro hijos implica tener el doble
127

de hijos que una persona que tenga dos).


100
54

- Variables cuantitativas discretas.


24

Los valores numéricos no pueden adoptar cualquier valor (en


23
17

general, sólo podrán ser números enteros).


0 Número de hijos
Ejemplo: número de pacientes atendidos en un día en una
0 1 2 3 4 5 6 7 8 ó más
consulta: se pueden atender 23 o 24 pacientes, pero no 23,5
pacientes. ¡Ojo! Al trabajar con estas variables, por ejemplo al
Figura 3. Diagrama de barras.
calcular la media, sí podríamos obtener decimales.
- Variables cuantitativas continuas.
Los valores numéricos pueden adoptar cualquier valor, inclu- - Diagrama de sectores.
yendo decimales. Círculo dividido en porciones cuya superficie es proporcional
Ejemplo: presión arterial: si tuviera un aparato lo suficiente- a la frecuencia de cada valor de la variable.
mente preciso podría indicar una PAS de 140,6 mmHg. ¡Ojo!
Aunque habitualmente sólo utilicemos una variable con nú-
Representación de variables cuantitativas continuas:
meros enteros, debemos pensar si sería posible dar un valor
con decimales de dicha variable. - Histograma.
Como un diagrama de barras, pero la anchura de cada barra
es proporcional al tamaño del intervalo que representa.
Representación gráfica de las variables - Polígono de frecuencias.
Representación de variables cualitativas y cuantitativas dis- Se obtiene de la unión del punto medio del vértice superior de
cretas: cada barra de un histograma.
- Diagrama de rectángulos. (Ver figura 4 en la página siguiente)
En el eje de abscisas se representan cada una de las posibles
categorías, y en el eje de ordenadas su frecuencia.

15
Manual ENARM · Estadística y Epidemiología

Medidas de dispersión
250 Cuando analizamos los resultados, una variable cuantitativa en
una muestra de sujetos, no sólo nos interesa en torno a qué
200 valor se agrupan los resultados obtenidos (medida de tenden-
cia central), sino también si las observaciones se encuentran
“cerca” o “lejos” del centro de la distribución. Este dato lo
150
indican las medidas de dispersión.
Recuento

Para las variables de distribución simétrica se utiliza la desvia-


100 ción típica, y para las variables de distribución asimétrica el
rango intercuartílico.
50 Ejemplo: la media de presión arterial sistólica de una muestra
de pacientes puede ser de 130 mmHg porque la mitad tiene
0 129 mmHg y la otra mitad 131 mmHg (esta muestra tiene una
10 20 30 40 50 60 70 80 90
PAS muy bien controlada), pero también puede ser 130 mmHg
porque la mitad de pacientes tenga 90 mmHg y la otra mitad
Edad del encuestado
170 mmHg (a pesar de tener la misma media, esta muestra es
Figura 4. Histograma (verde claro) y polígono de frecuencias (verde oscuro).
muy diferente de la otra, ya que los valores individuales están
muy “alejados” del centro).
Las principales medidas de dispersión son:
1.3. Medidas de análisis de los datos - Desviación típica (desviación estándar, σ).
Es la media de la diferencia que existe entre cada observación
Las variables cualitativas se suelen expresar mediante por- individual realizada y la media aritmética de la distribución. Se
centajes (indicando el porcentaje de observaciones que pre- obtiene a partir de la raíz cuadrada de la varianza (σ2), que
senta cada categoría de la variable), y no tienen medidas de es la media del cuadrado de dichas diferencias.
dispersión.
Sin embargo, las variables cuantitativas se deben expresar me- (xi – x)2
diante una medida de tendencia central y una medida de dis- σ2 = σ = √ σ2
persión. Además, existen medidas de posición para indicarnos √ n
el lugar que ocupa cada observación dentro de la distribución.
Para calcular la desviación típica es necesario realizar una ar-
gucia matemática, ya que si calculamos sin más la media de la
Medidas de tendencia central diferencia o “separación” mencionada, al sumar la separación
Informan acerca de cómo se agrupan los distintos valores re- de los valores menores a la media (a la “izquierda”), que dará
gistrados de los individuos de la muestra, indicando dónde se números negativos, más la separación de los valores mayores
encuentra el centro de la distribución. a la media (a la “derecha”), que dará números positivos, los
- Media aritmética. números positivos se anularán con los negativos y obtendre-
La más utilizada, principalmente en distribuciones simétricas. mos un resultado = 0.
Es el “centro de gravedad” del conjunto de valores. No debe Dicha argucia matemática es la varianza, que es la media del
usarse en distribuciones asimétricas ya que, al ser un cálculo cuadrado de la separación mencionada. Al elevar al cuadrado
matemático, los valores de los extremos influirán más que las separaciones “negativas”, se vuelven números positivos y
los centrales pudiendo artificialmente desplazar el valor de la ya no se anulan con las separaciones positivas.
media hacia ellos (en cuyo caso la media dejará de indicar - Rango (recorrido).
dónde está el centro). Es la diferencia entre el valor máximo que toma la variable y
su valor mínimo.
- Rango intercuartílico.
xi
Es la diferencia entre el valor que ocupa el cuartil 3 (C3) de la
x=
distribución y el valor que ocupa el cuartil 1 (C1). Esto es, es el
n
“rango” existente entre los individuos que se sitúan en el 50
% central de la distribución.
- Mediana. - Coeficiente de variación.
Es el valor de la variable que presenta el individuo que ocupa Se utiliza para comparar la dispersión de varias distribuciones,
la posición central si ordenamos las observaciones de menor ya que no tiene unidades (es adimensional). Indica qué por-
a mayor, esto es, que divide el conjunto de observaciones en centaje respecto de la media supone la desviación típica de
dos partes iguales (deja la mitad de las observaciones por en- una distribución.
cima y la mitad por debajo). Si la distribución de valores es Ejemplo: no es lo mismo separarse (DT) 10 kg respecto a 50
simétrica, coincide con la media. Es la más indicada si los datos kg de media (un 20 % de separación) que respecto a 100 kg
a analizar tienen una distribución asimétrica o presentan va- de media (un 10 % de separación).
lores extremos.
- Moda.
CV = σ / x
Es el valor más repetido de todos los valores de la variable.
Puede ser un valor único o haber varias. Es útil para distribu-
ciones con varios “picos” de frecuencia, esto es, con varias ¡Ojo! Cuando queremos expresar cualquier resultado en %,
modas. tenemos que multiplicar el resultado por 100, y viceversa, si
queremos expresar un porcentaje en tanto por 1, deberemos
dividir el resultado por 100.

16
Tema 1 · Estadística descriptiva

Recuerda que... Asimetría


Estudia la deformación horizontal de los valores en torno al
En variables cuantitativas de distribución simétrica,
valor central, la media, observando la concentración de la va-
los resultados se expresan con la media y la desviación típica.
riable hacia uno de sus extremos. Se mide con los coeficientes
En variables cuantitativas de distribución asimétrica,
de asimetría (el más utilizado es el coeficiente de asimetría de
los resultados se expresan con la mediana y el rango intercuartílico.
Fisher ó g1). Una distribución es simétrica cuando a la derecha
y a la izquierda de la media existe el mismo número de valores,
equidistantes dos a dos de la media, de tal manera que media,
Medidas de posición (localización) mediana y moda son iguales (g1 = 0).
Se basan en la ordenación de las observaciones de menor a
Cuando tenemos una curva asimétrica a la izquierda o negativa,
mayor, y la posterior división de la distribución obtenida en gru-
la mayoría de valores están a la derecha de la media (g1 <0),
pos que contienen el mismo número de observaciones. A cada
y la media es menor a la mediana, y ésta a su vez a la moda.
grupo se le asigna un número que indica el número de grupos
Cuando tenemos una curva asimétrica a la derecha o positiva,
situados a su “izquierda”, esto es, que tienen valores de la va-
la mayoría de valores se encuentra a la izquierda de la media
riable menores o iguales a él. En general a estos grupos se les
(con g1 >0), y la media es mayor que la mediana, y ésta a su
denomina “centiles”, pero en función del número de grupos
vez que la moda.
que se utilicen existen distintos nombres:
- Cuartiles.
Se divide a la distribución en cuatro partes iguales.
Curva de asimetría Curva simétrica Curva de asimetría
- Deciles. negativa positiva
Se divide a la distribución en 10 partes iguales.
- Percentiles.
Se divide a la distribución en 100 partes iguales.

La mediana ocupa la posición central de una distribución, por


lo que también es una medida de localización. Al situarse en
el centro, equivale al cuartil 2 (C2), decil 5 (D5) o percentil 50 media < mediana media = mediana mediana < media
(p50).
Ejemplo: el percentil 75 (p75) será el valor de la variable obte- Figura 6. Asimetría.
nido por aquél individuo tal que el 75 % de las observaciones
hayan sido menores o iguales a dicho valor, y el 25 % de las
Curtosis o apuntamiento
observaciones hayan sido mayores a dicho valor. El p75 equivale
al C3 y al D7,5. La curtosis mide el grado de agudeza o achatamiento de una
distribución en relación a la distribución normal (determina
cuán puntiaguda es una distribución). Se mide con el coe-
ficiente de curtosis de Fisher (g2). Se dice que una curva es
mesocúrtica cuando posee un grado de apuntamiento igual a
0,5
la distribución normal (g2 = 0). Se denomina leptocúrtica si es
más apuntada o puntiaguda (g2 >0). Se denomina platicúrtica
0,4 si es más achatada (g2 <0).

0,3

0,2

0,1

Leptocúrtica Mesocúrtica Platicúrtica


0
-4 -3 -2 -1 0 1 2 3 4 Figura 7. Curtosis.

Figura 5. Dispersión de distribuciones.


Definición de una curva de distribución normal según la
forma
Medidas de forma de una distribución Cuando una distribución de datos presenta un coeficiente de
Cuando dos distribuciones coinciden en sus medidas de posi- asimetría g1 = ±0,5 y un coeficiente de curtosis de g2 = ±0,5
ción y dispersión, se hace difícil su comparación. Una manera cumple criterios de distribución normal.
de hacerlo es a través de la forma de la distribución. Para ello
las distribuciones se comparan con la distribución normal en
sus valores ideales, con media 0 y varianza 1 (distribución nor-
mal “tipificada”). Las dos medidas de la forma que se utilizan
habitualmente son el grado de asimetría y el apuntamiento o
curtosis.

17
Manual ENARM · Estadística y Epidemiología

1.4. Principales distribuciones de probabilidad - El intervalo x ± σ comprende el 68 % de los valores centrales


u observaciones. Fuera de dicho intervalo queda el 32 % de
las observaciones (el 16 % a cada lado).
La “distribución” de los resultados de una variable es un modo
- El intervalo x ± 2 σ comprende el 95 % de los valores centrales
de llamar a la morfología que toma la representación gráfica de
u observaciones. Fuera de dicho intervalo queda el 5 % de las
dichos resultados. Cuando estudiamos los resultados de nues-
observaciones (el 2,5 % a cada lado).
tro estudio, nos interesará que se distribuyan de forma similar a
- El intervalo x ± 2,5 σ comprende el 99 % de los valores cen-
distribuciones ya conocidas y que tienen propiedades matemá-
trales u observaciones. Fuera de dicho intervalo queda el 1 %
ticas interesantes, para que podamos aplicar dichas propieda-
de las observaciones (el 0,5 % a cada lado).
des matemáticas a nuestros resultados.
Para las variables cuantitativas continuas nos interesará
comprobar si se distribuyen de forma similar a la distribución
%
normal (de Gauss).
Para las variables cualitativas y para las cuantitativas dis-
16% 68% 16%
cretas podemos utilizar varias distribuciones, siendo las más
utilizadas la binomial y la de Poisson.

2,5% 95% 2,5%


Distribución normal (de Gauss)
La mayoría de las variables biológicas (presión arterial, tem-
peratura, datos de laboratorio, peso, altura, etc.) se distribuyen
con este patrón. ..- -2,5 -2 -1 +1 +2 +2,5 ..+
Se define por una función de probabilidad continua, cuyo x
rango va desde – hasta + , en la cual los valores se agrupan
en torno a un valor central con forma de campana. Figura 8. Distribución normal.

- Es simétrica.
- La media aritmética, mediana y moda coinciden. Distribución binomial
- Es unimodal (tiene una única moda).
Se aplica a variables cuantitativas discretas o cualitativas, y con-
- El área bajo la curva de la distribución es igual a 1.
siste en convertir la variable en dicotómica, habiendo por tanto
La distribución normal, aplicada a la estadística descriptiva re-
una probabilidad de “éxito” p(A) y una probabilidad de fracaso:
presenta el porcentaje de observaciones que tiene cada valor
su probabilidad complementaria p(1-A).
posible, por lo que la suma de todos los porcentajes (área bajo
la curva) será = 100 % = 1.
Distribución de Poisson
La principal utilidad matemática de la distribución normal es Es un caso particular de la distribución binomial que se utiliza
que permite definir una serie de intervalos que encierran un para sucesos muy poco frecuentes: aquéllos en los que p(A) ó
área bajo la curva conocida. En estadística descriptiva, esto p(1-A) <10 %, y además hay <5 individuos dentro de alguna
implica que si nuestros resultados se distribuyen de un modo categoría (n · p(A) <5 ó n · p(1-A) <5).
“normal”, podremos establecer unos intervalos que indiquen En la distribución de Poisson la media coincide con la varianza.
entre qué valores se encuentra un determinado porcentaje
de las observaciones de nuestra muestra:

Pregunta ENARM
1. ¿Cuál de las siguientes medidas de dispersión es
útil para describir datos que no tienen una distri-
bución gaussiana?

A. Media y moda.
B. Error estándar.
C. Desviación estándar.
D. Rango intercuartílico.

· Encuentra las respuestas y comentarios de las preguntas ENARM al final del manual ·

18
Tema 2
Estadística inferencial

Recuerda que... que tienen cada uno de los valores posibles de la variable, a
una distribución de resultados poblacional, que refleja la pro-
La Estadística inferencial estima cómo serían los resultados de la babilidad de que cada una de las posibles medias sea la ver-
población objetivo si fuéramos capaces de estudiar a todos sus indi- dadera media poblacional.
viduos. Para ello, extrae conclusiones a partir de los resultados obte-
Si la distribución muestral es normal, o si n >30 (teorema central
nidos en la muestra, por lo que existirá una probabilidad de error.
del límite), la distribución poblacional también será normal y
podremos utilizar las propiedades matemáticas de dicha dis-
tribución.
Hemos comentado que una muestra es un subconjunto de una
población, ya hemos visto que podemos definir las caracterís-
ticas de esa muestra y la describimos mediante la Estadística
Descriptiva, la cual resume la información contenida en ese % Muestra prob. Población
conjunto de datos. Ahora abordaremos el hecho de que de esa
muestra es de suma importancia extrapolar esos datos al resto
de la población a la cual pertenece; para ello utilizamos la Es-
tadística Inferencial. La Estadística Inferencial esta conformada
por varias técnicas utilizadas para proveer información acerca
de los valores de los parámetros basados en observaciones he-
chas sobre los valores estadísticos.
Esto queda ejemplificado con la pandemia de COVID 19, en
la cual supongamos que deseamos saber la media de días de x variable x
estancia hospitalaria de los pacientes y la capacidad hospitala-
x ± z· ± z · eem
ria en diferentes países. Para esto tomamos los hospitales que
atienden pacientes con COVID 19 de un muestreo aleatorio y
Figura 2. Estadística descriptiva (izquierda) y estadística inferencial (derecha).
medimos en estos hospitales sus días de estancia por paciente.
De cada centro hospitalario que haya resultado en la aleatori-
zación podremos obtener su media y en conjunto entre varios Expresión de resultados de una inferencia de medias
hospitales obtener una media que represente a cada país.
Al igual que al expresar los resultados de la muestra se uti-
lizan intervalos que indican entre qué valores se encuentra
un determinado porcentaje de las observaciones, al estimar los
resultados de la muestra se utilizarán intervalos de confianza
(IC) que indicarán entre qué valores se encuentra, con una
Población determinada probabilidad, la verdadera media poblacional.
Objeto de estudio
- La medida de tendencia central (media poblacional = µ) se
Tiene una μ (media poblacional)
que ignoramos equipara a la media muestral (µ = x).
Si nuestra muestra es representativa de la población, la media
muestral será el valor más probable que podrá tomar la media
poblacional.
- La medida de dispersión utilizada se denomina error están-
dar de la media (eem), y se calcula a partir de la desviación
Estadística
inferencial típica muestral.
Muestra
De la estadística σ
descriptiva tenemos eem =
la medida de
nuestros datos x n

Para el cálculo de los intervalos de confianza (IC) se utilizan


Figura 1. Esquema de la muestra extraída de la población de interés y el uso de las propiedades matemáticas de la distribución normal:
la Estadística Inferencial.
- IC del 68 % = µ ± eem
- IC del 95 % = µ ± 2 eem
- IC del 99 % = µ ± 2,5 eem
2.1. Estadística inferencial para variables cuantitativas

2.2. Estadística inferencial para variables cualitativas


El objetivo va a ser estimar, con un determinado nivel de con-
fianza, entre qué niveles se encontrará la verdadera media
poblacional de la variable que hemos medido en nuestra El objetivo va a ser estimar, con un determinado nivel de con-
muestra. fianza, entre qué niveles se encontrará el verdadero por-
Para ello pasamos de la distribución de resultados de nuestra centaje poblacional de la categoría de la variable que hemos
muestra, que refleja el porcentaje o número de observaciones medido en nuestra muestra.

19
Manual ENARM · Estadística y Epidemiología

Para ello pasamos de una distribución de resultados binomial de Para el cálculo de los intervalos de confianza (IC) se utilizan
nuestra muestra, que refleja el porcentaje p(A) de la categoría las propiedades matemáticas de la distribución normal:
que queremos inferir y su porcentaje complementario p(1-A), a - IC del 68 % = P(A) ± eep
una distribución de resultados poblacional, que refleja la pro- - IC del 95 % = P(A) ± 2 eep
babilidad de que cada uno de los posibles porcentajes sea el - IC del 99 % = P(A) ± 2,5 eep
verdadero porcentaje poblacional. La variable de la distribución
poblacional (“porcentaje poblacional”) es cuantitativa y sigue Antes de realizar cualquier estudio epidemiológico, se debe
una distribución normal. analizar cuál es el tamaño muestral mínimo necesario para con-
¡Ojo! Al inferir un porcentaje, como empleamos la distribu- seguir ofrecer unos resultados suficientemente precisos.
ción binomial estamos realizando la estimación poblacional de En los estudios de inferencia (estimar cómo será un paráme-
una sola categoría de la variable (p. ej., en la variable “color de tro en la población, p. ej., la prevalencia de una enfermedad)
pelo”, tendremos que elegir una sola categoría –pelo rubio, es necesario conocer los siguientes datos para calcular el ta-
pelo castaño, pelo moreno…- cada vez que realicemos infe- maño muestral:
rencia).
- Nivel de precisión (anchura del intervalo de confianza) de-
seado.
- Nivel de confianza deseado (95 %, 99 %...).
% Muestra prob. Población

2.3. Cálculo del tamaño muestral para estudios


de inferencia

p(A)
p(1-A)
Además, necesitamos otro dato que depende del tipo de va-
riable utilizada en nuestro estudio:
- Variable cualitativa:
Porcentaje esperado del parámetro que se va a medir (según
categoría “A” resto de P(A) p(A) estudios previos).
categorías
P(A) ± z · eep - Variable cuantitativa:
Varianza de la variable.
Figura 3. Estadística descriptiva (izquierda) y estadística inferencial (derecha).

No es necesario conocer: error beta.


Expresión de resultados de una inferencia de porcentajes Aclaración: en ocasiones, en las preguntas de tu examen se
- La medida de tendencia central [porcentaje poblacional = denomina erróneamente error alfa a la probabilidad de error
P(A)] se equipara al porcentaje muestral [P(A) = p(A)]. que existe en estadística inferencial (complementario del nivel
- La medida de dispersión utilizada se denomina error están- de confianza del estudio). Sin embargo, debemos “aceptar” ese
dar del porcentaje (eep). error como correcto cuando respondamos preguntas sobre el
Como las variables cualitativas no tienen medidas de disper- cálculo del tamaño muestral.
sión (no tienen desviación típica), se calcula a partir del por-
centaje muestral.

p(A) · p (1-A)
eep =
√ n

20
Tema 3
Contraste de hipótesis

Recuerda que... - Diseño de no inferioridad.


El objetivo es determinar si la intervención experimental “A”
El contraste de hipótesis compara los resultados de varias no es peor que otra ya existente “B”; nos da igual que sea
poblaciones entre sí, para lo cual debe realizar inferencia poblacio- igual o superior, lo que queremos es únicamente que no sea
nal a partir de muestras obtenidas de cada población. Por tanto, al inferior. En este caso H0 es la presencia de inferioridad “A <
igual que en Estadística inferencial, existe probabilidad de error. B”, y la H1 es la situación de no inferioridad “A < B”. Se
utiliza por tanto un contraste de hipótesis unilateral o de
una cola, ya que sólo nos interesa descartar que no haya
3.1. Errores en contraste de hipótesis diferencias en el sentido en que “A” es peor que “B” (A < B).
Para realizar un análisis de no inferioridad, debemos estable-
cer un límite de no inferioridad (δ = delta) a partir del cual
El contraste de hipótesis se utiliza en estudios que pretenden consideraremos que la intervención experimental es “inferior”
determinar si existen diferencias (comparación) o asociaciones a la ya existente. Dicho límite es arbitrario y suele estable-
(correlación) entre varias variables. El objetivo del contraste de cerse en un 20 % de diferencias: el fármaco experimental
hipótesis es determinar si esas diferencias o asociaciones obser- debe conseguir al menos el 80 % del beneficio que consigue
vadas se deben al azar, o bien se deben a un efecto real. la intervención control.
Para ello, se definen dos hipótesis y las respectivas probabili- - Diseño de equivalencia terapéutica.
dades de que cada una de ellas se deba al azar (errores alfa y El objetivo es determinar si la intervención experimental “A” es
beta). similar a otra ya existente “B”; la intervención experimental no
debe ser mejor ni peor, sino producir un efecto terapéutico equi-
- Hipótesis nula (H0).
valente. En este caso H0 es la ausencia de equivalencia “A B”,
No existe asociación entre las variables analizadas.
y la H1 es la situación de equivalencia terapéutica “A B”.
- Hipótesis alternativa (H1).
Al igual que en un análisis de no inferioridad, debemos es-
Existe asociación entre las variables analizadas.
tablecer unos límites arbitrarios para definir la situación de
equivalencia. Dichos límites se suelen establecer en un ± 20
En la realidad sólo se podrá cumplir una de dichas hipótesis %: el efecto de un fármaco debe encontrarse entre el 80 %
(o existe asociación, o no existe), pero al realizar nuestro estu- y el 120 % del efecto que produce el otro (no puede ser más
dio podemos acertar o bien equivocarnos, viendo asociación de un 20 % peor ni más de un 20 % mejor).
cuando no la hay (error alfa), o no viendo asociación cuando El ejemplo más típico de diseño de equivalencia terapéutica
las hay en la realidad (error beta). Así, existen cuatro posibi- son los estudios de bioequivalencia, que se utilizan para
lidades si contrastamos los resultados de la realidad con los autorizar la comercialización de los fármacos genéricos com-
obtenidos en nuestro estudio: parando sus propiedades farmacocinéticas con los respectivos
fármacos originales (se estudia en el tema 7. Tipos de es-
tudios epidemiológicos).
REALIDAD
Error tipo I (error alfa)
Se cumple H1 Se cumple H0 Es el error que se comete cuando las diferencias observadas se
(A ≠ B) (A = B) deben al azar (en la realidad, H0 es cierta), pero el investigador
lo interpreta como debido a una diferencia o asociación (en el
estudio, se acepta H1 y se rechaza H0): es la probabilidad de
ESTUDIO Veo diferencias Potencia Error Tipo I rechazar la hipótesis nula siendo cierta. Por lo tanto, es un
TEST (se acepta H1) 1−ß α resultado “falso positivo”.
La probabilidad de cometer este error es α, que define el nivel
No veo de significación estadística de los estudios epidemiológicos.
Error Tipo II
diferencias 1−α Una vez realizado cualquier estudio epidemiológico de compa-
ß
(no se rechaza H0) ración, se calcula mediante un test estadístico el valor “p”, que
es la probabilidad de que una diferencia igual o mayor a la
Tabla 1. Contraste de hipótesis en estudios con diseño de superioridad. observada en el estudio no exista en la realidad (esto es, de que
estemos incurriendo en un error α). Si el valor de “p” es inferior
al nivel de significación estadística α que hayamos predefinido
Hipótesis nula y alternativa según el objetivo de nuestro antes de iniciar el estudio (en general se define α = 0.05), dire-
estudio mos que los resultados del estudio han sido estadísticamente
- Diseño de superioridad. significativos.
El objetivo es conocer si una intervención “A” (tratamiento, - p <0,05: se acepta H1 y se rechaza H0.
prueba diagnóstica, etc.) es mejor que otra intervención “B”, - p >0,05: no se acepta H1 y no se rechaza H0.
o bien si esa otra es mejor. En este caso H0 es la igualdad “A =
B”, y H1 es la presencia de diferencias “A B”. Se utiliza por El nivel de significación de un contraste de hipótesis es inde-
tanto un contraste de hipótesis bilateral o de dos colas, ya pendiente de la magnitud de las diferencias encontradas
que nos interesa conocer si hay diferencias en ambos sentidos entre las intervenciones que se comparan.
de la igualdad (A > B, B > A).

21
Manual ENARM · Estadística y Epidemiología

Error tipo II (error beta)


que parecen trabalenguas y que tienen el siguiente esquema
Es el error que se comete cuando las diferencias observadas con dos partes, la primera que nos habla de lo que ocurre en
son reales (en la realidad, H1 es cierta), pero el investigador la realidad, y la segunda que nos habla sobre los resultados de
lo interpreta como debido al azar (en el estudio, no se acepta nuestro estudio: “En el caso de que no existieran diferencias
H1 y no se rechaza H0): es la probabilidad de no rechazar entre los dos fármacos (= si en la realidad se cumple H0),
la hipótesis nula siendo falsa. Por lo tanto, es un resultado existiría una probabilidad de encontrar unos resultados como
“falso negativo”. los obtenidos (= si, p. ej., en nuestro estudio hemos visto
Cuando se realizan estudios epidemiológicos y se concluye que diferencias significativas -H1-) inferiores al 5 % (= hemos
no existen diferencias, se suele requerir una probabilidad de obtenido una p <0.05)”.
haber cometido un error beta <0,20 (menos del 20 %). No
obstante, el error beta es menos importante que el error alfa y
en muchas ocasiones ni siquiera se calcula.
3.2. Cálculo del tamaño muestral en el contraste
de hipótesis
Recuerda que...
La hipótesis nula nunca se puede aceptar,
Como en cualquier estudio epidemiológico, se debe analizar antes
y la hipótesis alternativa nunca se puede rechazar. Así pues:
de comenzar el estudio cuál es el tamaño muestral mínimo ne-
- La hipótesis nula se rechaza o “no se rechaza”.
cesario para conseguir unos resultados suficientemente precisos.
- La hipótesis Alternativa se Acepta o “no se acepta”.
En los estudios de contraste de hipótesis (p. ej., comparar qué
fármaco “A” o “B” es mejor) es necesario conocer los siguien-
tes datos para calcular el tamaño muestral:
Potencia estadística (poder estadístico)
1. Aquellos parámetros que hacía falta conocer para estadística
Es la probabilidad de detectar diferencias (en el estudio se inferencial:
acepta H1 y se rechaza H0) cuando en realidad existen (en la • Nivel de precisión (confianza) deseado (95 %, 99 %...).
realidad, H1 es cierta): es la probabilidad de rechazar la hi- • Media o porcentaje esperado del parámetro que se va a
pótesis nula siendo falsa. Por lo tanto, es un resultado “ver- medir (según estudios previos)
dadero positivo”. • Variabilidad del parámetro estudiado.
La potencia estadística y el error beta son complementarios (po- 2. Parámetros específicos del contraste de hipótesis:
tencia + β = 1). Por lo tanto: • Tipo de diseño del estudio y si el análisis será de una cola
o de dos colas.
Potencia estadística = 1 – β • Error tipo α y tipo β permitidos.
β = 1 – potencia estadística Nivel de potencia estadística deseado. Cuanta mayor po-
tencia, y cuanto menor α y β deseados, mayor tamaño
muestral.
Así, de forma análoga al error beta, cuando se realizan estudios • Magnitud de la diferencia mínima clínicamente relevante
epidemiológicos y se concluye que no existen diferencias, se que se desea demostrar entre los dos fármacos (δ).
suele requerir que la potencia estadística sea al menos de un Aclaración: se llama también delta, pero es un concepto
80 %. distinto al límite de no inferioridad.
• Porcentaje de pérdidas previsto (d).

Recuerda que...
No es necesario conocer: nivel de enmascaramiento del estu-
Los errores alfa y beta son errores aleatorios, esto es, dio, número de pacientes que somos capaces de reunir, número
debidos al azar (es el azar el que hace que el estudio falle y de centros participantes.
detecte diferencias cuando no las hay, o no las detecte cuando Si al finalizar el estudio se obtiene un resultado no significativo,
las hay). Los errores aleatorios se solucionan aumentando el no se deben añadir pacientes hasta que lo sea, sino revisar la
tamaño muestral, por lo que ante un estudio cuyos resultados hipótesis de trabajo y la determinación del tamaño muestral y
no sean estadísticamente significativos (p >0,05), si diseñamos un realizar un nuevo estudio.
nuevo estudio incluyendo un mayor tamaño muestral, es posible
que consigamos alcanzar entonces la significación estadística.
3.3. Tests para contraste de hipótesis
↑ n → ↓ α, ↓ β, ↑ potencia estadística

Tests para estudios de comparación de variables


Recuerda que... Los principales tests para comparación de variables se exponen
en la tabla 2 (ver en la página siguiente). Para elegir el tipo
Trucos para acertar las preguntas sobre
de test a utilizar nos deberemos fijar en dos criterios funda-
contraste de hipótesis:
mentales:
- Las opciones categóricas (“siempre”, “nunca”, “sin lugar a
dudas”) son falsas. Se debe tener en cuenta que existe un - Qué tipo de variable (cualitativa o cuantitativa) es la varia-
margen de error que podemos cometer. ble resultado que tenemos que comparar.
- Las opciones correctas suelen aplicar la definición de error Los tests para variables cuantitativas aportan una mayor po-
alfa o error beta al ejemplo del enunciado, y para ello nos tencia estadística (permiten alcanzar la significación estadística
“traducen” la tabla 1 de este tema. Son por ello opciones con menor tamaño muestral y sus resultados son más preci-
sos) que los utilizados para variables cualitativas.

22
Tema 3 · Contraste de hipótesis

VARIABLE CUANTITATIVA
VARIABLE
CUALITATIVA 2 GRUPOS O 2 >2 GRUPOS O
MOMENTOS DEL t >2 MOMENTOS DEL t

DATOS chi2 (χ2) Paramétrico t Student ANOVA


INDEPENDIENTES - Corrección de Yates* No paramétrico
(VARIOS GRUPOS) - Test exacto de Fisher** Mann-Whitney Kruskal-Wallis
V. ordinales
t Student para ANOVA para
Paramétrico
DATOS APAREADOS datos apareados datos apareados
McNemar
(VARIOS MOMENTOS DEL t) No paramétrico
Wilcoxon Friedmann
V. ordinales

*Corrección de Yates: corrección que se aplica al test de chi2 cuando el tamaño muestral es n <200.
**Test exacto de Fisher: cuando en la tabla de contingencia de la chi2 hay menos de cinco individuos en >25 % de las casillas [expresado matemáticamente: n · p <5 ó
n · (1-p) <5] no se puede utilizar el test de chi2 y hay que utilizar el test exacto de Fisher.

Tabla 2. Tests de contraste de hipótesis para comparación de variables.

Muestras
independientes t de Student
2 grupos
Muestras
dependientes t pareada
Paramétrica
Cuantitativas Normalidad
Muestras
independientes ANOVA
>3 grupos
Muestras
dependientes ANOVA

Estadística inferencial Muestras X2 (chi2)


Variable dependiente independientes Prueba exacta de Fisher**
Corrección de Yates*
2 grupos
Muestras
dependientes McNemar

Nominal
Muestras
independientes X2 para n muestras
>3 grupos
Muestras
dependientes Q Cochran
No paramétrica
Cualitativas
Muestras
independientes U-Mann Whitney
2 grupos
Muestras
dependientes Wilcoxon

Ordinal
Muestras
independientes Kruskall-Wallis
>3 grupos
Muestras
dependientes Friedman

*Corrección de Yates: corrección que se aplica al test de chi2 cuando el tamaño muestral es n <200.
**Test exacto de Fisher: cuando en la tabla de contingencia de la chi2 hay menos de cinco individuos en >25 % de las casillas [expresado matemáticamente: n · p <5 ó
n · (1-p) <5] no se puede utilizar el test de chi2 y hay que utilizar el test exacto de Fisher.
Las casillas oscuras son las pruebas que consideramos tendrian mayor probabilidad de venir en el ENARM.

Figura 1. Tests de contraste de hipótesis para comparación de variables.

23
Manual ENARM · Estadística y Epidemiología

Cuando la variable es cuantitativa, además, tendremos que - Regresión lineal.


elegir entre los siguientes grupos de tests estadísticos: Cuando la variable “y” es cuantitativa, la fórmula matemática
• Tests paramétricos. más empleada es la ecuación de una recta:
Se utilizan cuando la variable sigue una distribución normal,
o bien si n >30 (pese a que la distribución no sea normal). y = a + b1 · x1 + b2 · x2 + b3 · x3 + … + bi · xi
Aportan una mayor potencia estadística que los no paramé-
tricos.
• Tests no paramétricos. y

a = ordenada en el origen
Se utilizan cuando la variable no sigue una distribución nor-
mal y además n <30. y=a+b·x
Las variables ordinales se consideran como si fueran cuanti-
tativas, pero con la restricción de que sólo se puede emplear
con ellas tests no paramétricos.
b = pendiente

Recuerda que...
Las variables resultado cualitativas nos las plantearán
habitualmente como porcentajes (comparar varios porcentajes),
mientras que las variables resultado cuantitativas nos las x
plantearán habitualmente como medias (comparar varias medias). 0 1 2 3 4

Figura 2. Regresión lineal simple.

- Si estamos comparando entre sí los resultados obtenidos en


esa variable en varios grupos de individuos (datos inde- El valor de la constante “a” indica el valor que toma la variable
pendientes), o bien en un único grupo de individuos pero en “y” (eje de ordenadas) cuando las variables independientes
varios momentos del tiempo (datos apareados). valen = 0. Se denomina ordenada en el origen.
El valor de cada coeficiente “b” expresa cuantitativamente
Tests para estudios de asociación entre variables la asociación entre cada variable “xi” y la variable “y”: indica
cuánto aumenta la variable “y” con cada unidad de aumento
En este caso, lo que se pretende es demostrar si los cambios de cada variable “xi”. Se denomina pendiente.
que se produzcan en una o varias variables (variables indepen- - Regresión de Cox.
dientes, xi) van a influir sobre el valor que tome otra variable Método de regresión que se utiliza en el análisis de supervi-
(variable dependiente, y); además, se pretende cuantificar vencia.
dicha influencia. Todas las variables se recogen de una misma
muestra.
Correlación
La correlación trata de expresar, mediante un coeficiente de
Regresión correlación, el porcentaje de los cambios observados en la va-
La regresión trata de expresar mediante ecuaciones la aso- riable dependiente que se deben a los cambios observados en
ciación existente (mostrar mediante una fórmula matemática las variables independientes. Por lo tanto, indicará lo “fuerte”
cómo varía la variable “y” con cada unidad de aumento de las que es el grado de asociación.
variables “xi”). Además, las ecuaciones obtenidas nos permiti- Evidentemente, los cambios que ocurran en una muestra de
rán predecir el valor que tomará la variable “y” en un individuo pacientes en la variable “y” (p. ej., en el colesterol), no se de-
para el que conocemos las variables “xi”. Las variables introdu- berán en su totalidad a los cambios apreciados en la variable
cidas pueden ser tanto cuantitativas como cualitativas (en cuyo “x” (p. ej., el peso). Sólo un cierto porcentaje de esa variación
caso habrá que asignar a cada categoría un número que nos se deberá a la variable “x”, y el resto se deberá a otras variables
inventemos). que no estamos estudiando (p. ej., la dieta, la realización o no
Por ejemplo: en una muestra de individuos, analizar cuánto au- de ejercicio físico, etc.).
menta el colesterol (variable y) con cada kg que aumente el Los tests de correlación más utilizados son los empleados para
peso medio (variable x) en dicha muestra. evaluar la correlación existente entre dos variables cuantitativas.
Si existe sólo una variable independiente (xi) en la ecuación se - Coeficiente “r” de Pearson.
habla de regresión univariante o simple. Si existen dos o Es un test paramétrico que mide el grado de correlación lineal
más variables independientes (xi) en la ecuación se habla de entre las variables (se emplea cuando las dos variables siguen
regresión multivariante o múltiple. Si se utiliza regresión una distribución normal o bien si n >30). No descarta otros
multivariante, todas las variables independientes incluidas en tipos de correlación que no sea la lineal.
la ecuación quedan “ajustadas entre sí” de modo que el co- - Coeficiente “ρ” de Spearman.
eficiente que acompaña a cada variable indicará el efecto que Es un test no paramétrico (se emplea cuando alguna de las
tiene exclusivamente dicha variable sobre la variable “y”, elimi- variables sigue una distribución no normal y además n <30).
nando el efecto de cualquier otra variable independiente intro-
ducida en la ecuación: sirve por tanto para evitar sesgos por
factor de confusión. El signo del coeficiente de correlación (+/-) indica si la correla-
ción es positiva (cuando la variable “x” aumenta, la variable “y”
El tipo de variable de la variable dependiente (y) define el tipo aumenta) o si es negativa (cuando la variable “x” aumenta, la
de regresión: variable “y” disminuye).
- Regresión logística. El valor absoluto del coeficiente indica, si lo elevamos al cua-
Si la variable “y” es cualitativa. drado, el porcentaje de los cambios de la variable “y” que se

24
Tema 3 · Contraste de hipótesis

explican por los cambios de la variable “x” (p. ej., un coeficiente estudiado con análisis de supervivencia, la medida epidemio-
de 0,8 = 80 %, indica que el 64 % de los cambios en la variable lógica utilizada es el hazard ratio o razón de riesgos (HR). Su
“y” se explican por los cambios en la variable “x”): interpretación es similar a las del resto de medidas de asociación
- Valor absoluto >0,7: (RR, OR…).
Correlación fuerte. El HR es el cociente entre el riesgo que tiene de presentar el
- Valor absoluto <0,7: evento de interés un sujeto del grupo experimental respecto
Correlación débil. a un sujeto del grupo control, por cada unidad de tiempo
- Valor absoluto = 0: que dura el estudio. Es similar al riesgo relativo (RR), dado que
Ausencia de correlación. también es un cociente de riesgos. Sin embargo, mientras el RR
compara el riesgo acumulado a lo largo de todo el estudio
(cociente de incidencias acumuladas al finalizar el estudio), el
y y HR analiza el riesgo instantáneo para cada unidad de tiempo
(cociente entre la velocidad de progresión de la enfermedad o
“hazard rate” de los grupos comparados). Así, el HR analiza las
probabilidades de presentar el evento en el siguiente instante
de tiempo, para aquéllos individuos que continúen en el estudio
al inicio de dicho periodo de tiempo (pacientes en riesgo); el RR
analiza las probabilidades de presentar el evento a lo largo de
todo el estudio.
Ejemplo (ver figura 4): imaginemos un estudio que compara 2
x x
grupos de 100 pacientes, que dura 2 unidades de tiempo, y que
Figura 3. Correlación positiva (izquierda) y negativa (derecha).
tiene un HR de 0.7 (sin pérdidas). Pongamos que observamos,
por ejemplo, 30 eventos en el grupo control en cada periodo
de tiempo. En este caso, en el grupo experimental habría 21
Recuerda que...
eventos en el periodo de tiempo 1 (un 70 % de 30) y quedarían
El análisis de regresión estima el valor de 79 pacientes para el periodo de tiempo 2. En dicho periodo de
una variable que corresponde para un valor de otra (ecuación). tiempo habría 24 eventos (en el grupo control hay 30 eventos
Mientras el análisis de correlación mide la intensidad de de 70 pacientes que quedan, esto es, un riesgo del 42,8 %; el
la relación entre dos variables cuantitativas. riesgo del grupo experimental debe ser el 70 % de ese 42,8 %:
un 30 % sobre 79 pacientes, que son 24 eventos). El HR del
estudio es 0.7, pero el RR sería igual al cociente de incidencias
Análisis de supervivencia acumuladas: 45 eventos en el grupo experimental / 60 eventos
en el grupo control = 0.75. Así, vemos que el HR y el RR son
Se utiliza cuando en un estudio epidemiológico la variable res- similares, pero no son la misma cosa.
puesta es el tiempo que transcurre hasta que sucede un
evento de interés (la muerte, la aparición de enfermedad, la
curación, el alta hospitalaria…). Así pues, las variables tienen
una parte cuantitativa (tiempo que transcurre) y una parte cua- 100% 21 eventos
litativa (aparición o no de un evento).
Cuando el tiempo de seguimiento de alguno de los pacientes 80% 79%
del estudio termina antes de que haya tenido lugar el evento 30 eventos
70%
de interés se habla de observaciones incompletas o censu- 24 eventos
radas. Si un paciente fallece por una causa distinta a la enfer- 60%
55%
medad estudiada se considerará como censurado, ya que, en
30 eventos
caso contrario, se estaría cometiendo un sesgo de información. 40% 40%

En la representación gráfica de las curvas de supervivencia, se


Supervivencia

suele anotar al principio de cada unidad de tiempo los pacientes


que siguen en el estudio y todavía no han presentado el evento 20%
de interés (pacientes en riesgo). Para calcular los pacientes
Tiempo
en riesgo al inicio de cada unidad de tiempo, se deben eliminar 0%
tanto los pacientes que han tenido el evento de interés como 0 1 2
los pacientes censurados. Pacientes en riesgo
Los métodos estadísticos no paramétricos son los más fre- 100 79 55
cuentemente utilizados en análisis de supervivencia. Entre ellos 100 70 40
los más destacados son: Grupo experimental
- Kaplan-Meier. Grupo control
Utilizado para “calcular” las curvas de supervivencia.
- Test de log-rank.
RR = 45/100 = 0,75
Utilizado como test de comparación, es similar al chi2 (compa- 60/100
rar los resultados obtenidos entre varias intervenciones).
- Modelo de regresión de Cox. 21/100 + 24/79
30/100 30/70
Utilizado para realizar regresión. HR = = 0,70
2

Para cuantificar el grado de asociación existente entre un de- Figura 4. Curvas de Kaplan-Meier que representan el ejemplo expuesto en el
terminado factor de riesgo o protector y un evento de interés texto.

25
Manual ENARM · Estadística y Epidemiología

Pregunta ENARM
2. En un estudio de cohortes se obtuvo como con-
clusión una mortalidad de 1.86 (hazard ratio con
intervalo de confianza del 95 % de 1.68 a 2.06)
en el grupo expuesto, comparado con el grupo
no expuesto. ¿Cuál de las siguientes es la inter-
pretación más apropiada del estudio respecto al
uso de opio y la mortalidad?

A. Incierta, por el tamaño muestral.


B. No afecta la mortalidad.
C. Aumenta la mortalidad.
D. Reduce la mortalidad.

· Encuentra las respuestas y comentarios de las preguntas ENARM al final del manual ·

26
Tema 4
Probabilidades

Conceptos
- Probabilidad.
Medida de la verosimilitud de que un determinado suceso A B = + -
ocurra o no. Oscila entre 0 (suceso imposible) y 1 (suceso se-
guro).
- Sucesos complementarios. p (A U B) = p(A) + p(B) -
U
p(A B)
Dos sucesos A y B son complementarios cuando la suma de las
probabilidades de ambos es igual a 1. Siempre que no ocurre Figura 1. Unión de probabilidades.
un suceso, ocurre el suceso contrario: p(A) + p(B) = 1.
Ejemplo: ser hombre (A) y ser mujer (B). Intersección de probabilidades (∩)
- Sucesos incompatibles.
Se denomina así a los sucesos excluyentes, es decir, que no Es la probabilidad de que ocurran un suceso y otro simultá-
pueden suceder a la vez. Dos sucesos A y B son incompatibles neamente. Para calcularlo se multiplica la probabilidad de que
cuando p(A ∩ B) = 0 ocurra uno de ellos [p(A)] por la probabilidad de que ocurra el
Ejemplo: tener el pelo moreno (A) o pelirrojo (B). otro en aquellos casos en los que ocurre el primer suceso [pro-
- Sucesos independientes. babilidad condicionada = p(B/A)]:
La probabilidad de que ocurra uno de ellos no se influye por el
hecho de que ocurra o no el otro: p(A/B) = p(A); p(B/A) = p(B). p(A ∩ B) = p(A) · p(B/A) = p(B) · p(A/B)
Ejemplo: ganar la quiniela (A) y ganar la lotería (B).
Si tenemos dos sucesos independientes: p(B/A) = p(B), y por
Unión de probabilidades (U) tanto p(A ∩ B) = p(A) · p(B).
Es la probabilidad de que ocurra un suceso u otro. Al calcular la
unión de probabilidades se suma la probabilidad de que ocurra
cada suceso, pero se debe restar una vez la probabilidad de que Probabilidad condicionada
ocurran ambos a la vez (ya que al sumar la probabilidad de que Una probabilidad de un suceso A condicionada al suceso B es
ocurra cada suceso se está contando dos veces a los individuos la probabilidad de que ocurra el suceso A considerando sólo
que presentan los dos sucesos): los casos en los que ocurre B (es decir, la probabilidad de que
ocurra A sabiendo que ha ocurrido B).
p(A U B) = p(A) + p(B) − p(A ∩ B) La fórmula por la cual se puede calcular la probabilidad condi-
cionada p(A/B) a partir de la probabilidad condicionada p(B/A)
se denomina teorema de Bayes.
Si tenemos dos sucesos incompatibles: p(A ∩ B) = 0, y por
tanto p(A U B) = p(A) + p(B)
p(A ∩ B) p(A) · p(B/A)
Si queremos calcular la probabilidad de que sólo ocurra un su- p(A/B) = =
ceso u otro (eliminando por tanto todos los casos en los que p(B) p(B)
aparezcan los dos sucesos a la vez) debemos restar dos veces
en la fórmula la intersección de probabilidades:
A menos que tengamos sucesos independientes, en cuyo caso
las fórmulas se simplifican, en el examen no nos van a poder
p(sólo A ó B) = p(A) + p(B) − 2 · p(A ∩ B) pedir calcular la probabilidad condicionada ni la intersección de
probabilidades.

27
Manual ENARM · Estadística y Epidemiología

28
EPIDEMIOLOGÍA

Tema 5
Estudios de validación de una prueba diagnóstica

Cuando se desea comercializar un nuevo test diagnóstico (p. más categorías existan, menos grado de concordancia calcu-
ej., un nuevo modelo de esfingomanómetro), se deben llevar a laremos. Es por eso que en variables con varias categorías (no
cabo estudios de validación mediante los cuales se evaluarán dicotómicas) se emplea el test de kappa ponderado.
distintas cualidades del test: Ejemplo: evaluar la concordancia entre dos cardiólogos que
definen la clase funcional de la NYHA I-II-III-IV de una serie de
pacientes. Existirá más concordancia si cuando un cardiólogo
Validez (exactitud) indica clase II el otro indica clase III, que si un cardiólogo indica
Es el grado en el cual una medición representa el verdadero clase I y el otro clase IV.
valor que se desea medir. En los estudios de validación, repre- - Variable cuantitativa: coeficiente de correlación intraclase.
sentaría el grado de correlación de las medidas obtenidas me- Ejemplo: evaluar la concordancia entre dos anatomopatólogos
diante el test con las obtenidas mediante el gold standard. que cuantifican el número de mitosis en una misma serie de
muestras de biopsias de un tumor neuroendocrino.
Reproducibilidad (fiabilidad, precisión)
Es la capacidad del test de obtener el mismo resultado cuando
la medición se repite bajo las mismas condiciones de medida. 5.1. Parámetros de validez de una prueba diagnóstica

Concordancia Para evaluar la validez de una prueba diagnóstica, se realiza un


Es la capacidad del test de obtener el mismo resultado cuando estudio transversal mediante el cual se comparan los resul-
la medición se repite mediante distintas condiciones de me- tados obtenidos por el test (que cataloga a los individuos en
dida (p. ej., cuando la persona encargada de realizar el test “+” o “−“) con los resultados obtenidos por el mejor método
es distinta). El cambio en condiciones que afectan a la validez diagnóstico que esté disponible, llamado gold standard o pa-
externa de una prueba (como la prevalencia de enfermedad, trón oro (que va a catalogar a los individuos del estudio en
o la aplicación del test como tamizaje o como diagnóstico de “enfermos” o “sanos”).
confirmación) afecta al grado de concordancia existente. Dicho estudio debe realizarse en las condiciones más similares
Los estudios de concordancia utilizan distintos tests estadísticos posibles a la práctica clínica habitual. Además, la comparación
en función de cómo sea la variable resultado que se va a utilizar: debe ser ciega e independiente y abarcar todo el espectro de
- Variable cualitativa dicotómica: estadístico kappa (de la enfermedad.
Cohen).
Oscila entre −1 (excesiva discordancia) y +1 (concordancia
completa). Cuando es igual a 0, la concordancia obtenida se
debe al azar.
Ejemplo: evaluar la concordancia entre dos radiólogos a los
que se les muestran las mismas radiografías de tórax y tienen
GOLD STANDARD
que indicar si hay SÍ/NO un infiltrado neumónico. ENFERMOS SANOS
- Variable cualitativa no dicotómica: estadístico kappa pon-
derado. TEST VP FP
VP + FP
Es igual que el estadístico kappa, pero tiene en cuenta el POSITIVO total de positivos
grado de discordancia existente, lo cual es importante cuando TEST FN + VN
existen varias categorías posibles de la variable (por eso se usa FN VN
NEGATIVO total de negativos
en variables no dicotómicas).
Cuantas más categorías posibles tenga una variable cualita- VP + FN FP + VN
n
tiva, más difícil va a ser que dos observadores distintos in- total de enfermos total de sanos
diquen exactamente la misma categoría ante una misma
muestra. Por lo tanto, si usamos el estadístico kappa, cuantas Tabla 1. Estudio de validación de una prueba diagnóstica.

29
Manual ENARM · Estadística y Epidemiología

Parámetros de validez interna Razón de probabilidad o verosimilitud


La validez interna es la capacidad del test de obtener resulta- La razón de probabilidad o verosimilitud positiva (RPP, RVP) es el
dos exactos (que representen el verdadero valor que se desea cociente entre la probabilidad de que un enfermo obtenga un
medir) en los sujetos de la muestra que se ha utilizado para resultado positivo (S) y la probabilidad de que un sano obtenga
realizar el estudio. un resultado positivo (TFP).
Los parámetros de validez interna son características intrínsecas La razón de probabilidad o verosimilitud negativa (RPN, RVN) es
del test que no dependen de la población a la que se aplique el cociente entre la probabilidad de que un enfermo obtenga
(esto es, no dependen de la prevalencia de enfermedad). un resultado negativo (TFN) y la probabilidad de que un sano
obtenga un resultado negativo (E).
Sensibilidad (S)
Es la capacidad del test de detectar a los sujetos enfermos. Es RPP = S / TFP
la probabilidad de que un sujeto enfermo (según el gold stan- RPN = TFN / E
dard) saque “+” en el test. La probabilidad complementaria a la
sensibilidad (esto es, la probabilidad de que un sujeto enfermo
saque “−“ en vez de “+” en el test) es la tasa de falsos ne-
Parámetros de validez externa
gativos (TFN). La validez externa es la capacidad del test de generalizar los
resultados obtenidos en la muestra a la población diana de
la que se obtuvo la muestra. La validez interna es un requisito
S = VP / total de enfermos previo para la validez externa (si los resultados no son válidos
TFN = FN / total de enfermos para la muestra de sujetos, tampoco lo podrán ser para la po-
S + TFN = 1 → S = 1 – TFN; TFN = 1 – S blación diana).
- Valor predictivo positivo (VPP).
Así, un test muy sensible es útil en la práctica cuando su resul- Capacidad del test de predecir si un sujeto que ha sacado
tado es negativo, ya que el test tendrá una TFN muy baja y positivo en el test va a estar realmente enfermo. Es la probabi-
por lo tanto casi todos los pacientes negativos serán verdaderos lidad de que un sujeto “+” (según el test) sea enfermo según
negativos (sanos), pudiendo por tanto descartar enfermedad. el gold standard.
La sensibilidad es análoga a la potencia estadística de un es-
tudio de contraste de hipótesis. VPP = VP / total de positivos
Un ejemplo de esto lo tenemos con el valor de los anticuerpos
antinucleares en el contexto del estudio de un paciente con - Valor predictivo negativo (VPN).
sospecha de Lupus Eritematoso Sistémico (LES). ANAs a títulos Capacidad del test de predecir si un sujeto que ha sacado ne-
de 1:80 tienen una sensibilidad del 97.8 % y una especificidad gativo en el test va a estar realmente sano. Es la probabilidad
del 74 %, por lo cual en un paciente que acude a la consulta de que un sujeto “−“ (según el test) sea sano según el gold
con sospecha de LES una prueba positiva no confirma el diag- standard.
nóstico, mientras que una prueba negativa prácticamente lo
descarta, debido al alto valor de sensibilidad de los ANAs, ya VPN = VN / total de negativos
que la tasa de falsos negativos es muy baja.
- Valor global (VG).
Especificidad (E) Es la proporción de resultados verdaderos (verdaderos positi-
Es la capacidad del test de detectar a los sujetos sanos. Es la vos y verdaderos negativos) del total de resultados de un test.
probabilidad de que un sujeto sano (según el gold standard) Indica, por tanto, el porcentaje de veces que el test “acierta”
saque “−” en el test. La probabilidad complementaria a la espe- en sus predicciones.
cificidad (esto es, la probabilidad de que un sujeto sano saque
“+“ en vez de “−” en el test) es la tasa de falsos positivos VG = (VP + VN) / n
(TFP).
Los parámetros de validez externa de un test diagnóstico de-
E = VN / total de sanos penden de la probabilidad pre-test de enfermedad de la
TFP = FP / total de sanos población donde se aplique. La probabilidad pre-test es la pro-
E + TFP = 1 → E = 1 – TFP; TFP = 1 – E babilidad que tiene un sujeto de tener una enfermedad antes
de que se le realice un test diagnóstico. Depende de las ca-
racterísticas clínicas del sujeto (cuantos más síntomas y signos
Un test muy específico es útil en la práctica cuando su resul- de la enfermedad, mayor probabilidad pre-test) y, fundamen-
tado es positivo, ya que el test tendrá una TFP muy baja y por talmente, es directamente proporcional a la prevalencia de
lo tanto casi todos los pacientes positivos serán verdaderos posi- enfermedad en la población.
tivos (enfermos), pudiendo por tanto confirmar enfermedad.
Así, si la prevalencia de una enfermedad es muy alta y un sujeto
Ejemplo: tratamos en la sensibilidad el caso de los ANAs como sale positivo en el test, será más probable que de verdad esté
un marcador de mucha utilidad para descartar la presencia de enfermo que si la prevalencia es muy baja. Por el contrario, si la
LES, pero si los ANAs resultan positivos, debido al bajo nivel de prevalencia de enfermedad es baja y un sujeto sale negativo en
especificidad no serían de mucha ayuda para los criterios de el test, será más probable que esté de verdad sano:
clasificación para LES, así que en ese caso se podría solicitar una
prueba altamente especifica como los Anticuerpos antiSm con
una especificidad del 97-99 %; en este caso la prueba positiva ↑ prevalencia → ↑ VPP, ↓ VPN
sería de mucho valor para clasificar al paciente con LES ya que ↓ prevalencia → ↓ VPP, ↑ VPN
la tasa de falsos positivos es muy baja.

30
Tema 5 · Estudios de validación de una prueba diagnóstica

Antes hemos indicado que los tests muy sensibles son útiles
cuando su resultado es negativo (descartan enfermedad), y los 100
tests muy específicos cuando su resultado es positivo (confir-
man enfermedad). Esto es así por la relación entre la S y E con
los valores predictivos de un test: Punto de corte óptimo

↑ S → ↓ TFN → ↑ VPN S
↑ E → ↓ TFP → ↑ VPP

Recuerda que...
Los valores predictivos de un test dependen de la prevalencia de
enfermedad, mientras que la S y E no dependen de la prevalencia.

Si una prueba diagnóstica tiene un VPP 100 % y un VPN 100 %, 0 100


1-E
significará que todos los individuos que den positivo en el test
estarán enfermos, y que por el contrario todos los individuos que Figura 1. Curva ROC.
den negativo estarán sanos: por tanto, se tratará de una prueba
patognonómica.
100 Mejor
Peor

5.2. Curvas ROC (de rendimiento diagnóstico)

Cuando se define enfermedad o salud utilizando una variable


cuantitativa continua, se debe definir un punto de corte a S
partir del cual consideramos que un sujeto es “positivo” y por
tanto predecimos que estará enfermo.
Ejemplo: se considera diabético a un individuo que tenga 126
mg/dl de glucemia en ayunas en al menos dos determinaciones
separadas en el tiempo.
En las variables cuantitativas, a medida que llevamos el punto
de corte que define enfermedad a niveles más “enfermos”,
0 100
seremos más específicos pero menos sensibles. Por el contrario, 1-E
si llevamos el punto de corte a niveles más “sanos”, seremos
más sensibles y menos específicos. Así, podemos afirmar que Figura 2. Comparación de la validez global de varios tests mediante sus curvas ROC.
para las variables cuantitativas la S y la E son inversamente pro-
porcionales: al aumentar la S disminuye la E, y viceversa.
5.3. Test de tamizaje y test de confirmación
Punto de corte más “Enfermo” → ↑ E y ↓ S
Punto de corte más “Sano” → ↑ S y ↓ E
Test de tamizaje
En muchas ocasiones, el proceso diagnóstico de una enferme-
Ejemplo: si en lugar de utilizar un nivel de glucemia de 126 mg/ dad se inicia realizando un test de tamizaje (o cribado pobla-
dl para definir diabetes, llevamos el punto de corte a un nivel cional). El objetivo de un test de tamizaje es doble: detectar
más “enfermo” (p. ej., a 150 mg/dl), el nuevo punto de corte casos precoces (presintomáticos) de enfermedad, y de manera
será más específico (habrá menos número de FP, ya que casi más importante descartar a los sujetos sanos (que sacan nega-
todos los pacientes con glucemia >150 mg/dl serán de verdad tivo en el test). Por tanto, los tests de tamizaje deben ser muy
diabéticos –VP–) pero menos sensible (habrá más número de sensibles; los pacientes que den negativo en el test sabremos
FN, ya que muchos pacientes diabéticos tienen glucemias me- que están sanos, y a los pacientes que den positivo se aplicará
nores a 150 mg/dl y no vamos a ser capaces de diagnosticarlos). luego un test más específico para confirmar la enfermedad.
Las curvas ROC muestran el nivel de S y de E que obtenemos La característica más importante de los tests de tamizaje es
con cada posible punto de corte de la variable cuantitativa, lo que deben tener un alto VPP en la población donde se apli-
que nos permite escoger el mejor punto de corte (aquel con quen. Si un test de tamizaje se aplica en una población de muy
una mejor relación entre sensibilidad y especificidad). Gráfica- baja prevalencia de enfermedad, la mayoría de sujetos que den
mente se representan poniendo la S en el eje de ordenadas, y positivo en el test serán realmente FP; nos veremos obligados a
la TFP (1 – E) en el eje de abscisas. El mejor punto de corte es realizar en balde muchos tests diagnósticos de confirmación, lo
aquel que corta la bisectriz de la curva ROC. cual supondrá un coste económico inasumible.
El área bajo la curva de las curvas ROC representa el grado Así, no todas las enfermedades son susceptibles de tamizaje,
de validez global del test. Cuando comparamos varios tests sino que se deben cumplir una serie de requisitos para que éste
diagnósticos, será mejor aquel cuya área bajo la curva ROC sea se pueda instaurar:
mayor (el vértice de la curva estará situado más cerca del ángulo
superior izquierdo).

31
Manual ENARM · Estadística y Epidemiología

Criterios de la enfermedad Test de confirmación


- Enfermedad frecuente en la población estudiada. Los tests que se utilizan para confirmar la presencia de enferme-
- Enfermedad grave que no debe pasar desapercibida (si no se dad deben ser muy específicos (para que los sujetos positivos
diagnostica a tiempo empeora el pronóstico). tengan muchas probabilidades de ser realmente enfermos).
- La fase presintomática no debe ser corta. Las principales circunstancias en las que es importante utilizar
- Se debe conocer la historia natural de la enfermedad. tests de confirmación para diagnosticar de forma definitiva una
- La enfermedad debe tener un tratamiento más eficaz si se enfermedad son:
aplica en fase presintomática que si se aplica en fase sinto-
mática. - Enfermedades graves pero sin tratamiento eficaz.
- Los falsos positivos pueden suponer un trauma emocional.
- Tratar los falsos positivos puede tener graves consecuencias.
Criterios del test - Enfermedades de prevalencia muy baja.
- Fácil de realizar.
- Inocuo.
- De coste razonable (pero no tiene por qué ser menos costoso
que tratar un caso de la enfermedad).
- Buenos valores de validez (primando la S sobre la E) y repro-
ducibilidad.
- Aceptable y visto como necesario por la comunidad.

32
Tema 6
Medidas en epidemiología

6.1. Medidas de frecuencia de una enfermedad n.º de casos en un momento puntual


Prevalencia =
población
Prevalencia
Es la proporción de individuos de una población que padecen n.º de casos nuevos a lo largo de un periodo de tiempo
una determinada enfermedad en un momento dado. IA =
población susceptible de enfermar al inicio del periodo
Es muy útil para valorar la extensión de enfermedades cróni-
cas. Sin embargo, como sólo se evalúa un momento concreto y n.º de casos nuevos a lo largo de un periodo de tiempo
no un periodo de tiempo, no es útil para el estudio enfermeda- DI =
des agudas (las enfermedades agudas aparecen y desaparecen, t de observación de cada individuo susceptible de enfermar
de modo que al estudiar un momento del tiempo concreto es
probable no encontrar la enfermedad).
Tabla 1. Medidas de frecuencia de una enfermedad.
Si se desea estimar la prevalencia de una enfermedad, lo más
eficiente es diseñar para ello un estudio transversal. Sin em-
bargo, en los estudios longitudinales se podría también deter- 6.2. Medidas de fuerza de asociación (medidas
minar la prevalencia en cualquier momento dado. de efecto)
La prevalencia de una enfermedad aumenta en las siguientes
circunstancias:
Todas ellas son razones que se calculan mediante el cociente
- Aumento de la incidencia de la enfermedad (aumento de entre el riesgo que presentan los sujetos expuestos a un deter-
casos nuevos). minado factor (de riesgo o protector), y el riesgo que presentan
- Aumento de duración de la enfermedad (si disminuye su mor- los no expuestos.
talidad).
Así, miden cuántas veces es más frecuente la enfermedad
- Descenso de la tasa de curación de la enfermedad.
en el grupo expuesto respecto al no expuesto. Miden pues la
- Mejora de los métodos diagnósticos de una enfermedad (se
“fuerza de asociación” entre un factor causal y su efecto.
descubrirán más casos).
- Inmigración de casos enfermos o emigración de sujetos sanos. Su resultado oscila entre 0 e infinito (rango), y no tienen uni-
dades:
Incidencia (incidencia acumulada) (IA) - Si el resultado es <1:
El factor estudiado es un factor protector.
Es la proporción de casos nuevos de una enfermedad que - Si el resultado es >1:
aparecen en una población en un determinado periodo de El factor estudiado es un factor de riesgo.
tiempo, con respecto al total de la población que es suscep- - Si el resultado es = 1:
tible de enfermar. Por ejemplo, si se desea medir la incidencia No existe relación causal entre el factor y la enfermedad (no
de una enfermedad crónica, habrá que calcular la proporción es factor de riesgo ni de protección).
de casos nuevos respecto de los sujetos que no tengan dicha
enfermedad (los que ya la tienen no son susceptibles de volver
a enfermar). Cuando se extrapola el resultado obtenido a una población
a partir de una muestra (estadística inferencial), el intervalo de
Indica la probabilidad que tiene un sujeto sano de enfermar confianza (IC) obtenido informa sobre la significación estadís-
a lo largo del periodo de tiempo que se haya tenido en cuenta tica del resultado. El valor de la medida de asociación no tiene
para el cálculo de la incidencia (riesgo individual de enfermar). por qué estar en el centro del IC, ya que puede que existan más
Para calcularla son necesarios estudios longitudinales prospec- probabilidades de que el riesgo sea mayor o menor que ese
tivos, ya que necesitamos un periodo de seguimiento que vaya valor que hemos obtenido, que viceversa.
hacia el futuro para cuantificar los casos nuevos que van apa-
reciendo.
Diseño de superioridad
- Si el IC incluye el 1, no es estadísticamente significativo.
Densidad de incidencia (DI) - Si el IC no incluye el 1, es estadísticamente significativo.
Es la velocidad con la que se propaga una enfermedad en una
población, e indica el número de casos nuevos que aparecen En el caso de que el riesgo del grupo expuesto y no expuesto
por unidad de tiempo. El tiempo que se utiliza como unidad fuera el mismo, el cociente entre esos riesgos sería = 1, así que
de medida es la suma del tiempo que ha estado expuesto a la si el “1” está incluido en el intervalo de confianza, significará
enfermedad cada individuo hasta que la contrae: suma de los que existen probabilidades de que el factor estudiado sea tanto
tiempos de observación. un factor protector (“parte” del intervalo de confianza que sea
En el momento que un individuo enferma, si ya no puede volver <1) como un factor de riesgo (“parte” del intervalo de confianza
a enfermar finaliza su tiempo de observación. Si un individuo que sea >1). El 1 es el “valor de no significación”.
no enferma a lo largo de todo el periodo de seguimiento, su
tiempo de observación será lo que dure dicho periodo.
Diseño de no inferioridad
Para calcularla también son necesarios estudios longitudina-
Para poder establecer que una intervención es no inferior a
les prospectivos.
otra, el IC para la intervención experimental debe encontrarse

33
Manual ENARM · Estadística y Epidemiología

totalmente por debajo de 1,2 (menos de un 20 % de riesgo Riesgo relativo (RR)


adicional respecto al fármaco control), si el límite de no inferio- Es la medida que se utiliza cuando disponemos de incidencias
ridad (delta) se establece en el 20 %. acumuladas. Como requiere del cálculo de incidencias, sólo
se podrá calcular en estudios que presenten un seguimiento
Diseño de equivalencia terapéutica prospectivo: estudio de cohortes, ensayo clínico, etc. Es la me-
dida de efecto que mejor estima el riesgo real.
Para poder establecer que dos tratamientos son equivalentes
terapéuticos entre sí, el IC de cualquiera respecto al otro debe
encontrarse delimitado entre 0,8 y 1,2 (si hemos establecido Odds ratio o razón de desventaja (OR)
unos límites del 20 %)
Es la medida que se utiliza en los estudios con un seguimiento
retrospectivo (estudio de casos y controles), en los cuales no
podemos calcular incidencias, sino las prevalencias del factor
A favor del A favor del
tratamiento tratamiento de riesgo en el grupo enfermo y en el grupo sano.
experimental control Es peor estimador del riesgo real que el riesgo relativo y tiende
a sobreestimar la fuerza de asociación. Para que su valor
Estudios de
Tratamiento experimental estime bien el RR, los controles y los casos deben provenir de la
superior misma población, y la incidencia de la enfermedad debe ser
superioridad
<10 % (esto es, en enfermedades poco frecuentes, se aproxima
bastante al RR).
Estudios de Tratamientos
equivalencia
terapéutica
equivalentes Razón de prevalencia o de proporciones (RP)
Es la medida que se utiliza en los estudios sin seguimiento
(estudios transversales, etc.), en los cuales lo único que pode-
Estudios de Tratamiento experimental mos calcular es la prevalencia en un momento puntual de la
no inferioridad no inferior
enfermedad en el grupo de expuestos y en el de sanos.
Su cálculo matemático es idéntico al del RR, pero es el peor
RR 0,8 1 1,2 estimador del riesgo real por el diseño de los estudios a partir
de los que se calcula (que no tienen seguimiento, por lo que
Figura 1. Interpretación del IC de las medidas de fuerza de asociación. nunca pueden demostrar causalidad).

Según qué medida de frecuencia de la enfermedad (del “riesgo” (Ver tabla 2)


de enfermar) estemos utilizando, usaremos una u otra medida
de asociación:

ENFERMOS SANOS

FACTOR a b
PRESENTE
FACTOR c d
AUSENTE

IA expuestos (Ie) a / (a + b)
RR = =
IA en no expuestos (Io) c / (c + d)

prevalencia del factor en enfermos a / (a + c)


“Odds” del grupo enfermo prevalencia de no tener factor en enfermos c / (a + c) a·d
OR = = = =
“Odds” del grupo sano prevalencia del factor en sanos b / (b + d) b·c
prevalencia de no tener factor en sanos d / (b + d)

prevalencia de enfermedad en expuestos a / (a+b)


RP = =
prevalencia de enfermedad en no expuestos c / (c+d)

Tabla 2. Medidas de fuerza de asociación.

34
Tema 6 · Medidas en epidemiología

6.3. Modelos de causalidad / Modelos causales Para que se establezca una relación de causalidad se deben
cumplir varios de los siguientes criterios (no hace falta que se
cumplan todos):
Los modelos de causalidad más relevantes son:
- Modelo determinista o unicausal.
Define la causalidad como una conexión perfectamente pre- Criterios de validez interna
decible, constante, única y recíproca entre la causa y el efecto. - Secuencia temporal.
Según este modelo la causa es necesaria y suficiente para pro- La causa debe preceder al efecto. Es el único criterio de cau-
ducir el efecto. salidad imprescindible.
- Modelo multicausal. - Fuerza de asociación.
Defiende la existencia de pluralidad de causas y multiplicidad A mayor magnitud de la medida de fuerza de asociación,
de efectos, negando la existencia de la especificidad de la mayor es la probabilidad de que exista una relación causal.
causa y del efecto. - Efecto dosis-respuesta (gradiente biológico).
- Modelo determinista modificado (Rothman). A mayor dosis o tiempo de exposición al factor causal, mayor
Mantiene la teoría determinista, pero defiende la multicau- es el riesgo de enfermar.
salidad y rechaza el concepto de causa necesaria y suficiente,
redefiniéndolos: Criterios de coherencia científica
• Causa suficiente. - Consistencia.
Aquella que inevitablemente produce un efecto. No es un Los resultados de un estudio que sugiera causalidad deben
factor único, sino un conjunto de factores o causas contri- ser reproducibles por otros investigadores y arrojar resultados
buyentes. similares.
• Causa contribuyente. - Coherencia.
Cada factor componente de una causa suficiente. Los resultados de los estudios que traten de establecer la re-
• Causa necesaria. lación causal entre un factor y un efecto deben ser similares
Aquella que debe estar inevitablemente presente para que entre sí.
se produzca el efecto. - Plausibilidad biológica.
- Modelo probabilístico. Existencia de un mecanismo fisiopatológico conocido que ex-
Preconiza el empleo de la teoría de probabilidades y las téc- plique la posible relación causal.
nicas estadísticas para estimar la magnitud de las relaciones - Especificidad de asociación.
causales. Si la posible causa conduce a un único efecto, y viceversa, el
efecto sólo parece estar causado por un único factor, la vero-
similitud de la relación causal aumenta.
6.4. Criterios de causalidad de Bradford Hill - Analogía.
Factores causales similares al estudiado producen efectos similares.
- Demostración experimental.
El hecho de que exista una determinada fuerza de asociación
Existencia de asociación entre el factor y el efecto en estudios
entre un factor y una enfermedad NO implica necesariamente
experimentales. Es el criterio de causalidad más potente.
que dicho factor sea un factor causal de dicha enfermedad.

No son criterios de causalidad


- La existencia de asociación estadísticamente significativa (p
<0,05).
- La respuesta a un tratamiento concreto.

6.5. Medidas de impacto

Cuantifican cuál es el impacto de una medida preventiva al apli-


carla en una población (al suprimir un determinado factor de
riesgo, o al implementar un determinado factor protector). Uti-
lizan incidencias acumuladas, por lo que se calculan sólo en
estudios con seguimiento prospectivo (estudio de cohortes,
ensayos clínicos, etc.).
En el cálculo de todas ellas existe una resta entre la incidencia
en expuestos y no expuestos. Por tanto, el “valor de no sig-
nificación” (aquel que indica que el riesgo en expuestos y no
expuestos es el mismo), es el “0”. En estadística inferencial, y
para los estudios de superioridad:
- Si el IC incluye el 0, no es estadísticamente significativo.
- Si el IC no incluye el 0, es estadísticamente significativo.

Medidas de impacto absolutas


Indican el beneficio absoluto (número de casos evitados por
cada 100 personas en riesgo) que se obtiene al retirar un fac-
Figura 2. Sir Austin Bradford Hill (1897-1991).

35
Manual ENARM · Estadística y Epidemiología

tor de riesgo o implementar un factor protector totalmente en útiles en Epidemiología Clínica (al sernos un indicador del
una muestra o población en riesgo. Por lo tanto, son medidas porcentaje de riesgo de enfermar que evitamos en cada sujeto
útiles en Salud Pública (al permitirnos calcular, si conocemos en riesgo).
el tamaño de una población, el número total de casos que evi-
taríamos en ella).
Fracción atribuible o fracción etiológica de riesgo (FA, FER)
Medida de impacto relativa utilizada para factores de riesgo.
Riesgo atribuible, exceso de riesgo o diferencia de inci- Es la proporción de casos nuevos entre los expuestos que es
dencias (RA, ER) atribuible a la exposición.
Medida de impacto absoluta utilizada para factores de riesgo. In-
dica el exceso de riesgo asociado a la exposición, y que podría evi-
FA = (Ie − Io) / Ie
tarse si se eliminara ésta (número de casos evitados por cada 100
pacientes con el factor de riesgo a los que les quitas dicho factor).
Ejemplo: FA = 40 % significa que de cada 100 casos de enfer-
medad que aparecen en un grupo de expuestos, 40 se deben a
RA = Ie − Io
esa exposición (60 se deberán a otras causas). Así, si un indivi-
duo expuesto elimina su factor de riesgo (p. ej., deja de fumar)
Ejemplo: RA = 6 % significa que por cada 100 expuestos hay su riesgo de enfermar disminuirá un 40 %.
seis casos más de enfermedad que por cada 100 no expuestos. El riesgo atribuible brinda cuántos casos se deben a un solo
Si elimináramos el factor de riesgo en un grupo de expuestos, factor, mientras que la fracción atribuible nos da el porcentaje.
evitaríamos por cada 100 expuestos esos seis casos de más.

Reducción relativa de riesgo (RRR)


Reducción absoluta de riesgo (RAR)
Medida de impacto relativa utilizada para factores de protec-
Medida de impacto absoluta utilizada para factores de protec- ción. Es la proporción de casos nuevos, entre los sujetos que
ción. Indica la reducción en la incidencia de enfermedad que no tienen el factor protector, que es atribuible a la ausencia de
conseguiríamos al implementar un factor protector en un grupo la protección que dicho factor confiere.
en riesgo (número de casos evitados por cada 100 pacientes
no protegidos, a los que se les proporciona el factor protector).
RRR = (Io − Ie) / Io = 1 − RR

RAR = Io – Ie
Ejemplo: RRR = 35 % significa que de cada 100 casos de enfer-
medad que aparecen en un grupo sin el factor protector (p. ej.,
Ejemplo: RAR = 5 % significa que por cada 100 personas no no vacunados), 35 se deben a no tener el factor protector. Así,
protegidas hay cinco casos más de enfermedad que por cada si un individuo adquiere el factor protector (p. ej., se vacuna) su
100 personas con el factor de protección. Si a las personas no riesgo de enfermar disminuirá un 35 %.
protegidas les proporcionáramos el factor de protección, evita-
ríamos esos cinco casos que tienen de más.
Ejercicio de integración
Número necesario de pacientes a tratar (NNT)
Es el número de pacientes que se debe tratar con un factor pro- En la revista JAMA 2000;283:1295-1302 se publicó el artículo
tector para prevenir un evento. Se obtiene a partir del inverso cuyo título es: Effects of Controlled-Release Metoprolol
de la RAR: on Total Mortality, Hospitalizations, and Well-being in
Patients With Heart Failure (Efecto del metoprolol de li-
NNT = 100 / RAR (expresando el RAR en %) beración prolongada en la mortalidad, hospitalizaciones
y mejoría de los síntomas en los pacientes con falla car-
diaca). El objetivo del estudio fue valorar el efecto del succinato
Se debe redondear al entero superior. Al igual que para el resto de metoprolol de liberación prolongada sobre la mortalidad,
de medidas de impacto, el “0” contenido en el intervalo de número de hospitalizaciones, síntomas y calidad de vida.
confianza indica no significación estadística.
En la tabla 3 (ver en la página siguiente) exponemos los
Al igual que podemos calcular el número de pacientes que hay resultados obtenidos.
que tratar con un factor protector para prevenir un evento,
Podemos observar que en el grupo de intervención metoprolol
usando para ello la RAR, también podemos calcular el número
CR/XL, de 1990 pacientes fallecieron 641, comparado con 767
de pacientes que hay que “dañar” con un factor de riesgo para
de 2001 del grupo placebo, por lo cual para obtener la RRR
provocar un caso de enfermedad (NNH: número necesario de
(Reducción de riesgo relativo), primero dividimos la incidencia
pacientes a dañar), usando para ello el RA:
de expuestos (641/1990=0.322) entre la incidencia de los ob-
servados (767/2001=0.383). Así obtenemos el riesgo relativo
NNH = 100 / RA (expresando el RA en %) (RR): 0.322/0.383=0.84. A continuación restamos 1 – el RR (1
representa que no hay ninguna reducción), de lo que se obtiene
1 - 0.84 = 0.16 (16 % de reducción del riesgo relativo).
Medidas de impacto relativas
Después podríamos obtener la RAR (Reducción absoluta del
Indican el beneficio relativo (porcentaje de casos evitados del riesgo). Para esto se restan la incidencia de los expuestos y la
total de casos que padece una población en riesgo) que se incidencia de los observados: 0.322 - 0.383= –0.061, lo que
obtiene al retirar un factor de riesgo o implementar un factor indica un 6 % de reducción absoluta del riesgo entre los ex-
protector en una población en riesgo. Por lo tanto, son medidas puestos al tratamiento frente a los que recibieron placebo.

36
Tema 6 · Medidas en epidemiología

GRUPO REDUCCIÓN
GRUPO,
DESENLACES METOPROLOL CR/XL, DE RIESGO %
NÚM. DE PACIENTES TOTAL
COMBINADOS NÚM. DE PACIENTES (95 % INTERVALO
(N=2001)
(N=1990) DE CONFIANZA)

Mortalidad total o hospitali-


zación por todas las causas 641 767 1408 19 (10-27)

Mortalidad total o hospita-


lización debida a empeora- 311 439 750 31 (20-40)
miento de falla cardíaca

Muerte o trasplante cardíaco 150 218 368 32 (16-45)

Muerte cardíaca o infarto


139 225 364 39 (25-51)
agudo al miocardio no fatal

Mortalidad total o hospi-


talización de emergencia
318 455 773 32 (21-41)
debido a empeoramiento
de falla cardíaca

Tabla 3. Efecto de Metoprolol CR/XL y placebo en desenlaces combinados*.

*Solo el primer objetivo ocurrido en cada paciente se tomó en cuenta. P> .001 para todas las comparaciones. CR/XL indica liberación controlada/Liberación prolongada
(ing. controlled reléase/ extended release).

Ahora podríamos obtener el número necesario a tratar para


prevenir una muerte: NNT = 100/6 = 16.6. Redondeamos la
cifra y tenemos 17. Es decir, necesitamos tratar a 17 pacientes
con el fármaco estudiado para prevenir que 1 fallezca.

37
Tema 7
Tipos de estudios epidemiológicos
Existen dos grandes clasificaciones de los estudios epidemioló- Generan nuevas hipótesis de trabajo, pero no permiten con-
gicos, la primera en función de sus objetivos y la segunda en firmar hipótesis ya que carecen de un grupo control (principal
función de la intervención del investigador. limitación).

En función de sus objetivos se clasifican en: Estudio transversal (estudio de prevalencia)


1. Estudios descriptivos: describen la frecuencia y caracterís- Es un estudio observacional de base individual (la unidad del
ticas más importantes de un problema de salud: estudio es el individuo) que no presenta seguimiento de los
a. En individuos: pacientes, esto es, que sólo estudia las características que tie-
- Reporte de caso/series de casos. nen los pacientes en el presente: trata de describir o estudiar
- Transversales o de prevalencia. relaciones causales entre exposiciones y problemas de salud
b. En poblaciones: presentes en un momento puntual.
- Ecológicos. Utiliza como medida de fuerza de asociación la razón de pre-
2. Estudios analíticos: establecen una relación entre una de- valencias.
terminada exposición y la aparición de un determinado pro-
blema de salud.
a. Observacionales: Ventajas
- Casos y controles. - Rápido, barato y reproducible, al prescindir del seguimiento de
- Cohortes. los pacientes.
b. Intervención: - Tipo de diseño adecuado para evaluar la validez de una
- Ensayo clínico. prueba diagnóstica.
- Ensayo de campo. - Tipo de diseño más eficiente para estimar la prevalencia de
- Ensayo clínico no aleatorizado. una enfermedad (cualquier estudio puede medir en un mo-
- Estudio de intervención comunitaria. mento puntual la prevalencia de enfermedad, pero el estudio
transversal es el más barato).
En función de la intervención del investigador se clasifican en: - Útil para el estudio de enfermedades crónicas.
- Útil para planificación sanitaria (Salud Pública), ya que
1. Experimentales: permite de forma barata el estudio de enfermedades crónicas,
a. Ensayo clínico. que son las que más recursos sanitarios consumen.
b. Ensayo de campo.
c. Ensayo clínico no aleatorizado.
d. Estudio de intervención comunitaria. Inconvenientes
2. No experimentales/observacionales: - Muy sensible a los sesgos.
a. Reporte de caso/ serie de casos. - No permite valorar la secuencia temporal (ya que estudia
b. Transversal o prevalencia. la presencia de la exposición y la enfermedad en el mismo
c. Ecológico. momento). Por lo tanto, no permite demostrar hipótesis
d. Casos y controles. etiológicas (causalidad), sino que sólo las genera.
e. Cohortes. - No es útil para el estudio de enfermedades agudas (ya que no
permite medir incidencias por no tener seguimiento) ni raras.

7.1. Estudios no experimentales/observacionales Estudio ecológico (estudio de riesgo agregado)


Es un estudio idéntico al estudio transversal, con la única dife-
Se distinguen de los estudios experimentales en la ausencia de rencia de tener una base comunitaria en lugar de tener una
intervención por parte del investigador, que se limita a obser- base individual.
var lo que ocurre en la práctica clínica habitual. Por lo tanto, es útil para generar hipótesis de trabajo pero no
Existen distintos estudios observacionales que se diferencian las demuestra.
por el tipo de seguimiento realizado a los pacientes. Características de una base comunitaria:
- Sin seguimiento (estudios transversales). - Utiliza datos recogidos de grupos de personas (en lugar de
Estudio transversal y estudio ecológico. individuos), formados en general por criterios geográficos
- Con seguimiento (estudios longitudinales). (países, comunidades autónomas, ciudades...).
• Retrospectivo: - Para recopilar los datos, se acude a registros, que son quie-
Estudio de casos y controles. nes proporcionan los datos (esto es, otra persona ha recogido
• Prospectivo: los datos individuales previamente y ha extrapolado los datos
Estudio de cohortes; estudio de tendencias temporales. poblacionales, que son los que utilizaremos).
- Utilizan datos indirectos o secundarios (recogidos por otras
personas).
Reporte de un caso/serie de casos Los datos indirectos son de peor calidad (más riesgo de ses-
Son estudios que describen las características o el manejo clí- gos) que los directos ya que no podemos controlar los crite-
nico realizado en un paciente o grupo de pacientes con un rios o instrumentos de medida utilizados por la persona que
diagnóstico similar. los recogió.

38
Tema 7 · Tipos de estudios epidemiológicos

- Los datos que recogemos son los promedios (se habla de pro- salud que se quiere analizar: un grupo que está expuesto a
medios en lugar de medias o de porcentajes) de la característica un factor de riesgo o protector, y un grupo no expuesto. Se
estudiada en cada uno de los grupos de personas estudiado. analiza la incidencia de enfermedad que aparece en cada uno
de esos dos grupos a lo largo del periodo de seguimiento.
Estudio de casos y controles - Utiliza como medida de fuerza de asociación el RR.
Es un estudio observacional de base individual y con segui- - Sus ventajas e inconvenientes están recogidos en la tabla 1.
miento retrospectivo (desde el presente hacia el pasado).
Dicho seguimiento no es un seguimiento real que implique ver
a los pacientes varias veces (un estudio de casos y controles CASOS Y CONTROLES COHORTES
sólo requiere ver a cada paciente una única vez), sino que es un Seguimiento retrospectivo Seguimiento prospectivo
seguimiento “virtual” que se realiza utilizando la memoria del
paciente para que nos cuente datos de su pasado. Calculan prevalencias Calculan incidencias
El seguimiento retrospectivo, por lo tanto, está sujeto a las limi- de exposición de enfermedad
taciones de la memoria humana y es peor (más sujeto a sesgos)
que el seguimiento prospectivo. OR: sobreestima la fuerza
RR: mejor estimador
En un estudio de casos y controles se selecciona un grupo de de asociación, salvo en
de la asociación
sujetos enfermos (casos) y un grupo de sujetos sanos (con- enfermedades raras
troles) respecto al problema de salud que se quiere analizar, y
se evalúa la proporción de sujetos de cada uno de los grupos Baratos, rápidos, reproducibles Caros, lentos, poco reproducibles
que estaba expuesta en el pasado a un supuesto factor de
riesgo o protector. Pueden escogerse varios controles para Peores para demostrar hipótesis Mejores para demostrar hipótesis
cada caso.
Más sensible a sesgos Menos sensible a sesgos
Para evitar sesgos de memoria es importante ser igual de ex-
haustivo en la anamnesis de los casos y de los controles.
- Utiliza como medida de fuerza de asociación la odds ratio, Útiles para estudiar Útiles para estudiar
que sobreestima el riesgo con respecto al RR salvo en el es- enfermedades raras o con exposiciones raras y para
tudio de enfermedades raras. largo periodo de latencia enfermedades agudas
- Sus ventajas e inconvenientes están recogidos en la tabla 1.
Permiten estudiar multi- Permiten estudiar multi-
Estudio de casos y controles anidado en una cohorte causalidad (varias causas efectividad (varios efectos
Es un caso particular del estudio de casos y controles que se de una enfermedad) de la misma exposición)
utiliza cuando en el momento actual no existe un número
de casos suficiente para realizar el estudio. Esto suele ocurrir Dificultad: Dificultad:
cuando se estudian enfermedades agudas y epidémicas, en las establecer el grupo control* sensible a pérdidas**
que los casos van apareciendo poco a poco a lo largo de un
periodo de tiempo. *La principal dificultad de los estudios de casos y controles es seleccionar el
Este estudio consiste en realizar un seguimiento prospectivo de grupo control, ya que óptimamente debe tener las mismas características que
el grupo de casos para minimizar el riesgo de aparición de sesgos de selección
una cohorte de sujetos (de la población diana de nuestro estu-
o de sesgos por factor de confusión. Para conseguirlo se emplean técnicas de
dio), e ir seleccionando los casos a medida que aparecen hasta apareamiento [ver Tema 8.2. Errores sistemáticos (sesgos)].
alcanzar el tamaño muestral deseado. Cada vez que aparece **Los estudios de cohortes (y cualquier estudio prospectivo) son sensibles a
un caso, se seleccionan de manera aleatoria entre los sujetos la aparición de pérdidas, ya que requieren ver a los pacientes en el futuro y eso
sanos de la cohorte el número de controles que se haya previsto puede no ser posible (fallecimientos, cambio de domicilio, incomparecencia del
para cada caso, y en ese momento se recogen los datos de paciente…). En cambio, los estudios de casos y controles sólo requieren ver a
forma retrospectiva (se pregunta al caso y a los controles por cada paciente una vez, por lo que no pueden tener pérdidas.
su pasado).
Tabla 1. Diferencias entre los estudios de casos y controles y los estudios de
Así, sus características son idénticas a las del estudio de casos y cohortes.
controles convencional, y sólo se diferencia en que los pacientes
se reclutan poco a poco en lugar de todos a la vez.
Los estudios de casos y controles realizados utilizando los datos Estudio de cohortes históricas (cohortes retrospectivo)
de los registros poblacionales de enfermedades suelen con- Es un estudio de cohortes en el que el seguimiento de los pa-
siderarse anidados, dado que los registros poblacionales suelen cientes se realiza desde el pasado hacia el presente, en lugar
elaborarse de forma prospectiva. de hacerlo desde el presente hacia el futuro. Fijaos que la direc-
ción del seguimiento sigue siendo prospectiva.
Estudio de cohortes El nombre “estudio de cohortes retrospectivo” es por lo tanto
desafortunado ya que el seguimiento no es retrospectivo sino
Es un estudio observacional de base individual y con segui- prospectivo. Es mejor utilizar el término estudio de cohortes
miento prospectivo (desde el presente hacia el futuro). Dicho históricas, aunque los dos términos son correctos.
seguimiento es real, y consiste en ver al paciente hoy y volverle
a ver en sucesivas ocasiones en el futuro hasta que finalice el El seguimiento se realiza de modo indirecto a través de la his-
periodo de seguimiento. Es el mejor estudio observacional toria clínica del paciente, comenzando por la primera página
para demostrar hipótesis. (pasado) y acabando en la última (presente).
En un estudio de cohortes se sigue prospectivamente a dos Sus características son idénticas a las del estudio de cohortes
grupos de individuos sanos con respecto al problema de convencional, excepto en los siguientes aspectos:

39
Manual ENARM · Estadística y Epidemiología

Pasado Presente

factor de riesgo / protector enfermos (casos)


Casos y controles
factor de riesgo / protector sanos (controles)

Presente Futuro

expuestos incidencia de enfermedad


Cohortes
no expuestos incidencia de enfermedad

Figura 1. Estudio de casos y controles y estudio de cohortes.

- Ventaja: Se consideran mejores estudio para demostrar hipótesis que los


Al no requerir de un seguimiento real de pacientes, es más cuasi-experimentales.
barato, rápido y reproducible. Para poder llevar a cabo cualquier estudio experimental, en Mé-
- Inconveniente: xico es necesario obtener autorización por parte de la Comi-
Utiliza datos indirectos (recogidos en la historia por terceras sión Federal para la Protección Contra Riesgos Sanitarios
personas), por lo que es más sensible a los sesgos. (COFEPRIS), así como un dictamen favorable del Comité Ético
de Investigación Clínica (CEIC) de cada uno de los Centros
(Ver figura 1) médicos que participen en el estudio.
- Ensayo de campo.
Estudio de series o tendencias temporales Estudio experimental cuyo objetivo es la prevención de una
enfermedad mediante la aplicación de una medida preventiva
Se puede definir como un estudio de cohortes pero que tiene (p. ej., una vacuna) a un grupo de sujetos sanos, cuyos resul-
una base comunitaria (aplicándose por tanto las característi- tados se compararán con los de otro grupo de sujetos sanos a
cas de la base comunitaria). Así, es también similar al estudio los que no se aplicó la medida preventiva.
ecológico, pero con un seguimiento prospectivo. - Ensayo clínico.
Son grandes registros con seguimientos prospectivos largos en Estudio experimental cuyo objetivo es el tratamiento de una
los que se trata de establecer cómo evoluciona un problema de enfermedad mediante la aplicación de una intervención (p. ej.,
salud en una o varias poblaciones a lo largo del tiempo. un fármaco) a un grupo de sujetos enfermos, cuyos resulta-
En el examen nos lo suelen mostrar relacionado a la evolución dos se compararán con los de otro grupo de enfermos a los
temporal de problemas medioambientales más que de enfer- que no se aplicó el tratamiento.
medades. Ejemplos: evolución temporal de los niveles de con- La declaración CONSORT (Consolidated Standards of Reporting
taminación de un río o de un mar. Trials) tiene como objetivo mejorar la redacción de artículos sobre
ensayos clínicos aleatorizados. Establece una serie de normas bá-
sicas de redacción que los autores deben cumplir, y establece una
7.2. Estudios experimentales lista de puntos que los lectores deben chequear para comprobar
que los datos importantes están incluidos en el artículo, favore-
ciendo así la comprensión y capacidad crítica de los lectores.
Se distinguen de los estudios no experimentales / observaciona- La declaración STROBE (Strengthening the Reporting of Ob-
les en la presencia de intervención por parte del investigador: servational studies in Epidemiology) tiene un objetivo similar a
el investigador introduce de forma directa una nueva medida la CONSORT, pero para estudios observacionales (transversa-
diagnóstica, terapéutica o preventiva en una determinada les, casos y controles y cohortes).
muestra de individuos.
Son los mejores estudios para demostrar hipótesis, y son Estudios “cuasi-experimentales”
menos sensibles a los sesgos que los estudios observaciona-
La asignación de la intervención se realiza por un método no
les. Por el contrario, todos requieren un seguimiento prospec-
aleatorio: los grupos que van a participar en el estudio no se
tivo y son caros, lentos y poco reproducibles. Además, están
forman mediante el azar. Si sólo hay un grupo de pacientes
sujetos a problemas éticos (ya que se interviene activamente
en un estudio con intervención, siempre será cuasi-experimen-
sobre la salud de las personas).
tal, ya que la intervención se realizará en dicho grupo y el azar
Los tipos de estudios experimentales que se diferencian por el no podrá decidir nada.
modo de asignación de la intervención:
Por ejemplo, si los grupos que van a participar ya existen de
manera natural (p. ej., dos localidades) y se elige cuál de los dos
Estudios “experimentales” grupos recibirá la intervención mediante el azar (tirando una
moneda al aire) no se está aleatorizando, ya que la aleatoriza-
La asignación de intervención o no intervención a cada indivi-
ción implica formar los grupos mediante el azar.
duo se realiza de manera aleatoria, de modo que es el azar
el que forma los distintos grupos (grupo intervención/grupo - Estudio de intervención comunitaria.
no intervención) que se van a comparar entre sí. Son estudios con base comunitaria, y en general para valorar
medidas preventivas. Casi siempre son cuasi-experimentales

40
Tema 7 · Tipos de estudios epidemiológicos

Más rápidos, baratos, reproducibles


Peores para demostrar hipótesis
Más sesgos
Comunicación de un caso / serie de casos

Base comunitaria Estudio ecológico


Sin seguimiento
Observacionales Base individual Estudio transversal
No experimentales C
Seguimiento retrospectivo Estudio de casos y controles
o
e ñ

Base comunitaria Series temporales


s

Seguimiento prospectivo
d i

Base individual Estudio de cohortes

Base comunitaria Estudio de intervención comunitaria B


o r

Asignación no aleatorizada
(estudios cuasi-experimentales) Ensayo clínico no aleatorizado
Base individual
(estudio antes-después)
e j

Experimentales
Fines preventivos Ensayo de campo
Asignación aleatorizada
M

(estudios experimentales) A
Fines terapéuticos Ensayo clínico

Más lentos, caros, poco reproducibles


Mejores para demostrar hipótesis
Menos sesgos

Figura 2. Tipos de estudios epidemiológicos y nivel de evidencia científica que generan.

(pero podrían ser aleatorizados) ya que, al utilizar una base nivel de evidencia, pero la más utilizada utiliza un esquema ABC
comunitaria, los grupos de estudio suelen estar preformados (siendo mayor la evidencia generada por los estudios de nivel A,
y en esos casos es imposible formarlos mediante el azar. y menor la de nivel C, cuya evidencia se considera inconcluyente
Los estudios de intervención comunitaria son habitualmente y debe confirmarse mediante estudios de mayor calidad).
la alternativa a un ensayo de campo cuando es muy difícil
utilizar una base individual. Por ejemplo, si se realiza un estu-
dio para demostrar si el consumo de agua fluorada previene Niveles de evidencia científica ABC
la aparición de caries, aleatorizar individuos y que unos tomen - Nivel de evidencia A.
agua fluorada y otros agua normal puede ser muy difícil. En • Metaanálisis de estudios experimentales aleatorizados.
estos casos es más sencillo aplicar la intervención sobre co- • Varios estudios experimentales aleatorizados.
munidades enteras (p. ej., que a una determinada localidad - Nivel de evidencia B.
se añada flúor al suministro de agua y a otra no). • Un único estudio experimental aleatorizado.
- Ensayo clínico no aleatorizado. • Estudios cuasi-experimentales.
Igual que un ensayo clínico, sólo que la asignación de la inter- • Estudios de cohortes grandes.
vención no es aleatoria. También se denomina estudio antes-
- Nivel de evidencia C.
después, aunque este término se suele reservar para estudios
• Estudios observacionales (salvo cohortes).
de intervención en un único grupo de pacientes (con lo que
• Consenso de expertos.
no hay posibilidad de aleatorización) en los que se compara
la situación basal con la situación tras la administración de un
tratamiento (datos apareados). Metaanálisis
El metaanálisis es una revisión sistemática de la literatura en
(Ver figura 2) la que se combinan estadísticamente los resultados de todos
los estudios incluidos:
- Revisión sistemática.
7.3. Niveles de evidencia científica La búsqueda bibliográfica se realiza en función de unos crite-
rios de selección concretos (inclusión y exclusión), de modo
que todo estudio que cumpla con esos criterios deberá ser in-
Actualmente, las sociedades científicas médicas basan sus re- cluido en el metaanálisis. Las revisiones narrativas, sin em-
comendaciones en los resultados de los estudios epidemioló- bargo, incluyen los artículos que elija libremente el investigador.
gicos disponibles sobre cada materia: Medicina Basada en la
Evidencia, que consiste en la integración de la mejor evidencia - Combinación estadística de resultados.
científica disponible sobre un tema con la maestría clínica in- Los resultados de los pacientes que participaron en cada estu-
dividual. dio individual se tratan como si todos los pacientes hubieran
participado en un único estudio. Así, se obtiene un resultado
En función de la calidad de diseño de cada tipo de estudio, combinado que procede de un tamaño muestral inmenso (la
éste es capaz de generar un determinado nivel de eviden- suma de tamaños muestrales de cada estudio individual), con
cia científica. Existen numerosas escalas de cuantificación del lo que se consigue:

41
Manual ENARM · Estadística y Epidemiología

• Mayor precisión. en la variabilidad intra-estudio y en el tamaño muestral. El mo-


Intervalos de confianza más pequeños. delo de efectos fijos se utiliza por tanto cuanto los estudios
• Mayor potencia estadística. incluidos son muy parecidos entre sí y con el mismo tipo de
Mayor probabilidad de demostrar la existencia de diferencias pacientes (similar a un ensayo clínico con criterios de selección
de modo estadísticamente significativo, si realmente existen. muy estrictos), lo que le confiere mayor validez interna y una
mayor potencia estadística y precisión en sus resultados.
Los metaanálisis se realizan en situaciones en las que la evi- Por otro lado, el modelo de efectos aleatorios tiene en
dencia científica disponible sobre un tema es inconcluyente, cuenta que los estudios pueden ser variables entre sí (varia-
bien porque los estudios realizados tienen un pequeño tamaño bilidad inter-estudios). De este modo, los modelos de efectos
muestral y no han demostrado diferencias significativas (quizá aleatorios son menos potentes, con intervalos de confianza más
por falta de potencia estadística), o bien porque los resultados amplios para el efecto combinado, y al no ponderarse por ta-
de los distintos estudios arrojen conclusiones discordantes. maño muestral, pueden dar excesiva importancia a estudios de
La evidencia generada por los metaanálisis se considera supe- pequeño tamaño.
rior a la de los estudios individuales incluidos, y ocupa el nivel
ABC del estudio incluido que tenga un menor nivel de eviden- Análisis de sensibilidad
cia. Por ejemplo, un metaanálisis de ensayos clínicos tendrá un
Este análisis pretende estudiar la influencia de cada uno de los
nivel de evidencia A, pero si se mezclan ensayos clínicos con
estudios incluidos en la estimación global del efecto y así la es-
estudios de cohortes el nivel de evidencia será B.
tabilidad de la medida final. Consiste en la repetición del metaa-
nálisis tantas veces como estudios se hayan incluido, de forma
que cada vez se omite un estudio combinándose todos los res-
RR (IC 95%) tantes. Si los resultados de los distintos metaanálisis realizados
Estudio 1 son similares, se puede concluir que los resultados son robustos.
Estudio 2 En caso contrario no se tendría un estimador robusto, lo cual
exigiría cierta precaución en la interpretación de los resultados
Estudio 3
o podría ser motivo para generar nuevas hipótesis.
Estudio 4 Este mismo proceso podría repetirse eliminando a un mismo
Estudio 5 tiempo varios estudios (por ejemplo, aquellos de peor calidad
Estudio 6 metodológica, los no publicados, etc.) para determinar su posi-
Resultado agregado
ble influencia en los resultados.
0,25 0,50 0,75 1,00 1,25 1,50 2,00
Sesgo de publicación
A favor del A favor del
fármaco fármaco Es un tipo de sesgo de selección que consiste en no incluir ar-
experimental control tículos que no se hayan publicado (si no los buscamos en sitios
muy concretos nunca vamos a encontrar esos artículos). Dichos
Figura 3. Ejemplo de representación de los resultados de un metaanálisis. Se artículos suelen ser desfavorables para el tratamiento experi-
expone el IC 95 % del resultado de cada estudio individual, y debajo de los mental (simplemente porque los estudios en los que el fármaco
estudios individuales se expone el IC 95 % del resultado agregado (se suele no muestra diferencias significativas no se suelen publicar); por
representar con un rombo, cuyo centro coincide con el centro del IC 95 %). tanto, si existe sesgo de publicación sobreestimaremos el
efecto del fármaco experimental.
Aspectos estadísticos del metaanálisis Existen varios métodos para investigar la presencia de un sesgo
Heterogeneidad y modelos estadísticos de combinación de publicación. El más simple consiste en realizar un análisis
de resultados de sensibilidad para calcular el número de estudios negativos
realizados y no publicados que debería haber para modificar el
Uno de los principales problemas que nos podemos encontrar sentido de una posible conclusión “positiva” del metaanálisis (si
en un metaanálisis es la diferencia entre los estudios incluidos. este número es muy elevado, se considera que la probabilidad
Para determinar el grado de heterogeneidad de los estudios de que el sesgo de publicación haya modificado los resultados
incluidos se utilizan diversos métodos, como los estadísticos de es baja, y se acepta la existencia de las diferencias sugeridas por
heterogeneidad (prueba Q, índice I2) y el gráfico de Galbraith. el metaanálisis).
Cuando encontremos un análisis de heterogeneidad con una
p significativa (<0,05), significará que existe heterogeneidad, También se puede examinar con el método conocido como el
y por tanto lo correcto será aplicar un modelo de efectos alea- gráfico en embudo (Funnel-plot), en el que se distribuyen los
torios. estudios incluidos en el metaanálisis. Se parte del supuesto de
que los estudios con mayor probabilidad de no ser publicados
A la hora de combinar los estudios y obtener el resultado agru- son los que no muestran diferencias (estudios “negativos”),
pado global del metaanálisis, los estudios son ponderados sobre todo si son de pequeño tamaño; si no encontramos en
según el tamaño muestral, la dispersión y la calidad de los mis- nuestro gráfico estudios con esas características, es probable
mos, dando diversos grados de importancia a cada factor en que estemos incurriendo en un sesgo de publicación. Como
los diferentes modelos. El factor principal que nos hace elegir el este gráfico presenta una subjetividad “visual”, en ocasiones
modelo estadístico de combinación de los resultados es el grado se utilizan también pruebas analíticas para verificar el sesgo de
de heterogeneidad de los estudios, existiendo un modelo de publicación, como el test de Begg o el test de Egger.
efectos fijos y uno de efectos aleatorios.
El modelo de efectos fijos se utiliza cuando la heterogeneidad
es baja; no tiene en cuenta la variabilidad entre los estudios (in- (Ver figura 4 en la página siguiente)
ter-estudios), sino que su ponderación se basa principalmente

42
Tema 7 · Tipos de estudios epidemiológicos

explicar todas las mediciones que se van a realizar y el método


0 estadístico por el que se van a analizar los resultados.
Si se extraen conclusiones de un estudio epidemiológico a pos-
teriori (estudios post hoc), dichas conclusiones no servirán
1 para confirmar hipótesis, sino que sólo sirven para generarlas
Error estándar

y se deberán confirmar con nuevos estudios específicamente


diseñados para ello. Por ejemplo: realizar un análisis de subgru-
pos que no estaba planificado inicialmente y observar que un
2 determinado subgrupo se beneficia del fármaco.

2. Reclutamiento (inclusión de sujetos participantes)


3 Una vez definidas las características del estudio, se realiza la
0,1 0,33 0,6 1 3 10 inclusión de los sujetos participantes. Para incluir a un paciente
Efecto en un estudio experimental, deben seguirse por este orden
los siguientes pasos:
A. Criterios de selección.
0
Verificar que el paciente cumpla todos los criterios de in-
clusión y no tenga ningún criterio de exclusión.
B. Consentimiento informado.
1 El paciente debe expresar libremente y por escrito su consen-
Error estándar

timiento para participar en el estudio.


En el caso de que se utilice placebo, los sujetos deben saber
que pueden ser tratados con éste, aunque luego no podrán
2 conocer si están tomando el placebo o el fármaco (enmasca-
ramiento). Además, si se utiliza placebo deben incluirse en el
diseño del estudio “cláusulas de rescate” que permitan pasar
a un sujeto del grupo placebo al grupo de fármaco experi-
3 mental si su evolución clínica empeora claramente y hay datos
0,1 0,33 0,6 1 3 10 provisionales de mayor eficacia con el fármaco experimental.
Efecto C. En estudios experimentales: asignación de intervención.
Una vez se comprueba que el paciente cumple los criterios
Figura 4. Funnel plot. El gráfico representa cada estudio (puntos) incluido en el
metanálisis en función de su tamaño (que es inversamente proporcional al error de selección y firma el consentimiento informado, se le
estándar del resultado, mostrado en el eje de ordenadas: estudios pequeños asigna a un grupo del estudio.
“abajo” y estudios grandes “arriba”) y de la medida del efecto que se obtuvo En los estudios experimentales “puros” esta fase se deno-
(RR, OR, etc., representado en el eje de abscisas). La medida del efecto agre- mina aleatorización. Si la aleatorización ha sido adecuada,
gado del metanálisis suele representarse como una línea vertical punteada. Si la las características de los distintos grupos del estudio serán
distribución de los estudios sigue una forma triangular y simétrica (esquema de superponibles, pero el azar también puede jugar una mala
arriba) a ambos lados de dicha medida de efecto agregado, existen pocas pro- pasada y hacer que la distribución de alguna característica
babilidades de sesgo de publicación, pero si “faltan” estudios en alguna región
sea distinta entre los grupos. Existen distintas técnicas de
del teórico triángulo (esquema de abajo, círculo rojo) es probable la presencia
de un sesgo de publicación. aleatorización:
• Aleatorización simple.
Cada paciente tiene las mismas probabilidades de formar
Metaanálisis acumulado
parte de cada uno de los grupos. El azar podría hacer que
Se define como aquel proceso en el cual se lleva a cabo un el número de pacientes de cada grupo sea distinto.
nuevo metaanálisis cada vez que aparece un nuevo estudio • Aleatorización por bloques.
publicado. No requiere de técnicas estadísticas especiales para Consigue que haya el mismo número de personas en
combinar los estudios. Permite estudiar de forma retrospectiva todos los grupos de estudio. Para ello, se elige un nú-
el momento en el que el efecto de un nuevo tratamiento supera mero, y cada “bloque” (ese número) de pacientes debe
al control. tener el mismo número de pacientes distribuido en cada
Esta forma de presentación de los resultados pone de mani- grupo de tratamiento.
fiesto lo difícil que es para cualquier estudio individual, una • Aleatorización estratificada.
vez se han alcanzado resultados relativamente estables, aportar La estratificación de la muestra en función de una carac-
información adicional. terística que pueda funcionar como factor de confusión
El metaanálisis acumulado sería similar en planteamiento a un o que sea un factor pronóstico importante permitirá su
ensayo clínico secuencial. distribución homogénea en los distintos grupos.

3. Monitorización
7.4. Fases de realización de los estudios Fase de seguimiento de los pacientes, en la que se realizan las
epidemiológicos mediciones previstas en el diseño y se obtienen los resultados.

1. Diseño 4. Análisis de resultados y obtención de conclusiones


Se deben especificar a priori (antes de empezar el estudio) Una vez obtenidos los resultados, se deben analizar siguiendo
todos sus aspectos metodológicos, con un cuidado especial en los siguientes pasos:

43
Manual ENARM · Estadística y Epidemiología

A. Verificar que el diseño sea correcto y no haya sesgos (vali- que sea actualmente de elección. La utilización de placebo se
dez interna). reserva para los casos en los que no hay fármacos con eficacia
Es el paso más importante del análisis de resultados, ya que demostrada, y también se permite para enfermedades que no
la ausencia de validez interna invalidará cualquier resultado sean graves (sin riesgo de secuelas) y en las que exista una alta
obtenido. tasa de respuesta a placebo.
La lectura crítica de un artículo científico deberá, por tanto, Las diferencias entre la fase II y la fase III son las siguientes:
basarse fundamentalmente en analizar los aspectos meto-
- Fase II.
dológicos del estudio (su diseño), plasmados en el apartado
Empleo del tratamiento en un grupo reducido de enfermos
“Material y Métodos” del estudio.
(en general <100) muy seleccionados, esto es, con criterios
B. Confirmar la existencia de significación estadística. de selección estrictos (estudios explicativos).
C. Valorar la magnitud de las diferencias existentes y su rele- Además, suelen utilizar variables resultado “blandas” (deter-
vancia clínica. minaciones de laboratorio, pruebas de imagen…), que aportan
La existencia de diferencias estadísticamente significativas menor relevancia clínica de los resultados, pero al ser en general
entre dos intervenciones no implica que una de ellas sea cuantitativas proporcionan mayor potencia estadística.
mejor que otra. Sólo si la magnitud de dicha diferencia es su- En ocasiones se distingue una primera fase IIa (la que hemos
ficiente, y si implicará beneficios relevantes desde un punto mencionado hasta ahora), y una segunda fase IIb, cuyo ob-
de vista clínico, podremos decir que una intervención es jetivo es probar varias dosis del fármaco para establecer la
“mejor” que otra y, por tanto, establecer una recomenda- relación dosis-respuesta (titulación de dosis) y elegir la dosis
ción al respecto. más adecuada para su empleo en la fase III.
D. Determinar la validez externa. La utilización de criterios de selección estrictos hace que
Los resultados del estudio se podrán generalizar a aquellos la muestra sea muy homogénea (los pacientes se parecerán
subgrupos poblacionales que cumplan los criterios de selec- mucho entre sí), lo cual confiere las siguientes ventajas e in-
ción de los pacientes participantes del estudio. convenientes:
• Ventajas:
- Mayor validez interna.
5. Difusión de los resultados Menor riesgo de sesgos de selección o por factor de confu-
Mediante la publicación del estudio en artículos científicos u sión, al tener los distintos grupos características similares.
otros medios de comunicación. - Resultados más homogéneos.
Como los pacientes son muy parecidos, el fármaco hará lo
mismo en todos ellos obteniendo resultados más precisos
7.5. Fases de desarrollo de un tratamiento (fases (intervalos de confianza más pequeños), con lo que au-
del ensayo clínico) menta la potencia estadística del estudio (necesidad de
menor tamaño muestral).
• Inconvenientes:
Para el desarrollo de un tratamiento, primero se realiza su sínte- - Menor validez externa.
sis química y se realizan estudios con material biológico in vitro. Los resultados serán generalizables sólo a un limitado sec-
Posteriormente se prueba su eficacia y seguridad en animales. tor de la población.
Tras esta fase preclínica, el tratamiento debe testarse en hu-
- Fase III.
manos antes de poder comercializarlo.
Empleo del tratamiento en un grupo amplio de enfermos (en
La fase clínica del desarrollo de un tratamiento incluye estudios general >100) con criterios de selección laxos (estudios
con diseño de ensayo clínico y por eso se suele hablar directa- pragmáticos), lo que va a permitir que la muestra sea similar
mente de “fases del ensayo clínico”; dicha fase clínica consta a a los pacientes que se van a encontrar en la práctica clínica ha-
su vez de las siguientes fases: bitual, y la eficacia demostrada se parecerá a la “efectividad”
que se observará en la población.
Fase I Además, suelen utilizar variables resultado “duras” (varia-
bles clínicas: muerte, infarto, ictus…), que aportan mayor
Es la primera vez que se utiliza el tratamiento en humanos. relevancia clínica de los resultados, pero al ser en general
Consiste en un estudio transversal sobre un único grupo de cualitativas (p. ej., muerte: sí/no) proporcionan menor poten-
sujetos voluntarios, cuyo objetivo es estudiar las propiedades cia estadística. Estas variables clínicas son muchas veces sub-
farmacocinéticas del tratamiento. jetivas (dolor, calidad de vida…), lo cual dificulta su correcta
Como objetivo secundario, se estudia de forma preliminar la determinación; son útiles en este caso las escalas de evalua-
tolerabilidad/toxicidad del fármaco (si su administración pro- ción multidimensionales, que aportan una alta relevancia
dujo efectos adversos a los voluntarios). clínica, pero pueden ser difíciles de interpretar y tener proble-
Habitualmente se realiza sobre voluntarios sanos (que suelen mas de validez para nuestra muestra concreta.
recibir una remuneración económica por participar en el estu- En ocasiones, en vez de utilizar variables duras se utilizan varia-
dio), pero si el tratamiento se prevé que tenga muchos efectos bles resultado blandas pero que han demostrado asociarse de
adversos se realizará con voluntarios enfermos (p. ej., quimio- manera significativa a una determinada variable dura en estu-
terápicos). dios previos (“validadas”): es lo que se llaman variables subro-
gadas o intermedias. Al ser variables en general cuantitativas,
aportarán mayor potencia estadística y por tanto permitirán uti-
Fase II y fase III lizar un menor tamaño muestral en el estudio, pero son siempre
Son las fases que tienen diseño de ensayo clínico. Por lo peores que la utilización de la variable dura en sí misma (más
tanto, su objetivo es valorar la eficacia y seguridad del trata- riesgo de sesgos). Ejemplo: analizar si un nuevo betabloqueante
miento en un grupo de enfermos. Las dos fases pueden tener consigue disminuir la PAD en 10 mmHg (variable subrogada) en
un grupo control y un diseño idéntico. En el caso de tener sujetos hipertensos, lo cual ha demostrado en estudios previos
grupo control, éticamente se debe emplear el fármaco activo aumentar la supervivencia (variable dura).

44
Tema 7 · Tipos de estudios epidemiológicos

Así, los estudios de fase III demuestran si el nuevo tratamiento


va a ser útil para los pacientes desde el punto de vista clínico
FASE POBLACIÓN CARACT. OBJETIVOS
y constituyen la evidencia fundamental del beneficio-riesgo - Caracte-
del medicamento, por lo que son los que permiten que se rísticas
comercialice un fármaco o tratamiento. Voluntarios Diseño farmaco-
La utilización de criterios de selección laxos hace que la muestra I
(sanos) transversal cinéticas
sea muy heterogénea (los pacientes serán muy diferentes entre - Toxicidad
sí), lo cual confiere las siguientes ventajas e inconvenientes: preliminar
• Ventajas:
- Mayor validez externa: los resultados serán generaliza- - Criterios de - IIa: eficacia
bles a un amplio sector de la población (así, cuando se selección y seguridad
comercialice el fármaco una gran parte de la población se estrictos - IIb: titular
podrá beneficiar de él). II Enfermos
-↓n dosis
• Inconvenientes: - Variables
- Menor validez interna: mayor riesgo de sesgos de selec- blandas
ción o por factor de confusión.
- Resultados dishomogéneos: como los pacientes son dis- - Criterios de
tintos entre sí, el efecto del fármaco variará mucho en fun- selección
ción de sus características, obteniendo resultados menos laxos
precisos (intervalos de confianza amplios) y una menor Eficacia y
III Enfermos -↑n
potencia estadística (necesidad de un mayor tamaño seguridad
- Variables
muestral). resultado
duras
Fase IV (fase poscomercialización)
Incluye aquellos estudios realizados con un fármaco tras su co- - Efectividad
Práctica - Nuevas indi-
mercialización, que como hemos visto ocurre tras la publicación
IV clínica caciones
de los estudios en fase III.
habitual - Farmaco-
Tiene fundamentalmente tres objetivos: vigilancia
- Estudio de la efectividad de un fármaco (cuando se utiliza en
la práctica clínica habitual). Tabla 2. Fases del ensayo clínico.
- Búsqueda de nuevas indicaciones.
Para ello, se deberán volver a realizar estudios con diseño aná-
logo a la fase II y fase III. Recuerda que...
- Farmacovigilancia. Los ensayos de fase II brindan un preliminar de la eficacia
Sistema de notificación espontánea de posibles reacciones y los estudios fase III la establecen.
adversas asociadas a un tratamiento por parte del personal
sanitario. Intenta detectar reacciones adversas poco fre-
cuentes (que no se detectaron en los ensayos clínicos reali-
zados por su limitado tamaño muestral) y que sólo se podrán
7.6. Diseños especiales en estudios experimentales
detectar cuando el fármaco se administre a miles de personas
en la práctica clínica habitual.
La notificación espontánea de reacciones adversas la debe rea- Diseño paralelo vs diseño cruzado
lizar cualquier personal sanitario mediante la cumplimentación
El diseño paralelo es el utilizado habitualmente, por el cual un
de una “tarjeta amarilla” que se envía a la Agencia Española
grupo de sujetos recibe un único tratamiento o intervención, y
del Medicamento. Ésta recopila las tarjetas amarillas recibidas
el otro grupo que recibe el otro tratamiento.
y las reenvía a la Agencia Europea del Medicamento, que es
el organismo responsable de la Farmacovigilancia a nivel eu- En el diseño cruzado, sin embargo, todos los sujetos reciben los
ropeo. dos tratamientos o intervenciones en comparación. Un grupo re-
Si se reciben varias notificaciones que parecen sugerir que un cibe primero un tratamiento y luego el otro, y el otro grupo recibe
medicamento produce una reacción adversa, se lanza una la secuencia de tratamientos inversa. Así, lo que se aleatoriza en
advertencia al respecto (“warning”) y se diseña un estudio este caso es la secuencia de administración de los tratamientos.
epidemiológico para demostrar la posible relación causal. Al
querer estudiar un problema de salud raro (reacción adversa Aleatorización Seguimiento Comparación
poco frecuente) el diseño habitual de dichos estudios es de
casos y controles.
Los estudios farmacoeconómicos (se estudia en Miscelá- Grupo “A” A A
nea) son útiles para labores de farmacovigilancia porque per- Paralelo “A” vs “B”
miten estudiar la utilización de un fármaco en la población y Grupo “B” B B
por tanto calcular cuántas personas están expuestas al mismo.
Grupo “A-B” A A A
(Ver tabla 2) Cruzado “A” vs “B”
Grupo “B-A” B B B

Figura 5. Diseño paralelo y diseño cruzado.

45
Manual ENARM · Estadística y Epidemiología

Ventajas del diseño cruzado respecto al paralelo Diseño factorial


- Requiere la mitad de tamaño muestral. Es el diseño más eficiente cuando existen >2 opciones de tra-
En un diseño cruzado, cada individuo recibe los dos tratamien- tamiento. Consiste en dividir la muestra en grupos que toman
tos, por lo que sirve como su propio control y ahorra la inclu- cada tratamiento por separado, y grupos que toman cada una
sión de otro individuo para servir de control. Si necesitamos de las posibles combinaciones de tratamientos.
100 pacientes que tomen la medicación “A” y 100 pacientes
que tomen la medicación “B”, en un diseño paralelo tendre-
mos que incluir 200 pacientes (100 por ramo de tratamiento), Ventajas
mientras que en un diseño cruzado sólo necesitaremos 100 - Permite evaluar interacciones entre los tratamientos.
pacientes (50 en el grupo A-B y 50 en el grupo B-A). - Ahorra tamaño muestral.
- Muestra más homogénea. Ya que los pacientes que toman varios tratamientos cuentan
El grupo de individuos que toma el fámaco “A” es igual que para los resultados de cada uno de los tratamientos.
el que toma el fármaco “B” (son las mismas personas); esta Ejemplo: en un estudio que compara los fármacos A, B, C,
circunstancia hace surgir el concepto de “variabilidad intra- en el que se necesitan 100 pacientes por rama, un diseño
individual o intragrupal”, que hace referencia al hecho de convencional utilizaría 300 pacientes (100 A, 100 B, 100 C),
que en los diseños cruzados cada individuo es su propio con- mientras que el siguiente ejemplo de diseño factorial utilizaría
trol y por tanto la variabilidad que existe entre cada individuo 220 pacientes (50 A, 50 B, 50 C, 20 AB, 20 AC, 20 BC, 10
y su control (o entre cada grupo y su control) es nula (son las ABC; sigue habiendo 100 pacientes en total que toman A,
mismas personas). Sin embargo, la “variabilidad interindivi- 100 que toman B y 100 que toman C).
dual o intergrupal” (entre dos sujetos o grupos diferentes del
estudio) no varía respecto al estudio paralelo. Diseño con n = 1
Como ya hemos visto previamente, el disponer de una mues- Ensayo clínico de diseño cruzado (sus características son total-
tra homogénea aporta ventajas: mente aplicables) con un único individuo como muestra. Se rea-
• Menor riesgo de sesgos de selección y por factor de confusión. liza cuando un paciente crónico es refractario a los tratamientos
• Mayor potencia estadística y precisión de los resultados. habituales, y su objetivo es encontrar un tratamiento que le sea
útil desde el punto de vista clínico (se evalúan variables duras).
Inconvenientes del diseño cruzado respecto al paralelo A diferencia del resto de estudios epidemiológicos, el objetivo
- Mayor duración. del estudio es mejorar la salud de nuestro paciente, en lugar de
Dura el doble de tiempo, ya que cada sujeto recibe una inter- mejorar la salud de la población.
vención y luego debe recibir la otra.
- Muy sensible a las pérdidas.
Si se pierde un paciente, se pierde en los dos grupos de com- Diseño polietápico
paración “A” y “B”, por lo que es como perder dos pacientes Los tratamientos se administran primero con dosis de induc-
en un diseño paralelo. ción, y posteriormente con dosis de mantenimiento (en varias
- Efecto residual o de arrastre. “etapas”). Se utiliza principalmente en tratamientos antineoplá-
Efecto que deja el primer fármaco sobre el organismo. Tras sicos.
dejar de tomar el primer fármaco, se debe esperar un cierto
tiempo (periodo de lavado) para que se elimine el fármaco
Utilización de controles históricos
y desaparezca su efecto residual.
Por lo tanto, el tratamiento no puede ser curativo ni dejar Consiste en utilizar como grupo control a pacientes que han
un efecto irreversible. Además, el periodo de lavado de sido tratados de la patología que estamos investigando en el
los dos fármacos debe ser similar. pasado (utilizándose por lo tanto el tratamiento convencional
- Efecto periodo. que hubiera disponible). Compararemos los resultados de estos
Los dos tratamientos se administran al paciente en dos perio- pacientes con los resultados de un grupo de enfermos del pre-
dos de tiempo distintos, por lo que las características clínicas sente a los que tratamos con la terapia experimental.
de la enfermedad no deben cambiar entre esos dos periodos La utilización de controles históricos tiene numerosas limita-
para poder comparar el efecto de los dos fármacos en las ciones:
mismas condiciones basales. - Utilización de datos indirectos (utilizamos datos de pacientes
Por lo tanto, la enfermedad debe ser crónica. No es útil para que fueron tratados en el pasado por otros médicos; pueden
enfermedades agudas o que cursen con brotes, a menos que faltar datos que necesitemos, o pueden estar recogidos de un
los brotes sean predecibles (si los brotes son predecibles es modo distinto al que nos interesa).
el escenario más favorable para utilizar un diseño cruzado, - Posibilidad de sesgos de cointervención.
ya que el periodo entre los brotes funciona como periodo de Las “cointervenciones” son todas las mejoras en el manejo de
lavado). la enfermedad que han aparecido entre el pasado y la actuali-
dad, aparte del tratamiento experimental (p. ej., mejores mé-
Diseño secuencial todos diagnósticos que permiten un diagnóstico más precoz,
No existe un tamaño muestral predeterminado, sino que mejores técnicas quirúrgicas…). Los pacientes de la actualidad
se van incluyendo progresivamente pacientes hasta alcanzar un mejorarán su pronóstico no sólo por la utilización del fármaco
tamaño muestral o un periodo de tiempo máximo establecido. experimental, sino por todas esas “cointervenciones”. Así, los
estudios con controles históricos tienden a sobreestimar el
A medida que se van incluyendo pacientes, se realizan análi- efecto del fármaco experimental.
sis intermedios para ver si se consigue llegar a la significación - Puede existir un problema de homogeneidad entre el grupo
estadística. En el momento que se alcance la significación (o si experimental y el control si los criterios diagnósticos o para
se llega al tamaño muestral o el tiempo máximos), el estudio tratar la enfermedad han variado.
se detiene.

46
Tema 7 · Tipos de estudios epidemiológicos

Debido a estas limitaciones, la utilización de controles históricos surgido antes de que finalice el seguimiento del estudio), y por
se restringe a situaciones en las que es muy difícil reclutar el tanto incurrir en problemas éticos (seguir tratando a un grupo
tamaño muestral necesario en el presente (enfermedades de pacientes con un fármaco inferior a otro): en caso de encon-
raras o terminales). trar diferencias significativas en un análisis intermedio, se
Además, se exige que las variables resultado sean variables detiene el estudio.
duras. La realización de análisis intermedios debe estar planificada en
el diseño del estudio antes de comenzarlo.
Además, hay que tener en cuenta que al hacer análisis interme-
7.7. Realización de muchas comparaciones en los dios se incurre en comparaciones múltiples, por lo que existe
estudios epidemiológicos un riesgo de sobrestimar el beneficio del tratamiento experi-
mental (mayor probabilidad de cometer un error alfa). Por ello,
habrá que aplicar una penalización estadística.
La realización de muchas comparaciones en un estudio supone
un problema ya que, con cada comparación realizada, existirá
una probabilidad de cometer un error alfa (encontrar diferen-
cias que en realidad no existen), y la probabilidad alfa de cada 7.8. Estudios de bioequivalencia
comparación se irá acumulando hasta tener una probabilidad
global de haber cometido errores en el estudio muy alta. Tipos de especialidades farmacéuticas
Así, pese a tener comparaciones individuales estadísticamente - Fármaco original o innovador.
significativas (si p <0,05), puede ocurrir que no podamos decir Investigación y desarrollo completo por parte de la industria
que de forma global nuestro estudio ha demostrado encontrar farmacéutica. Tiene un periodo de exclusividad en el que sólo
diferencias (p “global” >0,05). lo pude comercializar la compañía farmacéutica que lo ha de-
Ejemplo: si realizamos dos comparaciones con un error alfa de sarrollado.
0.04 en cada una, la probabilidad global de haber cometido - Licencias o segundas marcas.
un error alfa en el estudio será = 0,04 + 0,04 – 0,04 · 0,04 = La compañía farmacéutica que ha desarrollado un fármaco (y
0,0784 (resultado “global” no significativo). todavía lo comercializa en periodo de exclusividad) autoriza a
Para evitar este problema, se aconseja aplicar una penalización otra empresa para que también lo distribuya.
estadística: se exigen niveles de significación de cada compa- - Especialidad farmacéutica genérica (EFG).
ración individual lo suficientemente bajos para que, al sumarlos, Especialidad con la misma forma farmacéutica (comprimidos,
el valor alfa “global” sea p <0,05. De forma aproximada, el cápsulas, vial para inyección…) e igual composición cualitativa
nivel de significación exigido para cada comparación individual y cuantitativa de principio activo que otra especialidad de refe-
es pi = 0,05 / n.º de comparaciones. rencia, cuyo perfil de eficacia y seguridad esté suficientemente
Hay varias situaciones en las que se realizan muchas compara- demostrado. Los excipientes pueden ser distintos. Pueden re-
ciones en los estudios epidemiológicos: gistrarse antes de que haya expirado la patente original, pero
se comercializan una vez haya expirado. En el registro han de
aparecer las mismas indicaciones de la especialidad original.
Análisis de comparaciones múltiples
Se comparan muchas variables esperando que al menos en al- Estudios de bioequivalencia
guna de ellas se encuentren diferencias significativas. Implica Para poder registrar un fármaco genérico, éste debe demostrar
como hemos visto un mayor riesgo de encontrar falsas di- su equivalencia terapéutica con la especialidad de referencia
ferencias, por lo que sus resultados deben interpretarse con mediante los correspondientes estudios de bioequivalencia.
precaución.
En ellos, no es necesario demostrar la eficacia y la relación be-
neficio/riesgo del producto, siendo suficiente demostrar que las
Análisis de subgrupos características farmacocinéticas del genérico (concentración
Se analizan los resultados obtenidos en subconjuntos de la plasmática máxima alcanzada, tiempo que se tarda hasta alcan-
muestra (p. ej., en ancianos, en diabéticos, en pacientes con zar esa concentración, y cantidad total de fármaco absorbida
insuficiencia renal…). –área bajo la curva–) no son significativamente distintas a la del
producto original.
Puede ser útil para conocer el comportamiento de un fármaco
en distintos grupos poblacionales, pero su realización es muy Los estudios de bioequivalencia suelen realizarse en voluntarios
sensible a los sesgos, especialmente si los subgrupos no se sanos y con un diseño cruzado. El análisis de los datos se realiza
han previsto desde el inicio del estudio. para demostrar equivalencia terapéutica con un límite bilate-
ral de un 20 % de diferencias. Dichas diferencias se miden en
En general, el análisis de subgrupos plantea nuevas hipótesis de
el intervalo de confianza del 90 % (IC 90 %) del cociente de
trabajo, pero no sirve para confirmarlas. Dichas hipótesis debe-
medias de los parámetros farmacocinéticos mencionados, que
rán confirmarse en nuevos estudios realizados específicamente
debe encontrarse entre el 80-125 %. Se divide la media de los
en pacientes del subgrupo de interés.
resultados obtenidos en el fármaco original entre la media de
los resultados obtenidos con el genérico.
Análisis intermedios La demostración de bioequivalencia permite suponer que, ante
Son análisis de los resultados que se realizan en momentos in- similar indicación y con la misma pauta posológica, esos pro-
termedios del seguimiento de un estudio, cuando dicho segui- ductos presentarán la misma eficacia clínica.
miento es muy largo (por ello, se realizan sobre todo en los Las diferentes formas farmacéuticas orales de liberación inme-
estudios de fase III). diata (comprimidos, cápsulas…) podrán considerarse la misma
Se realizan para evitar que pasen desapercibidas diferencias im- forma farmacéutica siempre que hayan demostrado su bioequi-
portantes entre los grupos en comparación (que pueden haber valencia.

47
Manual ENARM · Estadística y Epidemiología

Cp

Cmáx

ABC

Tmáx t
Administración del
fármaco

Cp = concentración plasmática. Cmáx = concentración plasmática máxima.


Tmáx = tiempo que se tarda hasta alcanzar la Cmáx. ABC = área bajo la curva,
que es proporcional a la cantidad total de fármaco absorbida.

Figura 6. Parámetros analizados en un estudio de bioequivalencia.

48
Tema 7 · Tipos de estudios epidemiológicos

Pregunta ENARM Pregunta ENARM


3. Un grupo de investigadores aplicó encuestas 6. Un grupo de investigadores desean saber si la
anuales sobre consumo de opio a 50,045 iraníes canaglifozina es útil en la mejoría del control
entre enero del 2004 y junio del 2008. Al final glucémico en pacientes descontrolados. Por lo
del seguimiento encontraron que 2,145 habían tanto, se incluyeron a 50 pacientes con diabetes.
muerto. Al ajustar por otras causas confuso- Fueron aleatorizados a recibir el tratamiento o un
ras, encontraron que las personas expuestas a placebo, 25 pacientes en cada grupo, y vigilados
opio comparadas con las personas no expuestas por 2 años. Al final del seguimiento, se excluye-
tenían un riesgo de mortalidad de 2.06. ¿Cuál es ron del análisis a los pacientes que no tomaron
la clasificación más apropiada del estudio men- el medicamento y que no se perdieron durante
cionado? el seguimiento, se exluyeron también a algunos
pacientes que cambiaron de grupo, placebo a
A. Cohorte. canaglifozina o viceversa. Al final, 5 de 20 pacien-
B. Ensayo clínico. tes con el grupo de canaglizofina presentaron
C. Transversal. descontrol grave (25 %) mientras que 10 de 20
D. Casos y controles. pacientes (50 %) con placebo también presen-
taron descontrol grave. ¿Cuál de los siguientes
define mejor el tipo de estudio comentado?

Pregunta ENARM A. Cohorte.


B. Casos y controles.
Un grupo de investigadores de la Universidad de
C. Descriptivo.
Michigan realizó una valoración cognitiva a una mues-
D. Ensayo clínico.
tra representativa de 856 personas seleccionadas de
varios asilos con el objetivo de determinar los costos
de atención de los pacientes con mayor deterioro
cognitivo, utilizando la base de datos del Mediacare y
entrevistas a los cuidadores. La prevalencia de pacien-
tes con demencia fue de 14.6 %. El costo del cuidado
por persona con demencia fue de $56,290 dólares
anuales, extrapolado a toda la población, el costo total
anual de la atención fue de 215 billones de dólares, de
los cuales Mediacare pagó 11 billones.

4. ¿Qué tipo de estudio se realizó?

A. Experimental.
B. Comparativo.
C. Homodémico.
D. Descriptivo.

5. ¿Cuál de los siguientes describe mejor el estudio?

A. Casos y controles.
B. Transversal.
C. Prospectivo.
D. Cohorte.

· Encuentra las respuestas y comentarios de las preguntas ENARM al final del manual ·

49
Tema 8
Errores en los estudios epidemiológicos

Validez y reproducibilidad en los estudios epidemiológicos ejemplo, un grupo es más anciano que el otro, lo que influye
Al igual que en un estudio de validación de un nuevo test diag- en que se mueran más sujetos en dicho grupo.
nóstico, en cualquier estudio epidemiológico se tiene en cuenta Siempre que realizamos un estudio comparando varios grupos,
su validez y reproducibilidad: debemos confirmar al inicio del análisis de resultados que las
características de los grupos sean homogéneas (grupos “com-
parables” entre sí), en cuyo caso no habrá posibilidad de que
Validez (exactitud) existan sesgos de selección.
Grado en que un estudio mide lo que realmente tenía como - Solución.
objetivo medir. La aleatorización a la hora de formar los grupos disminuye
- La validez interna hace referencia a la exactitud de los resul- las probabilidades de que las características de los pacientes
tados para los pacientes del estudio (que los resultados sean se distribuyan de forma dishomogénea entre los grupos.
aplicables a la muestra), y depende de que el diseño del estu- El análisis de subgrupos y el análisis estratificado per-
dio sea correcto (ausencia de sesgos). miten, a posteriori (tras finalizar el estudio), comprobar si las
- La validez externa hace referencia a que los resultados sean diferencias en las características de los grupos participantes
aplicables a la población diana, y depende de lo representa- influyen en los resultados (y por tanto si suponen un sesgo de
tiva que sea la muestra de la población (ausencia de errores selección), pero no permiten eliminar el sesgo.
aleatorios). La validez interna es un prerrequisito de la validez
externa. Ejemplos de sesgos de selección
- Sesgo de autoselección (del voluntario).
Reproducibilidad (fiabilidad, precisión) Cuando se recluta a pacientes voluntarios para participar en
Grado de un estudio de obtener el mismo resultado si se re- un estudio, suelen ser pacientes que no encuentran alivio con
pitiera en otras muestras distintas en las mismas condiciones. los tratamientos disponibles y buscan “a la desesperada” una
Depende de lo representativa que sea la primera muestra res- solución. Dichos pacientes suelen por tanto estar más graves
pecto a la población de la que se obtienen las siguientes mues- que la media, lo cual puede afectar a los resultados (cualquier
tras para repetir el estudio (por tanto, de la presencia de errores fármaco tenderá a ser menos efectivo).
aleatorios). - Sesgo del obrero sano.
Si para estudiar una enfermedad laboral se acude al lugar
de trabajo para seleccionar a los individuos, se infraestimará la
8.1. Errores aleatorios frecuencia de enfermedad, ya que aquellos sujetos enfermos
no estarán trabajando sino de baja.
- Sesgo diagnóstico (de Berkson).
El hecho de que estudiemos muestras de individuos y no a la Sesgo que ocurre cuando se seleccionan los individuos de un
población completa puede hacer que nuestra muestra no sea estudio de entre pacientes hospitalizados, y el factor que
representativa de la población. se está estudiando es un factor de riesgo para hospitalizarse.
- Tipos de errores aleatorios. Ejemplo: se analiza la posible relación causal entre el VIH y los
Error de tipo I (alfa) y error de tipo II (beta) (se estudia en el linfomas en pacientes hospitalizados mediante un estudio de
tema 3.1. Errores en contraste de hipótesis). casos (pacientes con linfoma) y controles (hospitalizados por
- Consecuencia. otras causas), analizando la frecuencia de VIH en cada grupo.
Afectan a la validez externa del estudio (no afectan a la Tanto el VIH como los linfomas son por sí mismos factores de
validez interna). riesgo de ingresar en el hospital (si un individuo con VIH o con
- Solución. linfoma enferma por otras causas, es probable que le ingresen
El aumento del tamaño muestral disminuye el riesgo de porque su enfermedad de base le convierte en un paciente de
cometer errores aleatorios y aumenta la potencia estadística alto riesgo). Así, entre los pacientes “hospitalizados por otras
del estudio. causas” habrá un subgrupo de pacientes cuyo motivo de hos-
pitalización será VIH (mientras que el grupo de pacientes con
linfoma ya tienen bastante con su tumor para ingresar). Esto
8.2. Errores sistemáticos (sesgos) hará que infraestimemos la asociación entre linfoma y VIH,
al encontrar más pacientes VIH en el grupo control.
- Sesgo de incidencia/prevalencia (falacia de Neyman).
Son errores debidos a un diseño inadecuado del estudio. Sesgo que ocurre en los estudios de casos y controles al
- Consecuencia. estudiar enfermedades que tienen una fase aguda con altas
Afectan a la validez interna del estudio (por lo que, secun- tasas de letalidad y una fase crónica posterior (p. ej., IAM,
dariamente, afectan también a la validez externa). ictus, disección de aorta), ya que sólo podremos estudiar a los
- No se ven influidos por el tamaño muestral. casos “prevalentes” (crónicos que han sobrevivido a la fase
aguda) mientras que se nos pasarán desapercibidos los casos
Sesgos de selección “incidentes” (agudos que fallecieron). Las características de
los casos prevalentes pueden ser distintas a las de los casos
Aparece cuando existen diferencias en las características que incidentes y eso tener implicaciones en los resultados.
tienen los distintos grupos en estudio (aparte de la característica Ejemplo: al analizar la relación causal de la FA con el ictus, in-
estudiada), y dichas diferencias influyen en los resultados. Por fraestimaremos la asociación porque los ictus cuya causa es

50
Tema 8 · Errores en los estudios epidemiológicos

cardioembólica por FA tienen una mayor letalidad que los ictus - Estudios abiertos.
por otras causas. Así, los casos “prevalentes” de ictus tendrán Los pacientes e investigadores conocen qué intervención reci-
una prevalencia de FA menor que la del conjunto de pacientes ben los pacientes.
con ictus (sumando los casos incidentes y los prevalentes). - Estudios ciegos (con enmascaramiento).
• Ciego simple.
Los pacientes no saben qué intervención reciben (si la expe-
rimental o el control).
• Doble ciego.
No lo saben ni los pacientes ni los investigadores.
• Triple ciego.
No lo saben ni los pacientes, ni los investigadores ni los ana-
listas de los datos (que suelen ser personas independientes
de los investigadores).

Dentro de las técnicas de enmascaramiento, la técnica de doble


simulación o “double dummy” se utiliza cuando se realiza un
estudio en el que se comparan dos tratamientos cuya forma de
administración (oral, i.v…), posología (cada 12 h, cada 24 h…)
o forma farmacéutica (comprimidos, cápsulas, supositorios…)
son distintos.
Dicha técnica consiste en administrar, en cada uno de los gru-
pos del estudio, el fármaco que le toca a dicho grupo, y además
el placebo del fármaco que le toca al otro grupo.
Ejemplos del sesgo de clasificación incorrecta diferencial son:
- Sesgo de memoria o amnésico.
Figura 1. Jerzy Neyman, matemático polaco del siglo XX. Entre sus aportes a la En los estudios de casos y controles, los casos suelen recordar
Epidemiología (además de describir el sesgo que lleva su nombre) se encuentra más la exposición al factor de riesgo que los controles.
el diseño de los estudios de bioequivalencia. - Sesgo de atención o efecto Hawthorne.
Los participantes de un estudio pueden actuar de modo dis-
Sesgos de clasificación (de información, de medida) tinto del habitual simplemente por sentirse observados.
Por ejemplo: un ensayo clínico estudia la eficacia de la rosu-
Aparece cuando se clasifica erróneamente una variable en es-
vastatina para el tratamiento de la hipercolesterolemia. Todos
tudio, pensando que los pacientes que presentan esa variable
los pacientes deberán seguir una dieta baja en grasas y realizar
no la presentan o viceversa. Por ejemplo, el esfingomanómetro
ejercicio, y a un grupo de pacientes, además, se les adminis-
del estudio está estropeado y siempre marca PAS 150 mmHg;
trará rosuvastatina. Los pacientes que sepan que les ha to-
clasificaremos mal a los sujetos no hipertensos ya que pensare-
cado el fármaco experimental realizarán en mayor proporción
mos que son hipertensos.
ejercicio físico que los que sepan que no reciben tratamiento,
ya que tratarán de “ayudar” al fármaco con más ilusión y es-
Sesgo de clasificación incorrecta no diferencial peranza para mejorar su salud.
Aparece por errores en los aparatos de medida que condi-
cionan el mismo nivel de error en la clasificación de todos los
grupos del estudio.
Dichos errores tienden a diluir el efecto de la exposición o tra-
tamiento estudiados, por lo que infraestiman la asociación.
Su solución pasa por mejorar los aparatos de medida (au-
mentar su S y E).

Sesgo de clasificación incorrecta diferencial


Aparece por errores subjetivos de los pacientes o del investi-
gador a la hora de clasificar las variables resultado de los pa-
cientes. Estos sesgos suelen aparecer cuando el paciente o el
investigador conoce a qué grupo pertenece el paciente,
de modo que los pacientes que reciban la intervención expe-
rimental o los investigadores pueden interpretar una falsa me-
joría en variables subjetivas (bienestar, dolor, etc.) respecto
de los pacientes del grupo control (que reciben o bien nada,
o placebo, o un fármaco activo control): la clasificación de las
Figura 2. Trabajadoras de la fábrica Hawthorne Works, de la compañía Western
variables es distinta en cada uno de los grupos. Electric. El efecto Hawthorne recibe su nombre por unos estudios sobre produc-
Así, este sesgo sobreestima los resultados, ya que el grupo tividad industrial realizados en dicha fábrica de la localidad de Cicero (Illinois)
experimental verá sus variables resultado subjetivas artificial- entre 1924 y 1932. El estudio más famoso consistió en comparar la producti-
mente mejoradas. vidad industrial con iluminación ambiental más alta o más baja, y sus resulta-
dos fueron que la productividad aumentó tanto en el grupo sometido a alta
Su solución consiste en emplear técnicas de enmascara- iluminación, como en el sometido a baja iluminación; fue el hecho de saberse
miento (ciego): observados el que propició que las trabajadoras aumentaran su productividad.

51
Manual ENARM · Estadística y Epidemiología

Sesgo por factor de confusión (FC) - Factor de confusión.


Un factor de confusión es un factor de riesgo para la enferme- Al realizar un análisis del subgrupo que presenta el FC, la
dad en estudio, y que además se asocia estadísticamente a fuerza de asociación entre el FR y la enfermedad disminuye
la exposición cuya asociación causal con la enfermedad que- (porque restamos el efecto que era atribuido al FC). Al realizar
remos estudiar. Además, el factor de confusión debe actuar de un análisis estratificado según la presencia o no del FC, la
forma independiente a la exposición en cuanto al mecanismo fuerza de asociación de los distintos estratos es igual.
por el que provoca la enfermedad (no puede ser un paso inter- - Factor modificador del efecto.
medio en la relación exposición-enfermedad). Al realizar un análisis del subgrupo que presenta el FME, la
fuerza de asociación entre el FR y la enfermedad aumenta
Como el FC y la exposición se asocian estadísticamente, los (porque el efecto del FR está potenciado por el FME). Al rea-
pacientes del grupo expuesto presentarán en mayor proporción lizar un análisis estratificado, la fuerza de asociación de los
el FC que los pacientes del grupo no expuesto, independien- distintos estratos es distinta (mayor en el estrato con el FME
temente del método de selección de la muestra (aunque sea y menor en el estrato sin él).
aleatorizada). Así, al suponer el FC un riesgo para la aparición
de enfermedad, parte del riesgo que atribuyamos a la ex-
posición se deberá realmente al FC (sobreestimando pues Factor modificador
Factor de
la verdadera asociación causal). confusión del efecto
El sesgo por factor de confusión es el único que puede elimi-
narse a posteriori:
- Soluciones a priori del sesgo por factor de confusión. FR Enfermedad FR Enfermedad
• Restricción.
El FC supone un criterio de exclusión para el estudio. Así,
ningún paciente (ni del grupo expuesto ni del no expuesto)
tendrá el FC y éste no podrá influir en los resultados.
• Apareamiento. FC FME
Por cada paciente incluido en el grupo expuesto que posea
el FC, incluiremos un paciente en el grupo no expuesto que
lo posea. Así, el porcentaje de pacientes con el FC será el
Análisis de RRsubgrupo FC < RRcrudo RRsubgrupo FME > RRcrudo
mismo en ambos grupos, y se eliminará la influencia del FC subgrupos
sobre la asociación exposición-enfermedad.
La aleatorización puede contribuir a minimizar la posibilidad Análisis RRestrato FC = RRestrato no FC
estratificado RRestrato FME > RRestrato no FME
de cometer un sesgo por factor de confusión, pero no es un
método que permita controlarlo por sí misma.
Figura 3. Factor de confusión y factor modificador del efecto.
- Soluciones a posteriori del sesgo por factor de confu-
sión.
• Análisis de subgrupos y análisis estratificado. Sesgo de atricción
Mediante estos análisis estadísticos podemos calcular exacta-
En cualquier estudio epidemiológico puede haber pérdidas,
mente qué porcentaje del riesgo inicial era atribuible al FC, y
y dichas pérdidas pueden ser de dos tipos: las pérdidas pre-
por tanto eliminar dicho riesgo para quedarnos con el riesgo
aleatorización se producen cuando los pacientes no cumplen
atribuible únicamente a la exposición estudiada.
los criterios de selección del estudio, y afectan por tanto a su
• Análisis multivariante.
validez externa. Las pérdidas post-aleatorización se producen
Si incluimos como variables independientes (xi) de una regre-
en los estudios prospectivos tras la asignación del tratamiento,
sión múltiple tanto a la exposición como al FC, el coeficiente
y pueden afectar a la validez interna.
de cada una de estas variables quedará “ajustado entre sí”,
indicando exclusivamente el riesgo atribuible a cada variable Cuando existen diferencias en el porcentaje de pérdidas
individual. post-aleatorización de los distintos grupos de un estudio
prospectivo, y las pérdidas no se incluyen en el análisis estadís-
tico de los resultados, aparece un sesgo de atricción.
Recuerda que... Habitualmente, si los dos grupos tienen características homogé-
El análisis de subgrupos y el análisis estratificado permiten, a neas, la diferencia en las pérdidas se deberá a un efecto adverso
posteriori, detectar el sesgo de selección (pero no eliminarlo), así del tratamiento experimental por el cual los sujetos de dicho
como detectar y eliminar el sesgo por factor de confusión. grupo abandonan más el estudio que los del otro grupo.
La solución del sesgo de atricción consiste en estudiar los resul-
tados mediante un análisis por intención de tratar en lugar
Tanto el sesgo de selección como el sesgo por factor de confu- de un análisis por protocolo.
sión se sospechan cuando existen diferencias significativas en - Análisis por protocolo.
alguna característica de los grupos en comparación. Los resul- Sólo se estudian los resultados de los pacientes que finalizan
tados del análisis de subgrupos o estratificado que realicemos el estudio. Si existe diferente proporción de pérdidas entre
permitirán saber si estamos ante un factor de confusión o un el grupo experimental y el control y estas pérdidas se deben
sesgo de selección. a efectos adversos del fármaco experimental, sobreestima-
El resultado del sesgo de selección se denomina factor mo- remos el beneficio del fármaco experimental al no tener en
dificador del efecto, y actúa (al contrario que el factor de cuenta a los pacientes que tienen que dejar de tomarlo (y por
confusión) de forma dependiente a la exposición (potenciando tanto dejan de beneficiarse de él).
su efecto). Puede ser además un factor de riesgo independiente Es un peor tipo de análisis y sólo se permite realizarlo en los
de la enfermedad, pero no tiene por qué serlo. estudios con diseño de no inferioridad.

52
Tema 8 · Errores en los estudios epidemiológicos

- Análisis por intención de tratar. del tratamiento médico y no un éxito de la cirugía). Permite
Se estudian los resultados de todos los pacientes reclutados estudiar la causa de las pérdidas y el efecto global del fármaco
en el estudio (todos los pacientes aleatorizados), incluyendo a teniendo en cuenta que un porcentaje de pacientes no se lo
los pacientes que cursen pérdida o que sean traspasados entre tomará (situación que simula a la que se observará en la prác-
grupos, considerándose cada paciente como perteneciente al tica clínica real una vez se comercialice el fármaco).
grupo al que fue aleatorizado (p. ej., un paciente aleatorizado Es el mejor tipo de análisis y el único permitido en los estudios
a tratamiento médico al que finalmente se somete a cirugía con diseño de superioridad.
por fracaso del tratamiento médico se considera un fracaso

Error Consecuencia Solución

Errores aleatorios Validez externa n

Errores sistemáticos Validez interna Validez externa Mejorar diseño

Selección Habitualmente infraestima Aleatorización


Clasificación incorrecta no diferencial Infraestima la asociación Mejorar aparatos de medida
Clasificación incorrecta diferencial Sobreestima la asociación Enmascaramiento
Factor de confusión Sobreestima la asociación A priori:
- restricción
- apareamiento
A posteriori:
- análisis de subgrupos
- análisis estratificado
- análisis multivariante

Atricción Sobreestima la asociación Análisis por intención de tratar

Figura 4. Errores en los estudios epidemiológicos.

53
Valores normales en
Estadística y Epidemiología

CONCEPTO VALORES NORMALES


Significación estadística (error α) p <0,05

Error β β <0,2

Potencia Potencia >0,8

Intervalo 68 % (de confianza en est. inferencial) µ +/- σ (eem en inferencial)

Intervalo 95 % (de confianza en est. inferencial) µ +/- 2σ (2eem en inferencial)

Intervalo 99 % (de confianza en est. inferencial) µ +/- 2,5σ (2,5eem en inferencial)

EEM EEM = σ / n

NNT NNT = 100 / RAR

Límite de no inferioridad (δ = delta) Habitualmente δ = 20 %

Tabla 1. Valores normales en Estadística y Epidemiología.

54
BIBLIOGRAFÍA

- Métodos de investigación clínica y epidemiológica, 3.ª Edición. JM Argimón Pallás, J Jiménez Villa. Mosby, 2007.
- Manual de Epidemiología y Salud Pública para grados en ciencias de la salud, 2.ª Edición. I Hernández-Aguado, A Gil de Mi-
guel, M Delgado Rodríguez, F Bolúmar Montrull, FG Benavides, M Porta Serra, C Álvarez-Dardet Díaz, J Vioque López, B Lumbreras
Lacarra. Editorial Médica Panamericana, 2011.
- El método estadístico en la investigación médica, 6.ª Edición. JL Carrasco de la Peña. Ciencia 3 Diostribución, 1995.
- Hjalmarson A, Goldtein S, Fegerberg B, et al. Effects of Controlled-Release Metoprolol on Total Mortality, Hospitalizations,
and Well-being in Patients With Heart Failure. The Metoprolol CR/XL Randomized Intervention Trial in Congestive Heart Failure
(MERIT-HF). JAMA. 2000;283:1295-1302
- R. Clifford Blair, Richard A. Taylor. Bioestadística. Pearson Educación. México, 2008
- Aringer M, Costenbader KH, Dörner T, et al. Limited role of specificity of ANA for SLE classification. Response to: ‘European
League against Rheumatism/American College of Rheumatology classification criteria for systemic lupus erythematosus: the labora-
tory immunologist’s point of view’ by Infantino et al. Ann Rheum Dis 2019;0:1. doi:10.1136/annrheumdis-2019-216700.

55
RESPUESTAS ENARM

Tema 1. Estadística descriptiva


1. RESPUESTA CORRECTA: D
Comentario: Cuando analizamos los resultados de una variable cuantitativa en una muestra de sujetos, no sólo nos interesa
en torno a qué valor se agrupan los resultados obtenidos (medida de tendencia central), sino también si las observaciones se
encuentran “cerca” o “lejos” del centro de la distribución. Este dato lo indican las medidas de dispersión. Para las variables de
distribución simétrica se utiliza la desviación típica, y para las variables de distribución asimétrica el rango intercuartílico.

Tema 3. Contraste de hipótesis


2. RESPUESTA CORRECTA: C
Comentario: Para cuantificar el grado de asociación existente entre un determinado factor de riesgo o protector y un evento de
interés estudiado con análisis de supervivencia, la medida epidemiológica utilizada es el hazard ratio o razón de riesgos (HR). Su
interpretación es similar a las del resto de medidas de asociación (RR, OR…).

Tema 7. Tipos de estudios epidemiológicos


3. RESPUESTA CORRECTA: A
Comentario: Es un estudio observacional de base individual y con seguimiento prospectivo (desde el presente hacia el futuro).
Dicho seguimiento es real, y consiste en ver al paciente hoy y volverle a ver en sucesivas ocasiones en el futuro hasta que finalice
el periodo de seguimiento. En un estudio de cohortes se sigue prospectivamente a dos grupos de individuos sanos con respecto al
problema de salud que se quiere analizar: un grupo que está expuesto a un factor de riesgo o protector, y un grupo no expuesto.
Se analiza la incidencia de enfermedad que aparece en cada uno de esos dos grupos a lo largo del periodo de seguimiento.

4. RESPUESTA CORRECTA: D
Comentario: Estos estudios describen la frecuencia y características más importantes de un problema de salud: en individuos
(reporte de caso/series de casos, transversales o de prevalencia) y en poblaciones (ecológicos), a diferencia de los estudios ana-
líticos, que establecen una relación entre una determinada exposición y la aparición de un determinado problema de salud:
observacionales (casos y controles, cohortes) y de intervención (ensayo clínico, ensayo de campo, ensayo clínico no aleatorizado,
estudio de intervención comunitaria).

5. RESPUESTA CORRECTA: B
Comentario: Es un estudio observacional de base individual (la unidad delcestudio es el individuo) que no presenta seguimiento
de los pacientes, esto es, que sólo estudia las características que tienen los pacientes en el presente: trata de describir o estudiar
relaciones causales entre exposiciones y problemas de salud presentes en un momento puntual.

6. RESPUESTA CORRECTA: D
Comentario: El ensayo clínico es un estudio experimental cuyo objetivo es el tratamiento de una enfermedad mediante la apli-
cación de una intervención (p. ej., un fármaco) a un grupo de sujetos enfermos, cuyos resultados se compararán con los de otro
grupo de enfermos a los que no se aplicó el tratamiento.

56
NOTAS
NOTAS

También podría gustarte