Documentos de Académico
Documentos de Profesional
Documentos de Cultura
DE LA EVIDENCIA CLÍNICA
Cómo citar este libro:
Juan B Cabello por CASPe. Lectura crítica de la evidencia clínica. Barcelona: Elsevier; 2015.
COLECCIÓN CUIDADOS DE SALUD AVANZADOS
Directora Loreto Maciá Soler
LECTURA CRÍTICA
DE LA EVIDENCIA CLÍNICA
Advertencia
Las ciencias de la salud son un área en constante evolución. Aunque deben seguirse unas
precauciones de seguridad estándar, a medida que aumenten nuestros conocimientos gra-
cias a la investigación básica y clínica habrá que introducir cambios en los tratamientos y en
los fármacos. En consecuencia, se recomienda a los lectores que analicen los últimos datos
aportados por los fabricantes sobre cada fármaco para comprobar las dosis recomendadas,
la vía y duración de la administración y las contraindicaciones. Es responsabilidad inelu-
dible del médico determinar las dosis y el tratamiento más indicados para cada paciente,
en función de su experiencia y del conocimiento de cada caso concreto. Ni los editores
ni los directores asumen responsabilidad alguna por los daños que pudieran generarse a
personas o propiedades como consecuencia del contenido de esta obra.
El Editor
In memóriam
A Casti,
mi amante y amada esposa,
compañera del alma, compañera
Juan B. Cabello
vii
viii ÍNDICE DE CONTENIDOS
ix
Página deliberadamente en blanco
Prólogo
xi
xii PRÓLOGO
This book covers the skills needed to incorporate in clinical practice clinical
knowledge about essential clinical procedures, such as diagnosis, prognosis and
treatment. It has been designed particularly for clinicians, who, together with
patients, are one of the two most important users of health research. However, the
book will also be an invaluable tool for teachers, clinical trainers and producers of
health research. It will help young clinicians check whether what they have been
taught is in fact the best treatment or diagnostic test for their patient.
The book has been written by doctors, nurses and information specialists invol-
ved in teaching critical appraisal skills to clinicians for over a decade through the
Spanish Critical Appraisal Skills Programme. The authors are producers of syste-
matic reviews for The Cochrane Collaboration and contributors to the development
and use of up-to-date best practice and methods, for example, the GRADE approach
to assessing evidence and making recommendations in guidelines, the appraisal of
clinical prediction rules, and methods recommended for prognostic studies.
The book is intended to help anyone who has to take decisions about health or
health care to acquire the skills needed to help make sure that their decisions are
informed by the best available evidence. I wish I had access to such a book in my
early clinical career. With the skills I could have learnt from this book I might have
done less harm and more good for my patients.
En cierto modo este libro es varios libros, pero sobre todo es dos libros. El
lector queda invitado a elegir una de las dos posibilidades que señalamos
en estas letras, a las que llamamos tablero de dirección, alusión que el lector
sin duda entenderá.
El primer libro se puede leer como un libro de métodos de investigación
clínica, aunque visto desde la perspectiva del lector del estudio y no desde
la del diseñador. Ese libro está constituido por el texto de los capítulos del
primero al undécimo. El lector puede escoger también el orden de lectura,
pero conviene saber que algunos capítulos contienen, a modo de muñeca
rusa, otros precedentes. Por ejemplo, para leer el capítulo 5 es preciso haber
leído el 4, y es preciso haber leído ambos para comprender el capítulo 11.
De modo análogo, para leer el 10 es conveniente haber leído del 4 al 8, y
la lectura del capítulo 3 es esencial para dar sentido a todos los capítulos
posteriores. Por su parte, los capítulos 1 y 2 pueden funcionar como piezas
individuales, pero leídas al inicio le dan otra dimensión a lo restante. Un
caso especial es el capítulo 9, que trata de la lectura de la investigación
cualitativa y que, por sustentarse en un paradigma diferente, no depende
de otros capítulos.
El segundo libro se puede ver como un libro de trabajo sobre habilidades
de lectura crítica de los diferentes tipos de estudios clínicos. Este segundo
libro se encuentra en parte en este texto y en parte en la nube, y por ello el
procedimiento de lectura es un poco más complejo. Veamos:
En primer lugar, será necesario leer el texto del capítulo correspondiente,
incluido el escenario clínico.
A continuación, será preciso bajar de internet el artículo elegido para
ese escenario y realizar su lectura crítica. En este sentido, hemos elegido
artículos de revistas de acceso libre. Si se maneja la versión electrónica de
este libro, se accederá al artículo por el hipertexto, y si se usa una versión en
soporte tradicional, será preciso acceder desde un navegador a la dirección
web correspondiente.
Asimismo, se necesitará el material CASPe de lectura para los diferentes
tipos de estudios; son las llamadas plantillas, que facilitarán la lectura crítica
del estudio correspondiente. Estas plantillas pueden bajarse libremente
desde el sitio web de CASPe (http://redcaspe.org/drupal/?q=node/29).
Con esos tres componentes el lector podrá hacer su propia lectura crítica,
sea de modo individual, sea en un grupo o en un club de lectura. Una vez
realizada esta, el lector puede consultar en el libro las notas de lectura crítica
xv
xvi TABLERO DE DIRECCIÓN
sobre el artículo elegido en cada capítulo. Estas notas han sido elaboradas
por los autores correspondientes, lo cual permitirá al lector comparar su
lectura con la de los autores.
Para este segundo uso como libro de trabajo, valen las reflexiones sobre
el orden de lectura comentadas para el primer libro. Es asimismo posible
elegir practicar sobre itinerarios específicos de lectura crítica: sobre trata-
mientos (capítulos 3, 4, 5 y 11), sobre diagnóstico (capítulos 3 y 6) o sobre
pronóstico (capítulos 3, 7 y 8).
Abierto este abanico de posibilidades, invitamos al lector a elegir el mejor
modo de usar este libro y, porque entendemos la lectura como un proceso
activo, sugerimos empezar a decidir desde este mismo instante.
xvii
Página deliberadamente en blanco
Colaboradores
Víctor Abraira
Unidad de Bioestadística Clínica, Hospital Universitario Ramón y Cajal. Madrid,
España.
Miembro de CASPe. Madrid, España.
Eukene Ansuategui Zengotitabengoa
Bibliotecaria-documentalista. Biblioteca, Hospital Universitario Donostia.
San Sebastián, España.
Coordinadora de BusCASPE. País Vasco, España.
Amanda Burls
Professor of Public Health. Health Services Research and Management Division,
School of Health Sciences, City University London. Londres, Reino Unido.
Juan Bautista Cabello López
Servicio de Cardiología, Hospital General Universitario de Alicante. Alicante,
España.
Senior fellow. Centre for Evidence Based Medicine, Oxford University. Oxford,
Reino Unido.
Director de CASPe. España.
Alejandra Cano Arana
Unidad de Bioestadística Clínica, Hospital Universitario Ramón y Cajal. Madrid,
España.
Miembro de CASPe, Enfermería.
Fernando Carballo Álvarez
Profesor titular. Medicina Interna, Departamento de Medicina, Universidad
de Murcia. Murcia, España.
Jefe del Servicio de Aparato Digestivo. Hospital Clínico Universitario Virgen
de la Arrixaca. Murcia, España.
Coordinador de CASPe, Medicina Digestiva.
Rafael Carbonell Sanchís
Servicio de Otorrinolaringología, Hospital de Sagunto. Sagunto (Valencia), España.
Miembro de CASPe. Comunidad Valenciana, España.
José Ignacio Emparanza Knörr
Unidad de Epidemiología Clínica, Hospital Donostia. San Sebastián, España.
Senior fellow. Centre for Evidence Based Medicine, Oxford University. Oxford,
Reino Unido.
Coordinador de CASPe. País Vasco, España.
Teresa González Gil
Profesora ayudante doctor. Sección Departamental de Enfermería, Departamento
de Cirugía, Facultad de Medicina, Universidad Autónoma de Madrid. Madrid,
España.
xix
xx COLABORADORES
1
¿Por qué la lectura crítica?
Amanda Burls, José Ignacio Emparanza Knörr
y Juan Bautista Cabello López
Parece no haber ningún estudio tan fragmentado, / ninguna hipótesis
tan trivial, / ninguna lista de referencias tan sesgada o tan egoísta, / ningún di-
seño tan retorcido, / ninguna metodología tan mala, / ninguna presentación de
resultados tan imprecisa, oscura o contradictoria, / ningún análisis tan autocom-
placiente, / ningún argumento tan circular, / ninguna conclusión tan insignificante
o injustificada, / y ninguna gramática ni sintaxis tan ofensiva o molesta / que evite
que un artículo termine siendo publicado. Drummond Rennie (1)
Pero hay algunas amenazas que inciden sobre este escenario, en efecto.
En 2004, Marcia Angell, ex editora del New England Journal of Medicine,
tras dejar el puesto, escribió el libro The truth about drug companies (4). En
1. ¿Por qué la lectura crítica? 5
Bibliografía
1. Rennie D. Editorial Peer Review in Biomedical Publication. The First International Con-
gress. JAMA. 1990;263(10):1317.
2. Jeferson T, Rudin M, Brodney S, Davidoff F. Editorial peer review for improving the quality
of reports of biomedical studies. Cochran Database Syst Rev. 2007;(2):MR000016.
3. McKibbon KA, Wilczynski NL, Haynes RB. What do evidence-based secondary journals
tell us about the publication of clinically important articles in primary healthcare journals?
BMC Medicine. 2004;2:33.
4. Angels M. The truth about drug companies. How They Deceive Us and What to Do About
It. New York: Random House; 2004.
5. Smith R. The trouble with medical journals. London: The Royal Society of Medicine Press
Ltd.; 2011.
6. Goldacre B. Bad science. London: Fourth State; 2009.
7. Goldacre B. Bad Pharma. London: Fourth State; 2012.
8. Gotzsche PC. Deadly medicines and organized crime. How the Big pharma has corrupted
healthcare. London: Radcliffe Publishing; 2013.
2
Lectura crítica para la práctica
clínica basada en la evidencia
Juan Bautista Cabello López
y José Ignacio Emparanza Knörr
INTRODUCCIÓN
DIMENSIÓN ENUNCIATIVA
En ella se profundiza en la actitud del que escribe y se intuye lo que
desea lograr del lector a partir de la forma en que se usa el lenguaje para
contar hechos, datos, ideas, emociones o creencias, y especialmente a partir
del énfasis de sus juicios sobre certidumbre, importancia, confianza, etc.
Esta dimensión es claramente diferente en los documentos biomédicos
respecto de los de otros ámbitos (literario, periodístico, etc.). En el ámbito
médico se prefiere un estilo neutro de escritura, que será expositivo o re-
flexivo (dependiendo de las secciones) y que trata de transmitir ideas, hechos
o interpretaciones, y raramente énfasis. Además de ese equilibrio expositivo,
se ofrecen indicaciones de estilo, como el uso de algunas convenciones para
tiempos verbales (futuro para los protocolos, pasado para las revisiones y
la preferencia por la forma activa frente a la pasiva) y otras sugerencias de
estilo que se mencionan en sucesivas versiones de Vancouver, aunque hay
publicaciones y organizaciones —p. ej., BMJ (4) o Cochrane Collaboration (5)—
© Elsevier. Fotocopiar sin autorización es un delito.
que tienen sus propios manuales de estilo literario para sus autores e incluso
repositorios de frases preconstruidas (Manchester Academic Phrasebank;
http://www.phrasebank.manchester.ac.uk/).
DIMENSIÓN VALORATIVA
Trasciende lo estrictamente escrito en las líneas y trata de identificar lo
que hay entre líneas, es decir, los elementos intelectuales que subyacen
en el texto. En esta dimensión se hace uso de los recursos señalados de
las anteriores dimensiones, y se incorporan otros recursos propios que
permiten al lector adentrarse en una visión crítica del texto.
En definitiva, un texto ofrece siempre un punto de encuentro para una
negociación comunicativa con el lector (6). Pero esa negociación no siempre se
produce: un lector podría comprender el contenido del texto y su significado
sin reconocer la dimensión valorativa que hay detrás, es decir, sin juzgar el
10 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
texto. En efecto, esa negociación implica una actitud lectora especial (crítica)
y la existencia de conocimiento previo, es decir, siempre nos aproximamos
a un texto con nuestras propias preconcepciones; a esas preconcepciones
o prejuicios de los lectores de la literatura médica dedicaremos parte del
próximo apartado; digamos, por ahora, que son determinantes del resultado
de la valoración y, por tanto, elemento esencial de la lectura crítica.
CUADRO 2-1
G U Í A S PA R A L A E S C R I T U R A
DE ESTUDIOS CLÍNICOS*
• ECA: CONSORT
• Variantes para los diferentes tipos de diseños de ECA:
CONSORT-EXTENSIONS
• RS y metaanálisis: PRISMA
• Estudios observacionales: STROBE
• RS de estudios observacionales: MOOSE
• Estudios de exactitud de las pruebas diagnósticas: STARD
• Estudios de mejora de la calidad: SQUIRE
• Descripción de casos: CARE
• Descripción de los apartados de estadística: SAMPL
• Descripción de protocolos de ECA: SPIRIT
• Estudios cualitativos: COREQ
• RS cualitativas: ENTREQ
CUADRO 2-2
R E G I S T R O S D E E N S AY O S C L Í N I C O S
A L E AT O R I O S
• WHO International Clinical Trials Registry Platform Search Portal:
http://apps.who.int/trialsearch/
• EU Clinical Trials Register: https://www.clinicaltrialsregister.eu
© Elsevier. Fotocopiar sin autorización es un delito.
ESTRATEGIA DE LECTURA
Las piezas elementales de evidencia (los estudios) muestran un tradi-
cional esquema IMRAD, donde la introducción define el marco de lo ya
conocido; el material y los métodos muestran los detalles necesarios para
su comprensión, reproducción o posterior aplicación de la investigación;
los resultados son la información nuclear del estudio, y la discusión ofrece
explicaciones para los hallazgos, define de nuevo el marco de conocimiento
y propone nuevas hipótesis.
En realidad, la información nueva (y sustancial) está contenida en los
resultados, pero la validez de ellos dependerá del material y los métodos.
Por ello, tradicionalmente, la lectura crítica se centra primeramente en la
validez (y, por tanto, en el material y los métodos), a continuación en los
resultados y, posteriormente, en la aplicabilidad, ya sea a pacientes, a
grupos, o a la investigación de síntesis.
Sin embargo, la validez depende de las preguntas en un doble sentido:
la pregunta formulada condiciona la selección del diseño de investigación
adecuado y, sobre todo, la pregunta incorpora los diferentes desenlaces de
investigación; ello nos permite valorar si los desenlaces son importantes
para la decisión clínica o para la investigación en curso. Abordaremos esto
con detalle en el capítulo 3; por ahora, señalemos que:
• La primera reflexión de cualquier lectura crítica será sobre
la pregunta de investigación y, lógicamente, el primer punto
de los instrumentos de lectura.
• La pregunta generalmente ocupa el título y/o el último párrafo de
la introducción, que, como señalábamos, se dedica a justificar el marco
de conocimiento que da sentido a esa pregunta.
• La identificación de la pregunta y de sus diferentes desenlaces
nos permitirá saber si este estudio contiene realmente la evidencia
que necesitamos para nuestra clínica o para nuestra investigación
de síntesis.
• Los siguientes elementos de validez, resultados y, en su caso,
aplicabilidad se incorporan por ese orden en los instrumentos
de lectura (que describimos en el siguiente apartado). Por tanto,
la secuencia lógica de lectura será: Pregunta – Validez – Resultados –
Aplicación.
2. Lectura crítica para la práctica clínica basada en la evidencia 15
CUADRO 2-3
(Continúa)
16 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
En nuestro caso, y durante todos los ejercicios del libro, usaremos los
instrumentos CASPe, que describimos sucintamente y que pueden des-
cargarse de http://redcaspe.org/drupal/?q=node/29.
Se trata de un instrumento (diseño-específicos) organizado en tres sec-
ciones sucesivas (validez, resultados y aplicabilidad), diseñado para ser
usado asociado a un escenario de decisión (real o docente) y que requiere
una sesión de formación metodológica previa. El formato del instrumento
es de listado de preguntas (10 u 11 preguntas), cada una de ellas con tres
posibles respuestas (Sí, No se puede saber y No). En realidad, lo relevante
es que incluye una pequeña guía de uso en forma de pistas para abordar
cada una de las preguntas y conducir el debate grupal.
Bibliografía
1. Rayner K, Reichle ED. Models of the Reading Process. Wiley Interdiscip Rev Cogn Sci.
2010;1(6):787-799.
2. Lectura crítica en 2013 [visitado el 01/10/2014]. Disponible en: http://www.icfes.gov.
co/index.php?option=com_content&view=article&id=63&Itemid=210&q=lectura%20
critica.
20 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
3
Formulando preguntas
para la práctica clínica
Juan Bautista Cabello López
y José Ignacio Emparanza Knörr
INTRODUCCIÓN
SEGÚN SU AMPLITUD
Hay preguntas clínicas que son muy genéricas y que guardan relación
con las bases del conocimiento clínico, son «saber establecido y aceptado»;
un ejemplo de ellas sería: ¿cuáles son los síntomas y signos de un infarto de mio-
cardio? En cambio, otras son más específicas y aluden a un aspecto concreto
de un problema que está frecuentemente en el límite de lo conocido o en
proceso de revisión o discusión, por ejemplo, ¿es efectivo el ácido acetilsalicílico
en dosis bajas en la disminución de la probabilidad de preeclampsia?
3. Formulando preguntas para la práctica clínica 25
TABLA 3-1 Relación entre tipo de pregunta (según dominio clínico) y diseños
adecuados de investigación
Tipo de pregunta clínica (por dominio Tipo de estudio adecuado (estudios
clínico) primarios)
Tratamiento Ensayo clínico aleatorio
Diagnóstico Estudios de exactitud de test diagnóstico
Exactitud del test (S, E, LR+, LR–, etc.) Estudios transversales, cohortes
Consecuencias clínicas de su uso Ensayo clínico aleatorio
Pronóstico
Cursos clínicos y desenlaces con sus Estudio de cohortes
probabilidades
Predicción para paciente individual Reglas de predicción clínicas
Etiología Estudio de cohortes
Daño o perjuicio Estudio de casos y controles
Prevención Ensayo clínico aleatorio
Creencias y valores Estudios cualitativos
Otras: organización, servicios Diversos
En todos los casos, la opción más deseable es la de contar con estudios de síntesis o revisiones
sistemáticas de estudios primarios (aleatorios, observacionales, de exactitud de test, etc.).
E, especificidad; LR+, cociente de probabilidad positivo; LR–, cociente de probabilidad negativo;
S, sensibilidad.
natural del aprendizaje de los clínicos, de modo que en los períodos iniciales
de formación y al comienzo de la actividad profesional las preguntas «fun-
damentales» son mucho más frecuentes que las específicas. Sin embargo,
con el aumento de la experiencia y de las habilidades de decisión, las
preguntas fundamentales se van reduciendo gradualmente, en tanto que
las preguntas específicas aumentan, siempre que exista la actitud intelectual
y el entrenamiento adecuado para ello.
TABLA 3-2 Taxonomía de las preguntas genéricas (las 10 formas más frecuentes
de formular la pregunta por los clínicos)
Pregunta formulada Porcentaje
¿Cuál es el fármaco de elección para la enfermedad o condición clínica X? 11%
¿Cuál es la causa del síntoma X? 8%
¿Qué test está indicado en la situación X? 8%
¿Cuál es la dosis del fármaco X? 7%
¿Cómo debe ser tratada la condición clínica X (excluidos medicamentos)? 6%
¿Cómo debe manejarse la condición clínica X (sin especificar si se refiere 5%
a diagnóstico o tratamiento)?
¿Cuál es la causa de este hallazgo de exploración? 5%
¿Cuál es la causa de este resultado de test diagnóstico? 5%
¿Puede el medicamento X causar el efecto adverso Y? 4%
¿Podría este paciente tener la enfermedad X? 4%
Otras (diversas)… 37%
Tomado y modificado de Ely JW, Osheroff A, Gorman P, Ebell MH, Chambliss ML, Pifer EA, et al. A taxonomy of
generic clinical-questions: classification study. BMJ. 2000;321:429-32.
3. Formulando preguntas para la práctica clínica 27
CUADRO 3-1
P R E G U N TA E S T R U C T U R A D A
O F O R M AT O P I C O
P Paciente o Pacientes: tipo o características de un paciente
como el nuestro
I Intervención: intervención o exposición considerada
C Comparación: intervención o exposición alternativa (si procede)
O Desenlaces (Outcomes): resultados o desenlaces
CUADRO 3-2
BENEFICIOS DE LA REDACCIÓN
D E L A S P R E G U N TA S E N F O R M AT O P I C O
• Ayuda a hacerte una idea más clara y más estructurada
de los problemas que sufre tu paciente. De algún modo, puede
ayudarte a clarificar el escenario clínico concreto
• Hacer explícito, por escrito, todos los desenlaces (outcomes)
de interés, permite valorar cuál es el más importante y priorizar
tus acciones en consecuencia
• La formulación PICO facilita comprender qué tipo de estudio
responderá óptimamente a tu pregunta
• La redacción de las preguntas clínicas en formato PICO te ayuda
a encontrar los mejores términos de búsqueda
los que suelen estar los subrogados) pueden ser ignorados, aunque puedan
ser interesantes para explicar o comprender otros desenlaces.
Bibliografía
1. Tilson JK, Kaplan SL, Harris JL, Hutchinson A, Ilic D, Niederman R, et al. Sicily statement
on classification and development of evidence-based practice learning assessment tools.
BMC Med Educ. 2011;11:78.
2. Cabello JB, Emparanza JI, Burls A. Una educación para la clínica del siglo XXI: el currículo
para la práctica basada en la evidencia. Med Clin (Barc). 2013;141(5):221-226.
3. Kassirer J, Wong J, Kopelman R. Learning Clinical reasoning. 2nd ed. Baltimore: Lippincott
Williams & Wilkins; 2010.
4. Allan MG, Ma V, Aaron S, Vandermeer B, Manca D, Korownyk C. Residents’ clinical
questions: how are they answered and are the answers helpful? Can Fam Physician.
2012;58:e344-e351.
5. Gorman PN, Helfand M. Information seeking in primary care: how physicians choose
which clinical questions to pursue and which to leave unanswered. Med Decis Making.
1995;15:113-119.
6. Ely JW, Osheroff A, Gorman P, Ebell MH, Chambliss ML, Pifer EA, et al. A taxonomy of
generic clinical questions: classification study. BMJ. 2000;321:429-432.
3. Formulando preguntas para la práctica clínica 31
7. Kloda LA, Bartlett J. Formulating Answerable Questions: Question. Negotiation in
Evidence-based Practice. JCHLA/JABSC. 2013;34:55-60.
8. Richardson SW, Wilson M, Nishikawa J, Hayward R. The well-built clinical question: a
key to evidence-based decisions. ACP J Club. 1995;123(3):A12-A13.
9. Horsley T, O’Neill J, McGowan J, Perrier L, Kane G, Campbell C. Interventions to improve
question formulation in professional practice and self-directed learning. Cochrane Database
Syst Rev. 2010;5:CD007335.
10. Guyatt GH, Oxman AD, Kunz R, Vist GE, Falck-Ytter Y, Schünemann HJ, GRADE Working
Group. Rating quality of evidence and strength of recommendations: What is “quality of
evidence” and why is it important to clinicians? BMJ. 2008;336:995-998.
Ejemplos
Ejemplo 1
En tu condición de residente de segundo año y médico de guardia en el
servicio de urgencias de tu hospital, recibes una llamada sobre el traslado
en ambulancia desde un restaurante del puerto pesquero de una paciente
de 34 años (Laura) con cefalea, enrojecimiento facial, urticaria en el tronco,
hipotensión arterial y broncoespasmo, sin antecedentes asmáticos ni alérgicos.
El médico de la ambulancia, que llegará en 10 min, sugiere que puede ser
una intoxicación escombroide.
Dado que no has oído nunca hablar de esta patología, te preguntas: ¿qué es
una intoxicación escombroide?
En este caso estamos planteando una pregunta sobre la etiología del cuadro
© Elsevier. Fotocopiar sin autorización es un delito.
clínico que presenta Laura. Planteas la pregunta porque desconoces los términos
a los que se refiere el médico de la ambulancia. No está formulada en relación
con una toma decisión clínica, sino con la necesidad de conocimiento. Es, por
lo tanto, una pregunta general, no específica.
Ejemplo 2
Has diagnosticado a Erenia, una mujer de 65 años, por lo demás sana, de
una infección del tracto urinario. Le explicas que el tratamiento que le vas
a prescribir, amoxicilina-clavulánico, eliminará probablemente en un par
de días la sintomatología que ahora sufre, y que debe venir a realizar un
urocultivo de control más adelante, cuando la llamen de consultas. Erenia
comenta que hace 3 años le dieron ese mismo tratamiento y tuvo una diarrea
considerable. Te pregunta si hay alguna forma de prevenir que le suceda lo
mismo esta vez.
32 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
Ejemplo 3
Iñaki, de 13 años de edad, ha sufrido un traumatismo en el pulgar derecho
mientras jugaba al baloncesto con abducción forzada, tras el que presenta dolor,
hinchazón e impotencia funcional en la articulación metacarpofalángica.
Trasladado por sus padres al servicio de urgencias del hospital, es
visto por el traumatólogo de guardia. En la exploración, el traumatólogo
hace ver a los padres la laxitud de esa articulación, que sugiere rotura del
ligamento lateral. En la radiografía se observa una leve subluxación que
sugiere el mismo diagnóstico. El padre señala que la laxitud es similar a
la que se observa en el pulgar izquierdo, que no ha sufrido traumatismo
alguno, y que una radiografía anterior de la mano izquierda realizada hace
2 meses por rotura de la falange distal del 5.° dedo izquierdo mostraba
una imagen similar en la articulación metacarpofalángica del primer dedo
izquierdo. Estas observaciones no son tenidas en cuenta por el traumató-
logo, que, con el diagnóstico de rotura del ligamento, propone la cirugía
reparadora urgente.
La cirugía, con anestesia regional, transcurre sin problemas, aunque el
ligamento se observa intacto y el único hallazgo patológico es un leve desgarro
del aductor. El cirujano señala que ha suturado este desgarro.
Tras la cirugía, Iñaki es trasladado al servicio de pediatría, donde le mantie-
nen a dieta durante 6 h y establecen una pauta de probar tolerancia progresiva
a líquidos antes de darle el alta.
Algunas preguntas que surgen de este escenario son:
Escenarios de entrenamiento
Tras estos escenarios resueltos, proponemos los siguientes escenarios para
que los resuelva el lector. Trata de formular al menos una pregunta clínica es-
pecífica estructurada en formato PICO para cada escenario.
Escenario 1
Un hombre de 65 años acude a tu consulta para una visita de control por
hipertensión arterial. Es fumador de 20 cigarrillos al día y tuvo un infarto
lagunar hace 1 año, del que se ha recuperado totalmente. Está en tratamiento
con un diurético que ya no toma, porque le molestan sus efectos diuréticos en
su actividad diaria. Tensión arterial: 160/100 mmHg.
Le explicas que es necesario que tome el tratamiento antihipertensivo, dado
el riesgo que se asocia con la tensión alta y sus antecedentes. El paciente está de
acuerdo en recibir un tratamiento, pero argumenta que a un vecino suyo, que
también tiene hipertensión, su médico le ha recetado un medicamento que no es
diurético («algo que acaba en “-pril”») y que no aumenta la necesidad de orinar.
Escenario 2
Llega un paciente a tu consulta que describe aumento del perímetro abdomi-
nal con un incremento ponderal de 6 kg en la última semana. Ha sido diagnos-
ticado previamente de cirrosis, estadio C de Child. Ha sido ingresado dos veces
por descompensación ascítica y varices esofágicas sangrantes. Actualmente,
está en tratamiento con laxantes, furosemidas, espironolactona y vitamina K.
Encuentras claros signos de ascitis en la exploración física. El líquido obtenido
por paracentesis muestra 280 neutrófilos/ml. Con el diagnóstico de peritonitis
bacteriana espontánea, prescribes 2 g de cefotaxima cada 8 h. Te preguntas si
se puede hacer algo para prevenir futuros episodios de peritonitis.
© Elsevier. Fotocopiar sin autorización es un delito.
Escenario 3
Un hombre de 66 años acude a urgencias por dolor torácico. Es fumador de un
paquete al día, hipertenso y tiene el colesterol alto. Ha estado asintomático hasta
hace 4 días, cuando le empezó un dolor torácico que apareció mientras caminaba,
con irradiación al brazo izquierdo y disnea, y que desaparecía cuando dejaba
de caminar. El día del ingreso ha notado un dolor torácico retroesternal durante
1 h. El dolor no se modifica con los movimientos respiratorios y no se irradia.
El electrocardiograma en urgencias muestra una onda T negativa en I, aVL,
V5 y V6 compatible con sobrecarga del ventrículo izquierdo. La radiografía
muestra una ligera cardiomegalia. Las enzimas cardíacas creatin fosfocinasa
(CPK), CPK fracción MB, troponina y mioglobina son normales. Tratas de tras-
ladarlo a la unidad de vigilancia intensiva, pero ellos te sugieren que lo ingreses
en la planta de interna y que monitorices la evolución.
34 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
Escenario 4
Una mujer de 60 años que estaba previamente sana fue ingresada ayer por
la noche debido a un síndrome confusional agudo, fiebre y signos meníngeos.
Se ha aislado Neisseria meningitidis tanto en sangre como en el líquido cefalo-
rraquídeo. Las enfermeras de urgencias te preguntan si es necesario algún
tratamiento profiláctico, porque estuvieron en contacto con esta mujer en
urgencias (y tienen niños pequeños en casa).
C A P Í T U L O
4
Lectura crítica de estudios
de tratamiento.
Ensayos clínicos aleatorios
Eduardo López Briz, José Ignacio Pijoan Zubizarreta
y Juan Bautista Cabello López
INTRODUCCIÓN
ESCENARIO
POBLACIÓN
Cuando formulábamos preguntas clínicas, hablábamos de pacientes (P).
Ahora, en investigación, la P corresponderá a la «Población de estudio»,
que se define como el subgrupo de la población que reúne los criterios de
inclusión y carece de los de exclusión.
Idealmente, esta población debe parecerse a los pacientes en quienes
se piensa aplicar la intervención si fuera efectiva, y no es preciso ningún
muestreo representativo. Frecuentemente, por razones de índole práctica,
se selecciona un subgrupo en el que es más probable observar el desenlace
investigado y, en ocasiones, ingresa «a prueba» (run-in) en el estudio. Por
todo ello, suele reflejar solo una parte del espectro de la enfermedad. Como
para esa selección pueden usarse diferentes criterios en los distintos es-
tudios, esa disparidad puede ser fuente de heterogeneidad en las RS.
Concierne a la prudencia clínica valorar las diferencias entre las po-
blaciones de estudio y el paciente concreto a quien debe aplicarse el resul-
tado. En realidad, casi nunca encontraremos un ensayo con una población
exactamente igual a nuestro paciente; por ello la pregunta sería si nuestro
4. LECTURA CRÍTICA DE ESTUDIOS DE TRATAMIENTO. ENSAYOS CLÍNICOS ALEATORIOS 39
INTERVENCIÓN
Se trata de la acción cuyo efecto se pretende estudiar y que puede ser
de muy diferentes tipos: fármacos, grupos de fármacos, intervenciones
quirúrgicas, fisioterápicas, psicológicas, estrategias de manejo clínico o es-
trategias de organización, intervenciones complejas, terapias alternativas
y un largo etcétera.
En cualquiera de los casos, la intervención (y la comparación) debe ser es-
tandarizada y descrita con el detalle suficiente como para poder ser aplicada
a la clínica, reproducida en investigación o incorporada en investigación
de síntesis. La estandarización es relativamente fácil cuando hablamos de
fármacos, pero las intervenciones más complejas exigen definiciones más
elaboradas. Otras veces, las intervenciones son críticamente dependientes
de las habilidades específicas de las personas que las realizan (p. ej., cirugía,
hemodinámica, manipulaciones vertebrales, psicoterapia, etc.) y la estanda-
rización resulta aún más complicada. En tales casos, el control de las curvas
de aprendizaje o la utilización de diseños especiales llamados «diseños de
habilidad» (expertise design) son alternativas disponibles.
En otras ocasiones, la intervención no se puede realizar sobre un indivi-
duo, pues hay que considerar su integración en una organización o socie-
dad. Por ejemplo, al estudiar estrategias docentes entre grupos aleatorios
de residentes del mismo hospital, la contaminación entre grupos es segura,
o estudiar dos intervenciones dietéticas entre escolares de la misma escuela
plantea dificultades obvias. En esos casos puede ser de utilidad el diseño
de ensayo cluster, cuya complejidad excede los objetivos del capítulo. Final-
mente, cuando el efecto de la intervención es reversible en un plazo corto y
se aplica a una enfermedad crónica estable, es posible probar sucesivamente
intervención y comparación en la misma población; se trata de los diseños
cruzados (cross-over trials).
COMPARACIÓN
En este aspecto está, sin duda, la clave práctica y ética de los ECA.
Desde el punto de vista del clínico práctico, solo tiene sentido comparar
nuevas intervenciones con intervenciones con efectos ya probados, o al
menos que sean los tratamientos usuales; no usar tratamientos probados
sería maleficencia y, además, esa comparación reproduce el posible dilema
decisional real (tratamiento nuevo frente a tratamiento usual).
Desde el punto de vista ético, para proponer a un paciente la participa-
ción en un ensayo debe existir un equilibrio entre los posibles beneficios y
riesgos esperables del nuevo tratamiento con los beneficios y riesgos de la
intervención comparada (es la llamada equipoise). En realidad, este concepto
4. LECTURA CRÍTICA DE ESTUDIOS DE TRATAMIENTO. ENSAYOS CLÍNICOS ALEATORIOS 41
LOS DESENLACES
Pueden ser orientados a los pacientes u orientados a la enfermedad
(desenlaces subrogados). El catálogo de desenlaces es tan amplio como la
clínica: puede tratarse de condiciones clínicas objetivas, como, por ejemplo,
mortalidad, eventos clínicos, como accidente vascular cerebral o infarto de
miocardio o curación, pero también pueden ser síntomas, signos, percep-
ciones, habilidades, calidad de vida, etc. En unos casos son valorados o
42 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
ALEATORIZACIÓN
Consiste en la asignación de cada paciente a un grupo en función
de una secuencia aleatoria que se puede generar de diversos modos
(tabla 4-2) (6). Esta es la manera que tenemos de intentar que los dos gru-
pos sean similares respecto de las variables que creemos importantes,
pero también de otras variables desconocidas. En teoría debe controlar
el sesgo de selección y el sesgo de confusión. Conceptualmente hay
dos elementos distintos en la aleatorización: uno es la generación de la
secuencia de aleatorización, y otro más pragmático es cómo se realiza el
procedimiento de asignación, especialmente si la secuencia se mantiene
oculta para quien hace el reclutamiento (ocultación de la secuencia de
aleatorización [OSA]).
SECUENCIA DE ALEATORIZACIÓN
La secuencia de aleatorización puede generarse de modo simple a través
de una tabla o sistema de números aleatorios (hasta con una moneda si hay
solo dos grupos para comparar). El problema de las secuencias generadas
así es el desequilibrio de efectivos entre grupos, que es especialmente
frecuente para ensayos pequeños. El modo de resolver este problema es
haciendo bloques de permutaciones (aleatorización restrictiva por bloques);
de ese modo, la máxima diferencia posible entre grupos en el número de in-
dividuos será igual a la mitad del tamaño del bloque. El segundo problema
posible es la distribución desigual en los grupos de los factores pronósticos
importantes, lo cual puede afectar al control del sesgo de confusión. Este
problema suele abordarse mediante la estratificación (con o sin bloques
por estrato), o mediante algoritmos de minimización (7) que resuelven el
problema de manejar muchos estratos y cuyo uso se ha popularizado en
los últimos años (2).
En cualquiera de los casos, la aleatorización genera una tendencia a la
similitud entre los grupos, pero a largo plazo (con tamaños muestrales
grandes). Sin embargo, pese a las precauciones, el azar puede produ-
cir desequilibrios en los factores pronósticos. Por tanto, la efectividad
de la aleatorización debe ser comprobada en todos los ensayos. El efecto de
la aleatorización sobre las variables conocidas suele mostrarse en la tabla 1
de los todos los ensayos (es la llamada tabla 1 de CONSORT), en la que,
por diferentes razones, no procede hacer test de significación estadística.
OCULTACIÓN DE LA SECUENCIA DE ALEATORIZACIÓN
El problema de la predictibilidad del grupo de tratamiento se debe a que
saber a qué grupo se asignará el próximo paciente puede condicionar los
comportamientos clínicos o de quien recluta (8). Imaginemos que sabemos
que el próximo paciente reclutado será asignado al grupo experimental, y
tenemos una cierta preferencia, consciente o no, por uno de los tratamientos
(el tradicional). Supongamos que estamos ante un paciente con criterios
límite de inclusión (especialmente grave) y creemos que en realidad le
beneficiaría más el tratamiento clásico; es muy posible que forcemos la
exclusión del paciente, y con ello estemos generando un sesgo de selec-
ción al favorecer el nuevo tratamiento. En resumen, conocer la secuencia
puede generar sesgos de selección y eliminar, en parte, las ventajas de la
aleatorización.
Esta OSA debe diferenciarse del cegamiento, que será comentado des-
pués. En efecto, se puede mantener la secuencia de aleatorización oculta y,
sin embargo, tratarse de un ensayo en el que se compara un procedimiento
quirúrgico con uno médico y, por tanto, es un ensayo abierto.
A efectos de lectura, la no comunicación de la secuencia suele asociarse a
otros déficits metodológicos. En cuanto a la OSA, hay consistente evidencia
empírica (9,10) de que su ausencia provoca una sobrestimación del efecto
4. LECTURA CRÍTICA DE ESTUDIOS DE TRATAMIENTO. ENSAYOS CLÍNICOS ALEATORIOS 45
de hasta el 40%, y es, sin duda, una de las más importantes causas de sesgo
en los ECA.
Encargar la aleatorización a la farmacia o unidad de ensayos/
epidemiología del centro, el uso de sobres opacos ordenados y numerados,
o una central de aleatorización son los métodos de afrontar el problema.
Un aspecto final que se debe señalar es que el uso de bloques y la minimi-
zación pueden, en algunos casos, hacer predecible la siguiente asignación,
y con ello desocultar la secuencia de aleatorización; esto debe ser también
considerado en la lectura.
PÉRDIDAS DE DATOS
Cualquiera que sea el mecanismo de producción de esta ausencia de
información, el resultado es que se pone en peligro el valor proporcionado
por la aleatorización. Ya no se puede asegurar el balance inicial de los
grupos y, como veremos, no es posible un verdadero análisis por intención
de tratamiento. El resultado neto del sesgo de atrición (attrition bias) no es
previsible y requiere una evaluación específica del mismo en cada ensayo.
Para su detección pueden ser de ayuda las normas de CONSORT y,
en particular, el flujograma que permite ver lo acontecido en el tiempo a
todos los pacientes seleccionados y aleatorizados. También puede ser útil
que la tabla 1 recomendada por CONSORT, que presenta las principales
características basales de los pacientes en cada grupo de tratamiento según
la aleatorización inicial, se expanda, presentando para cada grupo las
46 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
jetivos principales del AIT son dos (13). En primer lugar, mantener la
comparabilidad de los grupos que se alcanza tras una adecuada aleato-
rización, minimizando el sesgo de confusión. En segundo lugar, acercar
las controladas condiciones del ECA hacia el mundo de la práctica real,
en el que los pacientes fallecen antes de finalizar el tratamiento, dejan de
acudir a citas de revisión, se cambian de domicilio o violan algún criterio
de inclusión, lo que obliga a sacarlos del ensayo.
CEGADO (ENMASCARAMIENTO)
Entendemos por cegado o enmascaramiento en un ECA el procedimiento
por el cual se asegura que los participantes, los investigadores, los recolec-
tores de los datos o los que los analizan desconozcan qué intervención se
administra a cada participante. La figura 4-1 muestra algunas definiciones
relacionadas con los distintos tipos de cegado.
48 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
FIGURA 4-1 Algunas definiciones relacionadas con el cegado en los ensayos clínicos
aleatorios. ECA, ensayo clínico aleatorizado.
El posible impacto del cegado sobre las estimaciones depende del tipo
de cegado, pero también del tipo de variable que se va a medir. Teóri-
camente, el cegamiento o su ausencia pueden influir en tres aspectos.
Por una parte, pueden influir en que la solicitud y/o administración de
cuidados sea diferencial en uno u otro grupo. Por otra, pueden afectar a la
evaluación independiente de los desenlaces (por el clínico, el investigador,
o por el propio paciente). Finalmente, en los casos en los que mantenerse
4. LECTURA CRÍTICA DE ESTUDIOS DE TRATAMIENTO. ENSAYOS CLÍNICOS ALEATORIOS 49
RESULTADOS
Los ECA se llevan a cabo para valorar si una determinada interven-
ción es efectiva y segura, o si proporciona alguna ventaja en términos de
riesgo/beneficio sobre una intervención de referencia. La decisión se
basará en el análisis comparativo de los resultados obtenidos en cada
grupo de intervención.
Es importante determinar cuál es la escala de medida de la variable de
desenlace principal, pues esta, a su vez, condiciona la técnica de análisis es-
tadístico y la forma de presentación de los resultados. Si la variable principal
se mide en una escala continua (p. ej., el nivel sanguíneo de un parámetro
bioquímico o la puntuación de calidad de vida relacionada con la salud
medida con el cuestionario SF-36), la forma habitual de expresar el resultado
sería proporcionar la diferencia media entre el resultado observado en el
grupo experimental y el del grupo de referencia, añadiendo información
sobre la precisión de esta estimación en forma de error estándar de la misma
o suministrando su IC. Generalmente se aconseja utilizar variables de gran
relevancia clínica, y entre ellas destacamos aquellas de tipo dicotómico o
binario (sí/no), pues se acomodan bien a la forma de trabajo del profesional
asistencial (tiene/no tiene este problema, le trato/no le trato, se cura/no se
cura, etc.). En este caso, deberemos siempre buscar los números «crudos»
(es decir, en cuántos pacientes se evaluó el desenlace y en cuántos se detectó
el resultado de interés). De esta forma se clarificará si se analizó a todos
los pacientes aleatorizados o a un subgrupo determinado. Además, con
sencillas herramientas de cálculo epidemiológicas, el clínico entrenado y
con ganas podrá fácilmente obtener y valorar a partir de ellos algunos es-
timadores del efecto quizá no presentados en el artículo y que pueden ser
de utilidad interpretativa.
Con este tipo de variables podremos encontrar los siguientes descriptores
de los resultados:
• El riesgo o probabilidad de desarrollar el desenlace de interés
(p. ej., curación) en el grupo de intervención experimental
o el del correspondiente grupo de referencia; este riesgo podrá
ser presentado en forma de una proporción (número decimal entre
0 y 1) o de un porcentaje (en escala de 0 a 100).
• La diferencia de riesgos (DR), también llamada reducción
absoluta del riesgo (RAR), refleja la diferencia en la probabilidad
de ocurrencia del desenlace entre los grupos. Una reducción de
0 equivale a igualdad de riesgo en los grupos y, por tanto, a
la ausencia de efectos diferentes de las intervenciones que se
comparan. Si se obtiene un resultado distinto de 0, habrá que valorar
la magnitud y el sentido de la diferencia.
• El llamado número necesario de pacientes que hay que tratar
(NNT). Es el inverso de la DR (RAR) y nos informa del efecto
4. LECTURA CRÍTICA DE ESTUDIOS DE TRATAMIENTO. ENSAYOS CLÍNICOS ALEATORIOS 51
APLICABILIDAD
Hasta el momento se han revisado los principales aspectos metodológi-
cos que pueden condicionar la validez interna de un ECA, es decir, aque-
llos aspectos que pueden llevar a cuestionar su calidad desde el punto de
vista epistemológico. Pero la lectura crítica, como herramienta básica de la
práctica basada en la evidencia, necesita ir un paso más allá para traspasar
la frontera que separa el pensar del hacer, y para ello es imprescindible que
el lector analice la aplicabilidad de los ECA a su actividad clínica real, ex-
plorando la validez externa de sus hallazgos.
Entendemos por aplicabilidad la medida en que los efectos observados en
los estudios publicados corresponderán a los resultados esperados cuan-
do una intervención específica se aplique a la población de interés bajo
ARTÍCULO
CUADRO 4-1
E VA L U A C I Ó N C R Í T I C A D E L A R T Í C U L O
PROPUESTO (PLANTILLA CASPE)
A) ¿Son válidos los resultados del ensayo?
Preguntas de eliminación
1. ¿Se orienta Sí ✓ No sé No
el ensayo a La población estaba constituida por pacientes de 65 años
una pregunta o más, ingresados y expuestos a antibióticos orales o
claramente intravenosos en los 7 días previos o que iban a iniciar el
definida? tratamiento en breve. Se excluyeron pacientes en los que
PISTA: una pregunta ya existía diarrea, inmunocomprometidos, dependientes o
debe definirse en necesitados de cuidados intensivos, portadores de válvulas
términos que se cardíacas, con DCD en los 3 meses previos, con enfermedad
definen con el inflamatoria intestinal que hubiera precisado tratamiento
acrónimo PIO: en los 12 meses previos, con sospecha de pancreatitis
– La población de aguda, alimentados por yeyuno, con anomalías de los
estudio vasos mesentéricos, con historia de reacciones adversas
– La previas a preparaciones microbianas o que se negaron a
intervención abandonar el uso de preparaciones microbianas en uso.
realizada La intervención consistió en la administración de
– Los resultados un preparado liofilizado de 6 × 1010 bacterias vivas
(outcomes) compuesto por diversas cepas de Lactobacillus acidophilus,
considerados Bifidobacterium bifidum y B. lactis en la dosis de una
cápsula diaria durante 21 días con comidas y a ser
posible entre las tomas de antibiótico, que se comparó
con placebo de aspecto similar.
Los outcomes o resultados primarios que se midieron
fueron la aparición de DAA en las ocho semanas
siguientes a la inclusión en el ensayo y/o DCD en las 12
semanas siguientes. Se consideró DAA la evacuación de
tres o más heces diarreicas en un período de 24 h y que
se produjo asociada a tratamiento antibiótico sin que se
pudieran detectar patógenos o explicaciones alternativas,
mientras que se requirió detección de toxina de C. difficile
para considerar la DCD. Finalmente, se incluyeron como
resultados secundarios la duración y gravedad de la
DAA y la DCD, los síntomas abdominales, los eventos
adversos graves, la duración de la estancia hospitalaria,
la aceptabilidad del preparado microbiano y la calidad de
vida (escala SF12 v2).
4. LECTURA CRÍTICA DE ESTUDIOS DE TRATAMIENTO. ENSAYOS CLÍNICOS ALEATORIOS 55
2. ¿Fue aleatoria la Sí ✓ No sé No
asignación a los La aleatorización se llevó a cabo por bloques de
tratamientos? tamaño variable generados por un ordenador en
¿Se mantuvo oculta proporción 1:1, estratificando por centro. Este modelo
la secuencia de de aleatorización por bloques permitió que, a pesar
aleatorización? del elevado número de participantes (2.981), estos se
distribuyeran en los grupos de manera muy similar
(1.493 en el grupo activo y 1.488 en el grupo placebo).
La secuencia de aleatorización no estuvo disponible
para ninguno de los miembros del equipo de
investigación durante el reclutamiento ni durante el
seguimiento, por lo que puede afirmarse que se respetó
la ocultación de la secuencia de aleatorización.
Dada la presumible seguridad de los probióticos, no
hubo copias disponibles de las claves para ser abiertas
en caso de efectos adversos y así poder conocer con
certeza qué contenía la cápsula que estaba tomando un
paciente concreto
© Elsevier. Fotocopiar sin autorización es un delito.
(Continúa)
56 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
3. ¿Fueron Sí ✓ No sé No
adecuadamente En el ensayo se declara que se hizo el análisis de resultados
considerados tanto de eficacia como de seguridad de acuerdo con un
hasta el final del modelo de intención de tratar «modificado», de manera que
estudio todos se excluyó a los pacientes que abandonaron inmediatamente
los pacientes tras la aleatorización, a los que no recibieron la intervención
que entraron o de los que no se disponía de datos de seguimiento. Ello
en él? supuso la pérdida de 23 pacientes en el grupo activo (1,54%)
– ¿El y de 17 (1,14%) en el grupo placebo, pérdidas que pueden
seguimiento considerarse como razonables.
fue completo? Llaman la atención dos aspectos que justifican la
– ¿Se etiqueta de «modificado»: en uno de los grupos se excluyó
interrumpió del análisis a seis pacientes porque habían sido reclutados
precozmente el dos veces en el ensayo a lo largo del tiempo.
estudio? Aunque el protocolo no hace ninguna mención a que un
– ¿Se analizaron paciente solo pueda ser reclutado una vez y técnicamente
los pacientes eran pacientes elegibles, los investigadores decidieron, en
en el grupo contra de un criterio puro de «intención de tratamiento»,
al que fueron retirarlos del análisis. Los investigadores probablemente se
aleatoriamente encontraron con una «laguna inesperada» en el protocolo
asignados? y decidieron retirarlos, considerando que la segunda
participación de los pacientes podría estar «contaminada»
por la primera y posiblemente también que eran solo seis
casos. El otro aspecto llamativo es que hubo siete casos (seis
en el grupo de intervención y uno en el grupo placebo) en
los que no se pudo saber qué habían tomado, al haberse
producido un error en el etiquetado de los contenedores
de la medicación. Si disponemos de la secuencia de
aleatorización y es posible identificar a los pacientes a partir
de ella, el principio de intención de tratamiento llevado a sus
últimas consecuencias nos obligaría a incluir a esos pacientes
en el grupo de tratamiento determinado por la secuencia (el
tratamiento que el proceso de aleatorización seleccionó). Los
investigadores retiraron a los pacientes del análisis.
De forma complementaria, realizaron un análisis de los
pacientes seleccionados de acuerdo con el cumplimiento
total o de un grado mínimo del protocolo (análisis por
protocolo). Este análisis está, en general, más sujeto a
posibles sesgos en la determinación de a qué individuos
se analiza y a cuáles no. En este ensayo, los autores no
presentan los resultados, pero indican que llevan a las
mismas conclusiones
4. LECTURA CRÍTICA DE ESTUDIOS DE TRATAMIENTO. ENSAYOS CLÍNICOS ALEATORIOS 57
(Continúa)
58 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
(Continúa)
60 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
11. ¿Los Sí No sé No ✓
beneficios que A pesar de la excelente tolerabilidad de los probióticos,
se esperan los resultados negativos del ensayo, con no detección
obtener de diferencias entre probióticos y placebo en todos los
justifican los resultados considerados, hacen inefectiva la intervención
riesgos y los estudiada. No hay ninguna certeza de que se vayan a
costes? obtener beneficios clínicos
Es improbable que
pueda deducirse
del ensayo, pero
¿qué piensas tú al
respecto?
DAA, diarrea asociada a antibióticos; DCD, diarrea por Clostridium difficile; IC 95%, intervalo
de confianza al 95%; NNT, número necesario de pacientes que hay que tratar; OR, odds ratio;
RAR, reducción absoluta del riesgo; RR, riesgo relativo.
Ello requeriría, sin embargo, un tremendo esfuerzo por parte del clínico,
leyendo y evaluando varios ensayos, salvo que ese trabajo ya haya sido
realizado y sea accesible.
En el escenario planteado, resulta difícil concluir algo definitivo acerca
de la superioridad de los probióticos, dadas las evidencias contradictorias
entre el ensayo y el metaanálisis. A la hora de aplicarlas a nuestro paciente,
Julio, habría que considerar también otros factores de riesgo de DAA, como
la ingesta o no de inhibidores de la bomba de protones. Finalmente, y
sopesando las ambigüedades existentes, la mejor solución pasará, sin duda,
por la decisión conjunta y valorada entre Julio y tú.
Bibliografía
1. Glasziou P, Chalmers I, Rawlins M, McCulloch P. When are randomised trials unnecessary?
Picking signal from noise. BMJ. 2007;334:349-351.
2. Higgins JPT, Altman DG, Sterne JAC on behalf of the Cochrane Statistical Methods Group
and the Cochrane Bias Methods Group. Chapter 8: Assessing risk of bias in included
studies. En: Higgins JPT, Green S, editors. Cochrane Handbook for Systematic Reviews
of Interventions. Version 5.1.0 [updated March 2011]. The Cochrane Collaboration; 2009.
Disponible en: www.cochrane-handbook.org.
3. Montori V, Devereaux PJ, Adhikari NK, Burns KE, Eggert CH, Briel M, et al. Randomized
trials stopped early for benefit: a systematic review. JAMA. 2005;294:2203-2209.
4. Cannistra SA. The ethics of early stopping rules: who is protecting whom? J Clin Oncol.
2004;22:1542-1545.
5. Montori VM, Permanyer-Miralda G, Ferreira-González I, Busse JW, Pacheco-Huergo V,
Bryant D, et al. Validity of composite end points in clinical trials. BMJ. 2005;330:594-596.
6. McPherson GC, Campbell MK, Elbourne R. Use of randomization in clinical trials. Trials.
2012;13:198.
7. Altman DG, Bland JM. Treatment allocation by minimisation. BMJ. 2005;330:843.
8. Schulz KF, Grimes DA. Allocation concealment in randomised trials: defending against
deciphering. Lancet. 2002;359:614-618.
9. Schulz KF, Chalmers I, Hayes RJ, Altman DG. Empirical evidence of bias. Dimensions of
methodological quality associated with estimates of treatment effects in controlled trials.
© Elsevier. Fotocopiar sin autorización es un delito.
JAMA. 1995;273:408-412.
10. Wood L, Egger M, Gluud LL, Schulz KF, Juni P, Althman DG, et al. Empirical evidence
of bias in treatment effect estimates in controlled trials with different interventions and
outcomes: meta-epidemiological study. BMJ. 2008;336:601-605.
11. Dumville JC, Torgerson DJ, Hewitt CE. Reporting attrittion in randomised controlled trials.
BMJ. 2006;969-971.
12. Thabane L, Mbuagbaw L, Zhang S, Samaan Z, Marcucci M, Ye Ch, et al. A tutorial on sen-
sitivity analyses in clinical trials: the what, why, when and how. BMC Med Res Methodol.
2013;13:92.
13. Montori VM, Guyatt GH. Intention-to-treat principle. CMAJ. 2001;165:1339-1341.
14. Egger M, Ebrahim S, Smith GD. Where now for meta-analysis? Int J Epidemiol.
2002;31:1-5.
15. Chan AW, Hrobjartson A, Haahr MT, Gotzszhe P, Althman DG. Empirical evidence for
selective reporting of outcomes, in randomized trials: comparison of protocols to published
articles. JAMA. 2004;291:2457-2465.
16. Chan AW, Althman DG. Identifying outcome reporting bias in randomized trial son
Pubmed review of publications and survey of authors. BMJ. 2005;330:753.
62 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
17. Dwan K, Altman DG, Arnaiz JA, Bloom J, Chan AW, Cronin E, et al. Systematic review of
the empirical evidence of study publication bias and outcome reporting bias. PLoS ONE.
2008;3:e3081.
5
Lectura crítica de estudios
de tratamiento.
Revisiones sistemáticas
de ensayos clínicos aleatorios
Vicente Ruiz García, Rafael Carbonell Sanchís
e Iratxe Urreta Barallobre
INTRODUCCIÓN
solución es una visión de conjunto, pues valorar todos los estudios re-
quiere mucho tiempo y podríamos encontrar que los estudios muestren
resultados diferentes, bien porque se han realizado en diferentes lugares,
con diferentes grupos de personas, con diferentes estados evolutivos de
enfermedad y/o con tratamientos no exactamente iguales. Por otra parte,
la velocidad con que se publican nuevos estudios impide estar seguros
de que conocemos toda la información sobre un aspecto determinado de
un problema.
Las revisiones de la literatura médica son una buena solución a este
problema, pues presentan una visión de un determinado problema médico,
bien sobre tratamiento, diagnóstico o pronóstico.
Las RS pueden ser de estudios observacionales, de pruebas diagnós-
ticas o pronósticos, pero su uso más generalizado es sobre estudios de
tratamiento, es decir, con ensayos clínicos (EC). Frecuentemente pueden ir
acompañadas de un metaanálisis, que es la combinación estadística de los
resultados de diferentes estudios independientes sobre un mismo tema.
Como continuación del capítulo 4, en este capítulo abordaremos las RS de
estudios sobre efectividad de un tratamiento.
ESCENARIO
PICO
La RS debe responder a una pregunta claramente formulada. La mejor
forma de hacerlo es mediante el acrónimo PICO, ya comentado al abordar
el EC en el capítulo 3.
P (participantes). Los participantes en las RS son los estudios
originales, en este caso los EC realizados sobre pacientes que
66 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
CUADRO 5-1
E J E M P L O D E P R E G U N TA
B I E N F O R M U L A D A A T R AV É S
D E L A C R Ó N I M O P I C O . PA C I E N T E S ,
I N T E RV E N C I Ó N , C O M P A R A C I Ó N
Y O U T C O M E ( R E S U LT A D O )
Participantes
• Adultos con EPOC moderada, estables
Intervención
• b2 adrenérgicos inhalados
Comparación
• Corticoides inhalados
Outcome
• Ingresos hospitalarios por reagudización
• Sensación de disnea
• Pruebas funcionales respiratorias
• Efectos adversos
SESGO DE PUBLICACIÓN
Resulta imposible asegurar que una RS incluye todos los estudios exis-
tentes sobre un tema. Puede ocurrir que algunos ensayos no estén publica-
dos, bien porque no han finalizado o porque los autores o los patrocinadores
no lo han considerado oportuno. Se sabe que los estudios financiados por la
industria farmacéutica tienen más posibilidades de ser publicados. También
se publican antes si incluyen resultados clínicos en vez de resultados su-
brogados, o si incluyen tamaños muestrales de más de 1.000 pacientes y
muestran resultados positivos (3).
Cuando se revisaron todos los ensayos producidos sobre 12 antidepresi-
vos registrados en la FDA, se comprobó que, de los 38 que dieron resultados
a favor del fármaco, 37 se publicaron. Sin embargo, de los 36 ensayos que
dieron un resultado en contra del fármaco, solo tres se publicaron (4).
Esta clara asimetría deja claro que, además de las tradicionales fuentes
de información, que son las publicaciones científicas, necesitamos buscar
más información al respecto.
Hoy en día, la información sobre un fármaco como Tamiflu® para la gripe
sigue siendo privada por parte de la industria (5,6).
Esta diferencia entre lo que se produce científicamente y lo que se publica
es un grave problema de características éticas, porque induce a la pres-
cripción de productos que no son eficaces, con la consiguiente repercusión
sobre la salud de las personas y el coste adicional que supone para finan-
ciadores y pacientes. En realidad, es un problema en el que estamos todos
concernidos como científicos, pero también como ciudadanos, y en el que
todos los responsables (reguladores como la Food and Drug Administration
y la European Medicines Agency, promotores de la industria farmacéutica,
comités de EC, asociaciones de pacientes y ciudadanos en general, enfermos
o potencialmente enfermos en cualquier caso) deberíamos apoyar la trans-
parencia al respecto. Iniciativas como Alltrials.org se han desarrollado para
presionar a que toda la investigación producida sea pública en el menor
tiempo posible.
Cuando los autores o patrocinadores deciden no publicar cierto material
del ensayo por la magnitud del resultado, la dirección del mismo o la significa-
ción estadística, se produce un sesgo conocido como reporting bias (7). Cuando
5. LECTURA CRÍTICA DE ESTUDIOS DE TRATAMIENTO. REVISIONES SISTEMÁTICAS... 69
FIGURA 5-1 Funnel plot de una revisión sistemática. La distribución de los estudios a
ambas partes del verdadero efecto sugiere que no existe sesgo de publicación, pues los es-
tudios de menor tamaño muestral por azar se supone que se distribuirían a ambos lados del
gráfico de forma parecida.
70 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
FIGURA 5-2 Funnel plot de una revisión sistemática. La falta de estudios a la derecha de
la línea media sugiere un posible sesgo de publicación.
HETEROGENEIDAD
Parece lógico que los estudios incluidos en una RS y en un metaanálisis
presenten resultados diferentes entre ellos. El lector de la RS debe juzgar si
esa diferencia en los resultados se debe a motivos identificables. Diferentes
dosis, diferentes estados evolutivos de enfermedad, diferentes compara-
dores, diferente extracción de los enfermos pueden producir resultados
similares, pero no exactamente iguales.
Existen diferentes formas de evaluar la heterogeneidad. Una de ellas es
explorando visualmente el gráfico forest plot, gráfico del que hablaremos
más adelante. De momento, podemos avanzar que, cuando las estimaciones
72 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
TABLA 5-1 Riesgo de sesgo del resultado «incremento del apetito» a través de los
diferentes ensayos de una revisión
Libre de
Generación Ocultación Datos de comunicación Libre
de secuencia de la resultados selectiva de de otros
Apetito adecuada secuencia Cegamiento incompletos resultados sesgos
Estudio Bajo riesgo No claro/ Bajo riesgo Bajo riesgo No claro/ No claro/
A de sesgo incierto de sesgo de sesgo incierto incierto
Estudio No claro/ No claro/ Bajo riesgo Bajo riesgo Bajo riesgo No claro/
B incierto incierto de sesgo de sesgo de sesgo incierto
Estudio No claro/ No claro/ Alto riesgo Bajo riesgo Bajo riesgo No claro/
C incierto incierto de sesgo de sesgo de sesgo incierto
Estudio No claro/ No claro/ Alto riesgo Bajo riesgo Bajo riesgo No claro/
D incierto incierto de sesgo de sesgo de sesgo incierto
Estudio No claro/ No claro/ Alto riesgo Bajo riesgo Bajo riesgo No claro/
E incierto incierto de sesgo de sesgo de sesgo incierto
CUADRO 5-2
G U Í A A P R O X I M A D A PA R A
I N T E R P R E TA R H E T E R O G E N E I D A D
• Del 0 al 40%: puede no ser importante
• Del 30 al 60%: puede representar heterogeneidad moderada
• Del 50 al 90%: puede representar heterogeneidad significativa
• Del 75 al 100%: heterogeneidad considerable
Tomado de Cochrane Handbook for Systematic Reviews of Interventions. 2nd edition.
Chichester: Wiley; 2011. 672 p.
5. LECTURA CRÍTICA DE ESTUDIOS DE TRATAMIENTO. REVISIONES SISTEMÁTICAS... 73
FIGURA 5-3 Forest plot que mide el riesgo de mejorar en la cefalea con el nuevo tratamiento
en relación con el tratamiento control. El valor de I2 es de cero, no sugiriendo heterogeneidad
estadística.
FIGURA 5-4 Forest plot que compara la mortalidad de un nuevo tratamiento para la cefalea.
Los IC 95% de todos los estudios no se solapan y la I2 es del 63%, sugiriendo heterogeneidad
importante.
5. LECTURA CRÍTICA DE ESTUDIOS DE TRATAMIENTO. REVISIONES SISTEMÁTICAS... 75
ANÁLISIS DE SENSIBILIDAD
El análisis de sensibilidad pretende estudiar la influencia de cada
uno de los estudios en la estimación global del efecto y, por lo tanto, la
robustez o estabilidad de la medida final obtenida. Este análisis consiste
en la repetición del metaanálisis tantas veces como estudios seleccionados,
de forma que cada vez se omite un estudio, combinándose todos los res-
tantes. Si los resultados de los distintos metaanálisis son similares, esto
es, el efecto tiene una misma dirección, magnitud y significación estadís-
tica, se puede concluir que los resultados son robustos. En caso contrario,
no se tendría un estimador robusto, lo cual exigiría cierta precaución
5. LECTURA CRÍTICA DE ESTUDIOS DE TRATAMIENTO. REVISIONES SISTEMÁTICAS... 77
tado representado en esa RS. Exige conocer no solo los resultados, sino
la información primaria de la que se ha extraído. Veamos qué aspectos
son importantes a la hora de valorar la aplicabilidad a nuestros pacientes
concretos.
• Existencia de diferencias demográficas importantes entre los pacientes del
estudio y los comunitarios. Aproximadamente un 60% de los enfermos
con insuficiencia cardíaca tienen insuficiencia renal con filtrado
glomerular inferior al 15%, y estos enfermos tienen un peor
pronóstico (11). Sin embargo, una parte importante de ensayos
con inhibidores de la enzima convertidora de angiotensina (IECA),
b-bloqueantes y espironolactona excluyen a estos enfermos
de los ensayos (12). Esta cuestión es importante, porque estudios
poblacionales han cuestionado los resultados de EC como el RALES,
78 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
ARTÍCULO
© Elsevier. Fotocopiar sin autorización es un delito.
Marcolino MS, Maia JX, Alkmim MB, Boersma E, Ribeiro AL. Teleme-
dicine application in the care of diabetes patients: systematic review and
meta-analysis. PLoS One. 2013;8(11):e79246. Disponible en: http://www.
plosone.org/article/info%3Adoi%2F10.1371%2Fjournal.pone.0079246#po-
ne-0079246-g004.
CUADRO 5-3
E VA L U A C I Ó N C R Í T I C A D E L A R T Í C U L O
PROPUESTO (PLANTILLA CASPE)
A) ¿Los resultados de la revisión son válidos?
Preguntas de eliminación
1. ¿Se hizo la Sí ✓ No sé No
revisión sobre un Población: adultos con DM tipo 1 y 2. Cita los criterios
tema claramente de exclusión: diabetes gestacional, imposibilidad de
definido? establecer feedback o seguimiento inferior a 6 meses, etc.
PISTA: un tema debe Intervención: estrategia de aplicación de
ser definido en telemedicina en el cuidado de los pacientes.
términos de: Por telemedicina se pueden entender cosas muy
– La población de distintas, desde teleconsultas hasta programas a través
estudio de internet o dispositivos desde los que envías los
– La intervención niveles de glucemia a distancia, etc.
realizada Comparación: grupo con el cuidado habitual (no está
– Los resultados definido).
(outcomes) Resultados: primario (cambio en términos
considerados absolutos en la HbA1c), secundarios (cambio en
términos absolutos en el LDL-c, presión arterial
sistólica, presión arterial diastólica e IMC). La
HbA1c es un resultado intermedio (subrogate
outcome), pero no es un resultado clínico relevante y,
en cualquier caso, no es un outcome «centrado en el
paciente»
2. ¿Buscaron los Sí ✓ No sé No
autores el tipo Buscaron artículos cuya pregunta era el objeto de la
de artículos revisión.
adecuado? Buscaron ensayos clínicos, que es el diseño
PISTA: el mejor «tipo apropiado para responder esta pregunta
de estudio» es el
que:
– Se dirige a la
pregunta objeto
de la revisión
– Tiene un diseño
apropiado para
la pregunta
5. LECTURA CRÍTICA DE ESTUDIOS DE TRATAMIENTO. REVISIONES SISTEMÁTICAS... 81
(«No es oro todo lo que reluce», tratada en el capítulo 4. Habría que analizar
El Mercader de Venecia, también la calidad a través de los outcomes, pero
Acto II) no se hizo mediante GRADE.
Los estudios con pérdidas > 20% o > 5% que
no hacían análisis por intención de tratar fueron
excluidos. Quizás este problema podría haber
sido resuelto haciendo análisis de sensibilidad
con estos estudios y verificando si los resultados
son consistentes.
Evalúan el sesgo de publicación de manera
gráfica (funnel plot) y a través del test de Egger, y
dicen que puede existir un sesgo de publicación.
Tras aplicar el método de trim-and-fill, comentan
que este sesgo no interfiere en la interpretación
de los resultados
(Continúa)
82 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
(Continúa)
84 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
9. ¿Se han Sí No sé No ✓
considerado No se evalúan resultados clínicamente importantes,
todos los como mortalidad, eventos cardiovasculares, ingresos
resultados hospitalarios por descompensación, molestias para
importantes los enfermos, coste del programa, etc. No se ha
para tomar la medido la sensación de enfermedad o su refuerzo
decisión? sobre los pacientes que produce la telemedicina. No
sabemos si en la intervención se produjeron errores,
como hipoglucemias o ingresos por hiperglucemias.
No sabemos la satisfacción global de la misma. Son
resultados a corto plazo y de resultados intermedios en
salud, que no deberían servir para extrapolar y llegar
a algún tipo de convencimiento sobre si realmente
reducirán las complicaciones agudas (cetoacidosis,
ingresos, hipoglucemias) y las que aparecerán a largo
plazo: mortalidad, cardiovasculares, neurológicas,
amputaciones, ceguera, etc.
5. LECTURA CRÍTICA DE ESTUDIOS DE TRATAMIENTO. REVISIONES SISTEMÁTICAS... 85
Bibliografía
1. Marcolino MS, Maia JX, Alkmim MBM, Boersma E, Ribeiro AL. Telemedicine applica-
tion in the care of diabetes patients: systematic review and meta-analysis. PloS One.
2013;8(11):e79246.
2. Oxman AD, Guyatt GH. The science of reviewing research. Ann N Y Acad Sci.
1993;703:125-133. discussion 133-4.
3. Gordon D, Taddei-Peters W, Mascette A, Antman M, Kaufmann PG, Lauer MS. Pu-
blication of trials funded by the National Heart, Lung, and Blood Institute. N Engl J Med.
2013;369(20):1926-1934.
4. Turner EH, Matthews AM, Linardatos E, Tell RA, Rosenthal R. Selective publication of
© Elsevier. Fotocopiar sin autorización es un delito.
antidepressant trials and its influence on apparent efficacy. N Engl J Med. 2008;358(3):
252-260.
5. Doshi P, Jefferson T, Del Mar C. The Imperative to Share Clinical Study Reports: Recom-
mendations from the Tamiflu Experience. PLoS Med. 2012;9(4):e1001201.
6. Jefferson T, Jones MA, Doshi P, Del Mar CB, Hama R, Thompson MJ, et al. Risk of bias in
industry-funded oseltamivir trials: comparison of core reports versus full clinical study
reports. BMJ Open. 2014;4(9):e005253.
7. Dwan K, Altman DG, Arnaiz JA, Bloom J, Chan A-W, Cronin E, et al. Systematic Review of
the Empirical Evidence of Study Publication Bias and Outcome Reporting Bias. Siegfried
N, editor. PLoS ONE. 2008;3(8):e3081.
8. Higgins JPT, Green S. Cochrane Handbook for Systematic Reviews of Interventions. 2nd
edition Chinchester: Wiley; 2011. p. 672.
9. Latour-Pérez J, Cabello-López JB. Early interruption of clinical trials: too good to be true?
Med Intensiva. 2007;31(9):518-520.
10. Murad MH, Montori VM, Ioannidis JPA, Jaeschke R, Devereaux PJ, Prasad K, et al. How
to Read a Systematic Review and Meta-analysis and Apply the Results to Patient Care:
Users’ Guides to the Medical Literature. JAMA. 2014;312(2):171.
86 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
11. McAlister FA, Ezekowitz J, Tonelli M, Armstrong PW. Renal insufficiency and heart failure:
prognostic and therapeutic implications from a prospective cohort study. Circulation.
2004;109(8):1004-1009.
12. Shlipak MG. Pharmacotherapy for heart failure in patients with renal insufficiency. Ann
Intern Med. 2003;138(11):917-924.
13. Pitt B, Zannad F, Remme WJ, Cody R, Castaigne A, Perez A, et al. The effect of spirono-
lactone on morbidity and mortality in patients with severe heart failure. Randomized
Aldactone Evaluation Study Investigators. N Engl J Med. 1999;341(10):709-717.
14. Juurlink DN, Mamdani MM, Lee DS, Kopp A, Austin PC, Laupacis A, et al. Rates of
hyperkalemia after publication of the Randomized Aldactone Evaluation Study. N Engl J
Med. 2004;351(6):543-551.
15. Bjørn M, Brendstrup C, Karlsen S, Carlsen JE. Consecutive screening and enrollment in
clinical trials: the way to representative patient samples? J Card Fail. 1998;4(3):225-230.
discussion 231.
16. Gurwitz JH, Col NF, Avorn J. The exclusion of the elderly and women from clinical trials
in acute myocardial infarction. JAMA. 1992;268(11):1417-1422.
17. Bayer A, Tadd W. Unjustified exclusion of elderly people from studies submitted to research
ethics committee for approval: descriptive study. BMJ. 2000;321(7267):992-993.
18. Bartlett C, Doyal L, Ebrahim S, Davey P, Bachmann M, Egger M, et al. The causes and
effects of socio-demographic exclusions from clinical trials. Health Technol Assess Winch
Engl. 2005;9(38):iii-iii10. ix-x, 1-152.
19. Jadad AR, To MJ, Emara M, Jones J. Consideration of multiple chronic diseases in rando-
mized controlled trials. JAMA. 2011;306(24):2670-2672.
20. Conde Martel A. Extrapolation of results from clinical trials to heart failure patients hos-
pitalized in Internal Medicine. Med Clin (Barc). 2014;142(10):463-467.
21. OMS. Informe sobre la situación mundial de las enfermedades no transmisibles 2010
[visitado el 28/10/2014]. Disponible en: http://www.who.int/nmh/publications/ncd_
report2010/es/.
22. Merlo J, Broms K, Lindblad U, Björck-Linné A, Liedholm H, Ostergren PO, et al. Association
of outpatient utilisation of non-steroidal anti-inflammatory drugs and hospitalised heart
failure in the entire Swedish population. Eur J Clin Pharmacol. 2001;57(1):71-75.
23. Clinical advisory. carotid endarterectomy for patients with asymptomatic internal carotid
artery stenosis. Stroke J Cereb Circ. 1994;25(12):2523-2524.
24. Wennberg DE, Lucas FL, Birkmeyer JD, Bredenberg CE, Fisher ES. Variation in carotid
endarterectomy mortality in the Medicare population: trial hospitals, volume, and patient
characteristics. JAMA. 1998;279(16):1278-1281.
25. Ruiz Garcia V, Jobanputra P, Burls A, Cabello JB, Vela Casasempere P, Bort-Marti S, et al.
Certolizumab pegol (CDP870) for rheumatoid arthritis in adults. Cochrane Database Syst
Rev. 2014;9:CD007649.
6
Lectura crítica de estudios
de diagnóstico
Ana Royuela Vicente, María Luisa Montes Ramírez
y Antonio Jesús Martín Mateos
INTRODUCCIÓN
ESCENARIO
(CP– igual a 1). Cuanto menos frecuente sea el resultado negativo en los
enfermos con respecto a los no enfermos, más información aporta y menor
será el valor del CP– (4).
Cociente de probabilidad positivo (CP+): cuánto más frecuente es
obtener un resultado positivo entre los enfermos que entre los no en-
fermos:
VP
sen
CP + = VP + FN =
FP 1 − esp
FP + VN
Cociente de probabilidad negativo (CP–): cuánto más frecuente es ob-
tener un resultado negativo entre los enfermos que entre los no enfermos:
FN
CP − = VP + FN = 1 − sen
VN esp
FP + VN
No te asustes con la fórmula; si lo piensas bien es muy fácil recordarla.
Si conocemos la sensibilidad de la prueba y su especificidad, solo tienes
que hacer un sencillo cálculo. Haz la prueba.
Tenemos una prueba diagnóstica con una sensibilidad del 95% y una es-
pecificidad del 90%. Si te fijas bien en la fórmula anterior, el cociente de pro-
babilidad positivo realmente es el cociente entre la sensibilidad y el «error»
de la especificidad (1 – esp); si la especificidad es del 90%, hay un 10% de
«error» en la especificidad, por tanto, nuestro ejemplo será 95/10 = 9,5. Para
el cociente de probabilidad negativo, usaremos el «error» de la sensibilidad
(1 – sen) y la especificidad, en nuestro ejemplo 5/90 = 0,055.
Antes de realizar una prueba diagnóstica, la probabilidad de padecer
© Elsevier. Fotocopiar sin autorización es un delito.
ARTÍCULO
CUADRO 6-1
E VA L U A C I Ó N C R Í T I C A D E L A R T Í C U L O
PROPUESTO (PLANTILLA CASPE)
A) ¿Son válidos los resultados del estudio?
Preguntas de eliminación
1. ¿Existió una Sí ✓ No sé No
comparación con una
prueba de referencia Se utilizó el cultivo en medio de micobacterias
adecuada? como el patrón de oro, lo cual es correcto.
PISTA: ¿es correcto el patrón Además, se utilizó un segundo patrón
de oro? (no siempre se puede de oro incorporando criterios clínicos bien
aplicar el mismo patrón de oro definidos en aquellos pacientes con cultivo
a todos los pacientes) negativo
2. ¿Incluyó la muestra Sí ✓ No sé No
un espectro adecuado Para evitar los sesgos de selección, se
de pacientes? incluyeron todos los pacientes ingresados en
PISTAS: el hospital de Kampala por tos de más de 2
– ¿Están adecuadamente semanas de duración de manera consecutiva.
descritos los pacientes y Los pacientes incluidos tenían la sospecha de
cómo se seleccionaron? enfermedad
– Casi cualquier prueba
distingue entre sanos y
gravemente enfermos
(Continúa)
96 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
5. ¿La decisión Sí ✓ No sé No
de realizar el Todas las muestras recogidas se procesaron tanto
patrón de oro fue para el cultivo (patrón de oro) como para las pruebas
independiente del de estudio. Todas las muestras se clasificaron con los
resultado de la mismos criterios independientemente del resultado
prueba problema? del cultivo
PISTAS: Considera si:
– Se incluyeron
preferentemente
los resultados
positivos en la
prueba que se iba
a evaluar
– Se utilizaron
diferentes
patrones de oro en
los positivos y en
los negativos
6. Lectura crítica de estudios de diagnóstico 97
los intervalos
de confianza de
los cocientes de
probabilidad
(Continúa)
98 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
Bibliografía
1. Sackett DL, Haynes RB. The architecture of diagnostic research. BMJ. 2002 Mar
2;324(7336):539-541.
2. Van den Bruel A, Cleemput I, Aertgeerts B, Ramaekers D, Buntinx F. The evaluation of
diagnostic tests: evidence on technical and diagnostic accuracy, impact on patient outcome
and cost-effectiveness is needed. J Clin Epidemiol. 2007 Nov;60(11):1116-1122.
3. Jaeschke R, Guyatt GH, Sackett DL. Users’ guides to the medical literature. III. How to
use an article about a diagnostic test. B. What are the results and will they help me in
6. Lectura crítica de estudios de diagnóstico 99
caring for my patients? The Evidence-Based Medicine Working Group. JAMA. 1994 Mar
2;271(9):703-707.
4. Abraira V. Índices de rendimiento de las pruebas diagnósticas. SEMERGEN.
2008;28:193-194.
5. Fagan TJ. Letter: Nomogram for Bayes theorem. N Engl J Med. 1975 Jul 31;293(5):257.
6. Hanley JA, McNeil BJ. The meaning and use of the area under a receiver operating cha-
racteristic (ROC) curve. Radiology. 1982 Apr;143(1):29-36.
7
Lectura crítica de estudios
de pronóstico. Estudios de cohortes
Víctor Abraira, Alfonso Muriel García
y María Luisa Montes Ramírez
INTRODUCCIÓN
ESCENARIO
cirugía. Tras hacer una lectura crítica, lo comenta con Carmen y, dado que es
una prueba sencilla y barata, deciden hacerla; el resultado es de 1,15 mg/ml.
• ¿Crees que la determinación del dímero-D puede ayudar a predecir el
pronóstico de los pacientes con carcinoma gástrico?
• En el caso de Carmen, ¿crees que es aplicables esta prueba? ¿Puede
ayudarla a clarificar su pronóstico y tomar las decisiones personales
que necesita?
EN EL DISEÑO
Como se ha dicho en la introducción, y señalando en negrita los puntos
clave para la evaluación crítica de artículos de este tipo, el diseño óptimo
para establecer factores pronósticos es un estudio de cohortes, es decir,
un estudio en el que se selecciona un grupo de pacientes bien definido,
representativo de la población de estudio, en un momento homogéneo
de la enfermedad, al que se sigue en el tiempo para observar el evento o
eventos de interés durante un tiempo suficientemente prolongado.
Que un grupo de pacientes esté bien definido y sea representativo de la
población de interés depende de la pregunta de investigación. Por ejem-
plo, para responder a la pregunta de si el uso de antipsicóticos atípicos
aumenta el riesgo (es factor pronóstico) de padecer fractura de cadera
en ancianos, se debe comparar la frecuencia de fracturas en un grupo de
ancianos que toman antipsicóticos atípicos con la de otro grupo que no los
toma; ahora bien, este grupo puede estar formado por ancianos que no
tomen antipsicóticos o por ancianos que tomen otro tipo de antipsicóticos.
Es representativo, según el caso, un grupo de ancianos de la población
general o de ancianos con demencia (9).
Otro elemento clave para la validez de estos estudios es que, en el comienzo
del seguimiento, los pacientes se encuentren en un momento homogéneo de
la enfermedad. Es fácil de entender que si, por ejemplo, se quieren estudiar
factores pronósticos para pacientes infectados por el VIH, daría lugar a errores
(efecto cohorte) introducir en la cohorte pacientes naïve (que no han recibido
ningún tratamiento antirretroviral) junto con pacientes multitratados.
El elemento clave más relevante de estos estudios, que condiciona to-
dos los demás, es la elección del evento. Como ya se ha mencionado, con
frecuencia es la muerte, pero también hay otros eventos de interés, como
remisión, recidiva, rechazo del trasplante, aparición de la enfermedad, por
ejemplo, en pacientes con VIH, etc. El artículo debe tener una definición
clara y precisa del evento, o eventos, de interés (p. ej., si fuera muerte, es-
pecificar si es por todas las causas o por alguna causa específica o, si fuera
7. Lectura crítica de estudios de pronóstico. Estudios de cohortes 105
EN LOS RESULTADOS
En cuanto a los resultados de estos estudios, como se dijo en el apartado
© Elsevier. Fotocopiar sin autorización es un delito.
PRECISIÓN
Es importante destacar también que los índices citados en el apartado ante-
rior se calculan a partir de muestras, es decir, un subconjunto de los pacientes
de interés en lugar de todos ellos; por tanto, presentan una imprecisión que
se debe cuantificar por el intervalo de confianza (intervalo dentro del cual se
© Elsevier. Fotocopiar sin autorización es un delito.
FIGURA 7-1 Curvas de supervivencia en las que se cumple la asunción de riesgo relativo
constante, o riesgo proporcional. Obsérvese cómo se separan según avanza el tiempo.
108 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
FIGURA 7-2 Curvas de supervivencia en las que no se cumple la asunción de riesgo relativo
constante. Este sería un caso extremo en el que las curvas llegan a cruzarse, por lo que, para
tiempos menores del punto en el que se cruzan (150 meses), el riesgo de evento para los pacientes
sin ganglios (línea negra) es menor (supervivencia mayor) que para los pacientes con ganglios
(línea naranja); por lo tanto, el riesgo relativo es menor que 1 y, sin embargo, para tiempos mayores
que 150, la relación se invierte y el riesgo relativo es mayor que 1, es decir, no es constante.
FIGURA 7-3 Curvas de supervivencia con sus intervalos de confianza al 95% (IC 95%),
en los que se observa el aumento de anchura según avanza el tiempo.
CONFUSIÓN E INTERACCIÓN
La mayor amenaza para el estudio de asociaciones entre variables me-
diante estudios observacionales es la confusión. Existe confusión cuando
© Elsevier. Fotocopiar sin autorización es un delito.
la asociación entre dos variables difiere según que se considere, o no, otra
variable. A esta última variable se le denomina variable de confusión. Para
que una variable sea de confusión debe de estar asociada al factor y a la va-
riable evento. Por ejemplo, en el estudio para la estratificación pronóstica
de pacientes con linfoma esplénico de la zona marginal (3), se encontró que
los pacientes con concentración sérica elevada de la lactato deshidrogenasa
(LDH) tienen un riesgo de muerte por la enfermedad 3,38 veces mayor que
los que no la tienen. Sin embargo, como la supervivencia puede depender no
solo de la LDH, sino también de otras variables, como la edad, o los niveles
de otros componentes sanguíneos, podría ocurrir que, si los pacientes con
niveles altos de LDH fueran también diferentes respecto a esas otras varia-
bles, esa estimación del RR esté equivocada (confundida). En efecto, cuando
se consideran otras variables, el RR de la LDH cambia a 2,47. La manera más
usada y sencilla de controlar la confusión es, como se hizo en ese estudio,
110 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
ARTÍCULO
CUADRO 7-1
E VA L U A C I Ó N C R Í T I C A D E L A R T Í C U L O
PROPUESTO (PLANTILLA CASPE)
A) ¿Son válidos los resultados?
Preguntas de eliminación
1. ¿Fue una muestra Sí ✓ No sé No
representativa y bien definida Son 247 pacientes con cáncer gástrico
de pacientes en un momento probado patológicamente y sin terapia
similar en el curso de la paliativa previa atendidos en un
enfermedad? hospital de Shanghái entre 2002 y 2004.
PISTAS: Se permitió quimioterapia adyuvante si
– ¿De qué ámbito son los habían pasado más de 6 meses.
pacientes: atención primaria De ellos, 237 recibieron algún
o especializada? tratamiento quirúrgico (168
– ¿En qué punto de su gastrectomía radical, 46 gastrectomía
curso clínico se incluyen en el paliativa y 23 laparotomía exploratoria).
estudio? Después de la cirugía, 50 pacientes
fueron confirmados como diseminación
peritoneal
2. ¿Fue el seguimiento lo Sí ✓ No sé No
suficientemente prolongado Siguen a los pacientes mediante la
y completo? historia del hospital, el Registro de
PISTAS: Cáncer de Shanghái o el contacto con los
– El intervalo temporal entre un familiares.
factor pronóstico y un resultado El tiempo fue definido como el
es variable y puede ser muy intervalo entre la fecha de cirugía y el
largo último seguimiento o muerte debido a
– ¿Se pierden pacientes? ¿Se cáncer gástrico. Los pacientes fueron
investigan sus características? observados hasta el 31/12/2010
En resultados dicen que la mediana de
seguimiento fue 37 meses (1-48)
7. Lectura crítica de estudios de pronóstico. Estudios de cohortes 113
(Continúa)
114 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
8. ¿Conducen los Sí ✓ No sé No
resultados a Los autores sugieren que podría ser de gran ayuda
seleccionar o a evitar para predecir la diseminación y la supervivencia
un tratamiento? a medio plazo. En el caso de Carmen, si
decidimos que el factor racial no supone una
enorme diferencia, podría ayudarla a contemplar
un tratamiento menos agresivo y con menos
probabilidad de muerte a 4 años
Bibliografía
1. Hemingway H, Croft P, Perel P, Hayden JA, Abrams K, Timmis A, et al. Prognosis re-
search strategy (PROGRESS) 1: A framework for researching clinical outcomes. BMJ.
2013;346:e5595.
2. Krumholz HMM, Wang YP, Chen JM, Drye EEMS, Spertus JAM, Ross JSMM, et al. Re-
© Elsevier. Fotocopiar sin autorización es un delito.
8. Hingorani AD, Windt DA, Riley RD, Abrams K, Moons KG, Steyerberg EW, et al. Prognosis
research strategy (PROGRESS) 4: Stratified medicine research. BMJ. 2013;346:e5793.
9. Paula AR, Jerry HG, Kathy S, Muhammad M, David LS, Susan G, et al. Reader’s guide to
critical appraisal of cohort studies: 1. Role and design. BMJ. 2005;330:895-897.
10. U.S. Department of Health and Human Services Food and Drug Administration. Guidance
for Industry. Clinical Trail Endpoints for the Approval of Cancer Drugs and Biologics.
2007 [Visitado el 08/09/2014]. Disponible en: http://www.fda.gov/downloads/drugs-
GuidanceComplianceRegulatoyInformation/Guidance/UCM071590.pdf.
11. Abraira V, Muriel A, Emparanza JI, Pijoán JI, Royuela A, Plana MN, et al. Reporting quality
of survival analyses in medical journals still needs improvement. A minimal requirements
proposal. J Clin Epidemiol. 2013;66:1340-1346.
12. Pocock SJ, Clayton TC, Altman DG. Survival plots of time-to-event outcomes in clinical
trials: good practice and pitfalls. Lancet. 2002;359:1686-1689.
13. Muriel A, Hernández D, Abraira V. Modelos estructurales marginales: una herramienta
útil que proporciona evidencia a los estudios observacionales. Nefrología. 2011;2(Supl
Ext):7-13.
14. Aizer AA, Chen MH, McCarthy EP, Mendu ML, Koo S, Wilhite TJ, et al. Marital status and
survival in patients with cancer. J Clin Oncol. 2013;31:3869-3876.
15. Becker A, Bos Gt, de Vegt F, Kostense PJ, Dekker JM, Nijpels G, et al. Cardiovascu-
lar events in type 2 diabetes: comparison with nondiabetic individuals without and
with prior cardiovascular disease: 10-year follow-up of the Hoorn Study. Eur Heart J.
2003;24:1406-1413.
16. Pencina MJ, D’Agostino RB, Steyerberg EW. Extensions of net reclassification improvement
calculations to measure usefulness of new biomarkers. Stat Med. 2011;30:11-21.
8
Lectura crítica de estudios
de reglas de predicción clínica
José Ignacio Emparanza Knörr
y Alfonso Muriel García
INTRODUCCIÓN
ESCENARIO
TIPO DE DISEÑO
El mejor diseño de estudio (3) para desarrollar una RPC depende del
objetivo que esta persiga. Para RPC de tipo diagnóstico, optaríamos por un
estudio transversal, mientras que si se trata de una RPC de tipo pronóstico,
un estudio longitudinal de cohortes prospectivo, en el que las pérdidas
fueran mínimas, sería el diseño idóneo.
En analogía con la evaluación de las pruebas diagnósticas, para desarro-
llar una RPC diagnóstica, el diseño de estudio más adecuado es un estudio
transversal en el que reclutamos, de manera no sesgada, a una serie de
sujetos (representativos de la población de interés) susceptibles de tener
la enfermedad en los que evaluamos las variables que forman parte de la
regla de predicción y la prueba de referencia de forma simultánea. Como
la simultaneidad es difícil de cumplir, es necesario garantizar que el tiempo
entre la evaluación de las variables sea el mínimo para que la condición del
sujeto no cambie (no mejore/no empeore).
Preferimos un estudio de cohortes prospectivo con inclusión de pa-
cientes consecutivos frente a uno retrospectivo. La inclusión consecutiva
© Elsevier. Fotocopiar sin autorización es un delito.
TAMAÑO MUESTRAL
El tamaño muestral necesario para construir una RPC es difícil de de-
terminar, habida cuenta de la naturaleza multivariable de la RPC. Existe
una regla empírica que dice que son necesarios tantos individuos como
número de variables se quieren incorporar en la RPC multiplicado por 10
en la categoría de desenlace de menor tamaño. Así, si el desenlace ocurre en
una minoría de la cohorte (digamos el 10%) y queremos incluir siete varia-
bles predictoras, necesitaremos al menos 70 individuos con el desenlace
para estimar con suficiente poder estadístico los coeficientes del modelo:
70 individuos con el desenlace y 630 sin él, para una cohorte total de al
menos 700 individuos.
VARIABLES PREDICTORAS
Las variables (predictoras) que forman parte de una RPC pueden ser
de diversa índole:
• Demográficas (edad, sexo, etc.).
• De anamnesis (historia personal, síntomas, comorbilidades, etc.).
• De exploración física (signos, etc.).
• De exámenes complementarios (bioquímica, microbiología, pruebas
funcionales, etc.).
• De pruebas de imagen.
Las variables se recogen sin conocer el desenlace en los estudios pronós-
ticos, puesto que el desenlace es futuro. Sin embargo, en los estudios de RPC
diagnósticas, las variables predictoras son contemporáneas del desenlace,
que aquí es la enfermedad. En este caso, es deseable que se recojan las
variables predictoras sin conocer el verdadero estado del paciente (con
enfermedad o sin ella). De este modo, la evaluación de una variable no es-
tará influenciada de manera consciente o inconsciente por el conocimiento
del verdadero estado del paciente. Además, cuando las variables predic-
toras estén sujetas a variabilidad por parte del observador (evaluaciones
subjetivas), deberá medirse la variabilidad intra- e interobservador, por
ejemplo, mediante el índice k de Cohen.
Desde el punto de vista estadístico, las variables predictoras pueden ser
dicotómicas, categóricas o continuas. Es una práctica común el transformar
las variables predictoras continuas en variables categóricas o incluso en
dicotómicas, y las categóricas en dicotómicas. Ello permite al desarro-
llador de una RPC evitar el engorro de tener que comprobar diferentes
asunciones estadísticas entre la variable y el desenlace. Otra ventaja es la
de la simplicidad: se simplifican las tareas estadísticas necesarias, ya que
el análisis de una variable dicotómica es mucho más fácil que el de una
categórica y se simplifica la interpretación de los resultados. Y, sin embargo,
la pérdida de información es, en muchos casos, sustantiva. En particular,
la «dicotomización» de una variable continua puede tener consecuencias
8. Lectura crítica de estudios de reglas de predicción clínica 121
VARIABLES DESENLACE
La elección del desenlace es muy importante. En estudios diagnósticos
debe definirse claramente cuál es la enfermedad o condición y cuál será
el método para evaluar su presencia. Nos referimos habitualmente como
patrón de referencia o patrón oro a aquel método que permite establecer
con certeza la presencia o no de una enfermedad o condición. El problema,
en la práctica, puede ser la ausencia de tal patrón oro, y la elección de un
método subóptimo para el diagnóstico del verdadero estado del paciente.
122 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
MÉTODOS ESTADÍSTICOS
Hay tres grandes categorías de análisis estadísticos para desarrollar una
RPC: modelos de regresión, modelos de clasificación y redes neuronales.
Los más habituales son los modelos de regresión, que, dependiendo del tipo
de variable desenlace, se pueden clasificar en: modelos de regresión lineal
múltiple si el desenlace es una variable continua, modelos de regresión
logística múltiple si el desenlace es una variable binaria o dicotómica, y
modelos de regresión de Cox multivariantes si el desenlace es la variable
tiempo a un evento.
Otros métodos para desenlaces dicotómicos son modelos bayesianos
multivariantes que incorporan dependencias entre variables predictoras y
árboles de clasificación y regresión.
En el caso más habitual de desenlaces dicotómicos y, por lo tanto,
modelos logísticos, desde el punto de vista estadístico hay que tener en
cuenta (6-8):
• Que el tamaño muestral se ajuste a la regla de 10 casos por predictor
en el subgrupo menor de desenlace.
• Que se deben incluir inicialmente en el modelo logístico aquellas
variables predictoras que muestran una significación (valor p) menor
a 0,25-0,3 en el análisis univariante.
• Que la reducción del número de variables del modelo debe
hacerse con sentido estadístico (y clínico a ser posible) mediante
un procedimiento explícito.
8. Lectura crítica de estudios de reglas de predicción clínica 123
TIPOS DE VALIDACIÓN
La idea de validar una RPC diagnóstica o pronóstica quiere decir dis-
cernir si funciona satisfactoriamente en un grupo de pacientes diferentes
© Elsevier. Fotocopiar sin autorización es un delito.
MÉTODOS ESTADÍSTICOS
La validación debe presentar los resultados de rendimiento en cuanto
a discriminación y calibración en el nuevo grupo de pacientes. Ello nos
dará una idea clara del verdadero valor clínico de la RPC. Tendremos
en cuenta:
• Que el rendimiento (poder de discriminación) de la RPC debe
mostrarse mediante una curva ROC. Si el ABC, o estadístico c, es
menor o igual a 0,7, la RPC carece de valor clínico.
• Hay que esperar que los datos de rendimiento sean menores
que en la validación interna.
• Si han establecido un punto de corte óptimo, deben ofrecer la tabla
2 × 2 o los datos necesarios para obtenerla.
• Deben ofrecer la estimación puntual y por IC 95% del ABC.
• Una gráfica de calibración también debe ser mostrada: probabilidades
predichas frente a probabilidades observadas (o reales).
ARTÍCULO
CUADRO 8-1
E VA L U A C I Ó N C R Í T I C A D E L A R T Í C U L O
PROPUESTO (PLANTILLA CASPE)
A) ¿Son válidos los resultados del estudio?
Preguntas de eliminación
1. ¿Está la regla bien Sí ✓ No sé No
definida? Pacientes (p. 555 del artículo original) con cirrosis
PISTAS: que ingresan consecutivamente en una UCI entre
– ¿Se define 1989 y 2012 en un hospital terciario de referencia
claramente el para enfermedades hepáticas y trasplante hepático
tipo de pacientes en el Reino Unido. El motivo específico de ingreso
a los que se aplica está descrito en la tabla 2 del artículo original. No
la regla? conocemos la procedencia de los pacientes. Tampoco
– ¿Están se detalla la evolución previa. Las causas de la
adecuadamente cirrosis están descritas, pero habría que valorar si son
descritas las similares a las de nuestro entorno.
variables Definen cirrosis por hipertensión portal, estudios
predictoras? por imagen del hígado y biopsia del hígado (si existe).
– ¿El desenlace La admisión en la UCI fue dividida en cuatro períodos:
(outcome) es 89-96, 97-04, 05-08 y 09-12. Parece que el manejo de la
relevante y tiene enfermedad es diferente entre estos cuatro períodos de
sentido clínico? tiempo, si bien no dan información al respecto ni del
(El desenlace se porqué de la división en estos cuatro períodos.
puede expresar La edad, el sexo, la etiología de la enfermedad, la
como una indicación de la admisión en la UCI, la estancia en la
probabilidad o un UCI y la mortalidad intrahospitalaria fueron medidas en
curso de acción) todos los pacientes. Además, se recogieron parámetros
© Elsevier. Fotocopiar sin autorización es un delito.
(Continúa)
126 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
Preguntas detalladas
4. ¿Hubo una Sí No sé No ✓
evaluación ciega No, pero…
del desenlace y Siendo la variable desenlace la muerte, parece
de las variables que la falta de una evaluación ciega tiene poco o
predictoras? ningún impacto.
PISTAS: La evaluación de las otras variables de
– ¿Las personas laboratorio podemos asumir que son ciegas. Las
que valoraban el variables que forman parte del modelo final son
resultado conocían todas de laboratorio (recogidas antes de que ocurra
los datos clínicos? el desenlace), excepto el sangrado por varices como
– ¿Las personas motivo de admisión en la UCI
que medían
las variables
predictoras
conocían el
desenlace?
5. ¿Se midieron Sí ✓ No sé No
las variables Parece que sí…
predictoras y el Es difícil saber si todos los pacientes tenían las
© Elsevier. Fotocopiar sin autorización es un delito.
(Continúa)
128 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
6. ¿Se describen Sí ✓ No sé No
los métodos de La regla la crean mediante un modelo de regresión
derivación y logística múltiple con estrategia hacia atrás.
validación de la La capacidad de discriminación se evalúa
regla? mediante el área bajo la curva ROC.
PISTAS: La calibración la realizan mediante la χ2 de la
– ¿Se incluyen prueba de Hosmer-Lemeshow.
las variables Los autores declaran que usan los coeficientes del
importantes y modelo de regresión directamente, sin redondeo.
los criterios de Habría que notar que la regla obliga a hacer
positividad? los cálculos con calculadora. Es más frecuente
– ¿Se describe el el redondeo para que la regla se aplique más
método estadístico fácilmente.
empleado? Por otra parte, no ofrecen ninguna tabla con los
– ¿Se describe la coeficientes.
reproducibilidad de El criterio de positividad (o punto de corte)
las medidas? se calcula mediante la puntuación del índice de
Youden (suma de sensibilidad más especificidad
menos 1), que es lo mismo que elegir aquel valor
que maximiza la sensibilidad más especificidad.
Ello supone que los autores adoptan una postura
ecléctica, dando igual importancia al hecho de no
predecir las muertes que ocurren que al predecir
falsamente muertes que no ocurren.
Esta postura ecléctica, basada en la cantidad
de información sin tener en cuenta el coste de los
errores por exceso o por defecto, debe ser objeto de
una reflexión serena.
A veces no queremos elegir el valor de una RPC
que ofrece mayor cantidad de información, sino
aquel valor que minimiza los errores en uno o en
otro sentido.
Por ejemplo, si lo que pretendemos al desarrollar,
validar y, finalmente, aplicar una RPC es descartar
la presencia de una enfermedad (RPC de
propósito diagnóstico) o de un desenlace (RPC
de propósito predictivo), elegiremos un valor que
maximice la sensibilidad a un coste razonable de
pérdida de especificidad, por supuesto
8. Lectura crítica de estudios de reglas de predicción clínica 129
izquierda).
En la tabla 5 del artículo original se aprecia
también que la RFH es la de mayor ABC (0,797),
aunque no ofrecen los IC de ninguna de las RPC.
Respecto a la calibración, ofrecen el valor del
estadístico χ2 y el valor p correspondiente, pero no
han hecho ninguna curva de calibración.
Además de la validación interna, sería
deseable que se realizara una validación externa
de la RPC
(Continúa)
130 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
10. ¿Es aceptable la Se trata de una regla fácil de calcular, aunque aún lo
prueba en este caso? sería más si hubieran procedido al redondeo de los
PISTAS: coeficientes.
– Considera la Por otra parte, las variables predictoras incluidas
facilidad de uso, la tienen mucho sentido clínico y son de uso cotidiano
disponibilidad de la en este tipo de pacientes. Se refieren al estado de
RPC y los costes hipertensión portal, al estado funcional del hígado,
– Considera si la RPC al estado renal y a la función respiratoria
tiene sentido clínico
8. Lectura crítica de estudios de reglas de predicción clínica 131
11. ¿Modificarán los Se trata de una RPC nueva, sin validación externa y
resultados de la sin conocer, por lo tanto, el verdadero impacto que
prueba la decisión su aplicación pueda tener.
sobre cómo actuar En cualquier caso, se trata de pacientes cirróticos
(o la información ingresados en la UCI, no de cirróticos en términos
para el paciente)? generales.
PISTAS: A nuestro juicio, la RPC goza de una aparente
– Al margen de tu calidad dadas las variables incluidas, y podría
opinión, puede ayudar, si su rendimiento se confirmara mediante
haber estudios que una validación externa, a tomar decisiones más
exploren el impacto ajustadas al devenir de estos pacientes
de la RPC (dinero,
resultados en
salud, etc.)
– Desde la
perspectiva del
escenario, si la
actitud no va a
cambiar, la RPC es
(al menos) inútil
– Considera
cómo cambia tu
estimación inicial
tras aplicar la RPC
y cómo afecta esto
al umbral de acción
ABC, área bajo la curva ROC; esp, especificidad; IC, intervalo de confianza; LR–, likelihood
© Elsevier. Fotocopiar sin autorización es un delito.
ratio negativa; LR+, likelihood ratio positiva; RFH, Royal Free Hospital Score; ROC, receiver
operador characteristic; RPC, regla de predicción clínica; sens, sensibilidad; UCI, unidad
de cuidados intensivos.
Bibliografía
1. Phillips B. Clinical decision rules: how to build them. Arch Dis Child Educ Pract Ed. 2010
Jun;95(3):83-87.
2. Phillips B. Clinical Decision Rules: how to use them. Arch Dis Child Educ Pract Ed.
2010;95:88-92.
3. Mann CJ. Observational research methods. Research design II: cohort, cross sectional, and
case-control studies. Emerg Med J. 2003 Jan;20(1):54-60.
4. Royston P, Altman DG, Sauerbrei W. Dichotomizing continuous predictors in multiple
regression: a bad idea. Stat Med. 2006 Jan 15;25(1):127-141.
132 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
5. Siontis GC, Tzoulaki I, Ioannidis JP. Predicting death: an empirical evaluation of predictive
tools for mortality. Arch Intern Med. 2011 Oct 24;171(19):1721-1726.
6. Harrell FE Jr, Lee KL, Califf RM, Pryor DB, Rosati RA. Regression modelling strategies for
improved prognostic prediction. Stat Med. 1984 Apr-Jun;3(2):143-152.
7. Harrell FE Jr, Lee KL, Matchar DB, Reichert TA. Regression models for prognostic prediction:
advantages, problems, and suggested solutions. Cancer Treat Rep. 1985 Oct;69(10):1071-1077.
8. Harrell FE Jr, Lee KL, Pollock BG. Regression models in clinical studies: determining relation
ships between predictors and response. J Natl Cancer Inst. 1988 Oct 5;80(15):1198-1202.
9. Adams ST, Leveson SH. Clinical prediction rules. BMJ (Clinicla research ed). 2012;344:d8312.
10. Harrell FE Jr, Lee KL, Mark DB. Multivariable prognostic models: issues in developing
models, evaluating assumptions and adequacy, and measuring and reducing errors. Stat
Med. 1996 Feb 28;15(4):361-387.
9
Lectura crítica de estudios
cualitativos
Alejandra Cano Arana y Teresa González Gil
INTRODUCCIÓN
ESCENARIO
¿Cuál es la ¿Cuáles son los Explorar la Identificar las Etnografía Criterios de Actores Observación del Proceso de Se identifican
experiencia significados, experiencia creencias, valores, inclusión Contextos de participante codificación categorías
de una las creencias, de… patrones de experienciales interacción Entrevistas en basado en que hacen
determinada los valores, los comportamiento Muestreo profundidad una primera referencia a
población patrones de en torno al intencional Grupos de aproximación los diferentes
en torno al comportamiento fenómeno X Tamaño de discusión más elementos
fenómeno en torno al la muestra Técnicas descriptiva culturales que
X? fenómeno X? según la documentales y una condicionan
saturación de segunda fase la vivencia de
los datos interpretativa un fenómeno
X (creencias,
valores,
rituales…)
¿Cuál es la esencia Identificar la Fenomenología Informantes Entrevistas en Análisis temático Se identifican
del significado del esencia de vivir el profundidad según las temas y
fenómeno X? fenómeno X Técnicas propuestas subtemas que
narrativas de diferentes describen la
Técnicas autores: esencia de la
biográficas Colaizzi, experiencia
Giorgi, Vivir el fenómeno
Benner… X es vivir…
Pregunta Preguntas Técnicas de
general de específicas de Objetivo Objetivos recogida Estrategias de
investigación investigación general específicos Método Población de estudio de datos análisis Resultados
¿Cómo es el Identificar las fases Teoría Actores/ Entrevistas en Codificación Se identifica un
proceso de que definen fundamentada informantes profundidad abierta proceso social
vivir a través del el proceso de Contextos de Observación del Codificación básico con sus
fenómeno X? vivir a través del interacción participante axial diferentes fases
fenómeno X Especial Grupos de Codificación o acciones que
Identificar la énfasis en discusión selectiva se desarrollan
dinámica del el muestreo Técnicas Comparación a lo largo de
proceso teórico narrativas constante dicho proceso
Técnicas Representación
documentales gráfica del
proceso
138 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
ESTRATEGIA DE MUESTREO
Cuando hablamos de población de estudio, hacemos referencia al total
conglomerado de casos que cumplen unos criterios de inclusión específicos.
9. Lectura crítica de estudios cualitativos 139
CONSIDERACIONES ÉTICAS
Los principios éticos que guían la investigación cualitativa están cons-
truidos basándose en la ética médica. La aplicación de los mismos al con-
texto de la investigación cualitativa, sin embargo, resulta en ocasiones algo
complicada, incómoda y delicada. Así, basándonos en los principios de
autonomía, beneficencia/no maleficencia y justicia, podemos identificar
diferentes problemas o situaciones conflictivas a nivel ético en el contexto
de la planificación y desarrollo de nuestros trabajos de investigación. Para
cada uno de estos problemas podemos encontrar diferentes estrategias
de abordaje que, en ocasiones, más que seguir directrices estandarizadas,
deberán ser gestionadas por el propio investigador en función de las ne-
cesidades de campo. Esto último, requiere una constante actitud de alerta
para la identificación de situaciones potencialmente conflictivas (16).
Algunas de las estrategias básicas para la salvaguardia de los princi-
pios éticos son: la aprobación de la propuesta y seguimiento del proceso
por parte de un comité ético; la información clara y completa a los infor-
mantes acerca de los objetivos de estudio, condiciones de participación y
9. Lectura crítica de estudios cualitativos 145
ARTÍCULO
© Elsevier. Fotocopiar sin autorización es un delito.
CUADRO 9-1
E VA L U A C I Ó N C R Í T I C A D E L A R T Í C U L O
PROPUESTO (PLANTILLA CASPE)
A) ¿Son válidos los resultados del estudio?
Preguntas de eliminación
1. ¿Se definieron de Sí ✓ No sé No
forma clara los Queda explícita, ya que en la introducción (en
objetivos de la la página 464 del artículo original) se habla del
investigación? interés del grupo de investigación en entender y
PISTAS: describir el significado social y el manejo de los
– ¿Queda implícita/ fármacos que modifican el estado de ánimo en
explícita la diferentes entornos culturales europeos.
pregunta de Aunque inicialmente parece claro que el
investigación? objetivo de investigación es identificar las
– ¿Se identifica trayectorias de consumo de los pacientes,
con claridad el así como las estrategias de manejo de los
objetivo de la psicofármacos en el contexto de los trastornos
investigación? depresivos, a posteriori, según se avanza en la
– ¿Se justifica la lectura del artículo, surgen pequeñas dudas al
relevancia de los respecto, y parece que la orientación indagadora
mismos? fuera más en busca de aspectos motivacionales
para la adherencia terapéutica.
Los autores justifican la actualidad de la
pregunta basándose en la prevalencia del 10,5%
para los episodios depresivos en España según
el estudio epidemiológico ESEMed europeo,
la importancia de una adecuada adherencia
terapéutica para la gestión de los problemas
de salud mental crónicos, y las tasas de
incumplimiento con la medicación pautada del
40 al 70% en personas con depresión (OMS).
En cuanto a la pertinencia de la pregunta,
dicen que conocer cuál es la perspectiva de las
personas que padecen depresión con respecto
al régimen terapéutico puede ayudarnos
a identificar factores de riesgo o factores
relacionados para con el incumplimiento,
así como orientarnos en la planificación de
actividades de intervención para su abordaje
de una forma individualizada y adaptada a sus
necesidades reales
9. Lectura crítica de estudios cualitativos 147
2. ¿Es apropiada Sí ✓ No sé No
la metodología Sí, quiere conocer la perspectiva de los
cualitativa? pacientes en relación con el tema, para ello hay
PISTAS: considera: que explorar la subjetividad de los participantes.
– Si la investigación La investigación cualitativa tiene por objetivo
pretende explorar el conocer la realidad desde la subjetividad de
las conductas las personas, indagando en la interpretación
o experiencias que estas realizan de su propia experiencia/
subjetivas de los vivencia en relación con el fenómeno de
participantes estudio. La investigación cualitativa, bajo el
con respecto al paradigma constructivista/naturalista, aboga
fenómeno de por la no existencia de una única realidad, sino
estudio de múltiples realidades que corresponderían a
– ¿Es apropiada las múltiples interpretaciones de los diferentes
la metodología sujetos (personas) que han experimentado un
cualitativa para determinado fenómeno. El acceso, entonces,
dar respuesta a al conocimiento de la realidad es a través de la
los objetivos de subjetividad, de la interpretación que los sujetos
investigación realizan de dicha vivencia
planteados?
3. ¿El método de Sí No sé No ✓
la investigación Los autores no hacen referencia explícita al
es adecuado marco teórico que han tomado por referencia.
para alcanzar los Si bien es cierto que metodológicamente
objetivos? hacen alusión a la propuesta de la teoría
PISTA: considera si fundamentada en el contexto del muestreo,
el investigador hace el análisis de los datos y la exposición de los
© Elsevier. Fotocopiar sin autorización es un delito.
(Continúa)
148 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
(Continúa)
150 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
– Si el investigador
refleja y justifica los
cambios conceptuales
(reformulación de la
pregunta y objetivos
de la investigación)
y metodológicos
(criterios de inclusión,
estrategia de muestreo,
técnicas de recogida de
datos, etc.)
7. ¿Se han tenido en Sí ✓ No sé No
cuenta los aspectos Los autores mencionan que, tras informar
éticos? a los participantes sobre los objetivos del
PISTAS: considera: estudio, su participación en el mismo y
– Si el investigador ha aspectos sobre confidencialidad y anonimato,
detallado aspectos se confirmó su deseo de participar, además
relacionados con: de solicitarles permiso para la grabación
– El consentimiento de la entrevista. Sin embargo, no se hace
informado referencia explícita a si esta aceptación para
– La la participación fue verbal o si se redactó un
confidencialidad de consentimiento informado en formato escrito
los datos para su firma y archivo legal.
– El manejo de la La confidencialidad de los datos sí se ha
vulnerabilidad tenido en cuenta.
emocional (efectos No se hace referencia a otros aspectos
del estudio sobre relacionados con el principio ético de
© Elsevier. Fotocopiar sin autorización es un delito.
(Continúa)
152 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
– Se reflexiona sobre
las limitaciones del
estudio
(Continúa)
154 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
Bibliografía
1. Cano Arana A, González Gil T, Palmar Santos A, Luengo González R. Diferentes aproxima-
ciones de investigación en salud: metodología cuantitativa y cualitativa. Educare 21 [revista
en internet]. 2008 Jun [acceso 7 Sep 2014]. Disponible en: http://www.enfermeria21.com.
proxy1.athensams.net/revistas/educare/articulo/470251/.
2. De la Cuesta Benjumea C. ¿Por dónde empezar?: la pregunta de investigación cualitativa.
Enferm Clin. 2008;18(4):205-210.
3. Mayan MJ. Una Introducción a los métodos cualitativos: módulo de entrenamiento para
estudiantes y profesores [monografía en Internet]. Alberta: International Institute for
Qualitative Methodology; 2001 [acceso 7 Sep 2014]. Disponible en: http://www.ualberta.
ca/∼iiqm/pdfs/introduccion.pdf.
9. Lectura crítica de estudios cualitativos 155
4. Morse JM, Richards L. Selecting a Method. En: Morse JM, Richards L, editors. Read me
first. Thousand Oaks: SAGE; 2001. p. 43-64.
5. Hammersley M, Atkinson P. Etnografía. Métodos de investigación. Barcelona: Paidós; 2001.
6. Taylor SB, Bogdan R. Introducción a los métodos cualitativos de investigación. 2.ª ed.
Barcelona: Paidós; 1987.
7. Glaser B, Strauss A. The Discovery of grounded theory: Strategies for Qualitative Research.
Chicago: Aldine; 1967.
8. Marshall M. Sampling for qualitative research. Fam Pract. 1996 Dec;13(6):522-525.
9. Callejo Gallego J. Observación, entrevista y grupo de discusión: el silencio de tres prácticas
de investigación. Rev Esp Salud Pública. 2002;76(5):409-422.
10. Alonso LE. Sujeto y discurso: el lugar de la entrevista abierta en las prácticas de la sociología
cualitativa. En: Delgado JM, Gutiérrez J, coordinadores. Métodos y técnicas cualitativas
de investigación en ciencias sociales. Madrid: Síntesis; 1999. p. 225-240.
11. Canales M, Peinado A. Grupos de discusión. En: Delgado JM, Gutiérrez J, editors. Métodos
y técnicas cualitativas de investigación en Ciencias Sociales. Madrid: Síntesis; 1999. p. 288-
316.
12. Krueger RA, Casey MA. Focus Groups: A Practical Guide for Applied Research. London:
SAGE Publications; 2000.
13. Morse JM. Emerger de los datos: los procesos cognitivos del análisis en la investigación
cualitativa. En: Morse JM, editor. Asuntos críticos en los métodos de investigación cuali-
tativa: Universidad de Antioquia; 2003. p. 29-52.
14. Cooffey A, Atkinson P. Variedades de datos y variedades de análisis. En: Coofffey A,
Atkinson P, editors. Encontrar sentido a los datos cualitativos: estrategias complementarias
de investigación. Colombia: Universidad de Antioquia; 2003. p. 1-30.
15. Castillo E, Vásquez LM. El rigor metodológico en la investigación cualitativa. Colomb
Med. 2003;34:164-167.
16. Barrio-Cantalejo I, Simón-Lorda P. Problemas éticos de la investigación cualitativa. Med
Clin. 2006;126(11):418-423.
10
Documentos de evidencia.
El sistema 6S. Evidencia a pie
de cama (sumarios point of care)
y guías de práctica clínica
Juan Bautista Cabello López,
Fernando Carballo Álvarez,
Eukene Ansuategi Zengotitabengoa
y Marimar Úbeda Carrillo
INTRODUCCIÓN
ESTUDIOS
Corresponden a los estudios tradicionales o piezas elementales de eviden-
cia, versan sobre los diferentes dominios clínicos mencionados en el capítulo 3
(tratamiento, pronóstico, diagnóstico, etc.) y, por tanto, asumen alguno de los
diseños señalados como adecuados para la construcción de conocimiento en
el dominio correspondiente (ECA, estudios de exactitud, pruebas diagnós-
ticas, estudios de cohortes, etc.) y, obviamente, utilizan un formato estructu-
rado «PICO» para la formulación de la pregunta (v. capítulo 3).
En cuanto a la arquitectura los documentos, mantienen la tradicional
estructura IMRAD (Introducción, Material y Métodos, Resultados y Dis-
cusión). Generalmente, los estudios aportan un pequeño resumen (150-200
palabras), que mantiene la estructura del artículo y permite su ojeo rápido
en las bases de datos.
10. DOCUMENTOS DE EVIDENCIA. EL SISTEMA 6S. EVIDENCIA A PIE DE CAMA 161
SINOPSIS DE ESTUDIOS
Se trata de un resumen comentado de los estudios del apartado anterior.
Se diferencia de los resúmenes, antes mencionados, en que incluye juicios
de valor sobre la validez de la evidencia aportada por ese estudio y otras
consideraciones relacionadas con el contexto de conocimiento o con la apli-
cación clínica, es evidencia preevaluada. En cuanto a la pregunta, responde
a una cuestión estructurada en formato PICO o similares. En ocasiones
se agrupan la pregunta, la búsqueda correspondiente y la sinopsis, cons-
tituyendo un CAT (critically appraised topic).
Dado que son resúmenes, no suelen aportar la información necesaria
para realizar lectura crítica directa; sin embargo, constituyen una pieza
elemental de evidencia preevaluada siempre que los criterios de lectura
crítica sean preespecificados y consistentes. Estas sinopsis suelen agruparse
en revistas de resúmenes o en bancos de CAT.
Las sinopsis ofrecen la ventaja de ahorrar tiempo para el clínico o decisor
ocupado; sin embargo, tienen cierto parecido con los «artículos de opinión»,
en la medida en que realizan juicios de valor. Deben por ello ser valoradas
con especial prudencia (dependiendo de la fuente).
SÍNTESIS
Corresponden a las de RS o diseños que, procediendo de modo sis-
temático y consistente, recopilan, valoran y sintetizan (cualitativa y/o
cuantitativamente) toda la evidencia existente en torno a una pregunta es-
tructurada PICO. Incorporan toda la evidencia disponible sobre la pregunta
y ofrecen, por tanto, una visión global y aportan, además, un extra de
© Elsevier. Fotocopiar sin autorización es un delito.
SINOPSIS DE SÍNTESIS
Son documentos que contienen un resumen estructurado de una síntesis
que, al igual que en las sinopsis, incluye juicios de valor sobre la validez
de la revisión, la pertinencia de las preguntas y las posibles peculiaridades
de su aplicación.
162 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
TABLA 10-1 Cómo guiar nuestra búsqueda: el modelo 6S propone comenzar por el
nivel más alto (sistemas) hasta el más bajo (estudios), siendo el nivel 5 (sumarios)
el primer escalón con fuentes de información disponibles
Pirámide Recurso Contenido
Escalón 5 UpToDate Libro electrónico dirigido a clínicos que ofrece información
organizada por condiciones clínicas. Describe la etiología,
la fisiopatología y las manifestaciones clínicas de una gran
variedad de enfermedades, las opciones de diagnóstico,
el manejo del paciente y su tratamiento. Cubre varias
especialidades médicas y ofrece otros servicios docentes
http://www.uptodate.com Suscripción
Editor: Wolters Kluwer Health
Escalón 5 DynaMed Herramienta de referencia para la toma de decisiones clínicas,
con sumarios de la evidencia para más de 3.200 temas,
organizados por especialidad y condición clínica. De
actualización diaria, monitoriza más de 5.200 publicaciones,
ofreciendo la mejor evidencia médica disponible
https://dynamed.ebscohost.com Suscripción
Editor: EBSCO
Escalón 5 Clinical Compendio actualizado de evidencia que proporciona
Evidence información concisa del estado actual del conocimiento
sobre el tratamiento y prevención de un amplio rango de
© Elsevier. Fotocopiar sin autorización es un delito.
(Continúa)
164 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
TABLA 10-1 Cómo guiar nuestra búsqueda: el modelo 6S propone comenzar por el
nivel más alto (sistemas) hasta el más bajo (estudios), siendo el nivel 5 (sumarios)
el primer escalón con fuentes de información disponibles (cont.)
Pirámide Recurso Contenido
Escalones DARE Se centra principalmente en las revisiones sistemáticas que
2y4 evalúan los efectos de las intervenciones de atención de
la salud y la prestación y organización de los servicios de
salud. Esta base de datos se puede consultar dentro de la
Cochrane y en la página web del Centre for Reviews and
Dissemination de York
http://www.crd.york.ac.uk/crdweb Acceso libre
Editor: University of York
Escalones NHS Evidence Servicio web del NICE, que proporciona un fácil acceso a
2y4 sumarios de conocimiento clínico, sumarios de temas
bajo incertidumbre y algunos formularios clásicos. Es un
portal que busca en múltiples fuentes de información con
consistencia y usando criterios de calidad y pertinencia
https://www.evidence.nhs.uk Acceso libre
Editor: NICE
Escalones Evidence Base de datos que proporciona referencias (de alrededor
2y4 Updates de 160 principales revistas clínicas seguidas). Incluye
información sobre diagnóstico, tratamiento y manejo de
condiciones clínicas que han sido previamente clasificadas
por su calidad y posteriormente tres clínicos de todo el
mundo han realizado una selección por su relevancia
clínica e interés
http://plus.mcmaster.ca/ Acceso libre
EvidenceUpdates/
Editor: BMJ y McMaster University’s
Health Information Research Unit
Escalones McMaster Base de datos que proporciona artículos originales de
2y4 PLUS calidad, evaluados críticamente a través del proceso
Database de valoración crítica (CAP), que identifica los que son
metodológicamente sólidos y posteriormente considera
como pertinentes por clínicos, siguiendo el sistema
McMaster Online Rating of Evidence (MORE)
http://plus.mcmaster.ca/ Hay que
McMasterPLUSDB/Default.aspx?Page=1 registrarse
http://hiru.mcmaster.ca/more_new/
Escalones PEDro Base de datos sobre fisioterapia basada en la evidencia
2y4 creada y mantenida por el Centro de Fisioterapia Basada
en la Evidencia en el George Institute for Global Health.
Es gratuita y contiene más de 28.000 ensayos aleatorios
controlados, revisiones sistemáticas y guías de práctica
clínica de fisioterapia
http://www.pedro.org.au/ Acceso gratuito
10. DOCUMENTOS DE EVIDENCIA. EL SISTEMA 6S. EVIDENCIA A PIE DE CAMA 165
TABLA 10-1 Cómo guiar nuestra búsqueda: el modelo 6S propone comenzar por el
nivel más alto (sistemas) hasta el más bajo (estudios), siendo el nivel 5 (sumarios)
el primer escalón con fuentes de información disponibles (cont.)
Pirámide Recurso Contenido
Escalón 3 Cochrane Es la base de datos original «The Cochrane Library»
Library y (revisiones realizadas por los grupos Cochrane, registro
Plus de ensayos clínicos aleatorios, estudios de evaluación
económica, informes de agencias de tecnología sanitarias).
Más la traducción al castellano de algunas revisiones
http://www.thecochranelibrary.com/ Suscripción
http://www.update-software.com/BCP/ Acceso gratuito
Escalón 3 JBI COnNECT Recurso online desarrollado por el Instituto Joanna Briggs.
Tiene como actividad principal la elaboración de revisiones
sistemáticas y ofrece un conjunto de recursos y herramientas
basados en la evidencia, especialmente diseñados para
ayudar en el proceso de toma de decisiones clínicas
http://connect.jbiconnectplus.org/ Suscripción
Escalón 3 PROSPERO Base de datos internacional producida por The Centre for
Reviews and Dissemination en la Universidad de York con
el registro de revisiones sistemáticas en salud y seguridad
social
http://www.crd.york.ac.uk/prospero/ Acceso gratuito
Escalón 3 Systematic Revista open access que tiene como misión la publicación
Reviews de revisiones sistemáticas, protocolos y métodos de
investigación relacionados con las revisiones sistemáticas
http://www.systematicreviewsjournal. Acceso gratuito
com/
Editor: BioMed Central
Escalones ACP J Club, Estas revistas ofrecen una sinopsis (resumen estructurado
2y4 Evidence de un artículo junto con el comentario del revisor) de
Based las principales revistas de la especialidad que cubren
Medicine, (medicina interna, enfermería, etc.)
etc. http://acpjc.acponline.org/index.html Acceso libre
http://ebm.bmj.com/ Suscripción
© Elsevier. Fotocopiar sin autorización es un delito.
Escalones POEMS, CAT, Son sinopsis de artículos relevantes para la práctica clínica
2y4 BET, etc. que son agrupados por condiciones clínicas. Mantienen
también un sistema de alerta
http://www.infopoems.com Suscripción
http://www.bestbets.org/ Acceso gratuito
MBE Guipúzcoa; http://www.mbe.i2000. Acceso gratuito
es/
Escalón 1 Bases de datos PubMed, Medline, Embase, PsycInfo, Suscripción
primarias Cinhal… (PubMed
Bases de datos primarias con estudios gratuito)
originales publicados en revistas, libros
o actas de congresos. También incluyen
revisiones sistemáticas
(Continúa)
166 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
TABLA 10-1 Cómo guiar nuestra búsqueda: el modelo 6S propone comenzar por el
nivel más alto (sistemas) hasta el más bajo (estudios), siendo el nivel 5 (sumarios)
el primer escalón con fuentes de información disponibles (cont.)
Sumarios
Sinopsis de
síntesis
Síntesis
Sinopsis de
estudios
Estudios
es el mayor condicionante de su uso. Los tres criterios se relacionan con las
grandes líneas o tendencias de la práctica basada en la evidencia: una es la
vocación de síntesis del conocimiento, otra la resolución de la brecha entre
preguntas de investigación y de aplicación, y la tercera es la usabilidad de
la evidencia en un entorno clínico donde el tiempo es demasiado valioso.
Con excepción de los estudios y las síntesis, los recursos de los demás
estratos del sistema 6S se consideran evidencia preevaluada y no permiten
realizar una lectura crítica directa al modo tradicional. Por ello, dado que
no toda la evidencia preevaluada tiene la misma calidad, será preciso
disponer de criterios explícitos para saber en qué productos de evidencia
preevaluada podemos confiar. Abordaremos inicialmente este problema de
modo general para todos los estratos (tabla 10-3), describiremos los criterios
para evaluar CAT (cuadro 10-1) y nos detendremos en la evaluación de los
sumarios de evidencia y las GPC.
© Elsevier. Fotocopiar sin autorización es un delito.
CUADRO 10-1
C R I T E R I O S P A R A E VA L U A R U N C A T
( C R I T I C A L LY A P P R A I S E D T O P I C )
• ¿Existe una pregunta claramente definida (PICO)?
• ¿Se muestra una estrategia de búsqueda definida: base de datos,
términos de búsqueda y tipo de estudio?
• ¿Por qué se seleccionó ese (esos) artículo(s)?
• Evaluación breve —telegráfica— de la calidad del (de los) artículo(s)
seleccionado(s)
• Medidas de efecto descritas en términos usables (puntual y por
intervalo) para cada desenlace
Elaborado por CASPe y Hospital Universitario de Donostia.
168 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
Los productos de este tipo deben idealmente (8) ser fiables, pertinentes
para el clínico y legibles (en inglés se usa la nemotecnia «3R»: reliable,
relevant, readible). Por fiable entendemos que sea altamente válido: porque
ha sido buscado o recopilado de manera eficiente, porque ha sido leído
críticamente de acuerdo con criterios explícitos y rigurosos, porque la
lectura ha sido consistente entre los diversos lectores entrenados y porque
se usa alguna clasificación para expresarlo. Algunos de estos productos
usan para clasificar el tipo de evidencia una de la escalas de GRADE (que
veremos en el siguiente capítulo).
Por pertinente o adecuado para la clínica se entiende que, tras haber
sido buscados con criterios explícitos y rigurosos, el material resultante
ha sido «destilado» y clasificado (generalmente por clínicos prácticos) de
acuerdo con dos criterios: el primero es su importancia para la decisión,
es decir, que incluya preguntas y, sobre todo, desenlaces «críticos para la
decisión» o «importantes no críticos» (v. capítulo 3). El segundo criterio
es que tenga en cuenta las necesidades de grupos clínicos específicos a
los que esté enfocado (p. ej., médicos de familia, internistas, cardiólogos,
neurólogos o urólogos).
Por legible consideramos que sean piezas suficientemente breves para
permitir su manejo en consulta o en la sala, con un formato amable y con
una edición que tenga en cuenta las peculiaridades y posibilidades de la
lectura en pantallas diversas.
Una característica deseable adicional es la actualización de los pro-
ductos. Es sabido que las RS (10) y los sumarios de evidencia tienen su
caducidad (11). Este es, sin duda, un tema interesante de investigación,
y en ese terreno probablemente hay que desarrollar criterios flexibles
sobre las necesidades de actualización de cada producto y/o cada tema.
No es lo mismo rastrear para incorporar nuevas publicaciones a un
sumario de evidencias que actualizar una guía de práctica cínica; o
existen temas muy consolidados y otros más cambiantes y que requieren
especial vigilancia.
Un resumen de las preguntas concretas que hay que hacerse para decidir
si confiamos en un sumario de evidencia determinado se puede ver en el
cuadro 10-2.
CUADRO 10-2
C R I T E R I O S P A R A E VA L U A R
Sumarios de evidencia (evidencia de consulta o a pie de cama)
• ¿Cómo se recopiló la información?
• ¿Se describen las fuentes y criterios de búsqueda y cómo se incluyen
en el proceso?
• ¿Se especifican los criterios la selección por pertinencia clínica
(condiciones clínicas adecuadas y si incluye los desenlaces críticos o
importantes-no críticos)?
• ¿Se describen los criterios usados para la lectura crítica, el modo
en que se organiza a los revisores y cómo se evalúa ese proceso
(consistencia de revisores)?
• ¿Ofrecen una clasificación del tipo de evidencia para cada afirmación
o recomendación?
• ¿Cómo se realiza la selección final orientada por pertinencia para
los clínicos específicos (influyen grupos de clínicos en ordenar ese
producto final)?
• ¿Cómo se mantiene y actualiza el producto (con qué periodicidad)?
• ¿Es usable fácilmente? ¿Es accesible desde diferentes medios (PC,
móvil, tablet, etc.)?
• ¿Los criterios de presentación editorial se adecuan a los diversos
medios (ayudas intuitivas)?
Libros electrónicos
• ¿Ofrecen información explícita sobre cómo se busca la evidencia?
• ¿Es adecuada la búsqueda: fuentes consultadas y estrategias, etc.?
• ¿Ofrecen información clara sobre el tipo de evidencia que sustenta
cada afirmación o recomendación contenida en el texto?
© Elsevier. Fotocopiar sin autorización es un delito.
ASPECTOS CONCEPTUALES
• Habitualmente, las GPC se centran en una condición clínica definida
con diferente amplitud (p. ej., fibrilación atrial o hemorragia digestiva
alta), y dentro de esa condición se seleccionarán las preguntas clínicas
clave de entre las múltiples posibles.
• Esas preguntas podrán ser sobre riesgo, diagnóstico, factores
pronósticos, diferentes opciones de tratamiento, efectos adversos,
costes y recursos asociados, experiencias de los pacientes con los
procedimientos, etc. Es decir, las preguntas versan sobre los dominios
clínicos tradicionales señalados en el capítulo 3.
• Como se trata de preguntas para las que hay que obtener evidencia,
deberán formularse en forma estructurada (formato PICO),
concediendo especial atención a la importancia de los desenlaces
valorada desde las diferentes perspectivas posibles (clínicos,
pacientes, etc.).
• La correspondiente evidencia para esas preguntas provendrá de los
diferentes diseños posibles según el dominio clínico de que se trate
(ECA, estudios de cohortes, estudios de diagnóstico, etc.). Idealmente,
debe incluir toda la evidencia disponible y, por tanto, usaremos
preferentemente síntesis (RS) sobre los correspondientes PICO,
aunque, en caso necesario, se usarán otros estudios o incluso se podrá
realizar la RS ad hoc para la guía.
LECTURA CRÍTICA
Desde el punto de vista de la lectura hay que señalar dos aspectos:
1. Puesto que no tenemos acceso a todos los originales que están
incluidos en las múltiples RS o estudios que han sido usados en la
guía, no es posible realizar una lectura crítica directa. Sin embargo,
es posible saber cuál es la calidad de la evidencia usada en cada
una de las preguntas de la guía (se trata de evidencia preevaluada).
Actualmente, el sistema usado de modo general para valorar la
10. DOCUMENTOS DE EVIDENCIA. EL SISTEMA 6S. EVIDENCIA A PIE DE CAMA 171
CUADRO 10-3
DOMINIOS E ÍTEMS
DEL INSTRUMENTO AGREE II
P A R A L A E VA L U A C I Ó N D E G U Í A S
DE PRÁCTICA CLÍNICA*
Alcance y objetivo
1. El (los) objetivo(s) general(es) de la guía está(n) específicamente
descrito(s)
2. El (los) aspecto(s) de salud cubierto(s) por la guía está(n)
específicamente descrito(s)
3. La población (pacientes, público, etc.) a la cual se pretende aplicar la
guía está específicamente descrita
Rigor de la elaboración
1. Se han utilizado métodos sistemáticos para la búsqueda de la
evidencia
2. Los criterios para seleccionar la evidencia se describen con claridad
3. Las fortalezas y limitaciones del conjunto de la evidencia están
claramente descritas
4. Los métodos utilizados para formular las recomendaciones están
claramente descritos
(Continúa)
172 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
Claridad de la presentación
1. Las recomendaciones son específicas y no son ambiguas
2. Las distintas opciones para el manejo de la enfermedad o condición
de salud se presentan claramente
3. Las recomendaciones clave son fácilmente identificables
Aplicabilidad
1. La guía describe factores facilitadores y barreras para su aplicación
2. La guía proporciona consejo y/o herramientas sobre cómo las
recomendaciones pueden ser llevadas a la práctica
3. Se han considerado las posibles implicaciones de la aplicación de las
recomendaciones sobre los recursos
4. La guía ofrece criterios para monitorización y/o auditoría
Independencia editorial
1. Los puntos de vista de la entidad financiadora no han influido en el
contenido de la guía
2. Se han registrado y abordado los conflictos de intereses de los
miembros del grupo elaborador de la guía
*Cada ítem debe ser puntuado entre 1 (muy en desacuerdo) y 7 (muy de acuerdo).
Bibliografía
1. Scott I. The evolving science of translating research evidence into clinical practice. Evid
Based Med. 2007;12:4-7.
2. Tilson JK, Kaplan SL, Harris JL, Hutchinson A, Ilic D, Niederman R, et al. Sicily statement
on classification and development of evidence-based practice learning assessment tools.
BMC Med Educ. 2011;11:78.
3. Thomson O’Brien MA, Freemantle N, Oxman AD, Wolf F, Davis DA, Herrin J. Continuing
education meetings and workshops: effects on professional practice and health care
outcomes. Cochrane Database Syst Rev. 2001;(1):CD003030.
4. Glasziou P, Haynes B. The paths from research to improved health outcomes. ACP J Club.
2005;142:A8-A9.
5. Smith R. What clinical information do doctors need? BMJ. 1996;313(7064):1062-1068.
6. DiCenso A, Bayley L, Haynes RB. Accessing preappraised evidence: fine-tuning the 5S
model into a 6S model. ACP J Club. 2009;151(3).
7. Banzil R, Liberati A, Moschetti I, Tagliabue L, Moja L. A Review of Online Evidence-based
Practice Point-of-Care Information Summary Providers. J Med Internet Res. 2010;12(3):e26.
8. Straus S, Haynes RB. Managing evidence-based knowledge: the need for reliable, relevant
and readable resources. CMAJ. 2009;180(9):942-945.
9. Woolf S, Schünemann HJ, Eccles MP, Grimshaw JM, Shekelle P. Developing clinical practice
guidelines: types of evidence and outcomes; values and economics, synthesis, grading,
and presentation and deriving recommendations. Implement Sci. 2012;7:61.
10. Shojania KG, Sampson M, Ansari MT, Doucette S, Moher D. How quickly do systematic
review go out of date? A survival analysis. Ann Intern Med. 2007;147:224-233.
11. Moher D, Tsertsvadze A, Tricco AC, Eccles M, Grimshaw J, Sampson M, et al. Systematic
review identified methods and strategies describing when and how to update systematic
review. J Clin Epidemiol. 2007;60:1095-1104.
© Elsevier. Fotocopiar sin autorización es un delito.
12. Brouwers MC, Kho ME, Browman GP. AGREE II: advancing guideline development,
reporting and evaluation in health care. CMAJ. 2010;182(18):E839-E842.
A N EX O
A continuación (tabla 10-4) se muestran dos ejemplos de las salidas de bús-
queda en diferentes «ingenios». Las preguntas son las formuladas a partir de
dos de los escenarios clínicos del anexo del capítulo 3.
174 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
Hemos seleccionado los recursos que son gratuitos, dado que el acceso a la
evidencia es muy variable dependiendo del sistema de salud o incluso del centro
de trabajo. No obstante, sugerimos probar con los dispositivos de búsquedas
que cada uno use de modo habitual en su lugar de trabajo.
adults
Número de documentos recuperados: 103
Destacamos los siguientes resultados:
• Zhang CD, Dai DQ, Zhao ZM. Probiotics for the
prevention of antibiotic-associated diarrhea in
adult patients: a metaanalysis. World Chinese
Journal of Digestology 2012; 20(21): 2006-2011
• Goldenberg JZ, Ma SSY, Saxton JD, Martzen
MR, Vandvik PO, Thorlund K, Guyatt GH,
Johnston BC. Probiotics for the prevention of
Clostridium difficile-associated diarrhea in adults
and children. Cochrane Database of Systematic
Reviews 2013, Issue 5. Art. No.: CD006095. DOI:
10.1002/14651858.CD006095.pub3
(Continúa)
176 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
(Continúa)
178 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
11
De la evidencia
a la recomendación. GRADE
Juan Bautista Cabello López y Jaime Latour Pérez
INTRODUCCIÓN
¿QUÉ ES GRADE?
CUADRO 11-1
E S C A L A G R A D E PA R A L A C A L I D A D
DE LA EVIDENCIA Y EL GRADO
DE RECOMENDACIÓN
Calidad de la evidencia
• Alta calidad (⊕⊕⊕⊕ o A): estamos seguros de que el efecto mostrado
en los estudios refleja el efecto real existente
• Moderada calidad (⊕⊕⊕⊝ o B): estamos bastante seguros de que el
efecto mostrado en los estudios está cerca del auténtico efecto real
• Baja calidad (⊕⊕⊝⊝ o C): creemos que el auténtico efecto puede
diferir significativamente del estimado en estos estudios
• Muy baja calidad (⊕⊝⊝⊝ o D): es casi seguro que el auténtico
efecto difiere del que ofrecen estos estudios
Grado de recomendación
• Fuerte a favor (↑↑ o 1)
• Débil a favor (↑? o 2)
• Débil en contra (↓? o 2)
• Fuerte en contra (↓↓ o 1)
RIESGO DE SESGO
O la existencia de defectos en el diseño o conducción de los estudios que
compromete su validez (la clásicamente llamada validez interna). Tales
problemas, comentados en los capítulos 4 y 5, son:
• No ocultación de la secuencia de aleatorización.
• Ausencia de cegamiento.
• Pérdidas excesivas en el seguimiento.
• Ausencia de análisis por intención de tratar.
• Detención precoz por supuesto beneficio.
• Comunicación selectiva de desenlaces, particularmente los que no
muestran efecto.
EVIDENCIA INDIRECTA
Puede adoptar, típicamente, dos formas.
© Elsevier. Fotocopiar sin autorización es un delito.
IMPRECISIÓN
Cuando los estudios incluyen relativamente pocos pacientes, y es-
pecialmente si ocurren pocos eventos los intervalos de confianza son muy
188 LECTURA CRÍTICA DE LA EVIDENCIA CLÍNICA
INCONSISTENCIA
La existencia de diferentes estimados del efecto entre los distintos
estudios requiere estudiar la heterogeneidad, especialmente si el (los) es-
tudio(s) inconsistente(s) puede(n) cambiar la dirección del efecto. Cuando
no encontramos una explicación satisfactoria para ello, hay que poner en
duda la estimación y bajar uno o dos puntos la puntuación de calidad.
SESGO DE PUBLICACIÓN
Si existen dudas al respecto, la calidad de la evidencia se resiente; es
particularmente probable cuando hay pocos estudios y también en los es-
tudios financiados por la industria.
DIRECCIÓN DE LA RECOMENDACIÓN
La formulación de una recomendación a favor o en contra de una inter-
vención depende del balance global entre los desenlaces beneficiosos y los
indeseados del tratamiento o intervención frente a una alternativa concreta.
TABLA 11-1 Perfil de evidencia para anticoagulación frente a antiagregación como prevención secundaria en pacientes con ictus no cardioembólico
Calidad estimada Resumen de los resultados
Diferencia
Con del riesgo con
Con anticoagulante Riesgo con anticoagulante
antiagregantes oral antiagregantes oral (IC 95%)
Mortalidad en general (desenlace importante)
5.400 (5 estudios) Riesgo de Severa No severo No severa No Moderada 127 de 2.707 172 de 2.693 1,36 Moderado
0-5 años sesgo encontrado debido a la (4,7) (6,4) (1,09-1,7) 50 muertes por 18 muertes más
no inconsistencia cada 1.000 por cada 1.000
severo (de 5 más a
35 más)
Ictus recurrente no letal (isquémico o/y hemorrágico) (desenlace crítico)
5.400 (5 estudios) Riesgo de No severa No severo No severa No Alta 253 de 2.707 260 de 2.693 1,03 Moderado
0-5 años sesgo encontrado (9,3) (9,7) (0,88-1,22) 106 apoplejías 3 apoplejías más
no por cada por cada 1.000
severo 1.000 (de menos de
13 a 23 más)
Infarto de miocardio no letal (desenlace importante)
1.637 (2 estudios) Riesgo de No severa No severo Severa No Moderada 40 de 812 (4,9) 37 de 825 (4,5) 0,91 Moderado
3-5 años sesgo encontrado debido a la (0,59-1,4) 13 IM por cada 1 IM menos por
no imprecisión 1.000 cada 1.000
severo (de 5 menos a
5 más)
Hemorragia extracraneal mayor, no letal (desenlace crítico)
3.194 (4 estudios) Riesgo de No severa No severo No severa No Alta 23 de 1.604 82 de 1.590 RR 3,6 Moderado
0-5 años sesgo encontrado (1,4) (5,2) (2,29-5,66) 10 episodios 26 episodios más
no de sangrado de sangrado
severo por cada por cada 1.000
1.000 (de 13 más a
47 más)
En negrita, calidad general de la evidencia estimada en función de las observaciones anteriores.
IC 95%, intervalo de confianza al 95%; IM, infarto de miocardio.
Modificada de (10).
11. De la evidencia a la recomendación. GRADE 191
FUERZA DE LA RECOMENDACIÓN
Aunque la relación riesgo-beneficio es un continuo, GRADE establece
cuatro categorías de recomendación: fuerte a favor, débil a favor, débil en
contra y fuerte en contra (fig. 11-2).
© Elsevier. Fotocopiar sin autorización es un delito.
ser apropiadas y, por tanto, su uso como criterio de calidad no estaría jus-
tificado.
El hecho de que una recomendación sea fuerte no significa que debe ser
implantada de forma prioritaria. Para los decisores políticos, la prioridad
de la implantación de una intervención debe tener en cuenta otros factores,
como la prevalencia de la enfermedad, la facilidad de implementación, los
costes sociales, el impacto potencial o la equidad.
El lector interesado en profundizar puede obtener más información en:
• Serie de artículos en BMJ (v. http://www.gradeworkinggroup.org/
publications/).
• Serie de Journal of Clinical Epidemiology (v. en http://www.jclinepi.
com/content/jce-GRADE-Series).
Bibliografía
1. The periodic health examination. Canadian Task Force on the Periodic Health Examination.
Can Med Assoc J. 1979;121:1193-1254.
2. West S, King V, Carey T, Lohr KN, McKoy N, Sutton SF, et al. Systems to Rate the Strength
of Scientific Evidence. Rockville: Agency for Healthcare Research and Quality (US); 2002
[20/07/2014]. Disponible en: http://www.ncbi.nlm.nih.gov/books/NBK11930/#A86871.
ref82.
3. Shukla V, Bai A, Milne S, Wells G. Systematic review of the evidence grading system for
grading level of evidence. German J Evidence and Quality in Health Care. 2008;102:43.
4. Guyatt GH, Oxman AD, Vist GE, Kunz R, Falck-Ytter Y, Alonso-Coello P, GRADE Working
Group. et al. GRADE: an emerging consensus on rating quality of evidence and strength
of recommendations. BMJ. 2008;336:24-26.
5. Guyatt GH, Oxman AD, Kunz R, Vist GE, Falck-Ytter Y, Schünemann HJ. GRADE Working
Group, GRADE: what is «quality of evidence» and why is it important to clinicians? BMJ.
2008;336:995-998.
6. Guyatt GH, Oxman AD, Kunz R, Falck-Ytter Y, Vist GE, Liberati A, et al.; GRADE Working
Group. GRADE: going from evidence to recommendations. BMJ. 2008;336:1049-1051.
7. Cannegieter SC, Rosendaal FR, Briet E. Thromboembolic and bleeding complications in
patients with mechanical heart valve prostheses. Circulation. 1994;89:635-641.
8. Shea BJ, Grimshaw JM, Wells GA. Development of AMSTAR: a measurement tool to assess
the methodological quality of systematic reviews. BMC Med Res Methodol. 2007;7:10.
9. Brouwers M, Kho ME, Browman GP, Cluzeau F, Feder G, Fervers B, et al.; AGREE Next
Steps Consortium. AGREE II: Advancing guideline development, reporting and evaluation
in healthcare. Can Med Assoc J. 2010;182:E839-E842.
10. Lansberg MG, O’Donnell MJ, Khatri P, Lang ES, Nguyen-Huynh MN, Schwartz NE, et al.;
American College of Chest Physicians. Antithrombotic and thrombolytic therapy for is-
chemic stroke: Antithrombotic Therapy and Prevention of Thrombosis, 9th ed: American
College of Chest Physicians Evidence-Based Clinical Practice Guidelines. Chest. 2012;141
(2 Suppl):e601S-e636S.